IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニーの特許一覧

特表2022-520104CRISPR/CAS融合タンパク質およびシステム
<>
  • 特表-CRISPR/CAS融合タンパク質およびシステム 図1
  • 特表-CRISPR/CAS融合タンパク質およびシステム 図2A
  • 特表-CRISPR/CAS融合タンパク質およびシステム 図2B
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-03-28
(54)【発明の名称】CRISPR/CAS融合タンパク質およびシステム
(51)【国際特許分類】
   C12N 15/55 20060101AFI20220318BHJP
   C07K 19/00 20060101ALI20220318BHJP
   C07K 7/06 20060101ALI20220318BHJP
   C07K 14/315 20060101ALI20220318BHJP
   C12N 1/15 20060101ALI20220318BHJP
   C12N 5/10 20060101ALI20220318BHJP
   C12N 15/11 20060101ALI20220318BHJP
   C12N 15/12 20060101ALI20220318BHJP
   C12N 15/86 20060101ALI20220318BHJP
   C12N 15/85 20060101ALI20220318BHJP
   C12N 15/82 20060101ALI20220318BHJP
   C12N 15/63 20060101ALI20220318BHJP
   C12N 15/62 20060101ALI20220318BHJP
   C12N 9/16 20060101ALI20220318BHJP
【FI】
C12N15/55 ZNA
C07K19/00
C07K7/06
C07K14/315
C12N1/15
C12N5/10
C12N15/11 Z
C12N15/12
C12N15/86 Z
C12N15/85 Z
C12N15/82 Z
C12N15/63 Z
C12N15/62 Z
C12N9/16 Z
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2021547390
(86)(22)【出願日】2020-02-13
(85)【翻訳文提出日】2021-10-11
(86)【国際出願番号】 US2020018145
(87)【国際公開番号】W WO2020168102
(87)【国際公開日】2020-08-20
(31)【優先権主張番号】62/806,708
(32)【優先日】2019-02-15
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】311016949
【氏名又は名称】シグマ-アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニー
【氏名又は名称原語表記】Sigma-Aldrich Co. LLC
(74)【代理人】
【識別番号】100145403
【弁理士】
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100122301
【弁理士】
【氏名又は名称】冨田 憲史
(74)【代理人】
【識別番号】100157956
【弁理士】
【氏名又は名称】稲井 史生
(74)【代理人】
【識別番号】100170520
【弁理士】
【氏名又は名称】笹倉 真奈美
(72)【発明者】
【氏名】チェン,フーチアン
【テーマコード(参考)】
4B050
4B065
4H045
【Fターム(参考)】
4B050CC03
4B050DD02
4B050LL01
4B065AA72X
4B065AA87X
4H045AA10
4H045AA20
4H045AA30
4H045BA10
4H045BA15
4H045BA16
(57)【要約】
操作されたCas9システムがここに開示される。
【特許請求の範囲】
【請求項1】
少なくとも1つのマーカータンパク質に連結したCas9タンパク質を含む、融合タンパク質。
【請求項2】
少なくとも1つのマーカータンパク質が、Cas9タンパク質に直接化学結合により、直接的または間接的にリンカーを介してまたはこれらの組み合わせにより連結されている、請求項1の融合タンパク質。
【請求項3】
少なくとも1つのマーカータンパク質が、Cas9タンパク質に直接的または間接的にリンカーを介して連結されている、請求項1の融合タンパク質。
【請求項4】
少なくとも1つのマーカータンパク質が、Cas9タンパク質にN末端、C末端、内部位置またはこれらの組み合わせに連結されている、請求項1~3の何れかの融合タンパク質。
【請求項5】
少なくとも1つの核移行シグナルをさらに含む、請求項1~4の何れかの融合タンパク質。
【請求項6】
核移行シグナル、マーカータンパク質、リンカーおよびCas9タンパク質が次の順番(N末端からC末端方向)で配置されている、請求項5の融合タンパク質:
マーカータンパク質-リンカー-核移行シグナル-Cas9タンパク質;
マーカータンパク質-核移行シグナル-リンカー-Cas9タンパク質;
核移行シグナル-リンカー-マーカータンパク質-Cas9タンパク質;
核移行シグナル-マーカータンパク質-リンカー-Cas9タンパク質;
マーカータンパク質-リンカー-核移行シグナル-リンカー-Cas9タンパク質;または
核移行シグナル-リンカー-マーカータンパク質-リンカー-Cas9タンパク質。
【請求項7】
核移行シグナル、マーカータンパク質、リンカーおよびCas9タンパク質が次の順番(N末端からC末端方向)で配置されている、請求項6の融合タンパク質:
マーカータンパク質-リンカー-核移行シグナル-Cas9タンパク質。
【請求項8】
少なくとも1つの異種ドメインをさらに含む、請求項1~7の何れかの融合タンパク質。
【請求項9】
少なくとも1つの異種ドメインが細胞透過性ドメイン、クロマチン調節モチーフ、後成的修飾ドメイン、転写制御ドメイン、RNAアプタマー結合ドメインまたはこれらの組み合わせである、請求項8の融合タンパク質。
【請求項10】
融合タンパク質がヌクレアーゼであり、二本鎖配列の両鎖を開裂する、ニッカーゼであり、二本鎖配列の一方の鎖を開裂するまたはヌクレアーゼまたはニッカーゼ活性を有しない、請求項1~9の何れかの融合タンパク質。
【請求項11】
Cas9タンパク質がストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)、ナイセリア・メニンギティディス(Neisseria meningitidis)、スタフィロコッカス・アウレウス(Staphylococcus aureus)またはカンピロバクター・ジェジュニ(Campylobacter jejuni)由来である、請求項1~10の何れかの融合タンパク質。
【請求項12】
マーカータンパク質が配列番号19または20と少なくとも90%配列同一性を有するアミノ酸配列を有する、請求項1~11の何れかの融合タンパク質。
【請求項13】
マーカータンパク質が配列番号19または20に示すアミノ酸配列を有する、請求項1~11の何れかの融合タンパク質。
【請求項14】
リンカーが配列番号35または36と少なくとも90%配列同一性を有するアミノ酸配列を有する、請求項3~13の何れかの融合タンパク質。
【請求項15】
リンカーが配列番号35または36に示すアミノ酸配列を有する、請求項3~13の何れかの融合タンパク質。
【請求項16】
融合タンパク質が配列番号48、49または50と少なくとも90%配列同一性を有するアミノ酸配列を有する、請求項3~15の何れかの融合タンパク質。
【請求項17】
融合タンパク質が配列番号48、49または50に示すアミノ酸配列を有する、請求項3~15の何れかの融合タンパク質。
【請求項18】
請求項1~17の何れかの融合タンパク質および操作されたガイドRNAを含む、システム。
【請求項19】
操作されたガイドRNAが単一分子である、請求項18のシステム。
【請求項20】
操作されたガイドRNA配列が、操作されたガイドRNA内での塩基対形成促進、操作されたガイドRNA内での塩基対形成最小化、操作されたガイドRNAの安定性増加、真核生物細胞における操作されたガイドRNAの転写促進またはこれらの組み合わせのために最適化されている、請求項18または19のシステム。
【請求項21】
請求項1~17の何れかの融合タンパク質をコードする、複数の核酸。
【請求項22】
複数の核酸が融合タンパク質をコードする少なくとも1つの核酸および少なくとも1つの操作されたガイドRNAをコードする核酸を含む、請求項18~20の何れかのシステムをコードする複数の核酸。
【請求項23】
融合タンパク質をコードする少なくとも1つの核酸がRNAである、請求項14の複数の核酸。
【請求項24】
融合タンパク質をコードする少なくとも1つの核酸がDNAである、請求項14の複数の核酸。
【請求項25】
融合タンパク質をコードする少なくとも1つの核酸が真核生物細胞における発現のためにコドン最適化されている、請求項21~24の何れかの複数の核酸。
【請求項26】
真核生物細胞がヒト細胞、非ヒト哺乳動物細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞、植物細胞または単細胞真核生物である、請求項25の複数の核酸。
【請求項27】
少なくとも1つの操作されたガイドRNAをコードする核酸がDNAである、請求項22~26の何れかの複数の核酸。
【請求項28】
融合タンパク質をコードする少なくとも1つの核酸が、インビトロRNA合成または細菌細胞におけるタンパク質発現のためにファージプロモーター配列に操作可能に連結され、少なくとも1つの操作されたガイドRNAをコードする核酸が、インビトロRNA合成のためにファージプロモーター配列に操作可能に連結されている、請求項22~27の何れかの複数の核酸。
【請求項29】
融合タンパク質をコードする少なくとも1つの核酸が、真核生物細胞における発現のために真核生物プロモーター配列に操作可能に連結され、少なくとも1つの操作されたガイドRNAをコードする核酸が、真核生物細胞における発現のために真核生物プロモーター配列に操作可能に連結されている、請求項22~27の何れかの複数の核酸。
【請求項30】
請求項21~29の何れかの複数の核酸を含む、少なくとも1つのベクター。
【請求項31】
プラスミドベクター、ウイルスベクターまたは自己複製ウイルスRNAレプリコンである、請求項30の少なくとも1つのベクター。
【請求項32】
請求項1~17の何れかの融合タンパク質、請求項18~20の何れかのシステム、請求項21~29の何れかの複数の核酸または請求項30もしくは31の少なくとも1つのベクターを含む少なくとも1つのシステムを含む、真核生物細胞。
【請求項33】
ヒト細胞、非ヒト哺乳動物細胞、植物細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞または単細胞真核生物である、請求項32の真核生物細胞。
【請求項34】
インビボ、エクスビボまたはインビトロである、請求項32または33の真核生物細胞。
【請求項35】
生存真核生物細胞または化学的に固定された真核生物細胞内の染色体同一性および位置を決定する方法であって、請求項1~31の何れかの融合タンパク質、システム、複数の核酸またはベクターを生存または化学的に固定された真核生物細胞に導入し、マーカータンパク質からのシグナルを測定することを含む、方法。
【請求項36】
真核生物細胞がヒト細胞、非ヒト哺乳動物細胞、植物細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞または単細胞真核生物である、請求項35の方法。
【請求項37】
真核生物細胞がインビボ、エクスビボまたはインビトロである、請求項35または36の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は、2019年2月15日出願の、米国仮出願62/806,708に基づく優先権の利益を請求し、その全体を引用により本明細書に包含させる。
【0002】
分野
本発明は、操作された(engineered)Cas9システム、該システムをコードする核酸およびゲノム修飾のための該システムの使用方法に関連する。
【背景技術】
【0003】
背景
多くの種々のタイプのペプチドリンカーがGFPをCas9に融合するために試験されているが、一般に基本的なCas9の活性低下に終わっている。
【発明の概要】
【0004】
発明の概要
本発明の種々の態様の中には、操作されたCas9システムが含まれる。
【0005】
本発明の他の態様および特性を次に詳述する。
【図面の簡単な説明】
【0006】
図1図1は、ここに開示するCas9融合タンパク質が各々SpCas9タンパク質のレベルに沿った編集活性を保持することを示す。
【0007】
図2図2Aおよび図2Bは、ここに開示するCas9融合タンパク質の編集効率が、全標的において市販タンパク質より数倍高かったことを示す。
【0008】
配列表
本出願は、ASCII形式で電子的に提供しており、引用によりその全体をここに包含させる配列表を含む。ASCIIコピーは、2020年2月13日に作成し、P19-027_WO-PCT_SL.txtなる名称であり、87,735バイトのサイズである。
【発明を実施するための形態】
【0009】
詳細な記載
アクセサリータンパク質のCRISPRタンパク質への融合は、種々のタンパク質機能性を細胞内の規定された位置に局在化させるための、広範囲に及ぶ機会を作る。数ある中でも、CRISPR機能性を保持する方法で異種タンパク質のCRISPRタンパク質への融合を可能にするペプチドリンカーが開示される。
【0010】
(I) 操作されたCas9システム
本発明のある態様は、操作されたCas9タンパク質およびシステムを提供する。例えば、Cas9-マーカー融合タンパク質が開示される。ある態様において、システムは、複数の操作されたCas9タンパク質および複数の操作されたガイドRNAを含み、ここで、各操作されたガイドRNAは、特定の一つの操作されたCas9タンパク質と複合体形成するよう設計される。これらの操作されたCas9システムは、天然には生じない。
【0011】
(a)操作されたCas9タンパク質
Cas9タンパク質は、種々の細菌に存在するII型CRISPRシステムにおける単一エフェクタータンパク質である。ここに開示する操作されたCas9タンパク質は、アカリオクロリス属(Acaryochloris sp.)、アセトハロビウム属(Acetohalobium sp.)、アシダミノコッカス属(Acidaminococcus sp.)、アシドチオバチルス属(Acidithiobacillus sp.)、アシドサーマス属(Acidothermus sp.)、アッケルマンシア属(Akkermansia sp.)、アリシクロバチルス属(Alicyclobacillus sp.)、アロクロマチウム属(Allochromatium sp.)、アンモニフェクス属(Ammonifex sp.)、アナベナ属(Anabaena sp.)、アルスロスピラ属(Arthrospira sp.)、バシラス属(Bacillus sp.)、ビフィドバクテリウム属(Bifidobacterium sp.)、バークホルデリア属(Burkholderiales sp.)、カルジセルロシラプター属(Caldicelulosiruptor sp.)、カンピロバクター属(Campylobacter sp.)、カンジダタス属(Candidatus sp.)、クロストリジウム属(Clostridium sp.)、コリネバクテリウム属(Corynebacterium sp.)、クロコスファエラ属(Crocosphaera sp.)、シアノセイス属(Cyanothece sp.)、エグジゴバクテリウム属(Exiguobacterium sp.)、フィブロバクター属(Fibrobacter sp.)、フィネゴルディア属(Finegoldia sp.)、フランシセラ属(Francisella sp.)、クテドノバクテリア属(Ktedonobacter sp.)、ラクノスピラセアエ属(Lachnospiraceae sp.)、ラクトバシラス属(Lactobacillus sp.)、リステリア属(Listeria sp.)、リングビア属(Lyngbya sp.)、マリノバクター属(Marinobacter sp.)、メタノハロビウム属(Methanohalobium sp.)、マイクロスシーラ属(Microscilla sp.)、ミクロコレウス属(Microcoleus sp.)、ミクロキスチス属(Microcystis sp.)、マイコプラズマ属(Mycoplasma sp.)、ナトラナエロビウス属(Natranaerobius sp.)、ナイセリア属(Neisseria sp.)、ニトラチフラクター属(Nitratifractor sp.)、ニトロソコッカス属(Nitrosococcus sp.)、ノカルジオプシス属(Nocardiopsis sp.)、ノドゥラリア属(Nodularia sp.)、ノストク属(Nostoc sp.)、オエノコッカス属(Oenococcus sp.)、オスキラトリア属(Oscillatoria sp.)、パラステレラ属(Parasutterella sp.)、パスツレラ属(Pasteurella sp.)、パルビバクラム属(Parvibaculum sp.)、ペロトマクラム属(Pelotomaculum sp.)、ペトロトガ属(Petrotoga sp.)、ポラロモナス属(Polaromonas sp.)、プレボテーラ属(Prevotella sp.)、シュードアルテロモナス属(Pseudoalteromonas sp.)、ラルストニア属(Ralstonia sp.)、ロドスピリラム属(Rhodospirillum sp.)、スタフィロコッカス属(Staphylococcus sp.)、ストレプトコッカス属(Streptococcus sp.)、ストレプトマイセス属(Streptomyces sp.)、ストレプトスポランギウム属(Streptosporangium sp.)、シネココッカス属(Synechococcus sp.)、サーモシフォ属(Thermosipho sp.)、トレポネーマ属(Treponema sp.)、ヴェルコミクロビア属(Verrucomicrobia sp.)およびウォリネラ属(Wolinella sp.)に由来し得る。
【0012】
Cas9タンパク質または他の要素の起源または由来であり得る種の例は、アカリオクロリス属菌種(Acaryochloris spp.)(例えば、アカリオクロリス・マリーナ(Acaryochloris marina))、アセトハロビウム属菌種(Acetohalobium spp.)(例えば、アセトハロビウム・アラバチクム(Acetohalobium arabaticum))、アシダミノコッカス属菌種(Acidaminococcus spp.)、アシドチオバチルス属菌種(Acidithiobacillus spp.)(例えば、アシドチオバチルス・カルダス(Acidithiobacillus caldus)、アシドチオバチルス・フェロオキシダンス(Acidithiobacillus ferrooxidans))、アシドサーマス属菌種(Acidothermus spp.)、アッケルマンシア属菌種(Akkermansia spp.)、アリシクロバチルス属菌種(Alicyclobacillus spp.)(例えば、アリシクロバチルス・アシドカルダリウス(Alicyclobacillus acidocaldarius))、アロクロマチウム属菌種(Allochromatium spp.)(例えば、アロクロマチウム・ビノサム(Allochromatium vinosum))、アンモニフェクス属菌種(Ammonifex spp.)(例えば、アンモニフェクス・デゲンジイ(Ammonifex degensii))、アナベナ属菌種(Anabaena spp.)(例えば、アナベナ・バリアビリス(Anabaena variabilis))、アルスロスピラ属菌種(Arthrospira spp.)(例えば、アルスロスピラ・マキシマ(Arthrospira maxima)、アルスロスピラ・プラテンシス(Arthrospira platensis))、バシラス属菌種(Bacillus spp.)(例えば、バシラス・シュードマイコイデス(Bacillus pseudomycoides)、バシラス・セレニティレデュセンス(Bacillus selenitireducens))、ビフィドバクテリウム属菌種(Bifidobacterium spp.)、バークホルデリア属菌種(Burkholderiales spp.)(例えば、バークホルデリア・バクテリウム(Burkholderiales bacterium))、カルジセルロシラプター属菌種(Caldicelulosiruptor spp.)(例えば、カルジセルロシラプター・ベシイ(Caldicelulosiruptor becscii))、カンピロバクター属菌種(Campylobacter spp.)(例えば、カンピロバクター・ジェジュニ(Campylobacter jejuni)、カンピロバクター・ラリ(Campylobacter lari))、カンジダタス属菌種(Candidatus spp.)(例えば、カンジダタス・デスルフォルディス(Candidatus Desulforudis))、クロストリジウム属菌種(Clostridium spp.)(例えば、クロストリジウム・ボツリヌム(Clostridium botulinum)、クロストリジウム・ディフィシル(Clostridium difficile))、コリネバクテリウム属菌種(Corynebacterium spp.)(例えば、コリネバクテリウム・ジフテリア(Corynebacterium diphtheria))、クロコスファエラ属菌種(Crocosphaera spp.)(例えば、クロコスファエラ・ワトソニイ(Crocosphaera watsonii))、シアノセイス属菌種(Cyanothece spp.)、デルタプロテオバクテリウム属菌種(Deltaproteobacterium spp)、エグジゴバクテリウム属菌種(Exiguobacterium spp.)(例えば、エグジゴバクテリウム・シビリカム(Exiguobacterium sibiricum))、フィブロバクター属菌種(Fibrobacter spp.)(例えば、フィブロバクター・スクシノゲン(Fibrobacter succinogene))、フィネゴルディア属菌種(Finegoldia spp)(例えば、フィネゴルディア・マグナ(Finegoldia magna))、フランシセラ属菌種(Francisella spp.)(例えば、フランシセラ・ノビシダ(Francisella novicida))、ガンマプロテオバクテリウム(Gammaproteobacterium)、クテドノバクター属菌種(Ktedonobacter spp.)(例えば、クテドノバクター・ラセミファー(Ktedonobacter racemifer))、ラクノスピラセアエ属菌種(Lachnospiraceae spp.)、ラクトバシラス属菌種(Lactobacillus spp.)(例えば、ラクトバシラス・ブフネリ(Lactobacillus buchneri)、ラクトバシラス・デルブルエッキイー(Lactobacillus delbrueckii)、ラクトバシラス・ガセリ(Lactobacillus gasseri)、ラクトバシラス・サリバリウス(Lactobacillus salivarius))、リステリア属菌種(Listeria spp.)(例えば、リステリア・イノキュア(Listeria innocua))、レプトトリキア属菌種(Leptotrichia spp.)、リングビア属菌種(Lyngbya spp.)、マリノバクター属菌種(Marinobacter spp.)、メタノハロビウム属菌種(Methanohalobium spp.)(例えば、メタノハロビウム・エベスチガータム(Methanohalobium evestigatum))、ミクロコレウス属菌種(Microcoleus spp.)(例えば、ミクロコレウス・クソノプラステス(Microcoleus chthonoplastes))、マイクロスシーラ属菌種(Microscilla spp.)(例えば、マイクロスシーラ・マリーナ(Microscilla marina))、ミクロキスチス属菌種(Microcystis spp.)(例えば、ミクロキスチス・エルギノーザ(Microcystis aeruginosa))、マイコプラズマ属菌種(Mycoplasma spp.)、ナトラナエロビウス属菌種(Natranaerobius spp.)(例えば、ナトラナエロビウス・サーモフィルス(Natranaerobius thermophilus))、ナイセリア属菌種(Neisseria spp.)(例えば、ナイセリア・シネレア(Neisseria cinerea)、ナイセリア・メニンギティディス(Neisseria meningitidis))、ニトラチフラクター属菌種(Nitratifractor spp.)、ニトロソコッカス属菌種(Nitrosococcus spp.)(例えば、ニトロソコッカス・ハロフィルス(Nitrosococcus halophilus)、ニトロソコッカス・ワトソニイ(Nitrosococcus watsoni))、ノカルジオプシス属菌種(Nocardiopsis spp.)(例えば、ノカルジオプシス・ダソンヴィレイ(Nocardiopsis dassonvillei))、ノドゥラリア属菌種(Nodularia spp.)(例えば、ノドゥラリア・スプミゲナ(Nodularia spumigena))、ノストク属菌種(Nostoc spp.)、オエノコッカス属菌種(Oenococcus spp.)、オスキラトリア属菌種(Oscillatoria spp.)、パラステレラ属菌種(Parasutterella spp.)、パルビバクラム属菌種(Parvibaculum spp.)(例えば、パルビバクラム・ラバメンティボランス(Parvibaculum lavamentivorans))、パスツレラ属菌種(Pasteurella spp.)(例えば、パスツレラ・ムルトシダ(Pasteurella multocida))、ペロトマクラム属菌種(Pelotomaculum spp.)(例えば、ペロトマクラム・サーモプロピオニカム(Pelotomaculum thermopropionicum))、ペトロトガ属菌種(Petrotoga spp.)(例えば、ペトロトガ・モビリス(Petrotoga mobilis))、プランクトミケス属菌種(Planctomyces spp.)、ポラロモナス属菌種(Polaromonas spp.)(例えば、ポラロモナス・ナフタレニボランス(Polaromonas naphthalenivorans))、プレボテーラ属菌種(Prevotella spp.)、シュードアルテロモナス属菌種(Pseudoalteromonas spp.)(例えば、シュードアルテロモナス・ハロプランクティス(Pseudoalteromonas haloplanktis))、ラルストニア属菌種(Ralstonia spp.)、ルミノコッカス属菌種(Ruminococcus spp.)、ロドスピリラム属菌種(Rhodospirillum spp.)(例えば、ロドスピリラム・ルブルム(Rhodospirillum rubrum))、スタフィロコッカス属菌種(Staphylococcus spp.)(例えば、スタフィロコッカス・アウレウス(Staphylococcus aureus))、ストレプトコッカス属菌種(Streptococcus spp.)(例えば、ストレプトコッカス・パステウリアヌス(Streptococcus pasteurianus)、ストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus))、サテレラ属菌種(Sutterella spp.)(例えば、サテレラ・ワズワーセンシス(Sutterella wadsworthensis))、ストレプトマイセス属菌種(Streptomyces spp.)(例えば、ストレプトマイセス・プリスチナエスピラリス(Streptomyces pristinaespiralis)、ストレプトマイセス・ビリドクロモゲネス(Streptomyces viridochromogenes)、ストレプトスポランギウム属菌種(Streptosporangium spp.)(例えば、ストレプトスポランギウム・ロゼウム(Streptosporangium roseum)、シネココッカス属菌種(Synechococcus spp.)、サーモシフォ属菌種(Thermosipho spp.)(例えば、サーモシフォ・アフリカヌス(Thermosipho africanus))、トレポネーマ属菌種(Treponema spp.)(例えば、トレポネーマ・デンティコラ(Treponema denticola))およびヴェルコミクロビア属菌種(Verrucomicrobia spp.)、ウォリネラ属菌種(Wolinella spp.)(例えば、ウォリネラ・スクシノゲネス(Wolinella succinogenes))および/またはMakarova, Kira S., et al. "An updated evolutionary classification of CRISPR-Cas systems." Nature Reviews Microbiology 13.11 (2015): 722およびKoonin, Eugene V., Kira S. Makarova, and Feng Zhang. "Diversity, classification and evolution of CRISPR-Cas systems." Current opinion in microbiology 37 (2017): 67-78(各々引用によりそれら全体を本明細書に包含させる)に開示されているものなどのゲノムデータベースのバイオインフォマティクス調査において記述されている種を含む。
【0013】
ある実施態様において、操作されたCas9タンパク質はストレプトコッカス・ピオゲネスからであり得る。ある実施態様において、操作されたCas9タンパク質はストレプトコッカス・サーモフィルスからであり得る。ある実施態様において、操作されたCas9タンパク質はナイセリア・メニンギティディスからであり得る。ある実施態様において、操作されたCas9タンパク質はスタフィロコッカス・アウレウスからであり得る。ある実施態様において、操作されたCas9タンパク質はカンピロバクター・ジェジュニからであり得る。
【0014】
野生型Cas9タンパク質は2個のヌクレアーゼドメイン、すなわち、RuvCおよびHNHドメインを含み、その各々は二本鎖配列の一方の鎖を開裂する。Cas9タンパク質はまたガイドRNA(例えば、REC1、REC2)またはRNA/DNAヘテロ二本鎖(例えば、REC3)と相互作用するRECドメインおよびプロトスペーサー隣接モチーフ(PAM)と相互作用するドメイン(すなわち、PAM相互作用ドメイン)も含む。
【0015】
Cas9タンパク質は、Cas9タンパク質が改変された活性、特異性および/または安定性を有するように、1以上の修飾(すなわち、少なくとも1個のアミノ酸の置換、少なくとも1個のアミノ酸の欠失、少なくとも1個のアミノ酸の挿入)を含むよう操作され得る。
【0016】
例えば、Cas9タンパク質は、ヌクレアーゼドメインの一方または両方を不活性化する1以上の変異および/または欠失により操作され得る。一方のヌクレアーゼドメインの不活性化は、二本鎖配列の一方の鎖を開裂するCas9タンパク質(すなわち、Cas9ニッカーゼ)を生成する。RuvCドメインはD10A、D8A、E762Aおよび/またはD986Aなどの変異により不活性化され得て、HNHドメインはH840A、H559A、N854A、N856Aおよび/またはN863Aなどの変異により不活性化され得る(ストレプトコッカス・ピオゲネスCas9、SpyCas9のナンバリングシステムを参照)。両ヌクレアーゼドメインの不活性化は、開裂活性を有しないCas9タンパク質(すなわち、触媒として不活性または無効な(dead)Cas9)を生じる。
【0017】
Cas9タンパク質は、改善されたターゲティング特異性、改善された忠実度、改変されたPAM特異性、低減されたオフターゲット効果および/または増加した安定性を有するように、1以上のアミノ酸置換、欠失および/または挿入によっても操作され得る。ターゲティング特異性を改善する、忠実度を改善するおよび/またはオフターゲット効果を低減する1以上の変異の非限定的例は、N497A、R661A、Q695A、K810A、K848A、K855A、Q926A、K1003A、R1060Aおよび/またはD1135Eを含む(SpyCas9のナンバリングシステムを参照)。
【0018】
別の実施態様において、Casタンパク質はI型CRISPR/Casシステムに由来し得る。ある実施態様において、Casタンパク質は、I型CRISPR/Casシステムのカスケード複合体の成分であり得る。例えば、Casタンパク質はCas3タンパク質であり得る。ある実施態様において、Casタンパク質はIII型CRISPR/Casシステムからであり得る。ある実施態様において、Casタンパク質はIV型CRISPR/Casシステムからであり得る。ある実施態様において、Casタンパク質はV型CRISPR/Casシステムからであり得る。ある実施態様において、Casタンパク質はVI型CRISPR/Casシステムからであり得る。ある実施態様において、Casタンパク質はRNA開裂活性を有し得る。種々の実施態様において、Casタンパク質はCas9、Cas12a(別名Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e(別名CasX)、Cas13aまたはCas13bとして分類され得る。
【0019】
(i) 異種ドメイン
Cas9タンパク質は、少なくとも1つの異種ドメインを含むように操作され得て、すなわち、Cas9は1以上の異種ドメインに融合される。2以上の異種ドメインがCas9と融合する状況において、2以上の異種ドメインは同一であってよくまたはそれらは異なってよい。1以上の異種ドメインはN末端、C末端、内部位置またはこれらの組み合わせに融合し得る。融合は、化学結合を介した直接的であってよくまたは該結合は1以上のリンカーを介して間接的であってよい。
【0020】
ある好ましい実施態様において、ここに記載する操作されたCas9タンパク質は、1以上の核移行シグナル(NLS)を含む。核移行シグナルの非限定的例は、PKKKRKV(配列番号1)、PKKKRRV(配列番号2)、KRPAATKKAGQAKKKK(配列番号3)、YGRKKRRQRRR(配列番号4)、RKKRRQRRR(配列番号5)、PAAKRVKLD(配列番号6)、RQRRNELKRSP(配列番号7)、VSRKRPRP(配列番号8)、PPKKARED(配列番号9)、PQPKKKPL(配列番号10)、SALIKKKKKMAP(配列番号11)、PKQKKRK(配列番号12)、RKLKKKIKKL(配列番号13)、REKKKFLKRR(配列番号14)、KRKGDEVDGVDEVAKKKSKK(配列番号15)、RKCLQAGMNLEARKTKK(配列番号16)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号17)およびRMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号18)を含む。
【0021】
ある特定の実施態様において、核移行シグナルはPKKKRKV(配列番号1)およびPAAKRVKLD(配列番号6)から選択される。他の特定の実施態様において、操作されたCas9タンパク質はPKKKRKV(配列番号1)およびPAAKRVKLD(配列番号6)の両者を含む。他の特定の実施態様において、操作されたCas9タンパク質は、少なくとも2つのPKKKRKV(配列番号1)および少なくとも1つのPAAKRVKLD(配列番号6)を含む。他の特定の実施態様において、操作されたCas9タンパク質は、2つのPKKKRKV(配列番号1)および1つのPAAKRVKLD(配列番号6)を含む。
【0022】
これらおよび他の好ましい実施態様において、操作されたCas9タンパク質は1以上のマーカードメインを含む。マーカードメインは、蛍光タンパク質および精製またはエピトープタグを含む。適当な蛍光タンパク質は、緑色蛍光タンパク質(例えば、GFP、eGFP、GFP-2、tagGFP、turboGFP、Emerald、Azami Green、Monomeric Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色蛍光タンパク質(例えば、YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、青色蛍光タンパク質(例えば、BFP、EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire)、シアン蛍光タンパク質(例えば、ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、赤色蛍光タンパク質(例えば、mKate、mKate2、mPlum、DsRedモノマー、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)、橙色蛍光タンパク質(例えば、mOrange、mKO、Kusabira-Orange、Monomeric Kusabira-Orange、mTangerine、tdTomato)またはこれらの組み合わせを含むが、これらに限定されない。マーカードメインは、1以上の蛍光タンパク質のタンデムリピート(例えば、Suntag)を含み得る。
【0023】
ある実施態様において、マーカータンパク質は次のものから選択される。
【表1】

【0024】
適当な精製またはエピトープタグの非限定的例は、6xHis(配列番号22)、FLAG(登録商標)(例えば、配列番号21)、HA、GST、Myc、SAMなどを含む。CRISPR複合体の検出または富化を促進する異種融合の非限定的例は、ストレプトアビジン(Kipriyanov et al., Human Antibodies, 1995, 6(3):93-101)、アビジン(Airenne et al., Biomolecular Engineering, 1999, 16(1-4):87-92)、単量体形態のアビジン(Laitinen et al., Journal of Biological Chemistry, 2003, 278(6):4010-4014)、組み換え産生中のビオチニル化を促進するペプチドタグ(Cull et al., Methods in Enzymology, 2000, 326:430-440)を含む。
【0025】
核移行シグナルおよびマーカータンパク質に加えて、種々の実施態様において、操作されたCas9タンパク質は、細胞透過性ドメイン、マーカードメイン、クロマチン破壊ドメイン、後成的修飾ドメイン(例えば、シチジンデアミナーゼドメイン、ヒストンアセチルトランスフェラーゼドメインなど)、転写制御ドメイン、RNAアプタマー結合ドメインまたは非Cas9ヌクレアーゼドメインなどの1以上の異種ドメインも含み得る。
【0026】
ある実施態様において、1以上の異種ドメインは細胞透過性ドメインであり得る。適当な細胞透過性ドメインの例は、GRKKRRQRRRPPQPKKKRKV(配列番号23)、PLSSIFSRIGDPPKKKRKV(配列番号24)、GALFLGWLGAAGSTMGAPKKKRKV(配列番号25)、GALFLGFLGAAGSTMGAWSQPKKKRKV(配列番号26)、KETWWETWWTEWSQPKKKRKV(配列番号27)、YARAAARQARA(配列番号28)、THRLPRRRRRR(配列番号29)、GGRRARRRRRR(配列番号30)、RRQRRTSKLMKR(配列番号31)、GWTLNSAGYLLGKINLKALAALAKKIL(配列番号32)、KALAWEAKLAKALAKALAKHLAKALAKALKCEA(配列番号33)およびRQIKIWFQNRRMKWKK(配列番号34)を含むが、これらに限定されない。
【0027】
さらに他の実施態様において、1以上の異種ドメインはクロマチン調節モチーフ(CMM)であり得る。CMMの非限定的例は、高移動度群(HMG)タンパク質(例えば、HMGB1、HMGB2、HMGB3、HMGN1、HMGN2、HMGN3a、HMGN3b、HMGN4およびHMGN5タンパク質)由来のヌクレオソーム相互作用ペプチド、ヒストンH1バリアント(例えば、ヒストンH1.0、H1.1、H1.2、H1.3、H1.4、H1.5、H1.6、H1.7、H1.8、H1.9およびH.1.10)の中心球状ドメインまたはクロマチンリモデリング複合体のDNA結合ドメイン(例えば、SWI/SNF(SWItch/Sucrose Non-Fermentable)、ISWI(Imitation SWItch)、CHD(Chromodomain-Helicase-DNA binding)、Mi-2/NuRD(Nucleosome Remodeling and Deacetylase)、INO80、SWR1およびRSC複合体を含む。他の実施態様において、CMMはまたトポイソメラーゼ、ヘリカーゼまたはウイルスタンパク質にも由来し得る。CMMのこれら供給源は変わり得てかつ変わる。CMMはヒト、動物(すなわち、脊椎動物および無脊椎動物)、植物、藻類または酵母由来であり得る。特異的CMMの非限定的例を下表に挙げる。当業者は、他の種におけるホモログおよび/またはその中の関連融合モチーフを容易に同定できる。
【表2】

【0028】
さらに他の実施態様において、1以上の異種ドメインは、後成的修飾ドメインであり得る。適当な後成的修飾ドメインの非限定的例は、DNA脱アミノ化(例えば、シチジンデアミナーゼ、アデノシンデアミナーゼ、グアニンデアミナーゼ)、DNAメチルトランスフェラーゼ活性(例えば、シトシンメチルトランスフェラーゼ)、DNAデメチラーゼ活性、DNAアミノ化、DNA酸化活性、DNAヘリカーゼ活性、ヒストンアセチルトランスフェラーゼ(HAT)活性(例えば、E1A結合タンパク質p300由来HATドメイン)、ヒストンデアセチラーゼ活性、ヒストンメチルトランスフェラーゼ活性、ヒストンデメチラーゼ活性、ヒストンキナーゼ活性、ヒストンホスファターゼ活性、ヒストンユビキチンリガーゼ活性、ヒストン脱ユビキチン化活性、ヒストンアデニル化活性、ヒストン脱アデニル化活性、ヒストンSUMO化活性、ヒストン脱SUMO化活性、ヒストンリボシル化活性、ヒストン脱リボシル化活性、ヒストンミリストイル化活性、ヒストン脱ミリストイル化活性、ヒストンシトルリン化活性、ヒストンアルキル化活性、ヒストン脱アルキル化活性またはヒストン酸化活性を有するものを含む。具体的実施態様において、後成的修飾ドメインは、シチジンデアミナーゼ活性、アデノシンデアミナーゼ活性、ヒストンアセチルトランスフェラーゼ活性またはDNAメチルトランスフェラーゼ活性を含み得る。
【0029】
他の実施態様において、1以上の異種ドメインは転写制御ドメイン(すなわち、転写活性化ドメインまたは転写リプレッサードメイン)であり得る。適当な転写活性化ドメインは、単純ヘルペスウイルスVP16ドメイン、VP64(すなわち、VP16の4個のタンデムコピー)、VP160(すなわち、VP16の10個のタンデムコピー)、NFκB p65活性化ドメイン(p65)、エプスタイン・バールウイルスRトランスアクティベーター(Rta)ドメイン、VPR(すなわち、VP64+p65+Rta)、p300依存的転写活性化ドメイン、p53活性化ドメイン1および2、ヒートショック因子1(HSF1)活性化ドメイン、Smad4活性化ドメイン(SAD)、cAMP応答要素結合タンパク質(CREB)活性化ドメイン、E2A活性化ドメイン、活性化T細胞核内因子(NFAT)活性化ドメインまたはこれらの組み合わせを含むが、これらに限定されない。適当な転写リプレッサードメインの非限定的例は、クルッペル関連ボックス(KRAB)リプレッサードメイン、Mxiリプレッサードメイン、誘導型cAMP早期リプレッサー(ICER)ドメイン、YY1グリシンリッチリプレッサードメイン、Sp1様リプレッサー、E(spl)リプレッサー、IκBリプレッサー、Sin3リプレッサー、メチル-CpG結合タンパク質2(MeCP2)リプレッサーまたはこれらの組み合わせを含む。転写活性化または転写リプレッサードメインは、Cas9タンパク質に遺伝的に融合されるかまたは非共有結合性タンパク質-タンパク質、タンパク質-RNAまたはタンパク質-DNA相互作用を介して結合され得る。
【0030】
さらなる実施態様において、1以上の異種ドメインはRNAアプタマー結合ドメインであり得る(Konermann et al., Nature, 2015, 517(7536):583-588; Zalatan et al., Cell, 2015, 160(1-2):339-50)。適当なRNAアプタマータンパク質ドメインの例は、MS2コートタンパク質(MCP)、PP7バクテリオファージコートタンパク質(PCP)、MuバクテリオファージComタンパク質、ラムダバクテリオファージN22タンパク質、ステムループ結合タンパク質(SLBP)、脆弱X精神遅滞症候群関連タンパク質1(FXR1)、AP205、BZ13、f1、f2、fd、fr、ID2、JP34/GA、JP501、JP34、JP500、KU1、M11、M12、MX1、NL95、PP7、φCb5、φCb8r、φCb12r、φCb23r、Qβ、R17、SP-β、TW18、TW19およびVKなどのバクテリオファージ由来タンパク質、それらのフラグメントまたはそれらの誘導体を含む。
【0031】
さらに他の実施態様において、1以上の異種ドメインは、非Cas9ヌクレアーゼドメインであり得る。適当なヌクレアーゼドメインは、何れかのエンドヌクレアーゼまたはエキソヌクレアーゼから得ることができる。ヌクレアーゼドメインが由来し得るエンドヌクレアーゼの非限定的例は、制限エンドヌクレアーゼおよびホーミングエンドヌクレアーゼを含むが、これらに限定されない。ある実施態様において、ヌクレアーゼドメインは、II型S制限エンドヌクレアーゼであり得る。II型Sエンドヌクレアーゼは、一般に認識/結合部位から数塩基対離れた場所でDNAを開裂し、そのようなものとして、分離可能な結合および開裂ドメインを有する。これらの酵素は、一般に、一過性に結合して二量体を形成し、DNAの各鎖を互い違いの位置で開裂する単量体である。適当なII型Sエンドヌクレアーゼの非限定的例は、BfiI、BpmI、BsaI、BsgI、BsmBI、BsmI、BspMI、FokI、MboIIおよびSapIを含む。ある実施態様において、ヌクレアーゼドメインは、FokIヌクレアーゼドメインまたはその誘導体であり得る。II型Sヌクレアーゼドメインは、2つの異なるヌクレアーゼドメインの二量体化を促進するよう修飾され得る。例えば、FokIの開裂ドメインは、あるアミノ酸残基の変異導入により修飾され得る。非限定的例として、FokIヌクレアーゼドメインの446位、447位、479位、483位、484位、486位、487位、490位、491位、496位、498位、499位、500位、531位、534位、537位および538位のアミノ酸残基は、修飾の標的である。具体的実施態様において、FokIヌクレアーゼドメインは、Q486E、I499Lおよび/またはN496D変異を含む第一FokI半ドメインならびにE490K、I538Kおよび/またはH537R変異を含む第二FokI半ドメインを含み得る。
【0032】
1以上の異種ドメインは、1以上の化学結合(例えば、共有結合)によりCas9タンパク質に直接連結され得るかまたは1以上の異種ドメインは1以上のリンカーを介してCas9タンパク質に間接的に連結され得る。
【0033】
リンカーは、少なくとも1つの共有結合を介して1以上の他の化学基を接続する化学基である。適当なリンカーは、アミノ酸、ペプチド、ヌクレオチド、核酸、有機リンカー分子(例えば、マレイミド誘導体、N-エトキシベンジルイミダゾール、ビフェニル-3,4’,5-トリカルボン酸、p-アミノベンジルオキシカルボニルなど)、ジスルフィドリンカーおよびポリマーリンカー(例えば、PEG)を含む。リンカーは、アルキレン、アルケニレン、アルキニレン、アルキル、アルケニル、アルキニル、アルコキシ、アリール、ヘテロアリール、アラルキル、アラルケニル、アラルキニルなどを含むが、これらに限定されない1以上のスペーシング基を含み得る。リンカーは中性であるかまたは正もしくは負電荷を有し得る。さらに、リンカーは、リンカーを他の化学基に接続する該リンカーの共有結合が、pH、温度、塩濃度、光、触媒または酵素を含む一定条件下で破壊または開裂されるように開裂可能であり得る。ある実施態様において、リンカーはペプチドリンカーであり得る。ペプチドリンカーは、(例えば、小さな、非極性または極性アミノ酸を含む)可撓性アミノ酸リンカーであり得る。
【0034】
ある特定の実施態様において、リンカーは次のものから選択される。
【表3】

【0035】
可撓性リンカーの他の非限定的例は、LEGGGS(配列番号37)、TGSG(配列番号38)、GGSGGGSG(配列番号39)、(GGGGS)1-4(配列番号40)および(Gly)6-8(配列番号41)を含む。あるいは、ペプチドリンカーは、硬いアミノ酸リンカーであり得る。このようなリンカーは、(EAAAK)1-4(配列番号42)、A(EAAAK)2-5A(配列番号43)、PAPAP(配列番号44)および(AP)6-8(配列番号45)を含む。適当なリンカーのさらなる例は当分野で周知であり、リンカーを設計するためのプログラムは容易に利用可能である(Crasto et al., Protein Eng., 2000, 13(5):309-312)。
【0036】
ある実施態様において、操作されたCas9タンパク質は、無細胞システム、細菌細胞または真核生物細胞で組み換えにより産生し、標準的精製手段を使用して精製することができる。他の実施態様において、操作されたCas9タンパク質は、操作されたCas9タンパク質をコードする核酸から目的の真核生物細胞においてインビボで産生される(下記セクション(II)参照)。
【0037】
操作されたCas9タンパク質がヌクレアーゼまたはニッカーゼ活性を含む実施態様において、操作されたCas9タンパク質は、さらに少なくとも細胞透過性ドメインおよび少なくとも1つのクロマチン破壊ドメインを含み得る。操作されたCas9タンパク質が後成的修飾ドメインに結合される実施態様において、操作されたCas9タンパク質は、さらに少なくとも1つの細胞透過性ドメインおよび少なくとも1つのクロマチン破壊ドメインを含み得る。さらに、操作されたCas9タンパク質が転写制御ドメインに連結される実施態様において、操作されたCas9タンパク質は、さらに少なくとも1つの細胞透過性ドメイン、ならびに少なくとも1つのクロマチン破壊ドメインおよび/または少なくとも1つのRNAアプタマー結合ドメインを含み得る。
【0038】
種々の融合タンパク質要素は、N末端からC末端方向で、どのような順番でも、組み合わせられ得る。例えば、Aがマーカータンパク質であり、Bが核移行シグナルであり、CがCas9タンパク質であるとき、融合タンパク質は、N末端からC末端方向で、次のA-B-C;A-C-B;B-A-C;B-C-A;C-A-B;またはC-B-Aの方法で配置され得て、ここで、リンカー(「-L-」)が何れかの2つの間に配置され得る(例えば、A-L-B-C;A-B-L-C;A-L-B-L-Cなど)。
【0039】
(b) 操作されたガイドRNA
操作されたガイドRNAは、特定の一つの操作されたCas9タンパク質と複合体形成するよう設計される。ガイドRNAは、(i)5’末端に標的配列とハイブリダイズするガイド配列を含むCRISPR RNA(crRNA)および(ii)Cas9タンパク質を動員させるトランス作用crRNA(tracrRNA)配列を含む。各ガイドRNAの該crRNAガイド配列は異なる(すなわち、配列特異的である)。tracrRNA配列は、一般に特定の細菌種からのCas9タンパク質と複合体形成するよう設計されたガイドRNAにおいては同じである。
【0040】
crRNAガイド配列は、標的配列(すなわち、プロトスペーサー)と二本鎖配列でハイブリダイズするよう設計される。一般に、crRNAと該標的配列の相補性は、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%または少なくとも99%である。具体的実施態様において、相補性は完全(すなわち、100%)である。種々の実施態様において、crRNAガイド配列の長さは、約15ヌクレオチド~約25ヌクレオチドの範囲であり得る。例えば、crRNAガイド配列は、約15、16、17、18、19、20、21、22、23、24または25ヌクレオチド長であり得る。具体的実施態様において、crRNAは、約19、20または21ヌクレオチド長である。ある実施態様において、crRNAガイド配列は20ヌクレオチドの長さを有する。
【0041】
ガイドRNAは、Cas9タンパク質と相互作用する少なくとも1つのステムループ構造を形成する反復配列および一本鎖のままである3’配列を含む。各ループおよびステムの長さは変わり得る。例えば、ループは約3~約10ヌクレオチド長の範囲であり得て、ステムは約6~約20塩基対長であり得る。ステムは、1~約10ヌクレオチドの1以上のバルジを含み得る。一本鎖3’領域の長さは変わり得る。操作されたガイドRNAにおける該tracrRNA配列は、一般に目的の細菌種における野生型tracrRNAのコード配列に基づく。野生型配列を、二次構造形成促進、二次構造安定性増加、真核生物細胞における発現促進などのために修飾し得る。例えば、1以上のヌクレオチド変化を、ガイドRNAコード配列に導入し得る(下記実施例3参照)。tracrRNA配列は、約50ヌクレオチド~約300ヌクレオチドの範囲の長さであり得る。種々の実施態様において、tracrRNAは、約50~約90ヌクレオチド、約90~約110ヌクレオチド、約110~約130ヌクレオチド、約130~約150ヌクレオチド、約150~約170ヌクレオチド、約170~約200ヌクレオチド、約200~約250ヌクレオチドまたは約250~約300ヌクレオチドの範囲の長さであり得る。
【0042】
一般に、操作されたガイドRNAは、crRNA配列がtracrRNA配列に連結された単一分子(すなわち、シングルガイドRNAまたはsgRNA)である。ある実施態様において、しかしながら、操作されたガイドRNAは、2つの別の分子であり得る。第一分子は、第二分子の5’末端と塩基対形成できる3’配列(約6~約20ヌクレオチド含む)を含むcrRNAを含み、ここで、第二分子は、第一分子の3’末端と塩基対形成できる5’配列(約6~約20ヌクレオチド含む)を含むtracrRNAを含む。
【0043】
ある実施態様において、操作されたガイドRNAのtracrRNA配列は、1以上のアプタマー配列を含むように修飾され得る(Konermann et al., Nature, 2015, 517(7536):583-588; Zalatan et al., Cell, 2015, 160(1-2):339-50)。適当なアプタマー配列は、MCP、PCP、Com、SLBP、FXR1、AP205、BZ13、f1、f2、fd、fr、ID2、JP34/GA、JP501、JP34、JP500、KU1、M11、M12、MX1、NL95、PP7、φCb5、φCb8r、φCb12r、φCb23r、Qβ、R17、SP-β、TW18、TW19、VK、それらのフラグメントまたはそれらの誘導体から選択されるアダプタータンパク質に結合するものを含む。当業者は、アプタマー配列の長さが変わり得ることを認識する。
【0044】
他の実施態様において、ガイドRNAは、さらに少なくとも1つの検出可能な標識を含み得る。検出可能な標識は、フルオロフォア(例えば、FAM、TMR、Cy3、Cy5、Texas Red、Oregon Green、Alexa Fluors、ハロタグまたは適当な蛍光色素)、検出タグ(例えば、ビオチン、ジゴキシゲニンなど)、量子ドットまたは金粒子であり得る。
【0045】
ガイドRNAは、標準的リボヌクレオチドおよび/または修飾リボヌクレオチドを含み得る。ある実施態様において、ガイドRNAは、標準的または修飾デオキシリボヌクレオチドを含み得る。ガイドRNAが酵素合成される(すなわち、インビボまたはインビトロ)実施態様において、ガイドRNAは、一般に標準的リボヌクレオチドを含む。ガイドRNAが化学合成される実施態様において、ガイドRNAは標準的または修飾リボヌクレオチドおよび/またはデオキシリボヌクレオチドを含み得る。修飾リボヌクレオチドおよび/またはデオキシリボヌクレオチドは、塩基修飾(例えば、シュードウリジン、2-チオウリジン、N6-メチルアデノシンなど)および/または糖修飾(例えば、2’-O-メチル、2’-フルオロ、2’-アミノ、ロックド核酸(LNA)など)を含む。ガイドRNAの主鎖も、ホスホロチオエート結合、ボラノホスフェート結合またはペプチド核酸を含むよう修飾され得る。
【0046】
(c) PAM配列
ある実施態様において、標的配列は、CRISPR/Cas9複合体により認識される短配列であるプロトスペーサー隣接モチーフ(PAM)に隣接され得る。ある実施態様において、PAMは、標的配列の3’末端に隣接するかまたは1、2、3もしくは4ヌクレオチド以内であり得る。PAMの長さおよび配列は、使用するCas9タンパク質に依存し得る。例えば、PAMは、特定の一つのCas9タンパク質またはCas9オルソログに対するコンセンサスまたは特異的PAM配列から選択され得て、引用により本明細書に包含させるRan et al., Nature, 520: 186-191 (2015)のFIG. 1に記載のものを含む。ある実施態様において、PAMは、2、3、4、5、6、7、8、9または10ヌクレオチド長を含み得る。非限定的例示的PAM配列は、NGG、NGGNG、NG、NAAAAN、NNAAAAW、NNNNACA、GNNNCNNAおよびNNNNGATT(ここで、Nは任意のヌクレオチドとして定義され、WはAまたはTとして定義される)を含む。ある実施態様において、PAM配列はNGGであり得る。ある実施態様において、PAM配列はNGGNGであり得る。ある実施態様において、PAM配列はNNAAAAWであり得る。
【0047】
異なるCRISPRタンパク質は異なるPAM配列を認識することは理解される。例えば、Cas9タンパク質のためのPAM配列は5’-NGG、5’-NGGNG、5’-NNAGAAW、5’-NNNNGATT、5-NNNNRYAC、5’-NNNNCAAA、5’-NGAAA、5’-NNAAT、5’-NNNRTA、5’-NNGG、5’-NNNRTA、5’-MMACCA、5’-NNNNGRY、5’-NRGNK、5’-GGGRG、5’-NNAMMMCおよび5’-NNGを含み、Cas12aタンパク質のためのPAM配列は5’-TTNおよび5’-TTTVを含み、ここで、Nは任意のヌクレオチドとして定義され、RはGまたはAとして定義され、WはAまたはTとして定義され、YはCまたはTとして定義され、そしてVはA、CまたはGとして定義される。一般に、Cas9 PAMは標的配列の3’に位置し、Cas12a PAMは標的配列の5’に位置する。種々のPAM配列およびそれらを認識するCRISPRタンパク質は文献、例えば、各々引用により全体として本明細書に包含させる米国特許出願公開2019/0249200; Leenay, Ryan T., et al. "Identifying and visualizing functional PAM diversity across CRISPR-Cas systems." Molecular cell 62.1 (2016): 137-147;およびKleinstiver, Benjamin P., et al. "Engineered CRISPR-Cas9 nucleases with altered PAM specificities." Nature 523.7561 (2015): 481により知られる。
【0048】
これに加えてまたはこれとは別に、ここに開示する操作されたCas9システムの各々に対するPAMを下に示す。
【表4】


例えば、引用により全体として本明細書に包含させる米国特許出願公開2019/0249200参照。
【0049】
(II) 核酸
本発明のさらなる態様は、セクション(I)に上記された操作されたCas9システムをコードする核酸を提供する。システムは、単一核酸または複数核酸により高度され得る。核酸はDNAでもRNAでも、直鎖状でも環状でも、一本鎖でも二本鎖でもよい。RNAまたはDNAは、目的の真核生物細胞におけるタンパク質への効率的な翻訳のためにコドン最適化され得る。コドン最適化プログラムは、フリーウェアとしてまたは商業的供給源から入手可能である。
【0050】
ある実施態様において、核酸は、配列番号48、49または50のアミノ酸配列に対して少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%または少なくとも約99%配列同一性を有するタンパク質をコードする。ある実施態様において、操作されたCas9タンパク質をコードする核酸は、配列番号48、49または50のDNA配列に対して少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%または少なくとも約99%配列同一性を有し得る。ある実施態様において、操作されたCas9タンパク質をコードするDNAは、配列番号48、49または50のDNA配列を有する。さらなる実施態様において、核酸は、配列番号48、49または50のアミノ酸配列に対して少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%または少なくとも約99%配列同一性を有するタンパク質をコードする。
【0051】
ある実施態様において、操作されたCas9タンパク質をコードする核酸はRNAであり得る。RNAは、インビトロで酵素合成され得る。これについて、操作されたCas9タンパク質をコードするDNAを、インビトロRNA合成のためのファージRNAポリメラーゼにより認識されるプロモーター配列に操作可能に連結し得る。例えば、プロモーター配列はT7、T3もしくはSP6プロモーター配列またはT7、T3もしくはSP6プロモーター配列の異形であり得る。操作されたタンパク質をコードするDNAは、下記のとおりベクターの一部であり得る。このような実施態様において、インビトロ転写RNAは精製、キャップ化および/またはポリアデニル化され得る。他の実施態様において、操作されたCas9タンパク質をコードするRNAは、自己複製RNAの一部であり得る(Yoshioka et al., Cell Stem Cell, 2013, 13:246-254)。自己複製RNAは、限られた回数の細胞分裂について自己複製可能であり、目的のタンパク質をコードするように修飾され得るプラス鎖、一本鎖RNAである非感染性、自己複製ベネズエラウマ脳炎(VEE)ウイルスRNAレプリコンに由来し得る(Yoshioka et al., Cell Stem Cell, 2013, 13:246-254)。
【0052】
他の実施態様において、操作されたCas9タンパク質をコードする核酸は、DNAであり得る。DNAコード配列は、目的の細胞における発現のために、少なくとも1つのプロモーター制御配列に操作可能に連結され得る。ある実施態様において、DNAコード配列は、細菌(例えば、大腸菌)細胞または真核生物(例えば、酵母、昆虫または哺乳動物)細胞における操作されたCas9タンパク質の発現のためにプロモーター配列に操作可能に連結され得る。適当な細菌プロモーターは、T7プロモーター、lacオペロンプロモーター、trpプロモーター、tacプロモーター(trpプロモーターとlacプロモーターのハイブリッド)、前記の何れかの異形および前記の何らかの組み合わせを含むが、これらに限定されない。適当な真核生物プロモーターの非限定的例は、構成的、制御的または細胞もしくは組織特異的プロモーターを含む。適当な真核生物構成的プロモーター制御配列は、サイトメガロウイルス最初期プロモーター(CMV)、サルウイルス(SV40)プロモーター、アデノウイルス主要後期プロモーター、ラウス肉腫ウイルス(RSV)プロモーター、マウス乳房腫瘍ウイルス(MMTV)プロモーター、ホスホグリセリン酸キナーゼ(PGK)プロモーター、伸長因子(ED1)-アルファプロモーター、ユビキチンプロモーター、アクチンプロモーター、チューブリンプロモーター、免疫グロブリンプロモーター、それらのフラグメントまたは前記の何らかの組み合わせを含むが、これらに限定されない。適当な真核生物制御的プロモーター制御配列の例は、ヒートショック、金属、ステロイド、抗生物質またはアルコールにより制御されるものを含むが、これらに限定されない。組織特異的プロモーターの非限定的例は、B29プロモーター、CD14プロモーター、CD43プロモーター、CD45プロモーター、CD68プロモーター、デスミンプロモーター、エラスターゼ-1プロモーター、エンドグリンプロモーター、フィブロネクチンプロモーター、Flt-1プロモーター、GFAPプロモーター、GPIIbプロモーター、ICAM-2プロモーター、INF-βプロモーター、Mbプロモーター、NphsIプロモーター、OG-2プロモーター、SP-Bプロモーター、SYN1プロモーターおよびWASPプロモーターを含むが、これらに限定されない。プロモーター配列は野生型であってよくまたはより効率的なまたは効果的な発現のために修飾され得る。ある実施態様において、DNAコード配列はまたポリアデニル化シグナル(例えば、SV40 polyAシグナル、ウシ成長ホルモン(BGH)polyAシグナルなど)および/または少なくとも1つの転写終止配列に連結され得る。ある状況において、操作されたCas9タンパク質は細菌または真核生物細胞から精製され得る。
【0053】
さらに他の実施態様において、操作されたガイドRNAは、DNAによりコードされ得る。一部例において、操作されたガイドRNAをコードするDNAは、インビトロRNA合成のためのファージRNAポリメラーゼにより認識されるプロモーター配列に操作可能に連結され得る。例えば、プロモーター配列はT7、T3もしくはSP6プロモーター配列またはT7、T3もしくはSP6プロモーター配列の異形であり得る。他の例において、操作されたガイドRNAをコードするDNAは、目的の真核生物細胞における発現のためにRNAポリメラーゼIII(Pol III)により認識されるプロモーター配列に操作可能に連結され得る。適当なPol IIIプロモーターの例は、哺乳動物U6、U3、H1および7SL RNAプロモーターを含むが、これらに限定されない。
【0054】
種々の実施態様において、操作されたCas9タンパク質をコードする核酸はベクター中に存在し得る。ある実施態様において、ベクターは、操作されたガイドRNAをコードする核酸をさらに含み得る。適当なベクターは、プラスミドベクター、ウイルスベクターおよび自己複製RNA(Yoshioka et al., Cell Stem Cell, 2013, 13:246-254)を含む。ある実施態様において、複合体または融合タンパク質をコードする核酸は、プラスミドベクター中に存在し得る。適当なプラスミドベクターの非限定的例は、pUC、pBR322、pET、pBluescriptおよびそれらのバリアントを含む。他の実施態様において、複合体または融合タンパク質をコードする核酸は、ウイルスベクター(例えば、レンチウイルスベクター、アデノ随伴ウイルスベクター、アデノウイルスベクターなど)の一部であり得る。プラスミドまたはウイルスベクターは、さらなる発現制御配列(例えば、エンハンサー配列、コザック配列、ポリアデニル化配列、転写終止配列など)、選択可能マーカー配列(例えば、抗生物質耐性遺伝子)、複製起点などを含み得る。ベクターおよびその使用に関するさらなる情報は、“Current Protocols in Molecular Biology” Ausubel et al., John Wiley & Sons, New York, 2003 or “Molecular Cloning: A Laboratory Manual” Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001に見られ得る。
【0055】
(III) 真核生物細胞
本発明の他の態様は、上のセクション(I)に詳述した操作されたCas9システムの少なくとも1つおよび/または上のセクション(II)に詳述した操作されたCas9タンパク質および/または操作されたガイドRNAをコードする核酸の少なくとも1つを含む、真核生物細胞を含む。
【0056】
真核生物細胞は、ヒト細胞、非ヒト哺乳動物細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞、植物細胞または単細胞真核生物生物であり得る。適当な真核生物細胞の例は、下のセクション(IV)(c)に詳述される。真核生物細胞は、インビトロ、エクスビボまたはインビボであり得る。
【0057】
例として、ある実施態様において、真核生物細胞または真核生物細胞の集団は、T細胞、CD8 T細胞、CD8ナイーブT細胞、中央記憶T細胞、エフェクター記憶T細胞、CD4 T細胞、幹細胞記憶T細胞、ヘルパーT細胞、制御性T細胞、細胞毒性T細胞、ナチュラルキラーT細胞、造血幹細胞、長期造血幹細胞、短期造血幹細胞、多能性前駆細胞、系統限定前駆細胞、リンパ系前駆細胞、膵臓前駆細胞、内分泌前駆細胞、外分泌腺前駆細胞、骨髄前駆細胞、共通骨髄前駆細胞、赤血球前駆細胞、巨核球赤血球前駆細胞、単球性前駆体細胞、内分泌前駆体細胞、外分泌腺細胞、線維芽細胞、肝芽細胞、筋芽細胞、マクロファージ、島ベータ細胞、心筋細胞、血液細胞、管細胞、腺房細胞、アルファ細胞、ベータ細胞、デルタ細胞、PP細胞、胆管細胞、網膜細胞、光受容体細胞、桿体細胞、錐体細胞、網膜色素性上皮細胞、強角膜線維柱帯細胞、蝸牛有毛細胞、外有毛細胞、内部有毛細胞、肺上皮性細胞、気管支上皮性細胞、肺胞上皮性細胞、肺上皮性前駆細胞、横紋筋細胞、心筋細胞、筋肉衛星細胞、筋細胞、神経細胞、神経型幹細胞、間葉性幹細胞、誘導多能性幹(iPS)細胞、胚幹細胞、単球、巨核細胞、好中球、好酸球、好塩基球、肥満細胞、網赤血球、B細胞、例えば前駆B細胞、Pre B細胞、Pro B細胞、記憶B細胞、血漿B細胞、消化器上皮性細胞、胆管上皮性細胞、膵管上皮性細胞、腸幹細胞、肝細胞、肝星細胞、クッパー細胞、骨芽細胞、破骨細胞、脂肪細胞(例えば、褐色脂肪細胞または白色脂肪細胞)、脂肪前駆細胞、膵臓前駆体細胞、膵島細胞、膵臓ベータ細胞、膵臓アルファ細胞、膵臓デルタ細胞、膵臓外分泌腺細胞、シュワン細胞または希突起膠細胞またはこのような細胞の集団である。
【0058】
(IV) 染色体配列を修飾する方法
本発明のさらなる態様は、真核生物細胞における染色体配列を修飾する方法を含む。一般に、方法は、目的の真核生物細胞に、上のセクション(I)に詳述した操作されたCas9システムの少なくとも1つおよび/または上のセクション(II)に詳述した該操作されたCas9システムをコードする核酸の少なくとも1つを導入することを含む。
【0059】
操作されたCas9タンパク質がヌクレアーゼまたはニッカーゼ活性を含む実施態様において、染色体配列修飾は、少なくとも1つのヌクレオチドの置換、少なくとも1つのヌクレオチドの欠失、少なくとも1つのヌクレオチドの挿入を含み得る。ある反復において、方法は、1以上の操作されたCas9システムが染色体配列の標的部位に二本鎖切断を導入し、細胞性DNA修復過程による該二本鎖切断の修復が、少なくとも1つのヌクレオチド変化(すなわち、インデル)を導入し、それにより該染色体配列を不活性化する(すなわち、遺伝子ノックアウト)ように、真核生物細胞に一つのヌクレアーゼ活性を含む操作されたCas9システムまたは2つのニッカーゼ活性を含む操作されたCas9システムを導入し、ドナーポリヌクレオチドを導入しないことを含む。他の反復において、方法は、1以上の操作されたCas9システムが染色体配列の標的部位に二本鎖切断を導入し、細胞性DNA修復過程による該二本鎖切断の修復が、ドナーポリヌクレオチドにおける配列の染色体配列における標的部位への挿入または交換をもたらす(すなわち、遺伝子修正または遺伝子ノックイン)ように、真核生物細胞に1つのヌクレアーゼ活性を含む操作されたCas9システムまたは2つのニッカーゼ活性を含む操作されたCas9システムおよびドナーポリヌクレオチドを導入することを含む。
【0060】
操作されたCas9タンパク質が後成的修飾活性または転写制御活性を含む実施態様において、染色体配列修飾は、標的部位におけるまたはその近くの少なくとも1つのヌクレオチドの変換、標的部位におけるまたはその近くの少なくとも1つのヌクレオチドの修飾、標的部位におけるまたはその近くの少なくとも1つのヒストンタンパク質の修飾および/または染色体配列の標的部位におけるまたはその近くの転写の変化を含み得る。
【0061】
(a) 細胞への導入
上記のとおり、方法は、真核生物細胞に少なくとも1つの操作されたCas9システムおよび/または該システムをコードする核酸(および場合により存在するドナーポリヌクレオチド)を導入することを含む。少なくとも1つのシステムおよび/または核酸/ドナーポリヌクレオチドは、多様な手段により目的の細胞に導入され得る。
【0062】
ある実施態様において、細胞は、適切な分子(すなわち、タンパク質、DNAおよび/またはRNA)でトランスフェクトされ得る。適当なトランスフェクション方法は、ヌクレオフェクション(またはエレクトロポレーション)、リン酸カルシウム介在トランスフェクション、陽イオン性ポリマートランスフェクション(例えば、DEAE-デキストランまたはポリエチレンイミン)、ウイルス形質導入、ビロソームトランスフェクション、ビリオントランスフェクション、リポソームトランスフェクション、陽イオン性リポソームトランスフェクション、イムノリポソームトランスフェクション、非リポソーム型脂質トランスフェクション、デンドリマートランスフェクション、ヒートショックトランスフェクション、マグネトフェクション、リポフェクション、遺伝子銃送達、インペールフェクション、ソノポレーション、光学トランスフェクションおよび核酸の独自取り込み増強剤使用(proprietary agent-enhanced uptake)を含む。トランスフェクション方法は当分野で周知である(例えば、“Current Protocols in Molecular Biology” Ausubel et al., John Wiley & Sons, New York, 2003 or “Molecular Cloning: A Laboratory Manual” Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001参照)。他の実施態様において、分子をマイクロインジェクションにより細胞に導入し得る。例えば、分子を目的の細胞の細胞質または核に注入し得る。細胞に導入される各分子の量は変わり得るが、当業者は適切な量を決定するための手段を熟知している。
【0063】
種々の分子を、同時にまたは逐次的に細胞に導入し得る。例えば、操作されたCas9システム(またはそのコード化核酸)およびドナーポリヌクレオチドは、同時に導入され得る。あるいは、一方をまず導入してよく、次に、他方を追って細胞に導入してよい。
【0064】
一般に、細胞は細胞増殖および/または維持に適する条件下に維持される。適当な細胞培養条件は当分野で周知であり、例えば、Santiago et al., Proc. Natl. Acad. Sci. USA, 2008, 105:5809-5814; Moehle et al. Proc. Natl. Acad. Sci. USA, 2007, 104:3055-3060; Urnov et al., Nature, 2005, 435:646-651;およびLombardo et al., Nat. Biotechnol., 2007, 25:1298-1306に記載される。細胞を培養する方法は当分野で知られ、細胞型により変わり得るかつ変わることを当業者は認識する。日常的な最適化を、全例において、特定の細胞型について最良の技術を決定するために使用し得る。
【0065】
(b) 場合により存在するドナーポリヌクレオチド
操作されたCas9タンパク質がヌクレアーゼまたはニッカーゼ活性を含む実施態様において、方法は、さらに少なくとも1つのドナーポリヌクレオチドを細胞に導入することを含む。ドナーポリヌクレオチドは一本鎖でも二本鎖でも、直鎖状でも環状でもおよび/またはRNAでもDNAでもよい。ある実施態様において、ドナーポリヌクレオチドはベクター、例えば、プラスミドベクターであり得る。
【0066】
ドナーポリヌクレオチドは、少なくとも1つのドナー配列を含む。ある態様において、ドナーポリヌクレオチドのドナー配列は、内因性または天然染色体配列の修飾バージョンであり得る。例えば、ドナー配列は、染色体配列の操作されたCas9システムにより標的とされる部分またはその近辺に本質的に同一であるが、少なくとも1つのヌクレオチド変化を含み得る。故に、天然配列の組込みまたはそれとの交換により、標的染色体位置の配列は、少なくとも1つのヌクレオチド変化を含む。例えば、変化は、1以上のヌクレオチドの挿入、1以上のヌクレオチドの欠失、1以上のヌクレオチドの置換またはこれらの組み合わせであり得る。修飾配列の「遺伝子修正」組込みの結果、細胞は、標的染色体配列から修飾遺伝子産物を産生し得る。
【0067】
他の態様において、ドナーポリヌクレオチドのドナー配列は外因性配列であり得る。ここで使用する、「外因性」配列は、細胞に天然ではない配列または天然位置が細胞のゲノムにおける異なる位置である配列をいう。例えば、外因性配列はタンパク質コード配列を含み得て、これは、ゲノムへの組込みにより、細胞が統合された配列によりコードされるタンパク質を発現できるように、外因性プロモーター制御配列に操作可能に連結され得る。あるいは、外因性配列は、発現が内因性プロモーター制御配列により制御されるように、染色体配列に統合され得る。他の反復において、外因性配列は転写制御配列、他の発現制御配列、RNAコード配列などであり得る。上記のとおり、染色体配列への外因性配列の組込みは、「ノックイン」と称される。
【0068】
当業者により認識され得るとおり、ドナー配列の長さは変わってよくかつ変わる。例えば、ドナー配列の長さは、数ヌクレオチド~数百ヌクレオチド~数十万ヌクレオチドで変わり得る。
【0069】
一般に、ドナーポリヌクレオチドにおけるドナー配列は、操作されたCas9システムにより標的とされる配列のそれぞれ上流および下流に位置する配列と実質的配列同一性を有する上流配列および下流配列が隣接する。これら配列類似性により、ドナーポリヌクレオチドの上流および下流配列は、ドナー配列が染色体配列に統合される(またはそれと交換される)ことができるように、ドナーポリヌクレオチドと標的染色体配列間の相同組み換えを可能とする。
【0070】
ここで使用する上流配列は、操作されたCas9システムにより標的とされる配列の上流の染色体配列と実質的配列同一性を共有する核酸配列をいう。同様に、下流配列は、操作されたCas9システムにより標的とされる配列の下流の染色体配列と実質的配列同一性を共有する核酸配列をいう。ここで使用する、用語「実質的配列同一性」は、少なくとも約75%配列同一性を有する配列をいう。故に、ドナーポリヌクレオチドにおける上流および下流配列は、標的配列の上流または下流の配列と約75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%配列同一性を有し得る。例示的実施態様において、ドナーポリヌクレオチドにおける上流および下流配列は、操作されたCas9システムにより標的とされる配列の上流または下流の染色体配列と約95%または100%配列同一性を有し得る。
【0071】
ある実施態様において、上流配列は、操作されたCas9システムにより標的とされる配列のすぐ上流に位置する染色体配列と実質的配列同一性を共有する。他の実施態様において、上流配列は、標的配列から約100ヌクレオチド上流に位置する染色体配列と実質的配列同一性を共有する。故に、例えば、上流配列は、標的配列から約1~約20、約21~約40、約41~約60、約61~約80または約81~約100ヌクレオチド上流に位置する染色体配列と実質的配列同一性を共有し得る。ある実施態様において、下流配列は、操作されたCas9システムにより標的とされる配列のすぐ下流に位置する染色体配列と実質的配列同一性を共有する。他の実施態様において、下流配列は、標的配列から約100ヌクレオチド下流に位置する染色体配列と実質的配列同一性を共有する。故に、例えば、下流配列は、標的配列から約1~約20、約21~約40、約41~約60、約61~約80または約81~約100ヌクレオチド下流に位置する染色体配列と実質的配列同一性を共有し得る。
【0072】
各上流または下流配列の長さは、約20ヌクレオチド~約5000ヌクレオチドの範囲であり得る。ある実施態様において、上流および下流配列は、約50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800または5000ヌクレオチド含み得る。具体的実施態様において、上流および下流配列の長さは、約50~約1500ヌクレオチドの範囲であり得る。
【0073】
(c) 細胞型
多様な真核生物細胞が、ここに開示する方法において使用するのに適する。例えば、細胞は、ヒト細胞、非ヒト哺乳動物細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞、昆虫細胞、植物細胞、酵母細胞または単細胞真核生物生物であり得る。ある実施態様において、細胞は1細胞期胚であり得る。例えば、非ヒト哺乳動物胚は、ラット、ハムスター、齧歯類、ウサギ、ネコ、イヌ、ヒツジ、ブタ、ウシ、ウマおよび霊長類胚を含む。さらに他の実施態様において、細胞は、胚幹細胞、ES様幹細胞、胎児幹細胞、成人幹細胞などの幹細胞であり得る。ある実施態様において、幹細胞は、ヒト胚幹細胞ではない。さらに、幹細胞は、全体として本明細書に包含させるWO2003/046141またはChung et al.(Cell Stem Cell, 2008, 2:113-117)に開示の技術により産生されたものを含み得る。細胞は、インビトロ(すなわち、培養)、エクスビボ(すなわち、生物から単離された組織内)またはインビボ(すなわち、生物ない)であり得る。例示的実施態様において、細胞は哺乳動物細胞または哺乳動物細胞株である。具体的実施態様において、細胞はヒト細胞またはヒト細胞株である。
【0074】
例として、ある実施態様において、真核生物細胞または真核生物細胞の集団は、T細胞、CD8 T細胞、CD8ナイーブT細胞、中央記憶T細胞、エフェクター記憶T細胞、CD4 T細胞、幹細胞記憶T細胞、ヘルパーT細胞、制御性T細胞、細胞毒性T細胞、ナチュラルキラーT細胞、造血幹細胞、長期造血幹細胞、短期造血幹細胞、多能性前駆細胞、系統限定前駆細胞、リンパ系前駆細胞、膵臓前駆細胞、内分泌前駆細胞、外分泌腺前駆細胞、骨髄前駆細胞、共通骨髄前駆細胞、赤血球前駆細胞、巨核球赤血球前駆細胞、単球性前駆体細胞、内分泌前駆体細胞、外分泌腺細胞、線維芽細胞、肝芽細胞、筋芽細胞、マクロファージ、島ベータ細胞、心筋細胞、血液細胞、管細胞、腺房細胞、アルファ細胞、ベータ細胞、デルタ細胞、PP細胞、胆管細胞、網膜細胞、光受容体細胞、桿体細胞、錐体細胞、網膜色素性上皮細胞、強角膜線維柱帯細胞、蝸牛有毛細胞、外有毛細胞、内部有毛細胞、肺上皮性細胞、気管支上皮性細胞、肺胞上皮性細胞、肺上皮性前駆細胞、横紋筋細胞、心筋細胞、筋肉衛星細胞、筋細胞、神経細胞、神経型幹細胞、間葉性幹細胞、誘導多能性幹(iPS)細胞、胚幹細胞、単球、巨核細胞、好中球、好酸球、好塩基球、肥満細胞、網赤血球、B細胞、例えば前駆B細胞、Pre B細胞、Pro B細胞、記憶B細胞、血漿B細胞、消化器上皮性細胞、胆管上皮性細胞、膵管上皮性細胞、腸幹細胞、肝細胞、肝星細胞、クッパー細胞、骨芽細胞、破骨細胞、脂肪細胞(例えば、褐色脂肪細胞または白色脂肪細胞)、脂肪前駆細胞、膵臓前駆体細胞、膵島細胞、膵臓ベータ細胞、膵臓アルファ細胞、膵臓デルタ細胞、膵臓外分泌腺細胞、シュワン細胞または希突起膠細胞またはこのような細胞の集団である。
【0075】
適当な哺乳動物細胞または細胞株の非限定的例は、ヒト胚腎臓細胞(HEK293、HEK293T);ヒト子宮頸癌腫細胞(HELA);ヒト肺細胞(W138);ヒト肝臓細胞(Hep G2);ヒトU2-OS骨肉腫細胞、ヒトA549細胞、ヒトA-431細胞およびヒトK562細胞;チャイニーズハムスター卵巣(CHO)細胞、ベビーハムスター腎臓(BHK)細胞;マウス骨髄腫NS0細胞、マウス胚線維芽細胞3T3細胞(NIH3T3)、マウスBリンパ腫A20細胞;マウス黒色腫B16細胞;マウス筋芽細胞C2C12細胞;マウス骨髄腫SP2/0細胞;マウス胚間葉性C3H-10T1/2細胞;マウス癌腫CT26細胞、マウス前立腺DuCuP細胞;マウス乳房EMT6細胞;マウス肝細胞癌Hepa1c1c7細胞;マウス骨髄腫J5582細胞;マウス上皮性MTD-1A細胞;マウス心筋MyEnd細胞;マウス腎臓RenCa細胞;マウス膵臓RIN-5F細胞;マウス黒色腫X64細胞;マウスリンパ腫YAC-1細胞;ラット神経膠芽腫9L細胞;ラットBリンパ腫RBL細胞;ラット神経芽腫B35細胞;ラット肝細胞癌細胞(HTC);バッファローラット肝臓BRL 3A細胞;イヌ腎臓細胞(MDCK);イヌ乳房(CMT)細胞;ラット骨肉腫D17細胞;ラット単球/マクロファージDH82細胞;サル腎臓SV-40形質転換線維芽細胞(COS7)細胞;サル腎臓CVI-76細胞;アフリカミドリザル腎臓(VERO-76)細胞を含む。哺乳動物細胞株の広範なリストは、American Type Culture Collectionカタログ(ATCC, Manassas, VA)に見られ得る。
【0076】
(V) 適用
ここに開示する組成物および方法は、多様な治療、診断、産業および研究適用において使用され得る。ある実施態様において、本発明を使用して、遺伝子の機能の研究、興味ある遺伝的または後成的状態の研究または種々の疾患または障害に関与する生化学的経路のモデル化および/または研究のための、細胞、動物または植物における何れかの興味ある染色体配列を修飾し得る。例えば、疾患または障害と関連する1以上の核酸配列の発現が改変されている、疾患または障害のモデルであるトランスジェニック生物を作ることができる。疾患モデルを使用して、生物における変異の影響の研究、疾患発症および/または進行の研究、疾患に対する薬学的活性化合物の効果の研究および/または潜在的遺伝子治療戦略の有効性の評価を行い得る。
【0077】
他の実施態様において、組成物および方法を使用して、効率的かつ費用効果がある機能的ゲノムスクリーニングを実施でき、これを使用して、特定の生物学的過程に関与する遺伝子の機能をおよび遺伝子発現の何らかの改変がどのように生物学的過程に影響し得るかを研究できまたは細胞性表現型と併せたゲノム遺伝子座の飽和変異誘発またはディープスキャン変異誘発を実施できる。飽和変異誘発またはディープスキャン変異誘発を使用して、例えば、遺伝子発現、薬物耐性および疾患回復に必要な機能的要素の、重大な最小特性および個別の脆弱性を決定し得る。
【0078】
さらなる実施態様において、ここに開示する組成物および方法を、疾患または障害の存在を確立するためのおよび/または処置選択肢決定に使用するための診断試験に使用し得る。適当な診断試験の例は、癌細胞における特異的変異(例えば、EGFR、HER2などにおける特異的変異)の検出、特定の疾患と関連する特異的変異(例えば、トリヌクレオチド反復、鎌状赤血球疾患と関連するβ-グロビンの変異、特異的SNPなど)の検出、肝炎の検出、ウイルス(例えば、ジカ)の検出などを含む。
【0079】
さらなる実施態様において、ここに開示する組成物および方法を使用して、特定の疾患または障害と関連する遺伝子変異を修正する、例えば、鎌状赤血球疾患またはサラセミアと関連するグロビン遺伝子変異を修正する、重症複合免疫不全症(SCID)と関連するアデノシンデアミナーゼ遺伝子における変異を修正する、ハンチントン病の疾患原因遺伝子であるHTTの発現を低減するまたは網膜色素変性症処置のためのロドプシン遺伝子の変異を修正することができる。このような修飾は、エクスビボで細胞に為し得る。
【0080】
さらに他の実施態様において、ここに開示する組成物および方法を使用して、形質が改善されたまたは環境的ストレスへの抵抗性が増加した作物植物を作り得る。本発明を使用して、形質が改善された家畜または生産動物(production animals)を作り得る。例えば、ブタは、特に、再生医学または異種移植における生物医学的モデルとして魅力ある多くの特性を有する。
【0081】
さらに他の実施態様において、ここに開示する組成物および方法を使用して、生存細胞または化学的に固定された細胞(例えばホルマリン固定パラフィン包埋臨床サンプルで使用されるホルマリン固定)内の染色体同一性および位置を決定できる。例えば、ここに開示するペプチド配列を介して蛍光タンパク質に連結されたCRIPSR複合体は、単一または複数コピーである遺伝子座に標的化され、このような複合体は、染色体座位コピー数および/または位置を決定するために顕微鏡で検出され得る。追跡のための遺伝子座の例は、セントロメア領域、テロメア領域または複数コピーの単一同一CRISPR複合体が結合し得るゲノムの他の反復領域を含む。
【0082】
定義
他に定義されない限り、ここで使用する全ての技術的および科学的用語は、本発明が属する分野の当業者により共通して理解される意味を有する。次の参考文献は、本発明で使用される用語の多くの一般的定義を当業者に提供する:Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd Ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991)。ここで使用する、次の用語は、特に断らない限り、それらに含意される通常の意味を有する。
【0083】
本発明の要素またはその好ましい実施態様を説明するとき、単数表現、「本」および「該」は、要素が1以上あることを意味することを意図する。用語「含む」、「包含する」および「有する」は、包括的であることを意図し、挙げた要素以外のさらなる要素が存在し得ることを意味する。
【0084】
用語「約」は、数値xと関連して使用されるとき、例えばx±5%を意味する。
【0085】
ここで使用する、用語「相補的」または「相補性」は、特異的水素結合を介する塩基対形成による二本鎖核酸の結合をいう。塩基対形成は、標準的ワトソン・クリック塩基対形成(例えば、5’-AGTC-3’が相補的配列3’-TCAG-5’と対形成)であり得る。塩基対形成はまたフーグスティーン型または逆フーグスティーン型水素結合でもあり得る。相補性は、一般に二本鎖領域に関して測定され、故に、例えば、オーバーハングは除外される。二本鎖領域の2鎖間の相補性は部分的であり得て、塩基の一部(例えば、70%)のみが相補的であるならば、パーセンテージ(例えば、70%)として表される。相補的ではない塩基は、「ミスマッチ」である。相補性は、二本鎖領域における全塩基が相補的であるならば、完全(すなわち、100%)でもあり得る。
【0086】
ここで使用する、用語「CRISPR/Casシステム」または「Cas9システム」は、Cas9タンパク質(すなわち、ヌクレアーゼ、ニッカーゼまたは触媒として無効なタンパク質)およびガイドRNAを含む複合体をいう。
【0087】
ここで使用する用語「内因性配列」は、細胞に天然である染色体配列をいう。
【0088】
ここで使用する、用語「外因性」は、細胞に天然ではない配列または細胞のゲノムにおける天然位置が異なる染色体位置である染色体配列をいう。
【0089】
ここで使用する、「遺伝子」は、遺伝子産物をコードするDNA領域(エクソンおよびイントロンを含む)および遺伝子産物の産生を制御する全てのDNA領域を、そのような制御配列がコードおよび/または転写配列に隣接していてもしていなくても、含む。従って、遺伝子は、プロモーター配列、ターミネーター、リボソーム結合部位およびリボソーム内部進入部位などの翻訳制御配列、エンハンサー、サイレンサー、インスレーター、境界要素、複製起点、マトリックス付着部位および遺伝子座調節領域を含むが、必ずしもこれらに限定されない。
【0090】
用語「異種」は、目的の細胞に内因性または天然ではないものをいう。例えば、異種タンパク質は、外因的に導入された核酸配列などの外因性源に由来するまたはもともと由来したタンパク質をいう。一部例において、異種タンパク質は、目的の細胞により通常は産生されない。
【0091】
用語「ニッカーゼ」は、二本鎖核酸配列の一方の鎖を切断する(すなわち、二本鎖配列に切り目を入れる)酵素をいう。例えば、二本鎖開裂活性を有するヌクレアーゼを、ニッカーゼとして機能し、二本鎖配列の一方の鎖のみを開裂するように変異および/または欠失により修飾し得る。
【0092】
ここで使用する、用語「ヌクレアーゼ」は、二本鎖核酸配列の両鎖を開裂する酵素をいう。
【0093】
用語「核酸」および「ポリヌクレオチド」は、直鎖状または環状構造および一本鎖または二本鎖形態のデオキシリボヌクレオチドまたはリボヌクレオチドポリマーをいう。本発明の目的のために、これらの用語はポリマー長に関して制限があると解釈してはならない。本用語は、天然ヌクレオチドの既知アナログ、ならびに塩基、糖および/またはリン酸部分(例えば、ホスホロチオエート主鎖)が修飾されたヌクレオチドを含み得る。一般に、特定のヌクレオチドのアナログは、同じ塩基対形成特異性を有する;すなわち、AのアナログはTと塩基対形成する。
【0094】
用語「ヌクレオチド」は、デオキシリボヌクレオチドまたはリボヌクレオチドをいう。ヌクレオチドは、標準的ヌクレオチド(すなわち、アデノシン、グアノシン、シチジン、チミジンおよびウリジン)、ヌクレオチド異性体またはヌクレオチドアナログであり得る。ヌクレオチドアナログは、修飾プリンまたはピリミジン塩基または修飾リボース部分を有するヌクレオチドをいう。ヌクレオチドアナログは、天然に存在するヌクレオチド(例えば、イノシン、シュードウリジンなど)または天然に存在しないヌクレオチドであり得る。ヌクレオチドの糖または塩基部分の修飾の非限定的例は、アセチル基、アミノ基、カルボキシル基、カルボキシメチル基、ヒドロキシル基、メチル基、ホスホリル基およびチオール基の付加(または除去)ならびに塩基の炭素および窒素原子の他の原子への置換(例えば、7-デアザプリン)を含む。ヌクレオチドアナログはまたジデオキシヌクレオチド、2’-O-メチルヌクレオチド、ロックド核酸(LNA)、ペプチド核酸(PNA)およびモルホリノを含む。
【0095】
用語「ポリペプチド」および「タンパク質」は、相互交換可能に使用されて、アミノ酸残基のポリマーをいう。
【0096】
用語「標的配列」、「標的染色体配列」および「標的部位」は、相互交換可能に使用されて、操作されたCas9システムが標的とする染色体DNAにおける特異的配列および操作されたCas9システムがDNAまたはDNAと関連するタンパク質を修飾する部位をいう。
【0097】
核酸およびアミノ酸配列同一性を決定するための技術は当分野で知られる。一般に、このような技術は、遺伝子についてmRNAのヌクレオチド配列を決定するおよび/またはそれによりコードされるアミノ酸配列を決定すること、そして、配列を第二のヌクレオチドまたはアミノ酸配列と比較することを含む。ゲノム配列もまた決定でき、この様式で比較され得る。一般に、同一性は、2つのポリヌクレオチドまたはポリペプチド配列それぞれの正確なヌクレオチド毎またはアミノ酸毎の対応をいう。2以上の配列(ポリヌクレオチドまたはアミノ酸)を、パーセント同一性の決定により比較し得る。2つの配列のパーセント同一性は、核酸であれアミノ酸配列であれ、2つの整列させた配列間の正確なマッチ数を、短い配列の長さで除し、100倍したものである。核酸配列のための近似のアラインメントは、Smith and Waterman, Advances in Applied Mathematics 2:482-489 (1981)の局所相同性アルゴリズムにより提供される。このアルゴリズムを、Dayhoff, Atlas of Protein Sequences and Structure, M. O. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical Research Foundation, Washington, D.C., USAにより開発され、Gribskov, Nucl. Acids Res. 14(6):6745-6763 (1986)により標準化されたスコアリングマトリックスの使用により、アミノ酸配列に適用し得る。配列のパーセント同一性を決定するためのこのアルゴリズムの実行の例は、Genetics Computer Group(Madison, Wis.)により「BestFit」ユーティリティアプリケーションで提供される。配列間のパーセント同一性または類似性を計算するための他の適当なプログラムは一般に当分野で知られ、例えば、他のアラインメントプログラムはBLASTであり、デフォルトパラメータで使用される。例えば、BLASTNおよびBLASTPは次のデフォルトパラメータを使用して使用され得る:遺伝コード=標準的;フィルター=なし;鎖=両方;カットオフ=60;期待値=10;マトリックス=BLOSUM62;記述=50配列;ソート=HIGH SCORE;データベース=非冗長、GenBank+EMBL+DDBJ+PDB+GenBank CDS翻訳+Swissタンパク質+Spupdate+PIR。これらのプログラムの詳細は、GenBankウェブサイトに見られ得る。
【0098】
上記細胞および方法において、本発明の範囲から逸脱することなく種々の変化を付し得るため、上の記載および下記実施例に含まれる全ての事柄は説明的であり、限定的意味ではないと解釈されるべきである。
【実施例
【0099】
次の実施例は、本発明のいくつかの態様を説明する。
【0100】
実施例1:GFP-SpCas9およびRFP-SpCas9融合タンパク質を使用するヒト細胞遺伝子編集
ヒトK562細胞(0.35×10)を、60pmolのSpCas9、GFP-SpCas9またはRFP-SpCas9組み換えタンパク質および180pmolのガイド配列5’-GCUCCCAUCACAUCAACCGG-3’を有するヒトEMX1座位をターゲティングするインビトロ転写シングルガイドRNA(sgRNA)でトランスフェクトした。トランスフェクションを、Nucleofection Solution VおよびAmaxa装置を使用して実施した。細胞を3日間37℃および5%COに維持し、その後遺伝子編集分析のために採取した。ゲノムDNAをQuickExtract DNA抽出溶液を使用して調製した。標的EMX1領域を、標的特異的配列および次世代シークエンシング(NGS)アダプターからなるプライマーを使用して、PCR増幅した。フォワードプライマーは5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGNNNNNNAGTCTTCCCATCAGGCTCTCA-3’(配列番号46)であり、リバースプライマーはGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGNNNNNNAGAGTCCAGCTTGGGCC-3’(配列番号47)であり、ここで、標的特異的配列には下線を引いており、NはA、T、GまたはCを表す。PCRアンプリコンを、Illumina MiSeqを使用するNGSにより分析して、各Cas9タンパク質の編集効率を決定した。図1に示す結果は、GFP-SpCas9およびRFP-SpCas9融合タンパク質の各々は、SpCas9タンパク質のレベルに沿った編集活性を保持することを示す。
【0101】
表1は、操作されたCas9/NLSタンパク質のヒトコドン最適化DNAおよびタンパク質配列を表し、ここで、NLS配列は太字で表し、マーカータンパク質とCas9の間のリンカーは下線を引いている。
【表5】
【表6】
【表7】
【0102】
3種のタンパク質の産生に使用したヒトコドン最適化DNA配列は次の通りである。
【表8】
【表9】
【表10】
【表11】
【表12】
【表13】
【表14】
【0103】
実施例2:市販製品との編集効率比較
2つの市販GFP-SpCas9融合タンパク質製品、GenCrispr NLS-Cas9-EGFPヌクレアーゼおよびArciTect Cas9-eGFPヌクレアーゼをそれぞれGenScript(Piscataway, NJ)およびStemcell Technologies(Vancouver, Canada)から購入した。ヒトU2OS細胞(0.2×10)およびHEK293細胞(0.3×10)を、50pmolのGenCrispr NLS-Cas9-EGFPヌクレアーゼまたはArciTect Cas9-eGFPヌクレアーゼまたは本発明のGFP-SpCas9タンパク質と、各150pmolのヒトEMX1、HEKSite4、VEGFA3、HPRT座位をターゲティングする4つの化学合成sgRNAの組み合わせでトランスフェクトした。ガイド配列は:
5’-GAGUCCGAGCAGAAGAAGAA-3’(EMX1)(配列番号51)、
5’-GGCACUGCGGCUGGAGGUGG-3’(HEKSite4)(配列番号52)、
5’GGUGAGUGAGUGUGUGCGUG-3’(VEGFA3)および
5’-GGUCACUUUUAACACACCCA-3’(HPRT)(配列番号53)
である。トランスフェクションを、Nucleofection Solution VおよびAmaxa装置を使用して実施した。細胞を3日間37℃および5%COに維持し、その後遺伝子編集分析のために採取した。ゲノムDNAをQuickExtract DNA抽出溶液を使用して調製した。各標的ゲノム領域を、標的特異的配列および次世代シークエンシング(NGS)アダプターからなるプライマー対を使用してPCR増幅した。プライマーを下表に挙げる。
【表15】

【0104】
PCRアンプリコンを、Illumina MiSeqを使用するNGSにより分析して、各Cas9タンパク質の編集効率を決定した。図2Aおよび図2Bにおける結果は、本発明のGFP-SpCas9タンパク質による編集効率が、全標的において、市販タンパク質より数倍高かったことを示す。
図1
図2A
図2B
【配列表】
2022520104000001.app
【手続補正書】
【提出日】2021-10-11
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
つのマーカータンパク質に連結したCas9タンパク質を含む、融合タンパク質であって、該1つのマーカータンパク質がCas9タンパク質に直接化学結合によりまたは配列番号35もしくは36と少なくとも90%配列同一性を有するアミノ酸配列を有する第一リンカーを介して連結されている、融合タンパク質
【請求項2】
つのマーカータンパク質が、Cas9タンパク質にN末端、C末端、内部位置またはこれらの組み合わせに連結されている、請求項1の融合タンパク質。
【請求項3】
少なくとも1つの核移行シグナルをさらに含む、請求項1または2の何れかの融合タンパク質。
【請求項4】
さらに場合により存在する第二のリンカーを含み、核移行シグナル、マーカータンパク質、第一のリンカー、第二のリンカー(存在するとき)およびCas9タンパク質が次の順番(N末端からC末端方向)で配置されている、請求項5の融合タンパク質:
マーカータンパク質-第一リンカー-核移行シグナル-Cas9タンパク質;
マーカータンパク質-核移行シグナル-第一リンカー-Cas9タンパク質;
核移行シグナル-第一リンカー-マーカータンパク質-Cas9タンパク質;
核移行シグナル-マーカータンパク質-第一リンカー-Cas9タンパク質;
マーカータンパク質-第一リンカー-核移行シグナル-第二リンカー-Cas9タンパク質;または
核移行シグナル-第一リンカー-マーカータンパク質-第二リンカー-Cas9タンパク質。
【請求項5】
核移行シグナル、マーカータンパク質、リンカーおよびCas9タンパク質が次の順番(N末端からC末端方向)で配置されている、請求項の融合タンパク質:
マーカータンパク質-第一リンカー-核移行シグナル-Cas9タンパク質。
【請求項6】
少なくとも1つの異種ドメインをさらに含む、請求項1~の何れかの融合タンパク質。
【請求項7】
少なくとも1つの異種ドメインが細胞透過性ドメイン、クロマチン調節モチーフ、後成的修飾ドメイン、転写制御ドメイン、RNAアプタマー結合ドメインまたはこれらの組み合わせである、請求項の融合タンパク質。
【請求項8】
融合タンパク質がヌクレアーゼであり、二本鎖配列の両鎖を開裂する、ニッカーゼであり、二本鎖配列の一方の鎖を開裂するまたはヌクレアーゼまたはニッカーゼ活性を有しない、請求項1~の何れかの融合タンパク質。
【請求項9】
Cas9タンパク質がストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)、ナイセリア・メニンギティディス(Neisseria meningitidis)、スタフィロコッカス・アウレウス(Staphylococcus aureus)またはカンピロバクター・ジェジュニ(Campylobacter jejuni)由来である、請求項1~の何れかの融合タンパク質。
【請求項10】
マーカータンパク質が配列番号19または20と少なくとも90%配列同一性を有するアミノ酸配列を有する、請求項1~の何れかの融合タンパク質。
【請求項11】
マーカータンパク質が配列番号19または20に示すアミノ酸配列を有する、請求項1~10の何れかの融合タンパク質。
【請求項12】
リンカーが配列番号35または36に示すアミノ酸配列を有する、請求項11の何れかの融合タンパク質。
【請求項13】
融合タンパク質が配列番号48、49または50と少なくとも90%配列同一性を有するアミノ酸配列を有する、請求項12の何れかの融合タンパク質。
【請求項14】
融合タンパク質が配列番号48、49または50に示すアミノ酸配列を有する、請求項12の何れかの融合タンパク質。
【請求項15】
請求項14の何れかの融合タンパク質および操作されたガイドRNAを含む、システム。
【請求項16】
操作されたガイドRNAが単一分子である、請求項15のシステム。
【請求項17】
操作されたガイドRNA配列が、操作されたガイドRNA内での塩基対形成促進、操作されたガイドRNA内での塩基対形成最小化、操作されたガイドRNAの安定性増加、真核生物細胞における操作されたガイドRNAの転写促進またはこれらの組み合わせのために最適化されている、請求項15または16のシステム。
【請求項18】
請求項1~14の何れかの融合タンパク質をコードする、複数の核酸。
【請求項19】
複数の核酸が融合タンパク質をコードする少なくとも1つの核酸および少なくとも1つの操作されたガイドRNAをコードする核酸を含む、請求項1517の何れかのシステムをコードする複数の核酸。
【請求項20】
融合タンパク質をコードする少なくとも1つの核酸がRNAであるまたは融合タンパク質をコードする少なくとも1つの核酸がDNAである、請求項19の複数の核酸。
【請求項21】
融合タンパク質をコードする少なくとも1つの核酸が真核生物細胞における発現のためにコドン最適化されている、請求項1820の何れかの複数の核酸。
【請求項22】
真核生物細胞がヒト細胞、非ヒト哺乳動物細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞、植物細胞または単細胞真核生物である、請求項21の複数の核酸。
【請求項23】
少なくとも1つの操作されたガイドRNAをコードする核酸がDNAである、請求項1822の何れかの複数の核酸。
【請求項24】
融合タンパク質をコードする少なくとも1つの核酸が、インビトロRNA合成または細菌細胞におけるタンパク質発現のためにファージプロモーター配列に操作可能に連結され、少なくとも1つの操作されたガイドRNAをコードする核酸が、インビトロRNA合成のためにファージプロモーター配列に操作可能に連結されている、請求項1823の何れかの複数の核酸。
【請求項25】
融合タンパク質をコードする少なくとも1つの核酸が、真核生物細胞における発現のために真核生物プロモーター配列に操作可能に連結され、少なくとも1つの操作されたガイドRNAをコードする核酸が、真核生物細胞における発現のために真核生物プロモーター配列に操作可能に連結されている、請求項1823の何れかの複数の核酸。
【請求項26】
請求項1825の何れかの複数の核酸を含む、少なくとも1つのベクター。
【請求項27】
プラスミドベクター、ウイルスベクターまたは自己複製ウイルスRNAレプリコンである、請求項26の少なくとも1つのベクター。
【請求項28】
請求項1~14の何れかの融合タンパク質、請求項1517の何れかのシステム、請求項1825の何れかの複数の核酸または請求項26もしくは27の少なくとも1つのベクターを含む少なくとも1つのシステムを含む、真核生物細胞。
【請求項29】
ヒト細胞、非ヒト哺乳動物細胞、植物細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞または単細胞真核生物である、請求項28の真核生物細胞。
【請求項30】
インビボ、エクスビボまたはインビトロである、請求項28または29の真核生物細胞。
【請求項31】
生存真核生物細胞または化学的に固定された真核生物細胞内の染色体同一性および位置を決定する方法であって、請求項1~27の何れかの融合タンパク質、システム、複数の核酸またはベクターを生存または化学的に固定された真核生物細胞に導入し、マーカータンパク質からのシグナルを測定することを含む、方法。
【請求項32】
真核生物細胞がヒト細胞、非ヒト哺乳動物細胞、植物細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞または単細胞真核生物である、請求項31の方法。
【請求項33】
真核生物細胞がインビボ、エクスビボまたはインビトロである、請求項31または32の方法。
【手続補正書】
【提出日】2022-03-16
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
配列番号35または36と少なくとも90%配列同一性を有するアミノ酸配列を有する第一リンカーを介してCas9タンパク質に連結されている少なくとも1つのマーカータンパク質を含む、融合タンパク質。
【請求項2】
第一リンカーが、少なくとも1つのマーカータンパク質およびCas9タンパク質の間に配置されている、請求項1の融合タンパク質。
【請求項3】
少なくとも1つのマーカータンパク質が、Cas9タンパク質に直接的または間接的に第一リンカーを介して連結されている、請求項1または2の融合タンパク質。
【請求項4】
1以上の少なくとも1つの核移行シグナル(NLS)をさらに含む、請求項1~3の何れかの融合タンパク質。
【請求項5】
の順番(N末端からC末端方向)で配置されている成分を含む、請求項の融合タンパク質:
マーカータンパク質-第一リンカー-核移行シグナル-Cas9タンパク質;
マーカータンパク質-核移行シグナル-第一リンカー-Cas9タンパク質;
核移行シグナル-第一リンカー-マーカータンパク質-Cas9タンパク質;
核移行シグナル-マーカータンパク質-第一リンカー-Cas9タンパク質;
マーカータンパク質-第一リンカー-核移行シグナル-第二リンカー-Cas9タンパク質;または
核移行シグナル-第一リンカー-マーカータンパク質-第二リンカー-Cas9タンパク質。
【請求項6】
少なくとも1つの異種ドメインをさらに含み、所望により少なくとも1つの異種ドメインが細胞透過性ドメイン、クロマチン調節モチーフ、後成的修飾ドメイン、転写制御ドメイン、RNAアプタマー結合ドメインまたはこれらの組み合わせである、請求項1~5の何れかの融合タンパク質。
【請求項7】
融合タンパク質がヌクレアーゼであり、二本鎖配列の両鎖を開裂する、ニッカーゼであり、二本鎖配列の一方の鎖を開裂する、またはヌクレアーゼまたはニッカーゼ活性を有しない、および/またはCas9タンパク質がストレプトコッカス・ピオゲネス(Streptococcus pyogenes)、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)、ナイセリア・メニンギティディス(Neisseria meningitidis)、スタフィロコッカス・アウレウス(Staphylococcus aureus)またはカンピロバクター・ジェジュニ(Campylobacter jejuni)由来である、請求項1~の何れかの融合タンパク質。
【請求項8】
少なくとも1つのマーカータンパク質が配列番号19または20と少なくとも90%配列同一性を有するアミノ酸配列を有する、または少なくとも1つのマーカータンパク質が配列番号19または20に示すアミノ酸配列を有する、請求項1~の何れかの融合タンパク質。
【請求項9】
リンカーが配列番号35または36に示すアミノ酸配列を有する、請求項1~の何れかの融合タンパク質。
【請求項10】
融合タンパク質が配列番号48、49または50と少なくとも90%配列同一性を有するアミノ酸配列を有する、または融合タンパク質が配列番号48、49または50に示すアミノ酸配列を有する、請求項1~の何れかの融合タンパク質。
【請求項11】
請求項1~10の何れかの融合タンパク質および操作されたガイドRNAを含む、システム。
【請求項12】
(a)操作されたガイドRNAが単一分子である、および/または(b)操作されたガイドRNA配列が、操作されたガイドRNA内での塩基対形成促進、操作されたガイドRNA内での塩基対形成最小化、操作されたガイドRNAの安定性増加、真核生物細胞における操作されたガイドRNAの転写促進またはこれらの組み合わせのために最適化されている、請求項11のシステム。
【請求項13】
(a)請求項1~1の何れかの融合タンパク質、または
(b)複数の核酸が融合タンパク質をコードする少なくとも1つの核酸および少なくとも1つの操作されたガイドRNAをコードする核酸を含む、請求項11または12のシステム
をコードする、複数の核酸。
【請求項14】
(a)融合タンパク質をコードする少なくとも1つの核酸がRNAまたはDNAである、(b)融合タンパク質をコードする少なくとも1つの核酸が真核生物細胞における発現のためにコドン最適化されており、所望により真核生物細胞がヒト細胞、非ヒト哺乳動物細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞、植物細胞または単細胞真核生物である、(c)少なくとも1つの操作されたガイドRNAをコードする核酸がDNAである、(d)融合タンパク質をコードする少なくとも1つの核酸が、インビトロRNA合成または細菌細胞におけるタンパク質発現のためにファージプロモーター配列に操作可能に連結され、少なくとも1つの操作されたガイドRNAをコードする核酸が、インビトロRNA合成のためにファージプロモーター配列に操作可能に連結されている、または(e)融合タンパク質をコードする少なくとも1つの核酸が、真核生物細胞における発現のために真核生物プロモーター配列に操作可能に連結され、少なくとも1つの操作されたガイドRNAをコードする核酸が、真核生物細胞における発現のために真核生物プロモーター配列に操作可能に連結されている、
請求項13の複数の核酸。
【請求項15】
請求項13または14の複数の核酸を含み、所望によりプラスミドベクター、ウイルスベクターまたは自己複製ウイルスRNAレプリコンである、少なくとも1つのベクター。
【請求項16】
請求項1~10の何れかに定義される融合タンパク質、請求項11または12に定義されるシステム、請求項13または14に定義される複数の核酸または請求項15に定義される少なくとも1つのベクターを含む少なくとも1つのシステムを含む、真核生物細胞。
【請求項17】
ヒト細胞、非ヒト哺乳動物細胞、植物細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞または単細胞真核生物である、および/またはインビボ、エクスビボまたはインビトロである、請求項16の真核生物細胞。
【請求項18】
生存真核生物細胞または化学的に固定された真核生物細胞内の染色体同一性および位置を決定する方法であって、請求項1~15の何れかの融合タンパク質、システム、複数の核酸またはベクターを生存または化学的に固定された真核生物細胞に導入し、マーカータンパク質からのシグナルを測定することを含む、方法。
【請求項19】
真核生物細胞がヒト細胞、非ヒト哺乳動物細胞、植物細胞、非哺乳類脊椎動物細胞、無脊椎動物細胞または単細胞真核生物である、および/または真核生物細胞がインビボ、エクスビボまたはインビトロである、請求項18の方法。
【国際調査報告】