(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-13
(45)【発行日】2023-12-21
(54)【発明の名称】細胞を単離又は同定する方法及び細胞集団
(51)【国際特許分類】
C12N 5/10 20060101AFI20231214BHJP
C12N 1/15 20060101ALI20231214BHJP
C12N 1/19 20060101ALI20231214BHJP
C12N 1/21 20060101ALI20231214BHJP
C12N 1/02 20060101ALI20231214BHJP
C12Q 1/6881 20180101ALI20231214BHJP
C12N 15/09 20060101ALI20231214BHJP
【FI】
C12N5/10
C12N1/15
C12N1/19
C12N1/21
C12N1/02
C12Q1/6881 Z ZNA
C12N15/09 110
(21)【出願番号】P 2020537085
(86)(22)【出願日】2019-08-13
(86)【国際出願番号】 JP2019031872
(87)【国際公開番号】W WO2020036181
(87)【国際公開日】2020-02-20
【審査請求日】2022-08-15
(31)【優先権主張番号】P 2018152403
(32)【優先日】2018-08-13
(33)【優先権主張国・地域又は機関】JP
(31)【優先権主張番号】P 2019012268
(32)【優先日】2019-01-28
(33)【優先権主張国・地域又は機関】JP
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人新エネルギー・産業技術総合開発機構「植物等の生物を用いた高機能品生産技術/高生産性微生物創製に資する情報解析システムの開発」委託研究開発、産業技術力強化法第17条の適用を受ける特許出願、平成30年度、国立研究開発法人科学技術振興機構「戦略的創造研究推進事業/統合1細胞解析のための革新的技術基盤/1細胞レベルで細胞系譜を一斉同定するDNABarclockテクノロジー」委託研究開発、産業技術力強化法第17条の適用を受ける特許出願
(73)【特許権者】
【識別番号】508113022
【氏名又は名称】Spiber株式会社
(73)【特許権者】
【識別番号】504137912
【氏名又は名称】国立大学法人 東京大学
(74)【代理人】
【識別番号】100088155
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100128381
【氏名又は名称】清水 義憲
(74)【代理人】
【識別番号】100211100
【氏名又は名称】福島 直樹
(74)【代理人】
【識別番号】100211199
【氏名又は名称】原田 さやか
(72)【発明者】
【氏名】石田 花菜
(72)【発明者】
【氏名】石黒 宗
(72)【発明者】
【氏名】谷内江 望
(72)【発明者】
【氏名】佐藤 知香子
(72)【発明者】
【氏名】菅原 潤一
【審査官】福澤 洋光
(56)【参考文献】
【文献】国際公開第2017/040694(WO,A2)
【文献】特表2009-527240(JP,A)
【文献】特表2008-518613(JP,A)
【文献】特表2011-518571(JP,A)
【文献】国際公開第2015/133554(WO,A1)
【文献】YACHIE, N., et al.,Pooled-matrix protein interaction screens using barcode fusion genetics,Molecular Systems Biology,2016年,Vol.12, No.4:863,pp.1-17
(58)【調査した分野】(Int.Cl.,DB名)
C12N 1/00-15/90
C12Q 1/00- 3/00
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
Genbank/EMBL/DDBJ/GeneSeq
PubMed
(57)【特許請求の範囲】
【請求項1】
細胞集団からターゲットクローン細胞を単離又は同定する方法であって、
(i)バーコード配列とそれに連結した少なくとも一つのレポータータンパク質異常発現カセットを導入した細胞集団を調製するステップ;
(ii)任意のバーコード配列を標的とするバーコード配列認識モジュールと核酸変異修復酵素とを細胞に導入するステップ;
(iii)標的とされたバーコード配列を有する細胞において、前記少なくとも一つのレポータータンパク質異常発現カセットにおける異常発現の原因である核酸変異を、前記バーコード配列認識モジュールと前記核酸変異修復酵素の複合体の発現により修復し、それにより前記レポータータンパク質を正常に発現させるステップ;
(iv)前記レポータータンパク質が発現したターゲットクローン細胞を単離又は同定するステップ;
を含む、方法。
【請求項2】
前記複合体は、前記核酸変異部位において1以上のヌクレオチドを他の1以上のヌクレオチドに変換する若しくは欠失させる、又は1以上のヌクレオチドを挿入するものである、請求項1に記載の方法。
【請求項3】
前記核酸変異が、N末端から最初に現れるメチオニンをコードする配列(ATG)における変異である、請求項1又は2に記載の方法。
【請求項4】
前記バーコード配列にはATGが含まれない、請求項3に記載の方法。
【請求項5】
前記バーコード配列認識モジュールが、ガイドRNAであり、
前記核酸変異修復酵素がCasタンパク質と連結しており、
前記ガイドRNAは前記バーコード配列の少なくとも一部と相補的な配列を含む、請求項1~4いずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、細胞を単離又は同定する方法及び細胞集団に関する。
【背景技術】
【0002】
細胞分化、がん細胞の増殖や個体発生において細胞集団の不均質性が重要であることが指摘されている。例えば、がんの悪性化や細胞分化又はそれらのモデルとなる培養細胞の系は、ゲノム解析により、不均質で異なる細胞クローンであることが明らかにされ、これががん治療を困難なものとする原因の1つとして着目されている。一方で、不均質な細胞集団に関する研究においては、「将来特定の形質を示す細胞クローン」が複雑性の高い初期状態の不均質な細胞集団中に埋没し、多様な細胞の中から同定・単離・培養することができないということが問題となる。
【0003】
ゲノム解析のみでがんの悪性化等を生じる機構を解明するのは困難であるため、不均質な細胞集団を何らかの手法で分離して解析する必要がある。フローサイトメトリー等の従来の細胞分離法では、通常細胞表面のマーカーを基準として細胞を選別することから、表面抗原が特定された免疫細胞等を選別するのには有用な方法である。しかしながら、表面抗原マーカー等を用いた従来法による細胞の分取り・解析では、目的とするクローンを集団中から選択的に分離できる遺伝子セットが必要となる。そのため、マーカーの発現が自明ではない細胞や既知のマーカーでは分離できない集団については、分取り・解析が困難となる。例えば、造血幹細胞が血液細胞へと分化、成熟するまでの過程に未知の亜集団の存在が指摘されているが、現状では、これらの細胞集団を分取りし、解析することは出来ない。また、例えば、線維芽細胞からiPS細胞への誘導の過程においては、その誘導効率がクローン毎に異なる現象が見出されているものの、現状では誘導効率の高いクローンを分取りし、遺伝子発現やDNAメチル化の状態等を解析することは難しい。
【0004】
さらに、細胞は集団内で相互作用を繰り返し、各々の細胞内動態を変化させる。この一例として、がん細胞における薬剤耐性獲得プロセスが挙げられる。がん細胞集団の抗がん剤に対する応答を理解することは、理想的な抗がん剤開発において急迫した課題である。その一方、各々のがん細胞クローンの持つゲノム構造や遺伝子発現といった分子動態は、がん細胞集団全体に対してどのように作用・応答しているのか、今日の技術では解析が難しく明らかにされていない。例えば、米ノバルティスとハーバード大学のチームは、非小細胞肺がん由来細胞株を対象に、複雑性の高いDNAバーコードをレンチウィルスによりゲノムに導入し、抗がん剤暴露下における細胞の増殖変動を計測した (非特許文献1)。長期に及ぶ複数の抗がん剤暴露下で、集団内においてDNAバーコードの多様性が縮小し、異なる細胞クローンの増減の一斉追跡法を確立したものの、この方法によっても、特定の遺伝子の増幅又は細胞形態の変化が確認された細胞クローンの分子動態について、時間発展とともにどのように細胞集団環境下で変動してきたか、そのダイナミクスを解析することはできない。
【先行技術文献】
【非特許文献】
【0005】
【文献】Bhang HE et al.,Nat Med., 2015,21(5):440-8
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、細胞集団から任意の細胞を単離又は同定する方法及び当該方法に用いる細胞集団を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明者らは、バーコード技術による細胞集団の一斉標識化と、核酸編集技術を用いて、細胞集団から任意の細胞クローンを同定・単離できる方法を見出し、本発明を完成するに至った。
【0008】
本発明は、例えば、以下の各発明を提供する。
[1]
細胞集団からターゲットクローン細胞を単離又は同定する方法であって、
(i)バーコード配列とそれに連結した少なくとも一つのレポータータンパク質異常発現カセットを導入した細胞集団を調製するステップ;
(ii)任意のバーコード配列を標的とするバーコード配列認識モジュールと核酸変異修復酵素とを細胞に導入するステップ;
(iii)標的とされたバーコード配列を有する細胞において、上記少なくとも一つのレポータータンパク質異常発現カセットにおける異常発現の原因である核酸変異を、上記バーコード配列認識モジュールと上記核酸変異修復酵素の複合体の発現により修復し、それにより上記レポータータンパク質を正常に発現させるステップ;
(iv)上記レポータータンパク質が発現したターゲットクローン細胞を単離又は同定するステップ;
を含む、方法。
[2]
上記複合体は、上記核酸変異部位において1以上のヌクレオチドを他の1以上のヌクレオチドに変換する若しくは欠失させる、又は1以上のヌクレオチドを挿入するものである、[1]に記載の方法。
[3]
上記核酸変異が、N末端から最初に現れるメチオニンをコードする配列(ATG)における変異である、[1]又は[2]に記載の方法。
[4]
上記バーコード配列にはATGが含まれない、[3]に記載の方法。
[5]
上記バーコード配列認識モジュールが、ガイドRNAであり、
上記核酸変異修復酵素がCasタンパク質と連結しており、
上記ガイドRNAは上記バーコード配列の少なくとも一部と相補的な配列を含む、[1]~[4]のいずれかに記載の方法。
[6]
バーコード配列とそれに連結した少なくとも一つのレポータータンパク質異常発現カセットが、個々の細胞に導入されている、細胞集団。
[7]
上記少なくとも一つのレポータータンパク質異常発現カセットにおける核酸変異が、N末端から最初に現れるメチオニンをコードする配列(ATG)における変異である、[6]に記載の細胞集団。
[8]
上記バーコード配列にはATGが含まれない、[6]又は[7]に記載の細胞集団。
[9]
任意のバーコードを標的とする核酸配列認識モジュールと核酸変異修復酵素とが結合した複合体を含む、[6]~[8]のいずれかに記載の細胞集団。
【発明の効果】
【0009】
本発明によれば、細胞集団から任意の細胞を単離又は同定する方法及び当該方法に用いる細胞集団を提供することができる。
【図面の簡単な説明】
【0010】
【
図1】実施例1の結果を示す蛍光顕微鏡写真である。
【
図2】実施例1における、RFPの蛍光強度を表したグラフである。targeはtarge sgRNAを用いた場合、scrambledは、scrambled sgRNAを用いた場合をそれぞれ示す。
【
図4】実施例2の結果を示すグラフである。各グラフ中に記載された%は、GFP蛍光が確認された集団の割合を示す。
【
図5】実施例3において、各バーコードを用いた場合のATG変換効率を示すグラフである。
【
図6】実施例4において、各システムにおける、異なるインデューサー及び細胞株の組み合わせを用いた結果を示すグラフである。
【
図7】実施例4において、各システムにおける、GFP陽性細胞の割合(活性化 %)と偽陽性(エラー %)の関係を示すグラフである。
【
図8】実施例5において、RFP発現が期待されるコロニーの例示を示す。左はsgRNA(sgRNA_BC7)を用いた場合、右はsgRNA(sgRNA_BC8)を用いた場合の結果を示す。
【
図9】実施例5において、サンプリングされたコロニーにおけるバーコード配列付近の配列を、次世代シーケンサーによりにより確認した結果を示す。網掛けはバーコード配列、囲み線は変異により修復された開始コドンATGを示す。
【発明を実施するための形態】
【0011】
以下、本発明を実施するための形態について詳細に説明する。ただし、本発明は以下の実施形態に限定されるものではない。
【0012】
一実施形態に係る細胞集団からターゲットクローン細胞を単離又は同定する方法は、以下の(i)~(iv)のステップを含むことを特徴とする。
(i)バーコード配列とそれに連結した少なくとも一つのレポータータンパク質異常発現カセットを導入した細胞集団を調製するステップ、
(ii)任意のバーコード配列を標的とするバーコード配列認識モジュールと核酸変異修復酵素とを細胞に導入するステップ、
(iii)標的とされたバーコード配列を有する細胞において、上記少なくとも一つのレポータータンパク質異常発現カセットにおける異常発現の原因である核酸変異を、上記バーコード配列認識モジュールと上記核酸変異修復酵素の複合体の発現により修復し、それにより上記レポータータンパク質を正常に発現させるステップ、
(iv)上記レポータータンパク質が発現したターゲットクローン細胞を単離又は同定するステップ。
【0013】
本発明において細胞は特に限定されず、例えば、がん細胞、造血幹細胞、血液細胞、線維芽細胞、iPS細胞等の様々な細胞を使用することが可能である。
【0014】
細胞集団は、細胞の集まりを意味する。細胞集団は、単一のクローンのみが存在する均質な細胞からなるものであってもよいが、不均質な細胞集団であると、本発明の効果がより顕著に発揮されるため好ましい。不均質な細胞集団とは、複数のクローンが存在する細胞の集まりを意味する。
【0015】
本発明は、レポータータンパク質の発現に基づき選抜することで、ターゲットクローン細胞を単離又は同定する。ターゲットクローン細胞は、単離又は同定の目的となる細胞であり、単一の細胞であってもよく、該細胞が増殖した後代の細胞群であってもよい。
【0016】
[ステップ(i)]
ステップ(i)は、バーコード配列とそれに連結した少なくとも一つのレポータータンパク質異常発現カセット(遺伝学的回路)を導入した細胞集団を調製するステップである。
【0017】
本発明のバーコード配列とは、タグ(特表平10-507357号公報、特表2002-518060号公報)、ジップコード(特表2001-519648号公報)もしくは正規直交化配列(特開2002-181813号公報)、バーコード配列(Xu, Q., Schlabach, M.R., Hannon, G.J. et al. (2009) PNAS 106, 2289-2294)などと呼ばれる配列である。バーコード配列は、DNA配列を用いたもの(DNAバーコード配列)であってもよく、DNAやRNAの類似体であるペプチド核酸(PNA)を用いたものであってもよい。バーコード配列は、交差反応性(クロスハイブリダイゼーション)が少ないことが望ましい。また、バーコード配列の塩基長は、8~30塩基長であってよく、10~25塩基長であってよく、15~20塩基長であってよく、17~20塩基長であってよく、16~18塩基長であってよい。また、下流に配置された遺伝子のタンパク質発現の安定性の観点等から、バーコードは、開始コドンに対応する配列(ATG)を含まないことが好ましく、開始コドンに対応する配列及び終止コドンに対応する配列(TAA、TAG、TGA)の両方を含まないことがより好ましい。バーコードの具体例としては、4塩基WSNS(W=A/T、S=G/C、N=A/T/G/C)を1つのユニットとし、連続する4つのユニットと一塩基のNを持った計17塩基から構成されるDNAバーコードが挙げられる((WSNS)4N)。上記バーコードの各WSNSユニットは理論上、開始コドンに対応する配列と終止コドンに対応する配列が出現しないため、下流に配置された遺伝子(例えば、レポーター遺伝子)の意図しない読み枠での翻訳開始と終結を防止することが期待でき、本実施形態に係る方法の安定性と高感度化に寄与すると期待される。
【0018】
レポータータンパク質異常発現カセットは、レポータータンパク質発現カセットにおける核酸変異により、レポータータンパク質を正常に発現しないように設計されたものを意味する。レポータータンパク質が正常に発現している場合には、その発現に基づき、目的とする選抜ができる。レポータータンパク質の異常発現は、上記核酸変異の存在により、レポータータンパク質を全く発現しない場合だけではなく、発現するタンパク質の構造が異常であったり、タンパク質の発現量が小さすぎたりするために、レポータータンパク質の発現に基づき目的とする選抜ができない場合も含む。したがって、レポータータンパク質の異常発現は、レポータータンパク質をコードする遺伝子における核酸変異によるものに限定されず、レポータータンパク質を発現するためのプロモーター等における核酸変異によるものであってもよい。レポータータンパク質異常発現カセットは、上記核酸変異が修正された場合にレポータータンパク質が正常に発現するように設計される。
【0019】
異常発現の原因となる核酸変異は、レポータータンパク質異常発現カセットにおけるヌクレオチドの変異であり、レポータータンパク質をコードするポリヌクレオチドにおけるヌクレオチドの塩基の変異であることが好ましい。ヌクレオチドの塩基の変異数は特に制限されず、1~5、1~4、1~3、1若しくは2、又は1の塩基における変異であってよい。また、塩基の変異は連続していてもよく、複数の変異が別個に存在していてもよい。変異の種類としては、置換、挿入、欠失及びそれらの組み合わせのいずれであってもよい。変異は、レポータータンパク質のアミノ酸配列においてN末端から最初に現れるATG(開始コドンに該当するメチオニン)における変異であることが好ましく、ATGのAをGに置換する変異であることがより好ましい。
【0020】
レポータータンパク質発現カセットは、細胞内でレポータータンパク質を発現可能なポリヌクレオチドである限り特に制限されない。該発現カセットの典型例としては、プロモーター、及び該プロモーターの制御下に配置されたレポータータンパク質コード配列を含むポリヌクレオチドが挙げられる。
【0021】
プロモーターとしては、特に制限されず、例えばCMVプロモーター、EF1aプロモーター、UbiCプロモーター、PGKプロモーター、U6プロモーター、CAGプロモーター等の恒常性プロモーターが挙げられる。レポータータンパク質発現カセットのプロモーターとしては、CMVプロモーターを使用することが好ましい。
【0022】
レポータータンパク質としては、特に制限されず、例えば、特定の基質と反応して発光(発色)する発光(発色)タンパク質、或いは励起光によって蛍光を発する蛍光タンパク質等が挙げられる。発光(発色)タンパク質としては、例えば、ルシフェラーゼ、βガラクトシダーゼ、クロラムフェニコールアセチルトランスフェラーゼ、βグルクロニダーゼ等が挙げられ、蛍光タンパク質としては、例えば、GFP、Azami-Green、ZsGreen、GFP2、EGFP、HyPer、Sirius、BFP、CFP、Turquoise、Cyan、TFP1、YFP、Venus、ZsYellow、Banana、KusabiraOrange、RFP、DsRed、AsRed、Strawberry、Jred、KillerRed、Cherry、HcRed、mPlum等が挙げられる。薬剤耐性レポータータンパク質としては、例えば、クロラムフェニコール耐性遺伝子、テトラサイクリン耐性遺伝子、ネオマイシン耐性遺伝子、エリスロマイシン耐性遺伝子、スペクチノマイシン耐性遺伝子、カナマイシン耐性遺伝子、ハイグロマイシン耐性遺伝子、ピューロマイシン耐性遺伝子等の薬剤耐性遺伝子にコードされるタンパク質が挙げられる。レポータータンパク質には、発光(発色)タンパク質や蛍光タンパク質との融合タンパク質や、発光(発色)タンパク質や蛍光タンパク質に公知のタンパク質タグ、公知のシグナル配列等が付加されてなるタンパク質も包含される。また、レポータータンパク質は、正常に発現する限り、公知のタンパク質の一部であってもよい。
【0023】
レポータータンパク質コード配列は、レポータータンパク質のアミノ酸配列をコードする塩基配列である限り特に制限されない。上述したように、レポータータンパク質は、公知のタンパク質の一部であってもよいため、レポータータンパク質コード配列は、公知のタンパク質の一部のORFをコードする塩基配列であってもよい。例えば、公知のタンパク質のアミノ酸配列において途中に現れるメチオニンを開始コドンとして使用することもできる。
【0024】
レポータータンパク質異常発現カセットは、各バーコード配列に連結している。レポータータンパク質異常発現カセットと各バーコード配列は、直接連結していてもよく、間接的に連結していてもよく、各バーコード配列がレポータータンパク質異常発現カセット内に組み込まれていてもよい。バーコード配列がレポータータンパク質異常発現カセット内に組み込まれる場合には、バーコード配列の直下に、変異を含むレポータータンパク質をコードする配列が配置されてもよく、バーコード配列と変異を含むレポータータンパク質をコードする配列の間に何らかの他の核酸が配置されていてもよい。バーコード配列の3’末端からレポータータンパク質異常発現カセットにおける核酸変異までの距離(バーコード配列が上流の場合)、又はレポータータンパク質異常発現カセットにおける核酸変異までの距離からバーコード配列の5’末端までの距離(バーコード配列が下流の場合)は、例えば、塩基数にして0~3塩基長、0~2塩基長又は0~1塩基長であってよい。
【0025】
バーコード配列とそれに連結した少なくとも一つのレポータータンパク質異常発現カセットを細胞に導入する方法は、特に制限されず、例えば、発現ベクターを使用した方法等当業者に周知の方法を用いることができる。
【0026】
発現ベクターは、例えば、該DNAを適当な発現ベクター中のプロモーターの下流に連結することにより製造することができる。また、発現ベクターは、所望によりターミネーター、リプレッサー、薬剤耐性遺伝子、栄養要求性相補遺伝子等の選択マーカー、宿主で機能し得る複製起点などを含有することができる。
【0027】
発現ベクターの導入は、宿主の種類に応じ、公知の方法(例えば、リゾチーム法、コンピテント法、PEG法、CaCl2共沈殿法、エレクトロポレーション法、マイクロインジェクション法、パーティクルガン法、リポフェクション法、アグロバクテリウム法など)に従って実施することができる。
【0028】
[ステップ(ii)]
ステップ(ii)は、任意のバーコード配列を標的とするバーコード配列認識モジュールと核酸変異修復酵素とを細胞に導入するステップである。
【0029】
任意のバーコード配列とは、上述したバーコード配列群から選択されたバーコード配列を意味する。
【0030】
バーコード配列認識モジュールは、上記選択されたバーコード配列を標的とするモジュールであり、バーコード認識領域を含む。バーコード認識領域は、バーコード配列の少なくとも一部と相補的な配列であることが好ましい。
【0031】
本発明のバーコード配列認識モジュールとしては、例えば、CRISPR-Casシステムを利用するもの、Casの少なくとも1つのDNA切断能が失活したCRISPR-Casシステム(以下、「CRISPR-変異Cas」ともいい、CRISPR-変異Cpf1も包含される)を利用するもの、ジンクフィンガーモチーフ、TALエフェクター及びPPRモチーフ等の他、制限酵素、転写因子、RNAポリメラーゼ等のDNAと特異的に結合し得るタンパク質のDNA結合ドメインを含み、DNA二重鎖切断能を有しないフラグメント等が用いられ得るが、これらに限定されない。好ましくは、CRISPR-変異Cas、ジンクフィンガーモチーフ、TALエフェクター、PPRモチーフ等が挙げられる。
【0032】
ジンクフィンガーモチーフは、Cys2His2型の異なるジンクフィンガーユニット(1フィンガーが約3塩基を認識する)を3~6個連結させたものであり、9~18塩基の標的ヌクレオチド配列を認識することができる。ジンクフィンガーモチーフは、Modular assembly法(Nat Biotechnol (2002) 20: 135-141)、OPEN法(Mol Cell (2008) 31: 294-301)、CoDA法(Nat Methods (2011) 8: 67-69)、大腸菌one-hybrid法(Nat Biotechnol (2008) 26: 695-701)等の公知の手法により作製することができる。ジンクフィンガーモチーフの作製の詳細については、上記特許文献1を参照することができる。
【0033】
TALエフェクターは、約34アミノ酸を単位としたモジュールの繰り返し構造を有しており、1つのモジュールの12及び13番目のアミノ酸残基(RVDと呼ばれる)によって、結合安定性と塩基特異性が決定される。各モジュールは独立性が高いので、モジュールを繋ぎ合わせるだけで、標的ヌクレオチド配列に特異的なTALエフェクターを作製することが可能である。TALエフェクターは、オープンリソースを利用した作製方法(REAL法(Curr Protoc Mol Biol (2012) Chapter 12: Unit 12.15)、FLASH法(Nat Biotechnol (2012) 30: 460-465)、Golden Gate法(Nucleic Acids Res (2011) 39: e82)等)が確立されており、比較的簡便に標的ヌクレオチド配列に対するTALエフェクターを設計することができる。TALエフェクターの作製の詳細については、上記特許文献2を参照することができる。
【0034】
PPRモチーフは、35アミノ酸からなり1つの核酸塩基を認識するPPRモチーフの連続によって、特定のヌクレオチド配列を認識するように構成されており、各モチーフの1、4及びii(-2)番目のアミノ酸のみで標的塩基を認識する。モチーフ構成に依存性はなく、両脇のモチーフからの干渉はないので、TALエフェクター同様、PPRモチーフを繋ぎ合わせるだけで、標的ヌクレオチド配列に特異的なPPRタンパク質を作製することが可能である。PPRモチーフの作製の詳細については、特開2013-128413号公報を参照することができる。
【0035】
また、制限酵素、転写因子、RNAポリメラーゼ等のフラグメントを用いる場合、これらのタンパク質のDNA結合ドメインは周知であるので、該ドメインを含み、且つDNA二重鎖切断能を有しない断片を容易に設計し、構築することができる。
【0036】
CRISPR-Casシステムを利用する場合、標的となるバーコード配列に対して相補的な配列を含むガイドRNAにより目的の二本鎖DNAの配列を認識するので、標的となるバーコード配列と特異的にハイブリッド形成し得るオリゴDNAを合成するだけで、任意の配列を標的化することができる。
【0037】
本発明のより好ましい実施態様においては、CRISPR-Casシステムを利用することが好ましく、少なくとも1つのDNA切断能が失活したCasタンパク質(例えば、ニッカーゼ)を用いた、CRISPR-Casシステム(CRISPR-変異Cas)を利用することがより好ましい。
【0038】
CRISPR-Casシステムを利用する場合のバーコード配列認識モジュールとしては、例えば、ガイドRNAが挙げられる。
【0039】
例えば、バーコード配列認識モジュールは、標的となるバーコード配列と相補的な配列(バーコード配列認識領域)を含むCRISPR-RNA(crRNA)と、Casタンパク質のリクルートに必要なtrans-activating RNA(tracrRNA)とからなるガイドRNA(キメラRNA)であってよい。
【0040】
ガイドRNAコード配列は、ガイドRNAをコードする塩基配列である限り特に制限されない。
【0041】
ガイドRNAは、CRISPR/Casシステムにおいて用いられるものであれば特に制限されず、例えば、標的部位に結合し、かつCasタンパク質と結合することにより、Casタンパク質を標的部位に誘導可能なものを各種使用することができる。
【0042】
本明細書において、ガイドRNAが結合する標的部位とは、PAM(Proto-spacer Adjacent Motif)配列及びその5’側に隣接するバーコード配列(標的鎖)とその相補鎖(非標的鎖)からなる、部位である。PAM配列の最も5’側の配列からレポータータンパク質異常発現カセットにおける核酸変異までの距離は、例えば、塩基数にして、15~20塩基長であってよい。
【0043】
PAM配列は、利用するCasタンパク質の種類によって異なる。例えば、S. pyogenes由来のCas9タンパク質(II型)に対応するPAM配列は5’-NGGであり、S. solfataricus由来のCas9タンパク質(I-A1型)に対応するPAM配列は5’-CCNであり、S. solfataricus由来のCas9タンパク質(I-A2型)に対応するPAM配列は5’-TCNであり、H. walsbyl由来のCas9タンパク質(I-B型)に対応するPAM配列は5’-TTCであり、E. coli由来のCas9タンパク質(I-E型)に対応するPAM配列は5´-AWGであり、E. coli由来のCas9タンパク質(I-F型)に対応するPAM配列は5’-CCであり、P. aeruginosa由来のCas9タンパク質(I-F型)に対応するPAM配列は5´-CCであり、S. Thermophilus由来のCas9タンパク質(II-A型)に対応するPAM配列は5’-NNAGAAであり、S. agalactiae由来のCas9タンパク質(II-A型)に対応するPAM配列は5’-NGGであり、S. aureus由来のCas9タンパク質に対応するPAM配列は、5’-NGRRT又は5’-NGRRNであり、N. meningitidis由来のCas9タンパク質に対応するPAM配列は、5´-NNNNGATTであり、T. denticola由来のCas9タンパク質に対応するPAM配列は、5’-NAAAACである。
【0044】
ガイドRNAは標的部位への結合に関与する配列(crRNA(CRISPR RNA)配列といわれることもある)を有しており、このcrRNA配列が、非標的鎖のPAM配列相補配列を除いてなる配列に相補的(好ましくは、相補的且つ特異的)に結合することにより、ガイドRNAは標的部位に結合することができる。本実施形態においては、crRNA配列は、バーコード配列に相補的に結合する。
【0045】
具体的には、crRNA配列の内、バーコード配列に結合する配列は、バーコード配列と例えば、80%以上、90%以上、好ましくは95%以上、より好ましくは98%以上、さらに好ましくは99%以上、特に好ましくは100%の同一性を有する。なお、ガイドRNAの標的部位への結合には、crRNA配列のうち、標的配列に結合する配列の3’側の12塩基が重要であるといわれている。このため、crRNA配列のうち、バーコード配列に結合する配列が、バーコード配列と完全同一ではない場合、バーコード配列と異なる塩基は、crRNA配列のうち、バーコード配列に結合する配列の3’側の12塩基以外に存在することが好ましい。
【0046】
tracrRNA配列は、特に制限されない。tracrRNA配列は、典型的には、複数(通常、3つ)のステムループを形成可能な50~100塩基長程度の配列からなるRNAであり、利用するCasタンパク質の種類に応じてその配列は異なる。tracrRNA配列としては、利用するCasタンパク質の種類に応じて、公知の配列を各種採用することができる。
【0047】
ガイドRNAは、通常、上記したcrRNA配列とtracr RNA配列を含む。ガイドRNAの態様は、crRNA配列とtracr RNA配列を含む一本鎖RNA(sgRNA)であってもよいし、crRNA配列を含むRNAとtracrRNA配列を含むRNAとが相補的に結合してなるRNA複合体であってもよい。
【0048】
ガイドRNAの発現カセットの具体例としては、例えばガイドRNAがcrRNA配列とtracr RNA配列を含む一本鎖RNA(sgRNA)である場合は、プロモーター、並びにそのプロモーターの制御下に配置されたcrRNAコード配列挿入用サイト及び該サイトの下流に配置されたtracrRNAコード配列を含むポリヌクレオチドや、プロモーター、及びそのプロモーターの制御下に配置されたsgRNAコード配列を含むポリヌクレオチド等が挙げられる。別の例として、ガイドRNAがcrRNA配列を含むRNAとtracrRNA配列を含むRNAとが相補的に結合してなるRNA複合体である場合は、ガイドRNAの発現カセットの典型例としては、プロモーター、及びそのプロモーターの制御下に配置された「crRNA配列を含むRNA」コード配列(或いは、crRNAコード配列挿入用サイト)を含む発現カセット(crRNA発現カセット)と、プロモーター、及びそのプロモーターの制御下に配置された「tracrRNA配列を含むRNA」コード配列を含む発現カセット(tracrRNA発現カセット)との組合せが挙げられる。
【0049】
crRNAコード配列挿入用サイトは、任意のcrRNAコード配列を含むポリヌクレオチドの挿入に適した配列を有する限りにおいて特に制限されない。該サイトとしては、例えば1又は複数の制限酵素サイトを含む配列が挙げられる。
【0050】
核酸変異修復酵素としては、レポータータンパク質異常発現カセットにおける異常の原因である核酸変異を修復できる酵素であれば特に制限されないが、後述するバーコード配列認識モジュールとの複合体は、核酸変異部位において1以上のヌクレオチドを他の1以上のヌクレオチドに変換する若しくは欠失させる、又は1以上のヌクレオチドを挿入するものであることが好ましい。核酸変異修復酵素としては、例えば、シチジンデアミナーゼ、アデノシンデアミナーゼ、グアノシンデアミナーゼ等の核酸塩基変換酵素が挙げられる。核酸変異修復酵素の由来は特に制限されないが、例えば、シチジンデアミナーゼであれば、ヤツメウナギ由来の(Petromyzon marinus cytidine deaminase 1)(PmCDA1)、脊椎動物(例、ヒト、ブタ、ウシ、イヌ、チンパンジー等の哺乳動物、ニワトリ等の鳥類、アフリカツメガエル等の両生類、ゼブラフィッシュ、アユ、ブチナマズ等の魚類など)由来のAID(Activation-induced cytidine deaminase; AICDA)を用いることができる。
【0051】
CRISPR-Casシステムを利用する場合の核酸変異修復酵素は、Casタンパク質と直接又は間接的に連結していてもよい。
【0052】
Casタンパク質コード配列は、Casタンパク質のアミノ酸配列をコードする塩基配列である限り特に制限されない。
【0053】
Casタンパク質は、CRISPR/Casシステムにおいて用いられるものであれば特に制限されず、例えばガイドRNAと複合体を形成した状態で標的部位に結合し、該標的部位を切断できるものを各種使用することができる。Casタンパク質としては、各種生物由来のものが知られており、例えばS. pyogenes由来のCas9タンパク質(II型)、S. solfataricus由来のCas9タンパク質(I-A1型)、S. solfataricus由来のCas9タンパク質(I-A2型)、H. walsbyl由来のCas9タンパク質(I-B型)、E. coli由来のCas9タンパク質(I-E型)、E. coli由来のCas9タンパク質(I-F型)、P. aeruginosa由来のCas9タンパク質(I-F型)、S. Thermophilus由来のCas9タンパク質(II-A型)、S. agalactiae由来のCas9タンパク質(II-A型)、S. aureus由来のCas9タンパク質、N. meningitidis由来のCas9タンパク質、T. denticola由来のCas9タンパク質、F. novicida由来のCpf1タンパク質(V型)等が挙げられる。これらの中でも、好ましくはCas9タンパク質が挙げられ、より好ましくはストレプトコッカス属に属する細菌が内在的に有するCas9タンパク質が挙げられる。
【0054】
Casタンパク質は、野生型の2本鎖切断型Casタンパク質であってもよいし、ニッカーゼ型Casタンパク質であってもよい。2本鎖切断型Casタンパク質は、通常、標的鎖の切断に関与するドメイン(RuvCドメイン)及び非標的鎖の切断に関与するドメイン(HNHドメイン)を含む。ニッカーゼ型Casタンパク質としては、例えば2本鎖切断型Casタンパク質のこれら2つのドメインの内のいずれかのドメインにおいて、その切断活性を損なわせる(例えば、その切断活性を1/2、1/5、1/10、1/100、1/1000以下にする)変異を有するタンパク質が挙げられる。Casタンパク質の二本鎖DNAの両方の鎖の切断能が失活したものと、一方の鎖の切断能のみを失活したニッカーゼ活性を有するものの、いずれも使用可能である。このような変異としては、例えばストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9(SpCas9)の場合、nCas及びdCasを用いることができる。本明細書においてnCasは、10番目のAsp残基がAla残基に変換した、ガイドRNAと相補鎖を形成する鎖の反対鎖の切断能を欠くD10A変異体、又は840番目のHis残基がAla残基で変換した、ガイドRNAと相補鎖の切断能を欠くH840A変異体を意味し、dCasはその二重変異体を意味する。nCas及びdCas以外の変異Casも同様に用いることができる。
【0055】
Casタンパク質は、その活性を損なわない限りにおいて、アミノ酸配列の変異(例えば、置換、欠失、挿入、付加等)を有していてもよい。この観点から、Casタンパク質は、野生型2本鎖切断型Casタンパク質、又は該野生型2本鎖切断型Casタンパク質に基づくニッカーゼ型Casタンパク質のアミノ酸配列と、例えば85%以上、好ましくは90%以上、より好ましくは95%以上、さらに好ましくは98%以上の同一性を有するアミノ酸配列からなり、且つその活性(ガイドRNAと複合体を形成した状態で標的部位に結合し、該標的部位を切断する活性)を有するタンパク質であってもよい。或いは、同様の観点から、Casタンパク質は、野生型2本鎖切断型Casタンパク質、又は該野生型2本鎖切断型Casタンパク質に基づくニッカーゼ型Casタンパク質のアミノ酸配列に対して1若しくは複数個(例えば2~100個、好ましくは2~50個、より好ましくは2~20個、さらに好ましくは2~10個、よりさらに好ましくは2~5個、特に好ましくは2個)のアミノ酸が置換、欠失、付加、又は挿入(好ましくは保存的置換)されたアミノ酸配列からなり、且つその活性(ガイドRNAと複合体を形成した状態で標的部位に結合し、該標的部位を切断する活性)を有するタンパク質であってもよい。不活性型のCas9変異体としては、例えば、上述したnCas及びdCas等を用いることができる。
【0056】
Casタンパク質は、公知のタンパク質タグ、シグナル配列、酵素タンパク質等のタンパク質が付加されたものであってもよい。タンパク質タグとしては、例えばビオチン、Hisタグ、FLAGタグ、Haloタグ、MBPタグ、HAタグ、Mycタグ、V5タグ、PAタグ等が挙げられる。シグナル配列としては、例えば核移行シグナル等が挙げられる。酵素タンパク質としては、例えば、各種ヒストン修飾酵素、脱アミノ酵素等が挙げられる。
【0057】
CRISPRを用いたゲノム編集技術として、CRISPR-Cas9以外にも、CRISPR-Cpf1を用いた例が報告されている(Zetsche B., et al., Cell, 163:759-771 (2015))。哺乳動物細胞でのゲノム編集が可能なCpf1としては、Acidaminococcus sp. BV3L6由来のCpf1や、Lachnospiraceae bacterium ND2006由来のCpf1などが挙げられるが、これらに制限されない。また、DNA切断能を欠く変異Cpf1としては、Francisella novicida U112由来のCpf1(FnCpf1)の917番目のAsp残基がAla残基で変換したD917A変異体、1006番目のGlu残基がAla残基で変換したE1006A変異体、1255番目のAsp残基がAla残基で変換したD1255A変異体などが挙げられるが、DNA切断能を欠く変異Cpf1であれば、これらの変異体に制限されることなく、本発明に用いることができる。
【0058】
CRISPR-Casシステムを利用する場合、バーコード配列認識モジュールがガイドRNAであり、核酸変異修復酵素がCasタンパク質と連結しており、ガイドRNAがバーコード配列の少なくとも一部と相補的な配列を含むことが好ましい。このような構成とすることで、ターゲットクローン細胞の単離又は同定する方法を、特異性がより高く(偽陽性がより少ない)、発現効率がより高いものとすることができる。
【0059】
本実施形態のバーコード配列認識モジュール及び核酸変異修復酵素の複合体と、バーコード配列との接触は、目的のバーコード配列を有する細胞に、該複合体又はそれをコードする核酸を導入することにより実施される。したがって、バーコード配列認識モジュール及び核酸変異修復酵素は、細胞へ導入する前に複合体を形成していてもよく、細胞へ導入後細胞内において複合体を形成してもよい。導入及び発現効率を考慮すると、核酸改変酵素複合体自体としてよりも、それをコードする核酸の形態で細胞に導入し、細胞内で該複合体を発現させることが望ましい。
【0060】
したがって、バーコード配列認識モジュールと、核酸変異修復酵素と(さらに場合によっては後述する塩基除去修復の阻害剤と)は、それらの融合タンパク質をコードする核酸として、あるいは、結合ドメインやインテイン等を利用してタンパク質に翻訳後、宿主細胞内で複合体を形成し得るような形態で、それらをそれぞれコードする核酸として調製することが好ましい。ここで核酸は、DNAであってもRNAであってもよい。DNAの場合は、好ましくは二本鎖DNAであり、宿主細胞内で機能的なプロモーターの制御下に配置した発現ベクターの形態で提供される。RNAの場合は、好ましくは一本鎖RNAである。
【0061】
上記核酸改変酵素複合体をコードする核酸が導入される細胞は、原核生物である大腸菌などの細菌や下等真核生物である酵母などの微生物の細胞から、ヒト等の哺乳動物を含む脊椎動物、昆虫、植物など高等真核生物の細胞にいたるまで、あらゆる生物種の細胞をも包含し得る。
【0062】
細胞へ導入する方法については、ステップ(i)と同様に、例えば、発現ベクターを使用した方法等当業者に周知の方法を用いることができる。
【0063】
核酸配列認識モジュール及び/又は核酸塩基変換酵素/又は塩基除去修復の阻害剤をコードするDNAを含む発現ベクターは、例えば、該DNAを適当な発現ベクター中のプロモーターの下流に連結することにより製造することができる。
【0064】
プロモーターとしては、遺伝子の発現に用いる宿主に対応して適切なプロモーターであればいかなるものでもよい。DSBを伴う従来法では毒性のために宿主細胞の生存率が著しく低下する場合があるので、誘導プロモーターを使用して誘導開始までに細胞数を増やしておくことが望ましいが、本発明の核酸改変酵素複合体を発現させても十分な細胞増殖が得られるので、構成プロモーターも制限なく使用することができる。
【0065】
発現ベクターは、所望によりターミネーター、リプレッサー、薬剤耐性遺伝子、栄養要求性相補遺伝子等の選択マーカー、宿主で機能し得る複製起点などを含有することができる。
【0066】
核酸配列認識モジュール及び/又は核酸塩基変換酵素/又は塩基除去修復の阻害剤をコードするRNAは、例えば、上記した核酸配列認識モジュール及び/又は核酸塩基変換酵素をコードするDNAをコードするベクターを鋳型として、自体公知のインビトロ転写系にてmRNAに転写することにより調製することができる。
【0067】
発現ベクターの導入は、宿主の種類に応じ、公知の方法(例えば、リゾチーム法、コンピテント法、PEG法、CaCl2共沈殿法、エレクトロポレーション法、マイクロインジェクション法、パーティクルガン法、リポフェクション法、アグロバクテリウム法など)に従って実施することができる。
【0068】
[ステップ(iii)]
ステップ(iii)は、標的とされたバーコード配列を有する細胞において、上記少なくとも一つのレポータータンパク質異常発現カセットにおける異常発現の原因である核酸変異を、上記バーコード配列認識モジュールと上記核酸変異修復酵素の複合体の発現により修復し、それにより上記レポータータンパク質を正常に発現させるステップである。
【0069】
バーコード配列認識モジュールと核酸変異修復酵素との複合体が細胞内で発現すると、該バーコード配列認識モジュールが目的の二本鎖DNA内の標的となるバーコード配列を特異的に認識して結合し、該バーコード配列認識モジュールに連結した核酸変異修復酵素の作用により、異常発現の原因である核酸変異が修復される。例えば、核酸変異修復酵素が、核酸塩基変換酵素である場合には、バーコード配列認識モジュールに連結した核酸塩基変換酵素の作用により、核酸変異部位(核酸変異全体もしくは一部又はそれらの近傍)のセンス鎖もしくはアンチセンス鎖で塩基変換が起こり、二本鎖DNA内にミスマッチが生じる。このミスマッチが正しく修復されずに、反対鎖の塩基が、変換した鎖の塩基と対形成するように修復されたり、修復の際にさらに他のヌクレオチドに置換、あるいは1ないし数十塩基の欠失もしくは挿入を生じたりすることにより、種々の変異が導入される。レポータータンパク質の開始コドンATGのAがGに変換されたレポータータンパク質異常発現カセットを使用し、CRISPR/Casシステムを利用した具体例を以下説明する。ガイドRNAとシチジンデアミナーゼの複合体が発現すると、ガイドRNAが標的のバーコード配列を認識することで、Cas9の作用によりに二本鎖が解け、そこにシチジンデアミナーゼが作用することで、シトシンがウラシルに変換する。生成されたミスマッチ配列は、修復機構により対応する配列に変換され、C→U(T)という一塩基変換が達成される。これにより、異常発現の原因であるATGにおけるGへの変異がAに修復(野生型へ修正)され、レポータータンパク質を正常に発現可能となる。
【0070】
上記核酸変異修復酵素により修復のために導入した核酸変異が、グリコシラーゼ等による塩基除去修復(BER)機構によって分解されてしまう場合がある。したがって、そのような塩基除去修復機構を阻害することが好ましい。BERの阻害は、上述のBERの阻害剤又はそれをコードする核酸を導入すること、又はBERを阻害する低分子化合物を導入することにより行うことができる。あるいは、BER経路に関与する遺伝子の発現を抑制することにより、細胞のBERを阻害することができる。遺伝子の発現の抑制は、例えば、BER経路に関与する遺伝子の発現を特異的に抑制し得るsiRNA、アンチセンス核酸、又はこれらのポリヌクレオチドを発現し得る発現ベクターを細胞に導入することにより行うことができる。または、BER経路に関与する遺伝子のノックアウトにより、遺伝子の発現を抑制することができる。
【0071】
BERを阻害する方法としては、例えば、BERの阻害剤又はそれをコードする核酸をステップ(ii)において、バーコード配列認識モジュールと核酸変異修復酵素とともに細胞に導入することが挙げられる。塩基除去修復の阻害剤としては、結果的にBERを阻害するものであれば特に制限はないが、効率の観点からは、BER経路の上流に位置するDNAグリコシラーゼの阻害剤が好ましい。DNAグリコシラーゼの阻害剤としては、例えば、チミンDNAグリコシラーゼの阻害剤、ウラシルDNAグリコシラーゼの阻害剤、オキソグアニンDNAグリコシラーゼの阻害剤、アルキルグアニンDNAグリコシラーゼの阻害剤などが挙げられる。例えば、核酸塩基変換酵素としてシチジンデアミナーゼ(例えば、PmCDA1)を用いる場合には、変異により生じたDNAのU:G又はG:Uミスマッチの修復を阻害するため、ウラシルDNAグリコシラーゼの阻害剤を使用することが好ましい。
【0072】
そのようなウラシルDNAグリコシラーゼの阻害剤としては、枯草菌(Bacillus subtilis)バクテリオファージであるPBS1由来のウラシルDNAグリコシラーゼ阻害剤(Ugi)又は枯草菌バクテリオファージであるPBS2由来のウラシルDNAグリコシラーゼ阻害剤(Ugi)が挙げられるが(Wang, Z., and Mosbaugh, D. W. (1988) J. Bacteriol. 170, 1082-1091)、これらに制限されない。上記DNAのミスマッチの修復阻害剤であれば、本発明に用いることができる。特に、PBS2由来のUgiは、DNA上のC からT以外の変異や切断、及び組み換えを起こさせにくくするとの効果も知られていることから、PBS2由来のUgiを使用することがより好ましい。
【0073】
上述のように、塩基除去修復(BER)機構において、DNAグリコシラーゼによって塩基が除去されると、APエンドヌクレアーゼが無塩基部位(AP部位)にニックを入れ、さらにエキソヌクレアーゼによってAP部位は完全に除去される。AP部位が除去されると、DNAポリメラーゼが反対鎖の塩基を鋳型に新しく塩基を作り、最後にDNAリガーゼがニックを埋めて修復が完了する。酵素活性を失っているがAP部位への結合能を保持している変異APエンドヌクレアーゼは、競合的にBERを阻害することが知られている。従って、これらの変異APエンドヌクレアーゼも、本発明の塩基除去修復の阻害剤として用いることができる。変異APエンドヌクレアーゼの由来は特に制限されないが、例えば、大腸菌、酵母、哺乳動物(例、ヒト、マウス、ブタ、ウシ、ウマ、サル等)など由来のAPエンドヌクレアーゼを用いることができる。酵素活性を失っているがAP部位への結合能を保持している変異APエンドヌクレアーゼの例としては、活性サイトや補因子であるMg結合サイトが変異したタンパク質が挙げられる。例えば、ヒトApe1の場合、E96Q、Y171A、Y171F、Y171H、D210N、D210A、N212A等が挙げられる。
【0074】
上述したバーコード配列認識モジュールが細胞に導入する前に核酸変異修復酵素と複合体を形成する場合には、上記核酸変異修復酵素及び/又は塩基除去修復の阻害剤との融合タンパク質として提供することもできるし、あるいは、SH3ドメイン、PDZドメイン、GKドメイン、GBドメイン等のタンパク質結合ドメインとそれらの結合パートナーとを、バーコード配列認識モジュールと、核酸塩基変換酵素及び/又は塩基除去修復のインヒビターとにそれぞれ融合させ、該ドメインとその結合パートナーとの相互作用を介してタンパク質複合体として提供してもよい。あるいは、核酸配列認識モジュールと、核酸変異修復酵素及び/又は塩基除去修復のインヒビターとにそれぞれインテイン(intein)を融合させ、各タンパク質合成後のライゲーションにより、両者を連結することもできる。
【0075】
[ステップ(iv)]
ステップ(iv)は、上記レポータータンパク質が発現したターゲットクローン細胞を単離又は同定するステップである。
【0076】
ターゲットクローン細胞を単離又は同定する方法は、特に制限されず、レポータータンパク質の種類等に基づき、当業者に周知の方法を適宜用いることができるが、例えば、レポータータンパク質が蛍光タンパク質の場合、フローサイトメーターを使用したセルソーティングにより、選択されたプールから細胞クローンを単離すること、レポータータンパク質が薬剤耐性遺伝子の場合、薬剤投与によりマーカー遺伝子の発現に基づいて細胞クローンを単離すること及び細胞を低密度で播種し、単一コロニー形成させて単離すること等が挙げられる。ここで単離されるターゲットクローン細胞は細胞群である必要はなく単一の細胞でもよい。
【0077】
一実施形態に係る細胞集団は、バーコード配列とそれに連結した少なくとも一つのレポータータンパク質異常発現カセットが、個々の細胞に導入されていることを特徴とするものである。バーコード配列とそれに連結した少なくとも一つのレポータータンパク質異常発現カセット、細胞の種類、細胞への導入方法等については、上述したとおりである。
【0078】
少なくとも一つのレポータータンパク質異常発現カセットにおける核酸変異が、N末端から最初に現れるメチオニンをコードする配列(ATG)における変異であることが好ましい。また、バーコード配列に開始コドンに対応する配列が含まれないことが好ましい。また、細胞集団が、任意のバーコードを標的とする核酸配列認識モジュールと核酸変異修復酵素とが結合した複合体を含むことが好ましい。
【実施例】
【0079】
[実施例で使用したプラスミド]
以下の実施例で使用したプラスミドの一部を表1に示す。
【0080】
【0081】
表1のプラスミドは、いずれもBenchling(Benchling社製)に登録されたデータに基づき設計された。
【0082】
[実施例1 酵母細胞における実証実験(1)]
<レポーター発現・異常発現ベクター>
レポーター異常発現ベクターとして、以下のRFPベクターを構築した。
5’ ADH1 promoter-PAM-barcode-9thGTG-RFP-ADH1 terminator 3’(配列番号4)
9thRFPは、RFPのアミノ酸配列において9番目に出現するメチオニンを開始コドンとして用い、それより上流(N末端側)の配列を削除した通常より短いORFをもつRFPを意味し、9thGTG-RFPは、上記9thRFPにおける開始コドンであるメチオニンをコードするATGをGTGに変換した変異体であることを意味する。バーコード配列(barcode)として、(WSNS)4Nで表されるランダムDNAバーコードから5’ AGCGTGTCAGGGTGACC 3’(配列番号9)を使用した。
【0083】
上記9thRFPにおける開始コドンであるメチオニンに変異を加えないこと以外は同様に、レポーター発現ベクターと同様であるレポーター発現ベクターを構築した(「9thATG-RFP」とも表す)、配列番号5)。
【0084】
<Cas9タンパク質-核酸変異修復酵素発現ベクター(Target-AID)>
Cas9タンパク質-核酸変異修復酵素発現ベクターとして、5’ADH1 promoter-Cas9 variant(-PmCDA1-UGI)-CYC1 terminator 3’から構成されるベクターを使用した(配列番号2)。ネガティブコントロールとしては、5’ADH1 promoter-dCas9-CYC1 terminator 3’(配列番号1)を使用した。
【0085】
<バーコード配列認識モジュール(ガイドRNA)発現ベクター>
バーコード配列認識モジュール(ガイドRNA)発現ベクター(Target sgRNA、配列番号7)を以下のように構築した。
5’ SNR52 promoter-filler-sgRNA scaffold-SUP4 terminator 3’から構成されるベクター(配列番号6)をバックボーンとして使用した。上記バックボーンからfiller配列を除去し、その代わりとしてバーコード配列に対応するスペーサー配列(バーコード認識領域、5’ CACGGTCACCCTGACACGCT 3’(配列番号10))をインサートした。
【0086】
目的の配列を標的としないネガティブコントロールとしては、5’ SNR52 promoter-CTGAAAAAGGAAGGAGTTGA-sgRNA scaffold-SUP4 terminator 3’から構成されるベクター(Scrambled sgRNA、配列番号8)を使用した。
【0087】
<酵母の形質転換>
酵母は、酵母ツーハイブリッド用のY8800株を使用した。市販のキット(Frozen-EZ Yeast Transformation IITM, ZYMO RESEARCH社)を用いて、上述したベクターを形質転換した。寒天培地はSD-His-Leu-Ura+Adeを用い、植菌後48時間から72時間程度30℃で培養してコロニーを得た。以下表2に、実施例にて使用した選択寒天培地の組成を示す。
【0088】
【0089】
<RFP発現の確認>
酵母のコロニーを表3に示す選択液体培地でコロニーを直接懸濁あるいは5時間以上培養した後、上清を除き、2μL程度の菌体をスライドグラスに載せ、カバーグラスで固定し、蛍光顕微鏡(BZ-X710,KEYENCE社)を用い細胞観察を行った。結果を
図1に示す。また、マイクロプレートリーダー(インフィニットF200 Pro-FL/T、TECAN社)を用いてRFPの蛍光強度を測定した結果を
図2に示す。Target sgRNA及びdCas9-AID-UGIを用いた場合において、一部RFP蛍光が確認された。これは、核酸変異修復酵素であるPmCDA1による一塩基ゲノム編集によって、開始コドンが修正によるものであると考えられた。なお、酵母としてBY4741株を用いた場合にも同様の結果が得られた。上記方法は、細胞の単離法のレポーターシステムとして有用である可能性が示唆された。
【表3】
【表4】
【0090】
[実施例2 ヒト細胞における実証実験]
<レポーター異常発現ベクター>
レンチウィルスベクターpLVSIN-CMV-Puro(Takara)に、(WSNS)4Nで表されるランダムDNAから任意のバーコード配列が付与された変異EGFP(pLV-eGFPから配列を取得し、開始コドンをコードするATGをGTGに変換させたもの)をそれぞれPCR法により増幅し、クローニングした。
【0091】
<細胞ゲノムへのレポーターの配置>
上記レポーター異常発現ベクターを二つのヘルパープラスミドpMD2.G(https://www.addgene.org/12259/(配列番号11)及びpsPAX2(https://www.addgene.org/12260/(配列番号12))とともにHEK293Ta細胞へトランスフェクションし、レンチウィルスを産生させた。レンチウィルス粒子を回収後、このウィルスをHEK293Ta細胞に感染させ、ピューロマイシン選択により本レポーターがゲノムに組み込まれた細胞株を得た(
図3 バーコード化された293Ta細胞)。
【0092】
<CloneSelectレポーターシステムの機能性に関する実証実験>
これと同時に、レポーター異常発現ベクター(pLV-CS-110(lenti-T002-GTG-EGFP)、配列番号13)の構築に使用したランダムDNAバーコード配列群のうち、T002バーコード配列(AACTATAACATCATTTCGTG、配列番号14)を標的とするガイドRNA(On-target gRNA、配列番号15)(pLV-CS-076(lentiGuide-T002))、並びにT002バーコード配列を標的としないネガティブコントロールガイドRNA(Off-target gRNA、配列番号16)(pLV-CS-077(lentiGuide-Scramble1)を得た。前記細胞株に対し、前記Cas9タンパク質-核酸変異修復酵素発現ベクター(Target-AID、CMVp-Sp_nCas9-PmCDA1-UGI、配列番号17)(pcDNA3.1_pCMV-nCas-PmCDA1-ugi pH1-gRNA(HPRT))並びに前記ガイドRNA発現ベクターをトランスフェクションし、3日後にフローサイトメーターFACS Verse(BD Biosciences社製)によりGFP陽性細胞の割合を解析した。
【0093】
その結果、Target-AID及びOn-target gRNAを用いた場合に、およそ5%程度の集団においてGFP蛍光が確認された(
図4)。一方、off-targetガイドRNAを用いた場合では、GFP陽性細胞の割合は0.09%以下と非常に低いことが明らかとなった。したがって、検出されたGFP蛍光は一塩基ゲノム編集による開始コドンの修正によるものと考えられた。上記方法は、細胞の単離法のレポーターシステムとして有用である可能性が示唆された。
【0094】
[実施例3 開始コドンの変換効率]
実施例2に記載の方法で、レンチウィルスの標的細胞への感染効率を10%以下となるようにコントロールし、平均で1コピーのバーコードが各ゲノム組み込まれることに想定し、レポータープラスミドをHEK293Ta細胞へ配置した。これにより、およそ100種類程度のバーコード化されたレポーターGFPをゲノムに有するヒト培養細胞(HEK293Ta)を調製することができた。
【0095】
前記Cas9タンパク質-核酸変異修復酵素発現ベクター(CMVp-Sp_nCas9-PmCDA1-UGI)並びに13種類のバーコード(表5参照)を標的とするガイドRNA発現ベクターをそれぞれトランスフェクションし、3日後にフローサイトメーターFACS Jazz(BD Biosciences社製)を用いてGFP陽性細胞をソーティングした。
【0096】
【0097】
GFP陽性細胞について、そのバーコード領域をPCR増幅し、次世代シーケンサーのライブラリを調製した。次世代シーケンサーのライブラリは、MiSeq(Illumina)による600サイクルのペアエンドモードでシーケンスされた。得られたシーケンスデータは、各サンプル特異的なインデックス配列をもとに分類され、各実験に用いたガイドRNA毎にGTGからATGに変換された割合が計算された(
図5)。
【0098】
その結果、多くのバーコードにおいて、GTGがATGへ80%以上の効率で変換されていることが明らかとなった。
【0099】
GTGが開始コドンへと高効率に塩基置換されることで変異EGFPにおける変異が修復され、EGFPレポーターが野生型(正常な活性が持続)へと変換された結果であることが明らかとなった。
【0100】
[実施例4 異なるレポーターシステムとの特異性と効率に関する定量的評価]
<CRISPR activation, CRISPRa>
dCas9(不活性型のCas9変異体)に転写因子が融合された複合体を用いることで、バーコード依存的に下流のマーカー遺伝子を転写レベルで活性化できると考えられる。そのため、CRISPRaレポーター又はガイドRNA(gRNA)によっても細胞集団のバーコード化は可能である。そこで、ATGをGTGに変換したレポーターを使用する方法による特異性を、CRISPRaレポーターを使用する方法及びガイドRNAを使用する方法の特異性と比較した。
【0101】
具体的には、同一のバーコード配列2種類、BC4(AGTCTGTCTCTCACAGCGTG(配列番号31))とBC6(AGTCTGGCAGTCACTGGGTG(配列番号32))を準備し、下記の3つの異なるシステムを比較検討した。
(1)GTG-EGFPレポーターをゲノムに持つ細胞株に対する、Cas9タンパク質-核酸変異修復酵素発現ベクター(CMVp-Sp_nCas9-PmCDA1-UGI)並びにバーコードを標的とするガイドRNAによる一塩基置換を介した発現誘導(GTG-GFPバーコードシステム);
(2)CRISPRaレポーターをゲノムに持つ細胞株に対する(バーコード配列をCRISPRaレポーターにクローニングし、HEK293Ta細胞へレンチウィルスで感染させ、ピューロマイシン又はブラストサイジン選択より細胞株を樹立)、gRNA-dCas9-転写因子複合体による発現誘導(CRISPRaバーコードシステム);
(3)ガイドRNAをゲノムに持つ細胞株に対し(バーコード配列をCRISPRa用のガイドRNAにクローニングし、HEK293Ta細胞へレンチウィルスで感染させ、ピューロマイシン又はブラストサイジン選択より細胞株を樹立)、CRISPRaレポーターをそのあと細胞へトランスフェクションすることによる発現誘導(gRNAバーコードシステム);
【0102】
3日後に細胞を回収し、FACS Verse (BD Biosciences社製)によりGFPの陽性細胞の割合を解析した。縦軸にFSC-A(細胞の大きさを示す)、及び横軸にFITC(GFP強度を示す)して、2つのパラメーターを同時に表示するドットプロットを作成した(
図6)。横軸の10
2より右側のエリアはGFP陽性であるとみなし、陽性細胞をFITC(GFP強度)により示した。
【0103】
(2)及び(3)の方法では、発現が誘導される組み合わせ(
図6中の「On-target」と記載されている組み合わせ)とそれ以外の組み合わせにおけるGFP強度にあまり差が見られなかったのに対し、GTG-GFPバーコードシステムにおいては、発現が誘導される組み合わせにおいて顕著なGFP強度が認められ、GTG-GFPバーコードシステムの特異性が高いことが示された(
図6)。
【0104】
また、フローサイトメトリーによるGFPの発現誘導の効率とそれに伴う偽陽性を適切に比較検討するため、それぞれ3つのシステムにおいてFITC(GFP)のゲートの閾値を連続的に変化させ、それぞれの閾値におけるGFP陽性細胞の割合(% 活性化)と偽陽性(% エラー)を解析し、比較した。
【0105】
その結果、GTG-GFPバーコードシステムでは、3%から25%のGFP陽性細胞の分画において偽陽性が検出されなかった(
図7)。一方、CRISPRaを用いた2つの転写誘導型のシステムでは5%から20%程度の偽陽性が観察された。
【0106】
本発明を用いたレポーターの発現誘導システムは、効率及び偽陽性の二面において、優れた性能を有することが示唆された。
【0107】
[実施例5 酵母細胞における実証実験(2)]
<レポーター異常発現ベクター>
5’ ADH1 promoter-BsmBI-filler-BsmBI-9thRFP-ADH1 terminator 3’から構成されるベクター(配列番号3)をBsmBI(NEW ENGLAND BioLab社)で制限酵素処理し(55℃、1時間以上)、精製したものをバックボーンとして使用した。
【0108】
インサートとして、配列が5’ BsmBI-PAM-barcode-GTG 3’及び5’ BsmBI-GTG-barcode-PAM 5’となるオリゴをデザインした。バーコード配列は(WSNS)4Nで表わされるセミランダムバーコードから成る。インサートはプライマー1(5’ ACTGACTGCAGTCTGAGTCTGACAG 3’)(配列番号33)とプライマー2(5’ CTAGCGTAGAGTGCGTAGCTCTGCT 3’)(配列番号34)を用いPCRにより増幅された。
【0109】
バックボーンベクターとインサートは1:10の割合で混合され、Golden Gate法(37℃で5分、20℃で5分のサイクルを合計15回繰り返した後に55℃で30分)で反応させた。反応後のサンプルは大腸菌(NEB 5α)に形質転換された。
【0110】
得られたシングルコロニー100個分を培養プレートからかき集め、抽出キット(日本ジェネティクス社)を使用してプラスミド抽出し、セミランダムDNAバーコードが挿入された目的のDNAバーコードプールを得た。精製後のDNAバーコードプールの配列を制限酵素処理及び次世代シーケンサーにより確認した。
【0111】
【0112】
<Cas変異体-核酸変異修復酵素発現ベクター>
Cas9変異体-核酸変異修復酵素発現ベクターとして5’ ADH1 promotern-nCas9-PmCDA1-UGI-CYC1 terminator 3’から構成されるベクターを使用した(表6参照、配列番号35)。
<バーコード認識モジュール(ガイドRNA)発現ベクター>
【0113】
バーコード認識モジュール(ガイドRNA)発現ベクター(sgRNA)を以下のように構築した。
5’ SNR52 promoter-BsmBI-filler-BsmBI-sgRNA scaffold-SUP4 terminator 3’から構成されるベクター(配列番号6)をBsmBI(NEW ENGLAND BioLab社)で制限酵素処理し(55℃, 1時間以上)、精製したものをバックボーンとして使用した。インサートとして、配列が5’ BsmBI-PAM-barcode-GTG 3’及び5’ BsmBI-GTG-barcode-PAM 5’となるオリゴ対をデザインし、T4ポリヌクレオチドキナーゼ(タカラバイオ社)によるリン酸化とアニーリングを同時に行なうことにより、突出末端のBsmBI切断面を有するDNA断片を得た(アニーリングは37℃で30分、95℃で5分の反応ののち、95℃から25℃になるまで12秒の反応を1サイクルごとに1℃ずつ温度を低下させる工程を合計70回繰り返した)。バーコード認識配列(バーコード認識領域)は(WSNS)4Nで表わされるセミランダムDNAバーコード配列に対応し、DNAバーコードプールの次世代シーケンサーでの配列解析結果から、任意のsgRNAのバーコード認識配列を決めた。バックボーンベクターとインサートは1:10の割合で混合され、Golden Gate法(37℃で5分、20℃で5分を合計15回繰り返したのちに55℃で30分)で反応させた。反応後のサンプルは大腸菌(NEB 5α)に形質転換され、コロニーを培養・プラスミド抽出(日本ジェネティクス社抽出キットを使用)してそれぞれ12種類の目的のベクターを得た。精製後のベクターはサンガーシーケンシング法により配列を確認した。上記12種類のベクターにそれぞれ含まれるバーコード認識配列を表7に示す。
【0114】
【0115】
<酵母の形質転換>
酵母は、出芽酵母の標準株であるBY4741株を使用した。市販のキット(Frozen-EZ Yeast Transformation IITM, ZYMO RESEARCH社)を用いた。
【0116】
まず、DNAバーコードプールをBY4741株に形質転換した。寒天培地はSD-His+Adeを用い、植菌後48時間から72時間程度30℃で培養してコロニーを得た。得られたコロニーを培養プレートからかき集めて、コンピテントセルを調製し(Frozen-EZ Yeast Transformation IITM, ZYMO RESEARCH社)、Cas9変異体(nCas9-AID-UGI,配列番号35)とsgRNAのベクター(配列番号36~47のバーコード認識配列をそれぞれ含む12種類の各ベクター)をそれぞれ用いて形質転換した。寒天培地はSD-His-Leu-Ura+Adeを用い、植菌後48時間から72時間程度30℃で培養してコロニーを得た。なお、培養プレートからかき集めたコロニーは、次世代シーケンサーによりそのバーコード配列を確認済みである。
【0117】
<RFP発現の確認>
Cas9変異体とsgRNAを形質転換したのちに得られた酵母コロニーのプレートをゲル撮影装置に内蔵されたブルーライト(FAS-V,日本ジェネティクス社)で照射し、赤く光る(RFP発現が期待される)コロニーをサンプリングした。RFP発現が期待されるものとしてサンプリングされたコロニーの例示を
図8に示す。左は配列番号42のバーコード認識配列を含むsgRNA(sgRNA_BC7)を用いた場合、右は配列番号43のバーコード認識配列を含むsgRNA(sgRNA_BC8)を用いた場合の結果を示す。
【0118】
<濁度測定及び蛍光(RFP)強度測定>
ブルーライト照射によりサンプリングされたRFP発現コロニーのスクリーニング(コロニーの突き間違いの確認)のため、酵母コロニーサンプルの濁度及び蛍光強度の測定を行なった。測定にはマイクロプレートリーダー(インフィニットF200PRO,TECAN社)を使用した。酵母コロニーを選択液体培地(SD-His-Leu-Ura+Ade)で培養あるいは懸濁した後、必要に応じて培養液を希釈し、96穴プレート(透明)にサンプルを200μL添加して濁度を測定した。同様にして、96穴プレート(黒色,不透明)にサンプルを200μL添加して蛍光強度を測定した。濁度及び蛍光強度の測定の結果、目的のコロニーをサンプリングできたことが確認された。
【0119】
<サンプリングされたコロニーの配列の確認>
サンプリングされた目的のコロニーにおけるバーコード配列付近の配列を、サンガーシーケンシング法によりにより確認した。その結果、バーコード配列下流の9
thRFPにおけるGTGが開始コドンへ変換され、変異が修復されていることが確認された(
図9)。
【0120】
[実施例6 バーコードシグナルの検証]
細胞集団から任意の細胞を単離又は同定するためには、1コロニーにおいて単一のバーコードシグナルが観察されることが好ましい。そこで、以下のように、Cas9タンパク質-核酸変異修復酵素発現ベクターを形質転換したのちにレポーター発現ベクターを形質転換した場合(Method A)と、レポーター発現ベクターを形質転換したのちにCas9タンパク質-核酸変異修復酵素発現ベクターを形質転換した場合(Method B)におけるバーコードシグナルの比較を行った。
【0121】
<レポーター異常発現ベクター>
5’ ADH1 promoter-BsmBI-filler-BsmBI-9thRFP-ADH1 terminator 3’から構成されるベクター(配列番号3)をBsmBI(NEW ENGLAND BioLab社)で制限酵素処理し(55℃、1時間以上)、精製したものをバックボーンとして使用した。
【0122】
インサートとして、配列が5’ BsmBI-PAM-barcode-GTG 3’及び5’ BsmBI-GTG-barcode-PAM 5’となるオリゴをデザインした。バーコード配列は(WSNS)4Nで表わされるセミランダムバーコードから成る。インサートはプライマー1(5’ ACTGACTGCAGTCTGAGTCTGACAG 3’)(配列番号33)とプライマー2(5’ CTAGCGTAGAGTGCGTAGCTCTGCT 3’)(配列番号34)を用いPCRにより増幅された。
【0123】
バックボーンベクターとインサートは1:10の割合で混合され、Golden Gate法(37℃で5分、20℃で5分のサイクルを合計15回繰り返した後に55℃で30分)で反応させた。反応後のサンプルは大腸菌(NEB 5α)に形質転換された。
【0124】
得られたシングルコロニー約4万個分を培養プレートからかき集め、抽出キット(日本ジェネティクス社)を使用してプラスミド抽出し、セミランダムDNAバーコードが挿入された目的のDNAバーコードプールを得た。精製後のDNAバーコードプールの配列を制限酵素処理及び次世代シーケンサーにより確認した。
【0125】
<Cas変異体-核酸変異修復酵素発現ベクター>
Cas9変異体-核酸変異修復酵素発現ベクターとして5’ ADH1 promotern-nCas9-PmCDA1-UGI-CYC1 terminator 3’から構成されるベクターを使用した(表6参照、配列番号35)。
【0126】
<酵母の形質転換>
酵母は、出芽酵母の標準株であるBY4741株を使用した。市販のキット(Frozen-EZ Yeast Transformation IITM, ZYMO RESEARCH社)を用いて、上述したベクターを形質転換した。
【0127】
(以下 Method Aに相当する実験)
第一段階として、Cas9タンパク質-核酸変異修復酵素発現ベクター(Target-AID)を形質転換した。寒天培地はSD-Leu+Adeを用い、植菌後48時間から72時間程度30℃で培養してコロニーを得た。
第一段階で得られたコロニーからコンピテントセルを調製した。調製には市販のキット(Frozen-EZ Yeast Transformation IITM, ZYMO RESEARCH社)を使用した。
【0128】
前述のコンピテントセルを用い、第二段階として、レポーター発現ベクターを形質転換した。寒天培地はSD-His-Leu+Adeを用い、植菌後48時間から72時間程度30℃で培養してコロニーを得た。
【0129】
(以下 Method Bに相当する実験)
第一段階として、レポーター発現ベクターを形質転換した。寒天培地はSD-His+Adeを用い、植菌後48時間から72時間程度30℃で培養してコロニーを得た。
【0130】
第一段階で得られたコロニーからコンピテントセルを調製した。調製には市販のキット(Frozen-EZ Yeast Transformation IITM, ZYMO RESEARCH社)を使用した。
【0131】
前述のコンピテントセルを用い、第二段階として、Cas9タンパク質-核酸変異修復酵素発現ベクター(Target-AID)を形質転換した。寒天培地はSD-His-Leu+Adeを用い、植菌後48時間から72時間程度30℃で培養してコロニーを得た。
【0132】
<サンプリングされたコロニーの配列の確認>
サンプリングされたシングルコロニーにおけるバーコード配列付近の配列を、サンガーシーケンシング法によりにより確認した。その結果、Cas9タンパク質-核酸変異修復酵素発現ベクター(Target-AID)を形質転換したのちにレポーター発現ベクターを形質転換したサンプル(Method A)においては、複数のバーコードシグナルが混じった配列が確認された。一方、レポーター発現ベクターを形質転換したのちにCas9タンパク質-核酸変異修復酵素発現ベクター(Target-AID)を形質転換したサンプル(Method B)においては、それぞれのサンプルから単一のバーコード配列が確認され、1コロニーが単一のプラスミド(バーコード)を保持していることが示された。なお、Method Aの順番で形質転換をした場合には、プラスミドプールを酵母へ形質転換する際のDNA濃度、使用する酵母株、バーコードの複雑性及び液体培地における培養時間を変化させても、1コロニーに複数のバーコードが保持させる結果は変わらなかった。
【産業上の利用可能性】
【0133】
さらに、本発明によりターゲットクローン細胞を単離又は同定し、各々の細胞を標識する固有のバーコード配列を特定できれば、マーカー遺伝子等が自明でない未知の細胞クローンを不均質性の高い細胞集団からマーカーフリーで単離・解析することが可能になる。この多用途性から、今後さらに展開、発展が予想されるシングルセルのトランスクリプトーム解析、エピゲノム解析とは親和性が高い。
【配列表】