(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-02-21
(54)【発明の名称】バクテロイデスにおけるゲノム編集
(51)【国際特許分類】
C12N 15/31 20060101AFI20230214BHJP
C12N 15/09 20060101ALI20230214BHJP
C12N 15/55 20060101ALI20230214BHJP
C12N 9/14 20060101ALI20230214BHJP
C12N 9/78 20060101ALI20230214BHJP
C12N 15/115 20100101ALI20230214BHJP
C12N 15/63 20060101ALN20230214BHJP
C12N 1/20 20060101ALN20230214BHJP
【FI】
C12N15/31 ZNA
C12N15/09 110
C12N15/55
C12N9/14
C12N9/78
C12N15/115 Z
C12N15/63 Z
C12N1/20 Z
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022537104
(86)(22)【出願日】2020-12-17
(85)【翻訳文提出日】2022-08-16
(86)【国際出願番号】 US2020065654
(87)【国際公開番号】W WO2021127209
(87)【国際公開日】2021-06-24
(32)【優先日】2019-12-17
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】311016949
【氏名又は名称】シグマ-アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニー
【氏名又は名称原語表記】Sigma-Aldrich Co. LLC
(74)【代理人】
【識別番号】100145403
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100122301
【氏名又は名称】冨田 憲史
(74)【代理人】
【識別番号】100157956
【氏名又は名称】稲井 史生
(74)【代理人】
【識別番号】100170520
【氏名又は名称】笹倉 真奈美
(72)【発明者】
【氏名】イーストランド,エリック
(72)【発明者】
【氏名】ジャン,ジーガン
(72)【発明者】
【氏名】デイビス,グレゴリー ディ
【テーマコード(参考)】
4B050
4B065
【Fターム(参考)】
4B050CC03
4B050DD02
4B050LL01
4B065AA01X
4B065AA01Y
4B065AB01
4B065BA02
4B065CA44
4B065CA60
(57)【要約】
本明細書において、バクテロイデス種のゲノム編集のための組成物および方法が提供される。RNA誘導核酸塩基修飾系は、標的細菌細胞の染色体DNAにおける特定の遺伝子座を標的とするように操作され、ここで標的細菌細胞のゲノムが修飾されることができる。
【選択図】
図1
【特許請求の範囲】
【請求項1】
細菌細胞の染色体に関連する操作されたRNA誘導核酸塩基修飾系を含むタンパク質-核酸複合体であって、ここで操作されたRNA誘導核酸塩基修飾系は、細菌細胞の染色体中の特定の遺伝子座を標的とし、細菌細胞の染色体は、配列番号1に対して少なくとも50%の配列同一性を有するアミノ酸配列を含むHUファミリーDNA結合タンパク質をコードする、タンパク質-核酸複合体。
【請求項2】
操作されたRNA誘導核酸塩基修飾系が、(i)CRISPRタンパク質およびガイドRNA(gRNA)を含むCRISPR系、および(ii)核酸塩基修飾酵素またはその触媒ドメインを含み、CRISPRタンパク質が、ヌクレアーゼ欠損変異体またはニッカーゼである、請求項1に記載のタンパク質-核酸複合体。
【請求項3】
CRISPR系が、I型CRISPR系、II型CRISPR系、III型CRISPR系、IV型CRISPR系、V型CRISPR系、またはVI型CRISPR系である、請求項2に記載のタンパク質-核酸複合体。
【請求項4】
CRISPRタンパク質が、Cas9、Cas12、Cas13、Cas14、またはCasXである、請求項2または3に記載のタンパク質-核酸複合体。
【請求項5】
gRNAが、CRISPR RNA(crRNA)およびトランス作用性crRNA(tracrRNA)を含む二重分子gRNAである、請求項2-4のいずれか一項に記載のタンパク質-核酸複合体。
【請求項6】
gRNAが、CRISPR RNA(crRNA)およびトランス作用性crRNA(tracrRNA)の融合ハイブリッドを含む単一分子gRNAである、請求項2-4のいずれか一項に記載のタンパク質-核酸複合体。
【請求項7】
核酸塩基修飾酵素またはその触媒ドメインが、シチジンデアミナーゼ1(CDA1)、シチジンデアミナーゼ2(CDA2)、活性化誘導シチジンデアミナーゼ(AICDA)、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーシチジンデアミナーゼ、APOBEC1相補因子/APOBEC1刺激因子(ACF1/ASF)シチジンデアミナーゼ、RNAに作用するシトシンデアミナーゼ(CDAR)、tRNAに作用するシトシンデアミナーゼ(CDAT)、tRNAアデニンデアミナーゼ、アデノシンデアミナーゼ、RNAに作用するアデノシンデアミナーゼ(ADAR)、またはtRNAに作用するアデノシンデアミナーゼ(ADAT)から選択される、請求項2-6のいずれか一項に記載のタンパク質-核酸複合体。
【請求項8】
核酸塩基修飾酵素またはその触媒ドメインが、シチジンデアミナーゼまたはその触媒ドメインであり、操作されたRNA誘導核酸塩基修飾系が、少なくとも1つのウラシルグリコシラーゼ阻害剤ドメインをさらに含む、請求項2-7のいずれか一項に記載のタンパク質-核酸複合体。
【請求項9】
CRISPRタンパク質が、核酸塩基修飾酵素またはその触媒ドメインに直接またはリンカーを介して連結されている、請求項2-8のいずれか一項に記載のタンパク質-核酸複合体。
【請求項10】
核酸塩基修飾酵素またはその触媒ドメインが、アダプタータンパク質に直接またはリンカーを介して連結され、CRISPRタンパク質またはgRNAが、アダプタータンパク質に結合することができるアプタマー配列を含む、請求項2-8のいずれか一項に記載のタンパク質-核酸複合体。
【請求項11】
アプタマー配列が、MS2/MSP、PP7/PCP、Com、N22、AP205、BZ13、F1、F2、fd、fr、GA、ID2、JP34、JP500、JP501、KU1、M11、M12、MX1、NL95、PRR1、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、Qβ、R17、SP、TW18、TW19、VK、または7sから選択される、請求項10に記載のタンパク質-核酸複合体。
【請求項12】
操作されたRNA誘導核酸塩基修飾系が、シチジンデアミナーゼまたはその触媒ドメインに連結されたヌクレアーゼ欠損Cas9またはCas12a変異体を含む、請求項2-11のいずれか一項記載のタンパク質-核酸複合体。
【請求項13】
操作されたRNA誘導核酸塩基修飾系が、操作されたRNA誘導核酸塩基修飾系をコードする核酸から発現され、細菌染色体に組み込まれる、請求項1-12のいずれか一項に記載のタンパク質-核酸複合体。
【請求項14】
操作されたRNA誘導核酸塩基修飾系が、操作されたRNA誘導核酸塩基修飾系をコードする核酸から発現され、染色体外ベクター上に担持される、請求項1-12のいずれか一項に記載のタンパク質-核酸複合体。
【請求項15】
細菌細胞の染色体上にコードされるHUファミリーDNA結合タンパク質のアミノ酸配列が、配列番号1に対して、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の配列同一性を有する、請求項1-14のいずれか一項に記載のタンパク質-核酸複合体。
【請求項16】
細菌が、バクテロイデス種またはその株レベル変異体である、請求項1-15のいずれか一項記載のタンパク質-核酸複合体。
【請求項17】
バクテロイデス種またはその株レベル変異体が、B.thetaiotaomicron、B.vulgatus、B.cellulosilyticus、B.fragilis、B.helcogenes、B.ovatus、B.salanitronis、B.uniformis、またはB.xylanisolvensから選択される、請求項16に記載のタンパク質-核酸複合体。
【請求項18】
標的細菌細胞の染色体中の少なくとも1つの核酸塩基を修飾する方法であって、該方法は、標的細菌細胞において操作されたRNA誘導核酸塩基修飾系を発現させることを含み、ここで、操作されたRNA誘導核酸塩基修飾系が、標的細菌細胞の染色体内の特定の遺伝子座を標的とし、該操作されたRNA誘導核酸塩基修飾系が、該特定の遺伝子座内の少なくとも1つの核酸塩基を修飾して、特定の遺伝子座を含む遺伝子の発現が変化、修飾、および/または不活性化されるようにし、ここで、標的細菌細胞の染色体は、配列番号1に対して少なくとも50%の配列同一性を有するアミノ酸配列を含むHUファミリーDNA結合タンパク質をコードする、方法。
【請求項19】
少なくとも1つの核酸塩基の修飾が、標的細菌細胞の染色体中の特定の遺伝子座内に少なくとも1つの一塩基多型および/または少なくとも1つの停止コドンの導入をもたらす、請求項18に記載の方法。
【請求項20】
操作されたRNA誘導核酸塩基修飾系が、(i)CRISPRタンパク質およびガイドRNA(gRNA)を含むCRISPR系、および(ii)核酸塩基修飾酵素またはその触媒ドメインを含み、CRISPRタンパク質が、ヌクレアーゼ欠損CRISPR変異体またはCRISPRニッカーゼである、請求項18から19のいずれか一項に記載の方法。
【請求項21】
CRISPR系が、I型CRISPR系、II型CRISPR系、III型CRISPR系、IV型CRISPR系、V型CRISPR系、またはVI型CRISPR系である、請求項20に記載の方法。
【請求項22】
CRISPRタンパク質が、Cas9、Cas12、Cas13、Cas14、またはCasXである、請求項20または21に記載の方法。
【請求項23】
gRNAが、CRISPR RNA(crRNA)およびトランス作用性crRNA(tracrRNA)を含む二重分子gRNAである、請求項20-22のいずれか一項に記載の方法。
【請求項24】
gRNAが、CRISPR RNA(crRNA)およびトランス作用性crRNA(tracrRNA)の融合ハイブリッドを含む単一分子gRNAである、請求項20-22のいずれか一項に記載の方法。
【請求項25】
核酸塩基修飾酵素またはその触媒ドメインが、シチジンデアミナーゼ1(CDA1)、シチジンデアミナーゼ2(CDA2)、活性化誘導シチジンデアミナーゼ(AICDA)、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーシチジンデアミナーゼ、APOBEC1相補因子/APOBEC1刺激因子(ACF1/ASF)シチジンデアミナーゼ、RNAに作用するシトシンデアミナーゼ(CDAR)、tRNAに作用するシトシンデアミナーゼ(CDAT)、tRNAアデニンデアミナーゼ、アデノシンデアミナーゼ、RNAに作用するアデノシンデアミナーゼ(ADAR)、またはtRNAに作用するアデノシンデアミナーゼ(ADAT)から選択される、請求項20から24のいずれか一項に記載の方法。
【請求項26】
核酸塩基修飾酵素またはその触媒ドメインが、シチジンデアミナーゼまたはその触媒ドメインであり、操作されたRNA誘導核酸塩基修飾系が、少なくとも1つのウラシルグリコシラーゼ阻害剤ドメインをさらに含む、請求項20-25のいずれか一項に記載の方法。
【請求項27】
CRISPRタンパク質が、核酸塩基修飾酵素またはその触媒ドメインに直接またはリンカーを介して連結されている、請求項20-26のいずれか一項に記載の方法。
【請求項28】
核酸塩基修飾酵素またはその触媒ドメインが、アダプタータンパク質に直接またはリンカーを介して連結され、CRISPRタンパク質またはgRNAが、アダプタータンパク質に結合することができるアプタマー配列を含む、請求項20-26のいずれか一項に記載の方法。
【請求項29】
アプタマー配列が、MS2、PP7、Com、N22、AP205、BZ13、F1、F2、fd、fr、GA、ID2、JP34、JP500、JP501、KU1、M11、M12、MX1、NL95、PRR1、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、Qβ、R17、SP、TW18、TW19、VK、または7sから選択される、請求項28に記載の方法。
【請求項30】
操作されたRNA誘導核酸塩基修飾系が、シチジンデアミナーゼまたはその触媒ドメインに連結されたヌクレアーゼ欠損Cas9またはCas12a変異体を含む、請求項20-29のいずれか一項に記載の方法。
【請求項31】
核酸塩基修飾酵素またはその触媒ドメイン、CRISPRタンパク質、およびgRNAが、標的細菌細胞の染色体中に組み込まれた少なくとも1つの核酸から発現される、請求項20-30のいずれか一項に記載の方法。
【請求項32】
核酸塩基修飾酵素またはその触媒ドメイン、CRISPRタンパク質、およびgRNAが、染色体外ベクター上に担持された少なくとも1つの核酸から発現される、請求項20-31のいずれか一項に記載の方法。
【請求項33】
CRISPRタンパク質をコードする核酸が、誘導性プロモーターに作動可能に連結されている、請求項31または32に記載の方法。
【請求項34】
プロモーター誘導化学物質が、無水テトラサイクリンである、請求項33に記載の方法。
【請求項35】
標的細菌細胞の染色体においてコードされるHUファミリーDNA結合タンパク質のアミノ酸配列が、配列番号1に対して、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の配列同一性を有する、請求項18-34のいずれか一項に記載の方法。
【請求項36】
標的細菌細胞が、バクテロイデス種またはその株レベル変異体である、請求項18-35のいずれか一項に記載の方法。
【請求項37】
バクテロイデス種または株レベル変異体が、B.thetaiotaomicron、B.vulgatus、B.cellulosilyticus、B.fragilis、B.helcogenes、B.ovatus、B.salanitronis、B.uniformis、またはB.xylanisolvensとして定義される系統群に属する、請求項36に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本出願は、2019年12月17日に出願された米国仮出願第62/949,314号の優先権の利益を主張し、その全内容は参照により本明細書に組み込まれる。
【0002】
配列表
本出願は、EFS-Webを介してASCII形式で提出された配列表を含み、その全体が参照により本明細書に組み込まれる。2020年12月17日に作成されたASCIIコピーは、P19-235_WO-PCT_SL.txtという名前で、サイズは38,913バイトである。
【0003】
本開示は、バクテロイデスにおけるゲノム編集のための組成物および方法に関する。
【背景技術】
【0004】
微生物ゲノム中のDNA配列を特異的に修飾する能力を制御することは、医学およびバイオテクノロジー研究の重要な側面である。最近の進歩は、微生物ゲノムの特定のDNA配列を標的とするようにRNA誘導系を設計できることを示すが、種々の微生物ゲノムが存在する独自のDNA修復状態および分子エピジェネティック構造は、特定のゲノム編集技術の有効性についての不確実性を生じさせる。ここでは、バクテロイデス種のゲノムを修飾するのに有効な組成物および方法について述べる。
【図面の簡単な説明】
【0005】
特許または出願ファイルは、カラーで作成された少なくとも1つの図面を含有する。カラー図面を有するこの特許または特許出願公開のコピーは、必要な手数料の要求および支払いに応じて、特許庁によって提供される。
【0006】
特許または出願ファイルは、カラーで作成された少なくとも1つの図面を含有する。カラー図面を含むこの特許または特許出願公開のコピーは、要求および必要な手数料の支払いに応じて、特許庁によって提供される。
【0007】
図1は、CRISPRベース編集(dSpCas9-CDA/sgRNA)の概略モデルを示す。dSpCas9-CDA/sgRNA複合体は二本鎖DNAに結合し、sgRNAおよびPAM依存的にRループを形成する。CDAは、PAMから上流の15-20塩基以内の下部(非相補的)鎖に位置するシトシンの脱アミノ化を触媒し、CからTへの突然変異誘発を引き起こす。
【0008】
図2は、Bacteroides thetaiotaomicronのtdk(BT_2275)を標的とするCRISPR塩基編集因子組み込みプラスミド[pNBU2.CRISPR-CDA]の模式図を示す。
【0009】
図3Aは、dSpCas9-CDAによって編集されたtdk_Bt突然変異体の配列アラインメントを示す。ゲノム遺伝子座およびtdk_BtsgRNA(N20)により標的化される部位は、PAMで示されている。tdk_Btのコード配列は、ATG開始コドンから始まる上部に示されている。aTc100寒天プレートから無作為に選んだ8つのコロニーから見いだされる変異部位を下に示す。変異した塩基(PAMの-17位のCからTへ)により、tdk_Btコード配列の28位に停止コドンが生じた。
図3Aは、出現順に配列番号10~13をそれぞれ開示する。
【0010】
図3Bは、dSpCas9-CDAによって編集されたsusC_Bt突然変異体の配列アラインメントを示す。ゲノム遺伝子座およびsusC_BtsgRNA(N20)により標的化される部位は、PAMで表示される。susC_Btのコード配列は上部に表示される。aTc100寒天プレートから無作為に選んだ8つのコロニーから見いだされる変異部位を下に示す。変異した塩基(PAMからの-17位および-19位のCからT)は、susC_Btコード配列の491位および493位にアミノ酸置換および停止コドンを生成する。
図3Bは、出現順に配列番号14-17をそれぞれ開示する。
【0011】
図4は、Bacteroides thetaiotaomicron VPI-5482ゲノムを標的としない非標的化ガイドRNAスクランブルヌクレオチド配列を有するCRISPR塩基編集因子安定維持プラスミド(pmobA.repA.CRISPR-CDA.NT)の概略図を、提示する。
【0012】
図5Aは、再構成された好気性大腸菌/Bacteroides thetaiotaomicron VPI-5482コンジュゲーションスラリー1mlからの1:10希釈液100μlで播種された、25μg/mlのエリスロマイシン(Em)および200μg/mlのゲンタマイシン(Gm)脳-心臓注入(BHI)血液寒天プレートを示す。これらの再構成されたコンジュゲーションスラリーは、選択なしBHI血液寒天プレートからであった。左から右へのプレートは、非標的化試料、BT_0362試料、およびBT_0364試料を示す。
【0013】
図5Bは、25μg/mlのEm、200μg/mlのGmおよび100ng/mlのアンヒドロテトラサイクリン(aTc)選択および誘導BHI血液寒天プレート上の無菌ループ成長ストリークを示す。各プレートからの個々のコロニーを
図5Aに示す。
図5Aは、25μg/mlのEm、200μg/mlのGmおよび100ng/mlのaTcを補充した5mlの選択および誘導TYG液体培地中で増殖させた。無菌ループ試料は、これらの選択および誘導TYG液体培地培養から採取された。左から右へのプレートは、非標的化試料、BT_0362試料、およびBT_0364試料を示す。
【0014】
図6Aは、「SangerTrace」と呼ばれるMilliporeSigma内部で開発されたソフトウェアを使用した定量的突然変異分析を示す。この解析ソフトウェアは、Applied Biosystem社の形式(ABI)ファイルに基づいて各塩基シグナルのピーク値を抽出し、「対照」および「試料」のサンガー配列決定データを比較して変異率を計算する。一番上のサンガートレースは、ガイドRNA配列に下線が引かれた非標的化試料である。赤い矢印は、CからTへの突然変異誘発およびBT_0362コード配列を切り詰める停止コドンの導入につながるシトシン脱アミノ化の位置である、PAMに対する塩基-17を示す。中央のサンガートレースはBT_0362で編集された試料を示し、下のグラフはCからTへの突然変異頻度を示す。
図6Aは、出現順に配列番号18-20をそれぞれ開示する。
【0015】
図6Bは、「SangerTrace」と呼ばれるMilliporeSigma内部で開発されたソフトウェアを使用した定量的突然変異分析を示す。この解析ソフトウェアは、Applied Biosystem社の形式(ABI)ファイルに基づいて各塩基シグナルのピーク値を抽出し、「対照」および「試料」のサンガー配列決定データを比較して変異率を計算する。一番上のサンガートレースは、ガイドRNA配列に下線が引かれた非標的化試料である。赤い矢印は、PAMに対する塩基-18、-19、および-20を示す。これはシトシン脱アミノ化の位置であり、CからTへの突然変異誘発と、BT_0364コード配列を切断する停止コドンの導入につながる。中央のサンガートレースはBT_0364で編集された試料を示し、下のグラフはCからTへの変異頻度を示す。
図6Bは、出現順に配列番号21-23をそれぞれ開示する。
【0016】
詳細な説明
本開示は、特定のDNA配列を修飾するために使用することができる、操作されたRNA誘導型ゲノム修飾系を提供する。特に、RNA誘導ゲノム修飾系は、ドメイン細菌の標的化されたメンバー、具体的には、ゲノムDNA配列の修飾(例えばノックアウト、ノックイン)をもたらす宿主動物種(ホモ・サピエンスを含むがこれに限定されない)の1つまたは複数の身体生息地において存在するメンバーを含む、バクテロイデス属に属するバクテロイデス門のメンバーの染色体DNA中の特定の遺伝子座を標的とするように操作される。
【0017】
(I)タンパク質-核酸複合体
本開示の一態様は、標的細菌種(またはその種の株レベル変異体)の染色体と関連する操作されたRNA誘導核酸塩基修飾系を含むタンパク質-核酸複合体を提供し、ここで、操作されたRNAは、誘導核酸塩基修飾系は、生物の染色体の特定の遺伝子座を標的とし、生物の染色体は、配列番号1:(MNKADLISAVAAAEAGLSKVDAKKAVEAFVSTVTKALQEGDKVSLIGFGTFSVAERSARTGINPSTKATITIPAKKVTKFKPGAELADAIK)のアミノ酸配列に対して少なくとも50%の配列同一性(例えば、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の配列同一性)を有するアミノ酸配列を含むHUファミリーDNA結合タンパク質をコードし、およびHUファミリーDNA結合タンパク質に関連している種/株の染色体は、配列番号:1のアミノ酸配列に対して少なくとも50%の配列同一性(例えば、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の配列同一性)を有する。
【0018】
種々の実施形態において、RNA誘導核酸塩基修飾系は、(i)クラスター化され、規則的に間隔が空いた短い回文構造の反復(CRISPR)タンパク質およびガイドRNA(gRNA)を含むCRISPR系、および(ii)核酸塩基修飾酵素またはその触媒ドメインを含み、ここでCRISPRタンパク質は、ヌクレアーゼ欠損CRISPR変異体(例えば、デッドCRISPR)またはCRISPRニッカーゼである。CRISPR系のgRNAは、細菌種/株の染色体の特定の遺伝子座にRNA誘導核酸塩基修飾系の結合を指示するように操作される。CRISPRタンパク質は、いくつかの実施形態において、ヌクレアーゼ欠損CRISPR変異体またはCRISPRニッカーゼであるため、細菌染色体の特定の遺伝子座における1つまたは複数の核酸塩基は、生物の染色体において致死的であることができる二本鎖切断の生成なしに修飾されることができる。細菌生物は、細菌染色体DNAと関連するHUファミリータンパク質を発現する。したがって、本明細書に開示されるタンパク質-核酸複合体は、DNA/タンパク質複合体(細菌染色体DNAおよび関連するHUファミリータンパク質)に結合したリボ核タンパク質複合体(gRNA/CRISPRタンパク質/核酸塩基修飾酵素)を含む。
【0019】
(a)操作されたRNA誘導核酸塩基修飾系
本明細書に開示されるタンパク質-核酸複合体は、典型的には、(i)CRISPRタンパク質およびガイドRNA(gRNA)を含むCRISPR系、ここでCRISPRタンパク質は、ヌクレアーゼ欠損CRISPR変異体またはCRISPRニッカーゼである、および(ii)核酸塩基修飾酵素またはその触媒ドメインを含む操作されたRNA誘導核酸塩基修飾系を含む。
【0020】
(i)CRISPR系
RNA誘導型CRISPR系は、多くの細胞型における遺伝子編集に使用されるRNA誘導型DNA標的化プラットフォームとして転用された、細菌および古細菌における天然の防御機構である。たとえば、(参照によりその全体が本明細書に組み込まれる)Chenらの国際公開番号WO2014/089190を参照のこと。以下に詳述するように、CRISPRタンパク質と相互作用するガイドRNAは、目的の核酸の特定の配列と塩基対を形成するように操作することができ、それによって、CRISPRタンパク質を目的の核酸の特定の配列に標的化することができる。
【0021】
本明細書に開示されるRNA誘導核酸塩基修飾系のCRISPR系は、I型CRISPR系、II型CRISPR系、III型CRISPR系、IV型CRISPR系、V型CRISPR系、またはタイプVICRISPR系に由来することができる。特定の実施形態において、CRISPRヌクレアーゼは、II型、V型、またはVI型系などの単一サブユニットエフェクター系に由来することができる。様々な実施形態において、CRISPRタンパク質は、II型Cas9タンパク質、(以前はCpf1と呼ばれていた)V型Cas12タンパク質、(以前はC2cdと呼ばれていた)VI型Cas13タンパク質、CasXタンパク質、またはCasYタンパク質に由来することができる。1つの特定の実施形態において、CRISPRヌクレアーゼは、II型Cas9タンパク質に由来する。別の特定の実施形態において、CRISPRヌクレアーゼは、V型Cas12タンパク質に由来する。
【0022】
CRISPRタンパク質は、Acaryochloris種、Acetohalobium種、Acidaminococcus種、Acidithiobacillus種、Acidothermus種、Akkermansia種、Alicyclobacillus種、Allochromatium種、Ammonifex種、Anabaena種、Arthrospira種、Bacillus種、Bifidobacterium種、Burkholderiales種、Caldicelulosiruptor種、Campylobacter種、Candidatus種、Clostridium種、Corynebacterium種、Crocosphaera種、Cyanothece種、Deltaproteobacterium種、Exiguobacterium種、Finegoldia種、Francisella種、Ktedonobacter種、Lachnospiraceae種、Lactobacillus種、Leptotrichia種、Lyngbya種、Marinobacter種、Methanohalobium種、Microscilla種、Microcoleus種、Microcystis種、Mycoplasma種、Natranaerobius種、Neisseria種、Nitratifractor種、Nitrosococcus種、Nocardiopsis種、Nodularia種、Nostoc種、Oenococcus種、Oscillatoria種、Parasutterella種、Pelotomaculum種、Petrotoga種、Planctomyces種、Polaromonas種、Prevotella種、Pseudoalteromonas種、Ralstonia種、Ruminococcus種、Staphylococcus種、Streptococcus種、Streptomyces種、Streptosporangium種、Synechococcus種、Thermosipho種、Verrucomicrobia種、Wolinella種、および/または、それぞれ参照により全体が本明細書に組み込まれるMakarova, Kira S., et al. “An updated evolutionary classification of CRISPR-Cas systems.” Nature Reviews Microbiology 13.11 (2015): 722 および Koonin, Eugene V., Kira S. Makarova, and Feng Zhang. “Diversity, classification and evolution of CRISPR-Cas systems.” Current opinion in microbiology 37 (2017): 67-78に開示されるものなどのゲノムデータベースのバイオインフォマティクス調査において描写された種に由来することができる。
【0023】
いくつかの態様において、CRISPRタンパク質は、Streptococcus pyogenes Cas9、Francisella novicida Cas9、Staphylococcus aureus Cas9、Streptococcus thermophilus Cas9、Streptococcus pasteurianus Cas9、Campylobacter jejuni Cas9、Neisseria meningitis Cas9、Neisseria cinerea Cas9、Francisella novicida Cas12a、Acidaminococcus種Cas12a Lachnospiraceae bacterium ND2006 Cas12a、Leptotrichia wadeii Cas13a、Leptotrichia shahii Cas13a、Prevotella種P5-125 Cas13、Ruminococcus flavefaciens Cas13d、Deltaproteobacterium CasX、Planctomyces CasX、またはCandidatus CasYに由来することができる。
【0024】
いくつかの態様において、誘導核酸塩基修飾系のCRISPRタンパク質は、ヌクレアーゼ活性をすべて欠くように修飾された、ヌクレアーゼ欠損CRISPR変異体であることができる。野生型CRISPRヌクレアーゼは一般に2つのヌクレアーゼドメインを含み、例えばCas9ヌクレアーゼはRuvCおよびHNHドメインを含み、それぞれが二本鎖配列の1つの鎖を切断する。RuvCヌクレアーゼドメインおよびHNHヌクレアーゼドメインの1つまたは複数の変異により、すべてのヌクレアーゼ活性が、消失することができる。例えば、ヌクレアーゼ欠損CRISPR変異体は、RuvCドメインにD10A、D8A、E762A、および/またはD986Aなどの変異、およびHNHドメインにH840A、H559A、N854A、N856A、および/またはN863Aなどの変異を含むことができる(Streptococcus pyogenes Cas9、SpyCas9の番号付け系を参照)。ヌクレアーゼ欠損Cas12変異体は、2つのヌクレアーゼドメインに同等の変異を含むことができる。いくつかの実施形態において、ヌクレアーゼ欠損CRISPR変異体は、D10AおよびH840A変異を有する死んだCas9(dCas9)変異体であることができる。
【0025】
他の実施形態において、本明細書に開示されるRNA誘導核酸塩基修飾系のCRISPRタンパク質は、二本鎖配列の一方の鎖を切断するCRISPRニッカーゼであることができる。ニッカーゼは、CRISPRヌクレアーゼのヌクレアーゼドメインの1つを不活性化することで操作できる。例えば、Cas9タンパク質のRuvCドメインまたはHNHドメインは、Cas9ニッカーゼ(例えば、nCas9)を生成するために、上記のように1つまたは複数の変異によって不活化することができる。他のCRISPRヌクレアーゼの同等の変異は、他のCRISPRニッカーゼ(例えば、nCas12)を生成できる。
【0026】
さらに、CRISPRタンパク質は、改善された標的化特異性、改善された忠実度、改変されたPAM特異性、および/または増大した安定性を有するように修飾されることができる。例えば、CRISPRタンパク質は、1つまたは複数の変異(すなわち、少なくとも1つのアミノ酸の置換、欠失、および/または挿入)を含むように修飾することができる。標的特異性を改善し、忠実度を改善し、および/またはオフターゲット効果を減少させる変異の非限定的な例は、N497A、R661A、Q695A、K810A、K848A、K855A、Q926A、K1003A、R1060A、および/またはD1135Eを含む(SpyCas9の番号付け系を参照)。
【0027】
CRISPR系は、ガイドRNAも含む。ガイドRNAは、目的の核酸内のCRISPRタンパク質および標的配列と相互作用し、CRISPRタンパク質を標的配列に導く。標的配列には、配列がプロトスペーサー隣接モチーフ(PAM)配列に隣接していることを除いて、配列の制限はない。異なるCRISPRタンパク質は、異なるPAM配列を認識する。たとえば、Cas9タンパク質についてのPAM配列は、5’-NGG、5’-NGGNG、5’-NNAGAAW、5’-NNNNGATT、5-NNNNRYAC、5’-NNNNCAAA、5’-NGAAA、5’-NNAAT、5’-NNNRTA、5’-NNGG、5’-NNNRTA、5’-MMACCA、5’-NNNNGRY、5’-NRGNK、5’-GGGRG、5’-NNAMMMC、5’-NNGを含み、Cas12aタンパク質についてのPAM配列は、5’-TTNおよび5’-TTTVを含み、ここでNは任意のヌクレオチドとして定義され、RはGまたはAのいずれかと定義され、WはAまたはTのいずれかと定義され、YはCまたはTのいずれかと定義され、VはA、C、またはGと定義される。一般に、Cas9PAMは標的配列の3’に位置し、Cas12aPAMは標的配列の5’に位置する。種々のPAM配列およびそれらを認識するCRISPRタンパク質は、当技術分野、例えば、それぞれ参照により全体が本明細書に組み込まれるLeenay, Ryan T., et al. “Identifying and visualizing functional PAM diversity across CRISPR-Cas systems.” Molecular cell 62.1 (2016): 137-147; および Kleinstiver, Benjamin P., et al. “Engineered CRISPR-Cas9 nucleases with altered PAM specificities.” Nature 523.7561 (2015): 481において既知である。
【0028】
ガイドRNAは、特定のCRISPRタンパク質と複合体を形成するように操作される。一般に、ガイドRNAは、(i)標的部位でハイブリダイズするガイドまたはスペーサー配列を5’末端に含むCRISPRRNA(crRNA)、および(ii)crRNAおよびCRISPRタンパク質と相互作用するトランス作用性crRNA(tracrRNA)配列を含む。各ガイドRNAのガイドまたはスペーサー配列は異なる(つまり、配列特異的である)。ガイドRNA配列の残りの部分は、特定のCRISPRタンパク質と複合体を形成するように設計されたガイドRNAと一般的に同じである。
【0029】
crRNAは、ガイド配列を5’末端に、およびtracrRNAの5’末端の配列と塩基対合して二重鎖構造を形成する追加の配列を3’末端に含み、tracrRNAは、CRISPRヌクレアーゼと相互作用する、少なくとも1つのステムループ構造を形成する追加の配列を含む。ガイドRNAは、crRNA配列がtracrRNA配列に連結された単一分子(例えば、単一ガイドRNA(sgRNA)または1ピースsgRNA)であることができる。あるいは、ガイドRNAは、別個の分子、すなわちcrRNAおよびtracrRNAを含む二重分子gRNAであることができる。
【0030】
crRNAガイド配列は、目的の核酸中の標的配列(すなわち、プロトスペーサー)の補体とハイブリダイズするように設計される。「標的核酸」は二本鎖分子である。一方の鎖は標的配列を含み、「PAM鎖」と呼ばれ、もう一方の相補鎖は「非PAM鎖」と呼ばれる。当業者は、gRNAスペーサー配列が、標的核酸の非PAM鎖に位置する標的配列の逆補体にハイブリダイズすることを認識する。一般に、ガイド配列と標的配列との間の配列同一性は、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%である。特定の実施形態において、相補性は完全である(すなわち、100%)。様々な実施形態において、crRNAガイド配列の長さは、約15ヌクレオチドから約25ヌクレオチドの範囲であることができる。例えば、crRNAガイド配列は、約15、16、17、18、19、20、21、22、23、24、または25ヌクレオチド長であることができる。特定の実施形態において、ガイドは、約19、20、または21ヌクレオチド長である。一実施形態において、crRNAガイド配列は、20ヌクレオチドの長さを有する。特定の実施形態において、crRNAは、tracrRNAと相互作用する追加の3’配列を含むことができる。追加の配列は、約10から約40ヌクレオチドを含むことができる。ガイドRNAが単一分子を含む実施形態において、gRNAのcrRNAおよびtracrRNA部分は、ループを形成する配列によって連結されることができる。ループを形成する配列は、長さが約4ヌクレオチドから約10以上のヌクレオチドの範囲であることができる。
【0031】
上述のように、tracrRNAは、CRISPRヌクレアーゼと相互作用する少なくとも1つのステムループ構造を形成する反復配列を含む。各ループおよびステムの長さはさまざまであることができる。例えば、ループは長さが約3から約10ヌクレオチドの範囲であり、ステムは長さが約6から約20塩基対の範囲であることができる。ステムは、1から約10ヌクレオチドの1つまたは複数のバルジを含むことができる。ガイドRNAのtracrRNA配列は、一般に、野生型CRISPRヌクレアーゼと相互作用する野生型tracrRNAの配列に基づいている。野生型配列は、二次構造の形成、二次構造の安定性の向上などを促進するために修飾されることができる。例えば、1つまたは複数のヌクレオチド変化をガイドRNA配列に導入することができる。tracrRNA配列は、長さが約50ヌクレオチドから約300ヌクレオチドの範囲であることができる。様々な実施形態において、tracrRNAは、長さが約50から約90ヌクレオチド、約90から約110ヌクレオチド、約110から約130ヌクレオチド、約130から約150ヌクレオチド、約150から約170ヌクレオチド、約170から約200ヌクレオチド、約200から約250ヌクレオチド、または約250から約300ヌクレオチドの範囲であることができる。tracrRNAは、tracrRNAの3’末端に所望の拡張を含むことができる。
【0032】
ガイドRNAは、標準リボヌクレオチドおよび/または修飾リボヌクレオチドを含むことができる。いくつかの実施形態において、ガイドRNAは、標準または修飾されたデオキシリボヌクレオチドを含むことができる。ガイドRNAが酵素的に(すなわち、インビボまたはインビトロで)合成される実施形態において、ガイドRNAは一般に標準リボヌクレオチドを含む。ガイドRNAが化学的に合成される実施形態において、ガイドRNAは、標準または修飾リボヌクレオチドおよび/またはデオキシリボヌクレオチドを含むことができる。修飾リボヌクレオチドおよび/またはデオキシリボヌクレオチドは、塩基修飾(例えば、プソイドウリジン、2-チオウリジン、N6-メチルアデノシンなど)および/または糖修飾(例えば、2’-O-メチル、2’-フルオロ、2’-アミノ、ロックド核酸(LNA)など)を含む。ガイドRNAの主鎖は、ホスホロチオエート結合、ボラノホスフェート結合、またはペプチド核酸を含むように修飾することもできる。
【0033】
所望のアプタマー配列。場合によっては、ガイドRNAのCRISPRタンパク質またはtracrRNAは、1つまたは複数のアプタマー配列をさらに含むことができる(Konermann et al., Nature, 2015, 517(7536):583-588; Zalatan et al., Cell, 2015, 160(1-2):339-50)。アプタマー配列は、核酸(例えば、RNA)またはペプチドであることができる。アプタマー配列は、特定のアダプタータンパク質によって認識および結合される。適切なアプタマー配列の非限定的な例は、MS2/MSP、PP7/PCP、Com、N22、AP205、BZ13、F1、F2、fd、fr、GA、ID2、JP34、JP500、JP501、KU1、M11、M12、MX1、NL95、PRR1、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、Qβ、R17、SP、TW18、TW19、VK、および7sを含む。当業者は、アプタマー配列の長さが変化することができることを理解する。アプタマー配列は、共有結合を介してCRISPRタンパク質またはtracrRNAに直接連結することができる。あるいは、アプタマー配列は、リンカーを介してCRISPRタンパク質またはtracrRNAに間接的に連結することができる。
【0034】
リンカーは、少なくとも1つの共有結合を介して1つまたは複数の他の化学基を接続する化学基である。適切なリンカーは、アミノ酸、ペプチド、ヌクレオチド、核酸、有機リンカー分子(例えば、マレイミド誘導体、N-エトキシベンジルイミダゾール、ビフェニル-3,4’,5-トリカルボン酸、p-アミノベンジルオキシカルボニルなど)、ジスルフィドリンカー、およびポリマーリンカー(例えば、PEG)を含む。リンカーは、アルキレン、アルケニレン、アルキニレン、アルキル、アルケニル、アルキニル、アルコキシ、アリール、ヘテロアリール、アラルキル、アラルケニル、アラルキニルなどを含むがこれらに限定されない1つまたは複数のスペーシング基を含むことができる。リンカーは中性であるか、正または負の電荷を運ぶことができる。いくつかの実施形態において、リンカーはペプチドリンカーであることができる。ペプチドリンカーは、柔軟なアミノ酸リンカー(例えば、小さい、非極性または極性アミノ酸を含む)であることができる。あるいは、ペプチドリンカーは、剛性アミノ酸リンカー(例えば、αヘリックス)であることができる。ペプチドライカーの長さは、約4アミノ酸から100以上のアミノ酸までさまざまである。例えば、適切なリンカーは、10-20個のアミノ酸、20-40個のアミノ酸、40-80個のアミノ酸、または80-120個のアミノ酸を含むことができる。適切なリンカーの例は当技術分野で周知であり、リンカーを設計するためのプログラムは容易に入手できる(Crasto et al., Protein Eng., 2000, 13(5):309-312)。
【0035】
(ii)核酸塩基修飾酵素
本明細書に開示される操作されたRNA誘導(CRISPR)核酸塩基修飾系は、核酸塩基修飾酵素またはその触媒ドメインも含む。
【0036】
種々の核酸塩基修飾酵素が、本明細書に開示される系での使用に適している。核酸塩基修飾酵素は、DNA塩基編集剤であることができる。いくつかの実施形態において、DNA塩基編集因子は、シチジンをウリジンに変換するシチジンデアミナーゼであることができ、これはポリメラーゼ酵素によってチミンとして読み取られる。シチジンデアミナーゼの非限定的な例は、シチジンデアミナーゼ1(CDA1)、シチジンデアミナーゼ2(CDA2)、活性化誘導シチジンデアミナーゼ(AICDA)、アポリポタンパク質BmRNA編集複合体(APOBEC)ファミリーシチジンデアミナーゼ(例えば、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D/E、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4)、APOBEC1相補因子/APOBEC1刺激因子(ACF1/ASF)シチジンデアミナーゼ、RNAに作用するシトシンデアミナーゼ(CDAR)、バクテリアロングアイソフォームシチジンデアミナーゼ(CDDL)、およびtRNA(CDAT)に作用するシトシンデアミナーゼを含む。他の実施形態において、DNA塩基編集因子は、アデノシンをグアノシンとしてポリメラーゼ酵素によって読み取られるイノシンに変換するアデノシンデアミナーゼであることができる。アデノシンデアミナーゼの非限定的な例は、tRNAアデニンデアミナーゼ、アデノシンデアミナーゼ、RNAに作用するアデノシンデアミナーゼ(ADAR)、およびtRNAに作用するアデノシンデアミナーゼ(ADAT)を含む。
【0037】
核酸塩基修飾酵素(塩基編集因子)は、野生型またはそのフラグメント、その修飾されたバージョン(例えば、非必須ドメインを削除することができる)、またはその操作されたバージョンであることができる。核酸塩基修飾酵素(塩基編集因子)は、真核生物、細菌、または古細菌に由来することができる。
【0038】
いくつかの実施形態において、核酸塩基修飾酵素(塩基編集因子)は、シチジンデアミナーゼまたはその触媒ドメインであることができる。シチジンデアミナーゼは、ヒト、マウス、ヤツメウナギ、アワビ、または大腸菌由来のものであることができる。核酸塩基修飾酵素がシチジンデアミナーゼである実施形態において、RNA誘導核酸塩基修飾系は、少なくとも1つのウラシルグリコシラーゼ阻害剤(UGI)ドメインをさらに含むことができる。シトシン脱アミノ化の結果であるDNAからのウラシルの除去は、UGIによって阻害される。適切なUGIドメインは、当技術分野で既知である。
【0039】
いくつかの実施形態において、シチジンデアミナーゼおよびUGIを使用する系は、これらの成分が過剰発現される場合、負の効果を有することができる。過剰発現を防ぐために、分解タグを追加することができる。分解タグは、タンパク質リサイクル系によってタンパク質が分解されることを知らせる。これらの分解タグにより、タンパク質の半減期が異なる。非限定的な分解タグの例は、LVA、AAV、ASVおよびLAAである。
【0040】
所望のアダプタータンパク質。いくつかの実施形態において、核酸塩基修飾酵素またはその触媒ドメインは、アプタマー配列を認識して結合するアダプタータンパク質に連結することができる。いくつかの実施形態において、アダプタータンパク質は、MCPアプタマー配列を認識して結合するMS2バクテリオファージコートタンパク質、またはPCPアプタマー配列を認識して結合するPP7バクテリオファージコートタンパク質であることができる。他の実施形態において、アダプタータンパク質は、Com、N22、AP205、BZ13、F1、F2、fd、fr、GA、ID2、JP34、JP500、JP501、KU1、M11、M12、MX1、NL95、PRR1、ΦCb5、ΦCb8r、ΦCb12r、ΦCb23r、Qβ、R17、SP、TW18、TW19、VK、または7sアダプター配列を認識して結合することができる。
【0041】
核酸塩基修飾酵素またはその触媒ドメインとアダプタータンパク質との間の結合は、共有結合を介して直接的であることができる。あるいは、核酸塩基修飾酵素またはその触媒ドメインとアダプタータンパク質との間の結合は、リンカーを介して間接的であることができる。リンカーは、上記のセクション(I)(a)(i)に記載されている。アダプタータンパク質は、核酸塩基修飾酵素またはその触媒ドメインのアミノ末端および/またはカルボキシ末端に連結することができる。
【0042】
(iii)CRISPR系および核酸塩基修飾酵素間の相互作用
本明細書に開示される操作されたRNA誘導核酸塩基修飾系は、(i)ヌクレアーゼ活性を有さないかまたはニッカーゼ活性を有するCRISPR系(上記のセクション(I)(a)(i)に記載)および(ii)核酸塩基修飾酵素(塩基編集因子)またはその触媒ドメイン(上記のセクション(I)(a)(ii)に記載)を含む。CRISPR系および核酸塩基修飾酵素またはその触媒ドメインは、さまざまな方法で相互作用することができる。
【0043】
いくつかの実施形態において、CRISPR系のCRISPRタンパク質は、核酸塩基修飾酵素またはその触媒ドメインに連結することができる。いくつかの態様において、CRISPRタンパク質と核酸塩基修飾酵素またはその触媒ドメインとの間の結合は、共有結合(例えば、ペプチド結合)を介して直接的であることができる。他の態様において、CRISPRタンパク質と核酸塩基修飾酵素またはその触媒ドメインとの間の連結は、リンカーを介することができる。リンカーは、上記のセクション(I)(a)(i)に記載されている。核酸塩基修飾酵素またはその触媒ドメインは、CRISPRタンパク質のアミノ末端および/またはカルボキシ末端に連結することができる。
【0044】
他の実施形態において、核酸塩基修飾酵素またはその触媒ドメインは、アダプタータンパク質(上記セクション(I)(a)(ii)に記載)に連結することができ、CRISPRタンパク質またはgRNAは、アダプタータンパク質に結合することができるアプタマー配列(上記セクション(I)(a)(i)に記載)を含むことができる。例えば、核酸塩基修飾酵素(例えば、シチジン/アデノシンデアミナーゼ)をMS2バクテリオファージコートタンパク質に連結することができ、CRISPR系のgRNAは、ステムループ構造を形成するMCPアプタマー配列を含むことができ、ここでMS2タンパク質はMSPアプタマー配列に結合することができ、それによってCRISPR-シチジン/アデノシンデアミナーゼ系を形成する。
【0045】
(iv)操作されたRNA誘導核酸塩基修飾系の発現
CRISPR系のガイドRNAは、RNA誘導(CRISPR)核酸塩基修飾系を細菌染色体DNA中の特定の遺伝子座に標的化するように操作され、その結果、上記のように、タンパク質-核酸複合体が形成されることができる。一般に、タンパク質-核酸複合体は細菌細胞内で形成される。
【0046】
いくつかの実施形態において、操作されたRNA誘導(CRISPR)核酸塩基修飾系は、細菌の種または株の染色体に組み込まれた前記系をコードする少なくとも1つの核酸から発現されることができる。他の実施形態において、操作されたRNA誘導(CRISPR)核酸塩基修飾系は、少なくとも1つの染色体外ベクター上に担持される前記系をコードする少なくとも1つの核酸から発現されることができる。細菌に核酸を導入するための技術は、核酸を細菌染色体に組み込むための手段と同様に、当技術分野で周知である。
【0047】
操作されたRNA誘導(CRISPR)核酸塩基修飾系の発現は、調節することができる。例えば、操作されたCRISPRヌクレアーゼ系の発現は、セクション(II)に後述するように、誘導性プロモーターによって調節することができる。
【0048】
いくつかの実施形態において、操作されたRNA誘導(CRISPR)核酸塩基修飾系は、プールされたガイドRNAライブラリーとして形式化されて、多くのゲノム位置を並行して標的とし、バクテロイデス細胞の集団の作成を可能にすることができ、各細胞は異なるRNA誘導ゲノム修飾を有する。次いで、これらのプールされた細胞集団を選択圧下に置き、選択された細胞をDNA配列決定によって分析することができる。
【0049】
(b)細菌染色体
本明細書に開示されるタンパク質-核酸複合体は、細菌染色体をさらに含み、ここで細菌染色体は、配列番号1のアミノ酸配列に対して少なくとも50%の配列同一性を有するアミノ酸配列を含むHUファミリーDNA結合タンパク質をコードし(配列番号1に対して少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の配列同一性)、細菌染色体DNAは、前記HUファミリーDNA結合タンパク質と会合している。DNA結合タンパク質のHUファミリーは、配列特異性なしで二本鎖DNAに結合し、フォーク、3/4ウェイジャンクション、ニック、オーバーハング、およびバルジなどのDNA構造に結合する、小さな(-90アミノ酸)塩基性ヒストン様タンパク質で構成される。HUファミリーDNA結合タンパク質の結合は、DNAを安定化し、極端な環境条件下での変性から保護することができる。バクテロイデスHUファミリーDNAタンパク質と染色体DNAとの会合は、CRISPR系などの他のDNA結合タンパク質が染色体標的に結合し、ヌクレアーゼ、ニッカーゼ、デアミナーゼまたは他のゲノム修飾モダリティなどとして機能するために適合しなければならない独自の構造環境を作り出す。
【0050】
一般に、染色体(またはその染色体領域)は、バクテロイデスの任意のメンバー内にあることができる。 いくつかの実施形態において、HUファミリーDNA結合タンパク質は、配列番号1に対して、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の配列同一性を有するアミノ酸配列を含む。他の実施形態において、HUファミリーDNA結合タンパク質は、配列番号1のアミノ酸配列を有する。
【0051】
いくつかの実施形態において、生物はバクテロイデス属のメンバーである。バクテロイデス種は、哺乳類の腸内微生物叢の著名な嫌気性共生生物である。それらはさまざまな糖分解酵素を含有し、腸内の多糖類の主要な発酵槽である。それらは、腸内に保持されている場合、宿主との複雑で一般的に有益な関係を維持するが、この環境から逃れると重大な病状を引き起こすことができる。バクテロイデス種の非限定的な例は、B.acidifaciens、B.bacterium、B.barnesiaes、B.caccae、B.caecicola、B.caecigallinarum、B.capillosis、B.cellulosilyticus、B.cellulosolvens、B.clarus、B.coagulans、B.coprocola、B.coprophilus、B.coprosuis、B.distasonis、B.dorei、B.eggerthii、B.gracilis、B.faecichinchillae、B.faecis、B.finegoldii、B.fluxus、B.fragilis、B.galacturonicus、B.gallinaceum、B.gallinarum、B.goldsteinii、B.graminisolvens、B.helcogene、B.heparinolyticus、B.intestinalis、B.johnsonii、B.luti、B.massiliensis、B.melaninogenicus、B.neonati、B.nordii、B.oleiciplenus、B.oris、B.ovatus、B.paurosaccharolyticus、B.plebeius、B.polypragmatus、B.propionicifaciens、B.putredinis、B.pyogenes、B.reticulotermitis、B.rodentium、B.salanitronis、B.salyersiae、B.sartorii、B.sediment、B.stercoris、B.stercorirosoris、B.suis、B.tectus、B.thetaiotaomicron、B.timonensis、B.uniformis、B.vulgatus、B.xylanisolvens、B.xylanolyticus.、およびB.zoogleoformansおよびこれらの種の株レベル変異体を含む。例えば、B.cellulosilyticusの株レベル変異体は、B.cellulosilyticus DSM 14838、B.cellulosilyticus WH2、B.cellulosilyticus CL02T12C19、B.cellulosilyticus CRE21(T)、およびB.cellulosilyticus JCM 15632Tを含むが、これらに限定されない。
【0052】
いくつかの実施形態において、染色体(またはその染色体領域)は、Bacteroides thetaiotaomicron、Bacteroides vulgatus、Bacteroides cellulosilyticus、Bacteroides fragilis、Bacteroides helcogenes、Bacteroides ovatus、Bacteroides salanitronis、Bacteroides uniformis、またはBacteroides xylanisolvensおよびこれらの種の株レベル変異体から選択される。
【0053】
いくつかの実施形態において、染色体(またはその染色体領域)は、Barnesiella種、Barnesiella viscericola、Capnocytphaga種、Odoribacter splanchnicus、Paludibacter種、Parabacteroides種、Porphyromonadaceae bacterium、およびSchleiferia種およびこれらの種の株レベル変異体から選択される。
【0054】
染色体領域は、例えば、プラスミドDNAまたは細菌人工染色体に関連する長さ(およそ2,000から350,000塩基長)、または一次細菌染色体に関連する長さ(130,000塩基から14,000,000塩基長)であることができる。
【0055】
したがって、例えば、染色体領域の長さは、約2000、約3000、約4000、約5000、約6000、約7000、約8000、約9000、約10000、約11000、約12000、約13000、約14000、約15000、約16000、約17000、約18000、約19000、約20000、約21000、約22000、約23000、約24000、約25000、約26000、約27000、約28000、約29000、約30000、約31000、約32000、約33000、約34000、約35000、約36000、約37000、約38000、約39000、約40000、約41000、約42000、約43000、約44000、約45000、約46000、約47000、約48000、約49000、約50000、約51000、約52000、約53000、約54000、約55000、約56000、約57000、約58000、約59000、約60000、約61000、約62000、約63000、約64000、約65000、約66000、約67000、約68000、約69000、約70000、約71000、約72000、約73000、約74000、約75000、約76000、約77000、約78000、約79000、約80000、約81000、約82000、約83000、約84000、約85000、約86000、約87000、約88000、約89000、約90000、約91000、約92000、約93000、約94000、約95000、約96000、約97000、約98000、約99000、約100000、約101000、約102000、約103000、約104000、約105000、約106000、約107000、約108000、約109000、約110000、約111000、約112000、約113000、約114000、約115000、約116000、約117000、約118000、約119000、約120000、約121000、約122000、約123000、約124000、約125000、約126000、約127000、約128000、約129000、約130000、約131000、約132000、約133000、約134000、約135000、約136000、約137000、約138000、約139000、約140000、約141000、約142000、約143000、約144000、約145000、約146000、約147000、約148000、約149000、約150000、約151000、約152000、約153000、約154000、約155000、約156000、約157000、約158000、約159000、約160000、約161000、約162000、約163000、約164000、約165000、約166000、約167000、約168000、約169000、約170000、約171000、約172000、約173000、約174000、約175000、約176000、約177000、約178000、約179000、約180000、約181000、約182000、約183000、約184000、約185000、約186000、約187000、約188000、約189000、約190000、約191000、約192000、約193000、約194000、約195000、約196000、約197000、約198000、約199000、約200000、約201000、約202000、約203000、約204000、約205000、約206000、約207000、約208000、約209000、約210000、約211000、約212000、約213000、約214000、約215000、約216000、約217000、約218000、約219000、約220000、約221000、約222000、約223000、約224000、約225000、約226000、約227000、約228000、約229000、約230000、約231000、約232000、約233000、約234000、約235000、約236000、約237000、約238000、約239000、約240000、約241000、約242000、約243000、約244000、約245000、約246000、約247000、約248000、約249000、約250000、約251000、約252000、約253000、約254000、約255000、約256000、約257000、約258000、約259000、約260000、約261000、約262000、約263000、約264000、約265000、約266000、約267000、約268000、約269000、約270000、約271000、約272000、約273000、約274000、約275000、約276000、約277000、約278000、約279000、約280000、約281000、約282000、約283000、約284000、約285000、約286000、約287000、約288000、約289000、約290000、約291000、約292000、約293000、約294000、約295000、約296000、約297000、約298000、約299000、約300000、約301000、約302000、約303000、約304000、約305000、約306000、約307000、約308000、約309000、約310000、約311000、約312000、約313000、約314000、約315000、約316000、約317000、約318000、約319000、約320000、約321000、約322000、約323000、約324000、約325000、約326000、約327000、約328000、約329000、約330000、約331000、約332000、約333000、約334000、約335000、約336000、約337000、約338000、約339000、約340000、約341000、約342000、約343000、約344000、約345000、約346000、約347000、約348000、約349000、約350000、約351000、約352000、約353000、約354000、約355000、約356000、約357000、約358000、約359000、約360000、約361000、約362000、約363000、約364000、約365000、約366000、約367000、約368000、約369000、約370000、約371000、約372000、約373000、約374000、約375000、約376000、約377000、約378000、約379000、約380000、約381000、約382000、約383000、約384000、約385000、約386000、約387000、約388000、約389000、約390000、約391000、約392000、約393000、約394000、約395000、約396000、約397000、約398000、約399000、約400000、約401000、約402000、約403000、約404000、約405000、約406000、約407000、約408000、約409000、約410000、約411000、約412000、約413000、約414000、約415000、約416000、約417000、約418000、約419000、約420000、約421000、約422000、約423000、約424000、約425000、約426000、約427000、約428000、約429000、約430000、約431000、約432000、約433000、約434000、約435000、約436000、約437000、約438000、約439000、約440000、約441000、約442000、約443000、約444000、約445000、約446000、約447000、約448000、約449000、約450000、約451000、約452000、約453000、約454000、約455000、約456000、約457000、約458000、約459000、約460000、約461000、約462000、約463000、約464000、約465000、約466000、約467000、約468000、約469000、約470000、約471000、約472000、約473000、約474000、約475000、約476000、約477000、約478000、約479000、約480000、約481000、約482000、約483000、約484000、約485000、約486000、約487000、約488000、約489000、約490000、約491000、約492000、約493000、約494000、約495000、約496000、約497000、約498000、約499000、約500000、約501000、約502000、約503000、約504000、約505000、約506000、約507000、約508000、約509000、約510000、約511000、約512000、約513000、約514000、約515000、約516000、約517000、約518000、約519000、約520000、約521000、約522000、約523000、約524000、約525000、約526000、約527000、約528000、約529000、約530000、約531000、約532000、約533000、約534000、約535000、約536000、約537000、約538000、約539000、約540000、約541000、約542000、約543000、約544000、約545000、約546000、約547000、約548000、約549000、約550000、約551000、約552000、約553000、約554000、約555000、約556000、約557000、約558000、約559000、約560000、約561000、約562000、約563000、約564000、約565000、約566000、約567000、約568000、約569000、約570000、約571000、約572000、約573000、約574000、約575000、約576000、約577000、約578000、約579000、約580000、約581000、約582000、約583000、約584000、約585000、約586000、約587000、約588000、約589000、約590000、約591000、約592000、約593000、約594000、約595000、約596000、約597000、約598000、約599000、約600000、約601000、約602000、約603000、約604000、約605000、約606000、約607000、約608000、約609000、約610000、約611000、約612000、約613000、約614000、約615000、約616000、約617000、約618000、約619000、約620000、約621000、約622000、約623000、約624000、約625000、約626000、約627000、約628000、約629000、約630000、約631000、約632000、約633000、約634000、約635000、約636000、約637000、約638000、約639000、約640000、約641000、約642000、約643000、約644000、約645000、約646000、約647000、約648000、約649000、約650000、約651000、約65200
0、約653000、約654000、約655000、約656000、約657000、約658000、約659000、約660000、約661000、約662000、約663000、約664000、約665000、約666000、約667000、約668000、約669000、約670000、約671000、約672000、約673000、約674000、約675000、約676000、約677000、約678000、約679000、約680000、約681000、約682000、約683000、約684000、約685000、約686000、約687000、約688000、約689000、約690000、約691000、約692000、約693000、約694000、約695000、約696000、約697000、約698000、約699000、約700000、約701000、約702000、約703000、約704000、約705000、約706000、約707000、約708000、約709000、約710000、約711000、約712000、約713000、約714000、約715000、約716000、約717000、約718000、約719000、約720000、約721000、約722000、約723000、約724000、約725000、約726000、約727000、約728000、約729000、約730000、約731000、約732000、約733000、約734000、約735000、約736000、約737000、約738000、約739000、約740000、約741000、約742000、約743000、約744000、約745000、約746000、約747000、約748000、約749000、約750000、約751000、約752000、約753000、約754000、約755000、約756000、約757000、約758000、約759000、約760000、約761000、約762000、約763000、約764000、約765000、約766000、約767000、約768000、約769000、約770000、約771000、約772000、約773000、約774000、約775000、約776000、約777000、約778000、約779000、約780000、約781000、約782000、約783000、約784000、約785000、約786000、約787000、約788000、約789000、約790000、約791000、約792000、約793000、約794000、約795000、約796000、約797000、約798000、約799000、約800000、約801000、約802000、約803000、約804000、約805000、約806000、約807000、約808000、約809000、約810000、約811000、約812000、約813000、約814000、約815000、約816000、約817000、約818000、約819000、約820000、約821000、約822000、約823000、約824000、約825000、約826000、約827000、約828000、約829000、約830000、約831000、約832000、約833000、約834000、約835000、約836000、約837000、約838000、約839000、約840000、約841000、約842000、約843000、約844000、約845000、約846000、約847000、約848000、約849000、約850000、約851000、約852000、約853000、約854000、約855000、約856000、約857000、約858000、約859000、約860000、約861000、約862000、約863000、約864000、約865000、約866000、約867000、約868000、約869000、約870000、約871000、約872000、約873000、約874000、約875000、約876000、約877000、約878000、約879000、約880000、約881000、約882000、約883000、約884000、約885000、約886000、約887000、約888000、約889000、約890000、約891000、約892000、約893000、約894000、約895000、約896000、約897000、約898000、約899000、約900000、約901000、約902000、約903000、約904000、約905000、約906000、約907000、約908000、約909000、約910000、約911000、約912000、約913000、約914000、約915000、約916000、約917000、約918000、約919000、約920000、約921000、約922000、約923000、約924000、約925000、約926000、約927000、約928000、約929000、約930000、約931000、約932000、約933000、約934000、約935000、約936000、約937000、約938000、約939000、約940000、約941000、約942000、約943000、約944000、約945000、約946000、約947000、約948000、約949000、約950000、約951000、約952000、約953000、約954000、約955000、約956000、約957000、約958000、約959000、約960000、約961000、約962000、約963000、約964000、約965000、約966000、約967000、約968000、約969000、約970000、約971000、約972000、約973000、約974000、約975000、約976000、約977000、約978000、約979000、約980000、約981000、約982000、約983000、約984000、約985000、約986000、約987000、約988000、約989000、約990000、約991000、約992000、約993000、約994000、約995000、約996000、約997000、約998000、約999000、約1000000、約1001000、約1002000、約1003000、約1004000、約1005000、約1006000、約1007000、約1008000、約1009000、約1010000、約1011000、約1012000、約1013000、約1014000、約1015000、約1016000、約1017000、約1018000、約1019000、約1020000、約1021000、約1022000、約1023000、約1024000、約1025000、約1026000、約1027000、約1028000、約1029000、約1030000、約1031000、約1032000、約1033000、約1034000、約1035000、約1036000、約1037000、約1038000、約1039000、約1040000、約1041000、約1042000、約1043000、約1044000、約1045000、約1046000、約1047000、約1048000、約1049000、約1050000、約1051000、約1052000、約1053000、約1054000、約1055000、約1056000、約1057000、約1058000、約1059000、約1060000、約1061000、約1062000、約1063000、約1064000、約1065000、約1066000、約1067000、約1068000、約1069000、約1070000、約1071000、約1072000、約1073000、約1074000、約1075000、約1076000、約1077000、約1078000、約1079000、約1080000、約1081000、約1082000、約1083000、約1084000、約1085000、約1086000、約1087000、約1088000、約1089000、約1090000、約1091000、約1092000、約1093000、約1094000、約1095000、約1096000、約1097000、約1098000、約1099000、約1100000、約1101000、約1102000、約1103000、約1104000、約1105000、約1106000、約1107000、約1108000、約1109000、約1110000、約1111000、約1112000、約1113000、約1114000、約1115000、約1116000、約1117000、約1118000、約1119000、約1120000、約1121000、約1122000、約1123000、約1124000、約1125000、約1126000、約1127000、約1128000、約1129000、約1130000、約1131000、約1132000、約1133000、約1134000、約1135000、約1136000、約1137000、約1138000、約1139000、約1140000、約1141000、約1142000、約1143000、約1144000、約1145000、約1146000、約1147000、約1148000、約1149000、約1150000、約1151000、約1152000、約1153000、約1154000、約1155000、約1156000、約1157000、約1158000、約1159000、約1160000、約1161000、約1162000、約1163000、約1164000、約1165000、約1166000、約1167000、約1168000、約1169000、約1170000、約1171000、約1172000、約1173000、約1174000、約1175000、約1176000、約1177000、約1178000、約1179000、約1180000、約1181000、約1182000、約1183000、約1184000、約1185000、約1186000、約1187000、約1188000、約1189000、約1190000、約1191000、約1192000、約1193000、約1194000、約1195000、約1196000、約1197000、約1198000、約1199000、約1200000、約1201000、約1202000、約1203000、約1204000、約1205000、約1206000、約1207000、約1208000、約1209000、約1210000、約1211000、約1212000、約1213000、約1214000、約1215000、約1216000、約1217000、約1218000、約1219000、約1220000、約1221000、約1222000、約1223000、約1224000、約1225000、約1226000、約1227000、約1228000、約1229000、約1230000、約1231000、約1232000、約1233000、約1234000、約1235000、約1236000、約1237000、約1238000、約1239000、約1240000、約1241000、約1242000、約1243000、約1244000、約1245000、約1246000、約1247000、約1248000、約1249000、約1250000、約1251000、約1252000、約1253000、約1254000、約1255000、約1256000、約1257000、約1258000、約1259000、約12
60000、約1261000、約1262000、約1263000、約1264000、約1265000、約1266000、約1267000、約1268000、約1269000、約1270000、約1271000、約1272000、約1273000、約1274000、約1275000、約1276000、約1277000、約1278000、約1279000、約1280000、約1281000、約1282000、約1283000、約1284000、約1285000、約1286000、約1287000、約1288000、約1289000、約1290000、約1291000、約1292000、約1293000、約1294000、約1295000、約1296000、約1297000、約1298000、約1299000、約1300000、約1301000、約1302000、約1303000、約1304000、約1305000、約1306000、約1307000、約1308000、約1309000、約1310000、約1311000、約1312000、約1313000、約1314000、約1315000、約1316000、約1317000、約1318000、約1319000、約1320000、約1321000、約1322000、約1323000、約1324000、約1325000、約1326000、約1327000、約1328000、約1329000、約1330000、約1331000、約1332000、約1333000、約1334000、約1335000、約1336000、約1337000、約1338000、約1339000、約1340000、約1341000、約1342000、約1343000、約1344000、約1345000、約1346000、約1347000、約1348000、約1349000、約1350000、約1351000、約1352000、約1353000、約1354000、約1355000、約1356000、約1357000、約1358000、約1359000、約1360000、約1361000、約1362000、約1363000、約1364000、約1365000、約1366000、約1367000、約1368000、約1369000、約1370000、約1371000、約1372000、約1373000、約1374000、約1375000、約1376000、約1377000、約1378000、約1379000、約1380000、約1381000、約1382000、約1383000、約1384000、約1385000、約1386000、約1387000、約1388000、約1389000、約1390000、約1391000、約1392000、約1393000、約1394000、約1395000、約1396000、約1397000、約1398000、約1399000、または約1400000塩基対であることができる。
【0056】
(c)特定のタンパク質-核酸複合体
特定の実施形態において、タンパク質-核酸複合体は、(i)ヌクレアーゼ欠損Cas9またはCas12a変異体、および(ii)シチジンデアミナーゼまたはアデノシンなどの塩基編集因子を含む、操作されたRNA誘導(CRISPR)核酸塩基修飾系を含むことができる。デアミナーゼ(またはその触媒ドメイン)は、バクテロイデス染色体に結合または関連している。いくつかの実施形態において、操作されたRNA誘導(CRISPR)核酸塩基修飾系は、シチジンデアミナーゼまたはアデノシンデアミナーゼ(またはその触媒ドメイン)に連結されたヌクレアーゼ欠損Cas9またはCas12a変異体を含む。
【0057】
(II)タンパク質-核酸複合体の生成方法
本開示のさらなる態様は、セクション(I)に上述したように、操作されたRNA誘導(CRISPR)核酸塩基修飾系およびHUファミリーDNA結合タンパク質をコードする細菌染色体を含む複合体を生成するための方法を提供する。前記方法は、(a)細菌染色体中の特定の遺伝子座を標的とするように核酸塩基修飾系のCRISPR系を操作すること、および(b)操作されたRNA誘導(CRISPR)核酸塩基修飾系をバクテロイデス種/株に導入することを含む。
【0058】
核酸塩基修飾系のCRISPR系を操作することは、そのcrRNAガイド配列が、PAM配列(によって認識される)に隣接する細菌染色体中の特定の(-約19-22nt)配列または遺伝子座を標的とするガイドRNAを設計することを含む。そのtracrRNA配列は、セクション(I)(a)(i)に記載したように、目的のCRISPRタンパク質によって認識される。
【0059】
操作されたCRISPR核酸塩基修飾系は、少なくとも1つのコード核酸として細菌細胞に導入することができる。例えば、コード核酸は、1つまたは複数のベクターの一部であることができる。操作されたCRISPR核酸塩基修飾系(例えば、CRISPR塩基編集因子融合および1つまたは複数のgRNA)をコードするベクターは、プラスミドベクター、ファージミドベクター、ウイルスベクター、バクテリオファージベクター、バクテリオファージ-プラスミドハイブリッドベクター、または他の適切なベクターであることができる。ベクターは、組み込みベクター、コンジュゲーションベクター、シャトルベクター、発現ベクター、染色体外ベクターなどであることができる。種々のベクターをバクテロイデスに送達または導入するための手段は、当技術分野で周知である。
【0060】
CRISPR-塩基編集因子融合をコードする核酸配列は、目的の細菌における発現のためにプロモーターに作動可能に連結することができる。特定の実施形態において、CRISPR塩基編集因子融合をコードする配列は、調節プロモーターに作動可能に連結することができる。いくつかの局面において、調節プロモーターは、プロモーター誘導化学物質によって調節されることができる。かかる実施形態において、プロモーターはpTetOであり、これは大腸菌Tn10由来のtet調節系に基づいており、強力なtetオペレーター(tetO)含有マイコバクテリアプロモーターおよびリプレッサーTetRについての発現カセットで構成されており、プロモーター誘導化学物質は無水テトラサイクリン(aTc)であることができる。他の実施形態において、プロモーターはpBADまたはaraC-ParaBADであることができ、プロモーター誘導化学物質はアラビノースであることができる。さらなる実施形態において、プロモーターはpLacまたはtac(trp-lac)であることができ、プロモーター誘導化学物質はラクトース/IPTGであることができる。他の実施形態において、プロモーターはpPrpBであることができ、プロモーター誘導化学物質はプロピオン酸であることができる。
【0061】
少なくとも1つのガイドRNAをコードする核酸配列は、目的の細菌における発現のためにプロモーターに作動可能に連結されることができる。一般に、少なくとも1つのガイドRNAの発現は、構成的プロモーターによって調節することができる。目的の細菌がバクテロイデス属である実施形態において、構成的プロモーターは、B.thetaiotaomicron 16S rRNA遺伝子BT_r09の上流にあるP1プロモーターであることができる(Wegmann et al., Applied Environ. Microbiol., 2013, 79:1980-1989)。他の適切なバクテロイデスプロモーターは、P2、P1TD、P1TP、P1TDP(Lim et al., Cell, 2017, 169:547-558)、PAM、PcfiA、PcepA、PBT1311 (Mimee et al., Cell Systems, 2015, 1:62-71)または前述のプロモーターのいずれかの変異体を含む。他の実施形態において、構成的プロモーターは、大腸菌σ70プロモーターまたはその誘導体、枯草菌σAプロモーターまたはその誘導体、またはサルモネラPspv2プロモーターまたはその誘導体であることができる。当業者は、目的の細菌に適した追加の構成的プロモーターに精通している。
【0062】
いくつかの実施形態において、ベクターは組み込みベクターであることができ、リコンビナーゼをコードする配列、ならびに1つまたは複数のリコンビナーゼ認識部位をさらに含むことができる。一般に、リコンビナーゼは不可逆的なリコンビナーゼである。適切なリコンビナーゼの非限定的な例は、バクテロイデスのintN2チロシンインテグラーゼ(NBU2遺伝子によってコードされる)、ストレプトマイセスファージphiC31(ΦC31)リコンビナーゼ、コリファージP4リコンビナーゼ、コリファージラムダインテグラーゼ、リステリアA118ファージリコンビナーゼ、およびアクチノファージR4Sreリコンビナーゼを含む。リコンビナーゼ/インテグラーゼは、2つの配列特異的認識(または付着)部位(例えば、attP部位およびattB部位)間の組換えを媒介する。いくつかの実施形態において、ベクターは、リコンビナーゼ認識部位(例えば、attP)の1つを含むことができ、他のリコンビナーゼ認識部位(例えば、attB)は、細菌の染色体中(例えば、tRNA-Ser遺伝子の近く)に位置することができる。かかる状況において、ベクター全体を細菌染色体に組み込むことができる。他の実施形態において、操作されたCRISPR核酸塩基修飾系をコードする配列は、操作されたCRISPR核酸塩基修飾系をコードする配列のみが細菌染色体に組み込まれるように、2つのリコンビナーゼ認識部位に隣接することができる。
【0063】
上記のベクターのいずれも、少なくとも1つの転写終結配列、ならびに少なくとも1つの複製起点および/または目的のバクテロイデス細胞における増殖および選択のための少なくとも1つの選択マーカー配列(例えば、抗生物質耐性遺伝子)をさらに含むことができる。
【0064】
ベクターおよびその使用に関する追加情報は、「Current Protocols in Molecular Biology」Ausubel et al., John Wiley & Sons, New York, 2003 または「Molecular Cloning: A Laboratory Manual」Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001に記載されている。
【0065】
操作されたCRISPR核酸塩基修飾系をコードするベクターが組み込みベクターである実施形態において、操作された系をコードする核酸(またはベクター全体)は、生物へのベクターの送達(およびリコンビナーゼ/インテグラーゼの発現)後にバクテロイデス染色体に安定して組み込まれることができる。 操作されたCRISPR核酸塩基修飾系をコードするベクターが組み込みベクターではない実施形態において、ベクターは、ベクターの菌への送達後、染色体外に留まることができる。
【0066】
CRISPR-塩基編集因子融合体をコードする核酸配列が誘導性プロモーターに作動可能に連結されている実施形態において、CRISPR核酸塩基修飾系の発現は、プロモーター誘導化学物質を細菌に導入することによって誘導することができる。 特定の実施形態において、プロモーター誘導化学物質は、無水テトラサイクリンであることができる。 誘導されると、CRISPR塩基編集因子融合物が合成され、少なくとも1つのガイドRNAと複合体を形成し、CRISPR核酸塩基修飾系を細菌染色体中の標的遺伝子座に標的化し、それによって本明細書に開示されるタンパク質-核酸複合体を形成する。
【0067】
(III)細菌における核酸塩基を修飾する方法
本開示のさらなる態様は、バクテロイデスの標的メンバーの染色体中の少なくとも1つの核酸塩基を修飾するための方法を包含する。この方法は、標的種/株において操作されたRNA誘導(CRISPR)核酸塩基修飾系を発現させることを含み、ここで、操作されたRNA誘導(CRISPR)核酸塩基修飾系は、標的細菌染色体中の特定の遺伝子座を標的とし、操作されたRNA誘導核酸塩基修飾系は、特定の遺伝子座内の少なくとも1つの核酸塩基を修飾して、特定の遺伝子座を含む遺伝子が修飾および/または不活性化されるようにし、ここで標的細菌種/株の染色体はHUファミリーDNA結合タンパク質をコードする配列番号1に対して少なくとも50%の配列同一性(例えば、配列番号1に対して、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または少なくとも99%の配列同一性)を有するアミノ酸配列を含む。核酸塩基修飾(例えば、シトシンからチミンへの変換、またはアデニンからグアニンへの変換)は、特定の遺伝子座内に一塩基多型(SNP)および/または停止コドンを導入することができる。少なくとも1つの核酸塩基修飾の結果として、標的細菌は、特定の遺伝子座を含む少なくとも1つの遺伝子の発現を変更、低減、または排除することができる。
【0068】
セクション(I)(a)に上述したRNA誘導型(CRISPR)核酸塩基修飾系のいずれかを、セクション(II)に上述したように操作して、上記のセクション(I)(b)に記載されている、目的のバクテロイデスの系統発生的系統における細菌種/株の染色体中の特定の遺伝子座を標的とすることができる。操作されたCRISPR核酸塩基修飾系は、上記のセクション(II)に記載したように、ベクターの一部として細菌に導入できる。一般に、CRISPR-核酸塩基修飾系は誘導性である(例えば、CRISPR-塩基編集因子融合をコードする核酸配列は、誘導性プロモーターに作動可能に連結される)。そのため、CRISPR核酸塩基修飾系は、定義された時点で発現させることができる。化学物質を誘導するプロモーターが存在しない場合、CRISPR核酸塩基修飾系を生成することはできない。セクション(II)に上述したように、CRISPR-塩基編集因子融合タンパク質が染色体に組み込まれたコード配列または染色体外コード配列から発現されるように、細菌をプロモーター誘導化学物質に曝露することによって、CRISPR-塩基編集因子融合を生成することができる。CRISPR塩基編集因子融合体は、染色体に組み込まれたコード配列または染色体外コード配列から構成的に発現される少なくとも1つのガイドRNAと複合体を形成し、それによって活性なCRISPR核酸塩基修飾系を形成する。CRISPR核酸塩基修飾系は、細菌染色体の特定の遺伝子座を標的とし、そこで少なくとも1つの核酸塩基を修飾して、特定の遺伝子座を含む遺伝子の発現が変化、減少、または排除されるようにする。
【0069】
いくつかの実施形態において、標的生物は、上記のセクション(I)(b)に詳述したように、バクテロイデス種または株レベル変異体であることができる。
【0070】
他の実施形態において、生物は哺乳動物の消化管(または腸)に収容されることができ、プロモーター誘導化学物質の投与は、腸内微生物叢の標的細菌のレベルを低下または排除してもよい核酸塩基修飾(例えば、シトシンからチミンへの変換またはアデニンからグアニンへの変換)をもたらすことができる。プロモーター誘導化学物質は、経口投与することができる(例えば、食品、飲料、または薬学的製剤を介して)。哺乳動物は、マウス、ラット、または他の研究動物であることができる。特定の実施形態において、哺乳動物はヒトであることができる。例えば、標的細菌生物(例えば、バクテロイデス属のメンバー)の減少または排除は、改善された腸の健康につながることができる。
【0071】
(細胞培養または消化管中の)細菌の混合集団は、多種多様な分類群を含むことができる。たとえば、ヒトの腸内微生物叢は、何百もの異なる種の細菌を含み、相当な株レベルの多様性を伴う。
【0072】
特定の実施形態において、哺乳動物(例えば、ヒト)は、癌免疫療法を受けている可能性があり、免疫療法応答者は、非応答者と比較して、腸内細菌叢におけるバクテロイデス種のレベルが低いことが示されている(Gopalakrishnan et al., Science, 2018, 359:97-103)。したがって、腸内微生物叢におけるバクテロイデス種のレベルの低下は、より良いヒト癌免疫療法の結果につながることができる。
【0073】
特定の実施形態において、哺乳動物(例えば、ヒト、イヌ、ネコ、ブタ、ウマ、またはウシ)は、炎症性腸疾患、クローン病、憩室炎、腸閉塞、ポリープ除去、癌組織除去、潰瘍性大腸炎、腸切除、直腸切除、結腸全摘、または結腸部分切除を含むさまざまな理由で腸の手術を受けることができ、ここで、誘導性CRISPR核酸塩基修飾系による哺乳類の腸内の手術前のBacteroides fragilis種の弱毒化は、腸の外側であるが哺乳類の体内の場所でのB.fragilisによる手術後の感染のリスクを減らすことができる。腸の外側の場所は、腸の外面を含む。B.fragilis内の誘導性CRISPR核酸塩基修飾系は、病原性島、毒素(すなわち、B.fragilis毒素またはBFT)、またはB.fragilisまたは術後感染症を引き起こすことが知られている他の天然の腸内細菌の感染株に関連する他のユニークな配列に限定されないが似ている場所を修飾するように標的化されることができる。例えば、非毒素原性B.fragilis(NTBF)および腸毒素原性B.fragilis(ETBF)のレベルは、NTBF株ではなくETBF株内に配置された操作された誘導性CRISPR核酸塩基修飾系を使用して選択的に調節されることができる。腸の手術後に感染症を引き起こすリスクのあるその他の腸内細菌は、Bacteroides capillosis、Escherichia coli、Enterococcus faecalis、Gamella haemolysan、Morganella morganiiを含んでもよい。誘導性CRISPR核酸塩基修飾系の腸内微生物叢への送達は、手術前、手術中、または手術後のプロバイオティクス治療の一部として発生することができる。標的細菌への誘導性CRISPR核酸塩基修飾系の送達は、哺乳動物の体外または哺乳動物の体内で発生することができる。標的細菌への誘導性CRISPR核酸塩基修飾系の送達は、プラスミドまたはバクテリオファージなどの核酸ベクターを介して発生することができる。プラスミドの送達は、エレクトロポレーション、化学的形質転換、または細菌から細菌へのコンジュゲーションを介して発生することができる。
【0074】
(IV)プロバイオティクスとしてのCRISPR組み込み細菌種/株
本開示のさらに別の態様は、例えばプロバイオティクスとして使用するための操作された細菌株を包含する。操作された株は、セクション(I)(a)に記載の操作されたCRISPR核酸塩基修飾系のいずれかを含み、細菌染色体に組み込まれるか、対象の生物内でエピソームベクターとして維持される。いくつかの実施形態において、操作された細菌は、誘導性CRISPR核酸塩基修飾系を含む操作されたバクテロイデスである。操作されたバクテロイデスの哺乳動物対象への投与およびそれに続くCRISPR系の誘導を使用して、細菌染色体の特定の遺伝子座を標的とすることができる。このCRISPR系による少なくとも1つの核酸塩基の修飾は、特定の遺伝子座を含む遺伝子の発現が変化、減少、または排除され、それによって哺乳動物対象に治療的利益を提供する。他の実施形態において、バクテロイデス株は、腸内細菌叢においてバクテロイデスの野生型株を打ち負かすように操作することができる。これらおよび他の実施形態において、哺乳動物対象に治療上の利益を提供する操作されたバクテロイデス株は、その後、誘導性CRISPR核酸塩基修飾系の誘導によって哺乳動物対象から除去することができる。
【0075】
定義
別段の定義がない限り、本明細書で使用されるすべての技術語および科学語は、本発明が属する分野の当業者によって一般的に理解される意味を有する。以下の参考文献は、本発明で使用される多くの語の一般的な定義を当業者に提供する:Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd Ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); および Hale & Marham, The Harper Collins Dictionary of Biology (1991)。本明細書で使用される場合、以下の語は、別段の指定がない限り、それらに帰する意味を有する。
【0076】
本開示またはその好ましい実施形態の要素を紹介する時、冠詞「a」、「an」、「その(the)」および「前記」は、1つまたは複数の要素があることを意味することを意図している。「含む(comprising)」、「含む(including)」、および「有する」なる語は包括的であることを意図しており、列挙された要素以外の追加の要素が存在することができることを意味する。
【0077】
数値xに関して使用される場合、語「約」は、例えば、x±5%を意味する。
【0078】
本明細書で使用される場合、語「相補的」または「相補性」は、特定の水素結合を介した塩基対形成による二本鎖核酸の結合を指す。塩基ペアリングは、標準的なワトソン・クリック塩基ペアリング(例えば、相補配列3’-TCAG-5’との5’-AGTC-3’ペア)であってもよい。塩基対はまた、フーグスティーンまたは逆フーグスティーン水素結合であってもよい。相補性は通常、二重鎖領域に関して測定されるため、例えばオーバーハングは除外される。二重鎖領域の2つの鎖間の相補性は部分的であり、塩基の一部(例えば、70%)のみが相補的である場合、パーセンテージ(例えば、70%)として表されることができる。相補的でない塩基は「ミスマッチ」である。二重鎖領域内のすべての塩基が相補的である場合、相補性も完全(すなわち、100%)であることができる。
【0079】
遺伝子またはポリヌクレオチドに関する「発現」なる語は、遺伝子またはポリヌクレオチドの転写、および必要に応じて、mRNA転写物のタンパク質またはポリペプチドへの翻訳を指す。したがって、文脈から明らかなように、タンパク質またはポリペプチドの発現は、オープンリーディングフレームの転写および/または翻訳から生じる。
【0080】
本明細書で使用される場合、「遺伝子」は、遺伝子産物をコードするDNA領域(エキソンおよびイントロンを含む)、ならびに、かかる調節配列がコードおよび/または転写配列に隣接しているかどうかに関わらず遺伝子産物の産生を調節するすべてのDNA領域を指す。したがって、遺伝子は、プロモーター配列、ターミネーター、リボソーム結合部位および内部リボソーム侵入部位などの翻訳調節配列、エンハンサー、サイレンサー、絶縁体、境界要素、複製起点、マトリックス付着部位、および遺伝子座を含むが、必ずしもこれらに限定されない領域を制御する。
【0081】
「異種」なる語は、目的の細胞に対して内因性でもネイティブでもない実体を指す。例えば、異種タンパク質は、外因的に導入された核酸配列などの外因性供給源に由来する、または元々由来したタンパク質を指す。場合によっては、異種タンパク質は、目的の細胞によって正常に産生されない。
【0082】
「ニッカーゼ」なる語は、二本鎖核酸配列の一方の鎖を切断する酵素を指す。
【0083】
「エンドヌクレアーゼ」なる語と交換可能に使用される「ヌクレアーゼ」なる語は、二本鎖核酸配列の両方の鎖を切断するか、または一本鎖核酸配列を切断する酵素を指す。
【0084】
「核酸」および「ポリヌクレオチド」なる語は、線状または環状コンフォメーション、および一本鎖または二本鎖形態のデオキシリボヌクレオチドまたはリボヌクレオチドポリマーを指す。本開示の目的のために、これらの語は、ポリマーの長さに関して限定的であると解釈されるべきではない。この語は、天然のヌクレオチドの既知の類似体、ならびに塩基、糖および/またはリン酸部分(例えば、ホスホロチオエート骨格)が修飾されたヌクレオチドを包含することができる。一般に、特定のヌクレオチドの類似体は、同じ塩基対特異性を有する、つまり、Aの類似体はTと塩基対を形成する。
【0085】
「ヌクレオチド」なる語は、デオキシリボヌクレオチドまたはリボヌクレオチドを指す。ヌクレオチドは、標準ヌクレオチド(すなわち、アデノシン、グアノシン、シチジン、チミジン、およびウリジン)、ヌクレオチド異性体、またはヌクレオチド類似体であることができる。ヌクレオチド類似体は、修飾されたプリンまたはピリミジン塩基または修飾されたリボース部分を有するヌクレオチドを指す。ヌクレオチド類似体は、天然に存在するヌクレオチド(例えば、イノシン、プソイドウリジンなど)または非天然に存在するヌクレオチドであることができる。ヌクレオチドの糖部分または塩基部分に対する修飾の非限定的な例は、アセチル基、アミノ基、カルボキシル基、カルボキシメチル基、ヒドロキシル基、メチル基、ホスホリル基、およびチオール基の付加(または除去)、並びに塩基の炭素原子および窒素原子の他の原子での置換(例えば7-デアザプリン)を含む。ヌクレオチド類似体は、ジデオキシヌクレオチド、2’-O-メチルヌクレオチド、ロックド核酸(LNA)、ペプチド核酸(PNA)、およびモルホリノも含む。
【0086】
「ポリペプチド」および「タンパク質」なる語は、アミノ酸残基のポリマーを指すために交換可能に使用される。
【0087】
「標的配列」、「標的部位」および「特定の遺伝子座」なる語は、CRISPR系が標的とする目的の核酸(例えば、染色体DNAまたは細胞RNA)の特定の配列、およびCRISPR系が核酸または核酸に関連するタンパク質を修飾する部位を指すのに交換可能に使用される。
【0088】
核酸およびアミノ酸配列の同一性を決定するための技術は、当技術分野で既知である。典型的には、かかる技術は、遺伝子のmRNAのヌクレオチド配列を決定すること、および/またはそれによってコードされるアミノ酸配列を決定すること、およびこれらの配列を第2のヌクレオチドまたはアミノ酸配列と比較することを含む。ゲノム配列も、この方法で決定および比較することができる。一般に、同一性とは、それぞれ2つのポリヌクレオチドまたはポリペプチド配列の正確なヌクレオチド対ヌクレオチドまたはアミノ酸対アミノ酸の対応を指す。2つ以上の配列(ポリヌクレオチドまたはアミノ酸)は、それらの同一性パーセントを決定することによって比較できる。2つの配列の同一性パーセントは、核酸配列であろうとアミノ酸配列であろうと、2つのアラインメントされた配列間の正確な一致の数を短い方の配列の長さで割り、100を掛けたものである。核酸配列のおおよそのアラインメントは、Smith and Waterman, Advances in Applied Mathematics 2:482-489 (1981) の局所相同性アルゴリズムによって提供される。このアルゴリズムは、Dayhoff, Atlas of Protein Sequences and Structure, M. O. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical Research Foundation, Washington, D.C., USAによって開発されたスコアリング行列、およびGribskov, Nucl. Acids Res. 14(6):6745-6763 (1986)によって正規化されたスコアリングマトリックスを使用することによりアミノ酸配列に適用できる。配列のパーセント同一性を決定するためのこのアルゴリズムの例示的な実施は、「BestFit」実用出願においてGenetics Computer Group(Madison、WI)によって提供される。配列間の同一性または類似性のパーセントを計算するための他の適切なプログラムは、当技術分野で一般的に知られており、例えば、別のアラインメントプログラムはBLASTであり、デフォルトパラメータと共に使用される。たとえば、BLASTNおよびBLASTPは、次のデフォルトパラメータを使用して使用できる:genetic code=standard;filter=none;strand=both;cutoff=60;expect=10;Matrix=BLOSUM62;Descriptions=50sequences;sort by=HIGH SCORE;Databases=non-redundant,GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+Swiss protein+Spupdate+PIR。これらのプログラムの詳細は、GenBankのウェブサイト上に見出すことができる。
【0089】
本発明の範囲から逸脱することなく、上記の細胞および方法に様々な変更を加えることができるため、上記の説明および以下に示す実施例に含まれるすべての事項は、限定的な意味でなく、例示として解釈されるべきであることが意図されている。
【0090】
実施例
以下の実施例は、本開示のある態様を例示する。
【0091】
実施例1.Bacteroides thetaiotaomicronにおけるCRISPR塩基編集
バクテロイデスにおけるデアミナーゼ媒介標的塩基編集を、DNA切断または鋳型ドナーDNAなしで、ガイドRNAによって特定される標的遺伝子座でヌクレオチドを直接編集するために行った(
図1)。細胞死を誘導することなく、ほぼ100%の編集効率が達成され、ゆえにバクテロイデスのゲノム操作に適する。
【0092】
バクテロイデスのdCas9-AlDベクターpNBU2.CRISPR-CDAを、構築した。このベクターは、(i)無水テトラサイクリン誘導性プロモーターの下のPetromyzonmarinusのシトシンデアミナーゼPmCDA1(CDA)に融合した触媒的に不活性化されたCas9(dCas:D10AおよびH840A変異)、および(ii)構成プロモーターPIの下の20ヌクレオチド(nt)の標的配列-gRNA足場ハイブリッド(sgRNA)を発現する。このプラスミドは、大腸菌におけるアンピシリン選択のためのR6K複製起点およびbla配列、コンジュゲーションのためのRP4-oriT配列、およびバクテロイデスにおけるエリスロマイシン(Em)選択のためのermG配列を含む。NBU2は、pNBU2.CRISPR-CDAプラスミド上のattN2部位とバクテロイデス細胞の染色体上に位置するattB部位の1つとの間の配列特異的組換えを媒介するintN2チロシンインテグラーゼをコードする(Wang et al., J. Bacteriology, 2000, 182( 12):3559-3571)。NBU2インテグラーゼ認識配列(attN2/attB)は、5’-CCTGTCTCTCCGC-3’(配列番号:2)である。CRISPR-CDAユニットは、Petromyzon marinusシトシンデアミナーゼ(PmCDA1)と融合したD10AおよびH840A変異を有する、誘導可能なヌクレアーゼ欠損SpCas9で構成される。dCas9-CDA1融合を、無水テトラサイクリン(aTc)の制御下でTetRレギュレーター(P2-A21-tetR、P1TDP-GH023-dSpCas9-PmCDA1)によって制御し、ガイドRNAを構成的P1プロモーター(P1-N20sgRNA足場)によって制御した。プロモーターおよびリボソーム結合部位は、Lim et al., Cell, 2017, 169:547-558 に記載されるように、Bacteroides thetaiotaomicron(Bt)16SrRNA遺伝子の調節配列に由来し、操作される。ガイドRNAは、コードまたは非コードDNA配列に相同なヌクレオチド配列であるか、または非標的化スクランブルヌクレオチド配列である。この配列は、異なるCas9ホモログのプロトスペーサー隣接モチーフ(PAM)要件と互換性がある限り、変更できる。ガイドRNAは、tracrRNAおよびcrRNAの別々の転写ユニットに存在するか、ハイブリッドキメラtracr/crRNA単一ガイド(sgRNA)中に融合される。プラスミドpNBU2.CRISPR-STOP.tdkfitDNA配列(11、383bp)のマップを
図2に示し、配列番号3として記載する:
GGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCCTTAAGACCCACTTTCACATTTAAGTTGTTTTTCTAATCCGCATATGATCAATTCAAGGCCGAATAAGAAGGCTGGCTCTGCACCTTGGTGATCAAATAATTCGATAGCTTGTCGTAATAATGGCGGCATACTATCAGTAGTAGGTGTTTCCCTTTCTTCTTTAGCGACTTGATGCTCTTGATCTTCCAATACGCAACCTAAAGTAAAATGCCCCACAGCGCTGAGTGCATATAATGCATTCTCTAGTGAAAAACCTTGTTGGCATAAAAAGGCTAATTGATTTTCGAGAGTTTCATACTGTTTTTCTGTAGGCCGTGTACCTAAATGTACTTTTGCTCCATCGCGATGACTTAGTAAAGCACATCTAAAACTTTTAGCGTTATTACGTAAAAAATCTTGCCAGCTTTCCCCTTCTAAAGGGCAAAAGTGAGTATGGTGCCTATCTAACATCTCAATGGCTAAGGCGTCGAGCAAAGCCCGCTTATTTTTTACATGCCAATACAATGTAGGCTGCTCTACACCTAGCTTCTGGGCGAGTTTACGGGTTGTTAAACCTTCGATTCCGACCTCATTAAGCAGCTCTAATGCGCTGTTAATCACTTTACTTTTATCTAATCTAGACATATTCGTTTAATATCATAAATAATTTATTTTATTTTAAAATGCGCGGGTGCAAAGGTAAGAGGTTTTATTTTAACTACCAAATGTTTTCGGAAGTTTTTTCGCTTTTCTTTTTCTATCGTTTCTCAGACTCTCTTAGCGAAAGGGAAAGAAGGTAAAGAAGAAAAACAAAACGCCTTTTCTTTTTTGCACCCGCTTTCCAAGAGAAGAAAGCCTTGTTAAATTGACTTAGTGTAAAAGCGCAGTACTGCTTGACCATAAGAACAAAAAAATCTCTATCACTGATAGGGATAAAGTTTGGAAGATAAAGCTAAAAGTTCTTATCTTTGCAGTCTCCCTATCAGTGATAGAGACGAAATAAAGACATATAAAAGAAAAGACACCATGGATAAGAAATACTCAATAGGCTTAGCTATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATGCCATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACGGTGGAGGAGGTTCTGGAGGTGGAGGTTCTGCTGAGTATGTGCGAGCCCTCTTTGACTTTAATGGGAATGATGAAGAGGATCTTCCCTTTAAGAAAGGAGACATCCTGAGAATCCGGGATAAGCCTGAGGAGCAGTGGTGGAATGCAGAGGACAGCGAAGGAAAGAGGGGGATGATTCCTGTCCCTTACGTGGAGAAGTATTCCGGAGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGTCTAGGCTCGAGTCCGGAGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGTCTAGGATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGCATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAATCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAATTAATGCGGCTGCAATTTTTTTGGGCGGGGCCGCCCAAAAAAATCCTAGCACCCTGCAGCAGTACTGCTTGACCATAAGAACAAAAAAACTTCCGATAAAGTTTGGAAGATAAAGCTAAAAGTTCTTATCTTTGCAGTATACAAGAGACCAGAAGAAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGAGATCTGTCGACTCTAGAGGATCCCCGGGTACCGAGCTCGAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGTACTTGTGCCTGTTCTATTTCCGAACCGACCGCTTGTATGAATCCATCAAAATTCGTTTTCTCTATGTTGGATTCCTTGTTGCTCATATTGTGATGATAATTTCTACAAATATAGTCATTGGTAACTATCTATGAAACTGTTTGATACTTTTATAGTTGATTAAACTTGTTCATGGCATTTGCCTTAATATCATCCGCTATGTCAATGTAGGGTTTCATAGCTTTGTAGTCGCTGTGTCCCGTCCATTTCATGACCACCTGTGCCGGGATTCCGAGAGCCAGCGCATTGCAGATGAATGTCCTTCTTCCTGCATGGGTACTGAGCAAAGCGTATTTGGGTGTGACTTCATCAATACGTTCATTTCCCTTGTAGTAGGTTTCCCGTACAGGCTCGTTGATTTCTGCCAGTTCGCCCAGCTCTTTCAGGTAATCGTTCATCTTCTGGTTGCTGATGACGGGCAGAGCCATGTAATTCTCGAAATGGATGTCCTTGTATTTGTCCAGTATGGCTTTGCTGTATTTGTTCAGTTCAATCGTCAGGCTGTCGGCAGTCTTGACTGTGGTTATTTCGATGTGGTCGGACTTCACATCGCTTCTTTTCAGATTGCGAACATCCGAATACCGCAAACTCGTAAAGCAGCAGAACAGGAAAACATCACGCACACGTTCCAGGTATTGCTTATCCTTGGGTATCTGGTAGTCTTTCAGCTTGTTCAGTTCATCCCAAGTCAGGAAGATTACTTTTTTCGAGGTGGTTTTCAGTTTCGGTTTGAACGTATCGTATGCAATGTTCTGATGATGTCCTTTCTTGAAGCTCCAGCGCAGGAACCATTTGAGGAATCCCATTTGCTTGCCGATGGTGCTGTTTCTCATATCCTTGGTGTCACGCAGGAAGTTGACGTATTCGTTCAATCCAAACTCGTTGAAATAGTTGAACGTTGCATCCTCCTTGAACTCTTTGAGGTGGTTCCTCACTGCTGCAAATTTTTCATAGGTGGATGCCGTCCAGTTATTCTGGTTACCGCACTCTTTTACAAACTCATCGAACACCTCCCAAAAGCTGACAGGGGCTTCTTCCGGCTGTTCTTCGCTGGTGTCTTTCATTCTCATGTTGAAAGCTTCCTTCAACTGTTGGGTCGTTGGCATGACCTCCTGCACCTCAAATTCCTTGAAAATATTCTGGATTTCGGCATAGTATTTCAGCAAGTCCGTATTGATTTCGGCTGCACTTTGCTTTAGCTTGTTGGTACATCCGCTCTTTACCCGCTGCTTATCTGCATCCCATTTGGCTACGTCAATCCGGTAGCCCGTTGTAAACTCGATGCGTTGGCTGGCAAAGATGACACGCATACGGATGGGTACGTTCTCTACGATTGGCACACCGTTCTTTTTCCGGCTCTCCAATGCAAAAATGATGTTGCGCTTGATATTCATAATTGGGTGCGTTTGAAATTCTACACCCAAATATACACCCAATTATTGAGATAGCAAAAGACATTTAGAAACATTTACTTTTACTCTATATTGTAATTTACACTTGATTATCAGTCGTTTGCAGTCTTATGATATTCTGTGAAAGTATAAGTTCGAGAGCCTGTCTCTCCGCAAAAAACGCTGAAAATCAGCAGATTGCAAAACAAACACCCTGTTTTACACCCAAGAATGTAAAGTCGGCTGTTTTTGTTTTATTTAAGATAATACAACCACTACATAATAAAAGAGTAGCGATATTAAAAGAATCCGATGAGAAAAGACTAATATTTATCTATCCATTCAGTTTGATTTTTCAGGACTTTACATCGTCCTGAAAGTATTTGTTGGTACCGGTACCGAGGACGCGTAAACATTTACAGTTGCATGTGGCCTATTGTTTTTAGCCGTTAAATATTTTATAACTATTAAATAGCGATACAAATTGTTCGAAACTAATATTGTTTATATCATATATTCTCGCATGTTTTAAAGCTTTATTAAATTGATTTTTTGTAAACAGTTTTTCGTACTCTTTGTTAACCCATTTCATTACAAAAGTTTCATATTTTTTTCTCTCTTTAAATGCCATTTTTGCTGGCTTTCTTTTTAATACAATTAATGTGCTATCCACTTTAGGTTTTGGATGGAAATAATACCTAGGAATTTTTGCTAATATAGAAATATCTACCTCTGCCATTAACAGCAATGCTAGTGATCTGTTTGTATCTAATAACATTTTAGCAAAACCATATTCCACTATTAAATAACTTATTGTGGCTGAACTTTCAAAAACAATTTTTCGAATTATATTTGTGCTTATGTTGTAAGGTATGCTGCCAAATATTTTATATGGATTGTGGCTAGGAAATGTAAATTTCAGTATATCATCATTTACTATTTGATAGTTAGGATAATTTAAGAGCTTATTACGAGTTACCTCACATAATTTAGAATCAATTTCTATCGCCGTTACAAAATTACATCTCTTTACCAATCCAGCAGTAAAATGACCTTTCCCTGCACCTATTTCAAAGATGTTATCTTTTTCATCTAAACTTATGCAATTCATTATTTTTTCTATGTGATATTTTGAAGTAATAAAATTTTGACTATCTTTTATATTTACTTTGTTCATTATAACCTCTCCTTAATTTATTGCATCTCTTTTCGAATATTTATGTTTTTTGAGAAAAGAACGTACTCATGGTTCATCCCGATATGCGTATCGGTCTGTATATCAGCAACTTTCTATGTGTTTCAACTACAATAGTCATCTATTCTCATCTTTCTGAGTCCACCCCCTGCAAAGCCCCTCTTTACGACATAAAAATTCGGTCGGAAAAGGTATGCAAAAGATGTTTCTCTCTTTAAGAGAAACTCTTCGGGATGCAAAAATATGAAAATAACTCCAATTCACCAAATTATATAGCGACTTTTTTACAAAATGCTAAAATTTGTTGATTTCCGTCAAGCAATTGTTGAGCAAAAATGTCTTTTACGATAAAATGATACCTCAATATCAACTGTTTAGCAAAACGATATTTCTCTTAAAGAGAGAAACACCTTTTTGTTCACCAATCCCCGACTTTTAATCCCGCGGCCATGATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCT
GTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATAACGCGTCAATTCGAGGGGGATCAATTCCGTGATAGGTGGGCTGCCCTTCCTGGTTGGCTTGGTTTCATCAGCCATCCGCTTGCCCTCATCTGTTACGCCGGCGGTAGCCGGCCAGCCTCGCAGAGCAGGATTCCCGTTGAGCACCGCCAGGTGCGAATAAGGGACAGTGAAGAAGGAACACCCGCTCGCGGGTGGGCCTACTTCACCTATCCTGCCCGGCTGACGCCGTTGGATACACCAAGGAAAGTCTACACGAACCCTTTGGCAAAATCCTGTATATCGTGCGAAAAAGGATGGATATACCGAAAAAATCGCTATAATGACCCCGAAGCAGGGTTATGCAGCGGAAAACGGAATTGATCCGGCCACGATGCGTCCGGCGTAGAGGATCTGAAGATCAGCAGTTCAACCTGTTGATAGTACGTACTAAGCTCTCATGTTTCACGTACTAAGCTCTCATGTTTAACGTACTAAGCTCTCATGTTTAACGAACTAAACCCTCATGGCTAACGTACTAAGCTCTCATGGCTAACGTACTAAGCTCTCATGTTTCACGTACTAAGCTCTCATGTTTGAACAATAAAATTAATATAAATCAGCAACTTAAATAGCCTCTAAGGTTTTAAGTTTTATAAGAAAAAAAAGAATATATAAGGCTTTTAAAGCTTTTAAGGTTTAACGGTTGTGGACAACAAGCCAGGGATGTAACGCACTGAGAAGCCCTTAGAGCCTCTCAAAGCAATTTTGAGTGACACAGGAACACTTAACGGCTGACATGGGAATTCCCCTCCACCGCGGTGG
【0093】
この特定の実施例において、非標的化対照ガイドRNA(5’-TGATGGAGAGGTGCAAGTAG-3’、「NT」と呼ばれる、配列番号:4)、またはBtゲノム上にtdk_Bt(BT_2275)またはsusC_Bt(BT_3702)コード配列を標的とするガイドRNAを発現する3つのプラスミドを、構築した。tdk遺伝子はチミジンキナーゼをコードし、susC遺伝子はデンプン結合に関与するB.thetaiotaomicronの外膜タンパク質をコードする。tdk_Btのプロトスペーサー配列は、5’-ATACAAGAGACCAGAAGAAG-3’(配列番号5)であり、susC_Btのプロトスペーサー配列は、5’-GCTCAAATCCGTATTCGTGG-3’(配列番号6)である。バクテロイデスゲノムに対する非標的化対照プロトスペーサー配列のin silico分析において、有意な配列一致は得られず、「オフターゲット」活性がないことが示された。tdk_BtおよびsusC_Btの標的化配列を、CからTへの変異がPAMの約15~20塩基上流に位置するシトシンヌクレオチド(C)で発生した場合に停止コドンを導入するように選択した (Nishida et al., Science, 2016, 353 ( 6305), doi: 10.1126/science.aaf8729; 12016, Banno et al., Nature Microbiology, 2018, 3. 10.1038/s41564-017-0102-6)。得られたプラスミドを、pNBU2.CRISPR-CDA.NT、pNBU2.CRISPR-CDA.tdk_Bt、およびpNBU2.CRISPR-CDA.susC_Btと名付ける。
【0094】
pNBU2.CRISPR-CDAプラスミドを、エリスロマイシン選択によりBt細胞に結合させ、コンジュゲーション当たり500-1000個のコロニーを得た。バクテロイデスの複製起点がないため、これらのプラスミドは維持できない。エリスロマイシン耐性コロニーは、おそらく染色体の組込み体であった。Bt染色体上の2つのattBT遺伝子座のいずれかにおけるCRISPR-CDA組込みのコロニーPCRスクリーニングのために、各コンジュゲーションからのコロニーを採取した。各attBT遺伝子座の染色体配列を標的とするプライマーを使用したPCRを使用して組み込み遺伝子座を推定し、続いてさらにジャンクションPCRおよび染色体と組み込みベクター配列間のDNA配列決定を確認した。NT(非標的化)、T(tdk_Bt)、およびS(susC_Bt)と標識されたattBT2-1遺伝子座に組み込まれた誘導CRISPR-CDAカセットを含む3つのCRISPR-CDA組み込み株を、次の誘導CRISPRベース編集実験のために取得した。NT、T、およびSCRISPR-CDA組込み体の単一コロニーを、200μg/mlゲンタマイシン(Gm)および25μg/mlエリスロマイシン(Em)を補充した5mlTYG液体培地(Holdeman et al., Anaerobe Laboratory Manual, 1977; Blacksburg, Va., Virginia Polytechnic Institute and State University Anaerobe Laboratory)を含むファルコンチューブ培養において一晩、coyチャンバー(Coy Laboratory Products Inc.)において一晩嫌気的に増殖させた。培養物を希釈し(10-6または10-8)、100μLを、それぞれ0および100ng/mlの濃度のaTcを補充した脳心臓注入(BHI;Beckton Dickinson,Co.)血液寒天プレート(Gm200μg/mLおよびEm25μg/mL)に広げた。寒天プレートを嫌気的に37℃で2-3日間インキュベートした。3株すべてについて、各血液寒天プレートで約102-103CFU(コロニー形成単位)が得られた。
【0095】
tdk_Bt塩基編集のために、8個のコロニーをaTc0およびaTc100寒天プレートから採取した。これらのコロニーを、200μg/mLのGmおよび200μg/mLの5-フルオロ-20-デオキシウリジン(FUdR)を補充したBHI血液寒天プレートに画線し、37°Cで2-3日間嫌気的にインキュベートした。Tc100寒天プレートからのコロニーはすべて成長したが、Tc0寒天プレートからのコロニーについては成長が観察されなかった。tdk_Bt領域のコロニーPCRを実行した後、DNA配列決定を行った。配列決定の結果は、aTc100寒天プレートからの8つのコロニーのうち8つが、PAMに対して-17位に予想されるCからTへの置換を有し、その結果、早期停止コドンが導入されることを示す(
図3A)。このtdk不活化変異は、有毒なヌクレオチドアナログFUdRに対する耐性を付与する。NT-aTc0、NT-aTc100、T-aTc0、およびT-aTc100寒天プレートからそれぞれ最大50個のコロニーを、200μg/mLのGmおよび200μg/mLのFUdRを補充したBHI血液寒天プレートにさらにストリークした。T-aTc100寒天プレートからのすべてのコロニーが成長したことが観察されたが、他のコロニーについては成長が観察されなかった。このことは、Bt細胞における誘導性の、RNA誘導性の、非常に効率的なヌクレオチド突然変異誘発を示唆している。
【0096】
susC_[0095]Bt塩基編集のために、8個のコロニーをaTc0およびaTc100寒天プレートから採取した。susC_Bt領域のコロニーPCRを実行した後、DNA配列決定を行った。配列決定の結果は、aTc100寒天プレートからの8つのコロニーのうち8つが、PAMに対して-17および-19位で予想されるCからTへの置換を有することを示し、これはアミノ酸置換(位置491のAからV)および初期停止コドン導入(3,012bp susCコード配列の493位)をもたらす(
図3B)。aTc0寒天プレートからの8つのコロニーすべてが、野生型のsusC_Bt配列を保持している。このことは、Bt細胞における誘導性で効率の高いRNA誘導塩基編集を示す。
【0097】
実施例2.Bacteroides thetaiotaomicron VPI-5482において安定に維持されたCRISPR塩基編集
バクテロイデスのdCas9-AIDベクターpmobA.repA.CRISPR-CDA.NTを構築した。このベクターは、(i)無水テトラサイクリン誘導性プロモーターの下でPetromyzon marinusシトシンデアミナーゼPmCDA1(CDA)に融合した触媒的に不活性化されたCas9(dCas:D10AおよびH840A変異)、および(ii)構成的プロモーターP1の下で20ヌクレオチド(nt)の標的配列-gRNA足場ハイブリッド(sgRNA)を発現する。このプラスミドは、pBR322複製起点およびE.coliにおけるアンピシリン選択のためのbla配列を含有する。動員についてmobA配列、複製についてrepA配列、およびバクテロイデスにおけるエリスロマイシン(Em)選択についてermF配列が必要とされる(Smith, C. J., et al., Plasmid, 1995, 34, 211-222)。CRISPR-CDAユニットは、Petromyzon marinusシトシンデアミナーゼ(PmCDA1)と融合したD10AおよびH840A変異を持つ、誘導可能なヌクレアーゼ欠損SpCas9で構成されている。dCas9-CDA1融合は、無水テトラサイクリン(aTc)の制御下でTetRレギュレーター(P2-A21-tetR、P1TDP-GH023-dSpCas9-PmCDA1)によって制御され、ガイドRNAは構成的P1プロモーター(P1-N20sgRNA足場)によって制御された。プロモーターおよびリボソーム結合部位は、Lim et al., Cell, 2017, 169: 547-558に記載されているように、Bacteroides thetaiotaomicron(Bt)16SrRNA遺伝子の調節配列に由来し、操作されている。ガイドRNAは、コードまたは非コードDNA配列に相同なヌクレオチド配列であるか、または非標的スクランブルヌクレオチド配列である。この配列は、異なるCas9ホモログのプロトスペーサー隣接モチーフ(PAM)要件と互換性がある限り、変更できる。ガイドRNAは、tracrRNAおよびcrRNAの別々の転写ユニットに存在するか、ハイブリッドキメラtracr/crRNAシングルガイド(sgRNA)に融合される。プラスミドpmobA.4および配列番号7として記載されている:
TCGGGACGCTCATCAATATCCACCCTGCCTGGGATAAATCCTCGCCCTGCATTTTTAGAACCACGTTTGGCATACCTGCGACCTTGTCTGCGAAGATATTTGTGCAGTTTGCCACCCCGCCGCTTATCCTCCCAAATCCAGCGATATATCGTTTCGTGAGATACCATCGCAATTCCCTCCAAGCGGCTCCTGCCGACAATCTGCTCCGGGCTGAATCCTTTCTTCAACAGCTTTATTATCCGTTTTCTCATTGCCGGTGTAAGCACTTCCTTGCGATGTTTTTGCTGCTTGCGCCTGTCTGCTTTTCGCTGGGCAAGCTCCATGCTATAGCTACCACTTCGGGCGTCGCAATTGCGCTTTATCTCCCTGTAAACAGTGCTTTTATCTACTCCGATAGCTTCCGCTATTGCTTTTTTGCTCATCGGTATTTGCAACATCATAGAAATTGCATACCTTTGTTCCTCGGTTATATGTTTGCTCATCTGCAACTTTTTTTTCTTTGGACGGACAATTAAAGCAAAGATAGCAAACTTTATCCATTCAGAGTGAGAGAAAGGGGGACATTGTCTCTCTTTCCTCTCTGAAAAATAAATGTTTTTATTGCTTATTATCCGCACCCAAAAAGTTGCATTTATAAGTTGAACTCAAGAAGTATTCACCTGTAAGAAGTTACTAATGACAAAAAAGAAATTGCCCGTTCGTTTTACGGGTCAGCACTTTACTATTGATAAAGTGCTAATAAAAGATGCAATAAGACAAGCAAATATAAGTAATCAGGATACGGTTTTAGATATTGGGGCAGGCAAGGGGTTTCTTACTGTTCATTTATTAAAAATCGCCAACAATGTTGTTGCTATTGAAAACGACACAGCTTTGGTTGAACATTTACGAAAATTATTTTCTGATGCCCGAAATGTTCAAGTTGTCGGTTGTGATTTTAGGAATTTTGCAGTTCCGAAATTTCCTTTCAAAGTGGTGTCAAATATTCCTTATGGCATTACTTCCGATATTTTCAAAATCCTGATGTTTGAGAGTCTTGGAAATTTTCTGGGAGGTTCCATTGTCCTTCAATTAGAACCTACACAAAAGTTATTTTCGAGGAAGCTTTACAATCCATATACCGTTTTCTATCATACTTTTTTTGATTTGAAACTTGTCTATGAGGTAGGTCCTGAAAGTTTCTTGCCACCGCCAACTGTCAAATCAGCCCTGTTAAACATTAAAAGAAAACACTTATTTTTTGATTTTAAGTTTAAAGCCAAATACTTAGCATTTATTTCCTGTCTGTTAGAGAAACCTGATTTATCTGTAAAAACAGCTTTAAAGTCGATTTTCAGGAAAAGTCAGGTCAGGTCAATTTCGGAAAAATTCGGTTTAAACCTTAATGCTCAAATTGTTTGTTTGTCTCCAAGTCAATGGTTAAACTGTTTTTTGGAAATGCTGGAAGTTGTCCCTGAAAAATTTCATCCTTCGTAGTTCAAAGTCGGGTGGTTGTCAAGATGATTTTTTTGGTTTGGTGTCGTCTTTTTTTAAGCTGCCGCATAACGGCTGGCAAATTGGCGATGGAGCCGACTTTGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCCTTAAGACCCACTTTCACATTTAAGTTGTTTTTCTAATCCGCATATGATCAATTCAAGGCCGAATAAGAAGGCTGGCTCTGCACCTTGGTGATCAAATAATTCGATAGCTTGTCGTAATAATGGCGGCATACTATCAGTAGTAGGTGTTTCCCTTTCTTCTTTAGCGACTTGATGCTCTTGATCTTCCAATACGCAACCTAAAGTAAAATGCCCCACAGCGCTGAGTGCATATAATGCATTCTCTAGTGAAAAACCTTGTTGGCATAAAAAGGCTAATTGATTTTCGAGAGTTTCATACTGTTTTTCTGTAGGCCGTGTACCTAAATGTACTTTTGCTCCATCGCGATGACTTAGTAAAGCACATCTAAAACTTTTAGCGTTATTACGTAAAAAATCTTGCCAGCTTTCCCCTTCTAAAGGGCAAAAGTGAGTATGGTGCCTATCTAACATCTCAATGGCTAAGGCGTCGAGCAAAGCCCGCTTATTTTTTACATGCCAATACAATGTAGGCTGCTCTACACCTAGCTTCTGGGCGAGTTTACGGGTTGTTAAACCTTCGATTCCGACCTCATTAAGCAGCTCTAATGCGCTGTTAATCACTTTACTTTTATCTAATCTAGACATATTCGTTTAATATCATAAATAATTTATTTTATTTTAAAATGCGCGGGTGCAAAGGTAAGAGGTTTTATTTTAACTACCAAATGTTTTCGGAAGTTTTTTCGCTTTTCTTTTTCTATCGTTTCTCAGACTCTCTTAGCGAAAGGGAAAGAAGGTAAAGAAGAAAAACAAAACGCCTTTTCTTTTTTGCACCCGCTTTCCAAGAGAAGAAAGCCTTGTTAAATTGACTTAGTGTAAAAGCGCAGTACTGCTTGACCATAAGAACAAAAAAATCTCTATCACTGATAGGGATAAAGTTTGGAAGATAAAGCTAAAAGTTCTTATCTTTGCAGTCTCCCTATCAGTGATAGAGACGAAATAAAGACATATAAAAGAAAAGACACCATGGATAAGAAATACTCAATAGGCTTAGCTATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATGCCATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACGGTGGAGGAGGTTCTGGAGGTGGAGGTTCTGCTGAGTATGTGCGAGCCCTCTTTGACTTTAATGGGAATGATGAAGAGGATCTTCCCTTTAAGAAAGGAGACATCCTGAGAATCCGGGATAAGCCTGAGGAGCAGTGGTGGAATGCAGAGGACAGCGAAGGAAAGAGGGGGATGATTCCTGTCCCTTACGTGGAGAAGTATTCCGGAGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGTCTAGGCTCGAGTCCGGAGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGTCTAGGATGACCGACGCTGAGTACGTGAGAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCATAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTGAATAAACCACAGAGCGGGACAGAACGTGGCATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAATACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGCTGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGCAAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAATCTCAGAGATAACGGGGTTGGGTTGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATTGAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATGATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAATTAATGCGGCTGCAATTTTTTTGGGCGGGGCCGCCCAAAAAAATCCTAGCACCCTGCAGCAGTACTGCTTGACCATAAGAACAAAAAAACTTCCGATAAAGTTTGGAAGATAAAGCTAAAAGTTCTTATCTTTGCAGTTGATGGAGAGGTGCAAGTAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGTCGACTCTAGAGGATCCCCGGGTACCGAGCTCGAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCC
CTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACACACCATAAACTTTTTTTAGAATAAGCACACAACCGTTTTCCGAACCCTGCAAAATGTTTTCTGAATCCGAACGGTGTAACACTCCATTGAGAGAGGCTGCCGTTTGGTCGCTCCCCCTTTGGGGGCGGGGGGGGGTTACATACCCATGCCGAAACCTCTGCTTCTGGTGATTTGCTTGAATAGGTCTTTCCCCTCTTCCATAGCTTTTGATATGTTTGGGAAATGATGCCTTAAAGCCTCCAGTTGTTCGGAATTGAACAAGTCTTTCATCTTACCAAGTTCTTTTTTCAACTCCTTGGTTTCGGCTTTTAGTTTTTGGTTCTCCGTCCTTAATAGGTTACTGGTTGTCCTTGCGTTGTCCATTTGTTGTCTATAATACTCCTTGTCATTCTCGGCTTTGAATGCCTTTGTGCTGTTTCGCTCTTTTTCAAGTATAGCCTTTCCCAGTCTATCGGATAGTTGTTCATTTTCCCCCTCTAAAGTCTTTACTTTGGCTTTTAAGGCATCCTTTTCCCTATCGTTGACTGTTTTTCCAATCAAGCCGTAAAACTTCTCTGAAGCCTTAGAAATGAGTTTTTGGACGTTCTTCTTTGTTTCAATGGAACGTAGTTCCTTCTGAAGCTGAAGAAGCTGGTTTTGTGCGTCCTTGTATTTGTCTAATGCACTGGATATATCGTTGGATAGTTCCTGAAGCTGTTCTTTCGCACATTCGGTCTTGTACTGCATAGCCGATAAGTGTTTGCGGTCAGAAGAAACGCCACGTTCCATGCCCAGTGTTTCAGATGCTATGGTTTGGAGTTCTGCCATGTCATCACGCGATAAACGCACACTTTTCCCATTCGGCTGCGTCCAATCGAAAACTACATGGGCATGAAGGTTAGGTGTCCACTGCTTTGCGTTCATGTATCCTTCGTCCTTGTGTATATGGATTTGAAACGCTTCGATACCGAAACGTTCTTTGCAGACCGTGGCAAACTGCTGGAGTTCCTGCATAGTGGTTTCTTGTTTGATTACTATTACTCCCTCTCGTATGGGTGCGGCTTTAGCCTGCATCTTCTGCCCAACCGTATCGAGATATCTTTGTTTTGCACTCTCCAGCCGATGGGAAATGCTATCTCCAACCCAGCTTTCATTCAAATGACTAAGTTCGGGACGAACATAGTCCAACTCTTTTTCCCTAAAGTTGTGAATCTCGCTCCCCGGCTTCACTGCTTGTACATGAATACTTGTTGCTCCCATAAGTTAACATTTTTGTGACAATCGATAACAGCCGGTGACAGCCGGCTGACAGGGGGTTAAGGGGGCTTGTCCCCTTACACACGCACTCTTTAGGGTGCTAGTGTGCTATCACCATACTGCATAGGTGCGAAGTTAGTGAATGTTTTGTAAATGCACAAATAAAGGGAAAAACATTTGGATTTGCGATAATAAAGTACTACCTTTGTTGCTGACCAAACGGTAGCTGACCGATACGGGAGAGTTACCAAAATACAAGCCGCTGGAGTTAATTGACGGACATCCGACATCTCCAGCGGCTTTATTTTTGCCTATCTGCTTCGCCTAGGCACACCAGTACCTCTACTAAAAATGTACTTCAAAGATACTTATTTTCTACCGACTTGATAGTTTTTACCCCATATTCTTGGACATTTTTCCCCCATGAGGTTATCTTTGTAGGGTGAAAGAGAAACCCATAAACGGGGATAGATTGAATGCTGGGAAGCATAAACAATCGGGGTAAGGTTAGCGAACCTTGCCTTTCATCCCCCATTATAACTTTACATAGAGGAACTTTATCTATCCCCCCCCGCCCCCAAAGGGGGAGCGACCAAACGGCAGCTTCACTCAATGGAGTGTTACTGTTCATCAAAGCCAAGTGATAATTGTCGTTTCTCTGCTTCTTCTTTCTTTTGGGCAGCTAAAGTCTTTTTCCGAACGTATGTTTTAGCAAATGTCACTCGGTCACCATTGAATACTATCAGAGGATTAATAAACCAAAGATTATCGGCTGGTCCTCGGGCTATGATTTCAGCTTTTACAAGTTCTGCAAGTCCTTTATAAACGGCTTTGTCTGTTTTGTATTTGGTATATTCTAGGCATTTTTTTCTATTGAAAATGATTAAATCATTTTTGGGTTTCATGCAGGTCATAAAGTAACCAAAAACCCGAATAGCTGCTTGTGATAGGTCAAAGAATGCAGCAAAGTTAGAAAGATACAATTTAGTGAATTGTTCTTCATCTACTTCTATTTGACGGATAAACGAAGTCTTAAACACTTCTCCAGTTTCAGTGTCGGCTAAAGCTACTACAGCTCTCTTATCGCCACCACTATTACTCTTATACTTTTTAACAACATGATTTTCAATACCTTCTATAGCTTGTTTCATAAAAGGATTTTCTTCGTTCTTTTGAAAATCGGTTAACTTAACTGCTTTTTTATTTTCCATTTTGATATGTTTTTGGGAAATATTATTCTCCACAAAGTAAACTATTATTTTCCATAAAAACAATATTAAGGGAAATATTATTTTCCTATTTAGTATCATATTAGGAAATCGGTATTTTCTAGATTGGAAAATGAGAATTTCCAATATGGAAAATGCCCTATATTGTGTATCAAGTACTTAACTTATTCTATTTCTTTTATTCTTAATATACCCCCAAAACAGCACAAAATCAGTCACTTAAAAATCATCGGTCGGGGAATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGCTAAATTTAAATATAAACAA
【0098】
この特定の実施例において、非標的化対照ガイドRNA(「NT」と呼ばれる5’-TGATGGAGAGGTGCAAGTAG-3’、配列番号4)、またはBtゲノム上にBT_0362またはBT_0364コード配列を標的とするガイドRNAを発現する3つのプラスミドを構築した。BT_0362のプロトスペーサー配列は5’-GGACGAATCGTAAATGCAGA-3’(配列番号8)であり、BT_0364のプロトスペーサー配列は5’-CCCATTGGCTGAATGTGGCG-3’(配列番号9)である。バクテロイデスゲノムに対する非標的化対照プロトスペーサー配列のin silico分析において、有意な配列一致は得られず、「オフターゲット」活性がないことが示された。BT_0362およびBT_0364の標的化配列は、CからTへの変異がPAMの約15-20塩基上流に位置するシトシンヌクレオチド(C)で発生した場合に停止コドンを導入するように選択された(Nishida et al., Science, 2016, 353 ( 6305), doi:10.1126/science.aaf8729; 12016, Banno et al., Nature Microbiology, 2018, 3.10.1038/s41564-017-0102-6)。得られたプラスミドは、pmobA.repA.CRISPR-CDA.NT、pmobA.repA.CRISPR-CDA.BT_0362、およびpmobA.repA.CRISPR-CDA.BT_0364と名付けられる。
【0099】
pmobA.repA.CRISPR-CDAプラスミドを、好気条件下で、脳-心臓注入(BHI;Beckton Dickinson,Co.)血液寒天プレート上で最初に選択または誘導なしでBt細胞に結合させた。このコンジュゲーションスメアをかき取り、1mlのTYG液体培地で再構成した(Holdeman et al., Anaerobe Laboratory Manual, 1977; Blacksburg, Va., Virginia Polytechnic Institute and State University Anaerobe Laboratory)。TYG培地中の各コンジュゲートプラスミド試料について、TYG培地で1:10に希釈した100μlを、25μg/mlエリスロマイシン(Em)および200μg/mlゲンタマイシン(Gm)BHI10%血液寒天プレートに播種し、コンジュゲーションあたり数百のコロニーを得た(
図5A)。バクテロイデスのrepA複製起点により、これらのプラスミドを維持することができる。各コンジュゲーションからの単一コロニーを、25μg/mlエリスロマイシン(Em)および200μg/mlゲンタマイシン(Gm)選択下での継続的なTYG培地液体培養増殖のために採取し、続いてプラスミド精製を行って正しいプラスミド維持を検証した。pmobA.repA.CRISPR-CDAガイド領域のPCR増幅およびサンガー配列決定により、各プラスミドの正しいガイド配列が確認された。3つのpmobA.repA.CRISPR-CDAが安定に維持され、NT(非標的化)、BT_0362、およびBT_0364と標識されたプラスミド株が、次の誘導性CRISPR塩基編集実験のために取得された。NT、BT_0362、およびBT_0364 pmobA.repA.CRISPR-CDAプラスミド株の単一コロニーを、200μg/mlゲンタマイシン(Gm)、25μg/mlエリスロマイシン(Em)および100ng/mlaTcを補充した5mlTYG液体培地を含むファルコンチューブ培養で一晩、coyチャンバー(Coy Laboratory Products Inc.)で嫌気的に増殖させた。次に、これらの培養物からの試料を、100ng/mlのaTcを補充したBHI10%血液寒天プレート(Gm200μg/mLおよびEm25μg/mL)にプラスチックループでストリークした。寒天プレートを嫌気的に37℃で2-3日間インキュベートした。3株すべてについて、各血液寒天プレート上のループストリーク領域に沿って個々のコロニーを得た(
図5B)。
【0100】
これら3枚のaTc100寒天プレートからコロニーを採取した。BT_0362およびBT_0364領域のコロニーPCRを実行した後、サンガー配列決定を行った。MilliporeSigma社内で開発されたソフトウェアを使用した定量的突然変異分析は、BT_0362およびBT_0364塩基編集試料aTc100寒天プレートが、BT_0362試料についてのPAMに対して-17位置に、BT_0364試料におけるPAMに対して-18、-19、および-20位置に予想されるCからTへの置換を含むことを示す。代表的なBT_0362およびBT_0364試料を(
図6AおよびB)に示す。これらのC-T置換により、BT_0362およびBT_0364ベース編集試料の両方で早期停止コドンが導入される。NT株は、aTC誘導後、標的のBT_0362またはBT_0364領域でC-T置換を示さなかった。
【0101】
この解析ソフトウェアは「SangerTrace」と呼ばれる。Applied Biosystem社の形式(ABI)ファイルをもとに各塩基シグナルのピーク値を抽出し、サンガー配列決定データの「対照」および「試料」を比較することにより変異率を算出する。
【0102】
実施例3.他のバクテロイデス株におけるCRISPR塩基編集
NBU2インテグラーゼ組換えtRNA-ser部位(5’-CCTGTCTCTCCCGC-3’(配列番号2))は保存されており、公開されたゲノム配列に基づく、Bacteroides vulgatus、Bacteroides cellulosilyticus、Bacteroides fragilis、Bacteroides helcogenes、Bacteroides ovatus、Bacteroides salanitronis、Bacteroides uniformis、およびBacteroides xylanisolvensを含む多くのバクテロイデス株に存在する。標的化ガイドRNAを発現する誘導可能なCRISPR-CDAカセットは、これらのバクテロイデス株の染色体に組み込むことができ、標的化ガイドRNAを発現する株における特定の遺伝子の標的CRISPR-CDA CからTへの塩基編集は、aTc誘導剤による処置により達成可能である。標的化ガイドRNAを発現する株における特定の遺伝子の編集は、Tcインデューサーで処理することによって達成することができる(実施例1に記載されているように)。特定の種の染色体上にNBU2インテグラーゼ部位がない場合、これらの13塩基対DNA配列は、組換え(例えば、Cre//oxP)または当技術分野で記載されているように対立遺伝子交換を介して染色体上に容易に挿入され、染色体のCRISPR-CDA組込みおよび標的化遺伝子ベース編集を可能にすることができる。
【0103】
実施例4.マウス腸におけるバクテロイデスのCRISPR塩基編集
特定のバクテロイデス種のマウス腸のインサイチュでの標的化された誘導性CRISPR-CDA CからTの塩基編集は、種特異的なプロトスペーサー配列を標的とするガイドRNAを発現するCRISPR-CDAカセットを細菌コンジュゲーションを介したNBU2インテグラーゼによって媒介されるゲノムの染色体上に組み込むことによって実施することができる。例示的な場合において、マウスは、ヒトを含む哺乳動物の腸内微生物叢に由来する1つまたは複数のバクテロイデスが定着したノトバイオート動物である。aTcインデューサーを特定の時点でマウスの腸に適用することができ、このことは腸内細菌叢の種における特定の遺伝子の標的化された変異または不活性化をもたらす。
【配列表】
【国際調査報告】