(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-16
(45)【発行日】2024-07-24
(54)【発明の名称】ゲノム編集、クローン増殖、および関連用途を特徴付けるための方法および試薬
(51)【国際特許分類】
C12N 15/09 20060101AFI20240717BHJP
C12Q 1/68 20180101ALI20240717BHJP
C12Q 1/6869 20180101ALI20240717BHJP
C12Q 1/02 20060101ALI20240717BHJP
【FI】
C12N15/09 100
C12Q1/68
C12Q1/6869 Z
C12Q1/02
(21)【出願番号】P 2021500573
(86)(22)【出願日】2019-07-12
(86)【国際出願番号】 US2019041735
(87)【国際公開番号】W WO2020014693
(87)【国際公開日】2020-01-16
【審査請求日】2022-07-12
(32)【優先日】2018-07-12
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】518201670
【氏名又は名称】ツインストランド・バイオサイエンシズ・インコーポレイテッド
【氏名又は名称原語表記】TWINSTRAND BIOSCIENCES, INC.
(74)【代理人】
【識別番号】110001508
【氏名又は名称】弁理士法人 津国
(72)【発明者】
【氏名】ソーク,ジェシー・ジェイ
(72)【発明者】
【氏名】バレンタイン,チャールズ・クリントン・ザ・サード
【審査官】吉門 沙央里
(56)【参考文献】
【文献】米国特許出願公開第2017/0253925(US,A1)
【文献】J. R. Revollo, et al.,Mutat Res Gen Tox En,2018年,Vol.829,p.61-69
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00- 3/00
C12N 15/00-15/90
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
操作されたゲノム編集事象後に、細胞集団における細胞のクローン増殖を検出し、かつ/または定量するための方法であって、
(a)前記操作されたゲノム編集事象後
、第1の時点で、前記細胞集団に由来する1つ以上の標的二本鎖DNA分子をデュプレックス配列決定すること
、
(b)前記標的二本鎖DNA分子の中の1つ以上のバリアントを特定すること
、
(c)
前記第1の時点での前記細胞集団に由来する前記標的二本鎖DNA分子の中の前記1つ以上のバリアントの
第1のバリアント頻度を決定すること
、
(d)
前記操作されたゲノム編集事象後、第2の時点で、前記細胞集団に由来する1つ以上の標的二本鎖DNA分子をデュプレックス配列決定すること、
(e)前記第2の時点での前記細胞集団に由来する前記標的二本鎖DNA分子の中の前記1つ以上のバリアントの第2のバリアント頻度を決定すること、
及び
(f)前記1つ以上のバリアントの
前記第1のバリアント頻度を、
前記1つ以上のバリアントの前記第2のバリアント頻度と比較すること
、
を含む、方法。
【請求項2】
操作されたゲノム編集事象後に、細胞集団における腫瘍化の可能性をモニタリングするための方法であって、
(a)前記操作されたゲノム編集事象後、第1の時点で、前記細胞集団に由来する1つ以上の標的二本鎖DNA分子をデュプレックス配列決定すること、
(b)前記標的二本鎖DNA分子の中の1つ以上のバリアントを特定すること、
(c)前記第1の時点での前記細胞集団に由来する前記標的二本鎖DNA分子の中の前記1つ以上のバリアントの第1のバリアント頻度を決定すること、
(d)前記操作されたゲノム編集事象後、第2の時点で、前記細胞集団に由来する1つ以上の標的二本鎖DNA分子をデュプレックス配列決定すること、
(e)前記第2の時点での前記細胞集団に由来する前記標的二本鎖DNA分子の中の前記1つ以上のバリアントの第2のバリアント頻度を決定すること、
及び
(f)前記1つ以上のバリアントの前記第1のバリアント頻度を、前記1つ以上のバリアントの前記第2のバリアント頻度と比較すること、
を含む、方法。
【請求項3】
前記1つ以上のバリアントの前記バリアント頻度が、目的のゲノム遺伝子座にマッピングするデュプレックス配列決定された標的二本鎖DNA分子の総数あたりの、前記目的のゲノム遺伝子座にマッピングする特定のバリアントを有するデュプレックス配列決定された標的二本鎖DNA分子の数を計算することによって決定される、請求項
1又は2に記載の方法。
【請求項4】
1つ以上のバリアントの前記
第1及び/又は第2のバリアント頻度が、閾値バリアント頻度を上回る、
請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記1つ以上のバリアントが、参照細胞集団由来の配列に対して特定される、請求項
1~4のいずれか一項に記載の方法。
【請求項6】
前記第1の時点および第2の時点の両方が、前記操作されたゲノム編集事象後の
30日以内、
45日以内、
60日以内、
75日以内、または
90日以内である、請求項
1又は2に記載の方法。
【請求項7】
前記
第2のバリアント頻度が、前記
第1のバリアント頻度よりも大きい場合、前記細胞集団で細胞のクローン増殖が発生したと決定される、
請求項1または請求項2に記載の方法。
【請求項8】
前記
第2のバリアント頻度が
、予測されるバリアント頻度よりも大きい場合、前記細胞集団で細胞のクローン増殖が発生したと決定される、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記細胞の前記クローン増殖が、異常な細胞増殖状態、癌様状態、前癌状態、またはフィールド効果を示す、請求項7または請求項8に記載の方法。
【請求項10】
前記予測されるバリアント頻度が、前記操作されたゲノム編集事象を経ていない同等の細胞集団から決定される、請求項
8に記載の方法。
【請求項11】
前記1つ以上のバリアントの少なくとも1つが、ゲノム編集のための意図された遺伝子座の外側の1つ以上の位置にある、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記1つ以上のバリアントの少なくとも1つが、腫瘍抑制遺伝子、癌遺伝子、癌原遺伝子、および/または癌ドライバーの配列にある、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記1つ以上のバリアントの少なくとも1つが、機能上破壊的な変異を含む、請求項1~12のいずれか一項に記載の方法。
【請求項14】
前記1つ以上のバリアントの少なくとも1つが、TP53にある、請求項1~13のいずれか一項に記載の方法。
【請求項15】
前記1つ以上のバリアントの少なくとも1つが、HRAS、NRAS、またはKRASにある、請求項1~14のいずれか一項に記載の方法。
【請求項16】
前記1つ以上のバリアントの少なくとも1つが、パッセンジャー変異である、請求項1~15のいずれか一項に記載の方法。
【請求項17】
前記1つ以上のバリアントの少なくとも1つが、非癌ドライバーバリアントである、請求項1~16のいずれか一項に記載の方法。
【請求項18】
前記細胞の集団または細胞集団が、多能性幹細胞、胚性幹細胞、免疫細胞、もしくは植物細胞であるか、またはこれらを含む、請求項1~17のいずれか一項に記載の方法。
【請求項19】
前記細胞の集団または細胞集団が、ヒト患者に由来する、請求項1~18のいずれか一項に記載の方法。
【請求項20】
前記ヒト患者から得られる前記二本鎖DNA分子が、組織、循環細胞、血漿中の無細胞DNA、他の体液中の無細胞DNA、エクソソームDNA、組織から脱離した細胞、および/または生検、から得られる、請求項19に記載の方法。
【請求項21】
前記細胞の集団または細胞集団が、細胞培養で増殖する、請求項1~19のいずれか一項に記載の方法。
【請求項22】
前記細胞の集団または細胞集団が、ヒトまたは動物対象に由来する、請求項1~19および
21のいずれか一項に記載の方法。
【請求項23】
前記細胞の集団または細胞集団が、異種移植片に由来する、請求項1~22のいずれか一項に記載の方法。
【請求項24】
前記操作されたゲノム編集事象が、標的化エンドヌクレアーゼ媒介性編集事象である、請求項1~23のいずれか一項に記載の方法。
【請求項25】
前記操作されたゲノム編集事象が、Cas9媒介性編集事象、Cas9媒介性編集事象、または修飾されたCASまたはCPF-1媒介性事象である、請求項1~24のいずれか一項に記載の方法。
【請求項26】
前記操作されたゲノム編集事象が、TALEN、MEGATAL、ジンクフィンガーヌクレアーゼ、ホーミングエンドヌクレアーゼ、または制限エンドヌクレアーゼによって媒介される、請求項1~24のいずれか一項に記載の方法。
【請求項27】
前記操作されたゲノム編集事象が、ポリヌクレオチド基質媒介性の相同組換え事象である、請求項1~26のいずれか一項に記載の方法。
【請求項28】
前記操作されたゲノム編集事象が、レトロウイルスまたは別のウイルスによって媒介される、請求項1~27のいずれか一項に記載の方法。
【請求項29】
前記細胞の集団または前記細胞集団が、CRISPR/Cas9システムを使用して編集された、請求項1~28のいずれか一項に記載の方法。
【請求項30】
1つ以上のバリアントの前記
第1及び/又は第2のバリアント頻度が、操作されたゲノム編集事象を経ていない細胞の参照集団から抽出された二本鎖DNA分子の参照集団のバックグラウンドバリアント頻度よりも大きい、請求項1に記載の方法。
【請求項31】
前記操作されたゲノム編集事象が、前記細胞の集団または細胞集団中の細胞のサブセットの死または損傷をもたらす、請求項1~30のいずれか一項に記載の方法。
【請求項32】
前記細胞の集団または細胞集団中の細胞のサブセットが、1つ以上の既存の遺伝的変異を有し、前記操作されたゲノム編集事象後、前記細胞のサブセットが、前記細胞の集団または細胞集団中の他の細胞よりも速い速度で選択的に増殖する、請求項1~31のいずれか一項に記載の方法。
【請求項33】
前記細胞の集団または細胞集団中の細胞のサブセットが、前記細胞に固有の既存のエピジェネティック状態を有し、前記操作されたゲノム編集事象後、前記細胞のサブセットが、前記細胞の集団または細胞集団中の他の細胞よりも速い速度で選択的に増殖する、請求項1~32のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2018年7月12日に出願された米国仮特許出願第62/697,397号に対する優先権およびその利益を主張し、その開示は、その全体が参照により援用される。
【背景技術】
【0002】
様々な用途のための混合細胞集団において、例えば、癌ドライバー変異を担持する細胞の、クローン増殖および初期腫瘍性クローン選択について、可能性を評価する必要がある。しかしながら、現在使用されているアッセイは、かかる初期段階の選択を検出する感度を提供しない。さらに、標的化ゲノム編集の分野では、非標的化核酸をさらに変化させることなく、ゲノム編集がうまく適用されたかを評価するためのツールが必要性とされている。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本技術は、概して、クローン選択および/または増殖を検出および評価するための方法、ならびにかかる方法で使用するための関連試薬に関する。特に、本技術の一部の実施形態は、事象(例えば、ゲノム編集、変異誘発など)後の混合細胞集団および/または細胞集団におけるクローン選択を評価するために、デュプレックス配列決定を利用することを対象とする。
【課題を解決するための手段】
【0004】
一実施形態では、本技術は、意図されたゲノム遺伝子座を対象とする操作されたゲノム編集事象後に、細胞の集団を特徴付ける方法を含み、当該方法は、(a)操作されたゲノム編集事象後に、細胞の集団に由来する二本鎖DNA分子を含む試料を提供することと、(b)複数の二本鎖DNA分子の各々について、エラー修正配列リードを生成することであって、複数の二本鎖DNA分子にアダプター分子をライゲーションして、複数のアダプター-DNA分子を生成すること、アダプター-DNA分子の元の第1の鎖のコピーのセットおよびアダプター-DNA分子の元の第2の鎖のコピーのセットを生成すること、元の第1の鎖および第2の鎖の1つ以上のコピーを配列決定して、第1の鎖の配列および第2の鎖の配列を提供すること、第1の鎖の配列と第2の鎖の配列とを比較して、第1の鎖の配列と第2の鎖の配列との間の1つ以上の対応関係を特定することを含む、エラー修正配列リードを生成することと、(c)意図されたゲノム遺伝子座の配列を含む1つ以上のエラー修正配列リードを予測されるゲノム編集DNA配列と比較することと、または(d)意図されないゲノム遺伝子座の配列を含む1つ以上のエラー修正配列リードを参照ゲノムDNA配列と比較することと、を含む。
【0005】
別の実施形態では、本技術は、細胞の集団における操作されたゲノム編集事象の効率を特徴付けるための方法を含み、操作されたゲノム編集事象は、意図されたゲノム遺伝子座を標的とし、当該方法は、(a)ゲノム編集事象後に、細胞の集団に由来する複数の二本鎖DNA分子を含む試料から配列決定ライブラリを調製することであって、配列ライブラリを調製することは、複数の二本鎖DNA分子に非対称アダプター分子をライゲーションして、複数のアダプター-DNA分子を生成することを含む、調製することと、(b)アダプター-DNA分子の第1の鎖および第2の鎖を配列決定して、アダプター-DNA分子の少なくとも一部について第1の鎖の配列リードおよび第2の鎖の配列リードを提供することと、(c)各配列決定されたアダプター-DNA分子について、第1の鎖の配列リードと第2の鎖の配列リードとを比較して、第1の鎖の配列リードおよび第2の鎖の配列リードとの間の1つ以上の対応関係を特定することと、(d)第1の鎖の配列リードと第2の鎖の配列リードとの間の1つ以上の対応関係を分析することによって、意図されたゲノム遺伝子座を含む複数の二本鎖DNA分子のうちの意図されたゲノム遺伝子座で予測されるゲノム配列の頻度を決定し、予測されるゲノム配列との対応関係を比較することと、を含む。
【0006】
別の実施形態では、本技術は、ゲノム編集細胞集団から抽出された標的二本鎖核酸分子の集団の高精度配列決定リードを生成する方法であって、当該方法は、(a)細胞集団から抽出された1つ以上の標的二本鎖核酸分子をデュプレックス配列決定することと、(b)標的二本鎖DNA分子について高精度のコンセンサス配列を生成することであって、標的二本鎖核酸分子は、DNAの意図されたゲノム編集領域およびDNAの1つ以上の意図されないゲノム領域を含む、生成することと、を含む。
【0007】
別の実施形態では、本技術は、操作された標的ゲノム編集事象を使用して、意図された遺伝子座でDNAが成功裏にゲノム編集されたかどうかを決定するための方法であって、当該方法は、(a)操作された標的ゲノム編集事象後に、試料から抽出された複数の二本鎖DNA分子について二重鎖(duplex)エラー修正配列決定リードを提供することと、(b)参照ゲノムの1つ以上の遺伝子座のセット中の各遺伝子座について、二重鎖エラー修正配列決定リードが予測される配列と実質的に同一の配列を有する二本鎖DNA分子を定量することと、を含む。
【0008】
別の実施形態では、本技術は、操作されたゲノム編集事象後に、細胞集団の腫瘍化の可能性を評価する方法であって、(a)操作されたゲノム編集事象後に、細胞集団に由来する二本鎖DNA分子を含む試料から配列決定ライブラリを調製することであって、配列ライブラリを調製することは、複数の二本鎖DNA分子をタグ付けして、第1のタグ付け鎖および第2のタグ付け鎖を有する複数のタグ付けDNA分子を生成することを含む、配列決定ライブラリを調製することと、(b)1つ以上の癌ドライバーにマッピングするタグ付けDNA分子のサブセットについて第1のタグ付け鎖および第2のタグ付け鎖を選択的に富化して、富化されたタグ付けDNA分子を提供することと、(c)複数の富化されたタグ付けDNA分子の各々についてエラー修正配列リードを生成することであって、エラー修正配列リードを生成することは、富化されたタグ付けDNA分子に由来する1つ以上の第1のタグ付け鎖および第2のタグ付け鎖を配列決定して、第1の鎖の配列および第2の鎖の配列を提供すること、第1の鎖の配列と第2の鎖の配列とを比較して、第1の鎖の配列と第2の鎖の配列との間の1つ以上の対応関係を特定すること、を含む、エラー修正配列リードを生成することと、(d)1つ以上の対応関係を参照ゲノム配列と比較することによって、複数の富化されたタグ付けDNA分子の中の1つ以上の癌ドライバーにバリアントが存在するかどうかを決定することとを含む方法、を含む。
【0009】
別の実施形態では、本技術は、操作されたゲノム編集事象後に、細胞集団中の細胞のクローン増殖を検出し、かつ/または定量するための方法であって、(a)操作されたゲノム編集事象後に、細胞集団に由来する1つ以上の標的二本鎖DNA分子をデュプレックス配列決定することと、(b)標的二本鎖DNA分子の中の1つ以上のバリアントを特定することと、(c)細胞集団に由来する標的二本鎖DNA分子の中の1つ以上のバリアントのバリアント頻度を決定することと、(d)1つ以上のバリアントの各々のバリアント頻度を予測されるバリアント頻度と比較することとを含む方法、を含む。
【0010】
本技術の他の実施形態、態様および利点は、以下の詳細な説明において、さらに説明される。
【0011】
本開示の多くの態様は、一緒に図面を構成する以下の図を参照することによって、より良く理解することができる。これらの図は、例示のみを目的としており、限定するものではない。図中の構成要素は、必ずしも縮尺どおりではない。むしろ、本開示の原理を明確に例示することを重視する。
【図面の簡単な説明】
【0012】
【
図1】[
図1A]本技術の一部の実施形態に使用するための例示的な核酸アダプター分子、および本技術の実施形態に従う二本鎖核酸断片へのアダプター分子のライゲーションから得られる例示的な二本鎖アダプター核酸複合体を提供する。[
図1Bおよび1C]本技術の一部の実施形態に従う、様々なデュプレックス配列決定方法のステップの概念図である。
【
図2】本技術の一部の実施形態に従う、ゲノム編集事象(例えば、操作されたゲノム編集事象)後の、ゲノム変化(例えば、定方向ゲノム変化、バリアント、変異など)を特定および/または定量し、クローン選択および/またはクローン増殖を特定するのに有用な本明細書に開示される方法および/またはキットと共に使用するネットワークコンピュータシステムの概略図である。
【
図3】本技術の一部の実施形態に従って、デュプレックス配列決定のコンセンサス配列データを生成するための例示的なルーチンを示すフロー図である。
【
図4】本技術の一部の実施形態に従う、細胞集団におけるゲノム編集事象から得られる意図されたゲノム遺伝子座で編集された配列を検出し、特定するためのルーチンを示すフロー図である。
【
図5】本技術の一部の実施形態に従う、細胞集団中のゲノム編集事象から得られる意図されないゲノム遺伝子座で編集された配列を検出し、特定するためのルーチンを示すフロー図である。
【
図6】本技術の一部の実施形態に従う、ゲノム編集事象後の細胞集団内の細胞のクローン増殖を検出し、特定するためのルーチンを示すフロー図である。
【
図7】本技術の一部の実施形態に従う、デュプレックス配列決定によって検出された、バリアントアレル画分(VAF)の初期腫瘍性クローン選択を示すグラフである。
【
図8A】本技術の特定の実施形態に従う、遺伝的に癌になりやすいマウス系統におけるヒトHRAS導入遺伝子のエクソン3に整列する一塩基バリアントを示すグラフである。
【
図8B】Tg.RasH2マウスモデルにおけるヒトHRAS形質導入遺伝子座を含む、特定のRasファミリー遺伝子から捕捉されたエクソンについてのゲノム区間にわたってプロットされた一塩基バリアント(SNV)を示すグラフである。
【発明を実施するための形態】
【0013】
本技術は、ゲノム編集事象を経た細胞の集団の中でバリアント(すなわち、遺伝的バリアント)を検出、評価、および/または定量するための方法の少なくとも一部を対象とする。例えば、一部の実施形態では、本開示は、ゲノム編集事象中に(例えば、ゲノム編集のための意図された遺伝子座、またはオフターゲットの意図されていない遺伝子座で)稀なおよび/または意図されないバリエーションを検出および/または定量するための方法、ならびにかかる方法で使用するための関連する試薬を提供する。一部の実施形態では、本開示は、クローン増殖を検出および/または定量するための方法、ならびにかかる方法で使用するための関連する試薬を提供する。
【0014】
本開示は、デュプレックス配列決定などの高忠実度配列決定技術を使用して、低頻度遺伝的バリアントを検出および/または定量することができるという認識を包含する。一部の実施形態では、本開示は、ゲノム編集事象(例えば、操作されたゲノム編集事象または天然ゲノム編集事象)後の混合細胞集団(インビトロまたはインビボのいずれか)および/または細胞集団におけるクローン選択を評価するためにデュプレックス配列決定を使用することを記載する。例えば、本技術の様々な実施形態は、標的二本鎖核酸分子の中の1つ以上の遺伝的バリアントを特定し、1つ以上のバリアントのバリアント頻度を決定するために、デュプレックス配列決定方法を行うことを含む。本技術のさらなる実施例は、事象後に、細胞のクローン増殖を検出し、評価するための、方法を対象とする。例えば、一部の実施形態は、デュプレックス配列決定方法を行って、癌ドライバー遺伝子に変異を有する細胞のクローン増殖および/または選択圧下でそれを評価することを含む。他の実施形態は、デュプレックス配列決定方法を行って、選択圧下にない細胞系統の遺伝マーカーの使用に基づいて、細胞のクローン増殖を評価することを含む。なおさらなる実施形態では、本技術は、ゲノム編集細胞集団から抽出された二本鎖核酸分子の集団の高精度配列決定リードを生成する方法を提供する。これらの方法は、様々な配置で、ゲノム編集事象の成功および/またはその望ましくない有害事象を決定するステップを含む。本技術の様々な態様は、前臨床および臨床療法の両方において、ならびに他の産業全体との関わりにおいて、多くの用途を有する。
【0015】
本技術の一部の実施形態の具体的な詳細について、図面(
図1A~
図8B)を参照しながら、以下に記載する。実施形態の多くは、デュプレックス配列決定に関して本明細書に記載されるが、本明細書に記載されるものに加えて、エラー修正配列決定リードを生成することが可能な他の配列決定モダリティは、本技術の範囲内である。これに加えて、本技術の他の実施形態は、本明細書に記載されるものとは異なる構成、構成要素または手順を有していてもよい。したがって、当業者は、本技術が、追加の要素を有する他の実施形態を含んでいてもよく、かつ本技術が、
図1A~
図8Bを参照しながら以下に示され、記載される特徴の一部を含まない他の実施形態を含んでいてもよいことを、理解するであろう。
【0016】
特定の定義
本開示がより容易に理解されるために、まず、特定の用語を以下に定義する。以下の用語および他の用語についてのさらなる定義は、本明細書全体を通して記載される。
【0017】
本出願では、文脈から別段明確でない限り、「1つの(a)」という用語は、「少なくとも1つ」を意味すると理解され得る。本出願で使用される場合、「または」という用語は、「および/または」を意味すると理解され得る。本出願では、「~を含む(comprising)」および「~を含む(including)」という用語は、それ自体によって示されるか、または1つ以上のさらなる構成要素もしくはステップと共に示されるかにかかわらず、項目化された構成要素またはステップを包含すると理解され得る。範囲が本明細書で提示される場合、その両端が含まれる。本出願で使用される場合、「~を含む(comprise)」という用語およびこの用語の変形語、例えば、「~を含む(comprising)」および「~を含む(comprises)」は、他の付加物、構成要素、整数またはステップを除外することを意図しない。
【0018】
約:「約」という用語は、ある値を参照して本明細書で使用される場合、参照される値の文脈で、類似する値を指す。一般に、その文脈に精通している当業者は、その文脈で、「約」に包含される関連する程度の分散を理解するであろう。例えば、一部の実施形態では、「約」という用語は、参照される値の25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、またはそれ未満内の範囲の値を包含し得る。1桁の整数値の分散について、正方向または負方向のいずれかにおける1個の数値のステップが、その値の25%を超える場合、「約」は、正方向または負方向のいずれかにおいて少なくとも1、2、3、4または5の整数値を含むことが当業者によって一般的に受け入れられており、状況に応じて0を超えても超えなくてもよい。この非限定的な例は、当業者にとって明らかであろう一部の状況において、3セントが約5セントとみなされ得るという仮説である。
【0019】
アレル:本明細書で使用される場合、「アレル」という用語は、特定のゲノム遺伝子座の2つ以上の既存の遺伝的バリアントのうちの1つを指す。
【0020】
類似体:本明細書で使用される場合、「類似体」という用語は、1つ以上の特定の構造特徴、要素、構成要素または部分が参照物質と共通する物質(substance)を指す。典型的には、「類似体」は、参照物質と有意な構造類似性を示すが(例えば、コアまたはコンセンサス構造が共通する)、特定の別個の様式では違いもある。一部の実施形態では、類似体は、参照物質から、例えば、参照物質の化学操作によって、生成可能な物質である。一部の実施形態では、類似体は、参照物質を生成する合成プロセスと実質的に類似した合成プロセス(例えば、複数のステップが共通する)の遂行を通して生成可能な物質である。一部の実施形態では、類似体は、参照物質を生成するために使用されるものとは異なる合成プロセスの遂行を通して生成されるか、または生成され得る。
【0021】
動物:本明細書で使用される場合、動物界の任意のメンバーを指す。一部の実施形態では、「動物」とは、いずれかの性別の、および発生の任意の段階の、ヒトを指す。一部の実施形態では、「動物」とは、発生の任意の段階の非ヒト動物を指す。特定の実施形態では、非ヒト動物は、哺乳動物(例えば、げっ歯類、マウス、ラット、ウサギ、サル、イヌ、ネコ、ヒツジ、ウシ、霊長類、および/またはブタなど)である。一部の実施形態では、動物としては、限定されないが、哺乳類、鳥類、爬虫類、両生類、魚類、昆虫、および/または寄生虫が挙げられる。一部の実施形態では、動物は、トランスジェニック動物、遺伝子操作動物、および/またはクローンであってもよい。
【0022】
生体試料:本明細書で使用される場合、「生体試料」または「試料」という用語は、典型的には、本明細書に記載されるように、目的の生体源(例えば、組織または生物または細胞または細胞培養物)から得られるか、または目的の生体源に由来する試料を指す。本明細書で使用される場合、「生体試料」は、ゲノム編集事象に適している。したがって、本開示の生体試料は、ゲノム物質を含む。一部の実施形態では、目的の生体源は、動物など(例えば、ヒトなどの哺乳動物)の生物を含む。一部の実施形態では、目的の供給源は、植物系生物(例えば、植物、植物部分、種子など)である。他の実施形態では、目的の供給源は、細菌、ウイルス、原生動物または真菌などの微生物を含む。さらなる実施形態では、目的の供給源は、合成組織、生物、細胞培養物、核酸または他の物質であってもよい。他の実施形態では、試料は、多生物試料(例えば、混合生物試料)であってもよい。一部の実施形態では、生体試料は、生体組織もしくは生物流体であるか、またはそれを含む。一部の実施形態では、生体試料は、骨髄、血液、血球、腹水、組織試料、生検試料、または穿刺吸引試料、細胞を含有する体液、遊離浮遊核酸、タンパク質に結合した核酸、リボタンパク質に結合した核酸、痰、血漿、血清、唾液、尿、脳脊髄液、腹腔液、胸水、糞便、リンパ液、婦人科系体液、皮膚スワブ、膣スワブ、パップスメア、口腔スワブ、鼻スワブ、乳管洗浄または気管支肺泡洗浄などの洗液または洗浄液、膣液、吸引物、擦過物、骨髄標本、組織生検標本、胎児組織または体液、外科標本、糞便、他の体液、分泌液、および/または排泄物、および/またはこれらからの細胞などであってもよいか、またはこれらを含んでいてもよい。一部の実施形態では、生体試料は、個体から得られた細胞であるか、またはこれらを含む。一部の実施形態では、得られる細胞は、試料が得られる個体由来の細胞であるか、またはこれらを含む。一部の実施形態では、細胞小器官または小胞あるいはエクソソームなどの細胞誘導体を含み得る。特定の実施形態では、生体試料は、対象から得られる液体生検である。一部の実施形態では、試料は、任意の適切な手段によって目的の供給源から直接得られる「一次試料」である。例えば、一部の実施形態では、一次生体試料は、生検(例えば、穿刺吸引または組織生検)、手術、体液(例えば、血液、リンパ液、糞便など)の採取などからなる群から選択される方法によって得られる。一部の実施形態では、文脈から明らかになるように、「試料」という用語は、一次試料を処理することによって(例えば、その1つ以上の構成要素を除去することによって、かつ/または1つ以上の薬剤をそれに加えることによって)得られる調製物を指す。例えば、半透過性膜を使用して濾過すること。かかる「処理された試料」は、例えば、試料から抽出されるか、または一次試料を、mRNAの増幅もしくは逆転写、特定の構成要素の単離および/または精製などの技術に供して得られる、核酸またはDNA分子を含んでいてもよい。
【0023】
癌:「癌(cancer)」、「悪性腫瘍」、「新生物」、「腫瘍」、および「癌(carcinoma)」という用語は、本明細書において、比較的異常な、制御されていない、および/または自律的な増殖を示す細胞を指すために使用され、これにより、それらは、細胞増殖の制御の著しい喪失を特徴とする異常な増殖表現型を示す。癌は、当業者によく知られ、一般的に、転移し得る異常な細胞の調節障害性の増殖を特徴とする。癌は、非限定的な例として、中でも、前立腺癌(例えば、腺癌、小細胞)、卵巣癌(例えば、卵巣腺癌、漿液性癌または胚性癌腫、卵黄嚢腫瘍、奇形腫)、肝臓癌(例えば、HCCまたは肝細胞腫、血管肉腫)、形質細胞腫瘍(例えば、多発性骨髄腫、形質細胞性白血病、形質細胞腫、アミロイドーシス、ワルデンストレーム高ガンマグロブリン血症)、大腸癌(例えば、結腸腺癌、結腸粘液腺癌、カルチノイド、リンパ腫および直腸腺癌、直腸扁平上皮癌)、白血病(例えば、急性骨髄性白血病、急性リンパ性白血病、慢性骨髄性白血病、慢性リンパ性白血病、急性骨髄芽球性白血病、急性前骨髄球性白血病、急性骨髄単球性白血病、急性単球性白血病、急性赤白血病および慢性白血病、T細胞白血病、セザリー症候群、全身性肥満細胞症、有毛細胞白血病、慢性骨髄性白血病の急性転化)、骨髄異形成症候群、リンパ腫(例えば、びまん性大細胞型B細胞リンパ腫、皮膚T細胞リンパ腫、末梢性T細胞リンパ腫、ホジキンリンパ腫、非ホジキンリンパ腫、濾胞性リンパ腫、マントル細胞リンパ腫、MALTリンパ腫、辺縁帯細胞リンパ腫、リヒタートランスフォーメーション、ダブルヒットリンパ腫、移植関連リンパ腫、CNSリンパ腫、節外性リンパ腫、HIV関連リンパ腫、風土病性リンパ腫、バーキットリンパ腫、移植関連リンパ増殖性腫瘍およびリンパ球性リンパ腫など)、子宮頸癌(扁平上皮子宮頸癌、明細胞癌、HPV関連癌腫、子宮頸部肉腫など)、食道癌(食道扁平上皮細胞癌、腺癌、特定のグレードのバレット食道、食道腺癌)、黒色腫(皮膚黒色腫、ブドウ膜黒色腫、四肢末端部黒色腫、無色素性黒色腫など)、CNS腫瘍(例えば、乏突起膠腫、星状細胞腫、多形神経膠芽腫、髄膜腫、シュワン腫、頭蓋咽頭腫など)、膵臓癌(例えば、腺癌、腺扁平上皮癌、印環細胞癌、肝様癌、コロイド癌腫、島細胞癌、膵神経内分泌癌など)、消化管間質腫瘍、肉腫(例えば、線維肉腫、粘液肉腫、脂肪肉腫、軟骨肉腫、骨肉腫、血管肉腫、内皮腫肉腫、リンパ管肉腫、リンパ管内皮腫肉腫、平滑筋肉腫、ユーイング肉腫および横紋筋肉腫、紡錘細胞腫瘍など)、乳癌(例えば、炎症性癌、大葉性癌、乳管癌など)、ER陽性癌、HER-2陽性癌、膀胱癌(膀胱扁平上皮癌、膀胱小細胞癌、尿路上皮癌など)、頭頸部癌(例えば、頭頸部扁平上皮癌、HPV関連扁平上皮細胞癌、鼻咽頭癌など)、肺癌(例えば、非小細胞肺癌、大細胞癌、気管支原性肺癌、扁平上皮細胞癌、小細胞肺癌など)、転移性癌、口腔癌、子宮癌(平滑筋肉腫、平滑筋腫など)、精巣癌(例えば、セミノーマ、非セミノーマおよび胚性癌腫、卵黄嚢腫瘍など)、皮膚癌(例えば、扁平上皮細胞癌および基底細胞癌、メルケル細胞癌、黒色腫、皮膚T細胞リンパ腫など)、甲状腺癌(例えば、乳頭癌、髄様癌、甲状腺未分化癌など)、胃癌(stomach cancer)、上皮内癌、骨癌、胆道癌、眼癌、喉頭癌、腎臓癌(例えば、腎細胞癌、ウイルムス腫瘍など)、胃癌(gastric cancer)、芽細胞腫(例えば、腎芽細胞腫、髄芽細胞腫、血管芽細胞腫、神経芽細胞腫、網膜芽細胞腫など)、骨髄増殖性腫瘍(真性赤血球増加症、本態性血小板血症、骨髄線維症など)、脊索腫、滑膜腫、中皮腫、腺癌、汗腺癌、脂腺癌、嚢胞腺癌、胆管癌、絨毛癌、上皮癌、上衣腫、松果体腫、聴神経腫、シュワン腫、髄膜腫、下垂体腺腫、神経鞘腫、小腸の癌、褐色細胞腫、小細胞肺癌、腹膜中皮腫、副甲状腺機能亢進性腺腫、副腎癌、原発不明癌、内分泌系の癌、陰茎の癌、尿道の癌、皮膚または眼内の黒色腫、婦人科腫瘍、小児の固形腫瘍、または中枢神経系の腫瘍、原発性縦隔胚細胞腫瘍、未確定の潜在能を有するクローン性造血、くすぶり型多発性骨髄腫、意義不明の単クローン性免疫グロブリン血症、単クローン性B細胞リンパ球増加症、低グレードの癌、クローナルフィールド欠損(clonal field defects)、前癌性腫瘍(preneoplastic neoplasms)、尿管癌、自己免疫関連癌(すなわち、潰瘍性結腸炎、原発性硬化性胆管炎、セリアック病)、遺伝性素因と関連する癌(すなわち、BRCA1、BRCA2、TP53、PTEN、ATMなどでの遺伝子欠陥を有するもの)、および様々な遺伝的症候群、例えば、MEN1、MEN2トリソミー21など)、および子宮内で化学物質に曝露されたときに生じるもの(すなわち、ジエチルスチルベストロール[DES]に曝露した女性の女性子孫における明細胞癌)、を含む。一部の実施形態では、本開示の文脈において検出、分析、および/または定量されたバリアントは、癌(例えば、腫瘍バリアント)と関連する。
【0024】
癌ドライバーまたは癌ドライバー遺伝子:本明細書で使用される場合、「癌ドライバー」または「癌ドライバー遺伝子」は、適切な文脈では、細胞が悪性転換を起こすか、または起こし始める可能性がある遺伝的損傷を指す。かかる遺伝子としては、悪性転換を正常に抑制するが、特定の様式で変異すると、もはや悪性転換を正常に抑制しない、腫瘍抑制因子(例えば、TP53、BRCA1)が挙げられる。他のドライバー遺伝子は、特定の様式で変異すると、細胞が悪性化するのを容易にする新しい性質を構成的に活性化するか、または獲得する癌遺伝子(例えば、KRAS、EGFR)であってもよい。ゲノムの非コード領域にみられる他の変異は、癌ドライバーであり得る。例えば、テロメラーゼ遺伝子(TERT)のプロモーター領域の変異は、この遺伝子の過剰発現を引き起こし、そのため、癌ドライバーとなる場合がある。非コード領域における他の変異は、異常なスプライシングを促進するか、または転写因子の結合、もしくは場合によって腫瘍増殖をもたらし得る他の制御変化を調節することができる。特定の転位(例えば、BCR-ABL融合)は、1つの遺伝子領域と、別の遺伝子領域とを並置し、過剰発現、抑制の消失またはキメラ融合遺伝子に関連する機構を介して腫瘍発生を促進する場合がある。広義には、他の細胞と比べて、その増殖、生存もしくは競争上の利点を与えるか、またはより頑強に進化する能力を付与する表現型を細胞に与える遺伝子変異(またはエピ変異)は、ドライバー変異と考えることができる。これは、これらの変異が同じ遺伝子内で起こり得る場合であっても(すなわち、同義変異)、かかる特徴を欠く変異とは対照的である。かかる変異が腫瘍内で識別されるとき、これらの変異は、増殖に有意義に寄与することなく、クローン増殖と共に「ヒッチハイク」するため、一般的に、パッセンジャー変異と呼ばれる。当業者に認識されているように、ドライバーとパッセンジャーの区別は絶対的なものではなく、そのように解釈されるべきではない。ある特定の状況(例えば、特定の組織)でのみ機能するドライバーもいれば、他のドライバーは、他の変異またはエピ変異または他の因子が存在しないと働かない場合もある。
【0025】
クローン増殖:本明細書で使用される場合、「クローン増殖」は、共通の創始細胞に由来する細胞の集団のクローン増殖を指す。細胞の誘導体集団(すなわち、娘細胞)は、単にクローンと呼んでもよい。クローン増殖は、正常な健康な生物学的プロセスの結果として(すなわち、受精卵はヒトの創設細胞であり、その細胞は全てクローンを含む)、人工的な手段(すなわち、培養物中の単一の単離された細胞が増殖し、細胞の集団へと反復的に分裂する)を通して生じ得る。クローン増殖はまた、病原性プロセスの結果として、例えば、体内の細胞が漸進的に増殖および分裂する能力を得た場合や、細胞が分裂すべきでないときに分裂してその娘細胞を含む腫瘍を形成する場合に生じ得る。クローンは、その性質上、サブクローン、すなわち、元のクローン創始者の娘細胞にクローン的に由来する、より小さな細胞の集団を含有する。これらのサブクローンは、それらの特定の創始細胞を参照して見ると、それ自体が単純にクローンであるが、より早い創設細胞(founding cell)に対して見た場合、サブクローンと呼ばれる。
【0026】
「クローン」または「クローン増殖」という用語は、それ自体が、必ずしも上記のうちのどれか、または他のプロセスが、クローンの増殖をもたらした可能性があることを示すものではない。クローン増殖は、関連細胞の集団(すなわち、ヒトにおいて健康な組織内に腫瘍を形成する1つの細胞)または非関連細胞(すなわち、多くの異なるヒトの細胞から確立された培養中の細胞の集団)内で生じ得る。一般に、より大きな細胞集団内でクローン増殖を起こしている細胞を認識するためには、通常、細胞およびその娘細胞を集団内の他の細胞から区別するための、ある形態の少なくとも1つの固有の系譜マーカーが存在する必要がある。その系譜マーカーは、創始細胞に実質的に固有であり、娘細胞へと伝播する遺伝的バリアントであってもよい。かかる遺伝的バリアントは、核ゲノム、ミトコンドリアゲノム、エピ変異、上記から得られる細胞の他の分子(すなわち、タンパク質)への他の遺伝的変化、または変化であってもよく、検出することができる。クローン増殖/クローンの特定の系譜マーカーは、それ自体が増殖に関与し得るか、もしくは寄与し得る(すなわち、「ドライバー」)、または単にクローンをマークし、特定の機能(すなわち、「パッセンジャー」または「ヒッチハイカー」)を果たさなくてもよい。
【0027】
異種細胞集団における細胞のクローン増殖は、様々な理由で生じ得、確率的なクローン増殖、増殖速度の増加、老化の低減、接触阻害の低減を含む。これらの後者の場合では、クローン増殖は、細胞の集団中の他の細胞と比較して、正の増殖バイアス(例えば、相対的な増殖の利点)の結果として生じる。単一の細胞のこの増加した繁殖または優先的な繁殖は、異種細胞集団中の他の細胞よりも多くの数の娘細胞/誘導体細胞を産生し、その結果、その細胞からの娘細胞または誘導体細胞が細胞集団内で不釣合に増殖してクローンを形成する。例えば、一部の実施形態では、クローン増殖を起こす細胞は、腫瘍性である。一部の実施形態では、クローン増殖を起こす細胞は、異種細胞集団中の他の細胞よりも健康である(例えば、集団中の他の細胞は、負の増殖バイアスを有する)。
【0028】
クローン選択:本明細書で使用される場合、「クローン選択」は、集団中の特定の細胞に対する選択または正のバイアスを指す。一般に、クローン選択は、単一の細胞の増加または優先的な繁殖をもたらして、異種細胞集団内の他の細胞よりも多くの数の娘/誘導体細胞を産生する事象および/またはシグナルであり、その結果、その細胞からの娘細胞または誘導体細胞が、細胞集団内で不釣合に増殖または生存する。
【0029】
決定:本明細書に記載の多くの方法論は、「決定する」ステップを含む。当業者は、本明細書を読むと、かかる「決定する」ことが、例えば本明細書に明示的に言及される特定の技術を含め、当業者が利用可能な様々な技術のいずれかの使用を通して利用され得るか、または達成され得ることを理解するだろう。一部の実施形態では、決定することは、物理的な試料の操作を伴う。一部の実施形態では、決定することは、(例えば、関連する分析を行うように適合されたコンピュータまたは他の処理ユニットを利用した、)データまたは情報の検討および/または操作を伴う。一部の実施形態では、決定することは、供給源から関連情報および/または資料を受信することを伴う。一部の実施形態では、決定することは、試料またはエンティティの1つ以上の特徴を、比較可能な参照と比較することを伴う。
【0030】
デュプレックス配列決定(DS):本明細書で使用される場合、「デュプレックス配列決定(Duplex Sequencing、DS)」は、その最も広い意味で、個々のDNA分子の両方の鎖からの配列を比較することによって卓越した精度を達成する、エラー修正方法を指す。
【0031】
操作された:当業者は、本開示を読むと、「操作された(engineered)」という用語が、本明細書で使用される場合、人間の手によって操作され、変更された様相を指すことを理解するだろう。特に、「操作された細胞」という用語は、その遺伝的、エピジェネティック、および/または表現型の同一性が、適切な参照細胞(例えば、その他は同一の、そのように操作されていない細胞)と比較して変化するように操作された細胞を指す。一部の実施形態では、操作は、遺伝子編集、塩基編集、および遺伝子療法などの遺伝子操作であるか、またはそれを含む。一部の実施形態では、操作された細胞は、目的の特定の薬剤(例えば、タンパク質、核酸、および/またはその特定の形態)を、そのような適切な参照細胞と比較して、変化した量および/または変化したタイミングに従って、含有および/または発現するように操作された細胞である。
【0032】
発現:本明細書で使用される場合、核酸配列の「発現」は、以下の事象のうちの1つ以上を指す:(1)DNA配列からのRNAテンプレートの産生(例えば、転写による)、(2)RNA転写物のプロセシング(例えば、スプライシング、編集、5’キャップ形成および/または3’末端形成による)、(3)RNAのポリペプチドもしくはタンパク質への翻訳、および/または(4)ポリペプチドもしくはタンパク質の翻訳後修飾。
【0033】
遺伝子:本明細書で使用される場合、「遺伝子」という用語は、産物(例えば、RNA産物および/またはポリペプチド産物)をコードする染色体中のDNA配列を指す。一部の実施形態では、遺伝子は、コード配列(すなわち、特定の生成物をコードする配列)を含み、一部の実施形態では、遺伝子は、非コード配列を含む。一部の特定の実施形態では、遺伝子は、コード配列(例えば、エクソン性)配列および非コード(例えば、イントロン性)配列の両方を含んでもよい。一部の実施形態では、遺伝子は、例えば、遺伝子発現の1つ以上の様相(例えば、細胞型特異的発現、誘導性発現など)を制御し得るか、またはそれに影響を与え得る1つ以上の調節要素を含んでいてもよい。
【0034】
ゲノム編集:本明細書で使用される場合、「ゲノム編集(genome editing)」、「ゲノム編集(genomic editing)」または「ゲノム操作(genome engineering)」は、生体(例えば、細胞または複数の細胞)中の核酸(例えば、ゲノムDNA、ミトコンドリアDNAまたは他のDNA)への変化を、変化または操作するためのプロセスを指す。ゲノム編集は、生体のゲノム中で、核酸配列(複数可)を、挿入、欠失、修飾、置換、修正、中断、損傷、非機能化、または変異するためのシステムを提供することを含み得る。標的ゲノム編集は、例えば、意図されたゲノム遺伝子座で、特定の配列を変化させ得る(例えば、「編集される」)方法を含む。例えば、プログラム可能な部位特異的ヌクレアーゼなどの遺伝子ツールを使用して、インビボで所望の変化をゲノムに誘導することができる。ゲノム編集は、インビトロまたは別の生体でDNA配列を遺伝子操作し、続いて、この配列を目的のゲノムに挿入することによって達成することができる。
【0035】
gRNA:本明細書で使用される場合、「gRNA」または「ガイドRNA」は、標的化エンドヌクレアーゼ(例えば、Cas酵素(例えば、Cas9もしくはCpf1)または同様の特性を有する別のリボ核酸タンパク質など)を、DNAまたはRNAの特定の領域の切断を容易にする実質的に標的特異性の配列に結合するのに適した足場配列を含む短いRNA分子を指す。
【0036】
相同性:本明細書で使用される場合、「相同性(homology)」という用語は、高分子間、例えば、核酸分子(例えば、DNA分子および/またはRNA分子)間、の全体的な関連性を指す。一部の実施形態では、ポリマー分子は、それらの配列が、少なくとも80%、85%、90%、95%、または99%同一である場合、互いに「相同」であると見なされる。他の実施形態では、類似度は、30%未満、少なくとも30%、40%、50%、60%、70%、または70%を超える場合があってもよい。当業者に理解されるように、異なる配列においてどの残基が互いに「対応する(correspond)」かを考慮する場合、ある配列の指定された長さのギャップを別の配列に対して許容することを含め、それらの相同性の程度を決定するために配列の比較を可能にする様々なアルゴリズムが利用可能である。2つの核酸配列間の相同性パーセントの計算は、例えば、最適な比較目的のために2つの配列を整列させることによって行うことができる(例えば、最適な整列のために第1の核酸配列および第2の核酸配列の一方または両方にギャップを導入することができ、比較目的のために非対応配列を無視することができる)。特定の実施形態では、比較目的のために整列された配列の長さは、参照配列の長さの少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または実質的に100%である。次いで、対応するヌクレオチド位置で、ヌクレオチドを比較する。第1の配列における位置が、第2の配列における対応する位置と同じヌクレオチドによって占有される場合、分子は、その位置において同一であり、第1の配列における位置が、第2の配列における対応する位置と類似のヌクレオチドによって占有される場合、分子は、その位置において類似する。2つの配列間の相同性パーセントは、ギャップの数、および2つの配列の最適な整列のために導入する必要がある各ギャップの長さを考慮して、配列によって共有される同一および類似の位置の数の関数である。2つのヌクレオチド配列間の相同性パーセントを決定するのに有用なアルゴリズムおよびコンピュータプログラムは、当該技術分野でよく知られている。
【0037】
変異:本明細書で使用される場合、「変異(mutation)」という用語は、参照配列に対する、核酸配列または構造の変化を指す。ポリヌクレオチド配列に対する変異は、複雑な複数ヌクレオチド変化の中で、試料中の点変異(例えば、単一塩基変異)、複数ヌクレオチドの変異、ヌクレオチドの欠失、配列再編成、ヌクレオチドの挿入およびDNA配列の重複を含んでいてもよい。変異は、相補的な塩基の変化(すなわち、真の変異)として、または一方の鎖にはあるが、他方の鎖にはない変異(すなわち、ヘテロ二重鎖)として、二重鎖(duplex)DNA分子の両方の鎖上で起きてもよく、修復されるか、破壊されるか、または誤って修復されるか/真の二本鎖変異へと変換されるかのいずれかの可能性を有する。参照配列は、データベース(すなわち、HG38ヒト参照ゲノム)、または配列が比較される別の試料の配列に存在し得る。変異は、遺伝的バリアントとしても知られている。
【0038】
変異体頻度:本明細書で使用される場合、「変異体頻度」という用語は、「変異頻度」と呼ばれることもあり、配列決定される塩基対の総数あたりに検出される固有の変異の数を指す。一部の実施形態では、固有の変異は、デュプレックス配列決定で検証される変異として定義され、配列決定される塩基対の総数は、デュプレックス配列決定によって検証されるものとして定義される。一部の実施形態では、変異体頻度は、特定の遺伝子のみ、遺伝子のセット、またはゲノム標的のセットの中の変異の頻度である。一部の実施形態では、変異体頻度は、特定の種類の変異のみを指していてもよい(例えば、A>T変異の頻度は、A塩基の総数あたりのA>T変異の数として計算される)。特に、変異が細胞または分子の集団に生じる頻度は、対象の年齢によって、時間と共に、組織または器官の種類によって、ゲノムの領域によって、変異の種類によって、トリヌクレオチドコンテキスト(trinucleotide context)、遺伝性の遺伝的背景によって、変異原性化学物質への曝露によって、放射線への曝露によって、および上記のうちのいずれかを含む環境への曝露によって、変化し得る。
【0039】
変異シグネチャ:本明細書で使用される場合、「変異シグネチャ」、「変異スペクトラム」または「変異スペクトル」という用語は、DNA複製の不忠実性、外因性および内因性の遺伝毒性物質への曝露、欠陥のあるDNA修復経路、およびDNAの酵素編集などの変異導入プロセスから生じる変異の種類の特徴的な組み合わせを指す。変異スペクトルは、三塩基対ヌクレオチド配列コンテキスト間の可能な種類の変異の相対的存在量のパターンを伴うトリヌクレオチド変異スペクトルを含んでもよい。かかるスペクトルは、参照ゲノム中の配列コンテキストの相対的存在量によって正規化され得る。変異スペクトルは、任意の配列コンテキストにおける任意の種類の変異を伴い得る。一実施形態では、変異スペクトラムは、計算パターンマッチング(例えば、教師なし階層型変異スペクトラムクラスタリング、非負値マトリックス因子分解など)によって、他の試料またはデータセットの変異スペクトラムと比較されてもよい。
【0040】
核酸:本明細書で使用される場合、その最も広い意味で、オリゴヌクレオチド鎖に組み込まれているか、または組み込まれ得る任意の化合物および/または物質を指す。一部の実施形態では、核酸は、ホスホジエステル結合を介してオリゴヌクレオチド鎖に組み込まれているか、または組み込まれ得る化合物および/または物質である。文脈から明らかになるように、一部の実施形態では、「核酸」は、個々の核酸残基(例えば、ヌクレオチドおよび/またはヌクレオシド)を指し、一部の実施形態では、「核酸」は、個々の核酸残基を含むオリゴヌクレオチド鎖を指す。一部の実施形態では、「核酸」は、RNAであるか、またはRNAを含み、一部の実施形態では、「核酸」は、DNAであるか、またはDNAを含む。一部の実施形態では、核酸は、1つ以上の天然核酸残基であるか、1つ以上の天然核酸残基を含むか、または1つ以上の天然核酸残基からなる。一部の実施形態では、核酸は、1つ以上の核酸類似体であるか、1つ以上の核酸類似体を含むか、または1つ以上の核酸類似体からなる。一部の実施形態では、核酸類似体は、ホスホジエステル骨格を利用しない点において核酸と異なる。例えば、一部の実施形態では、核酸は、1つ以上の「ペプチド核酸」であるか、1つ以上の「ペプチド核酸」を含むか、または1つ以上の「ペプチド核酸」からなり、当該技術分野で既知であり、骨格内のホスホジエステル結合の代わりにペプチド結合を有し、本技術の範囲内であると見なされる。代替的または追加的に、一部の実施形態では、核酸は、ホスホジエステル結合ではなく、1つ以上のホスホロチオエート結合および/または5’-N-ホスホラミダイト結合を有する。一部の実施形態では、核酸は、1つ以上の天然ヌクレオシド(例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシンおよびデオキシシチジン)であるか、1つ以上の天然ヌクレオシドを含むか、または1つ以上の天然ヌクレオシドからなる。一部の実施形態では、核酸は、1つ以上のヌクレオシド類似体(例えば、2-アミノアデノシン、2-チオチミジン、イノシン、ピロロ-ピリミジン、3-メチルアデノシン、5-メチルシチジン、C-5プロピニルシチジン、C-5プロピニルウリジン、2-アミノアデノシン、C5-ブロモウリジン、C5-フルオロウリジン、C5-ヨードウリジン、C5-プロピニルウリジン、C5-プロピニルシチジン、C5-メチルシチジン、2-アミノアデノシン、7-デアザアデノシン、7-デアザグアノシン、8-オキソアデノシン、8-オキソグアノシン、0(6)-メチルグアニン、2-チオシチジン、メチル化塩基、インターカレーションされた塩基、およびこれらの組み合わせ)であるか、1つ以上のヌクレオシド類似体を含むか、または1つ以上のヌクレオシド類似体からなる。一部の実施形態では、核酸は、天然核酸中の糖類と比較して、1つ以上の修飾された糖類(例えば、2’-フルオロリボース、リボース、2’-デオキシリボース、アラビノースおよびヘキソース)を含む。一部の実施形態では、核酸は、RNAまたはタンパク質などの機能的遺伝子産物をコードするヌクレオチド配列を有する。一部の実施形態では、核酸は、1つ以上のイントロンを含む。一部の実施形態では、核酸は、天然源からの単離、相補的テンプレートに基づく重合による酵素合成(インビボまたはインビトロで)、組換え細胞または系における複製および化学合成のうちの1つ以上によって調製される。一部の実施形態では、核酸は、少なくとも2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、またはそれを超える残基長である。一部の実施形態では、核酸は、部分的または完全に一本鎖であり、一部の実施形態では、核酸は、部分的または完全に二本鎖である。一部の実施形態では、核酸は、二次構造を有する分枝鎖であってもよい。一部の実施形態では、核酸は、ポリペプチドをコードするか、またはポリペプチドをコードする配列の相補である少なくとも1つの要素を含むヌクレオチド配列を有する。一部の実施形態では、核酸は、酵素活性を有する。一部の実施形態では、核酸は、例えば、リボ核酸タンパク質複合体またはトランスファーRNAにおいて、機械的な機能を果たす。
【0041】
パッセンジャー変異:本明細書で使用される場合、「パッセンジャー変異」という用語は、変異がクローンにおいて特定されるが、クローン増殖自体に寄与したとは考えられない変異を指す。これは、クローン増殖自体に機能的に貢献したと合理的に考えられる「ドライバー変異」とは対照的である。
【0042】
ポリヌクレオチド損傷:本明細書で使用される場合、「ポリヌクレオチド損傷」または「核酸損傷」という用語は、対象のデオキシリボ核酸(DNA)配列に対する損傷(「DNA損傷」)またはリボ核酸(RNA)配列に対する損傷(「RNA損傷」)を指し、エクスビボまたはインビボの要因(例えば、遺伝毒性物質への曝露、加齢、代謝プロセスなど)によって、直接的もしくは間接的に(例えば、代謝物、または損傷性もしくは変異原性であるプロセスの誘発)引き起こされるか、または誘発される。損傷した核酸は、疾患または障害、例えば、対象における遺伝毒性物質曝露、加齢、または他の変異原性プロセスと関連する疾患または障害、の発症を引き起こす場合がある。一部の実施形態では、対象における損傷した核酸の検出は、遺伝毒性物質曝露の指標となり得る。ポリヌクレオチド損傷は、細胞におけるDNAの化学的および/または物理的な修飾をさらに含んでいてもよい。一部の実施形態では、損傷は、非限定的な例として、酸化、アルキル化、脱アミノ化、メチル化、加水分解、ヒドロキシル化、ニッキング、鎖内架橋、鎖間架橋、平滑末端鎖切断、付着末端二本鎖切断、リン酸化、脱リン酸化、SUMO化、グリコシル化、脱グリコシル化、プトレシニル化、カルボキシル化、ハロゲン化、ホルミル化、一本鎖ギャップ、熱からの損傷、乾燥からの損傷、UV曝露からの損傷、γ線からの損傷、X線からの損傷、電離放射線からの損傷、非電離放射線からの損傷、重粒子放射線からの損傷、核崩壊からの損傷、β放射線からの損傷、α放射線からの損傷、中性子放射線からの損傷、陽子放射線からの損傷、宇宙放射線からの損傷、高pHからの損傷、低pHからの損傷、活性酸化種からの損傷、フリーラジカルからの損傷、過酸化物からの損傷、次亜塩素酸塩からの損傷、ホルマリンまたはホルムアルデヒドなどの組織固定からの損傷、反応性鉄からの損傷、低イオン状態からの損傷、高イオン状態からの損傷、無緩衝状態からの損傷、ヌクレアーゼからの損傷、環境曝露からの損傷、火災からの損傷、機械的ストレスからの損傷、酵素分解からの損傷、微生物からの損傷、調製の機械的剪断からの損傷、調製の酵素断片化からの損傷、インビボで自然発生した損傷、核酸抽出中に発生した損傷、配列決定ライブラリ調製中に発生した損傷、ポリメラーゼによって導入された損傷、核酸修復中に導入された損傷、核酸の末端テーリング中に発生した損傷、核酸ライゲーション中に発生した損傷、配列決定中に発生した損傷、DNAの機械的取り扱いから発生した損傷、ナノポアを通過中に発生した損傷、生物における老化の一部として発生した損傷、個体の化学物質曝露の結果として発生した損傷、変異原によって生じた損傷、発癌物質によって生じた損傷、染色体切断物質によって発生した損傷、酸素曝露によるインビボでの炎症性損傷から生じた損傷、1つ以上の鎖切断による損傷、のうちの少なくとも1つ、およびこれらの任意の組み合わせであるか、またはこれらを含む。
【0043】
参照:本明細書で使用される場合、「参照」は、比較が行われる標準または対照を指す。例えば、一部の実施形態では、目的の、薬剤、動物、個体、集団、試料、配列または値が、ある場所に存在し得るかまたは電子手段を介して遠隔的にアクセスし得る物理的またはコンピュータのデータベースにおいて、参照または対照の、薬剤、動物、個体、集団、試料、配列または値、もしくはこれらの代表と、比較される。一部の実施形態では、参照または対照は、目的の試験もしくは決定と実質的に同時に試験され、かつ/または決定される。一部の実施形態では、参照または対照は、歴史的な参照または対照であり、任意選択的に、有形媒体で具現化される。典型的には、当業者に理解されるように、参照または対照は、評価されるものと同等の条件もしくは状況下で決定されるか、または特徴付けられる。当業者は、特定の可能な参照もしくは対照に対する信頼および/または比較を正当化するのに十分な類似性がいつ存在するかを理解するだろう。
【0044】
参照試料:本明細書で使用される場合、「参照試料」は、参照試料がゲノム編集事象を経ていないことを除き、その他は比較される試料と同一である試料を指す。例えば、参照試料は、参照試料がゲノム編集事象(例えば、操作されたゲノム編集事象)を経るように誘導されていないことを除き、比較される試料(例えば、試験試料)と同じ方法で単離され得る。
【0045】
安全閾値バリアント頻度:本明細書で使用される場合、「安全閾値バリアント頻度」という用語は、「安全閾値変異体頻度」と呼ばれることもあり、ゲノム編集事象もしくはプロセスまたは別の変異誘発プロセスによって引き起こされる、許容される変異もしくはバリアントの生成の割合および/または総存在量を指し、それらを下回ると、細胞内での腫瘍化の可能性または他の遺伝子撹乱のリスクが許容される。許容されるバリアント生成の得られた変異率のリスクの耐容性は、細胞の種類、ゲノム編集事象の適用、対象、年齢、性別、組織の種類、患者の健康状態などに応じて異なる場合がある。
【0046】
一塩基多型(SNP):本明細書で使用される場合、「一塩基多型」または「SNP(single nucleotide polymorphism)」という用語は、あるアレルを別のアレルから区別する代替塩基が知られているゲノムの特定の塩基位置を指す。SNPは、本質的に一塩基であるバリエーションを指し、複数ヌクレオチドバリアントを指すMNV(multinucleotide variant)とは対照的である。「コピー数多型」または「コピー数バリアント」(CNPまたはCNVと称される)は、DNA内の配列のコピー数におけるバリエーションを指す。一部の実施形態では、1つまたはいくつかのSNPおよび/またはCNPは、複雑な遺伝的バリアントを互いに区別するのに十分であるため、分析目的で、1つまたは1セットのSNPおよび/またはCNPは、特定のバリアント、形質、細胞型、個体、種など、またはそれらのセットの特徴であるとみなされてもよい。一部の実施形態では、1つまたは1セットのSNPおよび/またはCNPを考慮して、特定のバリアント、形質、細胞型、個体、種など、またはそれらのセットを定義してもよい。最も一般的な使用では、SNPは、一般に、当のバリアントが生殖系列から遺伝することを意味する。より広い用語の一塩基バリアント(SNV)は、遺伝したSNPまたは体細胞的に獲得された変異を伴ってもよい。
【0047】
単一分子識別子(SMI):本明細書で使用される場合、「単一分子識別子」または「SMI」という用語(特に、「タグ」、「バーコード」、「分子バーコード」、「固有分子識別子」すなわち「UMI」と呼ばれてもよい)は、いずれか単独でまたは別の分子特徴と組み合わせて、より大きな異種の分子集団の間で個々の分子を実質的に区別することが可能な任意の物質(例えば、ヌクレオチド配列、核酸分子特徴)を指す。一部の実施形態では、SMIは、外因的に適用されるSMIであってもよいか、または外因的に適用されるSMIを含んでいてもよい。一部の実施形態では、外因的に適用されるSMIは、縮重または半縮重した配列であってもよいか、または縮重または半縮重した配列を含んでいてもよい。一部の実施形態では、実質的に縮重したSMIは、ランダムな固有分子識別子(R-UMI)として知られている場合がある。一部の実施形態では、SMIは、既知のコードのプール内からのコード(例えば、核酸配列)を含んでいてもよい。一部の実施形態では、所定のSMIコードは、定義された固有分子識別子(D-UMI)として知られている。一部の実施形態では、SMIは、内因性SMIであってもよいか、または内因性SMIを含んでいてもよい。一部の実施形態では、内因性SMIは、標的配列の特定の剪断点、標的配列を含む個々の分子の末端に関連する特徴、または個々の分子の一端にあるか、個々の分子の一端に隣接するか、もしくは個々の分子の一端から既知の距離内の特定の配列に関連する情報であってもよいか、またはこれらの情報を含んでいてもよい。一部の実施形態では、SMIは、核酸分子に対する無作為または半無作為な損傷、化学修飾、酵素修飾、または他の修飾に起因する、核酸分子における配列バリエーションに関連するものであってもよい。一部の実施形態では、修飾は、メチルシトシンの脱アミノ化であってもよい。一部の実施形態では、修飾は、核酸ニックの部位を伴っていてもよい。一部の実施形態では、SMIは、外因性の要素と内因性の要素の両方を含んでいてもよい。一部の実施形態では、SMIは、物理的に隣接するSMI要素を含んでいてもよい。一部の実施形態では、SMI要素は、分子内で空間的に明確に異なってもよい。一部の実施形態では、SMIは、非核酸であってもよい。一部の実施形態では、SMIは、2つ以上の異なる種類のSMI情報を含んでいてもよい。SMIの様々な実施形態は、国際特許公開第WO2017/100441号にさらに開示されており、その全体が参照により本明細書に援用される。
【0048】
鎖定義要素(SDE):本明細書で使用される場合、「鎖定義要素」または「SDE」という用語は、二本鎖核酸物質の特定の鎖の識別を可能にし、したがって、他の/相補鎖からの区別を可能にする任意の物質(例えば、配列決定または他の核酸照合の後に、標的二本鎖核酸から得られる2つの一本鎖核酸の各々の増幅産物を、実質的に互いに区別可能にする任意の物質)を指す。一部の実施形態では、SDEは、アダプター配列中の実質的に非相補的な配列の1つ以上のセグメントであってもよいか、またはこのセグメントを含んでいてもよい。特定の実施形態では、アダプター配列中の実質的に非相補的な配列のセグメントは、Y字型または「ループ」形状を含むアダプター分子によって提供されてもよい。他の実施形態では、アダプター配列中の実質的に非相補的な配列のセグメントは、アダプター配列中の隣接する相補的な配列の中央に、対になっていない「バブル」を形成してもよい。他の実施形態では、SDEは、核酸修飾を包含してもよい。一部の実施形態では、SDEは、対になった鎖の、物理的に分離した反応コンパートメントへの、物理的な分離を含んでいてもよい。一部の実施形態では、SDEは、化学修飾を含んでもよい。一部の実施形態では、SDEは、修飾された核酸を含んでもよい。一部の実施形態では、SDEは、核酸分子に対する無作為または半無作為な損傷、化学修飾、酵素修飾、または他の修飾に起因する、核酸分子における配列バリエーションに関連するものであってもよい。一部の実施形態では、修飾は、メチルシトシンの脱アミノ化であってもよい。一部の実施形態では、修飾は、核酸ニックの部位を伴っていてもよい。SDEの様々な実施形態は、国際特許公開第WO2017/100441号にさらに開示されておおり、その全体が参照により本明細書に援用される。
【0049】
対象:本明細書で使用される場合、「対象」という用語は、生物、典型的には、哺乳動物、例えば、ヒト(一部の実施形態では、出生前のヒト形態を含む)、非ヒト動物(例えば、哺乳動物および非哺乳動物、限定されないが、非ヒト霊長類、ウマ、ヒツジ、イヌ、ウシ、ブタ、ニワトリ、両生類、爬虫類、海洋生物(一般的にシーモンキーを除く)、他のモデル生物、例えば、虫、ハエ、ゼブラフィッシュなど)、およびトランスジェニック動物(例えば、トランスジェニックげっ歯類)などを指す。一部の実施形態では、対象は、ゲノム編集事象を経た細胞で治療されるか、またはゲノム編集事象を経た細胞に暴露される。一部の実施形態では、対象は、関連する疾患、障害または状態に罹患している。一部の実施形態では、対象は、ある疾患、障害または状態にかかりやすい。一部の実施形態では、対象は、ある疾患、障害または状態の、1つ以上の症状または特徴を示す。一部の実施形態では、対象は、ある疾患、障害または状態の、症状または特徴を何ら示さない。一部の実施形態では、対象は、ある疾患、障害もしくは状態へのなりやすさ、またはある疾患、障害もしくは状態のリスクに特徴的な1つ以上の特徴を有する。一部の実施形態では、対象は、診断および/または治療が実施されるか、および/または実施された個体である。他の実施形態では、生体試料は、対象から単離されるか、抽出されるか、またはそれ以外の方法で得られる。一部の実施形態では、対象は、ゲノム編集され得る任意の生きた生体源または他の核酸物質を指し、例えば、生物、細胞および/または組織、インビボ試験用のものなど、例えば、真菌、植物、原生動物、細菌、古細菌、ウイルス、培養物中の単離された細胞、意図的に(例えば、幹細胞移植、臓器移植)または非意図的に(すなわち、胎児または母体のマイクロキメリズム)編集または単離された核酸もしくはオルガネラ(すなわち、ミトコンドリア、葉緑体、遊離ウイルスゲノム、遊離プラスミド、アプタマー、リボザイム、または核酸の誘導体もしくは前駆体(すなわち、オリゴヌクレオチド、ジヌクレオチド三リン酸など)を含み得る。
【0050】
実質的に:本明細書で使用される場合、「実質的に」という用語は、目的の特徴または性質の全体もしくはほぼ全体の程度または度合いを示す定性的な状態を指す。生物学の当業者は、生物学的現象および化学的現象が、完全に終了すること、および/または完全に終了することに向けて進むこと、または絶対的な結果を達成するか、もしくは回避することは、もしあるにしてもまれであることを理解するだろう。したがって、「実質的に」という用語は、多くの生物学的現象および化学的現象に内在する完全性の潜在的欠如を捕捉するために本明細書で使用される。
【0051】
治療上有効量:本明細書で使用される場合、「治療上有効量」という用語は、治療投薬レジメンに従って、疾患、障害、および/または状態に罹患しているかまたは罹患しやすい集団に投与される場合に、疾患、障害、および/または状態を治療するのに十分な量を意味する。一部の実施形態では、治療上有効量は、ある疾患、障害、および/または状態の1つ以上の症状の発生および/または重症度を低減し、それらの1つ以上の特徴を安定させ、かつ/またはそれらの発症を遅らせる量である。当業者は、「治療上有効量」という用語が、特定の個体で達成される成功した治療を実際には必要としないことを理解するであろう。むしろ、治療上有効量は、そのような治療を必要とする患者に投与される場合、かなりの数の対象において特定の所望の薬理学的応答を提供する量であり得る。
【0052】
トリヌクレオチドまたはトリヌクレオチドコンテキスト:本明細書で使用される場合、「トリヌクレオチド」または「トリヌクレオチドコンテキスト」という用語は、配列において直前および直後にあるヌクレオチド塩基のコンテキスト内のヌクレオチド(例えば、3つのモノヌクレオチドの組み合わせ中のモノヌクレオチド)を指す。
【0053】
トリヌクレオチドスペクトラムまたはシグネチャ:本明細書では、「トリヌクレオチドシグネチャ」という用語は、「トリヌクレオチドスペクトラム」、「トリプレットシグネチャ」および「トリプレットスペクトラム」と互換的に使用され、トリヌクレオチドコンテキスト内の変異シグネチャを指す。特定の実施形態では、ゲノム編集事象は、固有の、半固有の、および/または別の識別可能なトリプレットスペクトラム/シグネチャを有していてもよい。場合によっては、変異シグネチャとしても知られる変異体シグネチャは、トリヌクレオチドシグネチャを含む。
【0054】
治療:本明細書で使用される場合、「治療」という用語は、対象に対する治療剤の適用または投与、あるいは対象から単離された組織または細胞株に対する治療薬剤の適用または投与を指し、対象は、障害、例えば、疾患、状態、または疾患の症状、または疾患に対する素因を有し、その目的は、その疾患、疾患の症状、または疾患に対する素因を、治し、治癒し、軽減し、緩和し、変化させ、救済し、寛解し、改善し、または影響を与えることである。治療はまた、その疾患、疾患の症状を、治し、治癒し、軽減し、緩和し、変化させ、救済し、寛解し、改善し、または影響を与えることが意図されていない、変化を誘導する目的で、対象または細胞に対する曝露またはプロセスの適用を指してもよい。例えば、実験動物は、ヒトに対するその効果を予測するためなど、げっ歯類の対象に対するその有害な影響を評価する目的で、有害な化学物質で処置されてもよい。
【0055】
バリアント:本明細書で使用される場合、「バリアント(variant)」という用語は、参照エンティティと有意な構造同一性を示すが、参照エンティティと比較して、1つ以上の化学部分の存在またはレベルが、参照エンティティと構造的に異なるエンティティを指す。核酸のコンテキストにおいて、バリアント核酸は、線形または三次元空間中の別の核酸に対して、指定された位置を有する複数のヌクレオチド残基からなる特徴的な配列要素を有し得る。相同性を有する配列は、1つ以上のバリアントによって異なる。例えば、バリアントポリヌクレオチド(例えば、DNA)は、核酸配列の1つ以上の差異の結果として、参照ポリヌクレオチドと異なる場合がある。一部の実施形態では、バリアントポリヌクレオチド配列は、別の配列(例えば、試料中の参照配列または他のポリヌクレオチド(例えば、DNA)配列)に対する挿入、欠失、置換または変異を含む。バリアントの例としては、SNP、SNV、CNV、CNP、MNV、MNP、変異、癌変異、ドライバー変異、パッセンジャー変異、遺伝性多型が挙げられる。
【0056】
バリアント頻度:本明細書で使用される場合、「バリアント頻度」という用語は、集団における特定の遺伝子座での遺伝的バリアントの相対的な頻度を指し、集団の割合またはパーセンテージとして表される。集団は、中でも、細胞の集団、生物の集団、対象の集団、または分子の集団もしくはDNA分子の集団であってもよい。
【0057】
バリアントアレル頻度:本明細書で使用される場合、「バリアントアレル頻度」という用語は、集団中の特定の遺伝子座でのアレル(遺伝子のバリアント)の相対的な頻度を指す(中でも、細胞の集団、生物の集団、対象の集団、または分子の集団もしくはDNA分子の集団の中で、特定のアレルを担持する集団中のすべての染色体の割合)。
【0058】
デュプレックス配列決定方法ならびに関連するアダプターおよび試薬の選択された実施形態
デュプレックス配列決定は、二本鎖核酸分子からエラー修正DNA配列を生成するための方法であり、元々、国際特許公開第WO2013/142389号および米国特許第9,752,188号および第WO2017/100441号、Schmittら、PNAS、2012[1]、Kennedyら、PLOS Genetics、2013[2]、Kennedyら、Nature Protocols、2014[3]、およびSchmittら、Nature Methods、2015[4]に記載された。上述の特許、特許出願および刊行物はそれぞれ、それらの全体が参照により本明細書に組み込まれる。
図1A~
図1Cに示されるように、本技術の特定の態様では、デュプレックス配列決定を使用して、個々のDNA分子の両方の鎖を独立して配列決定することができ、その結果、大規模並列配列決定(MPS)(一般的に次世代配列決定(NGS)としても知られる)中に、誘導体配列リードを、同じ二本鎖核酸親分子に由来するものとして認識することができるだけではなく、配列決定後に区別可能なエンティティとして互いに区別できるようになる。次いで、各鎖から得られる配列リードを、二本鎖コンセンサス配列(DCS)として知られる元の二本鎖核酸分子のエラー修正配列を得る目的のために比較する。デュプレックス配列決定のプロセスは、元の二本鎖核酸分子の両方の鎖が、DCSを形成するために使用される生成された配列決定データ中に表されることを、明示的に確認することを可能にする。
【0059】
特定の実施形態では、DSを組み込む方法は、1つ以上の配列決定アダプターを、第1の鎖の標的核酸配列と第2の鎖の標的核酸配列とを含む標的二本鎖核酸分子にライゲーションして、二本鎖標的核酸複合体を生成することを含んでいてもよい(例えば、
図1A)。
【0060】
様々な実施形態では、得られる標的核酸複合体は、少なくとも1つのSMI配列を含んでいてもよく、外因的に適用される縮重または半縮重配列(例えば、
図1Aに示されるランダム化された二重鎖タグ、
図1Aで、αおよびβとして特定された配列)、標的二本鎖核酸分子の特定の剪断点に関連する内因的な情報、またはこれらの組み合わせ、を伴っていてもよい。SMIは、標的核酸分子を、いずれか単独で、またはそれらがライゲーションされた核酸断片の要素を区別することと組み合わせて、配列決定される集団の中の複数の他の分子から実質的に区別可能にすることができる。SMI要素の実質的に区別可能な特徴は、二本鎖核酸分子を形成する各々の一本鎖によって独立して保有されてもよく、各々の鎖の誘導体増幅産物が、配列決定後に同じ元の実質的に固有の二本鎖核酸分子に由来するものであると認識され得る。他の実施形態では、SMIは、さらなる情報を含んでいてもよく、かつ/または上に引用した刊行物に記載されるものなど、機能性を区別するかかる分子が有用である他の方法において使用されてもよい。別の実施形態では、SMI要素は、アダプターライゲーションの後に組み込まれてもよい。一部の実施形態では、SMIは、本質的に二本鎖である。他の実施形態では、SMIは、本質的に一本鎖である(例えば、SMIは、アダプターの一本鎖部分(複数可)上にあってもよい)。他の実施形態では、SMIは、本質的に一本鎖と二本鎖の組み合わせである。
【0061】
一部の実施形態では、各二本鎖標的核酸配列複合体は、さらに、標的二本鎖核酸分子を形成する2つの一本鎖核酸の増幅産物を、配列決定後に互いに実質的に区別可能にする要素(例えば、SDE)を含んでいてもよい。一実施形態では、SDEは、配列決定アダプター内に含まれる非対称プライマー部位を含んでいてもよいか、または他の配置において、配列非対称を、プライマー配列内ではなくアダプター分子内に導入してもよく、その結果、第1の鎖の標的核酸配列複合体と第2の鎖の標的核酸配列複合体のヌクレオチド配列の少なくとも一部が、増幅および配列決定の後に互いに異なっている。他の実施形態では、SMIは、標準的(canonical)ヌクレオチド配列A、T、C、GまたはUとは異なるが、2つの増幅され、配列決定された分子における少なくとも1つの標準的ヌクレオチド配列の差に変換される、2つの鎖間の別の生化学的非対称を含んでいてもよい。さらに別の実施形態では、SDEは、増幅前に2つの鎖を物理的に分離する手段であってもよく、その結果、第1の鎖の標的核酸配列および第2の鎖の標的核酸配列からの誘導体増幅産物は、これら2つの配列間の区別を維持する目的のために、互いに実質的に物理的に単離された状態を維持する。第1の鎖と第2の鎖とを区別することを可能にするSDE機能を提供するための他のこのような配置および方法論、例えば、上に引用した刊行物に記載されるもの、または記載した機能目的を果たす他の方法を利用してもよい。
【0062】
少なくとも1つのSMIと少なくとも1つのSDEとを含む二本鎖標的核酸複合体を生成した後、またはこれらの要素の片方または両方がその後に導入される場合に、複合体は、DNA増幅(例えばPCRを用いる)またはDNA増幅の任意の他の生化学的方法(例えば、ローリングサークル増幅、複数置換増幅、等温増幅、ブリッジ増幅または表面結合増幅)が行われてもよく、その結果、第1の鎖の標的核酸配列の1つ以上のコピーおよび第2の鎖の標的核酸配列の1つ以上のコピーが産生される(例えば、
図1B)。次いで、第1の鎖の標的核酸分子の1つ以上の増幅コピーおよび第2の標的核酸分子の1つ以上の増幅コピーに、好ましくは、「次世代の」大規模並列DNA配列決定プラットフォームを用いて、DNA配列決定を行うことができる(例えば、
図1B)。
【0063】
元の二本鎖標的核酸分子に由来する第1の鎖の標的核酸分子および第2の鎖の標的核酸分子のいずれかから生成される配列リードは、関連する実質的に固有なSMIを共有していることに基づいて特定され、SDEによって逆鎖の標的核酸分子から区別されてもよい。一部の実施形態では、SMIは、数学に基づくエラー修正コード(例えば、ハミングコード)に基づく配列であってもよく、それにより、特定の増幅エラー、配列決定エラーまたはSMI合成エラーは、元のデュプレックス(例えば、二本鎖核酸分子)の相補鎖に対してSMI配列の配列を関連付ける目的のために許容され得る。例えば、SMIが、標準的DNA塩基の完全に縮重した配列の15塩基対を含む、二本鎖外因性SMIの場合、推定で4の15乗=1,073,741,824のSMIバリアントが、完全に縮重したSMIの集団中に存在することになる。2つのSMIが、10,000個のサンプリングされたSMIの集団からのSMI配列内で1個のヌクレオチドのみが異なる配列決定データのリードから回収される場合、これが偶然に発生する確率を数学的に計算することができ、この単一塩基対の違いが、上述のタイプのエラーの1つを反映していることがより確からしいかどうかの決定を行うことができ、そのSMI配列が、実際に同じ元の二重鎖分子に由来していたことを決定することができる。SMIが少なくとも部分的に外因的に適用される配列であり、その配列バリアントが互いに完全に縮重したものではなく、少なくとも部分的には既知の配列である一部の実施形態では、その既知の配列の同一性は、一部の実施形態では、上述のタイプの1つ以上のエラーが、ある既知のSMI配列の同一性を別のSMI配列の同一性へと変換しないように設計することができ、その結果、あるSMIが別のSMIであると誤って解釈されてしまう確率は減少する。一部の実施形態では、このSMI設計戦略は、ハミング符号手法またはその誘導体を含む。特定されたら、第1の鎖の標的核酸分子から作られる1つ以上の配列リードを、第2の鎖の標的核酸分子から作られる1つ以上の配列リードと比較して、エラー修正標的核酸分子配列を生成する(例えば、
図1C)。例えば、第1の鎖標的核酸配列と第2の鎖標的核酸配列の両方からの塩基が一致するヌクレオチド位置は、真の配列であるとみなされ、一方、この2つの鎖間で一致しないヌクレオチド位置は、技術的なエラーの可能性がある部位と認識され、この部位は、考慮に入れられないか、除外されるか、修正されるか、または別の状況で識別されてもよい。このようにして、元の二本鎖標的核酸分子のエラー修正配列を生成することができる(
図1Cに示される)。一部の実施形態では、第1の鎖の標的核酸分子および第2の鎖の標的核酸分子から生成される各々の配列決定リードを別個にグループ化した後、第1の鎖および第2の鎖各々について一本鎖コンセンサス配列を生成することができる。次いで、第1の鎖の標的核酸分子および第2の鎖の標的核酸分子に由来する一本鎖コンセンサス配列を比較して、エラー修正標的核酸分子配列を生成することができる(例えば、
図1C)。
【0064】
代わりに、一部の実施形態では、この2本の鎖間の配列が一致しない部位は、元の二本鎖標的核酸分子において、生物学的に由来するミスマッチの可能性がある部位として認識することができる。代わりに、一部の実施形態では、この2本の鎖間の配列が一致しない部位は、元の二本鎖標的核酸分子において、DNA合成に由来するミスマッチの可能性がある部位として認識することができる。代わりに、一部の実施形態では、この2本の鎖間の配列が一致しない部位は、損傷を受けたか、または修飾されたヌクレオチド塩基が、片方もしくは両方の鎖に存在し、酵素プロセス(例えば、DNAポリメラーゼ、DNAグリコシラーゼまたは別の核酸修飾酵素または化学プロセス)によってミスマッチに変換された可能性がある部位として認識することができる。一部の実施形態では、この後者の知見を使用して、酵素プロセスまたは化学的処置の前の核酸損傷またはヌクレオチド修飾の存在を推測することができる。
【0065】
一部の実施形態では、本技術の態様に従い、本明細書に記載するデュプレックス配列決定ステップから生成される配列決定リードをさらにフィルタリングして、DNA損傷分子(例えば、貯蔵、運搬中に、組織または血液の抽出中または抽出後に、ライブライリー調製中または調製後に損傷したなど)からの配列決定リードを除外することができる。例えば、DNA修復酵素、例えば、ウラシル-DNAグリコシラーゼ(UDG)、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)および8-オキソグアニンDNAグリコシラーゼ(OGG1)を利用して、DNA損傷(例えば、インビトロでのDNA損傷またはインビボでの損傷)を除外するか、または修正することができる。これらのDNA修復酵素は、例えば、DNAから損傷した塩基を除去するグリコシラーゼである。例えば、UDGは、(シトシンの自発的な加水分解によって生じる)シトシンの脱アミノ化から得られるウラシルを除去し、FPGは、8-オキソ-グアニン(例えば、活性酸素種から得られる一般的なDNA損傷)を除去する。FPGは、リアーゼ活性も有し、脱塩基部位に1塩基ギャップを生成することができる。かかる脱塩基部位は、例えば、ポリメラーゼがテンプレートをコピーすることができないため、一般的に、その後にPCRによって増幅することができない。したがって、かかるDNA損傷修復/除外酵素の使用は、真の変異を有していないが、配列決定および二重鎖配列(duplex sequence)分析の後に別の状況でエラーとして検出されない可能性がある損傷DNAを効果的に除外することができる。損傷した塩基によるエラーは、デュプレックス配列決定によって多くは修正することができるが、まれに、相補的エラーが、両方の鎖上の同じ位置に起こることが理論的にあり得るため、エラーを増やす損傷を減少させることによって、アーチファクトの確率を減少させることができる。さらに、ライブラリ調製中、配列決定されるDNAの特定の断片は、その供給源から、または処理ステップ(例えば、機械的なDNA剪断)から一本鎖であってもよい。これらの領域は、典型的には、当該技術分野で知られる「末端修復」ステップ中に二本鎖DNAに変換され、DNAポリメラーゼおよびヌクレオシド基質が、DNA試料に添加されて、5’陥凹末端を延長する。コピーされるDNAの一本鎖部分におけるDNA損傷の変異誘発性部位(すなわち、DNA二重鎖の片方または両方の末端にある一本鎖5’オーバーハングまたは内部の一本鎖ニックまたはギャップ)は、末端平滑化反応中にエラーを生じる場合があり、一本鎖変異、合成エラーまたは核酸損傷部位を二本鎖形態にして、最終的な二重鎖コンセンサス配列において真の変異であると誤って解釈される場合があり、真の変異が元の二本鎖核酸分子内に実際には存在しなかった場合に、存在したと誤って解釈される場合がある。この状況は、「偽の二重鎖」と呼ばれ、かかる損傷を破壊/修復する酵素の使用によって減少させることができ、または防ぐことができる。他の実施形態では、この発生は、元の二重鎖分子の一本鎖部分が形成するのを破壊するか、または防ぐための戦略の使用を通して低減、または除外することができる(例えば、ニックまたはギャップが残る可能性がある機械的剪断または特定の他の酵素ではなく、元の二本鎖核酸物質を断片化するために使用される特定の酵素の使用)。他の実施形態では、元の二本鎖核酸の一本鎖部分を除外するためのプロセス(例えば、S1ヌクレアーゼまたはマングビーンヌクレアーゼなどの一本鎖特異的ヌクレアーゼ)の使用を、同様の目的で利用することができる。
【0066】
さらなる実施形態では、本明細書に記載のデュプレックス配列決定ステップから生成される配列決定リードをさらにフィルタリングして、偽の二重鎖のアーチファクトに最もなりやすいリードの末端をトリミングすることによって、偽の変異を除外することができる。例えば、DNA断片化は、二本鎖分子の末端に一本鎖部分を生成することができる。これらの一本鎖部分は、末端修復中に末端平滑化されてもよい(例えば、KlenowまたはT4ポリメラーゼによって)。一部の例では、ポリメラーゼは、これらの末端修復した領域においてコピーの誤りを起こし、「偽の二重鎖分子」の生成を引き起こす。ライブラリ調製のこれらのアーチファクトは、配列決定されたときに真の変異であると誤って見えてしまう場合がある。これらの末端修復機構の結果としてのエラーは、より高いリスクを有する領域で生じる可能性がある変異を除外するために配列決定リードの末端をトリミングすることによって、配列決定後の分析から除外することができるか、または減少させることができ、それにより、偽の変異の数を減少させることができる。一実施形態では、配列決定リードのかかるトリミングは、自動的に達成することができる(例えば、通常の処理ステップ)。別の実施形態では、変異体頻度は、断片末端領域について評価することができ、変異の閾値レベルが断片末端領域で観察される場合、DNA断片の二本鎖コンセンサス配列リードを生成する前に、配列決定リードのトリミングを行ってもよい。
【0067】
具体例として、一部の実施形態では、本明細書では、二本鎖標的核酸物質のエラー修正配列リードを生成する方法が提供され、二本鎖標的核酸物質を、少なくとも1つのアダプター配列にライゲーションして、アダプター-標的核酸物質複合体を形成するステップを含み、ここで、少なくとも1つのアダプター配列は、(a)二本鎖標的核酸物質の各分子を固有に標識する縮重または半縮重した単一分子識別子(SMI)配列と、(b)アダプター-標的核酸物質複合体の各鎖が、その相補鎖に対して明確に特定可能なヌクレオチド配列を有するように、アダプター-標的核酸物質複合体の第1の鎖をタグ付けする第1のヌクレオチドアダプター配列、およびアダプター-標的核酸物質複合体の第2の鎖をタグ付けする第1のヌクレオチド配列と少なくとも部分的に非相補的な第2のヌクレオチドアダプター配列とを含む。次に、本方法は、アダプター-標的核酸物質複合体の各鎖を増幅して、複数の第1の鎖のアダプター-標的核酸複合体アンプリコン、および複数の第2の鎖のアダプター-標的核酸複合体アンプリコンを生成するステップを含んでいてもよい。本方法は、さらに、その第1の鎖および第2の鎖の両方を増幅して、第1の核酸産物および第2の核酸産物を提供するステップを含んでいてもよい。本方法はまた、第1の核酸産物および第2の核酸産物の各々を配列決定して、複数の第1の鎖の配列リードおよび複数の第2の鎖の配列リードを生成するステップと、少なくとも1つの第1の鎖の配列リードおよび少なくとも1つの第2の鎖の配列リードの存在を確認するステップと、を含んでいてもよい。本方法は、さらに、少なくとも1つの第1の鎖の配列リードと少なくとも1つの第2の鎖の配列リードとを比較することと、一致しないヌクレオチド位置を考慮しないことによって、二本鎖標的核酸物質のエラー修正配列リードを生成すること、または代わりに、比較された第1の鎖の配列リードと第2の鎖の配列リードが非相補的な1つ以上のヌクレオチド位置を有する、比較された第1の鎖の配列リードと第2の鎖の配列リードを除去することとを含んでいてもよい。
【0068】
さらなる具体例として、一部の実施形態では、本明細書では、試料からDNAバリアントを特定する方法が提供され、核酸物質(例えば、二本鎖標的DNA分子)の両方の鎖を、少なくとも1つの非対称アダプター分子にライゲーションして、二本鎖標的DNA分子の第1の鎖(例えば、上鎖)に関連付けられた第1のヌクレオチド配列と、二本鎖標的DNA分子の第2の鎖(例えば、下鎖)に関連付けられた第1のヌクレオチド配列に少なくとも部分的に非相補的な第2のヌクレオチド配列と、を有するアダプター-標的核酸物質複合体を形成するステップと、アダプター-標的核酸物質の各鎖を増幅するステップとを含み、各々の鎖において、増幅されたアダプター-標的核酸産物の別個でしかも関連したセットを生成する。本方法は、さらに、複数の第1の鎖のアダプター-標的核酸産物および複数の第2の鎖のアダプター-標的核酸産物の各々を配列決定するステップと、アダプター-標的核酸物質複合体の各鎖からの少なくとも1つの増幅された配列リードの存在を確認するステップと、第1の鎖から得られた少なくとも1つの増幅された配列リードと、第2の鎖から得られた少なくとも1つの増幅された配列リードとを比較して、核酸物質(例えば、二本鎖標的DNA分子)の両方の鎖の配列が一致しているヌクレオチド塩基のみを有する核酸物質(例えば、二本鎖標的DNA分子)のコンセンサス配列リードを形成するステップと、を含むことができ、その結果、コンセンサス配列リード中の特定の位置で生じるバリアント(例えば、参照配列と比較して)が、真のDNAバリアントとして特定される。
【0069】
一部の実施形態では、本明細書では、二本鎖核酸物質から高精度のコンセンサス配列を生成する方法が提供され、個々の二重鎖DNA分子をアダプター分子でタグ付けして、タグ付けDNA物質を形成するステップであって、各アダプター分子は、(a)二重鎖DNA分子を固有に標識する縮重または半縮重した単一分子識別子(SMI)、および(b)各々のタグ付けDNA分子について、タグ付けDNA物質内の各々の個々のDNA分子の元の下鎖から、元の上鎖を区別する第1および第2の非相補的ヌクレオチドアダプター配列、を含む、タグ付けDNA物質を形成するステップと、タグ付けDNA分子の元の上鎖の複製のセットおよびタグ付けDNA分子の元の下鎖の複製のセットを生成して、増幅されたDNA物質を形成するステップと、を含む。本方法は、さらに、元の上鎖の重複からの第1の一本鎖コンセンサス配列(SSCS)および元の下鎖の重複からの第2の一本鎖コンセンサス配列(SSCS)を作成するステップと、元の上鎖の第1のSSCSと、元の下鎖の第2のSSCSとを比較するステップと、元の上鎖の第1のSSCSおよび元の下鎖の第2のSSCSの両方の配列が相補的であるヌクレオチド塩基のみを有する高度に正確なコンセンサス配列を生成するステップとを含んでいてもよい。
【0070】
さらなる実施形態では、本明細書では、二本鎖標的DNA分子を含む試料から、DNAの変異および/またはバリアントを検出および/または定量する方法が提供され、本方法は、各二本鎖標的DNA分子の両方の鎖を少なくとも1つの非対称アダプター分子にライゲーションして、複数のアダプター-標的DNA複合体を形成するステップであって、各アダプター-標的DNA複合体は、二本鎖標的DNA分子の第1の鎖と関連付けられた第1のヌクレオチド配列と、二本鎖標的DNA分子の第2の鎖と関連付けられた第1のヌクレオチド配列に少なくとも部分的に非相補的な第2のヌクレオチド配列とを有する、ステップと、各々のアダプター標的DNA複合体について、アダプター標的DNA複合体の各鎖を増幅するステップとを含み、その結果、それぞれの鎖において、増幅されたアダプター標的DNAアンプリコンの別個でしかも関連するセットが生成される。本方法は、さらに、複数の第1の鎖のアダプター-標的DNAアンプリコンおよび複数の第2の鎖のアダプター-標的DNAアンプリコンの各々を配列決定するステップと、アダプター-標的DNA複合体の各鎖から少なくとも1つの配列リードの存在を確認するステップと、第1の鎖から得られた少なくとも1つの配列リードと第2の鎖から得られた少なくとも1つの配列リードとを比較して、二本鎖DNA分子の一方の鎖の配列リードが、二本鎖DNA分子の他方の鎖の配列リードと一致していない(例えば、非相補的な)ヌクレオチド塩基を検出および/または定量するステップと、を含んでいてもよく、その結果、DNA損傷の部位(複数可)を検出および/または定量することができる。一部の実施形態では、本方法は、さらに、第1の鎖のアダプター-標的DNAアンプリコンからの第1の一本鎖コンセンサス配列(SSCS)および第2の鎖のアダプター-標的DNAアンプリコンからの第2の一本鎖コンセンサス配列(SSCS)を作成するステップと、元の第1の鎖の第1のSSCSと、元の第2の鎖の第2のSSCSとを比較するステップと、第1のSSCSの配列と第2のSSCSの配列が非相補性であるヌクレオチド塩基を識別して、試料中の二本鎖標的DNA分子と関連付けられたDNA損傷を検出および/または定量するステップとを含んでいてもよい。
【0071】
単一分子識別子配列(SMI)
様々な実施形態に従い、提供される方法および組成物は、核酸物質の各鎖上に1つ以上のSMI配列を含む。SMIは、二本鎖核酸分子から得られる各々の一本鎖によって独立して担持されていてもよく、その結果、各鎖の誘導体増幅産物が、配列決定後に同じ元の実質的に固有の二本鎖核酸分子に由来するものとして認識され得る。一部の実施形態では、SMIは、さらなる情報を含んでいてもよく、かつ/または当業者が認識するように、機能性を区別するかかる分子が有用である他の方法において使用されてもよい。一部の実施形態では、SMI要素は、核酸物質にアダプター配列をライゲーションする前、実質的に同時に、または後に組み込まれてもよい。
【0072】
一部の実施形態では、SMI配列は、少なくとも1つの縮重または半縮重した核酸を含んでいてもよい。他の実施形態では、SMI配列は、縮重していなくてもよい。一部の実施形態では、SMIは、核酸分子の断片末端(例えば、ライゲーションされた核酸物質の無作為に、または半無作為に剪断された末端)またはその近傍と関連付けられた配列であってもよい。一部の実施形態では、外因性配列は、例えば、単一のDNA分子を互いに区別することが可能なSMI配列を得るために、ライゲーションされた核酸物質(例えば、DNA)の無作為に、または半無作為に剪断された末端に対応する配列と組み合わせて考慮されてもよい。一部の実施形態では、SMI配列は、二本鎖核酸分子にライゲーションされるアダプター配列の一部である。特定の実施形態では、SMI配列を含むアダプター配列は、二本鎖核酸分子の各鎖が、アダプター配列にライゲーションする後にSMIを含むような、二本鎖である。別の実施形態では、SMI配列は、二本鎖核酸分子にライゲーションする前または後に一本鎖であり、相補的SMI配列は、その逆鎖をDNAポリメラーゼを用いて伸長して、相補的二本鎖SMI配列を得ることによって生成されてもよい。他の実施形態では、SMI配列は、アダプターの一本鎖部分にある(例えば、Y字型を有するアダプターのアーム)。このような実施形態では、SMIは、二本鎖核酸分子の元の鎖に由来する配列リードのファミリーのグループ化を容易にすることができ、一部の例では、二本鎖核酸分子の元の第1の鎖と第2の鎖との間の関係を付与することができる(例えば、SMIの全てまたは一部は、ルックアップテーブルを介して関連付けられ得る)。実施形態では、第1の鎖および第2の鎖が異なるSMIで標識される場合、2つの元の鎖からの配列リードは、1つ以上の内因性SMI(例えば、核酸分子の断片末端または断片末端付近と関連付けられる配列などの断片特異的な特徴)を使用して関連付けられてもよく、または2つの元の鎖によって共有されるさらなる分子タグ(例えば、アダプターの二本鎖部分中のバーコード)の使用によって関連付けられてもよいか、またはこれらの組み合わせであってもよい。一部の実施形態では、各SMI配列は、約1~約30核酸(例えば、1、2、3、4、5、8、10、12、14、16、18、20、またはそれ以上の縮重または半縮重した核酸)を含んでいてもよい。
【0073】
一部の実施形態では、SMIは、核酸物質およびアダプター配列の片方または両方にライゲーション可能である。一部の実施形態では、SMIは、核酸物質のT-オーバーハング、A-オーバーハング、CG-オーバーハング、脱ヒドロキシル化塩基および平滑末端のうちの少なくとも1つにライゲーションされてもよい。
【0074】
一部の実施形態では、SMIの配列は、単一の核酸分子を互いに区別することが可能なSMI配列を得るために、例えば、核酸物質(例えば、ライゲーションされた核酸物質)の無作為または半無作為に剪断された末端に対応する配列と組み合わせて(またはこれに従って設計されて)考慮されてもよい。
【0075】
一部の実施形態では、少なくとも1つのSMIは、例えば、剪断点自体を使用して、または剪断点に直接隣接した核酸物質中の所定の数のヌクレオチド[例えば、剪断点から2、3、4、5、6、7、8、9、10ヌクレオチド]を使用して、内因性SMIであってもよい(例えば、剪断点に関連するSMI(例えば、断片末端))。一部の実施形態では、少なくとも1つのSMIは、外因性SMI(例えば、標的核酸物質にはみられない配列を含むSMI)であってもよい。
【0076】
一部の実施形態では、SMIは、画像化部分(例えば、蛍光または別の光学的に検出可能な部分)であってもよいか、または画像化部分を含んでいてもよい。一部の実施形態では、かかるSMIは、増幅ステップを必要とすることなく、検出および/または定量を可能にする。
【0077】
一部の実施形態では、SMI要素は、アダプター-標的核酸複合体上の異なる位置に位置する2つ以上の別個のSMI要素を含んでいてもよい。
【0078】
SMIの様々な実施形態は、国際特許公開第WO2017/100441号にさらに開示されており、その全体が参照により本明細書に援用される。
【0079】
鎖定義要素(SDE)
一部の実施形態では、二本鎖核酸物質の各鎖は、さらに、標的二本鎖核酸物質を形成する2つの一本鎖核酸の増幅産物を、配列決定後に実質的に互いに区別可能にする要素を含んでいてもよい。一部の実施形態では、SDEは、配列決定アダプター内に含まれる非対称プライマー部位であってもよいか、もしくはこの部位を含んでいてもよく、または他の配置において、配列非対称性を、プライマー配列内ではなくアダプター配列内に導入してもよく、その結果、第1の鎖の標的核酸配列複合体と標的核酸配列複合体の第2の鎖のヌクレオチド配列における少なくとも1つの位置が、増幅および配列決定の後で互いに異なっている。他の実施形態では、SDEは、標準的ヌクレオチド配列A、T、C、GまたはUとは異なるが、2つの増幅され配列決定された分子において少なくとも1つの標準的ヌクレオチド配列の差に変換される、2つの鎖間の別の生化学的非対称性を含んでいてもよい。さらに別の実施形態では、SDEは、増幅前に2つの鎖を物理的に分離する手段であってもよいか、またはこの手段を含んでいてもよく、その結果、第1の鎖の標的核酸配列および第2の鎖の標的核酸配列からの誘導体増幅産物は、2つの誘導体増幅産物間の区別を維持する目的で、互いに実質的に物理的に分離された状態を維持する。第1の鎖と第2の鎖を区別することを可能にするSDE機能を提供するための他のこのような配置または方法論が利用されてもよい。
【0080】
一部の実施形態では、SDEは、ループ(例えば、ヘアピンループ)を形成することが可能であってもよい。一部の実施形態では、ループは、少なくとも1つのエンドヌクレアーゼ認識部位を含んでいてもよい。一部の実施形態では、標的核酸複合体は、ループ内の切断事象を容易にするエンドヌクレアーゼ認識部位を含んでいてもよい。一部の実施形態では、ループは、非標準的(non-canonical)ヌクレオチド配列を含んでいてもよい。一部の実施形態では、含まれる非標準的ヌクレオチドは、鎖切断を容易にする1つ以上の酵素によって認識されてもよい。一部の実施形態では、含まれる非標準的ヌクレオチドは、ループ中の鎖切断を容易にする1つ以上の化学プロセスによって標的とされてもよい。一部の実施形態では、ループは、ループ中の鎖切断を容易にする1つ以上の酵素プロセス、化学プロセスまたは物理プロセスによって標的とされ得る、修飾された核酸リンカーを含んでいてもよい。一部の実施形態では、この修飾されたリンカーは、光開裂性リンカーである。
【0081】
様々な他の分子ツールが、SMIおよびSDEとして機能し得る。剪断点およびDNAに基づくタグ以外に、対になった鎖を物理的に近接した状態に維持する単分子コンパートメント化方法、または他の非核酸タグ付け方法は、鎖に関連する機能を果たし得る。同様に、アダプター鎖を物理的に分離し得る様式でのアダプター鎖の非対称化学標識は、SDEの役割を果たすことができる。近年記載されたデュプレックス配列決定の変形例は、亜硫酸水素変換を使用して、シトシンのメチル化の形態で天然に存在する鎖の非対称性を、2つの鎖を区別する配列の違いへと変換する。この実施態様は、検出され得る変異のタイプに制限があるが、天然の非対称を利用するこの概念は、修飾ヌクレオチドを直接的に検出することができる配列決定技術を出現させるという観点で注目すべきものである。SDEの様々な実施形態は、国際特許公開第WO2017/100441号にさらに開示されており、その全体が参照により援用される。
【0082】
アダプターおよびアダプター配列
様々な配置で、SMI(例えば、分子バーコード)、SDE、プライマー部位、フローセル配列および/または他の特徴を含むアダプター分子は、本明細書に開示される実施形態の多くと共に使用することが企図される。一部の実施形態では、提供されるアダプターは、(1)高い標的特異性がある、(2)多重化が可能である、および(3)強力かつバイアスが最小限の増幅を示す、という性質のうちの少なくとも1つを有するPCRプライマー(例えば、プライマー部位)に対して相補的または少なくとも部分的に相補的な1つ以上の配列であってもよいか、またはこの配列を含んでいてもよい。
【0083】
一部の実施形態では、アダプター分子は、「Y」字型、「U」字型、「ヘアピン」型であってもよく、バブル(例えば、非相補配列の一部)、または他の特徴を有し得る。他の実施形態では、アダプター分子は、「Y」字型、「U」字型、「ヘアピン」型、またはバブルを含み得る。特定のアダプターは、修飾ヌクレオチドまたは非標準的ヌクレオチド、制限部位、またはインビトロで構造もしくは機能を操作するための他の特徴を含んでいてもよい。アダプター分子は、末端を有する様々な核酸物質にライゲーションしてもよい。例えば、アダプター分子は、T-オーバーハング、A-オーバーハング、CG-オーバーハング、複数ヌクレオチドオーバーハング、脱ヒドロキシル化塩基、核酸物質の平滑末端、および標的の5’が脱リン酸化されているかまたはその他の従来のライゲーションから遮断されている分子の末端、にライゲーションするのに適したものであってもよい。他の実施形態では、アダプター分子は、ライゲーション部位の5’鎖に脱リン酸化または他のライゲーションを防ぐ修飾を含んでいてもよい。後者の2つの実施形態では、かかる戦略は、ライブラリ断片またはアダプター分子の二量体化を防ぐのに有用な場合がある。
【0084】
アダプター配列は、一本鎖の配列、二本鎖の配列、相補的な配列、非相補的な配列、部分的に相補的な配列、非対称配列、プライマーに結合する配列、フローセル配列、ライゲーション配列またはアダプター分子によって提供される他の配列を意味し得る。特定の実施形態では、アダプター配列は、オリゴヌクレオチドに相補的な配列によって増幅するために使用される配列を意味し得る。
【0085】
一部の実施形態では、提供される方法および組成物は、少なくとも1つのアダプター配列(例えば、核酸物質の5’末端および3’末端の各々に1つの、2つのアダプター配列)を含む。一部の実施形態では、提供される方法および組成物は、2つ以上のアダプター配列(例えば、3、4、5、6、7、8、9、10個、またはそれ以上)を含んでいてもよい。一部の実施形態では、アダプター配列の少なくとも2つは、互いに(例えば、配列によって)異なる。一部の実施形態では、各アダプター配列は、アダプター配列が互いに(例えば、配列によって)異なる。一部の実施形態では、少なくとも1つのアダプター配列は、少なくとも1つの他のアダプター配列の少なくとも一部に対して少なくとも部分的に非相補的である(例えば、少なくとも1つのヌクレオチドによって非相補的である)。
【0086】
一部の実施形態では、アダプター配列は、少なくとも1つの非標準的ヌクレオチドを含む。一部の実施形態では、非標準的ヌクレオチドは、脱塩基部位、ウラシル、テトラヒドロフラン、8-オキソ-7,8-ジヒドロ-2’デオキシアデノシン(8-オキソ-A)、8-オキソ-7,8-ジヒドロ-2’-デオキシグアノシン(8-オキソ-G)、デオキシイノシン、5’ニトロインドール、5-ヒドロキシメチル-2’-デオキシシチジン、イソ-シトシン、5’-メチル-イソシトシン、もしくはイソグアノシン、メチル化ヌクレオチド、RNAヌクレオチド、リボースヌクレオチド、8-オキソ-グアニン、光開裂性リンカー、ビオチン化ヌクレオチド、デスチオビオチンヌクレオチド、チオール修飾ヌクレオチド、アクリダイト修飾ヌクレオチド、イソ-dC、イソdG、2’-O-メチルヌクレオチド、イノシンヌクレオチド、ロック核酸、ペプチド核酸、5メチルdC、5-ブロモデオキシウリジン、2,6-ジアミノプリン、2-アミノプリンヌクレオチド、脱塩基ヌクレオチド、5-ニトロインドールヌクレオチド、アデニル化ヌクレオチド、アジドヌクレオチド、ジゴキシゲニンヌクレオチド、I-リンカー、5’ヘキシニル修飾ヌクレオチド、5-オクタジイニルdU、光開裂性スペーサー、非光開裂性スペーサー、クリックケミストリー適合性修飾ヌクレオチド、およびこれらの任意の組み合わせから選択される。
【0087】
一部の実施形態では、アダプター配列は、磁気特性を有する部分(すなわち、磁気部分)を含む。一部の実施形態では、この磁気特性は、常磁性である。アダプター配列が磁気部分を含む(例えば、磁気部分を含むアダプター配列にライゲーションされた核酸物質)一部の実施形態では、磁場が適用される場合、磁気部分を含むアダプター配列は、磁気部分を含まないアダプター配列(例えば、磁気部分を含まないアダプター配列にライゲーションされた核酸物質)から実質的に分離される。
【0088】
一部の実施形態では、少なくとも1つのアダプター配列は、SMIに対して5’に位置する。一部の実施形態では、少なくとも1つのアダプター配列は、SMIに対して3’に位置する。
【0089】
一部の実施形態では、アダプター配列は、1つ以上のリンカードメインを介して、SMIおよび核酸物質のうちの少なくとも1つに連結されてもよい。一部の実施形態では、リンカードメインは、ヌクレオチドで構成されていてもよい。一部の実施形態では、リンカードメインは、少なくとも1つの修飾ヌクレオチドまたは非ヌクレオチド分子(例えば、本開示の他箇所に記載されるもの)を含んでいてもよい。一部の実施形態では、リンカードメインは、ループであっても、またはループを含んでいてもよい。
【0090】
一部の実施形態では、二本鎖核酸物質の各鎖の片方または両方の末端上のアダプター配列は、さらに、SDEを提供する1つ以上の要素を含んでいてもよい。一部の実施形態では、SDEは、アダプター配列内に含まれる非対称プライマー部位であってもよいか、またはこの部位を含んでいてもよい。
【0091】
一部の実施形態では、アダプター配列は、少なくとも1つのSDE、および少なくとも1つのライゲーションドメイン(すなわち、少なくとも1つのリガーゼの活性に修正可能なドメイン、例えば、リガーゼの活性を通して核酸物質にライゲーションするのに好適なドメイン)であってもよいか、またはこれらを含んでいてもよい。一部の実施形態では、5’から3’まで、アダプター配列は、プライマー結合部位、SDEおよびライゲーションドメインであってもよいか、またはこれらを含んでいてもよい。
【0092】
デュプレックス配列決定アダプターを合成するための様々な方法は、例えば、米国特許第9,752,188号、国際特許公開第WO2017/100441号および国際特許公開第PCT/US18/59908号(2018年11月8日に出願された)に既に記載されており、これらは全て、それらの全体が参照により本明細書に援用される。
【0093】
プライマー
一部の実施形態では、(1)高い標的特異性がある、(2)多重化が可能である、(3)強力かつバイアスが最小の増幅を示す、という特性のうちの少なくとも1つを有する1つ以上のPCRプライマーは、本技術の態様に従う様々な実施形態における使用が企図される。以前の研究および商業製品の多くは、従来のPCR-CEについて、これらの基準のいくつかを満たすプライマー混合物を設計している。しかしながら、これらのプライマー混合物は、MPSと共に使用するのに常に適しているわけではないことを注記しておく。実際に、高度に多重化されたプライマー混合物を開発することは困難であり、時間のかかるプロセスであり得る。好都合に、IlluminaおよびPromegaの両者は、様々な標準的および非標準的なSTRおよびSNP遺伝子座の強力で効率的な増幅を示すIlluminaプラットフォームのための多重互換性プライマー混合物を近年開発した。これらのキットは、PCRを使用して、配列決定前にその標的領域を増幅するため、ペアエンド配列決定データにおける各リードの5’末端は、DNAを増幅するために使用されるPCRプライマーの5’末端に対応する。一部の実施形態では、提供される方法および組成物は、均一な増幅を確実にするように設計されたプライマーを含み、これは、様々な反応濃度、融解温度、および二次構造とプライマー内/プライマー間の相互作用を最小限にすること、を伴っていてもよい。MPSアプリケーション用の高度に多重化されたプライマーの最適化について、多くの技術が記載されてきた。特に、これらの技術は、当該技術分野で十分に記載されているように、しばしばampliseq法として知られている。
【0094】
増幅
提供される方法および組成物は、様々な実施形態では、核酸物質(またはその一部、例えば、特定の標的領域または遺伝子座)を増幅し、増幅された核酸物質(例えば、いくつかのアンプリコン産物)を形成する、少なくとも1つの増幅ステップを利用するか、または使用する。
【0095】
一部の実施形態では、核酸物質を増幅することは、SMI配列が少なくとも部分的に維持されるように、第1のアダプター配列中に存在する配列に少なくとも部分的に相補的な少なくとも1つの一本鎖オリゴヌクレオチドを使用して、元の二本鎖核酸物質からの第1の核酸鎖および第2の核酸鎖の各々に由来する核酸物質を増幅するステップを含む。増幅ステップは、さらに、第2の一本鎖オリゴヌクレオチドを使用して、目的の各鎖を増幅することを含み、かかる第2の一本鎖オリゴヌクレオチドは、(a)目的の標的配列に少なくとも部分的に相補的であってもよいか、または(b)少なくとも1つの一本鎖オリゴヌクレオチドと第2の一本鎖オリゴヌクレオチドが、核酸物質を効果的に増幅するように配向される様式で、第2のアダプター配列中に存在する配列に少なくとも部分的に相補的であってもよい。
【0096】
一部の実施形態では、試料中の核酸物質を増幅することは、「チューブ」(例えば、PCRチューブ)内で、エマルジョン液滴、マイクロチャンバ、および上に記載の他の例または他の既知の容器内で、核酸物質を増幅することを含んでいてもよい。
【0097】
一部の実施形態では、少なくとも1つの増幅するステップは、少なくとも1つの非標準的ヌクレオチドであるか、またはそれを含む少なくとも1つのプライマーを含む。一部の実施形態では、非標準的ヌクレオチドは、ウラシル、メチル化ヌクレオチド、RNAヌクレオチド、リボースヌクレオチド、8-オキソ-グアニン、ビオチン化ヌクレオチド、ロックド核酸、ペプチド核酸、高Tm核酸バリアント、アレルを区別する核酸バリアント、本明細書の他箇所に記載の任意の他のヌクレオチドもしくはリンカーバリアント、またはこれらの任意の組み合わせから選択される。
【0098】
任意の用途に適した増幅反応が、一部の実施形態に適合することが企図されるが、具体例として、一部の実施形態では、増幅ステップは、ポリメラーゼ連鎖反応(PCR)、ローリングサークル増幅(RCA)、多置換増幅(MDA)、等温増幅、エマルジョン内のポロニー増幅、表面、ビーズの表面、またはヒドロゲル内でのブリッジ増幅、およびこれらの任意の組み合わせ、であってもよいか、またはこれらを含んでいてもよい。
【0099】
一部の実施形態では、核酸物質を増幅することは、核酸物質の各鎖の5’末端および3’末端上のアダプター配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む。一部の実施形態では、核酸物質を増幅することは、目的の標的領域または標的配列(例えば、ゲノム配列、ミトコンドリア配列、プラスミド配列、合成的に生成された標的核酸など)に少なくとも部分的に相補的な少なくとも1つの一本鎖オリゴヌクレオチドと、アダプター配列のある領域(例えば、プライマー部位)に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドと、の使用を含む。
【0100】
一般に、安定した増幅(例えば、PCR増幅)は、反応条件に大きく依存し得る。マルチプレックスPCRは、例えば、緩衝液の組成、一価または二価カチオンの濃度、洗剤濃度、クラウディング剤(すなわち、PEG、グリセロールなど)の濃度、プライマー濃度、プライマーTm、プライマー設計、プライマーGC含有量、プライマー修飾ヌクレオチド特性およびサイクリング条件(すなわち、温度および伸長時間、ならびに温度変化速度)に対して感受性な場合がある。緩衝液の条件の最適化は、困難かつ時間がかかるプロセスである場合がある。一部の実施形態では、増幅反応は、既に知られている増幅プロトコルに従って、緩衝液、プライマープール濃度、およびPCR条件、のうちの少なくとも1つを使用してもよい。一部の実施形態では、新しい増幅プロトコルが作成されてもよく、かつ/または増幅反応の最適化が使用されてもよい。具体例として、一部の実施形態では、PCR最適化キット、例えば、Promega(登録商標)のPCR最適化キットを使用してもよく、このキットは、様々なPCR増幅(例えば、マルチプレックス、リアルタイム、GCリッチおよび阻害剤耐性増幅)に部分的に最適化された、いくつかの予め配合された緩衝液を含む。これらの予め配合された緩衝液は、様々なMg2+濃度およびプライマー濃度ならびにプライマープール比で迅速に補充することができる。これに加え、一部の実施形態では、様々なサイクリング条件(例えば、サーマルサイクリング)が、評価および/または使用されてもよい。特定の実施形態が、特定の所望の用途に適切であるかどうかを評価する際に、様々な側面の中でも、特異性、ヘテロ接合性遺伝子座についてのアレルカバレッジ比、遺伝子座間のバランスおよび深度、のうちの1つ以上を評価してもよい。増幅成功の測定は、産物のDNA配列決定、ゲルまたはキャピラリー電気泳動またはHPLCまたは他のサイズ分離方法と、その後の断片の視覚化による産物の評価、二本鎖核酸結合色素または蛍光プローブを使用する融解曲線分析、質量分析法または当該技術分野で知られている他の方法を含んでいてもよい。
【0101】
様々な実施形態に従って、様々な因子のいずれかが、特定の増幅ステップの長さ(例えば、PCR反応中のサイクル数など)に影響を与えることがある。例えば、一部の実施形態では、提供される核酸物質は、品質が劣っているか、さもなければ最適ではない場合がある(例えば、分解および/または汚染されている)。このような場合、より長い増幅ステップが、所望の産物が許容される程度に増幅されることを確実にするのに役に立つことがある。一部の実施形態では、増幅ステップは、各々の出発DNA分子から平均で3~10個の配列決定されたPCRコピーを提供し得るが、他の実施形態では、第1の鎖および第2の鎖の各々の単一コピーだけが必要とされる。特定の理論に縛られることを望むものではないが、多すぎるまたは少なすぎるPCRコピーは、アッセイ効率を低下させ、最終的には深度が低下する可能性がある。一般に、増幅(例えば、PCR)反応に使用される核酸(例えば、DNA)断片の数は、同じSMI/バーコード配列を共有するリードの数を規定し得る、主要な調節可能な変数である。
【0102】
核酸物質
種類
様々な実施形態に従って、様々な核酸物質のうちいずれかを使用してもよい。一部の実施形態では、核酸物質は、標準的糖-リン酸骨格内のポリヌクレオチドに対する少なくとも1つの修飾を含んでいてもよい。一部の実施形態では、核酸物質は、核酸物質中の任意の塩基内に少なくとも1つの修飾を含んでいてもよい。例えば、非限定的な例として、一部の実施形態では、核酸物質は、二本鎖DNA、一本鎖DNA、二本鎖RNA、一本鎖RNA、ペプチド核酸(PNA)、ロック核酸(LNA)のうちの少なくとも1つであるか、またはこれらを含む。
【0103】
修飾
様々な実施形態に従って、核酸物質は、特定の提供される方法または組成物が使用される用途に応じて、任意の特定のステップの前に、実質的に同時に、またはその後に、1つ以上の修飾を受けてもよい。
【0104】
一部の実施形態では、修飾は、核酸物質の少なくとも一部の修復であってもよいか、またはそれを含んでいてもよい。核酸修復の任意の用途に適した方法が、一部の実施形態に適合すると企図されるが、したがって特定の例示的な方法および組成物を以下および実施例に記載する。
【0105】
非限定的な例として、一部の実施形態では、DNA修復酵素、例えば、ウラシル-DNAグリコシラーゼ(UDG)、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)および8-オキソグアニンDNAグリコシラーゼ(OGG1)を利用して、DNA損傷(例えば、インビトロでのDNA損傷)を修正することができる。上述のように、これらのDNA修復酵素は、例えば、DNAから損傷した塩基を除去するグリコシラーゼである。例えば、UDGは、(シトシンの自発的な加水分解によって生じる)シトシンの脱アミノ化から得られるウラシルを除去し、FPGは、8-オキソ-グアニン(例えば、活性酸素種から得られる最も一般的なDNA損傷)を除去する。FPGは、リアーゼ活性も有し、脱塩基部位に1塩基ギャップを生成することができる。かかる脱塩基部位は、例えば、ポリメラーゼがテンプレートをコピーすることができないため、その後にPCRによって増幅することができない。したがって、かかるDNA損傷修復酵素の使用は、真の変異を有していないが、配列決定および二重鎖配列分析の後に別の状況でエラーとして検出されない可能性がある損傷DNAを効果的に除去することができる。
【0106】
上述のように、さらなる実施形態では、本明細書に記載の処理ステップから生成される配列決定リードをさらにフィルタリングして、アーチファクトに最もなりやすいリードの末端をトリミングすることによって、偽の変異を除外することができる。例えば、DNA断片化は、二本鎖分子の末端に一本鎖部分を生成することができる。これらの一本鎖部分は、末端修復中に末端平滑化されてもよい(例えばKlenowによって)。一部の例では、ポリメラーゼは、これらの末端修復した領域においてコピーの誤りを起こし、「偽の二重鎖分子」の生成を引き起こす。これらのアーチファクトは、配列決定されたときに真の変異であると見えてしまう場合がある。これらの末端修復機構の結果としてのエラーは、生じる可能性がある変異を除外するために配列決定リードの末端をトリミングすることによって、配列決定後の分析から除外することができ、それにより、偽の変異の数を減らすことができる。一部の実施形態では、配列決定リードのかかるトリミングは、自動的に達成することができる(例えば、通常の処理ステップ)。一部の実施形態では、変異体頻度は、断片末端領域について評価することができ、変異の閾値レベルが断片末端領域で観察される場合、DNA断片の二本鎖コンセンサス配列リードを生成する前に、配列決定リードのトリミングを行うことができる。
【0107】
デュプレックス配列決定の鎖比較技術によって提供される高度なエラー修正は、標準的な次世代配列決定方法と比較して、二本鎖核酸分子の配列決定エラーを数桁程度減少させる。このエラーの減少は、ほぼ全てのタイプの配列において、配列決定の精度を向上させるが、特にエラーが起こりやすいことが当該技術分野でよく知られている生化学的に困難な配列に対して、特によく適している場合がある。かかる種類の配列の非限定的な一例は、ヘテロポリマーまたは他のマイクロサテライト/ショートタンデムリピートである。デュプレックス配列決定のエラー修正から利益を得るエラーが起こりやすい配列の別の非限定的な例は、例えば、加熱、放射線、機械的応力、または1つ以上のヌクレオチドポリメラーゼによる複製中にエラーを起こしやすい化学付加物を生成し、また分子の末端で、またはニックおよびギャップとして一本鎖DNAを生成する様々な化学曝露によって損傷を受けた分子である。さらなる実施形態では、デュプレックス配列決定は、二本鎖核酸分子の集団の中で少数の配列バリアントを正確に検出するために使用することができる。本出願の非限定的な一例は、多数のDNA分子の中で、少数のバリアントDNA分子を検出することである(例えば、ゲノム編集事象中に誘導、取得、および/または選択されたバリアントを有する)。デュプレックス配列決定による稀少なバリアント検出のための別の非限定的な用途は、ゲノム編集事象から得られるDNA損傷の早期検出である。デュプレックス配列決定のさらなる非限定的な用途は、細胞(例えば、正の増殖バイアスを有する細胞、例えば、選択圧下での変異、例えば、腫瘍変異、を含有する細胞)のクローン増殖を検出および定量することである。デュプレックス配列決定の別の非限定的な用途は、標的ゲノム編集活性の成功を評価すること、または異常なゲノム編集事象を検出することである。
【0108】
ゲノム編集の評価のための選択された実施形態
中でも、ゲノム編集(遺伝子編集および操作ゲノム編集としても知られている)は、遺伝子サイレンシングまたは転写抑制、内因性遺伝子の一過性活性化、胚性幹細胞の遺伝子組み換え、疾患を治療するための細胞療法の産生、トランスジェニック生物の生成、他の農学的用途の中でも作物改良のための植物の遺伝子操作、およびインビボ遺伝子ノックアウトスクリーニング、ドミナントネガティブ遺伝子座の破壊などの用途に広く使用されている。意図された用途に応じて、ゲノム編集技術は、生体のゲノム中の核酸配列(複数可)の挿入、欠失、修飾、置換、修正、または変異に有効であり得る。特定の用途では、ゲノム配列に対する正確な修飾(意図された、意図されていない、所望の、または所望してない修飾のいずれか)は、ゲノム編集を使用して確認することができる。
【0109】
ゲノム編集プロセス後のゲノムの特徴付けは、DNAの標的(例えば、意図されたゲノム部位)領域または遺伝子座で所望の変化が得られたかどうかを決定するために、プロセスの効率を決定するために(例えば、意図されたゲノム部位で正確に変化した細胞の割合を決定するために)、およびゲノムの1つ以上の意図されないまたは「オフターゲット」遺伝子座で細胞のゲノムに何らかの変化がもたらされたかどうかを評価するために、重要であり得る。ゲノム配列決定方法(例えば、NGS)は、ゲノムの1つ以上の部位でヌクレオチド配列を決定するためのツールを提供するが、従来のNGS方法では、細胞集団における遺伝子編集事象を分子単位で特定および定量するのに必要とされるDNA配列決定の精度の感度レベルは、達成不可能である。本明細書に記載されるように、デュプレックス配列決定は、意図された用途のためのゲノム編集事象の成功(ならびに適合性および安全性)、方法、または試薬を効果的に特徴付け、決定するために必要な感度のレベルおよび配列決定エラー修正を提供する。
【0110】
ゲノム編集事象後に細胞集団の細胞に発生するゲノム変化を決定することに加えて、かかるゲノム変化は、細胞集団の他の細胞に対して、細胞が正の増殖バイアスを有するかまたは負の増殖バイアスを有するかのいずれかを引き起こし得る、細胞集団の1つ以上の細胞に選択圧を生じさせることができる。かかる増殖バイアスは、かかる増殖の利点を含む細胞のクローン増殖をもたらし得る(細胞集団内の他の細胞と比較して)。本開示の態様は、クローン増殖の評価、特に、かかる細胞の腫瘍性の可能性の評価を対象とする。
【0111】
ゲノム編集特徴付けのためのデュプレックス配列決定方法の選択された実施例
本開示は、ゲノム編集事象後のゲノム編集事象および/または細胞集団を特徴付けるのに有用な方法を提供する。本開示は、非常に正確な配列決定方法、例えば、上に記載のデュプレックス配列決定方法が、ゲノム編集を経た細胞の高分解能特徴付けを可能にし得るという認識を包含する。本開示は、ゲノム編集事象の精度を特徴付けるための方法、ならびに細胞集団における特定の細胞のクローン増殖が存在するかどうかを決定するなどの、細胞集団の経時的な特徴(例えば、細胞を培養の期間にわたって、および/または細胞を用いた治療の期間にわたって)を評価する方法を提供する。
【0112】
本開示は、ゲノム編集事象、例えば、操作されたゲノム編集事象後に細胞を特徴付ける方法を提供する。ゲノム編集から得られる不適切なゲノム編集事象および/またはオフターゲットバリエーションを正確に検出することができることが重要である。例えば、操作された部位特異的結合の不完全な特異性は、ゲノム編集事象中のゲノム遺伝子座の意図されない挿入、修飾または欠失をもたらし得る。かかるオフターゲットまたは異常なゲノム変化の結果は、臨床的結果を有し得る。分子の集団中の1つ以上の意図された遺伝子座で生じるゲノム編集事象の種類の分布を特徴付けることができることも同様に重要である。例えば、Cas9などの標的リボ核酸タンパク質による切断後、誤りやすい非相同末端結合は、様々な異なる長さの欠失、挿入、または他の変異事象をもたらし得る。
【0113】
一部の実施形態では、提供される方法は、ゲノム編集事象(例えば、意図されたゲノム遺伝子座を対象とする操作されたゲノム編集事象)が正しく進行したかどうかを評価するために有用である。一部の実施形態では、提供される方法は、1つ以上の意図されない変異がゲノム編集事象中に導入されるかどうかを評価するために有用である。一部の実施形態では、提供される方法を使用して、変異が導入されるかどうか(例えば、細胞の集団の中の少数の細胞において生じる)、または集団の1つ以上の細胞で不適切なゲノム編集事象が生じたかどうか、を決定することができる。一部の実施形態では、提供される方法を使用して、分子の集団における1つ以上の意図された遺伝子座で生じる、ゲノム編集事象の種類の分布を特徴付けることができる。
【0114】
一部の実施形態では、ゲノム編集事象(例えば、意図されたゲノム遺伝子座を対象とする操作されたゲノム編集事象)後の細胞の集団を特徴付ける方法が提供され、かかる方法は、概して、二本鎖DNA分子の集団を含む試料を提供するステップを含む。かかる二本鎖DNA分子は、分析される細胞の集団(例えば、ゲノム編集事象、例えば、操作されたゲノム編集事象、を経た細胞の集団)から抽出され得るか、またはそれに由来し得る。一部の実施形態では、二本鎖DNA分子は、非細胞DNA(例えば、分析される細胞の集団からのエクソソームまたは他の細胞外小胞由来のDNAである無細胞DNA)から単離され得る。一部の実施形態では、提供される方法は、二重鎖配列を使用して、少なくとも1つの第1の鎖の配列リードと少なくとも1つの第2の鎖の配列リードとを比較して、第1の鎖の配列リードと第2の鎖の配列リードとの間の1つ以上の対応関係を特定することによって、元の二本鎖のDNA分子のエラー修正配列リードを生成することを含む。特定の実施例では、第1の鎖の配列リードと第2の鎖の配列リードとの間で一致するヌクレオチド位置は、正確なヌクレオチド塩基コールとして特定され得る。
【0115】
一部の実施形態では、ゲノム編集細胞集団から抽出された標的二本鎖核酸分子の集団の高精度の配列決定リードを生成する方法が提供される。かかる方法は、細胞集団から抽出された1つ以上の標的二本鎖核酸分子をデュプレックス配列決定することと、標的二本鎖DNA分子についての高精度のコンセンサス配列を生成することと、を含む。一部の実施形態では、標的二本鎖核酸分子は、DNAの意図されたゲノム編集領域およびDNAの1つ以上の意図されないゲノム領域を含む。
【0116】
一部の実施形態では、提供される方法は、意図されたゲノム遺伝子座の配列を含む1つ以上のエラー修正配列リードを、予測されるゲノム編集DNA配列と比較すること、および/または意図されないゲノム遺伝子座の配列を含む1つ以上のエラー修正配列リードを、参照ゲノムDNA配列と比較すること、をさらに含む。
【0117】
一部の実施形態では、複数の二本鎖DNA分子の各々についてのエラー修正配列リードの生成は、配列決定の前に1つ以上の標的ゲノム領域を選択的に富化して、複数の富化されたアダプター-DNA分子を提供することをさらに含む。一部の実施形態では、提供される方法は、細胞集団の二本鎖DNA分子(例えば、ゲノム編集事象を経た細胞集団に由来する、および/または抽出された二本鎖DNA分子)の中の1つ以上のバリアントを特定するために有用である。一部の実施形態では、提供される方法は、細胞集団の二本鎖DNA分子の中の1つ以上のバリアントを特定するステップを含む。
【0118】
一部の実施形態では、デュプレックス配列決定方法によって分析される1つ以上の標的ゲノム領域は、ゲノム中の意図されたゲノム遺伝子座(すなわち、ゲノム編集のための意図された遺伝子座)であるか、またはそれを含む。一部の実施形態では、提供される方法は、1つ以上のエラー修正配列リードが、意図されたゲノム遺伝子座で予測される編集されたDNA配列を含むかどうかを決定するステップを含む。したがって、提供される方法は、ゲノム編集事象の成功を評価するのに有用であり得る。
【0119】
一部の実施形態では、操作されたゲノム編集事象の所望の結果を得ることの成功および/または効率を評価するための方法が、本明細書に提供される。一部の実施形態では、提供される方法は、意図されたゲノム遺伝子座の配列を含むエラー修正配列リードの中で、予測されるゲノム編集DNA配列の頻度を決定するステップを含む。
【0120】
一部の実施形態では、DNA配列(例えば、コード配列遺伝子の一部、遺伝子の非コード配列の一部、遺伝子など)を集団の細胞のゲノムに導入することを含む、操作されたゲノム編集事象の精度を評価する方法が、本明細書に提供される。一部の実施形態では、集団の細胞のゲノムからDNA配列(例えば、コード配列遺伝子の一部、遺伝子の非コード配列の一部、遺伝子など)を欠失させることを含む、操作されたゲノム編集事象の精度を評価する方法が、本明細書に提供される。一部の実施形態では、導入された遺伝子および/または欠失した遺伝子は、機能的なRNAまたはポリペプチドをコードする。
【0121】
一部の実施形態では、細胞集団における操作されたゲノム編集事象の効率を特徴付ける方法が本明細書に提供され、操作されたゲノム編集事象は、意図されたゲノム遺伝子座を標的とする。一部の実施形態では、かかる方法は、デュプレックス配列決定を含む。例えば、一部の実施形態では、提供される方法は、ゲノム編集事象後に細胞集団に由来する複数の二本鎖DNA分子を含む試料から配列決定ライブラリを調製することを含み、配列ライブラリを調製することは、複数の二本鎖DNA分子に非対称アダプター分子をライゲーションして、複数のアダプター-DNA分子を生成することと、アダプター-DNA分子の第1の鎖および第2の鎖を配列決定して、アダプター-DNA分子の少なくとも一部について第1の鎖の配列リードおよび第2の鎖の配列リードを提供することと、各配列決定されたアダプター-DNA分子について、第1の鎖の配列リードと第2の鎖の配列リードとを比較して、第1の鎖の配列リードと第2の鎖の配列リードとの間の1つ以上の対応関係を特定することと、を含む。一部の実施形態では、提供される方法は、意図されたゲノム遺伝子座を含む複数の二本鎖DNA分子の中で、意図されたゲノム遺伝子座における予測されるゲノム配列の頻度を決定することを含む。一部の実施形態では、意図されたゲノム遺伝子座における予測されるゲノム配列の頻度は、第1の鎖の配列リードと第2の鎖の配列リードとの間の1つ以上の対応を分析し、その対応関係を予測されるゲノム配列と比較することによって決定される。
【0122】
一部の実施形態では、操作されたゲノム編集事象の効率を特徴付けるための方法が提供され、配列決定の前に、1つ以上の標的ゲノム領域を選択的に富化して、複数の富化されたアダプター-DNA分子を提供することを含む。一部の実施形態では、提供される方法は、1つ以上の標的ゲノム領域を特徴付けることを含む。一部の実施形態では、1つ以上の標的ゲノム領域は、ゲノムの意図されたゲノム遺伝子座、ゲノムの少なくとも1つの意図されないゲノム遺伝子座、または意図されたゲノム遺伝子座および意図されないゲノム遺伝子座の両方を含む。
【0123】
一部の実施形態では、操作された標的化ゲノム編集事象を使用して、DNAが意図された遺伝子座で成功裏にゲノム編集されたかどうかを決定するための方法が、本明細書に提供される。かかる方法は、操作された標的ゲノム編集事象後に、試料から抽出された複数の二本鎖DNA分子についての二重鎖エラー修正配列決定リードを提供するステップと、参照ゲノムの1つ以上の遺伝子座のセット内の各遺伝子座について、二重鎖エラー修正配列決定リードが予測される配列と実質的に同一の配列を有する二本鎖DNA分子を定量するステップと、を含むことができる。
【0124】
一部の実施形態では、提供される方法は、1つ以上の意図されないゲノム遺伝子座からの配列を含む二本鎖DNA分子に由来する第1の鎖の配列リードと第2の鎖の配列リードとの間の1つ以上の対応関係を分析することと、その対応関係を参照ゲノム配列と比較することと、1つ以上の意図されないゲノム遺伝子座を含む複数の二本鎖DNA分子の中の1つ以上のバリアントの頻度を決定することと、を含む。一般に、予測される配列(例えば、参照配列)を使用して、不適切な編集事象もしくは変異、または他の実施形態では、ゲノムの他箇所(例えば、意図されないゲノム遺伝子座)で発生し得る「オフターゲット」編集事象、を特定することができる。一部の実施形態では、提供される方法を使用して、変更されていない配列(例えば、成功裏に編集されていないゲノム)を特定することができる。
【0125】
一部の実施形態では、ゲノム編集事象が成功しなかった場合、発生を検出および/または定量するための方法が本明細書に提供される(例えば、意図されたゲノム遺伝子座は、変化していない配列を含み、意図されたゲノム遺伝子座は、望ましくないまたは意図されていない変化した配列を含み、意図されていないゲノム遺伝子座は、ゲノム編集事象の結果として変化した配列を含む)。一部の実施形態では、集団における未編集の細胞の割合を評価するための方法が、本明細書に提供される。例えば、ゲノム編集事象を経た細胞の集団中の細胞の一部は、意図されたゲノム遺伝子座で未変化のままであってもよい。ゲノム編集事象の効率を決定することは、未変化のままの意図されたゲノム遺伝子座における配列を含む元の二本鎖DNA分子の割合を決定することを含み得る。同様に、方法は、意図されたゲノム遺伝子座で所望の変化した配列を含む元の二本鎖DNA分子の数または割合を定量することを含み得る。
【0126】
一部の実施形態では、操作されたゲノム編集事象が不適切であった場合、発生を検出する、および/または定量するための方法が本明細書に提供される。一部の実施形態では、提供される方法は、意図されたゲノム遺伝子座の配列における1つ以上のバリアントの存在を検出および/または定量することを含む。一部の実施形態では、1つ以上のバリアントは、意図されたゲノム遺伝子座の配列に不適切な変異を含む。例えば、一部の実施形態では、ゲノム編集のための意図されたゲノム遺伝子座の配列における不適切な変異は、非相同末端結合(NHEJ)事象に起因する。一部の実施形態では、NHEJに起因する変異は、所望の意図された変異である。一部の実施形態では、提供される方法は、意図されたゲノム遺伝子座における配列を含むエラー修正配列リードの中で、望ましくないDNA配列の頻度を決定することを含む。
【0127】
一部の実施形態では、操作されたゲノム編集事象は、複数の意図されたゲノム遺伝子座(例えば、多重ゲノム操作)を対象とする。一部の実施形態では、ゲノム編集によって標的化される複数のゲノム遺伝子座を特徴付けるための方法が、本明細書に提供される。一部の実施形態では、2つ以上(例えば、2、3、4、5、6、7、またはそれ以上)の意図された遺伝子座において、操作されたゲノム編集の成功を評価するための方法が、本明細書に提供される。一部の実施形態では、複数のゲノム編集事象のうちの少なくとも1つが不成功または不適切であった場合、発生を検出および/または定量するための方法が、本明細書に提供される。
【0128】
一部の実施形態では、提供される方法は、意図されないゲノム遺伝子座の配列を含む1つ以上のエラー修正配列リードがバリアントを含むかどうかを決定するステップも含んでいてもよい。
【0129】
一部の実施形態では、デュプレックス配列決定方法によって分析される1つ以上の標的ゲノム領域は、ゲノムの少なくとも1つの意図されないゲノム遺伝子座であるか、またはそれを含む。一部の実施形態では、1つ以上のバリアントが、意図されないゲノム遺伝子座の配列を含む1つ以上のエラー修正配列リード中に特定される。かかるバリアントは、機能上破壊的な変異(例えば、タンパク質機能を破壊し、癌を引き起こす可能性がある変異)を含んでよい。
【0130】
一部の実施形態では、提供される方法は、複数の二本鎖DNA分子の中で、意図されないゲノム遺伝子座で1つ以上のバリアントの頻度を決定するステップを含む。一部の実施形態では、提供される方法は、複数の(例えば、2つ以上の)異なる意図されないゲノム遺伝子座で、1つ以上のバリアントの頻度を決定するステップを含む。一部の実施形態では、エラー修正配列リードのかかる比較は、複数の意図されないゲノム遺伝子座の配列を、参照ゲノムDNA配列と比較することを含み得る。
【0131】
一部の実施形態では、意図されないゲノム遺伝子座は、変異しやすい部位、マイクロサテライト遺伝子座、意図されたゲノム遺伝子座と配列相同性を有する配列、および/または癌ドライバーのうちの1つ以上を含む。
【0132】
一部の実施形態では、意図されない遺伝子座は、ゲノム内の変異しやすい部位である配列であるか、またはその配列を含む。
【0133】
一部の実施形態では、意図されない遺伝子座は、マイクロサテライト遺伝子座である配列であるか、またはその配列を含む。一般に、マイクロサテライトは、短い反復DNA配列であり、エラーまたは変異が起こりやすい。腫瘍細胞では、マイクロサテライト変異は、マイクロサテライト配列の短縮または延長をもたらし、それによってマイクロサテライト不安定性(マイクロサテライト不安定性、MSI)を引き起こす場合がある。
【0134】
一部の実施形態では、意図されない遺伝子座は、意図されたゲノム遺伝子座での配列と、少なくとも部分的に類似している配列であるか、または少なくとも部分的に類似している配列を含む。一部の実施形態では、意図されない遺伝子座は、編集のための意図されたゲノムと相同性を有する配列であるか、またはそれを含む。一部の実施形態では、意図されない遺伝子座は、編集のための意図されたゲノム遺伝子座の少なくとも一部と、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%の類似性を有する配列を含む。一部の実施形態では、意図されない遺伝子座は、編集のための意図されたゲノム遺伝子座の少なくとも一部と、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の同一性を有する配列を含む。一部の実施形態では、意図されたゲノム遺伝子座の少なくとも一部は、少なくとも10塩基、少なくとも15塩基、少なくとも20塩基、少なくとも25塩基、少なくとも30塩基、少なくとも40塩基、少なくとも50塩基、またはそれ以上である。一部の実施形態では、意図されない遺伝子座は、ゲノム編集プロセスで使用されるガイドポリヌクレオチド(例えば、合成ガイドRNA(gRNA)分子)の配列と、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%の類似性を有する配列を含む。一部の実施形態では、意図されない遺伝子座は、ゲノム編集プロセスで使用されるガイドポリヌクレオチド(例えば、合成ガイドRNA(gRNA)分子)の配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%の同一性を有する配列を含む。
【0135】
一部の実施形態では、意図されない遺伝子座は、腫瘍抑制遺伝子、癌遺伝子、癌原遺伝子、および/または癌ドライバーであるか、それらを含む。一部の実施形態では、癌ドライバーは、Cancer Gene Census(CGC)またはCOSMICデータベース(癌に因果関係のある遺伝子)からの既知の癌ドライバーである。一部の実施形態では、癌ドライバー遺伝子は、ABL、ACC、BCR、BLCA、BRCA、CESC、CHOL、COAD、DLBC、DNMT3A、EGFR、ESCA、GBM、HNSC、KICH、KIRC、KIRP、LAML、LGG、LIHC、LUAD、LUSC、MESO、OV、PAAD、PCPG、PI3K、PIK3CA、PRAD、PTEN、READ、SARC、SKCM、STAD、TGCT、THCA、THYM、UCEC、UCS、および/またはUVM、であるか、またはこれらを含む。一部の実施形態では、癌ドライバー遺伝子は、TP53であるか、またはTP53を含む。一部の実施形態では、癌ドライバー遺伝子は、HRAS、NRAS、またはKRASであるか、あるいは、これらを含む。
【0136】
一部の実施形態では、バリアントが、分子の集団中の複数の富化されたタグ付けDNA分子の中の1つ以上の癌ドライバーにおいて検出される場合、本方法は、複数の富化されたタグ付けDNA分子の中のバリアントのバリアント頻度を決定するステップをさらに含んでもよい。
【0137】
クローン選択およびクローン増殖を評価するためのデュプレックス配列決定方法の選択された実施例
選択圧下で変異を含む細胞のクローン増殖を検出し、定量する能力は、癌リスクを評価し、発癌物質を特定し、ヒトにおける曝露の影響を予測し、臨床療法の成功を決定し、標的ゲノム編集の成功を決定するなどのために重要な場合がある。しかしながら、現在のツールは、時間がかかり、煩雑であり、かつ/またはそれが提供する情報に制限がある。多くのツールは、圧力下で選択されたクローンの初期腫瘍性増殖を検出する感度を欠いている。
【0138】
多くの事象では、細胞ゲノムの変化(例えば、挿入、欠失、切断および/または転位)がもたらされることがあり、その損傷がすぐに細胞死につながらない場合、癌につながり得る。特定の細胞集団において、癌ドライバー遺伝子(例えば、腫瘍抑制遺伝子または癌原遺伝子)における変異を保有する細胞は、細胞集団および隣接する細胞のクローン増殖の文脈によってマスキングされ得る。しかしながら、一部の細胞のクローン増殖を妨害し得る事象(例えば、細胞周期停止、細胞死などを引き起こす有害なDNA損傷)は、増殖の利点を有する細胞の選択的増殖の機会を提供し、そのようなクローンは、事象後に、細胞増殖を通して不均衡に繁殖し得る。選択圧を引き起こす事象は、近隣者に適応するおよび/または競り勝つことができる細胞に進化的圧力を提供する、任意の事象、変化、処理、プロセスまたは他の曝露(化学的、生物学的、物理的)であり得る。かかる選択圧は、インビボまたはインビトロの状況で存在し得る。例えば、ヒトまたは動物対象における異種移植は、一部の細胞が他の細胞よりも選択的に増殖することを示し得る。別の実施例では、標的ゲノム編集後、進化的利点を有する一部の細胞は、細胞培養において、他の近隣細胞に競り勝つ場合がある。このような場合、細胞クローンの増殖に伴うバリアントアレル頻度は、それぞれの増殖速度を表し、表される異なるバリアントの選択的利点または欠点についての洞察を提供し得る。したがって、デュプレックス配列決定によって検出される代表的な分子のバリアントアレル頻度を使用して、選択圧下で他の細胞に勝る変異を担持する細胞クローンを、明らかにすることができる。これらの変異のうちの特定の変異は、細胞が患者に導入される臨床環境および療法では、問題となるであろう。
【0139】
一部の実施形態では、提供される方法は、1つ以上のバリアントの頻度および/または存在量の変化を評価するために、複数の時点で行われる。一部の実施形態では、提供される方法は、第1の時点および第2の後の時点で行われる。一部の実施形態では、第2の時点は、第1の時点の少なくとも2、3、4、5、6、7、10、15、20、30、60、90、または180日後である。一部の実施形態では、第1の時点および第2の時点の両方は、操作されるゲノム編集事象後、約30日以内、約45日以内、約60日以内、約75日以内、または約90日以内である。複数の時点での分析は、腫瘍化の可能性、または腫瘍化の可能性の増加を評価するのに有用であり得る。例えば、第2の時点からのバリアント頻度が第1の時点からのバリアント頻度よりも大きい場合、細胞集団は、腫瘍化の可能性を有すると決定される。
【0140】
一部の実施形態では、提供される方法は、1つ以上のバリアントの頻度および/または存在量の変化を評価するために、複数の時点で行われる。一部の実施形態では、提供される方法は、複数の富化されたタグ付けDNA分子の中の1つ以上の癌ドライバーにおけるバリアントの検出および/または定量を含む。一部の実施形態では、提供される方法は、第1の時点において、および後の第2の時点において、複数の富化されたタグ付けDNA分子の中で、バリアントのバリアント頻度を決定するステップを含む。
【0141】
一部の実施形態では、第1の時点は、ゲノム編集ステップの前であり、第2の時点は、ゲノム編集ステップの後である。一部の実施形態では、提供される方法は、複数の富化されたタグ付けDNA分子の中の1つ以上の癌ドライバーにおけるバリアントを検出および/または定量することと、複数の富化されたタグ付けDNA分子の中のバリアントのバリアント頻度を決定することと、を含む。
【0142】
ゲノム編集
提供される方法は、「ゲノム編集」を指すが、本明細書に開示される「ゲノム編集」は、宿主細胞または二本鎖DNAの膜結合片、例えば、天然染色体、合成染色体、天然または合成エピソーム分子、ウイルス構築物などの内で標的化された任意のDNA分子のインビボ編集(例えば、誤修復、挿入、または他の標的部位の変化)を含むことを理解されたい。一部の実施形態では、ゲノム編集活性は、操作されているか、または天然である。例えば、CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats、クラスター化して規則的な配置の短い回文配列リピート)/Cas(CRISPR関連)系は、ウイルス攻撃から防御するための適応免疫系として、細菌および古細菌において進化した。天然ゲノム編集は、ウイルスまたはウイルス要素、転位性または移動性遺伝要素などによって媒介され得る。移動性遺伝要素は、カットおよびペースト(DNAトランスポゾン、クラスII要素)またはコピーおよびペースト(レトロポソン、クラスI要素)プロセスのいずれかによって複製する相互作用性遺伝剤である。移動性遺伝要素は、一般に、反復配列と隣接している。
【0143】
一部の実施形態では、ゲノム編集活性は、操作される。一部の実施形態では、操作されたゲノム編集事象は、標的化エンドヌクレアーゼを使用する。例示的な標的化エンドヌクレアーゼおよびそれを使用する方法を以下に提供する。一部の実施形態では、操作されたゲノム編集事象は、ポリヌクレオチド基質媒介性の相同組換え事象である。一部の実施形態では、操作されたゲノム編集事象は、DNA切断、DNA付加、DNA酸化的損傷、他の形態のDNA損傷、DNAニック、DNA脱アミノ化を導入する。ドーム実施形態では、遺伝子変化は、標的化エンドヌクレアーゼによる切断、および相同組換えを介して導入されるバリアントを有する提供される組換えテンプレートとの相同組換えの組み合わせによって導入される。一部の実施形態では、操作されたゲノム編集事象は、レトロウイルスまたは別のウイルスによって実行される。
【0144】
限定されないが、ゲノム編集は、遺伝子を「ノックアウト」するドナー断片を挿入することによって、または遺伝子の発現の低減もしくは機能的タンパク質への翻訳の低減をもたらす非コード配列を破壊することによって、1つ以上の遺伝子または非遺伝子座を破壊することができる。代替的にまたは付加的に、ゲノム編集は、遺伝子またはレプレッサーの発現を増加させ得るプロモーター、エンハンサーなどの遺伝子発現要素、または遺伝子もしくは他の転写産物(例えば、マイクロRNAまたは調節偽遺伝子)の発現を減少させる他の要素を導入することができる。本明細書に開示されるゲノム編集をさらに使用して、外因性遺伝子などの遺伝子を、遺伝子座に導入することができる。本明細書のゲノム編集方法を使用して、複数の遺伝子をドナー断片上のゲノム標的部位に導入することができる。ドナー断片は、任意選択的に、検出可能なマーカー遺伝子、例えば、蛍光タンパク質遺伝子を含むことができ、本明細書に提供される方法を使用して、導入された遺伝子または検出可能なマーカー遺伝子に物理的に連結された遺伝子の浸透率を評価するのに使用することができる。
【0145】
標的化エンドヌクレアーゼ
特に真核生物ゲノムの特定の遺伝子操作を可能にする一連の分子ツールが最近開発されている。最初に、ジンクフィンガーヌクレアーゼ(ZFN)が開発され、その後、転写活性化因子様エフェクターヌクレアーゼ(TALEN)が開発された。CRISPR/Cas9システムの開発により、真核生物種にわたって標的化ゲノム編集が達成されている。CRISPR/Cas9系は、一般に、Cas9エンドヌクレアーゼ(例えば、Streptococcus pyogenesのエンドヌクレアーゼ)およびCRISPR RNA(cRNA)およびトランス活性化cRNA(tracrRNA)の機能を組み合わせた合成ガイドRNA(gRNA)分子を含む。gRNAは、Cas9エンドヌクレアーゼを、Cas9活性に必要なプロトスペーサー関連モチーフ(PAM)NGG配列の前の20ヌクレオチドに相補的な標的配列に、誘導する。一部の実施形態では、cRNAとtracrRNAは、ヌクレオチド修飾を含み得る単一のRNAに組み合わされていてもよい。
【0146】
本開示の文脈において、任意の数の標的化エンドヌクレアーゼ(例えば、CRISPR関連リボ核酸タンパク質複合体、例えば、Cas9またはCpf1、ホーミングヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALEN、megaTALヌクレアーゼ、アルゴノートヌクレアーゼ、および/またはこれらの誘導体)を使用して、様々な生物における意図的な変異誘発(例えば、ゲノム編集)を誘導してもよい。一部の実施形態では、標的化エンドヌクレアーゼは、DNAの鎖に沿って選択された位置で、二本鎖切断(DSB)を生成することが可能な部位特異的ヌクレアーゼである。一部の実施形態では、標的化エンドヌクレアーゼは、DNAの鎖に沿って選択された位置で、一本鎖ニックを生成することが可能な部位特異的ヌクレアーゼである。
【0147】
一部の実施形態では、標的化エンドヌクレアーゼは、例えば、増強された熱安定性、塩耐性および/またはpH耐性を提供するためにアミノ酸置換を有するなど、修飾されていてもよい。他の実施形態では、標的化エンドヌクレアーゼは、ビオチン化されてもよく、ストレプトアビジンと融合されてもよく、かつ/または他の親和性に基づく(例えば、ベイト/プレイ)技術が組み込まれてもよい。特定の実施形態では、標的化エンドヌクレアーゼは、変化した認識部位特異性を有していてもよい(例えば、変化したPAM部位特異性を有するSpCas9バリアント)。
【0148】
一部の実施形態では、操作されたゲノム編集事象は、修飾されたCASまたはCPF-1媒介事象である。一部の実施形態では、操作されたゲノム編集事象は、Cas9媒介性編集事象である。一部の実施形態では、操作されたゲノム編集事象は、CPF1媒介性編集事象である。一部の実施形態では、操作されたゲノム編集事象は、TALEN、メガTAL、ジンクフィンガーヌクレアーゼ、ホーミングエンドヌクレアーゼ、制限エンドヌクレアーゼによって実行される。
【0149】
CRISPRに基づく標的化エンドヌクレアーゼは、本明細書でさらに論じられ、標的化エンドヌクレアーゼの使用のさらに詳細な非限定な例を提供する。なお、かかる標的化エンドヌクレアーゼにまつわる命名法は、依然として流動的である。本明細書での目的のために、開裂される核酸配列を再定義するようにその配列が修飾され得るような核酸配列を含むエンドヌクレアーゼを一般的に意味するように、「CRISPERに基づく」という用語を使用する。Cas9およびCPF1は、現在使用されているかかる標的化エンドヌクレアーゼの例であるが、さらに多くが自然界の異なる場所に存在すると見られ、かかる標的化され、容易に調整可能な様々な異なるヌクレアーゼの利用可能性は、今後数年で急速に成長することが予測される。同様に、これらの特性を向上させるか、または改変するためのこれらの酵素の複数の操作されたバリアントが、利用可能になりつつある。本明細書では、ここに記載される開示内容と同様の目的を達成するために、本明細書で明示的に記載されていないか、またはまだ発見されていない実質的に機能的に類似した標的化エンドヌクレアーゼの使用を明示的に企図する。
【0150】
ゲノム編集のための細胞およびベクター
ゲノム編集システムおよび/または方法は、ウイルスベクター、例えば、アデノウイルス、またはアデノ関連ウイルス(AAV)を含んでもよい。典型的には、発現ベクターDNAは、形質転換、エレクトロポレーション、またはウイルス(AAV)によって、細胞に送達することができる。また、RNAは、注射またはエレクトロポレーションによって、細胞に送達することができる。タンパク質は、エレクトロポレーション、ペプチド(HIV)タグを介して、細胞に送達することができる。
【0151】
本開示は、ゲノムが編集される細胞および/または編集された細胞を提供する。提供される方法は、限定されないが、植物細胞、動物細胞、ならびに原生動物、真菌、および藻類を含む、原核細胞(細菌および古細菌)ならびに真核細胞を含む、培養され得る任意の細胞で行われ得る。一部の実施形態では、本開示の文脈において編集および/または分析される細胞の集団は、多能性幹細胞、胚性幹細胞、免疫細胞、または植物細胞である。
【0152】
一部の実施形態では、本開示の文脈において編集および/または分析される細胞の集団は、動物細胞(例えば、哺乳動物細胞、例えば、ヒト細胞)であるか、または動物細胞を含む。一部の実施形態では、細胞の集団は、哺乳動物の幹細胞であるか、または哺乳動物の幹細胞を含む。一部の実施形態では、本開示の文脈で編集される細胞の集団は、植物細胞であるか、または植物細胞を含む。
【0153】
試薬を用いたキット
本技術の態様は、さらに、デュプレックス配列決定方法の様々な態様を実施するためのキットを包含する(本明細書では「DSキット」とも呼ばれる)。一部の実施形態では、キットは、核酸抽出、核酸ライブラリ調製、増幅(例えば、PCRによる)および配列決定について、本明細書に開示される方法または方法ステップのうちの1つ以上を実施するための説明書と共に、様々な試薬を含んでいてもよい。一実施形態では、キットは、本技術の態様に従い、例えば、試料に関連する、成功裏のゲノム編集事象、不適切なゲノム編集事象、意図されない(例えば、オフターゲット)ゲノム編集事象、クローン選択、クローン増殖などを決定するために、配列決定データ(例えば、生の配列決定データ、配列決定リードなど)を分析するためのコンピュータプログラム製品(例えば、コンピュータ上で実行するためのコード化されたアルゴリズム、1つ以上のアルゴリズムを実行するためのクラウドベースのサーバへのアクセスコード)をさらに含み得る。キットには、DNA標準、ならびに陽性および陰性対照の他の形態が含まれ得る。
【0154】
一部の実施形態では、DSキットは、試料調製(例えば、組織操作、DNA抽出、DNA断片化)、核酸ライブラリ調製、増幅および配列決定の様々な態様を行うのに好適な試薬または試薬の組み合わせを含んでいてもよい。例えば、DSキットは、任意選択的に、1つ以上のDNA抽出試薬(例えば、緩衝液、カラムなど)および/または組織抽出試薬を含んでいてもよい。任意選択的に、DSキットは、さらに、例えば、物理的手段(例えば、音響剪断または超音波処理を容易にするための管、ネブライザユニットなど)または酵素的手段(例えば、無作為または半無作為のゲノム剪断のための酵素および適切な反応酵素)によって、二本鎖DNAを断片化するための1つ以上の試薬またはツールを含んでいてもよい。例えば、キットは、標的の消化のために、酵素(例えば、制限エンドヌクレアーゼ、CRISPR/Casエンドヌクレアーゼ(複数可)およびRNAガイド、ならびに/または他のエンドヌクレアーゼ)、二本鎖フラグメンターゼカクテル、DNAの断片を主に二本鎖にするため、および/または一本鎖DNAを破壊するための一本鎖DNase酵素(例えば、マングビーンヌクレアーゼ、S1ヌクレアーゼ)のうちの1つ以上を含む二本鎖DNAを酵素的に断片化するためのDNA断片化試薬と、かかる酵素反応を容易にするための適切な緩衝液および溶液とを含んでいてもよい。
【0155】
一実施形態では、DSキットは、デュプレックス配列決定プロセスのステップを行うのに好適な試料から核酸配列ライブラリを調製して、試料中の二本鎖核酸分子のエラー修正(例えば、高精度の)配列を生成するためのプライマーおよびアダプターを含む。例えば、キットは、単一分子識別子(SMI)配列を含むアダプター分子の少なくとも1つのプール、またはユーザがこれを作成するためのツール(例えば、一本鎖オリゴヌクレオチド)を含んでいてもよい。一部の実施形態では、アダプター分子のプールは、試料中の複数の核酸分子が、アダプター分子の結合後に、実質的に固有に標識され得るように、いずれか単独でまたはライゲーションされる断片の固有の特徴と組み合わせて、好適な数の実質的に固有のSMI配列を含む。当業者は、分子タグ化において、「好適な」数のSMI配列を伴うものが、様々な特定の因子(入力DNA、DNA断片化の種類、断片の平均サイズ、ゲノム内で配列決定される配列の複雑性対反復性など)に応じて、数桁程度変化することを理解するだろう。任意選択的に、アダプター分子は、さらに、1つ以上のPCRプライマー結合部位、1つ以上の配列決定プライマー結合部位、または両方を含む。別の実施形態では、DSキットは、SMI配列またはバーコードを含むアダプター分子を含まないが、その代わりに、従来のアダプター分子(例えば、Y字型の配列決定アダプターなど)を含み、様々な方法ステップは、分子配列リードを関連付けるために、内因性SMIを利用してもよい。一部の実施形態では、アダプター分子は、インデックスアダプターであり、および/またはインデックス配列を含む。他の実施形態では、インデックスは、キットに供給されるプライマーを使用して、PCRによる「尾部付加(tailing in)」を通して、特定の試料に付加される。
【0156】
一実施形態では、DSキットは、非相補領域および/またはいくつかの他の鎖定義要素(SDE)を各々有するアダプター分子のセット、またはユーザがこれを生成するためのツール(例えば、一本鎖オリゴヌクレオチド)を含む。別の実施形態では、キットは、アダプター分子の少なくとも1つのセットを含み、アダプター分子の少なくともサブセットが、それぞれ、少なくとも1つのSMIと少なくとも1つのSDEとを含むか、またはこれらを生成するためのツールを含む。デュプレックス配列決定プロセスステップを行うのに好適な試料から核酸配列決定ライブラリを調製するためのプライマーおよびアダプターのさらなる特徴が、上に記載され、米国特許第9,752,188号、国際特許公開第WO2017/100441号および国際特許出願第PCT/US18/59908号(2018年11月8日出願)に開示され、これらは全て、それらの全体が参照により本明細書に援用される。
【0157】
これに加えて、キットは、さらに、例えば、Qubit蛍光光度計(Thermo Fisher Scientific, Waltham, MAから入手可能)と共に使用するためのSYBR(商標)greenまたはSYBR(商標)gold(Thermo Fisher Scientific, Waltham, MAから入手可能)など、または好適な蛍光分光計もしくはリアルタイムPCR機もしくはデジタルドロップレットPCR機で使用するためのPicoGreen(商標)色素(Thermo Fisher Scientific, Waltham, MAから入手可能)などのDNA結合色素などのDNA定量材料を含んでいてもよい。他のプラットフォームでのDNA定量に適した他の試薬も企図される。さらなる実施形態は、核酸サイズ選択試薬(例えば、Solid Phase Reversible Immobilization(SPRI)磁気ビーズ、ゲル、カラム)、ベイト/プレイハイブリダイゼーションを用いた標的DNA捕捉のためのカラム、qPCR試薬(例えば、コピー数決定のための)、および/またはデジタルドロップレットPCR試薬のうちの1つ以上を含むキットを含む。一部の実施形態では、キットは、任意選択的に、ライブラリ調製酵素(リガーゼ、ポリメラーゼ(複数可)、エンドヌクレアーゼ(複数可)、例えば、RNAインテロゲーションのための逆転写酵素)、dNTP、緩衝液、捕捉試薬(例えば、ビーズ、表面、コーティングされた管、カラムなど)、インデックスプライマー、増幅プライマー(PCRプライマー)および配列決定プライマーのうちの1つ以上を含んでいてもよい。一部の実施形態では、キットは、エラーを起こしやすいDNAポリメラーゼおよび/または高忠実度DNAポリメラーゼなどのDNA損傷の種類を評価するための試薬を含んでいてもよい。特定の条件(例えば、高GCリッチゲノム/標的)におけるPCRまたはライゲーション反応のために、さらなる添加剤および試薬が企図される。
【0158】
一実施形態では、キットは、さらに、試薬、例えば、ポリメラーゼ連鎖反応(PCR)プロセスを妨害するDNA配列のエラーを修復するDNAエラー修正酵素を含む(疾患を引き起こす変異の修復と対比して)。非限定的な例として、酵素は、以下の、数あるグリコシラーゼの中でも、単機能性ウラシル-DNAグリコシラーゼ(hSMUG1)、ウラシル-DNAグリコシラーゼ(UDG)、N-グリコシラーゼ/AP-リアーゼNEIL1タンパク質(hNEIL1)、ホルムアミドピリミジンDNAグリコシラーゼ(FPG)、8-オキソグアニンDNAグリコシラーゼ(OGG1)、ヒト脱プリン/脱ピリミジンエンドヌクレアーゼ(APE1)、エンドヌクレアーゼIII(Endo III)、エンドヌクレアーゼIV(Endo IV)、エンドヌクレアーゼV(Endo V)、エンドヌクレアーゼVIII(Endo VIII)、T7エンドヌクレアーゼI(T7 Endo I)、T4ピリミジン二量体グリコシラーゼ(T4 PDG)、ヒト一本鎖選択的ヒトアルキルデニンDNAグリコシラーゼ(hAAG)など、リアーゼ、エンドヌクレアーゼおよびエキソヌクレアーゼなど、のうちの1つ以上を含み、これらを利用して、DNA損傷(例えば、インビトロまたはインビボでのDNA損傷)を修正することができる。これらのDNA修復酵素のいくつかは、例えば、DNAから損傷した塩基を除去するグリコシラーゼである。例えば、UDGは、(シトシンの自発的な加水分解によって生じる)シトシン脱アミノ化から得られるウラシルを除去し、FPGは、8-オキソ-グアニン(例えば、活性酸素種から得られる最も共通のDNA病変)を除去する。FPGは、リアーゼ活性も有し、脱塩基部位に1塩基ギャップを生成することができる。かかる脱塩基部位は、例えば、ポリメラーゼがテンプレートをコピーすることができないため、その後にPCRによって増幅することができない。したがって、かかるDNA損傷修復酵素および/またはここに列挙され、当該技術分野で既知の他のものを使用して、真の変異を有していないがそれ以外はエラーとして検出されない可能性がある損傷DNAを、効果的に除去することができる。
【0159】
キットは、さらに、適切な対照、例えば、DNA増幅対照、核酸(テンプレート)定量対照、配列決定対照、ゲノム編集事象後のゲノム編集事象またはクローン増殖を経た生体源に由来する核酸分子を含んでいてもよい。一部の実施形態では、キットは、細胞の対照集団を含んでいてもよい。一部の実施形態では、キットは、操作されたゲノム編集のための1つ以上の構成要素、例えば、ベクター、gRNA、編集酵素および/または試薬を含んでいてもよい。したがって、キットは、編集事象についてのプロトコルの信憑性を決定する予測されるデュプレックス配列決定結果を与える対照を提供するのに好適な試薬(試験化合物、核酸、対照配列決定ライブラリなど)を含み得る。一部の実施形態では、キットは、ゲノム編集事象またはゲノム編集事象後のクローン増殖を特徴付けるための参照配列情報を含んでいてもよい。一部の実施形態では、キットは、編集された細胞の集団中の1つ以上のDNAバリアントを特定するのに有用な配列情報を含んでいてもよい。そのような配列情報は、編集された細胞の腫瘍化の可能性を決定する、および/またはゲノム編集プロセス自体の有効性を評価するのに有用であり得る。一実施形態では、キットは、対象試料中または操作された細胞集団中のDNAバリアントを検出するための分析用の試料を運搬するための容器、試料を安定化するための保管材料、試料(例えば、細胞試料)を凍結するための材料を含む。別の実施形態では、キットは、核酸汚染対照標準(例えば、試験生物または対象生物とは異なる生物におけるゲノム領域に対して親和性を有するハイブリダイゼーション捕捉プローブ)を含んでいてもよい。
【0160】
キットは、さらに、PCRおよび配列決定緩衝液、希釈剤、対象試料抽出ツール(例えば、シリンジ、スワブなど)を含む、商業およびユーザの観点から望ましい材料を含む1つ以上の他の容器と、使用説明書を含む添付文書とを含んでいてもよい。これに加えて、ラベルが、上に記載のような使用のための指示書と共に、容器上に提供されてもよく、かつ/またはこの指示書および/もしくは他の情報が、キットに含まれる添付書類、および/もしくはそれに提供されるウェブサイトアドレスを介して含まれていてもよい。キットはまた、例えば、試料管、プレートシーラー、マイクロ遠心分離管開口具、ラベル、磁気粒子分離器、フォームインサート、アイスパック、ドライアイスパック、断熱材など、実験器具も含んでいてもよい。
【0161】
キットは、さらに、電子計算デバイス(例えば、ラップトップ/デスクトップコンピュータ、タブレットなど)にインストール可能な、またはネットワーク(例えば、リモートサーバ)を介してアクセス可能なコンピュータプログラム製品を含んでいてもよく、計算デバイスまたはリモートサーバは、デュプレックス配列決定分析ステップを含む操作を行うための命令を実行するように構成された1つ以上のプロセッサを備える。例えば、プロセッサは、生の配列決定リードまたは未分析配列決定リードを処理して、デュプレックス配列決定データを生成するための命令を実行するように構成されていてもよい。さらなる実施形態では、コンピュータプログラム製品は、対象または試料の記録(例えば、特定の対象または試料もしくは試料群に関する情報)と、DNAの意図されたゲノム編集標的化領域または非標的化ゲノム領域に関する経験的に導き出された情報と、を含むデータベースを含んでいてもよい。コンピュータプログラム製品は、コンピュータ上で実行されるとき、本明細書に開示される方法のステップを行う、非一時的コンピュータ可読媒体に具現化される(例えば、
図3~6を参照)。
【0162】
キットは、さらに、データ(例えば、配列決定データ、レポート、他のデータ)をアップロードし、ダウンロードするためのリモートサーバ(クラウドベースのサーバを含む)にアクセスするための命令および/またはアクセスコード/パスワードなど、またはローカルデバイスにインストールされるソフトウェアを含んでいてもよい。全ての計算作業は、リモートサーバで行われ、インターネット接続などを介してユーザ/キットユーザによってアクセスされてもよい。
【0163】
選択された適用例
本明細書に記載されるように、提供される方法は、様々な目的のいずれか、および/または様々な状況のいずれかにおいて、使用されてもよい。以下は、特定の例示のみを目的とした非限定的な用途および/または状況の例を説明する。
【0164】
ゲノム編集細胞の品質評価
本開示は、ゲノム編集が、腫瘍性変異を誘導および/または選択することができるという認識を包含する。したがって、本開示は、操作されたゲノム編集事象後の細胞集団の腫瘍化の可能性を評価する方法を提供する。かかる方法は、ゲノム編集のための品質管理の分析において、および/またはゲノム編集を経た細胞ベース療法の安全性を確保する上で、有用である。
【0165】
本開示は、ゲノム編集事象が、増加したまたは調節不全の細胞周期変異(例えば、腫瘍性変異)を有する細胞に対して、選択的にバイアスを課し得るという認識を含む。したがって、ゲノム編集細胞を、それらの腫瘍化の可能性について評価および/またはモニタリングすることが重要である。
【0166】
一部の実施形態では、本開示は、操作されたゲノム編集事象後に、細胞集団の腫瘍化の可能性を評価する方法を提供し、デュプレックス配列決定することと、1つ以上の対応関係を参照ゲノム配列と比較することによって、複数の富化されたタグ付けDNA分子の中の1つ以上の癌ドライバーにバリアントが存在するかどうかを決定することと、を含む。一部の実施形態では、かかる方法は、操作されたゲノム編集事象後に、細胞集団に由来する二本鎖DNA分子を含む試料から配列決定ライブラリを調製することを含み、配列ライブラリを調製することは、複数の二本鎖DNA分子をタグ付けして、第1のタグ付け鎖および第2のタグ付け鎖を有する複数のタグ付けDNA分子を生成することを含む、配列決定ライブラリを調製することと、1つ以上の癌ドライバーにマッピングするタグ付けDNA分子のサブセットについて、第1のタグ付け鎖および第2のタグ付け鎖を選択的に富化して、富化されたタグ付けDNA分子を提供することと、複数の富化されたタグ付けDNA分子の各々についてエラー修正配列リードを生成することであって、エラー修正配列リードを生成することは、富化されたタグ付けDNA分子に由来する1つ以上の第1のタグ付け鎖および第2のタグ付け鎖を配列決定して、第1の鎖の配列および第2の鎖の配列を提供することを含む、エラー修正配列リードを生成することと、第1の鎖の配列と第2の鎖の配列とを比較して、第1の鎖の配列および第2の鎖の配列の間に1つ以上の対応関係を特定することと、1つ以上の対応関係を参照ゲノム配列と比較することによって、複数の富化されたタグ付けDNA分子の中の1つ以上の癌ドライバーにバリアントが存在するかどうかを決定することと、を含む。
【0167】
特に興味深いことは、機能上破壊的な変異を含む1つ以上のバリアントを検出することである。一部の実施形態では、提供される方法は、1つ以上の癌ドライバー遺伝子において、1つ以上のバリアントを検出するのに有用である。一部の実施形態では、癌ドライバーは、Cancer Gene Census(CGC)またはCOSMICデータベース(癌に因果関係のある遺伝子)からの既知の癌ドライバーである。一部の実施形態では、癌ドライバー遺伝子は、ABL、ACC、BCR、BLCA、BRCA、CESC、CHOL、COAD、DLBC、DNMT3A、EGFR、ESCA、GBM、HNSC、KICH、KIRC、KIRP、LAML、LGG、LIHC、LUAD、LUSC、MESO、OV、PAAD、PCPG、PI3K、PIK3CA、PRAD、PTEN、READ、SARC、SKCM、STAD、TGCT、THCA、THYM、UCEC、UCS、および/またはUVM、であるか、またはこれらを含む。一部の実施形態では、癌ドライバー遺伝子は、TP53であるか、またはTP53を含む。一部の実施形態では、癌ドライバー遺伝子は、HRAS、NRAS、もしくはKRASであるか、またはこれらを含む。
【0168】
一部の実施形態では、バリアントが、分子の集団中の複数の富化されたタグ付けDNA分子の中の1つ以上の癌ドライバーにおいて検出される場合、本方法は、複数の富化されたタグ付けDNA分子の中のバリアントのバリアント頻度を決定するステップをさらに含んでもよい。
【0169】
一部の実施形態では、提供される方法は、1つ以上のバリアントの頻度および/または存在量の変化を評価するために、複数の時点で行われる。一部の実施形態では、提供される方法は、第1の時点および第2の後の時点で行われる。一部の実施形態では、第2の時点は、第1の時点の少なくとも2、3、4、5、6、7、10、15、20、30、60、90、または180日後である。一部の実施形態では、第1の時点および第2の時点の両方は、操作されたゲノム編集事象後の約30日以内、約45日以内、約60日以内、約75日以内、または約90日以内である。複数の時点での分析は、腫瘍化の可能性または腫瘍化の可能性の増加を評価するのに有用であり得る。例えば、第2の時点でのバリアント頻度が第1の時点でのバリアント頻度よりも大きい場合、細胞集団は、腫瘍化の可能性を有すると決定される。一部の実施形態では、提供される方法は、ゲノム編集事象を経た細胞集団、およびゲノム編集事象を経ていないそれ以外は同一の細胞の一部、に対して行われる。一部の実施形態では、提供される方法は、編集された細胞集団と、操作されたゲノム編集事象を経ていない同等の細胞集団との間のバリアント頻度を評価および比較することを含む。
【0170】
細胞療法のモニタリング
ゲノム編集細胞は、多くの用途に使用され得る。例えば、一部の実施形態では、医学的障害は、特定の免疫応答を誘発するゲノム編集免疫エフェクター細胞(例えば、T細胞)の投与によって治療される。一部の実施形態では、治療用途で使用するための細胞は、ゲノム編集事象後の約1、2、3、4、5日またはそれ以上の日以内に、バルク集団として、エクスビボで数日、数週間、または数ヶ月間、増殖してもよい。一部の実施形態では、ゲノム編集細胞を、投与後に、対象から得て、分析してもよい。例えば、操作された免疫細胞の場合、かかる編集された細胞を、治療対象の血液から得て、本開示の方法を使用して特徴付けてもよい。一部の実施形態では、細胞集団における1つ以上のバリアントの存在量を、経時的にモニタリングする。一部の実施形態では、細胞集団における1つ以上のバリアントのクローン増殖を、経時的にモニタリングする。
【0171】
ゲノム編集後の核酸の特性評価のためのシステムおよび計算環境の実施形態
好適な計算環境
以下の考察は、本開示の態様が実装され得る好適な計算環境の一般的な説明を提供する。必須ではないが、本開示の態様および実施形態は、汎用コンピュータ(例えば、サーバまたはパーソナルコンピュータ)によって実行されるルーチンなどのコンピュータで実行可能な命令の一般的な観点で記載される。当業者であれば、本開示を、インターネット家電、携帯機器、ウェアラブルコンピュータ、セルラーホンまたは携帯電話、マルチプロセッサシステム、マイクロプロセッサを使用した家電またはプログラム可能な家電、セットトップボックス、ネットワークPC、ミニコンピュータ、メインフレームコンピュータなどを含む他のコンピュータシステム構成を用いて実施することができることを理解するだろう。本開示は、以下に詳細に説明するコンピュータで1つ以上の実行可能な命令を実行するように具体的にプログラミングされ、構成されているか、または構築された特殊用途のコンピュータまたはデータプロセッサで具現化されてもよい。実際に、「コンピュータ」という用語は、本明細書で一般的に使用される場合、上述のデバイスのいずれか、および任意のデータプロセッサを指す。
【0172】
本開示は、分散型計算環境でも実施可能であり、タスクまたはモジュールは、リモート処理デバイスによって行われ、これらは、ローカルエリアネットワーク(「LAN」)、ワイドエリアネットワーク(「WAN」)またはインターネットなどの通信ネットワークを介して接続している。分散計算環境において、プログラムモジュールまたはサブルーチンは、ローカルメモリ記憶デバイスおよびリモートメモリ記憶デバイスの両方に配置されてもよい。以下に記載される本開示の態様は、チップ(例えば、EEPROMチップ)中のファームウェアに格納されているか、またはインターネットもしくは他のネットワーク(無線ネットワークを含む)によって電子的に分散される磁気および光学的に読み取り可能かつ除去可能なコンピュータディスクを含め、コンピュータ可読媒体に格納されるか、または分散されてもよい。当業者は、本開示の一部が、サーバコンピュータに存在していてもよく、一方、対応する部分がクライアントコンピュータに存在していてもよいことを理解するだろう。本開示の態様に特有のデータ構造およびデータの伝送も、本開示の範囲内に包含される。
【0173】
コンピュータの実施形態(例えば、パーソナルコンピュータまたはワークステーション)は、1つ以上のユーザ入力デバイスおよびデータ格納デバイスに接続された1つ以上のプロセッサを含んでいてもよい。コンピュータは、少なくとも1つの出力デバイス(例えば、表示デバイス)および1つ以上の任意選択的なさらなる出力デバイス(例えば、プリンタ、プロッタ、スピーカ、触覚または嗅覚による出力デバイスなど)にも接続されてもよい。コンピュータは、例えば、任意のネットワーク接続、無線送受信機、またはこれら両方によって、外部のコンピュータに接続していてもよい。
【0174】
様々な入力デバイスは、キーボードおよび/またはポインティングデバイス(例えば、マウス)を含んでいてもよい。マイクロホン、ジョイスティック、ペン、タッチスクリーン、スキャナ、デジタルカメラ、ビデオカメラなど、他の入力デバイスが可能である。さらなる入力デバイスは、配列決定機(複数可)(例えば、超並列シーケンサー)、蛍光顕微鏡および他の実験機器などを含んでいてもよい。好適なデータ記憶デバイスは、コンピュータによってアクセス可能なデータを記憶することができる任意の種類のコンピュータ可読媒体、例えば、磁気ハードドライブおよびフロッピーディスクドライブ、光学ディスクドライブ、磁気カセット、テープドライブ、フラッシュメモリカード、デジタルビデオディスク(DVD)、ベルヌーイカートリッジ、RAM、ROM、スマートカードなどを含んでいてもよい。実際に、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)またはインターネットなどのネットワークに対する接続ポートまたはノードを含め、コンピュータ可読命令およびデータを記憶または送信するための任意の媒体を使用してもよい。
【0175】
本開示の態様は、様々な他の計算環境で実施され得る。例えば、ネットワークインターフェースを備える分散計算環境は、システムに1つ以上のユーザコンピュータを含んでもよく、それらは、インターネットのワールドワイドウェブ部分内のウェブサイトを含めて、コンピュータにアクセスおよびインターネットとのデータ交換を可能にするブラウザプログラムモジュールを含んでいてもよい。ユーザコンピュータは、他のプログラムモジュール(例えば、オペレーティングシステム)、1つ以上のアプリケーションプログラム(例えば、ワードプロセシングまたはスプレッドシートアプリケーション)などを含んでいてもよい。コンピュータは、様々な種類のアプリケーションを実行するようにプログラミング可能な汎用デバイスであってもよいか、またはコンピュータは、特定の機能もしくは機能群に最適化されるか、もしくは限定される専用デバイスであってもよい。より重要なことに、ネットワークブラウザで示されるが、以下に詳細に記載されるように、ユーザにグラフィカルユーザインターフェースを提供するための任意のアプリケーションプログラムを使用してもよい。ウェブブラウザおよびウェブインターフェースの使用は、本明細書でよく知られている例としてのみ使用される。
【0176】
インターネットまたはワールドワイドウェブ(「ウェブ」)に接続した少なくとも1つのサーバコンピュータは、本明細書で記載する電子メッセージ(例えば、ウェブページ、データストリーム、音声信号および電子画像)を受信し、ルーティングし、格納するための機能の多くまたは全てを実行することができる。インターネットが示されているが、イントラネットなどのプライベートネットワークが、いくつかの用途では実際に好ましい場合がある。ネットワークは、クライアントサーバアーキテクチャを有していてもよく、このとき、コンピュータは、他のクライアントコンピュータにサービスを提供するための専用コンピュータであるか、またはピアツーピアなどの他のアーキテクチャを有していてもよく、このとき、1つ以上のコンピュータは、サーバおよびクライアントとして同時に機能する。サーバコンピュータ(複数可)に接続するデータベースまたは複数のデータベースは、ユーザコンピュータ間で交換されるウェブページおよびコンテンツの多くを格納することができる。データベース(複数可)を含むサーバコンピュータ(複数可)は、システムに対する悪意のある攻撃を阻止し、それに格納されるメッセージおよびデータの完全性を維持するためのセキュリティ対策(例えば、ファイアウォールシステム、セキュアソケットレイヤ(SSL)、パスワード保護スキーム、暗号化など)を採用していてもよい。
【0177】
好適なサーバコンピュータは、特に、サーバエンジン、ウェブページ管理要素、コンテンツ管理要素およびデータベース管理要素を含んでいてもよい。サーバエンジンは、基本的な処理と、オペレーションシステムレベルタスクを実行する。ウェブページ管理要素は、ウェブページの作成および表示またはルーティングを処理する。ユーザは、これに関連付けられたURLを用い、サーバコンピュータにアクセスしてもよい。コンテンツ管理要素は、本明細書に記載する実施形態の機能の大部分を処理する。データベース管理要素は、データベースに関する格納および検索タスク、データベースへのクエリ、データベースの読み込み書き出し機能、ならびに動画、グラフィックおよび音響信号などのデータの格納を含む。
【0178】
本明細書に記載される機能ユニットの多くは、それらの実装独立性をより特定的に強調するために、モジュールと分類されている。例えば、モジュールは、様々な種類のプロセッサによる実行のためのソフトウェアで実装され得る。実行可能コードの識別されたモジュールは、例えば、コンピュータ命令の1つ以上の物理ブロックまたは論理ブロックを含み、この1つ以上の物理ブロックまたは論理ブロックは、例えば、オブジェクト、手順または機能として整理され得る。コンピュータ命令の特定されたブロックは、物理的に一緒に配置される必要はないが、異なる位置に格納される異なる命令を含んでいてもよく、論理的に共に結合された場合、モジュールを含み、そのモジュールの指定された目的を達成する。
【0179】
モジュールはまた、カスタムVLSI回路またはゲートアレイ、論理チップなどの既製品の半導体、トランジスタまたは他の別個の要素を含むハードウェア回路として実装されてもよい。モジュールはまたフィールドプログラマブルゲートアレイ(field programmable gate array)、プログラム可能なアレイロジック、プログラム可能なロジックデバイスなどのプログラム可能なハードウェアデバイスにも実装され得る。
【0180】
実行可能コードのモジュールは、単一の命令、または多くの命令であってもよく、異なるプログラムの中で、いくつかのメモリデバイスにわたって、いくつかの異なるコードセグメントにも分散されてもよい。同様に、操作データは、本明細書ではモジュール内で特定され、示されてもよく、任意の好適な形態で具現化され、任意の好適な種類のデータ構造で整理されてもよい。操作データは、単一のデータセットとして収集されてもよいか、または異なる記憶デバイスにわたって含む異なる位置に分散されてもよく、システムまたはネットワークに対する単なる電子信号として少なくとも部分的に存在していてもよい。
【0181】
ゲノム編集およびクローン増殖を特徴付けるためのシステム
本技術は、さらに、核酸混合物を含む生体試料を処理し、有線または無線のネットワークを介して配列決定データをサーバに送信して、試料のエラー修正配列リード(例えば、二重鎖配列リード、二重鎖コンセンサス配列など)、意図されたゲノム遺伝子座での配列リード、意図されない遺伝子座での配列リード、癌ドライバー遺伝子座での配列リード、予測される配列、予測されるゲノム編集配列、参照配列、バリアント特定、バリアント頻度、個々の/帰属性の遺伝子型の定量など、を決定する、システム(例えば、ネットワーク型コンピュータシステム、ハイスループット自動化システムなど)を含む。
【0182】
以下にさらに詳細に説明されるように、また、
図2に示される実施形態に関して、細胞集団のゲノム編集後に、核酸を特徴付けるためのコンピュータ化されたシステムは、(1)サーバと(例えば、リモートサーバ、またはローカルに格納されたサーバ)(2)配列決定データを生成および/または送信することが可能な複数のユーザ電子計算デバイスと、(3)任意選択的に、参照配列(例えば、予測されるゲノム配列、予測されるゲノム編集配列など)および関連情報(任意選択的)を含むデータベースと、(4)電子計算デバイス、データベース、およびサーバ間の電子通信を伝送するための有線または無線のネットワークと、を備える。このサーバは、さらに、(a)ゲノム編集の記録結果およびバリアントプロファイルの記録(例えば、変異プロファイル、バリアント頻度結果など)を記憶するデータベースと、(b)メモリに通信可能に接続された1つ以上のプロセッサ、およびプロセッサ(複数可)のための命令を含む1つ以上の非一時的コンピュータ可読記憶デバイスまたは媒体と、を備え、当該プロセッサは、
図3~6に記載の1つ以上のステップを含む操作を行うための当該命令を実行するように構成されている。
【0183】
一実施形態では、本技術は、非一時的コンピュータ可読記憶媒体をさらに含み、1つ以上のプロセッサによって実行された場合、1つ以上の意図されたゲノム遺伝子座における予測されるゲノム編集配列の存在、1つ以上の意図されたゲノム遺伝子座における望ましくないゲノム編集配列の存在、1つ以上の意図されないゲノム遺伝子座における望ましくないゲノム編集配列の存在、癌ドライバー遺伝子座または非癌ドライバー遺伝子座における1つ以上のバリアントの存在、集団間の意図されたゲノム遺伝子座におけるオンターゲットゲノム変化の頻度、1つ以上の意図されないゲノム遺伝子座におけるオフターゲットゲノム変化の頻度、核酸混合物中に存在する1つ以上のバリアントのバリアント頻度、ゲノム編集事象後の混合物中の各バリアントの経時的な定量など、を決定するための方法を行う命令を含む。特定の実施形態では、本方法は、
図3~6に記載の1つ以上のステップを含んでいてもよい。
【0184】
本技術のさらなる態様は、1つ以上の意図されたゲノム遺伝子座における予測されるゲノム編集配列の存在、1つ以上の意図されたゲノム遺伝子座における望ましくないゲノム編集配列の存在、1つ以上の意図されないゲノム遺伝子座における望ましくないゲノム編集配列の存在、癌ドライバー遺伝子座または非癌ドライバー遺伝子座における1つ以上のバリアントの存在、集団間の意図されたゲノム遺伝子座におけるオンターゲットゲノム変化の頻度、1つ以上の意図されないゲノム遺伝子座におけるオフターゲットゲノム変化の頻度、核酸混合物中に存在する1つ以上のバリアントのバリアント頻度、ゲノム編集事象後の混合物中の各バリアントの経時的な定量など、を決定するためのコンピュータ化された方法を対象とする。特定の実施形態では、本方法は、
図3~6に記載の1つ以上のステップを含んでいてもよい。
【0185】
図2は、細胞集団のゲノム編集後に、核酸を特徴づけるための本明細書に開示される方法を用いた使用のための、コンピュータシステム400のブロック図であり、コンピュータプログラム製品250がそれにインストールされている。
図2は、様々な計算システム要素を示しているが、当業者に既知の他のまたは異なる要素(例えば上に記載のもの)が、本開示の態様が実装され得る好適な計算環境を提供し得ることが企図される。
図3は、本技術の一実施形態に従う、デュプレックス配列決定のコンセンサス配列データを提供するためのルーチンを示すフロー図である。
図4~
図6は、ゲノム編集細胞集団に由来する核酸からのゲノム編集事象後の細胞集団における細胞のゲノム変化(例えば、定方向ゲノム変化、バリアント、変異等)およびクローン増殖を特定および/または定量するための様々なルーチンを示すフロー図である。本技術の態様に従って、
図4~
図6に関して記載される方法は、例えば、ゲノム編集後の細胞集団の遺伝子プロファイル、試料中に存在する正確な/所望のゲノム編集配列、試料中に存在する不適切な/望ましくないゲノム編集配列、試料中に存在するゲノムの意図されない領域における望ましくないゲノム編集配列、試料中に存在する増殖利点またはバイアスを付与するであろう癌ドライバーにおけるバリアント、試料中に存在する予期しないおよび/または望ましくないバリアント頻度、試料内で表されるバリアントおよび/またはゲノム編集の定量、および試料データの参照配列のデータセットとの比較から導き出される情報(予測されるゲノム編集配列、予測される配列、バリアント頻度のバックグラウンドレベルを含むデータベースを含む)を含む、試料データを提供することができる。
【0186】
図2に示されるように、コンピュータシステム200は、複数のユーザ計算デバイス202、204と、有線または無線のネットワーク210と、ゲノム編集配列を分析し、ゲノム編集事象後の細胞集団に由来する核酸を特徴付けるためのプロセッサを含むサーバ(「DupSeq(商標)サーバ」)240と、を含み得る。実施形態では、ユーザ計算デバイス202、204を使用して、配列決定データを生成および/または送信することができる。一実施形態では、計算デバイス202、204のユーザは、細胞集団のゲノム編集後に核酸を特徴付けるための生体試料のデュプレックス配列決定方法のステップなど、本技術の他の態様を行うユーザであってもよい。一実施例では、計算デバイス202、204のユーザは、本技術の一実施形態に従って、試薬および/またはアダプターを含むキット(1、2)を用いた特定のデュプレックス配列決定方法のステップを行って、生体試料を調査する。
【0187】
図示されるように、各ユーザ計算デバイス202、204は、少なくとも1つの中央処理ユニット206と、メモリ207と、ユーザおよびネットワークインターフェース208と、を含む。一実施形態では、ユーザデバイス202、204は、デスクトップ、ラップトップ、またはタブレットコンピュータを含む。
【0188】
2つのユーザ計算デバイス202、204が示されているが、任意の数のユーザ計算デバイスがシステム200の他の構成要素に含まれていてもよいか、または接続されていてもよいことが企図される。これに加え、計算デバイス202、204はまた、試料を増幅し、配列決定するためのユーザ(1)およびユーザ(2)によって使用される複数のデバイスおよびソフトウェアの代表であってもよい。例えば、計算デバイスは、配列決定機(例えば、Illumina HiSeg(商標)、Ion Torrent PGM、ABI SOLiD(商標)シーケンサー、PacBio RS、Helicos Heliscope(商標)など)、リアルタイムPCR機(例えば、ABI 7900、Fluidigm BioMark(商標)など)、マイクロアレイ機器など、であってもよい。
【0189】
上に記載の構成要素に加えて、システム200は、さらに、参照配列および関連情報を含むゲノム編集プロファイル232を記憶するためのデータベース230を備えてもよい。例えば、サーバ240によってアクセス可能なデータベース230は、予測されるゲノム配列、予測されるゲノム編集配列、既知の癌ドライバー変異、ゲノム変異原性ホットスポットまたは変異しやすい部位、既知のマイクロサテライト遺伝子座、相同配列の既知の領域、バックグラウンドのバリアント頻度レベル、出発物質の既知の遺伝子型プロファイル(例えば、細胞の混合物)などの記録または収集物を含んでいてもよい。特定の実施例では、データベース230は、参照配列および関連情報を含む、ゲノム編集プロファイル232を含む第三者のデータベースであってもよい。例えば、ゲノム参照配列、健常(例えば、非疾患または非変異)生体源由来のゲノム配列、癌ドライバーの配列、癌ドライバー変異のカタログ、および配列相同性の領域を含む様々なデータベースを、特定の用途に関して照会することができる。別の実施形態では、データベースは、サーバ240とは別個にホスティングされた自立型データベース230(プライベート、またはプライベートではないもの)であってもよいか、またはデータベースは、サーバ240上にホスティングされていてもよく(例えば、データベース270)、予測されるゲノム配列およびバリアントプロファイルを含む経験的に導かれたゲノム編集プロファイル272を含む。一部の実施形態では、システム200を使用して、1つ以上の細胞集団からの新しいゲノム編集プロファイルを生成することができ、システム200および関連する方法(例えば、本明細書に記載の方法、例えば、
図3~6の方法)の使用から生成されるデータを、データベース230および/または270にアップロードしてもよく、そのため、さらなるゲノム編集プロファイル232、272が、将来の比較作業のために作成されてもよい。
【0190】
サーバ240は、ユーザ計算デバイス202、204からの配列決定データ(例えば、生の配列決定ファイル)および関連情報を、ネットワーク210を介して受信し、計算し、分析するように構成されていてもよい。試料特有の生の配列決定データは、デバイス202、204にインストールされているか、もしくはネットワーク210を介してサーバ240からアクセス可能なコンピュータプログラム製品/モジュール(配列モジュール205)を使用して、または当該技術分野でよく知られている他の配列決定ソフトウェアを使用して、ローカルに計算されてもよい。次いで、生の配列データは、ネットワーク210を介してサーバ240に送信されてもよく、ユーザ結果274は、データベース270に記憶されてもよい。サーバ240は、データベース270から生の配列決定データを受信するように構成され、また、例えば、本明細書に開示されるデュプレックス配列決定技術を使用してエラー修正二本鎖の配列リードを計算的に生成するように構成された、プログラム製品/モジュール「DSモジュール」212も含む。DSモジュール212は、サーバ240上に示されているが、当業者は、DSモジュール212が、代替的にデバイス202、204、または別のサーバ(図示せず)上で動作するようにホスティングされ得ることを認識するであろう。
【0191】
サーバ240は、少なくとも1つの中央処理ユニット(CPU)260と、ユーザおよびネットワークインターフェース262(またはサーバに接続されたインターフェースを有するサーバ専用の計算デバイス)と、ゲノム編集プロファイル272を記憶するための複数のコンピュータファイル/記録、および試験された試料274に関する結果(例えば、生の配列決定データ、デュプレックス配列決定データ、意図されたゲノム遺伝子座の分析、意図されないゲノム遺伝子座の分析、バリアント分析、バリアント頻度分析など)を記憶するためのファイル/記録を有する上記のようなデータベース270と、を含み得る。サーバ240は、さらに、本技術の態様に従って、ゲノム編集コンピュータプログラム製品(ゲノム編集モジュール)250を記憶したコンピュータメモリ211を含む。
【0192】
コンピュータプログラム製品/モジュール250は、非一時的コンピュータ可読媒体で具現化され、コンピュータ(例えば、サーバ240)上で実行されるとき、細胞集団のゲノム編集後に核酸を特徴付ける(例えば、ゲノム変化を検出し、特定する、バックグラウンドバリアントを検出し、特定する、ゲノム編集事象後のクローン増殖を検出し、特定する、および/またはそれらを定量する)ための本明細書に開示される方法のステップを行う。本開示の別の態様は、プロセッサが、ゲノム編集分析(例えば、意図されたおよび意図されないゲノム遺伝子座でのゲノム変化の特徴付け、ゲノム編集事象後のゲノムへの所望のおよび望ましくない変化の定量、バリアントの特定、特定されたバリアントの定量、細胞集団内のバリアント頻度の決定、ゲノム編集比較レポートなど)を実施できるように、それに具現化されたコンピュータ可読プログラムコードまたは命令を有する非一時的コンピュータ使用可能媒体を含むコンピュータプログラム製品/モジュール250を含む。これらのコンピュータプログラム命令は、コンピュータまたは他のプログラム可能な装置にロードされて、マシンを生成してもよく、その結果、コンピュータまたは他のプログラム可能な装置で実行する命令が、本明細書に記載の機能またはステップを実装する手段を生成する。これらのコンピュータプログラム命令はまた、コンピュータまたは他のプログラム可能な装置に特定の様式で機能させるように命令し得るコンピュータ可読メモリまたは媒体に格納されてもよく、その結果、コンピュータ可読メモリまたは媒体に格納される命令は、分析を実施する命令手段を含む製造物品を生成する。また、コンピュータプログラム命令を、コンピュータまたは他のプログラム可能な装置にロードして、コンピュータまたは他のプログラム可能な装置で行われる一連の操作ステップに、コンピュータに実装されるプロセスを生成させてもよく、その結果、コンピュータまたは他のプログラム可能な装置で実行する命令は、上に記載の機能またはステップを実装するためのステップを提供する。
【0193】
さらに、コンピュータプログラム製品/モジュール250は、任意の好適な言語および/またはブラウザに実装されてもよい。例えば、Python、C言語で実施されてもよく、好ましくは、オブジェクト指向高レベルプログラミング言語、例えば、Visual Basic、SmallTalk、C++などを用いて実施されてもよい。アプリケーションは、Windows(商標)98、Windows(商標)2000、Windows(商標)NTなどを含むMicrosoft Windows(商標)環境などの環境に適するように書かれていてもよい。これに加え、アプリケーションは、MacIntosh(商標)、SUN(商標)、UNIXまたはLINUX環境のために書かれていてもよい。これに加え、機能ステップは、ユニバーサルプログラミング言語またはプラットフォームに依存しないプログラミング言語を使用して実装されてもよい。かかるマルチプラットフォームプログラミング言語の例として、限定されないが、ハイパーテキストマークアップランゲージ(HTML)、JAVA(商標)、JavaScript(商標)、フラッシュプログラミング言語、コモンゲートウェイインターフェース/ストラクチャードクエリーランゲージ(CGI/SQL)、プラクティカルエクストラクションレポートランゲージ(PERL)、AppleScript(商標)および他のシステムスクリプト言語、プログラミングランゲージ/ストラクチャードクエリーランゲージ(PL/SQL)などが挙げられる。Java(商標)またはJavaScript(商標)に対応するブラウザ、例えば、HotJava(商標)、Microsoft(商標)Explorer(商標)またはNetscape(商標)を使用してもよい。アクティブコンテンツウェブページが使用される場合、Java(商標)アプレットまたはActiveX(商標)コントロールまたは他のアクティブコンテンツ技術を含んでいてもよい。
【0194】
システムは、多くのルーチンを呼び出す。ルーチンのいくつかが本明細書に記載されるが、当業者は、システムが実行することができる他のルーチンを特定することができる。さらに、本明細書に記載されるルーチンは、様々な様式で変更することができる。例として、図示されたロジックの順序は、並べ替えてもよく、サブステップを並列で行ってもよく、図示されたロジックを省略してもよく、他のロジックを含んでもよい、など。
【0195】
図3は、試料(例えば、生物学的混合物からの試料)中の二本鎖核酸分子についてのデュプレックス配列決定データを提供するためのルーチン300を示すフロー図である。ルーチン300は、計算デバイス(例えば、クライアントコンピュータまたはコンピュータネットワークに接続するサーバコンピュータ)によって呼び出されてもよい。一実施形態では、計算デバイスは、配列データ生成部および/または配列モジュールを含む。一例として、計算デバイスは、操作者が計算デバイスと通信するユーザインターフェースに接続した後、ルーチン300を呼び出してもよい。
【0196】
ルーチン300は、ブロック302で開始し、配列モジュールは、ユーザ計算デバイスから生の配列データを受信し(ブロック304)、試料中の複数の核酸分子に由来する複数の生の配列リードを含む試料特有のデータセットを生成する(ブロック306)。一部の実施形態では、サーバは、後で処理するために、データベースに試料特有のデータセットを格納することができる。次に、DSモジュールは、試料特有のデータセット中の生の配列データから二重鎖コンセンサス配列決定データを生成するための要求を受信する(ブロック308)。DSモジュールは、元の二本鎖核酸分子を表すファミリーからの配列リードをグループ分けし(例えば、SMI配列に基づいて)、個々の鎖からの代表的な配列を互いに比較する(ブロック310)。一実施形態では、代表的な配列は、各々の元の核酸分子からの1つまたは1つより多い配列リードであってもよい。別の実施形態では、代表的な配列は、代表的な鎖内の整列およびエラー修正から生成される一本鎖コンセンサス配列(SSCS)であってもよい。このような実施形態では、第1の鎖からのSSCSを、第2の鎖からのSSCSと比較することができる。
【0197】
ブロック312で、DSモジュールは、比較された代表的な鎖間で相補性を有するヌクレオチド位置を特定する。例えば、DSモジュールは、比較された(例えば、整列された)配列リードに沿って、ヌクレオチド塩基コールが一致するヌクレオチド位置を特定する。さらに、DSモジュールは、比較された代表的な鎖間で相補性を有さない位置を特定する(ブロック314)。したがって、DSモジュールは、比較された(例えば、整列された)配列リードに沿って、ヌクレオチド塩基コールが一致しないヌクレオチド位置を特定することができる。
【0198】
次に、DSモジュールは、試料中の二本鎖核酸分子についてのデュプレックス配列決定データを提供することができる(ブロック316)。かかるデータは、処理された配列リードの各々について、二重鎖コンセンサス配列の形態であってもよい。二重鎖コンセンサス配列は、一実施形態では、元の核酸分子の各鎖からの代表的な配列が一致しているヌクレオチド位置のみを含んでいてもよい。したがって、一実施形態では、一致しない位置は、二重鎖コンセンサス配列がエラー修正された高精度の配列リードであるように、除外するか、または考慮しなくてもよい。別の実施形態では、デュプレックス配列決定データは、一致しないヌクレオチド位置をさらに分析することができるように(例えば、DNA損傷を評価することができる場合に)、一致しないヌクレオチド位置に対するレポート情報を含んでいてもよい。ルーチン300は、次いで、ブロック318に続き、そこで終了してもよい。
【0199】
図4は、細胞集団におけるゲノム編集事象から得られる意図されたゲノム遺伝子座において編集された配列を検出し、特定するためのルーチン400を示すフロー図である。ルーチン400は、
図2の計算デバイスによって呼び出すことができる。ルーチン400は、ブロック402で開始し、ゲノム編集モジュールは、
図3からのデュプレックス配列決定データ(例えば、ブロック316の後)を参照配列情報と比較し(ブロック404)、意図されたゲノム遺伝子座における配列の対応関係および/またはバリエーション(例えば、対象配列が参照配列と対応し、対象配列が予測されるゲノム編集配列と対応し、対象配列が参照配列とは異なるなど)を特定する(ブロック406)。例えば、参照配列は、予測されるゲノム配列(例えば、所望の操作されたゲノム編集配列を含む)であってもよく、比較ステップは、対象配列が予測されるゲノム配列を含むかどうかを特定することができる。別の例では、参照配列は、未編集のゲノム配列を含んでもよく、比較ステップは、対象配列が未編集のゲノム配列からのバリエーションを含むかどうかを特定することができる。
【0200】
次に、ゲノム編集モジュールは、対象配列の集団の中で予測されるゲノム編集配列の頻度を決定し(ブロック408)、その試料についてゲノム編集スペクトラムを生成する(ブロック410)。このように、ゲノム編集細胞集団の分析は、試料から分析された核酸分子におけるゲノム編集(複数可)の種類(例えば、所望の、望ましくない、またはゲノム編集なし)、位置(それぞれの意図されたゲノム遺伝子座内)および各編集事象の頻度、に関する情報を提供してもよい。任意選択的に、ゲノム編集モジュールは、ゲノム編集事象の成功率を計算することができ(ブロック412)、さらに、任意選択的に、将来のゲノム編集事象(図示せず)の成功率を増加させるための情報を提供することができる。
【0201】
次に、ゲノム編集モジュールは、データベース中の試料特有のデータセットに格納され得るゲノム編集データを提供することができる(ブロック414)。一部の実施形態では、図示されていないが、ゲノム編集データを使用して、将来の比較作業のためにデータベースに格納されるゲノム編集プロファイルを生成してもよい。ルーチン400は、次いで、ブロック416に続き、そこで終了してもよい。
【0202】
図5は、細胞集団でのゲノム編集事象から得られる意図されないゲノム遺伝子座で編集された配列を検出し、特定するためのルーチン500を示すフロー図である。ルーチン500は、
図2の計算デバイスによって呼び出すことができる。ルーチン500は、ブロック502で開始し、ゲノム編集モジュールは、
図3からのデュプレックス配列決定データ(例えば、ブロック316の後)を参照配列情報と比較し(ブロック504)、意図されないゲノム遺伝子座での配列の対応関係および/またはバリエーション(例えば、対象配列が参照配列と対応し、対象配列が参照配列と異なるなど)を特定する(ブロック506)。例えば、意図されない遺伝子座は、変異しやすい部位、マイクロサテライト遺伝子座、意図された遺伝子座と配列相同性を有する配列、および/または癌ドライバーのうちの1つ以上を含むことができ、比較ステップは、対象配列が参照配列(例えば、未編集のゲノム配列)の変化またはバリアントを含むかどうかを特定することができる。
【0203】
決定ブロック508では、ルーチン500は、対象配列が、ゲノム編集事象後の意図されない遺伝子座にバリアントを含むかどうかを決定する。意図されないゲノム遺伝子座がバリアントを含む場合、ゲノム編集モジュールは、バリアント頻度を決定する(ブロック510)。意図されないゲノム遺伝子座がバリアントを含まない場合、ゲノム編集モジュールは、追加の意図されないゲノム遺伝子座を評価することができる(決定ブロック508は、全ての意図されないゲノム遺伝子座が評価されるまで繰り返す)。任意のバリアントが任意の意図されないゲノム遺伝子座で特定される場合、ゲノム編集モジュールは、それぞれのバリアント頻度を決定し(ブロック510)、試料内のいくつかの独立したバリアントを決定する(ブロック512)。意図されないゲノム遺伝子座の対象配列が参照配列と異なっていない事例での決定ブロック508およびブロック512に続いて、ゲノム編集モジュールが試料についてゲノム編集スペクトラムを生成する場合、ルーチン500を継続してもよい(ブロック514)。このように、ゲノム編集細胞集団の分析は、この試料から分析された核酸分子において、意図されない遺伝子座でのゲノム編集(複数可)の種類(例えば、望ましくない、またはゲノム編集なし)、位置(疑われるまたは感受性の意図されないゲノム遺伝子座で)および各編集事象の頻度、に関する情報を提供してもよい。任意選択的に、ゲノム編集モジュールは、ゲノム編集事象の成功率を計算することができ(ブロック516)、さらに、任意選択的に、将来のゲノム編集事象(図示せず)の成功率を増加させるための情報を提供することができる。
【0204】
次に、ゲノム編集モジュールは、データベース中の試料特有のデータセットに格納され得るゲノム編集データを提供することができる(ブロック518)。一部の実施形態では、図示されていないが、ゲノム編集データを使用して、将来の比較作業のためにデータベースに格納されるゲノム編集プロファイルを生成してもよい。ルーチン500は、次いで、ブロック520に続き、そこで終了してもよい。
【0205】
図6は、ゲノム編集事象後の細胞集団中の細胞のクローン増殖を検出し、特定するためのルーチン600を示すフロー図である。ルーチン600は、
図2の計算デバイスによって呼び出すことができる。ルーチン600は、ブロック602で開始し、ゲノム編集モジュールは、
図3からのデュプレックス配列決定データ(ブロック604)(例えば、ブロック316の後)と、任意選択的に、
図4および
図5からのゲノム編集データ(ブロック606)(例えば、それぞれブロック414および518の後)とを受信し、細胞集団がゲノム編集されたことを確認する(ブロック608)。次に、ゲノム編集モジュールは、標的ゲノム領域(例えば遺伝子または別のゲノム領域)の配列におけるバリアントを特定する(ブロック610)。例えば、ゲノム編集モジュールは、特定の遺伝子座(例えば、癌ドライバー遺伝子、癌遺伝子、癌原遺伝子、腫瘍抑制遺伝子、他の癌ドライバーゲノム遺伝子座など)で、デュプレックス配列決定データおよび任意選択的にゲノム編集データを分析してもよい。次いで、ゲノム編集モジュールは、バリアントアレル頻度(VAF)を計算する(ブロック612)。
【0206】
決定ブロック614では、ルーチン600は、VAFが、対照群よりも試験群で高いかどうかを決定する。対照群は、一部の実施形態では、ゲノム編集事象を経ていない細胞集団(例えば、同等の細胞集団)に由来するデュプレックス配列決定データであってもよい。別の実施形態では、対照群は、参照集団の予測されるバックグラウンドVAFであってもよい。別の実施形態では、対照群は、第1の時点で細胞集団中に存在する特定のバリアントの計算されたVAFであってもよく、試験群は、後の第2の時点で同じ細胞集団中に存在する特定のバリアントの計算されたVAFであってもよい。一実施例では、第1の時点は、ゲノム編集事象の前の時点より前であってもよく、第2の時点は、ゲノム編集事象の後の時点であってもよい(例えば、ゲノム編集事象の数日後、数週間後、数ヶ月後、ゲノム編集事象の1~約30日後、ゲノム編集事象の30日後より後など)。別の実施例では、第1の時点および第2の時点は、ゲノム編集事象後の時点であり得る。試験群のVAFが対照群よりも高くない場合、遺伝子編集モジュールは、その編集された細胞集団が、クローン増殖を経る疑いが低下したものとしてラベリングする(ブロック616)。ルーチン600は、次いで、ブロック618に続き、そこで終了してもよい。VAFが、対照群よりも試験群の方が高い場合、ルーチン600は、決定ブロック620に続き、ルーチン600は、バリアントが非シングレットであるかどうかを決定する。
【0207】
バリアントがシングレットである場合、遺伝子編集モジュールは、その編集された細胞集団が、クローン増殖を経る疑いが中レベルであると特徴付ける(ブロック622)。変異が非シングレット(すなわち、マルチプレット)であると決定された場合、このルーチン600は、その編集された細胞集団が、クローン増殖を経る疑いが高いと特徴付ける(ブロック624)。任意選択的に、ゲノム編集モジュールは、標的ゲノム領域で検出されるバリアントがドライバー変異(例えば、癌増殖/転換を駆動することが既知の変異)と一致するかどうか、または可能なパッセンジャー変異と一致するかどうかを決定する(ブロック626)。
【0208】
任意選択的に、疑いが中レベルであると特徴付けられた細胞集団(ブロック622で)、または疑いが高レベルであると特徴付けられた細胞集団(ブロック624で)(例えば、細胞療法として使用される細胞集団、患者から得られた細胞集団など)について、ゲノム編集モジュールは、細胞集団について安全性閾値を評価してもよく、かつ/または腫瘍性病態もしくは癌疾患の発症に関連するリスクを決定してもよい(ブロック628)。ルーチン600は、次いで、ブロック618に続き、そこで終了してもよい。
【0209】
他のステップおよびルーチンも、本技術によって企図される。例えば、システム(例えば、ゲノム編集モジュールまたは他のモジュール)は、ゲノム編集データを分析して、細胞集団がゲノム編集されたかどうか、ゲノム編集プロセスが効率的であったかどうか、および/または成功したかどうかを決定し、ゲノム編集事象のどのような特徴が変異原性または発癌性であるのかなどを決定するように構成されていてもよい。他のステップは、ゲノム編集事象後に、特定の細胞集団の試料から導き出されたゲノム編集データに基づいて、細胞集団に由来する細胞療法を使用して、対象が予防的にまたは治療的に処置されるべきであるかどうかを決定することを含んでいてもよい。さらなるステップは、特定の対象の生体試料から導き出されたゲノム編集データに基づいて、対象が、癌に関して治療的に処置されるべきであるかどうかを決定することを含んでいてもよい。例えば、ゲノム編集された細胞集団のクローン増殖または腫瘍化の可能性が、このシステムを用いて特定されると、サーバは、次いで、その対象が、ゲノム編集された細胞集団の腫瘍化の可能性の安全閾値レベルを超えて曝露されたかどうかを決定することができる。そうであれば、次いで、予防的または抑制的な疾患治療が開始されてもよい。
【実施例】
【0210】
実験例
以下の節は、デュプレックス配列決定および関連する試薬を用いて、事象後に細胞のクローン増殖を検出し、評価するための方法の一部の限定的な実施例を提供する。
【0211】
実施例1
一実施例では、初期細胞集団は、CRISPR/Cas9エンドヌクレアーゼ系を使用して標的化ゲノム編集に供される。Cas9は、ゲノムDNAの二本鎖切断を引き起こし、一部の用途では、TP53経路(すなわち、PMID29892062、PMID29892067)を介して細胞周期停止を誘導することが示されている。ゲノム編集は、場合によっては、低い効率を有すると考えられており、例えば、胚性幹細胞では、TP53が媒介する二本鎖切断応答によって、細胞周期の停止が誘導されるためである。ゲノム編集プロセス後に停止しないこれらの細胞は、TP53(または他の癌ドライバー遺伝子)の不活性化変異または欠失もしくは喪失を有し得、それぞれ機能を破壊し、細胞増殖の制限をより少なくする。この変異を有する細胞のクローン増殖は、隣接する細胞に競り勝つであろう。この実施例では、デュプレックス配列決定を使用して、標的化二本鎖DNA分子のエラー修正コンセンサス配列リードを生成し、Cas9媒介性ゲノム編集後に、細胞集団から採取された試料についてバリアント頻度(例えば、変異アレル頻度)を決定する。標的二本鎖DNA分子は、TP53または他の癌ドライバー遺伝子の領域もしくはその一部を含むことができる。クローン増殖のための選択圧は、癌ドライバー変異についての変異体アレル頻度が、閾値レベル(例えば、ゲノムの選択不可な参照部分を超える、所定レベル、バックグラウンドレベル、相対的変異アレル頻度など)を超えるかどうかを決定することによって評価される。一部の実施形態では、標的二本鎖DNA分子は、非癌ドライバー遺伝子座も含んでいてもよい。かかる非癌ドライバー遺伝子座に存在する1つ以上のバリアントは、デュプレックス配列決定を使用して検出可能であり、定量可能である。ゲノム編集事象後のバリアント頻度(例えば、パッセンジャー変異)の増加は(例えば、第1の時点および後の第2の時点にわたる増加、バックグラウンドレベルを上回る頻度の増加など)、癌ドライバーに変異が存在している可能性があり、それによって、かかるバリアントを有する細胞のクローン選択を提供し得ることを示し得る。パッセンジャー変異は、ゲノムのいずれかまたはすべてから選択され得るが、場合によっては、好ましくは、ホモポリマー領域などの高頻度変異部位である。クローンの特定に使用され得る異なる形態の遺伝系譜マーカーは、Salk et al 2010PMID 20951806に見出され得る。
【0212】
実施例2
この実施例では、デュプレックス配列決定を使用して、癌ドライバー遺伝子における初期の変異が、試験発癌物質の腫瘍化の可能性を反映するかどうかを決定する。モデル変異誘発剤を使用して、本実施例は、デュプレックス配列決定が、集団の中で個々のDNA分子における変異を解析することができることを示す。本実施例は、本開示の方法が、細胞の集団中の細胞のかかる初期腫瘍性クローン選択、ならびにかかる細胞のその後のクローン増殖を検出するのに必要な感度を提供することを実証する。
【0213】
この実施例では、FDAに承認された癌にかかりやすいマウスモデルであるTg.rasH2 (Saitoh et al.Oncogene 1990.PMID 2202951)において、異なるマウス組織型(肺、脾臓、血液)で、ウレタンの影響を調べる。このマウスは、1つの半接合アレルでの発現を促進するために活性化エンハンサー変異を有するヒトHRASの約3個のタンデムコピーを含有する。これらのマウスは、脾臓血管肉腫および肺腺癌にかかりやすく、2年間の野生型動物試験に代えて、通常、6ヶ月の発癌性試験が使用される。マウスにおいてみられる腫瘍は、通常、ヒトHRAS癌原遺伝子の1つのコピーに活性化変異を獲得している。したがって、ヒトHRAS導入遺伝子は、これらの動物におけるモデル標的癌ドライバー遺伝子として機能する。配列分析および変異検出は、天然マウスHras、Kras、NrasおよびヒトHRAS導入遺伝子と共に、4種類の天然マウス遺伝子(Rho、Hp、Ctnnb1、Polr1c)に対して行われた。
【0214】
この実施例では、Tg.rasH2マウス(n=5/群)に、ビヒクルまたはモデル変異誘導剤(例えば、発癌性用量のウレタン)を投与し(1、3、5日目)、ならびに標的組織(肺、脾臓)および全血におけるデュプレックス配列決定による変異検出のために、29日目に安楽死させた。標的内因性遺伝子(Rho、Hp、Ctnnb1、Polr1c)および天然のマウスHrasおよびヒトHRASの(導入)遺伝子も配列決定した。
【0215】
ウレタンを投与した動物(n=5/群)から、11週目に腫瘍(脾臓血管肉腫、肺腺癌)を採取し、これらの腫瘍における特徴的な癌ドライバー変異(CDM)を識別するために、全エキソーム配列決定(WES)を行った。
【0216】
図7は、デュプレックス配列決定によって検出される、バリアントアレル画分(VAF)の初期腫瘍性クローン選択を示すグラフである。特定された変異の大部分は、単一分子で、非常に低いバリアントアレル画分(VAF)、例えば、1/10,000程度で起こった。いくつかのバリアントは、試料中の複数の分子に見出され、かなり高いVAFを有していると特定された。
【0217】
図8Aは、ヒトHRAS導入遺伝子のエクソン3に整列する一塩基バリアント(SNV)を示すグラフである。ヒトHRASのエクソン3内のコドン番号61の中心残基が、強調表示され、この部位が一般的なHRAS癌を引き起こすホットスポットであることと一致している。5つのウレタン処置された肺試料のうちの4つが、0.1%~1.8%のバリアントアレル頻度で、この変異を有していた。4つのSNVはすべて、CTGのコンテキストでT→Aの塩基転換である。これに加え、2つの処置された脾臓試料は、このコドンに変異を有していた。一方は、これと同じ位置にあり、もう一方は、隣接する塩基対にあった。処置された肺試料の4/5が、29日目までにクローン増殖の病原性変異を有し、一方で、このパネルの他箇所では非常に少ない変異が観察されたことは(>1メンバークローンとして、または複数の試料では繰り返しがみられた)、曝露の直後の実質的な正の選択の有力な証拠を示す。さらに、本技術の実施形態に従って、デュプレックス配列決定方法は、かかる初期腫瘍性クローン選択を検出するのに必要な感度を提供する。
【表1】
【0218】
表1を参照すると、変異の97.5%は、単一分子のみで特定され、1%は、2つの分子でみられ、約0.5%は、2つより多い分子でみられた。4種類の最高レベルのクローンは全て、ヒトHRASにおける再発腫瘍ホットスポットであるAA61において発癌性変異を生じていた。この最高レベルのクローンも、癌ホットスポットで現れ、このことは、強力な選択圧の大きさをさらに強調するものであった。
【0219】
試料あたり、配列決定された二重鎖分子に変換されたものよりも、はるかに多量のDNAが抽出された。抽出された組織試料の部分から、およそ5μgのゲノムDNAが得られた。これをゲノム当量に変換し、3を掛け、この抽出においてtg.HRASコピーの数を得る。このうち約1/3%のみが配列決定され、そのため、検出された組織よりも約300倍多い変異体が、サンプリングされた組織の元の部分に存在していた。
【表2】
【0220】
この実施例では、選択されたクローンは、最高アレル画分クローンにおいて、90,000個を超える細胞を包含していた。その結果、計算によって、試験の29日以内に(例えば、変異曝露の時から)、細胞死がないと仮定すると、これらの細胞の倍増時間は、おおむね1.8日ごとであり、2の(29/1.8)乗から約90,000であった。理論によって束縛されないが、この計算された細胞倍増速度は、これらの選択された変異を短時間(例えば、最短で2週間)で検出する可能性が高いことを示唆する。
【0221】
この実施例の実験的な分析のこの結果は、デュプレックス配列決定が、非常に強力に、厳密に再現的な信頼区間で、変異の誘発を定量することを示す。さらに、二重鎖配列は、変異誘発の程度における組織特異的バリエーションを解析することができ、肺は、脾臓および血液よりも変異しやすいことが観察される。ウレタン曝露の単純な変異スペクトラムは、綺麗であり、バイアスのないクラスタリングは、群間を区別することができる。ウレタンのトリプレット変異スペクトラムは、「NTG」のコンテキスト内のT→AおよびT→Cの変異に対する強い傾向を示し、変異スペクトラムは、ビヒクル対照から区別可能である。
【0222】
これに加え、末梢血における変異誘発は、脾臓でみられた変異誘発と非常に似ており、末梢血の生前サンプリングが、いくつかの変異原について、検死(または生検)の代替となる可能性があることを示唆する。さらに、この実施例は、デュプレックス配列決定を使用すると、従来の研究で検出され得る(例えば、げっ歯類の腫瘍発症)よりもさらに早い時点で(例えば、29日目)、ヒトHRAS導入遺伝子において発癌性変異が選択されるという明確な証拠を提供した。したがって、本実施例は、標的癌ドライバー遺伝子(または他の癌ドライバー遺伝子座)での変異のスペクトラムを分析することは、既知のモデル変異原の影響を正確に反映し得ることを実証する。したがって、デュプレックス配列決定は、将来の癌リスクのバイオマーカーとして初期の癌ドライバー変異を評価することに関して、初期の正確なデータを提供することができる。異種混入は、きわめて低いレベルを維持していたが、外来種混入の除去は、自動的に信頼的に行われた。
【0223】
図8Bは、Tg.RasH2マウスモデル(
図8Aに示す)におけるヒト導入遺伝子の遺伝子座を含むRasファミリー遺伝子から捕捉されたエクソンについて、ゲノム区間にわたってプロットされた一塩基バリアント(SNV)を示す。シングレットは、単一分子内に見出される変異である。マルチプレットは、同じサンプラー内の複数の分子内で識別される同一の変異であり、クローン増殖事象を表す場合がある。各々の点の高さは、各SNVのバリアントアレル頻度(VAF)に対応し、この点の大きさは、マルチプレットの観察のみに対応している。COSMICにおけるRasファミリーのヒト癌変異ホットスポットの位置および相対的な頻度は、各遺伝子の下に示される。T>A塩基転換のクラスターが、ヒト発癌性HRASコドン61のホットスポットにおいて、ウレタン処置された肺試料の4/5で、ウレタン処置された脾臓試料の1/5で、観察された。十分に確立された癌ドライバーにおける高いVAFマルチプレットとして、独立した試料で同一の変異が観察されることは、正の選択の有力な指標である。特に、これらのクローンは、コンテキストNTGにおいて塩基転換T>Aを有し、これはウレタン変異誘発の特徴である。
【0224】
本実施例は、選択圧下にある潜在的な変異を有する細胞のクローン増殖を迅速に検出し、評価するための方法を記載する一方で、バリアントアレル頻度、変異の種類(複数可)のスペクトラムおよびゲノムコンテキストデータに関する詳細な情報を提供する。例えば、一部の実施形態では、本技術は、ゲノム編集事象後に、細胞集団からDNAを抽出することを含む方法のステップを含む。DNAは、ゲノム編集事象後の様々な時点で抽出することができる。例えば、DNAは、事象の数日後、数週間後、または数か月後に抽出することができる。一部の実施形態では、DNAは、事象後30日以内に、細胞集団から抽出することができる。DNA抽出後、DNAライブラリを調製してもよい。一実施形態では、抽出されたゲノムDNAは、複数の二本鎖DNA断片に断片化されてもよく、各二本鎖DNA断片は、1つ以上の所望のアダプター分子(例えば、
図1Aに示されるアダプター分子)にライゲーションされてもよい。
【0225】
DNAライブラリ調製後、二本鎖アダプター-DNA複合体を増幅し、デュプレックス配列決定方法のステップを用いて配列決定して、詳細な変異の位置および頻度を提供する(例えば、百万分の1未満の選択媒介性変異を解析する)直接的で高精度なDNA配列決定リードをもたらすことができる。さらに、デュプレックス配列決定分析によって、任意の生物からの任意の組織における任意の遺伝子座でのゲノムバリアントを、感度よく検出することができる。
さらなる実施例
1.意図されたゲノム遺伝子座を対象とする操作されたゲノム編集事象後に細胞の集団を特徴付ける方法であって、当該方法は、
(a)操作されたゲノム編集事象後に、細胞の集団に由来する二本鎖DNA分子を含む試料を提供することと、
(b)複数の二本鎖DNA分子の各々についてエラー修正配列リードを生成することであって、
複数の二本鎖DNA分子にアダプター分子をライゲーションして、複数のアダプター-DNA分子を生成すること、
アダプター-DNA分子の元の第1の鎖のコピーのセット、およびアダプター-DNA分子の元の第2の鎖のコピーのセットを生成すること、
元の第1の鎖および第2の鎖の1つ以上のコピーを配列決定して、第1の鎖の配列および第2の鎖の配列を提供すること、
第1の鎖の配列と第2の鎖の配列とを比較して、第1の鎖の配列と第2の鎖の配列との間の1つ以上の対応関係を特定すること、を含む、エラー修正配列リードを生成することと、
(c)意図されたゲノム遺伝子座の配列を含む1つ以上のエラー修正配列リードを、予測されるゲノム編集されたDNA配列と比較することと、
(d)意図されないゲノム遺伝子座の配列を含む1つ以上のエラー修正配列リードを、参照ゲノムDNA配列と比較することと、を含む、方法。
2.方法が、ステップ(c)およびステップ(d)の両方を含む、事例1に記載の方法。
3.複数の二本鎖DNA分子の各々についてエラー修正配列リードを生成することが、配列決定の前に、1つ以上の標的ゲノム領域を選択的に富化して、複数の富化されたアダプター-DNA分子を提供することをさらに含む、事例1または事例2に記載の方法。
4.1つ以上の標的ゲノム領域が、ゲノム中に意図されたゲノム遺伝子座を含む、事例4に記載の方法。
5.1つ以上の標的ゲノム領域が、ゲノム中に少なくとも1つの意図されないゲノム遺伝子座を含む、事例4に記載の方法。
6.二本鎖DNA分子の中の1つ以上のバリアントを特定することをさらに含む、事例1~5のいずれか1つに記載の方法。
7.1つ以上のバリアントが、意図されたゲノム遺伝子座の配列中に不適切な変異を含む、事例6に記載の方法。
8.ゲノム編集のための意図されたゲノム遺伝子座の配列中の不適切な変異が、非相同末端結合(NHEJ)事象に起因する、事例7に記載の方法。
9.1つ以上のバリアントが、意図されないゲノム遺伝子座の配列を含む1つ以上のエラー修正配列リードにおいて特定される、事例6に記載の方法。
10.1つ以上のバリアントが、機能上破壊的な変異を含む、事例6~9のいずれか1つに記載の方法。
11.(e)複数の二本鎖DNA分子の中の1つ以上のバリアントの頻度を決定することをさらに含む、事例6または事例9に記載の方法。
12.意図されたゲノム遺伝子座の配列を含む1つ以上のエラー修正配列リードが、予測されるゲノム編集DNA配列を含むかどうかを決定することをさらに含む、事例1~11のいずれか1つに記載の方法。
13.意図されたゲノム遺伝子座の配列を含むエラー修正配列リードの中で、予測されるゲノム編集DNA配列の頻度を決定することをさらに含む、事例12に記載の方法。
14.意図されたゲノム遺伝子座の配列を含むエラー修正配列リードの中で、望ましくないDNA配列の頻度を決定することをさらに含む、事例12に記載の方法。
15.意図されないゲノム遺伝子座の配列を含む1つ以上のエラー修正配列リードが、バリアントを含むかどうかを決定することをさらに含む、事例1~14のいずれか1つに記載の方法。
16.操作されたゲノム編集事象が、複数の意図されたゲノム遺伝子座を対象とする、事例1~15のいずれか1つに記載の方法。
17.ステップ(d)が、複数の意図されないゲノム遺伝子座の配列を含むエラー修正配列リードを、参照ゲノムDNA配列と比較することを含む、事例1~16のいずれか1つに記載の方法。
18.意図されないゲノム遺伝子座が、変異しやすい部位、マイクロサテライト遺伝子座、意図されたゲノム遺伝子座と配列相同性を有する配列、および/または癌ドライバーのうちの1つ以上を含む、事例17に記載の方法。
19.意図されないゲノム遺伝子座が、意図されたゲノム遺伝子座の配列と少なくとも部分的に類似する核酸配列を有する、事例1~18のいずれか1つに記載の方法。
20.意図されないゲノム遺伝子座が、腫瘍抑制遺伝子、癌遺伝子、癌原遺伝子、および/または癌ドライバーの配列を含む、事例1~19のいずれか1つに記載の方法。
21.細胞の集団における操作されたゲノム編集事象の効率を特徴付けるための方法であって、操作されたゲノム編集事象が、意図されたゲノム遺伝子座を標的とし、当該方法が、
(a)ゲノム編集事象後に、細胞の集団に由来する複数の二本鎖DNA分子を含む試料から配列決定ライブラリを調製することであって、配列ライブラリを調製することが、複数の二本鎖DNA分子に非対称アダプター分子をライゲーションして、複数のアダプター-DNA分子を生成することを含む、配列決定ライブラリを調製することと、
(b)アダプター-DNA分子の第1の鎖および第2の鎖を配列決定して、少なくとも一部のアダプター-DNA分子について第1の鎖の配列リードおよび第2の鎖の配列リードを提供することと、
(c)各配列決定されたアダプター-DNA分子について、第1の鎖の配列リードと第2の鎖の配列リードとを比較して、第1の鎖の配列リードと第2の鎖の配列リードとの間の1つ以上の対応関係を特定することと、
(d)意図されたゲノム遺伝子座を含む複数の二本鎖DNA分子の中の意図されたゲノム遺伝子座において、予測されるゲノム配列の頻度を決定することであって、
第1の鎖の配列リードと第2の鎖の配列リードとの間の1つ以上の対応関係を分析すること、
対応関係を予測されるゲノム配列と比較することにより、予測されるゲノム配列の頻度を決定することと、を含む、方法。
22.配列決定の前に1つ以上の標的ゲノム領域を選択的に富化して、複数の富化されたアダプター-DNA分子を提供することをさらに含む、事例21に記載の方法。
23.1つ以上の標的ゲノム領域が、ゲノム中に意図されたゲノム遺伝子座を含む、事例22に記載の方法。
24.1つ以上の標的ゲノム領域が、ゲノム中に少なくとも1つの意図されないゲノム遺伝子座を含む、事例22に記載の方法。
25.1つ以上の意図されないゲノム遺伝子座からの配列を含む二本鎖DNA分子に由来する第1の鎖の配列リードと第2の鎖の配列リードとの間の1つ以上の対応関係を分析すること、および
対応関係を参照ゲノム配列と比較することによって、意図されないゲノム遺伝子座において1つ以上のバリアントを特定することと、
1つ以上の意図されないゲノム遺伝子座を含む複数の二本鎖DNA分子の中の1つ以上のバリアントのバリアント頻度を決定することとをさらに含む、事例21~24のいずれか1つに記載の方法。
26.対応関係を予測されるゲノム配列と比較することが、ゲノム編集のために意図された遺伝子座の配列中の不適切な変異を特定することを含む、事例21~25のいずれか1つに記載の方法。
27.対応関係を予測されるゲノム配列と比較することが、変化していない配列を特定することを含む、事例21~25のいずれか1つに記載の方法。
28.ゲノム編集細胞集団から抽出された標的二本鎖核酸分子の集団の高精度配列決定リードを生成する方法であって、当該方法が、
(a)細胞集団から抽出された1つ以上の標的二本鎖核酸分子をデュプレックス配列決定することと、
(b)標的二本鎖DNA分子について高精度のコンセンサス配列を生成することと、を含み、
標的二本鎖核酸分子が、DNAの意図されたゲノム編集領域と、DNAの1つ以上の意図されないゲノム領域とを含む、方法。
29.DNAの意図されないゲノム領域が、DNAの意図されたゲノム編集領域と少なくとも部分的に類似する核酸配列を有する、事例28に記載の方法。
30.DNAの意図されたゲノム編集領域にマッピングする高精度コンセンサス配列を、予測されるゲノム編集DNA配列と比較することをさらに含み、意図されたゲノム編集領域にマッピングする1つ以上の高精度コンセンサス配列が、予測されるゲノム編集DNA配列と実質的に同一である場合、標的ゲノム編集プロセスが成功したと見なされる、事例28または事例29に記載の方法。
31.意図されたゲノム編集領域にマッピングする高精度コンセンサス配列の大部分が、予測されるゲノム編集DNA配列と実質的に同一である場合、標的ゲノム編集プロセスが成功したと見なされる、事例30に記載の方法。
32.意図されないゲノム領域にマッピングする高精度コンセンサス配列を、ゲノム編集事象を経ていない細胞に由来する参照ゲノム配列と比較することをさらに含み、意図されないゲノム領域にマッピングする高精度コンセンサス配列が、参照ゲノム配列と実質的に同一である場合、標的ゲノム編集プロセスが成功したと見なされる、事例28~31のいずれか1つに記載の方法。
33.操作された標的ゲノム編集事象を使用して、意図された遺伝子座でDNAが成功裏にゲノム編集されたかどうかを決定するための方法であって、当該方法が、
a)操作された標的ゲノム編集事象後に、試料から抽出された複数の二本鎖DNA分子についてデュプレックスエラー修正配列決定リードを提供することと、
b)参照ゲノムの1つ以上の遺伝子座のセット中の各遺伝子座について、二重鎖エラー修正配列決定リードが予測される配列と実質的に同一の配列を有する二本鎖DNA分子を定量することと、を含む、方法。
34.参照ゲノムの1つ以上の遺伝子座のセットが、意図された遺伝子座を含み、予測される配列が、予測されるゲノム編集DNA配列を含む、事例33に記載の方法。
35.参照ゲノムの1つ以上の遺伝子座のセットが、意図されない遺伝子座を含み、予測される配列が、ゲノム編集事象を経ていない細胞に由来するゲノム配列を含む、事例33または事例34に記載の方法。
36.意図されない遺伝子座が、変異しやすい部位、マイクロサテライト遺伝子座、意図された遺伝子座と配列相同性を有する配列、および/または癌ドライバーを含む、事例35に記載の方法。
37.操作されたゲノム編集事象後に、細胞集団の腫瘍化の可能性を評価する方法であって、
(a)操作されたゲノム編集事象後に細胞集団に由来する二本鎖DNA分子を含む試料から配列決定ライブラリを調製することであって、配列ライブラリを調製することが、複数の二本鎖DNA分子をタグ付けして、第1のタグ付け鎖および第2のタグ付け鎖を有する複数のタグ付けDNA分子を生成することを含む、配列決定ライブラリを調製することと、
(b)1つ以上の癌ドライバーにマッピングするタグ付けDNA分子のサブセットについて第1のタグ付け鎖および第2のタグ付け鎖を選択的に富化して、富化されたタグ付けDNA分子を提供することと、
(c)複数の富化されたタグ付けDNA分子の各々についてエラー修正配列リードを生成することであって、エラー修正配列リードを生成することが、
富化されたタグ付けDNA分子に由来する1つ以上の第1のタグ付け鎖および第2のタグ付け鎖を配列決定して、第1の鎖の配列および第2の鎖の配列を提供すること、
第1の鎖の配列と第2の鎖の配列とを比較して、第1の鎖の配列と第2の鎖の配列との間の1つ以上の対応関係を特定すること、を含む、エラー修正配列リードを生成することと、
(d)1つ以上の対応関係を参照ゲノム配列と比較することによって、複数の富化されたタグ付けDNA分子の中の1つ以上の癌ドライバーにバリアントが存在するかどうかを決定することと、を含む、方法。
38.1つ以上のバリアントが、機能上破壊的な変異を含む、事例37に記載の方法。
39.1つ以上の癌ドライバーが、ABL、ACC、BCR、BLCA、BRCA、CESC、CHOL、COAD、DLBC、DNMT3A、EGFR、ESCA、GBM、HNSC、KICH、KIRC、KIRP、LAML、LGG、LIHC、LUAD、LUSC、MESO、OV、PAAD、PCPG、PI3K、PIK3CA、PRAD、PTEN、READ、SARC、SKCM、STAD、TGCT、THCA、THYM、UCEC、UCS、および/またはUVMであるか、またはこれらを含む、事例37または事例38に記載の方法。
40.癌ドライバーが、TP53であるか、またはTP53を含む、事例37または事例38に記載の方法。
41.癌ドライバーが、HRAS、NRAS、もしくはKRASであるか、またはそれを含む、事例37または事例38に記載の方法。
42.複数の富化されたタグ付けDNA分子の中の1つ以上の癌ドライバーにバリアントが存在する場合、当該方法が、(e)複数の富化されたタグ付けDNA分子の中のバリアントのバリアント頻度を決定することをさらに含む、事例37~41のいずれか1つに記載の方法。
43.当該方法のステップ(a)~(e)が、事象後の第1の時点で、および事象後の第2の時点で行われ、第2の時点が、第1の時点の後であり、第1の時点からのバリアント頻度が、第2の時点からのバリアント頻度と比較される、事例42に記載の方法。
44.第2の時点が、第1の時点の2~90日後である、事例43に記載の方法。
45.第1の時点および第2の時点の両方が、操作されたゲノム編集事象後の約30日以内、約45日以内、約60日以内、約75日以内、または約90日以内である、事例43に記載の方法。
46.第2の時点からのバリアント頻度が、第1の時点からのバリアント頻度よりも大きい場合、細胞集団が、腫瘍化の可能性を有すると決定される、事例43~45のいずれか1つに記載の方法。
47.当該方法のステップ(a)~(e)が、操作されたゲノム編集事象後約30日以内に行われ、バリアント頻度が、操作されたゲノム編集事象を経ていない同等の細胞集団から決定された事象前のバリアント頻度と比較される、事例42に記載の方法。
48.操作されたゲノム編集事象後に、細胞集団中の細胞のクローン増殖を検出し、かつ/または定量するための方法であって、
(a)操作されたゲノム編集事象後に、細胞集団に由来する1つ以上の標的二本鎖DNA分子をデュプレックス配列決定することと、
(b)標的二本鎖DNA分子の中の1つ以上のバリアントを特定することと、
(c)細胞集団に由来する標的二本鎖DNA分子の中の1つ以上のバリアントのバリアント頻度を決定することと、
(d)1つ以上のバリアントの各々についてのバリアント頻度を、予測されるバリアント頻度と比較することと、を含む、方法。
49.デュプレックス配列決定のステップが、
(i)操作されたゲノム編集事象後に、細胞集団に由来する二本鎖DNA分子から配列決定ライブラリを調製することであって、配列ライブラリを調製することが、複数の二本鎖DNA断片にアダプター分子をライゲーションして、複数のアダプター-DNA分子を生成することを含む、配列決定ライブラリを調製することと、
(ii)アダプター-DNA分子の第1の鎖および第2の鎖を配列決定して、各アダプター-DNA分子について第1の鎖の配列リードおよび第2の鎖の配列リードを提供することと、
(iii)各アダプター-DNA分子について、第1の鎖の配列リードと第2の鎖の配列リードとを比較して、第1の鎖の配列リードと第2の鎖の配列リードとの間の1つ以上の対応関係を特定することと、を含む、事例48に記載の方法。
50.1つ以上のバリアントのバリアント頻度が、目的のゲノム遺伝子座にマッピングするデュプレックス配列決定された標的二本鎖DNA分子の総数あたりの、目的のゲノム遺伝子座にマッピングする特定のバリアントを有するデュプレックス配列決定された標的二本鎖DNA分子の数を計算することによって決定される、事例48または事例49に記載の方法。
51.1つ以上のバリアントのバリアント頻度が、閾値バリアント頻度を上回る、事例48~50のいずれか1つに記載の方法。
52.1つ以上のバリアントが、参照細胞集団由来の配列に対して特定される、事例48~51のいずれか1つに記載の方法。
53.当該方法のステップ(a)~(c)が、事象後の第1の時点で、および事象後の第2の時点で行われ、第2の時点が、第1の時点の後であり、第1の時点からのバリアント頻度が、予測されるバリアント頻度である、事例48~52のいずれか1つに記載の方法。
54.第2の時点が、第1の時点の2~90日後である、事例53に記載の方法。
55.第1の時点および第2の時点の両方が、操作されたゲノム編集事象後の約30日以内、約45日以内、約60日以内、約75日以内、または約90日以内である、事例53に記載の方法。
56.第2の時点からのバリアント頻度が、第1の時点からのバリアント頻度よりも大きい場合、細胞集団で細胞のクローン増殖が発生したと決定される、事例53~55のいずれか1つに記載の方法。
57.バリアント頻度が、予測されるバリアント頻度よりも大きい場合、細胞集団で細胞のクローン増殖が発生したと決定される、事例48~56のいずれか1つに記載の方法。
58.細胞のクローン増殖が、異常な細胞増殖状態、癌様状態、前癌状態、またはフィールド効果を示す、事例56または事例57に記載の方法。
59.予測されるバリアント頻度が、操作されたゲノム編集事象を経ていない同等の細胞集団から決定される、事例48に記載の方法。
60.1つ以上のバリアントが、ゲノム編集のための意図された遺伝子座の外側の1つ以上の位置にある、事例48~59のいずれか1つに記載の方法。
61.1つ以上のバリアントが、腫瘍抑制遺伝子、癌遺伝子、癌原遺伝子、および/または癌ドライバーの配列にある、事例48~60のいずれか1つに記載の方法。
62.1つ以上のバリアントが、機能上破壊的な変異を含む、事例48~61のいずれか1つに記載の方法。
63.少なくとも1つのバリアントが、TP53にある、事例48~62のいずれか1つに記載の方法。
64.少なくとも1つのバリアントが、HRAS、NRAS、またはKRASにある、事例47~63のいずれか1つに記載の方法。
65.少なくとも1つのバリアントが、パッセンジャー変異である、事例48~64のいずれか1つに記載の方法。
66.少なくとも1つのバリアントが、非癌ドライバーバリアントである、事例48~65のいずれか1つに記載の方法。
67.細胞の集団または細胞集団が、多能性幹細胞、胚性幹細胞、免疫細胞、もしくは植物細胞であるか、またはこれらを含む、事例1~66のいずれか1つに記載の方法。
68.細胞の集団または細胞集団が、ヒト患者に由来する、事例1~67のいずれか1つに記載の方法。
69.ヒト患者から得られる二本鎖DNA分子が、組織、循環細胞、血漿中の無細胞DNA、他の体液中の無細胞DNA、エクソソームDNA、組織から脱離した細胞、および/または生検、から得られる、事例68に記載の方法。
70.細胞の集団または細胞集団が、細胞培養で増殖する、事例1~68のいずれか1つに記載の方法。
71.細胞の集団または細胞集団が、ヒトまたは動物対象に由来する、事例1~68および70のいずれか1つに記載の方法。
72.細胞の集団または細胞集団が、異種移植片に由来する、事例1~71のいずれか1つに記載の方法。
73.操作されたゲノム編集事象が、標的化エンドヌクレアーゼ媒介性編集事象である、事例1~72のいずれか1つに記載の方法。
74.操作されたゲノム編集事象が、Cas9媒介性編集事象である、事例1~73のいずれか1つに記載の方法。
75.操作されたゲノム編集事象が、CPF1媒介性編集事象である、事例1~73のいずれか1つに記載の方法。
76.操作されたゲノム編集事象が、修飾されたCASまたはCPF-1媒介性事象である、事例1~73のいずれか1つに記載の方法。
77.操作されたゲノム編集事象が、TALON、MEGATAL、ジンクフィンガーヌクレアーゼ、ホーミングエンドヌクレアーゼ、または制限エンドヌクレアーゼによって実施される、事例1~73のいずれか1つに記載の方法。
78.操作されたゲノム編集事象が、ポリヌクレオチド基質媒介性の相同組換え事象である、事例1~73のいずれか1つに記載の方法。
79.操作されたゲノム編集事象が、レトロウイルスまたは別のウイルスによって実施される、事例1~73のいずれか1つに記載の方法。
80.操作されたゲノム編集事象が、DNA切断、DNA付加、DNA酸化的損傷の部位、DNAニック、またはDNA脱アミノ化のうちの1つ以上を導入する、事例1~73のいずれか1つに記載の方法。
81.細胞の集団または細胞集団が、CRISPR/Cas9システムを使用して編集された、事例1~72のいずれか1つに記載の方法。
82.1つ以上のバリアントのバリアント頻度が、操作されたゲノム編集事象を経ていない細胞の参照集団から抽出された二本鎖DNA分子の参照集団のバックグラウンドバリアント頻度よりも大きい、事例11、25、42、および48のいずれか1つに記載の方法。
83.操作されたゲノム編集事象が、細胞の集団または細胞集団中の細胞のサブセットの死または損傷をもたらす、事例1~82のいずれか1つに記載の方法。
84.細胞の集団または細胞集団中の細胞のサブセットが、1つ以上の既存の遺伝的変異を有し、操作されたゲノム編集事象後、細胞のサブセットが、細胞の集団または細胞集団中の他の細胞よりも速い速度で選択的に増殖する、事例1~82のいずれか1つに記載の方法。
85.細胞の集団または細胞集団中の細胞のサブセットが、当該細胞に固有の既存のエピジェネティック状態を有し、操作されたゲノム編集事象後、細胞のサブセットが、細胞の集団または細胞集団中の他の細胞よりも速い速度で選択的に増殖する、事例1~82のいずれか1つに記載の方法。
86.操作されたゲノム編集事象が、DNAに変異を引き起こす、事例1~85のいずれか1つに記載の方法。
87.操作されたゲノム編集事象が、ゲノムDNAにおける変異を修復する、事例1~86のいずれか1つに記載の方法。
88.操作されたゲノム編集事象後に、細胞集団の腫瘍化の可能性をモニタリングするための方法であって、
(a)第1の時点での操作されたゲノム編集事象後に、細胞集団に由来する1つ以上の標的二本鎖DNA分子をデュプレックス配列決定することと、
(b)標的二本鎖DNA分子の中の1つ以上のバリアントを特定することと、
(c)第1の時点での細胞集団に由来する標的二本鎖DNA分子の中の1つ以上のバリアントのバリアント頻度を決定することと、
(d)第2の時点での操作されたゲノム編集事象後に、細胞集団に由来する1つ以上の標的二本鎖DNA分子をデュプレックス配列決定することと、
(e)第2の時点での細胞集団に由来する標的二本鎖DNA分子の中の同じ1つ以上のバリアントのバリアント頻度を決定することと、
(f)第1の時点からの1つ以上のバリアントの各々についてのバリアント頻度を、第2の時点からの1つ以上のバリアントの各々についてのバリアント頻度と比較することと、を含む、方法。
89.デュプレックス配列決定のステップが、各々、
(i)細胞集団に由来する二本鎖DNA分子から配列決定ライブラリを調製することであって、配列ライブラリを調製することが、複数の二本鎖DNA断片にアダプター分子をライゲーションして、複数のアダプター-DNA分子を生成することを含む、配列決定ライブラリを調製することと、
(ii)アダプター-DNA分子の第1の鎖および第2の鎖を配列決定して、各アダプター-DNA分子について第1の鎖の配列リードおよび第2の鎖の配列リードを提供することと、
(iii)各アダプター-DNA分子について、第1の鎖の配列リードと第2の鎖の配列リードとを比較して、第1の鎖の配列リードと第2の鎖の配列リードとの間の1つ以上の対応関係を特定することと、を含む、事例88に記載の方法。
90.ゲノム編集された細胞の集団が、ゲノム編集された免疫細胞であるか、またはそれを含む、事例88または事例89に記載の方法。
91.ゲノム編集された細胞の集団が、第1の時点と第2の時点との間に対象に投与される、事例88~90のいずれか1つに記載の方法。
92.第2の時点からのバリアント頻度が、第1の時点からのバリアント頻度よりも大きい場合、細胞集団で細胞のクローン増殖が発生したと決定される、事例91に記載の方法。
93.1つ以上のバリアントが、腫瘍抑制遺伝子、癌遺伝子、癌原遺伝子、および/または癌ドライバーの配列にある、事例92に記載の方法。
94.1つ以上のバリアントが、機能上破壊的な変異を含む、事例92に記載の方法。
95.少なくとも1つのバリアントが、TP53にある、事例92~94のいずれか1つに記載の方法。
96.少なくとも1つのバリアントが、HRAS、NRAS、またはKRASにある、事例92~95のいずれか1つに記載の方法。
97.少なくとも1つのバリアントが、パッセンジャー変異である、事例92~96のいずれか1つに記載の方法。
98.少なくとも1つのバリアントが、非癌ドライバーバリアントである、事例92~97のいずれか1つに記載の方法。
99.操作されたゲノム編集事象後に、細胞の集団を特徴付けるための、二本鎖ポリヌクレオチドのエラー修正デュプレックス配列決定に使用され得るキットであって、当該キットは、
ポリメラーゼ連鎖反応(PCR)プライマーの少なくとも1つのセットおよびアダプター分子の少なくとも1つのセットであって、エラー修正デュプレックス配列決定実験で使用することができる、プライマーおよびアダプター分子と、
細胞の集団に由来する試料から抽出されたDNAのエラー修正デュプレックス配列決定を実施する際のキットの使用方法についての説明書であって、
意図されたゲノム遺伝子座における予測されるゲノム配列、
意図されないゲノム遺伝子座におけるバリアント、
癌ドライバーにおける変異、および
1つ以上のバリアントのバリアント頻度、のうちの1つ以上を特定するための説明書と、を含む、キット。
100.試薬が、DNA修復酵素を含む、事例99に記載のキット。
101.アダプター分子のセット中の各々のアダプター分子が、少なくとも1つの単一分子識別子(SMI)配列および少なくとも1つの鎖定義要素を含む、事例99に記載のキット。
102.コンピュータ上で実行されると、試料中の1つ以上の二本鎖DNA分子について、エラー修正デュプレックス配列決定リードを決定するステップと、エラー修正デュプレックス配列決定リードを使用して、ゲノム編集事象後の、意図されたゲノム遺伝子座の配列、1つ以上の意図されないゲノム遺伝子座の配列、バリアント、バリアント頻度、および/またはゲノム編集スペクトラムを決定するステップとを行う、非一時的コンピュータ可読媒体で具現化されたコンピュータプログラム製品をさらに含む、事例99に記載のキット。
103.操作されたゲノム編集事象後に細胞の集団を特徴付ける、および/または細胞の集団内の細胞のクローン増殖を検出するためのシステムであって、
配列決定データおよびゲノム編集データに関連する情報を送信するためのコンピュータネットワークであって、情報が、生の配列決定データ、デュプレックス配列決定データ、試料情報、およびゲノム編集情報、のうちの1つ以上を含む、コンピュータネットワークと、
1つ以上のユーザ計算デバイスと関連付けられ、かつコンピュータネットワークと通信するクライアントコンピュータと、
複数のゲノム編集プロファイルおよびユーザ結果の記録を格納するために、コンピュータネットワークに接続されたデータベースと、
コンピュータネットワークと通信し、かつデュプレックス配列決定データを生成するためにクライアントコンピュータから、生の配列決定データおよび要求を受信し、元の二本鎖核酸分子を表すファミリーからの配列リードをグループ化し、個々の鎖からの代表的な配列を互いに比較して、デュプレックス配列決定データを生成するように構成された、デュプレックス配列決定モジュールと、
コンピュータネットワークと通信し、かつデュプレックス配列決定データを参照配列情報と比較して、バリアントを特定し、意図されたおよび/または意図されないゲノム遺伝子座に少なくとも1つのゲノム変化を含むゲノム編集データを生成するように構成された、ゲノム編集モジュールと、を含む、システム。
104.ゲノム編集プロファイルが、1つ以上の意図されたゲノム遺伝子座からの配列情報を含む、事例103に記載のシステム。
105.ゲノム編集プロファイルが、1つ以上の意図されないゲノム遺伝子座からの配列情報を含む、事例103に記載のシステム。
106.ゲノム編集プロファイルが、細胞の集団のゲノムにおける1つ以上のバリアントのバリアント頻度を含む、事例103に記載のシステム。
107.1つ以上のプロセッサによって実行されると、操作されたゲノム編集事象後に細胞の集団を特徴付けるために、および/または細胞の集団内の細胞のクローン増殖を検出するために、事例1~98のいずれか1つに記載の方法を行う命令を含む、非一時的コンピュータ可読記録媒体。
108.操作されたゲノム編集事象後に細胞の集団を特徴付けるために、および/または細胞の集団内の細胞のクローン増殖を検出するために、事例1~98のいずれか1つに記載の方法を行うためのコンピュータシステムであって、当該システムが、プロセッサ、メモリ、データベース、およびプロセッサのための命令を含む非一時的コンピュータ可読記憶媒体を備える少なくとも1つのコンピュータを含み、当該プロセッサが、事例1~98のいずれか1つに記載の方法を含む操作を行うために当該命令を実行するように構成されている、コンピュータシステム。
109.
a.有線または無線のネットワークと、
b.試料のポリヌクレオチド配列を抽出し、増幅し、生成するための試薬を含むキットの使用に由来するデータを受信し、ネットワークを介してポリヌクレオチド配列をリモートサーバに送信することが可能な、複数のユーザ電子計算デバイスと、
c.プロセッサ、メモリ、データベース、およびプロセッサのための命令を含む非一時的コンピュータ可読記憶媒体を備えるリモートサーバであって、当該プロセッサが、事例1~98のいずれか1つに記載の方法を含む操作を行うために当該命令を実行するように構成されている、リモートサーバと、を含み、
d.当該リモートサーバが、ゲノム編集事象から得られるバリアントおよび/またはクローン増殖事象を検出し、特定することが可能である、ネットワークコンピュータシステムをさらに含む、事例108に記載のシステム。
110.データベースおよび/またはネットワークを介してアクセス可能な第三者データベースが、1つ以上の時点で、細胞の集団のゲノム編集プロファイル、参照配列、予測されるゲノム編集配列、およびバリアント頻度のうちの1つ以上を含む複数の記録をさらに含む、事例109に記載のシステム。
111.非一時的コンピュータ可読媒体であって、そのコンテンツが、少なくとも1つのコンピュータに、ゲノム編集された細胞集団からの試料中の二本鎖核酸分子についてのデュプレックス配列決定データを提供するための方法を行わせ、当該方法が、
ユーザ計算デバイスから生の配列データを受信することと、
試料中の複数の核酸分子に由来する複数の生の配列リードを含む試料特有のデータセットを作成することと、
元の二本鎖核酸分子を表すファミリーからの配列リードをグループ化することであって、グループ化が、共有される単一分子識別子配列に基づく、グループ化することと、
元の二本鎖核酸分子からの第1の鎖の配列リードと第2の鎖の配列リードとを比較して、第1の鎖の配列リードと第2の鎖の配列リードとの間の1つ以上の対応関係を特定することと、
試料中の二本鎖核酸分子についてのデュプレックス配列決定データを提供することと、を含む、非一時的コンピュータ可読媒体。
112.比較された第1の配列リードと第2の配列リードとの間の非相補のヌクレオチド位置を特定することをさらに含み、当該方法が、非相補の位置において、プロセスエラーを特定すること、除外すること、または考慮しないこと、をさらに含む、事例111に記載のコンピュータ可読媒体。
113.非一時的コンピュータ可読媒体であって、そのコンテンツが、少なくとも1つのコンピュータに、細胞集団でのゲノム編集事象から得られる意図されたゲノム遺伝子座において編集された配列を検出し、特定する方法を行わせ、当該方法が、
複数の対象配列を含む二重鎖配列データを参照配列情報と比較することと、
二重鎖配列データ中の配列対応および/またはバリエーションを特定することであって、バリエーションが、意図されたゲノム遺伝子座における参照情報と一致しない領域として特定される、特定することと、
二重鎖配列データ中の複数の対象配列の中の予測されるゲノム編集配列の頻度を決定することと、
二重鎖配列データからゲノム編集スペクトラムを生成することと、
ゲノム編集データを提供すること、を含む、非一時的コンピュータ可読媒体。
114.非一時的コンピュータ可読媒体であって、そのコンテンツが、少なくとも1つのコンピュータに、細胞集団でのゲノム編集事象から得られる意図されないゲノム遺伝子座において編集された配列を検出し、特定する方法を行わせ、当該方法が、
複数の対象配列を含む二重鎖配列データを参照配列情報と比較することと、
二重鎖配列データ中の配列対応および/またはバリエーションを特定することであって、バリエーションが、意図されないゲノム遺伝子座における参照情報と一致しない領域として特定される、特定することと、
対象配列が意図されないゲノム遺伝子座にバリアントを含むかどうかを決定することと、
バリアントが存在する場合、二重鎖配列データ内のバリアントのバリアント頻度を決定することと、
二重鎖配列データからゲノム編集スペクトラムを生成することと、
ゲノム編集データを提供すること、を含む、非一時的コンピュータ可読媒体。
115.非一時的コンピュータ可読媒体であって、そのコンテンツが、少なくとも1つのコンピュータに、ゲノム編集事象後に細胞集団中の細胞のクローン増殖を検出し、特定するための方法を行わせ、当該方法が、
ゲノム編集された細胞集団に由来する試料から生成されたデュプレックス配列決定データを使用して標的ゲノム領域中の配列バリアントを特定することと、
試験試料および対照試料のバリアントアレル頻度(VAF)を計算することと、
VAFが対照群よりも試験群において高いかどうかを決定することと、
より高いVAFを有する試料において、配列バリアントが、非シングレットであるかどうかを決定することと、
より高いVAFを有する試料において、配列バリアントが、ドライバー変異であるかどうかを決定することと、
非シングレットおよび/またはドライバー変異を有する試料を、クローン増殖を起こしていることが疑われるものとして特徴付けることと、を含む、非一時的コンピュータ可読媒体。
116.ゲノム編集された細胞集団の安全性閾値を評価すること、および/またはゲノム編集された細胞集団を用いて対象を治療することに関連するリスクを決定することをさらに含む、事例115に記載の非一時的コンピュータ可読媒体。
【0226】
結論
本技術の実施形態の上述の詳細な説明は、網羅的であること、または本技術を上述の正確な形態に限定することを意図するものではない。本技術の具体的な実施形態および実施例は、例示的な目的のために上に記載されているが、関連技術分野の当業者が認識するように、本技術の範囲内で様々な等価な修正が可能である。例えば、ステップは所与の順序で提示されているが、代替的な実施形態は、異なる順序でステップを行ってもよい。本明細書に記載の様々な実施形態を組み合わせて、さらなる実施形態を提供することもできる。本明細書に引用される全ての参考文献は、本明細書に完全に記載されるかのように、参照により援用される。
【0227】
上の記載から、本技術の特定の実施形態は、例示のために本明細書に記載されているが、本技術の実施形態の説明を不必要に曖昧にすることを回避するために周知の構造および機能は詳細には記載または示されていないことを理解されたい。文脈が許容する場合、単数または複数の用語は、それぞれ複数または単数の用語も含み得る。
【0228】
さらに、「または」という単語が、2つ以上の項目のリストに関して他の項目から排他される単一の項目のみを意味するように明示的に限定されない限り、そのようなリストにおける「または」の使用は、(a)そのリスト内の任意の単一の項目、(b)そのリスト内の全ての項目、または(c)そのリスト内の項目の任意の組み合わせを含むと解釈される。加えて、「~を含む(comprising)」という用語は、同じ特徴および/または追加のタイプの他の特徴のより多くの数が排除されないように、少なくとも列挙された特徴を含むことを意味するように全体を通して使用される。特定の実施形態が例示のために本明細書に記載されているが、本技術から逸脱することなく様々な変更が行われ得ることも理解されたい。さらに、本技術の特定の実施形態と関連付けられた利点は、それらの実施形態の文脈で説明されているが、他の実施形態も、かかる利点を示してもよく、全ての実施形態が必ずしも本技術の範囲内に収まるような利点を示す必要はない。したがって、本開示および関連技術は、本明細書に明示的に示されていないまたは記載されない他の実施形態を包含することができる。