(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-04-01
(54)【発明の名称】核酸ライブラリを調製及び分析する方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20220325BHJP
C12Q 1/6844 20180101ALI20220325BHJP
C12Q 1/686 20180101ALI20220325BHJP
C12Q 1/04 20060101ALI20220325BHJP
C12N 15/09 20060101ALN20220325BHJP
【FI】
C12Q1/6869 Z
C12Q1/6844 Z ZNA
C12Q1/686 Z
C12Q1/04
C12N15/09 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021547127
(86)(22)【出願日】2020-02-14
(85)【翻訳文提出日】2021-08-11
(86)【国際出願番号】 US2020018360
(87)【国際公開番号】W WO2020168239
(87)【国際公開日】2020-08-20
(32)【優先日】2019-02-15
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】500481499
【氏名又は名称】タカラ バイオ ユーエスエー, インコーポレイテッド
(74)【代理人】
【識別番号】100114557
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】カンベロフ,エマニュエル
(72)【発明者】
【氏名】キムラ,ヨシタカ
(72)【発明者】
【氏名】ラリベルテ,ジュリー キャサリン
(72)【発明者】
【氏名】マーティン,パトリック ケビン
(72)【発明者】
【氏名】マイヤーズ,ジェイコブ
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QQ01
4B063QQ15
4B063QQ42
4B063QQ52
4B063QR32
4B063QR62
4B063QS25
4B063QS36
(57)【要約】
【解決手段】同じサンプル内の異なる変異を検出することは、特にサンプルの量が限られている場合、及び変異を迅速に検出するためにハイスループット方法が望ましい場合に不可欠である。当技術分野で日常的に使用されている方法は、サンプル中の異なる変異又は変異タイプ(例えば、一塩基多型(SNP)若しくはコピー数変異(CNV))を検出するために別個のアッセイを必要とする。本開示は、同じサンプル中のSNP及びCNVなどの異なる変異を検出するための方法を提供する。本明細書に記載の方法は、着床前遺伝子検査、キャリアスクリーニング又は遺伝子型決定に有用であり得る。
【特許請求の範囲】
【請求項1】
サンプル中の一塩基多型(SNP)及びコピー数変異(CNV)を検出する方法であって、
a)核酸分子を含むサンプルを取得し、
b)全ゲノム増幅又は全トランスクリプトーム増幅のためのプライマの集団と標的増幅のための少なくとも1つの標的特異的プライマとに前記核酸分子をさらして、前記全ゲノム増幅又は全トランスクリプトーム増幅と前記標的増幅とによって生成されたアンプリコンの混合物を生成し、
c)シーケンサでシーケンシングアッセイを使用して前記アンプリコンの混合物をシーケンシングして、シーケンシングリードを生成し、
d)前記シーケンシングリードを評価して、前記サンプル中のSNP及びCNVを決定する方法。
【請求項2】
前記核酸分子を、ポリメラーゼ連鎖反応を使用して増幅する、請求項1に記載の方法。
【請求項3】
ステップ(b)で生成された前記アンプリコンの混合物は、少なくとも1つのネステッドプライマ対を使用する追加の標的増幅を施して、前記標的増幅によって生成されたアンプリコンを更に増幅する、請求項1に記載の方法。
【請求項4】
前記シーケンシングリードを使用して、一塩基変異(SNV)の遺伝子型決定、マイクロサテライトの遺伝子型決定、挿入及び/若しくは欠失の検出、接合性の決定、性別の決定、遺伝子融合の検出、一若しくは複数の転座の検出、一若しくは複数の変異の検出、又は染色体異常の検出を行う、請求項1に記載の方法。
【請求項5】
前記プライマの集団は、前記集団内の他のプライマに対して非自己相補的及び非相補的であり、5’から3’の方向に定常領域及び可変領域を含み、前記定常領域の配列は、前記集団の複数のプライマ間で一定である既知の配列を有し、前記可変領域の配列は、前記集団の複数のプライマ間で縮重し、更に、構成する前記定常領域及び前記可変領域の前記配列は、ステップ(a)~(c)を実行する条件下で交差ハイブリダイズ又は自己ハイブリダイズしない、請求項1に記載の方法。
【請求項6】
複数の核酸分子は、少なくとも50塩基対である、請求項1に記載の方法。
【請求項7】
(b)におけるようなプライマは、少なくとも10ヌクレオチドを含む、請求項1に記載の方法。
【請求項8】
前記少なくとも1つの標的特異的プライマは、1つ以上の標的配列に特異的である、請求項1に記載の方法。
【請求項9】
前記少なくとも1つの標的特異的プライマは、アダプタ配列を含まない、請求項1に記載の方法。
【請求項10】
前記少なくとも1つの標的特異的プライマは、アダプタ配列の少なくとも一部を含む、請求項1に記載の方法。
【請求項11】
(b)におけるようなプライマは、少なくとも1つの修飾ヌクレオチドを含む、請求項1に記載の方法。
【請求項12】
(b)におけるようなプライマの融解温度は、少なくとも摂氏30度である、請求項1に記載の方法。
【請求項13】
前記核酸分子は、ゲノムDNA又はRNAを含む、請求項1に記載の方法。
【請求項14】
前記サンプルを、血液、血清、血漿、脳脊髄液、頬掻き取り物、乳頭吸引物、生検サンプル、頸部サンプル、精液、体液、微生物、ミトコンドリア、葉緑体、細胞溶解物、尿、糞便、毛包、唾液、汗、免疫沈降若しくは物理的に単離されたクロマチン、循環腫瘍細胞、腫瘍生検サンプル、エキソソーム、胚、細胞培養培地、細胞、組織、オルガノイド若しくは胚を培養するための使用済み培地、生検胚、栄養芽細胞、羊膜液、母体血液、胎児細胞、胎児DNA、無細胞DNA、子宮洗浄液、子宮内膜液、卵丘細胞、顆粒膜細胞、ホルマリン固定組織、パラフィン包埋組織又は胚盤胞腔からなる群から選択する、請求項1に記載の方法。
【請求項15】
前記少なくとも1つの標的特異的プライマは、単一の標的特異的プライマ対を含む、請求項9に記載の方法。
【請求項16】
前記1つ以上の標的配列は、冗長ゲノム領域を含む、請求項15に記載の方法。
【請求項17】
前記冗長ゲノム領域は、繰り返し要素を含む、請求項16に記載の方法。
【請求項18】
前記繰り返し要素は、SVA要素を含む、請求項17に記載の方法。
【請求項19】
a)全ゲノム増幅又は全トランスクリプトーム増幅のためのプライマの集団、
b)標的増幅のための少なくとも1つの標的特異的プライマ、及び
d)コピー数変異(CNV)の検出、一塩基多型(SNP)の遺伝子型決定、一塩基変異(SNV)の検出、マイクロサテライトの遺伝子型決定、挿入及び/若しくは欠失の検出、接合性の決定、性別の決定、遺伝子融合の検出、転座の検出、一若しくは複数の変異の検出、又は染色体異常の検出を行うためにキットを使用するための一組の説明書
を含む、キット。
【発明の詳細な説明】
【発明の概要】
【発明が解決しようとする課題】
【0001】
同じサンプル内の異なる変異を検出することは、特にサンプルの量が限られている場合、及び変異を迅速に検出するためにハイスループットな方法が望まれる場合に不可欠である。当技術分野で日常的に使用されている方法は、サンプル中の異なる変異又は変異タイプ(例えば、一塩基多型(SNP)又はコピー数変異(CNV))を検出するために別個のアッセイを必要とする。別個のアッセイを使用すると、限られた量のサンプルで臨床的に重要な変異を見逃すリスクが生じ得る。
【課題を解決するための手段】
【0002】
本開示は、同じサンプル中のSNP及びCNVなどの異なる変異を検出するための方法を提供する。本明細書に記載の方法は、着床前遺伝子検査、キャリアスクリーニング、又は遺伝子型決定に有用である可能性がある。
【0003】
ある態様では、本開示は、サンプル中の一塩基多型(SNP)及びコピー数変異(CNV)を検出する方法を提供する。本方法では、a)核酸分子を含むサンプルを取得し、b)全ゲノム増幅又は全トランスクリプトーム増幅のためのプライマの集団と標的増幅のための少なくとも1つの標的特異的プライマとに前記核酸分子をさらして、前記全ゲノム増幅又は全トランスクリプトーム増幅と前記標的増幅とによって生成されたアンプリコンの混合物を生成し、c)シーケンサでシーケンシングアッセイを使用してアンプリコンの混合物をシーケンシングして、シーケンシングリードを生成し、d)シーケンシングリードを評価して、サンプル中のSNP及びCNVを決定する。
【0004】
いくつかの実施形態において、核酸分子を、ポリメラーゼ連鎖反応を使用して増幅する。いくつかの実施形態において、複数の核酸分子は、少なくとも50塩基対である。いくつかの実施形態において、核酸分子は、ゲノムDNA又はRNAを含む。
【0005】
いくつかの実施形態において、ステップ(b)で生成されたアンプリコンの混合物に、少なくとも1つのネステッドプライマ対を使用する追加の標的増幅を施して、標的増幅によって生成されたアンプリコンを更に増幅する。
【0006】
いくつかの実施形態において、本方法では、シーケンシングリードを使用して、一塩基変異(SNV)の遺伝子型決定、マイクロサテライトの遺伝子型決定、挿入及び/又は欠失の検出、接合性の決定、性別の決定、遺伝子融合の検出、一若しくは複数の転座の検出、一若しくは複数の変異の検出、又は染色体異常の検出を行う。
【0007】
いくつかの実施形態において、プライマの集団は、集団内の他のプライマに対して非自己相補的及び非相補的であり、5’から3’の方向に定常領域及び可変領域を含み、定常領域の配列は、集団の複数のプライマ間で一定である既知の配列を有し、可変領域の配列は、集団の複数のプライマ間で縮重し、更に、構成する定常領域及び可変領域の配列は、ステップ(a)~(c)を実行する条件下で交差ハイブリダイズ又は自己ハイブリダイズしない。
【0008】
いくつかの実施形態において、(b)におけるようなプライマは、少なくとも10ヌクレオチドを含む。いくつかの実施形態において、少なくとも1つの標的特異的プライマは、1つ以上の標的配列に特異的である。いくつかの実施形態において、少なくとも1つの標的特異的プライマは、アダプタ配列を含まない。いくつかの実施形態において、少なくとも1つの標的特異的プライマは、アダプタ配列の少なくとも一部を含む。いくつかの実施形態において、(b)におけるようなプライマは、少なくとも1つの修飾ヌクレオチドを含む。いくつかの実施形態において、(b)におけるようなプライマの融解温度は、少なくとも摂氏30度である。いくつかの実施形態において、少なくとも1つの標的特異的プライマは、単一の標的特異的プライマ対を含む。いくつかの実施形態において、1つ以上の標的配列は冗長ゲノム領域を含む。いくつかの実施形態において、冗長ゲノム領域は繰り返し要素を含む。いくつかの実施形態において、繰り返し要素はSVA要素を含む。
【0009】
いくつかの実施形態において、サンプルを、血液、血清、血漿、脳脊髄液、頬掻き取り物、乳頭吸引物、生検サンプル、頸部サンプル、精液、体液、微生物、ミトコンドリア、葉緑体、細胞溶解物、尿、糞便、毛包、唾液、汗、免疫沈降若しくは物理的に単離されたクロマチン、循環腫瘍細胞、腫瘍生検サンプル、エキソソーム、胚、細胞培養培地、細胞、組織、オルガノイド若しくは胚を培養するための使用済み培地、生検胚、栄養芽細胞、羊膜液、母体血液、胎児細胞、胎児DNA、無細胞DNA、子宮洗浄液、子宮内膜液、卵丘細胞、顆粒膜細胞、ホルマリン固定組織、パラフィン包埋組織又は胚盤胞腔からなる群から選択する。
【0010】
ある態様では、本開示はキットを提供する。キットは、a)全ゲノム増幅又は全トランスクリプトーム増幅のためのプライマの集団、b)標的増幅のための少なくとも1つの標的特異的プライマ、及びd)コピー数変異(CNV)の検出、一塩基多型(SNP)の遺伝子型決定、一塩基変異(SNV)の検出、マイクロサテライトの遺伝子型決定、挿入及び/若しくは欠失の検出、接合性の決定、性別の決定、遺伝子融合の検出、転座の検出、一若しくは複数の変異の検出、又は染色体異常の検出を行うためにキットを使用するための一組の説明書を含む。
【図面の簡単な説明】
【0011】
【
図1】同じ核酸サンプルを使用して、コピー数変異(CNV)を検出するためにWGAプライマを使用する全ゲノム増幅(WGA)、及び一塩基多型(SNP)を検出するために標的特異的プライマを使用する標的増幅を実施する方法を示す概略図である。
【
図2】核酸分子の同じサンプルを使用して全ゲノム増幅(WGA)及び標的増幅を夫々実行することにより、核酸分子を調製してコピー数変異(CNV)及び一塩基多型(SNP)を検出するためのプロトコルの例を示す図である。
【
図3】核酸分子の同じサンプルを使用してSNP及びCNVを検出するために核酸ライブラリ分子を生成するためのステップを示す概略図である。これらのステップは、WGA及び標的増幅を伴う事前増幅ステップ、任意の清浄化ステップ、ネステッドPCRを使用する標的増幅ステップなどの1つ以上のライブラリ調製ステップ、及びシーケンシングのために核酸ライブラリ分子を生成するためのインデックスPCRステップを含んでもよい。
【
図4】冗長ゲノム要素の実施形態を示す概略図である。
【
図5】SINE/VNTR/Alu(SVA)要素を示す概略図(
図5A)及びSVA要素の領域に相補的な標的特異的プライマを示す概略図(
図5B)である。
【
図6】WGAプライマを使用する全ゲノム増幅(WGA)、及び冗長ゲノム要素に相補的な標的特異的プライマを使用する標的増幅を行うことにより、核酸分子の同じサンプルを使用してSNP及びCNVを検出する方法を示す概略図である。
【
図7】標的配列に亘る複数の標的特異的プライマの使用を示す概略図である。
【
図8】3つの異なる事前増幅条件、すなわち、標的特異的プライマ無し、30の標的特異的プライマ有り及び90の標的特異的プライマ有りを使用して実施された実験からのデータを示す図表である。
図8Aは、3つの事前増幅条件でのカバレッジを示している。
図8Bは、3つの事前増幅条件間での、変動係数によって示されるようなカバレッジの変動を示している。
【
図9】事前増幅が標的増幅を伴って又は標的増幅を伴わず実施された実験からのデータを示す図表である。いずれの場合も、すなわち、事前増幅ステップにおいて標的増幅を伴って又は標的増幅を伴わず、標的増幅は、事前増幅ステップの後に実行された。
図9Aは、事前増幅ステップにおいて標的増幅を伴う又は標的増幅を伴わないアッセイを使用した、全ゲノム及び標的配列、すなわちCFTR遺伝子に亘るリードの割合を示す。
図9Bは、事前増幅ステップでの標的増幅を伴う又は伴わない場合の、全ゲノム及びCFTR遺伝子の平均カバレッジを示す。
図9Cは、事前増幅反応が標的増幅を含むアッセイからの、CFTR遺伝子における15の異なる標的又はバリアントに亘るシーケンシングリードのカバレッジを示す一方、
図9Dは、事前増幅反応が標的増幅を含まなかったアッセイからのカバレッジを示している。
【
図10】5つの細胞(
図10A)又は単一の細胞(
図10B)を使用して実施された実験からのシーケンシングリードのカバレッジデータを示す図表である。
【
図11】5つの細胞(
図11A)又は単一の細胞(
図11B)を使用して実施された実験からのシーケンシングリードの分布を示す図表である。
【
図12】5つの細胞の複製(
図12A)又は単一の細胞の複製(
図12B)を使用して複製間の相関を評価するための実験からのデータを示す図表である。
図12Cは、2つの複製における1Mbビンのリードのlog2比のゲノム図を示している。
【
図13】例えばキャリアスクリーニングのためにWGA無しで標的増幅のみを使用した、CFTR遺伝子における15の異なる標的に亘るカバレッジを示すための実験からのデータを示す図表である。
【
図14-2】栄養外胚葉生検(n=4)でのCFTR遺伝子における一塩基多型(SNP)及び染色体異数性を検出するための本方法(
図14C及び
図14D)を使用したデータを示す図である。
図14Cは、CFTR遺伝子におけるSNPの検出に関連するデータを提供し、
図14Dは、本方法を使用する異数性の検出に関連するデータを提供する。
【
図15】ヒトゲノム(アセンブリhg38)に亘るSVA要素内に見られるSNPを視覚的に示す図である。上部のバーは、個々の染色体1~22、X及びYを表す。下部のグラフは、個々のSNPをゲノムに亘るドットとして示している。Y軸は各SNPのマイナー対立遺伝子頻度を表す。黒色のドットは、0.05以上のマイナー対立遺伝子頻度を有するSNPを表す。灰色のドットは、0.05未満のマイナー対立遺伝子頻度を有するSNPを表す。
【
図16】標的特異的プライマ対、及び標的特異的プライマ対毎の予測されるPCR産物又はアンプリコンの数の実施形態を示す図である。配列は、上から下へAlu様プライマ配列(配列番号1~10);上から下へSINE-Rプライマ配列(配列番号:11~20)として記載されている。
【発明を実施するための形態】
【0012】
標的増幅と組み合わせて全ゲノム又は全トランスクリプトーム(WGA又はWTA)を増幅して、核酸分子の同じサンプルからの全ゲノム及び標的配列を増幅することにより、核酸分子を調製及び分析する方法が提供される。本方法は、同じサンプル内のコピー数変異(CNV)、挿入及び/又は欠失(インデル)、一塩基多型(SNP)などの様々な変異の検出に役立つ可能性がある。本方法は、臨床試験(例えば、キャリアスクリーニング、胚スクリーニング、使用済み培地試験)、法医学分析などに使用される。
【0013】
本発明をより詳細に説明する前に、この発明は、説明した特定の実施形態に限定されず、従って言うまでもなく様々であり得ることを理解されたい。本発明の範囲は添付の特許請求の範囲によってのみ限定されるので、本明細書で使用される用語は特定の実施形態を説明することのみを目的としており、限定することを意図しないことも理解されたい。
【0014】
値の範囲が提供される場合、文脈が明確に別段の指示をしない限り、下限の単位の10分の1までの、その範囲の上限と下限との間における各介在値、及び、その記載範囲における任意の他の記載の又は介在する値は、本発明に含まれることが理解される。これらのより小さな範囲の上限及び下限は、独立してより小さな範囲に含まれてもよく、また、記載範囲において特に除外された任意の限界を条件として本発明に含まれる。記載範囲が限界の一方又は両方を含む場合、これらの含まれる限界のいずれか又は両方を除外する範囲も、本発明に含まれる。
【0015】
本明細書では特定の範囲が示され、数値の前に「約」という用語が付いている。「約」という用語は、本明細書では、その用語が先行する正確な数、及びその用語が先行する数に近い数か又は略その数に対する文字通りのサポートを提供するために使用される。数が、具体的に記載された数に近いか又は略等しいかどうかを決定する際に、近いか又は近似する不記載の数は、その数が提示される文脈において、具体的に記載された数についての実質的均等をもたらす数であり得る。
【0016】
別段の定義がない限り、本明細書で使用される全ての技術用語及び科学用語は、この発明が属する技術の当業者によって共通して理解される意味と同じ意味を有する。本明細書に記載された方法及び材料と類似又は均等の任意の方法及び材料もまた、本発明の実施又は試験にて使用されることができるが、代表的且つ例示的な方法及び材料が本明細書に記載されている。
【0017】
本明細書で引用される全ての刊行物及び特許は、個々の刊行物又は特許が夫々参照により組み込まれることが具体的かつ個別に示されているかのように参照により本明細書に組み込まれ、刊行物が関連して引用されている方法及び/又は材料を記述又は記載するために参照により本明細書に組み込まれる。任意の刊行物の引用は、出願日より前のその開示についてであり、本発明が先行発明のためにそのような刊行物に先行する権利がないことを認めるものと解釈されるべきではない。更に、提供される発行日は実際の発行日とは異なる場合があり、個別に確認する必要があり得る。
【0018】
本明細書及び添付の特許請求の範囲で使用される場合、単数形「a」、「an」、及び「the」は、文脈が明確に別段の指示をしない限り、複数の指示対象を含むことに留意されたい。特許請求の範囲は、あらゆる任意の要素を除外するために起草されてもよいことに更に留意されたい。従って、この記述は、特許請求の範囲の要素の記載に関連して「単独」、「のみ」などの排他的な用語を使用する、又は「否定的な」制限を使用するための先行する記載として機能することを目的としている。
【0019】
この開示を読むと当業者には明らかであるように、本明細書に記載及び図示された個々の実施形態の夫々は、本発明の範囲又は趣旨から逸脱することなく他のいくつかの実施形態のいずれかの特徴から容易に分離され得る又はこのような特徴と組み合わされ得る別個の構成要素及び特徴を有する。記載された任意の方法は、記載されたイベントの順序で、又は論理的に可能な任意の他の順序で実行され得る。
【0020】
装置及び方法は、機能的な説明を伴って文法的流動性のために説明されているか、又は説明されるが、米国特許法第112条に基づき明示的に述べられていない限り、特許請求の範囲は、「手段」又は「ステップ」の制限の構築によっていかなる場合であっても必ず制限されると解釈されるべきではなく、均等法論の下で特許請求の範囲によって提供される定義の意味及び均等物の全範囲を与えられるべきであり、特許請求の範囲が米国特許法第112条に基づいて明示的に述べられている場合には、米国特許法第112条に基づく完全な法定均等物が付与されると明示的に理解されるべきである。
【0021】
方法
上記に要約したように、この開示に記載の方法は、同じサンプル、例えば、血液、細胞、使用済み培地、又は抽出された核酸中の様々な変異(例えば、コピー数変異及び一塩基多型)を検出するための核酸分子の調製及び分析に関する。概して、本方法は、標的特異的プライマを使用する標的配列(複数可)の標的増幅と組み合わせて及び/又はこのような標的増幅が後に続いて、全ゲノム増幅(WGA)又は全トランスクリプトーム増幅(WTA)のためのプライマを使用して核酸分子を増幅する。例えば、
図1に示すように、同じ核酸サンプルを使用して、コピー数変異(CNV)を検出するための全ゲノム増幅(WGA)プライマを使用するWGAを、SNPを検出するための、SNPを含む標的特異的プライマを使用する標的増幅と組み合わせて実施することができる。
【0022】
本明細書に開示される方法は、様々なステップを含むことができる。そのようなプロトコルの1つの例を
図2及び
図3に提供する。プロトコルは、核酸分子を含むサンプルを取得するステップ、サンプルを溶解してサンプルから核酸分子を抽出するステップ、核酸分子に事前増幅ステップを施してWGA/WTAプライマを使用して全ゲノムを増幅し、標的増幅と組み合わせて標的特異的プライマを使用して標的配列(複数可)を増幅するステップ、清浄化ステップを任意に実行した後、アンプリコンにライブラリ調製手順を施してシーケンシング用のライブラリ分子を調製するステップなどを含むことができる。ライブラリ調製ステップは、シーケンシングアッセイに必要な配列を付着させるための1つ以上のステップを含むことができる。ライブラリ調製ステップは2以上のステップを含むことができ、例えば、事前増幅ステップは標的増幅を含まないか、又は事前増幅ステップは標的増幅を含むが、事前増幅ステップの後に追加の標的増幅を適用してもよい。事前増幅ステップの後に追加の標的増幅が実施される場合、ネステッドPCRを実施して、標的配列(複数可)を更に増幅し、アダプタ配列(例えば、P5又はP7)を付着させてもよい。ネステッドPCRは、事前増幅ステップで使用される標的特異的プライマ内で入れ子状であるプライマを使用して実行されてもよい。いくつかの場合には、単一の反応でアダプタ配列及びインデックスを付着させるために、ライブラリを単一のステップで調製することができる。例えば、事前増幅ステップは標的増幅を含んでもよく、事前増幅ステップに続く追加の標的増幅が任意であってもよい。この場合、ライブラリは、例えばインデックスPCR中に単一のステップで調製され得る。インデックスPCRは、事前増幅ステップ及び/又は標的増幅のいずれかに続いて実行されて、インデックス(例えば、インデックス1又はインデックス2)をアンプリコンに付着させることができる。方法の様々なステップは、
図1~
図3に以下でより詳細に記載される。
【0023】
サンプル
この開示の方法は、DNA又はRNAなどの核酸分子を含む様々なサンプルで使用され得る。いくつかの場合には、サンプルは、血液、血清、血漿、脳脊髄液、頬掻き取り物、頸部液/細胞、乳頭吸引物、生検サンプル、精液、尿、糞便、毛包、唾液、汗、免疫沈降若しくは物理的に単離されたクロマチン、循環腫瘍細胞、腫瘍生検サンプル、エキソソーム、胚、細胞培養培地、細胞、組織、オルガノイド若しくは胚を培養するための使用済み培地、生検胚(胚盤胞の内部細胞塊(ICM)からの1つ以上の細胞、若しくは栄養外胚葉(TE)からの1つ以上の細胞-すなわち、栄養外胚葉細胞など)、羊膜液、ホルマリン固定組織、母体血液、胎児細胞(複数可)、無細胞DNA、子宮洗浄液、子宮内膜液、卵丘細胞、顆粒膜細胞、癌細胞(複数可)、パラフィン包埋組織又は卵割腔とすることができる。いくつかの場合には、サンプルは、卵母細胞又はその極体、微生物、植物細胞、動物細胞、ミトコンドリア、葉緑体、法医学サンプル、細胞溶解物、体液、頸部サンプルとすることができる。核酸分子を含む他のタイプのサンプルも使用することができる。
【0024】
細胞溶解及び核酸分子の抽出
核酸分子を含むサンプルを溶解して、核酸分子を放出させることができる。いくつかの場合には、試薬ベースの方法及び物理的な方法などの、当技術分野で知られている任意の方法を使用してサンプルを溶解することができる。例えば、試薬ベースの方法は、酵素(例えば、リゾチーム)、及び/又は有機溶媒(例えば、アルコール、クロロホルム、エーテル、EDTA、トリトン、アルカリ溶解物)の使用を含むことができる。物理的な方法の例は、超音波処理、ホモジナイザ、凍結融解サイクル、粉砕などを含むことができる。いくつかの場合には、細胞溶解は不要であってもよく、本明細書に開示される方法を使用して核酸分子を調製するためにサンプルを直接使用することができる。例えば、サンプルは、この開示の方法で使用することができる無細胞DNAとすることができる。
【0025】
いくつかの実施形態において、本明細書に記載の方法で使用することができる核酸分子の量/分量は、少なくとも0.5ピコグラム(pg)、少なくとも1pg、少なくとも2pg、少なくとも5pg、少なくとも10pg、少なくとも20pg、少なくとも30pg、少なくとも40pg、少なくとも50pg、少なくとも100pg、少なくとも200pg、少なくとも500pg、少なくとも1ナノグラム(ng)、又は1ng超とすることができる。他の量を、この開示の方法で使用することができる。
【0026】
いくつかの実施形態では、この開示の方法で使用できる核酸分子の品質は、当技術分野で開示された方法を使用して抽出されたDNAなどの、相当量の阻害剤を含まない高品質の核酸分子とすることができる。いくつかの場合には、核酸分子のサンプルは、ホルマリン固定サンプルなどの阻害剤を含むことができる。
【0027】
事前増幅
核酸分子に事前増幅ステップを施すことができる。事前増幅ステップは、全ゲノム増幅(WGA)又は全トランスクリプトーム増幅(WTA)のためのプライマに核酸分子をさらすことを含むことができる。いくつかの実施形態において、事前増幅ステップは、WGA/WTA及び標的増幅からアンプリコンの混合物を生成するために標的増幅のための標的特異的プライマを含んでもよい。いくつかの場合には、事前増幅ステップは標的特異的プライマを含まなくともよく、そのため、事前増幅ステップは、WGAのみからアンプリコンを生成してもよい。この場合、事前増幅ステップの後に標的増幅を行って、標的特異的プライマを使用して標的配列(複数可)を増幅してもよい。事前増幅反応が、アンプリコンの混合物を生成するために標的特異的プライマと組み合わせてWGA/WTAプライマを含んでもよい実施形態では、事前増幅ステップで標的増幅によって生成されたアンプリコン内のネステッドプライマを使用して、アンプリコンの混合物に標的増幅を更に施してもよい。いくつかの特定の実施形態では、事前増幅ステップを実行しなくてもよい。この場合、標的特異的プライマを使用して標的配列(複数可)を増幅するために核酸分子に標的増幅を施す。
【0028】
WGA又はWTAは、サンプル中の核酸分子の全てのフラグメントを実質的に増幅できる。WGA又はWTAは、特定の部位の表現を失うことなく、ゲノム全体又はトランスクリプトーム全体を実質的に増幅することができる。実質的に全て又は実質的に全体とは、ゲノム又はトランスクリプトームにおける全ての配列の約30%、約40%、約50%、約60%、約70%、約80%、約85%、約90%、約95%、又はそれ以上を指すことができる。WGA又はWTAは、いくつかの場合には、他の配列と比較して特定の配列の非等価増幅を含むことができるが、そのような増幅の相対的な違いは、いくつかの場合には重要ではない。WGA/WTAは、ゲノム又はトランスクリプトームの1つ以上の配列を標的にすることができる。ほとんどの場合、WGA/WTAは、ゲノム又はトランスクリプトーム内の、少なくとも約100、少なくとも約1000、少なくとも約10,000、少なくとも約100,000、少なくとも約1,000,000、少なくとも約10,000,000、少なくとも約100,000,000、少なくとも約1,000,000,000、又はそれ以上の部位を標的にできる。WGA及び/又はWTAは、任意の適切なプライマを使用して実行され得る。適切なWGA/WTAプライマには、PicoPLEX(登録商標)WGAキット、SMARTer(登録商標)PicoPLEX(登録商標)シングルセルWGAキット、SMARTer(登録商標)PicoPLEX(登録商標)DNA-seqキット、SMARTer(登録商標)PicoPLEX(登録商標)ゴールドシングルセルDNA-Seqキット、Ion ReproSeq(商標)PGSキット、MALBAC(登録商標)シングルセルWGAキット、GenomePlex(登録商標)WGAキット、REPLI-g(登録商標)WGA及びWTAキット、Ampli1(商標)WGA及びWTAキット、Transplex(登録商標)WTAキット、TruePrime(登録商標)WGAキット、Quantitect(登録商標)全トランスクリプトームキット、Doplify(登録商標)WGAキット、GenoMatrix(商標)WGAキット、PG-Seq(商標)キット、Sureplex(商標)DNA増幅システムキット、IllustraGenomiPhi(商標)DNA増幅キットにて提供されるプライマが含まれるが、これらに限定されない。適切なWGA/WTAプライマは、例えば、夫々の内容が参照により本明細書に組み込まれる、米国特許第7718403号明細書;米国特許第8206913号明細書;米国特許第9249459号明細書;米国特許第9617598号明細書;米国特許第5731171号明細書;米国特許第6365375号明細書;米国特許第10017761号明細書;米国特許第8034568号明細書;米国特許第6617137号明細書;米国特許第6977148号明細書、米国特許第10190163号明細書;米国特許第9840732号明細書;米国特許第9777316号明細書;米国特許第8512956号明細書;米国特許第8349563号明細書、及び、夫々の内容が参照により本明細書に組み込まれる、米国特許出願公開第2016/0355879号明細書;米国特許出願公開第2018/0030522号明細書;米国特許出願公開第2019/0271033号明細書;米国特許出願公開第2013/0085083号明細書;米国特許出願公開第2007/0054311号明細書;米国特許出願公開第2007/0178457号明細書;米国特許出願公開第2011/0033862号明細書;米国特許出願公開第2016/0312276号明細書;米国特許出願公開第2009/0099040号明細書;米国特許出願公開第2010/0184152号明細書;米国特許出願公開第2015/0072899号明細書;米国特許出願公開第2011/0189679号明細書;米国特許出願公開第2019/0300933号明細書;米国特許出願公開第2016/0289740号明細書に記載され得る。
【0029】
同様に、標的特異的プライマは、標的増幅中にゲノム又はトランスクリプトームの1つ以上の配列を増幅することができる。いくつかの場合には、標的特異的プライマは、1つの配列、2つの配列、3つの配列、10の配列、100の配列、1000の配列、10,000の配列、100,000の配列、1,000,000の配列、10,000,000の配列、又はそれ以上を増幅できる。いくつかの場合には、標的増幅は、1つ以上の標的特異的プライマを使用して同じ配列を増幅することができる。他の場合では、標的増幅はゲノム又はトランスクリプトームの異なる配列を増幅することができる。いくつかの場合には、「標的特異的プライマ」は、ハイブリダイゼーションに適した条件下で標的配列に選択的かつ予測可能にハイブリダイズするプライマを指す。いくつかの場合には、「標的配列」又は「該当する標的配列」及びその誘導体とは、一般に、サンプル中に存在することが疑われる又は予想される任意の核酸配列を含む、本開示に従って増幅することができる任意の一本鎖又は二本鎖の核酸配列を指す。いくつかの実施形態では、標的配列は二本鎖形態で存在し、標的特異的プライマの添加前に増幅又は合成される特定のヌクレオチド配列の少なくとも一部又はその補体を含む。標的配列は、ポリメラーゼによる伸長の前に標的特異的プライマがハイブリダイズすることができる核酸を含むことができる。いくつかの場合には、標的特異的プライマは、1つ以上の変異ホットスポット、ゲノムマーカ、該当するSNP、冗長ゲノム要素(例えば、SVA要素)、コーディング領域、エキソン、遺伝子、イントロン、非コーディング領域、プロモータ領域、偽遺伝子、イントロン-エキソン接合部、及び遺伝子間領域を含む標的配列を増幅する。いくつかの場合には、標的特異的プライマは、例えば、該当する遺伝子(例えば、CFTR遺伝子)又は該当する遺伝子の1つ以上の領域などの、該当する1つ以上のゲノム領域を含む標的配列を増幅することができる。いくつかの場合には、標的特異的プライマは、該当する1つ以上のSNPを含む標的配列を増幅することができる。いくつかの場合には、標的特異的プライマは、本明細書に開示される遺伝的障害のいずれかなどの遺伝的障害に関係する遺伝子又はゲノム領域を含む標的配列を増幅することができる。
【0030】
特定の実施形態において、標的特異的プライマの1つ以上の標的配列は、冗長ゲノム領域又は冗長ゲノム要素、すなわち、例えばヒトのゲノム全体に存在するゲノム領域を含む。冗長ゲノム領域は、例えば均一な方法で全ての染色体上に存在してもよい。いくつかの場合には、冗長ゲノム領域は、例えばゲノム内の1000以上の場所、ゲノム内の2000以上の場所、ゲノム内の3000以上の場所、ゲノム内の4000以上の場所、ゲノム内の5000以上の場所、ゲノム内の6000以上の場所、ゲノム内の7000以上の場所、ゲノム内の8000以上の場所、ゲノム内の9000以上の場所、ゲノム内の10,000以上の場所、ゲノム内の100,000以上の場所、ゲノム内の1,000,000以上の場所、ゲノム内の10,000,000以上の場所、又はゲノム内の100,000,000以上の場所など、ゲノム内の複数の場所に存在する。いくつかの場合には、冗長ゲノム領域は、ゲノム内の1000~10,000,000の場所、ゲノム内の1000~1,000,000の場所、ゲノム内の10,000~500,000の場所、又はゲノム内の50,000~200,000の場所の範囲のゲノム内の複数の場所に存在する。
【0031】
ゲノム内の複数の場所に存在するゲノム領域は、例えばゲノム領域がゲノムに亘って一意的にマッピングされるように配列が多様であってもよい。いくつかの場合には、冗長ゲノム領域は多型である(例えば、SNPを含む)。本明細書でその従来の意味で使用される場合、「多型」は、特定のゲノム配列の2つ以上のバリアントが集団内に見出されることが可能な状態を指す。いくつかの場合には、冗長ゲノム領域には1つ以上の多型領域が含まれる。多型領域には、挿入、欠失、構造バリアント接合部、可変長タンデムリピート、一塩基多型、一塩基変異、コピー数変異、又はそれらの組み合わせが含まれてもよい。いくつかの場合には、多型領域は、0.01以上、0.02以上、0.03以上、0.04以上、0.05以上、0.06以上、0.07以上、0.08以上、0.09以上、0.1以上、0.2以上、0.3以上、又は0.4以上の範囲のマイナー対立遺伝子頻度を有する。いくつかの場合には、1つ以上の多型領域は、例えば、領域当たり1~5のSNP、領域当たり10~20のSNP、領域当たり10~40のSNP、領域当たり15~35のSNP、領域当たり20~60のSNP、又は領域当たり20~50のSNPなど、領域当たり1つ以上のSNPをもたらす。いくつかの場合には、冗長ゲノム領域には1つ以上の保存領域が含まれる。その従来の意味で本明細書にて使用される場合、「保存領域」は、異種ポリヌクレオチド若しくはポリペプチド配列、又は、異なる種に存在するか若しくは異なる配列間に比較的高度の配列同一性が存在するゲノム内にて複製されるポリヌクレオチド若しくはポリペプチド配列中の領域を指す。保存領域間の配列同一性は、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、又は少なくとも99%であってもよい。いくつかの場合には、冗長ゲノム領域には、両端に保存領域が隣接する多型領域が含まれる。いくつかの場合には、冗長ゲノム領域には、ゲノムの非コーディング領域が含まれる。該当するゲノム領域は、例えば、1つ以上のイントロン、1つ以上の調節要素、1つ以上の偽遺伝子、1つ以上のリピート配列又は繰り返し要素、1つ以上のウイルス要素(例えば、内在性レトロウイルス配列)、1つ以上のテロメア、1つ以上の転移因子、1つ以上のレトロトランスポゾン、1つ以上の短鎖タンデムリピート、それらの一部又はそれらの組み合わせを含んでもよい。
【0032】
冗長ゲノム領域は、本方法による増幅に適した任意の長さを有してもよい。いくつかの場合には、冗長ゲノム領域の長さは、1000~4000塩基対(bp)、1000~3000bp、1000~2000bp、又は500~1500bpの範囲である。いくつかの場合には、ゲノム領域の長さは、1~500塩基対(bp)、10~500bp、又は100~500bpの範囲である。
【0033】
図4は、ゲノムに亘って複数の位置に存在する冗長ゲノム要素の実施形態(上)の概略図、及び両端に保存領域が隣接する多型領域を有する冗長ゲノム要素の実施形態(下)の概略図である。冗長ゲノム要素はゲノム全体に見られてもよく、全ての染色体に比較的均一に存在する。ゲノムは、1500~3000コピー以上、3000~30000コピー以上、30000~300000コピー以上の冗長ゲノム要素を含んでもよく、これは、ゲノムの1~2Mb毎にSNPの略1つの領域に相当する。
【0034】
いくつかの場合には、冗長ゲノム領域に繰り返し要素又はリピート配列が含まれる。繰り返し要素は、1つ以上のタンデムリピート、1つ以上の散在リピート、又はそれらの組み合わせを含んでもよい。
【0035】
タンデムリピートには、1つ以上のサテライトDNA、1つ以上のミニサテライト(長鎖タンデムリピート;10~100bpのリピート単位)、1つ以上のマイクロサテライト(短鎖タンデムリピート;10bp未満のリピート単位)又はそれらの組み合わせが含まれてもよい。いくつかの場合には、冗長ゲノム領域には、VNTR(可変数タンデムリピート)が含まれる。いくつかの場合には、冗長ゲノム領域には、マクロサテライト(リピート単位が100bpより長い)が含まれる。
【0036】
散在リピートは、遺伝子配列内又は遺伝子間でゲノムに亘って分散してもよい。散在リピートには、1つ以上のトランスポゾンが含まれてもよい。トランスポゾンは、可動遺伝因子であってもよい。可動遺伝因子は、ゲノム内で自身の位置を変えてもよい。トランスポゾンは、クラスI転移因子(クラスI TE)又はクラスII転移因子(クラスII TE)に分類されてもよい。クラスI TE(例えば、レトロトランスポゾン)は、最初に転写によりDNAからRNAへ、次に逆転写によってRNAからDNAに戻ってという2つの段階で自身をコピーしてもよい。その後、DNAコピーをゲノムの新しい位置に挿入してもよい。クラスI TEは、1つ以上の長鎖末端リピート(LTR)、1つ以上の長鎖散在核要素(LINE)、1つ以上の短鎖散在核要素(SINE)、又はそれらの組み合わせを含んでもよい。LTRの例には、ヒト内在性レトロウイルス(HERV)、中程度の反復リピート4(MER4)、及びレトロトランスポゾンが含まれるが、これらに限定されない。LINESの例には、LINE1及びLINE2が含まれるが、これらに限定されない。SINEは、1つ以上のAlu配列、1つ以上の哺乳類全体散在リピート(MIR)、又はそれらの組み合わせを含んでもよい。クラスII TE(例えば、DNAトランスポゾン)は、RNA中間体を含まないことがよくある。DNAトランスポゾンは、多くの場合、1つの部位から切り取られ、ゲノム内の別の部位に挿入される。或いは、DNAトランスポゾンが複製され、ゲノムの新しい位置に挿入される。DNAトランスポゾンの例には、MER1、MER2及びマリナーが含まれるが、これらに限定されない。
【0037】
散在リピートには、1つ以上のレトロトランスポーザブル要素が含まれてもよい。レトロトランスポーザブル要素(RE)には、長鎖散在核要素(LINE)、短鎖散在核要素(SINE)、及びSVA要素が含まれる。SINEは、通常、500ヌクレオチド未満の長さのREのクラスである一方、LINEは、通常、500ヌクレオチド超の長さである(A.F.A.Smit、The origin of interspersed repeats in the human genome、Current Opinion in Genetics Development、6(6):743-748(1996);Batzer,M.A.ら、Alu repeats and human genomic diversity、Nature Reviews Genetics、3(5):370-379(2002);Batzer、M.A.ら、African origin of human-specific polymorphic Alu insertions、Proceedings of the National Academy of Sciences、91(25):12288(1994);Feng,Q.ら、Human L1 retrotransposon encodes a conserved endonuclease required for retrotransposition、Cell、87(5):905-916(1996);Houck,C.M.ら、A ubiquitous family of repeated DNA sequences in the human genome、Journal of Molecular Biology、132(3):289-306(1979);Kazazian,H.H.ら、The impact of L1 retrotransposons on the human genome、Nature Genetics、19(1):19-24(1998);Ostertag,E.M.ら、Biology of mammalian L1 retrotransposons、Annual Review of Genetics、35(1):501-538(2001))。LINEの全長要素は、約6kbの長さであり、ポリメラーゼIIの内部プロモータと2つのオープンリーディングフレーム(ORF)とを含み、ポリAテールで終わる。SINEには、ヒトゲノムで100万を超えるコピー数に達した霊長類固有のSINEであるAlu要素が含まれる。SINEは元々、その散在性質及び長さ(75~500bp)によって定義されたが、そのRNAポリメラーゼIIIの転写によって更に特徴づけられている。
【0038】
REの第3のタイプは、SVA(SINE/VNTR/Alu)要素として知られる複合レトロトランスポゾンである(Wang,H.ら、SVA Elements:A Hominid-specific Retroposon Family、J.Mol.Biol.354:994-1007(2005))。SVAは進化的に若く、推定上トランスでLINE-1逆転写酵素によって動員される。SVAは現在アクティブであり、挿入型遺伝子変異、エキソンシャッフリング、選択的スプライシング、差次的メチル化領域(DMR)の生成など、様々なメカニズムを通じて宿主に影響を与えてもよい。SVAの各ドメインは、レトロトランスポゾン又はリピート配列のいずれかに由来する。標準的なSVAは、平均で約2キロベース(kb)(例えば約1,650bp)であるが、SVA挿入のサイズは、700~4000塩基対(bp)の範囲であってもよい(Hancks,D.C.、及びKazazian,H.H.、SVA Retrotransposons:Evolution and Genetic Instability、Semin.Cancer Biol.20:234-45(2010))。SVAは、その主要成分であるSINE、可変数タンデムリピート(VNTR)、及びAluにちなんで名付けられた複合要素である。SVA要素には、レトロトランスポゾンの特徴が含まれており、レトロトランスポゾンは、標的部位重複(TSD)に隣接し、ポリ(A)テールで終了し、ゲノムへの統合中に切り捨てられて反転されることがある。標準的なSVAには通常、5つの異なる領域、つまり、5’末端の(CCCTCT)n (配列番号25)六量体リピート、Alu様ドメイン、可変数タンデムリピート(VNTR)、SINE由来領域(例えば、Rがレトロウイルス起源を示すSINE-R)、及びポリ(A)テールが含まれている。リピートドメイン、例えばVNTR領域の結果として、完全長のSVA要素のサイズは、大きく異なる可能性がある。SVAは、SVA_A、SVA_B、SVA_C、SVA_D、SVA_E、SVA_Fという名前の6つのサブファミリーに分類されてもよい。ファミリーの相同性は、ファミリー毎のコンセンサス配列を使用して90~95%の範囲である。第7のサブファミリーSVA-F1では、(CCCTCT)n (配列番号25)六量体は、MAST2遺伝子の最初のエキソンの5’形質導入によって置き換えられる(Quinn、J.ら、The Role of SINE-VNTR-Alu(SVA)Retrotransposons in Shaping the Human Genome、Int.J.Mol.Sci.20:5977(2019))。
【0039】
いくつかの場合には、SVA要素は多型である(例えば、SNPを含む)。SVA要素の多型領域は、本明細書に記載のSVA要素のドメイン及び領域のいずれかの1つ以上を含んでもよい。いくつかの場合には、SVA要素のAlu様ドメインは多型である。いくつかの場合には、SVA要素のSINE-R領域は多型である。いくつかの場合には、SVA要素の保存領域には、1つ以上の標的部位重複ドメイン、六量体リピート、VNTR、及びポリAテールが含まれる。SVA要素の実施形態が
図5Aに提供されている(Wang,H.ら、SVA Elements:A Hominid-specific Retroposon Family、J.Mol.Biol.354:994-1007(2005)から採用)。SVA要素は、2つの隣接する標的部位複製ドメイン、六量体リピート(CCCTCT)
n (配列番号25)、SVA-Uによって接続された2つの部分的なAlu要素を含むAlu様ドメイン(335nt)、VNTR領域(48~2,306bpで変化;平均長:819bp)、ヒト内在性レトロウイルスからのセグメント(env、U3、R)から形成されたSINE-R領域(490nt)、及びポリAテールを含む。
【0040】
いくつかの場合には、冗長ゲノム領域に偽遺伝子が含まれる。本明細書で使用される「偽遺伝子」及び「複数の偽遺伝子」は、同定された遺伝子に対して高い配列類似性又は配列同一性を有するが、非機能的プロモータ、欠落した開始コドン又は他の欠陥のために一般に転写及び翻訳されない配列を指す。ほとんどの偽遺伝子はイントロンがなく、主に親遺伝子のコーディング配列を表している。いくつかの場合には、異なる生物又は組織で、機能的活性化が起こり得ることが示されている。
【0041】
いくつかの場合には、上記の標的増幅は、1つ以上の標的特異的プライマ対を使用して標的配列を増幅することを含む。いくつかの場合には、1つ以上の標的特異的プライマ対は、50以下のプライマ対、15以下のプライマ対、10以下のプライマ対、9以下のプライマ対、8以下のプライマ対、7以下のプライマ対、6以下のプライマ対、5以下のプライマ対、4以下のプライマ対、3以下のプライマ対、2以下のプライマ対、又は単一のプライマ対を含む。特定の実施形態において、本方法は、単一の標的特異的プライマ対を含む少なくとも1つの標的特異的プライマと組み合わせて及び/又はこのような標的特異的プライマを後で使用して、WGA/WTAのためのプライマを使用して核酸分子を増幅することを含む。
【0042】
いくつかの場合には、本方法における標的増幅のための標的特異的プライマは、上記のように冗長ゲノム領域を増幅するための単一のプライマ対を含む。いくつかの場合には、単一のプライマ対のプライマは、冗長ゲノム領域、又は冗長ゲノム領域の1つ以上の部分、例えば冗長ゲノム領域の多型領域に特異的又は相補的である。いくつかの場合には、単一のプライマ対のプライマは、繰り返し要素、例えば、SVA要素の1つ以上の領域又はドメインに特異的である。
図5Bでは、Alu様ドメインの部分又はSINE-Rドメインの部分に相補的なプライマ対のプライマが提供されている。いくつかの場合には、単一のプライマ対の1つ以上のプライマが、SVA要素のAlu様ドメイン又はAlu様ドメインの一部に相補的である。いくつかの場合には、単一のプライマ対の1つ以上のプライマが、SVA要素のSINE-R領域又はSINE-R領域の一部に相補的である。いくつかの場合には、WGA/WTA準ランダムプライマに加えて、冗長ゲノム要素、例えば、SVA要素に特異的な単一のプライマ対を使用する標的増幅を含む本方法は、SNPベースのCNVコール、片親性ダイソミーの検出、染色体モザイク現象の検出、又は連鎖解析の実行に使用される。
【0043】
図6は、WGA及び冗長ゲノム要素の標的増幅により、SNP及びCNVなどの様々な変異を検出するための方法の実施形態を提供する。
図6では、準ランダムWGAプライマは、ゲノムの浅く均一なカバレッジを提供し、冗長ゲノム要素のための標的特異的プライマは、SNP含有領域の信頼性のあるカバレッジを提供する。
【0044】
いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマの長さは、少なくとも約5塩基対(bp)、6bp、7bp、8bp、9bp、10bp、11bp、12bp、13bp、14bp、15bp、16bp、17bp、18bp、19bp、20bp、21bp、22bp、23bp、24bp、25bp、26bp、27bp、28bp、29bp、30bp、31bp、32bp、33bp、34bp、35bp、36bp、37bp、38bp、39bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、又はそれ以上とすることができる。
【0045】
いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマの融解温度は、少なくとも約10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、60℃、65℃、70℃、又はそれ以上とすることができる。いくつかの場合には、WGA/WTAプライマは、標的特異的プライマと同じ融解温度を有することができる。他の場合には、WGA/WTAプライマは、標的特異的プライマとは異なる融解温度を有することができる。
【0046】
いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマのGC含有量は、少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、又は60%超とすることができる。いくつかの場合には、WGA/WTAプライマは、標的特異的プライマと同じGC含有量を有することができる。他の場合には、WGA/WTAプライマは、標的特異的プライマとは異なるGC含有量を有することができる。
【0047】
いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマの濃度は、1ナノモル(nM)、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、又はそれ以上とすることができる。いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマの濃度は、少なくとも5マイクロモル(μM)、10μM、15μM、20μM、25μM、30μM、40μM、50μM、100μM、200μM、300μM、400μM、500μM、600μM、700μM、800μM、900μM、又はそれ以上とすることができる。いくつかの場合には、WGA/WTAプライマは、標的特異的プライマと同じプライマ濃度を有することができる。他の場合には、WGA/WTAプライマは、標的特異的プライマとは異なるプライマ濃度を有することができる。
【0048】
いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマによって生成されるアンプリコンのサイズは、少なくとも約50bp、100bp、150bp、200bp、250bp、300bp、350bp、400bp、450bp、500bp、550bp、600bp、650bp、700bp、750bp、800bp、850bp、900bp、又はそれ以上とすることができる。いくつかの場合には、WGA/WTAプライマは、標的特異的プライマと実質的に同様のサイズのアンプリコンを生成することができる。他の場合には、WGA/WTAプライマは、標的特異的プライマとは実質的に異なるサイズのアンプリコンを生成することができる。いくつかの場合には、WGA/WTAプライマは、WGA又はWTA中に実質的に同様のサイズのアンプリコンを生成することができる。いくつかの場合には、WGA/WTAプライマは、WGA/WTA中に実質的に異なるサイズのアンプリコンを生成することができる。いくつかの場合には、標的特異的プライマは、1つ以上の標的配列の標的特異的増幅中に実質的に同様のサイズのアンプリコンを生成することができる。いくつかの場合には、標的特異的プライマは、1つ以上の標的配列の標的特異的増幅中に実質的に異なるサイズのアンプリコンを生成することができる。いくつかの場合には、WGA/WTAプライマ及び標的特異的プライマは、ゲノムの同じ領域又は実質的に同じ領域を増幅する。例えば、標的特異的プライマは、WGA/WTAプライマ内にて入れ子状にすることができ、その逆も可能である。いくつかの例では、WGA/WTAプライマ及び標的特異的プライマは、同じ又は実質的に同じアンプリコンを生成することができる。例えば、WGA/WTAプライマ及び標的特異的プライマは、核酸分子における同じ又は実質的に同じ結合部位を共有してもよい。
【0049】
いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマは、異なるヌクレオチド配列を有することができる。例えば、集団内の全て又は実質的に全てのWGA/WTAプライマは、異なるヌクレオチド配列を有することができる。同様に、集団内の全て又は実質的に全ての標的特異的プライマは、特にマルチプレックス反応のように2以上の配列が標的とされる場合に異なるヌクレオチド配列を有することができる。
【0050】
いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマは、夫々参照によりその全体が本明細書に組み込まれる、Winzelerら、(1999)Science 285:901;Brenner(2000)Genome Biol.1:1Kumarら、(2001)Nature Rev.2:302;Giaeverら、(2004)Proc.Natl.Acad.Sci.USA101:793;Easonら、(2004)Proc.Natl.Acad.Sci.USA101:11046;及びBrenner(2004)Genome Biol.5:240に記載されているような、アダプタ配列などの追加の配列、又は、固有の分子バーコードなどのバーコードを含むことができる。例えば、WGA/WTAプライマは、フローセル付着部位(例えば、P5、P7)の配列、プライマ結合部位のシーケンシングのための配列(例えば、リードプライマ1、リードプライマ2)、インデックスシーケンシングなどの、Illuminaアダプタ配列の実質的な完全物又は一部を含むことができる。いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマは、いかなる追加の配列も含まない。他のいくつかの場合では、WGA/WTAプライマは追加の配列を含むことができるが、標的特異的プライマはいかなる追加の配列も含まない。標的特異的プライマは、標的増幅が実施されるステップ及び実施される標的増幅の回数に基づいて、追加の配列を含んでもよい。例えば、標的増幅がWGAと組み合わせて実行される場合及び/又は標的増幅が実行されて、次にWGAが実行される場合、WGAに続いて実行される標的増幅で使用される標的特異的プライマは、完全又は部分的なアダプタ配列を含んでもよい。一方、標的特異的プライマが、事前増幅ステップでWGAプライマと組み合わせて含まれ、いかなる後続のステップでは含まれない場合、標的特異的プライマはアダプタ配列を含んでもよい。
【0051】
いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマは、ロック核酸(LNA)、タンパク質核酸(PNA)、メチル化核酸などの1つ以上の修飾ヌクレオチドを有することができる。いくつかの場合には、修飾には、1つ以上のホスホロチオエート結合を有する核酸、フルオロフォア(複数可)、ビオチン、アミノ修飾因子、チオール修飾因子、アルキン修飾因子、アジド修飾因子、スペーサなどが含まれてもよい。修飾ヌクレオチドは、架橋、二重安定化、又はヌクレアーゼ耐性に有用であってもよい。例えば、修飾ヌクレオチドは、エキソヌクレアーゼ又はエキソヌクレアーゼ活性を有するポリメラーゼの活性から核酸分子を保護するのに有用であってもよい。いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマは、オリゴヌクレオチドの一端又は両端(例えば、5’末端、3’末端)に修飾ヌクレオチド(複数可)を有することができる。いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマは、オリゴヌクレオチドの一端(例えば、5’末端又は3’末端)に修飾ヌクレオチド(複数可)を有することができる。
【0052】
いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマは、集団内の他のプライマに対して実質的に非自己相補的及び実質的に非相補的であるように設計され得る。例えば、集団内の塩基の相互作用を制限し、過剰なプライマ-二量体形成を防ぎ、完全若しくは散発的な遺伝子座の脱落を減らし、非常に短い増幅産物の生成を減らし、及び/又は、一本鎖の、短鎖の若しくは断片化されたDNA及びRNA分子を増幅できないことを減らすために、WGA/WTAプライマは、グアニン(G)及びチミン(T)若しくはシトシン(C)及びアデニン(A)などの非相補的塩基を含むように設計され得る。いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマは、1つ以上の縮重ヌクレオチドを有することができ、同定物を、定義された配列の代わりに、ヌクレオチドの様々な選択肢から選択することができる。縮重ヌクレオチドは、WGA/WTA及び/又は標的特異的プライマ全体に等間隔で配置されてもよい。縮重ヌクレオチドは、1つおきの塩基、2つおきの塩基、若しくは3つおきの塩基、又は、実験者がその特定用途に役立つことを見出す任意の他の配列など、特定の位置に縮重ヌクレオチドを含めることで等間隔に配置され得る。他の場合には、縮重ヌクレオチドは、プライマの縮重領域又は可変領域に制限されてもよい。縮重領域又は可変領域の例は、1つ以上の「N」残基を含んでもよく、ここで、Nは任意の塩基である。そのような縮重領域又は可変領域は、プライマ配列の5’末端及び/又は3’末端にあることができる。いくつかの場合には、5’末端には、非自己相補的塩基及び非相補的塩基に加えて、1つ以上のヌクレオチドが含まれてもよい。いくつかの場合には、WGAプライマの可変領域又は縮重領域は、例えば、Illuminaアダプタ配列、P5又はP7などのアダプタ配列を含んでもよい。いくつかの場合には、定常領域と可変領域又は縮重領域、或いはWGA/WTAプライマのいずれかの末端との間に追加の配列が含まれ得る。
【0053】
いくつかの場合には、WGA/WTAプライマ及び/又は標的特異的プライマは、核酸分子における隣り合う又は重複する位置に相補的とすることができる。例えば、
図7に示すように、順方向及び逆方向の両方の標的特異的プライマは、核酸分子上で互いに隣り合うように設計されることができる。このような標的特異的プライマは、順方向プライマ及び逆方向プライマの様々な組み合わせから生じる複数のアンプリコンを生成することができる。
図7に示すように、3つの順方向プライマ及び3つの逆方向プライマは、9つの異なるアンプリコンを生成することができる。そのような手法は、変異、例えばSNPを伴う標的配列のより大きな増幅をもたらす可能性があり、これは、ほとんど該当しない領域より該当する領域を更にカバーするのに役立つ可能性がある。
【0054】
いくつかの場合には、WGA/WTAプライマ及び標的特異的プライマは夫々、事前増幅ステップ中に全ゲノム又は全トランスクリプトーム及び標的配列(複数可)を同時に、実質的に同時に、又は次々に(例えば、WTA/WGA、その後の標的増幅、又はその逆)増幅することができる。
【0055】
いくつかの場合には、WGA/WTA及び標的増幅は、同じ管、ウェル、キャビティ、チャンバ、滴、液滴、溶液、反応などで発生する可能性がある。いくつかの場合には、WGA/WTA及び標的増幅用の試薬を共に混合して反応ボリュームに分注することができる。他のいくつかの場合では、WGA/WTA用の試薬を最初に反応ボリュームに分注し、次に標的増幅用の試薬を分注するか、又はその逆を行うことができる。言い換えれば、標的増幅用の試薬は、WGA/WTA用の試薬の上に重ねられることができる。いくつかの場合には、標的増幅及びWGA/WTA増幅は、同じ反応混合物中で同時に、又は実質的に同時に実行される。いくつかの場合には、標的増幅及びWGA/WTA増幅が同じ反応混合物内で連続して行われる。例えば、WGA/WTAプライマが自身の標的配列を増幅する前に標的特異的プライマが自身の標的配列を増幅してもよく、又はその逆であってもよい。別の例では、標的特異的プライマ及びWGA/WTAプライマは、自身の標的を実質的に同時に又は同時に増幅することができる。
【0056】
いくつかの場合には、標的特異的プライマは、標的配列(複数可)に実質的に相補的とすることができる。例えば、標的特異的プライマは、標的配列(複数可)に少なくとも約50%、65%、70%、75%、80%、85%、90%、95%、99%、又は100%、相補的とすることができる。いくつかの場合には、標的特異的プライマは、SNPなどの変異(複数可)を含む可能性が高い標的配列(複数可)を増幅することができる。いくつかの場合には、標的特異的プライマは、2つの異なるSNPなど、2以上の変異を含む標的配列(複数可)を増幅することができる。いくつかの場合には、標的特異的プライマは、SNP及びSNVなどの2以上の異なる種類の変異を含む標的配列(複数可)を増幅することができる。
【0057】
いくつかの実施形態では、標的増幅と組み合わせたWGA/WTAは、WGA/WTAアンプリコン及び標的アンプリコンを含むアンプリコンの混合物をもたらすことができる。いくつかの場合には、アンプリコンの混合物は、WGA/WTAアンプリコン及び標的アンプリコンの等しい又は実質的に等しい部分を含んでもよい。いくつかの場合には、アンプリコンの混合物は、標的アンプリコンより大きい又は実質的に大きいWGA/WTAアンプリコンの部分を含んでもよい。例えば、WGA/WTAアンプリコンはアンプリコンの混合物の90%以上を含むことができる一方、標的アンプリコンはアンプリコンの混合物の10%以下を含むことができる。
【0058】
いくつかの実施形態では、アンプリコンの混合物をシーケンサで直接シーケンシングすることができる。いくつかの場合には、シーケンシングの前に、清浄化手順、標的増幅、インデックスPCR、及び/又は任意の追加の増幅手順をアンプリコンの混合物に施すことができる。例えば、アンプリコンの混合物を清浄化してプライマ及び他の試薬(例えば、増幅試薬、溶解試薬など)を除去した後、WGAアンプリコン及び標的アンプリコンの両方をシーケンサでシーケンシングする前に、標的アンプリコンを増幅するためのネステッドPCRを行うことができる。
【0059】
清浄化ステップ
清浄化ステップを、細胞溶解後、又は1つ以上の増幅ステップ後に実行することができる。清浄化ステップは、任意の清浄化ステップで、標的増幅、インデックスPCR、シーケンシングアッセイなどの下流プロセスを妨害及び/又は阻害する可能性のある、ポリメラーゼ、溶解試薬、増幅試薬、プライマ、組み込まれていないdNTPなどを除去するのに有用である可能性がある。清浄化ステップを、当技術分野で知られている手順のいずれか1つを使用して実行することができる。例えば、標的増幅と組み合わせてWGAによって生成されたアンプリコンの混合物を、カラムベース、ゲルベース、酵素ベース、及び/又はビーズベースの精製技術によって、組み込まれていないdNTP、増幅試薬などを除去すべく清浄化することができる。
【0060】
標的増幅
標的増幅を、事前増幅ステップでWGA/WTAと組み合わせてWGA/WTAの後に実行することができる。他の場合には、事前増幅ステップはWGA/WTAのみを含んでもよく、標的増幅は、事前増幅ステップの後に実行されてもよい。他のいくつかの場合において、事前増幅ステップを実行しなくてもよく、標的特異的プライマを使用して標的配列(複数可)を増幅するために核酸分子に標的増幅を施す。
【0061】
事前増幅ステップでWGA/WTAと組み合わせて実行される標的増幅は、アンプリコンの混合物を生成し得る。アンプリコンのこの混合物を、ネステッドPCRの事前増幅ステップで使用される標的特異的プライマ内でネステッドプライマを使用して更に増幅することができる。ネステッドPCRは、シーケンシングアッセイにおけるシーケンシングのための標的配列(複数可)の十分な表現をもたらすことができる。例えば、低頻度で発生する標的配列は、最初に標的特異的プライマを使用する事前増幅ステップで増幅され、次に、ネステッドプライマを使用するネステッドPCRでの追加の標的増幅で増幅されることができる。これにより、シーケンシングアッセイでのユニークなリードの数によって決定される、十分なカバレッジによって示されるような標的配列の十分な表現が保証される。ネステッドプライマは、WGA/WTAプライマ又は標的特異的プライマと1つ以上の特徴を共有してもよい。例えば、ネステッドプライマは、WGA/WTAプライマ又は標的特異的プライマと比較して、実質的に同様のGC含有量を有してもよい。ネステッドプライマはまた、WGA/WTAプライマでのようにアダプタ配列(例えば、P5又はP7)を含んでもよく、それにより、生成されたネステッドアンプリコンは、インデックスプライマにより更に増幅されることができ、シーケンシングプラットフォーム、例えばIlluminaでのシーケンシングを可能にする。WGA/WTAプライマ又は標的特異的プライマ(例えば、ネステッドプライマ)に存在するアダプタ配列は、部分的なIllumina配列(例えば、GCTCTTCCGATCT)(配列番号21)又は完全な配列(例えば、AATGATACGGCGACCACCGAGATCTACACXXXXXXXXACACTCTTTCCCTACACGACGCTCTTCCGATCT)(配列番号22)を含んでもよく、ここで、ユーザが、インデックスPCRステップを介して間接的にシーケンシングインデックスを追加することを希望するか、又は、追加の標的増幅ステップ中にシーケンシングインデックスを直接追加することを希望するかに応じて、バーコードインデックス(例えば、サンプルインデックス)の一部として、XはA、C、G又はCである。アダプタは、Illuminaシーケンシングプラットフォームのみに特異的である必要はなく、ユーザは、選択したシーケンシングプラットフォームに適した任意の配列に一致するようにアダプタ配列を修飾してもよい。
【0062】
いくつかの場合には、標的増幅に使用されるネステッドプライマの長さは、全長又は標的特異的領域のいずれかで、少なくとも約5塩基対(bp)、6bp、7bp、8bp、9bp、10bp、11bp、12bp、13bp、14bp、15bp、16bp、17bp、18bp、19bp、20bp、21bp、22bp、23bp、24bp、25bp、26bp、27bp、28bp、29bp、30bp、31bp、32bp、33bp、34bp、35bp、36bp、37bp、38bp、39bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、又はそれ以上とすることができる。
【0063】
いくつかの場合には、アダプタ配列(複数可)の有無にかかわらず、ネステッドプライマの融解温度は、少なくとも約40℃、45℃、50℃、60℃、65℃、70℃、又はそれ以上とすることができる。いくつかの場合には、ネステッドプライマは、標的特異的プライマと同じ融解温度を有することができる。他の場合には、ネステッドプライマは、標的特異的プライマとは異なる融解温度を有することができる。
【0064】
いくつかの場合には、ネステッドプライマのGC含有量は、少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、又は60%超とすることができる。いくつかの場合には、ネステッドプライマは、標的特異的プライマ及び/又はWGA/WTAプライマと同じGC含有量を有することができる。他の場合には、ネステッドプライマは、標的特異的プライマ及び/又はWGA/WTAプライマとは異なるGC含有量を有することができる。
【0065】
いくつかの場合には、ネステッドPCRにおけるネステッドプライマの濃度は、少なくとも1ナノモル(nM)、10nM、20nM、30nM、40nM、50nM、60nM、70nM、80nM、90nM、100nM、5マイクロモル(μM)、10μM、15μM、20μM、25μM、30μM、40μM、50μM、100μM、200μM、300μM、400μM、500μM、600μM、700μM、800μM、900μM、又はそれ以上とすることができる。
【0066】
いくつかの場合には、ネステッドPCRでネステッドプライマによって生成されるアンプリコンは、少なくとも約50bp、100bp、150bp、200bp、250bp、300bp、350bp、400bp、450bp、500bp、550bp、600bp、650bp、700bp、750bp、800bp、850bp、900bp、又はそれ以上とすることができる。
【0067】
いくつかの場合には、ネステッドプライマは、ロック核酸(LNA)、タンパク質核酸(PNA)、メチル化核酸などの1つ以上の修飾ヌクレオチドを有することができる。いくつかの場合には、修飾には、1つ以上のホスホロチオエート結合を有する核酸、フルオロフォア(複数可)、ビオチン、アミノ修飾因子、チオール修飾因子、アルキン修飾因子、アジド修飾因子、スペーサが含まれてもよく、修飾ヌクレオチドは、エキソヌクレアーゼ又はエキソヌクレアーゼ活性を有するポリメラーゼの活性から核酸分子を保護するのに有用であってもよい。いくつかの場合には、ネステッドプライマは、オリゴヌクレオチドの一端又は両端(例えば、5’末端、3’末端)に修飾ヌクレオチド(複数可)を有することができる。いくつかの場合には、ネステッドプライマは、オリゴヌクレオチドの一端(例えば、5’末端又は3’末端)に修飾ヌクレオチド(複数可)を有することができる。
【0068】
インデックスPCR
事前増幅反応後又は標的増幅(例えば、ネステッドPCR)後のいずれかで、アンプリコン又は標的アンプリコンの混合物にインデックスPCRアッセイを施して、シーケンサでシーケンシングアッセイを実行するために必要であるインデックス1、インデックス2、P5、P7などの追加の核酸配列(複数可)を追加することができる。例えば、MiSeq、NextSeq、MiniSeq、HiSeq、iSeq、NovaSeqなどの異なるIlluminaシーケンサでの互換性及びライブラリクラスタリングに必要なIlluminaアダプタ配列を含むインデックスプライマをアンプリコンに追加して、更なるシーケンシングのための核酸ライブラリを生成することができる。バーコードを含むインデックスプライマを使用して、単一のラン又はレーンにプールした後、ライブラリを逆多重化することができる。
【0069】
分析
シーケンシング後、カスタムパイプラインを使用してデータを分析し、異数性、コピー数変異などのバリアントを検出できる。いくつかの場合には、パイプラインに、追加の塩基(例えば、アダプタ配列)のトリミング、参照配列(例えば、hg19)ヘのアライメント、重複リードの選別及びマーキング、並びに/又はバリアントコールなどの機能を含めることができる。いくつかの場合には、異なるインデックス配列に対応すべく、パイプラインをカスタマイズすることができる。いくつかの場合には、ユニークなリードの数で示されるような、ゲノムの浅く均一なカバレッジで十分であってもよい(例えば、約0.025×)。いくつかの場合には、SNP又は小さなインデルなどのバリアントを検出するために、確実で深いカバレッジ(例えば、>30×)が必要であってもよい。いくつかの場合には、本明細書に記載の事前増幅ステップを使用するなどして、浅いカバレッジを、SNP又は小さなインデルの検出に使用できる。シーケンシングリードは、CNV、SNP又はその両方の検出など、用途に基づいて割り当てられる必要があってもよい。
【0070】
キット
本開示の態様には、キットが更に含まれる。キットは、例えば、WGA/WTA用のプライマの集団、標的増幅用の少なくとも1つの標的特異的プライマなどを含んでもよい。キットは、CNVの検出、SNP、SNVの遺伝子型決定、マイクロサテライトの遺伝子型決定、挿入及び/若しくは欠失の検出、接合性の決定、遺伝子融合の検出、転座(複数可)の検出、又は任意の他の変異(複数可)の検出を行うためにキットを使用するための一組の説明書を含んでもよい。いくつかの場合には、キットには、サーモリシンのようなプロテアーゼ、アルカリ溶解物(NaOH)、ドデシル硫酸ナトリウム(SDS)、トリトンX-100、ジギトニン、グアニジン、3-[(3-コラミドプロピル)ジメチルアンモニオ]-1-プロパン-スルホン酸塩、レーザパルス、電気パルス、超音波処理、グリセロール、1,2プロパンジオール、ベタイン一水和物、Tween-20、ホルムアミド、テトラメチルアンモニウムクロリド(AC)、7-デアザ-2’-デオキシグアノシン、ジメチルスルホキシド(DMSO)、Triton X-100、NP-40、マグネシウム、ウシ血清アルブミン(BSA)、エチレングリコール、ジチオスレイトール(DTT)、KAPA HiFi及びKAPA HiFi Uracil+、VeraSeq Ultra DNAポリメラーゼ、VeraSeq2.0 High Fidelity DNAポリメラーゼ、Takara PrimeSTAR DNAポリメラーゼ、Agilent Pfu Turbo CXポリメラーゼ、Phusion U DNAポリメラーゼ、Deep VentR DNAポリメラーゼ、LongAmp Tag DNAポリメラーゼ、Phusion High-Fidelity DNAポリメラーゼ、Phusion Hot Start High-Fidelity DNAポリメラーゼ、Kapa High-Fidelity DNAポリメラーゼ、Q5 High-Fidelity DNAポリメラーゼ、Platinum Pfx High-Fidelityポリメラーゼ、Pfu High-Fidelity DNAポリメラーゼ、Pfu Ultra High-Fidelity DNAポリメラーゼ、KOD High-Fidelity DNAポリメラーゼ、iProof High-Fidelityポリメラーゼ、High-Fidelity 2 DNAポリメラーゼ、Velocity High-Fidelity DNAポリメラーゼ、ProofStart High-Fidelity DNAポリメラーゼ、Tigo High-Fidelity DNAポリメラーゼ、Accuzyme High-Fidelity DNAポリメラーゼ、VentR DNAポリメラーゼ、DyNAzyme II Hot Start DNAポリメラーゼ、Phire Hot Start DNAポリメラーゼ、Phusion Hot Start High-Fidelity DNAポリメラーゼ、Crimson LongAmp Tag DNAポリメラーゼ、DyNAzyme EXT DNAポリメラーゼ、LongAmp Tag DNAポリメラーゼ、Phusion High-Fidelity DNAポリメラーゼ、標準Taq(Mgフリー)バッファ付きTag DNAポリメラーゼ、標準タグバッファ付きTag DNAポリメラーゼ、ThermoPol II(Mgフリー)バッファ付きTag DNAポリメラーゼ、ThermoPolバッファ付きTag DNAポリメラーゼ、Crimson Taq DNAポリメラーゼ、(Mgフリー)バッファ付きCrimson Taq DNAポリメラーゼ、Phire Hot Start DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼ、Hemo KlenTaq、Deep VentR(exo-)DNAポリメラーゼ、Deep VentR DNAポリメラーゼ、DyNAzyme EXT DNAポリメラーゼ、Hemo KlenTaq、LongAmp Tag DNAポリメラーゼ、Prot Script AMVファーストストランドcDNA合成キット、Prot Script M-MuLVファーストストランドcDNA合成キット、Bst DNAポリメラーゼ、全長、Bst DNAポリメラーゼ、ラージフラグメント、9Nm DNAポリメラーゼ、DyNAzyme II Hot Start DNAポリメラーゼ、Hemo KlenTaq、Sulfolobus DNAポリメラーゼIV、Therminator y DNAポリメラーゼ、Therminator DNAポリメラーゼ、Therminator II DNAポリメラーゼ、Therminator III DNAポリメラーゼ、Bsu DNAポリメラーゼ、ラージフラグメント、DNAポリメラーゼI(E.coli)、DNAポリメラーゼI、ラージ(Klenow)フラグメント、Klenowフラグメント(3’¨>5’exo¨)、phi29 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 DNAポリメラーゼ(未修飾)、ターミナルトランスフェラーゼ、逆転写酵素及びRNAポリメラーゼ、E.coliポリ(A)ポリメラーゼ、AMV逆転写酵素、M-MuLV逆転写酵素、phi6 RNAポリメラーゼ(RdRP)、ポリ(U)ポリメラーゼ、5P6 RNAポリメラーゼ、及びT7 RNAポリメラーゼ、マグネシウム塩、ヌクレオチド三リン酸(dNTP)及びそれらの誘導体、塩化ナトリウム、塩化カリウム、AMPure-Beckman Coulter、NucleoMag-MACHEREY-NAGEL、MagJet-ThermoFisher、Mag-Bind-Omega Biotek、ProNexビーズ-Promega、Kapa Pure Beads-Kapa Biosystemsのような負に帯電したカルボキシル基でコーティングされた磁性(ポリスチレン)ビーズ、QIAquick PCR Purification Kit及びMinElute PCR Purification Kit-Qiagen、PureLink-Thermo Fisher Scientific、GenElute PCR Clean-Upキット-Sigma、NucleoSpin(登録商標)ゲル及びPCR Clean-up-MACHEREY-NAGELなどのシリカカラム、アガロース又はアクリルアミドゲル、エタノール又はイソプロパノール沈殿物、フェノールクロロホルム抽出物、Trisバッファ、tween-20、SDS、ヌクレオチド三リン酸(dNTP)、ジメチルスルホキシド、ジメチルホルムアミド、Tris-HCI pH8.4、硫酸アンモニウム、硝酸アンモニウム、硝酸カリウム、TMA-SO4(テトラメチルアンモニウムスルファート)、TMA-Cl(テトラメチルアンモニウムクロリド)、グリセロール、シーケンシングに必要な試薬(例えば、MiSeq試薬、NextSeq試薬)、修飾有又は修飾無のプライマオリゴヌクレオチド(例えば、ホスホロチオール化塩基付きLNA)、AMPureXPビーズ、シリカ膜カラム、エタノール、フェノール-クロロホルム抽出物、PEG抽出物、又はアガロースゲルからなる群から選択された1つ以上の試薬が含まれてもよい。
【0071】
有用性
本方法は、遺伝的障害に関連するSNP、SNV、CNV、異数性、転座、遺伝子融合などの様々な変異の検出に使用される。特定の実施形態において、本方法は、着床失敗の原因、又は流産の原因、臨床サンプルなどを理解するために、例えば片親性ダイソミーなどの染色体異常及び異数性の検出、子宮洗浄液、子宮内膜液における体細胞バリアントの検出に使用される。特定の実施形態では、本方法は、ゲノムマッピング及びゲノム全体の関連分析、例えば、SNPベースのCNVコールの実行、SNPの使用によるCNV分析の精度の決定、染色体モザイク現象の検出、及び連鎖解析の実行に使用される。本方法は、潜在的な変異を有する疑いがあるか、又はそれらの変異を有することが分かっている個人をスクリーニングするためのキャリアスクリーニングに使用される。本方法は、遺伝的障害に関連する変異を検出するための着床前の(例えば胚の一又は複数の細胞を使用した、胚が培養物であった培地を使用したなどの)胚のスクリーニングに使用される。本方法は、母体サンプル(血液、子宮頸部など)の胎児DNA又は無細胞DNAのスクリーニングに使用される。本方法はまた、生検胚又は培養培地(胚、細胞、組織若しくはオルガノイドが成長した使用済み培地など)における母体又は父体のDNA汚染又はRNA汚染などの汚染を決定する際にも使用される。本方法は、サンプル中のヘテロ接合性又はクローン性の決定に使用される。例えば、本方法は、CNV及びSNPなどの遺伝的変化について、腫瘍生検サンプル、血液サンプル、循環腫瘍細胞、無細胞DNA又はエキソソームなどのサンプルをスクリーニングするために使用され得る。このようなスクリーニングは、腫瘍細胞集団内の不均一性/クローン性を特定するのに役立ち得る。これは、臨床医が治療選択肢を決定するのに役立ち得る。いくつかの場合には、本方法は、人物同定用途、法医学用途、DNAフィンガープリンティング、DNAプロファイリング、(例えば移植若しくは生着モニタリング中の)DNAタイピング又は性決定に使用される。いくつかの場合には、本方法は、生物祖先又は系統学的な用途、親族関係分析、親子鑑定、系統発生分析、又は進化論の研究に使用される。いくつかの場合には、本方法は、薬理遺伝学、及び薬物療法に応じた変異性の決定に使用される。
【0072】
遺伝性障害の例には、軟骨形成不全症、副腎白質ジストロフィ、アルファサラセミア、アルファ-1-抗トリプシン欠乏症、アルポート症候群、筋萎縮性側索硬化症、ベータサラセミア、シャルコー・マリー・トゥース、先天性グリコシル化障害1a型、クルゾン症候群、嚢胞性線維症、デュシェンヌ型筋ジストロフィ及びベッカー型筋ジストロフィ、ジストニア1、捻転症、エメリー・ドレイファス筋ジストロフィ、顔面肩甲上腕型ジストロフィ、ファミリー性腺腫性ポリポーシス、ファミリー性アミロイド性多発神経障害、ファミリー性自律神経障害、ファンコニ貧血、脆弱X症候群、グルタル酸尿症1型、血友病A及びB、血球貪食性リンパ組織球症、ホルトオラム症候群、ハンチントン病、高インスリン血症性低血糖症、低カリウム血症性周期性麻痺、色素性尿失禁、リンチ症候群、マルファン症候群、メンケス病、異染性白質ジストロフィ、ムコ多糖症II型(ハンター症候群)、多発性内分泌新生物(MEN2)、多発性外骨症、筋ジストロフィ、神経線維腫症I型及びII型、非症候性感覚神経性難聴、ノリー症候群、骨形成不全(脆性骨疾患)、多発性嚢胞腎、常染色体優性、多発性嚢胞腎、常染色体劣性、ポンペ症候群、鎌状細胞貧血、スミス-レムリ-オピッツ症候群、痙性傍麻痺4、脊髄及び球根筋萎縮、脊髄筋萎縮、脊髄小脳性運動失調1、2及び3、脊椎後葉異形成症(シュミット)、テイサックス病、トリーチャーコリンズ症候群、結核性硬化症、フォンヒッペル-リンダウ症候群、X連鎖ジストニアパーキンソニズム(XDP)、X連鎖無ガンマグロブリン血症、白血病、遺伝性楕円細胞症及びピロポイキロサイトーシス、常染色体劣性高コレステロール血症、福山型筋ジストロフィが含まれるが、これらに限定されない。以下の実施例(複数可)は、限定としてではなく、例示として提供されている。
【0073】
(実施例)
実施例1:コピー数変異(CNV)及び一塩基多型(SNP)の検出
CNV及びSNPは、本開示を使用して同じサンプルで検出された。簡単に説明すると、CNV及びSNPは、標的特異的プライマと組み合わせたWGA/WTAプライマを伴う事前増幅手順と、その後のネステッドプライマを使用したネステッドPCRアッセイを使用する標的増幅と、シーケンサでシーケンシングアッセイを実行するために必要な配列を追加するためのインデックスPCRとを使用して、限られた数の細胞(例えば、単一の細胞又は5つの細胞)又はゲノムDNA(例えば、30pgのゲノムDNA)を含むサンプルで検出された。次世代シーケンシング(NGS)アッセイを実行して、CNV及びSNPの検出のためにカスタムバイオインフォマティクスパイプラインによって分析された配列リードを生成した。本方法により、約100万リードという低いシーケンシング深度で異なる変異を検出できた。
【0074】
アッセイは、いくつかの変更を加えたSMARTer(登録商標)PicoPLEX(登録商標)ゴールドシングルセルDNA-Seqキット(Takara Bio USA、R300669)を使用して実施された。本キットには、細胞溶解、全ゲノム増幅(WGA)、DNA精製、及びシーケンシング互換性のためのIlluminaアダプタの追加というステップが含まれている。本キットは、WGAと共に標的特異的プライマを使用してCFTR遺伝子の特定の領域を増幅するように変更された。そのため、標的特異的プライマは事前増幅ステップで追加され、ネステッドプライマは事前増幅ステップの後に追加された。
【0075】
標的特異的プライマは、該当するSNP又はインデルなどのバリアントを含むゲノムの特定の領域を増幅するように設計され、ゲノムの残りの部分より標的配列に対して高い特異性を有するように設計された。標的特異的プライマを設計する際に、標的配列に対するプライマ特異性に影響を与える可能性のある他の高頻度SNPの染色体の位置が考慮された。約600塩基対(bp)のアンプリコンを生成する標的特異的プライマを選択した。所望の標的配列をカバーする可能性を高めるために、複数の標的特異的プライマを設計して共に混合し、複数の配列を標的とした。標的特異的プライマは、ThermoBLAST(dnasoftware)などのツールを使用して設計された。3つのプライマ対が1つの標的領域を増幅するように、合計90の標的特異的プライマがCFTR遺伝子の15の領域を標的とするように設計された。プライマはIntegrated DNA Technology(Coralville、Iowa、USA)から購入した。
【0076】
最初に、CFTR遺伝子のカバレッジに対する、90の標的特異的プライマ、30の標的特異的プライマ、又はWGAプライマと組み合わせた標的特異的プライマ無しなどを使用して、標的特異的プライマの数の影響を決定した。90の標的特異的プライマには標的領域毎に3つのプライマ対が含まれた一方、30の標的特異的プライマには標的領域毎に1つのプライマ対が含まれた。WGAプライマと共に多くの標的特異的プライマを用いた事前増幅反応は、Coriell Institute(Camden、New Jersey、USA)から購入した30ピコグラム(pg)のgDNAを使用して実施された。標的特異的プライマは、SMARTer(登録商標)PicoPLEX(登録商標)ゴールドシングルセルDNA-Seqキットに含まれるPreAmp Buffer及びPreAmp Enzymeに、各標的特異的プライマの約20nMの濃度で含まれていた。
【0077】
事前増幅反応は、以下のサイクリング条件を使用して実施された。
ホットスタート:95℃で3分間-1サイクル
標的特異的増幅:95℃で15秒間、55℃で90秒間、68℃で90秒間-0~6サイクル
WGA:95℃で15秒間、15℃で50秒間、25℃で40秒間、35℃で30秒間、65℃で40秒間、75℃で40秒間-14~18サイクル
【0078】
増幅サイクルの数は、更なる分析のために十分な量のアンプリコン(例えば、0.5~5ナノグラム)が得られるように調整された。所望であれば、WGAとは別の反応で標的特異的増幅を行うことができる。この場合、標的特異的プライマは、最適なサイクリング条件により、標的配列(複数可)を効率的に増幅することができる。その後、例えばAMPure XPビーズ(Beckman Coulter、カタログ番号A63882)を使用して、増幅されたDNAを清浄化してプライマを除去した。
【0079】
図8Aに示されるように、CFTR遺伝子における15の異なる標的領域のカバレッジが、3つの異なるプライマの組み合わせ間で比較された-0の標的特異的プライマ(0のブースタープライマ)、30の標的特異的プライマ(15の順方向プライマ及び15の逆方向プライマ;30のブースタープライマ)、及び90の標的特異的プライマ(45の順方向プライマ及び45の逆方向プライマ;90のブースタープライマ)が、カバレッジ、及び遺伝子に亘るカバレッジの変動について比較された。
図8Aに示すように、標的特異的プライマの数は、CFTR標的配列に亘るカバレッジに直接関連していた。X軸は、CFTR標的配列内の15の標的領域を示している。Y軸は、CFTR標的遺伝子に亘る、ユニークなリードの数で示されるような、シーケンシングリード又はカバレッジの数を示す。例えば、30の標的特異的プライマを使用した場合、又は標的特異的プライマを使用しなかった場合と比較して、90の標的特異的プライマを使用した場合、標的配列に亘るより広いカバレッジが観察された。次に、
図8Bに示されるように、90の標的特異的プライマは、30の標的特異的プライマを使用した場合又は標的特異的プライマ無しの場合と比較して、CFTR標的配列に亘るカバレッジの変動を減少させた。言い換えると、30の標的特異的プライマを使用した場合のカバレッジと比較して、90の標的特異的プライマを使用した場合の方がより均一なカバレッジが観察された。X軸は各反応におけるプライマの数を示し、Y軸は変動係数を示す。90の標的特異的プライマを使用した場合、カバレッジの変動係数は0.5未満であったが、30の標的特異的プライマを使用した場合又は標的特異的プライマを使用しなかった場合、カバレッジの変動係数は1に近くなった。
【0080】
更に、CFTR領域の標的増幅を、ネステッドPCRアッセイでネステッドプライマを使用して実行した。合計15のネステッドプライマ対が設計され、各プライマは、各末端、すなわち5’末端と3’末端とに1つずつ2つの機能断片を含んでいた。プライマの5’末端断片には、Illuminaアダプタ配列が含まれていた。より具体的には、順方向プライマ及び逆方向プライマは、P5及びP7 Illuminaアダプタの13の共通塩基を含んでいた。順方向プライマには、下線付きのP5に特異的な6つの追加塩基が含まれていた(リード1):CACGACGCTCTTCCGATCT(配列番号23)一方、逆方向プライマには、下線付きのP7に特異的な7つの追加塩基が含まれていた(リード2);GACGTGTGCTCTTCCGATCT(配列番号24)。ネステッドプライマの3’末端断片は、事前増幅ステップで標的特異的プライマによって生成されたアンプリコンのセグメントを増幅するように設計された。ネステッドプライマの選択及び設計の際に、プライマの特異性が考慮された。事前増幅ステップで使用される標的特異的プライマと同様に、標的特異的なネステッドプライマは、ThermoBLAST(dnasoftware)などのツールを使用して設計され、該当する領域と比較してゲノムの他の領域への親和性が制限されたプライマが選択された。ネステッドプライマを設計する際、標的配列に対するプライマの特異性に影響を与える可能性のある他の高頻度SNPの染色体の位置も考慮された。約150塩基対(bp)のアンプリコンを生成するネステッドプライマが選択された。シーケンサによって生成されたシーケンシングリードにバリアントが確実に含まれているために、ネステッドPCRによって生成されたアンプリコン内の該当するバリアント、SNP又はインデルの位置が考慮された。例えば、2×75塩基対の対エンドリードが望ましかったため、標的SNP又は変異が最初の75塩基(アンプリコンの生成に使用されるネステッドプライマのいずれかの3’末端から15~60又は30~40塩基など)に含まれるようにネステッドPCRを実行した。複数のネステッドプライマを共に混合して、増幅された標的の数を多重化した。最終濃度25nMの30のネステッドプライマを、SMARTer(登録商標)PicoPLEX(登録商標)ゴールドシングルセルDNA-SeqキットのAmplification Buffer(還元マグネシウムバージョン)及びAmplification Enzymeと混合した。ネステッドPCRアッセイは、以下のサイクリング条件を使用して実行された。
95℃で3分間-1サイクル
95℃で30秒間、56℃で2分間、68℃で30秒間-14サイクル
【0081】
ネステッドPCRステップの全内容物は、SMARTer(登録商標)PicoPLEX(登録商標)ゴールドシングルセルDNA-SeqキットのAmplification Buffer及びAmplification Enzymeと、インデックスプライマSMARTer DNA HT Dual Index Kit-24N(Takara Bio、カタログ番号R400664)又はSMARTer DNA Unique Dual Index Kit-24UセットA~D(Takara Bio、カタログ番号R400665~R400668)又はSMARTer DNA HT Dual Index Kit-96NセットA~D(Takara Bio、カタログ番号R400660~R400663)とに追加された。全てのインデックスプライマには、Miseq、NextSeq、Miniseq、HiSeq、iSeq又はNovaSeqなどの異なるIlluminaシーケンサでの互換性及びライブラリクラスタリングに必要な必須のIlluminaアダプタ配列が含まれていた。複数の異なるサンプルから生成されて同じシーケンシングラン又はシーケンシングレーンで同時的にシーケンシングされたライブラリの逆多重化を可能にするために、インデックスプライマにバーコードも含まれていた。
【0082】
インデックスPCRは、以下のサイクリング条件を使用して実行された。
95℃で3分間-1サイクル
95℃で30秒間、63℃で30秒間、68℃で60秒間-4サイクル
95℃で30秒間、68℃で60秒間-6~10サイクル
【0083】
サイクル数は、インデックスPCR中に適切な産物収量(例えば、100~500ナノグラム)が得られるように調整された。増幅されたライブラリは、AMPure XPビーズ(Beckman Coulter、カタログ番号A63882)を製造元の説明書に従って使用して、増幅試薬、プライマ、DNAポリメラーゼ及び他のものを除去するために清浄化された。ライブラリは、MiSeq又はNextSeqで2×75サイクルで更に処理された。
【0084】
シーケンシング後、カスタムパイプラインを使用してデータを分析した。まず、fastqファイルが合計100万回のリードにダウンサンプリングされた。アダプタ配列とリードの最初の14塩基がトリミングされ、Trimmomaticを使用して低品質リードが濾過された(Bolger AM,Lohse M及びUsadel B.,Trimmomatic:a flexible trimmer for Illumina sequence data,Bioinformatics.2014 Aug 1;30(15):2114-2120)。その後、ヒトゲノムアセンブリGRCh37(Church DMら、Modernizing reference genome assemblies,PLoS Biol.2011 Jul;9(7):e1001091)へのアラインメントが、Bowtie2で実施された(Langmead B,Salzberg S.Fast gapped-read alignment with Bowtie 2.Nature Methods.2012,9:357-359)。バリアントコールが、Vardictを使用して実施された(Lai Z,Markovets A,Ahdesmaki M,Chapman B,Hofmann O,McEwen R,Johnson J,Dougherty B,Barrett JC,及びDry JR. VarDict:a novel and versatile variant caller for next-generation sequencing in cancer research.Nucleic Acids Res.2016,pii:gkw227)。
【0085】
CNVは、浅いが一様なカバレッジで検出できるが、SNP、SNV又は小さなインデルなどのバリアントは、より深いカバレッジが必要になる場合がある。従って、CNV及びSNP、SNVを検出するために、全ゲノムのカバレッジとCFTR遺伝子の標的領域のカバレッジとに割り当てられたシーケンシングリードの数が最適化された。そのために、ゲノムとCFTR遺伝子とのカバレッジを、2つの条件、つまりWGA及び標的増幅による事前増幅と、標的増幅無しのWGAによる事前増幅とで比較した。どちらの場合も、標的増幅は事前増幅ステップの後に実行された。30ピコグラムのゲノムDNAをアッセイに使用した。
【0086】
図9Aに示すように、標的増幅を伴わない事前増幅ステップと比較して、事前増幅ステップが標的増幅を含む場合、より高い割合のCFTR遺伝子のリードが得られた。X軸は、2つのアッセイ-事前増幅ステップでCFTR遺伝子の標的増幅がある場合及びCFTR遺伝子の標的増幅がない場合-の結果を示している。Y軸はリードの割合を示す。事前増幅ステップが標的増幅を含まなかったリードの割合(4.3%)と比較して、事前増幅ステップが標的増幅を含んだ場合、より高い割合のリード(12%)が得られた。逆に、事前増幅ステップに標的増幅が含まれる場合のアッセイからのリード(88%)と比較して、事前増幅ステップに標的増幅が含まれない場合、WGAからのリードの割合が高いことが観察された(95.7%)。
図9Bに示すように、事前増幅ステップでの標的増幅無しのアッセイで得られたカバレッジ(3184×)と比較した場合、事前増幅ステップでの標的増幅有りのアッセイで、CFTR遺伝子(8633×)のユニークなリードの数によって示されるように、より大きなカバレッジが観察された。X軸は、2つの異なるアッセイ-事前増幅ステップでのCFTR遺伝子の標的増幅有り及び標的増幅無しを示している。Y軸は平均カバレッジを示す。更に、CFTR遺伝子における15の異なる領域に亘るカバレッジの均一性は、事前増幅ステップにおける標的増幅無しのカバレッジ(
図9D)と比較した場合、事前増幅ステップに含まれる標的増幅を伴うアッセイ(
図9C)で改善された。X軸はCFTR遺伝子における15の異なる標的領域を示し、Y軸は各標的領域でのカバレッジ又はユニークなリードの数を示す。
【0087】
CFTR遺伝子の15のアンプリコンに亘るカバレッジの均一性は、事前増幅ステップと、その後の標的増幅及びシーケンシング用のライブラリ分子を生成するためのインデックスPCRとで単一の細胞(n=4)及び5つの選別細胞(n=4)を使用し、90の標的特異的プライマを使用して評価された。
図10A及び
図10Bに示されるように、CFTR遺伝子における15の標的領域に亘る、より均一なカバレッジが、単一の細胞のサンプルと比較して5つの細胞のサンプルで観察された。しかし、カバレッジの均一性は、更なる分析のために両方のサンプルタイプで完全に許容可能であった。
【0088】
次に、CFTR遺伝子のバリアントを検出するためにシーケンシングリードを分析した。表1に示すように、GM07552及びGM012785の両方について単一の細胞又は5つの選別細胞を使用して、異なるバリアントとその対立遺伝子頻度が検出された。GM07552細胞は、既知のバリアントであるPhe508DEL、Arg553TERを含み、CFTR遺伝子に7T/9Tの対立遺伝子を有する。GM12785細胞は、CFTR遺伝子にARG347PRO、GLY551ASP、7T/7Tの既知バリアントを含んでいる。GM07552又はGM12785を使用して5つの選別細胞で実行された実験では、全てのヘテロ接合バリアントが0.2~0.8の対立遺伝子頻度で正確に識別された。パネルによってカバーされている全ての塩基(2,250塩基)が調査されたとき、0.1の対立遺伝子頻度を超える他のバリアントは報告されなかった。偽陽性率は事実上0%であった。同様に、ヘテロ接合バリアントは、単一の細胞を使用して識別された。
【0089】
【0090】
1Mbビンのシーケンシングリードの分布は、
図11A及び
図11Bに夫々示されているように、GM12785-5つの細胞又は単一の細胞を使用して決定された。
図11A及び
図11Bに示されているように、ビン当たりのリード数は、様々なビンに亘る5つの細胞のサンプルと単一の細胞のサンプルとの間で同様のパターンを示し、アッセイの感度及び再現性を示している。
【0091】
GM12785の、
図12Aに示されるような5つの選別細胞(N=4)の複製、及び
図12Bに示されるような単一の細胞(N=4)の複製間のリード分布の再現性が、ピアソンの相関及びスピアマンの相関を計算することによって評価された。5つの細胞の複製及び単一の細胞の複製の両方で強い相関が観察され、標的プライマの存在下でも全ゲノム増幅の信頼性が示された。各ビンのlog2比が、5つのGM12785の選別細胞又は単一の細胞の2つの複製間で計算され、
図12Cに示されているようにIGV(Broad Institute)を使用してプロットされた。示されているように、ビンは2つの複製間で保存されており、予想されるコピー数の変動が、GM05067及びGM22601の夫々染色体9及び染色体4で観察された。
【0092】
要約すると、SMARTer(登録商標)PicoPLEX(登録商標)ゴールドシングルセルDNA-Seqに標的特異的プライマとネステッドプライマとを追加することで、ゲノムの確実且つ均一なカバレッジ、及び単一のチューブワークフローでの単一の細胞又は5つの細胞からのCFTR遺伝子の15の主要領域の深いカバレッジが可能になった。合計100万回のリードを使用した場合、アッセイは良好に機能した。5つの選別細胞を使用した場合、5つの異なる特徴付けられたヘテロ接合変異の検出は事実上100%であった。2,250塩基のパネルでは偽陽性は検出されなかった。
【0093】
実施例2:SNP検出のための標的増幅
この実施例では、例えばキャリアスクリーニングでSNPを検出するための標的特異的プライマの使用を示した。15ngのゲノムDNA、NA07552又はNA012785が、GM07552細胞又はGM12785細胞から夫々抽出された。GM07552細胞は、CFTRのPhe508DEL、Arg553TERという既知のバリアントを含んでおり、対立遺伝子7T/9Tを有する。GM12785は、CFTR遺伝子にArg347Pro、Gly551Aspという既知のバリアントを含んでおり、対立遺伝子7T/7Tを有する。CFTR遺伝子における15の異なるバリアントを増幅するために、抽出されたゲノムDNA、NA07552又はNA012785に15対の標的特異的プライマを使用して標的増幅を施した。最終濃度25nMの標的特異的プライマを、SMARTer(登録商標)PicoPLEX(登録商標)ゴールドシングルセルDNA-SeqキットのAmplification Buffer(還元マグネシウムバージョン)及びAmplification Enzymeと混合した。標的増幅PCRは次のように実行された。
95℃で3分間-1サイクル
95℃で30秒間、56℃で2分間、68℃で30秒間-14サイクル
【0094】
標的増幅の内容物は、SMARTer(登録商標)PicoPLEX(登録商標)ゴールドシングルセルDNA-SeqキットのAmplification Buffer及びAmplification Enzymeと、インデックスプライマSMARTer DNA HT Dual Index Kit-24N(Takara Bio、カタログ番号R400664)又はSMARTer DNA Unique Dual Index Kit-24UセットA~D(Takara Bio、カタログ番号R400665~R400668)又はSMARTer DNA HT Dual Index Kit-96NセットA~D(Takara Bio、カタログ番号R400660-R400663)とに追加された。全てのインデックスプライマには、Miseq、NextSeq、Miniseq、HiSeq、iSeq、NovaSeqなどの異なるIlluminaシーケンサでの互換性及びライブラリクラスタリングに必要なIlluminaアダプタ配列が含まれていた。インデックスプライマには、単一のランにプールした後にライブラリを逆多重化するために使用されるバーコードも含まれていた。
【0095】
インデックスPCRは次のように実行された。
95℃で3分間-1サイクル
95℃で30秒間、63℃で30秒間、68℃で60秒間-4サイクル
95℃で30秒間、68℃で60秒間-6サイクル
【0096】
増幅されたライブラリは、AMPure XPビーズ(Beckman Coulter、カタログ番号A63882)を使用して、増幅試薬、プライマ、DNAポリメラーゼ及び他のものを除去するために清浄化された。ライブラリは、MiSeq 2×75サイクルで更に処理された。
【0097】
シーケンシング後、カスタムバイオインフォマティクスパイプラインを使用してデータを分析した。まず、fastqファイルが合計100万回のリードにダウンサンプリングされた。アダプタ配列とリードの最初の14塩基とがトリミングされ、Trimmomaticを使用して低品質リードが濾過された(Bolger AM,Lohse M及びUsadel B.,Trimmomatic:a flexible trimmer for Illumina sequence data,Bioinformatics.2014 Aug 1;30(15):2114-2120)。その後、ヒトゲノムアセンブリGRCh37(Church DMら、Modernizing reference genome assemblies,PLoS Biol.2011 Jul;9(7):e1001091)へのアラインメントが、続いてBowtie2で実施された(Langmead B,Salzberg S.Fast gapped-read alignment with Bowtie 2.Nature Methods.2012,9:357-359)。バリアントコールが、Vardictを使用して実施された(Lai Z,Markovets A,Ahdesmaki M,Chapman B,Hofmann O,McEwen R,Johnson J,Dougherty B,Barrett JC,及びDry JR. VarDict:a novel and versatile variant caller for next-generation sequencing in cancer research.Nucleic Acids Res.2016,pii:gkw227)。
【0098】
図13に示すように、CFTR遺伝子における15の標的領域に亘る一様なカバレッジが、本開示に記載される標的特異的プライマを使用する標的増幅のみで観察された。X軸は、CFTR遺伝子における15の標的領域又はバリアントを示している。Y軸は、標的領域毎のユニークなリードの数で示されるようなカバレッジを示す。更に表2に示すように、標的増幅のみを使用して、0.4~0.6の間の対立遺伝子頻度で5つのヘテロ接合バリアント全てを正確に同定することができた。パネルによってカバーされている全ての塩基(2,250塩基)が調査されたとき、0.05の対立遺伝子頻度を超える他のバリアントは報告されなかった。偽陽性率は事実上0%であった。
【0099】
【0100】
この実験に基づいて、特にWGAが不要な場合、又は大量の入力DNAが利用可能な場合に、標的増幅を使用してSNPを検出できると結論付けた。そのような例の1つには、親のキャリアスクリーニングにおけるSNPの検出が含まれてもよい。
【0101】
実施例3:臨床サンプルにおけるCFTR変異の検出
この研究は、2ステップ方法を使用する従来のSNP及びCNV分析を既に施した胚から収集された栄養外胚葉生検サンプルを使用して行われ、それにより、第1の生検がSNP決定に使用され、その後、第2の生検がコピー数の決定に使用された。これは、
図14Aに概略的に略述されている。4つの胚は、病原性CFTRバリアントSNP、F1052Vのキャリアであると決定された母親と、R117Hバリアントのキャリアであると決定された父親とに由来した。
図14Aに示すように、第1の生検では、胚3及び胚4が複合ヘテロ接合体であり、母親と父親との両方からの病原性バリアントを保持していることが明らかになった。従って、これら2つの胚は、第2の生検を使用して可能性のあるコピー数変異(CNV)について更にスクリーニングされなかった。胚1及び胚2は、第2の生検のために繰り越され、可能性のあるCNV異数性が胚1及び胚2で同定された。
【0102】
この実施例では、本開示に記載の方法を使用して、同じ4つの胚から第3の生検を行い、本開示の方法が単一の生検試験からSNP及びCNVの両方の異常をどのように特定できるかを示すために使用した。これは、
図14Bに概略的に示されている。略5つの細胞を夫々含む栄養外胚葉生検サンプル(n=4)を採取して、WGA及び標的増幅の組み合わせを使用する本開示の方法を実施した。同じ生検サンプルから実験を2回繰り返し、その結果を
図14Cに示す。上部パネル(
図14C)に示すように、母体及び父体の病原性CFTRバリアントの4つの胚の夫々の接合性が評価され、両方の場合で従来の方法と一致することがわかり、胚3及び胚4が複合ヘテロ接合体であり、胚1は母体のCFTRバリアントのキャリアであり、胚2は野生型であることが明らかになった。下部パネル(
図14D)には、実行されたアッセイの対の1つからの4つの胚のCNV分析が更に示されている。これにより、胚1、胚3及び胚4は正常な核型を有したのに対し、胚2は染色体19qの部分的な欠損を示したことが明らかになり、従来の2ステップ方法で得られた結果を確認した。胚1は野生型であることが判明した。これは、胚のモザイク現象を反映している可能性がある。結論として、本発明のWGA/標的シーケンシング方法の組み合わせにより、単一の胚生検からSNP及びCNVの変化を決定できることが示され、従って、SNP及びCNVを別々に評価する従来の2ステップ方法より有用性が向上する。
【0103】
実施例4:SVA要素のバリアントの検出
SNP及びCNVは、ヒトゲノムDNAのサンプルと、全ゲノム増幅用のプライマ対と組み合わせて冗長ゲノム要素を増幅するための単一の標的特異的プライマ対を含む事前増幅手順とを使用して検出された。SVA要素は、全ての常染色体及び性染色体に、全ての染色体でのSNPベース分析を可能にする密度で見られるため、冗長ゲノム要素の候補として選択された(表3)。
【0104】
【0105】
SVA要素の数及び位置は、hg38ヒトゲノムアセンブリを使用して繰り返しDNAファミリーのDfamデータベースからアクセスされた。SVA要素の密度は、hg38ヒトゲノムアセンブリを使用した各染色体のマッピング可能部分に基づいている。
【0106】
これらのSVA要素に含まれるSNPの数を決定するために、米国国立生物工学情報センターからのヒトSNPデータベースの最新公開物が、SVA要素内で見つかったSNPの総数と有益なSNP数(マイナー対立遺伝子頻度≧0.05)とを決定するために参照として使用された(表4)。SVA要素内で見つかった推定146,856の有益なSNPは、平均して67,109bp毎に1回発生する。有益なSNPは、全ての染色体に亘るSVA要素内で発生する(
図15)。
【0107】
【0108】
SVA要素には7つの異なる領域が含まれている(
図5)。標的特異的プライマ対は、Alu様領域又はSINE-R領域などのSVA要素の領域を増幅するように設計された。50の候補標的特異的プライマを、標的SVA要素を増幅する能力についてスクリーニングした。標的特異的プライマは、BiSearch Primer Design and Search Toolなどのツールを使用して設計された(
図16)(Aranyiら、(2006))。
図16に開示されている順方向プライマ及び逆方向プライマの25の異なるプライマ対の組み合わせが、領域毎、すなわちAlu様領域又はSINE-R領域毎にテストされた。合計50のプライマ対の組み合わせがテストされ、標的領域を首尾よく増幅し、予測サイズに近いアンプリコン産物を生成した標的特異的プライマが、本開示で提供されるように、WGA/WTA法の事前増幅ステップに組み込むために選択された。50のプライマ対から、合計37のSVA特異的プライマ対が選択された。
【0109】
要約すると、全ゲノム増幅プロセスの事前増幅ステップにSVA特異的プライマ対を組み込むと、SVA要素のSNP含有領域がヒトゲノムに亘る密度及び分布で増幅され、この特許出願の方法の段落で詳細に記載されたSNPベース分析が実行される。
【0110】
前述の発明は、理解を明確にするために例示及び実施例としていくらか詳細に説明されてきたが、この発明の教示に照らして添付の特許請求の範囲の趣旨又は範囲から逸脱することなく特定の変更及び修正をこの発明になしてもよいことが当業者には容易に明らかである。
【0111】
従って、上記は本発明の原理を単に説明するものである。当業者は、本明細書に明示的に記載又は示されていないが、本発明の原理を具体化し、その趣旨及び範囲内に含まれる様々な構成を考案し得ることが理解される。更に、本明細書に記載された全ての例及び条件付き言語は、主に、本発明の原理及び本発明者が技術を促進するために寄与する概念を読者が理解することを支援することが意図されており、そのような具体的に記載された例及び条件に限定されるものではないと解釈されるべきである。更に、本発明の原理、態様、及び実施形態を本明細書にて記載する全ての記述、並びにそれらの具体例は、それらの構造的均等物及び機能的均等物の両方を包含することが意図されている。更に、そのような均等物には、現在知られている均等物及び将来開発される均等物の両方、すなわち、構造に関係なく同じ機能を実行するあらゆる開発要素が含まれることが意図される。更に、本明細書に開示されているものは全て、そのような開示が特許請求の範囲に明示的に記載されているかどうかにかかわらず、公益に捧げられることが意図されていない。
【0112】
従って、本発明の範囲は、本明細書に示されて説明される例示的な実施形態に限定されることを意図するものではない。むしろ、本発明の範囲及び趣旨は、添付の特許請求の範囲によって具体化される。特許請求の範囲に関して、米国特許法第112条(f)又は米国特許法第112条(6)は、請求項にて「ための手段」という正確な句又は「ためのステップ」という正確な句がそのような制限の冒頭に記載されている場合にのみ、請求項の制限について適用されると明示的に定義されており、そのような正確な句が請求項における制限で使用されていない場合、米国特許法第112条(f)又は米国特許法第112条(6)は適用されない。
【0113】
(関連出願への相互参照)
米国特許法第119条(e)に準拠して、この出願は、2019年2月15日に提出された米国仮特許出願第62/806698号明細書の出願日の優先権を主張しており、その開示が参照により本明細書に組み込まれる。
【配列表】
【国際調査報告】