IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ガーヴァン インスティチュート オブ メディカル リサーチの特許一覧

<>
  • 特表-参照ラダー及びアダプター 図1
  • 特表-参照ラダー及びアダプター 図2
  • 特表-参照ラダー及びアダプター 図3
  • 特表-参照ラダー及びアダプター 図4
  • 特表-参照ラダー及びアダプター 図5
  • 特表-参照ラダー及びアダプター 図6
  • 特表-参照ラダー及びアダプター 図7
  • 特表-参照ラダー及びアダプター 図8
  • 特表-参照ラダー及びアダプター 図9
  • 特表-参照ラダー及びアダプター 図10
  • 特表-参照ラダー及びアダプター 図11
  • 特表-参照ラダー及びアダプター 図12
  • 特表-参照ラダー及びアダプター 図13
  • 特表-参照ラダー及びアダプター 図14
  • 特表-参照ラダー及びアダプター 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-04-03
(54)【発明の名称】参照ラダー及びアダプター
(51)【国際特許分類】
   C12N 15/63 20060101AFI20230327BHJP
   C12Q 1/6869 20180101ALI20230327BHJP
   C12Q 1/6876 20180101ALI20230327BHJP
【FI】
C12N15/63 Z ZNA
C12Q1/6869 Z
C12Q1/6876 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022548803
(86)(22)【出願日】2021-02-12
(85)【翻訳文提出日】2022-10-04
(86)【国際出願番号】 AU2021050123
(87)【国際公開番号】W WO2021159184
(87)【国際公開日】2021-08-19
(31)【優先権主張番号】2020900400
(32)【優先日】2020-02-13
(33)【優先権主張国・地域又は機関】AU
(31)【優先権主張番号】2020900401
(32)【優先日】2020-02-13
(33)【優先権主張国・地域又は機関】AU
(81)【指定国・地域】
(71)【出願人】
【識別番号】500139280
【氏名又は名称】ガーヴァン インスティチュート オブ メディカル リサーチ
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】マーサー,ティモシー
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QQ42
4B063QQ52
4B063QR08
4B063QR42
4B063QR55
4B063QR62
4B063QS34
4B063QX01
(57)【要約】
本開示は、概して、サンプル中のポリヌクレオチドの識別情報及び/又は分量を決定する方法のキャリブレーションにおいて有用なポリヌクレオチドに関する。詳細には、本開示は、参照ラダー又は参照アダプターとして機能するキャリブレーション配列を含むポリヌクレオチドに関する。本ポリヌクレオチドは、ハイスループットシーケンシング方法(例えば、次世代シーケンシング、即ちNGS方法と称されるもの)を含めて、多様なシーケンシング方法のキャリブレーションに使用され得る。本開示は、概して、例えば多様なシーケンシング方法のキャリブレーションを含めて、多様な適用におけるこれらのポリヌクレオチドの使用にも関する。
【特許請求の範囲】
【請求項1】
2つ以上のキャリブレーション配列を含む単離ポリヌクレオチド配列であって、前記キャリブレーション配列が、それぞれ独立に、天然に存在するポリヌクレオチド配列を表し、前記キャリブレーション配列が、天然に存在するいかなるゲノムにも見られない配置で、前記ポリヌクレオチド配列内で連続して配置される、単離ポリヌクレオチド配列。
【請求項2】
前記キャリブレーション配列の1つ以上が、前記ポリヌクレオチド配列内に2つ以上のコピー数で存在する、請求項1に記載のポリヌクレオチド配列。
【請求項3】
第1のキャリブレーション配列が、エクソン、イントロン、遺伝子、アレル、染色体又はゲノム配列を表し、第2のキャリブレーション配列は、前記第1のキャリブレーション配列と異なり、及び独立に、異なるエクソン、イントロン、遺伝子、アレル、染色体又はゲノム配列を表す、請求項1又は2に記載のポリヌクレオチド配列。
【請求項4】
前記第2のキャリブレーション配列が、前記第1のキャリブレーション配列の変異体を表す、請求項3に記載のポリヌクレオチド配列。
【請求項5】
前記第2のキャリブレーション配列が、前記第1のキャリブレーション配列と少なくとも90%同一である、請求項4に記載のポリヌクレオチド配列。
【請求項6】
前記変異体が、前記第1のキャリブレーション配列と比較して、1つ以上のSNP、1つ以上の挿入、1つ以上の欠失、1つ以上のマイクロサテライト、多塩基多型、1つ以上のデュプリケーション、1つ以上のタンデムリピート数変異体、1つ以上の逆位、1つ以上のトランジション、1つ以上のトランスバージョン及び/又は1つ以上の転座を含む、請求項5に記載のポリヌクレオチド配列。
【請求項7】
前記第1のキャリブレーション配列及び/又は前記第2のキャリブレーション配列が、癌、遺伝性疾患、病原体、薬物耐性、循環腫瘍DNA、循環胎児DNA、循環母体DNA又は他の目的とする属性のいずれか1つ以上を示す、請求項3~6のいずれか一項に記載のポリヌクレオチド配列。
【請求項8】
前記2つ以上のコピー数が、前記キャリブレーション配列によって表される前記天然に存在する配列の天然に存在する頻度を再現するように選択される、請求項2~7のいずれか一項に記載のポリヌクレオチド配列。
【請求項9】
前記2つ以上のコピー数が、天然に存在するヒトポリヌクレオチド配列のホモ接合性、ヘテロ接合性及び/又は体細胞性アレル頻度のいずれか1つ以上を再現するように選択される、請求項8に記載のポリヌクレオチド配列。
【請求項10】
前記2つ以上のコピー数が、ゲノム存在量、染色体存在量、遺伝子発現レベル、アイソフォーム発現レベル、変異体アレル頻度、ホモ接合遺伝子型、ヘテロ接合遺伝子型、体細胞突然変異頻度、コピー数変異、遺伝子増幅、遺伝子欠失、トリソミー、染色体異数性、微生物存在量、ウイルス存在量又は各種のmRNA発現レベルのいずれか1つ以上を再現するように選択される、請求項8に記載のポリヌクレオチド配列。
【請求項11】
一方のキャリブレーション配列が、母系由来のポリヌクレオチドを表し、及びもう一方のキャリブレーション配列が、父系由来のポリヌクレオチドを表す、請求項1~10のいずれか一項に記載のポリヌクレオチド配列。
【請求項12】
前記天然に存在するポリヌクレオチド配列が、ヒト、原核生物、細菌、ウイルス、ファージ又は細胞小器官ゲノムに由来する、請求項1~11のいずれか一項に記載のポリヌクレオチド配列。
【請求項13】
前記キャリブレーション配列が、独立に、18ヌクレオチド長~20,000ヌクレオチド長である、請求項1~12のいずれか一項に記載のポリヌクレオチド配列。
【請求項14】
前記キャリブレーション配列が、独立に、100ヌクレオチド長~2,000ヌクレオチド長である、請求項13に記載のポリヌクレオチド配列。
【請求項15】
前記キャリブレーション配列の2つ以上が、スペーサー配列によって隔てられる、請求項1~14のいずれか一項に記載のポリヌクレオチド配列。
【請求項16】
前記キャリブレーション配列の1つ以上の5’側及び/又は3’側に位置する1つ以上のフランキング又は末端配列を含む、請求項1~15のいずれか一項に記載のポリヌクレオチド配列。
【請求項17】
前記キャリブレーション配列の2つ以上が、前記ポリヌクレオチド配列内で連続して配置される、請求項1~14のいずれか一項に記載のポリヌクレオチド配列。
【請求項18】
前記キャリブレーション配列の少なくとも2つが、異なるヌクレオチド長のものである、請求項1~17のいずれか一項に記載のポリヌクレオチド配列。
【請求項19】
DNA又はRNAポリヌクレオチド配列である、請求項1~18のいずれか一項に記載のポリヌクレオチド配列。
【請求項20】
5’プロモーター;フランキング(3’及び5’)エンドヌクレアーゼ部位;及び3’ポリアデニンリピートトラクトのいずれか1つ以上に作動可能に連結されている、請求項1~19のいずれか一項に記載のポリヌクレオチド配列をコードするDNA配列を含むベクター。
【請求項21】
請求項1~19のいずれか一項に記載のポリヌクレオチド配列を作成する方法であって、前記2つ以上のキャリブレーション配列を提供し、及びライゲートすることを含み;任意選択で、存在する場合、フランキング若しくは末端配列及び/又はスペーサー配列を提供し、及びライゲートすることを更に含む方法。
【請求項22】
請求項1~19のいずれか一項に記載の2つ以上のポリヌクレオチド配列を含む組成物。
【請求項23】
循環DNA検出方法をキャリブレーションするためのポリヌクレオチドを提供する方法であって、請求項1~19のいずれか一項に記載のポリヌクレオチド配列を断片化して、1つ以上のポリヌクレオチド断片を作製することを含み、前記1つ以上のポリヌクレオチド断片は、循環DNA検出方法のキャリブレーションに好適である、方法。
【請求項24】
RNAシーケンシング方法をキャリブレーションするためのポリヌクレオチドを提供する方法であって、DNAポリヌクレオチド配列である、請求項1~19のいずれか一項に記載のポリヌクレオチド配列のインビトロ転写を実施して、1つ以上のRNA断片を作製することを含み、前記1つ以上のRNA断片は、RNAシーケンシング方法のキャリブレーションに好適である、方法。
【請求項25】
ポリヌクレオチドシーケンシングプロセスをキャリブレーションする方法であって、
i)請求項1~19のいずれか一項に記載のポリヌクレオチド配列を所与の組のパラメータ下でポリヌクレオチドシーケンシングプロセスに供すること;
ii)i)で実施された前記シーケンシングプロセスによって決定されるとおりの前記キャリブレーション配列の配列を記録すること;
iii)ii)で記録された前記キャリブレーション配列の前記配列を、請求項1~19のいずれか一項に記載のポリヌクレオチド配列中のそれぞれのキャリブレーション配列の既知の配列と比較すること;及び
iv)目的とするポリヌクレオチドを含むサンプルを、前記同じ組のパラメータ下において、i)で実施された前記同じシーケンシングプロセスに供すること
を含み、iii)における配列決定の精度は、iv)における配列決定をキャリブレーションするために使用される、方法。
【請求項26】
iv)における定量化プロセスが、請求項1~19のいずれか一項に記載のポリヌクレオチド配列の非存在下で実施される、請求項25に記載の方法。
【請求項27】
ポリヌクレオチド定量化プロセスをキャリブレーションする方法であって、
i)請求項1~19のいずれか一項に記載のポリヌクレオチド配列を所与の組のパラメータ下でポリヌクレオチド定量化プロセスに供すること;
ii)i)で実施された前記定量化プロセスによって決定されるとおりの前記キャリブレーション配列の分量を記録すること;
iii)ii)で記録された前記キャリブレーション配列の前記分量を、請求項1~15のいずれか一項に記載のポリヌクレオチド配列中のそれぞれのキャリブレーション配列の既知の分量と比較すること;及び
iv)目的とするポリヌクレオチドを含むサンプルを、前記同じ組のパラメータ下において、i)で実施された前記同じ定量化プロセスに供すること
を含み、iii)における分量決定の精度は、iv)における分量決定をキャリブレーションするために使用される、方法。
【請求項28】
iv)における前記定量化プロセスが、請求項1~19のいずれか一項に記載のポリヌクレオチド配列の非存在下で実施される、請求項27に記載の方法。
【請求項29】
標的DNAエンリッチメントプロセスをキャリブレーションする方法であって、
i)請求項1~19のいずれか一項に記載のポリヌクレオチド配列を、ハイブリダイゼーションを可能にする条件下で略相補的な配列のオリゴヌクレオチドと組み合わせること;
ii)ポリヌクレオチド配列にハイブリダイズされたオリゴヌクレオチドをエンリッチすること;
iii)ii)でエンリッチされた前記ポリヌクレオチドを所与の組のパラメータ下でシーケンシングすること;
iv)iii)で決定された前記ポリヌクレオチド配列を前記ポリヌクレオチド配列の既知の配列と比較すること;及び
v)ii)でエンリッチされた前記オリゴヌクレオチドをiii)における前記同じ組のパラメータ下でシーケンシングすること
を含み、iv)における配列決定の精度は、v)における配列決定をキャリブレーションするために使用される、方法。
【請求項30】
標的DNAエンリッチメントプロセスをキャリブレーションする方法であって、
i)既知の分量の、請求項1~19のいずれか一項に記載のポリヌクレオチド配列を、ハイブリダイゼーションを可能にする条件下で略相補的な配列のオリゴヌクレオチドと組み合わせること;
ii)ポリヌクレオチド配列にハイブリダイズされたオリゴヌクレオチドをエンリッチすること;
iii)ii)でエンリッチされた前記ポリヌクレオチドを所与の組のパラメータ下で定量化すること;
iv)iii)で決定されたポリヌクレオチド分量をi)における前記ポリヌクレオチド配列の前記既知の分量と比較すること;及び
v)ii)でエンリッチされた前記オリゴヌクレオチドをiii)における前記同じ組のパラメータ下で定量化すること
を含み、iv)における分量決定の精度は、v)における分量決定をキャリブレーションするために使用される、方法。
【請求項31】
ポリヌクレオチドシーケンシング及び/又は定量化プロセスをキャリブレーションするための、請求項1~19のいずれか一項に記載のポリヌクレオチド配列の使用。
【請求項32】
請求項1~19のいずれか一項に記載のポリヌクレオチド配列と、前記ポリヌクレオチド配列を断片化する能力を有する1つ以上のヌクレアーゼ酵素とを含むキット。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2020年2月13日に出願されたオーストラリア仮特許出願第2020900400号及び同第2020900401号からの優先権を主張するものであり、これらの各々の内容は、全体として参照により本明細書に援用される。
【0002】
技術分野
本開示は、概して、サンプル中のポリヌクレオチドの識別情報及び/又は分量を決定する方法のキャリブレーションにおいて有用なポリヌクレオチドに関する。本ポリヌクレオチドは、ハイスループットシーケンシング方法(例えば、次世代シーケンシング、即ちNGS方法と称されるもの)を含めて、多様なシーケンシング方法のキャリブレーションに使用され得る。本開示は、概して、例えば多様なシーケンシング方法のキャリブレーションを含めて、多様な適用におけるこれらのポリヌクレオチドの使用にも関する。
【背景技術】
【0003】
背景
NGS技術(Illumina、Oxford Nanopore、PacBio、Ion Torrent、Roche 454 Pyrosequencing(例えば、Bentley, D.R. et al., 2008;Clarke, J. et al., 2009;Ronaghi, M. et al., 1998;Eid, J. et al., 2009;Rothberg, J.M. et al., 2011を参照されたい)及びその他などの企業が提供するサービス及び製品によって例示される)は、核酸分子のハイスループットな超並列シーケンシングを可能にする。これらの技術は、単一のサンプル中における何百万個ものRNA及びDNA分子のヌクレオチド塩基配列を決定する能力を有する。更に、個々のRNA又はDNA配列が決定される速度は、サンプル中におけるその個々のRNA又はDNA配列の相対的存在量に比例する。従って、NGSは、サンプル中における1つ以上の核酸配列の分量の決定にも用いることができる。
【0004】
NGSは、動物、植物、微小生物又は環境サンプル中における多様な微生物集団など、天然の供給源から採取されたサンプル中に見られる核酸の配列の決定及び/又は分量の測定に広く用いられている(Edwards, R.A. et al., 2006)。こうした用途には、生物の全ゲノム配列の決定(例えば、Bentley, D.R. et al., 2008を参照されたい)、サンプル中に存在するメッセンジャーRNAの配列及び存在量の決定(例えば、Mortazavi, A. et al., 2008を参照されたい)若しくは疾患に関連する遺伝子変異体の同定又は後成的修飾(例えば、Bernstein, B.E. et al., 2005を参照されたい)、タンパク質結合部位(例えば、Johnson, D.S., et al., 2007を参照されたい)、三次元DNA構造(例えば、Lieberman-Aiden, E. et al., 2009を参照されたい)及び他の特徴など、様々な細胞特徴のシーケンシング及び測定が含まれる。
【0005】
NGSによって決定される何百万個もの個々のRNA又はDNA配列は、デノボアセンブリによってマージして、より長い配列(コンティグと呼ばれる)にすることができるか、又は既知の参照配列と照合することができる。DNA配列のデノボアセンブリを用いると、生物のゲノムをアセンブルすることができ;RNA配列のデノボアセンブリは、遺伝子配列、長さ及びアイソフォームを指示し得る。DNA配列を参照ゲノムと照合又はアラインメントすると、個体間で遺伝的に差異又は変異がある箇所を同定することができる。DNA配列と参照ゲノムとの間の一致箇所は、ヒストン修飾などの後成的特徴のある箇所又はタンパク質結合部位を指示し得る。RNA配列と参照ゲノムとのアラインメントは、遺伝子スプライシングの過程で切り出されるイントロン配列の存在を指示し得る。
【0006】
一部の例では、かかるシーケンシング方法の作業時、天然の核酸サンプルには、標準と称される既知の分量又は配列の核酸が加えられている(又は「スパイクイン」されている)。結果として得られる組み合わせの混合物は、次に、マイクロアレイ技術、定量的ポリメラーゼ連鎖反応方法などを含む様々な遺伝子技術(NGS技術など)を用いて分析され得る。サンプル核酸の分量又は配列を、加えた核酸標準の既知の分量又は配列と比較すると、参照尺度を提供することができ、それを用いて天然の核酸サンプルの分量又は配列を測定し、決定することができる。
【0007】
これまで使用されているRNA及びDNA標準は、天然の供給源に由来するものであった。例えば、元々白人女性ヒト由来であるNA12878細胞株から抽出されるDNA配列は、広く特徴付けられており、分析ツールが遺伝的変異を同定する性能を評価するために用いられている(Zook, J.M. et al., 2014)。古細菌メタノカルドコッカス・ジャナスキイ(Methanocaldococcus jannaschii)に由来する配列を含むリボ核酸標準(ERCC Spike-Inとして知られる)は、マイクロアレイ及びqRT-PCR技術のために開発されたものであり(Baker, S.C. et al., 2005;Consortium, E.R.C., 2005)、RNAシーケンシングで用いられている(Jiang, L. et al., 2011)。最近では、天然配列を標準として使用することに起因する1つ以上の欠点に対処するため、人工キャリブレーション配列が考案されている。かかる人工キャリブレーション配列については、国際公開第2016/094947号として公開された国際特許出願第PCT/オーストラリア特許出願公開第2015/050797号に記載されている。
【0008】
アダプター(adaptor)(又はアダプター(adapter))配列は、典型的には、次世代シーケンシングのための標的ポリヌクレオチドの調製に使用されるDNA配列として知られる。次世代シーケンシング中のライブラリ調製工程では、標的DNA又はRNA配列の上流に(即ち5’方向に)及び/又は下流に(即ち3’方向に)アダプター配列を含むDNA配列が生成される。これらの生成されたDNA配列は、次に、次世代シーケンシング方法を用いてシーケンシングされる。
【発明の概要】
【発明が解決しようとする課題】
【0009】
これらの進展にもかかわらず、NGSデータの解析は、依然として課題である。シーケンシングエラーは、突然変異の誤検出(偽陽性)を招き得る結果、不必要で高価な治療を招き、突然変異の見逃し(偽陰性)は、診断の見逃し及び患者の治療機会の見逃しを招き得る。従って、NGS方法の精度が更に向上すれば、有益となり得る。
【課題を解決するための手段】
【0010】
概要
本開示は、概して、多様なシーケンシング方法のキャリブレーションに使用し得るポリヌクレオチド配列に関する。これらのポリヌクレオチド配列は、本明細書では「標準」、「参照標準」又は「対照」とも称され、これらの用語は、本明細書では同義的に使用される。このように、本開示は、NGS方法など、多様なハイスループットシーケンシング方法のキャリブレーションに使用することのできる参照標準を提供する。本明細書に開示されるポリヌクレオチド配列は、2つ以上のキャリブレーション配列であって、それぞれ独立に、天然に存在するポリヌクレオチド配列を表し、及び天然に存在するいかなるゲノムにも見られない配置においてポリヌクレオチド配列内で連続して配置される2つ以上のキャリブレーション配列を含む。異なるキャリブレーション配列は、単一のコピーで存在し得る。代わりに、キャリブレーション配列の1つ以上は、ポリヌクレオチド配列中に2つ以上のコピー数で存在し得る。このように、本開示は、それぞれ独立に、同じコピー数又はばらつきのあるコピー数で存在する複数のキャリブレーション配列を含むポリヌクレオチド「ラダー」を提供する。
【0011】
一態様において、本開示は、2つ以上のキャリブレーション配列を含む単離ポリヌクレオチド配列を提供し、ここで、キャリブレーション配列は、それぞれ独立に、天然に存在するポリヌクレオチド配列を表し、キャリブレーション配列は、天然に存在するいかなるゲノムにも見られない配置においてポリヌクレオチド配列内で連続して配置される。キャリブレーション配列の1つ以上は、ポリヌクレオチド配列内に2つ以上のコピー数で存在し得る。
【0012】
第1のキャリブレーション配列は、エクソン、イントロン、遺伝子、アレル、染色体又はゲノム配列を表し得、第2のキャリブレーション配列は、第1のキャリブレーション配列と異なり得、及び異なるエクソン、イントロン、遺伝子、アレル、染色体又はゲノム配列を表し得る。第2のキャリブレーション配列は、第1のキャリブレーション配列の変異体を表し得る。
【0013】
キャリブレーション配列の1つ以上は、癌、遺伝性疾患、病原体、薬物耐性、循環腫瘍DNA、循環胎児DNA、循環母体DNA又は他の目的とする属性のいずれか1つ以上など、目的とする特徴を示し得る。
【0014】
本明細書に開示されるポリヌクレオチドが、2つ以上のコピー数で存在するキャリブレーション配列を含むとき、それらのコピー数は、キャリブレーション配列によって表される天然に存在する配列の天然に存在する頻度を再現するように選択され得る。例えば、限定するものではないが、2つ以上のコピー数は、天然に存在するヒトポリヌクレオチド配列のホモ接合性、ヘテロ接合性及び/又は体細胞性アレル頻度のいずれか1つ以上を再現するように選択され得る。他のコピー数の表現については、本明細書に記載される。
【0015】
キャリブレーション配列は、独立に、18ヌクレオチド長~20,000ヌクレオチド長であり得る。例えば、キャリブレーション配列は、独立に、100ヌクレオチド長~2,000ヌクレオチド長であり得る。
【0016】
別の態様において、本開示は、5’プロモーター;フランキング(3’及び5’)エンドヌクレアーゼ部位;及び3’ポリアデニンリピートトラクトのいずれか1つ以上に作動可能に連結されている、本明細書に開示されるポリヌクレオチド配列をコードするDNA配列を含むベクターを提供する。
【0017】
別の態様において、本開示は、本開示のポリヌクレオチド配列を作成する方法であって、2つ以上のキャリブレーション配列を提供し、及びライゲートすることを含み;任意選択で、存在する場合、フランキング若しくは末端配列及び/又はスペーサー配列を提供し、及びライゲートすることを更に含む方法を提供する。
【0018】
別の態様において、本開示は、本明細書に開示されるいずれか2つ以上のポリヌクレオチド配列を含む組成物を提供する。
【0019】
別の態様において、本開示は、循環DNA検出方法をキャリブレーションするためのポリヌクレオチドを提供する方法を提供し、この方法は、本開示のポリヌクレオチド配列を断片化して、1つ以上のポリヌクレオチド断片を作製することを含み、この1つ以上のポリヌクレオチド断片は、循環DNA検出方法のキャリブレーションに好適である。
【0020】
別の態様において、本開示は、RNAシーケンシング方法をキャリブレーションするためのポリヌクレオチドを提供する方法を提供し、この方法は、DNAポリヌクレオチド配列である本開示のポリヌクレオチド配列のインビトロ転写を実施して、1つ以上のRNA断片を作製することを含み、この1つ以上のRNA断片は、RNAシーケンシング方法のキャリブレーションに好適である。
【0021】
別の態様において、本開示は、ポリヌクレオチドシーケンシングプロセスをキャリブレーションする方法であって、
i)本開示のポリヌクレオチド配列を所与の組のパラメータ下でポリヌクレオチドシーケンシングプロセスに供すること;
ii)i)で実施されたシーケンシングプロセスによって決定されるとおりのキャリブレーション配列の配列を記録すること;
iii)ii)で記録されたキャリブレーション配列の配列を、本開示のポリヌクレオチド配列中のそれぞれのキャリブレーション配列の既知の配列と比較すること;及び
iv)目的とするポリヌクレオチドを含むサンプルを、同じ組のパラメータ下において、i)で実施された同じシーケンシングプロセスに供すること
を含む方法を提供し、ここで、iii)における配列決定の精度は、iv)における配列決定をキャリブレーションするために使用される。iv)における定量化プロセスは、本開示のポリヌクレオチド配列の非存在下で実施され得る。
【0022】
別の態様において、本開示は、ポリヌクレオチド定量化プロセスをキャリブレーションする方法であって、
i)本開示のポリヌクレオチド配列を所与の組のパラメータ下でポリヌクレオチド定量化プロセスに供すること;
ii)i)で実施された定量化プロセスによって決定されるとおりのキャリブレーション配列の分量を記録すること;
iii)ii)で記録されたキャリブレーション配列の分量を、本開示のポリヌクレオチド配列中のそれぞれのキャリブレーション配列の既知の分量と比較すること;及び
iv)目的とするポリヌクレオチドを含むサンプルを、同じ組のパラメータ下において、i)で実施された同じ定量化プロセスに供すること
を含む方法を提供し、ここで、iii)における分量決定の精度は、iv)における分量決定をキャリブレーションするために使用される。この場合もやはり、iv)における定量化プロセスは、本開示のポリヌクレオチド配列の非存在下で実施され得る。
【0023】
上記から明らかなとおり、本明細書に開示される方法のいずれも、試験サンプルに対して実施される、同じパラメータを有する均等な方法とは別に実施することができる。例えば、本明細書に開示される方法は、試験サンプルに対して実施される均等な方法と並行して実施することができる。これにより、例えば、同じ標的配列を表すキャリブレーション配列を加えることによって試験サンプル中の目的とする標的ポリヌクレオチド配列の量が変わることにより、試験サンプルに対して実施される方法の結果にキャリブレーション配列が干渉するリスクが低下する。
【0024】
別の態様において、本開示は、標的DNAエンリッチメントプロセスをキャリブレーションする方法を提供し、この方法は、
i)本開示のポリヌクレオチド配列を、ハイブリダイゼーションを可能にする条件下で略相補的な配列のオリゴヌクレオチドと組み合わせること;
ii)ポリヌクレオチド配列にハイブリダイズされたオリゴヌクレオチドをエンリッチすること;
iii)ii)でエンリッチされたポリヌクレオチドを所与の組のパラメータ下でシーケンシングすること;
iv)iii)で決定されたポリヌクレオチド配列をポリヌクレオチド配列の既知の配列と比較すること;及び
v)ii)でエンリッチされたオリゴヌクレオチドをiii)における同じ組のパラメータ下でシーケンシングすること
を含み、iv)における配列決定の精度は、v)における配列決定をキャリブレーションするために使用される。
【0025】
別の態様において、本開示は、標的DNAエンリッチメントプロセスをキャリブレーションする方法を提供し、この方法は、
i)既知の分量の本開示のポリヌクレオチド配列を、ハイブリダイゼーションを可能にする条件下で略相補的な配列のオリゴヌクレオチドと組み合わせること;
ii)ポリヌクレオチド配列にハイブリダイズされたオリゴヌクレオチドをエンリッチすること;
iii)ii)でエンリッチされたポリヌクレオチドを所与の組のパラメータ下で定量化すること;
iv)iii)で決定されたポリヌクレオチド分量をi)におけるポリヌクレオチド配列の既知の分量と比較すること;及び
v)ii)でエンリッチされたオリゴヌクレオチドをiii)における同じ組のパラメータ下で定量化すること
を含み、iv)における分量決定の精度は、v)における分量決定をキャリブレーションするために使用される。
【0026】
別の態様において、本開示は、ポリヌクレオチドシーケンシング及び/又は定量化プロセスをキャリブレーションするための、本開示のポリヌクレオチド配列の使用を提供する。
【0027】
別の態様において、本開示は、本開示のポリヌクレオチド配列と、そのポリヌクレオチド配列を断片化する能力を有する1つ以上のヌクレアーゼ酵素とを含むキットを提供する。
【0028】
本開示は、サンプル中のポリヌクレオチドの識別情報及び/又は分量を決定する方法のキャリブレーションにおいて有用である、キャリブレーション配列(本明細書に記載されるなど)をそれぞれ含むポリヌクレオチドアダプター配列も提供する。アダプター配列内にキャリブレーション配列を取り込むと、例えばサンプルに対して実施される方法と並行して実施される別個のキャリブレーション方法の性能と比較して、それらの方法のキャリブレーション効率が向上する。キャリブレーション配列は、参照配列を提供し、それとの対比でシーケンシング方法の実施時に生じるエラー及び技術的バイアスを決定することができる。このように、本明細書に開示されるアダプター配列をポリヌクレオチドライブラリ調製方法(NGSライブラリ調製方法など)中に用いると、そうしたライブラリ調製方法のシーケンシング性能及び/又は定量性能を測定することができる。
【0029】
従って、本開示は、キャリブレーション配列とプライマー配列とを含む単離ポリヌクレオチドアダプター配列を提供する。
【0030】
このプライマー配列は、複製しようとするポリヌクレオチドを含有するサンプルに加えることが可能な別個のプライマー配列と相補的(又は略相補的)であり得る。このように、アダプター配列は、複製しようとするポリヌクレオチドを含有するサンプルに加えて、複製しようとするポリヌクレオチドにライゲートさせることができ、及び結果として得られるライゲートされた配列には、加えられるプライマーが結合できるため、結果として得られるそのライゲートされた配列との相補的ポリヌクレオチドの合成及び/又は結果として得られるそのライゲートされた配列の転写が促進されることになる。
【0031】
代わりに、プライマー配列は、複製しようとするポリヌクレオチドの一部分に相補的(又は略相補的)であり得る。このように、アダプター配列は、複製しようとするポリヌクレオチドを含有するサンプルに加えることができ、アダプター配列内のプライマー配列は、複製しようとするポリヌクレオチド内の相補配列に結合することができるため、複製しようとするポリヌクレオチドの合成が促進されることになる。
【0032】
本開示は、キャリブレーション配列と、標的配列に相補的な配列(「相補配列」)とを含む単離ポリヌクレオチドアダプター配列も提供する。相補配列は、プライマーと同じように標的ポリヌクレオチド配列に結合し得るが、標的ポリヌクレオチドの複製又は合成を促進することにおいて必ずしもプライマーの機能を果たすわけではない。このように、キャリブレーション配列と相補配列とを含む単離ポリヌクレオチドアダプター配列は、プライマー配列を含まないものであり得る。ポリヌクレオチド、キャリブレーション配列及び相補配列を含むかかるアダプターポリヌクレオチドは、ポリヌクレオチドの複製が関与しないライブラリ調製方法のキャリブレーションにおいて特に有用であり得る。例えば、かかるアダプターポリヌクレオチドは、タンパク質ナノポアによるシーケンシングのためのライブラリ調製方法において特に有用であり得る。
【0033】
アダプター配列は、フローセルDNA配列に相補的な配列;複製しようとするポリヌクレオチドを含有するサンプルの識別情報を指示するインデックス配列;及び個々のアダプター配列の識別情報を指示する一意の分子識別子(UMI)配列のいずれか1つ以上を更に含み得る。
【0034】
キャリブレーション配列は、天然に存在するポリヌクレオチド配列を表し得る。これは、キャリブレーション配列が、天然に存在するポリヌクレオチド配列を含むか若しくはそれからなることによるか、又はキャリブレーション配列が人工であるにもかかわらず、天然に存在するポリヌクレオチド配列のある種の高次特徴を保持しているポリヌクレオチド配列(例えば、国際公開第2016/094947号に記載されるとおり)を含むか若しくはそれからなることによって達成され得る。
【0035】
アダプター配列は、一本鎖又は二本鎖ポリヌクレオチド配列であり得、DNA又はRNAポリヌクレオチド配列であり得る。
【0036】
本明細書に開示されるいずれのアダプター配列も、アダプター配列が相補的標的配列に結合したときに末端ヌクレオチドオーバーハングを形成する配列を含み得る。ヌクレオチドオーバーハングは、チミン(T)であり得る。末端Tヌクレオチドは、ヌクレアーゼ消化を防ぐため、ホスホロチオエート結合によってつなぎ合わされ得る。代わりに、本明細書に開示されるいずれのアダプター配列も、アダプター配列が相補的標的配列に結合したときに付着末端型オーバーハングを形成する配列を含み得る。付着末端型オーバーハングは、別のポリヌクレオチド上の付着末端型オーバーハングに相補的な配列を含んで、それらの2つのポリヌクレオチドのアニーリングを促進する。
【0037】
2つ以上のキャリブレーション配列は、単一のアダプター配列に異なる分量(即ちコピー数)で存在し得る。加えて、2つ以上のアダプター配列が既知の分量で混合物中において組み合わされ得る。このように、この混合物は、既知の相対量の2つ以上の異なるキャリブレーション配列を提供することができる。これは、各キャリブレーション配列の複数のコピーを有するアダプターを混合物に含めることによって達成され得る。これは、既知の異なる分量の異なるアダプターであって、各々が単一のキャリブレーション配列を有するアダプターを混合物に含めることによっても達成され得る。これは、これらの手法の組み合わせを通しても達成され得る。2つ以上のキャリブレーション配列を異なる分量で提供すると、標的ポリヌクレオチドの分量の測定をキャリブレーションすることが可能となる。
【0038】
本開示は、本明細書に開示されるとおりの1つ以上のアダプター配列を含む組成物も提供する。
【0039】
本開示は、本明細書に開示される組成物を含む容器も提供する。
【0040】
本開示は、本明細書に開示されるアダプター配列を含むベクターも提供する。
【0041】
本開示は、本明細書に開示される1つ以上のアダプター配列又は本明細書に開示される組成物と、リガーゼ酵素、及び/又はトランスポザーゼ酵素、及び/又は1つ以上の別個のオリゴヌクレオチドプライマーとを含むキットも提供する。
【0042】
本開示は、本明細書に開示されるアダプター配列を作成する方法も提供し、この方法は、エンドヌクレアーゼ消化によるか、又は本明細書に開示されるベクターからアダプター配列を増幅することによるか、又は本明細書に開示されるベクター内に含まれるアダプター配列を転写することにより、本明細書に開示されるベクターからアダプター配列を切り出すことを含む。
【0043】
本開示は、標的ポリヌクレオチドを含むサンプルをシーケンシング又は定量化プロセスのために調製する方法も提供し、この方法は、標的ポリヌクレオチドの末端(即ち5’及び/又は3’側端)の一方又は両方に対して、本明細書に開示されるポリヌクレオチドアダプター配列を取り付けるステップを含む。
【0044】
本開示は、標的ポリヌクレオチドを含むサンプルをシーケンシング又は定量化プロセスのために調製する方法も提供し、この方法は、ポリヌクレオチドアダプター配列中のプライマー配列が標的ポリヌクレオチドの相補的な一部分に結合することを可能にするのに好適な条件下において、標的ポリヌクレオチドを、本明細書に開示されるアダプター配列と接触させることを含む。
【0045】
本開示は、ポリヌクレオチドシーケンシング及び/又は定量化プロセスをキャリブレーションするための、本明細書に開示されるポリヌクレオチドアダプター配列又は本明細書に開示される組成物の使用も提供する。
【0046】
従って、本開示は、ポリヌクレオチドシーケンシングプロセスをキャリブレーションする方法であって、
i)配列を決定しようとする標的ポリヌクレオチドを含むサンプルに、ポリヌクレオチドアダプター配列を標的ポリヌクレオチドの5’及び/又は3’末端に取り付けることを可能にする条件下において、本明細書に開示されるアダプター配列又は組成物を加えること;
ii)標的ポリヌクレオチドを増幅すること;
iii)標的ポリヌクレオチドの配列を決定すること;
iv)アダプター配列中のキャリブレーション配列の配列を決定すること;及び
v)iv)で決定された配列を元のキャリブレーション配列と比較すること
を含む方法も提供し、ここで、iv)における配列決定の精度は、iii)における配列決定をキャリブレーションするために使用される。
【0047】
本開示は、ポリヌクレオチドシーケンシングプロセスをキャリブレーションする方法であって、
i)配列を決定しようとする標的ポリヌクレオチドを含むサンプルに、ポリヌクレオチドアダプター配列中のプライマー配列が標的ポリヌクレオチドの相補的な一部分に結合することを可能にする条件下において、本明細書に開示されるアダプター配列又は組成物を加えること;
ii)標的ポリヌクレオチドを増幅すること;
iii)標的ポリヌクレオチドの配列を決定すること;
iv)アダプター配列中のキャリブレーション配列の配列を決定すること;及び
v)iv)で決定された配列を元のキャリブレーション配列と比較すること
を含む方法も提供し、ここで、iv)における配列決定の精度は、iii)における配列決定をキャリブレーションするために使用される。
【0048】
本開示は、ポリヌクレオチド定量化プロセスをキャリブレーションする方法であって、
i)分量を決定しようとする標的ポリヌクレオチドを含むサンプルに、アダプター配列を標的ポリヌクレオチドの5’及び/又は3’末端に取り付けることを可能にする条件下において、既知の量の、本明細書に開示されるアダプター配列又は組成物を加えること;
ii)標的ポリヌクレオチドを増幅すること;
iii)標的ポリヌクレオチドの分量を決定すること;
iv)アダプター配列中のキャリブレーション配列の分量を決定すること;及び
v)iv)で決定された分量をi)におけるアダプター配列中のキャリブレーション配列の既知の量と比較すること
を含む方法も提供し、ここで、iv)における分量決定の精度は、iii)における分量決定をキャリブレーションするために使用される。
【0049】
本開示は、ポリヌクレオチド定量化プロセスをキャリブレーションする方法であって、
i)分量を決定しようとする標的ポリヌクレオチドを含むサンプルに、ポリヌクレオチドアダプター配列中のプライマー配列が標的ポリヌクレオチドの相補的な一部分に結合することを可能にする条件下において、既知の量の、本明細書に開示されるアダプター配列又は組成物を加えること;
ii)標的ポリヌクレオチドを増幅すること;
iii)標的ポリヌクレオチドの分量を決定すること;
iv)アダプター配列中のキャリブレーション配列の分量を決定すること;及び
v)iv)で決定された分量をi)におけるアダプター配列中のキャリブレーション配列の既知の量と比較すること
を含む方法も提供し、ここで、iv)における分量決定の精度は、iii)における分量決定をキャリブレーションするために使用される。
【0050】
本開示の任意の特定の態様、又は実施形態、又は例の各特徴は、本開示の任意の他の態様、又は実施形態、又は例に適宜修正して適用され得る。
【0051】
図面の簡単な説明
以下の図は、本開示の特定の態様を更に実証する。本開示は、本明細書に提供される具体的な実施形態の詳細な説明と組み合わせて、これらの図の1つ以上を参照することによってよりよく理解され得る。
【図面の簡単な説明】
【0052】
図1】1、2及び3コピー数で繰り返されるERBB2遺伝子エクソン配列を含むポリヌクレオチド配列の設計及び使用を例示する概略図。
図2】1コピー数で繰り返されるTP53遺伝子エクソン配列を含むポリヌクレオチド配列の設計及び使用を例示する概略図。
図3】1、2及び4コピー数で繰り返される細菌ゲノム配列を含むポリヌクレオチド配列の設計及び使用を例示する概略図。
図4】BRAF遺伝子の体細胞性アレル頻度で遺伝的変異を表すキャリブレーション配列を含むポリヌクレオチド配列の設計及び使用を例示する概略図。
図5】BRCA2遺伝子のヘテロ接合性アレル頻度で遺伝的変異を表すキャリブレーション配列を含むポリヌクレオチド配列の設計及び使用を例示する概略図。
図6】循環DNAシーケンシング方法で使用するためのポリヌクレオチド配列の酵素的剪断によるDNA断片のサイズプロファイル。
図7】ポリヌクレオチドシーケンシングプロセスのキャリブレーションに好適なコンピューターシステム3800を例示する概略図。コンピューターシステム3800は、プログラムメモリ3804に接続されたプロセッサ3802、データメモリ3806、通信ポート3808及びユーザーポート3810を含む。
図8】ライブラリ調製及びシーケンシング時におけるキャリブレーション配列を含むポリヌクレオチドアダプター配列の設計。(A)Y-アダプター内でのキャリブレーション配列の箇所並びにP5及びP7プライマー配列、インデックス配列及び一意の分子識別子(UMI)に対する相対的な位置及びT-ヌクレオチドオーバーハングを示す概略図。(B)次世代シーケンシングのためのライブラリ調製ステップ時に試験サンプルDNA断片の末端にライゲートされたポリヌクレオチドアダプター配列を示す概略図。
図9】DNA合成時のキャリブレーション配列を含むポリヌクレオチドアダプター配列の取込み。(A)ポリヌクレオチドアダプター配列は、キャリブレーション配列と、サンプルDNA中の標的部位に相補的なプライマー配列とを含む。ポリヌクレオチドアダプター配列が標的DNAにハイブリダイズし、プライマー配列からDNA合成が開始される。(B)1回目及び2回目のDNA合成ラウンドにより、プライマー配列とキャリブレーション配列とを含むポリヌクレオチドアダプター配列が取り込まれ、ここで、試験サンプルDNA断片は、単一の連続したDNA配列を形成することになる。
図10】ロングリード(ナノポア)シーケンシング時のポリヌクレオチドアダプター配列の使用。(A)2つのキャリブレーション配列を含む2つのポリヌクレオチドアダプター配列であり、ここで、第2のキャリブレーション配列(G)は、第1のキャリブレーション配列(WT)の遺伝子変異体配列である。(B)ポリヌクレオチド配列を長鎖試験サンプルDNA断片の5’及び3’末端にライゲートする。(C)ナノポア技術を用いて長鎖サンプルDNA断片及びポリヌクレオチドアダプター配列(キャリブレーション配列を含む)をシーケンシングする。
図11】ライブラリ調製及び次世代シーケンシング時のポリヌクレオチドアダプター配列の使用。(A)ポリヌクレオチドアダプター配列を試験サンプルDNAにライゲートする。(B)ライブラリ断片は、サンプルDNA配列と、キャリブレーション配列を含むポリヌクレオチドアダプター配列とを含む。(C)ライブラリ調製時、DNA合成により、キャリブレーション及びアダプター配列が末端領域に取り込まれる。(D)シーケンシングリード内にあるキャリブレーション配列を識別する。(E)散布図は、アダプター混合物内にあるキャリブレーション配列の予想される存在量割合と比べた、リード内にあるキャリブレーション配列の観察されるカウントを示す。
図12】(A)ゲノムブラウザの表示は、ポリヌクレオチドアダプター内にあるキャリブレーション配列に対応するシーケンシングされたロングリードアラインメントを示す。シーケンシングエラーが指示される。下のパネルは、例示的シーケンシングリードを示し、キャリブレーション配列が指示される。(B)散布図は、NGSライブラリにおけるそれらの予想される存在量割合と比べた、種々のキャリブレーション配列(Y5~Y8)の観察される存在量割合を示す。
図13】(A)ゲノムブラウザの表示は、ポリヌクレオチドアダプター内にあるキャリブレーション配列に対応するシーケンシングされたロングリードアラインメントを示す。下のパネルは、例示的シーケンシングリードを示し、キャリブレーション配列が指示される。遺伝子変異体配列(C)の存在が指示される。
図14】(A)ゲノムブラウザの表示は、ポリヌクレオチドアダプター内にあるキャリブレーション配列に対応するシーケンシングされたロングリードアラインメントを示す。キャリブレーション配列は、BRAF遺伝子に対応するヒト参照ゲノム配列を表す。
図15】(A)ゲノムブラウザの表示は、ポリヌクレオチドアダプター配列内にあるプライマー配列によって標的化されるヒトEFGR遺伝子の領域を示す。(B)概略図は、キャリブレーション配列と、ヒトEFGFR遺伝子を標的化するプライマー配列とを含むポリヌクレオチドアダプター配列を示す。(C)例示的シーケンシングリードは、出力ライブラリ(FASTQ)におけるシーケンシングリード中のキャリブレーション配列の識別を示す。
【発明を実施するための形態】
【0053】
配列表の凡例
配列番号1 ERBB2遺伝子由来の3つのキャリブレーション配列を含む線状ポリヌクレオチド配列のヌクレオチド配列(EG1_ERBB2)。
配列番号2 EG1_EGFRのヌクレオチド配列。
配列番号3 EG1_METのヌクレオチド配列。
配列番号4 EG1_BRAFのヌクレオチド配列。
配列番号5 EG1_FGFR1のヌクレオチド配列。
配列番号6 TP53遺伝子由来の5つのキャリブレーション配列を含む線状ポリヌクレオチド配列のヌクレオチド配列(EG2_TP53)。
配列番号7 緑膿菌(Pseudomonas aeruginosa)PAO1、インフルエンザ菌(Haemophilus influenzae)Rd KW20及び大腸菌(Escherichia coli)K-12由来のキャリブレーション配列を含む線状ポリヌクレオチド配列のヌクレオチド配列(EG3_16S)。
配列番号8 BRAF遺伝子キャリブレーション配列のヌクレオチド配列(EG4_BRAF)。
配列番号9 一体につなぎ合わされたBRCA2遺伝子由来の2つのキャリブレーション配列のヌクレオチド配列(EG4_BRCA2)。
配列番号10 一体につなぎ合わされたBCR、ABL及びALK遺伝子由来の3つのキャリブレーション配列のヌクレオチド配列(EG6_GENES)。
配列番号11 ERBB2遺伝子由来のエクソンからのキャリブレーション配列のヌクレオチド配列(EG1_CNV_ERBB2_A)。
配列番号12 ERBB2遺伝子由来のエクソンからのキャリブレーション配列のヌクレオチド配列(EG1_CNV_ERBB2_B)。
配列番号13 ERBB2遺伝子由来のエクソンからのキャリブレーション配列のヌクレオチド配列(EG1_CNV_ERBB2_C)。
配列番号14 EGFR遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_EGFR_A)。
配列番号15 EGFR遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_EGFR_B)。
配列番号16 EGFR遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_EGFR_C)。
配列番号17 MET遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_MET_A)。
配列番号18 MET遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_MET_B)。
配列番号19 MET遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_MET_C)。
配列番号20 BRAF遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_BRAF_A)。
配列番号21 BRAF遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_BRAF_B)。
配列番号22 BRAF遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_BRAF_C)。
配列番号23 FGFR1遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_FGFR1_A)。
配列番号24 FGFR1遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_FGFR1_B)。
配列番号25 FGFR1遺伝子由来のキャリブレーション配列のヌクレオチド配列(EG1_CNV_FGFR1_C)。
配列番号26 TP53遺伝子エクソンと重複のあるキャリブレーション配列のヌクレオチド配列(EG2_TP53_A)。
配列番号27 TP53遺伝子エクソンと重複のあるキャリブレーション配列のヌクレオチド配列(EG2_TP53_B)。
配列番号28 TP53遺伝子エクソンと重複のあるキャリブレーション配列のヌクレオチド配列(EG2_TP53_C)。
配列番号29 TP53遺伝子エクソンと重複のあるキャリブレーション配列のヌクレオチド配列(EG2_TP53_D)。
配列番号30 TP53遺伝子エクソンと重複のあるキャリブレーション配列のヌクレオチド配列(EG2_TP53_E)。
配列番号31 緑膿菌(Pseudomonas aeruginosa)PAO1由来のキャリブレーション配列を含むポリヌクレオチド配列のヌクレオチド配列(EG3_16S_pseuAeru_C)。
配列番号32 インフルエンザ菌(Haemophilus influenzae)Rd KW20由来のキャリブレーション配列を含むポリヌクレオチド配列のヌクレオチド配列(EG3_16S_haemInfl_B)。
配列番号33 大腸菌(Escherichia coli)K-12由来のキャリブレーション配列を含むポリヌクレオチド配列のヌクレオチド配列(EG3_16S_eschColi_A)。
配列番号34 BRAFの異なる遺伝子変異体を表すキャリブレーション配列を含むポリヌクレオチド配列のヌクレオチド配列(EG4_BRAF_WT)。
配列番号35 BRAFの異なる遺伝子変異体を表すキャリブレーション配列を含むポリヌクレオチド配列のヌクレオチド配列(EG4_BRAF_V600E)。
配列番号36 BRCA2遺伝子からのキャリブレーション配列のヌクレオチド配列(EG5_BRCA2_WT)。
配列番号37 単一のヌクレオチド欠失を有するBRCA2からのキャリブレーション配列のヌクレオチド配列(EG5_BRCA2_DEL)。
配列番号38 BCR遺伝子の遺伝子発現を測定するための合成配列のヌクレオチド配列(EG6_GENE_BCR_A)。
配列番号39 ABL遺伝子の遺伝子発現を測定するための合成配列のヌクレオチド配列(EG6_GENE_ABL_B)。
配列番号40 ALK遺伝子の遺伝子発現を測定するための合成配列のヌクレオチド配列(EG6_GENE_ALK_C)。
配列番号41 ERBB2_SPCRのアセンブリに使用される人工スペーサー配列のヌクレオチド配列。
配列番号42 EGFR_SPCRのアセンブリに使用される人工スペーサー配列のヌクレオチド配列。
配列番号43 MET_SPCRのアセンブリに使用される人工スペーサー配列のヌクレオチド配列。
配列番号44 BRAF_SPCRのアセンブリに使用される人工スペーサー配列のヌクレオチド配列。
配列番号45 FGFR1_SPCRのアセンブリに使用される人工スペーサー配列のヌクレオチド配列。
配列番号46 Y1Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号47 Y1Aプライマーのヌクレオチド配列。
配列番号48 Y1Aキャリブレーション配列のヌクレオチド配列。
配列番号49 Y1A Y配列のヌクレオチド配列。
配列番号50 Y2Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号51 Y2Aプライマーのヌクレオチド配列。
配列番号52 Y2Aキャリブレーション配列のヌクレオチド配列。
配列番号53 Y2A Y配列のヌクレオチド配列。
配列番号54 Y3Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号55 Y3Aプライマーのヌクレオチド配列。
配列番号56 Y3Aキャリブレーション配列のヌクレオチド配列。
配列番号57 Y3A Y配列のヌクレオチド配列。
配列番号58 Y4Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号59 Y4Aプライマーのヌクレオチド配列。
配列番号60 Y4Aキャリブレーション配列のヌクレオチド配列。
配列番号61 Y4A Y配列のヌクレオチド配列。
配列番号62 Y1Bと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号63 Y1Bプライマーのヌクレオチド配列。
配列番号64 Y1Bキャリブレーション配列のヌクレオチド配列。
配列番号65 Y1B Y配列のヌクレオチド配列。
配列番号66 Y2Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号67 Y2Bプライマーのヌクレオチド配列。
配列番号68 Y2Bキャリブレーション配列のヌクレオチド配列。
配列番号69 Y2B Y配列のヌクレオチド配列。
配列番号70 Y3Bと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号71 Y3Bプライマーのヌクレオチド配列。
配列番号72 Y3Bキャリブレーション配列のヌクレオチド配列。
配列番号73 Y3B Y配列のヌクレオチド配列。
配列番号74 Y4Bと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号75 Y4Bプライマーのヌクレオチド配列。
配列番号76 Y4Bキャリブレーション配列のヌクレオチド配列。
配列番号77 Y4B Y配列のヌクレオチド配列。
配列番号78 Y5Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号79 Y5Aキャリブレーション配列のヌクレオチド配列。
配列番号80 Y5A Y配列のヌクレオチド配列。
配列番号81 Y6Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号82 Y6Aキャリブレーション配列のヌクレオチド配列。
配列番号83 Y6A Y配列のヌクレオチド配列。
配列番号84 Y7Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号85 Y7Aキャリブレーション配列のヌクレオチド配列。
配列番号86 Y7A Y配列のヌクレオチド配列。
配列番号87 Y8Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号88 Y8Aキャリブレーション配列のヌクレオチド配列。
配列番号89 Y8A Y配列のヌクレオチド配列。
配列番号90 Y5Bと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号91 Y5Bキャリブレーション配列のヌクレオチド配列。
配列番号92 Y5B Y配列のヌクレオチド配列。
配列番号93 Y6Bと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号94 Y6Bキャリブレーション配列のヌクレオチド配列。
配列番号95 Y6B Y配列のヌクレオチド配列。
配列番号96 Y7Bと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号97 Y7Bキャリブレーション配列のヌクレオチド配列。
配列番号98 Y7B Y配列のヌクレオチド配列。
配列番号99 Y8Bと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号100 Y8Bキャリブレーション配列のヌクレオチド配列。
配列番号101 Y8B Y配列のヌクレオチド配列。
配列番号102 Y9Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号103 Y9Aキャリブレーション配列のヌクレオチド配列。
配列番号104 Y9A Y配列のヌクレオチド配列。
配列番号105 Y9Bと命名されるY字型アダプター配列のヌクレオチド配列
配列番号106 Y9Bキャリブレーション配列のヌクレオチド配列。
配列番号107 Y9B Y配列のヌクレオチド配列。
配列番号108 Y10Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号109 Y10Aキャリブレーション配列のヌクレオチド配列。
配列番号110 Y10A Y配列のヌクレオチド配列。
配列番号111 Y11Aと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号112 Y11Aキャリブレーション配列のヌクレオチド配列。
配列番号113 Y11A Y配列のヌクレオチド配列。
配列番号114 Y10Bと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号115 Y10Bキャリブレーション配列のヌクレオチド配列。
配列番号116 Y10B Y配列のヌクレオチド配列。
配列番号117 Y11Bと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号118 Y11Bキャリブレーション配列のヌクレオチド配列。
配列番号119 Y11B Y配列のヌクレオチド配列。
配列番号120 Y12Fと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号121 Y12Fプライマーのヌクレオチド配列。
配列番号122 Y12Fキャリブレーション配列のヌクレオチド配列。
配列番号123 Y13Fと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号124 Y13Fプライマーのヌクレオチド配列。
配列番号125 Y13Fキャリブレーション配列のヌクレオチド配列。
配列番号126 Y14Fと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号127 Y14Fプライマーのヌクレオチド配列。
配列番号128 Y14Fキャリブレーション配列のヌクレオチド配列。
配列番号129 Y12Rと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号130 Y12Rプライマーのヌクレオチド配列
配列番号131 Y12Rキャリブレーション配列のヌクレオチド配列。
配列番号132 Y13Rと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号133 Y13Rプライマーのヌクレオチド配列。
配列番号134 Y13Rキャリブレーション配列のヌクレオチド配列。
配列番号135 Y14Rと命名されるY字型アダプター配列のヌクレオチド配列。
配列番号136 Y14Rプライマーのヌクレオチド配列。
配列番号137 Y14Rキャリブレーション配列のヌクレオチド配列。
配列番号138 ポリT mRNAアダプター配列のヌクレオチド配列。
配列番号139 ポリT mRNAアダプタープライマー配列のヌクレオチド配列。
配列番号140 ポリT mRNAアダプターキャリブレーション配列のヌクレオチド配列。
配列番号141 ポリT mRNAアダプターのヌクレオチド配列。
配列番号142 ポリT mRNAアダプタープライマー配列のヌクレオチド配列。
配列番号143 ポリT mRNAアダプターキャリブレーション配列のヌクレオチド配列。
配列番号144 天然ヒト免疫不全ウイルス(HIV)配列アダプターのヌクレオチド配列。
配列番号145 天然HIV配列アダプタープライマー配列のヌクレオチド配列。
配列番号146 天然HIV配列アダプターキャリブレーション配列のヌクレオチド配列。
配列番号147 天然ヒト免疫不全ウイルス(HIV)配列アダプターのヌクレオチド配列。
配列番号148 天然HIV配列アダプタープライマー配列のヌクレオチド配列。
配列番号149 天然HIV配列アダプターキャリブレーション配列のヌクレオチド配列。
配列番号150 PCRプライマー1.0(P5)のヌクレオチド配列。
配列番号151 PCRプライマー2.0(P7)のヌクレオチド配列。
配列番号152 TruSeqユニバーサルアダプターのヌクレオチド配列。
配列番号153 TruSeqアダプター、インデックス1のヌクレオチド配列。
配列番号154 TruSeqアダプター、インデックス2のヌクレオチド配列。
配列番号155 TruSeqアダプター、インデックス3のヌクレオチド配列。
配列番号156 TruSeqアダプター、インデックス4のヌクレオチド配列。
配列番号157 TruSeqアダプター、インデックス5のヌクレオチド配列。
配列番号158 TruSeqアダプター、インデックス6のヌクレオチド配列。
配列番号159 TruSeqアダプター、インデックス7のヌクレオチド配列。
配列番号160 TruSeqアダプター、インデックス8のヌクレオチド配列。
配列番号161 TruSeqアダプター、インデックス9のヌクレオチド配列。
配列番号162 TruSeqアダプター、インデックス10のヌクレオチド配列。
配列番号163 TruSeqアダプター、インデックス11のヌクレオチド配列。
配列番号164 TruSeqアダプター、インデックス12のヌクレオチド配列。
配列番号165 TruSeqアダプター、インデックス13のヌクレオチド配列。
配列番号166 TruSeqアダプター、インデックス14のヌクレオチド配列。
配列番号167 TruSeqアダプター、インデックス15のヌクレオチド配列。
配列番号168 TruSeqアダプター、インデックス16のヌクレオチド配列。
配列番号169 TruSeqアダプター、インデックス18のヌクレオチド配列。
配列番号170 TruSeqアダプター、インデックス19のヌクレオチド配列。
配列番号171 TruSeqアダプター、インデックス20のヌクレオチド配列。
配列番号172 TruSeqアダプター、インデックス21のヌクレオチド配列。
配列番号173 TruSeqアダプター、インデックス22のヌクレオチド配列。
配列番号174 TruSeqアダプター、インデックス23のヌクレオチド配列。
配列番号175 TruSeqアダプター、インデックス25のヌクレオチド配列。
配列番号176 TruSeqアダプター、インデックス27のヌクレオチド配列。
配列番号177 NEBインデックス1のヌクレオチド配列。
配列番号178 NEBインデックス2のヌクレオチド配列。
配列番号179 NEBインデックス3のヌクレオチド配列。
配列番号180 NEBインデックス4のヌクレオチド配列。
配列番号181 NEBインデックス5のヌクレオチド配列。
配列番号182 NEBインデックス6のヌクレオチド配列。
配列番号183 NEBインデックス7のヌクレオチド配列。
配列番号184 NEBインデックス8のヌクレオチド配列。
配列番号185 NEBインデックス9のヌクレオチド配列。
配列番号186 NEBインデックス10のヌクレオチド配列。
配列番号187 NEBインデックス11のヌクレオチド配列。
配列番号188 NEBインデックス12のヌクレオチド配列。
配列番号189 NEBnextユニバーサルプライマーのヌクレオチド配列。
配列番号190 Illumina用NEBNextアダプターのヌクレオチド配列。
配列番号191 16Sフォワードプライマーのヌクレオチド配列。
配列番号192 23Sリバースプライマーのヌクレオチド配列。
配列番号193 TruSeqアダプター、インデックス1のヌクレオチド配列。
配列番号194 TruSeqアダプター、インデックス2のヌクレオチド配列。
配列番号195 TruSeqアダプター、インデックス3のヌクレオチド配列。
配列番号196 TruSeqアダプター、インデックス4のヌクレオチド配列。
配列番号197 TruSeqアダプター、インデックス5のヌクレオチド配列。
配列番号198 TruSeqアダプター、インデックス6のヌクレオチド配列。
配列番号199 TruSeqアダプター、インデックス7のヌクレオチド配列。
配列番号200 TruSeqアダプター、インデックス8のヌクレオチド配列。
配列番号201 TruSeqアダプター、インデックス9のヌクレオチド配列。
配列番号202 TruSeqアダプター、インデックス10のヌクレオチド配列。
配列番号203 TruSeqアダプター、インデックス11のヌクレオチド配列。
配列番号204 TruSeqアダプター、インデックス12のヌクレオチド配列。
配列番号205 TruSeqアダプター、インデックス13のヌクレオチド配列。
配列番号206 TruSeqアダプター、インデックス14のヌクレオチド配列。
配列番号207 TruSeqアダプター、インデックス15のヌクレオチド配列。
配列番号208 TruSeqアダプター、インデックス16のヌクレオチド配列。
配列番号209 TruSeqアダプター、インデックス18のヌクレオチド配列。
配列番号210 TruSeqアダプター、インデックス19のヌクレオチド配列。
配列番号211 TruSeqアダプター、インデックス20のヌクレオチド配列。
配列番号212 TruSeqアダプター、インデックス21のヌクレオチド配列。
配列番号213 TruSeqアダプター、インデックス22のヌクレオチド配列。
配列番号214 TruSeqアダプター、インデックス23のヌクレオチド配列。
配列番号215 TruSeqアダプター、インデックス25のヌクレオチド配列。
配列番号216 TruSeqアダプター、インデックス27のヌクレオチド配列。
配列番号217 UMI配列。
配列番号218 ポリT配列。
配列番号219 実験的リード配列1のヌクレオチド配列。
配列番号220 実験的リード配列2のヌクレオチド配列。
配列番号221 実験的リード配列3のヌクレオチド配列。
配列番号222 実験的リード配列4のヌクレオチド配列。
配列番号223 実験的リード配列5のヌクレオチド配列。
配列番号224 実験的リード配列6のヌクレオチド配列。
配列番号225 IDTデュアルインデックスUMIアダプター1のヌクレオチド配列。
配列番号226 IDTデュアルインデックスUMIアダプター2のヌクレオチド配列。
配列番号227 IDTデュアルインデックスUMIアダプター3のヌクレオチド配列。
配列番号228 IDTデュアルインデックスUMIアダプター4のヌクレオチド配列。
配列番号229 IDTデュアルインデックスUMIアダプター5のヌクレオチド配列。
配列番号230 IDTデュアルインデックスUMIアダプター6のヌクレオチド配列。
【0054】
詳細な説明
概要
本明細書全体を通して、特に具体的に明記されない限り又は文脈上特に必要でない限り、単一のステップ、組成物、ステップ群又は組成物群への言及は、それらのステップ、組成物、ステップ群又は組成物群の1つ及び複数(即ち1つ以上)を包含すると解釈されるものとする。
【0055】
本明細書で使用されるとき、「1つの」、「及び」及び「その」の単数形には、文脈上特に明確に指示されない限り、それらの単語の複数形が含まれる。
【0056】
用語「及び/又は」、例えば「X及び/又はY」は、「X及びY」又は「X又はY」のいずれかを意味するように理解されるものとし、両方の意味又はいずれか一方の意味に対する明示的なサポートを提供すると解釈されるものとする。
【0057】
本明細書全体を通して、語句「含む(comprise)」又は変化形、例えば「含む(comprises)」若しくは「含んでいる」などは、提示される要素、完全体若しくはステップ又は要素、完全体若しくはステップの群の包含を含意するが、しかし、任意の他の要素、完全体若しくはステップ又は要素、完全体若しくはステップの群の除外を含意しないことが理解されるであろう。
【0058】
用語「約」は、本明細書で使用されるとき、指定される値から±10%の範囲を指し、提示される値自体への明示的言及を含むと解釈される(例えば、用語「約10」は、10への明示的言及を含む)。
【0059】
用語「略相補的」は、一方のポリヌクレオチドがもう一方のポリヌクレオチドに結合することを可能にするのに十分な配列同一性を有することを意味すると理解されるものとする。例えば、本明細書に記載される任意の配列は、標的配列と少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも97%、少なくとも98%又は少なくとも99%同一であり得るが、その標的配列とのハイブリダイズ能を依然として有し得る。ハイブリダイゼーションの程度は、ポリヌクレオチドのいずれか所与の機能又は方法論的プロセシングステップを達成するのに十分である、例えば転写の開始を促進するか、又はサンプル内の二本鎖ポリヌクレオチドのエンリッチメント、若しくは選択、若しくはプロセシングを促進するのに十分であり得る。
【0060】
ポリヌクレオチド配列
本明細書に開示されるポリヌクレオチド配列は、2つ以上のキャリブレーション配列をコードする単一の連続するRNA又はDNA配列であり得る。ポリヌクレオチド配列は、組換えポリヌクレオチド配列であり得る。本明細書に記載されるポリヌクレオチド配列は、本明細書に記載されるとおりのアダプターポリヌクレオチド配列でもあり得る。
【0061】
ポリヌクレオチドアダプター配列
本明細書に開示されるポリヌクレオチドアダプター配列(本明細書では同義的に「アダプター配列」、又は「アダプター」、又は「アダプター分子」と称される)は、単一の連続するRNA又はDNA配列であり得る。好ましくは、アダプター配列は、DNA配列である。アダプター配列は、組換えポリヌクレオチド配列であり得る。
【0062】
アダプター配列は、ポリヌクレオチドシーケンシング方法及び/又は定量化方法において使用可能なものである。アダプター配列によって付与される機能は、ポリヌクレオチドシーケンシング方法及び/又は定量化方法中に目的とする標的ポリヌクレオチド配列の合成(又は複製)を促進することである。これは、アダプター配列内にプライマー配列を含めることによって達成される。プライマー配列は、プライマーの部位におけるDNA合成タンパク質分子の特異的結合を促進して、合成(又は複製)の開始を可能にする。本明細書に開示されるアダプター配列には、任意の公知のプライマーを含めることができる。
【0063】
例えば、プライマー配列は、任意の市販のプライマーに略相補的(又はそれに相補的)であり得る。市販のプライマーの例としては、P5及びP7プライマー(Illumina)が挙げられる。市販のプライマーのこれら及び他の例を以下の表1に掲載する。
【0064】
【表1】
【0065】
【表2】
【0066】
【表3】
【0067】
【表4】
【0068】
プライマー配列は、ユニバーサルシーケンシングプライマー(TruSeqユニバーサルアダプター、NEBnextユニバーサルプライマーなど);試験DNAサンプル内の配列;ヒトゲノムの領域;mRNA 3’ポリA配列又は任意の公知のプライマーに略相補的(又はそれに相補的)であり得る。例えば、プライマー配列は、16S及び23S rRNA遺伝子;免疫グロブリン及びT細胞受容体遺伝子;コードエクソン;又は癌などのヒト疾患に原因として関連する遺伝子中のエクソンに隣接する及びその範囲内にある配列に略相補的(又はそれに相補的)であり得る。
【0069】
アダプター配列は、合成されるポリヌクレオチドに1つ以上の特定の配列を取り込むためにも提供され得る。これは、典型的には、シーケンシングのための標的ポリヌクレオチドを調製する際に実施される。これは、例えば、1つ以上のかかる特定の配列をプライマー配列の下流に(即ち3’方向に)位置させることによって達成され得る。代わりに又は加えて、1つ以上のかかる特定の配列をプライマー配列の上流に(即ち5’方向に)位置させることができる。例えば、アダプター配列は、二本鎖ポリヌクレオチドであり得、ここで、第1鎖は、合成されるポリヌクレオチドに取り込もうとする特定の配列の上流に位置するプライマー配列を含み、及び第1鎖に相補的な(又はそれに略相補的な)第2鎖は、合成されるポリヌクレオチドに取り込もうとする特定の配列の下流に位置するプライマー配列を含む。
【0070】
キャリブレーション配列
ポリヌクレオチド配列は、任意の数のキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、200,000個以下、又は100,000個以下、又は10,000個以下、又は1,000個以下、又は900個以下、又は800個以下、又は700個以下、又は600個以下、又は500個以下、又は400個以下、又は300個以下、又は200個以下、又は100個以下、又は90個以下、又は80個以下、又は70個以下、又は60個以下、又は50個以下、又は40個以下、又は30個以下、又は20個以下、又は10個以下、又は9個以下、又は8個以下、又は7個以下、又は6個以下、又は5個以下、又は4個以下、又は3個以下、又は2個以下のキャリブレーション配列を含有し得る。
【0071】
代わりに、ポリヌクレオチド配列は、2個より多い、3個より多い、4個より多い、5個より多い、6個より多い、7個より多い、8個より多い、9個より多い、10個より多い、20個より多い、30個より多い、40個より多い、50個より多い、60個より多い、70個より多い、80個より多い、90個より多い、100個より多い、200個より多い、300個より多い、400個より多い、500個より多い、600個より多い、700個より多い、800個より多い、900個より多い、1000個より多い、5000個より多い、10,000個より多い又は20,000個より多いキャリブレーション配列を含み得る。
【0072】
ポリヌクレオチド配列は、2~20,000個のキャリブレーション配列を含み得る。例えば、ポリヌクレオチド配列は、2~10,000個のキャリブレーション配列、又は2~5,000個のキャリブレーション配列、又は2~1,000個のキャリブレーション配列、又は2~500個のキャリブレーション配列、又は2~100、又は2~10個のキャリブレーション配列、又は2~5個のキャリブレーション配列、又は2~4個のキャリブレーション配列、又は2~3個のキャリブレーション配列、又は別の同様の範囲を含み得る。
【0073】
各キャリブレーション配列は、他のキャリブレーション配列の長さと無関係なポリヌクレオチド長であり得る。キャリブレーション配列は、21ヌクレオチド~20,000ヌクレオチド長の異なる長さであり得る。キャリブレーション配列は、独立に、20,000以下、又は10,000以下、又は1,000以下、又は900以下、又は800以下、又は700以下、又は600以下、又は500以下、又は400以下、又は300以下、又は200以下、又は100以下、又は90以下、又は80以下、又は70以下、又は60以下、又は50以下、又は40以下、又は30以下、又は21以下、又は21以下、又は18以下、又は15以下のヌクレオチド長であり得る。キャリブレーション配列は、独立に、少なくとも20,000、又は少なくとも10,000、又は少なくとも1,000、又は少なくとも900、又は少なくとも800、又は少なくとも700、又は少なくとも600、又は少なくとも500、又は少なくとも400、又は少なくとも300、又は少なくとも200、又は少なくとも100、又は少なくとも90、又は少なくとも80、又は少なくとも70、又は少なくとも60、又は少なくとも50、又は少なくとも40、又は少なくとも30、又は少なくとも21ヌクレオチド、又は少なくとも18ヌクレオチド、又は少なくとも15ヌクレオチド長であり得る。キャリブレーション配列の長さは、上記に提示される最小値及び最大値の任意の組み合わせによって定義される範囲内であり得る。例えば、キャリブレーション配列は、21~10,000ヌクレオチド長、又は21~2,000ヌクレオチド長、又は21~1,000ヌクレオチド長、又は21~900ヌクレオチド長、又は21~800ヌクレオチド長、又は21~700ヌクレオチド長、又は21~600ヌクレオチド長、又は21~500ヌクレオチド長、又は21~400ヌクレオチド長、又は21~300ヌクレオチド長、又は21~200ヌクレオチド長、又は21~100ヌクレオチド長であり得る。一例では、キャリブレーション配列は、約200~約1600ヌクレオチド長であり得る。別の例では、キャリブレーション配列は、約600~約1600ヌクレオチド長であり得る。
【0074】
ポリヌクレオチド配列中に存在する任意のキャリブレーション配列は、1コピーのみで存在し得る。一例では、ポリヌクレオチド配列中に存在する全てのキャリブレーション配列は、1コピーのみで存在し得る。代わりに、ポリヌクレオチド配列中に存在するいずれか1つ以上のキャリブレーション配列は、2つ以上のコピー数で存在し得る。例えば、ポリヌクレオチドは、独立に、2、3、4、5、6、7、8、9、10、12、14、16、32、64、100、128、256、512、1000、1024、2048、4096、8192又は10,000コピー(順不同)のいずれかで存在する1つ以上のキャリブレーション配列を含有し得る。
【0075】
別の例では、ポリヌクレオチドは、1コピー以上で存在する第1のキャリブレーション配列と、第1のキャリブレーション配列よりも2、3、4、5、6、7、8、9、10、20、50、100、1,000又は10,000倍多いコピー数のいずれかで存在する第2のキャリブレーション配列とを含有し得る。別の例では、1つ以上のキャリブレーション配列は、ポリヌクレオチド配列中において、2、3、4又は5コピーより多く存在し得る。代わりに又は加えて、任意のキャリブレーション配列は、ポリヌクレオチド配列中において、5、10、20、50、100又は100,000コピー以下で存在し得る。更なる例において、ポリヌクレオチドは、等しいコピー数で存在するキャリブレーション配列を含み得る。キャリブレーション配列のいずれか2つ若しくは2つより多く又は全ては、等しいコピー数で存在し得る。
【0076】
本明細書に開示されるポリヌクレオチド配列は、ポリヌクレオチド配列内にある第2のキャリブレーション配列のコピー数に対して既知の、対数の、整数の、一連の及び一定の比をとるコピー数で繰り返される1つ以上のキャリブレーション配列を含み得る。代わりに、本明細書に開示されるポリヌクレオチド配列は、ポリヌクレオチド配列内で異なるコピー数で繰り返される2つ以上のキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、ポリヌクレオチド配列内で1、2及び3コピー数で繰り返されるキャリブレーション配列を含む。
【0077】
1つの詳細な例において、ポリヌクレオチド配列は、それぞれ2、2、1及び3コピーで存在する、A、B、C及びDと称され得るキャリブレーション配列を含む。このように、一例では、ポリヌクレオチドは、そのうちの1個が1コピーのみで存在し、そのうちの2個が2コピーで存在し、及びそのうちの1個が3コピーで存在する4個のキャリブレーション配列を含み得るか又はそれからなり得る。
【0078】
キャリブレーション配列のコピーは、元のキャリブレーション配列と同一である。所与のキャリブレーション配列の「変異体」は、異なるキャリブレーション配列と見なされることが理解されるであろう。このように、例えば、本明細書に開示されるポリヌクレオチド配列は、目的のゲノム配列を表す第1のキャリブレーション配列と、第1のキャリブレーション配列の変異体を表す第2のキャリブレーション配列とを含み得る。ポリヌクレオチド配列は、各々が目的のゲノム配列の変異体を表す複数のキャリブレーション配列を含み得る。変異体は、特定の目的のゲノム配列と比べた任意の遺伝子変化によって生じ得る。
【0079】
キャリブレーション配列は、単一の連続するポリヌクレオチド配列となるように所定のコピー数で組み合わされ得る。
【0080】
本明細書に開示されるポリヌクレオチドは、天然に存在するいかなるゲノムにも見られない配置で提供される2つ以上のキャリブレーション配列を含む。このように、キャリブレーション配列は、単一のポリヌクレオチド配列内に人工的に配置される。従って、キャリブレーション配列は、天然に存在するゲノム配列と同一であり得るが、それらは、本明細書に開示されるポリヌクレオチドにおけるその人工的な配置を通して非天然の形態で提供される。この非天然の形態とは、単に、本明細書に開示されるポリヌクレオチド配列内でのキャリブレーション配列の体裁であり得る。本明細書に開示されるポリヌクレオチド配列の調製は、天然には見られないポリヌクレオチド配列の生成を必要とすることが理解されるであろう。
【0081】
本明細書に開示されるポリヌクレオチド配列は、天然のゲノム又はトランスクリプトームに本来存在しない線状配列を形成するように人工的に配置される2つ以上のキャリブレーション配列を含有する。このように、2つ以上のキャリブレーション配列が共につなぎ合わされるか又はライゲートされて、単一のポリヌクレオチド配列を形成し得る。ポリヌクレオチド配列は、介在するスペーサー配列と共に連続的に線状に配置されているキャリブレーション配列を含み得る。代わりに又は加えて、ポリヌクレオチド配列は、線状の並び順で連続的に配置される(即ち介在するスペーサー配列のない)キャリブレーション配列を含み得る。
【0082】
本明細書に開示されるポリヌクレオチド配列は、単一のキャリブレーション配列の少なくとも2コピーを含み得、それらのコピーは、ポリヌクレオチド配列内において、2つのコピーが他のキャリブレーション配列及び/又は他のキャリブレーション配列の複数のコピーによって隔てられるように配置される。
【0083】
本明細書に開示されるポリヌクレオチド配列は、追加の配列エレメントを含み得る。これらの追加の配列エレメントは、人工的なもの(即ち天然に存在するゲノムに存在しないもの)であり得る。例えば、ポリヌクレオチド配列は、いずれか1つ以上のキャリブレーション配列の前、及び/又はその間、及び/又はその後ろに生じるスペーサー及び/又はフランキング配列を含み得る。スペーサー配列は、5より大きい、6より大きい、7より大きい、8より大きい、9より大きい、10より大きい、12より大きい、15より大きい、18より大きい、21より大きい、30より大きい、40より大きい、50より大きい、100より大きい、200より大きい、500より大きい、600より大きい、1000より大きい、2000より大きい、10,000より大きいヌクレオチド長であり得る。スペーサーは、5以下、6以下、7以下、8以下、9以下、10以下、12以下、15以下、15以下、18以下、21以下、30以下、40以下、50以下、100以下、200以下、500以下、600以下、1000以下、2000以下、10,000以下のヌクレオチド長であり得る。スペーサー配列の非限定的な例は、配列番号41~45に示される。多くの代替的なスペーサー配列を使用し得ることが理解されるであろう。
【0084】
フランキング配列は、5より大きい、6より大きい、7より大きい、8より大きい、9より大きい、10より大きい、12より大きい、15より大きい、18より大きい、21より大きい、30より大きい、40より大きい、50より大きい、100より大きい、200より大きい、500より大きい、600より大きい、1000より大きい、2000より大きい、10,000より大きいヌクレオチド長であり得る。スペーサーは、5以下、6以下、7以下、8以下、9以下、10以下、12以下、15以下、15以下、18以下、21以下、30以下、40以下、50以下、100以下、200以下、500以下、600以下、1000以下、2000以下、10,000以下のヌクレオチド長であり得る。一例では、ポリヌクレオチド配列は、1つ以上のキャリブレーション配列又は各キャリブレーション配列の前、その間及びその後ろに生じるスペーサー及びフランキング配列を含む。
【0085】
別の例では、ポリヌクレオチド配列は、スペーサー配列によって隔てられているキャリブレーション配列の2つ以上のコピーを含む。スペーサー配列は、人工的なもの(即ち天然に存在するゲノムに存在しないもの)であり得る。一例では、スペーサー配列は、ランダム化された遺伝子配列であり、これがキュレートされて、任意の公的に利用可能である、天然に存在するゲノム配列との配列相同性が除去又は低減され得る。本明細書に開示されるポリヌクレオチド配列は、1つ以上のキャリブレーション配列と連続する1つ以上のスペーサー配列を含み得る。代わりに又は加えて、ポリヌクレオチド配列は、ライブラリ調製時に起こり得るエッジ効果を軽減するスペーサー及びフランキング配列を含み得る。
【0086】
ポリヌクレオチド配列は、次世代シーケンシングライブラリから計算的に識別、フィルタリング及び/又は除去することのできるスペーサー及び/又はフランキング配列を含み得る。一例では、ポリヌクレオチド配列は、シーケンシング時、合成配列、又は参照合成染色体、又は人工配列若しくは人工染色体(例えば、国際公開第2016/094947号に記載されるとおり)と計算的にアラインメントすることのできるスペーサー及びフランキング配列を含む。
【0087】
本明細書に開示されるポリヌクレオチド配列は、ポリメラーゼ鎖の増幅時に使用されるプライマー配列に完全に又は部分的に相補的な1つ以上のスペーサー及び/又はフランキング配列を含み得る。例えば、ポリヌクレオチド配列は、制限エンドヌクレアーゼ消化のための認識部位配列を有するスペーサー及び/又はフランキング配列を含むことができる。代わりに又は加えて、ポリヌクレオチド配列は、いずれか1つ以上のプロモーター配列、転写開始部位又はポリAトラクトを有するスペーサー及びフランキング配列を含むことができる。ポリヌクレオチド配列は、1つ以上のプライマー部位、制限部位、プロモーター配列、転写開始部位及び/又はポリAトラクトに作動可能に連結されているキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、1つ以上のプライマー部位、制限部位、プロモーター配列、転写開始部位及び/又はポリAトラクトに作動可能に連結されている第1のキャリブレーション配列と、1つ以上の異なるプライマー部位、制限部位、プロモーター配列、転写開始部位及び/又はポリAトラクトに作動可能に連結されている第2のキャリブレーション配列とを含む。
【0088】
本明細書に開示されるとおりの2つ以上のポリヌクレオチド配列を組み合わせて組成物を形成し得ることが理解されるであろう。この組成物は、2つ以上の異なるポリヌクレオチド配列を含むことができる。2つ以上の異なるポリヌクレオチド配列は、それぞれ2つ以上の異なるキャリブレーション配列を含み得る。代わりに、組成物は、各々が同一の組のキャリブレーション配列を含む2つ以上の異なるポリヌクレオチド配列を含み得る。
【0089】
本明細書に開示される組成物において、組成物中の2つ以上のポリヌクレオチド配列に1つ以上のキャリブレーション配列が存在し得る。一例では、2つ以上のポリヌクレオチド配列に単一のキャリブレーション配列が異なるコピー数で存在する。
【0090】
別の例では、2つ以上のポリヌクレオチド配列が異なる濃度で組み合わされて混合物を形成し得る。ポリヌクレオチド配列は、所定の濃度で組み合わされて混合物を形成し得る。一部の組成物では、2つ以上のポリヌクレオチド配列が既知の絶対濃度で組み合わされて混合物を形成し得る。一部の組成物では、2つ以上のポリヌクレオチド配列が既知の相対濃度で組み合わされて混合物を形成し得る。一部の組成物では、2つ以上のポリヌクレオチド配列が等モル濃度で組み合わされて混合物を形成し得る。相対濃度は、組成物中の各キャリブレーション配列の相対量が、各キャリブレーション配列のコピー数に関して本明細書に記載される相対的な倍数差のいずれかで提供されるように予め決められ得る。
【0091】
本明細書に記載されるとおり、本開示のアダプター配列は、キャリブレーション配列を含み、これは、転写後のポリヌクレオチドに取り込まれることになる。キャリブレーション配列(本明細書では「標準」、「参照標準」又は「対照」とも称される)は、ポリヌクレオチドシーケンシング方法及び/又は定量化方法の精度を測定する際に対比させ得る参照標準としての役割を果たす任意の好適な長さ及び/又はヌクレオチド組成であり得る。キャリブレーション配列は、ポリヌクレオチドシーケンシングの精度及び/又は定量化を評価する際に対比させ得る既知の配列及び分量のグラウンドトゥルース対照である。キャリブレーション配列は、方法中にそれが合成、シーケンシング及び/又はアラインメントの性能を妨げないような任意の好適な長さ及び/又はヌクレオチド組成であり得る。
【0092】
本開示のアダプターとの関連では、キャリブレーション配列は、例えば、少なくとも8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、500、1,000ヌクレオチド長であり得る。このように、キャリブレーション配列は、例えば、少なくとも約8、少なくとも約10、約15、約20、約25、約30、約35、約40、約45、約50、約60、約70、約80、約90、約100、約150、約200、約300、約400、約500又は約1,000ヌクレオチド長であり得る。別の例では、キャリブレーション配列は、約10、約15、約20、約25、約30、約35、約40、約45、約50、約60、約70、約80、約90、約100、約150、約200、約300、約400、約500又は約1,000ヌクレオチド長であり得る。代わりに又は加えて、キャリブレーション配列は、例えば、20,000、10,000、5,000、2,000、1,000、900、800、700、600、500、400、300、200又は100ヌクレオチド長未満であり得る。このように、キャリブレーション配列は、例えば、8~10,000ヌクレオチド長であり得る。フローセルベースのシーケンシング方法には、より短いキャリブレーション配列(例えば、8~100ヌクレオチド長、8~50ヌクレオチド長など、8~20ヌクレオチド長など、約20ヌクレオチド長など)が好ましくなり得る。より長いポリヌクレオチドのシーケンシングを典型的に含むナノポアベースのシーケンシング方法には、より長いキャリブレーション配列(例えば、8~10,000ヌクレオチド長、12~10,000ヌクレオチド長など、20~10,000ヌクレオチド長など、50~10,000ヌクレオチド長など、100~10,000ヌクレオチド長など)が好ましくなり得る。
【0093】
キャリブレーション配列は、アダプター配列において任意の比率を占め得る。例えば、キャリブレーション配列は、アダプター配列の長さの少なくとも0.0001、0.001、0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、0.95、0.99、0.999、0.9999の割合を占め得る。別の例では、キャリブレーション配列は、ポリヌクレオチドアダプター配列長さの約0.1%、約1%、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%、約15%、約16%、約17%、約18%、約19%、約20%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、約95%、約99%、約99.9%を占め得る。別の例では、キャリブレーション配列は、ポリヌクレオチドアダプター配列長さの1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%又は99.9%以下を占め得る。
【0094】
アダプター配列は、任意の数のキャリブレーション配列を含み得る。一例では、アダプター配列は、1,000個以下、又は900個以下、又は800個以下、又は700個以下、又は600個以下、又は500個以下、又は400個以下、又は300個以下、又は200個以下、又は100個以下、又は90個以下、又は80個以下、又は70個以下、又は60個以下、又は50個以下、又は40個以下、又は30個以下、又は20個以下、又は10個以下、又は9個以下、又は8個以下、又は7個以下、又は6個以下、又は5個以下、又は4個以下、又は3個以下、又は2個以下、又は1個以下のキャリブレーション配列を含有し得る。
【0095】
ポリヌクレオチド配列は、2~1,000個のキャリブレーション配列、又は2~500個のキャリブレーション配列、又は2~100個のキャリブレーション配列、又は2~50個のキャリブレーション配列、又は2~10個のキャリブレーション配列、又は2~8個のキャリブレーション配列、又は別の同様の範囲を含み得る。
【0096】
2つ以上のキャリブレーション配列を含むアダプター配列又は2つ以上のキャリブレーション配列を含む2つ以上のアダプター配列の組成物では(同じアダプター配列か否かにかかわらず)、各キャリブレーション配列は、他のキャリブレーション配列の長さと無関係なポリヌクレオチド長であり得る。キャリブレーション配列は、8ヌクレオチド~10,000ヌクレオチド長の種々の長さであり得る。キャリブレーション配列は、独立に、10,000以下、又は1,000以下、又は900以下、又は800以下、又は700以下、又は600以下、又は500以下、又は400以下、又は300以下、又は200以下、又は100以下、又は90以下、又は80以下、又は70以下、又は60以下、又は50以下、又は40以下、又は30以下、又は21以下のヌクレオチド長であり得る。代わりに又は加えて、キャリブレーション配列は、独立に、少なくとも9,900、又は少なくとも1,000、又は少なくとも900、又は少なくとも800、又は少なくとも700、又は少なくとも600、又は少なくとも500、又は少なくとも400、又は少なくとも300、又は少なくとも200、又は少なくとも100、又は少なくとも90、又は少なくとも80、又は少なくとも70、又は少なくとも60、又は少なくとも50、又は少なくとも40、又は少なくとも30、又は少なくとも21、又は少なくとも20、又は少なくとも15、又は少なくとも10、又は少なくとも8ヌクレオチド長であり得る。キャリブレーション配列の長さは、上記に提示される最小値及び最大値の任意の組み合わせによって定義される範囲内であり得る。例えば、キャリブレーション配列は、8~10,000ヌクレオチド長、又は21~2,000ヌクレオチド長、又は21~1,000ヌクレオチド長、又は21~900ヌクレオチド長、又は21~800ヌクレオチド長、又は21~700ヌクレオチド長、又は21~600ヌクレオチド長、又は21~500ヌクレオチド長、又は21~400ヌクレオチド長、又は21~300ヌクレオチド長、又は21~200ヌクレオチド長、又は21~100ヌクレオチド長であり得る。一例では、キャリブレーション配列は、約8~約10,000ヌクレオチド長であり得る。一例では、キャリブレーション配列は、約8~約10,000ヌクレオチド長であり得る。一例では、キャリブレーション配列は、約10~約10,000ヌクレオチド長であり得る。別の例では、キャリブレーション配列は、約20~約1000ヌクレオチド長であり得る。
【0097】
アダプターに存在する任意のキャリブレーション配列は、1コピーのみで存在し得る。一例では、アダプターに存在する全てのキャリブレーション配列は、1コピーのみで存在し得る。代わりに、アダプターに存在するいずれか1つ以上のキャリブレーション配列は、2つ以上のコピー数で存在し得る。例えば、アダプターは、独立に、2、3、4、5、6、7、8、9、10、12、14、16、32、64、100、128、256、512、1000、1024、2048、4096、8192又は10,000コピー(順不同)のいずれかで存在する1つ以上のキャリブレーション配列を含有し得る。
【0098】
別の例では、アダプターは、1コピー以上で存在する第1のキャリブレーション配列と、第1のキャリブレーション配列よりも2、3、4、5、6、7、8、9、10、20、50、100、1,000又は10,000倍多いコピー数のいずれかで存在する第2のキャリブレーション配列とを含有し得る。別の例では、1つ以上のキャリブレーション配列は、アダプター中において、2、3、4又は5コピーより多く存在し得る。代わりに又は加えて、任意のキャリブレーション配列は、アダプター中において、5、10、20、50、100又は100,000コピー以下で存在し得る。更なる例において、ポリヌクレオチドは、等しいコピー数で存在するキャリブレーション配列を含み得る。キャリブレーション配列のいずれか2つ若しくは2つより多く又は全ては、等しいコピー数で存在し得る。
【0099】
別の例では、1つのアダプターは、1コピー以上で存在する第1のキャリブレーション配列を含有し得、及び第2のアダプターは、第1のキャリブレーション配列よりも2、3、4、5、6、7、8、9、10、20、50、100、1,000又は10,000倍多いコピー数のいずれかで存在する第2のキャリブレーション配列を含有し得る。
【0100】
本明細書に開示されるアダプター配列(これは、1つ以上のコピー数で存在する1つ以上のキャリブレーション配列をそれぞれ独立に有する1つ以上のアダプターを含む組成物及び/又は混合物中に提供され得る)は、アダプター配列内又は複数のアダプターの組成物中の異なるアダプター内にある第2のキャリブレーション配列のコピー数に対して既知の、対数の、整数の、一連の及び一定の比をとるコピー数で繰り返される1つ以上のキャリブレーション配列を含み得る。一例では、アダプター配列は、アダプター配列内又は混合物中に存在する複数のアダプターにわたる集合体内において、1、2及び3コピー数で繰り返されるキャリブレーション配列を含む。このように、本明細書に開示されるアダプターの組成物又は混合物は、組成物又は混合物中の異なるアダプター内にある第2のキャリブレーション配列のコピー数に対して既知の、対数の、整数の、一連の及び一定の比をとるコピー数で繰り返される1つ以上のキャリブレーション配列を含み得る。
【0101】
1つの詳細な例において、アダプター配列は、それぞれ2、2、1及び3コピーで存在する、A、B、C及びDと称され得るキャリブレーション配列を含む。このように、一例では、アダプターは、そのうちの1個が1コピーのみで存在し、そのうちの2個が2コピーで存在し、及びそのうちの1個が3コピーで存在する4個のキャリブレーション配列を含み得るか又はそれからなり得る。
【0102】
キャリブレーション配列のコピーは、元のキャリブレーション配列と同一である。所与のキャリブレーション配列の「変異体」は、異なるキャリブレーション配列と見なされることが理解されるであろう。このように、例えば、本明細書に開示されるアダプター配列(又はアダプター配列の組成物若しくは混合物)は、目的のゲノム配列を表す第1のキャリブレーション配列と、第1のキャリブレーション配列の変異体を表す第2のキャリブレーション配列とを含み得る。アダプター配列は、各々が目的のゲノム配列の変異体を表す複数のキャリブレーション配列を含み得る。変異体は、特定の目的のゲノム配列と比べた任意の遺伝子変化によって生じ得る。
【0103】
キャリブレーション配列は、単一の連続するポリヌクレオチド配列となるように所定のコピー数で組み合わされ得る。この単一の連続するポリヌクレオチド配列がアダプター配列を構成し得る。
【0104】
本明細書に開示されるアダプター配列は、天然に存在するポリヌクレオチド配列であるキャリブレーション配列を含み得る。加えて、本明細書に開示されるアダプター配列は、天然に存在するいかなるゲノムにも見られない配置で提供される2つ以上のキャリブレーション配列を含み得る。このように、キャリブレーション配列は、アダプター配列内で人工的に配置されているものであり得る。従って、キャリブレーション配列は、天然に存在するゲノム配列と同一であり得るが、本明細書に開示されるアダプターにおけるその人工的な配置を通して非天然の形態で提供される。この非天然の形態とは、単に、本明細書に開示されるアダプター配列内でのキャリブレーション配列の体裁であり得る。本明細書に開示されるアダプター配列の調製は、天然には見られないポリヌクレオチド配列の生成を必要とすることが理解されるであろう。
【0105】
本明細書に開示されるアダプター配列は、天然のゲノム又はトランスクリプトームに本来存在しない線状配列を形成するように人工的に配置される2つ以上のキャリブレーション配列を含有し得る。このように、2つ以上のキャリブレーション配列が共につなぎ合わされるか又はライゲートされて、単一のポリヌクレオチド配列を形成し得る。アダプター配列は、介在するスペーサー配列と共に連続的に線状に配置されているキャリブレーション配列を含み得る。代わりに又は加えて、アダプター配列は、線状の並び順で連続的に配置される(即ち介在するスペーサー配列のない)キャリブレーション配列を含み得る。
【0106】
本明細書に開示されるアダプター配列は、単一のキャリブレーション配列の少なくとも2コピーを含み得、それらのコピーは、アダプター配列内において、2つのコピーが他のキャリブレーション配列及び/又は他のキャリブレーション配列の複数のコピーによって隔てられるように配置される。
【0107】
代わりに又は加えて、本明細書に開示されるアダプター配列は、人工キャリブレーション配列を含み得る。人工キャリブレーション配列は、天然のエクソン、遺伝子、アレル、ゲノム又はトランスクリプトーム配列から選択される配列と100%未満、99.99%未満、99.9%未満、99%未満、90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、20%未満、10%未満又は1%未満の配列同一性を有し得る。一例では、キャリブレーション配列は、天然に存在する遺伝子配列であって、そのキャリブレーション配列を元の遺伝子配列と区別することを可能にする1つ以上の遺伝子変異体、ヌクレオチドトランスバージョン、トランジション、挿入及び欠失で修飾されている配列から選択される。一例では、キャリブレーション配列は、天然に存在する遺伝子配列であって、そのキャリブレーション配列を元の遺伝子配列と区別することを可能にする1つ以上の人工的なヌクレオチドトランスバージョン、トランジション、挿入及び欠失で修飾されている配列から選択される。別の例では、キャリブレーション配列は、天然に存在する遺伝子配列であって、次にそのキャリブレーション配列を元の遺伝子配列と区別することが可能となるように反転され、入れ換えられ、及び/又は修飾されている配列から選択され得る。従ってキャリブレーション配列は、人工的な配列の表現である1つ以上の天然の遺伝子配列を含み、ここで、天然の遺伝子配列は、遺伝的変異、遺伝子又は反復配列を含む。
【0108】
本明細書に開示されるキャリブレーション配列は、その長さの10%、20%、30%、40%、50%、60%、70%、80%又は90%超をグアニン又はシトシンヌクレオチドが占め得る。代わりに又は加えて、キャリブレーション配列は、その長さの10%、20%、30%、40%、50%、60%、70%、80%又は90%超をアデニン又はチミンヌクレオチドが占め得る。代わりに又は加えて、キャリブレーション配列は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19又は20ヌクレオチド長を超える単一ヌクレオチド反復配列を含み得る。代わりに又は加えて、キャリブレーション配列は、2、4、6、8、10、12、14、16、18又は20ヌクレオチド長を超えるジヌクレオチド反復配列を含み得る。代わりに又は加えて、キャリブレーション配列は、3、6、9、12、15、18又は21ヌクレオチド長を超えるトリヌクレオチド反復配列を含み得る。
【0109】
本明細書に開示されるアダプター配列は、追加の配列エレメントを含み得る。これらの追加の配列エレメントは、人工的なもの(即ち天然に存在するゲノムに存在しないもの)であり得る。例えば、ポリヌクレオチド配列は、いずれか1つ以上のキャリブレーション配列の前、及び/又はその間、及び/又はその後ろに生じるスペーサー配列を含み得る。スペーサー配列は、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも20、少なくとも50、少なくとも100ヌクレオチド長であり得る。代わりに又は加えて、スペーサー配列は、6以下、8以下、10以下、20以下、50以下、100以下のヌクレオチド長であり得る。一例では、アダプター配列は、1つ以上のキャリブレーション配列又は各キャリブレーション配列の前、その間及びその後ろに生じるスペーサー配列を含む。
【0110】
別の例では、アダプター配列は、スペーサー配列によって隔てられているキャリブレーション配列の2つ以上のコピーを含む。スペーサー配列は、人工的なもの(即ち天然に存在するゲノムに存在しないもの)であり得る。一例では、スペーサー配列は、ランダム化された遺伝子配列であり、これがキュレートされて、任意の公的に利用可能である、天然に存在するゲノム配列との配列相同性が除去又は低減され得る。本明細書に開示されるアダプター配列は、1つ以上のキャリブレーション配列と連続する1つ以上のスペーサー配列を含み得る。代わりに又は加えて、アダプター配列は、ライブラリ調製時に起こり得るエッジ効果を軽減するスペーサー配列を含み得る。
【0111】
アダプター配列は、次世代シーケンシングライブラリから計算的に識別、フィルタリング及び/又は除去することのできるスペーサー及び/又はフランキング配列を含み得る。一例では、アダプター配列は、シーケンシング時、合成配列、又は参照合成染色体、又は人工配列若しくは人工染色体(例えば、国際公開第2016/094947号に記載されるとおり)と計算的にアラインメントすることのできるスペーサー及びフランキング配列を含む。
【0112】
本明細書に開示されるアダプター配列は、制限エンドヌクレアーゼ消化又はライゲーションのための認識部位配列を有するスペーサー及び/又はフランキング配列を含み得る。代わりに又は加えて、アダプター配列は、いずれか1つ以上のプロモーター配列、転写開始部位又はポリAトラクトを有するスペーサー及びフランキング配列を含むことができる。アダプター配列は、1つ以上のプライマー部位、制限部位、プロモーター配列、転写開始部位及び/又はポリAトラクトに作動可能に連結されているキャリブレーション配列を含み得る。一例では、アダプター配列は、1つ以上のプライマー部位、制限部位、プロモーター配列、転写開始部位及び/又はポリAトラクトに作動可能に連結されている第1のキャリブレーション配列と、1つ以上の異なるプライマー部位、制限部位、プロモーター配列、転写開始部位及び/又はポリAトラクトに作動可能に連結されている第2のキャリブレーション配列とを含む。
【0113】
アダプター配列は、UMI、フローセルDNA配列に相補的な配列、細胞バーコード配列及びインデックス配列のいずれか1つ以上も含み得る。代わりに、アダプター配列は、UMI、フローセルDNA配列に相補的な配列、細胞バーコード配列及びインデックス配列のいずれか1つ以上を含まなくてもよい。
【0114】
一意の分子識別子(UMI)配列は、シーケンスリードが別のシーケンスリードのデュプリケーション(これは、ライブラリ調製時のPCR増幅時に起こり得る)であるかどうかを指示する一意的な人工配列である。UMI配列は、典型的には、シーケンシング前には分からないが、アダプターの合成時にランダムヌクレオチドの取込みによって作られる(ランダムな未知のUMI配列は、典型的には、NNNNNのアノテーションで指示される)。UMIは、ランダムに合成される結果として組成物内で一意に存在し、混合物内での分量は、分からない。UMIは、他のUMI配列といかなる相同性も共有しない。UMIは、典型的には、4~12ntの短い配列であり(ショートリードIlluminaシーケンシング用)、最長でも36nt(ロングリードOxford Nanoporeシーケンシング用)である。UMI配列は、典型的には、ランダムな人工配列であり、ヌクレオチド反復配列を含まない。任意の単一の試験サンプルDNA配列は、2つの識別されたUMIと結び付けられることになるものと思われ、ここで、第2の標的サンプルが、同じ配列で及び同じ2つの識別されたUMIと結び付けられる可能性は低く、そのリードは、典型的には、PCR増幅に起因した、第1のリードのデュプリケートクローンであることを指示する。本明細書に開示される各アダプターは、単一のUMIを含み得る。
【0115】
UMI配列は、いずれか1つ以上のランダムに取り込まれたヌクレオチドを含み得、R、Y、S、W、K、M、B、D、H、V又はNヌクレオチド(IUPACヌクレオチドコード)からなる群から選択されるいずれか1つ以上の修飾ヌクレオチドを含み得る。このように、キャリブレーション配列は、代替的実施形態では、かかるUMI配列を含まなくてもよい。このように、キャリブレーション配列は、A、T、C又はGヌクレオチドのみを含み得る、R、Y、S、W、K、M、B、D、H、V又はNヌクレオチド(IUPACヌクレオチドコード)からなる群から選択されるいずれか1つ以上の修飾ヌクレオチドを含まなくてもよい。
【0116】
インデックス配列は、シーケンシングリードがいずれのライブラリに属するかを指示する一意的な人工配列である。それぞれの異なるライブラリは、使用されるアダプター配列内で異なるインデックス配列を含むことになる。次に、単一フローセル上でのシーケンシングのためにそれらのライブラリが共に混合され(「マルチプレックス化」と称される)、出力シーケンシングリードは、インデックス配列の存在に基づいて異なるライブラリに割り当てられる。インデックス配列は、典型的には、6~8ヌクレオチド(例えば、ショートリードIlluminaシーケンシング用)及び36ヌクレオチド(例えば、ロングリードOxford Nanoporeシーケンシング用)並びにヌクレオチド反復配列を含まないランダムな人工配列である。アダプター配列は、シングルセルシーケンシング適用向けの「細胞バーコード」配列も含み得る。これは、シーケンシングリードと個々の細胞、ウェル又は液滴との関連付けを指示する短い(例えば、26ヌクレオチド)配列を含む。典型的には、インデックス及び細胞バーコード配列は、ランダム配列である。
【0117】
アダプター配列は、標的ポリヌクレオチドと、フローセルの表面など、表面にアンカリングされているポリヌクレオチド又はタンパク質に取り付けられているポリヌクレオチドとの間に架橋を形成し得る。フローセルは、オリゴヌクレオチドが取り付けられた固体表面を含み得る。アダプター配列は、表面に取り付けられているオリゴヌクレオチド配列に相補的なプライマー配列を含有し得る。従って、試験サンプルDNA配列とアダプター配列とを含むDNA断片は、表面に取り付けられているオリゴヌクレオチド配列にハイブリダイズすることができる。
【0118】
Y字型アダプター
本明細書に開示されるアダプター配列は、Y字型アダプターであり得る。Y字型アダプターは、一体にアニールされた2つの略相補的なポリヌクレオチド配列を含み、ここで、アニールされた分子の一端は、相補的ポリヌクレオチドを含み、アニールされた分子の他端は非相補的ポリヌクレオチドを含む。このように、例えば、Y字型アダプターは、2つのポリヌクレオチドアダプター配列をアニールすることによって形成され得、ここで、第1のポリヌクレオチドアダプター配列の3’側端は、第2のポリヌクレオチド配列の5’側端に相補的である一方、第1のポリヌクレオチドアダプター配列の5’側端は、第2のポリヌクレオチドアダプター配列の3’側端に非相補的である。これらの2つのポリヌクレオチド配列がハイブリダイズし、アニールすると、それらは、Y字型分子構造を形成する。図1は、Y字型アダプターの非限定的な例を示す。一例では、本明細書に開示されるY字型アダプターは、Y字のうち、アニールされる部分(Y字の縦棒)に2つの相補的プライマー配列を含み得、2つのアニールされない部分(Y字の枝分かれ)は、非相補配列を含む。これらの非相補配列は、プライマー配列であっても又はなくてもよい。
【0119】
アダプター内でのプライマー配列及びキャリブレーション配列の相対的位置
キャリブレーション配列は、ポリヌクレオチドアダプター配列の5’側端に位置し得る。代わりに、キャリブレーション配列は、ポリヌクレオチドアダプター配列の3’側端に位置し得る。一例では、1つのポリヌクレオチドは、ポリヌクレオチドアダプター配列の3’側端で終わるキャリブレーション配列を含む一方、第2のポリヌクレオチドアダプター配列は、ポリヌクレオチドアダプター配列の5’側端で始まる第2のキャリブレーション配列を含む。このような例において、第2のキャリブレーション配列は、第1のキャリブレーション配列の逆相補体であり得る。その結果、2つのキャリブレーション配列が二本鎖ポリヌクレオチドの同じ末端でハイブリダイズすることになる。
【0120】
本明細書に開示されるアダプターのいずれにおいても、1つのアダプター中のキャリブレーション配列は、第2のアダプター中の第2のキャリブレーション配列の逆相補体であり得る。
【0121】
一例では、キャリブレーション配列は、アニールしてY字型アダプターを形成する2つのポリヌクレオチドアダプター配列間の相補配列から3’側下流に位置する。別の例では、キャリブレーション配列は、アニールしてY字型アダプターを形成する2つのポリヌクレオチドアダプター配列間の相補配列に対して5’側上流に位置する。
【0122】
一例では、ポリヌクレオチドアダプター配列は、1つ以上のプライマー配列から3’側下流に1つ以上のキャリブレーション配列を含む。別の例では、キャリブレーション配列は、合成、ユニバーサル、P5又はP7オリゴヌクレオチド配列(表1を参照されたい)との相補配列から3’側下流に位置する。別の例では、キャリブレーション配列は、DNA合成を開始する相補的DNAオリゴヌクレオチドに結合する配列(表1を参照されたい)から3’側下流に位置する。
【0123】
一例では、ポリヌクレオチドアダプター配列は、1つ以上のプライマー配列から上流に1つ以上のキャリブレーション配列を含む。一例では、ポリヌクレオチドアダプター配列は、標的DNA部位にハイブリダイズしてDNA合成を開始させるプライマー配列を含み、ここで、結果として得られる増幅したDNA断片は、標的DNA配列から上流にポリヌクレオチドアダプター配列を含む単一のポリヌクレオチド配列を含むことになる。一例では、キャリブレーション配列は、フローセルの表面に取り付けられたオリゴヌクレオチドに相補的なプライマー配列の3’側下流に位置する。
【0124】
別の例では、キャリブレーション配列は、合成、ユニバーサル、オリゴヌクレオチド配列(表1を参照されたい)との相補配列の5’側上流に位置する。別の例では、キャリブレーション配列は、DNA合成を開始させる相補的DNAオリゴヌクレオチドに結合する配列(表1を参照されたい)から3’側下流に位置する。
【0125】
別の例では、キャリブレーション配列は、試験DNAサンプル内にある相補的標的ポリヌクレオチド配列に結合する配列から5’側上流に位置する。別の例では、キャリブレーション配列は、ヒトゲノム配列内にある相補的標的ポリヌクレオチド配列に結合する配列から5’側上流に位置する。別の例では、キャリブレーション配列は、ヒト遺伝子エクソン及び/又はイントロン内にある相補的標的ポリヌクレオチド配列に結合する配列から5’側上流に位置する。
【0126】
逆転写には、相補的標的RNA配列にハイブリダイズして相補的DNA(cDNA)合成を開始させる短いDNAオリゴヌクレオチドプライマーが必要である。本開示の一例では、アダプター配列は、1つ以上のキャリブレーション配列と、標的RNA配列に相補的な1つ以上のプライマー配列とを含む。かかるアダプターを逆転写方法に使用することができる。この例では、逆転写方法に使用されるポリヌクレオチドアダプター配列は、キャリブレーション配列と、RNA標的に相補的な配列とを含む。ポリヌクレオチドアダプター配列が標的RNA部位にハイブリダイズすると、cDNA分子の合成が始まることになり、このcDNA分子は、5’側端にポリヌクレオチドアダプター配列を含み、続いて標的RNA配列を含むものである。このように、逆転写合成により、ポリヌクレオチドアダプター配列と標的RNA配列とを含むcDNA断片を生成することができる。
【0127】
一例では、ポリヌクレオチドアダプター配列は、キャリブレーション配列を含み、ここで、キャリブレーション配列は、3個より多い、8個より多い、10個より多い、15個より多い又は20個より多い連続したチミンヌクレオチドを含有するプライマー配列から上流にある。一例では、ポリヌクレオチドアダプター配列は、キャリブレーション配列を含み、ここで、キャリブレーション配列は、3個より多い、8個より多い、10個より多い、15個より多い又は20個より多い連続したウラシルヌクレオチドを含有するプライマー配列から上流にある。一例では、ポリヌクレオチドアダプター配列は、キャリブレーション配列を含み、ここで、キャリブレーション配列は、3、8、10、15又は20個より多い連続したチミンヌクレオチドを含む配列から下流にある。
【0128】
ナノポアシーケンシングは、RNA又はDNA配列がナノポアを通過するときの電流の変化によってヌクレオチドの識別情報を決定することができる。本開示の一例では、アダプター配列は、1つ以上のキャリブレーション配列を含む。かかるアダプターは、ナノポアシーケンシング方法において使用することができる。この例では、アダプター配列は、標的ポリヌクレオチド配列にライゲートされ得る(図3の非限定的な例に示される)。一例では、アダプター配列にタンパク質が取り付けられ得る。一例では、アダプター配列は、タンパク質が取り付けられている第2のDNA分子にライゲートされ得る。取り付けられているタンパク質は、DNA又はRNA分子のナノポアを通した移行を開始させて制御する酵素モーターであり得る。次に、標的ポリヌクレオチド配列及びアダプター配列がタンパク質によってナノポアにロードされ、続いてナノポアを通過することができ、それに伴ってアダプター及びポリヌクレオチド標的配列が決定される。
【0129】
一例では、ポリヌクレオチドアダプター配列は、キャリブレーション配列を含み、ここで、キャリブレーション配列は、ポリヌクレオチドアダプター配列の3’側端で終わり、及びキャリブレーション配列は、チミンヌクレオチドで終わる。別の例では、ポリヌクレオチドアダプター配列は、キャリブレーション配列を含み、ここで、キャリブレーション配列は、ポリヌクレオチドアダプター配列の5’側始端で始まり、及びキャリブレーション配列は、チミンヌクレオチドで始まる。一例では、アダプター配列は、3’末端にチミンヌクレオチドを有する。別の例では、アダプターは、アダプター分子の5’側端に5’リン酸を含む。
【0130】
組成物
本明細書に開示されるとおりの2つ以上のアダプター配列を組み合わせて組成物を形成し得ることが理解されるであろう。この組成物は、2つ以上の異なるアダプター配列を含むことができる。2つ以上の異なるアダプター配列は、それぞれ2つ以上の異なるキャリブレーション配列を含み得る。代わりに、組成物は、各々が同一の組のキャリブレーション配列を含む2つ以上の異なるアダプター配列を含み得る。
【0131】
本明細書に開示される組成物において、組成物中の2つ以上のアダプター配列に1つ以上のキャリブレーション配列が存在し得る。一例では、2つ以上のアダプター配列に単一のキャリブレーション配列が異なるコピー数で存在する。
【0132】
別の例では、2つ以上のアダプター配列が異なる濃度で組み合わされて混合物を形成し得る。アダプター配列は、所定の濃度で組み合わされて混合物を形成し得る。一部の組成物では、2つ以上のアダプター配列が既知の絶対濃度で組み合わされて混合物を形成し得る。一部の組成物では、2つ以上のアダプター配列が既知の相対濃度で組み合わされて混合物を形成し得る。一部の組成物では、2つ以上のアダプター配列が等モル濃度で組み合わされて混合物を形成し得る。相対濃度は、組成物中の各キャリブレーション配列の相対量が、各キャリブレーション配列のコピー数に関して本明細書に記載される相対的な倍数差のいずれかで提供されるように予め決められ得る。例えば、アダプターは、組成物中の1つ以上の他のキャリブレーション配列の濃度と比べて、2、3、4、5、6、7、8、9、10、12、14、16、32、64、100、128、256、512、1000、1024、2048、4096、8192又は10,000倍高い濃度で存在する1つ以上のキャリブレーション配列を含有し得る。
【0133】
天然遺伝子特徴の表現
本明細書に記載されるキャリブレーション配列は、天然に存在するゲノムに存在する任意の特定の目的配列をベースとすることができる。例えば、キャリブレーション配列は、最新の公的に利用可能なヒトゲノム配列(現時点では、GRCh38.p13(2019年2月28日にGenome Reference ConsortiumによってNCBIに提出され、GenBankアセンブリアクセッション番号GCA_000001405.28(最新)によって識別されるGenome Reference Consortium Human Build 38パッチリリース13、ホモ・サピエンス(Homo sapiens)(ヒト)))に存在する任意の特定の目的配列をベースとすることができる。このように、キャリブレーション配列は、ヒトゲノム配列GRCh38.p13に存在する任意の特定の目的配列をベースとすることができる。キャリブレーション配列は、任意の哺乳類、脊椎動物、動物、微生物、細菌、ウイルス、ファージ、細胞小器官、原核生物又は真核生物ゲノムなど、任意の他の公的に利用可能なゲノム配列に存在する任意の特定の目的配列をベースとすることができる。かかる公的に利用可能なゲノム配列の2つの非限定的な例としては、B型肝炎ゲノム(NC_003977.2)及びHIVゲノム(NC_001802.1)が挙げられる。多くのかかる公的に利用可能なゲノム配列が存在し、本明細書に記載されるとおりのキャリブレーション配列の作成に使用し得ることは、容易に明らかであろう。
【0134】
本明細書に開示されるポリヌクレオチド配列は、天然に存在するポリヌクレオチド配列である少なくとも1つのキャリブレーション配列を含み得る。キャリブレーション配列は、部分的に又は完全に天然に存在する配列をベースとすることができる。このように、キャリブレーション配列は、天然ゲノム又はトランスクリプトーム配列に認められる1つ以上の配列をベースとし得る。このように、本明細書に開示されるポリヌクレオチド配列は、天然に見られる遺伝子配列を再現するキャリブレーション配列を含み得る。
【0135】
ポリヌクレオチド配列は、2つ以上の異なるエクソン、遺伝子、イントロン、染色体又はゲノムからの遺伝子配列を表すキャリブレーション配列を含み得る。
【0136】
キャリブレーション配列は、キャリブレーション配列の全長にわたり、天然に存在するゲノム配列と100%同一であり得る。しかしながら、他の例では、本開示のアダプター内に含まれるキャリブレーション配列は、天然に存在する遺伝子配列と100%未満の同一性(又は相同性)を有し得る。例えば、アダプター配列は、天然ゲノム又はトランスクリプトーム配列に認められる配列と1%、10%、20%、30%、40%、50%、60%、70%、80%、90%、99%、99.99%、99.9999%又は99.999999%より高い同一性(又は相同性)を有し得る。一実施形態において、アダプター配列は、天然ゲノム又はトランスクリプトーム配列に認められる配列と1%、10%、20%、30%、40%、50%、60%、70%、80%、90%、99%、99.99%、99.9999%又は99.999999%より高い同一性(相同性)の1つ以上のキャリブレーション配列を含む。一実施形態において、アダプター配列は、天然ゲノム又はトランスクリプトーム配列に認められる配列と1%、10%、20%、30%、40%、50%、60%、70%、80%、90%、99%、99.99%、99.9999%又は99.999999%より高い相同性の2つ以上のキャリブレーション配列を含む。
【0137】
本明細書に開示されるポリヌクレオチド配列は、単一の連続するRNA又はDNA配列となるようにつなぎ合わされている天然ゲノム又はトランスクリプトーム配列に認められる2つ以上の配列を再現する2つ以上のキャリブレーション配列を含むことができる。
【0138】
一例では、本明細書に記載されるポリヌクレオチド配列(本開示のラダー及びアダプターを含む)は、第1のゲノムから選択される遺伝子配列を再現する第1のキャリブレーション配列と、第2のゲノムから選択される遺伝子配列を再現する第2のキャリブレーション配列とを含み得る。別の例では、本明細書に記載されるポリヌクレオチド配列(本開示のラダー及びアダプターを含む)は、第1の染色体配列から選択される遺伝子配列を再現する第1のキャリブレーション配列と、第2の染色体配列から選択される遺伝子配列を再現する第2のキャリブレーション配列とを含み得る。他の例では、本明細書に記載されるポリヌクレオチド配列(本開示のラダー及びアダプターを含む)は、真核生物、原核生物又はウイルスゲノム、ベクター、細胞小器官又はプラスミドゲノム又はトランスクリプトーム配列のいずれか1つ以上から選択される配列を再現するキャリブレーション配列を含み得る。
【0139】
ポリヌクレオチド配列は、天然に存在するゲノム配列の特徴を表すキャリブレーション配列を含み得る。かかる特徴は、例として及び限定なしに、ヒトマイクロサテライト、T細胞及び免疫グロブリン遺伝子配列及びCpGメチル化配列から選択され得る。ポリヌクレオチド配列は、遺伝子変異体内にある配列から選択されるキャリブレーション配列を含み得、ここで、遺伝子変異体には、例えば、ヌクレオチドトランスバージョン、ヌクレオチドトランジション、挿入、欠失、逆位、リピート伸長及び/又は構造的変異体が含まれる。別の例では、ポリヌクレオチド配列は、コピー数変異、増幅、欠失、微小欠失又は染色体異数性を有する遺伝子配列から選択されるキャリブレーション配列を含み得る。本明細書に開示されるポリヌクレオチド配列は、あるゲノムから選択されるコード配列、イントロン配列及び非コード配列から選択される1つ以上のキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、遺伝子配列から選択されるキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列は、メッセンジャーRNA配列、融合遺伝子配列、マイクロRNA、長鎖非コードRNA及び他のRNA転写物種から選択されるキャリブレーション配列を含む。かかる特徴は、例として及び限定なしに、ヒトマイクロサテライト、メチル化配列及びT細胞及び免疫グロブリン遺伝子配列から選択され得る。別の例では、ポリヌクレオチド配列は、一般的な、困難な、病原性の及び/又は良性の遺伝子変異体配列から選択されるキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列は、公的に利用可能な参照ゲノムアセンブリ配列から選択されるキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列は、ヒトゲノムアセンブリ配列から選択されるキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列は、ヒト遺伝子配列から選択されるキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列は、コピー数変異、増幅、欠失、微小欠失又は染色体異数性を有する遺伝子配列から選択されるキャリブレーション配列を含む。本明細書に開示されるアダプター配列は、天然に存在するポリヌクレオチド配列である少なくとも1つのキャリブレーション配列を含み得る。キャリブレーション配列は、部分的に又は完全に天然に存在する配列をベースとすることができる。このように、キャリブレーション配列は、天然ゲノム又はトランスクリプトーム配列に認められる1つ以上の配列をベースとし得る。このように、本明細書に開示されるポリヌクレオチド配列は、天然に見られる遺伝子配列を再現するキャリブレーション配列を含み得る。アダプター配列は、エクソン、遺伝子、イントロン、染色体又はゲノムからの遺伝子配列を表すキャリブレーション配列を含み得る。アダプター配列は、2つ以上の異なるエクソン、遺伝子、イントロン、染色体又はゲノムからの遺伝子配列を表すキャリブレーション配列を含み得る。
【0140】
別の例では、ポリヌクレオチド配列(例えば、アダプター)は、公的に利用可能な参照ゲノムアセンブリ配列から選択されるキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列(例えば、アダプター)は、ヒトゲノムアセンブリ配列から選択されるキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列(例えば、アダプター)は、ヒト遺伝子配列から選択されるキャリブレーション配列を含む。
【0141】
一例では、ポリヌクレオチド配列(例えば、アダプター)は、天然に存在する第1のポリヌクレオチド配列を表す少なくとも1つのキャリブレーション配列と、第1のキャリブレーション配列の変異体配列を表す少なくとも1つ他のキャリブレーション配列とを含む。
【0142】
このように、本明細書に開示されるポリヌクレオチド配列は、遺伝子変異体を含有する遺伝子配列を再現するキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、ゲノム配列から選択される第1のキャリブレーション配列と、第1の配列に対する変異体配列を表す第2のキャリブレーション配列とを含む。一例では、ポリヌクレオチド配列は、2つ以上のキャリブレーション配列を含み、ここで、第1のキャリブレーション配列は、ヒトゲノム参照アセンブリ配列から選択され、第2のキャリブレーション配列は、第1のキャリブレーション配列の変異体を表す。一例では、ポリヌクレオチド配列は、ヒト染色体の二倍体対から選択されるそれぞれ異なるアレル配列を表す第1及び第2のキャリブレーション配列を含む。このように、1つのキャリブレーション配列が母系由来の配列を表し得、別のキャリブレーション配列が父系由来の配列を表し得る。
【0143】
ポリヌクレオチド配列は、ゲノム配列から選択される第1のキャリブレーション配列と、第1の配列に対する変異体配列を表す第2のキャリブレーション配列とを含み得、ここで、第2のキャリブレーション配列は、第1のキャリブレーション配列より多い、少ない又は同じコピー数で繰り返される。例えば、ポリヌクレオチド配列は、ヘテロ接合遺伝子型、ホモ接合遺伝子型、コピー数増幅、欠失、挿入及び/又はヘテロ接合性喪失について認められるコピー数の比を再現するコピー数で繰り返される2つ以上のアレル配列を表す2つ以上のキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、母系遺伝の染色体配列を表す第1のキャリブレーション配列と、父系遺伝の染色体配列を表す第2のキャリブレーション配列とを含む。別の例では、ポリヌクレオチド配列は、第1のアレル配列を表す第1のキャリブレーション配列と、第2のアレル配列を表す第2のキャリブレーション配列とを含み得る。追加のアレル配列を表して、追加のキャリブレーション配列が含まれ得ることが理解されるであろう。
【0144】
本明細書に開示されるポリヌクレオチド配列は、第1のアレル配列を表す第1のキャリブレーション配列と、第2のアレル配列を表す第2のキャリブレーション配列とを含み得、ここで、両方のキャリブレーション配列は、異なるコピー数で繰り返され、及びコピー数の比は、生体サンプルのシーケンシングで認められる体細胞アレル頻度を再現する。任意の生体サンプルは、それに存在するアレル頻度の点において、それに合わせてコピー数が調整されるキャリブレーション配列を使用することにより再現され得る。好適な生体サンプルの1つの非限定的な例は、腫瘍生検である。例えば、ポリヌクレオチド配列は、コピー数の比が50%、25%、12.5%、6.25%、10%、1%又は0.1%のアレル頻度を再現するようなコピー数で繰り返される2つ以上のキャリブレーション配列を含み得る。加えて、ポリヌクレオチド配列は、コピー数の比がコピー数変異、増幅、欠失、微小欠失、トリソミー及び/又は染色体異数性を再現するようなコピー数で繰り返される2つ以上のキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、コピー数の比が非侵襲的出生前シーケンシングで認められる胎児、及び/又は母系、及び/又は父系遺伝子型を再現するようなコピー数で繰り返される2つ以上のキャリブレーション配列を含む。
【0145】
本明細書に開示されるポリヌクレオチド配列は、ヒト疾患の臨床診断時に同定される遺伝子配列から選択される1つ又はキャリブレーション配列を含み得る。例えば、ポリヌクレオチド配列は、ヒト疾患に原因として関連するヒトゲノム配列から選択される1つ以上のキャリブレーション配列を含み得る。例えば、本明細書に開示されるポリヌクレオチド配列は、癌、遺伝性疾患、病原体検出及び/又は薬剤耐性の診断時に同定される遺伝子配列から選択されるキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、臨床診断に使用されるヒト配列から選択されるキャリブレーション配列を含む。
【0146】

腫瘍サンプルのシーケンシングは、癌の診断に使用することのできる遺伝子突然変異の存在を検出し得る。これは、患者予後及び治療についての情報を与え得る。しかしながら、腫瘍サンプルの複雑さ、多くの場合にアレル頻度が低い体細胞突然変異の存在並びにライブラリ調製及びシーケンシング時の更なる技術的変数は、突然変異の正確な診断に影響を及ぼし得る。
【0147】
本明細書に開示されるポリヌクレオチド配列は、癌を引き起こすことが公知の遺伝子配列から選択されるキャリブレーション配列を含み得る。例えば、ポリヌクレオチド配列は、癌に原因として関連する1つ以上の遺伝子又はエクソン配列から選択されるキャリブレーション配列を含み得る。別の例では、ポリヌクレオチド配列は、癌に原因として関連する単一遺伝子からの2つ以上のエクソンからの遺伝子配列から選択されるキャリブレーション配列を含み得る。このように、本明細書に開示されるポリヌクレオチド配列を使用して、癌に原因として関連する遺伝子の配列内における変異体の検出を解釈することができる。このように、本開示は、癌の検出方法をキャリブレーションするための本明細書に開示されるポリヌクレオチドの使用を提供する。例えば、本明細書に開示されるポリヌクレオチドを使用して、癌の存在、又は癌を発症する素因、又は癌に罹患している対象の予後を示す1つ以上の遺伝子配列を検出する方法をキャリブレーションすることができる。かかる方法は、動物対象、例えば哺乳類対象など、より詳細にはヒト対象に対して実施され得る。
【0148】
別の例では、本明細書に開示されるポリヌクレオチド配列は、単一遺伝子からの異なるエクソン配列から選択される2つ以上のキャリブレーション配列を含み得る。かかるキャリブレーション配列は、ヒト疾患における遺伝子エクソンの増幅及び欠失を再現するコピー数で繰り返され得る。このように、一例では、本明細書に開示されるポリヌクレオチド配列は、同じ遺伝子からの異なるエクソン配列から選択されるキャリブレーション配列を含み得る。別の例では、本明細書に開示されるポリヌクレオチド配列は、同じ遺伝子からの異なるエクソン配列から選択されるキャリブレーション配列を含み得、このキャリブレーション配列は、2、3、4、5、6、7、8、9、10、20、100、1,000及び/又は10,000コピーで提供される。このように、本明細書に開示されるポリヌクレオチド配列は、腫瘍サンプル内に典型的に存在する突然変異担持量を再現することができる。従って、キャリブレーション配列は、腫瘍サンプル内に典型的に存在する突然変異担持量を再現するコピー数で提供され得る。従って、キャリブレーション配列は、腫瘍サンプル内に典型的に存在する突然変異担持量を再現するコピー数で提供され得る。
【0149】
本明細書に開示されるポリヌクレオチド配列は、以下の遺伝子配列(組み合わせ自由又は順不同)から選択された1つ以上のキャリブレーション配列を含み得る(これらは、NIHの遺伝子配列データベースGenBank(登録商標)などのデータベースで公的に利用可能である):ABL1、ABO、ACADM、ACTA2、ACTC1、AFF2、AKT1、AKT2、AKT3、ALK、APC、APOA1、APOB、APOE、AR、ARAF、AREG、ARID1A、ATM、ATN1、ATP7B、ATR、ATXN1、ATXN3、ATXN7、AURKA、AXIN2、BAP1、BCL2、BCR、BCR-ABL1、BCR-JAK2、BLM、BMPR1A、BMPR2、BRAF、BRCA1、BRCA2、BRD4、BTD、BTK、C9orf72、CACNA1A、CACNA1S、CAS9、CASR、CBL、CCND1、CCND2、CCND3、CCNE1、CD19、CD274、CDH1、CDK4、CDK6、CDKN1A、CDKN1B、CDKN2A、CDKN2B、CDKN2C、CFTR、CHEK2、chrM、COL1A1、COL1A1-PDGFRB、COL3A1、CRLF2、CSF1R、CSF3R、CTNNB1、CYP1A2、CYP2C19、CYP2C9、CYP2D6、CYP2D7、CYP3A5、DDR2、DMD、DMPK、DNMT3A、DSC2、DSG2、DSP、EF1a、EGFR、EPHA2、EPHA3、ERBB、ERBB2、ERBB3、ERBB4、ERCC1、ERCC2、ERCC4、ERCC6、EREG、ESR1、EZH2、F2、F5、F8、F9、FANCA、FANCC、FBN1、FBXW7、FGA、FGF3、FGF4、FGFR1、FGFR2、FGFR3、FGFR4、FH、FLCN、FLT3、FMR1、FRS2、FXN、G6PD、GALT、GATA3、GBA、GLA、GNA11、GNAQ、GNAS、HBA1、HBA2、HBB、HBD、HBG1、HBG2、HDAC2、HEXA、HFE、HGF、HLA-A、HLA-B、HLA-C、HLA-DM、HLA-DO、HLA-DP、HLA-DQ、HLA-DR、HRAS、HTT、IDH1、IDH2、IGF1R、IGF2、IKBKAP、IL7R、INPP4B、JAK1、JAK2、JAK3、KCNH2、KCNQ1、KDR、KIT、KMT2A、KRAS、LDLR、LMNA、LRP1B、LYZ、MAP2K1、MAP2K2、MAP3K1、MCL1、MCOLN1、MDM2、MDM4、MEK1、MEN1、MET、MGMT、MITF、MLH1、MLL、MLL2、MLL3、MPL、MSH2、MSH3、MSH6、MTHFR、MTOR、MUTYH、MYBPC3、MYC、MYCN、MYD88、MYH11、MYH7、MYL2、MYL3、MYLK、NAT2、NF1、NF2、NKX2、NOTCH1、NOTCH2、NPM1、NRAS、NRG1、NTRK1、NTRK3、OTC、PAH、PAK1、PALB2、PAX8、PBRM1、PCSK9、PDGFRA、PDGFRB、PDK1、PDPK1、PIK3CA、PIK3CB、PIK3R1、PIK3R2、PKD1、PKD2、PKHD1、PKP2、PLCG2、PML、PML-RARA、PMS2、PPARG、PPP2R2B、PRKAG2、PRKCH、PRSS1、PTCH1、PTEN、PTPN11、RAC1、RAD50、RAF1、RARA、RB1、RET、RET-PTCH1、RHCE、RHD、RICTOR、RNF43、ROS1、RYR1、RYR2、SCN5A、SDHAF2、SDHB、SDHC、SDHD、SERPINA1、SETD2、SF3B1、SH2B3、SLCO1B1、SMAD3、SMAD4、SMARCA1、SMARCA4、SMARCB1、SMN1、SMN2、SMO、SMPD1、SOCS1、SPINK1、STAG2、STK11、SUZ12、SYK、TBP、TGFBR1、TGFBR2、TMEM43、TMPRSS2、TNNI3、TNNT2、TOP2A、TP53、TPM1、TPMT、TSC1、TSC2、TTR、UGT1A1、VEGFA、VHL、VKORC1、WT1、ZNRF3。一例では、ポリヌクレオチド配列は、本明細書に記載される遺伝子のいずれか1つ以上の参照、野生型、突然変異型又は変異体配列から選択されたキャリブレーション配列を含む。
【0150】
ctDNA
癌患者の血流中で循環腫瘍DNA(ctDNA)の断片が検出され得る。こうした断片(即ちctDNA)は、腫瘍の存在及び進化を指示し得る。ctDNAの検出は、腫瘍を検出及び診断するための非侵襲的方法として用いられ得る。
【0151】
本明細書に開示されるポリヌクレオチド配列は、ctDNA配列から選択されるキャリブレーション配列を含み得る。例えば、ポリヌクレオチド配列は、ctDNA内に存在する、体細胞、ドライバー、臨床的に作用可能な又は良性の突然変異又はDNA修飾など、癌に関連する遺伝子配列から選択されるキャリブレーション配列を含み得る。
【0152】
一例では、本明細書に開示されるポリヌクレオチド配列を使用してctDNA断片が同定され、分析される。ポリヌクレオチド配列は、酵素的剪断を用いてctDNAの長さを再現するように断片化することができる。一例では、本明細書に記載されるポリヌクレオチド配列が機械的又は酵素的剪断を用いて断片化され、ctDNA断片の長さと一致する断片が作成される。かかる断片は、例えば、約10~約400ヌクレオチド長であり得る。例えば、かかる断片は、約15~約350ヌクレオチド長、又は約50~約300ヌクレオチド長、又は約100~約200ヌクレオチド長、又は約130~約170ヌクレオチド長、又は約140~約160ヌクレオチド長、又は約150ヌクレオチド長であり得る。この場合もやはり、キャリブレーション配列は、ポリヌクレオチド配列中において、ctDNA内に存在する体細胞突然変異の頻度を反映するコピー数で繰り返され得る。
【0153】
本明細書に開示されるポリヌクレオチド配列中のキャリブレーション配列間のコピー数又は比は、ctDNAに反映されるとおりの腫瘍突然変異担持量を模倣し得る。
【0154】
キャリブレーション配列は、ポリヌクレオチド配列中において、ctDNA内に存在する体細胞突然変異の頻度を反映するコピー数で繰り返され得る。本明細書に開示されるアダプター配列中の(例えば、単一のアダプター配列内又はアダプター配列の組成物内での)キャリブレーション配列間のコピー数又は比は、ctDNAに反映されるとおりの腫瘍突然変異担持量を模倣し得る。
【0155】
本明細書に開示されるポリヌクレオチド配列は、修飾ヌクレオチドを含有するキャリブレーション配列を含み得る。例えば、ポリヌクレオチド配列は、1つ以上のメチル化されたDNA配列を含むキャリブレーション配列を含み得る。加えて、本明細書に開示されるポリヌクレオチド配列は、修飾ヌクレオチドを異なる既知の存在量で含有するキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、ctDNA内に存在する体細胞突然変異の頻度を反映する異なるコピー数で存在するキャリブレーション配列を含み、そのため、ctDNAサンプル中の体細胞突然変異を検出する方法のキャリブレーションにおいてそれらのポリヌクレオチド配列を有利に使用できるようになる。
【0156】
核型
異数性並びに大規模染色体欠失及び増幅は、様々なヒト疾患を引き起こし得る。NGSを用いて大規模染色体領域又は数のかかる変化を検出し得るが、しかしながら、アラインメントエラー、不十分なシーケンシング深さ並びに低複雑性及び反復性の配列により、分析に交絡が生じ得る。
【0157】
本明細書に開示されるポリヌクレオチド配列は、第1のアレル配列を表す第1のキャリブレーション配列と、第2のアレル配列を表す第2のキャリブレーション配列とを含み得る。異なるアレルを表す2つのキャリブレーション配列間のコピー数比は、ヒト核型における染色体領域のコピー数比と一致するように決定され得る。このように、一例では、本明細書に開示されるポリヌクレオチド配列は、ヒト染色体の1つ以上の領域からの選択された父系及び母系アレル配列である1つ以上のキャリブレーション配列を含み得る。ポリヌクレオチド配列中のキャリブレーション配列の比は、正常又は異常なヒト核型における染色体の比と一致するように予め決定され得る。かかるシナリオの一例を挙げれば、ポリヌクレオチド配列は、2コピーで繰り返される少なくとも1つの他のキャリブレーション配列に対して、3コピーで繰り返されるキャリブレーション配列を含み得る。ポリヌクレオチド配列は、ヒト染色体1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22番、X、Y又はミトコンドリア染色体(chrM)配列のいずれか1つ以上から選択されるキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、本明細書に記載されるとおり、異なるコピー数で繰り返されるキャリブレーション配列を含み、DNAサンプル中のコピー数変異の分量を測定及び判定するための定量的参照ラダーを確立する。一例では、ポリヌクレオチド配列は、ヒトゲノム中の配列と同じコピー数で繰り返されるキャリブレーション配列を含む。
【0158】
NIPT
妊娠中の母親の血中において、胎児ゲノムに由来するDNA断片の循環を検出し得る。循環胎児DNA断片の単離及びシーケンシングは、胎児ゲノム内での染色体異数性、コピー数変異体、構造変異体及び小突然変異の存在を検出する非侵襲的方法を提供し得る。しかしながら、断片サイズの小ささ、胎児DNA負荷量のばらつき、ゲノムカバレッジの希薄さ及び循環母体DNAの重複する存在に起因して、NGS方法による分析は、感度が限られている。
【0159】
本明細書に開示されるポリヌクレオチド配列は、循環母体又は胎児DNA配列から選択されるキャリブレーション配列を含み得る。このように、ポリヌクレオチド配列は、父系、母系又は胎児染色体遺伝子配列から選択される1つ以上のキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、母系染色体遺伝子配列から選択される第1のキャリブレーション配列と、胎児染色体遺伝子配列から選択される第2のキャリブレーション配列とを含む。1つ又はキャリブレーション配列は、母体及び胎児循環DNA配列の比を再現するコピー数で繰り返され得る。一例では、本明細書に開示されるポリヌクレオチド配列を用いて母体血中の胎児循環DNAが測定される。
【0160】
本明細書に開示されるポリヌクレオチド配列は、1つ以上のキャリブレーション配列を含み得、ここで、2つ以上のキャリブレーション配列間のコピー数の比は、ヘテロ接合、ホモ接合、胎児及び母体の遺伝的変異、胎児染色体異数性、コピー数変異、欠失及び/又は増幅の比と一致する。一例では、ポリヌクレオチド配列は、非侵襲的出生前検査(NIPT)で同定される遺伝子配列から選択されるキャリブレーション配列を含む。加えて、ポリヌクレオチド配列は、染色体異数性、大型コピー数変異体、マイクロ増幅、マイクロ欠失及び/又はマイクロデュプリケーションを有する遺伝子配列から選択されるキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列が断片化されて、循環胎児DNA及び循環母体DNA断片の長さと一致するDNA断片が生成される。かかる断片は、例えば、約10~約400ヌクレオチド長であり得る。例えば、かかる断片は、約15~約350ヌクレオチド長、若しくは約50~約250ヌクレオチド長、若しくは約100~約200ヌクレオチド長、若しくは約130~約170ヌクレオチド長、若しくは約140~約160ヌクレオチド長であり得るか、又は約150ヌクレオチド長であり得る。
【0161】
RNA
ゲノムは、まとめてトランスクリプトームと称される様々なコード及び非コードRNAに転写される。RNAシーケンシングは、生物学研究で一般的なツールとなっており、臨床診断での適用も増えつつある。しかしながら、遺伝子発現の莫大なサイズ及び複雑さ、広範囲にわたる発現依存的バイアス並びにライブラリ調製、シーケンシング及び分析時の更なる技術的変数がトランスクリプトームの分析に影響を及ぼす。
【0162】
本明細書に開示されるポリヌクレオチド配列は、リボヌクレオチド(RNA)配列を含み得るか又はそれからなり得る。一例では、ポリヌクレオチド配列は、1つ以上の遺伝子エクソンから選択されるキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列は、各々が単一遺伝子からの異なるエクソン配列から選択される2つ以上のキャリブレーション配列を含む。更なる例において、ポリヌクレオチド配列は、各々が異なる遺伝子からの異なるエクソン配列から選択される2つ以上のキャリブレーション配列を含む。キャリブレーション配列が繰り返されるコピー数の数間の比は、キャリブレーション配列によって表される天然に存在する配列の遺伝子発現存在量、選択的スプライシング頻度及びアイソフォーム発現と一致するように提供され得る。
【0163】
本明細書に開示されるポリヌクレオチド配列は、相補的DNA(cDNA)配列に逆転写され得る。従って、本明細書に開示されるポリヌクレオチド配列は、RNAシーケンシング方法において使用することができる。このように、本開示は、RNAシーケンシング方法のキャリブレーションにおける本明細書に開示されるとおりのポリヌクレオチド配列の使用を提供する。
【0164】
本明細書に開示されるポリヌクレオチド配列は、PCRベースの増幅方法を用いたRNA配列のターゲットエンリッチメントでも使用することができる。例えば、本明細書に開示されるポリヌクレオチド配列は、相補的オリゴヌクレオチドプローブとのハイブリダイゼーションを用いたRNA配列のターゲットエンリッチメント方法において使用することができる。このように、本開示は、PCRベースの増幅方法及び/又は相補的オリゴヌクレオチドプローブとのハイブリダイゼーションを用いたRNA配列のターゲットエンリッチメントにおける本明細書に開示されるとおりのポリヌクレオチド配列の使用を提供する。
【0165】
本明細書に開示されるポリヌクレオチドに存在するキャリブレーション配列コピー数の比は、遺伝子発現存在量に対応するように決定することができる。例えば、本明細書に開示されるポリヌクレオチド配列は、シングルセルRNAシーケンシング方法で使用することができる。一例では、ポリヌクレオチド配列は、ヒト疾患の臨床診断において使用される遺伝子シグネチャから選択されるキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列は、癌に生じる融合遺伝子配列から選択される1つ以上のキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列は、融合遺伝子に典型的に生じるとおりの、2つの個別の遺伝子からの1つ以上のエクソンから選択される1つ以上のキャリブレーション配列を含む。
【0166】
本明細書に開示されるポリヌクレオチド配列は、例えば、以下の遺伝子リスト:ABL1、ABO、ACADM、ACTA2、ACTC1、AFF2、AKT1、AKT2、AKT3、ALK、APC、APOA1、APOB、APOE、AR、ARAF、AREG、ARID1A、ATM、ATN1、ATP7B、ATR、ATXN1、ATXN3、ATXN7、AURKA、AXIN2、BAP1、BCL2、BCR、BCR-ABL1、BCR-JAK2、BLM、BMPR1A、BMPR2、BRAF、BRCA1、BRCA2、BRD4、BTD、BTK、C9orf72、CACNA1A、CACNA1S、CAS9、CASR、CBL、CCND1、CCND2、CCND3、CCNE1、CD19、CD274、CDH1、CDK4、CDK6、CDKN1A、CDKN1B、CDKN2A、CDKN2B、CDKN2C、CFTR、CHEK2、chrM、COL1A1、COL1A1-PDGFRB、COL3A1、CRLF2、CSF1R、CSF3R、CTNNB1、CYP1A2、CYP2C19、CYP2C9、CYP2D6、CYP2D7、CYP3A5、DDR2、DMD、DMPK、DNMT3A、DSC2、DSG2、DSP、EF1a、EGFR、EPHA2、EPHA3、ERBB、ERBB2、ERBB3、ERBB4、ERCC1、ERCC2、ERCC4、ERCC6、EREG、ESR1、EZH2、F2、F5、F8、F9、FANCA、FANCC、FBN1、FBXW7、FGA、FGF3、FGF4、FGFR1、FGFR2、FGFR3、FGFR4、FH、FLCN、FLT3、FMR1、FRS2、FXN、G6PD、GALT、GATA3、GBA、GLA、GNA11、GNAQ、GNAS、HBA1、HBA2、HBB、HBD、HBG1、HBG2、HDAC2、HEXA、HFE、HGF、HLA-A、HLA-B、HLA-C、HLA-DM、HLA-DO、HLA-DP、HLA-DQ、HLA-DR、HRAS、HTT、IDH1、IDH2、IGF1R、IGF2、IKBKAP、IL7R、INPP4B、JAK1、JAK2、JAK3、KCNH2、KCNQ1、KDR、KIT、KMT2A、KRAS、LDLR、LMNA、LRP1B、LYZ、MAP2K1、MAP2K2、MAP3K1、MCL1、MCOLN1、MDM2、MDM4、MEK1、MEN1、MET、MGMT、MITF、MLH1、MLL、MLL2、MLL3、MPL、MSH2、MSH3、MSH6、MTHFR、MTOR、MUTYH、MYBPC3、MYC、MYCN、MYD88、MYH11、MYH7、MYL2、MYL3、MYLK、NAT2、NF1、NF2、NKX2、NOTCH1、NOTCH2、NPM1、NRAS、NRG1、NTRK1、NTRK3、OTC、PAH、PAK1、PALB2、PAX8、PBRM1、PCSK9、PDGFRA、PDGFRB、PDK1、PDPK1、PIK3CA、PIK3CB、PIK3R1、PIK3R2、PKD1、PKD2、PKHD1、PKP2、PLCG2、PML、PML-RARA、PMS2、PPARG、PPP2R2B、PRKAG2、PRKCH、PRSS1、PTCH1、PTEN、PTPN11、RAC1、RAD50、RAF1、RARA、RB1、RET、RET-PTCH1、RHCE、RHD、RICTOR、RNF43、ROS1、RYR1、RYR2、SCN5A、SDHAF2、SDHB、SDHC、SDHD、SERPINA1、SETD2、SF3B1、SH2B3、SLCO1B1、SMAD3、SMAD4、SMARCA1、SMARCA4、SMARCB1、SMN1、SMN2、SMO、SMPD1、SOCS1、SPINK1、STAG2、STK11、SUZ12、SYK、TBP、TGFBR1、TGFBR2、TMEM43、TMPRSS2、TNNI3、TNNT2、TOP2A、TP53、TPM1、TPMT、TSC1、TSC2、TTR、UGT1A1、VEGFA、VHL、VKORC1、WT1、ZNRF3(組み合わせ自由又は順不同)から選択される1つ以上のキャリブレーション配列を含み得る。
【0167】
メタゲノミクス
メタゲノミクスは、環境サンプル内に存在する微生物ゲノムの大域的プロファイルを提供する。しかしながら、微生物参照ゲノム配列の不足、複雑でばらつきがあり、反復的な遺伝子配列の存在並びにライブラリ調製及びシーケンシングに起因する技術的ばらつきにより、分析に交絡が生じ得る。
【0168】
本明細書に開示されるポリヌクレオチド配列は、選択された微生物ゲノム配列である1つ以上のキャリブレーション配列を含有し得る。例えば、ポリヌクレオチド配列は、細菌、古細菌、ウイルス、プラスミド及び/又はバクテリオファージRNA又はDNA配列から選択されるキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、2つ以上の微生物の存在量と一致するコピー数で繰り返される2つ以上のキャリブレーション配列を含む。代わりに又は加えて、ポリヌクレオチド配列は、水平に獲得された遺伝子、プラスミド、トランスポゾン又はインテグロン、ウイルス若しくはバクテリオファージ配列から選択される1つ以上のキャリブレーション配列を含み得る。
【0169】
例えば、本明細書に開示されるポリヌクレオチド配列は、RNA又はDNAウイルスゲノム配列、逆転写ウイルス、二本鎖及び一本鎖RNA及び/又はDNAウイルスを含めて、ウイルスゲノム配列から選択される1つ以上のキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、ヒトゲノムへのウイルス組込み配列から選択される1つ以上のキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列は、ウイルスゲノム配列に対する変異体配列から選択されるキャリブレーション配列を含み得る。別の例では、ポリヌクレオチド配列は、薬剤耐性(抗生物質耐性など)を付与する遺伝子変異体配列から選択される1つ以上のキャリブレーション配列を含み得る。一例では、ポリヌクレオチド配列は、非ヌクレオシド逆転写酵素阻害薬、ヌクレオシド逆転写酵素阻害薬及びプロテアーゼ阻害薬に対する耐性を付与する選択されたHIVゲノム配列である1つ以上のキャリブレーション配列を含む。別の例では、ポリヌクレオチド配列は、遺伝子療法適用において使用されるウイルスベクター配列から選択されるキャリブレーション配列を含む。
【0170】
本明細書に開示されるポリヌクレオチド配列は、例えば、以下のゲノム配列リスト:アストロウイルス属(Astrovirus)、カンジダ・アルビカンス(Candida Albicans)、カンジダ・グラブラタ(Candida glabrata)、クリプトコッカス・ネオフォルマンス(Cryptococcus neoformans)、クリプトコッカス・ネオフォルマンス(Cryptococcus neoformans)(SOD1)、デングウイルス、エボラウイルス、エプスタイン・バーウイルス、ヘリコバクター・ピロリ(Helicobacter pylori)、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、D型肝炎ウイルス、E型肝炎ウイルス、E型肝炎ウイルス、C型肝炎、ヒトアルファヘルペスウイルス、ヒトコロナウイルス、ヒトエンテロウイルスA、ヒトエンテロウイルスB、ヒトエンテロウイルスD、ヒトヘルペスウイルス、ヒト免疫不全ウイルス、ヒトメタニューモウイルス、ヒトパピローマウイルス、ヒトパラインフルエンザウイルス1、ヒトパラインフルエンザウイルス3、ヒトパルボウイルス、ヒトライノウイルス、インフルエンザ、A型インフルエンザ、B型インフルエンザ、ノロウイルスGI、パレコウイルス、ポリオウイルス、狂犬病ウイルス、小形クリプトスポリジウム(Cryptosporidium parvum)(Hsp70)、呼吸器合胞体ウイルス、ロタウイルス、サポウイルス、黄色ブドウ球菌(Staphylococcus aureus)、ウエストナイルウイルス、黄熱病ウイルス、ジカウイルス、大腸菌(Escherichia coli)から選択される1つ以上のキャリブレーション配列を含み得る。
【0171】
修飾ヌクレオチド
本明細書に開示されるポリヌクレオチド配列は、1つ以上の修飾ヌクレオチドを含み得る。一実施形態において、ポリヌクレオチド配列は、修飾ヌクレオチドを含む1つ以上のキャリブレーション配列と、修飾ヌクレオチドを含まない1つ以上のキャリブレーション配列とを含む。一実施形態において、ポリヌクレオチド配列は、ポリヌクレオチド配列中の既知の部位に存在する修飾ヌクレオチドを含む。一実施形態において、このポリヌクレオチド配列を使用して、シーケンシング、ハイブリダイゼーション、抗体又は蛍光技術を用いた修飾ヌクレオチドの検出をキャリブレーションすることができる。
【0172】
本明細書に開示されるポリヌクレオチド配列は、5-メチル-ウリジン、2’O-メチル-RNA、2’-フルオロウラシル、2’-フルオロシトシン、5-プロピニル-2’デオキシシチジン、5-プロピニル-2’デオキシウリジン、5-メチルシトシン、5-ヒドロキシメチルシトシン、イオニシン、7-デアザグアニン、2,6-ジアミノプリン、5’ニトロインドール、3-ニトロピロール及び2’-O-メチル化リボースの1つ以上を含む1つ以上の修飾ヌクレオチドを含み得る。加えて、本明細書に開示されるポリヌクレオチド配列は、2-アミノ-ATP、2-アミノ-6-Cl-RTP、8-アザ-ATP、6-Cl-RTP、2’-フルオロ-dATP、2’-フルオロ-dCTP、2’-フルオロ-dGTP、2’-フルオロ-dUTP、5-ヨード-CTP、5-ヨード-UTP、N6-メチル-ATP、5-メチル-CTP、2’-O-メチル-ATP、2’-O-メチル-CTP、2’-O-メチル-GTP、2’-O-メチル-UTP、プソイド-UTP、ITP、2’-O-メチル-ITP、ピューロマイシン-TP、キサントシン-TP、5-メチル-UTP、4-チオ-UTP、2’-アミノ-dCTP、2’-アミノ-dUTP、2’-アジド-dCTP、2’-アジド-dUTP、O6-メチル-GTP、2-チオ-UTP、アラ-CTP、アラ-UTP、5,6-ジヒドロ-UTP、2-チオ-CTP、6-アザ-CTP、6-アザ-UTP、N1-メチル-GTP、2’-O-メチル-2-アミノ-ATP、2’-O-メチルプソイド-UTP、N1-メチル-ATP、2’-O-メチル-5-メチル-UTP、7-デアザ-GTP、2’-アジド-dATP、2’-アミノ-dATP、アラ-ATP、8-アジド-ATP、5-ブロモ-CTP、5-ブロモ-UTP、2’-フルオロ-dTTP、3’-O-メチル-ATP、3’-O-メチル-CTP、3’-O-メチル-GTP、3’-O-メチル-UTP、7-デアザ-ATP、5-AA-UTP、2’-アジド-dGTP、2’-アミノ-dGTP、5-AA-CTP、8-オキソ-GTP、2-アミノ-RTP、プソイドイソ-CTP、N4-メチル-CTP、N1-メチルプソイド-UTP、5,6-ジヒドロ-5-メチル-UTP、N6-メチル-アミノ-ATP、5-カルボキシ-CTP、5-ホルミル-CTP、5-ヒドロキシメチル-UTP、5-ヒドロキシメチル-CTP、チエノ-GTP、5-ヒドロキシ-CTP、5-ホルミル-UTP、チエノ-UTP、2-アミノ-6-Cl-dRTP、2-アミノ-dATP、2-アミノ-dRTP、5-ブロモ-dCTP、5-ブロモ-dUTP、6-クロロ-dRTP、7-デアザ-dATP、7-デアザ-dGTP、dITP、5-プロピニル-dCTP、5-プロピニル-dUTP、2’-dUTP、5-フルオロ-dUTP、5-ヨード-dCTP、5-ヨード-dUTP、N6-メチル-dATP、5-メチル-dCTP、O6-メチル-dGTP、N2-メチル-dGTP、5-ニトロ-1-インドリル-dRTP、8-オキソ-dATP、8-オキソ-dGTP、2-チオ-dTTP、2’-dPTP、5-ヒドロキシ-dCTP、4-チオ-dTTP、2-チオ-dCTP、6-アザ-dUTP、6-チオ-dGTP、8-クロロ-dATP、5-AA-dCTP、5-AA-dUTP、N4-メチル-dCTP、2’-デオキシゼブラリン-TP、5-ヒドロキシメチル-dUTP、5-ヒドロキシメチル-dCTP、5-プロパルギルアミノ-dCTP、5-プロパルギルアミノ-dUTP、5-カルボキシ-dCTP、5-ホルミル-dCTP、5-インドリル-AA-dUTP、5-カルボキシ-dUTP、5-ホルミル-dUTP、3’-dATP、3’-dGTP、3’-dCTP、5-メチル-3’-dUTP、3’-dUTP、ddATP、ddGTP、ddUTP、ddTTP、ddCTP、3’-アジド-ddATP、3’-アジド-ddGTP、3’-アジド-ddTTP、3’-アミノ-ddATP、3’-アミノ-ddCTP、3’-アミノ-ddGTP、3’-アミノ-ddTTP、3’-アジド-ddCTP、3’-アジド-ddUTP、5-ブロモ-ddUTP、ddITP、ビオチン-16-dUTP、ビオチン-16-dCTP、ビオチン-16-CTP、N4-ビオチン-dCTP、ビオチン-16-UTP、ダブシル-dUTPN/AN/AN/A、デスチオビオチン-6-dCTP、デスチオビオチン-16-UTP、ppGpp、pGp、5’-ビオチン-GMP、5’-ビオチン-AMP、5’-ビオチン-dGMP、5’-ビオチン-dAMP、5’-アミノ-GMP、mCAP、CAP、ARCA、(1-チオ)-dATP、(1-チオ)-dCTP、(1-チオ)-dGTP、(1-チオ)-dTTP、(1-チオ)-ATP、(1-チオ)-CTP、(1-チオ)-GTP、(1-チオ)-UTP、(1-チオ)-ddATP、(1-チオ)-ddCTP、(1-チオ)-ddGTP、(1-チオ)-ddTTP、(1-チオ)-3’-アジド-ddTTP、(1-チオ)-ddUTP、(1-ボラノ)-dATP、(1-ボラノ)-dCTP、(1-ボラノ)-dGTP、(1-ボラノ)-dTTP、ガンシクロビル-TP、シドホビル-DPのいずれか1つ以上を含む修飾ヌクレオチドを含み得る。
【0173】
参照標準及びアダプターの作製方法
一実施形態において、本開示は、キャリブレーション配列を含むポリヌクレオチド配列を生成する方法を提供する。ポリヌクレオチド配列は、本明細書に記載されるとおりのラダー又はアダプターであり得る。本方法は、初めに、本明細書に記載されるとおりのキャリブレーション配列を選択することを含み得る。一部の実施形態において、各キャリブレーション配列は、1つ以上のコピー数で繰り返される。一部の実施形態において、次に各キャリブレーションコピー配列が線状の連続的な並び順に配置され、単一の連続するポリヌクレオチド配列が形成される。この配置により、キャリブレーション配列は、本来自然中には認められない人工的な線状の並び順に配置される。一部の実施形態において、各キャリブレーション配列には、「スペーサー」配列が間に散在し、ポリヌクレオチド配列の末端は、フランキング末端配列を含む。一部の実施形態において、本明細書に記載されるスペーサー及び末端配列は、プライマー結合部位、制限消化部位、プロモーター及び転写開始部位並びに他の配列エレメントを含み得る。
【0174】
一部の実施形態において、ポリヌクレオチド配列は、DNA又はRNA分子として物理的に合成される。一部の実施形態において、ポリヌクレオチド配列には、宿主ベクター配列からのポリヌクレオチド配列の切り出し及び精製を可能にする2つの制限消化部位が隣接する。一部の実施形態において、ポリヌクレオチド配列は、制限エンドヌクレアーゼによるキャリブレーション配列の切り出し及び精製を可能にする配列が隣接するキャリブレーション配列を含む。
【0175】
一部の実施形態において、本明細書に記載されるとおりのポリヌクレオチド配列には、ポリヌクレオチド配列又はキャリブレーション配列のインビトロ転写を可能にするため、5’方向にプロモーター配列が先行し、及び/又は後ろにポリAテール及び/又は制限部位が続く。一部の実施形態において、本明細書に記載されるとおりのキャリブレーション配列には、ポリヌクレオチド配列又はキャリブレーション配列のインビトロ転写を可能にするため、5’方向にプロモーター配列が先行し、及び/又は後ろにポリAテール及び/又は制限部位が続く。一部の実施形態において、ポリヌクレオチド配列のフォワード鎖及びリバース鎖が両方ともインビトロ転写されて、2つのRNA断片が形成される。
【0176】
一実施形態において、ポリヌクレオチド配列は、RNA又はDNA分子に合成される。一実施形態において、ポリヌクレオチド配列は、宿主となるベクター内にある。一態様において、本明細書に記載されるポリヌクレオチド又はキャリブレーション配列は、ベクターから切り出される。一実施形態において、本明細書に記載されるポリヌクレオチド又はキャリブレーション配列は、制限消化によってベクターから切り出される。一実施形態において、本明細書に記載されるポリヌクレオチド又はキャリブレーション配列は、ポリメラーゼ連鎖反応によってベクターから増幅される。一実施形態において、本明細書に記載されるポリヌクレオチド又はキャリブレーション配列は、ポリメラーゼ連鎖反応によってベクターから増幅される。一実施形態において、ポリヌクレオチド配列は、インビトロ転写を受けることによってベクターから転写される。一実施形態において、2つ以上のポリヌクレオチド配列が一体に組み合わされて、混合物が作り出される。
【0177】
一実施形態において、本明細書に記載されるポリヌクレオチド配列が断片化されて、断片化されたDNA分子の誘導体プールが生成される。一実施形態において、本明細書に記載されるポリヌクレオチド配列が機械的又は酵素的に剪断されて、断片化されたDNA分子の誘導体プールが生成される。一実施形態において、本明細書に記載されるポリヌクレオチド配列が消化されて、小型DNA断片の誘導体プールが生成される。一実施形態において、本明細書に記載されるポリヌクレオチド配列が消化されて、正常、腫瘍、胎児及び母体循環DNA分子と同じ長さのDNA断片が生成される。
【0178】
アダプター配列をライゲートする
本開示のポリヌクレオチド配列がアダプター配列である例によれば、アダプター配列は、他のポリヌクレオチドにライゲートされ得る。本明細書に開示されるアダプター配列は、当技術分野において公知の任意の手段によって試験サンプル中のポリヌクレオチドにライゲートすることができる。例として及び限定なしに、ライゲーションは、リガーゼ又はトランスポザーゼ酵素を使用して達成され得る。好適なリガーゼ酵素の一例は、T4 DNAリガーゼである。
【0179】
ポリヌクレオチドアダプター配列は、標的ポリヌクレオチド配列の3’及び/又は5’末端にライゲートして、単一の連続するポリヌクレオチド配列を形成することができる。このように、本明細書に開示される方法は、アダプター配列を標的ポリヌクレオチドにライゲートすることを含み得る。一例では、1つ以上のポリヌクレオチドアダプター配列を、天然に存在するRNA又はDNA断片にライゲートすることができる。
【0180】
一例では、ポリヌクレオチドアダプター配列をDNA断片にライゲートすることができ、ここで、DNA断片は、末端修復され、dAテールが付加されている。
【0181】
別の例では、DNA合成、ポリメラーゼ連鎖反応増幅又は逆転写中に1つ以上のポリヌクレオチドアダプター配列を標的ポリヌクレオチドに取り付けて、単一の連続するポリヌクレオチド配列を生成することができる。例えば、DNA合成をポリヌクレオチドアダプター配列の3’側端から開始することにより、ポリヌクレオチドアダプター配列の後に続いて、標的DNA配列を含む単一の連続するポリヌクレオチド配列を生成することができる。
【0182】
好ましくは、ポリヌクレオチドアダプター配列は、シーケンシングプロセスのためのライブラリの調製時に天然のDNA断片にライゲートされる。
【0183】
一例では、ポリヌクレオチドアダプター配列の3’側端が標的DNA断片配列の5’側始端にライゲートされる。別の例では、標的DNA断片の3’側端がポリヌクレオチドアダプター配列の5’側始端にライゲートされる。
【0184】
ポリヌクレオチド配列の使用方法
本開示は、種々のシーケンシング方法におけるその検出及び/又は定量化の比較を可能にする、2つ以上のキャリブレーション配列を含むポリヌクレオチド配列を提供する。単一のポリヌクレオチド配列内に2つのキャリブレーション配列を含めると、別個のポリヌクレオチド配列の調製時に本来生じ得る技術的差異を省くことが可能になる。2つのキャリブレーション配列を単一の遺伝子配列に組み合わせることにより、本発明者らは、キャリブレーション方法における使用時に両方のキャリブレーション配列が同じ製造条件及び同じプロセスパラメータに供されることを確実にし得るため、ポリヌクレオチド配列内にある2つのキャリブレーション配列のより正確な比較が可能となる。
【0185】
本明細書に開示されるポリヌクレオチド配列は、所定の濃度割合で目的のRNA又はDNAサンプルに直接加えることができる。このように、ポリヌクレオチド配列と目的のRNA又はDNAサンプルとは、ライブラリ調製及びシーケンシングを一緒に受けることができる。一例では、本明細書に開示されるポリヌクレオチドがヒトゲノムDNAサンプルに加えられ、次にライブラリ調製及びシーケンシングを一緒に受ける。別の例では、本明細書に開示されるポリヌクレオチドは、細胞株から抽出されたDNAに加えられ、次にライブラリ調製及びシーケンシングを一緒に受ける。例えば、ポリヌクレオチド配列をRNAサンプルに加えることができ、それらは、一緒に逆転写、ライブラリ調製及びシーケンシングを受ける。
【0186】
有利には、本明細書に開示されるポリヌクレオチド配列は、目的のポリヌクレオチド配列を含有するサンプルに適用される方法とは別個に、任意のシーケンシング方法に供することができる。これらの方法を、目的のポリヌクレオチド配列を含有するサンプルに適用されるものと同一の条件下において、但し目的のサンプルの非存在下で実施すると、サンプルに対して実施されるシーケンシングプロセスの結果にキャリブレーション配列が干渉する可能性が低下する。
【0187】
本開示は、本明細書に開示されるポリヌクレオチドアダプター配列を使用して、ポリヌクレオチドシーケンシング方法及び/又は定量化方法をキャリブレーションする方法も提供する。キャリブレーション配列を使用すると、定量精度、定量感度、シーケンシングエラー、PCR増幅バイアス、ターゲットエンリッチメント工程の使用、ライブラリ調製時のライゲーションバイアス、ライブラリの複雑さ及びサンプル入力、バイオインフォマティクスアーチファクト及びシーケンシングエラーのいずれか1つ以上を含む技術的エラーを同定することができる。
【0188】
本開示は、1つのライブラリ中のキャリブレーション配列が第2のライブラリ中のキャリブレーション配列と比較される方法であって、この比較により、ライブラリの深さ、ライブラリ調製方法、シーケンシング技術及び/又は他のバッチ特異的効果に関してサンプル調製が異なる検査施設又は検査員によることに起因する差異が同定される方法も提供する。
【0189】
本開示は、2つ以上のライブラリ間の配列分量の正規化内でのキャリブレーション配列の分量が2つ以上のライブラリ内のキャリブレーション配列の分量から決定される方法も提供する。
【0190】
更に、本開示は、キャリブレーション配列から決定されるスケール因子を使用して、標的RNA又はDNA配列分量の決定を正規化することができる方法を提供する。
【0191】
本開示は、次世代シーケンシング方法を用いてポリヌクレオチドアダプター配列をシーケンシングする方法を提供する。
【0192】
本開示は、ライブラリデータファイル内のシーケンシングリード内にあるキャリブレーション配列の分量を、ポリヌクレオチドアダプター配列の組成物内にあるキャリブレーション配列の分量によって決定することができる方法を提供する。一例では、ハイスループット次世代シーケンシングプロセスからの出力データファイル内にあるキャリブレーション配列の分量は、ポリヌクレオチドアダプター配列の組成物内にあるキャリブレーション配列の分量によって決定される。本開示は、ポリヌクレオチド配列の組成物中におけるキャリブレーション配列の分量が、キャリブレーション配列を含む出力ライブラリデータファイル中のシーケンシングリードの分量を決定する方法も提供する。
【0193】
本開示は、ライブラリデータファイル内のシーケンシングリード内にある1つのキャリブレーション配列の決定された分量を組成物中のキャリブレーション配列の参照分量が比較され、決定された分量と参照分量との間の差が配列決定及び定量化におけるエラーを指示する方法を提供する。本開示は、2つ以上の異なるライブラリ間のキャリブレーション配列カウントの比較がライブラリ間の正規化を可能にする方法を提供する。本開示は、ポリヌクレオチドアダプター配列を既知の分量の参照配列として使用して、標的RNA及びDNA配列分量の測定をキャリブレーションする方法を提供する。
【0194】
本開示は、ポリヌクレオチドアダプター配列の組成物をプライマーオリゴヌクレオチドとして使用してDNA合成を開始する方法を提供する。本開示は、ポリヌクレオチドアダプター配列の組成物をポリメラーゼ連鎖反応時にプライマーオリゴヌクレオチドとして使用する方法を提供する。本開示は、混合物内の第2のポリヌクレオチドアダプター配列と異なる分量で存在する1つのポリヌクレオチドアダプター配列を含む混合物が提供され、及びこのポリヌクレオチドアダプター配列の混合物が2つ以上の標的DNA配列の合成時に使用され、及び2つ以上のDNA標的の合成がそれぞれのキャリブレーション配列の参照分量との比較によってキャリブレーションされる方法を提供する。
【0195】
一実施形態において、天然DNA標的断片にライゲートされている、キャリブレーション配列を含むポリヌクレオチドアダプター配列の分量は、混合物中のポリヌクレオチドアダプターの既知の分量によって決定される。一実施形態において、ポリヌクレオチド配列を含有する増幅されたDNA断片の分量は、混合物中のポリヌクレオチドアダプターの既知の分量によって決定されることになる。一実施形態において、出力ライブラリデータファイル中におけるポリヌクレオチド配列と一致する配列の分量は、混合物中におけるポリヌクレオチドの分量によって決定される。
【0196】
本開示は、本明細書に記載されるとおりのポリヌクレオチドアダプター配列が、相補的オリゴヌクレオチドプローブとのハイブリダイゼーションを用いたターゲットエンリッチメント方法と共に使用される方法を提供する。本開示は、キャリブレーション配列を含有するポリヌクレオチドアダプター配列を使用して、ポリヌクレオチドシーケンシングプロセスをキャリブレーションする方法を提供し、ここで、シーケンシングプロセスは、シングルエンドシーケンシング、ペアエンドシーケンシング、ナノポアシーケンシング、シーケンシングバイシンセシス、ショートリード、ロングリードシーケンシング技術を含む。本開示は、本明細書に記載されるポリヌクレオチドアダプター配列がシーケンシング方法で使用される方法を提供し、ここで、かかる方法は、全ゲノムシーケンシング、ショットガンシーケンシング方法、メタゲノミクスシーケンシング方法、シングルセルシーケンシング方法、ナノポアシーケンシング方法及びロングリードシーケンシング方法を含む。
【0197】
本開示は、本明細書に記載されるポリヌクレオチドアダプター配列が、遺伝性ヒト疾患を含む疾患を指示する遺伝子配列の検出、癌診断、病原体検出及び薬剤耐性に使用される方法を提供する。本開示は、ポリヌクレオチドアダプター配列が癌の臨床診断において使用される方法を提供する。一実施形態において、ポリヌクレオチドアダプター配列は、循環腫瘍DNA分析及び非侵襲的出生前検査において使用される。
【0198】
本開示は、ポリヌクレオチドアダプター配列がシーケンシング適用と共にある方法を提供し、ここで、シーケンシング適用は、全ゲノムシーケンシング、ターゲットシーケンシング適用、RNAシーケンシング又はメタゲノミクスシーケンシングを含む。本開示は、ポリヌクレオチドアダプター配列がポリメラーゼ連鎖反応増幅、DNA合成、DNAシーケンシング、RNAシーケンシング、逆転写及びcDNAシーケンシングと共にある方法を提供する。本開示は、ポリヌクレオチド配列が、ポリメラーゼ連鎖反応をベースとするシーケンシング方法において使用される方法を提供し、ここで、シーケンシングプロセスは、マルチプレックスPCR増幅、リアルタイムPCR増幅、逆転写、アンプリコン遺伝子パネル、免疫レパートリープロファイリングを含む。
【0199】
本開示は、ポリヌクレオチドアダプター配列がライブラリ調製時に使用され、次にそのライブラリが次世代シーケンシングプロセスに供され、次にシーケンシングリードの出力ライブラリ(例えば、.FASTQファイル)を生成する方法を提供する。本開示は、リード配列中でキャリブレーション配列を識別することができる方法を提供する。本開示は、シーケンシングリードのライブラリ中におけるアダプター配列の除去時にキャリブレーション配列を識別して分析することができる方法を提供する。本開示は、出力ライブラリファイル中におけるキャリブレーション配列の分量及び配列がキャリブレーション配列の参照分量及び参照配列と比較される方法を提供し、ここで、キャリブレーション配列の決定された配列又は分量と参照配列又は分量との間の差は、シーケンシングプロセス中の配列及び分量の決定におけるエラーを指示する。本開示は、記載されるキャリブレーション配列が、PCRフリーの方法、トランスポザーゼベースの方法、アンプリコンベースの方法及びターゲットエンリッチメント方法を含むライブラリ調製方法と共に使用される方法を提供する。本開示は、記載されるキャリブレーション配列が、ナノポアシーケンシング、シーケンシングバイシンセシス又はショートリード若しくはロングリードシーケンシング技術を含むシーケンシング方法と共に使用される方法を提供する。
【0200】
本開示は、キャリブレーション配列の決定された分量をキャリブレーション配列の参照分量と比較して技術的エラー及びばらつきの存在を指示することができる方法を提供する。本開示は、キャリブレーション配列の決定された分量をキャリブレーション配列の参照分量と比較して技術的エラー及びばらつきの存在を指示することができる方法を提供し、ここで、そうしたエラーは、シーケンシングエラー、PCR増幅バイアス、ライゲーションバイアス及びバイオインフォマティクスアーチファクトを含む。本開示は、1つのライブラリに存在するキャリブレーション配列が第2のライブラリに存在するキャリブレーション配列と比較され、ライブラリ間の差がエラーを指示する方法を提供する。
【0201】
アダプター配列に2つ以上のキャリブレーション配列が含まれるとき、2つのキャリブレーション配列を含めると、別個のポリヌクレオチド配列の調製時に本来生じ得る技術的差異を省くことが可能になる。2つのキャリブレーション配列を単一の遺伝子配列に組み合わせることにより、本発明者らは、キャリブレーション方法における使用時に両方のキャリブレーション配列が同じ製造条件及び同じプロセスパラメータに供されることを確実にし得、それによりポリヌクレオチド配列内にある2つのキャリブレーション配列のより正確な比較が可能となる。
【0202】
本明細書に開示されるアダプター配列は、所定の濃度割合で目的のポリヌクレオチドサンプルに直接加えることができる。このように、アダプター配列と目的のRNA又はDNAサンプルとは、ライブラリ調製及びシーケンシングを一緒に受けることができる。例えば、アダプター配列をRNAサンプルに加えることができ、それらは、一緒に逆転写、ライブラリ調製及びシーケンシングを受ける。本明細書に開示されるポリヌクレオチド配列は、シーケンシングプロセスのキャリブレーションに使用することができる。例えば、本明細書に開示されるポリヌクレオチド配列は、次世代シーケンシングプロセスのキャリブレーションに使用することができる。このポリヌクレオチド配列は、遺伝子変異体を検出する任意の方法における真陽性率、真陰性率、偽陽性率及び偽陰性率のいずれか1つ以上の測定に使用することができる。このように、本明細書に開示されるポリヌクレオチド配列は、NGS方法などのシーケンシング方法において定量的及び定性的対照として使用することができる。所与のシーケンシング方法中に測定されるキャリブレーション配列の配列及び/又はコピー数を、それらのキャリブレーション配列の既知の配列及び/又はコピー数と比較した差異は、シーケンシング方法論におけるエラー及び/又はバイアスの可能性を指示することが理解されるであろう。結果として、かかる差異を用いて、そうしたシーケンシング方法論をキャリブレーションすることができる。
【0203】
本明細書に開示されるポリヌクレオチド配列は、ライブラリ調製及びシーケンシング方法と共に使用することができる。例えば、ポリヌクレオチド配列は、PCRベースの方法、トランスポゾンベースの方法、PCRフリーの方法、PCR増幅方法及びターゲットエンリッチメントライブラリ調製方法と共に使用することができる。本明細書に開示されるポリヌクレオチド配列は、ナノポアシーケンシング、シーケンシングバイシンセシス又はショートリード若しくはロングリードシーケンシング技術と共に使用することもできる。
【0204】
一例では、本明細書に開示されるポリヌクレオチド配列は、DNA配列のターゲットエンリッチメント方法と共に使用される。このように、本明細書に開示されるポリヌクレオチド配列は、ポリメラーゼ連鎖反応で増幅することができる。
【0205】
本明細書に開示されるポリヌクレオチド配列は、相補的オリゴヌクレオチドプローブとのハイブリダイゼーションを用いたターゲットエンリッチメント方法と共に使用することもできる。本明細書に開示されるポリヌクレオチド配列は、全ゲノムシーケンシング、ショットガンシーケンシング、メタゲノミクスシーケンシング、ナノポアシーケンシング及び/又はロングリードシーケンシング方法のいずれか1つ以上と共に使用することもできる。
【0206】
本明細書に記載されるポリヌクレオチド配列は、蛍光オリゴヌクレオチドプローブと共に使用することができる。このように、本明細書に開示される方法は、1つ以上の蛍光プローブの付加を含むことができる。一例では、本明細書に開示されるポリヌクレオチド配列は、蛍光インサイチュハイブリダイゼーションと共に使用される。別の例では、本明細書に開示されるポリヌクレオチド配列は、蛍光顕微鏡法と共に使用される。別の例では、本明細書に開示されるポリヌクレオチド配列は、オリゴヌクレオチドプローブを用いた標的DNAの蛍光検出と共に使用される。
【0207】
本明細書に開示されるポリヌクレオチド配列は、ターゲットシーケンシング適用と共に使用することができる。例えば、本明細書に開示されるポリヌクレオチド配列は、PCR増幅と共に使用することができる。本明細書に開示されるポリヌクレオチド配列は、標的化した遺伝子パネルと共に使用することもできる。一例では、オリゴヌクレオチドプローブは、次世代シーケンシングのためのライブラリの調製時、本明細書に開示されるポリヌクレオチド配列をハイブリダイズ、捕捉及びエンリッチする。このように、キャリブレーション配列がどの程度エンリッチされるかを用いて、サンプル中の目的の標的配列をエンリッチする方法をキャリブレーションすることができる。DNA合成及び増幅時、プライマーは、本明細書に開示されるポリヌクレオチド配列又はキャリブレーション配列を標的化するように設計され得る。このように、本明細書に開示されるポリヌクレオチド配列又は1つ以上のキャリブレーション配列に相補的なプライマー及びオリゴヌクレオチドプローブを使用することができる。このように、ポリヌクレオチド配列は、エンリッチメントの標的となるキャリブレーション配列を含むことができる。一例では、ポリヌクレオチド配列は、エンリッチメントの標的となる1つ以上のキャリブレーション配列と、エンリッチメントの標的でない1つ以上のキャリブレーション配列とを含む。このように、本ポリヌクレオチド配列を使用すると、第1のキャリブレーション配列のエンリッチメントを第2のキャリブレーション配列のエンリッチメントとの比較によりキャリブレーションすることができる。代わりに又は加えて、本ポリヌクレオチド配列を使用すると、第1のキャリブレーション配列のシーケンシングを第2のキャリブレーション配列のシーケンシングとの比較によりキャリブレーションすることができる。一例では、1つ以上のキャリブレーション配列のエンリッチメントは、ポリヌクレオチド配列内でのキャリブレーション配列の予想コピー数に対する相対的な存在量を比較することによって測定及びキャリブレーションすることができる。
【0208】
本明細書に開示される方法の一例では、ポリヌクレオチド配列は、ライブラリ調製及びシーケンシング前に、血液サンプルから抽出された循環DNAに加えることができる。
【0209】
別の例では、本明細書に開示されるポリヌクレオチド配列は、ライブラリ調製及びシーケンシング前に、腫瘍生検から抽出されたDNAに加えることができる。
【0210】
本明細書に開示されるポリヌクレオチド配列は、シーケンシングワークフロー全体を通して定量的及び定性的内部対照としての役割を果たし得る。このように、本明細書に開示される方法は、シーケンシング方法の評価、最適化及びキャリブレーションを可能にする。本明細書に開示されるポリヌクレオチド配列は、次世代シーケンシング検査における診断能力の経験的測定も提供することができる。例えば、本明細書に記載されるポリヌクレオチド配列は、ゲノムDNA中の突然変異を同定する際の真陽性率、真陰性率、偽陽性率及び/又は偽陰性率の測定に使用することができる。また、本明細書に開示されるポリヌクレオチド配列によれば、複数のDNA又はRNAサンプルの正規化も可能となり得る。本明細書に開示されるポリヌクレオチド配列によれば、1つのラダーにおいて、異なる部位又は時点からの複数のDNA又はRNAサンプルを正規化することが可能となり得る。
【0211】
ポリヌクレオチド配列の分析
本開示のポリヌクレオチド配列内でのキャリブレーション配列の存在量は、出力ライブラリ内にある誘導体シーケンシングリードの数をカウントすることによって決定され得る。一例では、キャリブレーション配列の存在量は、参照ゲノム又は染色体インデックスとのシーケンスリードのアラインメントをカウントすることによって測定され得る。キャリブレーション配列の存在量は、当技術分野において公知の他の好適な方法において、例えばマイクロアレイを用いた蛍光測定又はインサイチュハイブリダイゼーションによっても決定され得る。一例では、キャリブレーション配列の存在量は、オリゴヌクレオチドプローブとのハイブリダイゼーションを用いて測定される。
【0212】
本開示は、本明細書に開示されるポリヌクレオチド配列を使用してシーケンシングプロセスをキャリブレーションする方法を提供する。ポリヌクレオチド配列は、サンプルと共にライブラリ調製及びシーケンシングを同時に受けることができる。かかる方法において、ポリヌクレオチド配列は、加えた点から下流において、付随するサンプルと共に技術的ばらつきを生じ得る。このように、本明細書に開示されるポリヌクレオチド配列を使用して、ライブラリ調製、シーケンシング及びバイオインフォマティクス解析時の技術的エラーの発生を測定することができる。従って、本明細書に開示されるポリヌクレオチド配列を使用して、PCR増幅バイアス、ターゲットエンリッチメント工程、ライブラリ調製時のライゲーションバイアス、ライブラリの複雑さ、サンプル入力、バイオインフォマティクスエラー及び/又はシーケンシングエラーに起因する技術的ばらつきを測定することができる。NGSワークフロー全体を通して蓄積し得る技術的ばらつきの大きさは、ポリヌクレオチド配列内でのキャリブレーション配列の予想されるコピー数と観察される存在量との間のずれに比例し得る。
【0213】
本開示は、本明細書に開示されるポリヌクレオチド配列を使用して、別の別個のサンプル中のRNA又はDNA配列のシーケンシングをキャリブレーションする方法も提供する。本明細書に開示されるポリヌクレオチド配列を使用して、ポリヌクレオチド配列の測定に伴う不確実性を決定又は推定することができる。例えば、ポリヌクレオチド配列を使用して、シーケンシングプロセス時に測定される技術的ばらつきからスケール因子を計算することができる。次に、付随するRNA又はDNAサンプルに由来するポリヌクレオチド配列の分析時、このスケール因子を使用することができる。
【0214】
ポリヌクレオチド配列を使用して、PCR増幅、オリゴヌクレオチドプローブハイブリダイゼーション、蛍光又は他の存在量の定量的測定法を用いた測定の精度を測定することができる。一例では、ポリヌクレオチド配列内にあるキャリブレーション配列に由来するシーケンシングリードがカウントされる。キャリブレーション配列の測定されたリードカウントは、次に、ポリヌクレオチド配列内でキャリブレーション配列が繰り返される予想されるコピー数と比較され、ここで、測定されたリードカウントと予想されるコピー数との間の差は、ライブラリ調製及び/又はシーケンシングプロセスにおけるエラーを指示し、及びこのエラーは、例えば、残差の和、相関及び傾きを含めて、統計量を用いて測定することができ、そのため、NGSワークフロー全体にわたって生じる技術的ばらつきの大きさを測定し得る。従ってポリヌクレオチド配列を使用して、2つ以上の次世代シーケンシングライブラリ間の技術的差異を正規化することができる。
【0215】
キット
本開示は、本明細書に開示される1つ以上のポリヌクレオチド配列を含むキットも提供する。一部の例において、本キットは、ラダーである本開示の1つ以上のポリヌクレオチドを含む。他の例において、本キットは、アダプター配列である本開示の1つ以上のポリヌクレオチドを含む。他の例において、本キットは、ラダー配列及びアダプター配列の両方を含む。本キットは、(限定はされないが)その配列、濃度、目的の構造ゲノム学的特徴など、それに含まれる特定のポリヌクレオチド配列を説明する情報も提供し得る。
【0216】
本キットは、任意に組み合わせた、本明細書に記載されるポリヌクレオチド配列のいずれか1つ以上の混合物を含み得る。ポリヌクレオチド配列の混合物は、一緒に単一の緩衝液中に提供され得、それを1つ以上の容器に提供することができる。代わりに、ポリヌクレオチド配列の混合物は、各々が単一のポリヌクレオチド配列又は単一の濃度のポリヌクレオチド配列を含む複数の別個の容器の形態で提供され得る。一例では、別個の容器は、キットとして互いに関連付けられた状態で提供される。
【0217】
本キットは、本明細書に開示されるコンピューター装置、コンピュータープログラマブル媒体及び/又はコンピューターソフトウェアを更に含み得る。一例では、本キットは、物理的参照標準を実験的に使用することが可能であり、コンピューター装置及びソフトウェアを使用して実験的に導き出されたシーケンシング情報を本明細書に記載される参照標準と関係付けることが可能なパッケージとして提供される。
【0218】
本明細書に記載されるとおりの参照標準は、天然に存在する遺伝子配列を使用することに基づいて設計することができる。例えば、天然に存在する遺伝子配列からkmerを選択することができる。次に、それらのkmerを1つ以上の既知のコピー数単位で共につなぎ合わせて、単一の連続する配列を形成することができる。次に、この連続した配列をベクター中に合成することができる。次に、このベクターを、細菌形質転換、増幅、抽出、制限消化、精製及び定量化を含む製造プロセスに使用することができる。ベクターは、PCR増幅を含む製造プロセスにも使用することができ、ここで、プライマーは、配列を増幅するように設計され得、次に増幅の産物を精製し、定量化することができる。結果として得られる参照標準は、その参照標準のストック在庫として使用することができる。
【0219】
これらの製造された参照標準は、他の異なる製造された参照標準と組み合わせて混合物を形成することができる。これらの参照標準を異なる濃度で組み合わせて、ホモ接合性、ヘテロ接合性及び他のアレル頻度、コピー数、染色体倍数性並びに微生物及び病原体の存在量を模倣することができる。
【0220】
参照標準又は参照標準の混合物は、ヒトサンプル又は他の目的とするサンプルから抽出されたRNA/DNAに、ある濃度割合で加えることができ、次に一緒にライブラリ調製及びシーケンシングを受けることができる。参照標準は、単独でライブラリ調製及びシーケンシングに供され得る。NGSシーケンシングを用いると、参照標準又は参照標準の混合物及びサンプルのリードの単一の(.FASTQ)ライブラリを作製することができる。ラダー参照標準に由来するリードは、リード配列内にある既知のkmerの存在によって識別することができる。このように、リードは、それが既知のkmerを含む場合、標準からのものとして分類することができるか、又はそれが既知のkmerを含まない場合、サンプルからのものとして分類することができる。この出力(.FASTQ)ライブラリは、参照標準又はサンプルのいずれかからの2つのより小さいライブラリに分割することができる。出力ライブラリでは、ラダー参照標準に関するデータを分析することができる。
【0221】
コンピューターシステム及びコンピューター実装方法:
本開示は、コンピューターシステム及びコンピューター実装方法も提供する。図7は、ポリヌクレオチドシーケンシング又は定量化方法のキャリブレーションに好適なコンピューターシステム3800を例示する。コンピューターシステム3800は、プログラムメモリ3804、データメモリ3806、通信ポート3808及びユーザーポート3810に接続されたプロセッサ3802を含む。プログラムメモリ3804は、ハードドライブ、固体ディスク又はCD-ROMなどの非一時的コンピューター可読媒体である。ソフトウェア、即ちプログラムメモリ3804に格納されている実行可能プログラムは、プロセッサ3802に、本明細書に開示される方法を実施させる。
【0222】
プロセッサ3802は、次に、初期結果及び/又はキャリブレーション結果をRAM又はプロセッサレジスタなどのデータストア3806に格納し得る。プロセッサ3802は、サンプル配列データベースなど、サーバー又はポリヌクレオチドシーケンシング実験を管理するコンピューターシステムに初期結果及び/又はキャリブレーション結果を、通信ポート3808を介して送信することもできる。
【0223】
プロセッサ3802は、データメモリ3806並びに通信ポート3808及び/又はユーザーポート3810から、ポリヌクレオチド配列又はポリヌクレオチド配列の分量又はサンプルの配列を示すデータなどのデータを受信し得、ユーザーポート3810は、シーケンシング及び/又は定量化結果の視覚表現3814をユーザー3816に見せるディスプレイ3812に接続されている。一例では、プロセッサ3802は、IEEE 802.11に準拠するWi-Fiネットワークの使用によるなどして、シーケンシング装置から通信ポート3808を介して配列データを受信する。Wi-Fiネットワークは、アドホックネットワークに分散化され得、従ってルーターなどの専用の管理インフラストラクチャーが不要となるか、又はルーター若しくはアクセスポイントがネットワークを管理する集中型ネットワークとなる。
【0224】
通信ポート3808及びユーザーポート3810は、別個の実体として図示されるが、ネットワーク接続、メモリインターフェース、プロセッサ3802のチップパッケージのピン又は論理ポート、例えばIPソケット若しくはプログラムメモリ3804に格納され、及びプロセッサ3802によって実行される関数のパラメータなど、いかなる種類のデータポートもデータの受信に使用し得ることが理解されるべきである。これらのパラメータは、データメモリ3806に格納され得、ソースコード中で値毎又は参照毎に、即ちポインターとして取り扱われ得る。
【0225】
プロセッサ3802は、これらの全てのインターフェースを通してデータを受信し得、これは、キャッシュ若しくはRAMなどの揮発性メモリ又は光ディスクドライブ、ハードディスクドライブ、ストレージサーバー若しくはクラウドストレージなどの不揮発性メモリのメモリアクセスを含む。コンピューターシステム3800は、動的数の仮想マシンをホストする相互接続されたサーバーの管理グループなど、クラウドコンピューティング環境内で更に実装され得る。
【0226】
任意の受信するステップに先行して、プロセッサ3802による後に受信するデータの決定又は計算があり得ることが理解されるべきである。例えば、プロセッサ3802は、ポリヌクレオチド配列の配列データを決定し得、RAM又はプロセッサレジスタなどのデータメモリ3806に配列データを格納し得る。次に、プロセッサ3802は、リード信号をメモリアドレスと共に提供することによるなど、データメモリ3806からのデータを要求し得る。データメモリ3806は、物理的ビットライン上の電圧信号としてデータを提供し得、プロセッサ3802は、メモリインターフェースを介して配列データを受信し得る。
【0227】
本開示全体を通して、特に明記しない限り、データは、[「G」、「A」、「T」、「C」]ストリング又はヌクレオチドを符号化するバイナリタプルのリストなど、データ構造によって表され得ることが理解されるべきである。データ構造は、データメモリ3806に物理的に格納されるか、又はプロセッサ3802によって処理されることができる。
【0228】
本開示の技法は、種々の技術を用いて実装される可能性があることが理解されなければならない。例えば、本明細書に記載される方法は、好適なコンピューター可読媒体上に存在する一連のコンピューター実行可能命令によって実装され得る。好適なコンピューター可読媒体には、揮発性(例えば、RAM)及び/又は不揮発性(例えば、ROM、ディスク)メモリ、搬送波及び伝送媒体が含まれ得る。例示的搬送波は、ローカルネットワーク又はインターネットなど、公的にアクセス可能なネットワークに沿ってデジタルデータストリームを運ぶ電気信号、電磁信号又は光信号の形態をとり得る。
【0229】
また、特に具体的に明記されない限り、以下の考察から明らかなとおり、この説明全体を通して、「処理する」、又は「演算する」、又は「計算する」、又は「決定する」、又は「表示する」、又は「キャリブレーションする」、又は「正規化する」などの用語を利用する考察は、コンピューターシステムのレジスタ及びメモリ内で物理的(電子的)分量として表されるデータを、コンピューターシステムメモリ若しくはレジスタ又は他のかかる情報格納、伝送若しくは表示装置内で物理的分量として同様に表される他のデータに処理及び変換するコンピューターシステム又は類似の電子計算装置の動作及び処理を指し得ると認識されることも理解されなければならない。
【0230】
ここで、以下の非限定的な例において本開示を更に説明する。
【実施例
【0231】
実施例1:ポリヌクレオチド配列を使用した癌遺伝子の測定のキャリブレーション
本例は、ヒトゲノムからの2つ以上のキャリブレーション配列を含むポリヌクレオチド配列の設計及び合成を示す。ERBB2(HER2)遺伝子の異なるエクソン配列から、3つの約750ntのキャリブレーション配列を選択した(図1;配列番号11~13を参照されたい)。次に、キャリブレーション配列を繰り返した。配列Aは、1コピーで存在し、配列Bは、2コピーで存在し、配列Cは、3コピーで存在し、これにより癌遺伝子の欠失、正常(二倍体遺伝子型)及び増幅を模倣している。次に、これらの6コピー(3つのキャリブレーション配列を表す)を、以下のとおりの線状の並び順、C-B-C-A-B-Cに配置した。次に、各キャリブレーション配列間において、約600ntのランダムに生成された介在するスペーサー配列を含めて、3’及び5’末端に追加のフランキング配列を加えて最終的なポリヌクレオチド配列を形成した。癌での増幅又は欠失が繰り返し見出されるEGFR、MET、BRAF及びFGFR1遺伝子から選択した最終的なポリヌクレオチド配列(配列番号2~4及び14~25を参照されたい)も構築した。
【0232】
次に、ポリヌクレオチド配列を合成し、商業的供給業者(ThermoFisher)によって宿主pMAプラスミド内に導入された。プラスミド内では、ポリヌクレオチド配列にSap1制限酵素部位が隣接した。プラスミドで大腸菌(E. coli)を形質転換し、培養下で拡大させて、精製した(Plasmid Midi-Prep、Qiagen(登録商標)を使用)。サンガーシーケンシングを用いて、ポリヌクレオチド配列が正しいことを確かめた。pMAプラスミドからSap1酵素によるエンドヌクレアーゼ消化(NEB、製造者のプロトコルに従う)によってポリヌクレオチド配列を切り出した。切り出したポリヌクレオチド配列を分離し、残りのプラスミドからアガロースゲル電気泳動を用いて精製した。精製したポリヌクレオチド配列DNAを、Qubit 2.0蛍光光度計(Life Technologies)でBR dsDNA Qubitアッセイを用いて定量化し、Agilent 2100バイオアナライザーでAgilent高感度DNAキット(Agilent Technologies)によって確かめた。次に、これらの5つの個別のポリヌクレオチド配列を等濃度で組み合わせて(Eppendorf(登録商標)Epmotionを使用)、混合物を配合した。
【0233】
KAPAライブラリ調製キット(IlluminaプラットフォームKR0935-v2.14)により、SeqCapアダプターキット(Roche-NimbleGen)と併せて、製造者のプロトコルに従ってライブラリを調製した。次に、約183個の癌遺伝子を標的とするカスタムの遺伝子パネル(SeqCap、Roche-NimbleGen)を使用したターゲットエンリッチメントシーケンシングを実施した。エンリッチされたライブラリをAgilent 2100バイオアナライザーで定量化した後、上記のとおり、HiSeq 2500でペアエンドシーケンシングを実施した。シーケンシング(Illumina(登録商標)HiSeq 2500)を製造者の指示に従って実施して、出力ライブラリファイル(.FASTQファイル)を作成した。
【0234】
ポリヌクレオチド配列(上記に示したとおり、ラダーとして調製したもの)を分析するため、BWA(Li, 2013)を使用して出力ライブラリ(.FASTQ)をヒトゲノム参照アセンブリ(hg38;GRCh38.p12、2013年12月アセンブリ)とアラインメントした。スペーサー配列及びフランキング配列を含むアラインメントは、以降の分析から省いた。ポリヌクレオチドのアラインメントカバレッジを、キャリブレーション配列B(2コピーで存在する)が約30倍のカバレッジを有するようにキャリブレーションした。標的とする遺伝子エクソン全体にわたる観察されたアラインメントカバレッジを、ポリヌクレオチド配列内でのキャリブレーション配列の既知のコピー数に対してプロットした。得られた散布図は、ターゲットエンリッチメントNGSプロトコルを用いた遺伝子欠失及び増幅の検出についての定量精度を指示した。コピー数変異の測定についての定量精度を評価するため、予想されるアラインメントカバレッジに対する観察されたアラインメントカバレッジの偏差を残差の和によって測定し、1の値からの相関の偏差及び傾きを測定した。
【0235】
実施例2:ポリヌクレオチド配列を使用した遺伝子パネルのキャリブレーション
本例は、癌に原因として関連する約97個の遺伝子のエクソン配列から選択した2つ以上のキャリブレーション配列を含むポリヌクレオチド配列の設計及び合成を示す。TP53遺伝子エクソンと重複する5つのキャリブレーション配列(A~E)(図2;配列番号26~30を参照されたい)を選択した。これらのキャリブレーション配列(600nt、640nt、1549nt、871nt、1103nt)を約600ntの介在スペーサー配列(配列番号42)と共に配置した一方、3’及び5’末端に追加のフランキング配列を加えて、約7.6kbの最終的なポリヌクレオチド配列を形成した(配列番号6を参照されたい)。
【0236】
次に、上記に記載したとおり(実施例1を参照されたい)ポリヌクレオチド配列を合成し、調製した。簡潔に言えば、ライブラリ調製、ターゲットエンリッチメント及びシーケンシングのためのポリヌクレオチドを合成した。次に、BWA(Li, 2013)を使用して、出力ライブラリ(.FASTQ)をヒトゲノム参照アセンブリ(hg38、GRCh38.p12、2013年12月アセンブリ)とアラインメントした。
【0237】
アラインメントフォールドカバレッジ中央値が約30倍のカバレッジに等しくなるように、全てのキャリブレーション配列にわたるアラインメントカバレッジをキャリブレーションした。TP53遺伝子内でのキャリブレーション配列1~5にわたるアラインメントカバレッジの差異を評価し、NGS検査の技術的性能の差異を測定した。
【0238】
実施例3:ポリヌクレオチド配列を使用した微生物群集のシーケンシングのキャリブレーション
本例は、原核生物ゲノムから選択されるキャリブレーション配列を含むポリヌクレオチド配列の設計及び合成を示す。3つの微生物ゲノム(大腸菌(Escherichia coli)K-12、インフルエンザ菌(Haemophilus influenzae)Rd KW20、緑膿菌(Pseudomonas aeruginosa)PAO1;図3;配列番号31~33を参照されたい)から、16S rRNA遺伝子からの約1,500ntのキャリブレーション配列を選択した。次に、各キャリブレーション配列を1倍、2倍及び4倍のコピー数で繰り返した。次に、これらのコピーを介在スペーサー配列及びフランキング末端配列と共に配置して、最終的なポリヌクレオチド配列を形成した(配列番号7を参照されたい)。
【0239】
ポリヌクレオチド配列は、以下を除いて上記に記載したとおり製造した(実施例1を参照されたい)。ポリヌクレオチド配列DNA断片は、Nextera XTサンプル調製キット(Illumina(登録商標))を製造者の指示に従って使用して調製した。調製したライブラリは、Qubit蛍光光度計(Life Technologies)で定量化し、Agilent 2100バイオアナライザーでAgilent高感度DNAキット(Agilent Technologies)によって確かめた。シーケンシング(Illumina(登録商標)HiSeq 2500)を製造者の指示どおりに実施して、分析のための出力ライブラリファイル(.FASTQファイル)を作成した。
【0240】
このラダーを分析するため、BWA(Li, 2013)を使用して、出力ライブラリ(.FASTQ)を4つの微生物ゲノムについての参照ゲノムアセンブリとアラインメントした。スペーサー配列及びフランキング配列を含むアラインメントは、以降の分析から省いた。微生物配列全体にわたる観察されたアラインメントカバレッジをポリヌクレオチド配列内での各キャリブレーション配列の既知のコピー数に対してプロットすることにより、NGSライブラリ性能を評価する。
【0241】
実施例4:ポリヌクレオチド配列を使用したヒトゲノムにおける遺伝子変異体の検出のキャリブレーション
本例は、各々が単一の染色体領域における異なる遺伝子変異体を表すキャリブレーション配列を含むポリヌクレオチド配列の設計及び使用を示す。BRAF遺伝子配列からの1,100ntのキャリブレーション配列(図4)を選択した。このキャリブレーション配列を2コピーで繰り返した。1つのコピーは、参照Tヌクレオチドを有した一方、1つのコピーは、突然変異Aを有する結果、悪性黒色腫に関連するval600からgluへの(V600E)アミノ酸置換が生じていた(配列番号34~35を参照されたい)。これらの2つのキャリブレーション配列コピーを介在スペーサー配列と共に一体につなぎ合わせて、7.6kb長の単一のポリヌクレオチド配列を形成した(配列番号8を参照されたい)。
【0242】
本発明者らは、次に、BRCA2遺伝子配列から選択される2,200ntのキャリブレーション配列を選択した(図5)。このキャリブレーション配列を2コピーで繰り返した。1つのコピーは、参照Aヌクレオチドを有した一方、1つのコピーは、小さい単一のヌクレオチド欠失を有した(配列番号36~37を参照されたい)。これらの2つのキャリブレーション配列コピーを介在スペーサー配列と共に一体につなぎ合わせて、6.2kb長の単一のポリヌクレオチド配列を形成した(配列番号9を参照されたい)。
【0243】
これらのポリヌクレオチド配列を上記に記載したとおり合成し、調製した(実施例1を参照されたい)。簡潔に言えば、ライブラリ調製、ターゲットエンリッチメント及びシーケンシングのためのポリヌクレオチドを合成した。次に、BWA(Li, 2013)を使用して、出力ライブラリ(.FASTQ)をヒトゲノム参照アセンブリ(hg38;GRCh38.p12、2013年12月アセンブリ)とアラインメントした。このラダーを分析するため、BWA(Li, 2013)を使用して出力ライブラリ(.FASTQ)をヒト参照ゲノムアセンブリ(hg38)とアラインメントした。アラインメントは、30倍カバレッジにキャリブレーションし、スペーサー及びフランキング配列は以降の分析から省いた。
【0244】
VarScan2(Koboldt et al., 2012)を使用してBRAF及びBCRA2遺伝子の突然変異を同定した。これらの突然変異の観察されたアレル頻度を、繰り返されるコピー数の予想される比と比較することにより、NGSライブラリの精度を評価した。BRAF V600E突然変異の頻度は、(体細胞突然変異を反映して)25%と予想され、BRCA2は、(ヘテロ接合突然変異を反映して)50%と予想される。
【0245】
実施例5:ポリヌクレオチド配列を使用した循環DNAにおける遺伝子変異体の検出のキャリブレーション
本例は、循環腫瘍DNA検出方法と共に使用するためのポリヌクレオチド配列の設計及び使用を示す。上記に記載したとおり(実施例4を参照されたい)、BRAF V600E及びBCRA2欠失を含むポリヌクレオチド配列を、循環DNAシーケンシングで典型的に観察されるとおりの小型DNA断片と同様になるように断片化した。ポリヌクレオチド配列の断片化は、酵素的DNA断片化キットを製造者の指示に従って使用して実施した(New England Biolabs NEBNext Ultra II FS)。断片化されたポリヌクレオチド配列のサイズを、Agilent 4300 TapStationシステムを用いて測定し、ポリヌクレオチド配列が165ntのサイズ中央値に断片化されたことが示された(図6)。このサイズは、循環DNAで典型的に観察される長さと同様である(Lapin et al., 2018)。
【0246】
これらのポリヌクレオチド配列を上記に記載したとおり合成し、調製した(実施例4を参照されたい)。簡潔に言えば、ライブラリ調製、ターゲットエンリッチメント及びシーケンシングのためのポリヌクレオチドを合成した。次に、BWA(Li, 2013)を使用して、出力ライブラリ(.FASTQ)をヒトゲノム参照アセンブリ(hg38、GRCh38.p12、2013年12月アセンブリ)とアラインメントし、VarScan2(Koboldt et al., 2012)を使用して突然変異を同定した。
【0247】
実施例6:ポリヌクレオチド配列を使用したRNAシーケンシングのキャリブレーション
本例は、遺伝子発現を測定するためのRNAポリヌクレオチド配列の設計及び合成を示す。その発現が癌に関連する3つの異なる遺伝子(BCR、ABL及びALK)からのエクソンを含む200nt長のキャリブレーション配列を選択した(配列番号38~40を参照されたい)。これらのキャリブレーション配列を1、2及び3コピーで表し、スペーサー及びフランキング配列と共に単一のポリヌクレオチド配列にアセンブルした(配列番号10を参照されたい)。
【0248】
次に、ポリヌクレオチド配列を合成し、上記の実施例1に記載されるとおり宿主pMAプラスミド内に入れた。プラスミド内では、ポリヌクレオチド配列の前の5’側にSP6プロモーターがあり(ポリヌクレオチド配列のインビトロ転写を可能にする)、後ろの3’側に60ntポリアデニントラクト、続くNot1制限酵素部位があった。このプラスミドをNot1消化によって線状化し、次に製造者の指示に従って(MEGAscript SP6転写キット、Thermo Fisher Scientific(登録商標)を使用して)RNAに転写した。次に、ポリヌクレオチド配列を含む得られたRNA転写物を(Eppendorf(登録商標)Epmotionを使用して)等濃度で組み合わせて混合物を配合した。
【0249】
次に、それをライブラリ調製に(Illumina(登録商標)KAPA RNA HyperPrepキットを使用して)供した。ライブラリをAgilent 2100バイオアナライザーで定量化した後、上記に記載したとおり、HiSeq 2500でペアエンドシーケンシングを実施した。シーケンシング(Illumina(登録商標)HiSeq 2500)を製造者の指示どおりに実施して、出力ライブラリファイル(.FASTQファイル)を作成した。
【0250】
次に、BWA(Li, 2013)を使用して、出力ライブラリ(.FASTQ)をヒトゲノム参照アセンブリ(hg38)とアラインメントした。次に、Kallisto(Bray et. al., 2016)を使用してライブラリを分析することにより、ポリヌクレオチド配列内にある各キャリブレーション配列に転写物百万分率(TPM)値を割り当てた。次に、測定されたTPM値を、ポリヌクレオチド配列内でのキャリブレーション配列の予想されるコピー数に対してプロットした。このポリヌクレオチド配列の分析から、このRNAシーケンシング実験における遺伝子発現の測定についての定量精度が指示された。
【0251】
実施例7:Illuminaシーケンシング
本例は、次世代シーケンシングと共に使用するためのポリヌクレオチドアダプター配列の設計を示す(図11を参照されたい)。4つの異なるキャリブレーション配列(Y1~4)を選択し、各キャリブレーション配列が人工の12nt配列を含んだ。これらの配列は、低複雑度の配列又は繰り返し配列を含まないランダムに生成された配列であった。次に、キャリブレーション配列を試験して、アダプター内にある他の配列(P5、P7配列又は相補配列を含む)とのそれらの相補性が最小限(5連続ヌクレオチド未満)であることを確実にした。これらのキャリブレーション配列は、キャリブレーション内の対応する部位で異なるヌクレオチドもコードした。これは、インデックスリードの各サイクルで異なるヌクレオチドを有することによって最適なクラスター判別を確保するためであった。Y-アダプター配列の対(Y1A及びY1Bと呼ばれる)の設計例は、以下のとおりであった。
【0252】
第1のアダプター配列について、5’末端チミンを有するキャリブレーション配列を設計した(一例を示す)。
CACGGTGTTCTT(配列番号48)
【0253】
次に、これをP5プライマー結合配列:
AATGATACGGCGACCACCGA(配列番号47)
及び(Y-アダプター)パートナーと相補性を有する配列:
-GA-TCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(配列番号49)
とアセンブルして、アダプター配列(Y1A):
CACGGTGTTCTT-AATGATACGGCGACCACC-GA-GATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(配列番号46)
を形成した。
【0254】
第2のアダプター配列について、本発明者らは、キャリブレーション配列を設計した(一例を示す)。
AGAACACCGTG(配列番号64)
【0255】
次に、これを、(Y-アダプター)パートナーと相補性を有する配列及びインデックス配列:
GATCGGAAGAGCACACGTCTGAACTCCAGTCAC-ATCACG-(配列番号65)
及びP7プライマー結合部位:
ATCTCGTATGCCGTCTTCTGCTTG(配列番号63)
とアセンブルした。
【0256】
次に、上記の配列をアセンブルして、アダプター配列(Y1B)
AGAACACCGTG-AGATCGGAAGAGCA-CACGTCTGAACTCCAGTCAC-ATCACG-ATCTCGTATGCCGTCTTCTGCTTG(配列番号62)
を形成した。
【0257】
この手法を用いて、4対のY-アダプター(Y1~Y4;配列番号46~61を参照されたい)を形成する8配列を設計した。
【0258】
次に、上記のポリヌクレオチド配列を合成した(商業的供給業者;GeneArtによる)。各アダプター対を対応するアダプターと対にして、68℃から20分間かけて冷却することによりハイブリダイズした。これにより、カスタムのアダプター配列が各対間でアニールしてY字型アダプターを形成することが可能になった(図11を参照されたい)。次に、ポリヌクレオチドY-アダプターを以下の相対量(キャリブレーション配列Y1=10%;Y2=20%;Y3=30%及びY4=40%)で組み合わせて、アダプター配列の混合物を配合した(Eppendorf Epmotion)。
【0259】
次に、Illumina TruSeqライブラリ調製キット(合成したカスタムのアダプターを除き、製造者の指示に従う)を使用した試験サンプルからのライブラリの調製時、このアダプター配列混合物を使用した。試験サンプルは、合成モック微生物群集を含んだ(モック群集A)。これは、様々な微生物ゲノムのゲノム配列を映す合成DNA配列の混合物(sequinsとして知られる)を含んだ(Hardwick et. al., 2019)。調製したライブラリを、Agilent 2100バイオアナライザーを使用して確かめて、次に製造者の指示に従ってシーケンシングした(Illumina(登録商標)NextSeq)。
【0260】
次に、CutAdapt(Martin et. al., 2011;Python 2.7.6によるcutadapt 1.8.1)を使用して(キャリブレーション配列を含む本発明者ら独自のカスタムアダプター配列を提供する(-gオプション)という修正を加えた)、出力ライブラリ(.FASTQ)中のシーケンシングリードの5’側始端にあるキャリブレーション配列を識別した。例示的な第1のペアリードは、以下を含む(キャリブレーション配列CACGGTGTTCTT(配列番号48)に下線を付す)。
【化1】
【0261】
キャリブレーション配列を同定し、ライブラリ内でカウントした:Y1(10%)135,312リード、Y2(20%)302,356リード、Y3(30%)581,931リード及びY4(40%)1,324,455リード。次に、キャリブレーション配列の観察された割合を、キャリブレーション配列の予想される割合に対してプロットした(図11を参照されたい)。このプロットは、NGSライブラリの定量精度、線形性及び感度を指示し、傾き(3.847e+006±943048)及び相関(R2-0.8927)の推定を可能にする。ライブラリ中のキャリブレーション配列の存在量割合の実測値と予想値との間の差、即ち残差がシーケンシング時の技術的ばらつきを指示する。
【0262】
実施例8:アダプター配列をOxford Nanoporeシーケンシングと共に使用する
本例は、Oxford Nanopore MinION(商標)インスツルメントによるロングリードシーケンシングと共に使用するためのポリヌクレオチドアダプター配列の設計を示す(図10を参照されたい)。24ヌクレオチド長である4つのキャリブレーション配列を選択した。これらの配列をランダムに生成し、キュレートして、それらが天然配列との実質的な相同性又は他のアダプター若しくはプライマー配列との相補性を共有しないことを確実にした。キャリブレーション配列をアダプター配列中にアセンブルする例は、以下のとおりである(キャリブレーション配列に下線を付す)。
【0263】
第1のアダプター配列について、キャリブレーション配列を設計した(一例を示す)。
TCCATGTAACACCATGAACACATCT(配列番号79)
【0264】
次に、これを(Y-アダプター、例えばY5B)パートナーと相補性を有する配列:
TGACAGACAAGGGTAA(配列番号80)
とアセンブルした。
【0265】
次に、上記の配列をアセンブルして、第1のアダプター配列を形成した(Y5A、キャリブレーション配列に下線を付す)。
TGACAGACAAGGGTAA-TCCATGTAACACCATGAACACATCT(配列番号78)
【0266】
第2のアダプター配列について、本発明者らは、キャリブレーション配列を設計した(一例を示す)。
GATGTGTTCATGGTGTTACATGGA(配列番号91)
【0267】
次に、これを、(Y-アダプター、即ちY5A)パートナーと相補性を有するプライマー配列:
TTACCCTTGTCTGTCA(配列番号92)
とアセンブルした。
【0268】
次に、上記の配列をアセンブルして、アダプター配列
GATGTGTTCATGGTGTTACATGGA-TTACCCTTGTCTGTCA(配列番号90)
を形成した。
【0269】
この手法を用いて、4対のアダプター配列を設計した(Y5~Y8;配列番号78、81、84及び87を参照されたい)。
【0270】
ポリヌクレオチドアダプター配列を上記に記載したとおり調製した(実施例7を参照されたい)。次に、ポリヌクレオチドY-アダプターを以下の相対量(キャリブレーション配列Y5=10%;Y6=20%;Y7=30%及びY8=40%)で組み合わせて、アダプター配列の混合物を配合した(Eppendorf Epmotion)。
【0271】
次に、Oxford Nanopore LSK108キット(1Dライゲーション)を製造者の指示に従って(合成したカスタムのアダプターを除く)使用した試験サンプルからのライブラリの調製時、このアダプター配列混合物を使用した。試験サンプルは、合成モック微生物群集を含んだ(モック群集A)。これは、様々な微生物ゲノムのゲノム配列を映す合成DNA配列の混合物(sequinsとして知られる)を含んだ(Hardwick et. al., 2019)。MinION(商標)インスツルメント(Oxford Nanopore Technologies)でライブラリをシーケンシングした。ベースコールは、ONT Albacoreシーケンシングパイプラインソフトウェア(バージョン1.2.6)を使用して達成した。
【0272】
ONTリード内でのキャリブレーション配列の存在を決定した。ここで、未処理リード配列の例を挙げる(Y8Aキャリブレーション配列GAAACCCATCAATCGCTTAACATC(配列番号88)に下線を付す(簡潔にするため、クオリティスコアを取り除いてある)。
【化2】
【0273】
ライブラリ中のキャリブレーション配列の予想される割合を、ライブラリ中に識別される観察されたキャリブレーション配列に対してプロットした(図12を参照されたい)。このプロットは、NGSライブラリの定量精度、線形性及び感度を指示し、傾き及び相関の推定を可能にする。観察されたリード数と、キャリブレーション配列の予想される存在量割合との間の差は、シーケンシング時の技術的ばらつきを指示する。
【0274】
次に、ライブラリ内にあるキャリブレーション配列を識別し、カウントした:Y5(10%)539リード、Y6(20%)758リード、Y7(30%)2,119リード及びY8(40%)3,201リード。次に、キャリブレーション配列の観察された割合を、キャリブレーション配列の予想される割合に対してプロットした(図12を参照されたい)。このプロットは、NGSライブラリの定量精度、線形性及び感度を指示し、傾き(9347±1695)及び相関(R2=0.9383)の推定を可能にする。ライブラリ中のキャリブレーション配列の存在量割合の実測値と予想値との間の差、即ち残差は、シーケンシング時の技術的ばらつきを指示する。
【0275】
実施例9:天然遺伝子配列を含むキャリブレーション配列を含むアダプター配列を使用する
本例は、臨床的重要性のある天然遺伝子配列を表すキャリブレーション配列を含むポリヌクレオチドアダプター配列の設計を示す(例えば、図13を参照されたい)。ヒトゲノム(GRCh38.p13)のchr7:140753300~140753372(+)座標からキャリブレーション配列を選択した。この配列は、BRAF遺伝子のコードエクソンに生じる再起突然変異(V600Eとして知られる)と重複する。この突然変異の存在は、癌患者の治療に関して情報を与える。
【0276】
次に、以下のとおりアダプター配列内にこのキャリブレーション配列(Y9)をアセンブルした(ここで、キャリブレーション配列に下線を付す)。
CAAGTGCATAAGGAGATGTTCAAACTGATGGGACCCACTCCATCGAGATTTCTCTGTAGCTAGACCAAAATCACCTATTTTTACTGTGA*T(配列番号102)
【0277】
加えて、Y-アダプターパートナー配列を合成した。
TCACAGTAAAAATAGGTGATTTTGGTCTAGCTACAGAGAAATCTCGATGGAGTGGGTCCCATCAGTTTGAACATCTCCTTATGCACTTG(配列番号105)
【0278】
これらのアダプター配列(配列番号57及び60)を調製し、上記に記載したとおり(実施例8を参照されたい)、Oxford NanoporeシーケンシングのためのDNAサンプルのライブラリ調製時に使用した。上記に記載したとおり(実施例8を参照されたい)、ONTリード内におけるキャリブレーション配列の存在を決定した。以下は、未処理リード配列の例を提供する(Y9キャリブレーション配列に下線を付す(簡潔にするため、クオリティスコアを取り除いてある))。
【化3】
【0279】
試験サンプルDNA配列の3’側にアダプター配列(キャリブレーション配列Y9を含む)が存在するリード配列も識別した。
【化4】
【0280】
キャリブレーション配列の配列が既知であることを所与とすれば、リード中のキャリブレーション配列のエラー率は、ライブラリのシーケンシング精度を指示する。5,863個のリードがBRAF V600Eヌクレオチドを正しく識別する(WT=A)一方、50個のリードは、正しくなく、エラー率は、0.0085%を占めた。これには、ヌクレオチドAミスマッチ(3個のリード)、Cミスマッチ(4個のリード)及び43個の単一ヌクレオチド欠失が含まれており、このライブラリからのシーケンシング精度の指標を提供する。これは、臨床的重要性のある天然配列を表すキャリブレーション配列をライブラリのシーケンシング精度の評価及びシーケンシングプロセスのキャリブレーションにどのように使用し得るかを例示する。
【0281】
実施例10:遺伝的変異をコードするキャリブレーション配列を含むアダプター配列を使用する
本例は、遺伝子変異体を表すキャリブレーション配列を含むポリヌクレオチドアダプター配列の設計及び使用を示す(例えば、図14を参照されたい)。単一の変異体ヌクレオチドの違い(Y10配列は、Gをコードする一方、突然変異体Y11配列は、Cをコードする)を除いて同一である2つの人工的な21ヌクレオチド配列を生成した。アダプター配列は、以下のとおりである(キャリブレーション配列に下線を付し、及び変異体ヌクレオチドは、太字とする)。
Y10A:TAAGGAAGATAGACGCACTCCCACCATTGATGTCCAAAAGT(配列番号108)
Y11A:TAAGGAAGATAGACGCACTCCCACCATTCATGTCCAAAAGT(配列番号111)
【0282】
上記に記載したとおり、アダプター配列中にこれらのキャリブレーション配列をアセンブルした(上記を参照されたい、配列番号108及び111)。これらのアダプター配列を調製し、上記に記載したとおり(実施例8を参照されたい)、Oxford NanoporeシーケンシングのためのDNAサンプルのライブラリ調製時に使用した。上記に記載したとおり(実施例8を参照されたい)、リード配列内におけるキャリブレーション配列の存在を決定した。ここで、未処理リード配列の例示を挙げる(Y11キャリブレーション配列(C変異体をコードする)に下線を付す(簡潔にするため、クオリティスコアを取り除いてある)。
【化5】
【0283】
出力ライブラリ中で2つの参照及び変異体配列のいずれかを含むリードのカウントを測定した。G変異体を含む6,895個のリードが識別された一方、8403個のリードがC変異体を有した。これは、45%のアレル頻度に対応し、ここで、予想されるヘテロ接合遺伝子型頻度(即ち50%)との差は、技術的ばらつきの規模を指示する。この変異体は、遺伝子変異体の検出の評価及び最適化に使用し得る遺伝子変異体のグラウンドトゥルース例も提供する。
【0284】
実施例11:PCR増幅時にアダプター配列を使用する
本例は、PCR増幅及びアンプリコンシーケンシング時に使用されるポリヌクレオチドアダプター配列の設計を示す(図15を参照されたい)。chr7:55191816~55191828(GRCh38.p12)座標から第1のキャリブレーション配列を選択した:
Y12(WT):TTGGGCTGGCCA(配列番号131)
【0285】
次に、この配列を、2個の突然変異(A及びG、EFGR L585突然変異に対応する)を取り込むように修飾し、それによって更なる2つのキャリブレーション配列を生成した:
Y13(A):TTGGGCAGGCCA(配列番号134)
Y14(G):TTGGGCGGGCCA(配列番号137)
【0286】
次に、ヒトゲノムのchr7:55,191,755~55,191,888領域(EGFRエクソンを包含する)に隣接するフォワード及びリバースプライマー配列を選択した。
Fwd:TTCAGGGCATGAACTACTTGG(配列番号121、124及び127)
Rev:TGCCTCCTTCTGCATGGTAT(配列番号130、133及び136)
【0287】
次に、キャリブレーション配列をランダムスペーサー配列及びプライマー配列と共にアセンブルして、以下のとおりのポリヌクレオチドアダプター配列を形成した:
Y12F:TTGGGCTGGCCA-CTGATGCTA-TTCAGGGCATGAACTACTTGG(配列番号s120)
Y13F:TTGGGCGGGCCA-GCATTGCAG-TTCAGGGCATGAACTACTTGG(配列番号123)
Y14F:TTGGGCAGGCCA-TCACTATCC-TTCAGGGCATGAACTACTTGG(配列番号126)
【0288】
次に、上記のポリヌクレオチド配列(配列番号120、123及び126)を合成した(商業的供給業者;GeneArtによる)。次に、ポリヌクレオチドアダプターを以下の相対量(アダプター配列Y12=89%;Y13=10%;Y14=1%)で組み合わせて、アダプター配列の混合物を配合した(Eppendorf Epmotion)。
【0289】
次に、ポリヌクレオチドアダプター配列とヒトゲノムDNAサンプル(NA12878ゲノム、NIST)との混合物を使用して、PCR(Taw DNAポリメラーゼ;New England Bioscience)を実施した。PCRは、以下のサイクル処理パラメータに従って実施した:初期変性;95℃;30秒;30サイクルの95℃;45~68℃;68℃で15秒;20秒;最終伸長68℃で5分;保持4~10℃。得られたアンプリコンを精製し、QIAquick PCR精製キットを製造者の指示に従って使用してサイズ選択した。次に、Agilent 2100バイオアナライザーを使用してアンプリコンDNA産物を確かめ、それを、Illumina TruSeqライブラリ調製キット(製造者の指示に従う)を使用したライブラリ調製の入力DNAとして使用した。次に、ライブラリを製造者の指示に従ってシーケンシングした(Illumina(登録商標)NextSeq)。
【0290】
次に、上記に記載したとおり、出力ライブラリ(.FASTQ)中におけるシーケンシングリード内のキャリブレーション配列を識別した(実施例1を参照されたい)。未処理リード配列の例を以下に示す(Y12キャリブレーション配列に下線を付す)。
【化6】
【0291】
キャリブレーション配列の配列が既知であることを所与とすれば、リード中のキャリブレーション配列のエラー率は、ライブラリのシーケンシング精度を指示する。95,616リード(90.7%)がEGFR WTヌクレオチド配列を正しく識別した一方、9,032(8.5%)がA変異体を識別したのに対して、743リード(0.7%)がG変異体を識別した。これは、ライブラリがEFGR L585を検出する感度及び定量的精度を指示する。この変異体は、体細胞遺伝子変異体の検出の評価及び最適化に使用し得る遺伝子変異体のグラウンドトゥルース例も提供する。
【0292】
当業者によれば、本開示の広義の一般的な範囲から逸脱することなく、上述の実施形態に対する多くの変形形態及び/又は修正形態がなされ得ることが理解されるであろう。従って、本実施形態は、あらゆる点で例示的であり、限定的ではないと見なされる。
【0293】
本明細書において考察及び/又は参照される刊行物の全ては、全体として本明細書に援用される。
【0294】
本明細書に掲載した文献、行為、材料、装置、物品などに関するいずれの考察も、それが添付の特許請求の範囲の各請求項の優先日より前に存在したことに伴い、それらの事項の一部又は全てが先行技術基盤の一部を成す又は本開示が関係する分野の技術常識であったと認めるものと解釈されてはならない。
【0295】
本発明は、以下の記載事項の1つ以上により説明され得る。
【0296】
記載事項1.2つ以上のキャリブレーション配列を含む単離ポリヌクレオチド配列であって、キャリブレーション配列は、それぞれ独立に、天然に存在するポリヌクレオチド配列を表し、キャリブレーション配列は、天然に存在するいかなるゲノムにも見られない配置においてポリヌクレオチド配列内で連続して配置される、単離ポリヌクレオチド配列。
【0297】
記載事項2.キャリブレーション配列の1つ以上は、ポリヌクレオチド配列内に2つ以上のコピー数で存在する、記載事項1のポリヌクレオチド配列。
【0298】
記載事項3.第1のキャリブレーション配列は、エクソン、イントロン、遺伝子、アレル、染色体又はゲノム配列を表し、第2のキャリブレーション配列は、第1のキャリブレーション配列と異なり、及び独立に、異なるエクソン、イントロン、遺伝子、アレル、染色体又はゲノム配列を表す、記載事項1又は2のポリヌクレオチド配列。
【0299】
記載事項4.第2のキャリブレーション配列は、第1のキャリブレーション配列の変異体を表す、記載事項3のポリヌクレオチド配列。
【0300】
記載事項5.第2のキャリブレーション配列は、第1のキャリブレーション配列と少なくとも90%同一である、記載事項4のポリヌクレオチド配列。
【0301】
記載事項6.変異体は、第1のキャリブレーション配列と比較して、1つ以上のSNP、1つ以上の挿入、1つ以上の欠失、1つ以上のマイクロサテライト、多塩基多型、1つ以上のデュプリケーション、1つ以上のタンデムリピート数変異体、1つ以上の逆位、1つ以上のトランジション、1つ以上のトランスバージョン及び/又は1つ以上の転座を含む、記載事項5のポリヌクレオチド配列。
【0302】
記載事項7.第1のキャリブレーション配列及び/又は第2のキャリブレーション配列は、癌、遺伝性疾患、病原体、薬物耐性、循環腫瘍DNA、循環胎児DNA、循環母体DNA又は他の目的とする属性のいずれか1つ以上を示す、記載事項3~6のいずれか一項のポリヌクレオチド配列。
【0303】
記載事項8.2つ以上のコピー数は、キャリブレーション配列によって表される天然に存在する配列の天然に存在する頻度を再現するように選択される、記載事項2~7のいずれか一項のポリヌクレオチド配列。
【0304】
記載事項9.2つ以上のコピー数は、天然に存在するヒトポリヌクレオチド配列のホモ接合性、ヘテロ接合性及び/又は体細胞性アレル頻度のいずれか1つ以上を再現するように選択される、記載事項8のポリヌクレオチド配列。
【0305】
記載事項10.2つ以上のコピー数は、ゲノム存在量、染色体存在量、遺伝子発現レベル、アイソフォーム発現レベル、変異体アレル頻度、ホモ接合遺伝子型、ヘテロ接合遺伝子型、体細胞突然変異頻度、コピー数変異、遺伝子増幅、遺伝子欠失、トリソミー、染色体異数性、微生物存在量、ウイルス存在量又は各種のmRNA発現レベルのいずれか1つ以上を再現するように選択される、記載事項8のポリヌクレオチド配列。
【0306】
記載事項11.一方のキャリブレーション配列は、母系由来のポリヌクレオチドを表し、及びもう一方のキャリブレーション配列は、父系由来のポリヌクレオチドを表す、記載事項1~10のいずれか一項のポリヌクレオチド配列。
【0307】
記載事項12.天然に存在するポリヌクレオチド配列は、ヒト、原核生物、細菌、ウイルス、ファージ又は細胞小器官ゲノムに由来する、記載事項1~11のいずれか一項のポリヌクレオチド配列。
【0308】
記載事項13.キャリブレーション配列は、独立に、18ヌクレオチド長~20,000ヌクレオチド長である、記載事項1~12のいずれか一項のポリヌクレオチド配列。
【0309】
記載事項14.キャリブレーション配列は、独立に、100ヌクレオチド長~2,000ヌクレオチド長である、記載事項13のポリヌクレオチド配列。
【0310】
記載事項15.キャリブレーション配列の2つ以上は、スペーサー配列によって隔てられる、記載事項1~14のいずれか一項のポリヌクレオチド配列。
【0311】
記載事項16.キャリブレーション配列の1つ以上の5’側及び/又は3’側に位置する1つ以上のフランキング又は末端配列を含む、記載事項1~15のいずれか一項のポリヌクレオチド配列。
【0312】
記載事項17.キャリブレーション配列の2つ以上は、ポリヌクレオチド配列内で連続して配置される、記載事項1~14のいずれか一項のポリヌクレオチド配列。
【0313】
記載事項18.キャリブレーション配列の少なくとも2つは、異なるヌクレオチド長のものである、記載事項1~17のいずれか一項のポリヌクレオチド配列。
【0314】
記載事項19.DNA又はRNAポリヌクレオチド配列である、記載事項1~18のいずれか一項のポリヌクレオチド配列。
【0315】
記載事項20.5’プロモーター;フランキング(3’及び5’)エンドヌクレアーゼ部位;及び3’ポリアデニンリピートトラクトのいずれか1つ以上に作動可能に連結されている、記載事項1~19のいずれか一項のポリヌクレオチド配列をコードするDNA配列を含むベクター。
【0316】
記載事項21.記載事項1~19のいずれか一項のポリヌクレオチド配列を作成する方法であって、2つ以上のキャリブレーション配列を提供し、及びライゲートすることを含み;任意選択で、存在する場合、フランキング若しくは末端配列及び/又はスペーサー配列を提供し、及びライゲートすることを更に含む方法。
【0317】
記載事項22.記載事項1~19のいずれか一項の2つ以上のポリヌクレオチド配列を含む組成物。
【0318】
記載事項23.循環DNA検出方法をキャリブレーションするためのポリヌクレオチドを提供する方法であって、記載事項1~19のいずれか一項のポリヌクレオチド配列を断片化して、1つ以上のポリヌクレオチド断片を作製することを含み、この1つ以上のポリヌクレオチド断片は、循環DNA検出方法のキャリブレーションに好適である、方法。
【0319】
記載事項24.RNAシーケンシング方法をキャリブレーションするためのポリヌクレオチドを提供する方法であって、DNAポリヌクレオチド配列である、記載事項1~19のいずれか一項のポリヌクレオチド配列のインビトロ転写を実施して、1つ以上のRNA断片を作製することを含み、この1つ以上のRNA断片は、RNAシーケンシング方法のキャリブレーションに好適である、方法。
【0320】
記載事項25.ポリヌクレオチドシーケンシングプロセスをキャリブレーションする方法であって、
i)記載事項1~19のいずれか一項のポリヌクレオチド配列を所与の組のパラメータ下でポリヌクレオチドシーケンシングプロセスに供すること;
ii)i)で実施されたシーケンシングプロセスによって決定されるとおりのキャリブレーション配列の配列を記録すること;
iii)ii)で記録されたキャリブレーション配列の配列を、記載事項1~19のいずれか一項のポリヌクレオチド配列中のそれぞれのキャリブレーション配列の既知の配列と比較すること;及び
iv)目的とするポリヌクレオチドを含むサンプルを、同じ組のパラメータ下において、i)で実施された同じシーケンシングプロセスに供すること
を含み、iii)における配列決定の精度は、iv)における配列決定をキャリブレーションするために使用される、方法。
【0321】
記載事項26.iv)における定量化プロセスは、記載事項1~19のいずれか一項のポリヌクレオチド配列の非存在下で実施される、記載事項25の方法。
【0322】
記載事項27.ポリヌクレオチド定量化プロセスをキャリブレーションする方法であって、
i)記載事項1~19のいずれか一項のポリヌクレオチド配列を所与の組のパラメータ下でポリヌクレオチド定量化プロセスに供すること;
ii)i)で実施された定量化プロセスによって決定されるとおりのキャリブレーション配列の分量を記録すること;
iii)ii)で記録されたキャリブレーション配列の分量を、記載事項1~15のいずれか一項のポリヌクレオチド配列中のそれぞれのキャリブレーション配列の既知の分量と比較すること;及び
iv)目的とするポリヌクレオチドを含むサンプルを、同じ組のパラメータ下において、i)で実施された同じ定量化プロセスに供すること
を含み、iii)における分量決定の精度は、iv)における分量決定をキャリブレーションするために使用される、方法。
【0323】
記載事項28.iv)における定量化プロセスは、記載事項1~19のいずれか一項のポリヌクレオチド配列の非存在下で実施される、記載事項27の方法。
【0324】
記載事項29.標的DNAエンリッチメントプロセスをキャリブレーションする方法であって、
i)記載事項1~19のいずれか一項のポリヌクレオチド配列を、ハイブリダイゼーションを可能にする条件下で略相補的な配列のオリゴヌクレオチドと組み合わせること;
ii)ポリヌクレオチド配列にハイブリダイズされたオリゴヌクレオチドをエンリッチすること;
iii)ii)でエンリッチされたポリヌクレオチドを所与の組のパラメータ下でシーケンシングすること;
iv)iii)で決定されたポリヌクレオチド配列をポリヌクレオチド配列の既知の配列と比較すること;及び
v)ii)でエンリッチされたオリゴヌクレオチドをiii)における同じ組のパラメータ下でシーケンシングすること
を含み、iv)における配列決定の精度は、v)における配列決定をキャリブレーションするために使用される、方法。
【0325】
記載事項30.標的DNAエンリッチメントプロセスをキャリブレーションする方法であって、
i)既知の分量の、記載事項1~19のいずれか一項のポリヌクレオチド配列を、ハイブリダイゼーションを可能にする条件下で略相補的な配列のオリゴヌクレオチドと組み合わせること;
ii)ポリヌクレオチド配列にハイブリダイズされたオリゴヌクレオチドをエンリッチすること;
iii)ii)でエンリッチされたポリヌクレオチドを所与の組のパラメータ下で定量化すること;
iv)iii)で決定されたポリヌクレオチド分量をi)におけるポリヌクレオチド配列の既知の分量と比較すること;及び
v)ii)でエンリッチされたオリゴヌクレオチドをiii)における同じ組のパラメータ下で定量化すること
を含み、iv)における分量決定の精度は、v)における分量決定をキャリブレーションするために使用される、方法。
【0326】
記載事項31.ポリヌクレオチドシーケンシング及び/又は定量化プロセスをキャリブレーションするための、記載事項1~19のいずれか一項のポリヌクレオチド配列の使用。
【0327】
記載事項32.記載事項1~19のいずれか一項のポリヌクレオチド配列と、ポリヌクレオチド配列を断片化する能力を有する1つ以上のヌクレアーゼ酵素とを含むキット。
【0328】
記載事項33.キャリブレーション配列とプライマー配列とを含む単離ポリヌクレオチドアダプター配列。
【0329】
記載事項34.ポリヌクレオチド合成が容易となるように、プライマー配列は、相補的ポリヌクレオチド配列への結合能を有する、記載事項33のアダプター配列。
【0330】
記載事項35.アダプター配列に存在するプライマー配列は、複製しようとするポリヌクレオチドを含有するサンプルに加えることが可能な別個のプライマー配列に相補的である、記載事項34のアダプター配列。
【0331】
記載事項36.キャリブレーション配列は、アダプター配列に存在するプライマー配列の3’側に位置する、記載事項35のアダプター配列。
【0332】
記載事項37.アダプター配列に存在するプライマー配列は、複製しようとする標的ポリヌクレオチドの一部分に相補的である、記載事項34のアダプター配列。
【0333】
記載事項38.キャリブレーション配列は、アダプター配列に存在するプライマー配列の5’側に位置する、記載事項37のアダプター配列。
【0334】
記載事項39.プライマー配列は、ユニバーサルプライマー配列に相補的であるか、又はユニバーサルプライマー配列を含む、記載事項33~38のいずれか一項のアダプター配列。
【0335】
記載事項40.フローセルDNA配列に相補的な配列;複製しようとするポリヌクレオチドを含有するサンプルの識別情報を指示するインデックス配列;及び個々のアダプター配列の識別情報を指示する一意の分子識別子(UMI)配列のいずれか1つ以上を更に含む、記載事項33~39のいずれか一項のアダプター配列。
【0336】
記載事項41.キャリブレーション配列は、天然に存在するポリヌクレオチド配列を表す、記載事項33~40のいずれか一項のアダプター配列。
【0337】
記載事項42.キャリブレーション配列は、エクソン、イントロン、コード、非コード、遺伝子、染色体、アレル、ゲノム、トランスクリプトーム、リピート及び/又は変異体遺伝子配列を表す、記載事項33~41のいずれか一項のアダプター配列。
【0338】
記載事項43.キャリブレーション配列は、ヌクレオチドトランジション、トランスバージョン、ヘテロ接合突然変異、ホモ接合突然変異、体細胞突然変異、挿入、欠失、大規模構造変異、逆位、転座、タンデムデュプリケーション及びコピー数変異のいずれか1つ以上から選択される遺伝的変異配列を表す、記載事項33~42のいずれか一項のアダプター配列。
【0339】
記載事項44.キャリブレーション配列は、癌、遺伝性疾患、病原体、薬物耐性、循環腫瘍DNA、循環胎児DNA、循環母体DNA又は他の目的とする属性のいずれか1つ以上を示す配列を表す、記載事項33~43のいずれか一項のアダプター配列。
【0340】
記載事項45.キャリブレーション配列は、天然ゲノム又はトランスクリプトーム配列から選択される配列とその全長にわたって100%未満の配列同一性を有する人工ポリヌクレオチド配列である、記載事項33~44のいずれか一項のアダプター配列。
【0341】
記載事項46.キャリブレーション配列は、天然に存在する遺伝子配列を選択することと、前記天然に存在する遺伝子配列を、1つ以上のヌクレオチドの逆位、シャッフリング、挿入、欠失又は置換のいずれか1つ以上によって修飾して、天然に存在する配列との配列同一性を100%から低下させることとによって作製される、記載事項45のアダプター配列。
【0342】
記載事項47.キャリブレーション配列は、3回より多く連続して繰り返される単一ヌクレオチド;キャリブレーション配列の長さの少なくとも70%のG又はCヌクレオチド;及びキャリブレーション配列の長さの少なくとも70%のA又はTヌクレオチドのいずれか1つ以上を含む、記載事項33~46のいずれか一項のアダプター配列。
【0343】
記載事項48.一本鎖又は二本鎖ポリヌクレオチド配列である、記載事項33~47のいずれか一項のアダプター配列。
【0344】
記載事項49.DNA又はRNAポリヌクレオチド配列である、記載事項33~48のいずれか一項のアダプター配列。
【0345】
記載事項50.2つ以上のキャリブレーション配列を含む、記載事項33~49のいずれか一項のアダプター配列。
【0346】
記載事項51.第1のキャリブレーション配列及び第2のキャリブレーション配列を含み、第2のキャリブレーション配列は、第1のキャリブレーション配列の逆相補体である、記載事項33~50のいずれか一項のアダプター配列。
【0347】
記載事項52.第1及び第2のキャリブレーション配列を含み、第2のキャリブレーション配列は、第1のキャリブレーション配列の変異体である、記載事項33~51のいずれか一項のアダプター配列。
【0348】
記載事項53.1つ以上のキャリブレーション配列の2つ以上のコピー数を含む、記載事項33~52のいずれか一項のアダプター配列。
【0349】
記載事項54.アダプター配列及び/又はキャリブレーション配列の最後の3’末端ヌクレオチドは、チミンである、記載事項33~53のいずれか一項のアダプター配列。
【0350】
記載事項55.キャリブレーション配列は、アダプター配列の長さの少なくとも10%を占める、記載事項33~54のいずれか一項のアダプター配列。
【0351】
記載事項56.キャリブレーション配列は、9~10,000ヌクレオチド長である、記載事項33~55のいずれか一項のアダプター配列。
【0352】
記載事項57.記載事項33~56のいずれか一項の1つ以上のアダプター配列を含む組成物。
【0353】
記載事項58.少なくとも2つの異なるアダプター配列を含む、記載事項57の組成物。
【0354】
記載事項59.異なるアダプター配列は、組成物中に異なる分量で存在する、記載事項58の組成物。
【0355】
記載事項60.異なるアダプター配列の異なる分量の比は、既知の、一定の、整数の及び/又は対数の比である、記載事項59の組成物。
【0356】
記載事項61.第1のキャリブレーション配列を有する第1のアダプター配列と、第2のキャリブレーション配列を有する第2のアダプター配列とを含み、第1のアダプター配列と第2のアダプター配列との分量の比は、1:1又は1:2である、記載事項57~60のいずれか一項の組成物。
【0357】
記載事項62.液体担体を更に含む、記載事項57~61のいずれか一項の組成物。
【0358】
記載事項63.記載事項57~62のいずれか一項の組成物を含む容器。
【0359】
記載事項64.記載事項33~56のいずれか一項のアダプター配列を含むベクター。
【0360】
記載事項65.記載事項33~56のいずれか一項の1つ以上のアダプター配列又は記載事項57~62のいずれか一項の組成物と、リガーゼ酵素及び/又はトランスポザーゼ酵素及び/又は1つ以上の別個のオリゴヌクレオチドプライマーとを含むキット。
【0361】
記載事項66.1つ以上の別個のオリゴヌクレオチドプライマーは、キットに存在するポリヌクレオチドアダプター配列中のプライマー配列に相補的又は略相補的である、記載事項65のキット。
【0362】
記載事項67.記載事項33~56のいずれか一項のアダプター配列を作成する方法であって、エンドヌクレアーゼ消化によるか、又は記載事項64のベクターからアダプター配列を増幅することによるか、又は記載事項64のベクター内に含まれるアダプター配列を転写することにより、記載事項64のベクターからアダプター配列を切り出すことを含む方法。
【0363】
記載事項68.標的ポリヌクレオチドを含むサンプルをシーケンシング又は定量化プロセスのために調製する方法であって、記載事項33~56のいずれか一項のポリヌクレオチドアダプター配列を標的ポリヌクレオチドの5’末端に取り付けるステップを含む方法。
【0364】
記載事項69.取り付けるステップは、ポリヌクレオチドアダプター配列の3’ヒドロキシル基と標的ポリヌクレオチドの5’ヒドロキシル基との間にリン酸ジエステル結合を形成することを含む、記載事項68の方法。
【0365】
記載事項70.取り付けるステップは、記載事項33~56のいずれか一項のポリヌクレオチドアダプター配列をライゲーション、転位又はプライマー伸長のプロセスによって標的ポリヌクレオチドの5’末端に取り付けることを含む、記載事項68又は69の方法。
【0366】
記載事項71.リガーゼ酵素又はトランスポザーゼ酵素を含む、記載事項70の方法。
【0367】
記載事項72.標的ポリヌクレオチドを含むサンプルをシーケンシング又は定量化プロセスのために調製する方法であって、ポリヌクレオチドアダプター配列中のプライマー配列が標的ポリヌクレオチドの相補的な一部分に結合することを可能にするのに好適な条件下において、標的ポリヌクレオチドを、記載事項37若しくは38又は記載事項37若しくは38に従属しているときの記載事項39~56のいずれか一項のポリヌクレオチドアダプター配列と接触させることを含む方法。
【0368】
記載事項73.標的ポリヌクレオチドは、DNAポリヌクレオチドである、記載事項68~72のいずれか一項の方法。
【0369】
記載事項74.ポリヌクレオチドシーケンシング及び/又は定量化プロセスをキャリブレーションするための、記載事項33~56のいずれか一項のポリヌクレオチドアダプター配列又は記載事項56~62のいずれか一項の組成物の使用。
【0370】
記載事項75.ポリヌクレオチドシーケンシングプロセスをキャリブレーションする方法であって、
i)配列を決定しようとする標的ポリヌクレオチドを含むサンプルに、ポリヌクレオチドアダプター配列を標的ポリヌクレオチドの5’及び/又は3’末端に取り付けることを可能にする条件下において、記載事項33~56のいずれか一項のアダプター配列又は記載事項57~62のいずれか一項の組成物を加えること;
ii)標的ポリヌクレオチドを増幅すること;
iii)標的ポリヌクレオチドの配列を決定すること;
iv)アダプター配列中のキャリブレーション配列の配列を決定すること;及び
v)iv)で決定された配列を元のキャリブレーション配列と比較すること
を含み、iv)における配列決定の精度は、iii)における配列決定をキャリブレーションするために使用される、方法。
【0371】
記載事項76.ポリヌクレオチドシーケンシングプロセスをキャリブレーションする方法であって、
i)配列を決定しようとする標的ポリヌクレオチドを含むサンプルに、ポリヌクレオチドアダプター配列中のプライマー配列が標的ポリヌクレオチドの相補的な一部分に結合することを可能にする条件下において、記載事項37若しくは38又は記載事項37若しくは38に従属しているときの記載事項39~56のいずれか一項のアダプター配列又はそれを含む組成物を加えること;
ii)標的ポリヌクレオチドを増幅すること;
iii)標的ポリヌクレオチドの配列を決定すること;
iv)アダプター配列中のキャリブレーション配列の配列を決定すること;及び
v)iv)で決定された配列を元のキャリブレーション配列と比較すること
を含み、iv)における配列決定の精度は、iii)における配列決定をキャリブレーションするために使用される、方法。
【0372】
記載事項77.ポリヌクレオチド定量化プロセスをキャリブレーションする方法であって、
i)分量を決定しようとする標的ポリヌクレオチドを含むサンプルに、アダプター配列を標的ポリヌクレオチドの5’及び/又は3’末端に取り付けることを可能にする条件下において、既知の量の、記載事項33~56のいずれか一項のアダプター配列又は記載事項57~62のいずれか一項の組成物を加えること;
ii)標的ポリヌクレオチドを増幅すること;
iii)標的ポリヌクレオチドの分量を決定すること;
iv)アダプター配列中のキャリブレーション配列の分量を決定すること;及び
v)iv)で決定された分量をi)におけるアダプター配列中のキャリブレーション配列の既知の量と比較すること
を含み、iv)における分量決定の精度は、iii)における分量決定をキャリブレーションするために使用される、方法。
【0373】
記載事項78.ポリヌクレオチド定量化プロセスをキャリブレーションする方法であって、
i)分量を決定しようとする標的ポリヌクレオチドを含むサンプルに、ポリヌクレオチドアダプター配列中のプライマー配列が標的ポリヌクレオチドの相補的な一部分に結合することを可能にする条件下において、既知の量の、記載事項37若しくは38又は記載事項37若しくは38に従属しているときの記載事項39~56のいずれか一項のアダプター配列又はそれを含む組成物を加えること;
ii)標的ポリヌクレオチドを増幅すること;
iii)標的ポリヌクレオチドの分量を決定すること;
iv)アダプター配列中のキャリブレーション配列の分量を決定すること;及び
v)iv)で決定された分量をi)におけるアダプター配列中のキャリブレーション配列の既知の量と比較すること
を含み、iv)における分量決定の精度は、iii)における分量決定をキャリブレーションするために使用される、方法。
【0374】
記載事項79.i)で加えられる少なくとも1つのアダプター配列は、2つ以上のキャリブレーション配列を含み、iv)は、各キャリブレーション配列の分量を決定することを含む、記載事項77又は78の方法。
【0375】
記載事項80.ポリメラーゼ連鎖反応増幅、DNA合成、DNAシーケンシング、RNAシーケンシング、逆転写及び相補性cDNAシーケンシングのいずれか1つ以上を含む、記載事項75~79のいずれか一項の方法。
【0376】
記載事項81.シングルエンド、ペアエンド、ショートリード、ロングリード、シーケンスバイシンセシス及びナノポアシーケンシングのいずれか1つ以上を含む、記載事項75~80のいずれか一項の方法。
【0377】
記載事項82.標的ポリヌクレオチド及び/又はアダプター配列は、DNA又はRNAポリヌクレオチドである、記載事項75~81のいずれか一項の方法。
【0378】
記載事項83.疾患又は感染を引き起こすか、又はその存在若しくはそれに罹り易い素因を指示する遺伝子配列の同定を含む、記載事項75~81のいずれか一項の方法。
【0379】
記載事項84.サンプルが採取された対象における疾患又は病態又は感染の診断を含む、記載事項75~83のいずれか一項の方法。
【0380】
記載事項85.疾患は、癌であり、及び/又は感染は、微小生物による感染であり、及び/又は対象は、ヒトである、記載事項84の方法。
【0381】
参考文献:
・Baker, S.C. et al. The External RNA Controls Consortium: a progress report. Nat Methods 2, 731-4 (2005).
・Bentley, D.R. et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature 456, 53-9 (2008).
・Bernstein, B.E. et al. Genomic maps and comparative analysis of histone modifications in human and mouse. Cell 120, 169-81 (2005).
・Bray, N., Pimentel, H., Melsted, P. et al. Near-optimal probabilistic RNA-seq quantification. Nat Biotechnol 34, 525-527 (2016).
・Clarke, J. et al. Continuous base identification for single-molecule nanopore DNA sequencing. Nat Nanotechnol 4, 265-70 (2009).
・Consortium, E. (2005).“Proposed methods for testing and selecting the ERCC external RNA controls.”BMC Genomics 6: 150.
・Edwards, R.A. et al. Using pyrosequencing to shed light on deep mine microbial ecology. BMC Genomics 7, 57 (2006).
・Eid, J. et al. Real-time DNA sequencing from single polymerase molecules. Science 323, 133-8 (2009).
・Jiang, L. et al. Synthetic spike-in standards for RNA-seq experiments. Genome Res 21, 1543-51 (2011).
・Johnson, D.S., Mortazavi, A., Myers, R.M. & Wold, B. Genome-wide mapping of in vivo protein-DNA interactions. Science 316, 1497-502 (2007).
・Koboldt DC, Zhang Q, Larson DE, et al. VarScan 2: somatic mutation and copy number alteration discovery in cancer by exome sequencing. Genome Res. (2012);22(3):568-576.
・Lapin, Morten et al.“Fragment size and level of cell-free DNA provide prognostic information in patients with advanced pancreatic cancer.”Journal of translational medicine vol. 16,1 300; 6 Nov. 2018.
・Li, H. and R. Durbin (2009).“Fast and accurate short read alignment with Burrows-Wheeler transform.”Bioinformatics 25(14): 1754-1760.
・Li H. (2013) Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv:1303.3997v1 [q-bio.GN].
・Lieberman-Aiden, E. et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science 326, 289-93 (2009).
・Mortazavi, A., Williams, B.A., McCue, K., Schaeffer, L. & Wold, B. Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods 5, 621-8 (2008).
・Ronaghi, M., Uhlen, M. & Nyren, P. A sequencing method based on real-time pyrophosphate. Science 281, 363, 365 (1998).
・Rothberg, J.M. et al. An integrated semiconductor device enabling non-optical genome sequencing. Nature 475, 348-52 (2011).
・Zook, J.M. et al. Integrating human sequence data sets provides a resource of benchmark SNP and indel genotype calls. Nat Biotechnol 32, 246-51 (2014).
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
【配列表】
2023513725000001.app
【国際調査報告】