IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イルミナ・ケンブリッジ・リミテッドの特許一覧

特表2024-512122アダプター二量体検出を用いる核酸ライブラリシーケンシング技術
<>
  • 特表-アダプター二量体検出を用いる核酸ライブラリシーケンシング技術 図1
  • 特表-アダプター二量体検出を用いる核酸ライブラリシーケンシング技術 図2
  • 特表-アダプター二量体検出を用いる核酸ライブラリシーケンシング技術 図3
  • 特表-アダプター二量体検出を用いる核酸ライブラリシーケンシング技術 図4
  • 特表-アダプター二量体検出を用いる核酸ライブラリシーケンシング技術 図5
  • 特表-アダプター二量体検出を用いる核酸ライブラリシーケンシング技術 図6
  • 特表-アダプター二量体検出を用いる核酸ライブラリシーケンシング技術 図7
  • 特表-アダプター二量体検出を用いる核酸ライブラリシーケンシング技術 図8
  • 特表-アダプター二量体検出を用いる核酸ライブラリシーケンシング技術 図9
  • 特表-アダプター二量体検出を用いる核酸ライブラリシーケンシング技術 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-18
(54)【発明の名称】アダプター二量体検出を用いる核酸ライブラリシーケンシング技術
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20240311BHJP
   C40B 40/08 20060101ALI20240311BHJP
   C12M 1/00 20060101ALI20240311BHJP
   C12N 15/54 20060101ALN20240311BHJP
   C12N 15/11 20060101ALN20240311BHJP
【FI】
C12Q1/6869 Z ZNA
C40B40/08
C12M1/00 A
C12N15/54
C12N15/11 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023560147
(86)(22)【出願日】2022-03-31
(85)【翻訳文提出日】2023-09-28
(86)【国際出願番号】 EP2022058598
(87)【国際公開番号】W WO2022207804
(87)【国際公開日】2022-10-06
(31)【優先権主張番号】63/168,762
(32)【優先日】2021-03-31
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】519436884
【氏名又は名称】イルミナ・ケンブリッジ・リミテッド
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】カルラ・サンマーティン
(72)【発明者】
【氏名】イザベル・ラソロンジャトヴォ
(72)【発明者】
【氏名】アンドレア・サボット
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA23
4B063QA13
4B063QQ42
4B063QR08
4B063QR42
4B063QR62
4B063QS24
4B063QX01
(57)【要約】
ライブラリ品質管理メトリックを用いたライブラリシーケンシング技術が記載される。核酸シーケンシングライブラリの断片中の共通アダプター配列に相補的なシーケンシングプライマーを使用した配列データ。シーケンシングプライマーは、断片インサートとの接合部における共通アダプター配列の3’末端ヌクレオチドを除外する。この除外は、シーケンシングライブラリに存在する任意のアダプター二量体における不一致領域を回避し、配列データは、品質管理メトリックを生成するために使用されるアダプター二量体配列データを含む。
【特許請求の範囲】
【請求項1】
核酸ライブラリを特徴付ける方法であって、
シーケンシングプライマーを使用して核酸ライブラリをシーケンシングして、前記核酸ライブラリの断片及びアダプター二量体シーケンシングデータを表す試料シーケンシングデータを生成する工程であり、前記核酸ライブラリの個々の断片が、第1のアダプターに隣接する試料インサートを含み、前記核酸ライブラリの個々のアダプター二量体が、接合部で互いに直接連結された第2のアダプターを含み、前記第1のアダプター及び前記第2のアダプターが同じ配列を有し、前記シーケンシングプライマーが前記同じ配列の一部と同一であり、前記個々のアダプター二量体が前記接合部に不一致領域を含み、前記シーケンシングプライマーが、前記個々のアダプター二量体の鎖に結合した場合、前記接合部の5’である3’末端を有する工程、及び
前記アダプター二量体シーケンシングデータに基づいて前記核酸ライブラリの品質メトリックを決定する工程を含む、方法。
【請求項2】
前記核酸ライブラリをシーケンシングする工程が、不一致非許容性ポリメラーゼを使用することを含む、請求項1に記載の方法。
【請求項3】
前記不一致非許容性ポリメラーゼが、配列番号1の配列を有するポリメラーゼである、請求項2に記載の方法。
【請求項4】
前記不一致非許容性ポリメラーゼがpol812である、請求項2に記載の方法。
【請求項5】
前記品質メトリックを生成するために前記核酸ライブラリがシーケンシングされるという入力を受信する工程、及び前記品質メトリックを生成するシーケンシングデバイスの動作モードを選択する工程を含む、請求項1に記載の方法。
【請求項6】
前記シーケンシングプライマーが配列番号2の配列を有する、請求項1に記載の方法。
【請求項7】
前記シーケンシングプライマーが配列番号2のヌクレオチド3’を有さない、請求項6に記載の方法。
【請求項8】
前記シーケンシングプライマーが配列番号3の配列を有する、請求項1に記載の方法。
【請求項9】
前記シーケンシングプライマーが配列番号3のヌクレオチド3’を有さない、請求項8に記載の方法。
【請求項10】
前記核酸ライブラリをシーケンシングする工程が更なるシーケンシングプライマーを使用することを含み、前記シーケンシングプライマーが前記個々の断片の第1の鎖をシーケンシングするために使用され、前記更なるシーケンシングプライマーが前記個々の断片のリバース鎖をシーケンシングするために使用される、請求項1に記載の方法。
【請求項11】
前記核酸ライブラリをシーケンシングする工程が更なるシーケンシングプライマーを使用することを含み、前記更なるシーケンシングプライマーが同じ前記配列の異なる部分と同一である、請求項1に記載の方法。
【請求項12】
前記シーケンシングプライマーが、前記試料インサートから少なくとも1つのヌクレオチド離れた前記第1のアダプター上の位置に相補的である、請求項1に記載の方法。
【請求項13】
前記シーケンシングプライマーが、前記試料インサートから1~3ヌクレオチド離れた前記第1のアダプター上の位置に相補的である、請求項12に記載の方法。
【請求項14】
核酸ライブラリを特徴付ける方法であって、
シーケンシングデバイスにおいて、複数の核酸ライブラリのプールのシーケンシングランがアダプター二量体品質管理シーケンシングランであるという入力を受信する工程、
前記シーケンシングデバイスに、前記複数の核酸ライブラリの断片中の共通アダプター配列に相補的であり、断片インサートとの接合部における前記共通アダプター配列の3’末端ヌクレオチドを除外するシーケンシングプライマーを使用して、前記プールから配列データを生成させる工程、
各個々の核酸ライブラリについて品質メトリックを計算する工程であり、前記品質メトリックが、各個々の核酸ライブラリ中のアダプター二量体のパーセンテージを含む工程、及び
仕様限界を上回るアダプター二量体のパーセンテージを有する前記複数の核酸ライブラリの核酸ライブラリのサブセットを同定する工程を含む、方法。
【請求項15】
前記シーケンシングプライマーが、前記複数の核酸ライブラリの前記断片中の前記断片インサートの5’の3ヌクレオチド以内で終結する、請求項14に記載の方法。
【請求項16】
前記シーケンシングランがペアエンドシーケンシングランであり、前記配列データが更なるシーケンシングプライマーを使用して生成される、請求項14に記載の方法。
【請求項17】
前記共通アダプター配列の前記3’末端ヌクレオチドがTである、請求項14に記載の方法。
【請求項18】
前記品質メトリックが重複リードのパーセンテージを更に含み、重複リードパーセントの仕様上限が10%である、請求項14に記載の方法。
【請求項19】
前記同定されたサブセット中の核酸ライブラリを再調整する工程を含む、請求項14に記載の方法。
【請求項20】
前記品質メトリックに基づいて前記複数の核酸ライブラリの各核酸ライブラリのDNA濃度を推定する工程を含み、前記品質メトリックが%変動係数を更に含む、請求項14に記載の方法。
【請求項21】
シーケンシングデバイスであって、
複数の核酸ライブラリのプール、及び前記複数の核酸ライブラリの断片中の共通アダプター配列に相補的であり、断片インサートとの接合部で前記共通アダプター配列の3’末端ヌクレオチドを除外するシーケンシングプライマーをロードしたフローセル、及び
コンピュータであって、
前記プールのシーケンシングランがアダプター二量体品質管理シーケンシングランであるという入力を受信し、
前記シーケンシングデバイスに、前記シーケンシングプライマーを使用して前記プールから配列データを生成させ、
各個々の核酸ライブラリについて品質メトリックを計算して、各個々の核酸ライブラリ中のアダプター二量体のパーセンテージを決定し、
仕様限界を上回るアダプター二量体のパーセンテージを有する前記複数の核酸ライブラリの核酸ライブラリのサブセットを同定するようにプログラムされたコンピュータを含む、シーケンシングデバイス。
【請求項22】
前記同定されたサブセット及び前記品質メトリックを表示するディスプレイを備える、請求項21に記載のシーケンシングデバイス。
【請求項23】
前記コンピュータが、前記同定されたサブセットに関連する通知を生成するようにプログラムされている、請求項21に記載のシーケンシングデバイス。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、「NUCLEIC ACID LIBRARY SEQUENCING TECHNIQUES WITH ADAPTER DIMER DETECTION」と題され、2021年3月31日に出願された米国仮出願第63/168,762号の優先権及び利益を主張し、その開示は、あらゆる目的のためにその全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
開示される技術は、一般に、核酸シーケンシング技術に関する。特に、開示される技術は、ライブラリ調製中に形成されたアダプター二量体の検出及び/又は特徴付けを含む核酸シーケンシングのためのシーケンシングワークフローに関する。
【0003】
このセクションで考察される主題は、単にこのセクションにおける言及の結果として、先行技術であると想定されるべきではない。同様に、このセクションで言及した問題、又は背景として提供された主題と関連付けられた問題は、先行技術において以前に認識されていると想定されるべきではない。このセクションの主題は、単に、異なるアプローチを表し、それ自体はまた、特許請求される技術の実装形態に対応し得る。
【0004】
次世代シーケンシングのための試料調製(例えば、ライブラリ調製)は、ゲノムDNA又は二本鎖cDNA(RNAから調製される)などの核酸のより小さい断片への断片化、その後の断片の鎖への機能的アダプター配列の付加を含み得る。このようなアダプターは、シーケンシング反応のためのDNAポリメラーゼのプライミング部位、制限部位、並びに捕捉、増幅、検出、アドレス、及び転写プロモーターのためのドメインを含み得る。特定の技術において、アダプターは、連結によって核酸断片の末端に付加され、両端にアダプターを有する断片を生じる。
【0005】
テンプレート核酸断片の末端にアダプターを連結することによって核酸断片ライブラリを調製する際の1つの欠点は、アダプター二量体の形成である。アダプター二量体は、インサートとして介在するテンプレート核酸断片を含まないように、2つのアダプターを互いに直接連結することによって形成される望ましくない副産物である。いくつかのシーケンシング技術において、核酸断片ライブラリに存在するアダプター二量体は、例えば、シーケンシングワークフローの一部として、ライブラリが増幅されるときに増幅される。アダプター二量体は、一般にライブラリに含まれる断片よりも小さいため、それらはより速い速度で増幅及び蓄積することができ、したがってシーケンシング結果に、試料を代表しないアダプター二量体リードを混入させる。他の技術では、アダプター二量体は、アダプター二量体とアダプターに相補的なシーケンシングプライマーとの間の不一致を伴って形成されるため、アダプター二量体は増幅及び/又はシーケンシングされない。特定のシーケンシングポリメラーゼは、不一致を許容せず、したがってアダプター二量体を増幅又はシーケンシングしない。しかし、アダプター二量体がシーケンシングされない場合であっても、ライブラリ中のアダプター二量体の存在は、より低い質のシーケンシング結果をもたらし得る。クラスタ化アレイの場合、クラスタの有意な集団がアダプター二量体によって占有され、したがって試料DNA配列を有さない場合、より低い密度の有意義なインサート配列データが有限サイズのチップから得られる。したがって、低レベルのアダプター二量体を有するライブラリの調製は、ポリヌクレオチドのシーケンシングにおいて、特にそのようなプロセスがハイスループットである場合に有利である。核酸断片ライブラリに存在するアダプター二量体を評価して、そのようなライブラリからの核酸シーケンシングの改善を容易にするための技術が本明細書に記載される。
【発明の概要】
【発明が解決しようとする課題】
【0006】
一実施形態では、本開示は、核酸ライブラリを特徴付ける方法であって、シーケンシングプライマーを使用して核酸ライブラリをシーケンシングして、核酸ライブラリの断片及びアダプター二量体シーケンシングデータを表す試料シーケンシングデータを生成する工程であり、核酸ライブラリの個々の断片が、第1のアダプターに隣接する試料インサートを含み、核酸ライブラリの個々のアダプター二量体が、接合部で互いに直接連結された第2のアダプターを含み、第1のアダプター及び第2のアダプターが同じ配列を有し、シーケンシングプライマーが同じ配列の一部と同一であり、個々のアダプター二量体が接合部に不一致領域を含み、シーケンシングプライマーが、個々のアダプター二量体の鎖に結合した場合、接合部の5’である3’末端を有する工程、及びアダプター二量体シーケンシングデータに基づいて核酸ライブラリの品質メトリックを決定する工程を含む、方法に関する。
【0007】
別の実施形態では、本開示は、核酸ライブラリを特徴付ける方法であって、シーケンシングデバイスにおいて、複数の核酸ライブラリのプールのシーケンシングランがアダプター二量体品質管理シーケンシングランであるという入力を受信する工程、シーケンシングデバイスに、複数の核酸ライブラリの断片中の共通アダプター配列に相補的であり、断片インサートとの接合部における共通アダプター配列の3’末端ヌクレオチドを除外するシーケンシングプライマーを使用して、プールから配列データを生成させる工程、各個々の核酸ライブラリについて品質メトリックを計算する工程であり、品質メトリックが、各個々の核酸ライブラリ中のアダプター二量体のパーセンテージを含む工程、及び仕様限界を上回るアダプター二量体のパーセンテージを有する複数の核酸ライブラリの核酸ライブラリのサブセットを同定する工程を含む、方法に関する。
【0008】
別の実施形態では、本開示は、複数の核酸ライブラリのプール、及び複数の核酸ライブラリの断片中の共通アダプター配列に相補的であり、断片インサートとの接合部で共通アダプター配列の3’末端ヌクレオチドを除外するシーケンシングプライマーをロードしたフローセルを含むシーケンシングデバイスに関する。シーケンシングデバイスはまた、コンピュータであって、プールのシーケンシングランがアダプター二量体品質管理シーケンシングランであるという入力を受信し、シーケンシングデバイスに、シーケンシングプライマーを使用してプールから配列データを生成させ、各個々の核酸ライブラリについて品質メトリックを計算して、各個々の核酸ライブラリ中のアダプター二量体のパーセンテージを決定し、仕様限界を上回るアダプター二量体のパーセンテージを有する複数の核酸ライブラリの核酸ライブラリのサブセットを同定するようにプログラムされたコンピュータを含む。
【課題を解決するための手段】
【0009】
前述の説明は、開示される技術の作製及び使用を可能にするために提示されている。開示される実施態様に対する様々な修正は、明らかであり、本明細書で定義される一般原理は、開示される技術の趣旨及び範囲から逸脱することなく、他の実施態様及び用途に適用され得る。したがって、開示される技術は、示される実施態様に限定されることを意図するものではなく、本明細書に開示される原理及び特徴と一致する最も広い範囲を与えられるものである。開示される技術の範囲は、添付の特許請求の範囲によって規定される。
【0010】
本発明のこれらの特徴、態様、及び利点、並びに他の特徴、態様、及び利点は、添付図面を参照して以下の詳細な説明を読むと、より深く理解されると考えられ、同様の特徴は、図面にわたって同様の部分を表している。
【図面の簡単な説明】
【0011】
図1】本開示の態様による、核酸ライブラリを調製するための方法の概略図である。
図2】本開示の態様による、核酸ライブラリからシーケンシングリードを生成するための方法の概略図である。
図3】断片アダプター及びインサートに対するシーケンシングプライマー位置の概略図である。
図4】本開示の態様による、核酸ライブラリを調製するための方法の概略図である。
図5】本開示の態様による、核酸ライブラリからシーケンシングリードを生成する方法の概略図である。
図6】本開示の態様による、核酸シーケンシングワークフローの概略図である。
図7】本開示の態様による、再調整された核酸ライブラリのシーケンシング結果を示す図である。
図8】本開示の態様による、再調整された核酸ライブラリのシーケンシング結果を示す図である。
図9】本開示の態様による、シーケンシングされたアダプター二量体を使用した品質メトリックと同じ試料のPCR結果との間の比較例を示す図である。
図10】本技術に従ってシーケンシングデータを取得するように構成されたシーケンシングデバイスのブロック図である。
【発明を実施するための形態】
【0012】
以下の考察は、開示される技術を当業者が作製及び使用することを可能にするために提示され、特定の用途及びその要件に関連して提供される。開示される実施態様に対する様々な修正は、当業者には容易に明らかとなり、本明細書で定義される一般原理は、開示される技術の趣旨及び範囲から逸脱することなく、他の実施態様及び用途に適用され得る。したがって、開示される技術は、示される実施態様に限定されることを意図するものではなく、本明細書に開示される原理及び特徴と一致する最も広い範囲を与えられるものである。
【0013】
核酸シーケンシングなどの下流処理及び分析のためのライブラリ調製は、一般に、核酸(例えば、ゲノムDNA)を断片化して、その後増幅及びシーケンシングされる断片(例えば、核酸断片)を生成することを含む。ライブラリ調製物のテンプレート収率を測定するために定量PCR(Q-PCR)などの定量技術のみに依存することは、ライブラリの品質に関する情報を与えず、正確なインサートサイズの存在、ライブラリのシーケンシング及びクラスタ化性能、並びに/又はアダプター二量体などの混入物若しくは過剰表示配列の存在を推定する標準化された品質メトリックを提供しない。
【0014】
シーケンシングを使用する品質管理は、ライブラリに関する潜在的な問題を同定するための強力なアプローチである。ライブラリ断片並びにアダプター二量体を表すシーケンシングデータに基づいてライブラリ品質メトリックを生成するシーケンシングワークフローが本明細書において提供される。一実施形態では、品質メトリックは、シーケンシング性能(例えば、Q30スコア)、アダプター二量体%、インサートサイズ、試料当たりの収率(DNA濃度)、重複%、アライメントされたリードの数、及びクラスタ化性能(%フィルターを通過するクラスタ及び%占有)のうちの1つ以上を含み得る。開示された技術は、ライブラリ中のサイズ外要素の存在を見ることによってアダプターインサートサイズ及びアダプター二量体のパーセンテージを同定するが、アダプター二量体配列データを使用しない他の技術に対する改善を提供する。
【0015】
開示される技術は、設計誘導アプローチによって選択され、特定のシーケンシングライブラリ調製物に存在するアダプター二量体を表すシーケンシングデータを生成するシーケンシングプライマーを使用する。このアダプター二量体配列データは、同定され、個々のシーケンシングライブラリのための品質メトリックへの入力として提供される。一実施形態では、品質メトリックは、次いでライブラリの正規化又は再調整工程を誘導するために使用され得る。開示される技術は、アダプター二量体にハイブリダイズした場合に、インサート含有断片とアダプター二量体との間の配列差異によって引き起こされるプライマーの3’末端ヌクレオチドとアダプター二量体との間の不一致を有するシーケンシングプライマーを使用するシーケンシングワークフローとは対照的である。不一致に対する許容性が低いポリメラーゼ、例えばストリンジェントなポリメラーゼ又は不一致非許容性ポリメラーゼを使用する場合、不一致はアダプター二量体がシーケンシングされるのを妨げる。したがって、アダプター二量体を含むライブラリから取得されたシーケンシングデータは、本明細書で提供されるように特徴付けられ得るアダプター二量体シーケンシングリードを含まない。しかし、アダプター二量体がそのようなシーケンシングデータにおいて表されない場合であっても、それらの存在は、それにもかかわらず、不十分なライブラリ品質メトリックと関連し得る。更に、不一致非許容性ポリメラーゼの使用は、試料核酸から正確なシーケンシング結果を生成するために望ましい。したがって、開示された技術は、シーケンシングデータに基づくシーケンシングライブラリにおけるアダプター二量体の特徴付けを可能にし、更に不一致非許容性ポリメラーゼを使用してそのようなデータを生成する。
【0016】
図1は、試料核酸12からのライブラリ調製技術の概略図である。試料核酸12は、超音波処理、酵素処理などの適切な断片化技術に従って核酸インサート14を生成するために断片化される。生成されたインサート14は、本明細書中に一般的に開示されるように、アダプター16に連結され、一般的にアダプター-インサート-アダプター配置を有するアダプター末端連結断片22を含むシーケンシングライブラリ20を生成する。すなわち、インサート14は、アダプター16に隣接している。シーケンシングライブラリ20の断片22は、それらの5’末端で共通配列、及びそれらの3’末端で共通配列を共有してもよい。すなわち、共通配列は共通アダプター16からのものであり、共通アダプター16はすべて同じタイプ又は同じ配列のものであってもよく、適切な配向でインサート14の末端に連結されてもよい。
【0017】
更に、シーケンシングライブラリ20は、アダプター二量体26を含んでもよく、アダプター二量体26は、互いに直接連結され、介在インサート14を含まないアダプター16である。アダプター二量体26は、シーケンシングライブラリ20の混入物又は望ましくない要素である。
【0018】
一旦調製されると、シーケンシングライブラリ20は、シーケンシングプラットフォームに提供され、シーケンシング結果を改善するか、又は試料核酸12の改善されたシーケンシングデータを生成するために使用され得るクリーンアップ、再調整、若しくは他の富化工程を駆動するために使用され得るシーケンシングライブラリ20に存在するアダプター二量体からシーケンシングデータを生成する。個々のシーケンシングライブラリ20の品質は、出発試料核酸12の品質、試料核酸12の濃度、ライブラリ調製ワークフロー工程を実施する際のオペレーターのばらつき、試薬の品質、アダプター濃度などに関連し得る。したがって、異なるライブラリ20は、互いに異なる品質を有し得る。開示される技術は、それぞれの個々のライブラリ20に固有の品質メトリックを生成する。
【0019】
図2は、シーケンシングライブラリ20を用いて、アダプター二量体シーケンシング情報を生成するシーケンシングプライマーを使用して実施され得るペアエンドシーケンシングの概略図である。開示される技術は、追加的に又は代替的に、シングルエンドシーケンシングランと共に使用され得ることが理解されるべきである。更に、図2は、同時に存在するフォワード鎖及びリバース鎖についてのシーケンシングプライマーを示すが、ペアエンド配列工程は、シーケンシングデータを生成するために連続して実施され、配列インデックスに対する更なるシーケンシング工程もまた、連続して実施され得ることが理解されるべきである。
【0020】
シーケンシングは、チップ、フローセル、又は固体基板などの基板30上で実施することができる。他の実施形態において、シーケンシングは、ビーズ上で実施され得る。基板30は、試料断片22の固定化されたフォワード鎖32及びリバース鎖34を含む。鎖32、34は、基板30上の各クラスタ又は部位が試料12に由来する単一のインサート14を表すように、ブリッジ増幅によって形成されたクラスタの一部であってもよい。基板上の異なる位置に関連付けられた異なる部位は、異なるインサート14を有する異なる捕捉試料断片22を有する。両方の鎖32、34は、アダプター配列に隣接している。図示されるように、アダプター配列は、フォワード鎖の5’アダプターがリバース鎖上のアダプターの3’に位置し、逆もまた同様であるような、アダプター16の一本鎖型である。したがって、各鎖上の5’配列及び3’配列は識別可能であり得る。アダプター配列は、基板30上に固定化された捕捉オリゴヌクレオチドによる捕捉を可能にする捕捉領域40、44を含んでもよい。アダプター配列はまた、プライマー領域42、46を含む。
【0021】
アダプター二量体26からのフォワード鎖50及びリバース鎖52も、捕捉領域40、44を介して基板30上に捕捉される。プライマー領域40、44は、互いに直接連結される。インサート含有フォワード鎖32及びアダプター二量体フォワード鎖50は、プライマー領域46に相補的であり、それに結合するシーケンシングプライマーからの伸長により、シーケンシングワークフローの一部としてシーケンシングされる。図示されるように、リード1プライマー60は、アダプター二量体26の接合部又は二量体化位置に位置する不一致領域56を回避するように設計される。すなわち、不一致領域56は、第1のアダプター16及び第2のアダプター16が互いに接合する位置であるか、又はその位置を含む。リード1プライマー60は、不一致領域56の5’に位置する3’末端を有する。一実施形態において、不一致領域56は単一ヌクレオチドであり、2~3ヌクレオチド又は2~10ヌクレオチドである。不一致領域は、二量体化プロセスが、ライブラリ20から生成された鎖に反映される試料断片22と比較して、アダプター二量体26において異なる配列をもたらすために生成される。インサート14がアダプター16のそれぞれの末端に連結されているため、鎖32、34に不一致領域56は存在しない。
【0022】
アダプター二量体シーケンシング情報を生成する設計誘導シーケンシングプライマーは、リード1プライマー60を含む。従来のプライマー61は不一致領域56を含むため、従来のプライマーは、アダプター鎖50から伸長し、シーケンシングデータを生成することができない。したがって、リード1プライマー60は、異なる3’ヌクレオチドに基づいて従来のシーケンシングプライマーと少なくとも区別可能である。一実施形態では、リード1プライマー60は、最後の3’ヌクレオチドを含まないが、すべての他のヌクレオチドを含む従来のプライマー61の切断型である。一実施形態では、リード1プライマー60は、最後の3’ヌクレオチドを含まない従来のプライマー61(図2)のシフト型である。
【0023】
リード1プライマー60は、図示されるように、不一致領域56を回避する潜在的プライマーのセットから選択される単一プライマー配列であり得る。一実施形態では、リード1プライマー60は、フォワード鎖32にハイブリダイズした場合、インサート14に近い、例えばインサート14の10ヌクレオチド以内の位置から伸長する3’末端を有するように設計される。一実施形態では、リード1プライマー60は、インサート14の3ヌクレオチド以内の位置から伸長する。追加的又は代替的に、リード1プライマー60は、インデックス領域、バーコード領域、及び/又は捕捉領域44などの、アダプター16の他の機能領域を回避するか、又は含まないように設計され得る。リード1プライマー60は、18~24ヌクレオチド長であり得る。一実施形態では、フォワード鎖32のプライマー領域46に相補的なリード1プライマー60は、リバース鎖34上のプライマー領域42の配列と少なくとも50%、少なくとも75%、又は少なくとも95%同一である。
【0024】
ペアエンド実施形態では、シーケンシングプライマーはまた、リード2プライマー62を含む。従来のプライマー63は不一致領域56を含むため、従来のプライマーは、アダプター鎖52から伸長し、シーケンシングデータを生成することができない。したがって、リード2プライマー62は、異なる3’ヌクレオチドに基づいて従来のシーケンシングプライマーと少なくとも区別可能である。リード2プライマー62は、不一致領域56の5’に位置する3’末端を有する。一実施形態では、リード2プライマー62は、最後の3’ヌクレオチドを含まないが、すべての他のヌクレオチドを含む従来のプライマー63の切断型である。一実施形態では、リード2プライマー62は、最後の3’ヌクレオチドを含まず、5’方向に1ヌクレオチドシフトされた従来のプライマー63のシフト型である。リード2プライマー62は、図示されるように、不一致領域56を回避する潜在的プライマーのセットから選択される単一プライマー配列であり得る。一実施形態では、リード2プライマー62は、リバース鎖34にハイブリダイズした場合、インサート14に近い、例えばインサート14の10ヌクレオチド以内の位置から伸長する3’末端を有するように設計される。一実施形態では、リード2プライマー62は、インサート14の3ヌクレオチド以内の位置から伸長する。追加的又は代替的に、リード2プライマー62は、インデックス領域、バーコード領域、及び/又は捕捉領域40などの、アダプター16の他の機能領域を回避するか、又は含まないように設計され得る。リード2プライマー62は、18~24ヌクレオチド長であってもよい。一実施形態では、リバース鎖34のプライマー領域42に相補的なリード2プライマー62は、フォワード鎖32上のプライマー領域46の配列と少なくとも50%、少なくとも75%、又は少なくとも95%同一である。
【0025】
図3は、インサート14の位置に対する、アダプター16中のリード1プライマー60及びリード2プライマー62の位置の概略図である。プライマー60は、インサート14とアダプター16との間の界面におけるヌクレオチドに対応する、図3でNとして示される断片22上の領域80に対応する。一実施形態では、以下の配列を有するアダプター二量体対応シーケンシングプライマーが提供される。
【0026】
リード1プライマー60:
プライマー領域80及び5’に15~25ヌクレオチドを含むが、アダプター16の末端3’ヌクレオチドNを含まない配列。一実施形態では、末端ヌクレオチドNは「T」である。
【0027】
リード2プライマー62:
プライマー領域82に15~20ヌクレオチドを含み、インサート14のヌクレオチド3’を含まない配列。一実施形態では、末端ヌクレオチドNは「A」である。
【0028】
リード1プライマー60及びリード2プライマー62は、インサート14に近いが、一実施形態では、インサート14内で生成される配列情報が最大化されるようにインサート14から1ヌクレオチド離れている。
【0029】
図4は、フォーク型アダプターを使用し、開示される技術と併せて使用され得る、例示的なライブラリ調製ワークフロー100を示す。1つの二本鎖断片101のみが図示されているが、試料の数千~数百万の断片をワークフローにおいて同時に調製することができる。物理的方法によるDNA断片化は、3’オーバーハング、5’オーバーハング、及び平滑末端の混合物を含む異種末端を生成する。オーバーハングは様々な長さのものであり、末端はリン酸化されてもされなくてもよい。操作のゲノムDNAを断片化することから得られる二本鎖DNA断片の例を断片101として示す。断片101は、左端の3’オーバーハングと右端に示される5’オーバーハングの両方を有する。DNA断片が物理的方法によって生成される場合、ワークフローは、5’-リン酸化末端を有する平滑末端断片を生成する末端修復操作102の実行に進む。いくつかの実施形態において、この工程は、T4 DNAポリメラーゼ及びクレノウ酵素を使用して、断片化から生じるオーバーハングを平滑末端に変換する。これらの酵素の3’から5’のエキソヌクレアーゼ活性は、3’オーバーハングを除去し、5’から3’のポリメラーゼ活性は、5’オーバーハングを埋める。更に、この反応におけるT4ポリヌクレオチドキナーゼは、DNA断片の5’末端をリン酸化する。断片104は、末端修復された平滑末端産物の例である。
【0030】
末端修復後、ワークフロー100は、断片の3’末端のアデニル化(工程106)に進み、これは、単一のdATPが平滑断片の3’末端に付加され、それらがアダプター連結反応中に互いに連結することを防止するため、A-テーリング又はdA-テーリングとも呼ばれる。二本鎖分子110は、3’-dAオーバーハング及び5’-リン酸末端を有する平滑末端を有するAテール付き断片を示す。2つのシーケンシングアダプター116の各々の3’末端上の単一の「T」ヌクレオチドは、2つのアダプターをインサートに連結するために、インサートの各末端上の3’-dAオーバーハングに相補的なオーバーハングを提供する。一実施形態では、リード1プライマー60及びリード2プライマーは、単一の「T」ヌクレオチドを除外する。
【0031】
3’末端をアデニル化した後、ワークフロー100は、断片110の両端へのオリゴヌクレオチド、例えばアダプター116の連結(工程112)に進む。アダプター116は、多重化反応において個々の試料を同定するためのインデックス配列を含み得る。P5及びP7’オリゴヌクレオチドは、多重化反応の試料のすべてにおいて共通又はユニバーサルアダプターであり、Illuminaシーケンシングプラットフォームのフローセルの表面に結合した増幅プライマーに相補的であり、増幅プライマー結合部位とも呼ばれる。それらは、アダプター-インサート-アダプターライブラリがブリッジ増幅を受けることを可能にする。アダプター及びシーケンシングプラットフォームの他の設計が、種々の実施形態において使用され得る。アダプター116はまた、リード1及びリード2のための2つの配列プライマー結合配列を含む。他のシーケンシングプライマー結合配列は、異なる反応、例えば、インデックスリードのためのアダプターに含まれ得る。
【0032】
一実施形態では、開示される技術は、Truseq PCR-FREEライブラリ調製物(Illumina,Inc.)においてiSeq100を使用してアダプター二量体を検出するために使用され得る。カスタムレシピ及びプライマーは、iSeq(Illumina,Inc.)上でこのアダプター二量体検出を可能にするためにこのプロトコルで使用される。図5に示されるように、リードプライマーの最後のヌクレオチド(T)とアダプター二量体の最初の読み取り可能なヌクレオチド(C)との間に不一致(T-C)が存在する場合、アダプター二量体をシーケンシングすることができないiSeq DNAシーケンシングポリメラーゼpol812(SED ID NO:1)。すなわち、図4のリード1プライマーは、企図されるリード1プライマー60(図2)のセットに含まれないが、従来のプライマー61である。したがって、本明細書では、SBS3の末端に「T」を有さないカスタムリード1プライマー(リード1プライマー)が提供される。末端に「T」を有さないSBS12(リード2プライマー)も本明細書で提供される。これらのプライマーを使用して、アダプター二量体を検出することができる。本明細書に記載されるアダプター及びシーケンシングプロセスは、Illuminaプラットフォームに基づくが、Illuminaプラットフォームの代わりに、又はそれに加えて、他のアダプター及びシーケンシング技術が使用されてもよい。
【0033】
開示された技術は、不一致非許容性ポリメラーゼを使用するiSeqプラットフォーム、NextSeqプラットフォーム、及び/又はNovaSeq(Illumina,Inc.)などの特定のシーケンシングプラットフォームを使用して、ライブラリを定性、再調整、正規化、及び定量化するために使用され得る。本明細書で提供されるように、不一致非許容性ポリメラーゼの例は、配列番号1に開示されており、本明細書ではPol812ポリメラーゼとも呼ばれる。開示される技術と併せて使用され得る他の不一致非許容性又は高忠実度ポリメラーゼとしては、pfuポリメラーゼ又はQ5ポリメラーゼが挙げられる。しかし、開示される技術と併せて、比較的不一致許容性のシーケンシングポリメラーゼを含む他のシーケンシングポリメラーゼが使用され得ることが理解されるべきである。すなわち、開示される技術は、アダプター二量体不一致を回避するプライマーを提供するため、より広範な種々のシーケンシングポリメラーゼが、本明細書に提供されるアダプター二量体シーケンシングデータを生成することができる。
【0034】
図6は、シーケンシングライブラリのための品質メトリックを自動的に生成する、開示される実施形態によるiSeqプラットフォームのための例示的なシーケンシングワークフローである。ワークフローは、ライブラリ調製ワークフローの後に開始する(例えば、図1及び図4に示されるように)。調製されたライブラリは、1:1でプールすることができ、推奨される体積は試料当たり1μlである。希釈は、Illumina Qubit技術などのDNA濃度の測定に基づいて行うことができ、ライブラリプールは、DNA濃度に基づいて適切な濃度にする。しかし、一実施形態では、アダプター二量体シーケンシングデータから生成されたDNA濃度推定値又は他の品質メトリックは、Qubitを介した測定などの直接DNA測定に置き換わり得る。これは、時間のかかるDNA測定工程を排除することによってワークフローを高速化するという利点を提供する。更に、アダプター二量体シーケンシングデータの取得は、開示される品質メトリックがワークフローに時間を追加せず、ワークフローの全体的な時間を短縮し得るように、ライブラリのシーケンシングの間に行われる。したがって、開示される技術は、シーケンシングデバイスのより効率的な操作を可能にする。
【0035】
リード1プライマー60及びリード2プライマー62のためのカスタムプライマー配列は、以下であってもよい:
【0036】
【表1】
【0037】
アダプター二量体対応シーケンシングプライマー、例えば、配列番号2及び配列番号3、配列番号4及び配列番号5、配列番号6及び配列番号7の配列、又はリード1プライマー及びリード2プライマーを含むこれらの配列の他の組合せを含むプライマーを、シーケンシング基板、例えばフローセルに添加することができる。これらのプライマーが使用される場合、シーケンシングデバイスは、アダプター二量体対応シーケンシングプライマーが使用中であることを示す入力に基づき、アダプター二量体メトリックモードに従って動作するようにプログラムされ得る。従来のプライマーが使用される場合、これらのメトリックを提供しない異なる動作モードが選択される。これらのプライマー配列は例示であり、他のアダプター配列に基づく他のプライマーもまた使用され得ることが理解されるべきである。他の例において、プライマー配列は、他のIllumina技術又は他のNGSシーケンシング技術のためのリード1及びリード2シーケンシングプライマー対に基づく。
【0038】
シーケンシングランがランを終了すると、コンピュータに提供される1つ以上の品質メトリックレポートが自動的に生成される(図10)。シーケンシングランは、異なる供給源からの複数の異なるライブラリが一緒にプールされる多重化ランであり得る。それにもかかわらず、異なるライブラリは、本明細書に開示されるシーケンシングプライマーに結合する特定の共通アダプター配列を共有する。アダプターはまた、試料間で変動する配列、例えば、特定のシーケンシングリードを試料又は起源のライブラリに割り当てるために使用される異なるインデックスを含み得る。品質メトリックは、特定の試料に固有であり、その試料のインデックスに結び付けられ得る。更に、正規化プロトコルは、ユーザがプレート全体を正規化することを可能にする。
【0039】
ライブラリ濃度は、以下の式を適用することによって各試料ごとに計算される:
「Sample 1[DNA](nM)=%Demux(sample 1」)iSeqQCPool[DNA](nM)
【0040】
したがって、同じテンプレートなどの生成された品質管理メトリックを使用して、所与の体積及び濃度でプレートを正規化するために試料ごとに必要とされる試料及び再懸濁緩衝液(RSB)の体積を計算することもできる。標的正規化濃度(nM)及び総正規化体積(μl)は、ユーザ入力を介して入力することができる。以下の実施例では、2.5nMの標的濃度及び20μlの標的総体積を入力した。
【0041】
実施例:iSeqQCを用いてランした例示的なPCR-Free 450ライブラリ(NA12878 gDNA)を記載する。TSPF450ライブラリを定性するために使用されるメトリックを以下の表(表1)に列挙し、説明する。%クラスタPF、%占有及び%Q30塩基の仕様は、Illuminaによって公開されたiSeq仕様シートに基づいていた。インサートサイズの仕様は、望ましいインサートサイズに基づいていた。メトリックの残りは、良質のライブラリを用いて以前に実施された6回のTS PCR-Free 2×151 iSeqQCランに基づく(すべて仕様に対してNovaseq6000で試験された)。
【0042】
【表2】
【0043】
以下は、5つの異なる試料の品質管理例分析の結果である。試料1、2、3及び4は、すべてのHSL及びLSLに合格した。試料5は、%PF、%占有、%重複、%アダプター二量体、%アライメントされた塩基及び%GC含量(リード1及び2について)に不合格であった。この試料のQC不合格は、プールにスパイクされた1%アダプター二量体によるものであり、したがって不合格であると予想された。
【0044】
【表3】
【0045】
実証されるように、スパイクされた試料からのシーケンシングリードの分析は、シーケンシングリードがアダプター二量体から生成された所望の数よりも多いシーケンシングリードを反映したため、GC含量についての仕様を上回った。アダプター二量体は、ヒト由来DNAについての典型的な値から外れたGC含量を有する合成DNAである。したがって、所望よりも高いGC含量を示すシーケンシングデータを用いて本開示の技術に従って分析されたシーケンシングライブラリは、高いアダプター二量体の存在の特徴であり得る。高いアダプター二量体の存在を示す他の品質メトリックと共に、ライブラリは品質管理に不合格であると同定することができる。また実証されるように、インサートサイズなどの特定のメトリックは、高いアダプター二量体の存在を有するライブラリにおいてさえ、フラグが立てられないか、又は仕様限界外である。
【0046】
本明細書では、例えば、配列、アダプター二量体を検出し、この情報を品質管理分析への入力として提供するシーケンシングワークフローが提供される。アダプター二量体を検出するこのワークフローの効率を実証するために、PF450ライブラリを、様々な%スパイクされたアダプター二量体を用いてランした。実験の概要を以下の表(表3)に示す。
【0047】
【表4】
【0048】
結果は、iSeqQCワークフローがアダプター二量体を検出することができ、この検出が非常に低濃度で高感度であることを確証する。
【0049】
ライブラリがプール工程で不均等な濃度で組み合わされると、特定のライブラリが他のライブラリよりも偏って表示され得る。過小表示は、更なるシーケンシングを必要とする可能性があり、一方で過剰表示は、シーケンシング能力の浪費につながる可能性がある。多量のアダプター二量体を有するライブラリは、十分な濃度のDNAを有するようであり得る。しかし、この濃度は、断片を含有するのではなくアダプター二量体の存在を測定している可能性があり、したがって試料からのDNAのDNA濃度を誇張している可能性がある。アダプター二量体シーケンシング結果の評価を使用して、品質管理に合格しないアダプター二量体のパーセンテージを有する多重化反応におけるライブラリのサブセットを同定することができる。そのようなライブラリは、クリーンアップ工程に提供されてもよく、及び/又は再調整されてもよく、開示される技術の一部として同定されてもよい。クリーンアップ工程は、アダプター二量体をライブラリから分離するためのゲル又はサイズ分離を含み得る。しかし、クリーンアップ工程は時間がかかるため、シーケンシングデータの取得と併せて品質メトリックを通してライブラリをランすることにより、いくつかのライブラリが、事前シーケンシング分析、例えば、断片サイズデータのみに基づいて不必要にクリーンアップを経ることを回避することが可能になり得る。
【0050】
開示される技術の別の態様は、生成されたメトリックが、全インデックスにわたるカウント数の変動係数(CV)<10%でライブラリの再調整を改善することである。均等なインデックス表示は、試料がシーケンシング中に低い収率に起因して失敗することを防止することができる。それにもかかわらず、アダプター二量体は、例えば、第1又は第2のインデックスリードに表示され得るインデックス配列を含むため、インデックス配列ごとのライブラリの再調整は、高いアダプター二量体濃度を有する試料に対して正確ではない。したがって、アダプター二量体からの直接のインデックスリードに基づいて、%demuxの一部がアダプター二量体に由来し、ライブラリ自体に由来しないため、試料表示はインデックスのみに基づいてプールにおいて人工的に高くなるか、又は過剰表示される。不適切に調整された試料は、不十分なカバレッジでシーケンシングされる可能性がある。
【0051】
これは、高スループットワークフローにとって最も一般的な失敗のタイプであり、ターンアラウンドタイムの遅延を引き起こし、シーケンシングコストを増加させる。低い収率に起因して失敗した試料は、再シーケンシングされる必要があり、場合によってはライブラリ調製が再度行われる必要があり、より多くの遅延を引き起こし、ライブラリ調製コストを増加させる。iSeq QCワークフローは、インデックス表示を制御することを可能にし、将来のシーケンシング時間及びコストを節約する。%demux値を使用して、ライブラリをプレート上で再調整することができる。
【0052】
次の図には、計算された%demux値に基づいて再調整/正規化されたライブラリの例がある。%CVは非常に低く(<10%)、これは%demux値がDNA濃度に高度に関連しており、ライブラリを再調整及び正規化するために使用することができることを意味する。図8に示されるように、24個の試料を再調整し、プールして、異なる複雑度を有する2つの異なるライブラリプール:6plex(A1)及び24plex(A2)を生成した。両方のプールについての%CV値は、それぞれ7.52%及び9.5%であった。図9に示されるように、24-plexライブラリ調製物を使用して、各試料当たり異なる%demux試料を有する3-plexプールを作成した。ライブラリ1及び2は、%demux試料(%リード試料)から0%CVを有していた。ライブラリ3は、予測された%demux試料(%リード試料)から6.8%CVを有していた。同じ概念を使用して、試料のそれぞれについての濃度を、本明細書で提供されるように計算することができる。これらの濃度値を使用して、プレート全体を試料濃度及び体積に正規化することができる。
【0053】
iSeqQCから生成された濃度値とQ-PCR(Roche LightCycler 480、キットKK4953)からの濃度との間の比較を行った。図9は、iSeq DNA濃度予測値とQ-PCR DNA濃度との間の%CVの分布を示す。%CV平均は3.4%であり、これらが検出されたQ-PCR DNA濃度とiSeq DNA濃度値との間の高い相関であることを示す。これらの結果は、iSeq QC%demuxを使用して計算されたDNA濃度が、Q-PCR DNA濃度値と高い相関を有することを示す。
【0054】
品質管理ライブラリ工程の開示される実装形態は、任意の不良な性能のライブラリを廃棄又は修正し、より大きく、比較的高価なシーケンシングプラットフォームにおけるこのライブラリのシーケンシングに時間及び金銭を費やすことを防止することを可能にする。不良な性能のライブラリは、アダプター二量体を除去するクリーンアップ工程に供され得る。しかし、良好に機能するライブラリは、そのような工程に供される必要がなく、したがって品質管理メトリックを通過するライブラリの時間を節約する。
【0055】
いくつかの実施形態において、開示される技術は、核酸シーケンシングライブラリ(例えば、ライブラリ20)又はDNA断片ライブラリを生成するために使用される。生成されたライブラリは、本明細書に提供されるシーケンシング反応で使用され得る。図10は、本明細書に提供されるインデックス付け技術を使用して個々の試料に割り当てられたインデックス付けされた核酸(例えば、シーケンシングリード、リード1、リード2、インデックスリード、インデックスリード1、インデックスリード2、多重試料シーケンシングデータ)からシーケンシングデータを取得するために、開示される実施形態と併せて使用され得るシーケンシングデバイス160の概略図である。シーケンシングデバイス160は、その開示全体が参照により本明細書に組み込まれる、米国特許公開第2007/0166705号、同第2006/0188901号、同第2006/0240439号、同第2006/0281109号、同第2005/0100900号、米国特許第7,057,026号、国際公開第05/065814号、国際公開第06/064199号、同第07/010251号に記載されているsequencing-by-synthesis法を組み込んだものなどの任意のシーケンシング手法に従って実装され得る。あるいは、連結手法によるシーケンシングが、シーケンシングデバイス160に使用されてもよい。そのような手法は、DNAリガーゼを使用して、オリゴヌクレオチドを組み込み、かかるオリゴヌクレオチドの組み込みを特定し、米国特許第6,969,488号、同第6,172,218号、及び同第6,306,597号に記載されており、これらの特許の開示全体が参照により本明細書に組み込まれる。いくつかの実施形態は、ナノ細孔シーケンシングを利用することができ、それによって、試料の核酸鎖又はヌクレオチドは、試料の核酸からエキソヌクレアーゼによって除去され、ナノ細孔を通過する。試料の核酸又はヌクレオチドがナノ細孔を通過するとき、それぞれの塩基種は、細孔の電気コンダクタンスの変動を測定することによって特定され得る(その開示全体が参照により本明細書に組み込まれる、米国特許第7,001,792号、Soni & Meller,Clin.Chem.53,1996-2001(2007)、Healy,Nanomed.2,459-481(2007)、及びCockroft et al.J.Am.Chem.Soc.130,818-820(2008))。更なる他の実施形態は、伸長産物へのヌクレオチドの組み込み時に放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づくシーケンシングは、Ion Torrent(Guilford,CT、Life Technologiesの子会社)から市販されている電気検出器及び関連技術、又は、米国特許出願公開第2009/0026082(A1)号、同第2009/0127589(A1)号、同第2010/0137143(A1)号、同第2010/0282617(A1)号に記載されているシーケンシング方法及びシステムを使用することができる。特定の実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを含む方法を利用することができる。ヌクレオチドの取り込みは、フルオロフォア担持ポリメラーゼとγ-リン酸標識ヌクレオチドとの間の蛍光共鳴エネルギー移動(fluorescence resonance energy transfer、FRET)の相互作用を介して、又はこれらの開示全体が参照により本明細書に組み込まれる、例えば、Levene et al. Science 299,682-686(2003)、Lundquist et al.Opt.Lett.33,1026-1028(2008)、Korlach et al.Proc.Natl.Acad.Sci.USA 105,1176-1181(2008)に記載されているようなゼロモード導波路を用いて検出することができる。他の好適な代替的な技術としては、例えば、蛍光インサイチュシーケンシング(fluorescent in situ sequencing、FISSEQ)、及び超並列シグネチャシーケンシング(Massively Parallel Signature Sequencing、MPSS)が挙げられる。特定の実施形態では、シーケンシングデバイス160は、Illumina(La Jolla、CA)製iSeqであり得る。他の実施形態では、シーケンシングデバイス160は、DNA堆積がそれぞれのフォトダイオードと1対1にアライメントされるように、フォトダイオード上に作製されたナノウェルを備えたCMOSセンサを使用して動作するように構成され得る。
【0056】
シーケンシングデバイス160は、4つのヌクレオチドのうちの2つのみが標識され、任意の所与の画像について検出可能である「1チャネル」検出デバイスであってもよい。例えば、チミンは、永久的な蛍光標識を有し得るが、アデニンは、同じ蛍光標識を分離可能な形態で使用する。グアニンは永久的に暗色であってもよく、シトシンは最初は暗色であるが、サイクル中に標識を付加することができる。したがって、各サイクルは、最初の画像及び第2の画像を含むことができ、ここで最初の画像ではチミン及びアデニンのみが検出可能であるが、第2の画像ではチミン及びシトシンのみが検出可能であるように、色素が任意のアデニンから切断され、任意のシトシンに付加される。両方の画像を通して暗色の任意の塩基はグアニンであり、及び両方の画像を通して検出可能な任意の塩基はチミンである。第1の画像で検出可能であるが第2の画像で検出可能でない塩基はアデニンであり、第1の画像で検出可能でないが第2の画像で検出可能な塩基はシトシンである。最初の画像及び第2の画像からの情報を組み合わせることにより、1つのチャネルを使用して4つすべての塩基を識別することができる。他の実施形態では、シーケンシングデバイス160は「2チャネル」検出デバイスであってもよい。
【0057】
描写された実施形態では、シーケンシングデバイス160は、別個の試料基板162、例えば、フローセル又はシーケンシングカートリッジ、及び関連するコンピュータ164を含む。しかしながら、上記のように、これらは単一のデバイスとして実装されてもよい。描写された実施形態では、生体試料は、撮像されて配列データを生成する基板162に装填され得る。例えば、生体試料と相互作用する試薬は、撮像モジュール172によって生成された励起ビームに応答して特定の波長で蛍光発光し、それにより撮像のための放射線を戻す。例えば、蛍光成分は、成分の相補的分子にハイブリダイズするか、又はポリメラーゼを使用してオリゴヌクレオチドに組み込まれた蛍光タグ付きヌクレオチドにハイブリダイズする蛍光タグ付き核酸によって生成され得る。当業者には理解されるように、試料の染料が励起される波長、及びそれらが蛍光を発する波長は、特定の色素の吸収及び発光スペクトルに依存することとなる。そのような戻された放射線は、指向光学系を通って伝播し得る。このレトロビームは、一般に、カメラ又は他の光学検出器であり得る撮像モジュール172の検出光学系に向けられ得る。
【0058】
イメージングモジュール検出光学系は、任意の好適なテクノロジに基づき得、例えば、デバイス内の場所に影響を与える光子に基づいて画素化画像データを生成する荷電結合デバイス(charged coupled device、CCD)センサであり得る。しかしながら、時間遅延積分(time delay integration、TDI)動作のために構成された検出器アレイ、相補的金属酸化物半導体(complementary metal oxide semiconductor、CMOS)検出器、アバランシェフォトダイオード(avalanche photodiode、APD)検出器、Geiger-モード光子カウンタ、又は任意の他の適切な検出器を含むがこれらに限定されない、様々な他の検出器のいずれかを使用することもできることが理解されるであろう。TDIモードの検出は、参照により本明細書に組み込まれる米国特許第7,329,860号に記載されているように、ライン走査と連動することができる。他の有用な検出器は、例えば、様々な核酸シーケンシング方法学の文脈において本明細書で以前に提供された参考文献に記載されている。
【0059】
撮像モジュール172は、例えば、プロセッサ174によるプロセッサ制御下にあってもよく、I/O制御176、内部バス78、不揮発性メモリ180、RAM82、及びメモリが実行可能命令を記憶することができるような任意の他のメモリ構造、並びに図10に関して説明されたものと同様であり得る他の好適なハードウェア構成要素も含み得る。更に、関連付けられたコンピュータ164はまた、プロセッサ184、I/O制御186、通信モジュール84、並びに実行可能命令192を記憶することができるようにRAM188及び不揮発性メモリ190を含むメモリアーキテクチャを含んでもよい。ハードウェア構成要素は、ディスプレイ196にも連結することができる内部バス194によって連結され得る。シーケンシングデバイス160がオールインワンデバイスとして実装される実施形態では、特定の冗長なハードウェア要素を排除することができる。
【0060】
プロセッサ184は、本明細書に提供される技術に従い、関連するインデックス配列又は複数の配列に基づいて個々のシーケンシングリードを試料に割り当てるようにプログラムされ得る。特定の実施形態では、撮像モジュール172によって取得された画像データに基づき、シーケンシングデバイス160は、個々のクラスタの配列リードを含むシーケンシングデータを生成するように構成されてもよく、それぞれの配列リードは、基板170上の特定の場所に関連付けられている。各配列リードは、インサートを含有する断片由来であってもよく、又はシーケンシングライブラリに存在するアダプター二量体由来であってもよい。シーケンシングデータは、シーケンシングリードのそれぞれの塩基に対する塩基コールを含む。更に、画像データに基づいて、順次に行われるシーケンシングリードについても、個々のリードは、画像データを介して同じ場所、したがって同じテンプレート鎖に連結され得る。このようにして、インデックスシーケンシングリードは、オリジナルの試料に割り当てられる前に、インサートシーケンスのシーケンシングリードと関連付けられ得る。プロセッサ184はまた、試料へのシーケンシングリードの割り当てに続き、特定の試料のインサートに対応する配列に対して下流分析を行うようにプログラムされ得る。
【0061】
更に、シーケンシングデバイス160は、本明細書に提供される品質メトリックを生成し、開示された品質メトリックに関連するレポート、通知及び/又はデータを生成してもよい。
【0062】
開示される技術は、試料核酸(例えば、試料核酸12)から調製された核酸ライブラリをシーケンシングするために使用され得る。「試料核酸」は、生きているか死んでいるかにかかわらず、1つ以上の細胞、組織、器官、又は生物を含む任意のインビボ若しくはインビトロ供給源、又は任意の生物学的若しくは環境供給源(例えば、水、空気、土壌)に由来してもよい。例えば、いくつかの実施形態では、試料の核酸は、ヒト、動物、植物、真菌(例えば、カビ又は酵母)、細菌、ウイルス、ウイロイド、マイコプラズマ、又は他の微生物を起源とするか又は由来する真核生物及び/又は原核生物のdsDNAを含むか又はこれらからなる。いくつかの実施形態では、試料の核酸は、ゲノムDNA、サブゲノムDNA、(例えば、単離された染色体又は染色体の一部由来、例えば、染色体由来の1つ以上の遺伝子又は遺伝子座由来の)染色体DNA、ミトコンドリアDNA、葉緑体DNA、プラスミド若しくは他のエピソーム由来のDNA(又は内部に含有されている組換えDNA)、又はRNA依存性DNAポリメラーゼ若しくは逆転写酵素を使用してRNAを逆転写して第1の鎖cDNAを生成し、次いで、第1の鎖cDNAにアニーリングしたプライマーを伸長させて、dsDNAを生成することによって作製された二本鎖cDNAを含むか又はこれらからなる。いくつかの実施形態では、試料の核酸は、核酸分子中の又は核酸分子から調製された複数のdsDNA分子(例えば、生物学的(例えば、細胞、組織、器官、生物)又は環境(例えば、水、空気、土壌、唾液、痰、尿、糞便)供給源中の又はこれらに由来するゲノムDNA又はRNAから調製されたcDNA中の又はこれらから調製された複数のdsDNA分子)を含む。いくつかの実施形態では、試料の核酸は、インビトロ源由来である。例えば、いくつかの実施形態では、試料の核酸は、一本鎖DNA(ssDNA)から又は一本鎖若しくは二本鎖RNAから(例えば、好適なDNA依存性及び/又はRNA依存性DNAポリメラーゼ(逆転写酵素)を使用するプライマー伸長などの、当該技術分野において周知の方法を使用して、インビトロで調製されるdsDNAを含むか又はdsDNAからなる。いくつかの実施形態では、試料の核酸は、以下のための方法を含む、当該技術分野において既知の任意の方法を用いて、1本以上の二本鎖又は一本鎖DNA又はRNA分子のすべて又は一部から調製されるdsDNAを含むか又はdsDNAからなる:DNA又はRNAの増幅(例えば、PCR又は逆転写酵素PCR(RT-PCR)、転写媒介増幅法、1つ以上の核酸分子のすべて又は一部の増幅を伴う);その後に好適な宿主細胞内で複製されるプラスミド、フォスミド、BAC、又は他のベクター中の1つ以上の核酸分子のすべて又は一部の分子クローニング;あるいは、アレイ又はマイクロアレイ上のDNAプローブへのハイブリダイゼーションなどのハイブリダイゼーションによる、1つ以上の核酸分子の捕捉。
【0063】
この書面による説明は、本発明を開示するために最良の態様を含む例を使用し、また、任意のデバイス又はシステムを作製及び使用し、任意の組み込まれた方法を実行することを含めて、あらゆる当業者が本発明を実践することを可能にする。本発明の特許性のある範囲は、特許請求の範囲によって定義され、当業者が想到する他の例を含み得る。そのような他の例は、これらが特許請求の範囲内の文字通りの言葉とは異ならない構造要素を含む場合、又はこれらが、特許請求の範囲内の文字通りの言葉とのごくわずかな違いを有する等価の構造要素を含む場合、特許請求の範囲内にあることを意図する。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
【配列表】
2024512122000001.app
【国際調査報告】