IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イーワン ダイアグノミクス ゲノム センター カンパニー リミテッドの特許一覧

特表2023-510515二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法
<>
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図1
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図2
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図3
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図4
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図5
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図6a
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図6b
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図7
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図8
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図9
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図10
  • 特表-二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-03-14
(54)【発明の名称】二本鎖核酸分子およびそれを用いたDNAライブラリー内の遊離アダプターの除去法
(51)【国際特許分類】
   C12N 15/11 20060101AFI20230307BHJP
   C40B 40/06 20060101ALN20230307BHJP
   C12Q 1/6869 20180101ALN20230307BHJP
   C12Q 1/6862 20180101ALN20230307BHJP
   C12N 9/00 20060101ALN20230307BHJP
【FI】
C12N15/11 Z
C40B40/06 ZNA
C12Q1/6869 Z
C12Q1/6862 Z
C12N9/00
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022539424
(86)(22)【出願日】2020-12-24
(85)【翻訳文提出日】2022-08-10
(86)【国際出願番号】 KR2020019070
(87)【国際公開番号】W WO2021133088
(87)【国際公開日】2021-07-01
(31)【優先権主張番号】10-2019-0175696
(32)【優先日】2019-12-26
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
(71)【出願人】
【識別番号】317009156
【氏名又は名称】イーワン ダイアグノミクス ゲノム センター カンパニー リミテッド
(74)【代理人】
【識別番号】110001999
【氏名又は名称】弁理士法人はなぶさ特許商標事務所
(72)【発明者】
【氏名】ミン、ナ ヨン
(72)【発明者】
【氏名】ペ、ジン-シク
(72)【発明者】
【氏名】リー、ミン ソブ
(72)【発明者】
【氏名】シン、シャン チョル
【テーマコード(参考)】
4B050
4B063
【Fターム(参考)】
4B050CC07
4B050KK07
4B050LL03
4B063QA01
4B063QA13
4B063QA17
4B063QQ42
4B063QQ52
4B063QR20
4B063QR32
4B063QR35
4B063QR62
4B063QS24
(57)【要約】
本発明は、二本鎖核酸分子と制限酵素を用いたDNAライブラリー内の遊離アダプターの除去法に関するものであり、より詳細には、タイプIIs制限酵素の認識部位およびそれに相補的な配列を含む二本鎖核酸分子およびタイプIIs制限酵素を用いた次世代配列分析(Next generation sequencing,NGS)用のDNAライブラリー内の遊離アダプターの除去法に関するである。
【選択図】図5
【特許請求の範囲】
【請求項1】
タイプIIs制限酵素の認識部位および3~30nt(nucleotide)の長さの任意のヌクレオチド配列を含むセンス鎖;及び前記センス鎖に相補的な配列、および3’末端のAテール(A-tail)を含むアンチセンス鎖を含む二本鎖核酸分子。
【請求項2】
前記センス鎖の3’末端またはアンチセンス鎖の5’末端に長さ1~10ntの任意のヌクレオチド配列をさらに含むことを特徴とする、請求項1に記載の二本鎖核酸分子。
【請求項3】
前記センス鎖の3’末端にさらに含まれる任意のヌクレオチド配列が、シトシン(C)、グアニン(G)、またはそれらの組み合わせのみからなることを特徴とする、請求項2に記載の二本鎖核酸分子。
【請求項4】
前記アンチセンス鎖の5’末端にさらに含まれる任意のヌクレオチドの塩基配列が、チミン(T)、シトシン(C)、グアニン(G)、またはそれらの組み合わせのみからなることを特徴とする、請求項2に記載の二本鎖核酸分子。
【請求項5】
前記センス鎖の3’末端とアンチセンス鎖の5’末端とがループで連結されてヘアピン(hairpin)構造を有することを特徴とする、請求項1に記載の二本鎖核酸分子。
【請求項6】
前記タイプIIs制限酵素が、MmeI、FokI、Alw26I、BbvI、BsrI、EarI、HphI、MboI、SfaNI、AlwI、BsaI、BbsI、BbuI、BsmAI、BsmI、BspMI、Esp3I、HgaI、MboII、PleI 、SfaNi、MnlI、CspCI、AloI、PpiI、PsrI、BplI、FalI、Bsp24I, BsaXI、HaeIV、CjeI、CjePI、Hin4I、BaeI、AlfI、BcgI、BslFI及びTth111Iからなる群から選択されることを特徴とする、請求項1に記載の二本鎖核酸分子。
【請求項7】
前記センス鎖が、タイプIIs制限酵素の認識部位および6~10nt(nucleotide)長さの任意のヌクレオチドを含み、前記任意のヌクレオチドの塩基配列が、前記二本鎖核酸分子のTm(melting temperature)値が20℃以上になるように構成することを特徴とする、請求項1に記載の二本鎖核酸分子。
【請求項8】
前記センス鎖は配列番号1で表される塩基配列からなり、および前記アンチセンス鎖は配列番号2で表される塩基配列からなることを特徴とする、請求項1に記載の二本鎖核酸分子。
【請求項9】
前記二本鎖核酸分子が配列番号3で表される塩基配列からなることを特徴とする、請求項5に記載の二本鎖核酸分子。
【請求項10】
請求項1乃至請求項9のうちいずれか一項に記載の二本鎖核酸分子、DNAリガーゼ(DNA ligase)およびタイプIIs制限酵素を含む組成物。
【請求項11】
前記DNAリガーゼがT4リガーゼであることを特徴とする、請求項10に記載の組成物。
【請求項12】
前記組成物が、次世代塩基配列分析(Next generation sequencing,NGS)でインデックスされたDNAライブラリー内の試料検出能向上用のものであることを特徴とする、請求項10に記載の組成物。
【請求項13】
前記組成物が、次世代塩基配列分析のインデックスされたDNAライブラリーの製造過程においてインサート(insert)にライゲーションされていない遊離アダプター除去用であることを特徴とする、請求項10に記載の組成物。
【請求項14】
請求項1乃至請求項9のうちいずれか一項に記載の二本鎖核酸分子、DNAリガーゼおよびタイプIIs制限酵素を含む、次世代塩基配列分析のインデックスされたDNAライブラリー内の遊離アダプター除去用キット。
【請求項15】
(a)分析対象ゲノムDNAの二本鎖DNA切片の両末端に次世代配列分析のためのアダプターを接合して製造された次世代配列分析用DNAライブラリーに請求項1乃至請求項8のうちいずれか一項に記載の二本鎖核酸分子およびDNAリガーゼを処理および反応させる段階;及び、(b)前記反応物にタイプIIs制限酵素を処理する段階を含む次世代配列分析用DNAライブラリー内の遊離アダプターの除去法。
【請求項16】
前記アダプターがインデックス配列、ランダムバーコード配列、またはその両方を含むことを特徴とする、請求項15に記載の方法。
【請求項17】
前記タイプIIs制限酵素が、MmeI、FokI、Alw26I、BbvI、BsrI、EarI、HphI、MboI、SfaNI、AlwI、BsaI、BbsI、BbuI、BsmAI、BsmI、BspMI、Esp3I、HgaI、MboII、PleI、SfaNi、MnlI、CspCI、AloI、PpiI、PsrI、BplI、FalI、Bsp24I, BsaXI、HaeIV、CjeI、CjePI、Hin4I、BaeI、AlfI、BcgI、BslFI及びTth111Iからなる群から選択されることを特徴とする、請求項15に記載の方法。
【請求項18】
前記(b)段階以後に緩衝液で洗浄するか、またはクリーンアップ(bead clean-up)を行う段階をさらに含むことを特徴とする、請求項15に記載の方法。
【請求項19】
次世代塩基配列分析のインデックスされたDNAライブラリー内の遊離アダプター除去用製剤を製造するための、請求項1乃至請求項9のうちいずれか一項に記載の二本鎖核酸分子、DNAリガーゼおよびタイプIIs制限酵素の使用。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2019年12月26日に出願された大韓民国特許出願第10-2019-0175696号を優先権として主張し、前記明細書の全体は本出願の参考文献である。
本発明は、二本鎖核酸分子と制限酵素を用いたNGSライブラリーの製作過程で発生する遊離アダプター(Free adapter)の除去法に関するものであり、より詳細には、タイプIIs制限酵素の認識部位およびそれに相補的な配列を含む二本鎖核酸分子と、タイプIIs制限酵素を用いた次世代配列分析(Next generation sequencing,NGS)用のDNAライブラリー内の遊離アダプターの除去法に関するものである。
【背景技術】
【0002】
遺伝子またはゲノムとは、一つの生物が有する全ての遺伝子情報を示す。いずれかの一つの個体の遺伝体のシーケンシング(Sequencing)または配列分析のために、DNAチップおよび次世代配列分析(Next generation sequencing:NGS)、次次世代配列分析(Next next generation sequencing:NNGS)などの色んな技術が開発されている。NGSは研究と診断の目的で広く活用されている。NGSは装備の種類によって異なるが、大きく見ると試料の採取、ライブラリーの製作、及び核酸配列分析の遂行、総3段階に分けられる。核酸配列分析の後には、生産された配列分析のデータに基づいて、遺伝子変異の有無など様々な遺伝的情報を確認することができる。
【0003】
次世代配列分析技術の改善により、配列分析の速度およびデータの出力が大幅に増加し、現在、配列分析プラットフォームのサンプルの処理量が過去に比べて著しく向上した。このような増大した処理量を実現可能にするようにする一側面は多重化(multiplexing)である。これは、NGS用DNAライブラリーを用意する過程において各DNA断片にインデックス(index)塩基配列を含むアダプター(adapter)という独特な配列を追加することによって達成することができる。これにより、単一配列分析の遂行中に多数のライブラリーを同時にプール(pooling)して配列分析することが可能となった。プールされたライブラリの配列分析のリード(read)は、最終データ分析の前に逆多重化(demultiplexing)というプロセスによって識別且つ整列できなければならないため、多重化による処理速度の向上には複雑性という要素が追加されるデメリットがある。
【0004】
特に、前記アダプターは、重合酵素連鎖反応中に重合酵素がもたらす誤謬、および/または核酸配列分析過程中における感知の誤謬などによって核酸配列分析の結果における誤差をもたらす可能性があり、この誤差は変異の検出を阻害する問題がある(Kircher
et al.、2012、Nucleic Acids Res.、Vol. 40、No. 1)。
【0005】
一方、NGSで使用されるアダプターはDNAライブラリーを製作する過程で必要である必修要素であるが、これらがDNAインサート(insert)にライゲーションできず、遊離状態に残る場合、以後の実験過程でインデックスホッピング(index hopping)とUMI(unique molecular identifier) ミックス(一つのUMIを有するリードがPCRによって異なるUMIを有するリードに情報が変わる現象)などをもたらすことによって結果の信頼度を下げることになる。
よって、NGS用DNAライブラリーを製造する過程中に発生する遊離アダプターを効率
的に除去し、配列分析の信頼性を高めるための要求が高まっている。
【発明の概要】
【発明が解決しようとする課題】
【0006】
ここで、本発明者は、NGS用DNAライブラリー内に存在する遊離アダプターによる配列分析の信頼性の低下という問題を解決するために鋭意研究を重ねた結果、タイプIIs(type IIs)制限酵素の認識部位を含むセンス鎖およびこれに相補的な配列のアンチセンス鎖を含む二本鎖核酸分子を用いると、非常に効率的に前記遊離アダプターを除去することができることを見出し、本発明の完成に至った。
【0007】
よって、本発明の目的は、タイプIIs制限酵素の認識部位および3~30nt(nucleotide)の長さの任意のヌクレオチド配列を含むセンス鎖;及び前記センス鎖に相補的な配列、および3’末端のAテール(A-tail)を含むアンチセンス鎖を含む二本鎖核酸分子を提供することである。
【0008】
本発明の他の目的は、前記二本鎖核酸分子、DNAリガーゼ(DNA ligase)およびタイプIIs制限酵素を含む組成物を提供することである。
【0009】
本発明の他の目的は、前記二本鎖核酸分子、DNAリガーゼ及びタイプIIs制限酵素を含む、次世代塩基配列分析のインデックスされたDNAライブラリー内の遊離アダプター(free adapter)除去用キットを提供することである。
【0010】
本発明の他の目的は、(a)分析対象ゲノムDNAの二本鎖DNA切片の両末端に次世代配列分析のためのアダプターを接合し、製造された次世代配列分析用DNAライブラリーに本発明による二本鎖核酸分子およびDNAリガーゼを処理および反応させる段階;(b)前記反応物にタイプIIs制限酵素を処理する段階を含む次世代配列分析用のDNAライブラリー内の遊離アダプター除去法を提供することである。
【0011】
本発明の他の目的は、次世代塩基配列分析のインデックスされたDNAライブラリー内の遊離アダプター除去用製剤を製造するための二本鎖核酸分子、DNAリガーゼおよびDNAリガーゼ及びタイプIIs 制限酵素の使用を提供ことである。
【課題を解決するための手段】
【0012】
前記の本発明の目的を達成するために、本発明は、タイプIIs制限酵素の認識部位および3~30nt(nucleotide)の長さの任意のヌクレオチド配列を含むセンス鎖;及び前記センス鎖に相補的な配列、および3’末端のAテールを含むアンチセンス鎖を含む二本鎖核酸分子を提供する。
【0013】
本発明の他の目的を達成するために、本発明は、前記二本鎖核酸分子、DNAリガーゼおよびタイプIIs制限酵素を含む組成物を提供する。
【0014】
本発明の他の目的を達成するために、本発明は、前記二本鎖核酸分子、DNAリガーゼおよびタイプIIs制限酵素を含む、次世代塩基配列分析のインデックスされたDNAライブラリー内の遊離アダプター除去用キットを提供する。
【0015】
本発明の他の目的を達成するために、本発明は、(a)分析対象ゲノムDNAの二本鎖DNA切片の両末端に次世代配列分析のためのアダプターを接合し製造した次世代配列分析用DNAライブラリーに本発明による二本鎖核酸分子およびDNAリガーゼを処理且つ反応させる段階;(b)前記反応物にタイプIIs制限酵素を処理する段階を含む次世代配列分析用DNAライブラリー内の遊離アダプターの除去法を提供する。
本発明の他の目的を達成するために、本発明は、次世代塩基配列分析のインデックスされたDNAライブラリー内の遊離アダプターを除去用の製剤を製造するための前記二本鎖核酸分子、DNAリガーゼおよびタイプIIs制限酵素の使用を提供する。
【0016】
以下、本発明について詳細に説明する。
本発明において、別途の言及がない限り、塩基配列は5’から3’への方向のことにて記載される。
【0017】
本発明において、用語「鎖(strand)」とは、「筋」、「鎖」または「ストランド」と互換的に使用され、複数のヌクレオチド重合体(すなわち、ポリヌクレオチド)を意味する。
【0018】
本発明は、タイプIIs制限酵素の認識部位および3~30nt(nucleotide)の長さの任意のヌクレオチド配列を含むセンス鎖;及び前記センス鎖に相補的な配列、および3’末端のAテール(A-tail)を含むアンチセンス鎖を含む二本鎖核酸分子を提供する。
【0019】
本発明が提供する前記二本鎖核酸分子は、前記センス鎖の5’末端及びアンチセンス鎖の3’末端に次世代塩基配列分析のためのライブラリー製造時にインサート(insert)にライゲーションできなかった遊離アダプター(free adapter)がライゲーションすることができ、タイプIIs制限酵素による遊離アダプター切断のためのプラットフォームとして活用することができる。
【0020】
本発明が提供する前記二本鎖核酸分子のこの効果は、本発明の実施例を通じてより具体的に確認することができる。
【0021】
本発明における用語「制限酵素(restriction endonuclease)」とは、二重鎖DNAで各核酸間のホスホジエステル結合を切断して切片を作り出す酵素である。すべての制限酵素はDNAの特定の塩基配列を認識し、その塩基配列は当該制限酵素の選択的作用部位を示すものである。前記制限酵素は、認識部位(recognition site)において特定の塩基配列を認識し、制限部位(restriction site、切断部位)で核酸を切断する。
【0022】
本発明において、前記タイプIIs制限酵素とは、非対称DNA配列を認識し、制限酵素の認識部位の外部、一般的に制限酵素の認識部位から1~25ヌクレオチド内で切断される特定グループの酵素を意味する。このタイプの酵素は、認識配列が切断部位から分離されている点で他の制限酵素と異なる。本発明において、前記タイプIIs制限酵素の一部例は、MmeI、FokI、Alw26I、BbvI、BsrI、EarI、HphI、MboI、SfaNI、AlwI、BsaI、BbsI、BbuI、BsmAI、BsmI、BspMI、Esp3I、HgaI、MboII、PleI、SfaNi、MnlI、CspCI、AloI、PpiI、PsrI、BplI、FalI、Bsp24I, BsaXI、HaeIV、CjeI、CjePI、Hin4I、BaeI、AlfI、BcgI、BslFI及びTth111Iなどを含むが、それらに制限されない。多数のタイプIIs制限酵素は商業的入手が可能であり、それらの認識部位は当業者によく公知となっている。制限酵素の認識部位は一般的に4~8個の塩基で構成されており、その具体的な配列は選択しようとする制限酵素の種類に応じて当業者が容易に確認することができる。
【0023】
本発明における前記タイプIIs制限酵素の非限定的な例示、それらの制限酵素の認識部位の配列及び制限部位の位置を下記表1に示す。
【表1】
【0024】
一具体例によれば、本発明において、前記タイプIIs制限酵素はMmeIでもよく、その制限酵素の認識部位の配列はTCCRAC(センス鎖)(配列番号4)および3’-AGGYTG-5’(アンチセンス鎖)(配列番号19)で構成してもよい。
【0025】
一方、本発明の前記二本鎖核酸分子のセンス鎖は、前記制限酵素の認識部位の配列の3’末端に結合した3~30ntの長さの任意のヌクレオチド配列を含む。前記任意のヌクレオチド配列は、センス鎖とアンチセンス鎖とのアニーリングを容易にし、前記タイプIIs制限酵素が作用し得る構造体(Structure)として機能することができる。前記任意のヌクレオチドの塩基配列および長さは、前記センス鎖とアンチセンス鎖のアニーリングを容易にし、制限酵素が作用できる構造体として作用することができる限り特に制限がなく、通常の技術者が前記制限酵素の認識部位の塩基配列および長さを考慮して容易に設定することができる。
【0026】
好ましくは、前記制限酵素の認識部位のセンス鎖3’末端に結合する任意のヌクレオチド配列は、二本鎖核酸分子のセンス鎖とアンチセンス鎖のTm(melting temperature)値が20℃以上となるように構成してもよい。具体的に、前記二本鎖核酸分子のTm値は、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃および70℃からなる群から選択される任意の2つの値を下限値および上限値とする範囲の任意の範囲を含むか、または列挙した前記温度らのうち任意の特定値でもよい。
【0027】
より好ましくは、前記制限酵素の認識部位のセンス鎖の3’末端に結合される任意のヌクレオチド配列は、二本鎖核酸分子のセンス鎖とアンチセンス鎖のTm値が37℃を超えるように構成してもよい。具体的に、前記二本鎖核酸分子のTm値は、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、および70℃からなる群から選択される任意の2つの値を下限値および上限値とする範囲のうちいずれかを含むか、または列挙された前記温度らのうち任意の特定値でもよい。
【0028】
前記Tm値が前記温度の未満の場合、前記二本鎖核酸分子が制限酵素を処理する条件で一本鎖核酸分子に変性(denanturation)されて正常的機能を発揮することができないという問題が生じることもある。
【0029】
本発明において使用される用語「Tm(melting temperature)」とは、核酸二重鎖分子のうち半分が一本鎖となる溶融温度を意味する。
【0030】
また、前記制限酵素の認識部位の配列の3’末端に結合する任意のヌクレオチド配列は3~30ntの長さであってもよく、3、4、5、6、7、8、9、10、11、12、13、14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29および30ntからなる群から選択される任意の2つの値を下限値および上限値とする範囲のうち任意の範囲を含むか、または列挙した前記数値らのうちの任意の特定値を含む。好ましくは、前記任意のヌクレオチド配列は、4~28nt、より好ましくは5~25nt、さらに好ましくは6~20nt、最も好ましくは6~10ntの長さでもよい。
【0031】
前記制限酵素の認識部位の配列の3’末端に結合する任意のヌクレオチド配列の長さが短過ぎる場合、前記二本鎖核酸分子のTm値が低くなり、制限酵素処理条件で一本鎖核酸分子に変性したり、制限酵素の作用が可能な構造体として機能できない可能性がある。一方、制限酵素の認識部位の配列の3’末端に結合する任意のヌクレオチド配列の長さが長すぎる場合、経済的側面で好ましくなく、二本鎖核酸分子のセンス鎖および/またはアンチセンス鎖が制限酵素の認識部位を形成できず、異常な二次構造(secondary structure)を形成する可能性が高くなり好ましくない。
【0032】
一具体例によれば、前記任意のヌクレオチド配列は、TTGTGC(センス鎖)(配列番号20)および3’-CCACAA-5’(アンチセンス鎖)(配列番号21)でもよい。
【0033】
本発明において、前記アンチセンス鎖は、前記センス鎖に相補的な配列および3’末端の
Aテールを含んでもよい。
【0034】
本発明における用語「相補的」とは、核酸と関連して使用される場合、アデニン(A)はチミン(T)と、またはウラシル(U)と結合し、グアニン(G)はシトシン(C)と結合するそれぞれの配列特異的結合関係を意味する。例えば、5’から3’への方向に配列GCAU(配列番号22)を有する核酸は、3’から5’方向に配列CGTA(配列番号23)を有する核酸に相補的である。本明細書において、相補的という用語は、実質的に相補的な核酸及び100%の相補的な核酸(すなわち、ミスマッチ(mismatch)を許容しない)の意味を全部含むこととして使用され、最も好ましくは100%の相補的な核酸の関係を意味することでもある。
【0035】
前記Aテールとは、前記アンチセンス鎖の3’末端に結合した1つのアデニンヌクレオチド(adenine nucleotide)を意味することであり、本発明の二本鎖核酸分子とDNAライブラリーの製造に使用されるアダプター(adapter)とのライゲーションの中で連鎖体(concatemer)の発生を阻害することができ、アダプターに存在する相補的なdTオーバーハング(overhangs)とのライゲーションを可能にする。
【0036】
本発明の一態様において、前記センス鎖の3’末端またはアンチセンス鎖の5’末端に1~10ntの長さの任意のヌクレオチド配列をさらに含んでもよい。具体的に、前記センス鎖の3’末端またはアンチセンス鎖の5’末端に、1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9ntまたは10ntの長さの任意のヌクレオチド配列をさらに含んでもよく。好ましくは、前記センス鎖の3’末端またはアンチセンス鎖の5’末端に、2nt、3nt、4nt、5nt、6ntまたは7ntの長さの任意のヌクレオチド配列をさらに含むことができ、さらに好ましくは、前記センス鎖の3’末端またはアンチセンス鎖の5’末端に長さ2nt、3nt、4ntまたは5ntの任意のヌクレオチド配列をさらに含んでもよく、最も好ましくは、前記センス鎖の3’末端またはアンチセンス鎖の5’末端に、2ntまたは3ntの長さの任意のヌクレオチド配列をさらに含んでもよい。
【0037】
本発明の一態様において、前記センス鎖の3’末端にさらに含まれる任意のヌクレオチド配列は、シトシン(C)、グアニン(G)、またはそれらの組み合わせからなるものであってもよく、前記アンチセンス鎖の5’末端にさらに含まれる任意のヌクレオチドの塩基配列は、チミン(T)、シトシン(C)、グアニン(G)、またはそれらの組み合わせのみからなるものであってもよい。例えば、前記センス鎖の3’末端に含まれる任意のヌクレオチド配列は、C、G、CC、GG、CG、GC、CCC、GGG、CCG、GGC、CGC、GCGなどであってよく、前記アンチセンス鎖の5’末端に含まれる任意のヌクレオチド配列は、C,T,G,TT,TC,CT,TG,GT,CC,GG,CG,GC,TTT,TTC,TCT,CTC,CCT,TCC,CCT、TTG、TGT、GTG、GGT、TGG、CCC、GGG、CCG、GGC、CGC、GCGなどであってもよいが、これらに限定されない。
【0038】
前記センス鎖の3’末端またはアンチセンス鎖の5’末端にさらに含まれる1~10ntの長さの任意の配列は、前記二本鎖核酸分子内の制限酵素の認識部位の反対側の末端における次世代塩基配列分析のためのライブラリーの製造時にインサートにライゲーションされなかった遊離アダプターが非特異的にライゲーションすることを防止することができる。
【0039】
本発明の他の一態様において、本発明の前記二本鎖核酸分子は、センス鎖の3’末端とアンチセンス鎖の5’末端がループに連結されてヘアピン構造を有することを特徴としても
よい。
【0040】
本発明の用語「ヘアピン」とは、単一鎖内の相補的な2つの領域が非相補的領域によって分離された上に二本鎖を形成する場合、ステムループ構造(stem-loop structure)をとる自己ハイブリダイゼーションした構造を意味する。前記相補的な2つの領域(本発明の場合、センス鎖とアンチセンス鎖)は、相補性の程度と相補性部位の方位が十分であれば十分な塩基対の結合が起こり、ステムと称する二重構造を形成し、非相補性領域はループ構造を形成し、前記相補的な2つの領域を連結させる。ループ部位は、ループ部位の核酸(または核酸類似体)間の塩基対の不在によって構成され、前記ヘアピン構造のループ部位は、センスと及びアンチセンス鎖の間の一本鎖部位として「介入する一本鎖」とも呼ばれる。
【0041】
本明細書において、前記相補的な2つの領域を2つの腕(arm)と呼ばれ、したがって、本明細書におけるステムは2つの腕(3’armおよび5’arm)からなることとして定める。よって、前記ヘアピン構造は、単一鎖内で互いに相補的な関係である3’腕(3’arm、すなわち単一鎖の3’末端側)と5’腕(5’arm、すなわち、単一鎖の5’末端側)の配列が非相補的なループ配列によって分離された上に二重構造を形成したことも意味する。
【0042】
本発明の二本鎖核酸分子が非相補的なループ配列によって分離され、ヘアピン形態の二重構造を形成する場合、前記ループは4~80個、4~75個、4~70個、4~65個、4~60個、4~55個、4~50個、4~45個、4~40個、4~35個、4~30個、4~25個、4~20個、4~15個または4~10個の塩基からなることができ、本発明による一実施例における前記ループは6個の塩基からなってもよい。また、前記ループにおいて、それを構成する一部の塩基配列が互いに相補的である場合、ワトソン・クリック塩基対を形成してステム構造を有することができる。前記ステム構造は、A及びUの間にワトソン・クリック塩基対が形成されたAUモチーフを含んでもよい。
【0043】
本発明による一実施例において、前記ループを構成する6つの塩基配列はAAAAAA(配列番号24)である。
【0044】
本発明の二本鎖核酸分子が非相補的なループ配列によって分離され、ヘアピン形態の二重構造である場合、前記核酸分子は「5’型のIIs制限酵素の認識部位-3~30nt(nucleotide)の長さの任意のヌクレオチド配列-ヘアピンループ-前記3~30ntの長さの任意のヌクレオチド配列に相補的な配列-前記タイプIIs制限酵素の認識部位に相補的な配列-Aテール-3’」の構造からなるものであってもよい。
【0045】
前記ヘアピン構造の二本鎖核酸分子における3~30ntの長さの任意のヌクレオチド配列は、前述した内容を参考してもよい。
前記ヘアピン構造の二本鎖核酸分子は、制限酵素の認識部位の反対側の末端がヘアピン構造を形成しているため、次世代塩基配列分析のためのライブラリー製造時にインサートにライゲーションできなかった遊離アダプターが非特異的にライゲーションされることをブロックすることができる。
【0046】
本発明の一具体例によれば、本発明の前記二本鎖核酸分子は、配列番号1で表される塩基配列のセンス鎖および配列番号2で表される塩基配列のアンチセンス鎖が相補的に結合した二本鎖核酸分子であってもよく、または非相補的なループ配列によって分離且つ介入された一本鎖である配列番号3で表される塩基配列からなる核酸分子であってもよい。
また、本発明は、前述の二本鎖核酸分子、DNAリガーゼおよびタイプIIs制限酵素を含む組成物を提供する。
本発明において、前記組成物は、次世代塩基配列分析でインデックスされたDNAライブラリー内の試料検出能向上用のもの、または次世代塩基配列分析のインデックスされたDNAライブラリーの製造過程におけるインサートへのライゲーションができていない遊離アダプター除去用のものでもよい。
【0047】
次世代塩基配列分析は大きく2段階に分けられる。第1段階は、分析対象となるDNAを次世代配列分析機器によりシーケンシングが可能な形態に作るDNAライブラリーの製造段階であり、第2段階は、製造されたDNAライブラリーを次世代塩基配列シーケンサーで分析する段階である。
一般的に、本発明における前記「DNAライブラリー」の製造段階は、以下を含む。便宜上、イルミナ(Illumina)社の次世代塩基配列シーケンサーを例に挙げて説明する。本明細書では、説明の便宜のためにイルミナ社の分析機器を例に挙げるだけで、その他の通常の次世代塩基配列シーケンサーを制限なく利用することができる。
1)分析するゲノムDNAを超音波分解(sonication)またはDNA切断酵素を利用(enzymatic DNA digestion)して一定の長さに切片化する。ただし、例えば、無細胞DNAのようにDNAが切片化されている場合、このような分解過程なしに次の段階を進行する。
2) 末端修復(End Repair):切片化された二本鎖DNAを構成する2つの一本鎖DNAの両側の末端部分の長さを互いに等しく合わせる。
3)アデノシンコンジュゲート(dA-Tailing):切片化された二本鎖DNAの3’末端に1つの塩基Aをコンジュゲートする。
4)アダプター接合:次世代塩基配列シーケンサーによるシーケンシングのために二本鎖DNA切片にインデックス(index)またはUMIを含むアダプターを接合する。
5)重合酵素連鎖反応(Polymerase Chain Reaction):PCRにより分析対象DNAを増幅する。
【0048】
前記過程によって生成されたDNA分子プールは、当該業界における一般的な「DNAライブラリー」であり、本発明で使用される「DNAライブラリー」という用語も同様の意味で解釈することができる。本発明において、前記「インデックスされたDNAライブラリー」とは、分析対象の二本鎖DNA切片の一末端または両端にインデックス配列を含むアダプターがライゲーションしたことを意味する(図1を参照)。
【0049】
本発明において、前記「アダプター」とは、シーケンシング(例えば、NGS)に使用するのに適した独特な配列であるシーケンシングプライマーが結合する部位、サンプルインデックス配列、およびフローセル結合配列を含んでもよい。
また、本発明において、前記アダプターは、前記シーケンシング(例えば、NGS)に使用するのに適した独特な配列であるプライマー部位(すなわち、シーケンシングプライマーが結合する部位)とサンプルインデックス配列の間、または前記サンプルインデックス配列とフローセル結合配列との間にランダム化DNAバーコードまたは独特な分子識別子(UMI、unique molecular identifier)をさらに含んでもよい。
【0050】
前記ランダム化DNAバーコードは、例えば、SHAPE-SEQ、文献[Lucks et al.、Proc Natl Acad Sci USA 108:11063-11068]を参照することができ、前記UMIは、例えば、文献[Kivioja et al.、Nature Methods 9,72-74(2012)];文献[Islam et al.、Nature Methods 11,163-166(2014)];文献[Karlsson et al.、Genomics. 2015 Mar; 105(3):150-8]の参照により理解することができる。
【0051】
前記シーケンシングに使用するのに適した配列は、所望のシーケンシング方法、例えば、次世代シーケンシング法、例えば、イルミナ(Illumina)、アイオン・トレント(Ion Torrent)またはロシュ(Roche)/454のようなライブラリーの製造方法、イルミナ・ソレクサゲノム・アナライザ(lllumina Solexa
Genome Analyzer),アプライド・バイオシステムズ(Applied
Biosystems) SOLiD TMシステム、アイオン・トレントTM 半導体配列分析器、パくバイオ(PacBio)(R)・リアルタイムシーケンシング、およびヘリコス(Helicos)TM 単一分子シーケンシング(SMS)と共に使用するために選択してもよい。例えば、WO2014020137号、文献[Voelkerding et al.、Clinical Chemistry 55:4 641-658(2009)]および文献[Metzker、Nature Reviews Genetics 11:31-46(2010)]が参照される。ThruPLEX DNA-seqキット(ルビコン(Rubicon);米国特許第7,803,550号;第8,071,312号;第8,399,199号;第8,728,737号参照)およびNEBNext(R) (ニューイングランド・バイオラプス(New England BioLabs);例えば、米国特許第8,420,319号を参照)を含む多数のキットが、NGSのためのDNAライブラリーの製造のために購買することが可能である。
【0052】
前記PCRにより生成されたDNAライブラリーは、インデックス配列、またはインデックス配列及びランダム化DNAバーコード配列(またはUMI)を共に含み、ここで、前記インデックス配列は、次世代塩基配列の分析時に分析対象ゲノムDNAが属するサンプルを区別する役割を遂行し、前記ランダム化DNAバーコード配列(またはUMI)は、分析対象のゲノムDNAの一本鎖DNA切片にバーコードを付与する役割を果たすことができる。
次世代塩基配列分析用のDNAライブラリーの製造において、分析対象のゲノムDNAの二本鎖DNA切片に次世代塩基配列分析のためのアダプターを接合することは、シーケンシングのために必須的段階である。インデックス配列が含まれたアダプターを用いたDNAライブラリーの製造方法は、異なるサンプル間の区別を可能にし、マルチプレックス・シーケンシングを進めることができるという点で利点がある。
しかし、DNAライブラリーの製造過程において、標的DNA切片(または、インサート)とライゲーションできなかった遊離アダプターがインデックスホッピングまたはUMIミックス(UMI mix)などをもたらすことによって、NGS結果の信頼性を低下させることもある。
【0053】
前記「インデックスホッピング」とは、異なるインデックスを含む各サンプルに由来のDNAライブラリを混合した後、マルチプレックスでシーケンシングを行う場合、PCR過程において各サンプルに由来の特定のインデックス配列を含む遊離アダプターまたはインデックスを含むプライマーが除去されず、他のインデックスを有するDNAライブラリーにプライマーとして作用しながらDNAライブラリー情報(すなわち、インデックス情報)が混在することを意味する(図2参照)。
【0054】
前記「UMIミックス」とは、同一サンプル内で特定の切片を標識するUMIが混ざってビアス(bias)をもたらすことを意味することであり、これも遊離アダプターがプライマーとして作用されることにより、前記遊離アダプターが有するUMIがPCR過程を通じる流入によって発生する(図3参照)。
【0055】
PCR過程でプライマーとして作用する遊離アダプター内の領域の例示を図4に示す。
【0056】
本発明の前記組成物は、インデックスされたDNAライブラリーの製造過程の中、標的DNA切片に結合しなかった遊離アダプターを切断することによりインデックスホッピング
および/またはUMIミックスの可能性を著しく低下させ、NGS結果の検出能を向上させる使用として使用してもよい。
【0057】
より具体的には、本発明の前記組成物は、遊離アダプター内でプライマーとして作用することができる相同性を有する領域であるシーケンシングプライマー結合部位(sequencing primer site)の一部または全部を切断し、前記シーケンシングプライマー結合部位とUMI(またはバーコード)配列および/またはインデックス配列を分離することによって、インデックスホッピングおよび/またはUMIミックスの可能性を著しく低下させる可能性がある。
【0058】
本発明の一態様において、本発明の前記組成物に含まれる二本鎖核酸分子およびDNAリガーゼを、遊離アダプターが含まれると考えられるDNAライブラリーに添加すると、アダプターがDNAセグメントに結合することと同じ様相でDNAリガーゼの作用によって本発明の二本鎖核酸分子と結合し、アダプター・二本鎖核酸分子複合体を形成する。前記複合体内には二本鎖核酸分子を構成するタイプIIs制限酵素の認識部位が含まれており、タイプIIs制限酵素は認識部位から1~20個のヌクレオチド内に切断位置(または切断部位)を有するため、前記アダプター二本鎖核酸分子複合体におけるアダプター領域内の配列はタイプIIs制限酵素処理によって切断される。
【0059】
本発明が提供する前記組成物が遊離アダプターを切断することによってインデックスホッピングおよび/またはUMIミックスを排除する過程を順次説明すると、以下の通りである。
(i)本発明が提供する二本鎖核酸分子の一末端、すなわちセンス鎖の5’末端およびアンチセンス鎖の3’末端に遊離アダプターの一末端、すなわちインデックスまたはUMIを含み、ライゲーションのための二重鎖構造を含むアダプター末端部位がライゲーションされる。
(ii)本発明が提供する二本鎖核酸分子に含まれるタイプIIs制限酵素の認識部位を制限酵素が認識する。
(iii)制限酵素の認識部位から1~25個のヌクレオチド内の配列を切断するタイプIIs制限酵素の特性に応じて、遊離アダプター内の配列が切断される。
【0060】
前記(iii)において、制限酵素によって切断される部分は、遊離アダプターのシーケンシングプライマー結合部位内の領域であるか、またはシーケンシングプライマー結合部位とUMI(または、バーコード)配列の境界領域であるか、またはシーケンシングプライマー結合部位とインデックス配列の境界領域であるか、またはUMI(またはバーコード)配列内の領域であるか、またはインデックス配列内の領域であってもよい。
切断されたアダプターは、以後の緩衝液で洗浄するか、またはビーズクリーンアップ(bead clean-up)によってDNAライブラリーから完全に除去することができる。
【0061】
本発明の一態様において、前記組成物に含まれる二本鎖核酸分子内の制限酵素の認識部位の配列及びタイプIIs制限酵素の種類は、DNAライブラリーの製造に用いられるアダプター内のシーケンシングプライマー結合部位の長さおよび配列に応じて、通常の技術者が適宜選択することができる。
アダプター内のシーケンシングプライマー結合部位の長さより長いか同等な制限位置(すなわち、切断部位)を示すタイプIIs制限酵素およびその認識部位の配列を含む二本鎖核酸分子を使用することが最も好ましいが、アダプター内のシーケンシングプライマー結合部位の長さよりも短い制限部位を示すタイプIIs制限酵素およびその認識部位の配列を含む二本鎖核酸分子を用いても、切断後にUMI(またはバーコード)配列および/またはインデックス配列に残存するシーケンシングプライマー結合部位の配列がこれに相補的な
配列であることを示すTm値がPCR過程でのアニーリング温度よりも著しく低い場合、インデックスホッピングまたはUMIミックスの問題が発生する可能性が非常に低い。
【0062】
本発明の一実施例による二本鎖核酸分子の作動様式を図5に示す。
【0063】
本発明において、前記「DNAリガーゼ」とは、ATPなどのヌクレオチド三リン酸の分解に応じてホスホジエステル結合を形成し、ヌクレオチド間の結合を触媒する酵素を意味する。本発明の二本鎖核酸分子をライゲーションできるものであれば、その種類は特に限定されず、その非限定的な例示として、T4 DNAリガーゼ、T3 DNAリガーゼ、T7 DNAリガーゼ、大腸菌DNAリガーゼ、Ampligase DNAリガーゼ、サークリーガーゼ(CircLigase TM )ssDNAリガーゼ、またはそれらの組み合わせでもよく、好ましくは、T4 DNAリガーゼでもよいが、これらに限定されない。
【0064】
本発明の前記組成物には、前述の二本鎖核酸分子、DNAリガーゼ及びタイプIIs制限酵素の他にも、ライゲーション及び制限酵素反応に必要な試薬、例えば、緩衝液、補助因子(例えば、Mg 2+ )、ATPなどを制限なく追加的に含んでもよい。
【0065】
また、本発明は、前記の二本鎖核酸分子、DNAリガーゼおよびDNAII制限酵素を含む、次世代塩基配列分析のインデックスされたDNAライブラリー内の遊離アダプターを除去用キットを提供する。
【0066】
本発明は、(a)分析対象ゲノムDNAの二本鎖DNA切片の両末端に次世代配列分析のためのアダプターを接合して製造した次世代配列分析用DNAライブラリーに、本発明に係る二本鎖核酸分子及びDNAリガーゼを処理し反応させる段階;(b)前記反応物にタイプIIs制限酵素を処理する段階を含む次世代配列分析用DNAライブラリー内の遊離アダプター除去法を提供する。
【0067】
本発明の前記方法は、前記(b)段階以後に緩衝液で洗浄するか、またはビーズクリーンアップ(bead clean-up)を行う段階をさらに含んでもよい。
【0068】
また、本発明は、次世代塩基配列分析のインデックスされたDNAライブラリー内の遊離アダプター除去用製剤を調製するための二本鎖核酸分子、DNAリガーゼおよびDNAII制限酵素の使用を提供する。
【発明の効果】
【0069】
本発明が提供する二本鎖核酸分子、組成物または方法によれば、次世代塩基配列分析のためのインデックスされたDNAライブラリーから遊離アダプターのみを選択的に除去することができ、次世代塩基配列分析時の遊離アダプターによるインデックスホッピング、UMIミックスなどの問題を防止することができる。
【図面の簡単な説明】
【0070】
図1】は、インデックスされたDNAライブラリーの定義を図式化して示す図である。
図2】は、インデックスホッピングの概念を図式化して示す図である。
図3】は、UMIミックスの概念を図式化して示す図である。
図4】は、DNAライブラリーの製造段階におけるPCR段階においてプライマーとして作用することができる遊離アダプターの4つの領域を示す。
図5】は、本発明による二本鎖核酸分子の作動様式を図式化して示す図である。
図6a】は、本発明による二本鎖核酸分子の具体例を図式化して示す図である
図6b】は、本発明による二本鎖核酸分子の具体例を図式化して示す図である。
図7】は、制限酵素(MmeI)の処理によるアダプターが切片化されるかを確認するためにビーズクリーンアップを行わずに結果物を確認した図である。
図8】は、図7の結果において各バンドがアダプター内のどの領域を示すかを図式的に示した図である。
図9】は、制限酵素処理による非特異的切断が起こるかを確認するために、PCR産物にMmeIを処理した後、非特異的な分解が現れるかを確認した結果である。
図10】は、サンプルDNAのNGSシーケンシング過程において、遊離アダプターによるUMIビアス(UMI bias)がどの程度であり、このUMIビアスが本発明による二本鎖核酸分子および制限酵素によって除去できるかを確認するための実験方法を図式化した図である。
図11】は、サンプルDNAのNGSシーケンシング過程において、遊離アダプターによるUMIビアスがどの程度であり、このUMIビアスが本発明による二本鎖核酸分子および制限酵素によって除去できるかを確認した実験結果である。
【実施例
【0071】
以下、本発明を以下の実施例により詳細に説明する。ただし、以下の実施例は、ただ本発明を例示するためのものであり、本発明がこれらによって限定されるものではない。
実験方法
1.二本鎖核酸分子およびヘアピン構造の核酸分子の製造
タイプIIs制限酵素であるMme1の認識部位の配列(GTCGGA)(配列番号25)の3’末端に制限酵素が作動できる構造を提供する任意の塩基配列(TTGTGC)(配列番号20)が結合した配列番号1のセンス鎖、および前記センス鎖に相補的な塩基配列の5’末端にTTが追加的に結合し、3’末端にAが追加的に結合した配列番号2のアンチセンス鎖をそれぞれ製作した。前記センス鎖及びアンチセンス鎖を同一なモル数で混合し、50℃で変性(denature)させ、常温で低速クールダウン(slow cooling down)して二本鎖核酸分子を形成した。前記二本鎖核酸分子をcutting linker_FRと命名した(図6A)。
また、配列番号3の塩基配列からなる一本鎖核酸分子を製作し、50℃で変性させた後、低俗クールダウンしてイントラ構造(intra structure)を形成するように誘導することにより、ヘアピン構造の核酸分子を形成した。前記ヘアピン構造の核酸分子をcutting linker_hairpinと命名した(図6B)。
【0072】
2.遊離アダプターと二本鎖核酸分子のライゲーション
アダプターに前記製造された二本鎖核酸分子を1:10の割合で処理し、T4 DNAリガーゼを処理してそれらのライゲーションを誘導した。
具体的に、以下の表2に列挙した実験物質を混合し、25℃で2時間インキュベートした後、65℃で20分間熱不活性化(heat inactivation)を行って反応を終了させた。
【表2】
【0073】
3.制限酵素の処理
前記実験方法2に従って反応させた反応混合物にタイプIIs制限酵素であるMmeIを処理し、制限酵素反応を誘導した。
具体的に、下記表3に列挙した実験物質を混合し、37℃で1時間インキュベートした後、65℃で20分間熱不活性化を行って反応を終了させた。
【表3】
【0074】
4.ビードクリーンアップ(bead clean-up)
2.0X accubead(HiAccuBead(AccuGene(Cat。ACN01.50)))を用いて、製造者の指示に従ってクリーンアップを行った。
【0075】
実験結果
1. Cutting linker_FRまたはcutting linker_hairpin、および制限酵素による遊離アダプターの切片化の確認
前記実験方法にて製造された二本鎖核酸分子、T4 DNAライガーゼおよびタイプIIs制限酵素(MmeI)により、DNAライブラリー内の遊離アダプターが除去できるかを確認した。具体的に、アダプター、本発明による二本鎖核酸分子、DNAライガーゼ、Mme1をそれぞれ混合し、前記実験方法に記載の過程を経て反応を誘導した後、tapestation(Agilent)を通じてその結果を確認した。
【0076】
一次的にMme1処理によりアダプターが切片化されるかを確認するために、ビーズクリーンアップを行わず、その結果物を確認し、サンプルをそれぞれ2ngずつロード(loading)した。
これに対する結果を図7および図8に示した。
図7および図8を参照すると、本発明による二本鎖核酸分子および制限酵素(MmeI)によって切断されたことと推定されるアダプター切片らが確認された。図7のレーン3、4にて示されたように、アダプターに本発明による二本鎖核酸分子をライゲーションした場合、丸2のバンドがシフト(shift)され、丸1のバンドが形成されることが確認され、ここにMme1を処理した場合、レーン1、2にて示されたように、丸1のバンドが消え、切断形切片(cutting fragment)である丸3が確認された(図8参照)。 丸3のバンドは、アダプターが切断され、切片化されて出た産物でクリーンアップ過程を通じて除去することができる。
【0077】
最後に、Mme1による非特異的切断(non-specific cutting)が起こるかを確認するために、PCR産物(非Mme1認識部位(no Mme1 recognition site))にMme1を処理した後に非特異的変性(non-specific degradation)が現れるかを確認した。その結果、図9に示したように、Mme1認識部位がない場合は全く切片化が観察されなかった。
【0078】
2.NGSシーケンシング過程における遊離アダプターの切断によるUMIビアの除去
前述の実験結果により、本発明が提供するcutting linker_FRおよびcutting linker_hairpinが遊離アダプターを効率的に切断することができることを確認した。
ここで、以後の実験では、サンプルDNAのNGSシーケンシング過程における遊離アダプターによるUMIビアスがある程度であり、このようなUMIビアスが前記cutting linker_FRまたはcutting linker_hairpinおよび制限酵素によって除去できるかを確認した。
【0079】
実験手続は以下の通りである(図10を参照)。
1. アダプターにおいて、UMI塩基配列をATGCATG (配列番号26) に固定した後、DNAライブラリーを作成し、ここにNNNCNNN (配列番号27) を有するアダプターをスパイク・イン(spike in)して、実際にDNAライブラリーを作る過程でどのくらいのUMIビアスが誘導されるかを確認した。
2.2種類のカッティング・リンカー(FR及びhairpin)のそれぞれを使って、遊離アダプターによるUMIビアが除去されるかを確認した。
3.結果の再現性のために独立的に2回の実験を行い、その平均と標準偏差(STDEV)をグラフで表した。
DNAライブラリーを作る過程で、インプット・DNA(input DNA)にATGCATG(配列番号26)を有するアダプターがライゲーションされ、UMIビアスがない場合、すべてのDNAライブラリーはATGCATG(配列番号26)UMIタイプを有りしなければならない。逆に、UMIビアスがある場合、そのDNAライブラリーはA
TGCATG(配列番号26)ではない他のランダムUMIタイプを有する。
【0080】
これらの事実に基づいて、各実験群におけるATGCATG(配列番号26)配列のUMIを有するリード(read)の%を結果として算出し、以下の表4および図11に示した。
【表4】
【0081】
前記の表4および図11のMockのみの場合、固定形UMI(fixed UMI)(ATGCATG)(配列番号26)を有するアダプターのみをライゲーションさせたライブラリーをシーケンシングした後、全リードのうち固定形UMIを有するリードの%を得たことである。Mock_遊離アダプターの場合、固定形UMIのライゲーションを誘導した後、65℃で不活性化させ、その後に遊離形UMI(free UMI)(NNNANNN)(配列番号28)アダプターをスパイク・インしたものである。この場合、遊離形UMIアダプターインサートにライゲーションする過程には参加しなくなり、UMIビアスに該当する遊離アダプターとして残る。この時、最終的にライブラリーを作ってシーケンシングした後、同様にmock UMI %を確認した場合、70.18%まで下げたことを確認することができる。これらの結果は、UMIがライゲーションではなくPCR過程のプライマーとして作用し、30%まで流入できることを示している。
【0082】
この場合、本発明が提供する二本鎖核酸分子および制限酵素を用いて遊離アダプターにライゲーションを誘導した後、スパイク・インを行った。前記二本鎖核酸分子と制限酵素によって遊離アダプターが除去されなかった場合、実験結果上、Mock UMIを有するリードの割合が70%程度で現れなければならないが、実際の結果上、97.74、95.25%で現れ、Mock UMIを入れた対照群レベルに再度回復することが確認できた(Mock_free adaptor_linkerFR、Mock_free adaptor_linker_hairpin)。
【0083】
この結果により、本願発明が提供する二本鎖核酸分子と制限酵素により遊離アダプターが大部分除去され、本発明の二本鎖核酸分子の使用によりUMIビアスを大部除去できることを確認した。
【産業上の利用可能性】
【0084】
本発明が提供する二本鎖核酸分子、組成物または方法によれば、次世代塩基配列分析のためのインデックスされたDNAライブラリーから遊離アダプターのみを選択的に除去することができ、次世代塩基配列分析時の遊離アダプターによるインデックスホッピング(index hopping)、UMIミックス(UMI mix)などの問題を防止することができ、産業上の利用可能性が非常に高い。
図1
図2
図3
図4
図5
図6a
図6b
図7
図8
図9
図10
図11
【配列表】
2023510515000001.app
【国際調査報告】