特許7602621 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ナノディグンバイオ（ナンジン）バイオテクノロジーカンパニーリミテッドの特許一覧

特許7602621ペアエンドライブラリータグ組成物及びそれのＭＧＩシーケンシングプラットフォームにおける使用

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
1C
2A
2B
3A
3B
4
5
6
7A
7B
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-12-10

(45)【発行日】2024-12-18

(54)【発明の名称】ペアエンドライブラリータグ組成物及びそれのＭＧＩシーケンシングプラットフォームにおける使用

(51)【国際特許分類】

C40B 70/00 20060101AFI20241211BHJP

C12Q 1/6869 20180101ALI20241211BHJP

C12Q 1/6876 20180101ALI20241211BHJP

C40B 40/06 20060101ALI20241211BHJP

【ＦＩ】

C40B70/00 ZNA

C12Q1/6869 Z

C12Q1/6876 Z

C40B40/06

【請求項の数】 7

(21)【出願番号】P 2023511829

(86)(22)【出願日】2020-12-28

(65)【公表番号】

(43)【公表日】2023-09-08

(86)【国際出願番号】 CN2020139919

(87)【国際公開番号】W WO2022036977

(87)【国際公開日】2022-02-24

【審査請求日】2023-02-14

(31)【優先権主張番号】202010838955.X

(32)【優先日】2020-08-19

(33)【優先権主張国・地域又は機関】CN

(73)【特許権者】

【識別番号】523051996

【氏名又は名称】ナノディグンバイオ（ナンジン）バイオテクノロジーカンパニーリミテッド

【氏名又は名称原語表記】ＮＡＮＯＤＩＧＭＢＩＯ（ＮＡＮＪＩＮＧ）ＢＩＯＴＥＣＨＮＯＬＯＧＹＣＯ．，ＬＴＤ

(74)【代理人】

【識別番号】110002066

【氏名又は名称】弁理士法人筒井国際特許事務所

(72)【発明者】

【氏名】ワン，ビャオ

(72)【発明者】

【氏名】フー，ユーガン

(72)【発明者】

【氏名】ウー，チアン

【審査官】福間信子

(56)【参考文献】

【文献】中国特許出願公開第１１１５３４５１８（ＣＮ，Ａ）

【文献】国際公開第２０２０／１１８５９６（ＷＯ，Ａ１）

【文献】中国特許出願公開第１１１４５５４６９（ＣＮ，Ａ）

【文献】中国特許出願公開第１０６４９７９２０（ＣＮ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｃ１２Ｎ

ＣＡｐｌｕｓ／ＭＥＤＬＩＮＥ／ＥＭＢＡＳＥ／ＢＩＯＳＩＳ（ＳＴＮ）

(57)【特許請求の範囲】

【請求項1】

ペアエンドライブラリータグ組成物であって、前記ペアエンドライブラリータグ組成物は、複数の５’末端のライブラリータグと、複数の３’末端のライブラリータグとを含み、複数の前記５’末端のライブラリータグの長さは、全て同じであり、複数の前記３’末端のライブラリータグの長さは、全て同じであり、且つ前記ペアエンドライブラリータグ組成物において、同じ位置で各塩基の出現回数は同じであり、
前記複数の前記５’末端のライブラリータグの長さは、複数の前記３’末端のライブラリータグの長さと同じであり、
前記ペアエンドライブラリータグ組成物において、任意の２種類の前記ライブラリータグの間に、少なくとも３つの塩基の違いが存在し、且つ、任意の１種類の前記ライブラリータグ中に連続する同一塩基数が３以下であり、
任意の１種類の前記ライブラリータグのＧＣ含有量は、４０％～６０％であり、
前記ペアエンドライブラリータグ組成物は、４タグバランスのペアエンドライブラリータグの組み合せ、又は８タグバランスのペアエンドライブラリータグの組み合せを含み、前記４タグバランスのペアエンドライブラリータグの組み合せは、４ｎ個の前記５’末端のライブラリータグと、４ｎ個の前記３’末端のライブラリータグとの組み合せを指し、前記８タグバランスのペアエンドライブラリータグの組み合せは、８ｎ個の前記５’末端のライブラリータグと、８ｎ個の前記３’末端のライブラリータグとの組み合せを指しており、ここで、ｎは１以上の自然数であり、
前記４タグバランスのペアエンドライブラリータグの組み合せにおいて、前記５’末端のライブラリータグは、表１に示す９６群中の任意の一群又は複数群から選択され、前記３’末端のライブラリータグ群は、表１に示す９６群中の、前記５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択され、
前記８タグバランスのペアエンドライブラリータグの組み合せにおいて、前記５’末端のライブラリータグは、表２に示す４８群中の任意の一群又は複数群から選択され、前記３’末端のライブラリータグ群は、表２に示す４８群中の、前記５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択される、
ペアエンドライブラリータグ組成物。

【請求項2】

ＭＧＩシーケンシングプラットフォームに基づくペアエンドライブラリータグ付けの増幅プライマー組成物であって、前記増幅プライマー組成物は、複数のペアエンドライブラリータグ付けの増幅プライマー対の組み合せを含み、各前記増幅プライマー対は、５’末端のライブラリータグと、３’末端のライブラリータグとを含み、
複数の前記増幅プライマー対の５’末端のライブラリータグの長さは、全て同じであり、複数の前記増幅プライマー対の３’末端のライブラリータグの長さは、全て同じであり、且つ、同じ位置で各塩基の出現回数は同じであり、
複数の前記増幅プライマー対の５’末端のライブラリータグの長さは、複数の前記増幅プライマー対の３’末端のライブラリータグの長さと同じであり、
前記増幅プライマー組成物において、任意の２種類のライブラリータグの間に、少なくとも３つの塩基の違いが存在し、且つ、任意の１種類のライブラリータグ中に連続する同一塩基数が３以下であり、
複数の前記５’末端のライブラリータグと複数の前記３’末端のライブラリータグのＧＣ含有量は、いずれも４０％～６０％であり、
前記増幅プライマー組成物は、４タグバランスの４ｎ個の増幅プライマー対の組み合せ、又は８タグバランスの８ｎ個の増幅プライマー対の組み合せを含み、前記４タグバランスのペアエンドライブラリータグの組み合せは、４ｎ個の前記５’末端のライブラリータグと、４ｎ個の前記３’末端のライブラリータグとの組み合せを指し、前記８タグバランスのペアエンドライブラリータグの組み合せは、８ｎ個の前記５’末端のライブラリータグと、８ｎ個の前記３’末端のライブラリータグとの組み合せを指しており、ここで、ｎは１以上の自然数であり、
前記４タグバランスの４ｎ個の増幅プライマー対において、前記５’末端のライブラリータグは、表１に示す９６群中の任意の一群又は複数群から選択され、前記３’末端のライブラリータグ群は、表１に示す９６群中の、前記５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択され、
前記８タグバランスの８ｎ個の増幅プライマー対において、前記５’末端のライブラリータグは、表２に示す４８群中の任意の一群又は複数群から選択され、前記３’末端のライブラリータグ群は、表２に示す４８群中の、前記５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択される、
増幅プライマー組成物。

【請求項3】

各前記増幅プライマー対は、５’末端共通増幅配列と、３’末端共通増幅配列とをさらに含み、前記５’末端共通増幅配列は、前記５’末端のライブラリータグの上流に位置する共通配列と、前記５’末端のライブラリータグの下流に位置する共通配列とを含み、前記３’末端共通増幅配列は、前記３’末端のライブラリータグの上流に位置する共通配列と、前記３’末端のライブラリータグの下流に位置する共通配列とを含み、
前記５’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９３であり、前記５’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９４であり、前記３’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９５であり、前記３’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９６であり、或いは、
前記５’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９３であり、前記５’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９７であり、前記３’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９５であり、前記３’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９８である、
請求項２に記載の増幅プライマー組成物。

【請求項4】

請求項２に記載の増幅プライマー組成物を含む、
シーケンシングライブラリー構築試薬キット。

【請求項5】

前記試薬キットは、バブルアダプターをさらに含み、前記バブルアダプターは、第１アダプター配列と、第２アダプター配列とを含み、前記第１アダプター配列はＳＥＱＩＤＮＯ:７６９であり、前記第２アダプター配列はＳＥＱＩＤＮＯ:７７０であり、或いは、前記第１アダプター配列はＳＥＱＩＤＮＯ:７７３であり、前記第２アダプター配列はＳＥＱＩＤＮＯ:７７４である、
請求項４に記載の試薬キット。

【請求項6】

請求項４又は５に記載の試薬キットを採用して構築する、
ＭＧＩシーケンシングプラットフォームに基づくシーケンシングライブラリーの構築方法。

【請求項7】

請求項１に記載のペアエンドライブラリータグ組成物、又は請求項２に記載の増幅プライマー組成物を含む、
シーケンシングライブラリー。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、血漿ＤＮＡライブラリー構築の領域に関し、具体的には、ペアエンドライブラリータグ組成物及びそれのＭＧＩシーケンシングプラットフォームにおける使用に関する。

【背景技術】

【0002】

ＭＧＩハイスループットシーケンサーのシーケンシング過程では、より多くのサンプルのシーケンシングを実現するために、各サンプルを異なるタグ配列(Ｉｎｄｅｘ)で標記してシーケンシングした後に分割する必要がある。しかし、既存のＭＧＩシーケンシングプラットフォームは基本的にシングルエンドタグのライブラリーを使用している。シングルエンドタグ(Ｉｎｄｅｘ)には天然の欠陥が存在するため、サンプル間のクロストークが発生しやすい。合成、実験操作及びシーケンシングの各ステップにタグアダプター又はプライマーによる汚染で、クロストークが避けられないため、サンプル間の低頻度のクロストークを解決する必要があり、現在のところ、サンプル間のクロストークを効果的に除去できるペアエンドタグの方法が最適である。

【0003】

ペアエンドタグを採用することは、シングルエンドタグを採用することと比較して、シーケンスデータを分割する場合には、シーケンサーがタグ配列を正確に読み取ることができるかどうかは、シーケンスデータの有効分割に重大な影響を与える。ペアエンドタグ配列の読み取りに問題があると、シーケンスデータの有効分割率が低下し、シーケンシングコストが上昇することになる。

【0004】

従って、如何に、ペアエンドタグの方式で混合シーケンスのライブラリーを標記して、一方ではサンプルのクロストーク現象を減らし、他方では多サンプル混合シーケンシング後のデータの有効分割率を向上させることは、問題となっている。

【発明の概要】

【発明が解決しようとする課題】

【0005】

本発明の主な目的は、現在のＭＧＩシーケンシングプラットフォームがシングルエンドタグを利用してライブラリーを標記する際のサンプルクロストークという問題を解決するために、ペアエンドライブラリータグ組成物及びそれのＭＧＩシーケンシングプラットフォームにおける使用を提供することである。

【課題を解決するための手段】

【0006】

上記の目的を実現するために、本出願の第１の態様によれば、ペアエンドライブラリータグ組成物が提供され、ペアエンドライブラリータグ組成物は、複数の５’末端のライブラリータグと、複数の３’末端のライブラリータグとを含み、複数の５’末端のライブラリータグの長さは、全て同じであり、複数の３’末端のライブラリータグの長さは、全て同じであり、且つ、ペアエンドライブラリータグ組成物において、同じ位置で各塩基の出現回数は同じである。

【0007】

さらに、複数の５’末端のライブラリータグの長さは、複数の３’末端のライブラリータグの長さと同じであり、好ましくはいずれも６～１０ｂｐの間のいずれかの固定長さであり、好ましくは、ペアエンドライブラリータグ組成物において、任意の２種類のライブラリータグの間に、少なくとも３つの塩基の違いが存在し、且つ、任意の１種類のライブラリータグ中に連続する同一塩基数が３以下であり、好ましくは、任意の１種類のライブラリータグのＧＣ含有量は４０～６０％であり、好ましくは、ペアエンドライブラリータグ組成物は、４タグバランスのペアエンドライブラリータグの組み合せ、又は８タグバランスのペアエンドライブラリータグの組み合せを含み、ここで、４タグバランスのペアエンドライブラリータグの組み合せは、４ｎ個の５’末端のライブラリータグと、４ｎ個の３’末端のライブラリータグとの組み合せであり、８タグバランスのペアエンドライブラリータグの組み合せは、８ｎ個の５’末端のライブラリータグと、８ｎ個の３’末端のライブラリータグとの組み合せであり、ここで、ｎは１以上の自然数である。

【0008】

さらに、４タグバランスのペアエンドライブラリータグの組み合せにおいて、５’末端のライブラリータグは、表１に示す９６群中の任意の一群又は複数群から選択され、３’末端のライブラリータグ群は、表１に示す９６群中の、５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択される。

【0009】

さらに、８タグバランスのペアエンドライブラリータグの組み合せにおいて、５’末端のライブラリータグは、表２に示す４８群中の任意の一群又は複数群から選択され、３’末端のライブラリータグ群は、表２に示す４８群中の、５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択される。

【0010】

本発明の第２の態様によれば、ＭＧＩシーケンシングプラットフォームに基づくペアエンドライブラリータグ付けの増幅プライマー組成物が提供され、該増幅プライマー組成物は、複数のペアエンドライブラリータグ付けの増幅プライマー対の組み合せを含み、各増幅プライマー対は、５’末端のライブラリータグと、３’末端のライブラリータグとを含み、複数の増幅プライマー対の５’末端のライブラリータグの長さは、全て同じであり、複数の増幅プライマー対の３’末端のライブラリータグの長さは、全て同じであり、且つ同じ位置で各塩基の出現回数は同じである。

【0011】

さらに、複数の増幅プライマー対の５’末端のライブラリータグの長さは、複数の増幅プライマー対の３’末端のライブラリータグの長さと同じであり、好ましくは、５’末端のライブラリータグと３’末端のライブラリータグの長さは、いずれも６～１０ｂｐの間のいずれかの固定長さであり、好ましくは、増幅プライマー組成物において、任意の２種類のライブラリータグの間に、少なくとも３つの塩基の違いが存在し、且つ、任意の１種類のライブラリータグ中に連続する同一塩基数が３以下であり、好ましくは、複数の５’末端のライブラリータグと複数の３’末端のライブラリータグのＧＣ含有量は、いずれも４０～６０％であり、好ましくは、増幅プライマー組成物は、４タグバランスの４ｎ個の増幅プライマー対の組み合せ、又は８タグバランスの８ｎ個の増幅プライマー対の組み合せを含み、ｎは１以上の自然数である。

【0012】

さらに、４タグバランスの４ｎ個の増幅プライマー対において、５’末端のライブラリータグは、表１に示す９６群中の任意の一群又は複数群から選択され、３’末端のライブラリータグ群は、表１に示す９６群中の、５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択され、好ましくは、８タグバランスの８ｎ個の増幅プライマー対において、５’末端のライブラリータグは、表２に示す４８群中の任意の一群又は複数群から選択され、３’末端のライブラリータグ群は、表２に示す４８群中の、５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択される。

【0013】

さらに、各増幅プライマー対は、５’末端共通増幅配列と、３’末端共通増幅配列とをさらに含み、５’末端共通増幅配列は、５’末端のライブラリータグの上流に位置する共通配列と、５’末端のライブラリータグの下流に位置する共通配列とを含み、３’末端共通増幅配列は、３’末端のライブラリータグの上流に位置する共通配列と、３’末端のライブラリータグの下流に位置する共通配列と、を含み、好ましくは、５’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９３であり、５’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９４であり、３’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９５であり、３’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９６であり、或いは、
５’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９３であり、５’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９７であり、３’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９５であり、３’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９８である。

【0014】

本発明の第３の態様によれば、上記のいずれかの増幅プライマー組成物を含むシーケンシングライブラリー構築試薬キットが提供される。

【0015】

さらに、試薬キットは、バブルアダプターを含み、バブルアダプターは、第１アダプター配列と、第２アダプター配列とを含み、第１アダプター配列はＳＥＱＩＤＮＯ:７６９であり、第２アダプター配列はＳＥＱＩＤＮＯ:７７０であり、或いは、第１アダプター配列はＳＥＱＩＤＮＯ:７７３であり、第２アダプター配列はＳＥＱＩＤＮＯ:７７４である。

【0016】

本発明の第４の態様によれば、上記試薬キットを採用して構築する、ＭＧＩシーケンシングプラットフォームに基づくシーケンシングライブラリーの構築方法が提供される。

【0017】

本発明の第５の態様によれば、シーケンシングライブラリーが提供され、該シーケンシングライブラリーは、上記ペアエンドライブラリータグ組み合せ、又は上記のいずれかの増幅プライマー組成物を含む。

【発明の効果】

【0018】

本発明の技術スキームを適用し、ペアエンドライブラリータグ及び最適化されたペアエンドライブラリータグ組み合せを導入し、ペアエンドライブラリータグを利用してデータ分割を行うことにより、合成、実験及びシーケンシング過程時に生じるクロストーク問題を解決することができ、検出結果をより正確にすることができる。

【0019】

さらに、ペアエンドライブラリータグ組み合せ中の各５’末端のライブラリータグの長さが同じであり、３’末端のライブラリータグの長さも同じであることを制御し、且つ同じ位置で各塩基の出現回数は同じであることを限定することにより、該組成物中のペアエンドタグの塩基の出現確率が同じであるため、該組成物中のペアエンドタグ付けのアダプター又はライブラリー増幅プライマーを合成する場合、ペアエンドライブラリータグ塩基のバランスの良い複数のライブラリーを得ることができ、これらの複数のライブラリーを混合してシーケンシングする際に、これらの混合ライブラリー中の各ライブラリーのペアエンドタグの読み取り正確性が高く、さらにライブラリーの有効分割率を向上させる。

【図面の簡単な説明】

【0020】

本出願の一部を構成する明細書の添付図面は、本発明のさらなる理解を提供するために用いられ、本発明の概略的な実施例及びその説明は、本発明を説明するために用いられ、本発明の不当な制限を構成するものではない。添付の図面は、下記の通りである。

【0021】

【図1A】シングルエンドタグではなくペアエンドタグを使用するＭＧＩシーケンシングプラットフォームのクロストーク除去のための利点を示す。

【図1B】シングルエンドタグではなくペアエンドタグを使用するＭＧＩシーケンシングプラットフォームのクロストーク除去のための利点を示す。

【図1C】シングルエンドタグではなくペアエンドタグを使用するＭＧＩシーケンシングプラットフォームのクロストーク除去のための利点を示す。

【図2A】ＭＧＩのシングルエンドタグアダプターを示す。

【図2B】ＭＧＩのシングルエンドタグアダプターを示す。

【図3A】ＭＧＩ的ペアエンドタグアダプターを示す。

【図3B】ＭＧＩ的ペアエンドタグアダプターを示す。

【図4】ＭＧＩプラットフォームの２種類のペアエンドタグのライブラリー構築の実現過程を示す。

【図5】本発明のペアエンドタグスキームはシングルエンドタグアンプリコンスキームと互換性があることを示す。

【図6】本出願のペアエンドタグ増幅プライマーはシングルエンドタグの分子タグアダプターと互換性があることを示す。

【図7A】４バランスと８バランスタグ配列塩基バランス型を示す。

【図7B】４バランスと８バランスタグ配列塩基バランス型を示す。

【図8】４バランスと８バランスの多混合過程中の塩基バランスの比較を示す。

【図9】２種類ライブラリー構築スキームの収量比較を示す。

【図10】４バランスと８バランスの１２混合シーケンシング過程中のデータ分割差を示す。

【発明を実施するための形態】

【0022】

矛盾がない限り、本出願の実施例は特定の例示に過ぎず、一意に限定されるものではなく、本出願の実施例及び実施例における特徴は互いに組み合わせることができることに留意されたい。以下、本発明を実施例に関連させて詳細に説明する。

【0023】

用語の説明
ペアエンドタグアダプター:ハイスループットシーケンシングの時、各断片の末端にユニバーサルシーケンスアダプターを付加する必要があり、アダプターの非相補領域にそれぞれ有する可変配列領域配列は、タグ配列であり、それはシーケンシングの時にデータの分割に使用される。

【0024】

タグ配列塩基バランス:ＤＮＡ配列は、Ａ、Ｔ、Ｇ、Ｃの４種類の塩基からなり、シーケンシング過程中に効率よく読み取るために、タグ配列の各位置に均等な割合の塩基が存在するように１群のタグ配列を組み立てる。

【0025】

背景技術で述べたように、ＭＧＩのハイスループットシーケンサーは、シングルエンドタグ配列でライブラリーを構築すると、ある程度の割合のサンプル間のクロストークが発生する(これは、Ｉｌｌｕｍｉｎａのシーケンシングプラットフォームにも存在する現象で、ＭＧＩプラットフォームとＩｌｌｕｍｉｎａプラットフォームとがシーケンシング過程が大きく異なるものの、アダプター配列合成、ライブラリー構築及びハイブリダイゼーション捕捉過程では、どうしてもサンプル間のタグクロストークを引き起こすことは避けられない)。

【0026】

図１Ａに示すように、実験で１％のクロストークがある場合、アダプター合成、ライブラリー構築、ハイブリダイゼーション捕捉又はシーケンシングにかかわらず、すべて同じクロストーク効果を持つことになる。現在、サンプル間のクロストークを解决する最良の方法は、ライブラリー構築の過程でペアエンドタグ配列を導入することであり、図１Ｂに示すように、クロストークの問題を解决するには、各実験ステップをできるだけ制御しながらペアエンドタグ配列を導入する方法しかない。図１Ｃに示すように、ペアエンドタグスキームは、シングルエンドスキームよりもクロストークを１００倍(１％から０.０１％)低減する。

【0027】

従って、本出願は、ＭＧＩシーケンシングプラットフォームのサンプルクロストーク問題を解决するために、ＭＧＩの既存のシングルエンドタグをペアエンドタグに変更することによっても解決を試みている。具体的な開発の考え方や経緯は以下の通りである。

【0028】

ＭＧＩのライブラリー構築スキームは、ＩｌｌｕｍｉａのＹ型アダプターと異なるバブルアダプターを採用し、ＭＧＩのシングルエンドタグはアダプター内に融合すること(図２Ｂを参照)であってもよく、分離されたスキーム(図２Ａを参照)であってもよいが、ペアエンドタグの配列は、前端配列と融合することはできず(図３Ｂを参照し、前端でタグ配列を融合すると、前端相補領域が７ｂｐしかないため、中間の泡状構造がより長くなり、この構造は安定性が非常に悪く、実現効率が悪く、タグ配列プライマーとユニバーサルアダプターとが分離された截断型スキームよりも実現効果は悪い)、ユニバーサルアダプター及び分離されたペアエンドタグの増幅プライマー構造形式のみを採用できる(図３Ａを参照)。

【0029】

発明者らは、図３Ａに示す構造形式に従ってペアエンドタグをライゲーションしたが、実際使用の過程で、バブルアダプターの中間泡状が大きすぎてアニール二次構造の安定性に影響を与え、アニールが不十分だとアダプターライゲーション効率(平均ライゲーション効率は２０％～４０％である)に影響を与えることが分かった。ＭＧＩのバブルアダプターは、ＩｌｌｕｍｉｎａのＹ型アダプターのペアエンドタグの様にお互いに融合させることができることとは異なる。

【0030】

さらなる研究から分かるように、ＭＧＩのバブルアダプターの中間領域非対合塩基は、図４中のスキーム１に示すように、３０±５ｂｐであってもよく、この時に対合塩基が２０±２ｂｐである場合、より安定なアニーリングライゲーションを形成しやすく、ライゲーション効率を向上でき、中間領域非対合塩基は、図４中のスキーム２に示すように、４５±５ｂｐであってもよく、この時に対合塩基が２５±２ｂｐである場合、形成されたアニーリングライゲーションがより安定で、ライゲーション効率もより高くなる。

【0031】

そして、発明者らは、スキーム２と比較して、スキーム１は、第１に、泡状領域が３０±５ｂｐであるアダプターはアニーリングが安定で、相補を必要とする領域が少なく、安定でライゲーションに寄与する、第２に、シングルエンドタグのアンプリコンに適合し、図５のようにアンプリコンをシングルエンドとペアエンドタグで切り替えられる、第３に、図６のようにシングルエンド分子タグアダプターと互換性がある、というメリットを有することを見出した。

【0032】

さらなる研究の結果、発明者らは、上記スキーム１がスキーム２よりも優れているにもかかわらず、ペアエンドタグ付けのＭＧＩシーケンシングプラットフォームのシーケンスライブラリーを得ようとする場合、スキーム１又はスキーム２のいずれかがその目的を達成することも見出した。ペアエンドタグで構築したライブラリーをさらに利用してシーケンシング及びシーケンシング後のデータ分割を行う場合、図１Ｂに示すように、ＭＧＩのペアエンドタグアダプターは、データを分割するためには両端のタグ配列がいずれも正しいことが必要であり、シーケンシング時の塩基バランス要件がシングルエンドタグよりもさらに厳しいことを発明者らは見出した。

【0033】

つまり、ペアエンドタグは、サンプルのクロストーク問題を解決するものの、シーケンスの塩基バランス要件が非常に厳しく、塩基バランスが悪いとシーケンスデータの正確な読み取りに重大な影響を与え、データの効果的な分割に影響を及ぼす。

【0034】

さらに正確にデータを分割するために、ペアエンドタグの塩基数がすべて１０である場合を例として、発明者らは、１)各タグ配列の間に、３つの塩基の違いが存在する、２)各本配列のＧＣ含有量を０.４～０.６の間に制御する、３)同じ連続する塩基数が３以下である、という塩基スクリーニング規則に従って、ペアエンドタグに対して塩基バランスを最適化した。

【0035】

そして、該タグ配列が増幅プライマー３’末端の共通プライマーとヘアピンフォールドなどの二次構造を形成し、従って該増幅プライマーの増幅効率を低下させ、同時に混合ライブラリー全体中の各タグ塩基のバランスに影響を与え、さらに後続の各タグの読み取り正確性に影響を与え、それによってシーケンスデータ分割の正確性を低下させないかを評価するように、前記規則に従ってスクリーニングされた各本タグ配列の二次構造評価を行った。

【0036】

上記スクリーニングと最適化規則に従って、本出願では、３８４種類の４タグバランスと３８４種類の８タグバランスの配列を最適化する。４タグバランスとは、４個１群のタグ配列バランスであり、図７Ａに示すように(表４中の前の１～４号タグに対応する)、４個１群のタグ配列は、タグの１から１０位に、各塩基Ａ、Ｔ、ＧとＣをそれぞれ１つ有する。同様に、８タグバランスとは、８個１群のタグ配列バランスであり、図７Ｂに示すように(表５中の前の１～８号タグに対応する)、８個１群のタグ配列は、タグの１から１０位に、各塩基Ａ、Ｔ、ＧとＣをそれぞれ２つ有する。

【0037】

本出願の複数回の試験によると、４個１群のバランスは、最小のバランス単位であり、最適な組み合せであることが明らかになった。４バランスの組み合せは、４個、８個、１２個及び１６個などの４の倍数のバランス組み合せを組み立てることができるが、８バランスの組み合せは、８個と１６個などの８の倍数のバランス組み合せを組み立てる必要がある。

【0038】

図８に示すように(左側の４バランス組み合せのタグ配列は、表１中の最初の４群増幅プライマー群に付けられたライブラリータグ組み合せに対応し、右側の８バランス組み合せのライブラリータグは、表２中の最初の２群増幅プライマー群に付けられたライブラリータグ組み合せに対応する)、４個ライブラリータグを混合してシーケンシングする場合、４バランス中の各塩基がバランスしているため、各塩基の割合は２５％であるが、８バランス組み合せのライブラリータグを採用する場合、各塩基の割合は０～５０％である。

【0039】

８の倍数、例えば８個又は１６個のサンプルを混合してシーケンシングする場合、ライブラリータグを組み合って各塩基の割合は２５％で、バランスが取れている。１２個のサンプルを混合してシーケンシングする場合、８バランス組み合せのライブラリータグ中の各塩基の割合は１６.７％～３３.３％の間にある。

【0040】

なお、４バランスの非整数倍は８バランスの組み合せよりもバランスが良く、４バランスの適用は、ＭＧＩシーケンサーのスケジューリングに有利である。ＭＧＩシーケンサーのシーケンススループットが高くなるにつれて、本出願に最適化された３８４種類の４バランスのタグ組み合せを採用して、互いに近接した各４個を１群にするのはスケジューリングに有利である(表１の４バランスの３８４種類のタグ配列を参照)。最適化された３８４種類の８バランスのタグ組み合せは、互いに近接した各８個を１群にするのは、同様にスケジューリングに有利である(表２の８バランスの３８４種類のタグ配列を参照)。

【0041】

好ましくは、本出願中の２種類のバランスタグは、ペアエンド増幅プライマーを組み立てる時、プライマー１配列が３８４種類の番号のフォワード配列であり、プライマー２が３８４種類の番号のリバース配列であり、本発明の一好ましい推奨配列方式に過ぎない。実際応用中で、実際のニーズに合わせて配置を組み合わせることも可能である。例えば、下記の表１に示すように、プライマー１として９６群中のいずれかを選択した場合、プライマー２として残りの９５群中のいずれかを選択することができる。

【0042】

もちろん、混合したサンプルの数が４より多い場合、例えば８や１２であっても、プライマー１として選択されたタグ群番号が、プライマー２として選択されたタグ群番号と異なっていればよい。例えば、プライマー１として最初の３群を選択し、プライマー２として残りの９３群から任意の３群を選択することができる。類推すると、４の整数倍のサンプルを混合してシーケンスを行う場合、この規則に従ってペアエンライブラリータグを選択することができる。

【0043】

混合したサンプルが４の整数倍ではない場合、サンプルシーケンスデータ量の多い４つを１群のバランスタグ組み合せに優先的に配置し、サンプルシーケンス量の４より少ないサンプルをさらなる１群のバランスの他のタグ組み合せに配置してライブラリーを構築してシーケンシングを行い、この場合、４バランスの組み合せを配置することは、８バランスの組み合せより明らかに有利である。４バランスの組み合せは、４の整数倍の半分が８バランスのものより有利なこと(４，１２，２０)に加え、非整数倍の組み合せも８バランスの組み合せを上回り、４ｎ＋１と４ｎ＋２の場合でも８バランス組み合せの同じサンプル混合シーケンスよりもバランスが良くなっている。

【0044】

したがって、４バランスは、８バランスとの比較では、１)４バランスの組み合せでバランスしたサンプルの組み合せ種類は８バランスの２倍である、２)バランスしていない３群の組み合せにおいて、４ｎ＋１と４ｎ＋２の組み合せも８バランスの組み合せよりバランスが良い、３)サンプル間のシーケンスデータ量に差がある場合、４バランスのものはバランスに近い組み合わせで配置しやすく、ビッグデータサンプルがバランスの組み合せで優先的に配置され、小さなシーケンス量のサンプルがバランスされなくてもよい、というメリットがある。

【0045】

【表1】

【0046】

【表2】

【0047】

４バランス群の方のデータ分割率が高いのは、シーケンサーがバランス構成の塩基をより正確に読み取るからで、塩基がバランスしていないと、間違って読み取られ、データ分割率が低くなることを招く。１２個のサンプルを等しい割合で混合してシーケンシングする場合、それぞれ４バランスと８バランスのタグ配列でライブラリーを構築してシーケンシングし、データの分割結果から見ると、図１０に示すように、４バランスのタグ配列は、１２個のサンプルのデータ分割はあまり変動せず、８バランスのタグ配列は、１２個のサンプルのデータ分割が一部のサンプルで著しく低くなる。

【0048】

上記の研究結果に基づいて、出願人は本出願の技術スキームを提案した。

【0049】

本出願の一典型的な実施形態において、ペアエンドライブラリータグ組成物が提供され、該ペアエンドライブラリータグ組成物は、複数の５’末端のライブラリータグと、複数の３’末端のライブラリータグとを含み、複数の５’末端のライブラリータグの長さは、全て同じであり、複数の３’末端のライブラリータグの長さは、全て同じであり、且つ、ペアエンドライブラリータグ組成物において、同じ位置で各塩基の出現回数は同じである。

【0050】

本出願で提供されたペアエンドライブラリータグ組成物は、該組み合せ中の各５’末端のライブラリータグの長さが同じであり、３’末端のライブラリータグの長さも同じであることを限定し、且つ同じ位置で各塩基の出現回数は同じであることを限定することにより、該組成物中のペアエンドタグの塩基の出現確率が同じであるため、該組成物中のペアエンドタグ付けのアダプター又はライブラリー増幅プライマーを合成する場合、ペアエンドライブラリータグ塩基のバランスの良い複数のライブラリーを得ることができ、これらの複数のライブラリーを混合してシーケンシングする際に、これらの混合ライブラリー中の各ライブラリーのペアエンドタグの読み取り正確性が高く、さらにライブラリーの有効分割率が向上させる。

【0051】

ライブラリータグの塩基バランスと読み取り正確性をさらに向上させるために、一好ましい実施例では、複数の５’末端のライブラリータグの長さは、複数の３’末端のライブラリータグの長さと同じであり、好ましくはいずれも６～１０ｂｐの間のいずれかの固定長さであり、両端におけるライブラリータグの長さは同じであるため、サンプルを分割する際に、両端におけるライブラリータグのサンプルの由来判定に関わる塩基数が同じであるため、両端ライブラリーが提供する支持の確率は同じであり、一端ライブラリータグが長く、提出する支持の参照確率が高く、他端ライブラリータグが短く、提供する支持の参照確率が低く、それにより、分割結果がある一端に依存するライブラリータグの分割結果に偏ってしまうことを回避することができる。

【0052】

好ましくは、ペアエンドライブラリータグ組成物において、任意の２種類のライブラリータグの間に、少なくとも３つの塩基の違いが存在し、且つ任意の１種類のライブラリータグ中に連続する同一塩基数が３以下であり、好ましくは、任意の１種類のライブラリータグのＧＣ含有量はいずれも４０～６０％である。上記塩基最適化原則を満たすライブラリータグを組み合せて使用する場合、塩基読み取りのバランスがよく、読み取り結果がより正確で、データ分割率も高くなる。

【0053】

好ましくは、ペアエンドライブラリータグ組成物は、４タグバランスのペアエンドライブラリータグの組み合せ、又は８タグバランスのペアエンドライブラリータグの組み合せを含み、ここで、４タグバランスのペアエンドライブラリータグの組み合せは、４ｎ個の５’末端のライブラリータグと、４ｎ個の３’末端のライブラリータグとの組み合せであり、８タグバランスのペアエンドライブラリータグの組み合せは、８ｎ個の５’末端のライブラリータグと、８ｎ個の３’末端のライブラリータグとの組み合せであり、ｎは１以上の自然数である。

【0054】

一好ましい実施例では、４タグバランスのペアエンドライブラリータグの組み合せにおいて、５’末端のライブラリータグは、表１に示す９６群中の任意の一群又は複数群から選択され、３’末端のライブラリータグ群は、表１に示す９６群中の、５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択される。

【0055】

一好ましい実施例では、８タグバランスのペアエンドライブラリータグの組み合せにおいて、５’末端のライブラリータグは、表２に示す４８群中の任意の一群又は複数群から選択され、３’末端のライブラリータグ群は、表２に示す４８群中の、５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択される。

【0056】

本出願の第２の典型的な実施形態において、ＭＧＩシーケンシングプラットフォームに基づくペアエンドライブラリータグ付けの増幅プライマー組成物が提供され、該増幅プライマー組成物は、複数のペアエンドライブラリータグ付けの増幅プライマー対の組み合せを含み、各増幅プライマー対は、５’末端のライブラリータグと、３’末端のライブラリータグとを含み、複数の増幅プライマー対の５’末端のライブラリータグの長さは、全て同じであり、複数の増幅プライマー対の３’末端のライブラリータグの長さは、全て同じであり、且つ同じ位置で各塩基の出現回数は同じである。

【0057】

該組み合せ中の各増幅プライマー対の５’末端のライブラリータグの長さが同じであり、３’末端のライブラリータグの長さも同じであることを限定し、且つ同じ位置で各塩基の出現回数は同じであることを限定することにより、組み立てられた該増幅プライマー組成物中のペアエンドタグは、複数の混合サンプルシーケンスのサンプルを標記する際に、タグ塩基の読み取りはバランスを確保し、読み取り結果がより正確で、さらに該タグに基づいて分割されたサンプルデータがより正確で、サンプル分割率が向上させる。

【0058】

上記混合サンプルの５’末端ライブラリータグ長さが同じで、且つ５’末端ライブラリータグ長さが同じであることに基づいて、ライブラリータグの塩基バランス及び読み取り正確性をさらに向上させるために、一好ましい実施例では、上記複数の増幅プライマー対の５’末端のライブラリータグの長さは、複数の増幅プライマー対の３’末端のライブラリータグの長さと同じである。

【0059】

各対の増幅プライマー中の両端のライブラリータグの長さは同じであるため、サンプルを分割する際に、両端におけるライブラリータグのサンプルの由来判定に関わる塩基数が同じであるため、両端ライブラリーが提供する支持の確率は同じであり、一端のより長いライブラリータグが、より高い支持の参照確率を提供し、他端のより短いライブラリータグが、より低い参照確率を提供し、それにより、分割結果がある一端に依存するライブラリータグの分割結果に偏ってしまうことを回避することができる。

【0060】

より好ましくは、５’末端のライブラリータグと３’末端のライブラリータグの長さは、いずれも６～１０ｂｐの間のいずれかの固定長さであり、より好ましくは１０ｂｐである。ここで好ましい長さは１０ｂｐであり、６ｂｐや８ｂｐなどの他の長さに比べて、より大きな区分度とより多くの選択組み合わせの有益な効果がある。

【0061】

塩基のよりバランスするライブラリータグを提供するために、一好ましい実施例では、上記増幅プライマー組成物において、任意の２種類ライブラリータグの間に、少なくとも３つの塩基の違いが存在し、且つ任意の１種類のライブラリータグ中に連続する同一塩基数が３以下であり、より好ましくは、複数の５’末端のライブラリータグと複数の３’末端のライブラリータグのＧＣ含有量はいずれも４０～６０％である。上記塩基最適化原則を満たすライブラリータグを組み合せて使用する場合、塩基読み取りのバランスがよく、読み取り結果がより正確で、データ分割率も高くなる。

【0062】

一好ましい実施例では、上記増幅プライマー組成物は、４群のタグバランスの４ｎ個の増幅プライマー対の組み合せ、又は８群のタグバランスの８ｎ個の増幅プライマー対の組み合せを含み、ここで、ｎは１以上の自然数である。より好ましくは、４群のタグバランスの４ｎ個の増幅プライマー対において、５’末端のライブラリータグは、上記表１に示す９６群中の任意の一群又は複数群から選択され、３’末端のライブラリータグ群は、表１に示す９６群中の、５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択される。ここでの群数は実際のニーズに応じて決定される。表１中の９６群タグ配列の組み合せは、読み取り正確性が高いため、データ分割がより正確で、分割率も高くなる。

【0063】

他の好ましい実施例では、８群のタグバランスの８ｎ個の増幅プライマー対において、５’末端のライブラリータグは、表２に示す４８群中の任意の一群又は複数群から選択され、３’末端のライブラリータグ群は、上記表２に示す４８群中の、５’末端のライブラリータグ群と異なる任意の一群又は複数群から選択される。

【0064】

上記増幅プライマー組成物において、各増幅プライマー対は、５’末端共通増幅配列と、３’末端共通増幅配列とをさらに含み、５’末端共通増幅配列は、５’末端のライブラリータグの上流に位置する共通配列と、５’末端のライブラリータグの下流に位置する共通配列とを含み、３’末端共通増幅配列は、３’末端のライブラリータグの上流に位置する共通配列と、３’末端のライブラリータグの下流に位置する共通配列とを含む。上記各幅プライマー対中の共通増幅配列の具体的な配列は、ＭＧＩの既存のシーケンシングプラットフォームの共通配列に応じて決定される。

【0065】

本出願の上記改善されたライブラリータグを含む増幅プライマー対を利用して形成された増幅プライマー組み合せは、混合シーケンシングを行う際に、ライブラリータグの読み取り正確率を向上させ、さらに各サンプルのシーケンスデータの分割正確性と分割率を向上させることができる。

【0066】

上記によれば、ライブラリー構築は、比較的短いバブルアダプター(即ち中間領域非対合塩基数が３０±５ｂｐである)を採用してもよく、比較的長いバブルアダプター(中間領域非対合塩基数が４５±５ｂｐである)を採用してもよい。したがって、ここでの増幅プライマー対中の共通配列は、バブルアダプターの長さに応じて、比較的長い又は比較的短い共通増幅配列に調整することもできる。

【0067】

一好ましい実施例では、比較的短いバブルアダプターの使用に対応し、５’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９３であり、５’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９４であり、３’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９５であり、３’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９６である。

【0068】

他の好ましい実施例では、比較的長いバブルアダプターの使用に対応し、５’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９３であり、５’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９７であり、３’末端のライブラリータグの上流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９５であり、３’末端のライブラリータグの下流に位置する共通配列は、ＳＥＱＩＤＮＯ:７９８である。

【0069】

本出願の第３の典型的な実施形態において、上記のいずれかの増幅プライマー組成物を含む、ＭＧＩシーケンシングプラットフォームに基づくライブラリー構築試薬キットが提供される。上記塩基バランスを有する増幅プライマー中のペアエンドライブラリータグは、混合シーケンシング後の各サンプルのタグ配列を正確に読み取ることができ、混合サンプルデータのサンプル分割正確性と分割率を向上させることができる。

【0070】

ライブラリー構築の利便性をさらに向上させるために、上記試薬キットは、ＭＧＩシーケンシングプラットフォームのバブルアダプターをさらに含んでもよく、バブルアダプターは、第１アダプター配列と、第２アダプター配列とを含み、第１アダプター配列はＳＥＱＩＤＮＯ:７６９であり、第２アダプター配列はＳＥＱＩＤＮＯ:７７０であり、或いは、第１アダプター配列はＳＥＱＩＤＮＯ:７７３であり、第２アダプター配列はＳＥＱＩＤＮＯ:７７４である。改善された短バブルアダプターは、比較的長いバブルアダプターと比べて、アダプターのライゲーションステップの安定性と効率が高いことに加えて、アダプターライゲーション後のＰＣＲ増幅などの手順において、比較的長いバブルアダプターよりも互換性がある。

【0071】

本出願の第４の典型的な実施形態において、上記のいずれかの試薬キットを採用して構築する、ＭＧＩシーケンシングプラットフォームに基づくシーケンスライブラリーの構築方法がさらに提供される。本出願の上記試薬キットを利用して構築してなるライブラリーは、混合シーケンシングする際に、ライブラリータグのバランスが良く、ライブラリータグを読み取る時の読み取り正確性が高く、後続の各サンプルのシーケンスデータ分割もより正確で、データ分割率も高くなる。

【0072】

本出願の第５の典型的な実施形態において、上記のいずれかの増幅プライマー組成物を含み、又は上記のいずれかの方法を採用して構築してなる、シーケンシングライブラリーが提供される。該シーケンシングライブラリー中の複数のサンプルのライブラリータグはバランスが良く、シーケンシング後のライブラリータグの読み取り正確性が高く、後続のライブラリー分割率も高くなる。

【0073】

本出願の有益な効果について、具体的な実施例に関連して以下にさらに説明する。説明すべきものとして、以下の実施例は、ＮａｄＰｒｅｐTM ＤＮＡライブラリー構築試薬キット(ｆｏｒＭＧＩ)、商品番号:１００２２１２／ＮａｄＰｒｅｐ(R)血漿遊離ＤＮＡペアエンド分子タグライブラリー構築試薬キット(ｆｏｒＭＧＩ)、商品番号:１００３８１１取扱説明書Ｖ１.０(納昂達(南京)生物科技有限公司)で提供されたライブラリー構築プロセスを用いて実施される。具体的なプロセスを簡単に説明すると、次のようになる。

【0074】

ＤＮＡサンプル断片化－－－末端修復とＡ付加－－－アダプターライゲーション－－－断片スクリーニング－－－ＰＣＲ増幅－－－ライブラリー精製、定量と品質検査－－－ＭＧＩプラットフォームでのシーケンシング又は標的捕捉後のシーケンシング。

【0075】

また、以下の実施例は例示に過ぎず、本出願の方法を以下の方法のみに限定するものではないことに留意されたい。

【0076】

実施例１ライブラリー構築のスキーム１とスキーム２
具体的な手順:ＮａｄＰｒｅｐTM ＤＮＡライブラリー構築試薬キット(for MGI)(201909Version2.0)説明書を参照
唯一の違いはバブルアダプター配列と増幅プライマー配列の違いである。

【0077】

(１)スキーム１:
バブルアダプター配列:
ＳＥＱＩＤＮＯ:７６９に示すアダプター配列１とＳＥＱＩＤＮＯ:７７０に示すアダプター配列２:
ＳＥＱＩＤＮＯ:７６９:(３１ｂ)/phos/agtcggaggccaagcggtcttaggaagacaa、
ＳＥＱＩＤＮＯ:７７０(４０ｂｐ):ttgtcttcctaacaggaacgacatggctacgatccgact*t。

【0078】

ＳＥＱＩＤＮＯ:７７１に示す増幅プライマー１とＳＥＱＩＤＮＯ:７７２に示す増幅プライマー２:
ＳＥＱＩＤＮＯ:７７１:(６４ｂｐ)

【0079】

ＳＥＱＩＤＮＯ:７７２:(５２ｂｐ)

【0080】

スキーム１の特点:
１. アダプター部の相補領域は７＋１３ｂｐ(２０±２ｂｐの範囲に属する)であり、中間泡状構造領域は２０＋１２ｂｐ(３０±５ｂｐの範囲に属する)である。
２.増幅プライマーは比較的長い。

【0081】

このようなメリットには、次の点がある。
１.泡状領域が短いため、アニール構造は安定している。
２.増幅プライマーは、シングルエンドのアンプリコンスキームと分子タグアダプタースキームの両方と互換性がある(出願番号２０１９１０２２９５２７.４の血漿ライブラリー構築分子タグ特許を参照)。

【0082】

(２)スキーム２:
アダプター配列
ＳＥＱＩＤＮＯ:７７３に示すアダプター配列１とＳＥＱＩＤＮＯ:７７４に示すアダプター配列２。
ＳＥＱＩＤＮＯ:７７３(３５ｂｐ):
/phos/agtcggaggccaagcggtcttaggaagacaatcag。
ＳＥＱＩＤＮＯ:７７４(５９ｂｐ):
ctgattgtcttcctaagcaactccttggctcacagaacgacatggctacgatccgactt。
ＳＥＱＩＤＮＯ:７７５に示す増幅プライマー１とＳＥＱＩＤＮＯ:７７６に示す増幅プライマー２。

【0083】

ＳＥＱＩＤＮＯ:７７５:(５１ｂｐ)
/phos/ctctcagtacgtcagcagttnnnnnnnnnncaactccttggctcacagaac。ここで、nnnnnnnnnnの前の配列(/phos/CTCtcagtacgtcagcagtt)を、依然としてＳＥＱＩＤＮＯ:７９３とし、nnnnnnnnnnの後の配列(caactccttggctcacagaac)をＳＥＱＩＤＮＯ:７９７とする。

【0084】

ＳＥＱＩＤＮＯ:７７６:(５０ｂｐ)
gcatggcgaccttatcagnnnnnnnnnnttgtcttcctaagaccgcttgg。ここで、nnnnnnnnnnの前の配列(gcatggcgaccttatcag)を、依然としてＳＥＱＩＤＮＯ:７９５とし、nnnnnnnnnnの後の配列(ttgtcttcctaagaccgcttgg)をＳＥＱＩＤＮＯ:７９８とする。

【0085】

このスキームの特徴は、以下である。
１.アダプターの相補領域は７＋１７ｂｐ(２５±２ｂｐの範囲に属する)であり、中間泡状構造領域は３４＋１２ｂｐ(４５±５ｂｐの範囲に属する)である。
２.増幅プライマーが短く、増幅プライマーの部分を参照する。

【0086】

スキーム１と比べて、該スキームは以下のデメリットがある。
１.泡状領域が比較的長いため、アニーリング構造が比較的安定しない。
２.増幅プライマーの互換性が悪く、他のスキームと互換性がない(増幅プライマー配列が比較的短いため、スキーム１の泡状領域との重複領域が欠落し、スキーム１のアダプター配列との互換性がない)。

【0087】

スキーム１とスキーム２の具体的なアダプター構造と増幅プライマーの増幅結果を図４に示すが、最終的にどちらもＭＧＩでペアエンドタグライブラリーを実現することができて、実験中にそれぞれ２５ｎｇと１００ｎｇの投入量のライブラリー構築実験をして、具体的な情報は下表に示す。

【0088】

【表3】

【0089】

スキーム１とスキーム２はどちらも適切にライブラリーを構築することに成功し、ライブラリー収量も比較的近かった(図９を参照)。しかし、スキーム２は、ＭＧＩプラットフォームのシングルエンドタグで開発されたアンプリコンと分子タグアダプターとの互換性がない。

【0090】

実施例２４バランスと８バランスの１２個のサンプル混合データ分割の比較
ペアエンドタグのスキームは、サンプル間のクロストーク(タグスキップとも呼ばれる)を効果的に除去することができますが、データの分割には両端におけるタグが正しくなければ、有効なシーケンスデータを分割することができないため、シーケンシング時のタグバランス要件がシングルエンドタグよりも厳しくなる。

【0091】

本出願は、４バランスと８バランスの２つのスキームを最適化しており、本実施例はそれぞれ４バランスと８バランスを用いて、１２個のライブラリーを混合して試験を行い、２つのスキームの各サンプルに対する有効分割率を検測し、具体的な実験ステップと情報は以下の通りである。

【0092】

具体的なステップ:ライブラリー構築ステップは、シングルエンドタグアダプターをペアエンドタグアダプターのライブラリー構築スキームに変更すること以外、ＮａｄＰｒｅｐＴＭＤＮＡライブラリー構築試薬キット(ｆｏｒＭＧＩ)(２０１９０９Ｖｅｒｓｉｏｎ２.０)説明書を参照する。

【0093】

実験に使用した４バランスペアエンドタグ配列は、以下の表４に示すように、隣接した４個を１群でバランスし、各群は太字又は非太字のフォントで区別され、タグ１は３８４本の配列のフォワード配列であり、タグ２は３８４本のタグのリバース配列である。プライマー１のタグ１とプライマー２のタグ３８４は、第１群のペアエンドタグプライマー組み合せを組み立て、プライマー１のタグ２とプライマー２の３８３は、第２群のペアエンドタグプライマー組み合せを組み立て、これらを順に配列して３８４種類の組み合せになる。

【0094】

８バランスの配列方式は、４バランスの配列方式と同じで、唯一の違いは８個を１群でバランスし、表５に示すように、１２群のライブラリータグを一緒に置くと、最初の８個がバランスし、最後の４個がバランスしていないが、それに応じて、４バランスの組み合せの１２群のライブラリータグを一緒に置くのは完全にバランスしている。

【0095】

【表4】

【0096】

【表5】

【0097】

同じヒトゲノム標準品をそれぞれ１２個の４バランスと１２個の８バランスのペアエンドタグ配列でライブラリーを構築し、１２個の４バランスのライブラリーは、ペアエンドタグ配列が表４中の列の順序に示し、１２個の８バランスのライブラリーは、ペアエンドタグ配列が表５中の列の順序に示す。４バランスと８バランスのライブラリーは、それぞれＭＧＩシーケンシングプラットフォーム上でペアエンドタグシーケンシングと分析を行った。

【0098】

２つの混合サンプルライブラリーで得られたデータに対して２ラウンドの分割を行い、第１ラウンドは最大フォールト許容分割(シーケンシングフォールトも分割したスキーム)を用い、第２ラウンドは、各タグに１つのフォールトのみを許容する分割を行った。データ分割後の結果、図１０に示すように、４バランスの１２個のライブラリー混合データの分割率はより安定しており、８バランスの１２個のライブラリー混合データの分割変動は比較的大きい。これは、ペアエンドタグの厳格なバランスがＭＧＩシーケンサーの有効分割により有利であり、その中で８バランス設計はデータの有効分割率をある程度高めることができ、４バランス設計はデータの分割効果により優れていることを示している。

【0099】

実施例３
本出願の８バランス４８群タグ配列と、華大社製の８バランスの１２群タグ配列との間の性能差を確保するため、本出願の８バランス４８群タグ配列は、華大社製の８バランスの１２群タグ配列との使用する際の互換性があるように設計され、従って、本出願の８バランス４８群タグ配列は、華大社製の８バランスの１２群タグ配列との間に、任意の２本の配列に３つの塩基の違いが存在する。

【0100】

また、主な相違点は以下の通りである。
１.本発明のタグ配列は、ＧＣ％含有量が４０％～６０％と、よりバランスの塩基構成であるのに対し、華大社製のものはＧＣ％含有量が２０％～８０％である。
２.本発明のタグ配列は、増幅ライブラリーの増幅効率をバランスよく生産するために、スキーム１のアダプター配列とのマッチング計算を行ったが、華大社製の配列の増幅効率は、ある個別の配列において、増幅バランス要件を満たしていない。

【0101】

上記の増幅バランスの性能差をさらに検証するために、本発明のＭＤＩ００１－ＭＤＩ００８の８バランスタグ配列と華大社製のＭＧＩ００１－ＭＧＩ００８的８バランスタグ配列(表６に示す)をそれぞれ１群選択し、本発明のスキーム１でライブラリーを構築して測定を行った。両者とも１００ｎｇのＤＮＡ投入量を用い、５サイクル増幅後に回收してライブラリー収量を測定し、結果は表７に示す。

【0102】

表７に示すように、本発明の８バランスの１群は収量がバランスであるが、華大社製のものに、収量が正常値の半分を下回るライブラリーを１つ有し、これは本発明の最適化されたタグ配列はバランスが良くなり、増幅効率がより安定したことを示している。同時に、現在のＭＧＩシーケンサーのスループットが比較的高いので、本発明の２群３８４種類のタグは、華大社製の１２０種類のタグに比べて、多サンプルの混合シーケンシングのスループット要件によく満たすことができる。

【0103】

【表6】

【0104】

【表7】

【0105】

上記実施例の説明から分かるように、本出願は、ＭＧＩシーケンシングプラットフォーム上にペアエンドライブラリータグを導入し、サンプル両端のタグ配列によるデータ分割を行うことにより、合成、実験ステップ及びシーケンシング過程時に生じるクロストーク問題を解消し、検出結果をより正確にすることができる。

【0106】

また、本出願は、ＭＧＩシーケンシングプラットフォームのバブルアダプターに対して、この特殊構造をテストして最適化することにより、バブルアダプター中間の非対合領域が３０±５ｂｐ、対合塩基が２０±２ｂｐである場合、最適な効果が得られ、このような構成のバブルアダプターはアニーリングが最も安定しているとともに、対応する増幅プライマーは延長された増幅プライマーであり、シングルエンドタグのアンプリコンと分子タグアダプターとの互換性があることを見出した。

【0107】

該構成構造のバブルアダプターは延長された増幅プライマー(ペアエンドライブラリータグ付け)と組み合わせてライブラリーを構築する場合、既存のＭＧＩプラットフォームのシングルエンドタグソリューションのモジュールと互換性があり、ＭＧＩシーケンサーにおける使用を容易にする。

【0108】

上述の基礎の上で、本出願は、シーケンス後のデータ分割をよりよく配置するために、４バランスと８バランスの各３８４種類のタグ配列を最適化し、ＭＧＩシーケンサーのハイスループットシーケンシングとデータ分割に最適なソリューションを提供する。

【0109】

以上の説明は、本発明の好ましい実施例に過ぎず、本発明を限定するものではなく、当業者にとって様々な変更、変形が可能であることは言うまでもない。本発明の精神および原理の範囲内で行われた変更、等価置換、改良などは、本発明の保護範囲に含まれるものとする。

【図1A】