(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-13
(45)【発行日】2024-12-23
(54)【発明の名称】核酸識別子の夾雑を検出するためのアッセイ方法および組成物
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20241216BHJP
C12N 15/09 20060101ALN20241216BHJP
【FI】
C12Q1/6869 Z ZNA
C12N15/09 Z
【外国語出願】
(21)【出願番号】P 2023012722
(22)【出願日】2023-01-31
(62)【分割の表示】P 2019572006の分割
【原出願日】2018-05-10
【審査請求日】2023-02-22
(32)【優先日】2017-07-10
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】399117121
【氏名又は名称】アジレント・テクノロジーズ・インク
【氏名又は名称原語表記】AGILENT TECHNOLOGIES, INC.
(74)【代理人】
【識別番号】100099623
【氏名又は名称】奥山 尚一
(74)【代理人】
【識別番号】100125380
【氏名又は名称】中村 綾子
(74)【代理人】
【識別番号】100142996
【氏名又は名称】森本 聡二
(74)【代理人】
【識別番号】100180231
【氏名又は名称】水島 亜希子
(72)【発明者】
【氏名】ゾベック,ケイティ・リー
(72)【発明者】
【氏名】アンダーソン,ペイジ
(72)【発明者】
【氏名】チー,ジャヴェリン
(72)【発明者】
【氏名】ヨハンソン,ヘンリク
【審査官】井関 めぐみ
(56)【参考文献】
【文献】特表2020-527033(JP,A)
【文献】米国特許出願公開第2014/0378349(US,A1)
【文献】特表2013-528058(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/6869
C12N 15/09
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
アッセイ識別子を、オリゴヌクレオチドを含む一セットのオリゴヌクレオチドサンプルに取り付ける方法であって、各オリゴヌクレオチドが、5’定常領域、サンプル識別子、および3’定常領域を含み、前記方法が、
前記セットの前記オリゴヌクレオチドサンプルのそれぞれを、別個のベッセル内に用意するステップと、ここで、各ベッセルが、前記サンプルの1つまたは複数が夾雑した場合を除いて、たった1つのサンプル識別子を含み;
各ベッセル内で前記オリゴヌクレオチドをアッセイプライマーおよび第2のプライマーで増幅するステップと、ここで、前記アッセイプライマーが、1つまたは複数の定常領域、アッセイ識別子、および、前記オリゴヌクレオチドの前記定常領域の1つと同じであるまたは相補的であるプライミング部分を含み、各ベッセルが、前記アッセイプライマーの1つまたは複数が夾雑した場合を除いて、たった1つのアッセイ識別子を含み;
これらのステップによって、アッセイ識別子およびサンプル識別子を含むオリゴヌクレオチドアンプリコンを用意するステップと
を含む方法。
【請求項2】
オリゴヌクレオチドサンプルの前記セットが、少なくとも8つのサンプルを含む、請求項1に記載の方法。
【請求項3】
前記オリゴヌクレオチドアンプリコンが、
配列決定プラットフォームおよび配列決定プライミング領域のための標準5’増幅領域を含む5’定常領域と、
アッセイ識別子と、
配列決定プライミング領域を含む中央の定常領域と、
サンプル識別子と、
配列決定プラットフォームのための標準3’増幅領域を含む3’定常領域と
を含む、請求項1または2に記載の方法。
【請求項4】
前記標準5’増幅領域がP5配列を含み、かつ、前記標準3’増幅領域がP7’配列を含む、または前記標準5’増幅領域がP7配列を含み、かつ、前記標準3’増幅領域がP5’配列を含む、請求項3に記載の方法。
【請求項5】
前記オリゴヌクレオチドアンプリコンが、
標準5’増幅領域を含む5’定常領域と、
サンプル識別子と、
中央の定常領域と、
アッセイ識別子と、
標準3’増幅領域を含む3’定常領域と
を含む、請求項1~4のいずれか1項に記載の方法。
【請求項6】
前記第2のプライマーが、前記オリゴヌクレオチドの前記定常領域の1つと同じ、または相補的な、第1の配列
決定プラットフォームに適合する3’領域を含み、前記第2のプライマーがさらに、第2の配列決定プラットフォームのための標準増幅領域を含む5’領域を含み、前記第2のプライマーの前記5’領域が、前記オリゴヌクレオチドの前記定常領域によって支持されていない前記第2の配列決定プラットフォームでの配列決定を可能にする、請求項1~5のいずれか1項に記載の方法。
【請求項7】
前記オリゴヌクレオチドが、ライブラリ分子である、請求項1~6のいずれか1項に記載の方法。
【請求項8】
核酸サンプルについて一セットのオリゴヌクレオチド内の夾雑を検出する方法であって、
オリゴヌクレオチドを含む一セットのオリゴヌクレオチドサンプルを用意するステップと、ここで、各オリゴヌクレオチドが、5’定常領域、サンプル識別子、および3’定常領域を有し、サンプル内の前記オリゴヌクレオチドのそれぞれが、同じサンプル識別子を有し、前記セット内の前記サンプルのそれぞれが、前記サンプルの1つまたは複数が夾雑された場合を除いて、異なるサンプル識別子を有し;
前記オリゴヌクレオチドまたは前記オリゴヌクレオチドの相補体を、アッセイプライマーおよび第2のプライマーで増幅するステップと、ここで、サンプル毎に前記アッセイプライマーが異なっており、各アッセイプライマーが、プライミング部分およびアッセイ識別子を含むことによって、一セットのオリゴヌクレオチドアンプリコンを生成し、各オリゴヌクレオチドアンプリコンが、前記アッセイ識別子の1つ、前記5’定常領域、前記サンプル識別子の1つ、および前記3’定常領域を含み;
前記オリゴヌクレオチドアンプリコンを、1つまたは複数のプール内にプールするステップと;
前記オリゴヌクレオチドアンプリコンの少なくとも前記サンプル識別子および前記アッセイ識別子についての配列を決定するために、前記1つまたは複数のプールについて配列決定を行うステップと;
前記1つまたは複数のプール内の前記サンプル識別子が夾雑サンプル識別子を含むかどうかを判定するステップと
を含む方法。
【請求項9】
前記1つまたは複数のプールが第1のプールおよび第2のプールを含み、前記第1のプール内の前記アッセイ識別子が夾雑アッセイ識別子を含むかどうかを判定するステップをさらに含む、請求項8に記載の方法。
【請求項10】
前記夾雑サンプル識別子が、(i)複数のアッセイ識別子と関連する前記サンプル識別子の少なくとも1つを同定するステップと、(ii)複数のサンプル識別子と関連する前記アッセイ識別子の少なくとも1つを同定するステップのいずれかまたは双方によって判定される、請求項8または9に記載の方法。
【請求項11】
前記オリゴヌクレオチドアンプリコンの、少なくとも前記サンプル識別子および前記アッセイ識別子について配列を決定するために、前記第1のプールおよび前記第2のプールを別個に配列決定するステップと;
前記第2のプール内の前記サンプル識別子が夾雑サンプル識別子を含むかどうかを判定するステップと
を含む、請求項9に記載の方法。
【請求項12】
前記第2のプール内の前記アッセイ識別子が夾雑アッセイ識別子を含むかどうかを判定するステップをさらに含む、請求項11に記載の方法。
【請求項13】
夾雑サンプル識別子を、前記夾雑サンプル識別子が第2のプール由来であることを判定することによって同定するステップ
をさらに含む、請求項11に記載の方法。
【請求項14】
夾雑サンプル識別子を、前記第2のプールが夾雑アッセイ識別子を含まないことを判定することによって同定するステップ
をさらに含む、請求項11に記載の方法。
【請求項15】
夾雑アッセイ識別子を、前記第2のプールが夾雑アッセイ識別子を含むことを判定することによって同定するステップ
をさらに含む、請求項11に記載の方法。
【請求項16】
オリゴヌクレオチドの前記セットは、少なくとも8つのオリゴヌクレオチドを含む、請求項8から15のいずれか1項に記載の方法。
【請求項17】
アッセイグループを形成するために、前記アッセイ識別子に従って前記オリゴヌクレオチドアンプリコンの配列をグループ化し、前記アッセイグループのそれぞれに複数のサンプル識別子配列が存在するかを判定するステップと;
サンプルグループを形成するために、前記サンプル識別子に従って前記オリゴヌクレオチドアンプリコンの配列をグループ化し、前記サンプルグループのそれぞれに複数のアッセイ識別子配列が存在するかを判定するステップ
のいずれかまたは双方をさらに含む、請求項8~16のいずれか1項に記載の方法。
【請求項18】
前記アッセイ識別子の少なくとも1つと前記サンプル識別子の少なくとも1つとの間のミスマッチを判定するステップを含む、請求項8に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願の相互参照]
本出願は、2017年7月10日出願の米国非仮特許出願第15/645,085号明
細書の利益を主張し、この出願の内容は、その全体が参照によって本明細書の一部をなす
ものとする。
【0002】
[発明の分野]
本発明は、分子生物学の分野に関する。特に、本発明は、サンプルバーコード等の核酸
識別子の夾雑を検出するためのアッセイ方法および組成物に関する。
【背景技術】
【0003】
識別子(例えば、サンプルバーコードまたは分子バーコード)は、種々の目的のために
核酸中に存在し得る。最も一般的には、サンプルバーコードは、配列情報の起源またはソ
ースを同定することができるようにするために、標的核酸分子の増幅および/または配列
決定(シークエンシング)の前に当該分子に加えられる。様々なサンプル由来の核酸分子
が、一緒にプールされて、超並列配列決定にかけられて、多数の様々なサンプル由来の配
列情報が効率的に決定され得る。配列決定の前に、サンプル識別子(多くの場合、サンプ
ルバーコードと呼ばれる)が、核酸分子に加えられてよく、これは、情報のグループ化、
分析、および解釈を容易にする。別の例として、分子バーコードが、増幅の前に、標的核
酸分子に加えられて、その後、最初の標的分子の複製を同定し、かつ一緒にグループ化す
ることができる。
【0004】
サンプルバーコードは、様々なサンプル由来の核酸分子を、配列決定のためにプールし
、かつ、配列情報をサンプルに割り当てることができるように、超並列配列決定によって
分析されることとなる標的分子に頻繁に用いられる。超並列配列決定を実行する科学者お
よびラボは、サンプルバーコードが配列決定プール内に含まれなかった場合であっても、
プール内にこのサンプルバーコードを時折検出する。これは、夾雑サンプルバーコードが
、プールされた核酸中に存在することを示しており、当該夾雑サンプルコードは、複数の
サンプルバーコード配列を含有するサンプルバーコードアリコート、すなわち、予想され
るバーコード配列および夾雑バーコード配列によってもたらされている可能性がある。夾
雑バーコードは、最も初期のステージに始まり、サンプルバーコードアリコートの調製の
いかなるステージ(DNAオリゴの合成および精製が挙げられる)においても、またはサ
ンプルバーコード配列を希釈かつ分注するプロセスにおけるハンドリング工程を通しても
導入される可能性があった。低い頻度、例えば1%以下で存在する場合であっても、夾雑
サンプルバーコードの存在は、配列情報の信頼性および解釈に関して、問題を引き起こす
虞がある。
【0005】
サンプルバーコードは、多くの場合、一セットのコンテナ、例えばウェルプレート内に
用意され、各コンテナは、異なるサンプルバーコードを保持する。サンプルバーコードが
、例えば、サンプルバーコードをコンテナから、分析されることとなる種々のサンプルに
ピペットで移すことによって、ラボ分析に用いられる場合、コンテナまたはサンプルが夾
雑されてしまうリスクが存在する。
【0006】
サンプルバーコードの夾雑は、サンプルバーコード毎に個々の配列決定ライブラリを調
製して、これらを個々に配列決定することよって検出することができた。これ以外にも、
夾雑は、プーリングスキームで検出することができた。これは、プールの少なくとも1つ
において、サンプルバーコードと別のサンプルバーコードの夾雑とを比較する能力を提供
するものである。しかしながら、サンプルバーコードを多数のサンプル、例えば48サン
プルまたは96サンプルから単離するには、多数のプールが、別個の配列決定ランにおい
て調製され、かつ配列決定されなければならなかった。これは、高価であり、効率が悪く
、かつ時間を浪費することとなった。また、チューブ内に存在しなかったが、その代わり
に、多くのライブラリ調製工程の1つにおいて導入されたサンプルバーコード中に夾雑を
誤って見出して、偽陽性に至る可能性もある。
【発明の概要】
【0007】
本発明の一態様として、アッセイ識別子(例えば品質制御バーコード)を、オリゴヌク
レオチドを含む一セットのオリゴヌクレオチドサンプルに取り付ける方法であって、各オ
リゴヌクレオチドは、5’定常領域、サンプル識別子(例えばサンプルバーコード)、お
よび3’定常領域を含み、各サンプル識別子は、夾雑の不在下で、セット内で固有である
、方法が提供される。一部の実施形態において、定常領域は、配列決定プラットフォーム
用の標準増幅領域、またはその逆相補体を含む。例えば、一部の実施形態において、5’
定常領域は、Illumina Index 1配列であり、3’定常領域は、Illu
mina P7配列の逆相補体(P7’)である。他の実施形態において、向きは逆であ
り、5’定常領域がIllumina P7配列であり、そして3’定常領域がIllu
mina Read 2配列とされる。本方法は、サンプルの1つまたは複数が夾雑され
ていない限り各ベッセルがたった1つのサンプル識別子を含むように、別個のベッセル内
に当該セットのオリゴヌクレオチドサンプルのそれぞれを用意するステップを含む。本方
法はまた、アッセイプライマーおよび第2のプライマーを用いて、各ベッセル内でオリゴ
ヌクレオチドを増幅するステップを含む。アッセイプライマーは、1つまたは複数の定常
領域(例えば、P5およびRead 1プライマー配列)、アッセイ識別子、および、オ
リゴヌクレオチドの定常領域の1つと同じである、または相補的であるプライミング部分
を含む。各ベッセルは、アッセイプライマーの1つまたは複数が夾雑されていない限り、
たった1つのアッセイ識別子を含む。ゆえに、本方法は、アッセイ識別子およびサンプル
識別子を含むオリゴヌクレオチドアンプリコンを提供する。
【0008】
別の態様として、サンプル識別子を含む一セットのオリゴヌクレオチド内の夾雑を検出
する方法が提供される。本方法は、オリゴヌクレオチドを含む一セットのオリゴヌクレオ
チドサンプルを用意するステップを含み、各オリゴヌクレオチドは、5’定常領域、サン
プル識別子(例えばサンプルバーコード)、および3’定常領域を有する。サンプル内の
オリゴヌクレオチドは、同じサンプル識別子を有し、そしてセット内のサンプルのそれぞ
れは、サンプルの1つまたは複数が夾雑されていない限り、異なるサンプル識別子を有す
る。本方法はまた、オリゴヌクレオチド、またはオリゴヌクレオチドの相補体を、アッセ
イプライマーおよび第2のプライマーで増幅するステップを含む。サンプル毎に異なるア
ッセイプライマーが用いられ、そして各アッセイプライマーは、プライミング部分および
アッセイ識別子(例えばQCバーコード)を含むことによって、一セットのオリゴヌクレ
オチドアンプリコンを生成する。各オリゴヌクレオチドアンプリコンは、アッセイ識別子
の1つ、5’定常領域、サンプル識別子の1つ、および3’定常領域を含む。本方法はま
た、オリゴヌクレオチドアンプリコンを、1つまたは複数のプール内にプールするステッ
プと;オリゴヌクレオチドアンプリコンの少なくともサンプル識別子およびアッセイ識別
子についての配列情報を決定するために、1つまたは複数のプールについて配列決定を行
うステップと;第1のプール内のサンプル識別子が夾雑サンプル識別子を含むかどうかを
判定するステップと;第1のプール内のアッセイ識別子が夾雑アッセイ識別子を含むかど
うかを判定するステップとを含む。
【0009】
一部の実施形態において、本方法は、オリゴヌクレオチドアンプリコンを、少なくとも
2つのプール内にプールするステップと、オリゴヌクレオチドアンプリコンの少なくとも
サンプル識別子およびアッセイ識別子について配列を決定するために、第1のプールおよ
び第2のプールについて別個に配列決定を行うステップとを含む。本方法はまた、第2の
プール内のサンプル識別子が夾雑サンプル識別子を含むかどうかを判定するステップを含
んでもよい。一部の実施形態において、本方法はまた、第2のプール内のアッセイ識別子
が夾雑アッセイ識別子を含むかどうかを判定するステップを含む。一部の実施形態におい
て、本方法はさらに、第1のプール内の夾雑サンプル識別子を、その夾雑サンプル識別子
が第2のプール由来のものであることを判定することによって同定するステップを含む。
一部の実施形態において、本方法はさらに、第1のプール内の夾雑サンプル識別子を、第
2のプールが夾雑アッセイ識別子を含んでいないことを判定することによって同定するス
テップを含む。一部の実施形態において、本方法はさらに、第1のプール内の夾雑アッセ
イ識別子を、第2のプールが夾雑アッセイ識別子を含んでいることを判定することによっ
て同定するステップを含む。一部の実施形態において、夾雑サンプル識別子は、(i)複
数のアッセイ識別子と関連するサンプル識別子の1つまたは複数を同定するステップと、
(ii)複数のサンプル識別子と関連するアッセイ識別子を同定するステップとの一方ま
たは双方によって判定される。
【0010】
別の態様として、サンプル識別子を含む一セットのオリゴヌクレオチド内の夾雑を判定
するように適合したアッセイに有用である組成物が提供される。本組成物は、5’定常領
域、サンプル識別子(例えばサンプルバーコード)、および3’定常領域を有する少なく
とも1つのオリゴヌクレオチド、ならびにプライミング部分およびアッセイ識別子を含む
少なくとも1つのアッセイプライマーを含む。一部の実施形態において、組成物はさらに
、DNAポリメラーゼおよびデオキシヌクレオチドの1つまたは複数を含む。
【0011】
さらに別の態様として、サンプル識別子を含む一セットのオリゴヌクレオチド内の夾雑
を判定するように適合したアッセイ用のキットが提供される。本キットは、少なくとも8
個のアッセイプライマー、代わりに少なくとも16個のアッセイプライマー、代わりに少
なくとも32個のアッセイプライマー、代わりに少なくとも48個のプライマー、または
少なくとも96個のプライマーを、別個のベッセル内に含む。各アッセイプライマー識別
子は、プライミング部分およびアッセイ識別子を含む。
【0012】
上述の態様の一部の実施形態において、オリゴヌクレオチドサンプルのセットまたはプ
ールは、少なくとも8個のサンプル、代わりに少なくとも16個のサンプル、代わりに少
なくとも32個のサンプル、代わりに少なくとも48個のサンプル、代わりに少なくとも
96個のサンプルを含み、各サンプルは、セットまたはプール内に固有のサンプル識別子
を有する。一部の実施形態において、一セットのアッセイプライマーは、少なくとも32
個のアッセイ識別子、代わりに少なくとも48個のアッセイ識別子、代わりに少なくとも
96個のアッセイ識別子を含み、各アッセイプライマーは、セットまたはプール内につき
固有であるアッセイサンプル識別子を有する。
【図面の簡単な説明】
【0013】
【
図1A】サンプル識別子を有するオリゴヌクレオチドにアッセイ識別子を取り付ける本方法の実施形態を示す図である。
【
図1B】サンプル識別子を有するオリゴヌクレオチドにアッセイ識別子を取り付ける本方法の実施形態を示す図である。
【
図1C】サンプル識別子を有するオリゴヌクレオチドにアッセイ識別子を取り付ける本方法の実施形態を示す図である。
【
図2】本開示に従うアッセイプライマーの2つの異なる実施形態の配列を示す図である。2つの実施形態は、多くの同じ領域を含有するが、5’定常領域が異なる。バージョン2において、5’定常領域と3’定常領域との重複は、より少ない。
【
図3】
図2における第1の実施形態のアッセイプライマーを用いたオリゴヌクレオチドの増幅由来のアンプリコンのサイズの分布を示す図である。
【
図4】
図2における第2の実施形態のアッセイプライマーを用いたオリゴヌクレオチドの増幅由来のアンプリコンのサイズの分布を示す図である。
【
図5】アッセイ識別子を、サンプル識別子を有するオリゴヌクレオチドに取り付ける本方法の別の実施形態を示す図であり、識別子は、サンプル識別子に対して3’の位置に取り付けられる。
【
図6】アッセイ識別子を、サンプル識別子を有するオリゴヌクレオチドに取り付ける本方法の別の実施形態を示す図であり、オリゴヌクレオチドの定常領域は、所望の配列決定プラットフォームと適合しない。
【
図7】本方法および本組成物を用いてサンプル識別子の夾雑を検出するプーリングスキームを示す図である。
【発明を実施するための形態】
【0014】
本方法、本組成物、および本キットは、核酸サンプルについての一セットのオリゴヌク
レオチド内の夾雑を検出するのに有用であり、これは、夾雑が実質的にないサンプル識別
子セットの生成を可能とする。これは大きな進歩、そして利益である。というのも、サン
プルバーコード夾雑の存在は、遺伝的変異体の偽コーリング(false callin
g)を生じさせる場合があり、これが研究および臨床用途について深刻な結果をもたらす
虞があるからである。
【0015】
本方法、本組成物、および本キットは、5’定常領域、サンプル識別子、および3’定
常領域を有するオリゴヌクレオチドを使用する。サンプルの1つまたは複数が、夾雑サン
プル識別子によって夾雑されていない限り、サンプル内のオリゴヌクレオチドのそれぞれ
が同じサンプル識別子を有し、そしてセット内のサンプルのそれぞれが異なるサンプル識
別子を有する。一部の実施形態において、セット内のサンプルのそれぞれがセットに固有
のサンプル識別子を有し、このことは、夾雑がない場合に固有であることが意図され、か
つ固有となることを意味する。
【0016】
「サンプル識別子」は、サンプルを同定するのに用いることができるサンプルバーコー
ド、またはあらゆる縮重(degenerate)配列もしくはランダム配列を含む。サ
ンプル識別子は、定常領域が側面に(直接的または間接的に)位置してよい。一部の実施
形態において、サンプル識別子は、6つ以上のランダムヌクレオチドまたは縮重ヌクレオ
チドを含むサンプルバーコードであってよい。これ以外にも、サンプル識別子は、8つ以
上のランダムヌクレオチドもしくは縮重ヌクレオチド、または10個以上のランダムヌク
レオチドもしくは縮重ヌクレオチドを含むサンプルバーコードであってよい。一部の実施
形態において、サンプル識別子は、8つの既知の塩基を含み、そしてアッセイ識別子は、
10個の縮重塩基を含む。他の実施形態において、サンプル識別子は、4つの既知の塩基
または6つの既知の塩基を含む。一部の実施形態において、サンプル識別子中の塩基の数
は、識別されることとなるサンプルの数に基づいて選択されてよい。より長いサンプル識
別子およびサンプルバーコードも可能である。例えば、18塩基(8つの既知の塩基およ
び10個の縮重塩基)を含むサンプル識別子が、Ion Torrent配列決定プラッ
トフォーム用のオリゴヌクレオチドのライブラリを調製するのに使用されている。とりわ
け、アッセイが、他の配列決定プラットフォームおよび用途に用いられるならば、19塩
基を超えるサンプル識別子もまた実行可能であり、所望されてもよい。一部の実施形態に
おいて、最初のサンプルバーコードの相補体は、オリゴヌクレオチドアンプリコン内にあ
り、そしてこの相補体もまた、サンプル識別子とみなされる。
【0017】
「定常」領域は、既知の配列を含む領域である。定常領域は既知であるので、所望の機
能を提供することができる。定常領域は、通常、セットのオリゴヌクレオチド間で、同じ
、または実質的に同じであろう。既知の配列は、増幅またはプライマー伸長用のプライミ
ング部位(領域)として機能することができ、かつ/または支持体に取り付けられた核酸
にハイブリダイズすることができる。一部の実施形態において、定常領域は、一連の標準
領域、例えば、配列決定プラットフォームに用いられる標準増幅領域を含む。定常領域は
、標準領域の機能にとって十分な数の、既知の、または標準領域由来のヌクレオチド、例
えば、増幅用の標準プライマーにハイブリダイズするのに十分な数のヌクレオチドを含み
得る。
【0018】
「夾雑」分子または配列は、何らかの夾雑がある場合を除き、セットまたはプール中に
あるように設計されている分子もしくは配列ではなく、セット、プール、またはサンプル
中に存在するべき分子もしくは配列でもない。例えば、配列の第1のセットまたはプール
中のバーコードは、第1のセットもしくはプール中に存在するべきでない、かつ/または
、第2のセットもしくはプール中にのみ存在するべきであるならば、夾雑バーコードであ
る。
【0019】
本方法および本組成物は、サンプルバーコード等のサンプル識別子を含むオリゴヌクレ
オチドのセット内に夾雑を認める問題の解決策を提供する。本技術は、比較的少数のハン
ドリング工程しかなく、このことは望ましい。なぜなら、ハンドリング工程は、夾雑のリ
スクを増大させるからである。加えて、サンプル間の夾雑を検出するのに必要とされるプ
ール数および配列決定ラン数を少なくするプーリングスキームおよび分析法が提供される
。多数のプールの代わりに、本方法は、用いられるプールを少なくして、一セットの96
サンプル識別子内の夾雑を検出することができる。一部の実施形態において、一セットの
96サンプル識別子中のサンプル識別子夾雑を検出するのに、2つの配列決定プールが用
いられる。
【0020】
本方法および本組成物はまた、オリゴヌクレオチド(例えば、タンパク質またはペプチ
ドを標的とするのに用いられる、ライブラリ分子、アダプター、アプタマー、または他の
ssDNA分子)を増幅するのに用いることができ、これは、分子バーコードを検出する
ことを含む、配列多様性を検出するための一連のランダムなヌクレオチド(本明細書中で
サンプル識別子とみなされる)を、2つの定常領域間に有する。また、DNAの既知の領
域において、突然変異誘発の単一ヌクレオチド多型(SNP)または部位を同定するのに
用いることができる。
【0021】
本方法によってアッセイすることができるオリゴヌクレオチドとしては、標準アダプタ
ー由来の核酸分子または領域、例えば配列決定プラットフォーム用の標準アダプター由来
の増幅領域用のアダプターが挙げられる。また、オリゴヌクレオチドとしては、標識、タ
グ、または他の部分が挙げられ得る。一例として、オリゴヌクレオチドとしては、ビオチ
ン部分が挙げられ、これは、アビジンまたはストレプトアビジンへの結合によってオリゴ
ヌクレオチドを濃縮することを可能とする。このアプローチは、市販のHaloplex
キット(Agilent Technologies)に用いられている。本方法によっ
てアッセイすることができるオリゴヌクレオチドとしては、ライブラリ分子が挙げられ、
これは、配列決定プラットフォーム用のライブラリの一部となるべくして調製された分子
である。ライブラリ分子は、通常、プラットフォームを配列決定するためのサンプル識別
子および1つまたは複数の標準領域が取り付けられる挿入部を含む。他の領域が、ライブ
ラリ分子中に含まれてもよい。ライブラリ分子により、サンプル識別子は、分子バーコー
ドとなり得、または、第1のサンプルバーコードに加えて、第2のサンプルバーコードと
なり得る。
【0022】
本方法はまた、アッセイプライマーおよび第2のプライマーにより、オリゴヌクレオチ
ド、またはオリゴヌクレオチドの相補体を増幅するステップを含む。サンプル毎に異なる
アッセイプライマーが用いられ、そして各アッセイプライマーは、プライミング部分およ
びアッセイ識別子(例えばQCバーコード)を備えることによって、一セットのオリゴヌ
クレオチドアンプリコンを生成する。各オリゴヌクレオチドアンプリコンは、アッセイ識
別子の1つ、5’定常領域、サンプル識別子の1つ、および3’定常領域を含む。本アッ
セイ法は、種々の標準化された配列決定プラットフォーム(例えば、Illumina配
列決定プラットフォームおよびIon Torrent配列決定プラットフォーム)にと
って標準である定常領域を選択することによって、それらのプラットフォームに容易に適
合し得る。
【0023】
一部の実施形態において、本方法は、アッセイによって誘導される夾雑を回避または防
止するために少数のハンドリング工程を用いて、1%未満、代わりに0.5%未満、ある
いは0.1%未満のレベルのサンプル識別子夾雑を検出して、少数の配列決定ランが実行
されるようなプーリングおよび分析の方法を提供する。本開示は、サンプル識別子を有す
る、潜在的に夾雑されたオリゴヌクレオチド由来のライブラリを調製するための、高速か
つ比較的安価な方法を提供する。ライブラリは、1つまたは複数の所望の配列決定プラッ
トフォームでの配列決定、とりわけ超並列配列決定に適合する。
【0024】
一部の実施形態において、オリゴヌクレオチドアンプリコンは、5’定常領域および3
’定常領域を含む。さらに、5’定常領域は、配列決定プラットフォームおよび配列決定
プライミング領域のための標準5’アダプター、アッセイ識別子、配列決定プライミング
領域を含む中央の定常領域、ならびにサンプル識別子を含み、そして3’定常領域は、配
列決定プラットフォームのための標準3’アダプターを含む。一部の実施形態において、
オリゴヌクレオチドアンプリコンは、(i)配列決定プラットフォームおよび配列決定プ
ライミング領域のための標準5’アダプターを含む5’定常領域、(ii)アッセイ識別
子、(iii)配列決定プライミング領域を含む中央の定常領域、(iv)サンプル識別
子、ならびに(v)配列決定プラットフォームのための標準3’アダプターを含む3’定
常領域を含む。例えば、標準5’アダプターは、Illumina P5またはP5’配
列を含んでよく、そして標準3’アダプターは、Illumina P7またはP7’配
列を含んでよい。P7’は、P7の相補体を示す。同様に、P5’は、P5の相補体を示
す。他の実施形態において、オリゴヌクレオチドアンプリコンは、標準5’アダプターを
含む5’定常領域、サンプル識別子、中央の定常領域、アッセイ識別子、および標準3’
アダプターを含む3’定常領域を含む。
【0025】
本方法、本組成物、および本キットはまた、第1の配列決定プラットフォーム用の標準
領域(例えば、増幅領域または配列決定プライマー部位(領域))を含むオリゴヌクレオ
チドを修飾して、異なる配列決定プラットフォーム用の標準領域を含ませるのに用いるこ
とができる。一部の実施形態において、第2のプライマーは、オリゴヌクレオチドの3’
定常領域と相補的な3’領域を含み、そして第2のプライマーはさらに、標準増幅領域を
含む5’領域を含み、オリゴヌクレオチドの3’定常領域は、第2のプライマーの5’領
域の標準増幅領域とは異なる配列決定プラットフォーム用の標準増幅領域を含む。
【0026】
本開示はまた、サンプル識別子およびアッセイ識別子の夾雑を同定する新規のプーリン
グスキームおよび配列決定スキームを提供する。一部の実施形態において、本方法は、オ
リゴヌクレオチドアンプリコンを、少なくとも2つのプール内にプールするステップと;
サンプル識別子およびアッセイ識別子を含むオリゴヌクレオチドアンプリコンの少なくと
も一部の配列を決定するために、2つのプールについて配列決定を行うステップと;第2
のプール内のサンプル識別子が夾雑サンプル識別子を含むかどうかを判定するステップと
;第2のプール内のアッセイ識別子が夾雑アッセイ識別子を含むかどうかを判定するステ
ップとを含む。一部の実施形態において、本方法はさらに、夾雑サンプル識別子を、その
夾雑サンプル識別子が第2のプールに由来すると判定することによって判定するステップ
を含む。一部の実施形態において、本方法はさらに、夾雑サンプル識別子を、第2のプー
ルが夾雑アッセイ識別子を含んでいないことを判定することによって同定することを含む
。一部の実施形態において、本方法はさらに、夾雑アッセイ識別子を、第2のプールが夾
雑アッセイ識別子を含んでいないことを判定することによって同定することを含む。
【0027】
一部の実施形態において、本方法はさらに、アッセイグループを形成するために、アッ
セイ識別子に従ってオリゴヌクレオチドアンプリコンの配列をグループ化するステップと
;アッセイグループのそれぞれにおいて複数のサンプル識別子配列が存在するかを判定す
るステップとを含む。一部の実施形態において、本方法はさらに、サンプルグループを形
成するために、サンプル識別子に従ってオリゴヌクレオチドアンプリコンの配列をグルー
プ化するステップと;サンプルグループのそれぞれにおいて複数のアッセイ識別子配列が
存在するかを判定するステップとを含む。一部の実施形態において、本方法は、オリゴヌ
クレオチドアンプリコンから少なくとも2つのプールを形成するステップと;オリゴヌク
レオチドアンプリコンの配列情報を得るために、アンプリコンの少なくとも2つのプール
について配列決定を行うステップとを含み;個々のオリゴヌクレオチドアンプリコンにつ
いての配列情報は、少なくとも、アッセイ識別子およびサンプル識別子の配列を含む。一
部の実施形態において、本方法は、アッセイ識別子に従ってアンプリコン配列情報をグル
ープ化するステップと;グループ化されたアンプリコン配列情報が複数のサンプル識別子
を含有するかを判定するステップとを含んでよい。
【0028】
本方法は、例えば、サンプル識別子の少なくとも1つが、関連するはずのないアッセイ
識別子と関連する場合、かつ/またはアッセイ識別子の少なくとも1つが、関連するはず
のないサンプル識別子と関連する場合、アッセイ識別子とサンプル識別子間のミスマッチ
が存在するかを判定するステップを含んでよい。
【0029】
本方法は、NGS用のサンプル調製キットとともに用いることができる。また、ライブ
ラリ調製試薬に用いることができる。本方法はまた、SureSelect試薬キットな
どの、サンプルバーコードまたは他の識別子を含有するアッセイ標的濃縮キットおよびセ
ットに用いることができる。SureSelectキット(Agilent Techn
ologiesから入手可能)は、サンプル識別子を有し、かつサンプル識別子に対する
1つまたは複数の定常領域5’および3’を有するオリゴヌクレオチド、すなわちPCR
プライマーを含有する。
【0030】
本開示は、夾雑が実質的にない、例えば、夾雑サンプル識別子が0.1%未満、または
0.01%未満であるサンプル識別子セットまたはキットの製造を可能にする。
【0031】
図1Aにおいて、オリゴヌクレオチド102は、5’定常領域110、サンプル識別子
112、および3’定常領域114を含む。例えば、5’定常領域110は、標準配列、
例えばIllumina Index 1配列を含んでよく、サンプル識別子112、お
よび3’定常領域114は、標準増幅配列、例えばIllumina P7’配列を含ん
でよい。定常領域は、増幅または配列決定用のあらゆる標準プライミング部位(領域)を
含んでよい。オリゴヌクレオチド102は、3’定常領域114の少なくとも一部と相補
的なプライミング領域115を有するプライマー104を用いて増幅される。例えば、プ
ライマー104は、P7プライマーであってよい。同じ工程または以降の工程において、
オリゴヌクレオチド102またはその相補体は、5’定常領域110またはその相補体1
11の少なくとも一部と相補的なプライミング領域120を有するプライマー106で増
幅される。プライマーはまた、アッセイ識別子122および1つまたは複数の定常領域1
26、124(例えば、Illumina P5配列126およびread 1配列決定
プライマー124)を含む。増幅の更なるラウンドにより、1つまたは複数の定常領域1
26、124、アッセイ識別子122、最初のオリゴヌクレオチドの5’定常領域120
の配列、サンプル識別子配列128、および最初のオリゴヌクレオチドの3’定常領域1
30を含むオリゴヌクレオチドアンプリコン108が生じる。アンプリコン108内のサ
ンプル識別子配列128は、通常、オリゴヌクレオチド102のサンプル識別子112の
同一コピーである。アンプリコン108の定常領域120は、ほとんどの場合、オリゴヌ
クレオチド102の定常領域110と同一であろう。しかしながら、いずれかが部分的に
トランケートされている場合がある。例えば、定常領域110は、5’末端上でトランケ
ートされている場合があり、そして定常領域120は、3’末端上でトランケートされて
いる場合がある。同様に、定常領域114は、3’末端上で部分的にトランケートされて
いる場合があり、そして定常領域130は、5’末端上で部分的にトランケートされてい
る場合があるが、アンプリコン108の定常領域130およびオリゴヌクレオチド102
の定常領域114は、通常、同じであろう。オリゴヌクレオチドアンプリコン108は、
定常領域により、超並列配列決定用の標準プラットフォームでの配列決定に適合する。
【0032】
図1Bは、本方法の別の実施形態を示す。この実施形態において、オリゴヌクレオチド
103は、3’定常領域111、サンプル識別子113、および5’定常領域115を含
む。例えば、3’定常領域111は、Illumina Read 2配列(または配列
決定プラットフォーム用の別の標準領域)であってよく、そして5’定常領域115は、
増幅または配列決定用のIllumina P7配列またはあらゆる標準プライミング部
位(領域)であってよい。増幅により、1つまたは複数の定常領域127、125、アッ
セイ識別子123、3’定常領域111、サンプル識別子配列113、および5’定常領
域115の配列を含むオリゴヌクレオチドアンプリコン109が生じる。増幅の更なるラ
ウンドが、プライマー131で行われてよく、これは、プライマーとして機能するのに十
分な定常領域115の部分と同じ配列を有する。
【0033】
図1Cは、最初のオリゴヌクレオチドが、配列決定プラットフォーム用のサンプル識別
子および標準領域が取り付けられている挿入部を含む分子であるライブラリ分子である場
合に、いかにアッセイ方法が実行され得るかを実証している。この実施形態において、ア
ッセイ方法は、ライブラリ調製中に起こった夾雑を検出することができる。オリゴヌクレ
オチド102は、第1の5’定常領域110、サンプル識別子112、3’定常領域11
4を含み、そしてさらに挿入部140、第2の5’定常領域142(例えば、Read
1プライミング部位)、任意選択の第2のサンプル識別子144、および第3の5’定常
領域146(例えば、増幅プライミング部位)を含む。挿入部140は、研究され、分析
され、または追加試験、例えば超並列配列決定プラットフォームでの配列決定にかけられ
ることとなる標的配列を含む。第2のサンプル識別子144は、場合によっては、多くの
ライブラリ調製物内に含まれる。オリゴヌクレオチド103(オリゴヌクレオチド102
の相補鎖である)は、第1の3’定常領域111、サンプル識別子113、5’定常領域
115を含み、そしてさらに、挿入部141、第2の3’定常領域143(例えば、Re
ad 1プライミング部位)、任意選択の第2のサンプル識別子145、および第3の3
’定常領域147(例えば、増幅プライミング部位)を含む。オリゴヌクレオチド102
は、3’定常領域111の少なくとも一部と相補的なプライミング領域115を有するア
ッセイプライマー104を用いて増幅される。例えば、プライマー104は、P7プライ
マーであってよい。同じ工程または以降の工程において、オリゴヌクレオチド102また
はその相補体は、5’定常領域110またはその相補体111の少なくとも一部と相補的
なプライミング領域120を有するプライマー106で増幅される。プライマーはまた、
アッセイ識別子122および1つまたは複数の定常領域126、124(例えば、Ill
umina P5配列126およびRead 1配列決定プライマー領域124)を含む
。増幅の更なるラウンドは、1つまたは複数の定常領域126、124、アッセイ識別子
122、最初のオリゴヌクレオチドの5’定常領域120の配列、サンプル識別子配列1
28、および最初のオリゴヌクレオチドの3’定常領域130を含むオリゴヌクレオチド
アンプリコン108を生成する。示される実施形態において、オリゴヌクレオチドアンプ
リコン108は、挿入部140を含まないが、一部の実施形態において、プライマー10
6は、領域3’を挿入部140に結合させ、そしてそれによって、挿入部140はアンプ
リコン内に含まれる。プーリング方法(実施例4に記載される)が、2つ以上のサンプル
バーコード(バーコードが、ライゲーションまたは増幅のいずれかを介して取り付けられ
ている場合)で調製されたライブラリに使用することができ、そして当該プーリング方法
は、ライブラリ調製が実行された後にサンプルバーコード夾雑が起こったかを同定するの
に用いることができる。
【0034】
アッセイプライマー上の定常領域およびプライミング領域の選択によって、本方法は、
様々なライブラリ調製方法(Haloplex XTHS、Haloplex HS、S
ureSelect XT、およびSureSelect QXT(全てAgilent
由来)が挙げられる)、および様々な標準化された配列決定プラットフォーム(Illu
minaおよびIon Torrentが挙げられる)に適合性がある。超並列配列決定
用の配列決定プラットフォームとして、Ion Torrent PGMおよび陽子半導
体シーケンサー、ならびにIllumina MiSeq、HiSeq、MiniSeq
、およびNextSeqが挙げられる。他の配列決定プラットフォームが開発中であり、
そして本組成物および方法は、それらのプラットフォーム用の標準増幅領域に用いること
ができる。
【0035】
一部の実施形態において、オリゴヌクレオチド上の定常領域および/またはアッセイ識
別子は、標準化された配列決定プラットフォームでの使用に適した配列を含む。例えば、
定常領域は、Illumina配列決定プラットフォーム用の増幅領域の配列、例えばI
llumina P5配列もしくはIllumina P7配列、または例えばIon
TorrentアダプターA配列もしくはIon TorrentアダプターP1配列、
または例えば配列決定プライマー領域、例えばIllumina Read1、Inde
x1、Read2、もしくはIndex2を有してよい。他の増幅領域または配列決定プ
ライマー領域を、様々なプラットフォームに用いることができる。表1は、Illumi
naおよびIon Torrent配列決定プラットフォームに現在用いられている標準
領域の配列を示す。
【0036】
【表1】
一部の実施形態において、オリゴヌクレオチドの定常領域は、表1に示される配列から
選択される配列を含む。
【0037】
図5は、本方法および本組成物が、サンプル識別子に対して3’の位置にアッセイ識別
子を加えるためにどのように用いられ得るかを示す。このアプローチは、とりわけ、配列
決定されることとなる標的分子の5’末端への取付け用に構成されるアダプター、または
標的分子の5’末端を増幅することが意図されるプライマーであるオリゴヌクレオチドに
適している。ゆえに、この実施形態において、本方法は、5’アダプター(
図1に示され
る3’アダプターに代わるものである)内に存在する識別子を検出するのに特に適してい
る。
【0038】
図5において、オリゴヌクレオチド502は、5’定常領域510、サンプル識別子5
12、および3’定常領域514を含む。例えば、5’定常領域510は、Illumi
na P5配列であってよく、サンプル識別子512は、サンプルバーコードであってよ
く、そして3’定常領域514は、Illumina Read 1配列であってよい。
オリゴヌクレオチド502は、3’定常領域514の少なくとも一部と相補的なプライミ
ング領域515を有するプライマー504を用いて増幅される。例えば、プライミング領
域515は、3’定常領域514の逆相補体、すなわちIllumina Read 1
配列の逆相補体であってよい。プライマー504はまた、配列決定プラットフォームまた
はその相補体、例えばIllumina P7の逆相補体(P7’)用のアッセイ識別子
517およびアダプター519を含む。オリゴヌクレオチド502またはその相補体は、
5’定常領域510またはその相補体の少なくとも一部と相補的なプライミング領域52
0を有するプライマー506で増幅される。増幅の更なるラウンドは、3’アダプター5
18、アッセイ識別子522、516、3’定常領域514、サンプル識別子512、お
よび5’定常領域520を含むオリゴヌクレオチドアンプリコン508を生成する。オリ
ゴヌクレオチドアンプリコン508は、超並列配列決定用の標準プラットフォームでの配
列決定に適合する。なぜなら、少なくとも1つの定常領域、そして多くの場合、双方の定
常領域が、そのようなプラットフォーム用のアダプターを含むからである。
【0039】
図6は、本アッセイ方法および組成物が、2つの定常領域によって囲まれるオリゴヌク
レオチドであって、当該定常領域のどちらもアッセイに用いられることとなる配列プラッ
トフォームと適合しない場合に、そのオリゴヌクレオチド内の夾雑を検出するのにいかに
用いられ得るかを示す。これ以外にも、このアプローチは、アダプターおよびプライマー
を、ある配列決定プラットフォームから変換して、別のプラットフォームで配列決定でき
るようにするのに用いることができる。例えば、Ion Torrent HaloPl
exアッセイに用いられるアダプター等のオリゴヌクレオチドは、Illumina P
5、QXT Read1、QCインデックス、IonTorrent Readプライマ
ーを含むアッセイプライマー、ならびにIllumina P7およびHaloplex
ダーク塩基(dark base)(ダーク塩基は、配列決定中のヌクレオチド組込みと
関連する蛍光を生じさせないものである)に対する逆相補体を含む増幅プライマーを用い
てアッセイすることができる。これにより、これらのプライマーを、Illuminaシ
ーケンサーで夾雑についてアッセイすることができる。このアプローチはまた、配列決定
が意図されていない、そしてプラットフォームを配列決定するための増幅領域を含まない
オリゴヌクレオチドの配列決定を可能にするのにも用いることができる。ただし、当該オ
リゴヌクレオチドが、5’定常領域、知られていない領域、および3’定常領域を含む場
合である。
【0040】
図6において、オリゴヌクレオチド602は、5’定常領域610、サンプル識別子6
12、および3’定常領域614を含む。この実施形態において、オリゴヌクレオチド6
02の定常領域610、614は、第1の配列決定プラットフォーム、例えばIon T
orrent配列決定プラットフォーム用であるが、第2の配列決定プラットフォーム、
例えばIllumina配列決定プラットフォームでオリゴヌクレオチド602を配列決
定することが所望される。例えば、5’定常領域610は、Ion Torrentアダ
プターA配列であってよく、サンプル識別子612は、サンプルバーコードであってよく
、そして3’定常領域614は、ライゲーションおよび品質制御を可能とするために提供
されるダーク塩基であってよい。オリゴヌクレオチド602は、3’定常領域614の少
なくとも一部と相補的な(すなわち、ダーク塩基の少なくとも一部と相補的な)プライミ
ング領域615を有するプライマー604を用いて増幅される。プライマー604はまた
、配列決定プラットフォーム用の標準増幅領域、例えばIllumina P7配列に相
当する領域を含む領域617を含む。オリゴヌクレオチド602またはその相補体は、5
’定常領域610またはその相補体611の少なくとも一部と相補的なプライミング領域
620を有するプライマー606で増幅される。プライマー606はまた、アッセイ識別
子622および1つまたは複数の定常領域(例えば、Illumina P5配列626
およびIllumina Read 1配列624)を含む。増幅が、適切な増幅サイク
ルを用いて、プライマー606およびプライマー604で続けられて、Illumina
配列決定プラットフォームでの配列決定に適したオリゴヌクレオチドアンプリコンを提供
する。増幅の更なるラウンドにより、1つまたは複数の定常領域626、624、アッセ
イ識別子622、最初のオリゴヌクレオチド620の5’定常領域610の配列620、
サンプル識別子612、3’定常領域614の配列、および増幅領域628を含むオリゴ
ヌクレオチドアンプリコン608が生じる。オリゴヌクレオチドアンプリコン608は、
定常領域626および/または増幅領域628により、超並列配列決定用の標準プラット
フォームでの配列決定に適合する。
【0041】
一部の実施形態において、(アダプターの場合のような)相補的DNA鎖の存在は、相
補的アダプター鎖が増幅プライマー用の結合領域の双方を含有するならば、夾雑または配
列変化の検出に関する問題を引き起こす虞がある。そのような状況では、双方の鎖が増幅
されることとなり、検出されるあらゆる夾雑/配列変化が、2本の鎖上に存在するバーコ
ード配列の配列差異に起因し得た。多くの場合において、アダプター設計は、こうしたこ
とが起こらないようになされる。
【0042】
[実施例1]
本方法の実施形態は、サンプルバーコード夾雑が、Illuminaアダプター配列を
有するキット内に存在するかを判定するのに使用される。
図1Aに示すように、オリゴヌ
クレオチド102は、サンプル識別子112を有し、Illumina Index1配
列がその5’定常領域110として、そしてIllumina P7’配列がその3’定
常領域114として、側面に位置する。P7’は、P7の相補体を示す。同様に、P5’
は、P5の相補体を示す。
図1は、このオリゴヌクレオチド102の夾雑を、様々なサン
プル識別子を有するオリゴヌクレオチドで検出する方法を示す。増幅は、標準的なDNA
ポリメラーゼ、P7プライマー、およびP5を含む別のプライマー、Read 1プライ
マー配列、QCバーコード、およびIndex 1配列(それぞれ5’から3’)を用い
て実行することができる。高フィデリティ(high fidelity)DNAポリメ
ラーゼを用いて、PCRエラーに起因する誤った夾雑検出を引き下げ、または最小にする
ことができる。
【0043】
アッセイプライマーの2つのバージョンまたは実施形態を用いて、アッセイを開発した
。当該2つのバージョンの配列を、
図2に示す。Illumina Read 1プライ
マー、およびIllumina Read 2(Index 1)プライマー配列の逆相
補体の双方をアッセイプライマー内に含むアッセイプライマーのバージョン1を用いた最
初の試みにより、少量の予想される130bpのアンプリコンおよび大量のより短い増幅
産物が生じた(
図3のレーンB1)。これらの産物は、潜在的に、Read 1の3’末
端とIndex 1の5’末端間の13bpの相補性に起因して生じる二次増幅産物に由
来する。Read 1の配列をIllumina配列からQXT Read 1配列(ア
ッセイプライマーのバージョン2)に変えることによって、これらの二次増幅産物は、大
部分が除外された(
図4のレーンB1)。
【0044】
[実施例2]
HaloplexおよびHaloplex HSキットを試験して、サンプルバーコー
ドを含有するオリゴヌクレオチドが、キット内に供給される供給インデックス溶液内で増
幅し得るかを見た。オリゴヌクレオチドは、きれいに増幅し得ることが判明した。という
のも、アッセイプライマーを用いた場合に、強い増幅産物が生じたからである(
図4、レ
ーンB1(供給したインデックス溶液))。
【0045】
[実施例3]
アッセイプライマーを、SureSelect XTおよびSureSelect X
T2試薬キットで試験して、オリゴヌクレオチドが首尾よく増幅された。また、本アッセ
イプライマーを用いて、重複配列に修飾があるSureSelect XTHS試薬キッ
トを試験して、オリゴヌクレオチドが首尾よく増幅された。
【0046】
これらのライブラリの増幅は、オリゴヌクレオチドが伸長を防止するように修飾されて
いる場合ですら、起こり得る。というのも、最初の2ラウンド後以降のラウンドが、合成
された分子を鋳型として用いるからである。増幅方法もまた、5’ビオチン修飾の存在下
で機能する。
【0047】
[実施例4]
96個以上のサンプル識別子の一セットを用意する。当該セットは、配列決定前の増幅
に先立って、かつ/またはプーリングに先立って、サンプル識別子を核酸に加えるのに用
いることができる。しかしながら、キットのアセンブリまたは試薬の調製中に、これらの
サンプル識別子の1つにおいて夾雑が生じたならば、サンプル中の低い対立遺伝子変異体
の検出が生じる場合がある。夾雑の欠如について確信を持つために、多数の配列決定ラン
を実施して、全てのサンプル識別子に夾雑がないと確認することができることを確実にし
た。
【0048】
以下のスキームは、この制限を克服し、そして以下のスキームを用いて、サンプル識別
子(この実施例においてサンプルバーコードまたはSBCとも呼ばれる)および/または
アッセイ識別子(この実施例においてQCバーコードまたはQCBCとも呼ばれる)の夾
雑を判定することができる。様々なサンプル識別子を含有する96個のオリゴヌクレオチ
ドの一セットを、2つのグループ、グループ1およびグループ2に分割する。それぞれは
48個のオリゴヌクレオチドを含有する。グループ1は、SBC1~SBC48を有し、
グループ2は、SBC49~SBC96を有する。グループ1内の各サンプル識別子を、
48個の様々なアッセイ識別子(QCBC1~QCBC48)の1つを含有するアッセイ
プライマーで増幅する。グループ2内の各サンプル識別子を、グループ1に用いた同じ4
8個のアッセイ識別子の1つで、全てのアッセイ識別子(QCBC1~QCBC48)が
双方のグループに、かつ2つの増幅反応に存在するように、そして全てのサンプル識別子
(SBC1~SBC96)が、1つのグループにのみ、かつ1つの増幅反応にのみ存在す
るように、増幅する。スキームに従うサンプル識別子(SBC)とのアッセイ識別子(Q
CBC)の関連を、
図7に示す。説明目的で、SBCを、96ウェルプレート内に配置す
るように示すが、ウェルプレート内に用意する必要もなければ、ウェルプレートに用いる
必要もない。
【0049】
PCR増幅は、QCBCおよびSBCを有するオリゴヌクレオチドアンプリコンを生成
する。夾雑がない場合、各SBCは、一つのQCBCと関連する。言い換えると、配列決
定した場合、SBC毎の配列情報は、それと関連する単一のQCBCを有するはずである
。
図7は、このスキームを用いて生じることとなる関連を示す。しかしながら、超並列配
列決定を用いて、個々にではなくプールでアンプリコンを配列決定することによって、配
列決定に必要とされる時間、費用、および努力を引き下げることが所望される。ゆえに、
グループ1において生じるオリゴヌクレオチドアンプリコンを、一緒にプールして配列決
定し、そしてグループ2由来のオリゴヌクレオチドアンプリコンを、一緒にプールして配
列決定する。プールの配列決定は、プール内に含まれる種々のアンプリコンについての配
列情報を生じさせ、そして所定のアンプリコンについての配列決定情報は、サンプル識別
子、およびそれと関連するアッセイ識別子を有することとなる。
【0050】
こうした配列決定により、配列情報の分析後に同定される関連に基づいた、サンプル識
別子またはアッセイ識別子に起因する夾雑の検出が可能となることとなる。この分析のた
めに、全ての潜在的サンプル識別子(プール内に存在することが意図されるか否かに拘ら
ない)を、配列決定情報の分析に含めることが有益である。夾雑が起こるならば、夾雑は
、サンプル識別子またはアッセイプライマーに由来し得る。サンプル識別子およびアッセ
イ識別子が(グループ1およびグループ2由来の)2つの配列決定プールにおいて現れる
パターンは、夾雑がサンプル識別子夾雑またはアッセイ識別子夾雑のいずれであるかを判
定することとなる。本スキームにより、どちらが夾雑の源であるかを判定することができ
る。
【0051】
グループ2由来のサンプル識別子が、グループ1において観察されるならば(例えば、
SBC66の配列が、グループ1についての配列決定情報において見出されるならば)、
これは、グループ1内における一つのサンプルバーコードの夾雑を示す。というのも、予
想される48個ではなく49個のサンプル識別子が存在するからである。しかしながら、
この知識のみでは、グループ1内のどのサンプル識別子にSBC66が夾雑したかを示せ
ない。どのアッセイ識別子が夾雑SBC66と関連するかに基づいて、夾雑した具体的な
サンプルバーコードを判定する。第1のプール内に見出されたSBC66がQCBC10
と関連するならば、SBC10は、SBC66が夾雑したサンプル識別子である。グルー
プ1内のいずれのサンプル識別子も、それと関連する、夾雑サンプル識別子と同じアッセ
イ識別子を有するならば、サンプル識別子は夾雑している。
【0052】
加えて、本方法、本組成物、および本キットはまた、複数のアッセイ識別子と関連する
サンプル識別子を同定することによって、かつ/または複数のサンプル識別子と関連する
アッセイ識別子を同定することによって、プール内の夾雑を検出することもできる。配列
情報がSBC13およびQCBC13を有するアンプリコン、ならびにSBC13および
QCBC29を有するアンプリコンの存在を示す(すなわち、SBC13は、QCBC1
3と、そしてQCBC29と関連する)ならば、これは、何らかの夾雑が存在することを
示す。しかしながら、この知識のみでは、SBC29にSBC13が夾雑したのか、QC
BC13にQCBC29が夾雑したのかを示せない。同じアッセイ識別子の夾雑が第2の
プール内に存在するか同定することによって、夾雑の源を同定することができる。第2の
プールにおいて、SBC61は、夾雑の不在下で、QCBC13とのみ関連することとな
る。しかしながら、SBC61が、QCBC29とも関連するならば、これは、QCBC
13が夾雑されたことを示す。なぜなら、夾雑が双方のプールにおいて生じたからである
。SBC61がQCBC29と関連しないならば、QCBC13は夾雑されておらず、S
BC29が、第1のプールにおける夾雑の源であった。また、同じアプローチが、グルー
プ2のプール内に存在するグループ1サンプル識別子について機能する。本方法は、2つ
の配列決定プールを用いて、サンプル識別子の夾雑と、アッセイ識別子の夾雑との間に差
異を認める能力を提供する。
【0053】
本方法および本組成物はまた、2つの定常領域間で見出されるランダムなヌクレオチド
の配列変異を判定するのに用いることもできる。アッセイ識別子は、配列決定出力が、所
望される夾雑のレベルを検出するのに十分であると仮定して、標準サンプルバーコードと
して作用することができ、そしてサンプルの1つのみのプールが必要とされることとなる
。例えば、このアッセイは、小さな可変領域が2つの定常領域間に存在する場合、配列内
に生じる夾雑の低いレベル量を同定するのに用いることができ、そして意図されるあらゆ
る用途に用いられるオリゴヌクレオチド内の夾雑または変異を同定するのに有益であり得
る。
【0054】
例示的な、または好ましい実施形態の上述の説明は、特許請求の範囲によって定義され
る本発明を限定するのではなく、具体的に説明するものととられるべきである。容易に理
解されるように、先に記載した特徴の多数の変異および組合せを、特許請求の範囲に記載
される本発明を逸脱しない範囲で利用することができる。そのような変形は、本発明の範
囲からの逸脱とみなされず、そしてそのような変形は全て、以下の特許請求の範囲の範囲
内に含まれることが意図される。本明細書中で引用される参考文献は全て、その全体が参
照によって組み込まれる。
【配列表】