【文献】
Gunderson KL、他19名,Decoding Randomly Ordered DNA Arrays,GENOME RESEARCH,2004年 5月,Vol.14,No.5,Page.870-877
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0023】
詳細な説明
図面および以下の説明は本発明の様々な態様に関するが、例示にすぎない。以下の議論から、本明細書において開示された構造および方法の代わりの態様は、クレームされたものの原理から逸脱することなく使用され得る実行可能な代案として容易に認められることに留意しなければならない。
【0024】
今から、いくつかの態様について詳しく触れる。態様の例を添付の図面に図示した。実施可能なときはいつでも、類似する、または同様の符番が図面に使用することができ、類似する、または同様の機能を示すことができることに留意する。図面は、例示だけの目的で、開示されたシステム(または方法)の態様を示す。当業者は、以下の説明から、本明細書に記載の原理から逸脱することなく、本明細書において例示された構造および方法の代わりの態様が使用され得ることを容易に認めるだろう。
【0025】
定義
「標的分析物」または「分析物」とは、特定、定量、および別の方法で特徴付けされる分子、化合物、物質、または成分を指す。標的分析物は、例として、原子、化合物、分子(任意の分子サイズの分子)、ポリペプチド、タンパク質(折り畳まれたタンパク質もしくは折り畳まれていないタンパク質)、オリゴヌクレオチド分子(RNA、cDNA、もしくはDNA)、その断片、その修飾された分子、例えば、修飾された核酸、またはその組み合わせを含んでもよいが、これに限定されない。一態様において、標的分析物ポリペプチドまたはタンパク質は長さが約9アミノ酸である。一般的に、標的分析物は、任意の(例えば、ピコリットル範囲と少ない)溶液体積で、広範囲の濃度(例えば、mg/mL〜ag/mL範囲)のうちのどの濃度でもよい。例えば、血液、血清、ホルマリン固定パラフィン包埋(FFPE)組織、唾液、または尿の試料が様々な標的分析物を含有する可能性がある。標的分析物はプローブによって認識され、プローブは、電気的検出方法または光学的検出方法を用いて標的分析物を特定および定量するのに用いられる。
【0026】
標的タンパク質への修飾には、例えば、翻訳後修飾、例えば、タンパク質への他の生化学的官能基(例えば、酢酸、リン酸、様々な脂質および炭水化物)の取り付け、アミノ酸の化学的性質の変化(例えば、シトルリン化)、または構造変化(例えば、ジスルフィド架橋の形成)が含まれ得る。翻訳後修飾の例には、膜局在化のための疎水基の付加(例えば、ミリストイル化、パルミトイル化)、酵素活性を向上させるための補因子の付加(例えば、リポイル化(lipolyation))、翻訳因子の修飾(例えば、ジフタミド形成)、化学基の付加(例えば、アシル化、アルキル化、アミド結合形成、グリコシル化、酸化)、糖修飾(グリケーション)、他のタンパク質もしくはペプチドの付加(ユビキチン化(ubiquination))、またはアミノ酸の化学的性質の変化(例えば、脱アミド、カルバミル化)も含まれるが、これに限定されない。
【0027】
他の態様において、標的分析物は、修飾されているオリゴヌクレオチドである。DNA修飾の例にはDNAメチル化およびヒストン修飾が含まれる。
【0028】
本明細書で使用する「プローブ」とは、他の分子(例えば、DNAもしくはRNAを含むオリゴヌクレオチド、ポリペプチドもしくは完全長タンパク質など)、細胞成分もしくは構造(脂質、細胞壁など)、または細胞の特性を検出または評価するために、前記の分子、細胞成分もしくは構造、または細胞に結合することができる分子を指す。プローブは、標的分析物に結合する構造または成分を含む。一部の態様において、複数のプローブが同じ標的分析物の異なる部分を認識し得る。プローブの例にはアプタマー、抗体、ポリペプチド、オリゴヌクレオチド(DNA、RNA)、またはその任意の組み合わせが含まれるが、これに限定されない。プローブとしての抗体、アプタマー、オリゴヌクレオチド配列、およびその組み合わせも下記で詳述される。
【0029】
プローブは、標的分析物の存在を検出するために用いられるタグを含んでもよい。タグは、標的分析物結合成分に直接的または間接的に結合されてもよく、ハイブリダイズされてもよく、結合体化されてもよく、共有結合的に連結されてもよい。一部の態様において、タグは、蛍光分子または化学発光分子などの検出可能な標識である。他の態様において、タグは、ホモポリマー塩基領域(例えば、ポリAテール)を有するオリゴヌクレオチド配列を含む。プローブは、タグを介して電気的、光学的、または化学的に検出することができる。
【0030】
本明細書で使用する「タグ」という用語は、標的分析物を検出することができる分子を指す。タグは、ホモポリマー塩基領域(例えば、ポリAテール)を有するオリゴヌクレオチド配列でもよい。他の態様において、タグは、蛍光標識などの標識である。タグは、蛍光分子、化学発光分子、発色団、酵素、酵素基質、酵素補因子、酵素阻害剤、色素、金属イオン、金属ゾル、リガンド(例えば、ビオチン、アビジン、ストレプトアビジン、またはハプテン)、放射性同位体などを含んでもよいが、これに限定されない。タグはプローブに直接的または間接的に結合されてもよく、ハイブリダイズしてもよく、結合体化されてもよく、共有結合的に連結されてもよい。
【0031】
「タンパク質」または「ポリペプチド」または「ペプチド」とは、2つ以上のアミノ酸、アミノ酸類似体、または他のペプチドミメティック
の分子を指す。タンパク質は折り畳まれていてもよく、折り畳まれていなくてもよい(変成されていてもよい)。ポリペプチドまたはペプチドは、αヘリックス、βシート、または他のコンホメーションなどの二次構造を有してもよい。本明細書で使用する「アミノ酸」という用語は、グリシンおよびD光学異性体またはL光学異性体の両方、ならびにアミノ酸類似体およびペプチドミメティックを含む、天然および/または非天然もしくは合成のアミノ酸を指す。ペプチドは長さが2アミノ酸以上でもよい。長さがさらに長いペプチドはポリペプチドと呼ばれることが多い。タンパク質は、完全長タンパク質、類似体、およびその断片を指す場合があり、この定義に含まれる。これらの用語はまた、タンパク質またはポリペプチドの発現後修飾、例えば、グリコシル化、アセチル化、リン酸化なども含む。さらに、イオン化可能なアミノ基およびカルボキシル基が分子に存在するので、ある特定のポリペプチドは酸性塩もしくは塩基性塩として、または中性の形で得られる場合がある。タンパク質またはポリペプチドは供給源生物から直接得られてもよく、組換えまたは合成により産生されてもよい。
【0032】
タンパク質は、ペプチド配列、側鎖修飾、および/または三次構造によって特定および特徴付けることができる。側鎖修飾には、リン酸化、アセチル化、糖などが含まれる。セリン、スレオニン、およびチロシンアミノ酸からのヒドロキシル基のリン酸化は特に重要な関心対象の修飾である。
【0033】
「インビボ」という用語は、生物の中で起こるプロセスを指す。
【0034】
本明細書で使用する「哺乳動物」という用語はヒトおよび非ヒトを両方とも含み、ヒト、非ヒト霊長類、イヌ、ネコ、マウス、ウシ、ウマ、およびブタを含むが、これに限定されない。
【0035】
本明細書で使用する「試料」とは、生物学的材料からの標本、培養物、または収集物を含む。試料は、ヒト、サル、ラット、またはマウスを含むが、これに限定されない哺乳動物から得られてもよく、採取されてもよい。試料は、培養物、血液、組織、ホルマリン固定パラフィン包埋(FFPE)組織、唾液、毛、糞便、尿などがあるが、これに限定されない材料を含んでもよい。これらの例は、本発明に適用可能な試料タイプを限定するものであると解釈してはならない。
【0036】
本明細書で使用する「ビット」とは、演算処理およびデジタル通信における情報の基本単位を指す。ビットは2つの値のうちの1つだけをとることができる。これらの値の最も一般的な表現は0および1である。ビットという用語は2進数字(binary digit)の短縮形である。一例では、4ビットの情報を用いるシステムは(表1Aに示したように)16の異なる値を作り出すことができる。1桁台の16進数は全て4ビットで書くことができる。2進化10進法は、10進表記法を用いた数のデジタル符号化方法であり、それぞれの10進数字は4ビットで表現される。8ビットを用いた計算である別の例では、2
8(すなわち256)通りの値がある。
【0038】
検出アッセイにおける「パス」とは、複数のプローブが、結合された分析物に導入され、プローブと別個の標的分析物との間で選択的結合が起こり、プローブから複数の信号が検出されるプロセスを指す。1回のパスは、標的分析物に特異的に結合する1セットの抗体の導入を含む。支持体から全プローブが取り除かれる前に、異なるプローブセット
の複数回のパスがあってもよい。
【0039】
「サイクル」とは、1回または複数回のパスが完了し、支持体からプローブが取り除かれることと定義される。1サイクルにつき1回または複数回のパス
である次のサイクルが行われてもよい。1種類の支持体または試料に対して複数のサイクルが行われてもよい。タンパク質の場合、複数のサイクルには、プローブを除去する(取り除く)条件が、正しい立体配置に折り畳まれたタンパク質を維持すること、またはタンパク質が折り畳まれている立体配置に結合効率が依存しないように、使用プローブがペプチド配列に結合するように選択されることが必要とされる。
【0040】
本明細書および添付の特許請求の範囲において使用する単数形「1つの(a)」、「1つの(an)」、および「その(the)」は、特に文脈によってはっきりと規定されていない限り複数の指示物を含むことに留意しなければならない。
【0041】
概略
光学的システムおよび電気的システムの両方を用いて分析物を高多重単一分子特定・定量するための検出技法が開示される。分析物には、修飾のある、および修飾のない、タンパク質、ペプチド、DNA、およびRNA分子が含まれ得るが、これに限定されない。電気的検出は、感度を高めるためにMEMS(微小電気機械システム)構造と一体化したイオン選択性電界効果トランジスタ(ISFET)を用いて達成される。技法には、特異な停止(stop)のある、および特異な停止のないポリAタグ、分析物を詳細に特徴付けるための相補的な特異的プローブおよび非特異的プローブ、抗体プローブを用いた高多重単一分子特定・定量が含まれる。光学的検出は蛍光タグまたはルミネセンスタグの検出によって達成される。
【0042】
1.コンピュータシステム
図1は、一態様に従う、分子分析物の分析において使用するためのコンピュータ100の一例を図示したハイレベルブロック図である。チップセット104と連結された少なくとも1つのプロセッサ102を図示する。チップセット104は、メモリコントローラハブ120および入力/出力(I/O)コントローラハブ122を含む。メモリ106およびグラフィックスアダプタ112はメモリコントローラハブ122に連結され、ディスプレイ装置118はグラフィックスアダプタ112に連結される。記憶装置108、キーボード110、ポインティング装置114、およびネットワークアダプタ116はI/Oコントローラハブ122に連結される。コンピュータ100の他の態様は異なるアーキテクチャを有する。例えば、メモリ106は一部の態様ではプロセッサ102に直接連結される。
【0043】
記憶装置108は、非一時的なコンピュータ可読記憶媒体、例えば、ハードドライブ、コンパクトディスク読み出し専用メモリ(CD-ROM)、DVD、またはソリッドステートメモリ装置である。メモリ106は、プロセッサ102が使用する命令およびデータを保持する。ポインティング装置114は、データをコンピュータシステム100に入力するためにキーボード110と組み合わせて用いられる。グラフィックスアダプタ112はディスプレイ装置118に画像および他の情報を表示する。一部の態様において、ディスプレイ装置118は、ユーザ入力および選択を受け取るためのタッチスクリーン能力を含む。ネットワークアダプタ116はコンピュータシステム100をネットワークに連結する。コンピュータ100の一部の態様は、
図1に示したものとは異なる、および/または他の部品を有する。例えば、サーバは複数のブレードサーバからなり、ディスプレイ装置、キーボード、および他の部品を欠いてもよい。
【0044】
コンピュータ100は、本明細書に記載の機能を提供するためにコンピュータプログラムモジュールを実行するように適合される。本明細書で使用する「モジュール」という用語は、特定の機能を提供するために用いられるコンピュータプログラム命令および他のロジックを指す。従って、モジュールは、ハードウェア、ファームウェア、および/またはソフトウェアにおいて実行されてもよい。一態様において、実行可能なコンピュータプログラム命令からなるプログラムモジュールは記憶装置108に記憶され、メモリ106にロードされ、プロセッサ102によって実行される。
【0045】
2.組成物
1つ1つの分子を検出およびカウントできるように、DNA、RNA、タンパク質、およびペプチドなどの分析物に特異的に結合し、これをタグ化する組成物が提供される。
【0046】
プローブとしての抗体
一部の態様において、プローブは、試料中の標的分析物を検出するためにプローブとして使用することができる抗体を含む。下記のように、抗体は、標的タンパク質またはポリペプチドに特異的に結合する免疫グロブリンである。好ましい態様において、本発明において用いられる抗体はモノクローナルであり、折り畳まれたタンパク質または折り畳まれていないタンパク質に特異的に結合することができる。
【0047】
「抗体」とは、別の分子に特異的に結合し、それによって、別の分子と相補すると定義される免疫グロブリンを指す。抗体は、免疫系が細菌およびウイルスなどの外来物を特定および中和するのに使用する、B細胞によって産生される糖タンパク質である。抗体は、抗原と呼ばれる、外来標的の独特の部分を認識する。抗体は、典型的には、基本構造単位である2本の大きな重鎖および2本の小さな軽鎖から作られる。抗体はモノクローナルまたはポリクローナルでもよく、天然でもよく、改変されてもよく、組換えでもよい。抗体は、当技術分野において周知の技法、例えば、宿主の免疫化および血清の収集によって調製されてもよく(ポリクローナル)、連続ハイブリッド細胞株を調製し、分泌タンパク質を収集することによって調製されてもよく(モノクローナル)、少なくとも、天然抗体の特異的結合に必要なアミノ酸配列をコードするヌクレオチド配列もしくはその変異誘発バージョンをクローニングおよび発現させることによって調製されてもよい。抗体は完全な免疫グロブリンまたはその断片を含んでもよい。免疫グロブリンは、IgA、IgD、IgE、IgG1、IgG2a、IgG2bおよびIgG3、IgMなどの様々なクラスおよびアイソタイプを含む。その断片はFab、Fv、およびF(ab')2、Fab'などを含んでもよい。
【0048】
「モノクローナル抗体」(mAB)は、リンパ球のシングルクローン、すなわち、シングルB細胞の子孫によって産生され、抗原上にある1つのエピトープだけを認識する免疫グロブリンである。さらに、ある特定の標的に対する結合親和性が維持されている限り、適宜、免疫グロブリンまたはその断片の凝集物、ポリマー、および結合体を使用することができる。抗体(一次抗体)が、検出可能な標識(例えば、蛍光標識)に共有結合的に連結されてもよい。他の態様において、一次抗体は、検出可能な標識に共有結合的に連結された二次抗体に結合する。一部の態様において、その全体が参照により組み入れられる、2003年11月5日に出願されたLiuらへの米国特許第7,122,319号に記載のように、一次抗体は標識オリゴヌクレオチド分子に結合体化される。
【0049】
図2Aは、抗体132および検出可能なタグ134を含むプローブの一例を図示する。このプローブは標的分析物130に結合する。
図2Bでは、一次抗体132および二次抗体210を含むプローブの一例を示した。二次抗体210は、検出可能な標識134に結合体化されている。
【0050】
アプタマー
本明細書で使用する「アプタマー」とは、標的分析物に結合する核酸分子またはペプチド分子を指す。アプタマーはプローブの一成分でもよい。一部の態様において、核酸アプタマーは、様々な分子標的、例えば、低分子、タンパク質、核酸、さらには細胞、組織、および生物に結合するようにインビトロ選択を繰り返し行うことによって、言い換えると、SELEX(systematic evolution of ligands by exponential enrichment)によって操作された核酸分子である。Tuerk C & Gold L (1990)を参照されたい。他のアプタマー作製方法には、SAAB (selected and amplified binding site)およびCASTing(cyclic amplification and selection of targets)が含まれる。Systematic evolution of ligands by exponential enrichment: RNA ligands to bacteriophage T4 DNA polymerase. Science. 249:505-510; M. Svobodova, A. Pinto, P. Nadal and C. K. O' Sullivan. (2012) Comparison of different methods for generation of single-stranded DNA for SELEX processes. 「Anal Bioanal Chem」(2012) 404:835-842。アプタマーは、タンパク質(例えば、変性タンパク質もしくは折り畳まれたタンパク質)またはポリペプチドの中に見られるユニークなnマー配列に結合することができる。一態様において、アプタマーはユニークな9マー配列に結合する。一部の態様において、アプタマーは、タグ、例えば、ホモポリマー塩基領域(例えば、ポリAテール)を含むオリゴヌクレオチド鎖に結合することができる。
【0051】
一部の態様において、プローブはアプタマーおよびテール領域を含む。アプタマーは、特定の標的分析物に結合するオリゴヌクレオチドまたはペプチド分子である。
図3は、アプタマー300に結合した標的分析物130を示す。アプタマー300は、標的分析物130に特異的に結合するように構成されているプローブ領域320を含む。プローブ領域320はタンパク質、ペプチド、または核酸を含んでもよく、プローブ領域320は標的分析物を認識し、標的分析物に結合する。それぞれのプローブ領域320はタグと連結されてもよい。一部の態様において、タグはテール領域310である。テール領域310は少なくとも25ヌクレオチドのオリゴヌクレオチド分子であり、ポリヌクレオチド合成用のテンプレートとして働く。テール領域310は一般的に一本鎖DNA分子であるが、RNA分子でもよい。一態様において、テール領域310は、核酸バックボーンを介してプローブ領域330に共有結合的に連結される。
【0052】
別の態様において、テール領域310の一部はリンカー領域330に特異的に結合する。リンカー領域330は、核酸バックボーンを介してプローブ領域320に共有結合的に連結される。リンカー領域330は、1つのテール領域310の一部または複数のテール領域310の一部に特異的に結合するように構成されてもよい。一態様において、リンカー領域330は少なくとも10個のヌクレオチドを含む。別の態様において、リンカー領域330は20〜25個のヌクレオチドを含む。プローブ領域320は1個のリンカー領域330に共有結合的に連結されてもよく、複数の別個のリンカー領域330に共有結合的に連結されてもよく、複数の別個のリンカー領域330はそれぞれ別個のテール領域310の一部に特異的に結合する。
【0053】
テール領域310はポリヌクレオチド合成用のテンプレートとなる。ポリヌクレオチド合成中に、テール領域テンプレートに沿って組み込まれたヌクレオチドごとに1個の水素イオンが放出される。これらの複数の水素イオンを電気的出力信号としてトランジスタによって検出することができる。トランジスタが電気的出力信号を検出するためには、最小閾値数の水素イオンが放出されなければならない。例えば、最小閾値数は検出器構成の詳しい内容に応じて25でもよい。その場合、テール領域310は少なくとも25ヌクレオチド長でなければならない。一部の態様において、テール領域310は長さが少なくとも25、100、200、1000、または10,000ヌクレオチドである。テール領域310は1つまたは複数のホモポリマー塩基領域を含んでもよい。例えば、テール領域310は、ポリAテール、ポリCテール、ポリGテール、またはポリTテールでもよい。別の態様において、テール領域310は、ホモポリマー塩基領域に続いて異なるホモポリマー塩基領域、例えば、ポリAテールに続いてポリGテールを含む。一態様において、テール領域310は、長さが100ヌクレオチドのDNAベースのポリAテール
(SEQ ID NO: 1)である。ポリヌクレオチド合成を促進する条件下でヌクレオチド(dTTP)が付加され、テール領域を転写するようにヌクレオチドが組み込まれ、それによって、水素イオンが放出される。トランジスタが電気的出力信号を検出するための水素イオンの最小閾値数が100ヌクレオチド以下であれば、トランジスタは電気的出力信号を検出する。この信号は、ポリAテール領域に関連する標的分析物を特定するために、場合によっては、溶液中の標的分析物の濃度を求めるために用いられる。
【0054】
一部の態様において、テール領域310は、1個または複数個の停止塩基を含むホモポリマー塩基領域を含む。
図3は、2つのホモポリマー塩基領域が両側にある1個の停止塩基330を図示する。停止塩基330は、少なくとも1個のヌクレオチドが、ホモポリマー塩基領域内の塩基と異なる塩基から
構成されるように、ホモポリマー塩基領域に隣接する少なくとも1個のヌクレオチドを含むテール領域310の一部である。一態様において、停止塩基330は1個のヌクレオチドである。他の態様において、停止塩基330は複数個のヌクレオチドを含む。一般的に、停止塩基330の両側には2つのホモポリマー塩基領域がある。一態様において、停止塩基330の両側にある2つのホモポリマー塩基領域は同じ塩基から
構成される。別の態様において、2つのホモポリマー塩基領域は2個の異なる塩基から
構成される。別の態様において、テール領域310は複数の停止塩基330を含有する。
【0055】
低分子を特異検出するためのプローブとしてのアプタマーおよびテール領域に関するさらなる詳細は米国特許仮出願第61/868,988号に記載されている。
【0056】
分子タグ
一部の態様において、プローブは、標的分析物を検出するための分子タグを含む。タグはプローブの他の領域に化学的に取り付けられてもよく、共有結合的に取り付けられてもよい。一部の態様において、タグは蛍光分子である。蛍光分子は蛍光タンパク質でもよく、フルオロフォアとして知られる蛍光分子の反応性誘導体でもよい。
図4は、プローブ320に取り付けられた蛍光タグ402を図示する。フルオロフォアは、光励起されると光を発する蛍光化合物である。一部の態様において、フルオロフォアは標的分子上の特定の領域または官能基に選択的に結合し、化学的に取り付けられてもよく、生物学的に取り付けられてもよい。蛍光タグの例には、緑色蛍光タンパク質(GFP)、黄色蛍光タンパク質(YFP)、赤色蛍光タンパク質(RFP)、シアン蛍光タンパク質(CFP)、フルオレセイン、フルオレセインイソチオシアネート(FITC)、テトラメチルローダミンイソチオシアネート(TRITC)、シアニン(Cy3)、フィコエリトリン(R-PE)、5,6-カルボキシメチルフルオレセイン、(5-カルボキシフルオレセイン-N-ヒドロキシスクシンイミドエステル)、テキサスレッド、ニトロベンズ-2-オキサ-1,3-ジアゾール-4-イル(NBD)、クマリン、塩化ダンシル、およびローダミン(5,6-テトラメチルローダミン)が含まれるが、これに限定されない。
【0057】
他の例示的な蛍光タグを以下の表1Bに列挙した。
【0059】
抗体およびオリゴヌクレオチドを含むプローブ
図5に示したように、プローブは、オリゴヌクレオチドテール領域310にハイブリダイズすることができる領域410に連結された抗体132を含んでもよい。オリゴヌクレオチドテール領域310は、連結領域410、例えば、ポリエチレングリコール(PEG)鎖、酸化エチレンサブユニット、または抗体132をオリゴヌクレオチドテール310に連結することができる他の類似の鎖を介して抗体132に結合することができる。一部の態様において、連結領域は、標準的な化学的方法、例えば、N末端Cysが組み込まれたペプチドがマレイミド活性化オリゴと反応するNHSエステル-マレイミドを介した結合体化化学を用いて抗体ペプチドに連結されたオリゴヌクレオチドを含んでもよい。他の態様では、連結は、内部Cysによって、アルデヒド改変オリゴヌクレオチドとのヒドロキシル-アミン改変ペプチド反応によるオキシム形成を介して達成される。このような方法は当業者に公知である。連結領域410にあるオリゴヌクレオチド配列はオリゴヌクレオチドテール領域310の一部にハイブリダイズすることができる。オリゴヌクレオチドテール領域310は、前記のように、ポリヌクレオチド合成用および電気的検出用のテンプレートとして用いられるオリゴヌクレオチド配列を含んでもよい。2003年11月5日に出願されたLiuらへの米国特許第7,122,319号は、オリゴヌクレオチドタグに連結された分析物結合剤(例えば、抗体)の様々な態様について説明し、その全体が参照により組み入れられる。
【0060】
図6に示したように、プローブは一次抗体132および二次抗体210を含む。一次抗体132は標的分析物130に結合し、二次抗体210は一次抗体132に結合する。二次抗体210は、オリゴヌクレオチドテール領域310にハイブリダイズするリンカー領域410に結合体化される。テール領域310は、標的分析物130の電気的検出において、検出可能なタグとして働く。
【0061】
3.方法
I.支持体および試料調製
本発明は、何桁ものダイナミックレンジにわたって1個の分析物から何万個もの分析物までの広範な分析物を同時に特定および定量しながら、検出アッセイにおいて誤りを明らかにするための方法を提供する。
【0062】
図7に示したように、分析物610(例えば、タンパク質、ペプチド、DNAおよび/またはRNA)を含む試料が固体支持体600に結合される。支持体600は、分析物610を固定化するための表面として用いられるガラススライド、シリコン表面、固体膜、プレートなどを含んでもよい。一態様において、支持体600は、分析物610を表面に結合するコーティングを含む。別の態様において、支持体600は、分析物610を表面に結合するための捕獲用抗体またはビーズを含む。分析物610は支持体600にランダムに結合されてもよく、支持体600上に空間的に分離されてもよい。分析物610が支持体600に結合するように、試料は水溶液中にあってもよく、支持体上で洗浄されてもよい。一態様において、試料中のタンパク質は変性および/または酵素を用いて消化された後に、支持体600に結合される。一部の態様において、分析物610は支持体に共有結合的に取り付けられてもよい。別の態様において、選択された標識プローブは固体支持体600にランダムに結合され、分析物610は支持体全体にわたって洗浄される。
【0063】
図8は、分析物610を結合するための例示的な支持体600(10x10アレイ)を示す。それぞれのアレイインサート700は11x11(110)個の標的アレイを有する。
【0064】
図9は、分析物が支持体600にランダムに結合された固体支持体600の上面図である。異なる分析物をA、B、C、およびDと表記した。分析物を光学的検出するために、イメージングシステムには、蛍光信号が重複しないように分析物が固体支持体600上で空間的に分離されることが必要とされる。ランダムアレイの場合、このことは、それぞれの蛍光スポットに複数の画素が必要とされることを意味する。
【0065】
画素数は、1スポットにつき1と少ない画素および数百と多い画素でもよい。1蛍光スポットあたり画素の最適量は5〜20の画素であると予想される。一例では、イメージングシステムは224nm画素を有する。平均して1蛍光スポットにつき10の画素を有するシステムの場合、2蛍光画素/μm
2の表面密度がある。このことは、タンパク質表面密度がこれほど低くなる必要があることを意味しない。プローブが少い存在量のタンパク質に対してのみ選択されるのであれば、表面上のタンパク質の量はかなり多くなる可能性がある。例えば、表面上に平均して20,000タンパク質/μm
2があり、プローブが最も希少な0.01%(積分された和(integrated sum)として)タンパク質に対してのみ選択されるのであれば、蛍光タンパク質表面密度は2蛍光画素/μm
2になるだろう。別の態様において、イメージングシステムは163nm画素を有する。別の態様において、イメージングシステムは224nm画素を有する。好ましい態様において、イメージングシステムは325nm画素を有する。他の態様において、イメージングシステムは500nmと大きな画素を有する。
【0066】
II.光学的検出方法
光学的検出方法を用いて、試料中の多数の分析物を同時に定量および特定することができる。
【0067】
一態様において、蛍光タグ化単一分子の光学的検出は周波数変調吸収およびレーザー誘起蛍光によって実現することができる。各フルオロフォアが数千個からおそらく数百万個の光子を発した後に光退色するときに、蛍光発光は本質的に増幅されるので高感度になる可能性がある。蛍光は、通常、4段階サイクル1)基底電子状態から励起電子状態までの電子遷移。この速度は励起出力(excitation power)の一次関数である、b)励起電子状態における内部緩和(internal relaxation)、c)励起状態寿命によって決定される、励起状態から基底状態までの発光減衰または非発光減衰、およびd)基底状態における内部緩和で生じる。単一分子蛍光の測定は信号強度に関係なく信号あり/信号なしの読み取りに依存するので、この測定値は事実上デジタルとみなされる。
【0068】
光学的検出は、標識プローブから信号を検出するために光学的検出機器または読み取り装置を必要とする。米国特許第8,428,454号および米国特許第8,175,452号はその全体が参照により組み入れられ、使用することができる例示的なイメージングシステムならびにサブピクセルアラインメント許容範囲を実現するための前記システムを改善する方法について説明する。一部の態様において、アプタマーベースマイクロアレイ技術方法を使用することができる。Optimization of Aptamer Microarray Technology for Multiple Protein Targets, Analytica Chimica Acta 564 (2006)を参照されたい。
【0069】
A.タグ化抗体を用いた複数の分析物の光学的検出
前記方法は、プローブとしてタグ化抗体を用いた分析物の光学的検出を含む。試料中の既知の標的分析物(タンパク質)に対して、標的分析物に特異的に結合する抗体が選択される。選択された抗体は、単一分子プローブとしてELISAおよび同等のシステムために開発された抗体でもよい。容易に利用可能な、何十万もの既存のかつ資格のある一次抗体および二次抗体がある。一部の態様において、フルオロフォアなどのタグに結合体化された一次抗体が選択される。他の態様において、二次抗体に結合体する一次抗体が選択され、二次抗体は蛍光分子に結合体化されている。
【0070】
一態様において、前記方法は、試料中の既知の特定の標的タンパク質を有する一次抗体を選択する工程を含む。一次抗体は、蛍光分子などの検出可能なタグでタグ化される。選択された一次抗体は導入され、支持体全体にわたって洗浄される。一次抗体はその標的分析物に結合し、タグからの信号が検出される。
【0071】
別の態様において、検出可能なタグに結合体化された一次抗体および二次抗体が選択される。選択された一次抗体は導入され、支持体全体にわたって洗浄される。一次抗体はその標的分析物に結合する。次に、二次抗体は支持体全体にわたって洗浄され、一次抗体に結合する。タグは検出可能な信号を発生し、信号が規定された場所において検出されたかどうかを確かめるために、一部の態様では、信号がどういったものか(例えば、標識の色)に関する追加情報を確かめるために、信号は検出および分析され、好ましくは、コンピュータを用いて分析される。
【0072】
パスは結合工程および信号検出工程を含む。1サイクルにつき多数のパスがあってもよく、それぞれのパスは、1セットのタグ化抗体と異なる標的タンパク質との結合ならびにタグ化抗体からの信号の検出および分析を含む。支持体から全てのタグ化抗体が取り除かれる前に、異なるタグ化抗体の複数回のパスがあってもよい。1回または複数回のパスが完了し、支持体からタグ化抗体が取り除かれたときに1サイクルが終了する。同じ支持体および結合分析物の試料を用いて、1サイクルにつき1回または複数回のパス
である次のサイクルが行われてもよい。
【0073】
標識抗体からの信号をそれぞれ光学的に検出するために、光学的検出機器または読み取り装置が用いられる。信号の数、信号の場所、および信号の存在または非存在を記録および記憶することができる。検出された光信号に基づく分析物の定量および特定に関する詳細を下記で説明する。
【0074】
1.複数の分析物に対する複数のタグ
一態様において、支持体に結合された個々のタンパク質を検出するために、蛍光タグに結合体化された複数の抗体が用いられる。別個のタイプのタンパク質がそれぞれ、限られた数の蛍光タグでタグ化される。例えば、1回のパスにおいて、赤色蛍光タグでタグ化され、タンパク質Aに選択的に結合する抗体が導入される。結合後に、支持体上の赤色蛍光の数がカウントされる。カウントされたタグの数は、タンパク質Aの濃度に比例する。
【0075】
次のそれぞれのパスでは、異なるタンパク質を検出するために異なる蛍光タグ(異なる色)(例えば、タンパク質Bについては青色蛍光タグ、タンパク質Cについては黄色蛍光タグなど)が導入される。それぞれの蛍光タグの存在はそれぞれのパスにおいてカウントされ、記録される。
図9は、分析物A、B、C、およびDを含む固体支持体を図示する。それぞれのパスにおいて、異なる蛍光タグを用いて異なる分析物を検出し、それに応じてカウントすることができる。
【0076】
一部の態様において、分析物の検出および分析の際に「ダークレベル(dark level)」が用いられる。パスにおいてタグが存在せず、プラスの信号がカウントされない場合にダークレベルが存在する。これは「ダークパス」と呼ばれる。信号が全く存在しないことは一段階(level)とみなされる(すなわち、ダークサイクルがカウントされる)。ダークレベルを取り入れると、1サイクルあたりのプローブ数を1減らすことができる。一部の態様では、ダークレベルの使用は誤りに影響されやすくなる場合があるので、プラスの信号をとり、ダークレベルを使用しないことが好ましい。例示的な態様の1つを
図13に示した。生システム誤り率が低く、1サイクルあたりのプローブ数が少ない他の態様では、ダークレベルを使用すると、1サイクルあたりの転送される情報量を大幅に増やすことができる。
【0077】
ダークレベルの使用が役に立つ具体的な事例は、支持体に結合された分析物に一次抗体プローブがハイブリダイズされ、蛍光でタグ化された二次抗体または電気的にタグ化された二次抗体が第1の抗体に結合される場合である。単回パスシステムについて1サイクルにつき1段階の情報しか可能にならないように、二次抗体は全抗体に非特異的に結合することができる。この場合、1サイクルにつき1ビットの情報を実現するためには、ダークレベルの使用(すなわち、そのサイクルにおいて一次抗体を含まない)が必要とされる。
【0078】
二次抗体を用いたときにダークレベルの使用を無くすためには、一次抗体の予め決められたセットのプローブに対して高親和性を有する、および一次抗体の予め決められたセットのプローブに対して低親和性を有する2つ以上のタイプの二次抗体の使用または1サイクルにつき少なくとも2回のパスが必要とされる。
【0079】
2.複数の分析物に対する1個のタグ
別の態様において、支持体に結合された個々のタンパク質を検出するために、蛍光タグに結合体化された複数の抗体が用いられる。各タイプのタンパク質を同じ蛍光タグ(同じ色)でタグ化することができる。例えば、あるパスでは、赤色蛍光タグでタグ化された抗体プローブはタンパク質Aに選択的に結合し、支持体上の赤色蛍光の数がカウントされる。別のパスでは、タンパク質Bに特異的に結合する、赤色蛍光分子でタグ化された抗体プローブが導入され、支持体上のさらなる場所にある、さらなる赤色蛍光タグの存在がカウントされ、記録される。異なる標的タンパク質に特異的に結合する、同じ蛍光標識で標識された抗体を用いて複数回のパスを行うことができる。パスごとに、支持体上で検出されたさらなる赤色蛍光タグの存在がカウントされ、記録される。例示的な態様の1つを
図14に示した。
【0080】
B.分析物を光学的検出するための方法
本発明の高ダイナミックレンジ分析物定量方法を用いると、生物学的試料から10,000個以上の分析物を測定することが可能になる。前記方法は、濃度が約1ag/mL〜約50mg/mLで分析物を定量し、10
10を超えるダイナミックレンジを生じることができる。光信号はデジタル化され、分析物は、それぞれの分析物のデジタル信号のコード(IDコード)に基づいて特定される。
【0081】
前記のように、分析物は固体支持体に結合され、プローブは分析物に結合される。各プローブはタグを含み、標的分析物に特異的に結合する。一部の態様において、タグは、同じ蛍光色を発する蛍光分子であり、次のパスごとに、さらなる蛍光の信号が検出される。パスの間に、タグを含む1セットのプローブが支持体と接触され、その標的と結合する。支持体の画像が取り込まれ、パスが終わるたびに得られた画像から検出可能な信号が分析される。支持体上の検出された各位置(例えば、標的分析物)について、検出可能な信号の存在および/または非存在に関する情報が記録される。
【0082】
一部の態様において、本発明は、タグを含むプローブから発せられた光信号を検出するための工程、複数回のパスおよび/または複数のサイクルの間に、支持体上の様々な位置で発せられた信号をカウントする工程、ならびにKビットベースの計算を用いて信号をデジタル情報として分析して、支持体上のそれぞれの標的分析物を特定する工程を含む方法を含む。下記のように、誤り訂正を用いて、光学的に検出された信号の誤りを明らかにすることができる。
【0083】
一部の態様において、支持体は、N個の標的分析物を含む分析物と結合される。N個の標的分析物を検出するために、Mサイクルのプローブ結合および信号検出が選択される。Mサイクルはそれぞれ1回または複数回のパスを含み、それぞれのプローブセットがN個の標的分析物の1つに特異的に結合するように、それぞれのパスはNセットのプローブを含む。ある特定の態様において、N個の標的分析物についてN個のプローブセットがある。
【0084】
それぞれのサイクルにおいて、それぞれのパスについてプローブセットを導入するための予め決められた順序がある。一部の態様において、プローブセットの予め決められた順序は、ランダム化された順序である。他の態様において、プローブセットの予め決められた順序は、ランダム化されていない順序である。一態様において、ランダムでない順序はコンピュータプロセッサによって選択することができる。予め決められた順序は、それぞれの標的分析物について鍵で表示される。プローブセットの順序を含む鍵が作成され、標的分析物をそれぞれ特定するためにプローブの順序はコードでデジタル化される。
【0085】
一部の態様において、順序づけられたプローブのセットはそれぞれ、標的分析物を検出するための別個のタグと関連づけられ、別個のタグの数はN個の標的分析物の数より少ない。その場合、N個の標的分析物はそれぞれMサイクルについてM個のタグの配列に対応する。タグの順序づけられた順番は識別コードとして標的分析物と関連づけられる。
【0086】
一例では、16の標的タンパク質があり、標的タンパク質それぞれについて16の別個のプローブがあるが、蛍光タグは4種類(赤色、青色、緑色、および黄色)しかない。
図10Aは、支持体上に並べられた16の標的タンパク質(P1、P2、P3などと表記した)の一例を図示する。このアッセイは、2回のサイクルおよび1サイクルにつき1回のパスで設定することができる。従って、プールの2つの順序づけられたセット(1サイクルにつき1つの順序づけられたセット)が作り出される。ユニークな2色配列で16の標的タンパク質を標識するために、それぞれのプローブプールは4種類のタグを使用する。
【0087】
以下の表2は、16の標的分析物および対応するプローブ番号を示す。表3は、4種類の蛍光タグ(0〜3と表記した)を示す。表4および表5は、16の標的分析物のそれぞれが、プローブプール1の第1の蛍光タグおよびプローブプール2の第2の蛍光タグで標識されている2つのプローブプールを示す。
図10Bは、プローブプール1と接触された
図10Aの支持体を図示する。
図10Cは、プローブプール2と接触された
図10Aの支持体を図示する。例えば、プローブA2は、プローブプール1の青色蛍光タグおよびプローブプール2の赤色蛍光タグでタグ化された。従って、プローブA2(分析物P2に結合された)はサイクル1において青色を発し、サイクル2において赤色を発する。
図10Dに示した別の例では、プローブA7はプローブプール1(すなわちサイクル番号1)において緑色(GRN)タグを有する。プローブプール2において、プローブA7は青色(BLU)タグを有する。それぞれのプローブプールにおいて、いくつかのプローブは同じタグ色を共有するが、2つのプールにわたる色配列は、それぞれの分析物に固有のものである。プローブプール#1において、例えば、プローブA4およびA8はいずれも黄色でタグ化されている。しかしながら、プローブA9だけがプローブプール#1において赤色でタグ化され、プローブプール#2において緑色でタグ化されている。
【0092】
表6は、色配列に基づいた、それぞれの標的分析物のID(識別)コードを含む鍵の一例を示す。この表は、名前、対応する10進数(1〜10,000)、M進数(例えば、ここでは7桁で4進法を示す)、および色配列によってN個のタンパク質標的を示す。色配列は、ある特定の分析物について発せられた検出信号(赤色、青色、緑色、黄色)の順序およびタイプである。この鍵は、それぞれの色配列と一致する、標的分析物の対応するM進数(例えば、4進法、7桁)および同一性を示す。従って、4進法計算によって、7つの信号の順序づけられた色配列および10,000個以上の異なる標的分析物の特定が可能になり、それぞれの標的分析物は独自の識別用色配列を有する。
【0093】
(表6)名前、10進数、M進数、および色配列によるタンパク質標的の鍵
【0094】
一態様において、前記方法は、X個の異なる色の蛍光タグ化プローブを用いて支持体上にあるN個の異なる種類の標的分析物をカウントするためにプローブプールを標識するための以下の工程を含む:
1.X進数を用いてN個の標的(またはそのプローブ)のリストに番号をつける。
2.蛍光タグを、0〜X-1のX進数字と関連づける(例えば、0、1、2、3は赤色、青色、緑色、黄色に対応する)。
3.X
c>NになるようなCを見つける。
4.N個の標的を特定するために少なくともC個のプローブプールが必要である。添え字k=1〜CによってC個のプローブプールを表記する。
5.k番目のプローブプールにおいて、それぞれのプローブを、工程1において作成したリストの中にあるプローブ標的を特定するX進数のk番目のX進数字に対応する色の蛍光タグで表記する。
【0095】
例えば、N=10,000個の標的分析物および4種類の蛍光タグがある場合、4進法を選択することができる。4種類の蛍光タグ色はそれぞれ、数0、1、2、および3で指定される。例えば、数0、1、2、3は赤色、青色、緑色、および黄色に対応する。
【0096】
4進法が選択された場合、それぞれの蛍光色は2ビットで表現され(0および1、0=信号なし、1=信号あり)、標的分析物を特定するコードとして用いられる7個の色がある。例えば、タンパク質Aは、「青色、緑色、緑色、青色、青色、黄色、黄色」の色の組み合わせおよび順序を表す「1221133」のコードで特定することができる。7個の可能な色の場合、標的分析物には合計14ビットの情報(7x2=14ビット)がある。
【0097】
次に、4
C>10,000になるようにCが選択される。この場合、10,000個の標的を特定するためにプローブプールが7つあるようにCは7でもよい(4
7=16,384。これは10,000より多い)。長さCの色配列は、C個の異なるプローブプールを構築しなければならないことを意味する。7つのプローブプールをk=1〜7と表記する。次いで、それぞれのプローブを、k番目のX進数字に対応する蛍光タグで標識する。例えば、コード「12
21133」の中の3番目のプローブは3番目の4進数字であり、緑色に対応する。
【0098】
C.光学的に検出されたプローブの定量
検出プロセス後、それぞれのプローブプールからの信号がカウントされ、支持体上の各位置について信号の存在または非存在および信号の色を記録することができる。
【0099】
検出可能な信号から、N個の別個の標的分析物についてMサイクルそれぞれにおいてKビットの情報が得られる。K x M = Lビットの情報かつL
>log
2(N)となるように、Kビットの情報を用いてL全ビットの情報を求める。Lビットの情報を用いて、N個の別個の標的分析物の同一性(および存在)を決定する。サイクルが1回だけ(M=1)行われるのであれば、Kx1=Lである。しかしながら、1個の分析物につき、さらに多くのL全ビットの情報を得るために、複数のサイクル(M>1)が行われてもよい。次のサイクルごとに、標的分析物を特定するために用いられる、さらなる光信号情報が得られる。
【0100】
実際には信号の誤りが発生し、これは、標的分析物を特定する精度を交絡させる。例えば、プローブは間違った標的に結合する場合がある(例えば、偽陽性)、または正しい標的に結合しない場合がある(例えば、偽陰性)。下記のように、光学的信号検出および電気的信号検出における誤りを明らかにするための方法が提供される。
【0101】
III.電気的検出方法
他の態様では、支持体上にある標的分析物の存在を検出するために電気的検出方法が用いられる。標的分析物はオリゴヌクレオチドテール領域でタグ化され、オリゴヌクレオチドタグは、溶液中の水素イオン濃度を測定するイオン選択性電界効果トランジスタ(ISFET、すなわちpHセンサー)を用いて検出される。ISFETは、2007年12月14日に出願されたRothbergらへの米国特許第7,948,015号、および2009年5月29日に出願されたRothbergらへの米国特許出願公開第2010/0301398号においてさらに詳細に説明されている。これらはいずれも、その全体が参照により組み入れられる。
【0102】
ISFETは、分析物を特定および特徴付けするための感度がよく、かつ特異的な電気的検出システムを提供する。一態様において、本明細書において開示された電気的検出方法はコンピュータ(例えば、プロセッサ)によって実施される。溶液のイオン濃度をISFETの電極によって対数電位に変換することができ、電気的出力信号を検出および測定することができる。
【0103】
ISFETは、DNA配列決定を容易にするために以前から用いられている。一本鎖DNAから二本鎖DNAに酵素的変換される間に、それぞれのヌクレオチドがDNA分子に付加されるときに水素イオンが放出される。ISFETは、これらの放出された水素イオンを検出し、ヌクレオチドがDNA分子に付加されたかどうかを決定することができる。ヌクレオシド三リン酸(dATP、dCTP、dGTP、およびdTTP)の組み込みを同期化することによって、DNA配列も決定することができる。例えば、一本鎖DNAテンプレートがdATPに曝露されたときに電気的出力信号が検出されず、dGTPの存在下で電気的出力信号が検出されれば、DNA配列は、問題となっている位置では相補的シトシン塩基から
構成される。
【0104】
一態様において、ISFETは、プローブのテール領域を検出し、次いで、対応する標的分析物を特定するために用いられる。例えば、標的分析物は支持体、例えば、1つまたは複数のISFETを備える集積回路チップの上に固定化されてもよい。対応するプローブ(例えば、アプタマーおよびテール領域)が添加され、標的分析物に特異的に結合したときに、テール領域を転写するためにヌクレオチドおよび酵素(ポリメラーゼ)が添加される。ISFETは電気的出力信号として放出水素イオンを検出し、dNTPがテール領域に組み込まれたときにイオン濃度の変化を測定する。放出された水素イオンの量はテール領域の長さおよび停止(stop)に対応し、テール領域に関する、この情報を用いて、様々なタグを区別することができる。
【0105】
最も簡単なタイプのテール領域は、全て1つのホモポリマー塩基領域から
構成されるテール領域である。この場合、4通りのテール領域:ポリAテール、ポリCテール、ポリGテール、およびポリTテールがある。しかしながら、多くの場合、テール領域に大きな多様性があることが望ましい。
【0106】
テール領域において多様性を生む方法の1つは、テール領域のホモポリマー塩基領域内に停止塩基を設けることによる方法である。停止塩基は、少なくとも1個のヌクレオチドが、ホモポリマー塩基領域内の塩基と異なる塩基から
構成されるように、ホモポリマー塩基領域に隣接する少なくとも1個のヌクレオチドを含むテール領域の部分である。一態様において、停止塩基は1個のヌクレオチドである。他の態様において、停止塩基は複数のヌクレオチドを含む。一般的に、停止塩基の両側には2つのホモポリマー塩基領域がある。一態様において、停止塩基の両側にある2つのホモポリマー塩基領域は同じ塩基から
構成される。別の態様において、2つのホモポリマー塩基領域は2個の異なる塩基から
構成される。別の態様において、テール領域は複数の停止塩基を含有する。
【0107】
一例では、ISFETは最小閾値数100個の水素イオンを検出することができる。標的分析物1は、100ヌクレオチドポリAテールの後ろに、1個のシトシン塩基の後ろに、もう1つの100ヌクレオチドポリAテールから
構成されるテール領域を有する組成物に結合される。テール領域長さは合計201ヌクレオチド
(SEQ ID NO: 2)である。標的分析物2は、200ヌクレオチドポリAテール
(SEQ ID NO: 3)から
構成されるテール領域を有する組成物に結合される。dTTPが付加されたとき、かつポリヌクレオチド合成を促す条件下では、標的分析物1に結合したテール領域上で合成が起こると100個の水素イオンが放出される。これは、200個の水素イオンが放出される、標的分析物2に結合したテール領域上でのポリヌクレオチド合成と区別することができる。ISFETは、それぞれのテール領域の異なる電気的出力信号を検出する。さらに、dGTPが付加された後にさらにdTTPが付加されれば、標的分析物1に結合したテール領域は、さらなるポリヌクレオチド合成により1個の水素イオンを放出し、次いで、もう100個の水素イオンを放出する。テール領域組成物に基づいた特定のヌクレオシド三リン酸の付加から生じた別個の電気的出力信号によって、ISFETはテール領域のそれぞれから水素イオンを検出することが可能になり、その情報を用いて、テール領域およびその対応する標的分析物を特定することができる。
【0108】
ホモポリマー塩基領域、停止塩基、およびその組み合わせの様々な長さを用いて、試料中のそれぞれの分析物をユニークにタグ化することができる。支持体における標的分析物を特定するためのアプタマーおよびテール領域の電気的検出に関するさらなる説明は、その全体が参照により組み入れられる米国特許仮出願第61/868,988号に記載されている。
【0109】
他の態様において、前記の電気的検出方法におけるプローブとして抗体が用いられる。抗体は、リンカー領域を介して、タグとして働くオリゴヌクレオチドテール領域に結合する一次抗体または二次抗体でもよい。このようなプローブの例を
図2、
図5、および
図6に示した。
【0110】
これらの電気的検出方法は、何百個もの(さらには何千個もの)別個の標的分析物の同時検出に使用することができる。別個のデジタル識別子の数が試料中の別個の標的分析物の数に比例するように、それぞれの標的分析物をデジタル識別子と関連づけることができる。識別子はデジタル情報のビットの数によって表現されてもよく、順序づけられたテール領域セットの中で符号化される。順序づけられたテール領域セットの中にある、それぞれのテール領域は、標的分析物に特異的に結合されたプローブ領域のリンカー領域に特異的に結合するように連続して作られる。または、テール領域がその対応するプローブ領域に共有結合されるのであれば、順序づけられたテール領域セットの中にある、それぞれのテール領域は標的分析物に特異的に結合するように連続して作られる。
【0111】
一態様において、1サイクルは、ポリヌクレオチド合成が発生し、電気的出力信号として検出される水素イオンを放出するように、テール領域をリンカー領域に結合させ、取り除くことによって表される。従って、標的分析物を特定するためのサイクルの数は、順序づけられたテール領域セットの中にあるテール領域の数に等しい。順序づけられたテール領域セットの中にあるテール領域の数は、特定しようとする標的分析物の数ならびに作成しようとするビットの情報の総数に依存する。別の態様において、1サイクルは、標的分析物に特異的に結合し、標的分析物から取り除かれるプローブ領域に共有結合されたテール領域によって表される。
【0112】
それぞれのサイクルから検出された電気的出力信号はビットの情報にデジタル化される。その結果、それぞれのテール領域をその対応するリンカー領域に結合させるように全サイクルが行われた後に、得られたデジタル情報の全ビットを用いて、問題となっている標的分析物を特定および特徴付けることができる。ビットの総数は、標的分析物を特定するための特定ビットの数と誤り訂正のためのビットの数に依存する。誤り訂正のためのビットの数は電気的出力信号の望ましいロバストネス(robustness)および精度に基づいて選択される。一般的に、誤り訂正ビットの数は特定ビットの数の2倍または3倍である。
【0113】
IV.検出された分析物の順序および同一性を復号する
分析物を検出するために用いられるプローブは、それぞれのサイクルにおいて順序づけられて支持体に導入される。標的分析物ごとにプローブの順序に関する情報を符号化する鍵が作成される。分析物ごとに検出された信号はビットの情報にデジタル化することができる。信号の順序は、それぞれの分析物を特定するためのコードとなり、これはビットの情報に符号化することができる。
【0114】
分析物を光学的検出するための一例では、1ビットの情報を用いて、それぞれの分析物は、順序づけられたプローブセットと関連づけられる。以下の表7は、それぞれの標的分析物が、7サイクルにわたって導入される予め決められた順序の1セットのプローブと関連づけられ、順序づけられたプローブセットから発せられた信号の順序が標的分析物を特定するためのコードとして用いられることを図示する。例えば、α-1-酸性糖タンパク質の場合、識別コードは、6個の赤色(R)信号に続いて最後の1個の青色(B)信号
の順序づけられたプローブセットである。ある標的分析物について、「RRRRRRB」を示す1セットの信号が受信されたときに、鍵を用いて、プローブの順序の識別コードと、分析物から得られた信号との一致点を見つける。従って、このコードは、標的分析物がα-1-酸性糖タンパク質であることを確かめるために用いられる。
【0115】
(表7)7サイクルにわたる順序づけられたプローブセットに基づいた標的分析物の鍵および対応する識別コード
【0116】
一部の態様において、順序づけられたプローブセットおよびプローブを使用するための説明書を含むキットのユーザはコードにアクセスできず、信号の順序づけられたセットを対応する標的分析物に突き合わせることができない。一態様において、キットは結果を復号するための鍵を含まず、ユーザは、コードを用いてデータを処理するためにデータを第三者に送る。別の態様において、鍵とIDコードがキットのユーザに提供され、ユーザは信号の順序づけられたセットを標的分析物に解読することができる。
【0117】
別の例では、それぞれの色(蛍光信号)は2ビットの配列で表現することができ、2色の配列は4ビットデータ記号で表現することができる。表8は、4色(赤色、青色、緑色、および黄色)ならびにその対応するビット値の一例を示す。例えば、ある特定の分析物の色配列「BGGBBYY」は、表8に示したビット方式に従って14ビットで01101001011111と符号化され得る。
【0119】
プローブの順序は分析物ごとに新しいサイクルごとに(1サイクルが複数回のパスを含む場合)異なってもよく、サイクルセットごとに異なってもよい。1サイクルセットにおいて分析物を特定するために使用する鍵は別のアッセイにおいて再使用される必要はない。標的分析物のコードはアッセイごとに変更されてもよい。
【0120】
一部の態様において、順序づけられたプローブセットの予め決められた順序はランダムに選択される。他の態様において、予め決められた順序はランダムでない。一態様において、順序を指定するためにコンピュータソフトウェアが用いられる。
【0121】
V.誤り訂正方法
前記の光学的方法および電気的検出方法において、結合および/または信号検出の際に誤りが発生することがある。場合によっては、誤り率は1/5と高いことがある(例えば、5つの蛍光信号のうち1つが正しくない)。これは5サイクルシーケンスごとに1つの誤りに相当する。実際の誤り率は20%と高くはないかもしれないが、数パーセントの誤り率が起こり得る。一般的に、誤り率は、試料中の分析物のタイプおよび使用プローブのタイプを含む多くの要因に依存する。電気的検出方法では、例えば、テール領域が、サイクル中にアプタマー上にある対応するプローブ領域に正しく結合しない場合がある。光学的検出方法では、抗体プローブがその標的に結合しない場合がある、または間違った標的に結合する場合がある。
【0122】
検出信号における誤りを明らかにするために、およびさらなるビットの情報、例えば、パリティビットを得るために、さらなるサイクルが作成される。さらなるビットの情報は、誤り訂正符号を用いて誤りを訂正するために用いられる。一態様において、誤り訂正符号は、システムにおける誤りを検出および訂正するために用いられる非2進法巡回符号であるリード・ソロモン符号である。他の態様において、様々な他の誤り訂正符号を使用することができる。他の誤り訂正符号には、例えば、ブロック符号、重畳(convolution)符号、ゴレイ(Golay)符号、ハミング(Hamming)符号、BCH符号、AN符号、リード・マラー(Reed-Muller)符号、ゴッパ(Goppa)符号、ハダマード(Hadamard)符号、ウォルシュ(Walsh)符号、ハゲルバーガー(Hagelbarger)符号、ポーラー(polar)符号、反復符号、反復蓄積(repeat-accumulate)符号、消失訂正(erasure)符号、オンライン符号、群符号、エキスパンダー(expander)符号、重み一定符(constant-weight)符号、トルネード(tornado)符号、低密度パリティチェック(low-density parity check)符号、最大距離(maximum distance)符号、バースト誤り符号、ルビートランスフォーム(luby transform)符号、噴水符号、およびラプトール(raptor)符号が含まれる。Error Control Coding, 2
nd Ed., S. Lin and DJ Costello, Prentice Hall, New York, 2004を参照されたい。サイクルを追加し、さらなるビットの情報を得ることによって誤り訂正方法を証明する例も下記に示す。
【0123】
リード・ソロモン符号の一例は、4ビット記号を用いたRS(15,9)符号を含む。ここで、n=15、k=9、s=4、およびt=3、ならびにn=2
s-1およびk=n-2tであり、「n」は記号の数であり、「k」はデータ記号の数であり、「s」はビット単位での各記号のサイズであり、「t」は、訂正することができる誤りの数であり、「2t」はパリティ記号の数である。9個のデータ記号(k=9)および6個のパリティ記号(2t=6)がある。X進数が用いられ、X=4である場合、それぞれの蛍光色は2ビット(0および1)で表現される。一対の色は、2つの高ビット(high bit)および2つの低ビット(low bit)を含む4ビット記号で表現され得る。
【0124】
図11は、RS(15,9)の例示的な構造を図示する。4進法が選択されたので、それぞれの標的分析物を特定するために、7つのプローブプール、すなわち7個の色
の配列が用いられる。この配列は3 1/2の4ビット記号で表現される。残りの5 1/2のデータ記号は0にセットされる。次いで、リード・ソロモンRS(15,9)エンコーダーは、12のさらなるプローブプールで表現される6つのパリティ記号を作成する。従って、t=3記号の誤り訂正を得るためには、合計19のプローブプール(7+12)が必要とされる。
【0125】
16,384個までの別個の標的を特定するために、7つのプローブプールがあると仮定して、誤り訂正符号性能のモンテカルロ(Monte Carlo)シミュレーションが行われている。これらのシミュレーションを用いて、様々な数のパリティビットについて10
-5の訂正誤り率を実現するための最大許容生誤り率(蛍光標識の特定に関連する)を求めた。以下の表10Aは、これらの発見を図示する。
【0127】
一部の態様において、分析物に関連した予想されたビットの情報(例えば、分析物の予想されたプローブ順序および信号タイプ)を含む鍵が作成される。ある特定の分析物の、これらの予想されたビットの情報は、標的分析物から得られた実際のLビットの情報と比較される。リード・ソロモンアプローチを用いると、予想されたビットの情報と実際のLビットの情報の比較において、信号中のt個までの誤りの許容量を容認することができる。
【0128】
一部の態様において、予想された信号配列を、ある特定のプローブから観察された信号配列と比較するためにリード・ソロモンデコーダーが用いられる。例えば、標的分析物を特定するために7つのプローブプールが用いられてもよく、予想された色配列は14ビットで表現されるBGGBBYYである。次いで、誤り訂正のために、さらなるパリティプールが用いられてもよい。例えば、6つの4ビットパリティ記号が用いられてもよい。次いで、以下の表10Bに示したように、予想された信号配列は、観察された信号配列と比較され、この比較から、復号された信号配列が作成される。
【0130】
観察された信号配列には、19の信号
の順序づけられた配列中に2つの誤りがある。受信されたプローブ配列がリード・ソロモンデコーダーによって復号されたときに、オリジナルの送信されたプローブ配列は回復される。予想された信号配列は、あるタイプの分析物を特定するように設計された配列である。観察された信号配列は、固体支持体上のある特定の場所で受信された蛍光信号の配列である。復号された配列は、誤り訂正符号デコーダーによって復号された後に回復された配列である。
【0131】
分析物の電気的検出を用いる別の態様では、電気的検出方法において用いられたプローブおよび選択されたビットの情報は、以下の表11に示したように誤り訂正計算に続く。例1では、3ビットのIDが選択され、これは合計8個の標的分析物および8個のID数(2
3=8)に相当する。さらに、誤りのビット数をIDのビット数で割って誤り率が計算される。ここで、この例において誤り訂正に使用したビット数は9(3x3=9)であり、誤り率は3(9/3=3)になる。1ランあたりのビット総数は12である(IDの3ビットおよび誤り訂正の9ビットの和)。1サイクルあたりのビット数は3と選択することができ、1サイクルあたりのプローブ数は8(2
3=8)と求められる。次に、サイクル数は、ビット数、誤り率、および1サイクルあたりのビットに基づいて4と計算される。使用した式は、((ビットx(1+誤り率)/1サイクルあたりのビット)である。この場合、計算値は(3x(1+3))/3)=4サイクルである。この例では、1個の電気的タグにつき1個の停止が用いられる。表11の例2〜5に示したように、さらに多くのビットの選択に基づいて、検出可能なプローブの数を増やすことができる。
【0132】
(表11)様々なビット数、標的数、プローブ数、サイクル、および停止タイプを用いた例示的なアッセイの概要
【0133】
電気的検出方法に関するさらなる説明は、その全体が参照により組み入れられる米国特許仮出願第61/868,988号において見られる。
【0134】
VI.ダイナミックレンジ
試料、例えば、ヒト血清中の分析物、例えば、タンパク質の濃度は10
10倍を超えて変化することがある。特定のタンパク質の起こりうる濃度のダイナミックレンジは一般的にそれより小さい。例えば、フェリチンは、通常、ヒト血清1mLにつき10
4〜10
5pgで見出される。ほとんどのタンパク質濃度はヒト血清試料ごとに10
3倍を超えて変化しない。
【0135】
広い濃度ダイナミックレンジで、標的分析物に対応する蛍光標識を検出することは難しいので、標的分析物を含有する支持体をいくつかの濃度領域に分けることができる。例えば、
図12Aは、領域「高(HIGH)」、「中(MED)」、および「低(LOW)」に分けられた例示的な支持体を示す。3領域のそれぞれ全体にわたって同じ標的分析物が分配されてもよい。しかしながら、標的分析物は分配される前に異なる濃度試料に希釈される。すなわち、1つの試料が高濃度(高)、中濃度(中)、および低濃度(低)のそれぞれに希釈される。一態様において、支持体の「高」領域にある標的分析物は1平方ミクロンにつき約1タンパク質の濃度で分配され、「中」領域にある標的分析物は1平方ミクロンにつき約10
2タンパク質で分配され、「低」領域にある標的分析物は1平方ミクロンにつき約10
4タンパク質で分配される。さらなる態様において、希釈度は、それぞれの濃度領域にある蛍光標識の密度が支持体画像において10〜25画素につき約1タグになるように調整される。
【0136】
図12Bは、支持体の様々な濃度領域(低、中、および高)に位置する、試料からの標的分析物の存在量範囲の一例を示したグラフである。
図12Cも、第4の濃度領域:「希少(Rare)」のある標的分析物の存在量範囲を示したグラフである。存在量範囲が重複していることは、ある特定の標的分析物が複数の濃度領域で検出され得ることを証明している。実施例5(下記)において行ったシミュレーションから、これらのグラフ(
図12Bおよび12C)を作成した。
【0137】
一態様において、ダイナミックレンジをさらに広げるために、試料中の特定の標的分析物が試料から分離されてもよい。例えば、ヒト血清試料中に、極めて豊富に存在するタンパク質であるアルブミンを除去することが望ましい場合がある。高速液体クロマトグラフィーを含む任意の分離法を使用することができる。
【0138】
標的分析物試料の様々な希釈液が支持体に取り付けられたら、標的分析物に選択的に結合するようにプローブが適用されてもよい。一態様において、プローブは、支持体の「中」領域にある中程度の存在量の標的分析物に選択的に結合するように様々な濃度で調製されてもよい。
【実施例】
【0139】
以下は、本発明を実施するための特定の態様の実施例である。本実施例は例示のみの目的で提供され、いかなるやり方でも本発明の範囲を限定することを目的としない。使用された数値(例えば、量、温度など)に関して精度を確保するための努力がなされたが、もちろん、いくらかの実験誤差および偏差が許容されるはずである。
【0140】
本発明の実施では、特に定めのない限り、当該技術の範囲内でタンパク質化学、生化学、組換えDNA法、および薬理学の従来法が用いられる。このような技法は文献において十分に説明されている。例えば、T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al, Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick and N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Carey and Sundberg Advanced Organic Chemistry 3
rd Ed. (Plenum Press) Vols A and B(1992)を参照されたい。
【0141】
実施例1:単一蛍光タグ、単回パス、ダークカウントあり、および1サイクルにつき1ビットを用いた複数の分析物を対象にした光学的検出アッセイ
一例では、前記方法は、以下のパラメータ:単一蛍光タグ(単色)、単回パス、ダークカウントあり、および1サイクルにつき1ビットを用いて行われる。
図9は本実施例を示し、蛍光表面密度は付着タンパク質表面密度より小さい。この図は、他の非標的タンパク質と混合した4つの異なるタイプの標的タンパク質を表面にランダムに付着させたものを示す。
【0142】
以下の表12は、1サイクルにつき1回のパスとなるように、4サイクルのハイブリダイゼーションおよび取り除きを用いて合計4ビットの情報をどのように得ることができるのかを示す。4サイクルから得られた信号をビットの情報にデジタル化する。
【0143】
図13に示したように、サイクル1では分析物Aのプローブが導入され、分析物の存在が「1」で示される。サイクル2では、分析物Aのプローブは添加されず、分析物は検出されず、「0」で示される。4サイクル後に、分析物Aは「1010」の2進コードと関連づけることができる。2進法系では、このコードは「1010」で表現される。10進法系では、同じコードは「10」で表現される(例えば、(2
3x1)+(2
2x0)+(2
1x1)+(2
0x0)=10)。
【0144】
1回目のサイクルでは、標的Aおよび標的Bの抗体プローブだけがプローブプールに含まれる。イメージングシステムは第1のサイクルの単色画像を測定する。第1のサイクルでは、A分子およびB分子は蛍光を放つが、CおよびDは暗い(プローブなし、信号なし)。標的Aおよび標的Bのプローブは取り除かれる。2回目のサイクルのために標的Cおよび標的Dの抗体プローブが導入され、画像化され、次いで、CおよびDの抗体プローブは取り除かれる。3回目のサイクルのために標的Aおよび標的Cの抗体プローブが導入され、画像化される。次いで、標的Aおよび標的Cの抗体プローブは取り除かれる。4回目のサイクルのために、標的Bおよび標的Dの抗体プローブが導入され、蛍光分子が画像化される。複数のサイクルが画像化された後に、各位置にある標的分子のID(蛍光信号コード)が確かめられる。4つの分子を特定するためには2サイクルしか必要としない。一部の態様において、下記で説明する誤り訂正情報のために、または4つを超える分子を特定するために、さらなるサイクルを使用することができる。
【0145】
(表12)単一蛍光タグ、単回パス、ダークカウントあり、および1サイクルにつき1ビット
【0146】
実施例2:単色、1サイクルにつき4回のパス、ダークパスカウントなし、および1サイクルにつき2ビットを用いた複数の分析物を対象にした光学的検出アッセイ
別の実施例では、以下のパラメータ:単色、1サイクルにつき4回のパス、ダークパスカウントなし、および1サイクルにつき2ビットを使用する。
【0147】
図14には1サイクルの4回のパスを示した。1回目のパスは標的分析物Aのプローブを含む。標的Aのプローブはハイブリダイズし、検出可能な信号が画像化される。例えば、プローブは緑色蛍光分子を含み、緑色を発する。本実施例では標的Aのプローブは支持体から取り除かれない。パス2において、標的Bのプローブはハイブリダイズされ、標的Aのプローブと同じ蛍光色を有する。標的Bのさらなる信号(緑色蛍光)が検出され、標的Aおよび標的Bの信号はいずれも画像化される。AおよびBのプローブは支持体から取り除かれない。
【0148】
パス3では、標的Cのプローブが導入され、標的Cにハイブリダイズする。標的Cのプローブは標的Aおよび標的Bと同じ蛍光色を発する。標的A、標的B、および標的Cのプローブから発せられた信号は画像化される。パス4では、標的Dのプローブがハイブリダイズされ、標的A、標的B、標的C、および標的Dから発せられた信号は画像化される。最後に、全てのプローブが取り除かれ、1回目のサイクルは完了する。
【0149】
定量しようとする標的の数を増やすために複数のサイクルを行うことができる。パスごとに標的ごとにプローブを有する必要はなく、4種類を超える多くの分子が観察され得る。
【0150】
以下の表13は、4回のパスがある1サイクルから得られた信号がどのようにデジタル化され、1サイクルにつき2ビットの情報で表現されるのかを示す。4サイクルの期間にわたって、1個の分析物につき合計8ビットの情報を得ることができる。表14は、1サイクルにおいて4回のパスのデジタル出力の鍵を示す。
【0151】
(表13)単色、4回のパス、ダークカウントなし、1サイクルにつき2ビット
【0152】
(表14)実施例2アッセイの鍵
【0153】
1サイクルにつき、さらに多くのビットの情報を実現するために、連続ハイブリダイゼーションを行う代わりに二次分析物に対して複数の蛍光を使用することができる。例えば、二次抗体上に4色の蛍光タグを用いると、1サイクルにつき1回のハイブリダイゼーション工程および1回の取り除き工程によって1サイクルにつき2ビットの情報を実現することが可能になるだろう。
【0154】
複数の色を使用する組み合わせと、1サイクルにつき複数のハイブリダイゼーション工程を行うことでも、1サイクルにつき測定可能なビット数を増やすことができるだろう。例えば、4色イメージングシステムを使用し、1サイクルにつき4回のハイブリダイゼーション工程を行うことによって、1サイクルにつき4ビットまでの情報を実現することが可能になるだろう。
【0155】
実施例3:5色、1サイクルにつき3回のパス、ダークパスカウントあり、および1サイクルにつき4ビットを用いた複数の分析物を対象にした光学的検出アッセイ
別の実施例では、以下のパラメータ:5色、1サイクルにつき3回のパス、ダークパスカウントあり、および1サイクルにつき4ビットを使用する。
【0156】
以下の表は、1サイクルにつき3回のハイブリダイゼーションパスのある5色システムを用いたアッセイを示す。信号の非存在が一段階とみなされるのであれば(すなわち、ダークサイクルカウントあり)、1サイクルにつき合計16段階、言い換えると4ビットの情報が可能である。表16は、それぞれの分析物のIDコードの鍵を示す。
【0157】
(表15)
【0158】
(表16)
【0159】
以下の表17は、信号の非存在が一段階とみなされる場合および信号の非存在が一段階とみなされない場合(ダークサイクルカウントあり/ダークサイクルカウントなし)の光学的検出を目的としたマルチカラーマルチパスハイブリダイゼーションのための1サイクルあたりのビット数を示す。
【0160】
(表17)光学的検出を目的としたマルチカラーマルチパスハイブリダイゼーションのための1サイクルあたりのビット数
【0161】
実施例4:バルクレベルでのDNAプローブおよび標的ハイブリダイゼーションおよび取り除きを証明する
核酸を用いて、バルクレベルでのAPTIQプローブ/標的ハイブリダイゼーションおよび取り除きサイクルを証明した。オリゴヌクレオチド(表18)をIDT Integrated DNA Technologies(Coralville, Iowa)から購入した。オリゴを100μMの最終濃度でモレキュラーグレードウォーター(molecular grade water)に溶解し、-20℃で保管した。
【0162】
(表18)オリゴおよびプローブ配列
【0163】
C6-アミノリンカーを有するオリゴをArrayIt(Sunnyvale, California)においてマイクロアレイ上にプリントした。他で特定しない限り、これらの実施例において使用した試薬および機材は全てArrayItから購入した。1XMSP緩衝液(カタログID: MSP)に溶解した50μM最終濃度のオリゴを、SMP3 Microarray Printing Pinを用いてNanoPrint MicroarrayerによってSuperEpoxy 2 Microarray Substrates(カタログID: SME2)上にプリントした。プリントされたマイクロアレイを一晩乾燥させた。
【0164】
使用前に、支持体スライドをBlockitブロッキング用緩衝液(Blocking Buffer)(カタログID: BKT)に入れて350rpmで穏やかに攪拌しながら室温で1.5時間ブロックした後に、四角ペトリ皿, 30ml容積に入れて350RMP 2mm軌道(orbit)で1Xの洗浄用緩衝液(Wash Buffer)1、2、3(カタログID: WB1、WB2、WB3)を用いて3回、1回につき1分間洗浄した。次いで、Microarray Centrifuge(カタログID: MHC110)を用いてスライドを10秒間、遠心力で脱水した。
【0165】
ガスケット(カタログID: GAHC4x24)をBlockitブロッキング用緩衝液に入れて少なくとも1時間ブロックし、蒸留水を用いてリンスし、Microarray Cleanroom Wipe(カタログID: MCW)を用いて乾燥させ、カセット(カタログID: AHC4x24)の蓋に入れた。ハイブリダイゼーションのために1XのHybitハイブリダイゼーション用緩衝液(カタログID: HHS2)を使用した。Cy3標識プローブまたはCy5標識プローブ(表18)(それぞれ、色R-赤色またはG-緑色に対応する)を、1xハイブリダイゼーション用緩衝液に溶解したプローブプール中で混合した。75μlのハイブリダイゼーションプローブプールをマイクロアレイに入れ、Arrayit Array Plate Hyb Station(カタログID: MMHS110V)によって37℃で15分間、RMP350でインキュベートした。
【0166】
100ulの洗浄用緩衝液(37℃)1を各ウェルに添加し、次いで、RMP350で1分間インキュベートした。次いで、洗浄用緩衝液を放出して廃液に入れることによって、洗浄用緩衝液を取り出した。洗浄用緩衝液1をもう2回使用し、洗浄用緩衝液2を3回使用し、次いで、洗浄用緩衝液3を3回使用した。
【0167】
容器中の洗浄用緩衝液3に沈めたガスケットからスライドを取り出し、Microarray Centrifugeに入れて遠心力で脱水した。スライドを、Axonスキャナー4200Aに入れて、532レーザーおよび635レーザーの両方についてPMT250の設定でスキャンした。スライドをスポット側を上にして、30mlの取り除き用緩衝液(Stripping Buffer)Aが入っている四角ペトリ皿に入れて350RMPで10分間インキュベートした。取り除き用緩衝液Aを除去し、その直後に30mlの取り除き用緩衝液Bを添加した。この手順を、取り除き用緩衝液Bおよび取り除き用緩衝液Cを用いて繰り返した。スライドをmicroarray centrifugeに入れて乾燥させ、次のハイブリダイゼーションサイクルのために調製した。取り除きの効率を確かめるために取り除き後にスライドをスキャンした。
【0168】
図15は、スキャン結果:6サイクルの間に3種類のオリゴ標的、(B1、B2、およびB3)がプローブ結合および取り除きによって特定されたことを図示する。それぞれのオリゴ標的の色配列が正しく特定された。
【0169】
実施例5:DNAを用いて単一分子カウントを証明する
本発明者らは、単一分子を特定および定量するための方法について説明する。オリゴヌクレオチド(表19)をIDT Integrated DNA Technologiesから購入した。オリゴをモレキュラーグレードウォーターに最終濃度100uMで溶解し、-20℃で保管した。
【0170】
(表19)オリゴおよびプローブ配列
【0171】
シリコンスライドをUniversity Wafer(Boston, MA)から購入し、ダイシングし(American Precision Dicing Inc., San Jose, California)、SuperEpoxy支持体(ArrayIt)でコーティングした。単結晶シリコンチップを25mmx75mm支持体スライドとして調製した。使用したシリコンチップの厚さは500μm、675μm、および1000μmであった。シリコンチップ上で100nmの熱酸化物を成長させ、次いで、ダイシングしてスライドにした。
【0172】
スライドを4種類のDNAオリゴ(表19)の溶液に入れてインキュベートした。それぞれのオリゴの末端にはC6分子がある。4種類のオリゴの配列は、KRAS、EGFR、BRAF、およびP53をコードする遺伝子に対応するA、B、C、およびDであった。C6アミノリンカーを有する4種類のオリゴを1xマイクロスポッティング用溶液(カタログID:MSS,ArrayIt)に溶解して100nM/オリゴで混合し、次いで、容器に入れてエポキシコーティングシリコンスライド上で室温で一晩インキュベートした。インキュベーション中に、エポキシコーティングとC6オリゴとの反応によって一本鎖DNAは表面に共有結合された。次いで、スライドをモレキュラーグレードウォーターで5分間、3回洗浄した後に、ArrayIt BlockItブロッキング溶液に入れて350rpmで穏やかに攪拌しながら室温で1時間インキュベートした後に、四角ペトリ皿、30ml容積に入れて350RMP 2mm軌道で1X洗浄用緩衝液1、2、3を用いて3回、各回1分間、洗浄した。Microarray Centrifugeを用いてスライドを10秒間、遠心力で脱水した。
【0173】
チップを、接着剤を用いて、3つの部品、シリコンチップ、ピークフレーム(peek frame)、および170μm厚カバーガラスガラスからなるバイオチップに組み立てた。社内で開発した装置によって、カバーガラス(Nexterion, Tempe, AZ)を、50uMビーズ(Gelest, Morrisville, PA)と混合したBostik接着剤でシリコンスライドに接着した。接着剤およびビーズを3cc注射器(Hamilton Company, Reno, NV)に詰め、EFD ProcessMate遠心機(Nordson, Westlake, OH)に入れて遠心分離し、次いで、Nordson EFD Ultimus I接着剤ディスペンサーによって供給した。
【0174】
Cy3標識プローブまたはCy5標識プローブ(表19)を、1xHybItハイブリダイゼーション用緩衝液に溶解したプローブプール中で混合した。プール#1からのハイブリダイゼーション溶液をバイオチップに供給し、室温で15分間インキュベートした。次いで、チップを洗浄用緩衝液1、2、および3(ArrayIt)を用いて、各緩衝液で8回洗浄した。1xSSPE(150mM NaCl, 10mM NaH
2PO4, 1mM EDTA)に溶解した15%グリセロールをチップに添加した後に画像化した。プローブ1、2、3、4からなる連続プローブプールをハイブリダイズし、取り除いた。ハイブリダイゼーション工程が終わるたびに、イメージングシステムによってスライドの12の領域を画像化した。各領域は100μmx100μmであった。使用したカメラは、Olympus部品番号UAPON40XWを用いる40X拡大システム(magnification system)を備えたHamamatsu Orca 4.0であった。
【0175】
画像化後、チップをモレキュラーグレードウォーターでリンスし、次いで、取り除き用緩衝液A、B、C(ArrayIt)に入れて緩衝液ごとに8回、取り除いた。1xSSPEに溶解した15%グリセロールをチップに添加した後に画像化した。ハイブリダイゼーションプローブプール#1、画像化、取り除き、画像化を含むサイクル1の後に、サイクル2はプローブプール#2とのハイブリダイゼーションから開始した。
【0176】
2つのスライド(スライド#177および#179、
図16A)のデータを取得した。各スライドは12の視野を含んだ。各視野は100μmx100μmであった。2色イメージングシステムをCY3フィルターおよびCY5フィルターと使用した。各スライドについて、少なくとも12〜14サイクルのデータを収集し、分析には9〜10サイクルのデータを用いた。標的識別IDの色配列への割り当て(mapping)を表19に示した。
図16Aでは、プローブが、色R(赤色)に対応するCY5またはG(緑色)に対応するCY3で標識されるような配列に、それぞれの色は割り当てられている。R(赤色)は1に割り当てられ、G(緑色)は0に割り当てられ、1サイクルにつき1ビットの情報が取得される(
図16B)。この場合、誤り訂正方式はコンサバティブ (conservative)であり、1個の標的につき0個の誤りを必要とした。誤りとは、予想されなかった配列における明確な特定と定義される。欠損した配列は1分子につき5個まで許容される。欠損した配列は、1サイクルにおいて分子が特定されない場合である。これらは誤りに分類されない。
【0177】
スライド#177および#179を同様の条件で測定した。各スライドの小さな部分を測定した。(スライド全体の測定はスケールおよび自動化の実行である)。
図16Aは、各視野にある分子の数と、特定された各遺伝子の数を示す。特定された分子のパーセントは12%〜13%であった。
【0178】
図17は、表面に共有結合されたDNA標的オリゴにハイブリダイズされた単一蛍光DNAプローブのプロトタイプイメージャー(imager)を用いて撮影した画像を図示する。試料取り付けの間に発生した凝集のために、特定された分子のうち10%〜15%に1スポットにつき複数の蛍光があった。
【0179】
図18は、スライド#177から4種類の標的(
図16A)をそれぞれ特定した代表例を図示する。丸の中の各スポットを標的にある中心に合わせた。単一蛍光が検出された標的を特定した。画像にある標的のうち約10%〜15%が、1より多い蛍光が結合しているクラスター化した分子種であった。データを詳細に調べることによって、両実験についてBRAFおよびEGFRより大きなレベルのP53およびKRASが観察されたことが分かった。特定された分子の総数はどちらの場合も2000より少なかった。このことは、少数の分子の検出および特定の際に前記方法の感度が高い可能性があることを証明している。
【0180】
実施例6:バルクレベルでのペプチドプローブおよび標的ハイブリダイゼーションおよび取り除きを証明する
ペプチドを用いて、バルクレベルでのAPTIQプローブ/標的結合および取り除きサイクルを証明した。ペプチドMUC1(配列:APDTRPAPG
(SEQ ID NO: 19))をAmerican Peptide(Sunnyvale, California)から購入した。MUC1を1xペプチドプリント用緩衝液1(カタログID: PEP, ArrayIt)に1mg/mlで溶解した。0.2mg/mlのペプチドMUC16、マウス抗MUC1 C595に対するモノクローナル抗体[カタログID: NCRC48]、およびウサギ抗MUC16[カタログID:EPSISR23]をAbcam(Cambridge, MA)から購入した。以下の二次抗体: ヤギ抗マウスIgG Cy3(カタログID: ab97035)、ヤギ抗ウサギIgG Cy3(カタログID: ab6939)、ヤギ抗マウスIgG Cy5(カタログID: ab97037)、ヤギ抗ウサギIgG Cy5(カタログID: ab6564)もAbcamから購入した。
【0181】
ペプチドをArrayIt (Sunnyvale, California)においてマイクロアレイ上にプリントした。SMP3 Microarray Printing Pinを用いてNanoPrint MicroarrayerによってSuperEpoxy 2 Microarray Substrates上に、1xペプチドプリント用緩衝液2(カタログID: PEP, ArrayIt)に溶解した、0.5mg/ml最終濃度のMUC1ペプチドをプリントし、0.1mg/ml のMUC16をプリントした。プリントされたマイクロアレイを一晩乾燥させた。
【0182】
使用前に、スライドをBlockit Plus ブロッキング用緩衝液(カタログID: BKTP, ArrayIt)に入れて、350rpmで穏やかに攪拌しながら室温で1.5時間ブロックした後に、四角ペトリ皿、30ml容積に入れて350 RMP 2mm軌道で、1xPBSを用いて3回、各回1分間、洗浄した。ArrayIt Microarray Centrifugeを用いてスライドを10秒間、遠心力で脱水した。
【0183】
抗MUC1一次抗体および抗MUC16一次抗体を1xPBS緩衝液(137mM NaCl; 2.7mM KCl, 10mM Na
2HPO4; 2mM KH
2PO4, pH7.4)で250倍に希釈した。二次抗体を1xPBSで10000倍に希釈した。Cy3標識抗体またはCy5標識抗体を2つプールにおいて1xPBSに溶解して混合した:プール#1:抗マウスCy3および抗ウサギCy5;プール#2:抗ウサギCy5および抗ウサギCy3。
【0184】
5mlの一次プローブプール混合物をスライドに添加し、容器中で室温で1時間インキュベートした。次いで、450rpmで穏やかに攪拌しながら、スライドを1xPBSで3回、各回5分間、洗浄した。
【0185】
二次抗体プール#1をスライドに添加し、室温で1時間インキュベートした。次いで、450rpmで穏やかに攪拌しながら、スライドを1xPBSで3回、各回5分間、洗浄した。容器からスライドを取り出し、Microarray Centrifugeに入れて乾燥させた。スライドをAxon 4200Aに入れて、532レーザーおよび635レーザーの両方についてPMT250の設定でスキャンした。
【0186】
スライドをスポット側を上にして、5mlの取り除き用緩衝液(カタログID: 21028, Fisher Scientific, Rockford, IL)が入っている四角ペトリ皿に入れて300 RMPで1時間インキュベートした。次いで、スライドを蒸留水で3回、各回5分間、洗浄した。スライドをmicroarray centrifugeに入れて乾燥させ、次いで、抗体結合および取り除きからなる次のサイクルのために調製した。取り除きが効率的であったことを確かめるために、取り除き後にスライドをスキャンした。
【0187】
図19は、スキャン結果:4回のサイクルの間に2種類のオリゴ標的(MUC1およびMUC16)がプローブ結合および取り除きによって特定されたことを図示する。それぞれのオリゴ標的の色配列が正しく特定された。
【0188】
実施例7:ペプチドを用いて単一分子カウントを証明する
実施例4と同じ技法を用いてペプチド調製を行った。ペプチドMUC1(20ng/ml)およびMUC16(4ng/ml)をArrayIt 1xペプチドプリント用緩衝液2(ArrayIt, Sunnyvale, California)で希釈し、次いで、容器の中でシリコンスライド上で室温で一晩インキュベートした。次いで、スライドをモレキュラーグレードウォーターで5分間、3回洗浄した後に、ArrayIt BlockIt plusブロッキング溶液に入れて300rpmで穏やかに攪拌しながら室温で1時間インキュベートした。その後に、チップをモレキュラーグレードウォーターで5分間、3回洗浄した。スライドをマイクロアレイ高速遠心機に入れて遠心力で脱水した。次いで、前記と同じ手順に従ってスライドをバイオチップの中で組み立てた。
【0189】
一次抗体を1xPBSで250倍に希釈する。二次抗体を1xPBSで10,000倍に希釈する。MUC1およびMUC16に対する一次抗体の混合物をバイオチップに供給し、室温で60分間インキュベートした。次いで、チップを1xPBSで8回洗浄した。二次抗体(抗マウスCy3および抗ウサギCy5を含有するプール#1または抗ウサギCy5および抗ウサギCy3を含有するプール#2)の混合物をバイオチップに供給し、室温で60分間インキュベートした。次いで、チップを1xPBSで8回洗浄した。1xSSPEに溶解した15%グリセロールをバイオチップに添加した後に、画像化した。
【0190】
図20は、結合体化抗体(CY5およびCY3)が単離ペプチドに結合され、次に、チップ表面に共有結合されたような単一分子ペプチドの画像を示す。ある特定の抗体に複数の蛍光が結合されることがあり、それによって、それぞれの観察分子の強度の広がりが作り出される。これらの分子は、それぞれのDNAプローブに単一蛍光が結合体化されたDNA単一分子測定値よりいくらか明るく測定された。合計6回のサイクルが単一分子モードにおける2種類のタンパク質のランであった。これらの分子は高収率で結合および除去された。このシステムをさらに多くのタンパク質およびDNA/RNA標的にスケールアップするために類似の技法を使用することができる。
【0191】
画像化後、バイオチップをモレキュラーグレードウォーターでリンスし、次いで、取り除き用緩衝液(カタログID: 21028, Fisher Scientific, Rockford, IL)に入れて1時間、取り除いた後に、1xPBSで8回洗浄した。1xSSPEに溶解した15%グリセロールをバイオチップに添加した後に、画像化した。ハイブリダイゼーションプローブプール#1、画像化、取り除き、画像化を含むサイクル1の後に、サイクル2はプローブプール#2とのハイブリダイゼーションから開始した。
【0192】
実施例8:ヒト血漿プロテオームの定量
単一分子特定とリード・ソロモン誤り訂正符号化を用いて、対数が12のダイナミックレンジにわたるヒト血漿プロテオーム中にある約10,000個のタンパク質の濃度を測定する実現可能性を証明するために、システムモデルを作り出した。このモデルのために、血漿プロテオーム中のタンパク質を、
図12Bに示したように、低濃度領域、中濃度領域、および高濃度領域と呼ぶ3つの濃度領域に分けた。理論上は、ヒト血漿プロテオーム中のタンパク質濃度の全範囲は対数が10のダイナミックレンジにわたるが、各タンパク質の濃度は数対数を超えて変化しない。
図12Bは、重複した濃度領域を図示する。各領域について、その特定の領域の中にあると予想されるが、その領域に許容される最大濃度を超えないタンパク質に対するプローブを選択する。
図12Cに示したように、もう1つの濃度範囲を加えることによって、さらに大きな重複を実現することができる。トレードオフは、支持体チップのさらに広い領域が用いられることである。
【0193】
このモデルにおいて使用したデータはUniProtデータベースから入手した(uniprot.org, FASTA file for organism 9606), 「Toward a Human Blood Serum Proteome」, Joshua Adkins et al., 「The Human Plasma Proteome」, N. Leigh Anderson et al.および「A High-Confidence Human Plasma Proteome Reference Set with Estimated Concentrations in PeptideAtlas」, T. Farrah et al.。UniProtデータベースにある全てのタンパク質が公表濃度と関連づけられているとは限らないので、周知の極めて豊富に存在するタンパク質濃度または全濃度を変えることなくランダム濃度を割り当てた。
図21は推定濃度の確率プロットを示す。10
5〜10
11pg/mLの濃度は公表値を使用する。低域で発見された全公表値を使用した。残りのタンパク質濃度をlog正規近似を用いて推定した。推定ガウス分布は10
-1pg/mL〜10
4pg/mLの6桁のlog正規空間にわたった。
【0194】
図22は、使用した各存在量領域の具体的な推定値を列挙する。各存在量領域について、1.5標的タンパク質/μm
2の同じ標的タンパク質密度(dTP)を想定した。しかしながら、低存在量領域では高存在量領域タンパク質の数/標的タンパク質の数(rHT)は25,000:1であり、中存在量領域では250〜1であった。高存在量タンパク質の数/画素(rHP)は1,000:0.04であった。画素の数/標的タンパク質は3領域それぞれについて一定であった。
【0195】
このモデルについて、1サイクルにつき2ビットの情報を得る4色イメージングシステムを考える。
図23は、高存在量範囲にあるアルブミンの場合を除いて、任意の時間で標的分子の半分が同じ色だと予想されたときに、任意の存在量範囲全体にわたって任意の色についてシミュレート画像がどのように見えると予想されるのかを示す。視野は、一定の露光時間にわたるカメラの画像化領域である。この場合、163nm画素となる、40X倍率の2,000x2,000画素カメラが考えられる。低存在量領域には合計2,500視野(nF)が必要とされるが、高存在量領域および中存在量領域にはそれぞれ250視野しか必要とされない。
【0196】
システムモデルが最適化された状態で、最も少ない存在量の領域は9,719個のうち9,575個のタンパク質、すなわちプロテオームのうち98.5%を調べることが確かめられた。もう一方の極端な場合、高存在量領域はプロテオームの上位2.9%だけを調べる。これが、高存在量領域を構成する血漿プロテオーム中タンパク質のパーセントがわずかしかない理由である。測定可能な濃度範囲は濃度領域に応じて変化する。低存在量濃度領域は30fg/mL〜300ng/mLの濃度を測定する。中存在量濃度領域は82pg/mL〜85ug/mLの濃度を測定する。高存在量濃度領域は20ng/mL〜100mg/mLの濃度を測定する。この測定に必要とされるチップ総面積は320mm
2、すなわち18mmx18mmの寸法のチップである。
【0197】
対数が12のダイナミックレンジにわたる血漿プロテオーム測定におけるリード・ソロモン誤り訂正の有効性を確かめるために分析を行った。測定サイクルごとに、カウントされた分子ごとに固有の誤り率がある。各分子はスライド一面に広がるので(低存在量分子の場合、特に顕著である)、プローブと交差反応しないはずであるが、それにもかかわらず交差反応する他の分子が近くにある。ロバストなシステムは、これが起こるのを許容し、これらの誤りを訂正することができ、分子を正しく特定する。1サイクルあたり1分子あたりの正しくない結合が起こる割合が生誤り率である。システム誤り率は、訂正が行われた後の1分子あたりの特定誤り率(per molecule identification error rate)である。
【0198】
図24は、生誤り率を変えた場合および画像化サイクルの数を変えた場合の予想されたシステム誤り率対生誤り率のチャートを図示する。チャート用のデータは、多数のシステム構成をシミュレートしたモンテカルロ(Monte Carlo)シミュレーションを用いて作成した。16,384個のタンパク質を特定するために、4色システムには合計7回のデータサイクルが必要とされる(4
7=16,384)。最大許容可能な誤り率は、システム誤りの許容可能な数を、特定された分子の数で割ることによって計算される。この場合、平均が1タンパク質につき1個の誤りの場合、誤りの許容可能な数は16,384である。特定された分子の数は4.0x10
8 (2,500視野x1.6x10
5分子/視野)であり、許容可能な誤り率は4.1x10
-5と計算される。
【0199】
リード・ソロモン符号化は、生誤り率を改善するためにパリティサイクルを必要とする。4のガロア体(mm=4)を超えるリード・ソロモンシステムを仮定すると、それぞれの記号(またはワード)は、2つの2ビット記号で表現することができる4ビット記号である(すなわち、1サイクルにつき2ビットを得る2サイクルの4色システム)。リード・ソロモンシステムの場合、記号(またはコードワード)の長さはnn=2
mm-1、すなわち、15個の4ビット記号、言い換えると30個の2ビット記号である。このことは、4色フルイディクス(fluidics)/イメージングシステムによって30回までのサイクルが処理され得ることを意味している。訂正することができる誤りの数は、tt={3、4、または5}パリティ記号に相当する、1標的につき3、4、または5である。1回のパリティサイクルにつき4回の画像化サイクルが必要とされる。これにより、IDのために合計7データサイクル、および誤り訂正のために12、16、または20回の画像化サイクルが得られる。このことは、16,384個の同時に存在するタンパク質を特定するために必要とされるサイクル総数が、1分子につき3個、4個、および5個の許容可能な誤りについて19サイクル、23サイクル、および27サイクルであることを意味する。以前に計算したように4.1x10
-5の最大システム誤り率が1タンパク質につき1個の誤りを許容する。1タンパク質につき、さらに多くの誤りが許容されるのであれば、最大システム誤り率はその分だけ小さくなり得る。
【0200】
図24は、生誤り率対システム誤り率の曲線(contour)を示す。19回の画像化サイクルの場合、許容可能な最大生誤り率は3%であり、23回のサイクルの場合、許容可能な最大生誤り率は6%であり、27サイクルの場合、許容可能な最大生誤り率は13%である。生誤り率が5%未満と予想されるが、最も希少なタンパク質を除く全てについて、20%までの生誤り率が、十分、この技術の許容される範囲内であるように思われる。
【0201】
許容可能な最大サイクル数は30サイクルであるので、さらに多くのデータサイクルを含めることができる。特に、もう3つのデータサイクルが含まれたら、特定可能な標的の数は4^3、すなわち64X増えて、最大の可能性のある特定可能な標的は1,048,576となり、現実的なプローブ濃度より多い数が可能になるだろう。しかしながら、このことは、この技法が、生物学によってのみ限定される任意に大きな数の分子に拡張可能なことを例示する。
【0202】
まとめ
本発明の態様の前述の説明は例示目的で提示された。前述の説明は網羅的であること、または本発明を、開示された正確な形に限定することを目的としない。関連分野の当業者は、前記の開示を考慮すれば多くの変更および変形が可能なことを理解することができる。
【0203】
この説明のいくつかの部分は、情報に関する操作のアルゴリズムおよび記号表現の点から本発明の態様について説明する。これらのアルゴリズム記述および表現は、データ処理分野の当業者が仕事の内容を他の当業者に効果的に伝えるために一般的に用いられる。これらの操作は機能的に、計算的に、または論理的に記述されているが、コンピュータプログラムまたは等価な電気回路、マイクロコードなどによって実行されることが理解される。さらに、一般性を失うことなく、これらの操作配置をモジュールとして言及することが時として便利であることも分かっている。説明された操作およびその関連するモジュールは、ソフトウェア、ファームウェア、ハードウェア、またはその任意の組み合わせにおいて具体化され得る。
【0204】
本明細書に記載の工程、操作、またはプロセスはいずれも、1つまたは複数のハードウェアモジュールもしくはソフトウェアモジュールを単独で用いて実施または実行されてもよく、他の装置と組み合わせて実施または実行されてもよい。一態様において、ソフトウェアモジュールは、説明された工程、操作、またはプロセスのいずれかまたは全てを実施するためにコンピュータプロセッサによって実行することができるコンピュータプログラムコードを収めているコンピュータ可読媒体を含むコンピュータプログラム製品を用いて実行される。
【0205】
本発明の態様はまた、本明細書において操作を行うための機器に関することがある。この機器は、必要とされる目的のために特別に組み立てられてもよく、および/またはコンピュータ内に記憶されたコンピュータプログラムによって選択的に起動もしくは再構成される汎用演算処理装置を備えてもよい。このようなコンピュータプログラムは非一時的タンジブルコンピュータ可読記憶媒体内に記憶されてもよく、コンピュータシステムバスに連結され得る、電子命令を記憶するのに適した任意のタイプの媒体の中に記憶されてもよい。さらに、本明細書において言及された、いずれの演算処理システムも1つしかプロセッサを備えていなくてもよく、演算処理能力を高めるために複数のプロセッサ設計を使用するアーキテクチャでもよい。
【0206】
本発明の態様はまた、本明細書に記載の演算処理プロセスによって作成された製品に関することがある。このような製品は、演算処理プロセスに起因する情報を含んでもよい。この場合、情報は非一時的タンジブルコンピュータ可読記憶媒体に記憶され、コンピュータプログラム製品または本明細書に記載の他のデータ組み合わせの任意の態様を含んでもよい。
【0207】
最後に、本明細書において用いられた言語は、主に、読みやすさ、および教育上の目的で選択されており、本発明の保護対象(subject matter)を正確に説明する、または制限するために選択されたのではない可能性がある。従って、本発明の範囲は、この詳細な説明によって限定されず、特許請求の範囲に基づいた出願において発行された特許請求の範囲によって限定されることが意図される。従って、本発明の態様の開示は例示であり、本発明の範囲を限定するものではなく、本発明の範囲は以下の特許請求の範囲によって規定されることが意図される。
【0208】
本明細書の本文の中で引用された全ての参考文献、発行された特許、および特許出願はその全体が全ての目的のために参照により本明細書に組み入れられる。