【文献】
Gunderson KL、他19名,Decoding Randomly Ordered DNA Arrays,GENOME RESEARCH,2004年05月,Vol.14,No.5,Page.870-877
(58)【調査した分野】(Int.Cl.,DB名)
前記少なくとも1個の停止塩基が、前記第1のホモポリマー塩基領域および前記第2のホモポリマー塩基領域のヌクレオチドと異なるヌクレオチドを、少なくとも1個含む、請求項4記載の方法。
【発明の概要】
【0007】
概要
本発明は、標的分析物に特異的に結合するように構成されたプローブ領域;少なくとも25個の連続したヌクレオチドを含むホモポリマー塩基領域を含む、テール領域;および任意で、プローブ領域とテール領域との間に配置されたリンカー領域を含む、組成物であって、リンカー領域が、テール領域の一部に特異的に結合するように構成されたヌクレオチド配列を含み、任意のリンカー領域が存在するときにプローブ領域およびテール領域がそれぞれ別々の核酸分子を含む、組成物を提供する。
【0008】
本発明はまた、標的分析物に特異的に結合するように構成されたプローブ領域;およびプローブ領域に付着された少なくとも1つのリンカー領域を含む、組成物であって、リンカー領域が、少なくとも1つのテール領域の一部に特異的に結合するように構成されたヌクレオチド配列を含み、テール領域が、少なくとも25個の連続したヌクレオチドを含むホモポリマー塩基領域を含み、プローブ領域およびテール領域がそれぞれ別々の核酸分子を含む、組成物を提供する。一態様において、前記組成物は少なくとも1つのテール領域をさらに含み、それぞれのテール領域の一部は、別個のリンカー領域に特異的に結合するように構成されている。
【0009】
一態様では、組成物のテール領域およびプローブ領域は核酸バックボーンを介して共有結合的に連結される。別の態様において、テール領域は、ホモポリマー塩基領域内の塩基と異なる1個または複数個の塩基を含む1個または複数個のヌクレオチドをさらに含む。別の態様において、リンカー領域は複数のテール領域の一部に特異的に結合するように構成されている。さらなる態様において、ホモポリマー塩基領域は、ポリAテール、ポリTテール、ポリCテール、またはポリGテールを含む。さらに別の態様において、ホモポリマー塩基領域は少なくとも100個または200個の連続したヌクレオチドを含む。一部の態様において、標的分析物はタンパク質、ペプチド、または核酸を含む。他の態様において、プローブ領域はタンパク質、ペプチド、核酸、または抗体を含む。他の態様において、リンカー領域配列は少なくとも10個のヌクレオチドまたは20〜25個のヌクレオチドを含む。
【0010】
一態様において、テール領域は、ホモポリマー塩基領域に隣接し、ホモポリマー塩基領域内の塩基と異なる塩基を含む、ヌクレオチド;前記ヌクレオチドに隣接し、前記ヌクレオチド塩基と異なる塩基を含む、第2のホモポリマー塩基領域;および任意で、複数のさらなるホモポリマー塩基領域であって、それぞれのさらなるホモポリマー塩基領域が、介在ヌクレオチドによって、隣接するホモポリマー塩基領域と分けられており、介在ヌクレオチド塩基が、それぞれの隣接するホモポリマー塩基領域の塩基と異なる、複数のさらなるホモポリマー塩基領域をさらに含む。
【0011】
別の態様において、それぞれのホモポリマー塩基領域は同じ塩基を含む。別の態様において、前記ヌクレオチドおよびそれぞれの任意の介在ヌクレオチドは同じ塩基を含む。別の態様において、ライブラリーは、請求項15記載の複数の組成物を含み、(1)それぞれのプローブ領域は複数のリンカー領域と関連づけられ、(2)それぞれのリンカー領域は別個のテール領域の一部に特異的に結合する。さらなる態様において、ライブラリーにある全てのテール領域の長さは一定である。
【0012】
本発明はまた、少なくとも1つの標的分析物を特徴付ける方法であって、複数の順序付けられたテール領域セットを入手する工程であって、順序付けられたテール領域セットがそれぞれ、請求項1および3〜18のいずれか一項記載の1つまたは複数のテール領域を含み、かつN個の別個の標的分析物の規定されたサブセットに向けられており、N個の別個の標的分析物が、支持体の空間的に分離した領域上に固定化されている、工程;請求項1〜18のいずれか一項記載のプローブ領域のプローブ領域と、固定化されたN個の別個の標的分析物の1つまたは複数との特異的結合を促進するように設計された条件下で、N個の別個の標的分析物を、請求項1〜18のいずれか一項記載のプローブ領域と接触させる工程;少なくともMサイクルを実行する工程であって、(1)テール領域がプローブ領域に共有結合していない場合、結合されたプローブ領域をテール領域と接触させることを含むハイブリダイゼーション工程であって、それぞれのテール領域がプローブ領域のリンカー領域に特異的に結合する、ハイブリダイゼーション工程;(2)テンプレートとしてテール領域を用いてポリヌクレオチド鎖の合成をもたらす条件下で、結合されたテール領域を、試薬を含む反応混合物と接触させることを含む、合成工程;および(3)N個の別個の標的分析物からテール領域またはプローブ領域を取り除くことを含む、取り除き工程を含む、少なくともMサイクルを実行する工程;少なくともMサイクルのそれぞれの間に、支持体の空間的に分離した領域から複数の出力信号を検出する工程;ならびに検出された複数の出力信号から、N個の別個の標的分析物の1つまたは複数について1サイクルにつき少なくともKビットの情報を決定する工程であって、L全ビットの情報を決定するために少なくともKビットの情報が用いられ、K x M = Lビットの情報およびL≧log
2(N)であり、N個の別個の標的分析物の1つまたは複数を同定するためにLビットの情報が用いられる、工程を含む、方法も提供する。
【0013】
一態様では、L>log
2(N)であり、Lは、複数の信号における誤りを訂正するために用いられるビットの情報を含む。別の態様において、L>log
2(N)であり、Lは、予め決められた順序で順序付けられたビットの情報を含む。さらなる態様において、予め決められた順序は、ランダムな順序である。別の態様において、L>log
2(N)であり、Lは、N個の別個の標的分析物それぞれについて識別コードを決定するために用いられるビットの情報を含む。別の態様において、L>log
2(N)であり、Lは、少なくともMサイクルのそれぞれのサイクルについて、順序付けられたテール領域セットの順序を復号するための鍵を含むビットの情報を含む。さらなる態様において、鍵は、N個の別個の分析物の1つまたは複数の同一性を復号する。別の態様において、N個の標的分析物について決定されたLビットの情報は、鍵によって提供される予想されたビットの情報と比較され、この比較を用いてN個の標的分析物の同一性を決定する。別の態様において、順序付けられたテール領域セットの数は、N個の別個の標的分析物の数に基づく。
【0014】
一態様において、複数の信号の検出のダイナミックレンジを拡張するために複数の出力信号はデジタル化される。別の態様において、本発明の方法はコンピュータにより実行される。別の態様において、Lビットの情報を用いて複数の出力信号についての誤り訂正を決定することができる。さらなる態様において、誤り訂正は、リード・ソロモン符号を使用する工程を含む。別の態様において、上述の支持体は、複数の出力信号を検出する少なくとも1つのトランジスタを含む。さらなる態様において、トランジスタはイオン選択性電界効果トランジスタ(ISFET)構造である。
【0015】
本発明はまた、少なくとも1つの標的分析物を特徴付けるためのキットであって、それぞれのプローブ領域容器が、請求項1記載のプローブ領域およびリンカー領域を含む別個の分子を収容している、複数のプローブ領域容器;それぞれのテール領域容器が、請求項1記載のテール領域を含む別個の核酸分子を収容している、複数の順序付けられたテール領域容器;テール領域の1つからポリヌクレオチド鎖テンプレートを合成するのに用いられる酵素およびポリヌクレオチドを含む反応混合物を収容している、反応混合物容器;ならびにポリヌクレオチド鎖反応産物の合成をもたらす条件下で、標的分析物を、少なくとも1つのプローブ領域容器の内容物またはその一部、少なくとも1つのテール領域容器の内容物またはその一部、および反応混合物容器の内容物またはその一部と接触させるための説明書を含む、使用のための説明書を含む、キットも提供する。
【0016】
本発明はまた、少なくとも1つの標的分析物を特徴付けるためのキットであって、それぞれの組成物容器が請求項1〜18のいずれか一項記載の別個の組成物を収容している、複数の組成物容器;テール領域が存在する場合に、テール領域の1つからポリヌクレオチド鎖テンプレートを合成するのに用いられる酵素およびポリヌクレオチドを含む反応混合物を収容している、反応混合物容器;ならびにポリヌクレオチド鎖反応産物の合成をもたらす条件下で、標的分析物を、少なくとも1つのプローブ領域容器の内容物またはその一部、および反応混合物容器の内容物またはその一部と接触させるための説明書を含む、使用のための説明書を含む、キットも提供する。
【0017】
一態様において、キットは、少なくともMサイクルを実行するための説明書であって、実行する工程が、(1)テール領域がプローブ領域に共有結合していない場合、結合されたプローブ領域をテール領域と接触させることを含むハイブリダイゼーション工程であって、それぞれのテール領域がプローブ領域のリンカー領域に特異的に結合する、ハイブリダイゼーション工程;(2)テンプレートとしてテール領域を用いてポリヌクレオチド鎖の合成をもたらす条件下で、結合されたテール領域を、試薬を含む反応混合物と接触させることを含む、合成工程;および(3)N個の別個の標的分析物からテール領域またはプローブ領域を取り除くことを含む、取り除き工程を含む、少なくともMサイクルを実行するための説明書;少なくともMサイクルのそれぞれの間に、支持体の空間的に分離した領域から複数の出力信号を検出するための説明書;ならびに複数の信号から、N個の別個の標的分析物の1つまたは複数について1サイクルにつき少なくともKビットの情報を決定するための説明書であって、L全ビットの情報を決定するために少なくともKビットの情報が用いられ、K x M = Lビットの情報およびL≧log
2(N)であり、N個の別個の標的分析物の1つまたは複数の存在または非存在を決定するためにLビットの情報が用いられる、説明書をさらに含む。
【0018】
一態様では、L>log
2(N)である。別の態様において、前記説明書は、Lビットの情報を用いてN個の別個の標的分析物それぞれの同定を決定する工程をさらに含み、Lは、標的を同定するためのビットの情報を含む。別の態様において、前記説明書は、Lビットの情報を用いて複数の順序付けられたプローブ試薬セットの順序を決定する工程をさらに含み、Lは、予め決められた順序で順序付けられたビットの情報を含む。さらなる態様において、予め決められた順序は、ランダムな順序である。別の態様において、前記説明書は、複数の順序付けられたプローブ試薬セットの順序を復号するための鍵を使用する工程をさらに含む。
[本発明1001]
標的分析物に特異的に結合するように構成されたプローブ領域;
少なくとも25個の連続したヌクレオチドを含むホモポリマー塩基領域を含む、テール領域;および
任意で、プローブ領域とテール領域との間に配置されたリンカー領域
を含む、組成物であって、
リンカー領域が、テール領域の一部に特異的に結合するように構成されたヌクレオチド配列を含み、任意のリンカー領域が存在するときにプローブ領域およびテール領域がそれぞれ別々の核酸分子を含む、組成物。
[本発明1002]
標的分析物に特異的に結合するように構成されたプローブ領域;および
プローブ領域に付着された少なくとも1つのリンカー領域
を含む、組成物であって、
リンカー領域が、少なくとも1つのテール領域の一部に特異的に結合するように構成されたヌクレオチド配列を含み、テール領域が、少なくとも25個の連続したヌクレオチドを含むホモポリマー塩基領域を含み、プローブ領域およびテール領域がそれぞれ別々の核酸分子を含む、組成物。
[本発明1003]
少なくとも1つのテール領域をさらに含む本発明1002の組成物であって、それぞれのテール領域の一部が、別個のリンカー領域に特異的に結合するように構成されている、前記組成物。
[本発明1004]
テール領域およびプローブ領域が、核酸バックボーンを介して共有結合的に連結される、本発明1001の組成物。
[本発明1005]
テール領域が、ホモポリマー塩基領域内の塩基と異なる1個または複数個の塩基を含む1個または複数個のヌクレオチドをさらに含む、本発明1001または1003の組成物。
[本発明1006]
リンカー領域が、複数のテール領域の一部に特異的に結合するように構成されている、本発明1001または1002の組成物。
[本発明1007]
ホモポリマー塩基領域がポリAテール、ポリTテール、ポリCテール、またはポリGテールを含む、本発明1001または1002の組成物。
[本発明1008]
ホモポリマー塩基領域が、少なくとも100の連続したヌクレオチドを含む、本発明1001または1002の組成物。
[本発明1009]
ホモポリマー塩基領域が、少なくとも200個の連続したヌクレオチドを含む、本発明1001または1002の組成物。
[本発明1010]
標的分析物がタンパク質、ペプチド、または核酸を含む、本発明1001または1002の組成物。
[本発明1011]
プローブ領域がタンパク質、ペプチド、または核酸を含む、本発明1001または1002の組成物。
[本発明1012]
プローブ領域が抗体を含む、本発明1001または1002の組成物。
[本発明1013]
リンカー領域配列が少なくとも10個のヌクレオチドを含む、本発明1001または1002の組成物。
[本発明1014]
リンカー領域配列が20〜25個のヌクレオチドを含む、本発明1001または1002の組成物。
[本発明1015]
テール領域が、
ホモポリマー塩基領域に隣接し、ホモポリマー塩基領域内の塩基と異なる塩基を含む、ヌクレオチド;
該ヌクレオチドに隣接し、該ヌクレオチド塩基と異なる塩基を含む、第2のホモポリマー塩基領域;および
任意で、複数のさらなるホモポリマー塩基領域であって、それぞれのさらなるホモポリマー塩基領域が、介在ヌクレオチドによって、隣接するホモポリマー塩基領域と分けられており、介在ヌクレオチド塩基が、それぞれの隣接するホモポリマー塩基領域の塩基と異なる、複数のさらなるホモポリマー塩基領域
をさらに含む、本発明1001または1003の組成物。
[本発明1016]
それぞれのホモポリマー塩基領域が同じ塩基を含む、本発明1015の組成物。
[本発明1017]
前記ヌクレオチドおよびそれぞれの任意の介在ヌクレオチドが同じ塩基を含む、本発明1015の組成物。
[本発明1018]
本発明1015の組成物を複数含むライブラリーであって、(1)それぞれのプローブ領域が複数のリンカー領域と関連づけられ、(2)それぞれのリンカー領域が別個のテール領域の一部に特異的に結合する、ライブラリー。
[本発明1019]
ライブラリーにある全てのテール領域の長さが一定である、本発明1018のライブラリー。
[本発明1020]
少なくとも1つの標的分析物を特徴付ける方法であって、
複数の順序付けられたテール領域セットを入手する工程であって、該順序付けられたテール領域セットがそれぞれ、本発明1001および1003〜1018のいずれかの1つまたは複数のテール領域を含み、かつN個の別個の標的分析物の規定されたサブセットに向けられており、N個の別個の標的分析物が、支持体の空間的に分離した領域上に固定化されている、複数の順序付けられたテール領域セットを入手する工程;
本発明1001〜1018のいずれかのプローブ領域のプローブ領域と、固定化されたN個の別個の標的分析物の1つまたは複数との特異的結合を促進するように設計された条件下で、N個の別個の標的分析物を本発明1001〜1018のいずれかのプローブ領域と接触させる工程;
少なくともMサイクルを実行する工程であって、
(1)テール領域がプローブ領域に共有結合していない場合、結合されたプローブ領域をテール領域と接触させることを含むハイブリダイゼーション工程であって、それぞれのテール領域がプローブ領域のリンカー領域に特異的に結合する、ハイブリダイゼーション工程;
(2)テンプレートとしてテール領域を用いてポリヌクレオチド鎖の合成をもたらす条件下で、結合されたテール領域を、試薬を含む反応混合物と接触させることを含む、合成工程;および
(3)N個の別個の標的分析物からテール領域またはプローブ領域を取り除くことを含む、取り除き工程
を含む、少なくともMサイクルを実行する工程;
少なくともMサイクルのそれぞれの間に、支持体の空間的に分離した領域から複数の出力信号を検出する工程;ならびに
検出された複数の出力信号から、N個の別個の標的分析物の1つまたは複数について1サイクルにつき少なくともKビットの情報を決定する工程であって、L全ビットの情報を決定するために少なくともKビットの情報が用いられ、K x M = Lビットの情報およびL≧log2(N)であり、N個の別個の標的分析物の1つまたは複数を同定するためにLビットの情報が用いられる、工程
を含む、方法。
[本発明1021]
L>log2(N)であり、Lが、複数の信号における誤りを訂正するために用いられるビットの情報を含む、本発明1020の方法。
[本発明1022]
L>log2(N)であり、Lが、予め決められた順序で順序付けられたビットの情報を含む、本発明1020の方法。
[本発明1023]
予め決められた順序が、ランダムな順序である、本発明1022の方法。
[本発明1024]
L>log2(N)であり、Lが、N個の別個の標的分析物それぞれについて識別コードを決定するために用いられるビットの情報を含む、本発明1020の方法。
[本発明1025]
L>log2(N)であり、Lが、少なくともMサイクルのそれぞれのサイクルについて、順序付けられたテール領域セットの順序を復号するための鍵を含むビットの情報を含む、本発明1020の方法。
[本発明1026]
鍵を用いてN個の別個の標的分析物の1つまたは複数の同一性を復号する工程をさらに含む、本発明1020の方法。
[本発明1027]
複数の信号をデジタル化して該複数の信号の検出のダイナミックレンジを拡張する工程をさらに含む、本発明1020の方法。
[本発明1028]
N個の標的分析物について決定されたLビットの情報を、鍵によって提供された予想されたビットの情報と比較する工程であって、この比較を用いてN個の標的分析物の同一性を決定する、工程
をさらに含む、本発明1020の方法。
[本発明1029]
コンピュータにより実行される、本発明1020の方法。
[本発明1030]
Lビットの情報から複数の出力信号についての誤り訂正を決定する工程
をさらに含む、本発明1020の方法。
[本発明1031]
誤り訂正が、リード・ソロモン符号を使用する工程を含む、本発明1030の方法。
[本発明1032]
N個の別個の標的分析物の数に基づいて、順序付けられたテール領域セットの数を決定する工程をさらに含む、本発明1020の方法。
[本発明1033]
支持体が、複数の出力信号を検出する少なくとも1つのトランジスタを含む、本発明1020の方法。
[本発明1034]
トランジスタがイオン選択性電界効果トランジスタ(ISFET)構造である、本発明1033の方法。
[本発明1035]
少なくとも1つの標的分析物を特徴付けるためのキットであって、
それぞれのプローブ領域容器が、本発明1001のプローブ領域およびリンカー領域を含む別個の分子を収容している、複数のプローブ領域容器;
それぞれのテール領域容器が、本発明1001のテール領域を含む別個の核酸分子を収容している、複数の順序付けられたテール領域容器;
テール領域の1つからポリヌクレオチド鎖テンプレートを合成するのに用いられる酵素およびポリヌクレオチドを含む反応混合物を収容している、反応混合物容器;ならびに
ポリヌクレオチド鎖反応産物の合成をもたらす条件下で、標的分析物を、少なくとも1つのプローブ領域容器の内容物またはその一部、少なくとも1つのテール領域容器の内容物またはその一部、および反応混合物容器の内容物またはその一部と接触させるための説明書を含む、使用のための説明書
を含む、キット。
[本発明1036]
少なくとも1つの標的分析物を特徴付けるためのキットであって、
それぞれの組成物容器が、本発明1001〜1018のいずれかの別個の組成物を収容している、複数の組成物容器;
テール領域が存在する場合に、テール領域の1つからポリヌクレオチド鎖テンプレートを合成するのに用いられる酵素およびポリヌクレオチドを含む反応混合物を収容している、反応混合物容器;ならびに
ポリヌクレオチド鎖反応産物の合成をもたらす条件下で、標的分析物を、少なくとも1つのプローブ領域容器の内容物またはその一部、および反応混合物容器の内容物またはその一部と接触させるための説明書を含む、使用のための説明書
を含む、キット。
[本発明1037]
使用のための説明書が、
少なくともMサイクルを実行するための説明書であって、実行が、
(1)テール領域がプローブ領域に共有結合していない場合、結合されたプローブ領域をテール領域と接触させることを含むハイブリダイゼーション工程であって、それぞれのテール領域がプローブ領域のリンカー領域に特異的に結合する、ハイブリダイゼーション工程;
(2)テンプレートとしてテール領域を用いてポリヌクレオチド鎖の合成をもたらす条件下で、結合されたテール領域を、試薬を含む反応混合物と接触させることを含む、合成工程;および
(3)N個の別個の標的分析物からテール領域またはプローブ領域を取り除くことを含む、取り除き工程
を含む、少なくともMサイクルを実行するための説明書;
少なくともMサイクルのそれぞれの間に、支持体の空間的に分離した領域から複数の出力信号を検出するための説明書;ならびに
該複数の信号から、N個の別個の標的分析物の1つまたは複数について1サイクルにつき少なくともKビットの情報を決定するための説明書であって、L全ビットの情報を決定するために少なくともKビットの情報が用いられ、K x M = Lビットの情報およびL≧log2(N)であり、N個の別個の標的分析物の1つまたは複数の存在または非存在を決定するためにLビットの情報が用いられる、説明書
をさらに含む、本発明1035または1036のキット。
[本発明1038]
L>log2(N)である、本発明1037のキット。
[本発明1039]
Lビットの情報を用いてN個の別個の標的分析物それぞれの同定を決定するための説明書をさらに含む、本発明1037のキットであって、Lが、標的を同定するためのビットの情報を含む、前記キット。
[本発明1040]
Lビットの情報を用いて複数の順序付けられたプローブ試薬セットの順序を決定するための説明書をさらに含む、本発明1037のキットであって、Lが、予め決められた順序で順序付けられたビットの情報を含む、前記キット。
[本発明1041]
予め決められた順序が、ランダムな順序である、本発明1037のキット。
[本発明1042]
複数の順序付けられたプローブ試薬セットの順序を復号するための鍵を使用するための説明書をさらに含む、本発明1037のキット。
【発明を実施するための形態】
【0021】
詳細な説明
図面および以下の説明は本発明の様々な態様に関するが、例示にすぎない。以下の考察から、本明細書において開示された構造および方法の代わりの態様は、特許請求されているものの原理から逸脱することなく使用され得る実行可能な代案として容易に認められることに留意しなければならない。
【0022】
今から、いくつかの態様について詳しく触れる。態様の例を添付の図面に図示した。実施可能な限り常に、類似する、または同様の符番を図面に使用することができ、類似する、または同様の機能を示すことができることに留意する。図面は、例示だけの目的で、開示されたシステム(または方法)の態様を示す。当業者は、以下の説明から、本明細書に記載の原理から逸脱することなく、本明細書において例示された構造および方法の代わりの態様が使用され得ることを容易に認めるだろう。
【0023】
定義
「標的分析物」または「分析物」とは、同定される、定量される、および別の方法で特徴付けされる分子、化合物、物質、または成分を指す。標的分析物は、ポリペプチド、タンパク質(折り畳まれたタンパク質もしくは折り畳まれていないタンパク質)、オリゴヌクレオチド分子(RNAもしくはDNA)、その断片、またはその修飾された分子、例えば、修飾された核酸でもよい。一般的に、標的分析物は、任意の(例えば、ピコリットル範囲と少ない)量の溶液で、広範囲の濃度(例えば、mg/mL〜ag/mL範囲)のうちのどの濃度でもよい。例えば、血液、血清、ホルマリン固定パラフィン包埋(FFPE)組織、唾液、または尿の試料が様々な標的分析物を含有する可能性がある。標的分析物はプローブによって認識され、プローブは、電気的検出方法または光学的検出方法を用いて標的分析物を同定および定量するのに用いられる。
【0024】
標的タンパク質に対する修飾には、例えば、翻訳後修飾、例えば、タンパク質への他の生化学的官能基(例えば、酢酸、リン酸、様々な脂質および炭水化物)の付着、アミノ酸の化学的性質の変化(例えば、シトルリン化)、または構造変化(例えば、ジスルフィド架橋の形成)が含まれ得る。翻訳後修飾の例には、膜局在化のための疎水基の付加(例えば、ミリストイル化、パルミトイル化)、酵素活性を向上させるための補因子の付加(例えば、リポイル化(lipolyation))、翻訳因子の修飾(例えば、ジフタミド形成)、化学基の付加(例えば、アシル化、アルキル化、アミド結合形成、グリコシル化、酸化)、糖修飾(グリケーション)、他のタンパク質もしくはペプチドの付加(ユビキチン化(ubiquination))、またはアミノ酸の化学的性質の変化(例えば、脱アミド、カルバミル化)も含まれるが、これに限定されない。
【0025】
他の態様において、標的分析物は、修飾されているオリゴヌクレオチドである。DNA修飾の例にはDNAメチル化およびヒストン修飾が含まれる。さらに他の態様では、標的分析物は低分子(例えば、ステロイド)、原子、または他の化合物である。
【0026】
本明細書で使用する「プローブ」とは、他の分子(例えば、DNAもしくはRNAを含むオリゴヌクレオチド、ポリペプチドもしくは完全長タンパク質など)、細胞成分もしくは構造(脂質、細胞壁など)、または細胞の特性を検出または評価するために、前記の分子、細胞成分もしくは構造、または細胞に結合することができる分子を指す。プローブは、標的分析物に結合する構造または成分を含む。プローブの例にはアプタマー、抗体、ポリペプチド、オリゴヌクレオチド(DNA、RNA)、またはその任意の組み合わせが含まれるが、これに限定されない。プローブとしての抗体、アプタマー、オリゴヌクレオチド配列、およびその組み合わせも下記で詳述される。
【0027】
プローブは、標的分析物の存在を検出するために用いられるタグを含んでもよい。タグは、標的分析物結合成分に、直接的または間接的に結合されてもよく、ハイブリダイズしてもよく、結合体化されてもよく、共有結合的に連結されてもよい。一部の態様において、タグは、蛍光分子または化学発光分子などの検出可能な標識である。他の態様において、タグは、ホモポリマー塩基領域(例えば、ポリAテール)を有するオリゴヌクレオチド配列を含む。プローブは、タグを介して電気的、光学的、または化学的に検出することができる。
【0028】
本明細書で使用する「タグ」という用語は、標的分析物を検出することができる分子を指す。タグは、ホモポリマー塩基領域(例えば、ポリAテール)を有するオリゴヌクレオチド配列でもよい。他の態様において、タグは蛍光標識などの標識である。タグは、蛍光分子、化学発光分子、発色団、酵素、酵素基質、酵素補因子、酵素阻害剤、色素、金属イオン、金属ゾル、リガンド(例えば、ビオチン、アビジン、ストレプトアビジン、またはハプテン)、放射性同位体などを含んでもよいが、これに限定されない。タグは、プローブに、直接的または間接的に結合されてもよく、ハイブリダイズしてもよく、結合体化されてもよく、共有結合的に連結されてもよい。
【0029】
「タンパク質」または「ポリペプチド」または「ペプチド」とは、2つ以上のアミノ酸、アミノ酸類似体、または他のペプチドミメティックの分子を指す。タンパク質は折り畳まれていてもよく、折り畳まれていなくてもよい(変性されていてもよい)。ポリペプチドまたはペプチドは、αヘリックス、βシート、または他のコンホメーションなどの二次構造を有してもよい。本明細書で使用する「アミノ酸」という用語は、グリシンおよびD光学異性体またはL光学異性体の両方、ならびにアミノ酸類似体およびペプチドミメティックを含む、天然および/または非天然もしくは合成のアミノ酸を指す。ペプチドは長さが2アミノ酸以上でもよい。長さがさらに長いペプチドはポリペプチドと呼ばれることが多い。タンパク質は、完全長タンパク質、類似体、およびその断片を指す場合があり、これらは、この定義に含まれる。これらの用語はまた、タンパク質またはポリペプチドの発現後修飾、例えば、グリコシル化、アセチル化、リン酸化なども含む。さらに、イオン化可能なアミノ基およびカルボキシル基が分子に存在するので、ある特定のポリペプチドは酸性塩もしくは塩基性塩として、または中性の形で得られる場合がある。タンパク質またはポリペプチドは供給源生物から直接得られてもよく、組換えまたは合成により産生されてもよい。
【0030】
タンパク質は、ペプチド配列、側鎖修飾、および/またはその三次構造によって同定する、および特徴付けることができる。側鎖修飾には、リン酸化、アセチル化、糖などが含まれる。アミノ酸セリン、スレオニン、およびチロシンからのヒドロキシル基のリン酸化は、特に重要な関心対象の修飾である。
【0031】
「インビボ」という用語は、生物の中で起こるプロセスを指す。
【0032】
本明細書で使用する「哺乳動物」という用語は、ヒトおよび非ヒトを両方とも含み、ヒト、非ヒト霊長類、イヌ、ネコ、マウス、ウシ、ウマ、およびブタを含むが、これに限定されない。
【0033】
本明細書で使用する「試料」とは、生物学的材料からの標本、培養物、または収集物を含む。試料は、ヒト、サル、ラット、またはマウスを含むが、これに限定されない哺乳動物から得られてもよく、採取されてもよい。試料は、培養物、血液、組織、ホルマリン固定パラフィン包埋(FFPE)組織、唾液、毛、糞便、尿などがあるが、これに限定されない材料を含んでもよい。これらの例は、本発明に適用可能な試料タイプを限定するものであると解釈してはならない。
【0034】
本明細書で使用する「ビット」とは、演算処理およびデジタル通信における情報の基本単位を指す。ビットは2つの値のうち1つだけをとることができる。これらの値の最も一般的な表現は0と1である。ビットという用語は2進数字(binary digit)の短縮形である。一例では、4ビットの情報を用いるシステムは16の異なる値を作り出すことができる。1桁台の16進数は全て4ビットで書くことができる。2進化10進法は、10進表記法を用いた数のデジタル符号化方法であり、それぞれの10進数字は4ビットで表現される。8ビットを用いた計算である別の例では、2
8(すなわち256)通りの値がある。
【0036】
「サイクル」とは、ある結合反応が完了し、支持体から1つまたは複数のプローブが取り除かれることと定義される。1種類の支持体または試料に対して複数のサイクルが行われてもよい。タンパク質の場合、複数のサイクルには、プローブを除去する(取り除く)条件が、正しい立体配置に折り畳まれたタンパク質を維持すること、またはタンパク質が折り畳まれている立体配置に結合効率が依存しないように、使用プローブがペプチド配列に結合するように選択されることが必要とされる。
【0037】
本明細書および添付の特許請求の範囲において使用する単数形「1つの(a)」、「1つの(an)」、および「その(the)」は、特に文脈によってはっきりと規定されていない限り、複数の指示物を含むことに留意しなければならない。
【0038】
概略
電気的システムを用いた標的分析物の高多重単一分子同定および定量のための組成物および技法が開示される。一部の態様において、信号は、2つ以上の信号の大きさを比較することによって生じる示差的(differential)信号である。標的分析物には、修飾のある、および修飾のない、タンパク質、ペプチド、DNA、およびRNA分子が含まれる。電気的検出は、感度を高めるためにイオン選択性電界効果トランジスタ(ISFET)を用いて達成される。技法には、示差的停止(stop)のある、および示差的停止のないテール領域を用いて標的分析物を同定することが含まれる。テール領域の多様性および感度は標的分析物の詳細な特徴付けと高多重標的分析物同定を可能にする。さらに、標的分析物の検出および特徴付けにおいて潜在的な誤りを訂正する誤り訂正技法が開示される。
【0039】
組成物
本発明による標的分析物は、同定しようとする、定量しようとする、および別の方法で特徴付けようとする任意の分子である。標的分析物は、通常、タンパク質(変性されたタンパク質もしくは折り畳まれたタンパク質)、ペプチド、または核酸で構成されるが、別のタイプの分子、例えば、アシル、蛍光体、またはメチル基を含む任意の低分子、ステロイド、または修飾された核酸でもよい。
図1は、支持体上に固定化された標的分析物102の一例を示す。一般的に、標的分析物102は、広範囲の濃度のいずれにあってもよく(例えば、mg/mLからag/mLの範囲)、任意の量の溶液でよい(例えば、ピコリットル範囲と少なくてもよい)。例えば、血液、血清、ホルマリン固定パラフィン包埋(FFPE)組織、唾液、または尿の試料が、様々な標的分析物102を含有する可能性がある。標的分析物102は組成物によって認識され、組成物は、電気的検出方法を用いて標的分析物102を同定および定量するのに用いられる。組成物は、関心対象の標的分析物102に特異的に結合するように構成されたプローブ領域104を含む。プローブ領域104は、タンパク質、ペプチド、または核酸で構成されてもよく、標的分析物102を認識し、標的分析物102に結合するのに用いられる。一態様では、プローブ領域104の少なくとも一部は抗体で構成される。
【0040】
それぞれのプローブ領域104はタグ、またはテール領域106と連結されてもよい。検出器が一続きの長さN、2N、3N、4N、5N、6N、7N、8N、9N、10N、または10N超から生じた信号を分解できるように、テール領域106は、信頼性をもって検出され、かつ十分な精度をもって測定することができる信号を検出器によって生じるのに十分な長さ「N」の一続きのヌクレオチドで構成される。ある特定の態様において、Nは少なくとも10、15、25、50、100ヌクレオチドでもよく、100ヌクレオチドより多くてもよく、ポリヌクレオチド合成のためのテンプレートとして役立つ。テール領域106は一般的に一本鎖DNA分子であるが、RNA分子の場合もある。一態様において、テール領域106はプローブ領域104に核酸バックボーンを介して共有結合的に連結される。別の態様において、テール領域106の一部はリンカー領域108に特異的に結合し、リンカー領域108はプローブ領域104に核酸バックボーンを介して共有結合的に連結される。リンカー領域108は、1つのテール領域の一部に特異的に結合するように構成されてもよく、複数のテール領域の一部に特異的に結合するように構成されてもよい。一態様では、リンカー領域108は少なくとも10個のヌクレオチドで構成される。別の態様において、リンカー領域108は20〜25個のヌクレオチドで構成される。プローブ領域104は1種類のリンカー領域108に共有結合的に連結されてもよく、それぞれが別個のテール領域106の一部に特異的に結合する複数の別個のリンカー領域108に共有結合的に連結されてもよい。
【0041】
テール領域106はポリヌクレオチド合成用のテンプレートとなる。ポリヌクレオチド合成中に、テール領域106テンプレートに沿って組み込まれたヌクレオチドごとに1個の水素イオンが放出される。これらの複数の水素イオンを電気的出力信号としてトランジスタによって検出することができる。トランジスタが電気的出力信号を検出するためには最小閾値数の水素イオンが放出されなければならない。例えば、最小閾値数は検出器の構成に応じて25になる場合がある。その場合、テール領域106は少なくとも25ヌクレオチド長でなければならない。一部の態様において、テール領域106は長さが少なくとも25、100、200、1000、または10,000ヌクレオチドである。テール領域106は1つまたは複数のホモポリマー塩基領域を含むことが多い。例えば、テール領域106は、ポリAテール、ポリCテール、ポリGテール、またはポリTテールでありうる。一態様では、テール領域106は、あるホモポリマー塩基領域に続いて異なるホモポリマー塩基領域、例えば、ポリAテールに続いてポリGテールを含む。
【0042】
電気的出力信号から、テール領域106ならびにその対応するプローブ領域104および標的分析物102に関する情報が得られる。一例では、試料溶液は複数の標的分析物102を含有する。標的分析物102は、少なくとも1つのトランジスタを含む支持体の上に固定化される。標的分析物102の1つに特異的に結合するように構成されている組成物が添加されたとき、プローブ領域104は標的分析物102に特異的に結合する。この組成物のテール領域106は、長さが100ヌクレオチドのDNAベースのポリAテールである。従って、ポリヌクレオチド合成を促進する条件下でdTTPが付加され、テール領域106に組み込まれ、それによって、水素イオンが放出される。トランジスタが電気的出力信号を検出するための水素イオンの最小閾値数が100ヌクレオチド以下であれば、トランジスタは電気的出力信号を検出する。この信号は、ポリAテール領域106に関連づけられた標的分析物102を同定するために、場合によっては、溶液中の標的分析物102の濃度を決定するために用いられる。一態様において、試料中の標的分析物102の濃度は、支持体上に固定化された標的分析物の数を計数し、試料中の既知濃度の、これも支持体上に固定化された対照分析物(例えば、ハウスキーピング遺伝子または試料調製中に添加された既知の対照配列)と比較することで較正することによって決定される。
【0043】
イオン選択性電界効果トランジスタを用いた組成物の電気的検出
本発明の電気的検出方法では、溶液中で水素イオン濃度を測定するためにイオン選択性電界効果トランジスタ(ISFET、すなわちpHセンサー)が用いられる。一態様では、本明細書において開示された電気的検出方法はコンピュータによって行われる。溶液のイオン濃度をISFETの電極によって対数電位に変換することができ、電気的出力信号を検出および測定することができる。さらなる態様において、電気的出力信号はビットのデジタル情報に変換される。ISFETは、生体分子を同定および特徴付けするための感度がよく、かつ特異的な電気的検出システムを提供する。
【0044】
例えば、ISFETはDNA配列決定を容易にするために以前から用いられている。一本鎖DNAから二本鎖DNAに酵素的変換される間に、それぞれのヌクレオチドがDNA分子に付加されるときに水素イオンが放出される。ISFETは、これらの放出された水素イオンを検出し、従って、ヌクレオチドがDNA分子に付加されたかどうかを決定することができる。ヌクレオシド三リン酸であるdATP、dCTP、dGTP、およびdTTPの組み込みを同期化することによってDNA配列が決定され得る。例えば、一本鎖DNAテンプレートがdATPに曝露されたときに電気的出力信号が検出されず、dGTPの存在下で電気的出力信号が検出されれば、DNA配列は、問題となっている位置では相補的シトシン塩基で構成される。
【0045】
本発明において、ISFETは、組成物のテール領域106を同定し、従って、対応する標的分析物102を特徴付けるために用いられる。例えば、標的分析物102は、支持体、例えば、1つまたは複数のISFETを含む集積回路チップ上に固定化されてもよい。対応する組成物が添加され、標的分析物102に特異的に結合したとき、およびテール領域106に組み込まれたときに水素イオンを放出するヌクレオチドが添加されたときに、ISFETはイオン濃度の変化を検出および測定する。この電気的出力信号によって、テール領域106の同一性に関する情報が得られる。
【0046】
最も単純なタイプのテール領域106は、全て1つのホモポリマー塩基領域で構成されるテール領域106である。この場合、4通りのテール領域106:ポリAテール、ポリCテール、ポリGテール、およびポリTテールがある。しかしながら、多くの場合、特に、1つの試料において数百または数千もの標的分析物を検出する場合、テール領域106に大きな多様性があることが望ましい。
【0047】
テール領域106において多様性を生む方法の1つは、テール領域106のホモポリマー塩基領域内に1つまたは複数の停止塩基を設けることによる方法である。停止塩基を
図2Aおよび
図2Bに図示した。停止塩基は、少なくとも1個のヌクレオチドが、ホモポリマー塩基領域内の塩基と異なる塩基で構成されるように、ホモポリマー塩基領域に隣接する少なくとも1個のヌクレオチドを含む、テール領域106の部分である。一態様において、停止塩基は1個のヌクレオチドである。他の態様において、停止塩基は複数のヌクレオチドを含む。一般的に、停止塩基の両側には2つのホモポリマー塩基領域がある。一態様において、停止塩基の両側にある2つのホモポリマー塩基領域は同じ塩基で構成される。別の態様において、2つのホモポリマー塩基領域は2種類の異なる塩基で構成される。別の態様において、テール領域106は複数の停止塩基を含有する(
図2B)。
【0048】
一例では、ISFETは最小閾値数100個の水素イオンを検出することができる。標的分析物1は、100ヌクレオチドポリAテールと、その後ろの1個のシトシン塩基と、その後ろのもう1つの100ヌクレオチドポリAテールとで構成されるテール領域106を有する組成物に結合される。従って、テール領域106の長さは合計201ヌクレオチドである。標的分析物2は、200ヌクレオチドポリAテールで構成されるテール領域106を有する組成物に結合される。dTTPが付加されたとき、かつポリヌクレオチド合成を促す条件下では、標的分析物1に結合したテール領域106上で合成が起こると100個の水素イオンが放出される。これは、200個の水素イオンが放出される、標的分析物2に結合したテール領域106上でのポリヌクレオチド合成と区別することができる。ISFETは、それぞれの別個のテール領域106の区別可能な電気的出力信号を検出する。さらに、dGTPが付加された後にさらにdTTPが付加されれば、標的分析物1に結合したテール領域106は、さらなるポリヌクレオチド合成により1個の水素イオンを放出し、次いで、もう100個の水素イオンを放出する。テール領域106組成物に基づいた特定のヌクレオシド三リン酸の付加から生じた別個の電気的出力信号によって、ISFETは特定のテール領域106およびその対応する標的分析物102を検出および同定することが可能になる。
【0049】
これらの電気的検出方法は、何百個もの(さらには何千個もの)別個の標的分析物の同時検出に使用することができる。別個のデジタル識別子の数が試料中の別個の標的分析物の数に比例するように、それぞれの標的分析物102をデジタル識別子と関連づけることができる。識別子はデジタル情報のビット数によって表現されてもよく、順序付けられたテール領域セット106の中で符号化される。下記でさらに考察するように、順序付けられたテール領域106セットの中にある、それぞれのテール領域106は、標的分析物102に特異的に結合されたプローブ領域104のリンカー領域108に特異的に結合するように連続して作られる。または、テール領域106がその対応するプローブ領域104に共有結合される場合、順序付けられたテール領域106セットの中にある、それぞれのテール領域106は標的分析物102に特異的に結合するように連続して作られる。
【0050】
一態様において、1サイクルは、ポリヌクレオチド合成が生じ、電気的出力信号として検出される水素イオンを放出するように、テール領域106をリンカー領域108に結合させ、取り除くことによって表される。従って、標的分析物102を同定するためのサイクルの数は、順序付けられたテール領域106セットの中にあるテール領域106の数に等しい。順序付けられたテール領域106セットの中にあるテール領域106の数は、同定しようとする標的分析物の数ならびに作成しようとする情報のビット総数に依存する。別の態様において、1サイクルは、標的分析物102に特異的に結合し、標的分析物102から取り除かれるプローブ領域104に共有結合されたテール領域106によって表される。
【0051】
それぞれのサイクルから検出された電気的出力信号はビットの情報にデジタル化される。その結果、それぞれのテール領域106をその対応するリンカー領域108に結合させるように全サイクルが行われた後に、得られたデジタル情報の全ビットを用いて、問題となっている標的分析物102を同定する、および特徴付けることができる。ビットの総数は、標的分析物を同定するための同定ビットの数と誤り訂正のためのビットの数に依存する。下記で説明するように、誤り訂正のためのビットの数は電気的出力信号の望ましいロバストネスおよび精度に基づいて選択される。一般的に、誤り訂正ビットの数は同定ビットの数の2倍または3倍である。
【0052】
一例では、標的分析物102は支持体の空間的に分離した領域上に固定化され、支持体は、ISFETなどの1つまたは複数のトランジスタを含んでもよい。N個の別個の標的分析物102との特異的結合を促進するために、プローブ領域104は支持体に添加される。複数の別個の標的分析物102を特徴付ける方法の1つは、少なくとも1セットの順序付けられたテール領域106を入手する工程を伴う。1セットの中にあるそれぞれのテール領域106が、N個の別個の標的分析物102の規定されたサブセットの中にある別個の標的分析物102に向けられたプローブ領域104と関連づけられるように、それぞれの順序付けられたテール領域106セットは1つまたは複数のテール領域106で構成される。一態様では、テール領域106は全て同じヌクレオチド長を有する。別の態様において、1セットの中にある順序付けられたテール領域106の数は別個の標的分析物102の数に基づいて決定される。別の態様において、プローブ領域104は、1セットの中にある順序付けられたテール領域106に共有結合的に連結される。別の態様において、プローブ領域104は1つまたは複数のリンカー領域108を含有し、順序付けられたテール領域106のセットとは分かれている。
【0053】
次に、電気的出力信号を発生させ、標的分析物102を同定するために少なくともMサイクルの結合工程、合成工程、および取り除き工程が実行される。結合とは、テール領域106とプローブ領域104のリンカー領域108との特異的結合、またはプローブ領域104と標的分析物102との特異的結合と定義される。プローブ領域104およびテール領域106が別々の分子であれば、プローブ領域104に対応する順序付けられた1セットのテール領域106を添加して、プローブ領域104との特異的結合を促進することによってサイクルが開始する。次いで、合成工程が実行され、この間に、テンプレートとしてテール領域106を用いてポリヌクレオチド鎖の合成をもたらす条件下で、試薬の反応混合物が添加される。最後に、N個の別個の標的分析物102からテール領域106またはプローブ領域104のいずれかを取り除く工程を含む取り除き工程が実行される。一態様において、プローブ領域104は複数のリンカー領域108を含み、テール領域106とは別の分子である。それぞれのリンカー領域108は別個のテール領域106の一部に特異的に結合する。この場合、取り除き工程では、標的分析物102からテール領域106だけが取り除かれる。別の態様において、プローブ領域104はテール領域106に共有結合的に連結される。この場合、取り除き工程では、標的分析物102から組成物全体(プローブ領域104およびテール領域106)が取り除かれる。
【0054】
合成工程中に、ポリヌクレオチド合成中の水素イオン放出に応じて電気的出力信号を検出することができる。N個の別個の標的分析物102の1つまたは複数を同定するために、電気的出力信号から1サイクルにつき少なくともKビットの情報を得ることができる。電気的出力信号の測定値をデジタルビット情報に変換するためにアナログ-デジタル変換器が用いられる。このデジタル化によって、信号検出のダイナミックレンジが拡張される。一部の態様において、1セットの中にある順序付けられたテール領域106の数は、1サイクルあたりに得られるKビットの情報の数に基づいて決定され、log
2(テール領域の数)=Kとなる。K x M = Lビットの情報、およびL≧log
2(N)となるように、L全ビットの情報を決定するために少なくともKビットの情報が用いられる。N個の別個の標的分析物102の1つまたは複数を同定するためにLビットの情報が用いられる。
【0055】
サイクルが1回だけ行われるのであれば、テール領域106は1種類しか用いられず、K = Lである。しかしながら、さらに多くのサイクルを実行して、さらに多くのビットの情報Lを生成することができる。M>1であれば、それぞれのサイクルの間に、(例えば、順序付けられたテール領域106セットの中にある)異なるテール領域106が、ある特定の標的分析物102と関連づけることができるように、複数のサイクルが実行される。それぞれのサイクルについて、予想された電気的出力信号を標的分析物102と関連づけ、実際の電気的出力信号と比較することができる。この比較により、テール領域106および関連する標的分析物102を同定する精度に関する情報が生成される。1ランは、ある標的分析物102を同定するために、順序付けられたテール領域106セットの中にあるそれぞれのテール領域106を用いて実行される複数のサイクルによって表される。
【0056】
一態様では、Lが、電気的出力信号の誤りを訂正するのに用いられるビット情報を含むように、L>log
2(N)となる。Kは、1サイクルあたりに生成される、(標的分析物を)同定するためのビット数に等しいが、誤りを訂正するためのさらなるビットも1サイクルあたり生成することができ、そのため、1ランあたりのビット総数Lは同定ビットと誤り訂正ビットの両方を含む。例えば、サイクル中にテール領域106が、その対応するプローブ領域104に正しく結合しなければ、誤りが生じる可能性がある。Lビットの情報の一部を用いて、誤り訂正符号によって誤りを検出および訂正することができる。一態様では、誤り訂正符号は、システムにおける誤りを検出および訂正するために用いられる非2進法巡回符号であるリード・ソロモン符号である。リード・ソロモン符号は、標的分析物を同定するためのビット情報に加えて、誤りを訂正するためにさらなるビット情報を使用する。これらのさらなるビットはパリティビットと呼ばれ、さらなるサイクルの実行を含む様々な周知の技法によって得られてもよい。一態様では、選択される誤り訂正ビットの数は同定ビットの数の2倍または3倍に等しい。他の誤り訂正符号、例えば、ブロック符号、畳み込み符号、ゴレイ符号、ハミング符号、BCH符号、AN符号、リード・マラー符号、ゴッパ符号、アダマール符号、ウォルシュ符号、ハーゲルバーガー符号、ポーラー符号、反復符号、反復蓄積(repeat-accumulate)符号、消失訂正(erasure)符号、オンライン符号、群符号、エキスパンダー(expander)符号、重み一定符号、トルネード(tornado)符号、低密度パリティチェック符号、最大距離分離(maximum distance)符号、バースト誤り訂正(burst error)符号、ルビートランスフォーム(luby transform)符号、噴水符号、およびラプトール(raptor)符号も使用することができる。Error Control Coding, 2
nd Ed., S. Lin and DJ Costello, Prentice Hall, New York, 2004を参照されたい。
【0057】
(表1)別個の標的分析物のための順序付けられたテール領域セット
【0058】
表1は、標的分析物L-セレクチンおよびアルブミンの順序付けられたテール領域セットの例を図示する。L-セレクチンのデジタル識別子は「deabfcgh」であり、L-セレクチンに特異的な順序付けられたテール領域セットは8個の別個のテール領域a〜hを含む。ここで、1サイクルにつき1個の別個のテール領域が用いられる。アルブミンのデジタル識別子は「pnmolijk」であり、アルブミンに特異的な順序付けられたテール領域セットは8個の別個のテール領域i〜pを含む。これもまた、1サイクルにつき1個の別個のテール領域が用いられる。両標的分析物について、1ランは8サイクルによって表され、ランから得られるビット情報を用いて、それぞれの標的分析物を同定するデジタル識別子を決定する。
【0059】
一態様では、Lが、予め決められた順序で順序付けられたビットの情報を含むように、L>log
2(N)である。例えば、順序付けられたテール領域106セットによって、1サイクルあたりに用いられるテール領域の順序が予め決められていれば、ビットの情報は、予め決められた順序で順序付けられている。表1は、L-セレクチンについて、例えば、サイクル1がテール領域「a」に対応し、サイクル2がテール領域「b」に対応することを示す。一部の態様では、予め決められた順序はランダムである。他の態様において、順序を指定するためにコンピュータソフトウェアが用いられる。さらに別の態様において、順序付けられたテール領域106セットの順序は未知であり、少なくともMサイクルのそれぞれのサイクルについて、順序付けられたテール領域106セットの順序を復号するために鍵が用いられる。鍵は、ビットによって表される数を含んでもよく、鍵のビットはLビットの情報と組み合わされてもよい。例えば、表1にあるL-セレクチンの順序付けられたテール領域106セットは、サイクル1〜8のテール領域順序が「abcdefgh」にならず、その代わりに「cdbagfeh」になるようにスクランブルされてもよい。この順序を復号して、問題になっている標的分析物のデジタル識別子を決定するために、鍵が設けられてもよい。
【0060】
さらなる態様では、それぞれのテール領域106について検出された電気的出力信号に応じて、N個の別個の標的分析物102の1つまたは複数のデジタル識別子を復号するために別の鍵が用いられる。鍵から、それぞれのテール領域106に関連づけられた予想されたビット情報が提供されてもよい。または、鍵から、順序付けられたテール領域106セットの順序に関連づけられた予想されたビット情報が提供されてもよい。鍵によって提供された、これらの予想されたビット情報は、標的分析物102について決定された実際のLビットの情報と比較することができる。この比較を用いて標的分析物102の同一性を決定することができる。例えば、表1にあるL-セレクチンの順序付けられたテール領域106はスクランブルされなくてもよいが、その代わりに、1ランの全ビット数がデジタル識別子を「deabfcgh」と同定せず、「rstuvwxy」と同定するように、デジタル識別子がスクランブルされてもよい。デジタル識別子を復号して、問題になっている標的分析物の正しいデジタル識別子を決定するために、鍵が設けられてもよい。
【0061】
単一分子の示差的検出
多数の標的分析物102を同定する、および特徴付けるために、別個のテール領域106を含有するいくつかの組成物が用いられる場合もある。このような場合、示差的検出を用いてテール領域106を効率的に同定することができる。示差的検出では、同じ長さの複数のテール領域106が用いられ、それぞれのテール領域106は、同じヌクレオチドで構成されたホモポリマー塩基領域を含み、同じ数の停止塩基を含む。(1つのテール領域内にあり、停止塩基の間にある)2つ以上のホモポリマー塩基領域間のポリヌクレオチド合成からの電気的出力信号比によって示差的検出測定値が得られる。テール領域106に関連づけられた同定長(identification length)は、トランジスタによる検出のために、ある特定の水素イオン数が放出されるのに必要なテール領域106のヌクレオチド数に相当するように選択される。同定長が長ければ長いほど、1サイクルあたりに得られるビット情報は少なくなる。
【0062】
異なる同定長が望ましい様々な状況がある。長い同定長が用いられると、多くの水素イオンが発生し、従って、検出のために多くの信号が生じる。従って、 全体的に見て、システムの精度は高くなる。しかしながら、同定長が長くなると、結合時間が長くなるか、1サイクルあたりのビットが少なくなるか、検出される標的分析物が少なくなる可能性が高くなるか、または全サイクルを完了するのに長い時間が必要になる。短い同定長が用いられたとき、結合時間が短くなり、1サイクルあたりに得られるビットが多くなり、多数の標的分析物を検出することができる。しかしながら、生成される水素イオンは少なくなり、その結果、システムの精度は低くなる。一態様では、同定長は、検出器によって信頼性の高い信号を生じるのに十分な長さ「N」の一続きのヌクレオチドに等しい。一態様では、「N」は、電気的検出のための水素イオンの最小閾値数に対応する。別の態様において、同定長は、電気的検出のための水素イオンの最小閾値数より長い。例えば、同定長は、長さN、2N、3N、4N、5N、6N、7N、8N、9N、10N、または10N超になる場合がある。一態様において、同定長はテール領域106の長さに等しい。他の態様において、同定長はテール領域106の長さより短い。
【0063】
例えば、同定長が100ヌクレオチドであれば、テール領域106の全長は800ヌクレオチドになる場合がある。これによって、8の離散化長(discretization length)が得られる。離散化長はテール領域106の長さを同定長で割ったものに等しい(800/100=8)。それぞれの離散化長によって、テール領域106の同一性に関するいくらかの情報が得られる。この情報はビット情報としてデジタル化することができる。生成されるビット情報の数は、離散化長の数の2を底とする対数に等しい。この例では、8の離散化長、すなわち3ビットの情報(2
3=8)がある。
【0064】
示差的検出が用いられるとき、停止塩基は異なるテール領域106の異なる場所にあってもよいが、テール領域106の全長は、全てのテール領域106の間で一定のままでなければならない。示差的測定の場合、テール領域106の長さは[(離散化長の数 + 1) x (同定長)] + (停止塩基の数)に等しい。従って、この例において1個の停止塩基があれば、テール領域106の全長は(8 + 1)(100) + 1 = 901ヌクレオチドでなければならない。従って、ホモポリマー塩基領域の長さが複数の同定長に基づくように、テール領域106はホモポリマー塩基領域、停止塩基、およびもう1つのホモポリマー塩基領域で構成される。この例では、テール領域106の全てのホモポリマー塩基領域が同じ塩基で構成されていると仮定すると、それぞれについて異なる場所に停止塩基がある8個の別個のテール領域106がありうる。停止塩基の両側にあるホモポリマー塩基領域は長さが100/800、200/700、300/600、400/500、500/400、600/300、700/200、および800/100ヌクレオチドであってよい。2つのホモポリマー塩基領域間の電気的出力信号比によってテール領域106が同定される。この信号比によってトランジスタを較正することができる。示差的測定を用いずに電気的に検出されている間、トランジスタに対する標的分析物の空間的な方向は電気的出力信号に影響を及ぼし、その結果、不正確な測定値が得られる場合がある。しかしながら、示差的測定を用いると、このような間違いが起こらないようにシステムは効果的に較正される。
【0065】
テール領域106結合、ポリヌクレオチド合成、およびテール領域106取り除きの、1つまたは複数のサイクルが実行される。上で説明したように、複数のサイクルの間に、ある標的分析物102が複数の別個のテール領域106と関連づけられ得るように、サイクルごとに、別個の標的分析物102に特異的なテール領域106の異なる順序付けられたセットが用いられてもよい。サイクルごとに多数のビット情報が生成される。最適なシステムは、1サイクルあたりに取得することができる情報のビット数を最大にしながらテール領域106の数を減らし、テール領域106の長さを短くする。さらに、テール領域106を取り除くことで、支持体上に固定化された標的分析物102を損傷することがあるので、サイクル数を最小にすることが望ましい。
【0066】
コンピュータシステム
図3は、一態様に従う、分子分析物の分析において使用するためのコンピュータ300の一例を図示したハイレベルブロック図である。チップセット304と連結された少なくとも1つのプロセッサ302を図示する。チップセット304は、メモリコントローラハブ320および入力/出力(I/O)コントローラハブ322を含む。メモリ306およびグラフィックスアダプタ312はメモリコントローラハブ322に連結され、ディスプレイ装置318はグラフィックスアダプタ312に連結される。記憶装置308、キーボード310、ポインティング装置314、およびネットワークアダプタ316はI/Oコントローラハブ322に連結される。コンピュータ300の他の態様は異なる構成を有する。例えば、メモリ306は一部の態様ではプロセッサ302に直接連結される。
【0067】
記憶装置308は、非一時的なコンピュータ可読記憶媒体、例えば、ハードドライブ、コンパクトディスク読み出し専用メモリ(CD-ROM)、DVD、またはソリッドステートメモリ装置である。メモリ306は、プロセッサ302が使用する命令およびデータを保持する。ポインティング装置314は、データをコンピュータシステム300に入力するためにキーボード310と組み合わせて用いられる。グラフィックスアダプタ312はディスプレイ装置318に画像および他の情報を表示する。一部の態様において、ディスプレイ装置318は、ユーザ入力および選択を受け取るためのタッチスクリーン性能を含む。ネットワークアダプタ316はコンピュータシステム300をネットワークに連結する。コンピュータ300の一部の態様は、
図3に示したものとは異なる、および/または他の部品を有する。例えば、サーバは複数のブレードサーバからなり、ディスプレイ装置、キーボード、および他の部品を欠いてもよい。
【0068】
コンピュータ300は、本明細書に記載の機能を提供するためにコンピュータプログラムモジュールを実行するように適合される。本明細書で使用する「モジュール」という用語は、特定の機能を提供するために用いられるコンピュータプログラム命令および他のロジックを指す。従って、モジュールは、ハードウェア、ファームウェア、および/またはソフトウェアにおいて実行されてもよい。一態様において、実行可能なコンピュータプログラム命令からなるプログラムモジュールは記憶装置308に記憶され、メモリ306にロードされ、プロセッサ302によって実行される。
【実施例】
【0069】
以下の実施例は、示差的検出技法を用いた標的分析物同定実験を示す。
【0070】
実施例1
8個の別個の標的分析物102が、複数のトランジスタ(すなわち、ISFET)を含む集積回路チップ上に固定化されている。それぞれの標的分析物102は、1つまたは複数のリンカー領域108を含む別個のプローブ領域104に特異的であり、それぞれのリンカー領域108は特定のテール領域106に特異的である。本実施例では、8種類のポリAテール領域106を使用し、全て901ヌクレオチドの長さを有する。同定長は100ヌクレオチドであり、テールの中に1種類の停止塩基タイプ(シトシン)のうちの1個の停止塩基を挿入する。表1Aは、使用した様々なテール領域106を示す。「リーダー長」は停止塩基の上流にあるヌクレオチドの数を示し、「トレーラー長」は停止塩基の下流にあるヌクレオチドの数を示す。
【0071】
(表1A)
【0072】
N=別個の標的分析物102の数となるように、標的分析物102を同定するためのビット数はlog
2(N)に等しい。この場合、同定ビットはlog
2(8)=3ビットである。誤り訂正ビットは9ビットと選択される。従って、1ランあたりのビット総数(1ランは全サイクルを表す)は12(3 + 9 = 12)である。log
2(テール領域の数)=ビット数/サイクル、従って、log
2(8)=3となるように、1サイクルにつき3ビットの情報が生成されることが選択される。従って、この手法では、4サイクルの結合および取り除き(12全ビットを3ビット/サイクルで割る=4サイクル)が必要とされる。さらに、1サイクルにつき3つのフローシーケンスがある。それぞれのフローシーケンスが、ポリヌクレオチド合成が起こるのを可能にする異なるタイプの塩基(「フロー塩基」)の付加になるように、1サイクルにつき1つまたは複数の連続したフローシーケンスがある。例えば、テール領域106はシトシン停止塩基が1個あるポリAテールであるので、最初に、ポリAテール上でポリヌクレオチド合成を開始するためにはdTTPを添加しなければならない。これが1つのフローシーケンスである。次に、シトシン停止塩基に組み込むためにdGTPを添加しなければならない(2番目のフローシーケンス)。次いで、ポリヌクレオチド合成を終了するためにdTTPを再添加する(3番目のフローシーケンス)。以下の表1Bはフローシーケンスを示し、それぞれのサイクルが3つのフローシーケンスからなることを示す。
【0073】
(表1B)
【0074】
ランが終わると、標的分析物102を同定するための3ビットの情報が生成され、同定の精度に関する情報を提供する9ビットの誤り訂正が生成される。これらのビット情報によって、テール領域106およびその関連する標的分析物102が同定され、特徴付けられる。
【0075】
実施例2
16個の別個の標的分析物102が、複数のトランジスタを含む集積回路チップ上に固定化されている。それぞれの標的分析物102は、1つまたは複数のリンカー領域108を含む別個のプローブ領域104に特異的であり、それぞれのリンカー領域108は特定のテール領域106に特異的である。本実施例では、16種類のポリAテール領域106を使用し、全て701ヌクレオチドの長さを有する。同定長は100であり、テールの中に3種類の停止塩基タイプ(シトシン、グアニン、またはチミン)のうちの1個の停止塩基を挿入する。表2Aは、使用した様々なテール領域106を示す。「リーダー長」は停止塩基の上流にあるヌクレオチドの数を示し、「トレーラー長」は停止塩基の下流にあるヌクレオチドの数を示す。
【0076】
(表2A)
【0077】
N=別個の標的分析物102の数となるように、標的分析物102を同定するためのビット数はlog
2(N)に等しい。この場合、同定ビットはlog
2(16)=4ビットである。同定の精度に関する情報を提供するために、12ビットの誤り訂正ビットが選択される。従って、1ランあたりのビット総数は16(4 + 12 = 16)である。log
2(テール領域の数)=ビット数/サイクル、従って、log
2(16)=4となるように、1サイクルにつき4ビットの情報が生成されることが選択される。従って、この手法では、4サイクルの結合および取り除き(16全ビットを4ビット/サイクルで割る=4サイクル)が必要とされる。さらに、以下の表2Bに示したように、1サイクルにつき7つのフローシーケンスがある。
【0078】
(表2B)
【0079】
ランが終わると、標的分析物102を同定するための4ビットの情報が生成され、同定の精度に関する情報を提供する12ビットの誤り訂正が生成される。これらのビット情報によって、テール領域106およびその関連する標的分析物102が同定され、特徴付けられる。
【0080】
実施例3
256個の別個の標的分析物102が、複数のトランジスタを含む集積回路チップ上に固定化されている。それぞれの標的分析物102は、1つまたは複数のリンカー領域108を含む別個のプローブ領域104に特異的であり、それぞれのリンカー領域108は特定のテール領域106に特異的である。本実施例では、16種類のポリAテール領域106を使用し、全て402ヌクレオチドの長さを有する。同定長は100であり、テールの中に3種類の停止塩基タイプ(シトシン、グアニン、またはチミン)の組み合わせのうちの2個の停止塩基を挿入する。表3Aは、使用した様々なテール領域106を示す。「リーダー長」は停止塩基1番目の上流にあるヌクレオチドの数を示し、「中央長」は停止塩基2番目の上流にあるヌクレオチドの数を示し、「トレーラー長」は停止塩基2番目の下流にあるヌクレオチドの数を示す。
【0081】
(表3A)
【0082】
N=別個の標的分析物102の数となるように、標的分析物102を同定するためのビット数はlog
2(N)に等しい。この場合、同定ビットはlog
2(256)=8ビットである。同定の精度に関する情報を提供するために、24ビットの誤り訂正ビットが選択される。従って、1ランあたりのビット総数は32(8 + 24 = 32)である。log
2(テール領域の数)=ビット数/サイクル、従って、log
2(16)=4となるように、1サイクルにつき4ビットの情報が生成されることが選択される。従って、この手法では、8サイクルの結合および取り除き(32全ビットを4ビット/サイクルで割る=8サイクル)が必要とされる。さらに、以下の表3Bに示したように、1サイクルにつき13のフローシーケンスがある。
【0083】
(表3B)
【0084】
ランが終わると、標的分析物102を同定するための8ビットの情報が生成され、同定の精度に関する情報を提供する24ビットの誤り訂正が生成される。これらのビット情報によって、テール領域106およびその関連する標的分析物102が同定され、特徴付けられる。
【0085】
実施例4
4,096個の別個の標的分析物102が、複数のトランジスタを含む集積回路チップ上に固定化されている。それぞれの標的分析物102は、1つまたは複数のリンカー領域108を含む別個のプローブ領域104に特異的であり、それぞれのリンカー領域108は特定のテール領域106に特異的である。本実施例では、64種類のポリAテール領域106(84種類のポリAテール領域106を表4Aに示したが、64種類しか使用しない)を使用し、全て802ヌクレオチドの長さを有する。同定長は100であり、テールの中に2種類の停止塩基タイプ(シトシンまたはグアニン)の組み合わせのうちの2個の停止塩基を挿入する。表4Aは、使用した様々なテール領域106を示す。「リーダー」は、停止塩基1番目の上流にあるヌクレオチドの数(x100)を示し、「中央」は停止塩基2番目の上流にあるヌクレオチドの数(x100)を示し、「トレーラー」は停止塩基2番目の下流にあるヌクレオチドの数(x100)を示す。
【0086】
(表4A)
【0087】
N=別個の標的分析物102の数となるように、標的分析物102を同定するためのビット数はlog
2(N)に等しい。この場合、同定ビットはlog
2(4,096)=12ビットである。同定の精度に関する情報を提供するために、36ビットの誤り訂正ビットが選択される。従って、1ランあたりのビット総数は48(12 + 36 = 48)である。log
2(テール領域の数)=ビット数/サイクル、従って、log
2(64)=6となるように、1サイクルにつき6ビットの情報が生成されることが選択される。従って、この手法では、6サイクルの結合および取り除き(48全ビットを6ビット/サイクルで割る=8サイクル)が必要とされる。さらに、以下の表4Bに示したように、1サイクルにつき9つのフローシーケンスがある。
【0088】
(表4B)
【0089】
ランが終わると、標的分析物102を同定するための12ビットの情報が生成され、同定の精度に関する情報を提供する36ビットの誤り訂正が生成される。これらのビット情報によって、テール領域106およびその関連する標的分析物102が同定され、特徴付けられる。
【0090】
実施例5
65,536個の別個の標的分析物102が、複数のトランジスタを含む集積回路チップ上に固定化されている。それぞれの標的分析物102は、1つまたは複数のリンカー領域108を含む別個のプローブ領域104に特異的であり、それぞれのリンカー領域108は特定のテール領域106に特異的である。本実施例では、256種類のポリAテール領域106(324種類のポリAテール領域106を表5Aに示したが、256種類だけ使用した)を使用し、全て1002ヌクレオチドの長さを有する。同定長は100であり、テールの中に3種類の停止塩基タイプ(シトシン、グアニン、またはチミン)の組み合わせのうちの2個の停止塩基を挿入する。表5Aは、使用した様々なテール領域106を示す。例えば、1C1C8は、1x100個のポリAヌクレオチド、1個のシトシン停止塩基、1x100個のポリAヌクレオチド、第2のシトシン停止塩基、および8x100個のポリAヌクレオチドからなるテール領域106を示す。
【0091】
(表5A)
【0092】
N=別個の標的分析物102の数となるように、標的分析物102を同定するためのビット数はlog
2(N)に等しい。この場合、同定ビットはlog
2(65,536)=16ビットである。同定の精度に関する情報を提供するために、48ビットの誤り訂正ビットが選択される。従って、1ランあたりのビット総数は64(16 + 48 = 64)である。log
2(テール領域の数)=ビット数/サイクル、従って、log
2(256)=8となるように、1サイクルにつき8ビットの情報が生成されることが選択される。従って、この手法では、8サイクルの結合および取り除き(64の全ビットを8ビット/サイクルで割る=8サイクル)が必要とされる。さらに、以下の表4Bに示したように、1サイクルにつき13のフローシーケンスがある。
【0093】
(表5B)
【0094】
ランが終わると、標的分析物102を同定するための16ビットの情報が生成され、同定の精度に関する情報を提供する48ビットの誤り訂正が生成される。これらのビット情報によって、テール領域106およびその関連する標的分析物102が同定され、特徴付けられる。
【0095】
他の例では、1個のチップ上で、さらに多くの別個の標的分析物102を分析することができ、1サイクルにつき様々なビット数が生成されるように選択することができる。表6Aは、様々な数の同時標的に必要な1ランあたりのビット数を示す。表6Bは、1ランあたりのビット総数から決定された様々なサイクル数を示す。
【0096】
(表6A)様々な数の可能性のある同時標的
【0097】
(表6B)1ランあたりのビットからのサイクル数
【0098】
さらに、1サイクルあたりに得られるビット数は、使用する停止塩基の数に基づいて変化することがある。表7Aは、1個の停止塩基が用いられたときの1サイクルあたりのビット数を示す。表7Bは、2個の停止塩基が用いられたときの1サイクルあたりのビット数を示す。
【0099】
(表7A)1サイクルあたりのビット、1個の停止塩基
【0100】
(表7B)1サイクルあたりのビット、2個の停止塩基
【0101】
まとめ
本発明の態様の前述の説明は例示目的で提示された。前述の説明は網羅的であることも、本発明を、開示された正確な形に限定することも意図しない。関連分野の当業者は、前記の開示を考慮すれば多くの変更および変形が可能なことを理解することができる。
【0102】
この説明のいくつかの部分は、情報に関する操作のアルゴリズムおよび記号表現の点から本発明の態様について説明する。これらのアルゴリズム記述および表現は、データ処理分野の当業者が仕事の内容を他の当業者に効果的に伝えるために一般的に用いられる。これらの操作は機能的に、計算的に、または論理的に記述されているが、コンピュータプログラムまたは等価な電気回路、マイクロコードなどによって実行されることが理解される。さらに、一般性を失うことなく、これらの操作配置をモジュールとして言及することが時として便利であることも分かっている。説明された操作およびその関連するモジュールは、ソフトウェア、ファームウェア、ハードウェア、またはその任意の組み合わせにおいて具体化され得る。
【0103】
本明細書に記載の工程、操作、またはプロセスはいずれも、1つまたは複数のハードウェアモジュールもしくはソフトウェアモジュールを単独で用いて実施または実行されてもよく、他の装置と組み合わせて実施または実行されてもよい。一態様において、ソフトウェアモジュールは、説明された工程、操作、またはプロセスのいずれかまたは全てを実施するためにコンピュータプロセッサによって実行することができるコンピュータプログラムコードを収めているコンピュータ可読媒体を含むコンピュータプログラム製品を用いて実行される。
【0104】
本発明の態様はまた、本明細書において操作を行うための機器に関する。この機器は、必要とされる目的のために特別に組み立てられてもよく、および/またはコンピュータ内に記憶されたコンピュータプログラムによって選択的に起動もしくは再構成される汎用演算処理装置を含んでもよい。このようなコンピュータプログラムは非一時的な有形のコンピュータ可読記憶媒体内に記憶されてもよく、コンピュータシステムバスに連結され得る、電子命令を記憶するのに適した任意のタイプの媒体の中に記憶されてもよい。さらに、本明細書において言及された、いずれの演算処理システムも1つしかプロセッサを含んでいなくてもよく、演算処理能力を高めるために複数のプロセッサ設計を使用する構成でもよい。
【0105】
本発明の態様はまた、本明細書に記載の演算処理プロセスによって作成された製品に関する。このような製品は、演算処理プロセスに起因する情報を含んでもよい。この場合、情報は非一時的な有形のコンピュータ可読記憶媒体に記憶され、コンピュータプログラム製品または本明細書に記載の他のデータ組み合わせの任意の態様を含んでもよい。
【0106】
最後に、本明細書において用いられた言語は、主に、読みやすさ、および指示上の目的で選択されており、本発明の発明の主題を正確に説明する、または制限するために選択されたのではない場合がある。従って、本発明の範囲は、この詳細な説明によっては限定されず、ここに基づく出願において発行された特許請求の範囲によって限定されることが意図される。従って、本発明の態様の開示は例示であり、本発明の範囲を限定するものではなく、本発明の範囲は添付の特許請求の範囲によって規定されることが意図される。
【0107】
本明細書の本文の中で引用された全ての参考文献、発行された特許、および特許出願はその全体が全ての目的のために参照により本明細書に組み入れられる。