【文献】
Michael Zwolak,Colloquium: Physical approaches to DNA sequencing and detection,REVIEWS OF MODERN PHYSICS,2008年,Vol.80,pp.141-165
【文献】
谷口正輝,1分子解析技術による次々世代DNAシーケンサーの開発,第69回表面化学研究会 要旨集,2011年 3月 9日,pp.23-26
(58)【調査した分野】(Int.Cl.,DB名)
上記第3工程では、更に、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成することを特徴とする請求項1に記載の方法。
上記参照電流値は、ヌクレオチドを個別に上記電極対の間を通過させたときに生じるトンネル電流の複数のパルスの最大電流値のうちの最頻値であることを特徴とする請求項1または2に記載の方法。
上記第6工程では、上記第5工程で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、該三次塩基配列情報同士を繋ぎ合わせることを特徴とする請求項1〜4の何れか1項に記載の方法。
上記第5工程にて検索される上記共通している塩基配列は、少なくとも10個の二次塩基配列情報の間で共通しているものであることを特徴とする請求項1〜5の何れか1項に記載の方法。
上記第4工程では、1ms以上の時間の間、上記パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出することを特徴とする請求項1〜6の何れか1項に記載の方法。
上記一次塩基配列情報作成部は、更に、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成するものであることを特徴とする請求項9に記載のポリヌクレオチドの塩基配列を決定する装置。
上記参照電流値は、ヌクレオチドを個別に上記電極対の間を通過させたときに生じるトンネル電流の複数のパルスの最大電流値のうちの最頻値であることを特徴とする請求項9または10に記載の装置。
上記配列情報連結部は、上記共通配列検索部で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、該三次塩基配列情報同士を繋ぎ合わせるものであることを特徴とする請求項9〜12の何れか1項に記載の装置。
上記共通配列検索部にて検索される上記共通している塩基配列は、少なくとも10個の二次塩基配列情報の間で共通しているものであることを特徴とする請求項9〜13の何れか1項に記載の装置。
上記二次塩基配列情報抽出部は、1ms以上の時間の間、上記パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出するものであることを特徴とする請求項9〜14の何れか1項に記載の装置。
【発明を実施するための形態】
【0023】
以下に、本発明の一実施形態について説明するが、本発明はこれに限定されるものではない。
【0024】
〔1.ポリヌクレオチドの塩基配列を決定する方法〕
本発明のポリヌクレオチドの塩基配列を決定する方法は、以下の第1工程〜第6工程を包含している。つまり、
・第1工程:ポリヌクレオチドを、電極対の間を通過させる工程。
・第2工程:ポリヌクレオチドが電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する工程。
・第3工程:複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチド(参照ヌクレオチドと呼ぶ)と電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する工程。
・第4工程:複数のパルスの中から、パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する工程。
・第5工程:複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する工程。
・第6工程:共通している塩基配列を介して、当該共通している塩基配列を有している二次塩基配列情報同士を繋ぎ合わせる工程。
【0026】
〔1−1.第1工程〕
第1工程は、ポリヌクレオチドを、電極対の間を通過させる工程である。
【0027】
本明細書中で使用される場合、用語「ポリヌクレオチド」は、「オリゴヌクレオチド」、「遺伝子」と交換可能に使用され、ヌクレオチドの重合体が意図される。なお、本明細書中で使用される場合、「オリゴヌクレオチド」は、2〜数十個、より具体的には、2〜50個のヌクレオチドからなるものが意図される。「ポリヌクレオチド」は、数十個以上、具体的には、50個よりも多くのヌクレオチドからなるものが意図される。
【0028】
上記ポリヌクレオチドを構成するヌクレオチドとしては特に限定されず、任意のリボヌクレオチドであってもよいし、任意のデオキシリボヌクレオチドであってもよい。また、上記ポリヌクレオチドを構成するヌクレオチドは、リボヌクレオチドまたはデオキシリボヌクレオチドが化学修飾(例えば、メチル化、オキソ化、ヒドロキシル化、ホルミル化、カルボキシ化、ダイマー化、塩基脱離化等)を受けたものであってもよい。
【0029】
リボヌクレオチドとしては、特に限定されないが、アデノシン一リン酸(rAMP)、アデノシン二リン酸(rADP)、アデノシン三リン酸(rATP)、グアノシン一リン酸(rGMP)、グアノシン二リン酸(rGDP)、グアノシン三リン酸(rGTP)、シチジン一リン酸(rCMP)、シチジン二リン酸(rCDP)、シチジン三リン酸(rCTP)、ウリジン一リン酸(rUMP)、ウリジン二リン酸(rUDP)、およびウリジン三リン酸(rUTP)などが挙げられる。
【0030】
デオキシリボヌクレオチドとしては、特に限定されないが、デオキシアデノシン一リン酸(dAMP)、デオキシアデノシン二リン酸(dADP)、デオキシアデノシン三リン酸(dATP)、デオキシグアノシン一リン酸(dGMP)、デオキシグアノシン二リン酸(dGDP)、デオキシグアノシン三リン酸(dGTP)、デオキシシチジン一リン酸(dCMP)、デオキシシチジン二リン酸(dCDP)、デオキシシチジン三リン酸(dCTP)、デオキシウリジン一リン酸(dUMP)、デオキシウリジン二リン酸(dUMP)、デオキシウリジン二リン酸(dUTP)、デオキシチミジン一リン酸(dTMP)、デオキシチミジン二リン酸(dTDP)、およびデオキシチミジン三リン酸(dTTP)などが挙げられる。
【0031】
化学修飾を受けたリボヌクレオチドまたはデオキシリボヌクレオチドとしては、特に限定されないが、メチルシトシン、メチルアデニン、オキソグアニン、ヒドロキシメチルシトシン、チミンダイマー、メチルアデニン、ホルミルシトシン、および、リボヌクレオチドまたはデオキシリボヌクレオチドから塩基が脱離したものなどが挙げられる。
【0032】
第1工程では、上述したポリヌクレオチドを溶液中に溶解させて、上記電極対を形成する電極の間に当該溶液を充填すること、または、電極対を上記溶液中に保持することによって、ポリヌクレオチドを、電極対の間を通過させればよい。
【0033】
上記溶液としては、特に限定されないが、例えば、超純水が挙げられる。超純水は、例えば、ミリポア社のMilli-Q Integral 3(装置名)(Milli-Q Integral 3/5/10/15(カタログ番号))を用いることによって作製することができる。溶液中のポリヌクレオチドの濃度は、特に限定されないが、例えば、0.01〜1.0μMである。勿論、溶液中に1分子のポリヌクレオチドが含まれていれば、当該ポリヌクレオチドの塩基配列を分析することができる。
【0034】
第1工程では、電極対の間に電圧を印加する。これによって、当該電極対の間をポリヌクレオチドが通過するときに当該電極対を形成する電極間にトンネル電流が発生する。印加する電圧は、特に限定されず、例えば、0.25V〜0.75Vであり得る。
【0035】
第1工程では、上述したポリヌクレオチドを、電極対の間を通過させる。
【0036】
ポリヌクレオチドを電極対の間を通過させる具体的な方法は特に限定されないが、例えば、熱拡散(換言すれば、ブラウン運動)または交流電圧などによってポリヌクレオチドを移動させ、当該移動によって、電極対の間を通過させることが可能である。これらの中では、熱拡散によってポリヌクレオチドを移動させ、当該移動によって、電極対の間を通過させることが好ましい。上記構成によれば、ポリヌクレオチドが長時間、電極対の間に存在することが可能になるので、ポリヌクレオチドの部分配列の情報をより多く得ることができる。そして、その結果、ポリヌクレオチドの塩基配列を、より長く、かつ、より精度よく決定することができる。
【0037】
ポリヌクレオチドを熱拡散させる場合の温度は特に限定されず、適宜設定することができる。例えば、5℃〜70℃であることが好ましく、20℃〜50℃であることが更に好ましい。
【0038】
従来技術とは異なり、本発明はタンパク質によって形成されたポアを有する電極を必要としないので、たとえ高温にてポリヌクレオチドを熱拡散させたとしても、電極が機能を失うことはない。更に、ポリヌクレオチドを高温にて熱拡散させれば、ポリヌクレオチドが分子間で相互作用(例えば、水素結合)することを防止することができる。つまり、ポリヌクレオチドを高温にて熱拡散させれば、ポリヌクレオチドが2本鎖を形成することを防止することができる。その結果、より正確に、ポリヌクレオチドの塩基配列を決定することができる。
【0039】
次いで、本実施の形態に用いる電極対について説明する。
【0040】
本実施の形態を実施するためには、ポリヌクレオチドが通過した際に電極対の間にトンネル電流を生じさせることが必要である。このようなトンネル電流が生じるためには、電極対の間の距離が重要である。電極対の間の距離が、ポリヌクレオチドを構成する各ヌクレオチドの分子直径よりも長すぎると、電極対の間にトンネル電流が流れにくくなったり、2つ以上のポリヌクレオチドが、同時に電極対の間に入り込んだりする。反対に、電極対の間の距離がポリヌクレオチドを構成する各ヌクレオチドの分子直径よりも短すぎると、電極対の間にポリヌクレオチドが入り込めなくなる。
【0041】
電極対の間の距離がポリヌクレオチドを構成するヌクレオチドの分子直径よりも長すぎたり、短すぎたりすると、ポリヌクレオチドを構成する各ヌクレオチド1分子を介したトンネル電流に由来するパルスを検出することが困難になる。よって、電極対を形成する電極間の距離は、ポリヌクレオチドを構成するヌクレオチドの分子直径よりも少し短いか、等しいか、または、それよりも少し長い程度であることが好ましい。例えば、電極間の距離は、ヌクレオチドの分子直径の0.5倍〜2倍の長さであり、1倍〜1.5倍の長さであることが好ましく、1倍〜1.2倍の長さであることがより好ましい。
【0042】
ヌクレオチドの分子直径は当業者に公知であるため、本明細書に接した当業者であれば、最適な電極対の間の距離を適宜選択することができる。例えば、一リン酸の形態のヌクレオチドの分子直径は約1nmであるため、当該分子直径を基準として、電極対の間の距離を、例えば0.5nm〜2nm、好ましくは1nm〜1.5nm、より好ましくは1nm〜1.2nmに設定すればよい。
【0043】
また、上記電極対は、電極間の距離が一定に保たれているもの(または、電極間の距離が一定にコントロールされ得るもの)であることが好ましい。つまり、上記電極対は、トンネル電流を測定している時に電極間の距離が変化しないものであることが好ましい。
【0044】
例えば、電極間の距離の変化率が1%以下であるものが好ましく、0.1%以下であるものが更に好ましく、0.01%以下であるものが更に好ましく、0.001%以下であるものが更に好ましい。
【0045】
従来の技術で作製された電極対は、肉眼で観察した場合には一見すると電極間の距離が一定に保たれているように見えるが、実際には電極間の距離が微細に変化している。そして、微細であったとしても電極間の距離が変化すると、トンネル電流の値が変動する。つまり、同じ物質に由来するトンネル電流の値が変化してしまい、ポリヌクレオチドの塩基配列の決定精度が低くなってしまう。
【0046】
一方、電極間の距離が一定に保たれ得る電極対を用いれば、ポリヌクレオチドの塩基配列の決定精度を更に高いものにすることができる。
【0047】
なお、このような電極対は、本発明者が開発した技術(例えば、後述するナノ加工機械的破断接合法)によって容易に作製することができる。当該技術の詳細については、後述する。
【0048】
上記電極対の具体的な作製方法は特に限定されない。以下に、作製方法の一例を示す。
【0049】
上述した電極対は、公知のナノ加工機械的破断接合法(nanofabricated mechanically-controllable break junctions)を用いることによって作製することができる。このナノ加工機械的破断接合法は、ピコメーター以下の分解能にて、機械的安定性に優れた電極間距離を制御することができる優れた方法である。ナノ加工機械的破断接合法を用いた電極対の作製方法は、例えば、J. M. van Ruitenbeek, A. Alvarez, I. Pineyro, C. Grahmann, P. Joyez, M. H. Devoret, D. Esteve, C. Urbina, Rev. Sci. Instrum. 67, 108(1996)またはM. Tsutsui, K. Shoji, M. Taniguchi, T. Kawai, Nano Lett. 8, 345(2008)に記載されている。電極の材料としては、金などの任意の金属が挙げられる。
【0050】
例えば、以下に示す手順によって電極対を作製することができる。
【0051】
まず、ナノスケールの金の接合を、電子線描画装置(日本電子社製、カタログ番号:JSM6500F)を用いて、公知の電子ビームリソグラフィーおよびリフトオフ技術によって、ポリイミドでコーティングされた可撓性の金属基板上にパターン成形する。次いで、この接合の下にあるポリイミドを、反応性イオンエッチング装置(サムコ社製、カタログ番号:10NR)を用いて、公知のエッチング法(反応性イオンエッチング法など)に基づくエッチングによって取り除く。
【0052】
そして、基板を折り曲げることによって、3点にて折り曲げられた構造のナノスケールの金のブリッジを作製する。この場合、ピエゾアクチュエータ(CEDRAT社製、カタログ番号:APA150M)を用いて基板の折曲げを精密に操作することによって、電極対の電極間距離をピコメーター以下の分解能にて制御することができる。
【0053】
次いで、作製したこのブリッジを引っ張り。ブリッジの一部を破断させる。さらにブリッジを引っ張り、破断によって生じたギャップの大きさ(電極間距離)が目的のヌクレオチド分子の長さ(約1nm)になるように設定する。この場合、自己破断技術を利用してブリッジの引っ張りを調節することによって電極対の電極間距離を正確に制御することができる(M. Tsutsui, K. Shoji, M. Taniguchi, T. Kawai, Nano Lett. 8, 345(2008)、およびM. Tsutsui, M. Taniguchi, T. Kawai, Appl. Phys. Lett. 93, 163115(2008)参照)。
【0054】
具体的には、データ集録ボード(ナショナルインスツルメンツ社製、カタログ番号:NIPCIe-6321)を用いて、レジスタンスフィードバック法(M. Tsutsui, K. Shoji, M. Taniguchi, T. Kawai, Nano Lett. 8, 345(2008)、およびM. Tsutsui, M. Taniguchi, T. Kawai, Appl. Phys. Lett. 93, 163115(2008)参照)によって、プログラミングされた接合の引き延ばし速度の下で、10kΩの直列の抵抗を用いて、0.1VのDCバイアス電圧(V
b)をこのブリッジに印加して、金のナノ接合を引っ張り、ブリッジを破断させる。そして、ブリッジをさらに引っ張り、破断によって生じたギャップの大きさ(電極間距離)が目的のヌクレオチド分子の長さになるように設定する。このようにして、電極対を形成する。
【0055】
〔1−2.第2工程〕
第2工程は、ポリヌクレオチドが電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する工程である。
【0056】
第2工程にて検出されるパルスの数は特に限定されないが、多ければ多いほど、ポリヌクレオチドの全長の塩基配列を精度良く決定することができる。なお、検出されるパルスの数を多くするためには、例えば、トンネル電流を測定する時間を長くすればよい。トンネル電流を測定する時間は限定されないが、例えば、10分間、20分間、30分間、40分間、50分間、1時間であり得る。上記時間は、ポリヌクレオチドの長さに応じて適宜設定すればよい。
【0057】
以下では、トンネル電流の具体的な測定方法について説明する。
【0058】
例えば、ポリヌクレオチドが溶解した溶液中に電極対を保持し、電極対の間に電圧(例えば、0.25V〜0.75V)を印加すれば、ポリヌクレオチドが電極対の間を通過したときに、ポリヌクレオチドを構成するヌクレオチドに起因するトンネル電流が電極対の間に生じる。トンネル電流(複数のトンネル電流)が生じるメカニズムを以下にて説明する。
【0059】
ポリヌクレオチドが電極対の間に進入すると、まず、ポリヌクレオチドを構成する何れかのヌクレオチド(以下、1番目のヌクレオチドと呼ぶ)が電極間に捕捉される。1番目のヌクレオチドが電極間に捕捉されたときに、1番目のヌクレオチドに起因するトンネル電流が電極間に生じる。
【0060】
なお、当該1番目のヌクレオチドは、ポリヌクレオチドの5’末端のヌクレオチドである場合もあるし、ポリヌクレオチドの3’末端のヌクレオチドである場合もあるし、5’末端と3’末端との間に存在するヌクレオチドである場合もある。
【0061】
その後、1番目のヌクレオチドが電極対の間を完全に通過した後に、別のヌクレオチドが電極間に捕捉される(以下、2番目のヌクレオチドと呼ぶ)。2番目のヌクレオチドが電極対の間に捕捉されたときに、2番目のヌクレオチドに起因するトンネル電流が電極対の間に生じる。
【0062】
なお、上記2番目のヌクレオチドは、上記1番目のヌクレオチドに隣接しているヌクレオチドである場合もあるし、上記1番目のヌクレオチドに隣接していないヌクレオチドである場合もある。2番目のヌクレオチドが1番目のヌクレオチドに隣接しているヌクレオチドであるか否かはパルス持続時間に基づいて判定することが可能であり、この点については後述する。
【0063】
以上のようにして、ポリヌクレオチドを構成するヌクレオチドに起因するトンネル電流が電極対の間に生じる。
【0064】
そして、ポリヌクレオチドが電極対の間を通過すると(ポリヌクレオチドを構成する最後のヌクレオチドが電極対から解離すると)、電極対の間に生じていたトンネル電流が消失する。
【0065】
電極対の間に生じるトンネル電流の測定は、公知の電流計を用いて測定することができる。また、電流増幅器を用いて、トンネル電流のシグナルを一旦増幅してもよい。電流増幅器を用いることによって、微弱なトンネル電流の値を増幅することができるため、トンネル電流を高感度に測定することが可能となる。電流増幅器としては、例えば、市販の可変高速電流アンプ(Femto社製、カタログ番号:DHPCA−100)が挙げられる。
【0066】
電極対の間に流れるトンネル電流を所定の時間測定して、トンネル電流の電流値が基底レベルを超えているか否かを経時的に判定することによって、トンネル電流のパルスを検出することができる。具体的には、上述の判定にしたがって、トンネル電流が基底レベルを超えた時間を特定し、そして再び基底レベルに戻った時間を特定すれば、これらの2つの時間の間のシグナルをヌクレオチドに起因するトンネル電流のパルスとして検出することができる。測定したトンネル電流の電流値とトンネル電流の測定時間との関係を示すグラフ(例えば、曲線グラフ)を用いれば、このような判定を目視にて容易に行うことができる。
【0067】
図2(b)に、トンネル電流のパルスの一例を示す。
図2(b)に示すように、測定したトンネル電流の電流値とトンネル電流の測定時間との関係を示すグラフから、各パルスの最大電流値(Ip)とパルス持続時間(tp)とを算出することができる。
【0068】
〔1−3.第3工程〕
第3工程は、複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチド(参照ヌクレオチドと呼ぶ)と電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する工程である。
【0069】
また、第3工程は、複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチド(参照ヌクレオチドと呼ぶ)の参照電流値の間の大小の順番と、を比較することによって、複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する工程であってもよい。
【0070】
例えば、構造が既知である4種類の参照ヌクレオチドの各々の参照電流値A、B、CおよびDが予め決定され、その大小関係がA<B<C<Dであったとする。そして、測定された複数のパルスの最大電流値の各々がa、b、cまたはdに分類することができ、かつ、これらの最大電流値にa<b<c<dの大小関係があったとする。
【0071】
この場合、最大電流値aに対応するヌクレオチドと、参照電流値Aに対応する参照ヌクレオチドとは、同じヌクレオチドであると判断することができ、最大電流値bに対応するヌクレオチドと、参照電流値Bに対応する参照ヌクレオチドとは、同じヌクレオチドであると判断することができ、最大電流値cに対応するヌクレオチドと、参照電流値Cに対応する参照ヌクレオチドとは、同じヌクレオチドであると判断することができ、最大電流値dに対応するヌクレオチドと、参照電流値Dに対応する参照ヌクレオチドとは、同じヌクレオチドであると判断することができる。
【0072】
参照ヌクレオチドの構造は既知であるので、測定された各パルスを特定の種類のヌクレオチドに対応づけることができる。
【0073】
なお、上記第3工程は、複数のパルスの最大電流値の種類(上述した例では、4種類)と、参照電流値の種類(上述した例では、4種類)とが、同じ数であるか否かを判定する工程を包含していてもよい。複数のパルスの最大電流値の種類と、参照電流値の種類とが同じ数である場合には、より精度高くポリヌクレオチドの塩基配列を決定することができる。
【0074】
参照電流値の大小関係は電極対の材料に応じて決定され得る。
【0075】
例えば、電極対が金電極である場合には、参照電流値の大小の順番は、ヌクレオチド(参照ヌクレオチド)がDNAである場合には、dTMP<dCMP<dAMP<Methyl dAMP<dGMP<Oxo−dGMP<Methyl dCMPであり、ヌクレオチド(参照ヌクレオチド)がRNAである場合には、rUMP<rCMP<rAMP<rGMPであり得る。勿論、本発明は、これに限定されない。
【0076】
第3工程は、第2工程にて測定された最大電流値と、個々のヌクレオチド(以下、参照ヌクレオチドと称する)に対応する参照電流値とを比較することによって、ポリヌクレオチドから検出された複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する工程であってもよいし、当該工程を包含していてもよい。
【0077】
つまり、当該第3工程では、予め測定されている参照ヌクレオチドの最大電流値の最頻値(換言すれば、参照電流値)と、ポリヌクレオチドにて実際に測定された各パルスの最大電流値とを比較することによって、各パルスを特定の種類のヌクレオチドに対応付ける。そして、これによって、第2工程にて測定された最大電流値の情報が、一次塩基配列情報へ置換される。
【0078】
つまり、当該第3工程では、ポリヌクレオチドにて実際に測定されたパルスの最大電流値が、特定の参照ヌクレオチドの最大電流値の最頻値(換言すれば、参照電流値)と一致すれば、上記パルスを発しているポリヌクレオチド内のヌクレオチドが、上記特定の参照ヌクレオチドと同一であると判定することができる。
【0079】
上記参照ヌクレオチドとは、ポリヌクレオチドを構成している可能性があるヌクレオチドを意図する。具体的には、〔1−1.第1工程〕の欄にてポリヌクレオチドを構成し得るヌクレオチドとして記載した、任意のリボヌクレオチド、任意のデオキシリボヌクレオチド、および、これらが化学修飾(例えば、メチル化、オキソ化、ヒドロキシル化、ホルミル化、カルボキシ化、ダイマー化、塩基脱離化等)を受けたものであり得る。更に具体的なヌクレオチドの例は、〔1−1.第1工程〕の欄にて既に説明したので、ここではその説明を省略する。
【0080】
上記参照電流値は、参照ヌクレオチドを個別に電極対の間を通過させたときに生じるトンネル電流の複数のパルスの最大電流値の最頻値として求めることができる。なお、参照電流値を求めるときに用いる電極対は、ポリヌクレオチドの塩基配列を決定するために用いる電極対と同じ電極を用いることが好ましい。当該構成であれば、参照電流値を求めるときの測定条件と、ポリヌクレオチドの塩基配列を決定するときの測定条件とを同一にすることができるので、精度良く、ポリヌクレオチドの塩基配列を決定することができる。
【0081】
つまり、本発明では、電極対を作製したら、まず、様々な参照ヌクレオチドに関する参照電流値を求めるとともに当該参照電流値のデータをデータベース化し、実際にポリヌクレオチドの塩基配列を決定するときには、ポリヌクレオチドに由来する各パルスの最大電流値と上記データベース化された参照電流値とを比較することによって、ポリヌクレオチドに由来する各パルスがどの参照ヌクレオチドに対応するか決定すればよい。
【0082】
以下に、参照電流値を求める方法について、具体的に説明する。
【0083】
参照電流値を求める場合には、参照ヌクレオチドを個別に、複数回、電極対の間を通過させ、各参照ヌクレオチドについて複数のトンネル電流を測定し、当該複数のトンネル電流値の最大電流値を求め、最も頻度良く出現する最大電流値を参照電流値とすればよい。
【0084】
まず、参照ヌクレオチドを、個別に溶液(例えば、ポリヌクレオチドを溶解する溶液と同じ溶液)中に溶解させる。
【0085】
電極対を参照ヌクレオチドが溶解した溶液中に保持し、電極対の間に電圧を印加すれば、参照ヌクレオチドが通過するときに、電極対の間に参照ヌクレオチドが捕捉される。電極対の間に参照ヌクレオチドが捕捉されている間(電極間に参照ヌクレオチドが滞在する間)、電極対の間にトンネル電流が生じる。電極対の間に捕捉された参照ヌクレオチドは、所定の時間が経過すると自発的に電極対から解離する。参照ヌクレオチドが電極対から解離することによって、電極間に生じていたトンネル電流が消失する。このように、参照ヌクレオチドが電極対の間に捕捉され、電極対の間から解離することによって、トンネル電流のパルスが発生する。そして、当該捕捉と解離とを繰り返すことによって、各参照ヌクレオチドについて、複数のトンネル電流のデータが得られる。
【0086】
電極対の間に電圧を印加する方法は、特に限定されず、例えば、公知の電源装置を電極対に接続して、電極対の間に電圧(例えば、バイアス電圧)を印加すればよい。印加する電圧は、特に限定されず、ポリヌクレオチドの塩基配列を決定するときと同じ電圧を用いればよい。例えば、0.25V〜0.75Vである。
【0087】
このようにして、参照ヌクレオチドが溶解した溶液中に保持された電極対の間に電圧を印加して、これによって電極対の間に生じたトンネル電流の電流値を所定の時間測定すればよい。トンネル電流の電流値は、例えば、50分間測定すればよい。
【0088】
電極対の間に生じたトンネル電流は、公知の電流計を用いて測定することができる。また、例えば電流増幅器を用いてトンネル電流のシグナルを一旦増幅してもよい。電流増幅器を用いることによって、微弱なトンネル電流の値を増幅することができるため、トンネル電流を高感度に測定することが可能となる。電流増幅器としては、例えば、市販の可変高速電流アンプ(Femto社製、カタログ番号:DHPCA−100)が挙げられる。
【0089】
このように、電極対の間に流れるトンネル電流を所定の時間測定して、トンネル電流の電流値が基底レベルを超えているか否かを経時的に判定することによって、トンネル電流のパルスを検出することができる。具体的には、上述の判定にしたがって、トンネル電流が基底レベルを超えた時間を特定し、そして再び基底レベルに戻った時間を特定すれば、これらの2つの時間の間のシグナルを参照ヌクレオチドに起因するトンネル電流のパルスとして検出することができる。測定したトンネル電流の電流値とトンネル電流の測定時間との関係を示すグラフ(例えば、曲線グラフ)を用いれば、このような判定を目視にて容易に行うことができる。
【0090】
このようにして検出した参照ヌクレオチドに起因するパルスには、種々の高さのピークが存在する。これらのピークは、電極対の間における参照ヌクレオチドの運動に基づく電極と参照ヌクレオチドとの距離の変化に起因して出現する。すなわち、参照ヌクレオチドと電極との距離が短くなれば、トンネル電流が生じやすくなるため、トンネル電流の電流値が増加する。一方、参照ヌクレオチドと電極との距離が長くなれば、トンネル電流が生じにくくなるため、トンネル電流の電流値が減少する。このように、参照ヌクレオチドが電極対の間において運動することによって、電極と参照ヌクレオチドとの距離が変化し、トンネル電流の電流値が増減するため、トンネル電流のパルスに複数の種類のピークが現れる。
【0091】
このようにして検出した各パルスの最も高いピークの電流値から基底レベルを引くことによって、各パルスの最大電流値を求めることができる。そして、求めた各最大電流値に対して統計分析を行うことによって最頻値を算出することができる。
【0092】
最頻値を求めるためには、例えば、最大電流値の値と、当該値を有するパルスの数との関係を示すヒストグラムを生成する。そして、生成したヒストグラムを所定の関数にフィッティングする。そして、フィッティングした関数のピーク値を求めることによって、最頻値を算出することができる。
【0093】
フィッティングに用いる関数としては、ガウス関数またはポアソン関数を挙げることが可能であるが、ガウス関数であることが好ましい。ガウス関数を用いることによって、データ処理速度を速くすることができるという利点が得られる。
【0094】
最頻値を算出するための統計分析に用いる標本(パルス)の数は、特に限定されず、例えば500個〜1000個である。この程度の数を統計分析に用いれば、統計的に有意な最頻値を算出することができる。このような最頻値は各ヌクレオチドにとって固有の値であるため、この最頻値をヌクレオチドの識別のための指標として使用できる。
【0095】
本発明者らは、後述する表1に示すように、参照ヌクレオチドであるdGMP、dAMP、dCMP、dTMP、rGMP、rAMP、rCMPおよびrUMPの最頻値が、各々、87pS、67pS、60pS、39pS、123pS、92pS、64pSおよび50pSであることを実証した。また、参照ヌクレオチドであるメチルシトシン、オキソグアニン、および、リボヌクレオチドまたはデオキシリボヌクレオチドから塩基が脱離したものの最頻値は、各々、105pS、98pS、0pSであった。(なお、これらの最頻値は、0.8nmの電極間距離、0.4Vのバイアス電圧、統計分析のための標本の数(1000個)という条件で算出された。)。このように、最頻値は各参照ヌクレオチドにとって固有の値であるため、この最頻値を、ポリヌクレオチドを構成するヌクレオチドの識別のための指標に使用できる。
【0096】
ここで、トンネル電流は、電極間の距離、溶液中のヌクレオチドまたはポリヌクレオチドの濃度、電極の形状、電極間の電圧などの影響を受けるので、トンネル電流から算出される最頻値もこれらの影響を受ける。例えば、同じ種類のヌクレオチドであったとしても、電極間に印加する電圧が0.25V、0.50Vおよび0.75Vのとき、最頻値はそれぞれ異なる。
【0097】
このため、上述した最頻値は、分布を有している。したがって、本願発明に用いる参照電流値としては、「1点の最頻値」を用いることも可能であるし、「分布を有する最頻値」を用いることも可能である。参照電流値として「分布を有する最頻値」を用いる場合には、当該「分布を有する最頻値」は、最頻値を求めるために用いた関数(ガウス関数またはポアソン関数)の半値全幅として示すことができる。
【0098】
つまり、本発明に用いる参照電流値としては、参照ヌクレオチドの最頻値であってもよいし、参照ヌクレオチドの最頻値をxとし、該参照ヌクレオチドの最頻値を算出するために用いた関数における半値半幅をyとした場合、x±yの範囲の値であってもよい。また、最頻値が上述したように種々の条件の影響を受けるので、参照ヌクレオチドの最頻値は、ポリヌクレオチドの塩基配列を決定するときと同一の条件によって決定されたものであることが好ましい。
【0099】
後述する表1にも示すように、参照ヌクレオチドがdGMPである場合、xが87pSであり、yが22pSである。参照ヌクレオチドがdAMPである場合、xが67pSであり、yが17pSである。参照ヌクレオチドがdCMPである場合、xが60pSであり、yが22pSである。参照ヌクレオチドがdTMPである場合、xが39pSであり、yが11pSである。参照ヌクレオチドがrGMPである場合、xが123pSであり、yが54pSである。参照ヌクレオチドがrAMPである場合、xが92pSであり、yが33pSである。参照ヌクレオチドがrCMPである場合、xが64pSであり、yが18pSである。参照ヌクレオチドがrUMPである場合、xが50pSであり、yが12pSである。
【0100】
第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が87±22pSの範囲に含まれていれば、当該パルスはdGMPに由来するパルスであると判定することができ、最大電流値が87±22pSの範囲に含まれていなければ、当該パルスはdGMPに由来するパルスではないと判定することができる。
【0101】
第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が67±17pSの範囲に含まれていれば、当該パルスはdAMPに由来するパルスであると判定することができ、最大電流値が67±17pSの範囲に含まれていなければ、当該パルスはdAMPに由来するパルスではないと判定することができる。
【0102】
第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が60±22pSの範囲に含まれていれば、当該パルスはdCMPに由来するパルスであると判定することができ、最大電流値が60±22pSの範囲に含まれていなければ、当該パルスはdCMPに由来するパルスではないと判定することができる。
【0103】
第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が39±11pSの範囲に含まれていれば、当該パルスはdTMPに由来するパルスであると判定することができ、最大電流値が39±11pSの範囲に含まれていなければ、当該パルスはdTMPに由来するパルスではないと判定することができる。
【0104】
第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が123±54pSの範囲に含まれていれば、当該パルスはrGMPに由来するパルスであると判定することができ、最大電流値が123±54pSの範囲に含まれていなければ、当該パルスはrGMPに由来するパルスではないと判定することができる。
【0105】
第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が92±33pSの範囲に含まれていれば、当該パルスはrAMPに由来するパルスであると判定することができ、最大電流値が92±33pSの範囲に含まれていなければ、当該パルスはrAMPに由来するパルスではないと判定することができる。
【0106】
第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が64±18pSの範囲に含まれていれば、当該パルスはrCMPに由来するパルスであると判定することができ、最大電流値が64±18pSの範囲に含まれていなければ、当該パルスはrCMPに由来するパルスではないと判定することができる。
【0107】
第2工程にて測定された各パルスの最大電流値と、上述した参照電流値とを比較して、最大電流値が50±12pSの範囲に含まれていれば、当該パルスはrUMPに由来するパルスであると判定することができ、最大電流値が50±12pSの範囲に含まれていなければ、当該パルスはrUMPに由来するパルスではないと判定することができる。
【0108】
また、第2工程にて測定されたパルスの最大電流値が、複数の参照ヌクレオチドの「分布を有する最頻値」に属する場合には、当該パルスを、「分布を有する最頻値」のピークにより近い方の参照ヌクレオチドに由来するパルスであると判定することができる。
【0109】
本発明に用いる参照電流値として、上述したように最頻値自体を用いることも可能であるが、当該最頻値をヌクレオチドの中の何れかの最頻値を「1」として求めた比を用いることも可能である。例えば、dGMPおよびrGMPの最頻値の値を「1」とした場合の、他のヌクレオチドの最頻値の比を求め、当該比を参照電流値として用いることも可能である。
【0110】
この場合、例えば、上述した参照ヌクレオチドの最頻値の比は、dGMP:dAMP:dCMP:dTMP=1±0.25:0.77±0.20:0.69±0.25:0.45±0.12、および、rGMP:rAMP:rCMP:rTMP=1±0.44:0.75±0.27:0.58±0.16:0.41±0.10となる。
【0111】
第3工程では、第2工程にて測定された各パルスの最大電流値が、上述した参照電流値の何れに属するか判定することによって、各パルスを特定のヌクレオチドに対応付ける。そして、当該対応付けに基づいて、第2工程にて測定された各パルスが測定された時間の順番にしたがって、各パルスを特定のヌクレオチドに対応付けた一次塩基配列情報を作成すればよい。
【0112】
例えば、第2工程において8つのパルスが検出された場合、上述した判定基準にしたがって、当該パルスを「AGATTCAC」のような一次塩基配列情報に置換することになる。
【0113】
〔1−4.第4工程〕
第4工程は、複数のパルスの中から、パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する工程である。
【0114】
本明細書において「パルス持続時間が連続しているパルス」とは、隣接しているパルスのパルス持続時間の間隔が短いこと、換言すれば、連続して出現するパルス、を意図する。
【0115】
例えば、任意のパルスのパルス持続時間と、当該パルスに隣接しているパルスの持続時間との間の時間が、1つのヌクレオチドに対応するパルス持続時間よりも短い場合、これらのパルスは、ポリヌクレオチド内で隣接しているヌクレオチドに由来するパルスであると考えて、同じパルス群に分類される。このようにして、第2工程にて検出された複数のパルスを、複数のパルス群へ分類する。そして、一次塩基配列情報の中から、各パルス群に対応する複数の二次塩基配列情報が抽出される。
【0116】
なお、1つのパルス群に属するパルスの数は特に限定されず、例えば、2個以上の数であれば幾つであってもよい。1つのパルス群に属するパルスの数が多いほど、後述する第5工程で検索される共通している塩基配列の長さを長くすることができ、その結果、ポリヌクレオチドの塩基配列の決定精度を高めることができる。
【0117】
例えば、N個の塩基によって構成されているポリヌクレオチド(例えば、DNAまたはRNA)の塩基配列を決定する場合を考える。N<100の場合には、1つのパルス群に属するパルスの数は、N/3個以上であることが好ましく、N/2個であることが更に好ましく、N個であることが更に好ましく、N個以上であることが更に好ましい。N>100の場合には、1つのパルス群に属するパルスの数は、50個以上であることが好ましく、N/2個であることが更に好ましく、N個であることが更に好ましく、N個以上であることが更に好ましい。
【0118】
1つのパルス群に属するパルスの数が50個以上であれば、第5工程および第6工程において、精度の良い操作を可能にする。
【0119】
更に具体的には、1つのパルス群に属するパルスの数は、3個以上であることが好ましく、4個以上であることが更に好ましく、5個以上であることが更に好ましく、6個以上であることが更に好ましく、7個以上であることが更に好ましい。1つのパルス群に属するパルスの数は、多いほど好ましい。
【0120】
上述した「1つのヌクレオチドに対応するパルス持続時間」は、例えば、参照ヌクレオチドの最大電流値の最頻度を測定するときに、同時に参照ヌクレオチドのパルス持続時間を求めることによって決定することができる。
【0121】
例えば、様々な種類の参照ヌクレオチドのパルス持続時間を測定し、これらのパルス持続時間の中の何れかのパルス持続時間(例えば、最も短いパルス持続時間)を、上述した「1つのヌクレオチドに対応するパルス持続時間」と考えることが可能である。
【0122】
例えば、実施例に示すように、dGMPのパルス持続時間の最頻値は、略0.8msである(なお、これらの最頻値は、0.8nmの電極間距離、0.4Vのバイアス電圧、統計分析のための標本の数(1000個)という条件で算出された。)。したがって、1つのパルスのパルス持続時間と、当該パルスに隣接しているパルスの持続時間との間の時間が、0.8msよりも短ければ、これらのパルスは、ポリヌクレオチド内で隣接しているヌクレオチドに由来するパルスであると考えることができる。
【0123】
また、第4工程では、1ms以上の時間の間、上記パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出することが好ましい。
【0124】
上述したように、1つのヌクレオチドに由来するパルスのパルス持続時間は、約0.8ms〜約1msである。それ故に、パルス持続時間が少なくとも1ms以上の時間連続していれば、トンネル電流の測定時のノイズを除去することができるので、より精度良く、ポリヌクレオチドの塩基配列を決定することができる。
【0125】
また、パルス持続時間が連続する合計の時間は、長いほど好ましい。例えば、少なくとも2ms以上の時間、少なくとも5ms以上の時間、少なくとも10ms以上の時間、パルス持続時間が連続していることが好ましい。当該構成であれば、ノイズを除去できるのみならず、より長く、ポリヌクレオチドの塩基配列を決定することができる。
【0126】
第4工程では、確率統計的な手法(例えば、ガウス関数またはポアソン関数などに基づく確率論)に基づいて二次塩基配列を抽出することが好ましい。換言すれば、第4工程では、確率統計的な手法によって、測定されたトンネル電流に対応し得る複数のヌクレオチドの候補のうちの最も出現確率が高いヌクレオチドによって形成された二次塩基配列情報を抽出することが好ましい。
【0127】
図2(c)および(d)にも示すように、各ヌクレオチドに由来するトンネル電流には分布が存在し、各分布は一部が重なっている。それ故に、特定の値のトンネル電流が測定された場合、当該トンネル電流を生じるヌクレオチドの候補が複数存在することになる。しかしながら、各ヌクレオチドに由来するトンネル電流の分布は完全には一致していないので、特定の値のトンネル電流が測定された場合、当該トンネル電流を生じるヌクレオチドの各候補の間では、確からしさ(出現確率)が異なる(例えば、
図2(c)および(d)参照)。
【0128】
例えば、上述した確率統計的な手法は、測定されたトンネル電流と、当該トンネル電流に関して出現確率が最も高い塩基分子とを対応付ける手法であってもよい。
【0129】
一例として、塩基分子が「A」、「T」、「G」または「C」のときを考える。トンネル電流が測定された場合、当該トンネル電流を流す物質が「A」である確率をP(A)、当該トンネル電流を流す物質が「T」である確率をP(T)、当該トンネル電流を流す物質が「G」である確率をP(G)、当該トンネル電流を流す物質が「C」である確率をP(C)とすると、これらの間には以下の関係式が成立する。つまり、
1=P(A)+P(T)+P(G)+P(C)
この場合、最も値が高いP(X)(Xは、A、T、GまたはC)と、トンネル電流とを対応付ければよい。つまり、トンネル電流は、塩基分子Xに由来するものであると判定すればよい。
【0130】
例えば、特定の値のトンネル電流が測定された場合、P(A)が35%であり、P(G)が50%であり、P(C)が10%であり、P(T)が5%であるとすれば、当該トンネル電流は、最も確率が高いヌクレオチドである「G」に由来すると判定することができる。
【0131】
二次塩基配列情報は、連続している複数のパルスからなるパルス群に対応しており、略同じ条件下にて決定された情報であるといえる。そして、連続している複数のパルスを互いに比較しながら、確率統計的な手法に基づいて二次塩基配列を抽出すれば、より正確な二次塩基配列を抽出することができる。
【0132】
また、確率統計的な手法に基づいて二次塩基配列を抽出する場合には、電極間の距離が一定に保たれている電極対を用いることが更に好ましい。つまり、上記電極対は、トンネル電流を測定している時に電極間の距離が変化しないものであることが好ましい。
【0133】
例えば、電極間の距離の変化率が1%以下であるものが好ましく、0.1%以下であるものが更に好ましく、0.01%以下であるものが更に好ましく、0.001%以下であるものが更に好ましい。
【0134】
従来の技術で作製された電極対は、肉眼で観察した場合には一見すると電極間の距離が一定に保たれているように見えるが、実際には電極間の距離が微細に変化している。そして、微細であったとしても電極間の距離が変化すると、トンネル電流の値が一定になり難い。つまり、同じ物質に由来するトンネル電流の値が変化してしまい、ポリヌクレオチドの塩基配列の決定精度が低くなってしまう。
【0135】
つまり、従来の技術で作製された電極対では、
図2(c)および(d)などに示される分布が容易に変動するので、ヌクレオチドの種類を同定することに困難が伴う。
【0136】
一方、電極間の距離が一定に保たれ得る電極対を用いれば、
図2(c)および(d)などに示される分布を一定に保つことができるので、ポリヌクレオチドの塩基配列の決定精度を更に高いものにすることができる。
【0137】
つまり、電極間の距離が一定に保たれ得る電極対を用いれば、測定環境に左右されない安定したトンネル電流を測定することができる。そして、その結果、ポリヌクレオチドの塩基配列の決定精度を更に高いものにすることができる。
【0138】
トンネル電流は様々なパラメータによって大きく変動する。例えば、電極間の距離によって大きく変動する。それ故に、一般的な技術者は、トンネル電流に基づいてポリヌクレオチドの塩基配列を決定できるとは考えなかった。一方、実施例に示すように、本発明者らはトンネル電流に基づいてポリヌクレオチドの塩基配列を決定できることを実証した。
【0139】
そして、第4工程において確率統計的な手法を用いるとともに、電極間の距離が一定に保たれ得る電極対を用いれば、ポリヌクレオチドの塩基配列の決定精度を更に高いものにすることができる。
【0140】
上記構成を用いない場合には、二次塩基配列の精度にムラが生じ易い。そして、場合によっては二次塩基配列の精度が低くなることもある(例えば、略10%以下)。
【0141】
一方、上記構成によれば、トンネル電流をより安定して測定することができるので、確率統計的手法によって抽出される二次塩基配列情報の精度を高めることができる。つまり、より正確な二次塩基配列を抽出することができる。そして、その結果、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列をより正確に決定することができる。具体的には、上記構成であれば、略80%以上の安定した精度で二次塩基配列を抽出することができ、当該精度の高い二次塩基配列に基づいて、ポリヌクレオチドの塩基配列を正確に決定することができる。
【0142】
例えば、従来のトンネル電流の計測は、巨大な装置構成である走査型トンネル電子顕微鏡(STM)を用いて行われていたが、STMでは、原理的に、溶液中でのトンネル電流計測は容易ではなく、電極間の距離を一定に保持することは困難である。一方、ピエゾアクチュエータによるフィードバック方式で、微細加工で作製された金属細線を機械的に破断して作製されるナノギャップ電極や、微細加工で作製される基板上のナノギャップ電極は、溶液中でも電極間を一定に保持することが容易である。
【0143】
〔1−5.第5工程〕
第5工程は、複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する工程である。つまり、第5工程は、ポリヌクレオチドの全長の塩基配列情報が断片化された情報である二次塩基配列情報の中から、二次塩基配列情報同士を繋ぎ合わせる箇所を検索する工程である。
【0144】
共通している塩基配列の長さは特に限定されず、2塩基長以上の長さであってもよく、3塩基以上の長さであってもよく、4塩基以上の長さであってもよく、5塩基以上の長さであってもよく、10塩基以上の長さであってもよい。ポリヌクレオチドの塩基配列を精度良く決定するためには、共通している塩基配列の長さは、できるだけ長い方が好ましいといえる。
【0145】
第5工程にて検索される共通している塩基配列は、できるだけ多くの二次塩基配列情報の間で共通しているものであることが好ましい。例えば、少なくとも2個の二次塩基配列情報の間で共通したものであることが好ましく、少なくとも5個の二次塩基配列情報の間で共通したものであることがより好ましく、少なくとも10個の二次塩基配列情報の間で共通したものであることがより好ましく、少なくとも15個の二次塩基配列情報の間で共通したものであることがより好ましく、少なくとも20個の二次塩基配列情報の間で共通したものであることがより好ましい。上記構成によれば、ポリヌクレオチドの塩基配列をより精度良く決定することができる。
【0146】
〔1−6.第6工程〕
第6工程は、上述した共通している塩基配列を介して、当該共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる工程である。当該工程によって、ポリヌクレオチド(全長または部分長)の塩基配列を決定することができる。
【0147】
例えば、第5工程にて、共通している塩基配列を有している二次塩基配列情報として「AGATT」、「GATTC」および「TTCAC」が得られている場合、例えば「AGATT」と「GATTC」とを「GATT」を介して繋ぎ合わせて「AGATTC」を得る。そして、当該「AGATTC」と「TTCAC」とを「TTC」を介して繋ぎ合わせて「AGATTCAC」が得られることになる。
【0148】
上記構成によれば、ポリヌクレオチドの塩基配列を、より長く決定することができる。
【0149】
第6工程では、第5工程で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、上記三次塩基配列情報同士を繋ぎ合わせてもよい。
【0150】
例えば、第5工程にて、共通している塩基配列を有している二次塩基配列情報として「AGATT」、「GATTC」および「TTCAC」が得られている場合、例えば「AGATT」と「GATTC」とに共通している「GATT」と、「GATTC」と「TTCAC」とに共通している「TTC」とが、三次塩基配列情報として抽出される。そして、「GATT」と「TTC」とを「TT」を介して繋ぎ合わせて「GATTC」が得られることになる。
【0151】
上記構成によれば、ポリヌクレオチドの塩基配列を、より精度よく決定することができる。つまり、「GATTC」の部分は、複数回、塩基配列の特定がなされた部分であるので、配列の信頼度が非常に高いといえる。
【0152】
〔2.ポリヌクレオチドの塩基配列を決定する装置〕
〔2−1.各構成について〕
本実施の形態のポリヌクレオチドの塩基配列を決定する装置は、本発明のポリヌクレオチドの塩基配列を決定する方法を実施するための装置である。
【0153】
当該装置の構成について、
図5を参照しながら説明するが、
図5に示す構成は一例であって、本発明はこれに限定されない。なお、〔1.ポリヌクレオチドの塩基配列を決定する方法〕の欄で既に説明した事項については、ここではその説明を省略する。
【0154】
本実施の形態の装置100は、電圧印加部10、電極対20、測定部30、一次塩基配列情報作成部40、二次塩基配列情報抽出部50、共通配列検索部60、配列情報連結部70およびデータ格納部80を備えている。以下に、各構成について説明する。
【0155】
電圧印加部10は、電極対20に対して電圧を印加するための構成である。
【0156】
電圧印加部10によって電極対20に印加する電圧の大きさとしては特に限定されず、例えば、0.25V〜0.75Vであり得る。
【0157】
電圧印加部10の具体的な構成としては特に限定されず、適宜、公知の電圧印加装置を用いることが可能である。
【0158】
電圧印加部10によって電圧が印加されている電極対20の間をポリヌクレオチドが移動し、このときに、電極対20の間にトンネル電流が発生する。そして、本発明では、当該トンネル電流に基づいて、ポリヌクレオチドの塩基配列を決定することになる。
【0159】
電極対20の具体的な構成としては、既に詳細に説明したので、ここでは、その説明を省略する。
【0160】
測定部30は、ポリヌクレオチドが電極対20の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定するための構成である。測定部30の具体的な構成は特に限定されず、適宜、周知の電流測定装置を用いればよい。
【0161】
測定部30によって測定された情報のうち、少なくとも最大電流値に関する情報が、一次塩基配列情報作成部40へ送られる。また、このとき、データ格納部80に蓄積されている参照ヌクレオチドの参照電流値に関する情報も、一次塩基配列情報作成部40へ送られる。
【0162】
一次塩基配列情報作成部40では、複数のパルスの最大電流値の間の大小の順番と、参照電流値の間の大小の順番とを比較することによって、測定部30によって検出された複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報が作成される。
【0163】
一次塩基配列情報作成部40では、測定部30によって測定された最大電流値に関する情報と、データ格納部80に蓄積されていた参照電流値に関する情報とを比較することによって、測定部30によって検出された複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報が作成されてもよい。
【0164】
一次塩基配列情報作成部40およびデータ格納部80の具体的な構成としては特に限定されず、従来公知のコンピュータ等の演算装置およびメモリを用いることが可能である。
【0165】
二次塩基配列情報抽出部50は、測定部30から送られる少なくともパルス持続時間に関する情報、一次塩基配列情報作成部40から送られる一次塩基配列情報、および、データ格納部80から送られる参照ヌクレオチドのパルス持続時間に関する情報を受け取る。そして、二次塩基配列情報抽出部50は、これらの情報に基づいて、複数のパルスの中から、パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する。
【0166】
なお、二次塩基配列情報抽出部50は、1ms以上の時間の間、パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出するものであってもよい。
【0167】
二次塩基配列情報抽出部50の具体的な構成としては特に限定されず、従来公知のコンピュータ等の演算装置を用いることが可能である。
【0168】
共通配列検索部60は、二次塩基配列情報抽出部50から複数の二次塩基配列情報を受け取り、当該複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する。
【0169】
なお、共通配列検索部60にて検索される共通している塩基配列は、少なくとも10個の二次塩基配列情報の間で共通しているものであってもよい。
【0170】
共通配列検索部60の具体的な構成としては特に限定されず、来公知のコンピュータ等の演算装置を用いることが可能である。
【0171】
配列情報連結部70は、共通配列検索部60から、共通している塩基配列に関する情報を受け取るとともに、共通している塩基配列を介して、共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる。
【0172】
なお、配列情報連結部70は、共通配列検索部60で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、三次塩基配列情報同士を繋ぎ合わせるものであってもよい。
【0173】
配列情報連結部70によって繋ぎ合わせられたデータが、検出結果となる。
【0174】
配列情報連結部70の具体的な構成としては特に限定されず、来公知のコンピュータ等の演算装置を用いることが可能である。
【0175】
〔2−2.装置100の動作のフローの一例〕
図6に、装置100の動作のフローの一例を示す。なお、当該フローは一例であって、本発明はこれに限定されない。
【0176】
S101では、電極対20の間にポリヌクレオチドを含む溶液が充填される。
【0177】
S102では、電圧印加部10によって、電極対20に対して電圧が印加される。これによって、電極対20の間に存在するポリヌクレオチドを介して、トンネル電流が流れることになる。
【0178】
S103では、測定部30によって、トンネル電流の複数のパルスが検出されるとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とが測定される。
【0179】
S104では、上記最大電流値等に基づいて、一次塩基配列情報作成部40にて、一次塩基配列情報が作成される。
【0180】
S105では、二次塩基配列情報抽出部50によって、複数の二次塩基配列情報の抽出が行われる。このとき、複数の二次塩基配列情報の抽出ができなかった場合には、S102へ戻る。このとき、複数の二次塩基配列情報の抽出ができた場合には、S106へ進む。
【0181】
S106では、共通配列検索部60によって、複数の二次塩基配列情報に共通する塩基配列の検索が行われる。このとき、複数の二次塩基配列情報に共通する塩基配列が検索できなかった場合には、S102へ戻る。このとき、複数の二次塩基配列情報に共通する塩基配列が検索できた場合には、S107へ進む。
【0182】
S107では、配列情報連結部70によって、塩基配列情報が連結される。
【0183】
上述した実施形態の装置100、装置100に備えられた各構成、および、各ステップは、CPUなどの演算手段が、ROM(Read Only Memory)やRAMなどの記憶手段に記憶されたプログラムを実行し、キーボードなどの入力手段、ディスプレイなどの出力手段、あるいは、インターフェース回路などの通信手段を制御することにより実現することが可能である。
【0184】
したがって、これらの手段を有するコンピュータが、上記プログラムを記録した記録媒体を読み取り、当該プログラムを実行するだけで、上述した実施形態の装置100、装置100に備えられた各構成、および、各ステップを実現することができる。また、上記プログラムをリムーバブルな記録媒体に記録することにより、任意のコンピュータ上で上記の各種機能および各種処理を実現することができる。
【0185】
上記記録媒体としては、マイクロコンピュータで処理を行うために図示しないメモリ、例えばROMのようなものがプログラムメディアであってもよいし、また、図示していないが外部記憶装置としてプログラム読取り装置が設けられ、そこに記録媒体を挿入することにより読取り可能なプログラムメディアであってもよい。
【0186】
また、何れの場合でも、格納されているプログラムは、マイクロプロセッサがアクセスして実行される構成であることが好ましい。さらに、プログラムを読み出し、読み出されたプログラムは、マイクロコンピュータのプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であることが好ましい。なお、このダウンロード用のプログラムは予め本体装置に格納されていることが好ましい。
【0187】
また、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD/MO/MD/DVD等のディスクのディスク系、ICカード(メモリカードを含む)等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(登録商標)(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する記録媒体等があり得る。
【0188】
また、インターネットを含む通信ネットワークを接続可能なシステム構成であれば、通信ネットワークからプログラムをダウンロードするように流動的にプログラムを担持する記録媒体であることが好ましい。
【0189】
さらに、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであることが好ましい。
【0190】
本発明は、以下のように構成することも可能である。
【0191】
本発明のポリヌクレオチドの塩基配列を決定する方法は、上記課題を解決するために、上記ポリヌクレオチドを、電極対の間を通過させる第1工程と、上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する第2工程と、上記複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチドと上記電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する第3工程と、上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する第4工程と、上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する第5工程と、上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる第6工程と、を有することを特徴としている。
【0192】
上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
【0193】
本発明のポリヌクレオチドの塩基配列を決定する方法は、上記第3工程では、更に、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成することが好ましい。
【0194】
上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
【0195】
本発明のポリヌクレオチドの塩基配列を決定する方法では、上記参照電流値は、ヌクレオチドを個別に上記電極対の間を通過させたときに生じるトンネル電流の複数のパルスの最大電流値のうちの最頻値であることが好ましい。
【0196】
上記構成によれば、参照電流値の値を最適化することができるので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
【0197】
本発明のポリヌクレオチドの塩基配列を決定する方法では、上記電極対は金電極であり、上記参照電流値の大小の順番は、上記ヌクレオチドがDNAである場合には、dTMP<dCMP<dAMP<Methyl dAMP<dGMP<Oxo−dGMP<Methyl dCMPであり、上記ヌクレオチドがRNAである場合には、rUMP<rCMP<rAMP<rGMPであってもよい。
【0198】
上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
【0199】
本発明のポリヌクレオチドの塩基配列を決定する方法は、上記第6工程では、上記第5工程で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、該三次塩基配列情報同士を繋ぎ合わせることが好ましい。
【0200】
上記構成によれば、信頼性がより高い三次塩基配列情報のみを用いて塩基配列を決定するので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
【0201】
本発明のポリヌクレオチドの塩基配列を決定する方法では、上記第5工程にて検索される上記共通している塩基配列は、少なくとも10個の二次塩基配列情報の間で共通しているものであることが好ましい。
【0202】
上記構成によれば、信頼性がより高い共通した塩基配列を用いて塩基配列を決定するので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
【0203】
本発明のポリヌクレオチドの塩基配列を決定する方法は、上記第4工程では、1ms以上の時間の間、上記パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出することが好ましい。
【0204】
上記構成によれば、ノイズを除去することができるとともに、長い二次塩基配列情報を得ることができるので、より効率的にポリヌクレオチドの塩基配列を決定することができる。
【0205】
本発明のポリヌクレオチドの塩基配列を決定する方法では、上記電極対は、電極間の距離が一定に保たれているものであり、上記第4工程では、確率統計的な手法によって上記二次塩基配列情報を抽出することが好ましい。
【0206】
上記構成を用いない場合には、二次塩基配列の精度にムラが生じ易い。そして、場合によっては二次塩基配列の精度が低くなることもある(例えば、略10%以下)。
【0207】
一方、上記構成によれば、トンネル電流をより安定して測定することができるので、確率統計的手法によって抽出される二次塩基配列情報の精度を高めることができる。つまり、より正確な二次塩基配列を抽出することができる。そして、その結果、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列をより正確に決定することができる。具体的には、上記構成であれば、略80%以上の安定した精度で二次塩基配列を抽出することができ、当該精度の高い二次塩基配列に基づいて、ポリヌクレオチドの塩基配列を正確に決定することができる。
【0208】
本発明のポリヌクレオチドの塩基配列を決定する装置は、上記課題を解決するために、ポリヌクレオチドが通過可能な電極間距離を有する電極対と、上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する測定部と、上記複数のパルスの最大電流値の間の大小の順番と、個々のヌクレオチドと上記電極対を形成している金属とのエネルギー準位差に起因した電子状態に対応する参照電流値の間の大小の順番と、を比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する一次塩基配列情報作成部と、上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する二次塩基配列情報抽出部と、上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する共通配列検索部と、上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる配列情報連結部と、を備えていることを特徴としている。
【0209】
上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
【0210】
本発明のポリヌクレオチドの塩基配列を決定する装置では、上記一次塩基配列情報作成部は、更に、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成するものであることが好ましい。
【0211】
上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
【0212】
本発明のポリヌクレオチドの塩基配列を決定する装置では、上記参照電流値は、ヌクレオチドを個別に上記電極対の間を通過させたときに生じるトンネル電流の複数のパルスの最大電流値のうちの最頻値であることが好ましい。
【0213】
上記構成によれば、参照電流値の値を最適化することができるので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
【0214】
本発明のポリヌクレオチドの塩基配列を決定する装置では、上記電極対は金電極であり、上記参照電流値の大小の順番は、上記ヌクレオチドがDNAである場合には、dTMP<dCMP<dAMP<Methyl dAMP<dGMP<Oxo−dGMP<Methyl dCMPであり、上記ヌクレオチドがRNAである場合には、rUMP<rCMP<rAMP<rGMPであってもよい。
【0215】
上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
【0216】
本発明のポリヌクレオチドの塩基配列を決定する装置では、上記配列情報連結部は、上記共通配列検索部で検索された共通している塩基配列の配列情報を三次塩基配列情報として複数抽出し、該三次塩基配列情報同士を繋ぎ合わせるものであることが好ましい。
【0217】
上記構成によれば、信頼性がより高い三次塩基配列情報のみを用いて塩基配列を決定するので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
【0218】
本発明のポリヌクレオチドの塩基配列を決定する装置では、上記共通配列検索部にて検索される上記共通している塩基配列は、少なくとも10個の二次塩基配列情報の間で共通しているものであることが好ましい。
【0219】
上記構成によれば、信頼性がより高い共通した塩基配列を用いて塩基配列を決定するので、より精度よくポリヌクレオチドの塩基配列を決定することができる。
【0220】
本発明のポリヌクレオチドの塩基配列を決定する装置では、上記二次塩基配列情報抽出部は、1ms以上の時間の間、上記パルス持続時間が連続しているパルスからなるパルス群に対応する複数の二次塩基配列情報を抽出するものであることが好ましい。
【0221】
上記構成によれば、ノイズを除去することができるとともに、長い二次塩基配列情報を得ることができるので、より効率的にポリヌクレオチドの塩基配列を決定することができる。
【0222】
本発明のポリヌクレオチドの塩基配列を決定する装置では、上記電極対は、電極間の距離が一定に保たれているものであり、上記二次塩基配列情報抽出部は、確率統計的な手法によって上記二次塩基配列情報を抽出するものであることが好ましい。
【0223】
上記構成を用いない場合には、二次塩基配列の精度にムラが生じ易い。そして、場合によっては二次塩基配列の精度が低くなることもある(例えば、略10%以下)。
【0224】
一方、上記構成によれば、トンネル電流をより安定して測定することができるので、確率統計的手法によって抽出される二次塩基配列情報の精度を高めることができる。つまり、より正確な二次塩基配列を抽出することができる。そして、その結果、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列をより正確に決定することができる。具体的には、上記構成であれば、略80%以上の安定した精度で二次塩基配列を抽出することができ、当該精度の高い二次塩基配列に基づいて、ポリヌクレオチドの塩基配列を正確に決定することができる。
【0225】
本発明は、以下のように構成することができる。勿論、以下の構成と、本明細書に記載のあらゆる構成とを組み合わせることが可能である。
【0226】
本発明のポリヌクレオチドの塩基配列を決定する方法は、上記課題を解決するために、上記ポリヌクレオチドを、電極対の間を通過させる第1工程と、上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する第2工程と、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する第3工程と、上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する第4工程と、上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する第5工程と、上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる第6工程と、を有することを特徴としている。
【0227】
上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
【0228】
本発明のポリヌクレオチドの塩基配列を決定する装置は、上記課題を解決するために、ポリヌクレオチドが通過可能な電極間距離を有する電極対と、上記ポリヌクレオチドが上記電極対の間を通過したときに生じるトンネル電流の複数のパルスを検出するとともに、当該複数のパルスの各々について、最大電流値とパルス持続時間とを測定する測定部と、上記最大電流値と、個々のヌクレオチドに対応する参照電流値とを比較することによって、上記複数のパルスの各々を特定の種類のヌクレオチドに対応付けた一次塩基配列情報を作成する一次塩基配列情報作成部と、上記複数のパルスの中から、上記パルス持続時間が連続しているパルスからなるパルス群を抽出するとともに、上記一次塩基配列情報の中から、上記パルス群に対応する複数の二次塩基配列情報を抽出する二次塩基配列情報抽出部と、上記複数の二次塩基配列情報の少なくとも2つの二次塩基配列情報の間で共通している塩基配列を検索する共通配列検索部と、上記共通している塩基配列を介して、上記共通している塩基配列を有している上記二次塩基配列情報同士を繋ぎ合わせる配列情報連結部と、を備えていることを特徴としている。
【0229】
上記構成によれば、トンネル電流に関するデータに基づいて、ポリヌクレオチドの塩基配列を決定することができる。
【実施例】
【0230】
<1.電極対の作製>
図1に示す電極対を、ナノ加工機械的破断接合法(MCBJ)を用いて形成した(Tsutsui, M., Shoji, K., Taniguchi, M., Kawai, T., Formation and self-breaking mechanism of stable atom-sized junctions. Nano Lett. 8, 345-349(2007)参照)。以下に、電極対の作製方法を簡単に説明する。
【0231】
ナノスケールの金の接合を、電子線描画装置(日本電子社製、カタログ番号:JSM6500F)を用いて、標準の電子ビームリソグラフィーおよびリフトオフ技術によって、ポリイミド(Industrial Summit Technology社製、カタログ番号:Pyre-Ml)でコーティングされた可撓性の金属基板(リン青銅基板)上にパターン成形した。
【0232】
次いで、この接合の下にあるポリイミドを、反応性イオンエッチング装置(サムコ社製、カタログ番号:10NR)を用いて、反応性イオンエッチング法に基づくエッチングによって取り除いた。そして、金属基板を折り曲げることによって、3点にて折り曲げられた構造のナノスケールの金のブリッジを作製した。なお、このような基板の折曲げは、ピエゾアクチュエータ(CEDRAT社製、カタログ番号:APA150M)を用いて行った。
【0233】
その後、上記ブリッジを引っ張り、ブリッジの一部を破断させることによって、電極対(金電極)を形成した。具体的には、データ集録ボード(ナショナルインスツルメンツ社製、カタログ番号:NI PCIe−6321)を用いて、レジスタンスフィードバック法によって、プログラミングされた接合の引延し速度の下で、10kΩの直列の抵抗を用いて、0.1VのDCバイアス電圧(Vb)をこのブリッジに印加して、ブリッジを引っ張り、ブリッジを破断させた。そして、ブリッジをさらに引っ張り、破断によって生じたギャップの大きさ(電極間距離)が目的のヌクレオチド分子の長さ(約1nm)になるように設定した。
【0234】
このような手順によって、電極対を得た。なお、作製した電極対を顕微鏡観察したところ、電極対の電極間の距離は、0.80nmであった。
【0235】
<2.電極対の間に生じるトンネル電流の測定>
電極対を、ヌクレオチドまたはポリヌクレオチドが溶解したMilli−Q水に浸して、ヌクレオチドまたはポリヌクレオチドが電極対の間に捕捉されたときに生じるトンネル電流を測定した。なお、Milli−Q水におけるヌクレオチドまたはポリヌクレオチドの濃度は、何れも0.10μMであった。
【0236】
0.80nmの長さの電極間距離を有する電極対の間を流れるトンネル電流を、0.4VのDCバイアス電圧の下で、10kHzにて、対数増幅器(Rev. Sci. Instrum. 68(10),3816に記載の設計にしたがい、(株)大和技研にて製作)およびPXI 4071 digital multimeter(National Instruments)を用いて測定した。各サンプルについて、200個または個1000個のパルスが検出されるまで測定を行い、これらのパルスについて解析を行った。
【0237】
<3.参照ヌクレオチドの最大電流値およびパルス持続時間の測定>
上記電極対の間を、4種類のデオキシリボヌクレオシド一リン酸(dAMP(2’-deoxyadenosine-5’-monophosphate:Sigma-Aldrich)、dCMP(2’-deoxycytidine-5’-monophosphate sodium salt:Sigma-Aldrich)、dGMP(2’-deoxyguanosine-5’-monophosphate sodium salt hydrate:Sigma-Aldrich)、dTMP(Thymidylic acid disodium salt:Tokyo Chemical Industry Co.(TCI)))および4種類のリボヌクレオシド一リン酸(rAMP(2’-adenosine-5’-monophosphate disodium salt:Oriental yeast)、rCMP(cytidine 5’-monophosphate disodium salt:TCI)、rGMP(Guanosine 5’-monophosphate sodium salt hydrate:TCI)、rUMP(uridine 5’-monophosphate disodium salt hydrate:TCI))の各々を個別に通過させ、このときに電極対の間に生じるトンネル電流を測定するとともに、当該トンネル電流のパルスの最大電流値とパルス持続時間とを測定した。また、別の試料としてメチルシトシン、メチルアデニン、オキソグアニンについても測定した。
【0238】
具体的には、Milli−Q水に対して、最終濃度が0.10μMになるように上記デオキシリボヌクレオシド一リン酸またはリボヌクレオチド一リン酸の各々を加えて、測定用溶液を作製した。
【0239】
当該測定用溶液を電極の間の空間に充填した状態でナノギャップ電極間に0.4Vの電圧を印加し、このときに電極間に生じるトンネル電流を測定した。なお、このとき、電極の間に存在するデオキシリボヌクレオシド一リン酸またはリボヌクレオシド一リン酸は、ブラウン運動を行っている(測定用溶液の温度は、約25℃であった)。
【0240】
図2(a)に、dGMPを含有する測定用溶液を用いたときに、時間の経過とともに測定されるトンネル電流のデータを示す。
図2(a)に示すように、時間の経過にともなって、複数のトンネル電流のパルスが観察された。また、トンネル電流の大きさは、約10pA〜約100pAであった。
【0241】
図2(b)に、
図2(a)に示す複数のトンネル電流のパルスの1つを例示する。
図2(b)に示すように、各パルスは、Ip(最大電流値)およびtd(パルス持続時間)によって規定することが可能である。例えば、dGMPの典型的なIpおよびtdは、Ip=100pAであり、td=1msであった。
【0242】
各デオキシリボヌクレオシド一リン酸および各リボヌクレオシド一リン酸について、約1000個のパルスを用いて、コンダクタンス(Ip/V)ヒストグラムを作製した。なお、当該コンダクタンス(Ip/V)ヒストグラムの作成には、ガウス分布を用いた。
【0243】
図2(c)および
図2(d)に、コンダクタンス(Ip/V)ヒストグラムを示す。
図2(c)および
図2(d)に示すように、各核酸モノマーのG値(G値=コンダクタンス(Ip/V)ヒストグラムのピーク値)は、dGMPが87pSであり、dAMPが67pSであり、dCMPが60pSであり、dTMPが39pSであり、rGMPが123pSであり、rAMPが92pSであり、rCMPが64pSであり、rUMPが50pSであった。当該数値の大小を比較すれば、DNAについては、dGMP(87pS)>dAMP(67pS)>dCMP(60pS)>dTMP(39pS)であり、RNAについては、rGMP(123pS)>rAMP(92pS)>rCMP(64pS)>rUMP(50pS)となる。
【0244】
上記G値をdGMPまたはrGMPに対して標準化した値を下記表1に示す。
【0245】
【表1】
【0246】
密度関数理論に基づく計算によれば、占められている最も高い分子軌道エネルギー(HOMO)は、グアニンが−5.7eVであり、アデニンが−5.9eVであり、シトシンが−6.1eVであり、チミンが−6.6eVであり、ウラシルが−6.9eVであった。当該数値の大小を比較すれば、グアニン(−5.7eV)>アデニン(−5.9eV)>シトシン(−6.1eV)>チミン(−6.6eV)>ウラシル(−6.9eV)となる。
【0247】
分子軌道エネルギーの大小の順番は、上述した相対的なG値の大小の順番と同じである。このことは、核酸モノマーの種類をトンネル電流に基づいて決定する方法は、エネルギー準位(特に、HOMOエネルギー準位)に基づいて分子の種類を特定し得ることを示している。
【0248】
また、上述した「相対的なG値±FWHM」を用いれば、核酸モノマーの種類を特定できることが明らかになった。
【0249】
なお、上記表1には示さなかったが、メチルシトシンおよびオキソグアニンの各々のG値は、105pS、98pSであった。
【0250】
また、同様の実験条件にて測定した、別の試験結果を表2に示す。
【0251】
表1の試験結果と表2の試験結果とは、同様の傾向を示した。
【0252】
【表2】
【0253】
<4.DNAオリゴマーの核酸配列の決定>
上述した<3.参照ヌクレオチドの最大電流値およびパルス持続時間の測定>の試験において、核酸モノマーの代わりにDNAオリゴマー(具体的には、TGT、GTG、ATA、CAC、または、GAG)を用いて、同様の試験を行った。
【0254】
図3(b)〜
図3(f)に示すように、TGT、GTG、ATA、CAC、および、GAGの各々について、2種類のコンダタンスレベルが観察された。
【0255】
TGT、GTGおよびGAG(各々、
図3(b)、(c)、(f)に対応)において、高い方の相対的なG値がdGMP(=1)に対応すると考えた場合、低い方の相対的なG値は、各々、「0.29±0.12」、「0.35±0.12」および「0.68±0.12」となる(下記表3参照)。
【0256】
これらの値は、参照ヌクレオチドにおけるdTMPの「相対的なG値±FWHM」(0.45±0.12)、および、参照ヌクレオチドにおけるdAMPの「相対的なG値±FWHM」(0.77±0.20)の範囲内に入るので、0.29±0.12、0.35±0.12および0.68±0.12という得られた値は、各々、dTMP、dTMPおよびdAMPに対応する。
【0257】
同様に、ATAおよびCAC(各々、
図3(d)、(e)に対応)において、高い方の相対的なG値がdAMP(=0.77)に対応すると考えた場合、低い方のG値は、各々、「0.41±0.07」および「0.52±0.12」となる(下記表3参照)。
【0258】
これらの値は、参照ヌクレオチドにおけるdTMPの「相対的なG値±FWHM」(0.45±0.12)、および、参照ヌクレオチドにおけるdCMPの「相対的なG値±FWHM」(0.69±0.25)の範囲内に入るので、0.41および0.52という得られた値は、各々、dTMPおよびdCMPに対応する。
【0259】
以上の結果から、DNAオリゴマーを構成するヌクレオチドの種類を、参照ヌクレオチドの「相対的なG値±FWHM」に基づいて決定し得ることが明らかになった。
【0260】
【表3】
【0261】
<5.パルス持続時間の解析>
dGMPおよびDNAオリゴマー(具体的には、GGG)についてトンネル電流のパルス(約1000パルス)についてtd(パルス持続時間)を測定するとともに、当該tdの分布を観察した。
【0262】
図3(a)に、時間の経過と共に出現する、DNAオリゴマーのトンネル電流のパルスを示す。
図3(a)に示すように、DNAオリゴマーは、dGMPと同様に、略同じレベルの相対的なG値を有するパルス群を出願させた。
【0263】
図2(e)に、DNAオリゴマーにおけるtdの分布と、dGMPのtdの分布とを示す。
図2(e)から明らかなように、DNAオリゴマーのtdのピーク値は、略0.8msであり、dGMPのtdのピーク値も、略0.8msであった。
【0264】
このことから、略0.8〜略1ms以上のtdを有するトンネル電流のパルスが、実際のヌクレオチドに対応すると考えられる。つまり、当該値よりも短いtdを有するトンネル電流のパルスについては、ノイズ等と考えることができる。
【0265】
例えば、GまたはTに対応するトンネル電流のパルスは、1つの台地状のピークを有するパルスとなり、GTまたはTGに対応するトンネル電流のパルスは、2つの台地状のピークを有するパルスとなり、TGTまたはGTGに対応するトンネル電流のパルスは、3つの台地状のピークを有するパルスとなる。つまり、3つの核酸モノマーからなるDNAオリゴマーの電子シグナルを特定しようとすれば、tdの合計が1ms以上、かつ、3つの台地状のピークを有するパルス群であって、各パルスのtdが連続しているものを特定すればよい。
【0266】
図3(d)〜
図3(f)の各々に、自動的に電気シグナルを抽出した結果を示す。これらの図では、3つの台地状のピークを有する明確なパルスが観察されている。
【0267】
例えば、DNAオリゴマーのTGTに関するデータを示す
図3(g)では、1番目の位置と3番目の位置とに、Tを示す低い台地状のピークを有するとともに、2番目の位置に、Gを示す高い台地状のピークを有するパルスが検出されている。
【0268】
また、DNAオリゴマーのGTGに関するデータを示す
図3(h)では、1番目の位置と3番目の位置とに、Gを示す高い台地状のピークを有するとともに、2番目の位置にTを示す低い台地状のピークを有するパルスが検出されている。
【0269】
つまり、これらのデータは、本発明が、DNAオリゴマーの塩基配列を決定できたことを示している。
【0270】
図3(g)および
図3(h)に示すように、当該実施例では、「GTG」および「TGT」のみではなく、「G」、「T」、「TG」、「GT」、「GTGTT」および「TGTGT」などの配列も特定されている。これは、DNAオリゴマーが、ブラウン運動を行いながら、確率論的にナノギャップ電極の間に捕捉されているためであると考えられる。例えば、ナノギャップ電極の間において、ブラウン運動による当該TGTオリゴマーの運動の方向が、TGTオリゴマーの3番目のTの位置で反転した場合、「TGTGT」に対応するトンネル電流のパルスが検出されることになる。
【0271】
<6.ポリヌクレオチドの塩基配列の決定>
上述した<5.パルス持続時間の解析>の試験において、DNAオリゴマーの代わりに「5’−UGAGGUA−3’」(以下、miRNAとも呼ぶ)を用いて、同様の試験を行った。
【0272】
まず初めに、ランダムに断片化された配列情報を得るために、I−t曲線を作成した。
【0273】
図4(a)に示すように、I−t曲線から作成したコンダクタンスヒストグラムは、I=70pS、I=50pS、I=33pSに3つのピークを示した。
【0274】
これら3つのピークの相対的なG値は、各々、1、0.71および0.47であって、これらの値は、各々、rGMP、rAMPおよびrUMPに対応する(表4参照)
【0275】
【表4】
【0276】
上記結果は、miRNA中に3種類の核酸モノマーが含まれていることを示している。
【0277】
上述した<5.パルス持続時間の解析>と同様に、miRNAの部分塩基配列を決定した。
【0278】
図4(b)〜
図4(d)に、検出された典型的なシグナルを示す。
図4(b)〜
図4(d)に示すように、「A」、「G」、「U」、「AU」、「UGAGG」および「UGAGGUA」などの部分塩基配列を決定することができた。
【0279】
同様にして、133個のシグナルを解析したところ、19個のシグナルが「A」に対応し、15個のシグナルが「G」に対応し、44個のシグナルが「U」に対応し、5個のシグナルが「UA」に対応し、10個のシグナルが「GA」に対応し、5個のシグナルが「UG」に対応し、35個のシグナルが
図4(e)に示す配列に対応した。
【0280】
図4(e)に示すように、「GAGAGGUA」、「UGAGGAGA」および「UGAGGUAUA」という配列情報も得られた。これらは、ブラウン運動の結果生じた配列情報であると考えられる。
【0281】
また、
図4(e)に示すように、miRNA中の「AGGUA」および「GAGGUA」が、各々、誤って「AGAUA」および「GAGGUG」として特定されている場合があった。これらは、rGMPの相対的なG値が、rAMPの相対的なG値とオーバーラップしているために生じたと考えられる。
【0282】
次いで、
図4(e)に示すように、35個の得られた部分塩基配列の重複部分を繋ぎ合わせることによって、miRNAの全塩基配列を決定した。具体的には、頻度高く出現する部分塩基配列を抽出し、当該部分塩基配列を繋ぎ合わせることによって、miRNAの全塩基配列を決定した。
【0283】
具体的に、
図4(e)に示すように、35個の部分塩基配列のうちの13個の部分塩基配列中(13/35=37%)で「UGA」に対応する部分塩基配列が見出され、35個の部分塩基配列のうちの17個の部分塩基配列中(17/35=49%)で「GAGG」に対応する部分塩基配列が見出され、35個の部分塩基配列のうちの10個の部分塩基配列中(10/35=29%)で「AGGUA」に対応する部分塩基配列が見出され、35個の部分塩基配列のうちの13個の部分塩基配列中(13/35=37%)で「AGGU」に対応する部分塩基配列が見出された。
【0284】
そして、「UGA」、「GAGG」、「AGGUA」および「AGGU」を、重複した塩基配列の箇所にて繋ぎ合わせることによって「UGAGGUA」という全塩基配列を決定することに成功した。
【0285】
本発明は、以上説示した各構成に限定されるものではなく、特許請求の範囲に示した範囲で種々の変更が可能であり、異なる実施形態や実施例にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態や実施例についても本発明の技術的範囲に含まれる。