特許7512218 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ オックスフォード　ナノポール　テクノロジーズ　リミテッドの特許一覧

特許7512218ポリマー単位を含むポリマーの解析

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-06-28

(45)【発行日】2024-07-08

(54)【発明の名称】ポリマー単位を含むポリマーの解析

(51)【国際特許分類】

C12Q 1/6869 20180101AFI20240701BHJP

C12Q 1/34 20060101ALI20240701BHJP

G01N 27/02 20060101ALI20240701BHJP

C12M 1/00 20060101ALI20240701BHJP

【ＦＩ】

C12Q1/6869 Z ZNA

C12Q1/34

G01N27/02 D

C12M1/00 A

【請求項の数】 30

(21)【出願番号】P 2021014055

(22)【出願日】2021-02-01

(62)【分割の表示】P 2018213937の分割

【原出願日】2012-09-21

(65)【公開番号】P2021072834

(43)【公開日】2021-05-13

【審査請求日】2021-03-03

(31)【優先権主張番号】61/538,721

(32)【優先日】2011-09-23

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】61/617,880

(32)【優先日】2012-03-30

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】511252899

【氏名又は名称】オックスフォードナノポールテクノロジーズピーエルシー

(74)【代理人】

【識別番号】100108453

【弁理士】

【氏名又は名称】村山靖彦

(74)【代理人】

【識別番号】100110364

【弁理士】

【氏名又は名称】実広信哉

(74)【代理人】

【識別番号】100133400

【弁理士】

【氏名又は名称】阿部達彦

(72)【発明者】

【氏名】レイド，スチュアートウィリアム

(72)【発明者】

【氏名】ハーパー，ギャヴィン

(72)【発明者】

【氏名】ブラウン，クライヴギャヴィン

(72)【発明者】

【氏名】クラーク，ジェームスアンソニー

(72)【発明者】

【氏名】ヘロン，アンドリュージョン

【審査官】福間信子

(56)【参考文献】

【文献】特開２００５－２５７６８７（ＪＰ，Ａ）

【文献】特開２００６－１１９１４０（ＪＰ，Ａ）

【文献】特表２０１０－５２４４３６（ＪＰ，Ａ）

【文献】John J. Kasianowicz，Nanoscopic Porous Sensors，Annual Review of Analytical Chemistry，2008年，Vol.1, No.1，Pages 737-766

【文献】J. AM. CHEM. SOC.，2010年，vol.132, no.50，p.17961-17972

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｃ１２Ｑ

ＣＡｐｌｕｓ／ＭＥＤＬＩＮＥ／ＥＭＢＡＳＥ／ＢＩＯＳＩＳ（ＳＴＮ）

(57)【特許請求の範囲】

【請求項1】

ポリマー単位を含むポリマーを解析する方法であって、
ナノポアを横断して電圧が印加されている間に、
分子歯止めにより制御され、連続するｋマーがナノポアで登録される一方向のみに動く様式で実施される、ナノポア中を通るポリマーの移行中に、
ｋが正整数である前記ポリマーのｋ個のポリマー単位であるナノポア中のｋマーの正体に依拠しているナノポア中を通るイオン電流の流れの測定を行い、
ナノポア中を通るポリマーの移行中に、前記測定が個々のｋマーに関して、ナノポアを横断して印加される前記電圧の異なるレベルで行われる別々の測定を含むステップ、および
前記電圧の前記異なるレベルで測定を解析してポリマーの少なくとも一部の正体を決定するステップ
を含む方法。

【請求項2】

測定を行う前記ステップが、
異なる移行において電圧がナノポアを横断して異なるレベルで印加されている間に、ナノポア中を通る前記ポリマーの複数の移行を実施するステップ、
前記異なる移行中に、ナノポアを横断する前記電圧の前記異なるレベルでの前記ｋマーの測定を行うステップ
を含む、請求項１に記載の方法。

【請求項3】

前記複数の移行がナノポア中を通る第１の方向への移行およびナノポア中を通る前記第１の方向とは反対の方向への移行を含む、請求項２に記載の方法。

【請求項4】

測定を行う前記ステップが、
電圧がナノポアを横断して印加されている間に、ナノポア中を通る前記ポリマーの移行を実施するステップ、
ナノポア中を通るポリマーの前記移行中に、前記測定が前記個々のｋマーに依拠している状態の持続期間よりも短い繰返し周期を有する周期で前記電圧の前記異なるレベルを印加するステップ、および前記周期において前記電圧の前記異なるレベルでの前記個々のｋマーに関して前記別々の測定を行うステップ
を含む、請求項１に記載の方法。

【請求項5】

ポリマー単位を含むポリマーの測定を行う方法であって、
電圧がナノポアを横断して印加されている間に、
分子歯止めにより制御され、連続するｋマーがナノポアで登録される一方向のみに動く様式で実施される、ナノポア中を通る前記ポリマーの移行を実施するステップ、
ナノポア中を通るポリマーの前記移行中に、前記電圧の異なるレベルを周期的に印加するステップ、および
ｋが正整数である前記ポリマーのｋ個のポリマー単位であるナノポア中のｋマーの正体に依拠しているナノポア中を通るイオン電流の流れの測定であり、前記測定が個々のｋマーに依拠している状態よりも短い繰返し周期を有する前記周期で前記電圧の前記異なるレベルでの前記個々のｋマーに関する別々の測定を含む測定を行うステップ
を含む方法。

【請求項6】

繰返し周期が最長で３秒である、請求項４または５に記載の方法。

【請求項7】

繰返し周期が少なくとも０．５ｍｓである、請求項４から６のいずれか一項に記載の方法。

【請求項8】

前記繰返し周期が、状態の持続時間より短く、状態の持続時間の平均で６０％、７０％、８０％、９０％、９５％、または９９％の少なくとも１つよりも短い、請求項４から７のいずれか一項に記載の方法。

【請求項9】

１つよりも多い電圧周期が、状態の持続時間に適用され、適用される電圧周期の数が２から１０までである、請求項４から８のいずれか一項に記載の方法。

【請求項10】

前記電圧の異なるレベルがそれぞれ、前記周期の部分的期間連続して印加される、請求項４から９のいずれか一項に記載の方法。

【請求項11】

前記周期における前記電圧の前記異なるレベル間の遷移が、電圧変化により引き起こされる測定の容量性遷移を減少するように形作られる、請求項１０に記載の方法。

【請求項12】

前記電圧周期は、非対称的、対称的、規則的または不規則的な波形のいずれか１つを有し、および／または、
電圧の異なるレベルは連続的に適用され、そして前記波は三角波またはのこぎり波である、請求項９から１１のいずれか一項に記載の方法。

【請求項13】

測定を解析してポリマーの正体を推定するステップが、測定を解析してポリマー中のポリマー単位の配列を推定することを含む、請求項１から４のいずれか一項に記載の方法。

【請求項14】

測定を解析してポリマー中のポリマー単位の配列を推定するステップが、
可能なｋマーのセットについて、
起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷移重み付け、および
そのｋマーについての所与の測定値を観測する可能性を表すそれぞれのｋマーに関する放出重み付け
を含むモデルを提供するステップ、ならびに
前記モデルを参照し、ナノポアを横断する電圧の異なるレベルの印加下で行われる測定を扱う解析技法を使用して測定を複数の次元での測定として解析し、測定のシリーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度に基づいて、ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するステップ
を含む、請求項１３に記載の方法。

【請求項15】

測定を解析してポリマーの正体を決定するステップが、前記異なる電圧レベルで行われる別々の測定を比較して、前記測定が前記個々のｋマーに依拠している状態間の遷移を決定することをさらに含む、請求項１から４、１３または１４のいずれか一項に記載の方法。

【請求項16】

電圧の前記異なるレベル間の違いが１０ｍＶから１．５Ｖの範囲である、請求項１から１５のいずれか一項に記載の方法。

【請求項17】

前記異なるレベルが２つの異なるレベルからなる、請求項１から１６のいずれか一項に記載の方法。

【請求項18】

電圧の異なるレベルが同じ極性である、請求項１から１７のいずれか一項に記載の方法。

【請求項19】

ナノポア中を通るイオン電流の流れの前記測定が、ナノポア中を通るＤＣイオン電流の流れの測定である、請求項１～１８のいずれか一項に記載の方法。

【請求項20】

前記電圧の前記異なるレベルのそれぞれ１つでグループの複数の測定を行うステップ、および
前記異なるレベルのそれぞれ１つでの複数の測定のそれぞれのグループから１つまたは複数のサマリー測定を導き出して、個々のｋマーに関して前記別々の測定を構成するステップ
を含む、請求項１から１９のいずれか一項に記載の方法。

【請求項21】

前記電圧の異なるレベルがそれぞれ一定期間連続して印加され、
それぞれ各自の期間中、それぞれの期間中に印加される前記電圧の前記異なるレベルのうちの１つでグループのうちの１つの複数の測定を行う、
請求項２０に記載の方法。

【請求項22】

ポリマーがポリヌクレオチドであり、ポリマー単位がヌクレオチドである、請求項１から２１のいずれか一項に記載の方法。

【請求項23】

ナノポアが生物学的ポアである、請求項１から２２のいずれか一項に記載の方法。

【請求項24】

分子歯止めが酵素である、請求項１～２３のいずれか一項に記載の方法。

【請求項25】

前記ポリマーがポリヌクレオチドおよび、ポリメラーゼ、ヘリカーゼ、エキソヌクレアーゼ、一本鎖もしくは二本鎖結合タンパク質またはトポイソメラーゼを含む酵素である、
請求項２４に記載の方法。

【請求項26】

ポリマー単位を含むポリマーを解析するための装置であって、
ポリマーが中を通って移行しうるナノポア、
ナノポアを通過するポリマーの移行を、連続するｋマーがナノポアで登録される一方向のみに動く様式で制御するように配置された、分子歯止め、
ナノポア中を通るポリマーの移行中にナノポアを横断して電圧を印加するように配置された制御回路、および
ｋが正整数であるポリマーのｋ個のポリマー単位であるｋマーの正体に依拠しているナノポア中を通るイオン電流の流れの測定をナノポア中で行うように配置された測定回路であって、
前記制御回路がナノポアを横断して電圧の異なるレベルを印加するように配置され、前記測定回路がナノポアを横断して印加される前記電圧の異なるレベルで、個々のｋマーに関して別々の測定を行うように配置されている、測定回路、および
前記電圧の前記異なるレベルで測定を解析してポリマーの少なくとも一部の正体を決定するように配置されている解析ユニット
を備える装置。

【請求項27】

制御回路が、ナノポア中を通る前記ポリマーの異なる移行中にナノポアを横断して電圧の異なるレベルを印加するように配置されており、測定回路が前記電圧の異なるレベルでの前記異なる移行中に、個々のｋマーに関して別々の測定を行うように配置されている、請求項２６に記載の装置。

【請求項28】

制御回路が、ナノポア中を通るポリマーの前記移行中に、
前記測定が前記個々のｋマーに依拠している状態の持続時間よりも短い繰返し周期を有する周期で前記電圧の前記異なるレベルを印加するように配置されており、測定回路が前記周期において前記電圧の前記異なるレベルで、個々のｋマーに関して別々の測定を行うように配置されている、請求項２６に記載の装置。

【請求項29】

ポリマー単位を含むポリマーを測定するための装置であって、
ポリマーが中を通って移行しうるナノポア、
ナノポアを通過するポリマーの移行を、連続するｋマーがナノポアで登録される一方向のみに動く様式で制御するように配置された、分子歯止め、
ナノポア中を通るポリマーの移行中に、前記測定が個々のｋマーに依拠している状態の持続時間よりも短い繰返し周期を有する周期で電圧の異なるレベルを印加するように配置されている制御回路、および
ナノポアを横断して印加される前記電圧の異なるレベルで、個々のｋマーに関して別々のナノポア中を通るイオン電流の流れの測定を行うように配置されている測定回路
を備える装置。

【請求項30】

前記電圧の異なるレベルで測定を解析して、ポリマーの少なくとも一部の正体を決定するように配置されている解析ユニットをさらに備える、請求項２９に記載の装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、一般的には、ポリマー単位を含むポリマーを解析する、例えば、限定される
ものではないが、ポリヌクレオチドをポリマーに関係する測定を行うことにより解析する
分野に関する。本発明の第一の態様は、具体的にはポリマー中のポリマー単位の配列を推
定することに関する。本発明の第二および第三の態様は、ポリマーの解析のためにポリマ
ーの移行中にナノポア中を流れるイオン電流の測定に関する。

【背景技術】

【0002】

ポリマーを解析しおよび／またはポリマー単位の配列を決定するためのポリマーの測定
を提供する多くの種類の測定システムが存在する。

【0003】

例えば、限定されるものではないが、１つの種類の測定システムは、ポリマーを移行さ
せる際に通るナノポアを利用する。前記システムのある特性は、ナノポア中のポリマー単
位に依拠しており、その特性の測定が行われる。例えば、測定システムは、絶縁膜にナノ
ポアを置き分析物分子の存在下でナノポアを通る電圧駆動イオン輸送を測定することによ
り作製しうる。ナノポアの性質に応じて分析物の正体を、その特徴的なイオン電流サイン
、特に、電流ブロックの持続時間および程度ならびに電流レベルの分散を通じて明らかに
しうる。ナノポアを使用するそのような種類の測定システムは、特に、ＤＮＡまたはＲＮ
Ａなどのポリヌクレオチドの配列を決定する分野ではかなり有望であり、つい最近の開発
の主題であった。

【0004】

幅広い適用にわたり迅速で安価な核酸（例えば、ＤＮＡまたはＲＮＡ）配列決定技術に
対する必要性が現在存在する。既存の技術は、主に増幅技法を利用して大量の核酸を産生
し、シグナル検出には高品質の専門の蛍光化学物質を必要とするために、時間がかかり高
価である。ナノポア検知には、必要なヌクレオチドおよび試薬の量を減少させることによ
り迅速で安価な核酸配列決定を提供できる潜在性がある。

【発明の概要】

【発明が解決しようとする課題】

【0005】

本発明は、それぞれの測定の値が、ｋが正整数であるｋ個のポリマー単位（すなわち、
ｋマー）のグループに依拠している状況に関する。

【0006】

さらに、それぞれの測定の値が、ｋが複数の整数であるｋマーに依拠していることは、
大多数の現在公知の生物学的ナノポアを含む多くの種類の測定システムに典型的である。
これは、１つよりも多いポリマー単位が、観察されるシグナルに寄与しており、概念的に
は、測定されているポリマー単位よりも大きな「鈍いリーダーヘッド」を有する測定シス
テムと見なしてもよいからである。そのような状況では、分解される異なるｋマーの数が
ｋの冪乗まで増加する。例えば、ｎ個の可能なポリマー単位が存在する場合では、分解さ
れる異なるｋマーの数はｎ^ｋである。異なるｋマーについての測定間は明確に分離してい
ることが望ましいが、これらの測定の一部が重複していることはよく起こる。特に大きな
数のポリマー単位がｋマー中にある、すなわち、大きな値のｋでは、異なるｋマーにより
生み出される測定を分解するのは困難になり、ポリマーについての情報、例えば、ポリマ
ー単位の根底にある配列の推定値を導き出すのに障害となる。

【0007】

したがって、開発研究の多くは、測定の分解を改善する測定システムの設計に向けられ
てきた。根底にある物理的または生物学的系の固有の変動からばらついて生じることがあ
る測定の変動および／または測定されている特性が小規模である結果避けられない測定ノ
イズによって、これは実際の測定システムでは困難である。

【0008】

多くの研究が、単一のポリマー単位に依拠している分解可能な測定を提供する測定シス
テムの設計を目指してきた。しかし、これは実際には困難であった。

【0009】

他の研究は、ｋが複数の整数であるｋマーに依拠している測定を受け入れたが、異なる
ｋマーからの測定が互いに分解可能である測定システムの設計を目指してきた。しかし、
現実の限界はこれが極めて困難であることを再び意味している。いくつかの異なるｋマー
が発するシグナルの分布は重複することが多いことがある。

【0010】

原理的には、それぞれが同じポリマー単位に部分的に頼ってポリマー単位のレベルで分
解される単一の値を得る、ｋが複数の整数であるｋ個の測定からの情報を組み合わせるこ
とは可能であるだろう。しかし、これは実際には困難である。第一に、これは、ｋ個の測
定のセットを変換する適切な変換を同定する可能性にかかっている。しかし、多くの測定
システムでは、根底にある物理的または生物学的系における相互作用の複雑さのために、
そのような変換は存在しないまたは同定するのが非現実的であるのいずれかである。第二
に、所与の測定システムについてそのような変換が原理的に存在するとしても、測定の変
動のために変換を同定するのは困難であるおよび／または変換はそれでも互いに分解する
ことができない値を与える可能性がある。第三に、そのような技法では、例えば、測定を
行うことができない測定システムによって、またはそれに続くデータ処理のエラーによっ
て、実際の測定システムで時折ありうるように、見逃された測定、すなわち、所与のｋマ
ーに依拠している測定がポリマー単位の配列のなかで失われる場合を考慮に入れることは
困難であるまたは不可能である。

【課題を解決するための手段】

【0011】

本発明の第一の態様は、ｋマーに依拠しているような測定からポリマー中のポリマー単
位の配列を推定する正確度を改善する技法を提供することに関する。

【0012】

本発明の第一の態様によれば、ポリマーに関係する測定の少なくとも１つのシリーズか
らポリマー中のポリマー単位の配列を推定する方法であって、それぞれの測定の値が、ｋ
が正整数であるｋ個のポリマー単位のグループであるｋマーに依拠しており、
可能なｋマーのセットについて、
起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷移重み付け、および
そのｋマーについて所与の測定値を観測する可能性を表すそれぞれのｋマーに関する放出
重み付け
を含むモデルを提供するステップ、ならびに
前記モデルを参照する解析技法を使用して測定のシリーズを解析し、測定のシリーズがポ
リマー単位の配列により生み出されるというモデルにより予測される尤度に基づいて、ポ
リマー中のポリマー単位の少なくとも１つの推定された配列を推定するステップ
を含む方法が提供される。

【0013】

さらに本発明の第一の態様によれば、類似する方法を実行する解析装置が提供される。

【0014】

したがって、本発明の第一の態様は、測定を生み出す測定システムのモデルを使用する
。測定のいかなるシリーズを考慮しても、モデルはその測定を生み出したｋマーの異なる
配列の可能性を表す。本発明の第一の態様は、それぞれの測定の値が、ｋが複数の整数で
あるｋマーに依拠している状況に特に適している。

【0015】

前記モデルは可能なｋマーを考慮する。例えば、それぞれのポリマー単位が４個のポリ
マー単位（またはさらに一般的にはｎ個のポリマー単位）のうちの１つでありうるポリマ
ーでは、どれか特定のｋマーが物理的に存在しないのでなければ、４^ｋ個の可能なｋマー
（またはさらに一般的にはｎ^ｋ個の可能なｋマー）が存在する。存在しうるすべてのｋマ
ーでは、放出重み付けは所与の測定値を観測する可能性を考慮に入れる。それぞれのｋマ
ーに関する放出重み付けは、そのｋマーについての所与の測定値を観測する可能性を表す
。

【0016】

遷移重み付けは、起点ｋマーから目的地ｋマーまでの遷移の可能性を表し、したがって
、測定が依拠しているｋマーの、異なるｋマー間を遷移する可能性を考慮に入れる。した
がって、遷移重み付けは、多少なりとも可能性がある遷移を考慮しうる。例として、ｋが
複数の整数である場合、所与の起点ｋマーでは、これは、起点ｋマーとは異なる配列を有
し最初の（ｋ－１）個のポリマー単位が起点ｋマーの最後の（ｋ－１）個のポリマー単位
ではない目的地ｋマーまでの遷移である好ましくない遷移よりも、最初の（ｋ－１）個の
ポリマー単位が起点ｋマーの最後の（ｋ－１）個のポリマー単位である配列を有する目的
地ｋマーまでの遷移である好ましい遷移のより大きな可能性を表しうる。例えば、ポリマ
ー単位が天然に存在するＤＮＡ塩基である３マーでは、状態ＣＧＴは、ＧＴＣ、ＧＴＧ、
ＧＴＴおよびＧＴＡへの好ましい遷移を有する。限定のない例として、モデルは、遷移重
み付けおよび放出重み付けが確率である隠れマルコフモデルであってもよい。

【0017】

これにより、測定のシリーズは、モデルを参照する解析技法を使用して解析することが
可能になる。ポリマー中のポリマー単位の少なくとも１つの推定された配列が、測定のシ
リーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度に基
づいて推定される。例えば、限定されるものではないが、解析技法は確率的技法であって
よい。

【0018】

特に、個々のｋマーからの測定は互いに分解可能である必要はなく、同じポリマー単位
に依拠しているｋ個の測定のグループからその変換に関しての値までの変換が存在する必
要はない、すなわち、観測される状態のセットはもっと少数のパラメータの関数である必
要はない（がこれは排除されない）。代わりに、モデルの使用は、測定のシリーズがポリ
マー単位の配列により生み出されるというモデルにより予測される尤度を検討する際に複
数の測定を考慮に入れることにより正確な推定を提供する。概念的には、遷移重み付けは
、一部はそのポリマー単位に、および実際、配列中のより大きな距離からの測定にも依拠
している少なくともｋ個の測定を、所与のポリマー単位を推定する際に、モデルが考慮に
入れることを可能にすると見なしてもよい。モデルは、所与のポリマー単位を推定する際
に多数の測定を効果的に考慮に入れて、より正確でありうる結果を出すことができる。

【0019】

同様に、そのようなモデルを使用すれば、解析技法は所与のｋマーからの失われた測定
を考慮に入れるおよび／または所与のｋマーにより生じる測定の外れ値を考慮に入れるこ
とが可能になる。これは、遷移重み付けおよび／または放出重み付けにおいて説明しうる
。例えば、遷移重み付けは好ましくない遷移の少なくとも一部の非ゼロの可能性を表しう
るおよび／または放出重み付けはあらゆる可能な測定を観測する非ゼロの可能性を表しう
る。

【0020】

本発明の第二および第三の態様は、ポリマーがナノポア中を通って移行している間にナ
ノポア中を流れるイオン電流の測定を使用してポリマーの解析を支援する技法の提供に関
する。

【0021】

本発明の第二の態様によれば、ポリマー単位を含むポリマーを解析する方法であって、
ナノポアを横断して電圧が印加されている間にナノポア中を通るポリマーの移行中に、ｋ
が正整数である前記ポリマーのｋ個のポリマー単位であるナノポア中のｋマーの正体に依
拠している測定を行い、前記測定が個々のｋマーに関して、ナノポアを横断して印加され
る前記電圧の異なるレベルで行われる別々の測定を含むステップ、および
前記電圧の前記異なるレベルでの測定を解析してポリマーの少なくとも一部の正体を決定
するステップ
を含む方法が提供される。

【0022】

前記方法は、ｋが正整数であるポリマーのｋ個のポリマー単位であるナノポア中のｋマ
ーの正体に依拠している測定を行うことを伴う。特に、測定は、個々のｋマーに関して、
ナノポアを横断して印加された前記電圧の異なるレベルで行われる別々の測定を含む。本
発明者らは、ナノポアを横断して印加された前記電圧の異なるレベルでのそのような測定
は単に重複しているというよりもむしろ追加の情報を提供すると認識し実証してきた。例
えば、異なる電圧での測定は、異なる状態の分解を可能にする。例えば、所与の電圧で分
解することができないいくつかのｋマーは別の電圧では分解することができる。

【0023】

本発明の第三の態様は、ナノポアを横断する電圧の異なるレベルの印加下で行われる測
定を行う方法であって、場合により本発明の第二の態様で用いてもよい方法を提供する。
特に、本発明の第三の態様によれば、ポリマー単位を含むポリマーの測定を行う方法であ
って、
電圧がナノポアを横断して印加されている間に、ナノポア中を通る前記ポリマーの移行を
実施するステップ、
ナノポア中を通るポリマーの前記移行中に、前記電圧の異なるレベルを周期的に印加する
ステップ、および
ｋが正整数である前記ポリマーのｋ個のポリマー単位であるナノポア中のｋマーの正体に
依拠している測定であり、前記測定が個々のｋマーに依拠している状態よりも短い繰返し
周期を有する前記周期での前記電圧の前記異なるレベルでの前記個々のｋマーに関する別
々の測定を含む測定を行うステップ
を含む方法が提供される。

【0024】

したがって、本発明の第三の態様は、本発明の第二の態様と同じ利点であって、特に測
定が単に重複しているというよりもむしろ追加の情報を提供するという利点を与える。異
なる電圧での測定は、それに続く測定の解析において異なる状態の分解を可能にする。例
えば、所与の電圧で分解することができないいくつかの状態は別の電圧では分解すること
ができる。

【0025】

これは、異なる電圧での測定がナノポア中を通るポリマーの１回の移行中に得られる技
術革新に基づいている。これは、繰返し周期が測定される状態の持続時間よりも短くなる
ように選択される周期で前記電圧のレベルを変化させることにより達成される。

【0026】

しかし、本発明の第二の態様内でこの方法を使用することは不可欠ではない。代案とし
て、電圧の異なる大きさでのイオン電流測定は、同方向への移行でもよいし、または反対
方向への移行を含んでいてもよいナノポア中を通るポリマーの異なる移行中に行うことが
できる。

【0027】

したがって、本発明の第二の態様および第三の態様の方法は、ポリマーについての情報
を導き出す測定のその後の解析を改善する追加の情報を提供することができる。導き出し
うる情報の種類のいくつかの例は以下の通りである。

【0028】

解析は、状態間の遷移の時機を導き出すことでありうる。このケースでは、異なる電位
でのそれぞれの状態の測定により提供される追加の情報は、正確度を改善する。例えば、
２つの状態間の遷移を１つの電圧では分解することができないケースでは、遷移は別の電
圧でのイオン電流測定のレベルの変化により同定しうる。これが、１つの電圧だけでは明
らかな作動にならないと考えられる遷移を同定すること、または遷移が実際には起こらな
かったことをより高い信頼度で決定することを潜在的に可能にする。この同定は、測定の
それに続く解析において使用しうる。

【0029】

一般に、異なる電圧レベルで測定を実行することは、１つの電圧レベルで得られるより
も多くの情報を提供する。例えば、ナノポア中を通るイオン流の測定において、測定から
得られる情報には、特定の状態についての電流レベルおよびシグナル分散（ノイズ）が含
まれる。例えば、ナノポア中を通るＤＮＡの移行では、ヌクレオチド塩基Ｇを含むｋマー
はシグナル分散が増大した状態を生じる傾向がある。例えば、類似の電流レベルを有する
それぞれの状態によって、またはそれぞれの状態のうちの１つもしくは両方が高いシグナ
ル分散を有する場合には、状態の遷移が起こったかどうかを確定するのは困難であること
もある。特定の状態についての電流レベルおよびシグナル分散は異なる電圧レベルでは異
なることがあり、したがって、異なる電圧レベルでの測定は、高分散状態の決定を可能に
するまたは状態を決定する信頼度のレベルを増加しうる。その結果、別の電圧レベルと比
べて１つの電圧レベルでの状態間の遷移を決定する方が容易でありうる。

【0030】

解析は、ポリマーの正体を推定するまたはポリマー中のポリマー単位の配列を推定する
ことでありうる。このケースでは、異なる電位でのそれぞれの状態の測定により与えられ
る追加の情報は推定の正確度を改善する。

【0031】

ポリマー単位の配列を推定するケースでは、解析は本発明の第一の態様に従った方法を
使用しうる。したがって、本発明の第一の態様の特長は、本発明の第二の態様および／ま
たは第三の態様の特長と、いかなる組合せでも組み合わせることができる。

【0032】

さらに、本発明の第二および第三の態様によれば、類似の方法を実行する解析装置が提
供される。

【0033】

さらに十分な理解を可能にするため、本発明の実施形態は添付図面を参照して非限定的
例としてここで説明されることになる。

【図面の簡単な説明】

【0034】

【図1】は、ナノポアを含む測定システムの概略図である。

【図2】は、測定システムにより経時的に測定された事象のシグナルのプロットである。

【図3】は、ナノポアを含む測定システムにおける２つの異なるポリヌクレオチドの測定の度数分布のグラフである。

【図4】は、実験的に導き出される電流測定のセットに適用される一次線形モデルから予測される値に対する６４の３マー係数のプロットである。

【図5】は、実験的に導き出される電流測定値のセットに適用される一次線形モデルから予測される値に対する１０２４の５マー係数のプロットである。

【図6】は、ポリマーの測定を含む入力シグナルを解析する方法のフローチャートである。

【図7】は、図６の状態検出ステップのフローチャートである。

【図8】は、図６の解析ステップのフローチャートである。

【図9】は、状態検出ステップに供される入力シグナルのプロットである。

【図10】は、測定の得られたシリーズのプロットである。

【図11】は、遷移マトリックスの図形表示である。

【図12】は、シミュレーションされた例におけるｋマー状態に関する予測される測定のグラフである。

【図13】は、図１２において図示される予測される測定からシミュレーションされた入力シグナルを示している。

【図14】は、図１３の入力シグナルから導き出される測定のシリーズを示している。

【図15】は、遷移重み付けの遷移マトリックスを示している。

【図16】は、遷移重み付けの遷移マトリックスを示している。

【図17】は、ガウスである可能な分布を有する放出重み付けのグラフである。

【図18】は、三角である可能な分布を有する放出重み付けのグラフである。

【図19】は、四角である可能な分布を有する放出重み付けのグラフである。

【図20】は、図１２に示される１セットのシミュレーションされた測定と予測される測定間の電流スペースアライメントのグラフである。

【図21】は、実際のｋマーと図２０のシミュレーションされた測定から推定されるｋマー間のｋマースペースアライメントのグラフである。

【図22】は、シミュレーションされた測定の追加のセットと図１２に示される予測される測定間の電流スペースアライメントのグラフである。

【図23】は、図１５の遷移マトリックスを用いた、実際のｋマーと図２２のシミュレーションされた測定から推定されるｋマー間のｋマースペースアライメントのグラフである。

【図24】は、図１６の遷移マトリックスを用いた、実際のｋマーと図２２のシミュレーションされた測定から推定されるｋマー間のｋマースペースアライメントのグラフである。

【図25】は、分布が図１２の予測される測定を中心とする小非ゼロバックグランドのある四角分布を有する放出重み付けのグラフである。

【図26】は、図１５の遷移マトリックスおよび図２５の放出重み付けを用いた、実際のｋマーと図２０のシミュレーションされた測定から推定されるｋマー間のｋマースペースアライメントのグラフである。

【図27】は、分布が図１２の予測される測定を中心とするゼロバックグランドのある四角分布を有する放出重み付けのグラフである。

【図28】は、図１５の遷移マトリックスおよび図２７の放出重み付けを用いた、実際のｋマーと図２０のシミュレーションされた測定から推定されるｋマー間のｋマースペースアライメントのグラフである。

【図29】は、ストレプトアビジンを使用するＭＳ－（Ｂ２）８ナノポア中に保持されるＤＮＡ鎖から得られる電流測定の散布図である。

【図30】は、実例トレーニングプロセスについての遷移マトリックスである。

【図31】は、図３０の遷移マトリックスの拡大部分である。

【図32】は、静的トレーニングプロセスから導き出される６４のｋマーのモデルについての放出重み付けのグラフである。

【図33】は、図３２のモデルのおよそ４００の状態のモデルへの変換についての放出重み付けのグラフである。

【図34】は、トレーニングプロセスのフローチャートである。

【図35】は、図３４のトレーニングプロセスにより決定される放出重み付けのグラフである。

【図36】は、モデルから予測される測定を用いていくつかの実験にわたって集められた電流測定のグラフである。

【図37】は、実際のｋマーと推定されたｋマー間のｋマースペースアライメントのグラフである。

【図38】は、実際の配列と整列された推定されたｋマーの推定された配列を示している。

【図39】は、ポリマーのセンス領域およびアンチセンス領域の別々の推定された配列を、２つのそれぞれの次元で配置されたセンス領域およびアンチセンス領域からの測定を処理することにより導かれる推定された配列と一緒に示している。

【図40】は、最初の例における３つの異なる電圧でのナノポア中のＤＮＡ鎖のセットについてのイオン電流測定のヒストグラムのセットである。

【図41】は、第二の例におけるナノポア中の一本鎖についての共通の時間期間にわたり付加された電位および得られたイオン電流の対になったグラフである。

【図42】は、第二の例において電圧レベル＋６０ｍＶで水平方向に表示されたＤＮＡ鎖ごとの測定された電流の散布図である。

【図43】は、第二の例において電圧レベル＋１００ｍＶで水平方向に表示されたＤＮＡ鎖ごとの測定された電流の散布図である。

【図44】は、第二の例において電圧レベル＋１４０ｍＶで水平方向に表示されたＤＮＡ鎖ごとの測定された電流の散布図である。

【図45】は、第二の例において電圧レベル＋１８０ｍＶで水平方向に表示されたＤＮＡ鎖ごとの測定された電流の散布図である。

【図46】は、第二の例において印加された電圧に対するそれぞれのＤＮＡ鎖の測定された電流のプロットである。

【図47】は、印加された電圧に対する第二の例におけるＤＮＡ鎖ごとの電流測定の標準偏差のプロットである。

【図48】は、イオン電流測定を行う方法のフローチャートである。

【図49】は、第三の例における共通の時間期間にわたって付加された電位および得られたイオン電流の対になったグラフである。

【図50】は、第三の例における共通の時間期間にわたって付加された電位および得られたイオン電流の対になったグラフである。

【図51】は、イオン電流測定を行う別の方法のフローチャートである。

【図52】Ａ及びＢは、ナノポアを横断して印加された形状電圧ステップおよび得られた電流の同じ時間尺度上のプロットである。本発明のすべての態様は、以下の通りの広範なポリマーに適用しうる。

【発明を実施するための形態】

【0035】

ポリマーは、ポリヌクレオチド（または核酸）、タンパク質などのポリペプチド、多糖
類、または他の任意のポリマーであってよい。ポリマーは天然でも合成でもよい。

【0036】

ポリヌクレオチドまたは核酸のケースでは、ポリマー単位はヌクレオチドであってよい
。核酸は典型的にはデオキシリボ核酸（ＤＮＡ）、リボ核酸（ＲＮＡ）、ｃＤＮＡまたは
ペプチド核酸（ＰＮＡ）、グリセロール核酸（ＧＮＡ）、トレオース核酸（ＴＮＡ）、ロ
ックド核酸（ＬＮＡ）もしくはヌクレオチド側鎖のある他の合成ポリマーなどの当技術分
野で公知の合成核酸である。核酸は一本鎖でも二本鎖でもまたは一本鎖領域と二本鎖領域
の両方を含んでいてもよい。典型的には、ｃＤＮＡ、ＲＮＡ、ＧＮＡ、ＴＮＡまたはＬＮ
Ａは一本鎖である。本発明の方法を使用して、いかなるヌクレオチドでも同定しうる。ヌ
クレオチドは天然に存在するもので人工的なものでもよい。ヌクレオチドは典型的には、
核酸塩基、糖および少なくとも１つのリン酸基を含有する。核酸塩基は典型的には複素環
式である。適切な核酸塩基には、プリンおよびピリミジンが、さらに具体的にはアデニン
、グアニン、チミン、ウラシルおよびシトシンが含まれる。糖は典型的には五炭糖である
。適切な糖には、リボースおよびデオキシリボースが含まれるがこれらに限定されない。
ヌクレオチドは典型的にはリボヌクレオチドまたはデオキシリボヌクレオチドである。ヌ
クレオチドは典型的には、一リン酸塩、二リン酸塩または三リン酸塩を含有する。

【0037】

ヌクレオチドは損傷した塩基でも後成的塩基でも可能である。ヌクレオチドは標識され
てまたは修飾されて、はっきりしたシグナルを有するマーカーとして働くことができる。
この技法を使用して、ポリヌクレオチド内の塩基の非存在、例えば、塩基脱落単位または
スペーサーを同定することが可能である。前記方法はどんな種類のポリマーにも適用する
ことができるであろう。

【0038】

修飾されたまたは損傷したＤＮＡの測定（または類似のシステム）を検討する際に特に
有用なのが、補完的データが考慮される方法である。提供される追加の情報は、さらに多
数の根底にある状態の区別を可能にする。

【0039】

ポリペプチドのケースでは、ポリマー単位は天然に存在するまたは合成のアミノ酸であ
ってよい。

【0040】

多糖類のケースでは、ポリマー単位は単糖であってよい。

【0041】

本発明は、下でさらに考察されるように、広範囲の測定システムにより行われる測定に
適用しうる。

【0042】

本発明のすべての態様に従って、測定システムはナノポアを含むナノポアシステムであ
りうる。このケースでは、測定はナノポア中を通るポリマーの移行中に行いうる。ナノポ
ア中を通るポリマーの移行は、観測されうる、全体では「事象」と呼びうる測定される特
性における特徴的シグナルを生じる。

【0043】

ナノポアは、典型的にはナノメーターオーダーのサイズを有し、その中を通ってポリマ
ーを通過させるポアである。ポリマー単位がポア中を通って移行することに依拠している
特性は測定しうる。前記特性は、ポリマーとポア間の相互作用に関連していることがある
。ポリマーの相互作用はポアの狭窄領域で起こりうる。測定システムは前記特性を測定し
、ポリマーのポリマー単位に依拠している測定を生み出す。

【0044】

ナノポアは生物学的ポアでも固体状態ポアでもよい。

【0045】

ナノポアが生物学的ポアである場合、以下の特性を有していることがある。

【0046】

生物学的ポアは膜貫通タンパク質ポアでありうる。本発明に従って使用するための膜貫
通タンパク質ポアは、βバレルポアまたはαヘリックス束状ポアに由来することが可能で
ある。βバレルポアは、β鎖から形成されるバレルまたはチャネルを含む。適切なβバレ
ルポアには、α溶血素、炭疽毒素およびロイコシジンなどのβ毒素、ならびにマイコバク
テリウム・スメグマチス（Mycobacterium smegmatis）ポリン（Ｍｓｐ）、例えば、Ｍｓ
ｐＡ、外膜ポリンＦ（ＯｍｐＦ）、外膜ポリンＧ（ＯｍｐＧ）、外膜ホスホリパーゼＡお
よびナイセリア（Neisseria）自己輸送体リポタンパク質（ＮａｌＰ）などの細菌の外膜
タンパク質／ポリン、が含まれるがこれらに限定されない。αヘリックス束状ポアは、α
ヘリックスから形成されるバレルまたはチャネルを含む。適切なαヘリックス束状ポアに
は、内膜タンパク質ならびにＷＺＡおよびＣｌｙＡ毒素などのα外膜タンパク質が含まれ
るがこれらに限定されない。膜貫通ポアは、Ｍｓｐにまたはα溶血素（α－ＨＬ）に由来
しうる。

【0047】

膜貫通タンパク質ポアは典型的にはＭｓｐに、好ましくはＭｓｐＡに由来する。そのよ
うなポアは、オリゴマーであり、典型的にはＭｓｐ由来の７、８、９または１０モノマー
を含む。ポアは、同一のモノマーを含むＭｓｐ由来のホモオリゴマーポアであってもよい
。代わりに、ポアは、その他のモノマーとは異なる少なくとも１つのモノマーを含むＭｓ
ｐ由来のヘテロオリゴマーポアであってもよい。ポアは、Ｍｓｐ由来の２つ以上の共有結
合モノマーを含む１つまたは複数の構築物を含んでいてもよい。適切なポアは、米国特許
仮出願第６１／４４１，７１８号（２０１１年２月１１日提出）に開示されている。好ま
しくは、ポアはＭｓｐＡまたはそのホモログもしくはパラログ由来である。

【0048】

生物学的ポアは天然に存在するポアでもよいし、変異ポアでもよい。典型的なポアは、
ＷＯ－２０１０／１０９１９７、Stoddart D et al.、Proc Natl Acad Sci、12; 106(19)
:7702-7、Stoddart D et al.、Angew Chem Int Ed Engl. 2010; 49(3):556-9、Stoddart
D et al.、Nano Lett. 2010 Sep 8; 10(9):3633-7、Butler TZ et al.、Proc Natl Acad
Sci 2008; 105(52):20647-52および米国特許仮出願第６１／４４１７１８号に記載されて
いる。

【0049】

生物学的ポアはＭＳ－（Ｂ１）８でありうる。Ｂ１をコードするヌクレオチド配列およ
びＢ１のアミノ酸配列は下に示されている（配列番号１および配列番号２）。
配列番号１：ＭＳ－（Ｂ１）８＝ＭＳ－（Ｄ９０Ｎ／Ｄ９１Ｎ／Ｄ９３Ｎ／Ｄ１１８Ｒ／
Ｄ１３４Ｒ／Ｅ１３９Ｋ）８
ＡＴＧＧＧＴＣＴＧＧＡＴＡＡＴＧＡＡＣＴＧＡＧＣＣＴＧＧＴＧＧＡＣＧＧＴＣＡＡＧ
ＡＴＣＧＴＡＣＣＣＴＧＡＣＧＧＴＧＣＡＡＣＡＡＴＧＧＧＡＴＡＣＣＴＴＴＣＴＧＡＡ
ＴＧＧＣＧＴＴＴＴＴＣＣＧＣＴＧＧＡＴＣＧＴＡＡＴＣＧＣＣＴＧＡＣＣＣＧＴＧＡＡ
ＴＧＧＴＴＴＣＡＴＴＣＣＧＧＴＣＧＣＧＣＡＡＡＡＴＡＴＡＴＣＧＴＣＧＣＡＧＧＣＣ
ＣＧＧＧＴＧＣＴＧＡＣＧＡＡＴＴＣＧＡＡＧＧＣＡＣＧＣＴＧＧＡＡＣＴＧＧＧＴＴＡ
ＴＣＡＧＡＴＴＧＧＣＴＴＴＣＣＧＴＧＧＴＣＡＣＴＧＧＧＣＧＴＴＧＧＴＡＴＣＡＡＣ
ＴＴＣＴＣＧＴＡＣＡＣＣＡＣＧＣＣＧＡＡＴＡＴＴＣＴＧＡＴＣＡＡＣＡＡＴＧＧＴＡ
ＡＣＡＴＴＡＣＣＧＣＡＣＣＧＣＣＧＴＴＴＧＧＣＣＴＧＡＡＣＡＧＣＧＴＧＡＴＴＡＣ
ＧＣＣＧＡＡＣＣＴＧＴＴＴＣＣＧＧＧＴＧＴＴＡＧＣＡＴＣＴＣＴＧＣＣＣＧＴＣＴＧ
ＧＧＣＡＡＴＧＧＴＣＣＧＧＧＣＡＴＴＣＡＡＧＡＡＧＴＧＧＣＡＡＣＣＴＴＴＡＧＴＧ
ＴＧＣＧＣＧＴＴＴＣＣＧＧＣＧＣＴＡＡＡＧＧＣＧＧＴＧＴＣＧＣＧＧＴＧＴＣＴＡＡ
ＣＧＣＣＣＡＣＧＧＴＡＣＣＧＴＴＡＣＧＧＧＣＧＣＧＧＣＣＧＧＣＧＧＴＧＴＣＣＴＧ
ＣＴＧＣＧＴＣＣＧＴＴＣＧＣＧＣＧＣＣＴＧＡＴＴＧＣＣＴＣＴＡＣＣＧＧＣＧＡＣＡ
ＧＣＧＴＴＡＣＧＡＣＣＴＡＴＧＧＣＧＡＡＣＣＧＴＧＧＡＡＴＡＴＧＡＡＣＴＡＡ
配列番号２：ＭＳ－（Ｂ１）８＝ＭＳ－（Ｄ９０Ｎ／Ｄ９１Ｎ／Ｄ９３Ｎ／Ｄ１１８Ｒ／
Ｄ１３４Ｒ／Ｅ１３９Ｋ）８
ＧＬＤＮＥＬＳＬＶＤＧＱＤＲＴＬＴＶＱＱＷＤＴＦＬＮＧＶＦＰＬＤＲＮＲＬＴＲＥＷ
ＦＨＳＧＲＡＫＹＩＶＡＧＰＧＡＤＥＦＥＧＴＬＥＬＧＹＱＩＧＦＰＷＳＬＧＶＧＩＮＦ
ＳＹＴＴＰＮＩＬＩＮＮＧＮＩＴＡＰＰＦＧＬＮＳＶＩＴＰＮＬＦＰＧＶＳＩＳＡＲＬＧ
ＮＧＰＧＩＱＥＶＡＴＦＳＶＲＶＳＧＡＫＧＧＶＡＶＳＮＡＨＧＴＶＴＧＡＡＧＧＶＬＬ
ＲＰＦＡＲＬＩＡＳＴＧＤＳＶＴＴＹＧＥＰＷＮＭＮ

【0050】

生物学的ポアはより好ましくはＭＳ－（Ｂ２）８である。Ｂ２のアミノ酸配列は、変異
Ｌ８８Ｎを除いてはＢ１のアミノ酸配列と同じである。Ｂ２をコードするヌクレオチド配
列およびＢ２のアミノ酸配列は下に示されている（配列番号３および配列番号４）。
配列番号３：ＭＳ－（Ｂ２）８＝ＭＳ－（Ｌ８８Ｎ／Ｄ９０Ｎ／Ｄ９１Ｎ／Ｄ９３Ｎ／Ｄ
１１８Ｒ／Ｄ１３４Ｒ／Ｅ１３９Ｋ）８
ＡＴＧＧＧＴＣＴＧＧＡＴＡＡＴＧＡＡＣＴＧＡＧＣＣＴＧＧＴＧＧＡＣＧＧＴＣＡＡＧ
ＡＴＣＧＴＡＣＣＣＴＧＡＣＧＧＴＧＣＡＡＣＡＡＴＧＧＧＡＴＡＣＣＴＴＴＣＴＧＡＡ
ＴＧＧＣＧＴＴＴＴＴＣＣＧＣＴＧＧＡＴＣＧＴＡＡＴＣＧＣＣＴＧＡＣＣＣＧＴＧＡＡ
ＴＧＧＴＴＴＣＡＴＴＣＣＧＧＴＣＧＣＧＣＡＡＡＡＴＡＴＡＴＣＧＴＣＧＣＡＧＧＣＣ
ＣＧＧＧＴＧＣＴＧＡＣＧＡＡＴＴＣＧＡＡＧＧＣＡＣＧＣＴＧＧＡＡＣＴＧＧＧＴＴＡ
ＴＣＡＧＡＴＴＧＧＣＴＴＴＣＣＧＴＧＧＴＣＡＣＴＧＧＧＣＧＴＴＧＧＴＡＴＣＡＡＣ
ＴＴＣＴＣＧＴＡＣＡＣＣＡＣＧＣＣＧＡＡＴＡＴＴＡＡＣＡＴＣＡＡＣＡＡＴＧＧＴＡ
ＡＣＡＴＴＡＣＣＧＣＡＣＣＧＣＣＧＴＴＴＧＧＣＣＴＧＡＡＣＡＧＣＧＴＧＡＴＴＡＣ
ＧＣＣＧＡＡＣＣＴＧＴＴＴＣＣＧＧＧＴＧＴＴＡＧＣＡＴＣＴＣＴＧＣＣＣＧＴＣＴＧ
ＧＧＣＡＡＴＧＧＴＣＣＧＧＧＣＡＴＴＣＡＡＧＡＡＧＴＧＧＣＡＡＣＣＴＴＴＡＧＴＧ
ＴＧＣＧＣＧＴＴＴＣＣＧＧＣＧＣＴＡＡＡＧＧＣＧＧＴＧＴＣＧＣＧＧＴＧＴＣＴＡＡ
ＣＧＣＣＣＡＣＧＧＴＡＣＣＧＴＴＡＣＧＧＧＣＧＣＧＧＣＣＧＧＣＧＧＴＧＴＣＣＴＧ
ＣＴＧＣＧＴＣＣＧＴＴＣＧＣＧＣＧＣＣＴＧＡＴＴＧＣＣＴＣＴＡＣＣＧＧＣＧＡＣＡ
ＧＣＧＴＴＡＣＧＡＣＣＴＡＴＧＧＣＧＡＡＣＣＧＴＧＧＡＡＴＡＴＧＡＡＣＴＡＡ
配列番号４：ＭＳ－（Ｂ２）８＝ＭＳ－（Ｌ８８Ｎ／Ｄ９０Ｎ／Ｄ９１Ｎ／Ｄ９３Ｎ／Ｄ
１１８Ｒ／Ｄ１３４Ｒ／Ｅ１３９Ｋ）８
ＧＬＤＮＥＬＳＬＶＤＧＱＤＲＴＬＴＶＱＱＷＤＴＦＬＮＧＶＦＰＬＤＲＮＲＬＴＲＥＷ
ＦＨＳＧＲＡＫＹＩＶＡＧＰＧＡＤＥＦＥＧＴＬＥＬＧＹＱＩＧＦＰＷＳＬＧＶＧＩＮＦ
ＳＹＴＴＰＮＩＮＩＮＮＧＮＩＴＡＰＰＦＧＬＮＳＶＩＴＰＮＬＦＰＧＶＳＩＳＡＲＬＧ
ＮＧＰＧＩＱＥＶＡＴＦＳＶＲＶＳＧＡＫＧＧＶＡＶＳＮＡＨＧＴＶＴＧＡＡＧＧＶＬＬ
ＲＰＦＡＲＬＩＡＳＴＧＤＳＶＴＴＹＧＥＰＷＮＭＮ

【0051】

生物学的ポアは、生体膜、例えば、脂質二重層などの両親媒性層に挿入しうる。両親媒
性層は、親水性も親油性も有するリン脂質などの両親媒性分子から形成される層である。
両親媒性層は単層でも二重層でもよい。両親媒性層は、（Gonzalez-Perez et al.、Langm
uir、2009、25、10447-10450）により開示されているなどのコブロックポリマーであって
もよい。代わりに、生物学的ポアは固体状態層に挿入されてもよい。

【0052】

代わりに、ナノポアは、固体状態層内で形成される開口部を含む固体状態ポアであって
もよい。

【0053】

固体状態層は生体起源ではない。言い換えると、固体状態層は生物もしくは細胞などの
生物学的環境に由来してもそこから単離されてもおらず、または生物学的に利用可能な構
造体の合成的に製造されたものでもない。固体状態層は、マイクロエレクトロニクス材料
、Ｓｉ３Ｎ４、Ａ１２０３およびＳｉＯなどの絶縁材料、ポリアミドなどの有機および無
機ポリマー、Ｔｅｆｌｏｎ（登録商標）などのプラスチックまたは二成分付加硬化型シリ
コーンゴムなどのエラストマーならびにガラスを含むがこれらに限定されない有機材料か
らでも無機材料からでも形成することが可能である。固体状態層はグラフェンから形成し
うる。適切なグラフェン層は、ＷＯ２００９／０３５６４７およびＷＯ－２０１１／０
４６７０６に開示されている。

【0054】

固体状態ポアは典型的には固体状態層中の開口部である。開口部は化学的にまたは他の
方法で改変して、ナノポアとしてのその特性を増強してもよい。固体状態ポアは、トンネ
ル電極（Ivanov AP et al.、Nano Lett. 2011 Jan 12;11(1):279-85）または電界効果ト
ランジスター（ＦＥＴ）デバイス（国際出願ＷＯ２００５／１２４８８８）などのポリマ
ーの別のまたは追加の測定を提供する追加の成分と組み合わせて使用してもよい。固体状
態ポアは、例えば、ＷＯ００／７９２５７に記載されている工程を含む公知の工程によ
り形成してもよい。

【0055】

測定システムの一種では、ナノポア中を流れるイオン電流の測定を使用しうる。これら
のおよび他の電気的測定は、Stoddart D et al.、Proc Natl Acad Sci、12; 106(19):770
2-7、Lieberman KR et al、J Am Chem Soc. 2010; 132(50):17961-72および国際出願ＷＯ
－２０００／２８３１２に記載されている標準単一チャネル記録装置を使用して行いうる
。代わりに、電気的測定は、例えば、国際出願ＷＯ－２００９／０７７７３４および国際
出願ＷＯ－２０１１／０６７５５９に記載されているマルチチャネルシステムを使用して
行いうる。

【0056】

ポリマーがナノポア中を通って移行する時に測定を行うことを可能にするために、移行
速度はポリマー結合部分により制御することができる。典型的には、前記部分は、印加電
界に合わせてまたは逆らってナノポア中を通ってポリマーを移動させることができる。前
記部分は、例えば、前記部分が酵素のケースでは酵素活性を使用して分子モーターになる
、または分子ブレーキとなることができる。ポリマーがポリヌクレオチドである場合、ポ
リヌクレオチド結合酵素の使用を含む移行速度を制御するためのいくつかの方法が提唱さ
れている。ポリヌクレオチドの移行速度を制御するのに適した酵素には、ポリメラーゼ、
ヘリカーゼ、エキソヌクレアーゼ、一本鎖および二本鎖結合タンパク質、ならびにジャイ
レースなどのトポイソメラーゼが含まれるがこれらに限定されない。他のポリマー型では
、そのポリマー型と相互作用する部分を使用することができる。ポリマー相互作用部分は
、国際出願番号ＰＣＴ／ＧＢ１０／０００１３３またはＵＳ６１／４４１７１８（Lieber
man KR et al、J Am Chem Soc. 2010;132(50):17961-72）に開示されているおよび電位開
口型スキーム（Luan B et al.、Phys Rev Lett. 2010; 104(23):238103）についてのいか
なる部分でもよい。

【0057】

ポリマー結合部分は、ポリマー運動を制御するいくつかの方法で使用することが可能で
ある。前記部分は、印加電界に合わせてまたは逆らってナノポア中を通ってポリマーを移
動させることができる。前記部分は、例えば、前記部分が酵素のケースでは酵素活性を使
用して分子モーターとして、または分子ブレーキとして使用することができる。ポリマー
の移行は、ポア中を通るポリマーの動きを制御する分子歯止めにより制御しうる。分子歯
止めはポリマー結合タンパク質であってよい。ポリヌクレオチドでは、ポリヌクレオチド
結合タンパク質は好ましくはポリヌクレオチドハンドリング酵素である。ポリヌクレオチ
ドハンドリング酵素は、ポリヌクレオチドと相互作用をし、ポリヌクレオチドの少なくと
も１つの特性を改変することができるポリペプチドである。前記酵素は、ポリヌクレオチ
ドを切断して個々のヌクレオチドまたはジヌクレオチドもしくはトリヌクレオチドなどの
ヌクレオチドの比較的短い鎖を形成することによりポリヌクレオチドを改変することがあ
る。前記酵素は、ポリヌクレオチドを特定の位置に方向付けるまたは移動させることによ
りポリヌクレオチドを改変することがある。ポリヌクレオチドハンドリング酵素は、標的
ポリヌクレオチドと結合しポア中を通るその動きを制御することができさえすれば酵素活
性を示す必要はない。例えば、前記酵素はその酵素活性を取り除くように改変されてもよ
いし、酵素として作用するのを妨げる条件下で使用してもよい。そのような条件は下でさ
らに詳細に考察される。

【0058】

ポリヌクレオチドハンドリング酵素は、核酸分解酵素に由来していてもよい。酵素の構
築物中で使用されるポリヌクレオチドハンドリング酵素は、より好ましくは、酵素分類（
ＥＣ）群、３．１．１１、３．１．１３、３．１．１４、３．１．１５、３．１．１６、
３．１．２１、３．１．２２、３．１．２５、３．１．２６、３．１．２７、３．１．３
０および３．１．３１のうちのいずれかのメンバー由来である。酵素は、国際出願番号Ｐ
ＣＴ／ＧＢ１０／０００１３３（ＷＯ２０１０／０８６６０３として公開された）に開
示されている酵素のうちのいずれであってもよい。

【0059】

好ましい酵素は、ポリメラーゼ、エキソヌクレアーゼ、ヘリカーゼおよびジャイレース
などのトポイソメラーゼである。適切な酵素には、大腸菌（E.coli）由来のエキソヌクレ
アーゼＩ（配列番号８）、大腸菌（E.coli）由来のエキソヌクレアーゼＩＩＩ酵素（配列
番号１０）、サーマス・サーモフィルス（T. thermophilus）由来のＲｅｃＪ（配列番号
１２）およびバクテリオファージラムダエキソヌクレアーゼ（配列番号１４）ならびにそ
のバリアントが含まれるがこれらに限定されない。配列番号１４に示される配列またはそ
のバリアントを含む３つのサブユニットは相互作用してトリマーエキソヌクレアーゼを形
成する。前記酵素は好ましくはＰｈｉ２９ＤＮＡポリメラーゼ由来である。Ｐｈｉ２９
ポリメラーゼ由来の酵素は、配列番号６に示される配列またはそのバリアントを含む。

【0060】

配列番号６、８、１０、１２または１４のバリアントは、配列番号６、８、１０、１２
または１４のアミノ酸配列とは異なるアミノ酸配列を有しポリヌクレオチド結合力は保持
している酵素である。前記バリアントは、ポリヌクレオチドの結合を促進しならびに／ま
たは高塩濃度および／もしくは室温でその活性を促進する改変を含みうる。

【0061】

配列番号６、８、１０、１２または１４のアミノ酸配列の全長にわたり、バリアントは
好ましくは、アミノ酸同一性に基づいてその配列に少なくとも５０％相同であることにな
る。さらに好ましくは、前記バリアントポリペプチドは、アミノ酸同一性に基づいて、配
列番号６、８、１０、１２または１４のアミノ酸配列にその全配列にわたり少なくとも５
５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少
なくとも８０％、少なくとも８５％、少なくとも９０％およびさらに好ましくは少なくと
も９５％、９７％または９９％相同であってよい。２００以上の、例えば、２３０、２５
０、２７０または２８０以上の連続するアミノ酸のストレッチにわたって少なくとも８０
％、例えば、少なくとも８５％、９０％または９５％アミノ酸同一性（「ハード相同性」
）が存在していてもよい。相同性は上に記載される通りに決定される。バリアントは、配
列番号２を参照して上で考察されるいかなる点においても野生型配列とは異なりうる。酵
素は上で考察されたポアに共有結合していてもよい。

【0062】

一本鎖ＤＮＡ塩基配列決定のための２つの戦略は、シスからトランスへとトランスから
シスへの両方、付加電位に合わせてまたは逆らってのどちらかでナノポア中を通るＤＮＡ
の移行である。鎖塩基配列決定のための最も有利な機構は、付加電位下でのナノポア中を
通る一本鎖ＤＮＡの制御された移行である。二本鎖ＤＮＡ上で前進的にまたは進行的に作
用するエキソヌクレアーゼは、付加電位下で残りの一本鎖を中に送り込むためにポアのシ
ス側上で、または逆電位下ではトランス側で使用することができる。同様に、二本鎖ＤＮ
Ａをほどくヘリカーゼも類似する様式で使用することが可能である。付加電位に逆らった
鎖移行を必要とする塩基配列決定適用の可能性もあるが、ＤＮＡは先ず逆電位下でまたは
電位なしで酵素により「捕捉」されなければならない。次に結合に続いて電位が切り替え
られると、前記鎖はポア中をシスからトランスへ通過し、電流の流れにより伸ばされた立
体構造に保持されることになる。一本鎖ＤＮＡエキソヌクレアーゼまたは一本鎖ＤＮＡ依
存性ポリメラーゼは分子モーターとして働いて、付加電位に逆らってトランスからシスに
、制御された段階的な様式でポア中で移行したばかりの一本鎖を引き戻すことができる。
代わりに、一本鎖ＤＮＡ依存性ポリメラーゼは、ポア中を通るポリヌクレオチドの動きを
遅くする分子ブレーキとして働くことができる。仮出願ＵＳ６１／４４１７１８または
ＵＳ仮出願第６１／４０２９０３号に記載されているいかなる部分、技法または酵素を使
用してもポリマーの動きを制御することができるであろう。

【0063】

しかし、別の種類の測定システムおよび測定も可能である。

【0064】

別の種類の測定システムのいくつかの非限定的例は以下の通りである。

【0065】

測定システムは、走査型プローブ顕微鏡であってよい。走査型プローブ顕微鏡は、原子
間力顕微鏡（ＡＦＭ）、走査型トンネル顕微鏡（ＳＴＭ）または別の形態の走査型顕微鏡
である。

【0066】

読取り装置がＡＦＭであるケースでは、ＡＦＭチップの解像度は、個々のポリマー単位
の寸法ほど微細ではないことがある。したがって、測定は複数のポリマー単位の関数にな
りうる。ＡＦＭチップは、チップが機能化されていない場合とは別の様式でポリマー単位
と相互作用するように機能化させうる。ＡＦＭは、接触モード、非接触モード、タッピン
グモードまたは他のどんなモードでも作動させうる。

【0067】

読取り装置がＳＴＭであるケースでは、測定の解像度は個々のポリマー単位の寸法ほど
微細ではないことがあり、そのため測定は複数のポリマー単位の関数になる。ＳＴＭは、
従来法でまたは分光学的測定（ＳＴＳ）をするようにまたは他のどんなモードでも作動さ
せうる。

【0068】

別の種類の測定のいくつかの例には、電気的測定および光学的測定が限定なく含まれる
。蛍光の測定を伴う適切な光学的方法は、J. Am. Chem. Soc. 2009、131 1652-1653によ
り開示されている。可能な電気的測定には、電流測定、インピーダンス測定、トンネリン
グ測定（例えば、Ivanov AP et al.、Nano Lett. 2011 Jan 12;11(1):279-85に開示され
ている）およびＦＥＴ測定（例えば、国際出願ＷＯ２００５／１２４８８８に開示され
ている）が含まれる。光学的測定は電気的測定と組み合わせうる（Soni GV et al.、Rev
Sci Instrum. 2010 Jan;81(1):014301）。測定は、ナノポア中を通るイオン電流の流れの
測定などの膜貫通電流測定でもよい。イオン電流は典型的には、直流イオン電流でよいが
、原理的には代案は交流電流の流れ（すなわち、交流電圧の印加下で流れる交流電流の大
きさ）を使用することである。

【0069】

本明細書では、用語「ｋマー」とは、ｋマーが単一ポリマー単位であるｋが１であるケ
ースを含む、ｋが正整数であるｋ個のポリマー単位のグループのことである。いくつかの
文脈では、一般にはｋが１であるケースを除外してｋマーのサブセットである、ｋが複数
の整数であるｋマーに言及する。

【0070】

理想的には測定は単一のポリマー単位に依拠すると考えられるが、多くの典型的な測定
システムに関しては、測定は、ｋが複数の整数であるポリマーのｋマーに依拠する。すな
わち、それぞれの測定は、ｋが複数の整数であるｋマー中のそれぞれのポリマー単位の配
列に依拠する。典型的には、測定はポリマーと測定システム間の相互作用に関連する特性
である。

【0071】

本発明のいくつかの実施形態では、小グループのポリマー単位、例えば、ダブレットま
たはトリプレットのポリマー単位（すなわち、ｋ＝２またはｋ＝３）に依拠している測定
を使用するのが好ましい。他の実施形態では、さらに大きなグループのポリマー単位に依
拠している測定を、すなわち、「広い」解像度で使用するのが好ましい。そのような広い
解像度は、ホモポリマー領域を調べるのに特に有用になることがある。

【0072】

特に測定が、ｋが複数の整数であるｋマーに依拠している場合、できる限り多くの可能
なｋマーについて分解可能である（すなわち、分離される）ことが望ましい。典型的には
、これは異なるｋマーにより生み出される測定が測定範囲にわたり十分に広がっているお
よび／または狭い分布を有するならば、達成することが可能である。これは、異なる測定
システムにより様々な程度に達成しうる。しかし、異なるｋマーにより生み出される測定
が分解可能であることが不可欠ではないことは本発明の特別な利点である。

【0073】

図１は、両親媒性層などの生体膜２に挿入された生物学的ポア１であるナノポアを含む
測定システム８の例を模式的に示している。ポリマー単位のシリーズ４を含むポリマー３
は、矢印で示されるように生物学的ポア１中を通って移行される。ポリマー３は、ポリマ
ー単位４がヌクレオチドであるポリヌクレオチドでありうる。ポリマー３は、生物学的ポ
ア１内部のｋマーに依拠して変化する膜貫通電流などの電気特性を引き起こす生物学的ポ
ア１の活性部分５と相互作用する。この例では、活性部分５は３つのポリマー単位４のｋ
マーと相互作用しているものとして示されているが、これは限定的なものではない。

【0074】

生体膜２のそれぞれの側に配置された電極６は、制御回路７１および測定回路７２を含
めて、電気回路７と接続されている。

【0075】

制御回路７１は、生物学的ポア１を横断する印加のために電極６に電圧を供給するよう
に配置されている。

【0076】

測定回路７２は、電気特性を測定するように配置されている。したがって、測定は生物
学的ポア１内部のｋマーに依拠している。

【0077】

測定システムにより出力される典型的タイプのシグナルであり、本発明に従って解析さ
れることになる入力シグナルであるシグナルは「ノイズステップ波」であるが、このシグ
ナルタイプに限定されない。この形態を有する入力シグナルの例は、ナノポアを含む測定
システムを使用して得られるイオン電流測定のケースについて図２に示されている。

【0078】

このタイプの入力シグナルは、連続するグループの複数の測定が同じｋマーに依拠して
いる測定の入力シリーズを含む。それぞれのグループ内の複数の測定は、下で考察される
ある分散を受ける一定値であり、したがって、測定システムの状態に対応してシグナルに
「レベル」を形成する。シグナルは、大きなセットであることもあるレベルのセット間を
移動する。計測手段のサンプリング速度およびシグナル上のノイズを考慮すると、レベル
間の遷移は瞬間的だと見なすことが可能であり、したがって、シグナルは理想化されたス
テップトレースにより概算することが可能である。

【0079】

それぞれの状態に対応した測定は事象の時間尺度にわたり一定であるが、大半の測定シ
ステムでは短い時間尺度にわたり分散を受けることになる。分散は、例えば、電気回路お
よびシグナル処理から、特に電気生理学という特定のケースでは増幅器から生じる測定ノ
イズに起因することがある。そのような測定ノイズは、測定されている特性が小規模であ
るため避けられない。分散は、測定システムの根底にある物理的または生物学的系におけ
る固有の変動または拡散からも生じることがある。大半の測定システムは、そのような固
有の変動を大小の程度の差はあっても経験することになる。所与の測定システムでは、両
方の変動源が一因となることがあるまたはこれらのノイズ源のうちの１つが優勢であるこ
ともある。

【0080】

さらに、典型的にはグループにおける測定数に先験的知識はなく、この数は予測不能に
変化する。

【0081】

分散および測定数についての知識の欠如というこれら２つの要因のため、例えば、グル
ープが短いおよび／または２つの連続するグループの測定のレベルが互いに近い場合、グ
ループのいくつかを区別するのが困難になることがある。

【0082】

シグナルは、測定システムにおいて起きている物理的または生物学的過程の結果として
、このような形態をとる。したがって、測定のそれぞれのグループは「状態」と呼びうる
。

【0083】

例えば、ナノポアを含むいくつかの測定システムでは、ナノポア中を通るポリマーの移
行からなる事象は、一方向だけに動く様式で起こりうる。一方向だけの動きのそれぞれの
ステップ中、ナノポアを横断する所与の電圧でのナノポア中を流れるイオン電流は一定で
あり、上で考察された分散を受ける。したがって、測定のそれぞれのグループは、一方向
だけの動きのステップに関連している。それぞれのステップは、ポリマーがナノポアに対
してそれぞれの位置にある状態に対応する。状態の期間中の正確な位置にはある程度の変
動がありうるが、状態間にはポリマーの大規模な動きがある。測定システムの性質に応じ
て、状態はナノポア中での結合事象の結果として起こりうる。

【0084】

個々の状態の持続時間は、ポアを横断して印加される電位、ポリマーの歯止めをするの
に使用される酵素の種類、ポリマーが酵素によりポア中を通って押されているのかまたは
引っ張られているのか、ｐＨ、塩濃度および存在するヌクレオシド三リン酸の種類などの
いくつかの要因に依拠していることがある。状態の持続時間は、測定システムに応じて０
．５ｍｓから３秒まで変化することがあり、所与のナノポアシステムでは、状態間である
程度の無作為な変動がある。持続時間の予測される分布は、所与の測定システムについて
実験的に決定しうる。

【0085】

前記方法は、測定の複数の入力シリーズであって、それぞれがそれぞれのシリーズにお
ける複数の測定の連続するグループが同じｋマーに依拠している上記の形態をとる入力シ
リーズを使用することがある。そのような複数のシリーズは登録されることがあるので、
例えば、それぞれシリーズの測定が同時間に行われる場合、それぞれのシリーズからのど
の測定が対応し同じｋマーに依拠しているのかが先験的に分かる。例えば、測定が、異な
る測定システムにより同調して測定された異なる特性である場合、こうなる可能性がある
。代わりに、そのような複数のシリーズは登録されないことがあるので、それぞれのシリ
ーズからのどの測定が対応し同じｋマーに依拠しているのかは先験的には分からない。例
えば、測定のシリーズが異なる時間に行われる場合、こうなる可能性がある。

【0086】

ナノポアを横断する異なるレベルの電圧の印加下で測定が行われる、下で考察される第
三の態様に従った方法は、それぞれのレベルの電圧に関する測定のシリーズを提供する。
このケースでは、測定の繰返し周期は、問題の測定システムについての状態の繰返し周期
を考慮して選択される。理想的には、繰返し周期はすべての状態の持続時間より短く、こ
れは、測定システムについての最小の予想される繰返し周期よりも短い繰返し周期を選択
することにより達成される。しかし、いくつかの状態のみの持続時間よりも短い、例えば
、状態の持続時間の平均で６０％、７０％、８０％、９０％、９５％、または９９％より
も短い繰返し周期中に行われる測定から有用な情報を得ることができる。典型的には、繰
返し周期は最長で３秒、さらに典型的には最長で２秒または最長で１秒であってよい。典
型的には、繰返し周期は少なくとも０．５ｍｓ、さらに典型的には少なくとも１ｍｓまた
は少なくとも２ｍｓであってよい。

【0087】

１つよりも多い、例えば、２から１０までの数の電圧周期を状態の持続時間に適用して
もよい。

【0088】

それぞれのｋマーに関して複数の測定を１つの電圧レベルで（または、複数の電圧レベ
ルのそれぞれで複数の測定を）行ってもよい。１つの可能なアプローチでは、異なるレベ
ルの電圧をそれぞれ、例えば、電圧波形がステップ波である時に、一期間連続して印加し
てもよく、前記複数の期間のそれぞれの期間中に、その期間に印加される電圧のうちの１
つで１グループの複数の測定が行われる。

【0089】

複数の測定は、それ自体それに続く解析において使用しうる。代わりに、その（または
それぞれの）電圧レベルでの１つまたは複数のサマリー測定を、複数の測定のそれぞれの
グループから導き出しうる。前記１つまたは複数のサマリー測定は、所与のｋマーに関し
て所与の電圧レベルでの複数の測定から、いかなる様式でも、例えば、平均もしくは中央
値として、または統計的変動の尺度、例えば標準偏差として導き出しうる。次に、前記１
つまたは複数のサマリー測定は、それに続く解析において使用しうる。

【0090】

電圧周期はいくつかの異なる波形から選択しうる。波形は、非対称的、対称的、規則的または不規則的でもよい。

【0091】

周期の一例では、異なるレベルの電圧をそれぞれ、それらの異なるレベル間の遷移と共
に、一期間、すなわち、周期、例えば方形波またはステップ波の部分的期間連続して印加
してもよい。電圧レベル間の遷移は、急なこともあれば、一期間にわたり傾斜しているこ
ともある。

【0092】

周期の別の例では、電圧レベルは連続して変化し、例えば、異なるレベル間、例えば、
三角波またはのこぎり波で傾斜していてもよい。このケースでは、異なるレベルでの測定
は、所望の電圧レベルに対応する周期内で時々測定を行うことにより行ってもよい。

【0093】

情報は、電圧平坦域での測定からまたは勾配の測定から導き出しうる。さらに情報は、
異なる電圧レベルで行われる測定に加えて、例えば、１つの電圧レベルと別の電圧レベル
間の過渡電流の形状の測定により導き出しうる。

【0094】

段階的電圧スキームでは、電圧レベル間の遷移は、どんな容量過渡電流をも最小にする
ように形作ることができる。ナノポアシステムを単純なＲＣ回路と見なせば、電流の流れ
、Ｉ、は式Ｉ＝Ｖ／Ｒ＋ＣｄＶ／ｄｔにより与えられ、Ｖは付加電位、Ｒは抵抗（典型
的にはポアの）、ｔは時間およびＣは容量（典型的には二重層の）である。このモデル系
では２つの電圧レベル間の遷移は、時定数、τ＝ＲＣの指数関数（Ｖ＝Ｖ２－（Ｖ２－Ｖ
１）^＊ｅｘｐ（－ｔ／τ））に従うと考えられる。

【0095】

図５２ａおよび５２ｂは、電圧レベル間の遷移の時定数τが、遷移速度が最適化されて
いる、非常に速いおよび非常に遅くなるように選択されるケースを図示している。電圧遷
移が非常に速い場合、測定される電流シグナルにスパイク（オーバーシュート）が見られ
、非常に遅いと測定されるシグナルは急には平らにならない（アンダーシュート）。遷移
速度が最適化されているケースでは、測定される電流が理想的な急な遷移から歪んでいる
時間は最小化される。遷移の時定数τは、測定システムの電気的特性の測定から、または
異なる遷移の試験から決定しうる。

【0096】

２つ以上のうちのいかなる数のレベルの電圧でも測定は行いうる。電圧のレベルは、そ
れぞれのレベルの電圧での測定が、前記測定が依拠しているｋマーの正体についての情報
を提供するように選択される。したがって、レベルの選択は測定システムの性質に依拠し
ている。ナノポアを横断して印加される電位差の程度は、両親媒性層の安定性、使用され
る酵素の種類および所望の移行速度などの要因に依拠することになる。典型的には、電圧
のレベルのそれぞれは同じ極性になるが、一般には電圧のレベルのうちの１つまたは複数
はそれ以外のレベルとは反対の極性であることも可能であろう。一般に、大半のナノポア
システムでは、それぞれのレベルの電圧は典型的には対地１０ｍＶから２Ｖであってもよ
い。したがって、電圧レベル間の電圧差は典型的には少なくとも１０ｍＶ、さらに好まし
くは少なくとも２０ｍＶであってよい。電圧レベル間の電圧差は典型的には最大で１．５
Ｖ、さらに典型的には最大で４００ｍＶであってよい。電圧差が大きくなると電圧レベル
間の電流差はさらに大きくなり、したがってそれぞれの状態間に潜在的にさらに大きな区
別を生じる傾向がある。しかし、高電圧レベルは例えば、システムにより多くのノイズを
生じるまたは酵素による移行の混乱を招くことがある。逆に、電圧差が小さくなると電流
差は小さくなる傾向がある。最適電位差は、実験条件または酵素歯止めの種類に応じて選
択しうる。

【0097】

１つの電圧レベルで測定されるｋマーは、必ずしも異なる電圧レベルで測定されるのと
同じｋマーではないことがある。ｋの値は、異なる電位で測定されるｋマー間で異なるこ
とがある。しかし、これが本当であるならば、異なる電圧レベルで測定されるそれぞれの
ｋマーに共通であるポリマー単位が存在する可能性が高い。理論に縛られることなく、測
定されているｋマーのいかなる差も、ナノポアを横断して印加されるより高い電位差での
ナノポア内のポリマーの立体構造の変化がリーダーヘッドにより測定されているポリマー
単位の数の変化をもたらすことに起因している可能性があると考えられる。この立体構造
の変化の程度は、１つの値と別の値間の電位の差に依拠している可能性がある。

【0098】

測定の一部としてまたは登録情報を提供する追加の供給源からのいずれかで他の情報が
入手可能になることがある。この他の情報により状態を同定できることがある。

【0099】

代わりに、シグナルが恣意的な形態をとることがある。これらのケースでは、ｋマーに
対応する測定は放出と遷移のセットの点からも記載されることがある。例えば、特定のｋ
マーに依拠している測定は、これらの方法による記載を受け入れることができる形で起こ
る測定のシリーズを含むことがある。

【0100】

所与の測定システムがｋマーおよびｋマーのサイズに依拠している測定を提供する程度
は実験的に調べることができる。例えば、公知のポリマーが合成され、測定システムに対
して予め定められた位置に保持されて、得られた測定から、前記測定が測定システムと相
互作用をするｋマーの正体にどのように依拠しているのかを調べることができる。

【0101】

１つの可能なアプローチは、同一配列を有するポリマーのセットを、そのセットのポリ
マーごとに変化する予め定められた位置のｋマーを除いて使用することである。前記ｋマ
ーのサイズおよび正体を変化させて、測定に対するその効果を調べることができる。

【0102】

別の可能なアプローチは、予め定められた位置で調査中のｋマーの外側のポリマー単位
がそのセットのポリマーごとに変化するポリマーのセットを使用することである。そのよ
うなアプローチの例として、図３は、ナノポアを含む測定システムにおける２つのポリヌ
クレオチドの電流測定の頻度分布である。前記ポリヌクレオチドのうちの１つ（ｐｏｌｙ
Ｔと呼ばれる）では、ナノポアの領域におけるすべての塩基がＴ（ｐｏｌｙＴと呼ばれる
）であり、ポリヌクレオチドのもう一方（Ｎ１１－ＴＡＴＧＡＴ－Ｎ８と呼ばれる）では
、特定の決められた６マー（配列ＴＡＴＧＡＴを有する）から左側に１１塩基および右側
に８塩基を変化させる。図３の例は電流測定の点で前記２つの鎖の見事な分離を示してい
る。Ｎ１１－ＴＡＴＧＡＴ－Ｎ８鎖により見られる値の範囲も、ｐｏｌｙＴにより見られ
る値の範囲よりもごくわずかに広い。このようにしておよび他の配列を有するポリマーも
測定して、問題の特定の測定システムでは、測定が６マーに良好な近似で依拠しているこ
とを確かめることが可能である。

【0103】

このアプローチまたは類似のアプローチは、位置および最小ｋマー記述を決定すること
を可能にするどんな測定システムについても一般化することが可能である。

【0104】

異なる条件下でまたは異なる検出方法によって複数の測定を適用する確率論的枠組み、
特に技法により、ポリマーのより低いｋ記述を使用することが可能になることがある。例
えば、下で考察されるセンスＤＮＡおよびアンチセンスＤＮＡ測定のケースでは、それぞ
れのｋマー測定のより正確な記述が６マーになると考えられる場合、３マー記述で根底に
あるポリマーｋマーを決定するのに十分でありうる。同様に、複数の電位での測定のケー
スでは、それぞれのｋマー測定のより正確な記述がｋマーまたはｋが比較的高い値を有す
るｋマーになると考えられる場合、ｋが比較的低い値を有するｋマー記述で根底にあるポ
リマーｋマーを決定するのに十分でありうる。

【0105】

類似の方法を使用して、一般的測定システムにおける十分近似するｋマーの位置および
幅を同定してもよい。図３の例では、これは、（例えば、Ｎの数を前と後ろで変化させる
ことにより）ポアに対して６マーの位置を変えて、最もよく近似するｋマーの位置を検出
し、６から決められた塩基の数を増加するおよび減少することにより達成される。ｋの値
は、十分に狭い値の拡散の影響を最小限受けることがある。ｋマーの位置は、ピーク幅を
最小限にするように選択することができる。

【0106】

典型的な測定システムでは、異なるｋマーに依拠している測定はすべてが独自に分解可
能であるわけではないことは通常事実である。例えば、図３が関係する測定システムでは
、決められた６マーを有するＤＮＡ鎖により生み出される測定の範囲は２ｐＡの桁であり
、このシステムの近似の測定範囲は３０ｐＡから７０ｐＡであることが観測される。６マ
ーでは、４０９６通りの可能なｋマーが存在する。これらのそれぞれが２ｐＡの類似する
変動を有することを考慮すると、４０ｐＡ測定範囲においてはこれらのシグナルは独自に
分解可能ではないことは明らかである。いくつかのｋマーの測定が分解可能である場合で
さえ、多くの他のｋマーの測定が分解可能ではないことが典型的に観測される。

【0107】

多くの実際の測定システムでは、それぞれが同じポリマー単位に一部依拠しているｋ個
の測定を変換して、ポリマー単位のレベルで分解される単一の値を得る関数を同定するこ
とは可能ではなく、またはさらに一般的にはｋマー測定がｋマーの数よりも小さなパラメ
ータのセットにより記述可能ではない。

【0108】

例として、ナノポアを含む特定の測定システムでは、ポリヌクレオチドの実験的に導か
れたイオン電流測定は簡単な一次線形モデルにより正確に記述可能ではないことがここで
実証されるであろう。これは、下でより詳細に説明される２つのトレーニングセットにつ
いて明らかにされる。この実証のために使用される簡単な一次線形モデルは、
電流＝Ｓｕｍ［ｆｎ（Ｂｎ）］＋Ｅ
であり、ｆｎは測定システムにおけるそれぞれの位置ｎで生じる塩基Ｂｎごとの係数であ
り、Ｅは実験変動性に起因するランダム誤差を表す。データは最小二乗法によりこのモデ
ルにフィットさせるが、当技術分野で公知の多くの方法のいずれか１つを代わりに使用す
ることもできる。図４および５は、電流測定に対してフィットする最良モデルのプロット
である。データがこのモデルで十分に記述されるのであれば、点は典型的な実験誤差（例
えば、２ｐＡ）内で対角線にきちんと従うはずである。これは、データがどちらのセット
の係数でもこの線形モデルでは十分に記述されないことを示すケースではない。

【0109】

ノイズが多いステップ波である入力シグナルを解析する方法であって、本発明の第一の
態様を具体化する特定の方法がここで説明されることになる。以下の方法は、測定が、ｋ
が２以上のｋマーに依拠しているケースに関係するが、同じ方法はｋが１であるｋマーに
依拠している測定に単純化された形態で適用しうる。

【0110】

前記方法は図６に図示されており、図６に模式的に図示されている解析ユニット１０に
おいて実施しうる。解析ユニット１０は測定回路７２からの測定を含む入力シグナルを受
けて解析する。したがって、解析ユニット１０と測定システム８は接続され、合わせてポ
リマーを解析するための装置を構成する。解析ユニット１０は、制御回路７に制御シグナ
ルも提供して測定システム８において生物学的ポア１を横断して印加される電圧を選択し
、印加された電圧に従って測定回路７２からの測定を解析することができる。

【0111】

解析ユニット１０と測定システム８を含む装置は、ＷＯ－２００８／１０２２１０、Ｗ
Ｏ－２００９／０７７３４、ＷＯ－２０１０／１２２２９３および／またはＷＯ－２０１
１／０６７５５９のいずれかに開示されている通りに配置しうる。

【0112】

解析ユニット１０は、コンピュータ装置において実行されるコンピュータプログラムに
より実施してもよいし、または専用のハードウェアデバイスまたはその任意の組合せによ
り実施してもよい。どちらのケースでも、前記方法により使用されるデータは解析ユニッ
ト１０のメモリに記憶される。コンピュータ装置は、使用される場合、いかなる種類のコ
ンピュータシステムでもよいが、典型的には従来の構造である。コンピュータプログラム
は、いかなる適切なプログラム言語で書かれていてもよい。コンピュータプログラムは、
コンピュータ可読記憶媒体上に記憶されることができ、前記媒体は、どんな種類でも、例
えば、計算システムのドライブに差し込み可能であり、情報を磁気的に、光学的にまたは
光磁気的に記憶しうる記憶媒体、ハードドライブなどのコンピュータシステムの固定記憶
媒体、またはコンピュータメモリでもよい。

【0113】

前記方法は、どのグループでも測定の数についての先験的な知識なしで同じｋマーに依
拠している複数の測定の連続するグループを含む、上記の種類の測定のシリーズを（また
は、さらに下で説明されるように、より一般的にはどんな数のシリーズでも）を含む入力
シグナル１１で実施される。そのような入力シグナル１１の例は、以前記載された図２に
示されている。

【0114】

状態検出ステップＳ１では、入力シグナル１１は処理されて、連続するグループの測定
を同定し、それぞれの同定されたグループに関して予め定められた数（１または複数であ
る）の測定からなる測定のシリーズ１２を導き出す。解析ステップＳ２は、このようにし
て導き出された測定のシリーズ１２で実施される。状態検出ステップＳ１の目的は、それ
ぞれのｋマー状態に関連する予め定められた数の測定まで入力シグナルを減らして、解析
ステップＳ２を簡略化することである。例えば、図２に示されるように、ノイズの多いス
テップ波シグナルは、それぞれの状態に関連する単一の測定が平均電流でありうる状態ま
で減らしうる。この状態はレベルと呼ばれることもある。

【0115】

状態検出ステップＳ１は、以下の通りに入力シグナル１１の導関数において短期増加を
探す図７に示されている方法を使用して実施しうる。

【0116】

ステップＳ１－１では、入力シグナル１１は微分されてその導関数を導き出す。

【0117】

ステップＳ１－２では、ステップＳ１－１からの導関数は、（微分が増幅させる傾向が
ある）高周波ノイズを抑制するための低域フィルタリングにかけられる。

【0118】

ステップＳ１－３では、ステップＳ１－２からフィルターにかけられた導関数は閾値処
理され、測定のグループ間の遷移点を検出し、それによりデータのグループを同定する。

【0119】

ステップＳ１－４では、予め定められた数の測定は、ステップＳ１－３において同定さ
れたそれぞれのグループにおける入力シグナル１１から導き出される。最も簡単なアプロ
ーチでは、単一の測定は、それぞれの同定されたグループにおける測定値の、例えば平均
、中央値または他の位置の尺度として導き出される。ステップＳ１－４からの測定出力は
測定のシリーズ１２を形成する。他のアプローチでは、それぞれのグループに関する複数
の測定が導き出される。

【0120】

この技法の一般的簡略化は、データの２つの隣接する窓の平均を比較するスライディン
グウィンドウ解析を使用することである。次に、閾値は直接的に平均差に置くこともでき
るし、または前記２つの窓におけるデータ点の分散に基づいて設定することができる（例
えば、ステューデントｔ統計量を計算することにより）。これらの方法の特定の利点は、
これらの方法がデータに多くの仮定を負わせることなく適用することができることである
。

【0121】

測定されたレベルに関連している他の情報は、解析において後で使用するために記憶さ
せることができる。そのような情報は、シグナルの分散、非対称情報、観察の信頼度、グ
ループの長さのいずれでも制限なく含んでいてもよい。

【0122】

例として、図９は、移動するウィンドウｔ検定により減らされた実験的に決定された入
力シグナル１１を図示している。特に、図９は入力シグナル１１を細線で示している。状
態検出に続くレベルは暗線としてかぶせて示されている。図１０は、遷移間の平均値から
のそれぞれの状態のレベルを計算して、全トレースについて導き出された測定のシリーズ
１２を示している。

【0123】

しかし、下でさらに詳細に説明されるように、状態検出ステップＳ１は任意選択であり
、さらに下で説明される代案では、省いてもよい。このケースでは、図６中の点線により
模式的に示されるように、解析ステップＳ２は、測定のシリーズ１２の代わりに、入力シ
グナル１１自体で実施される。

【0124】

解析ステップＳ２はここで説明される。

【0125】

解析ステップＳ２は、解析ユニット１０に記憶されたモデル１３を参照する解析技法を
使用する。解析ステップＳ２は、測定のシリーズ１２がポリマー単位の配列により生み出
されるというモデル１３により予測される尤度に基づいてポリマー中のポリマー単位の推
定された配列１６を推定する。最も単純なケースでは、推定された配列１６は、ポリマー
単位ごとに単一の推定された正体を提供する表示であることがある。さらに一般的には、
推定された配列１６は、ある最適性基準に従ってポリマー単位の配列の任意の表示である
ことがある。例えば、推定された配列１６は、例えば、ポリマーの一部またはすべてにお
ける１つまたは複数のポリマー単位の複数の推定された正体を含めて、複数の配列を含む
ことがある。

【0126】

モデル１３の数学的基礎はここで検討される。解析ステップＳ２は、さらに下で説明さ
れるクオリティスコア１７も提供する。

【0127】

電流をサンプリングする確率変数の配列｛Ｘ_１、Ｘ_２、．．．，Ｘ_ｎ｝間の関係は、変
数
Ｘ_１－Ｘ_２－Ｘ_３－．．．_－Ｘ_ｎ
間の条件付き独立関係を表す単純なグラフィックモデルＡにより表される。

【0128】

それぞれの電流測定は読み取られているｋマーに依拠しているので、確率変数の根底に
あるセット｛Ｓ_１、Ｓ_２、．．．、Ｓ_ｎ｝がｋマーの根底にある配列を表しており、対応
するグラフィックモデルＢでは、

【0129】

【化1】

である。

【0130】

適用の電流領域に適用されるこれらのモデルはマルコフ性を利用する。モデルＡでは、
ｆ（Ｘ_ｉ）を確率変数Ｘｉの確率密度関数を表すようにとれば、マルコフ性は
ｆ（Ｘ_ｍ｜Ｘ_ｍ－１）＝ｆ（Ｘ_ｍ｜Ｘ_１、Ｘ_２、．．．、Ｘ_ｍ－１）
として表すことができる。

【0131】

モデルＢでは、マルコフ性は
Ｐ（Ｓ_ｍ｜Ｓ_ｍ－１）＝Ｐ（Ｓ_ｍ｜Ｓ_１、Ｓ_２、．．．、Ｓ_ｍ－１）
として表すことができる。

【0132】

問題が正確にどのようにコード化されているかに応じて、解決のための自然の方法は、
ベイジアンネットワーク、マルコフ確率場、隠れマルコフモデルを含むことがあり、これ
らのモデルの異形、例えば、そのようなモデルの条件付きまたは最大エントロピーフォー
ミュレーションも含む。これらのわずかに異なる枠組み内の解決法は多くの場合類似して
いる。一般的に、モデル１３は起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷
移重み付け１４、およびそれぞれのｋマーに関してそのｋマーについて測定の所与の値を
観測する可能性を表す放出重み付け１５を含んでいる。モデル１３が隠れマルコフモデル
であるケースではここで説明される。

【0133】

隠れマルコフモデル（ＨＭＭ）は、グラフィックモデルＢにおいてここで与えられる設
定の自然表示である。ＨＭＭでは、個々の確率変数Ｓ_ｍとＳ_ｍ＋１の間の関係は、このケ
ースではそれぞれの確率変数が取ることのできる可能な状態間、すなわち、起点ｋマーか
ら目的地ｋマーまでの遷移の確率を表す確率である遷移重み付け１４の遷移マトリックス
の点から定義されている。例えば、従来から、遷移マトリックスの（ｉ，ｊ）番目エント
リーは、Ｓ_ｍ＝Ｓ_ｍ，ｉだと仮定するとＳ_ｍ＋１＝Ｓ_{ｍ＋１，ｊ}である確率、すなわち、
Ｓ_ｍがそのｉ番目の可能な値を帯びると仮定するとＳ_ｍ＋１のｊ番目の可能な値への遷移
の確率を表す遷移重み付け１４である。

【0134】

図１１は、Ｓ_ｍからＳ_ｍ＋１までの遷移マトリックスの図形表示である。ここでは、Ｓ
_ｍおよびＳ_ｍ＋１は、説明のために４つの値を示しているだけであるが、実際には異なる
ｋマーが存在するのと同じ数の状態が存在すると考えられる。それぞれのエッジは遷移を
表し、遷移確率を表す遷移マトリックスからのエントリーで標識してもよい。図１１では
、Ｓ_ｍ層からＳ_ｍ＋１層においてそれぞれの交点を接続する４つのエッジの遷移確率は古
典的には合計で１になると考えられるが、非確率的重み付けを使用してもよい。

【0135】

一般に、遷移重み付け１４は、非バイナリー変数（非バイナリー値）の値を含むことが
望ましい。これにより、モデル１３はｋマー間の遷移の実際の確率を表すことが可能にな
る。

【0136】

モデル１３がｋマーを表すことを考慮すると、所与のｋマーは、起点ｋマーから、最初
の（ｋ－１）個のポリマー単位が起点ｋマーの最後の（ｋ－１）個のポリマー単位である
配列を有する目的地ｋマーまでの遷移であるｋ個の好ましい遷移を有する。例えば、４種
のヌクレオチドＧ、Ｔ、ＡおよびＣからなるポリヌクレオチドのケースでは、起点３マー
ＴＡＣは３マーＡＣＡ、ＡＣＣ、ＡＣＴおよびＡＣＧへの好ましい遷移を有する。最初の
近似まで、概念的には、４つの好ましい遷移の遷移確率は（０．２５）に等しく、それ以
外の好ましくない遷移の遷移確率はゼロであり、好ましくない遷移は、起点ｋマーから、
起点ｋマーとは異なる配列を有し、最初の（ｋ－１）個のポリマー単位が起点ｋマーの最
後の（ｋ－１）個のポリマー単位ではない目的地ｋマーまでの遷移であると考えてもよい
。しかし、この近似は理解のためには有用であるが、遷移の実際の可能性は一般に、所与
の測定システムではこの近似から変わることがある。これは、非バイナリー変数（非バイ
ナリー値）の値をとる遷移重み付け１４により反映されることがある。表されることがあ
るそのような変動のいくつかの例は以下の通りである。

【0137】

一例は、好ましい遷移の遷移確率は等しくなくてもよいことである。これによりモデル
１３は、ポリマーの配列間に相互関係性があるポリマーを表すことが可能になる。

【0138】

一例は、好ましくない遷移の少なくとも一部の遷移確率はゼロでなくてもよいことであ
る。これにより、モデル１３は見逃された測定、すなわち、実際のポリマー中のｋマーの
うちの１つ（または複数）に依拠している測定はないことを考慮することが可能になる。
そのような見逃された測定は、測定システムの問題によって起こり、測定は物理的には行
われない、または、例えば、所与のグループが短すぎるもしくは２つのグループが十分分
離したレベルではないという理由で、測定値のグループのうちの１つを同定することがで
きない状態検出ステップＳ１などのその後のデータ解析の問題によって起こることもある
。

【0139】

遷移重み付け１４が任意の値を持つことを可能にする一般性にもかかわらず、典型的に
は、遷移重み付け１４が、起点ｋマーから、最初の（ｋ－１）個のポリマー単位が起点ｋ
マーの最後の（ｋ－１）個のポリマー単位である配列を有する目的地ｋマーまでの好まし
い遷移の非ゼロの可能性を表し、好ましくない遷移のさらに低い可能性を表すことが事実
となるであろう。典型的には、遷移重み付け１４は、前記好ましくない遷移の少なくとも
一部の非ゼロの可能性も表すが、その可能性はゼロに近いことがあり、または完全に除外
される遷移の一部ではゼロであることもある。

【0140】

配列中の単一の見逃されたｋマーを可能にするため、遷移重み付け１４は、起点ｋマー
から、最初の（ｋ－２）個のポリマー単位が起点ｋマーの最後の（ｋ－２）個のポリマー
単位である配列を有する目的地ｋマーまでの好ましくない遷移の非ゼロの可能性を表すこ
とがある。例えば、４種のヌクレオチドからなるポリヌクレオチドのケースで、起点３マ
ーＴＡＣでは、これらはＣから開始するすべての可能な３マーへの遷移である。これらの
単一の見逃されたｋマーに対応する遷移を「スキップ（skips）」と定義することができ
る。

【0141】

それぞれのｋマーに関して単一測定を含む測定のシリーズ１２を解析するケースでは、
次に遷移重み付け１４は、測定１２ごとに遷移の高い可能性を表すことになる。測定の性
質に応じて、起点ｋマーから起点ｋマーと同じである目的地ｋマーまでの遷移の可能性は
ゼロもしくはゼロに近いこともあれば、好ましくない遷移の可能性に類似することもある
。

【0142】

同様に、それぞれのｋマーに関して予め定められた数の測定を含む測定のシリーズ１２
を解析するケースでは、次に遷移重み付け１４は、同じｋマーに関する測定１２間の遷移
の低いまたはゼロの可能性を表すことがある。遷移重み付け１４を変化させて起点ｋマー
と目的地ｋマーが同じｋマーになるようにすることは可能である。これは、例えば、誤検
出された状態遷移を可能にする。これら繰り返される同じｋマーに対応する遷移を「ステ
イ（stays）」と定義することができる。ｋマー中のポリマー単位すべてが同一である、
すなわちホモポリマーであるケースでは、好ましい遷移はステイ遷移になると考えられる
ことに我々は注目している。これらのケースでは、ポリマーは１位置移動しているがｋマ
ーは同じままである。

【0143】

同様に、それぞれのｋマーに関して典型的に複数の測定がある測定のシリーズ１２を解
析するケースであるが未知の量であるケース（「スティッキング（sticking）」と呼ばれ
ることがある）では、遷移重み付け１４は、起点ｋマーと目的地ｋマーが同じｋマーにな
る比較的高い確率を表すことがあり、物理系に応じて、遷移重み付け１４は、いくつかの
ケースでは、上記の好ましい遷移が、起点ｋマーから最初の（ｋ－１）個のポリマー単位
が起点ｋマーの最後の（ｋ－１）個のポリマー単位と同じである目的地ｋマーまでの遷移
である確率よりも大きくなることがある。

【0144】

さらに、状態検出ステップＳ１を使用せずに、入力シグナル１１を解析するケースでは
、次にこれは、単に、起点ｋマーと目的地ｋマーが同じｋマーになる比較的高い確率を表
すように遷移重み付け１４を適合させることにより達成しうる。これにより、根本的に、
同じ解析ステップＳ２を実施することが可能になり、モデル１３の適合は状態検出を暗黙
の裡に考慮に入れている。

【0145】

それぞれのｋマーと関連して、そのｋマーについての測定の所与の値を観測する確率を
表す放出重み付け１５が存在する。したがって、図１１における交点Ｓ_ｍ，ｉにより表さ
れるｋマー状態では、放出重み付け１５は、電流測定がサンプリングされる分布を記述す
る確率密度関数ｇ（Ｘ_ｍ｜Ｓ_ｍ，ｉ）として表されうる。放出重み付け１５が、非バイナ
リー変数の値を含むことが望ましい。これにより、モデル１３は、一般には簡単なバイナ
リー形をもたないことがある異なる電流測定の確率を表すことが可能になる。

【0146】

状態検出ステップＳ１が、それぞれの同定されたグループに関して複数の測定からなる
測定のシリーズ１２を導き出すケースでは（例えば、平均および変動）、放出重み付け１
５は、そのｋマーについてのそれぞれの種類の測定の所与の値を観測する確率を表す。同
様に、登録されているので、それぞれのシリーズ由来のどの測定が対応しており同じｋマ
ーに依拠しているのかが先験的に分かっている測定の複数のシリーズ１２で前記方法が実
施されるさらに一般的なケースでは、放出重み付け１５はそのｋマーについてのそれぞれ
のシリーズの測定の所与の値を観測する確率を再び表す。これらのケースでは、モデル１
３は、それぞれのｋマー状態についての複数の測定の分布を記述する複数の次元における
確率密度関数として放出重み付け１５を使用して適用することができる。一般に、所与の
ｋマーについての放出重み付け１５は、測定の確率を反映するいかなる形態でも取りうる
。異なるｋマーは、単一モデル１３内での同じ放出分布形態またはパラメータ付け（para
meterisation）で放出重み付け１５を有する必要はない。

【0147】

多くの測定システムでは、ｋマーの測定は、測定される物理的または生物学的特性の拡
散によりおよび／または測定誤差によりのいずれかで分散することがある特定の予測され
る値を有する。これは、適切な分布、例えば、単峰形（unimodal）である分布を有する放
出重み付け１５を使用することによりモデル１３にモデル化することができる。

【0148】

しかし、いくつかの測定システムでは、所与のｋマーについての放出重み付け１５は、
多峰形（multimodal）である、例えば、測定システムにおける２つの異なる種類の結合か
らおよび／またはｋマーが測定システム内で複数の立体構造をとることから物理的に生じ
ることがある。

【0149】

有利なことに、放出重み付け１５は、可能なすべての測定を観測する非ゼロの可能性を
表すことがある。これにより、モデル１３は、外れ値である、所与のｋマーが生み出す思
いがけない測定を考慮に入れることが可能になる。例えば、放出重み付け１５確率密度関
数を、非ゼロ確率を有する外れ値を可能にする広いサポート上で選択しうる。例えば、単
峰形分布のケースでは、ｋマーごとの放出重み付けは、すべての実数に対して非ゼロの重
み付けを有するガウス分布またはラプラス分布を有することがある。

【0150】

放出重み付け１５が恣意的に定義される分布であることを可能にして、外れ値測定の手
際の良い取扱いおよび多価放出を有する単一状態のケースを取り扱うことが可能になるこ
とは有利でありうる。

【0151】

放出重み付け１５を経験的に、例えば、下に説明されるトレーニング段階中に決定する
のが望ましいことがある。

【0152】

放出重み付け１５の分布は、測定空間を横断する任意の適切な数のビン（bin）を用い
て表すことができる。例えば、下記のケースでは、分布は、データ範囲全体で５００個の
ビンにより定義される。外れ値測定は、すべてのビンにおいて非ゼロ確率（外れたビンで
は低いが）を、データが定義されたビンのうちの１つに収まらない場合は類似の確率を有
することにより取り扱うことが可能である。十分な数のビンを定義すれば望ましい分布を
近似することができる。

【0153】

したがって、前記好ましくない遷移のうちの少なくとも一部の非ゼロ可能性を表す遷移
重み付け１４の使用および／またはあらゆる可能な測定を観測する非ゼロ可能性を表す放
出重み付け１５の使用から特定の利点を導き出しうる。特定の利点は、所与のｋマーにつ
いての広い範囲の測定を観測する相対的な可能性に対応する放出重み付けの使用からも導
き出しうる。

【0154】

これらの利点を強調するために、配列を導き出すための簡単な非確率的方法は比較例と
見なされる。この比較例では、観測される値の所与の範囲外の測定を生み出すｋマーは無
効とされ、見逃された測定（スキップ）に対応する遷移は、例えば、エッジおよび交点を
削除することにより図１１における遷移の数を減らして、無効とされる。比較例では、次
に、Ｓ_ｉごとに正確に１つの交点を含み、ポリマー単位の根底にある配列に対応するｋマ
ー状態の独自の接続された配列が探索される。しかし、この比較例は恣意的な閾値に頼っ
て無効とされた交点とエッジを同定するので、適切なエッジがグラフ内の存在しないため
読み飛ばされた測定のケースではどんな経路も見つけることができない。同様に、外れた
測定のケースでは、比較例は、図１１において削除された対応する交点を生じることにな
り、再びグラフ中を通る適切な経路を確認するのは不可能になる。

【0155】

これとは対照的に、モデル１３および解析ステップＳ２における確率的または重み付け
の方法などの解析技法の使用の特定の利点は、このブレイクダウンのケースを回避するこ
とができる点である。別の利点は、複数の可能な経路が存在するケースでは、最も可能性
の高い経路、または可能性のある経路のセットを決定することができる点である。

【0156】

この方法の別の特定の利点は、ホモポリマー、すなわち同一ポリマー単位の配列の検出
に関係する。モデルをベースとする解析により、シグナルに寄与するポリマー単位の数に
類似する長さまでホモポリマー領域の取扱いが可能になる。例えば、６マー測定は６ポリ
マー単位長までホモポリマー領域を同定することができるであろう。

【0157】

解析ステップＳ２の１つの可能な形態は図８に示されており、以下の通りに作動する。

【0158】

ステップＳ２－１では、ｋマーの推定された配列１８は、測定のシリーズ１２がｋマー
の配列により生み出されるというモデル１３により予測される尤度に基づいてモデル１３
を参照して推定される。

【0159】

ステップＳ２－２では、ポリマー単位の推定された配列１６は、ステップＳ２－１にお
いて推定されたｋマーの推定された配列１８から推定される。

【0160】

ステップＳ２－１でもＳ２－２でも、さらに下で考察されるように、それぞれｋマーの
推定された配列１８とポリマー単位の推定された配列１６の質を表すクオリティスコアも
提供される。

【0161】

解析ステップＳ２において適用される解析技法は、モデル１３に適している種々の形態
をとり、測定のシリーズ１２がポリマー単位の配列により生み出されるというモデル１３
により予測される尤度に基づいてポリマー中のポリマー単位の推定された配列１６を提供
しうる。例えば、モデルがＨＭＭであるケースでは、解析技法は、ステップＳ２－１にお
いて、いかなる公知のアルゴリズムでも、例えば、フォワードバックワードアルゴリズム
またはビタビ（Viterbi）アルゴリズムを使用してもよい。そのようなアルゴリズムは、
一般に、状態の配列を通じたあらゆる可能な経路の尤度を力任せに虱潰しに計算するのを
回避し、代わりに、尤度に基づいて簡略化された方法を使用して状態配列を同定する。

【0162】

一代案では、ステップＳ２－１は、測定のシリーズが個々のｋマーにより生み出される
というモデルにより予測される尤度に基づいて、配列の個々のｋマーまたは配列中のｋマ
ーごとの複数のｋマー推定値を推定することによりｋマーの配列１８を同定しうる。例と
して、解析技法がステップＳ２－１においてフォワードバックワードアルゴリズムを使用
する場合、解析技法は、測定のシリーズが個々のｋマーにより生み出されるというモデル
により予測される尤度に基づいて、ｋマーの配列１８を推定する。フォワードバックワー
ドアルゴリズムは当技術分野では周知である。フォワード部分では、所与のｋマーで終わ
る全配列の全体の尤度は遷移および放出重み付けを使用して最初から最後の測定まで再帰
的に前向きに計算される。バックワード部分は、類似する形態でしかし最後の測定からず
っと最初まで働く。これらのフォワードおよびバックワード確率は組み合わされ、データ
の全体の尤度と併せてそれぞれの測定が所与のｋマー由来である確率を計算する。

【0163】

フォワード－バックワード確率から、配列１８におけるそれぞれのｋマーの推定値が導
き出される。これは、それぞれ個々のｋマーと関連する尤度に基づいている。１つの簡単
なアプローチは、フォワード－バックワード確率がそれぞれの測定でのｋマーの相対的尤
度を示しているので、それぞれの測定で最も可能性の高いｋマーを取ることである。

【0164】

ステップＳ２－１では、測定のシリーズ１２が個々のｋマーを含む配列により生み出さ
れるというモデル１３により予測される尤度を表すクオリティスコアも配列１８中の個々
のｋマーに関して導き出される。これはステップＳ２－１において実施される解析から得
られ、追加の有用な情報を提供する。

【0165】

もう１つの代案では、ステップＳ２－１は、測定のシリーズがｋマーの全体配列により
生み出されるというモデルにより予測される尤度に基づいて、全体配列または複数の全体
配列を推定することによりｋマーの配列１８を同定しうる。別の例として、解析技法がス
テップＳ２－１においてビタビアルゴリズムを使用する場合、解析技法は、測定のシリー
ズがｋマーの全体配列により生み出されるというモデルにより予測される尤度に基づいて
ｋマーの配列１８を推定する。ビタビアルゴリズムは当技術分野では周知である。

【0166】

ステップＳ２－１では、測定のシリーズ１２がｋマーの全体配列により生み出されると
いうモデル１３により予測される尤度を表すクオリティスコアも配列１８中の個々のｋマ
ーに関して導き出される。これはステップＳ２－１において実施される解析から得られ、
追加の有用な情報を提供する。

【0167】

別の代案として、ステップＳ２－１は、測定のシリーズがｋマーの全体配列により生み
出されるというモデルにより予測される尤度に基づいてｋマーの全体配列を同定する第１
段階および第１段階の結果から前記配列の個々のｋマーまたは前記配列中のｋマーごとの
複数のｋマー推定値を推定することによりｋマーの配列１８を同定する第２段階を含む、
２つの段階に分けてもよい。例として、この代案は、力任せの虱潰し計算を使用しうる。

【0168】

ステップＳ２－２では、ポリマー単位の推定された配列１６は、任意の適切な技法を使
用してステップＳ２－１において推定されたｋマーの推定された配列１８から推定される
。１つの単刀直入なアプローチは、ｋマーをポリマー単位と１対１の関係に関連付け、関
連するｋマーから単一のポリマー単位を取り出すだけである。さらに複雑なアプローチは
、それぞれの所与のポリマー単位を含有する配列１８中の推定されたｋマーのグループか
らの情報の組合せを使用してそれぞれのポリマー単位を推定する。例えば、ポリマー単位
はその推定されたｋマーのうち最も確実なものから取り出してもよい。それぞれのポリマ
ー単位は、ステップＳ２－１における推定されたｋマー配列に関して導き出されたクオリ
ティスコア１７を利用して推定することができる。

【0169】

ステップＳ２－２では、測定のシリーズ１２がポリマー単位を含む配列により生み出さ
れるというモデル１３により予測される尤度を表すクオリティスコアも配列１６中のそれ
ぞれのポリマー単位に関して導き出される。これは、例えば、それぞれのｋマーおよび関
連するポリマー単位の相対的確率に基づいて、ステップＳ２－２において実施される解析
から得られ、追加の有用な情報を提供する。

【0170】

解析ステップＳ２における上記技法は限定的ではない。確率的または他の解析技法を使
用するモデルを利用する多くの方法が存在する。ｋマーの全体配列、個々のｋマーまたは
根底にあるポリマー単位を推定するプロセスは、特定の適用に適合させることが可能であ
る。いかなる「硬い」ｋマー配列、ｋマーまたはポリマー単位コールも作る必要はない。
あらゆるｋマー配列、または可能性の高いｋマー配列のサブセットを考慮することができ
る。ｋマー配列と関連するｋマーもしくはｋマーのセットまたは特定のｋマー配列とは関
係がないと見なされるｋマーもしくはｋマーのセット、例えば、すべてのｋマー配列にわ
たる加重和を考慮することができる。ｋマーと関連するポリマー単位もしくはポリマー単
位のセットまたは特定のｋマーとは関係がないと見なされるポリマー単位もしくはポリマ
ー単位のセット、例えば、すべてのｋマーにわたる加重和、ｋマー配列もしくはｋマー配
列のセットに依拠しているｋマーまたはｋマー配列もしくはｋマー配列のセットとは無関
係なｋマーを考慮することができる。

【0171】

例として、３マーポリヌクレオチド系を考慮しうる。可能性の高い塩基推定値のセット
を導き出すいくつかの方法がある。第１の代案は、最も可能性の高い経路を考慮し（ビタ
ビアルゴリズム）、その経路と関連する３マー状態のセットを導き出し、ｋマー由来の１
つの塩基、例えば、中央の塩基を塩基コールとして使用することである。第２の代案は、
すべての経路を考慮してそれぞれの地点で最も可能性の高いｋマーを導き出すことである
（フォワード－バックワードアルゴリズム）。次に、最も可能性の高いｋマー由来の１つ
の塩基（例えば、中央の塩基）を塩基推定値とすることもできるだろう。ｋマーから塩基
推定値を導き出す別の方法は、塩基のうちの１つ（例えば、中央の塩基）の寄与を考慮し
最も可能性の高い塩基を推定値として取りすべてのｋマーにわたり合計することになると
考えられる。ｋマーから塩基推定値を導き出す別の方法は、すべてのｋマーにおけるすべ
ての位置からの寄与を合計してそれぞれの位置で最も可能性の高い推定値を決定すること
になると考えられる。

【0172】

同様に、解析ステップＳ２は、ｋマーの複数の配列１８および／またはポリマー単位の
複数の配列１６を推定しうる。このケースでは、ｋマーの複数の配列１８のそれぞれおよ
び／またはポリマー単位の複数の配列１６のそれぞれに関してクオリティスコアを導き出
しうる。このようにして、解析ステップＳ２は、可能性がさらに低い配列に関する情報で
、にもかかわらず一部の適用において有用であることもある情報を提供する。

【0173】

上記説明は、遷移重み付け１４および放出重み付け１５が確率であり、解析ステップＳ
２がモデル１３を参照する確率的技法を使用するＨＭＭであるモデル１３に関して与えら
れている。しかし、遷移重み付け１４および／または放出重み付け１５が確率ではなくあ
る他の方法で遷移または測定の可能性を表す枠組みをモデル１３が使用することは代案と
しては可能である。このケースでは、解析ステップＳ２は、測定のシリーズがポリマー単
位の配列により生み出されるというモデル１３により予測される尤度に基づいている確率
的技法以外の解析技法を使用しうる。解析ステップＳ２により使用される解析技法は、尤
度関数を明確に使用しうるが、一般にはこれは不可欠ではない。したがって、本発明の文
脈では、用語「尤度」は、計算または正式な尤度関数の使用を必要とせずに、測定のシリ
ーズがポリマー単位の配列により生み出される可能性を考慮に入れるという一般的意味で
使用される。

【0174】

例えば、遷移重み付け１４および／または放出重み付け１５は、遷移または放出の可能
性を表すが、確率ではなく、したがって、例えば、合計が１になるように制約されてはい
ないコスト（または距離）により表しうる。このケースでは、解析ステップＳ２は解析を
、例えば、オペレーションズリサーチにおいて広く見られるように、最小コスト経路また
は最小経路問題として取り扱う解析技法を使用しうる。ダイクストラアルゴリズムなどの
標準法（または他のさらに効率的なアルゴリズム）を解決のために使用することができる
。

【0175】

モデル１３が、鈍いリーダーヘッドシステムからのデータをモデル化し解析するのに使
用されるＨＭＭである特定の例がここで考察されることになる。ここでは、入力データ１
１は先ず既に記載された状態検出ステップＳ１により処理される。簡単にするために、し
かし制限なく、この特定の例は、４種の可能な塩基を有し、そのため６４の可能なｋマー
が存在するポリヌクレオチドについての３マーモデルに関係している。根底にあるモデル
１３および状態を参照して要点を説明することができるシミュレーションされたケースが
提示される。

【0176】

このシミュレーションされたケースでは、３マー電流レベルが無作為に選択されるので
、６４のｋマー状態の放出重み付け１５を最も簡単に記述するのにも６４の係数が必要で
ある。測定からｋマーの根底にある配列を決定するのは、記載された通りにモデルベース
の解析により達成される。

【0177】

図１２は、ｋマーごとに、測定の最も可能性の高い値を示している。したがって、これ
らの値は、それぞれのｋマーの放出重み付け１５の分布の中心値でもある。図１２では、
ｋマー状態インデックスは、Ｇ、Ｔ、Ａ、Ｃの順に順次続き、すなわち、状態０＝「ＧＧ
Ｇ」、状態１＝「ＧＧＴ」、．．．状態６２＝「ＣＣＡ」、状態６３＝「ＣＣＣ」である
。ｋマー状態インデックスは解析中に使用され、最終ステップとして「塩基スペース（ba
se space）」に再び変換される。

【0178】

所与の配列からの測定は、既に記載されている係数を使用してシミュレーションされる
。例えば、配列ＡＣＴＧＴＣＡＧは３マー、ＡＣＴ、ＣＴＧ、ＴＧＴ、ＧＴＣ、ＴＣＡ、
ＣＡＧで構成されている。これらは状態インデックス４５、５２、１７、７、３０、５６
に対応し、このインデックスは６８．５、４６．５、９４．９、５１．３、１９．５、５
２．１の予測される測定を与える。シミュレーションされた測定は、入力シグナル１２と
して図１３に、状態検出ステップＳ１により生み出される測定のシリーズ１２として図１
４に図示されている。

【0179】

実際には、行われたどんな測定も、その測定に付随するエラーがある。シミュレーショ
ンのケースでは、予測された測定値にノイズを加えることによりこれは考慮される。

【0180】

測定を見落とすまたは偽陽性の測定を挿入する可能性もある。これらは、ここで説明さ
れることになる遷移マトリックスにおいて説明することができる。

【0181】

シミュレーションのケースについての遷移重み付け１４の遷移マトリックスは、ここで
考慮されることになる。

【0182】

測定のシリーズ１２および放出重み付け１５のセットを考慮して、解析ステップＳ２は
根底にある配列の推定値を決定する。概念的には、これは、観測された配列が比較される
対象のすべての可能な遷移をモデル化する解析ステップＳ２と見なしてもよい（が、実際
、解析ステップＳ２はこれを必要としないもっと効率的なアルゴリズムを使用することも
ある）。例えば、考慮中の３マーのケースでは、６４の状態のそれぞれが他の４つの状態
への好ましい遷移を有する。

【0183】

図１５は、好ましい遷移に対する遷移重み付け１４がそれぞれ０．２５であり、好まし
くない遷移に対する遷移重み付け１４がそれぞれゼロであるシミュレーションされたモデ
ルについての遷移重み付け１４の遷移マトリックスを図示している。例えば、起点状態０
（ＧＧＧ）は、等しい確率で状態、０（ＧＧＧ）、１（ＧＧＴ）、２（ＧＧＡ）または３
（ＧＧＣ）に遷移することが可能であると見ることができる。

【0184】

図１６は、見逃された測定を表す、すなわち、遷移が読み飛ばされている好ましくない
遷移に対する非ゼロの遷移重み付け１４を可能にすることにより、図１５のシミュレーシ
ョンされたモデルから修正されたシミュレーションされたモデルについての遷移重み付け
１４の遷移マトリックスのより複雑なケースを図示している。一般論として、遷移マトリ
ックスは、根底にある測定システムをモデル化するのに必要であるように、恣意的に複雑
になることがある。

【0185】

測定のシリーズ１２で作動するケースでは、我々が状態検出Ｓ１を実施した場合、所与
の起点ｋマーから離れる遷移確率は典型的に高く、要するに１に近づく。図１５の第１の
例では、遷移マトリックスは、好ましい「遷移」のうちの１つが同じｋマーへの遷移であ
る４つのホモポリマーのケースを除けば、遷移を必要とする。任意の状態からの４つの好
ましい遷移のそれぞれの確率は０．２５である。このマトリックスは、他の適切な緩和が
行われなければ、「実世界」のデータを取り扱うこと、例えば、放出重み付け１５におけ
る外れ値取扱い、ができる可能性はない。

【0186】

しかし、非ゼロの遷移は、それを扱う必要があるまたは起こる可能性があるいかなるケ
ースにも可能にすることができる。図１６の第２の例では、好ましい遷移の確率は０．２
５未満であり、残りはステイおよびスキップ確率からなる。恣意的なレベルの複雑さまで
、複数のスキップも類似する形態で許される。

【0187】

遷移確率は、ｋマー間の遷移を測定することができる平易さを考慮に入れるように調整
することが可能である。例えば、互いに非常に近い２つの連続するｋマーからのシグナル
のケースでは、状態検出ステップＳ１がこの遷移を見逃すことは可能である。このケース
では、これら２つのｋマー間の遷移マトリックスエレメントは、第２のｋマーを読み飛ば
す方向へ重み付けをしてもよい。

【0188】

マトリックスは、所与の試料中の任意の配列バイアスを考慮に入れるように調整しうる
。

【0189】

上記の例では、放出および遷移重み付けは一定の値で固定されているが、これは不可欠
ではない。代案として、放出重み付けおよび／または遷移重み付けは、おそらくプロセス
についての追加の情報に導かれて、解析される測定値シリーズの異なる部分について変化
させてもよい。例として、「ステイ」としての解釈を有する遷移重み付けのマトリックス
のエレメントを、特定の事象（）がポリマーの実際の遷移を反映する信頼度に応じて調整
することができるだろう。さらなる例として、放出重み付けを、測定デバイスのバックグ
ランドノイズにおける系統的ドリフトまたは印加された電圧に加えられる変化を反映する
ように調整することができるだろう。重み付けに対する調整の範囲はこれらの例に限定さ
れない。

【0190】

上記の例では、それぞれのｋマーが単回表示されているが、これは不可欠ではない。代
案として、モデルはｋマーの一部またはすべての複数回別個に表示されてもよく、したが
って、所与のｋマーに関して、遷移および／または放出重み付けのセットが複数あっても
よい。ここでの遷移重み付けは別個の起点ｋマーと別個の目的地ｋマー間であってよく、
したがって、それぞれの起点－目的地対は、それぞれのｋマーの別個の表示の数に応じて
、複数の重み付けがあってもよい。これら別個の表示の多くの可能な解釈の１つは、ｋマ
ーが、直接観測することが可能ではないシステムのある挙動、例えば、ナノポア中を通る
移行中にポリマーが取る可能性がある異なる立体構造または移行挙動の異なる動態を示す
ラベルをタグ付けされていることである。

【0191】

状態検出ステップＳ１を実施せずに生の入力シグナル１１で作動するモデル１３では、
複数の測定のグループが、グループにおける測定の数についての先験的な知識なしで同じ
ｋマーに依拠している測定の入力シリーズに前記方法は直接適用される。このケースでは
、非常に類似する技法であるが、所与の起点ｋマー状態から離れる遷移確率の合計がここ
では１よりはるかに少ないという点で著しく調整した技法を、モデル１３に適用すること
ができる。例えば、平均してシステムが同じｋマーで１００の測定を費やすとすれば、遷
移マトリックスにおける対角線上の確率（遷移を表さないまたは起点ｋマーと目的地ｋマ
ーが同じｋマーである遷移を表す）は０．９９になり、０．０１のスプリットがすべての
その他の好ましい遷移と好ましくない遷移の間にあることになる。好ましい遷移のセット
は、状態検出ケースについての遷移に類似していることがある。

【0192】

放出重み付け１５を考慮して、図１７から１９は、それぞれ、ガウス、三角および四角
分布であるシミュレーションされた係数についての放出分布を示すが、どんな恣意的な分
布（非パラメータ分布を含む）もこの様式で定義することができる。

【0193】

ノイズに対するこれらの方法の堅牢さを実証するため、ノイズ摂動がシミュレーション
された測定に加算される。この例では、標準偏差５ｐＡのガウス分布からサンプリングさ
れたランダムノイズが図１２に示される予測されるｋマー測定に加算される。

【0194】

図２０は、図１２に示される予測される測定と比べたシミュレーションされた測定（測
定のシリーズ１２）を示しており、見ることができる加算されたノイズが厳密であること
を図示している。

【0195】

遷移重み付けの適切な遷移マトリックス、例えば、図１６に示されるマトリックスおよ
び放出重み付け１５についての適切な分布、このケースでは、ガウス分布を用いて、モデ
ル１３が適用される。フォワード－バックワードアルゴリズムが解析技法として使用され
て、測定のシリーズにおけるそれぞれの点で最も可能性の高いｋマーを推定する。推定さ
れたｋマーコールは、図２１に示されているように、既知のｋマー配列に対して比較され
る。この厳密なケースでも、大多数の状態が正しく推定されていることが分かる。

【0196】

配列中のｋマーに関連する失われた測定に対する堅牢さはここで説明される。このケー
スでは、ノイズを予測されるｋマー測定に加算することに加えて（この例では、１ｐＡ標
準偏差を有するノイズの厳密ではないケースを使用する）、このケースでは、０．１の削
除の確率で、ｋマー測定がデータからも無作為に削除される測定のシリーズ１２がシミュ
レーションされる。図２２は、図１２に示されている予測された測定と比べたシミュレー
ションされた測定（測定のシリーズ１２）を示している。図２２では、円で囲まれた失わ
れたｋマー状態を見ることができる。

【0197】

再び、遷移重み付けの適切な遷移マトリックス、このケースでは図１５および１６に示
される両方のマトリックスおよび放出重み付け１５についての適切な分布、このケースで
は、ガウス分布を用いて、予測されたｋマー測定のモデル１３が適用される。フォワード
－バックワードアルゴリズムが解析技法として使用されて、測定のシリーズ１２における
それぞれの点で最も可能性の高いｋマーを推定する。

【0198】

推定されたｋマーコールは、図１５および１６の遷移マトリックスについてそれぞれ図
２３および２４に示されているように、既知のｋマー配列に対して比較される。ここでは
、図２３と比べた場合、図２４では、モデル遷移におけるスキップを可能にすることによ
り正確にコールされたｋマーの数に改善がみられる。失われたｋマー測定値が高信頼度の
推定値に取り囲まれているケースでは、失われたｋマーは周囲のｋマーから推定すること
が可能である。これとは対照的に、スキップが許されないケースでは、失われたデータは
、解析がｋマーのシリーズの中を通る経路を見つけるためにゼロには達しない分布を有す
る放出重み付け１５により収容される。放出分布における非ゼロのバックグランドは次の
セクションでさらに考察される。

【0199】

配列中の所与のｋマーと関連がある外れた測定に対する堅牢さはここで説明される。遷
移重み付け１４が読み飛ばされた状態（すなわち、図１５の遷移マトリックスを用いて）
を許さない失われた測定に関する以前の説明では、解析がｋマーの配列中を通る経路（非
常に可能性が低い経路にもかかわらず）を見つけることができるようにゼロに達しない分
布を有する放出重み付け１５を使用する必要があった。すべての測定値について非ゼロの
値を有する放出重み付け１５の利点は、四角放出分布の単純なケースにおいて例証される
。この例は、標準偏差５ｐＡを有するノイズが加算される図２０に示される測定のシミュ
レーションされたシリーズ１２を使用する。

【0200】

再び、図１５に示されるように、好ましくない遷移が許されない遷移重み付け１４の遷
移マトリックスを用いて、および放出重み付け１５についての２つの異なる分布を用いて
、予測されたｋマー測定のモデル１３がこのケースでは適用される。フォワードバックワ
ードアルゴリズムが解析技法として使用されて、測定のシリーズ１２におけるそれぞれの
点で最も可能性の高いｋマーを推定する。

【0201】

第１のケースでは、放出重み付け１５は、図２５に示される小非ゼロバックグランド（
このケースでは１×１０^－１０）の四角分布を有し、これについては図２６において、推
定されたｋマーコールは既知のｋマー配列に対して比較される。

【0202】

第２のケースでは、放出重み付け１５は図２７に示されるゼロバックグランドの四角分
布を有し、これについては図２８において、推定されたｋマーコールが既知のｋマー配列
に対して比較される。

【0203】

放出重み付け１５の分布においてゼロバックグランドの第２のケースでは、それらの分
布の幅が狭すぎる放出分布ではｋマー配列を通る経路は存在しない。この例では、図２７
において示されるように、解析が測定の中を通る経路を見つけることができるように幅＋
／－１４ｐＡの放出分布を使用してきた。このケースでは、それぞれが大きな数の正確な
状態を有する少数の経路が存在するよりは、多くの不正確にコールされた状態を含有する
多数の経路が存在する。この例についてのｋマーコールのセットは図２８に示されている
。

【0204】

図２５に示されるように、バックグランドにおいて小非ゼロ放出が許される第１のケー
スでは、はるかに狭い分布を許容することが可能であり、図２８よりも良好な結果を与え
る図２７に示されるように、さらに大きな数のｋマー状態を正確に推定することが可能に
なる。

【0205】

さらに、この例は、図２７および２８に示される四角分布の使用よりも良好な結果を提
供する図２０および２１に示される例について使用されるガウス放出と四角分布ケースを
比較することにより確率的方法の利点を示している。

【0206】

モデル１３のトレーニング、すなわち、所与の測定システムについての放出重み付け１
５の誘導がここで考察されることになる。

【0207】

上記シミュレーションとは対照的に、実際の測定システムでは、それぞれのｋマーから
の個々の測定は前もって分かってはいないが、トレーニングセットから導き出すことがで
きる。一般論として、これは既知のポリマーから測定を行い、それ自体がＨＭＭにとって
従来法であるトレーニング技法を使用することを含む。

【0208】

これらのトレーニング法では、特定種類の配列、すなわち、所与のｋについてすべての
ｋマーを含有する最小長配列であるド・ブラン（deBruijn）配列を利用しうる。ド・ブラ
ン配列を使用するのは必要とされる実験数を最小限に抑えるための効率的方法である。

【0209】

ポリヌクレオチドを測定するのに使用されるナノポアを含む測定システムについて２つ
のトレーニング法が記載されている。第１の方法は、ビオチン／ストレプトアビジン系に
よってナノポア内の特定の位置に保持された「静的」ＤＮＡ鎖からの測定を使用する。第
２の方法は、ナノポア中を通って移行されるＤＮＡ鎖からの測定を使用し、ｋマー推定の
ために記載された枠組みに類似する確率的枠組みを利用することにより係数を推定するま
たは「訓練する」。

【0210】

第１の静的トレーニング法は以下の通りに実施される。

【0211】

これらの実験は、Stoddart D et al.、Proc Natl Acad Sci, 12;106(19):7702-7に記載
されている方法に類似するやり方でビオチン分子を使用してＤＮＡ鎖をストレプトアビジ
ン「アンカー」に結合させた。このシステムでは、ｋの値は３である。ＤＮＡ鎖は、４０
０ｍＭＫＣｌ中でＭＳ－（Ｂ２）８を使用するｋ＝３ド・ブラン配列（配列番号３）を
表す。前記鎖は、付加電位下でナノポア中に捕捉され、その電流が記録される。下の表１
に収載されているように、実験は配列を１ヌクレオチドずつ前進させている一連のＤＮＡ
鎖を用いて繰り返すことが可能である。このようにして、下の表に収載されているように
、移動している鎖から予測される電流レベルに対応する１８０ｍＶなどの特定の付加電位
での電流レベルの測定が得られた。
配列番号３（ｋ３ド・ブラン）：
ＡＴＡＡＧＡＡＣＡＴＴＡＴＧＡＴＣＡＧＴＡＧＧＡＧＣＡＣＴＡＣＧＡＣＣＴＴＴＧＴ
ＴＣＴＧＧＴＧＣＴＣＧＴＣＣＧＧＧＣＧＣＣＣＡＡＡＴ

【0212】

【表1A】

【表1B】

【0213】

それぞれ個々の鎖からのデータは順次プロットされて図２９に示される電流状態の地図
（散布図）を生み出し、それぞれの点はＳＤ０１（左）からＳＤ６４（右）までのＤＮＡ
鎖を表す。データは、ポリＴ鎖からのふれとしてプロットされている。

【0214】

これらの測定を使用して、図２９に示される測定を中心とするそれぞれのｋマーの分布
として放出重み付け１５を導き出すことができる。ガウス分布は、図２９に示される測定
から得られる標準偏差を用いて使用しうる。遷移重み付け１４は手動で選択しうる。

【0215】

第２の動的トレーニング技法は以下の通りに実施される。

【0216】

静的鎖トレーニングは多くの利点を提供するが、骨が折れることがあり、一部では測定
システムは完全な塩基配列決定システムを正確に反映しないこともある。解析ステップＳ
２において使用する枠組みに類似する枠組み（および、したがって、類似するアルゴリズ
ム）を利用することにより、モデル１３を別法で訓練することが可能である。このそのよ
うな１つの実行はここで説明されるが、多くのバリエーションを適用することができる。
説明されるプロセスは反復性のプロセスなので、始めるのに用いるパラメータの合理的推
定値（ベイズ理論用語で、プライアー（prior））があるのは有用である。３マー静的係
数は、より高度なｋマーモデルを訓練するための合理的開始点を提供する。

【0217】

トレーニングが適用されるので、状態コーリングモデルよりもかなり柔軟性が少ないモ
デルが使用される。トレーニング鎖（複数可）の配列は既知であるので、大きな制約を適
用することができる。すべてのｋマー間の認められた遷移をモデル化するよりも、我々の
トレーニング配列により認められた遷移のみがモデル化される。トレーニングをさらに制
約するため、トレーニング鎖中のそれぞれの位置は独立してモデル化され、直後の状態へ
の遷移のみが好ましい。したがって、これを「強制的経路（forced path）」モデルと呼
ぶことができるであろう。

【0218】

例えば、およそ４００単位のポリマーであれば、そのポリマー中の位置ごとの別々の状
態インデックスを定義することができる。次に、図３０および３１に示されるように、ポ
リマー内での遷移を許す遷移マトリックスが構築され、図３０が４０８のｋマー状態につ
いての遷移マトリックスを示し、図３１が最初の１０の遷移重み付けの大写しを示してい
る。

【0219】

上記のモデル１３における遷移重み付け１４のｋマー推定遷移マトリックスの場合と同
じように、これが現実世界のシステムであるという事実を考慮するように柔軟性を加える
ことが可能である。この例では、遷移がないこと（または、起点状態インデックスと目的
地状態インデックスが同じ状態である遷移）が認められ、状態を読み飛ばす好ましくない
遷移について非ゼロの確率を使用することにより見落とされた測定が収容される。確率的
（または、重み付けされた）枠組みの利点は、測定システムの既知の人為産物を遷移重み
付けおよび／または放出重み付けにおいて具体的に取り扱うことができる点である。

【0220】

放出重み付けのトレーニングがここで説明される。放出重み付けの分布は、上記解析ス
テップＳ２のために使用された分布と類似していてもよい。しかし、この例では、ポリマ
ー中のそれぞれの位置が別々に扱われるために、放出分布は位置ごとに定義される。図３
２は、上記の静的トレーニングプロセスから導かれる６４ｋマーモデルの例を示している
。図３３は、およそ４００の状態の配列に移し返られた図３２の６４ｋマーモデルの例を
示している。既に記載されたように、外れ値データは、あらゆる可能な測定値について非
ゼロの確率を有する放出重み付けの分布内に収容することができる。

【0221】

トレーニングプロセスは図３４に示されており、ここで説明される。トレーニングプロ
セスは反復性であり、先ず、上記のモデル２０の最初の推定値をモデル２１の推定値とし
て使用する。トレーニングプロセスは測定２２も使用する。

【0222】

モデル２１の推定値および測定２２を考慮すれば、ステップＳ３において、広い範囲の
既知のアルゴリズムのうちのいずれか１つを適用することにより、測定２２がモデルにど
のようにして適合するのかが計算される。ＨＭＭのケースでは、１つの適切なアルゴリズ
ムはフォワード－バックワードアルゴリズムである。

【0223】

次に、ステップＳ４では、ステップＳ３において計算されたモデルに適合するデータを
使用して、どんな根底にある状態放出分布がその適合下にあるかを推定し、ｋマー状態中
心を再推定し、それによってモデル２１の推定値を更新する。

【0224】

ステップＳ５では、トレーニングプロセスが収束したかどうか、すなわち、ステップＳ
４からのモデル２１の更新された推定値が以前の繰り返しから著しく変化していないかど
うかが決定される。収束していなければ、前記プロセスはモデル２１の更新された推定値
を使用して繰り返される。

【0225】

そのような繰り返しは、ステップＳ５において収束が決定されるまで行われる。この時
点で、モデル２１の更新された推定値は測定２２の記述に収束しており、出力モデル２３
として出力される。

【0226】

これはトレーニングプロセスのための機械学習アルゴリズムの１つの可能な実行である
が、当技術分野で公知の他の機械学習方法を使用することもできるであろう。

【0227】

図６の解析方法が図９の実験的に決定された入力シグナル１１に適用される例がここで
説明されることになる。上記のように、状態検出ステップＳ１により導き出される測定の
シリーズ１２は図１０に示されている。

【0228】

ポリマーはポリヌクレオチドであり、測定を記述するのに使用されるｋマーモデルは３
マーである。

【0229】

モデル１３は、図１６に示され上に記載されている遷移重み付け１４を含む。

【0230】

前記モデルは、上記の図３４のトレーニングプロセスを使用して決定された放出重み付
け１５を含む。図３５は、小非ゼロバックグランドを有するガウス分布である結果として
得られた放出重み付け１５を示している。

【0231】

図３６は、モデル１３から予測される測定値を用いて、いくつかの実験にわたり集計さ
れた状態データのセクションからの電流測定のオーバーレイを示している。

【0232】

図３７は、既知の配列（参照）と解析ステップＳ２により推定されたｋマー状態の推定
された配列（コール）の状態スペースアライメントを示している。正確に推定されたｋマ
ー状態は大きな点として示されている。見ることができるように、ｋマー状態の良好な推
定が与えられている。

【0233】

図３８は、解析ステップＳ２により推定され、実際の配列と整列させて示されるヌクレ
オチドの推定された配列１６を示している。正確なｋマー状態推定値は「＃」として図示
されている（ｋマー状態を直接塩基と関連付けてきたので、これを示すことができる）。
正確な塩基推定値であるが不正確なｋマー状態推定値は「＊」として図示されている。

【0234】

上記説明は、前記方法が単一入力シグナル１１および測定の単一シリーズ１２に基づい
ているケースに関係している。

【0235】

代わりに、本発明の第一の態様は、それぞれが同じポリマーに関係している測定の複数
のシリーズを使用してもよい。この文脈では、「同じ」ポリマーとは、同じ正体または組
成を有するポリマーであり、物理的に同じポリマーまたは同じ正体を有する物理的に異な
るポリマーである。測定の複数のシリーズは同じポリマーで行ってもよいし、関連する配
列を有する異なるポリマーで行ってもよい。

【0236】

測定の複数のシリーズはそれぞれが同じ技法で行ってもよいし、異なる技法で行っても
よい。測定の複数のシリーズは同じ測定システムで行ってもよいし、異なる測定システム
で行ってもよい。

【0237】

測定の複数のシリーズは、同じポリマーの同じ領域で同時に行われる異なる種類、例え
ば、同時に行われる膜貫通電流測定とＦＥＴ測定であっても、または同時に行われる光学
的測定と電気的測定であってもよい（Heron AJ et al.、J Am Chem Soc. 2009;131(5):16
52-3）。所与のポリマーまたはその領域を１回よりも多くポア中を通って移行させること
により複数の測定を次々に行うことも可能である。これらの測定は同じ測定でもまたは異
なる測定でもよく、同じ条件下でもまたは異なる条件下でも行うことができる。

【0238】

測定の複数のシリーズは関係のあるポリマーの領域で行いうる。このケースでは、測定
のシリーズは、関係のある配列を有する別々のポリマーの測定でもよくまたは関係のある
配列を有する同じポリマーの異なる領域の測定でもよい。後者の例として、関係が配列が
相補的であるという場合に、ポリヌクレオチドについて提唱された技法が使用されること
もある。このケースでは、センス鎖とアンチセンス鎖が、ポリヌクレオチド結合タンパク
質を使用してまたはポリヌクレオチド試料調製を介して順次読み取られうる。特許仮出願
第６１／５１１４３６号またはＷＯ－２０１０／０８６６２２に提示されているいかなる
方法でも使用してセンス鎖とアンチセンス鎖を読み取らせてもよい。

【0239】

この例として、図６に図示されている方法は、状態検出ステップＳ１において処理され
うる複数の入力シグナル１１に適用して、測定の複数のシリーズ１２を提供しもよい。こ
のケースでは、上に詳細に記載されているように、それぞれの入力シグナル１１および測
定のシリーズ１２は、同じポリマーの同じ領域の測定であることにより、または同じポリ
マーもしくは異なるポリマーの異なっているが関係のある領域（例えば、ＤＮＡ鎖および
相補的ＤＮＡ鎖）の測定であることによりのいずれかで前記ポリマーと関係している。

【0240】

このケースでは、解析方法は基本的に同じであるが、測定のそれぞれのシリーズ１２か
らの測定は、複数のそれぞれの次元で配置されているステップＳ２における解析技法によ
り扱われる。

【0241】

これは、解析ステップＳ２においてそれぞれの入力シグナル１１と測定のシリーズ１２
を別々に処理するよりはかなり有利である。解析のこの初期段階で測定のシリーズ１２か
らの情報を組み合わせることにより、根底にあるポリマー単位のより正確な推定を行うこ
とが可能である。解析プロセス初期の情報を組み合わせると、解析プロセスの終了時に測
定のシリーズ１２と組合せを独立に処理するよりも正確な出力が可能になる。これは、根
底にあるポリマー関係による以外に、測定のシリーズ１２が関係があるといういかなる要
件もなしで達成されうる。確率的技法または他の解析技法でも、解析が、測定の関係のあ
るシリーズ１２の位置合わせまたはアライメントを推定することが可能になる。測定のど
んなシリーズでも他の任意の測定のシリーズに位置合わせをすることは先験的に分かって
いることもあれば分かっていないこともあることに注目するのは重要である。位置合わせ
がないケースでは、シリーズ内のそれぞれの測定は別のシリーズからの測定と先験的に対
になっていない。

【0242】

数学的に言えば、２つのそれぞれの次元に配置されている測定のシリーズ１２を扱う解
析ステップＳ２の拡張は単刀直入である。放出重み付け１５は複数の次元で起こり、測定
のシリーズ１２ごとに１つの次元である。方法が、登録されている測定の複数のシリーズ
１２で実施され、したがってそれぞれのシリーズからのどの測定が対応しており同じｋマ
ーに依拠しているのかが先験的に分かっているケースでは、モデル１３を、放出重み付け
１５をｋマー状態ごとの複数の測定の分布を記述している確率密度関数として複数の次元
で使用して適用しうる。

【0243】

これとは対照的に、方法が登録されていない複数のシリーズで実施され、したがってそ
れぞれのシリーズからのどの測定値が対応しており同じｋマーに依拠しているのかが先験
的に分かっていないケースでは、前記方法は、以下の通りに、測定の複数のシリーズを、
複数のそれぞれの次元で配置された全体として扱う。

【0244】

放出分布のそれぞれの次元は、スキップ状態で増大され、多次元重みはその発生の可能
性を表す。個々のシリーズでスキップが起こる場合、放出分布は対応する次元での測定値
よりはむしろ「スキップ」シグナル状態を放出するように取られる。これら「スキップ」
状態は観測可能ではなく、これらの状態の未知の数および位置が位置合わせ問題を引き起
こす。解析ステップＳ２は、測定の複数のシリーズ１２がｋマーおよびポリマー単位の異
なる配列から導き出される尤度およびこれらの測定間の異なる位置合わせではそれぞれの
位置合わせが放出分布において潜在している可能性に基づいて実施される。

【0245】

登録されたケースでも非登録のケースでも、測定の複数のシリーズ１２が同じ特性（例
えば、同じポリマーの繰返し測定について）の等しい測定である場合、それぞれのシリー
ズ１２に関する放出重み付け１５は同じであってよい。測定の複数のシリーズ１２が異な
る特性（例えば、同じポリマーの異なる測定について、またはポリマーの異なっているが
関係のある領域の測定について）の測定である場合、それぞれのシリーズ１２に関する放
出重み付け１５は異なっていてもよい。

【0246】

上記のグラフィックモデルＢを考慮すると、概念的にはモデルは、Ｘ_ｉがここでは単一
の値というよりむしろ値のベクトルを表すこと以外は同じである。ＨＭＭのケースでは、
１次元確率密度関数ｇ（）からの状態放出値というよりはむしろ、値は複数次元密度関数
から放出され、例えば、センス鎖およびアンチセンス鎖の測定のケースでは、Ｘ_ｉは電流
ペア（Ｘ_ｉｓ，Ｘ_ｉａ）を放出し、Ｘ_ｉｓはセンス鎖からの電流読取りでありＸ_ｉａは相
補的ｋマーに対するアンチセンス鎖からの読みである。この放出された電流ペアは、観測
されないスキップ状態ならびに実際の電流測定を含有していてもよい。基本的な１次元ケ
ースと同じように、外れ値および失われたデータまたは読み飛ばされた状態をモデル化す
ることができる。

【0247】

有利なことに、ポリマーのうちの１つでのスキップは関係するポリマーからの情報を使
用して埋めることができる。例えば、センス－アンチセンスデータに関しては、２次元密
度ｇ（）がスキップを非ゼロ確率で１次元に放出し、その間電流をもう一方の次元からサ
ンプリングすることを可能にすることにより、スキップをアンチセンスではなくセンスに
おいて（またはその逆）放出してもよく、したがって、Ｘ_１は形式（Ｘ_１ｓ，Ｘ_１ａ）、
（Ｘ_１ｓ，－）または（－，Ｘ_１ａ）（－は観測されないスキップを表す）の電流ペアを
放出しうる。さらに、両方のポリマーにおけるスキップもモデル化し、１Ｄケースにおけ
るのと同じように補正することができる。ここで、測定の１つのシリーズにおける「ステ
イ」も、その他のものについてのスキップ状態を放出することによりモデル化することが
できる。

【0248】

前記１次元ＨＭＭからの利点はすべてこの複数次元ＨＭＭに移動する。同様に、２つの
別々の１次元ＨＭＭを実行し次にアライメント技法を通じて底空間で整列させることより
も利点がある。

【0249】

単なる例として、複数の次元で配置された測定にビタビアルゴリズムを適用することが
考察される。ビタビアルゴリズムは当技術分野では周知である。１次元ＨＭＭでは、最も
可能性の高い経路がそれぞれの可能なｋマーＫで終わる尤度Ｌ_ｉ（ｋ）は、最初の状態か
ら最後の状態へ状態配列の中を前方に移動するそれぞれの状態ｉ（ｉ＝１．．．ｎ）ごと
に計算される。測定の複数のシリーズ間の位置合わせの欠如によって、そのような経路は
すべて考慮しなければならない。値Ｌ_ｉ（Ｋ）はすぐ前を先行する状態からの値Ｌ_ｉ－１
（．）のみを遷移および放出確率と共に使用し、再帰を形成して計算することができる。
ｍ次元ＨＭＭでは、類似するスキームを使用しうる。スキップが組み込まれるためには、
ｍ個のインデックスがあり、したがって、Ｌ_{ｉ１，ｉ２，．．．ｉｍ}（Ｋ）は、次元１に
おける状態ｉ１、次元２における状態ｉ２などを記述する最大尤度である。それは可能な
あらゆる量Ｌ_{ｊ１，ｊ２，．．．ｊｍ}（Ｋ）を調べることにより再帰的に計算することが
でき、スキップが次元１で放出されるならばｊ１＝ｉ１または状態が次元１において放出
されるならば（ｉ１－１）であり、ｊ２、ｊ３、等についても同様である。

【0250】

この解析法は、それぞれの入力シグナル１１および測定のシリーズ１２が同じポリマー
の同じ領域の測定である場合に適用しうる。例えば、ポリマーまたはポリマーの領域が再
読取りされるシステムでは、これらの読みは組み合わせることができ、位置合わせまたは
アライメントを推定して根底にあるｋマー状態をさらに正確に決定することができる。前
記方法は、異なる条件下でまたは組み合わされる異なる方法により行われる測定も可能に
する。

【0251】

上で考察されたように、例えば、測定の複数シリーズが複数の電気的測定または電気的
および光学的測定を含む場合、複数の測定も同時に行いうる。これらの読みは組み合わさ
れるおよび／または位置合わせもしくはアラインメントが推定されて根底にあるポリマー
配列をより正確に推定することができる。

【0252】

代わりに、測定の複数のシリーズ１２は集合されて、１次元測定として解析ステップＳ
２により使用される測定のサマリーシリーズを提供する。ｍ個の異なる種類の複数の測定
シリーズが存在する場合、同じ種類のすべてのシリーズに集合が適用され、ｍ次元ＨＭＭ
がサマリー状態シリーズに用いることができる。代わりに、複数のシリーズが存在する場
合、それぞれのシリーズまたはそれぞれのサマリー測定シリーズに１次元ＨＭＭを実行し
てよく、これらの解析からの出力に基づいてコンセンサスコールが行われる。

【0253】

この解析法は、入力シグナル１１および測定の２つのシリーズを含む測定のシリーズ１
２にも適用することができ、測定の第１のシリーズはポリマーの第１の領域の測定であり
、測定の第２のシリーズは前記第１の領域に関係しているポリマーの第２の領域、例えば
、同じポリマーまたは異なるポリマーの相補的領域の測定である。

【0254】

この技法は、ＤＮＡ配列の相補的対、すなわち、「センス」鎖およびその相補的「アン
チセンス」鎖への特定の適用を有する。

【0255】

２つの別々の１次元ＨＭＭおよび次にアライメント技法を通じた底空間で整列させるこ
とにまさる２次元アプローチの利点はここで説明されることになる。

【0256】

極度に単純化した説明として、センス鎖上でのＨＭＭからＰｒ（ＡＡＡＣＡＡＡ）＝０
．６、Ｐｒ（ＡＡＡＧＡＡＡ）＝０．３９、Ｐｒ（ＡＡＡＡＡＡＡ）＝０．０１およびア
ンチセンス鎖上でのＨＭＭからＰｒ（ＴＴＴＴＴＴＴ）＝０．６、Ｐｒ（ＴＴＴＣＴＴＴ
）＝０．３９、Ｐｒ（ＴＴＴＧＴＴＴ）＝０．０１が想定されている。センスおよびアン
チセンスについて最も可能性の高い配列が取られ、センス－アンチセンスペアとして整列
されるように企てられた場合、配列の中間の塩基でクラッシュ（clash）が得られる。２
次元ＨＭＭは、配列の飛び抜けて最も可能性の高い一貫したペアは（ＡＡＡＧＡＡＡ、Ｔ
ＴＴＣＴＴＴ）であることを見つけ、配列ペア（ＡＡＡＣＡＡＡ、ＴＴＴＧＴＴＴ）およ
び（ＡＡＡＡＡＡＡ、ＴＴＴＴＴＴＴ）には低い確率を割り当てると考えられる。

【0257】

この極度に単純化した説明では、２番目に可能性が高い配列はそれぞれの１次元ＨＭＭ
により問題を解決すると見なされるが、さらに長い配列についてのすべての必要なポリマ
ー単位推定を一通り調べるのはすぐに非現実的になる。さらに、ポリマー単位を推定する
ためのいくつかの方法（例えば、ビタビ）は最も確実な経路を放出するだけで、ポリマー
単位を推定した後の可能性のより低い配列の組合せは不可能になる。

【0258】

ビタビアルゴリズムを使用するセンス－アンチセンスケースの特定の詳細な例は、改良
を実証するためにここで説明される。

【0259】

センス－アンチセンスのケースでは、上記のｍ次元ケースは、ｍ＝２について使用され
、Ｌ_ｉｊ（Ｋ）は、状態がセンスのみにより、アンチセンスのみにより、または両方によ
り放出されるのかに応じて、値Ｌ_{ｉ－１，ｊ}（．）、Ｌ_{ｉ．ｊ－１}（．）およびＬ_ｉ，ｊ
（．）を使用して計算される。

【0260】

図３９は、最も可能性の高いセンスおよびアンチセンス配列の独立したコールが３マー
モデルおよびＨＭＭを使用して行われる例を図示している。ジョイントセンス－アンチセ
ンスコールは上記の２次元ビタビアルゴリズムを使用して行われる。ジョイントコールは
正確で例外は非常に少なく、特にセンスコールとアンチセンスコールの両方で不正確にコ
ールされている塩基を正確にコールしている。正確な３マー状態推定値は「＃」で示され
、正確な塩基は「＊」で示されている。この図解では、独立したセンス読取りとアンチセ
ンス読取りの最良の領域を組み合わせても、センス－アンチセンス結果の正確なコールの
数を占めていないことが見て取れる。解析プロセス初期のデータの組合せは、確率的アプ
ローチと組み合わせると、「部分の総和超（more than the sum of the parts）」の結果
をもたらす。

【0261】

この多次元例は、加算された情報が１つの鎖は別の鎖に相補的であることであるセンス
－アンチセンスＤＮＡのケースのためであるが、ポリマーの領域間の他の関係は多次元ア
プローチにおいてコード化しうる。コード化できるであろう別の種類の情報の例は、ポリ
マー中の構造情報である。この情報は、機能的構造体を形成することがわかっているＲＮ
Ａに存在しうる。この情報は、ポリペプチド（タンパク質）にも存在しうる。タンパク質
のケースでは、構造情報は、疎水性領域または親水性領域に関係していてもよい。前記情
報は、アルファへリックス、ベータシートまたは他の二次構造に関してでもよい。前記情
報は、結合部位、触媒部位および他のモチーフなどの既知の機能的モチーフに関してでも
よい。

【0262】

本発明の第二の態様および第三の態様に従ってポリマーの測定を行う方法がここで考察
されることになる。下でさらに詳細に考察されるように、これは場合によっては、本発明
の第一の態様に従った上記の方法と組み合わせてもよい。

【0263】

この方法では、測定はナノポア中を流れるイオン電流の測定である。この方法では、ポ
リマーは、ナノポアを横断して電圧が印加されている間にナノポアの中を移行する。測定
はナノポア中のｋマーの正体に依拠している。測定はナノポアを横断する異なるレベルの
電圧の印加下で行われる。そのような測定により、単なる重複性ではなく追加の情報が与
えられることは本発明者らにより認識されていた。この利点のいくつかの特定の実証がこ
こで説明されることになる。

【0264】

最初の例は、付加電位下で測定システム中に静止して保持されたＤＮＡの鎖であるポリ
マーのイオン電流測定の分解を図示している。この例では、電流が最初の通常の電圧レベ
ルでは互いに類似しているＤＮＡ配列は、第２の電圧レベルで記録することにより分解さ
れた。

【0265】

ＤＮＡ鎖は、Proc Natl Acad Sci U S A. 2009 May 12;106(19):7702-7に既に報告され
ている方法に類似するストレプトアビジンアンカーを使用してナノポア中に保持された。
ＤＮＡの個々の鎖が当技術分野で公知の方法を使用してＤＰｈＰＣ二重層に包埋された単
一ＭＳ－（Ｂ１）_８ナノポア中で測定される場合、ラン（run）が収集された。電圧はナ
ノポアを横切って印加され、電流はナノポアのどちら側でも塩溶液中のイオンの動きから
生み出された。

【0266】

ラン条件は、４００ｍＭＫＣｌ、１０ｍＭＨｅｐｅｓ、ｐＨ８．０、＋１８０ｍＶ
であった。対照配列（ＴＳ０１）はストレプトアビジンと一緒に２対１比でインキュベー
トされ、チャンバーに添加されて最終濃度２００ｎＭＤＮＡを得た。分析物配列はスト
レプトアビジンと一緒に２対１比でチャンバーに添加され、最終分析物ＤＮＡ濃度４００
ｎＭを得た。両方のケースで、ビオチン化ＤＮＡとストレプトアビジンは、チャンバーへ
の添加に先立って５分間インキュベートされた。シングルチャネルレコーディングは、＋
１８０ｍＶ（２秒）から－１８０ｍＶ（０．２秒）まで付加電位を変化させる自動化手順
を使用して実施された。正の付加電位を使用して捕捉してＤＮＡレベルを読取り、負電位
を使用してナノポアからストレプトアビジン－ＤＮＡ複合体を排出した。

【0267】

ＤＮＡ結合事象（状態）ごとの平均電流は以下の通りに調べられた。

【0268】

ＴＳ０１対照と分析物配列からの集団が記録された。分析物配列電流レベルは、以下の
関係
Ｉ_{ＤＮＡＡｊｕｓｔｅｄ}＝Ｉ_{ＤＮＡＲｅｃｏｒｄｅｄ}－Ｉ_ＴＳ０１＋３２．２ｐＡ
を使用することにより調整された。このプロセスは、広範囲の様々なＤＮＡ配列について
繰り返された。例として、表２は、＋１８０ｍＶの電圧で測定された場合、調整された電
流レベルが類似する大きさ（５４．５±０．５ｐＡ）を示した選択された配列を提示して
いる。

【0269】

【表2】

【0270】

それに続く実験では、ＤＮＡの同じ鎖はすべて、脂質膜に包埋された単一ＭＳ－（Ｂ１
）_８ナノポアを含有するチャンバー中に置かれた。条件は、上記条件の４００ｍＭＫＣ
ｌ、１０ｍＭＨｅｐｅｓ、ｐＨ８．０、＋１８０ｍＶに類似していた。分析物配列はす
べてストレプトアビジンと一緒に２対１比でチャンバーに添加され、最終濃度は分析物Ｄ
ＮＡごとに２００ｎＭＤＮＡであった。ＴＳ０１はこの実験では添加されなかった。ビ
オチン化ＤＮＡとストレプトアビジンは、チャンバーへの添加に先立って５分間インキュ
ベートされた。

【0271】

ＤＮＡ識別に対する付加電位の効果を調べるため、この実験では電圧を変化させた。シ
ングルチャネルレコーディングは、付加電位を＋Ｘ（２秒）から－Ｘ（０．２秒）まで変
化させる自動化手順を使用して実施され、Ｘは１４０ｍＶ、１８０ｍＶおよび２２０ｍＶ
である。シングルチャネルデータは、Ｘの値ごとにおよそ３０分間記録された。

【0272】

ＤＮＡ結合事象（状態）ごとの平均電流レベルが記録され、それぞれ＋１４０ｍＶ、＋
１８０ｍＶおよび＋２２０ｍＶの正電位に関して図４０に示されているヒストグラムのセ
ットにプロットされている。これらの結果を考慮すると、＋１８０ｍＶでのデータは予想
通りに振る舞っており、表１．１の１１の鎖すべてが非常に類似する電流レベルを生じて
いることは明白である。＋２２０ｍＶでは、電流レベルヒストグラムが広がるまたは散ら
ばっており、レベルが分離していることが示唆される。＋１４０ｍＶでも、広がるまたは
散らばっており、同様に電流レベルは明らかに多数のはっきり異なる集団に分解している
。これらの結果から、＋１８０ｍＶではできなかった多くのＤＮＡ鎖を＋１４０ｍＶでは
互いに区別することができることが示唆される。実験の容易さのために、これはナノポア
中で静止している鎖を用いて実施された例であるが、ＤＮＡ鎖が異なればナノポア中の関
連のある位置で提供されるｋマーも異なり、イオン電流に影響を与えるので、ＤＮＡ鎖の
異なるｋマーにより生み出されるイオン電流間の類似の分離はポア中を動的に移行すると
予測される。

【0273】

第２の例は、付加電位下で測定システム中で静止して保持されるＤＮＡの鎖であるポリ
マーのイオン電流測定の分離を図示している。この例では、異なる電圧レベルでのイオン
電流の測定は異なるｋマーを分解することが示されている。

【0274】

第２の例では、所与の鎖の電流レベルに対する付加電位の効果を決定するために、ＤＮ
Ａ配列はすべての可能なトリプレットを含有するように選択された（ド・ブラン、ＧＴＡ
Ｃ、ｋ３、配列番号５）。
配列番号５（ｋ３ド・ブラン）
ＡＴＡＡＧＡＡＣＡＴＴＡＴＧＡＴＣＡＧＴＡＧＧＡＧＣＡＣＴＡＣＧＡＣＣＴＴＴＧＴ
ＴＣＴＧＧＴＧＣＴＣＧＴＣＣＧＧＧＣＧＣＣＣＡＡＡＴ

【0275】

鎖の動きから生じるどんな可能な複雑化もなく電流レベルの効果を評価するために、一
連の異なるＤＮＡ鎖が設計された。これらの鎖はそれぞれが、３’末端にビオチン－ＴＥ
Ｇリンカー、ｋ３ド・ブラン配列の一部（３５ヌクレオチド長）、およびＤＮＡをナノポ
ア内に通すのを支援する低二次構造を有するセクション（１０ヌクレオチド長）を含有し
ていた。ｋ３ド・ブランを含有するセクションの配列は、配列が鎖あたり１ヌクレオチド
移動されるように変化させた。リーダーセクションは、ド・ブランセクションにハイブリ
ダイズしないように選択された。これらのコードおよび対応する配列は表３に収載されて
いる。

【0276】

【表3A】

【表3B】

【表3C】

【0277】

表３に示される鎖の電流レベルは、第１の例に記載されるアプローチに類似するアプロ
ーチを使用して得られた。ＴＳ０１鎖は内部対照としてチャンバーに添加され、電流レベ
ルはこの対照に対して較正された。この実験で使用される方法と第１の例で使用された方
法の間には２つの主な違いが存在していた。第１の違いはナノポアがＭＳ－（Ｂ１－Ｌ８
８Ｎ）_８ミュータントに変えられていることであった。第２の違いは、適用された電圧ス
キームであった。これは、電流が４つの異なる付加電位で順次記録されるように選択され
た。ナノポアがＤＮＡを捕捉する速度は付加電位に依拠しているので、最も大きな電位が
最初に記録された。選択された電圧スキームは、＋１８０ｍＶ（２．２秒）、＋１４０ｍ
Ｖ（０．４秒）、＋１００ｍＶ（０．４秒）、＋６０ｍＶ（０．４秒）、－１８０ｍＶ（
０．８秒）であった。

【0278】

図４１は、下のトレースでは印加電圧の例を、上のトレースでは同じ時間スケールにわ
たるＳＤ０１鎖について得られ測定されたイオン電流を示している。図４１のこの例に見
られるように、結合事象は＋１８０ｍＶの初期間中に起こり、イオン電流の降下を生じる
。それに続く期間で電位が下がるに従って、観測されるイオン電流は減少する。最終期間
は、逆になった電圧はＤＮＡ鎖を排出する。

【0279】

ＤＮＡ鎖ＳＤ０１～ＳＤ５４のすべてについて類似するパターンが観測され、それぞれ
の電圧での測定されたイオン電流レベルは表３に収載されている。

【0280】

このデータのグラフィック表示を提供するため、図４２から４５は、それぞれ４つのレ
ベルの電圧で、順次水平方向に表示されたＤＮＡ鎖ごとの測定された電流の散布図である
。見て取れるように、散布図の形状は電位が変わるに従って変化する。それは、異なる電
圧での測定が、例えば、別の電圧では分解することができない２つの状態を分解する１つ
の電圧での測定により追加の情報を提供することになることを暗示している。

【0281】

同じデータの別の表示を与えるため、図４６は印加電圧に対するそれぞれの鎖の測定さ
れた電流のグラフである。前記データは、それぞれの電圧での鎖ごとの点からなり、鎖ご
との点はグラフでは線で繋がれて鎖ごとの傾向を示している。図４６におけるこの表示は
変動の２つの主要な特長を図示している。

【0282】

第１の特長は、電圧が増大するに従って全体では異なる鎖についての測定された電流の
広がりが増大することである。この全体の傾向は一般的に興味深い。これは、電圧の最適
の選択に影響を与えると考えられるが、状態間の分離におよび個々の状態の測定の標準偏
差にも依拠している状態間の分解の変化を示している可能性がある。しかし、全体の傾向
は複数の電圧を使用する有益性を実証するものではない。

【0283】

第２の特長は、個々の鎖についての測定された電流が印加電圧への異なる依存度での挙
動を示していることである。したがって、全体の傾向が電圧の増大に従って分岐すること
であるが、すべての鎖ごとの電流測定は同じ傾向を示してはいない。鎖についての測定は
相互に分岐していないが、代わりに個々の鎖に変動がある。それどころか、一部の鎖は電
圧と共に一般的線形変化を示しているが、他の鎖は非線形または振動性の変化を示し、い
くつかのケースでは変曲点がある。全体的な分岐傾向に対して、一部の鎖に関する線は収
束している。この観測の理由は重大ではないが、これは、異なる電圧の印加下での測定シ
ステムの物理的および／または生物学的変化により、おそらくナノポア中のＤＮＡの立体
構造変化により引き起こされると推測される。

【0284】

この第２の特長は、１つよりも多い電圧での測定が単に重複しているというよりはむし
ろ追加の情報を提供することである。異なる電圧でのイオン電流測定により異なる状態の
分解が可能になる。例えば、１つの電圧では分解できないいくつかの状態を別の電圧では
分解することができる。

【0285】

第２の例でのいくつかの追加の観測により、状態の標準偏差（または分散）に対する電
圧を変えることの効果が調べられる。これらの状態の分散は、電流の分散がＤＮＡ鎖の制
御された動き（例えば、酵素制御されたＤＮＡ移行）に類似する時間尺度であるときには
問題を引き起こすことがある。このレジメでは、電流レベルの変化がそれぞれの状態内の
分散またはＤＮＡのネット運動（net movement）のためあるかどうかを決めるのは困難に
なる。この理由で、第２の例で収集されたデータは、移行を制御する酵素を使用するので
はなく、ストレプトアビジンによりナノポア上に保持された鎖を使用して収集された。し
たがって、電流変化が鎖の動きから生じたのかまたはその電流状態の固有の特性から生じ
たのかどうかを描写するように電流レベルの分散を変化させることができるシステムがあ
るのが望ましい。

【0286】

状態分散に対する付加電位の効果を評価するため、第２の例の結果は解析されて、表３
のＤＮＡ配列ごとに平均標準偏差を導き出した。図４７は、印加電圧に対するそれぞれの
鎖の標準偏差のグラフである。データは、それぞれの電圧での鎖ごとの点からなり、鎖ご
との点はグラフでは線で繋がれて鎖ごとの傾向を示している。電流レベルの分散は付加電
位と共に確かに変化することは、図４７から明らかである。大多数の鎖では、分散は付加
電位の増大と共に増加するが＋１８０ｍＶから＋２２０ｍＶまで急上昇する。この変化は
上記の電圧に合わせた電流の変動に類似する原因を有すると推測される。

【0287】

１つよりも多い電圧でイオン電流測定を行う方法であって、本発明の第二の態様および
第三の態様を具体化する方法は、図４８に図示されている。この方法では、付加電位はＤ
ＮＡがナノポア中を通って動いている間変調される。

【0288】

ステップＳ６では、ポリマーはナノポアを横断する電圧の印加下でナノポア内を通って
移行される。

【0289】

ステップＳ７では、移行中、電圧のレベルは周期的に変化される。周期は２つ以上の電
圧レベルを含みうる。電圧レベルは規則的にまたは不規則に繰り返してもよい。この期間
を含めて、周期は個々の観測される状態、すなわち、測定される電流が異なるｋマーに依
拠するようにポリマーが異なる位置である状態よりも短くなるように選択される。したが
って、それぞれの状態中、電圧のレベルが同じである時、例えば、繰り返される周期で、
ナノポア中を流れるイオン電流は同じであることが観察される。言い換えると、イオン電
流は印加電圧と共に循環する。

【0290】

ステップＳ８では、異なる電圧レベルの適用下でのナノポア中を流れるイオン電流はそ
れぞれの状態ごとに測定される。

【0291】

第３の例は、この方法の例が以下の通りに実施された。分析物ＤＮＡ鎖は、上記第２の
例におけるストレプトアビジン系で特徴付けられていた配列を含有するように選択された
。分析物ＤＮＡ鎖は、ナノポア中に通させる５’オーバーハングでの低二次構造配列も含
有していた。相補鎖は分析物鎖にハイブリダイズされた。前記相補鎖は、コレステロール
－ＴＥＧリンカーを含有する短いオリゴがハイブリダイズされる短い５’オーバーハング
も含有していた。コレステロールの組込みにより、ＤＮＡは二重層に繋ぎ止められ、必要
なＤＮＡの濃度が大幅に減少する。表４は、この例で使用される分析物ＤＮＡ鎖の配列を
収載している。

【0292】

【表4】

【0293】

実験設定は上記に類似しており、溶液は、４００ｍＭＫＣｌ、１０ｍＭＨｅｐｅｓ
、ｐＨ８．０、１ｍＭＥＤＴＡ、１ｍＭＤＴＴを含有していた。バッファーはチャン
バー内で予備混合溶液の一部として使用された。表４．１において使用されるＤＮＡは１
対１対１比でハイブリダイズされ、予備混合溶液に添加され、ＰｈｉＤＮＡＰも添加さ
れ、予備混合溶液は室温で５分間混合させておいた。単一のＭＳ－（Ｂ１－Ｌ８８Ｎ）_８
チャネルが得られ、予備混合物を添加して、０．５ｎＭの最終溶液ＤＮＡ濃度および１０
０ｎＭの最終溶液Ｐｈｉ２９ＤＮＡＰ濃度が得られた。

【0294】

印加電圧は、それぞれ１０ｍｓの長さの＋１８０ｍＶと＋１４０ｍＶの交互パルスを含
む周期で適用された。

【0295】

図４９は、結果の図解部分を示しており、特に、下トレースでは印加電圧、および上ト
レースでは得られ測定されたイオン電流を示している。事象はＰｈｉ２９ＤＮＡＰ－Ｄ
ＮＡ複合体から見られた。図４９では、付加電位の両方で、状態、例えば、標識された状
態１から３を観測することができた。それぞれの状態中、連続する周期においてそれぞれ
の電圧レベルで流れるイオン電流は同じである。それぞれの状態で、＋１４０ｍＶおよび
＋１８０ｍＶの付加電位での電流レベルは、鎖が一貫した位置にあり、ポア中の単一分子
上２つの電圧で読みを与える間順次得られ、これは状態の期間よりも短い周期期間により
達成される。容量性遷移は付加電位が変えられる直後に観察することができる。これは、
脂質二重層上に蓄えられた電荷が変化する時に起きる。この容量性遷移の持続時間は脂質
膜のサイズに依拠し、さらに小さな膜サイズに進むことにより減らすことができる。この
実験では、脂質膜は、直径５０μｍの開口部にわたって浮遊させた。

【0296】

ＤＮＡは付加電位下Ｐｈｉ２９ＤＮＡＰの中を通って引っ張られるので、鎖が１つの
位置から別の位置に動くときに起こる状態間の遷移を観察することも可能である。前記遷
移により付加電位ごとに観察される電流が変化する。

【0297】

図４９の例は、状態２と隣接する状態１および３における測定されるイオン電流間の違
いは＋１４０ｍＶの印加電圧よりも＋１８０ｍＶの印加電圧でのほうがはるかに大きいと
いう点で、複数の電圧を使用する利点も図示している。これにより、＋１４０ｍＶの印加
電圧よりも＋１８０ｍＶの印加電圧で状態１と３から状態２を分解するほうが容易になる
。逆に、＋１８０ｍＶの印加電圧よりも＋１４０ｍＶの印加電圧で他の状態を分解するほ
うが容易である。

【0298】

図５０は、図４９と同じ種類のプロットにおいて、第３の例で記載された条件に類似す
る条件下で、しかし、ＭＳ－（Ｂ１－Ｌ８８Ｎ）_８の代わりにＭＳ－（Ｂ１）_８ポアを使
用して得られた結果の別の図解部分を図示している。図５０は図４９に類似する全体的な
形を有し、今回は、状態１から状態４と名付けられた４つの状態を含む。このケースでは
、＋１４０ｍＶの印加電圧での状態２と隣接する状態３の測定されたイオン電流間にはほ
とんど違いはないが、＋１４０ｍＶの印加電圧では大きな違いが存在する。このケースで
は、＋１４０ｍＶでは状態２を状態３から分解するのは困難であるまたは不可能でさえあ
るが、これは＋１８０ｍＶでは可能になる。再び、＋１８０ｍＶの印加電圧よりも＋１４
０ｍＶの印加電圧で他の状態を分解するほうが容易である。

【0299】

上で実証され考察された複数レベルの印加電圧を使用して得られた追加の情報は、ポリ
マーについての情報を導き出すために測定されたイオン電流が解析される時には利点を提
供する。

【0300】

測定を解析する１つの方法は、本発明の第一の態様に従って方法、例えば、第一の態様
を（図６およびそれに続く図を参照して）具体化する上記の方法を適用することである。
したがって、本明細書に記載される方法の様々な特長はいかなる組合せでも組み合わせう
る。このケースでは、複数の電圧を使用することにより得られる追加の情報は推定の正確
度を改善する。

【0301】

本発明の第一の態様に従った解析法は、ポリマーの少なくとも一部の配列を、したがっ
て、正体を決定する。しかし、第二の態様および第三の態様に従った方法も、ポリマーの
少なくとも一部の正体を決定する測定を解析する他の方法において利点を提供し、その利
点のいくつかの非限定的例は以下の通りである。

【0302】

測定を解析して、本発明の第一の態様に従った技法以外の技法を使用してポリマーの少
なくとも一部のポリマー単位の配列を推定しうる。

【0303】

測定を解析して、ポリマー単位の配列の完全な推定を提供せずにポリマーの少なくとも
一部の正体を推定しうる。これらの種類の解析では、複数の電圧を使用することにより得
られる追加の情報は推定の正確度を改善する。

【0304】

代わりに、測定を解析して、状態間の遷移のタイミングを導き出しうる。これらのタイ
ミングはそれ自体が価値があり、またはさらなる解析において使用して、例えば、ポリマ
ー単位の正体を決定しうる。この種類の解析では、追加の情報は遷移を検出する能力を改
善する。一部の遷移は１つの電位で観測するほうが容易であり、他の遷移はもう一方の電
位で観測するほうが容易である。例として、図５０の図解的結果では、状態２から状態３
への遷移は＋１４０ｍＶで観測するのは困難であるが、＋１８０ｍＶでは容易に観測され
る。これとは対照的に、状態３から状態４への遷移は＋１８０ｍＶでは弱いが、＋１４０
ｍＶでは容易に観測される。したがって、１つよりも多い電位で記録するのには状態検出
に対する利点が明らかに存在する。

【0305】

いくつかの解析方法では、異なるレベルでの測定は両方とも、例えば、ポリマーの少な
くとも一部の正体の決定に両方とも同じように寄与する別々の測定として直接使用される
。他の解析方法では、異なるレベルでの測定、例えば、正体を決定するのに使用される１
つのレベルで行われる測定およびその結果を確認するのに使用される異なるレベルで行わ
れる測定は異なるやり方で使用しうる。代わりに、１つのレベルでのノイズは、１つの電
圧での特定の測定を使用することを決定するため、別のレベルでのノイズと比較されるこ
とがある。代わりに、解析方法は、それぞれのｋマーについての異なるレベルでの測定間
の選択とそれに続くポリマーの少なくとも一部の正体を決定するための選択された測定の
使用を含んでいてもよい。

【0306】

異なるレベルでの２つの測定の使用により得られる追加の情報の程度はｋマー間で変わ
ることがある。そのケースでは、異なる数のレベルでの測定は異なるｋマーについて使用
され、例えば、いくつかのｋマーについて、減少した数のレベル、おそらく、１つだけの
レベルでの測定を使用し、一方、他のｋマーについてさらに多くのレベルでの測定を使用
することがある。この方法は、高分散状態にまたは類似の電流レベルを有するそれぞれの
状態に特に有用でありうる。

【0307】

異なるレベルでの測定が使用される場合、異なる重み付けが異なる測定に付けられるこ
とがある。

【0308】

それでもなお、解析方法が様々な形で測定を使用しうるという事実にもかかわらず、い
くつかのｋマーに関する異なるレベルでの測定はある方法で使用される。

【0309】

本発明に従った２つの非限定的例がここで説明される。これらの例は両方とも、それぞ
れの電位での状態あたり典型的には少なくとも１つの測定があるケースに適用される。

【0310】

最初の例では、複数のレベルでの測定が使用されて、状態遷移を決定する。これは、状
態遷移がある電位では観測可能であるが別の電位では可能ではないことがあるという事実
を利用する。測定は、状態からの遷移の可能性が高い、状態検出ステップＳ１を含む上記
の解析方法を受けることができる。図５０では、例えば、状態についてのそれぞれの電位
での全データの平均をとることにより、トレースはそれぞれ１４０および１８０ｍＶでの
２つの測定に減らしてもよい。次に、これらの測定は２セットの放出分布から同時発生（
すなわち、密に結合した次元）として扱われ、１Ｄケースに類似するセットの遷移で解析
されてもよい。これは、我々が単一の電位で状態を１回よりも多く測定するケース、例え
ば、平均と分散に実行が類似している点に注目されたい。実際、我々は、例えば、それぞ
れの電位での平均と分散を考慮することによりこのアプローチを４つの密に結合された次
元まで広げることがある。

【0311】

第２の例では、状態間の遷移は、ステップＳ１が省かれる上記ケースに似て、別々のス
テップとしてというよりむしろ解析段階中に推定される。この例では、単純にするため、
我々は、電位周期のそれぞれのステップでの測定のシリーズを単回測定まで減らしたケー
ス、例えば、平均を考慮することになる。再び、図５０を参照して、状態１は１４０から
１８０ｍＶに交互に代わる２８の測定からなる。したがって、測定ごとの放出確率は適切
な放出（１４０ｍＶまたは１８０ｍＶ）およびこのデータに適している遷移に関して計算
される。例えば、この状態からのおよそ０．０５の全遷移確率が適切でありうる。このア
プローチは、それぞれの周期からのサマリー測定またはそれぞれの周期からの複数のサマ
リー測定よりはむしろそれぞれの測定を考慮するように一般化されてもよい。

【0312】

本発明の第二の態様に従って異なる電圧で測定を行う方法では、ポリマーがナノポア中
を通って移行される間付加電位が循環される本発明の第三の態様に従った方法を適用する
のが有利であるが、代わりに他の方法を使用しうる。

【0313】

非限定的例として、本発明の第二の態様に従って１つよりも多い電圧でイオン電流測定
を行う１つの別の方法は、図５１に示されており以下の通りに実施される。

【0314】

ステップＳ９では、ポリマーはナノポア中を通って移行され、ステップＳ１０では、移
行中単一レベルの電圧がナノポアを横断して印加されそのレベルの電圧の印加下でナノポ
ア中を流れるイオン電流が観測されるそれぞれの状態ごとに測定される。次に、前記方法
は同じポリマーを移行させるステップＳ９およびステップＳ１０を繰り返すが、異なるレ
ベルの電圧を印加する。ステップＳ９およびＳ１０は、いかなる数の回数でも繰り返して
、いかなる数の電圧レベルでイオン電流測定を得てもよい。

【0315】

望ましいのは、毎回同じポリヌクレオチドを読み取るために、ナノポアを離れるポリマーの能力は制限される。ポリヌクレオチドのケースでは、これは、鎖が離れていかないように電位を制御することにより、または鎖の移行を阻害する、ストレプトアビジンなどの化学的または生化学的ブロック剤を使用することにより実行しうる。
本願は以下の態様にも関する。
（１）ポリマーに関係する少なくとも１つのシリーズの測定からポリマー中のポリマー単位の配列を推定する方法であって、それぞれの測定値が、ｋが正整数であるｋ個のポリマー単位のグループであるｋマーに依拠しており、
可能なｋマーのセットについて、
起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷移重み付け、および
そのｋマーについての所与の測定値を観測する可能性を表すそれぞれのｋマーに関する放出重み付け
を含むモデルを提供するステップ、ならびに
前記モデルを参照する解析技法を使用して測定のシリーズを解析し、測定のシリーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度に基づいて、ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するステップ
を含む方法。
（２）遷移重み付けおよび放出重み付けのうちの少なくとも１つが非２値変数の値を含む、上記（１）に記載の方法。
（３）遷移重み付けと放出重み付けの両方が非２値変数の値を含む、上記（２）に記載の方法。
（４）放出重み付けがあらゆる可能な測定を観測する非ゼロの可能性を表す、上記（１）から（３）のいずれかに記載の方法。
（５）それぞれのｋマーに関する放出重み付けが測定値にわたり単峰性または多峰性分布を有する、上記（１）から（４）のいずれかに記載の方法。
（６）それぞれのｋマーに関する放出重み付けが測定値にわたりガウス分布、ラプラス分布、四角分布または三角分布を有する、上記（５）に記載の方法。
（７）ｋが複数の整数である、上記（１）から（６）のいずれかに記載の方法。
（８）遷移重み付けが、起点ｋマーから、最初の（ｋ－１）個のポリマー単位が前記起点ｋマーの最後の（ｋ－１）個のポリマー単位である配列を有する目的地ｋマーまでの遷移である好ましい遷移の非ゼロ可能性を表し、起点ｋマーから前記起点ｋマーとは異なる配列を有し、最初の（ｋ－１）個のポリマー単位が前記起点ｋマーの最後の（ｋ－１）個のポリマー単位ではない目的地ｋマーまでの遷移である好ましくない遷移のより低い可能性を表す、上記（７）に記載の方法。
（９）遷移重み付けが前記好ましくない遷移のうちの少なくとも一部の非ゼロ可能性を表す、上記（８）に記載の方法。
（１０）遷移重み付けが、起点ｋマーから、最初の（ｋ－２）個のポリマー単位が前記起点ｋマーの最後の（ｋ－２）個のポリマー単位である配列を有する目的地ｋマーまでの好ましくない遷移の非ゼロ可能性を表す、上記（９）に記載の方法。
（１１）解析技法が確率的技法である、上記（１）から（１０）のいずれかに記載の方法。
（１２）遷移重み付けが確率であり、および／または放出重み付けが確率である、上記（１）から（１１）のいずれかに記載の方法。
（１３）モデルが隠れマルコフモデルである、上記（１）から（１２）のいずれかに記載の方法。
（１４）解析のステップが、測定のシリーズがポリマー単位の推定された配列により生み出されるというモデルにより予測される尤度を表す推定された配列またはそれぞれの推定された配列に関してクオリティスコアを導き出すことをさらに含む、上記（１）から（１３）のいずれかに記載の方法。
（１５）解析のステップが、ポリマー単位の推定された配列に対応する個々のｋマーに関するクオリティスコアであって、測定のシリーズが個々のｋマーを含む配列により生み出されるというモデルにより予測される尤度を表すクオリティスコアを導き出すことをさらに含む、上記（１）から（１４）のいずれかに記載の方法。
（１６）解析のステップが、ポリマー単位の推定された配列に対応するｋマーの配列に関するクオリティスコアであって、測定のシリーズがｋマーの所与の配列により生み出されるというモデルにより予測される尤度を表すクオリティスコアを導き出すことをさらに含む、上記（１）から（１５）のいずれかに記載の方法。
（１７）解析のステップがポリマー中のポリマー単位の複数の推定された配列を導き出す、上記（１）から（１６）のいずれかに記載の方法。
（１８）ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するステップが、測定のシリーズが個々のｋマーにより生み出されるというモデルにより予測される尤度に基づいてｋマーの配列を推定するステップ、および
ｋマーの推定された配列からポリマー単位の配列を推定するステップ
を含む、上記（１）から（１７）のいずれかに記載の方法。
（１９）ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するステップが、測定のシリーズがｋマーの全体の配列により生み出されるというモデルにより予測される尤度に基づいてｋマーの少なくとも１つの配列を推定するステップ、および
ｋマーの推定された配列からポリマー単位の配列を推定するステップ
を含む、上記（１）から（１８）のいずれかに記載の方法。
（２０）測定の少なくとも１つのシリーズにおいて、予め定められた数の測定がそれぞれのｋマーに依拠しており、予め定められた数が１以上である、上記（１）から（１９）のいずれかに記載の方法。
（２１）グループにおける測定の数についての先験的知識なしで、複数の測定のグループが同じｋマーに依拠している測定の入力シリーズを含む少なくとも１つの入力シグナルを受けるステップ、および
解析のステップ前に、少なくとも１つの入力シグナルを処理して、連続するグループの測定を同定し、それぞれの同定されたグループに関して前記予め定められた数の測定を導き出し、解析のステップがこのようにして導き出された測定のシリーズまたはそれぞれの測定のシリーズで実施されるステップ
を含む、上記（２０）に記載の方法。
（２２）少なくとも１つのシリーズの測定において、複数の測定のグループが、前記グループにおける測定の数について先験的知識なしで同じｋマーに依拠している、上記（１）から（１９）のいずれかに記載の方法。
（２３）ポリマーの前記測定を行うことをさらに含む、上記（１）から（２２）のいずれかに記載の方法。
（２４）ポリマーの前記測定がナノポア中を通るポリマーの移行中に行われる、上記（２３）に記載の方法。
（２５）ポリマーの移行が、複数の測定のグループが同じｋマーに依拠するように実施される、上記（２４）に記載の方法。
（２６）ナノポア中を通るポリマーの移行は一方向のみに動く様式で実施される、上記（２４）または（２５）に記載の方法。
（２７）ポリマーがポリヌクレオチドであり、ポリマー単位がヌクレオチドである、上記（２４）から（２６）のいずれかに記載の方法。
（２８）測定のシリーズが、ナノポア中を通るポリマーの移行中に行われる測定である、上記（２４）から（２７）のいずれかに記載の方法。
（２９）ナノポアが生物学的ポアである、上記（２４）から（２８）のいずれかに記載の方法。
（３０）測定が、電流測定、インピーダンス測定、トンネリング測定、ＦＥＴ測定および光学的測定のうちの１つまたは複数を含む、上記（２４）から（２９）のいずれかに記載の方法。
（３１）方法が、それぞれが前記ポリマーに関係している測定の複数のシリーズで実施され、それぞれの測定の値がｋマーに依拠しており、
解析技法が、複数のそれぞれの次元で配置されている測定の複数のシリーズを扱う、上記（２４）から（３０）のいずれかに記載の方法。
（３２）測定のそれぞれのシリーズが同じポリマーの同じ領域の測定である、上記（３１）に記載の方法。
（３３）測定の複数のシリーズが測定の２つのシリーズを含み、測定の最初のシリーズがポリマーの第１の領域の測定であり、測定の第２のシリーズが前記第１の領域に関係しているポリマーの第２の領域の測定である、上記（３１）に記載の方法。
（３４）前記第１の領域と第２の領域が同じポリマーの関係する領域である、上記（３３）に記載の方法。
（３５）前記関係する領域が相補的である、上記（３３）または（３４）に記載の方法。
（３６）モデルがメモリに記憶される、上記（１）から（３５）のいずれかに記載の方法。
（３７）モデルを提供し測定を解析するステップが、ハードウェア装置においてまたはコンピュータ装置において実行される、上記（１）から（３６）のいずれかに記載の方法。
（３８）上記（１）から（３７）のいずれかに記載の方法を実施するように構成されたデバイス。
（３９）ポリマー中のポリマー単位の配列を前記ポリマーに関係のある測定の少なくとも１つのシリーズから推定するための解析デバイスであって、それぞれの測定の値が、ｋが複数の整数であるｋ個のポリマー単位のグループであるｋマーに依拠しており、方法が可能なｋマーのセットについて、
起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷移重み付け、および
そのｋマーの所与の測定値を観測する可能性を表すそれぞれのｋマーに関する放出重み付けを含むモデルを記憶するメモリ、ならびに
前記モデルを参照する解析技法を使用して、測定のシリーズを解析し、測定のシリーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度に基づいて、ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するように構成された解析ユニット
を含む、解析デバイス。
（４０）ポリマーの前記測定を行うように構成された測定デバイス、および上記（３８）または（３９）に記載の解析デバイス
を備える塩基配列決定装置。
（４１）ポリマー単位を含むポリマーを解析する方法であって、
ナノポアを横断して電圧が印加されている間にナノポア中を通るポリマーの移行中に、ｋが正整数である前記ポリマーのｋ個のポリマー単位であるナノポア中のｋマーの正体に依拠している測定を行い、前記測定が個々のｋマーに関して、ナノポアを横断して印加される前記電圧の異なるレベルで行われる別々の測定を含むステップ、および
前記電圧の前記異なるレベルで測定を解析してポリマーの少なくとも一部の正体を決定するステップ
を含む方法。
（４２）測定を行う前記ステップが、
異なる移行において電圧がナノポアを横断して異なるレベルで印加されている間に、ナノポア中を通る前記ポリマーの複数の移行を実施するステップ、
前記異なる移行中に、ナノポアを横断する前記電圧の前記異なるレベルでの前記ｋマーの測定を行うステップ
を含む、上記（４１）に記載の方法。
（４３）前記複数の移行がナノポア中を通る第１の方向への移行およびナノポア中を通る前記第１の方向とは反対の方向への移行を含む、上記（４２）に記載の方法。
（４４）測定を行う前記ステップが、
電圧がナノポアを横断して印加されている間に、ナノポア中を通る前記ポリマーの移行を実施するステップ、
ナノポア中を通るポリマーの前記移行中に、前記測定が前記個々のｋマーに依拠している状態の持続期間よりも短い繰返し周期を有する周期で前記電圧の前記異なるレベルを印加するステップ、および前記周期において前記電圧の前記異なるレベルでの前記個々のｋマーに関して前記別々の測定を行うステップ
を含む、上記（４１）に記載の方法。
（４５）ポリマー単位を含むポリマーの測定を行う方法であって、
電圧がナノポアを横断して印加されている間に、ナノポア中を通る前記ポリマーの移行を実施するステップ、
ナノポア中を通るポリマーの前記移行中に、前記電圧の異なるレベルを周期的に印加するステップ、および
ｋが正整数である前記ポリマーのｋ個のポリマー単位であるナノポア中のｋマーの正体に依拠している測定であり、前記測定が個々のｋマーに依拠している状態よりも短い繰返し周期を有する前記周期で前記電圧の前記異なるレベルでの前記個々のｋマーに関する別々の測定を含む測定を行うステップ
を含む方法。
（４６）繰返し周期が最長で３秒である、上記（４４）または（４５）に記載の方法。
（４７）繰返し周期が少なくとも０．５ｍｓである、上記（４４）から（４６）のいずれかに記載の方法。
（４８）前記電圧の異なるレベルがそれぞれ、前記周期の部分的期間連続して印加される、上記（４４）から（４７）のいずれかに記載の方法。
（４９）前記周期における前記電圧の前記異なるレベル間の遷移が、電圧変化により引き起こされる測定の容量性遷移を減少するように形作られる、上記（４８）に記載の方法。
（５０）測定を解析してポリマーの正体を決定することをさらに含む、上記（４５）または（上記（５に付随する場合は上記（４６）から（４９）のいずれかに記載の方法。
（５１）測定を解析してポリマーの正体を推定するステップが、測定を解析してポリマー中のポリマー単位の配列を推定することを含む、上記（４１）から（４４）または（５０）のいずれかに記載の方法。
（５２）測定を解析してポリマー中のポリマー単位の配列を推定するステップが、
可能なｋマーのセットについて、
起点ｋマーから目的地ｋマーまでの遷移の可能性を表す遷移重み付け、および
そのｋマーについての所与の測定値を観測する可能性を表すそれぞれのｋマーに関する放出重み付け
を含むモデルを提供するステップ、ならびに
前記モデルを参照し、ナノポアを横断する電圧の異なるレベルの印加下で行われる測定を扱う解析技法を使用して測定を複数の次元での測定として解析し、測定のシリーズがポリマー単位の配列により生み出されるというモデルにより予測される尤度に基づいて、ポリマー中のポリマー単位の少なくとも１つの推定された配列を推定するステップ
を含む、上記（５１）に記載の方法。
（５３）測定を解析してポリマーの正体を決定するステップが、前記異なる電圧レベルで行われる別々の測定を比較して、前記測定が前記個々のｋマーに依拠している状態間の遷移を決定することをさらに含む、上記（４１）から（４４）、（５１）または（５２）のいずれかに記載の方法。
（５４）電圧の前記異なるレベル間の違いが１０ｍＶから１．５Ｖの範囲である、上記（１）から（５３）のいずれかに記載の方法。
（５５）前記異なるレベルが２つの異なるレベルからなる、上記（１）から（５４）のいずれかに記載の方法。
（５６）電圧の異なるレベルが同じ極性である、上記（１）から（５５）のいずれかに記載の方法。
（５７）前記測定がナノポア中を通るイオン電流の流れの測定である、上記（１）から（５６）のいずれかに記載の方法。
（５８）ナノポア中を通るイオン電流の流れの前記測定が、ナノポア中を通るＤＣイオン電流の流れの測定である、上記（５７）に記載の方法。
（５９）前記電圧の前記異なるレベルのそれぞれ１つでグループの複数の測定を行うステップ、および
前記異なるレベルのそれぞれ１つでの複数の測定のそれぞれのグループから１つまたは複数のサマリー測定を導き出して、個々のｋマーに関して前記別々の測定を構成するステップ
を含む、上記（１）から（５８）のいずれかに記載の方法。
（６０）前記電圧の異なるレベルがそれぞれ一定期間連続して印加され、
それぞれ各自の期間中、それぞれの期間中に印加される前記電圧の前記異なるレベルのうちの１つでグループのうちの１つの複数の測定を行う、
上記（５９）に記載の方法。
（６１）ポリマーがポリヌクレオチドであり、ポリマー単位がヌクレオチドである、上記（１）から（６０）のいずれかに記載の方法。
（６２）ナノポアが生物学的ポアである、上記（１）から（６１）のいずれかに記載の方法。
（６３）ナノポア中を通るポリマーの前記移行が、連続するｋマーがナノポアで登録される一方向のみに動く様式で実施される、上記（１）から（６２）のいずれかに記載の方法。
（６４）ポリマーの移行が分子歯止めにより制御される、上記（１）から（６３）のいずれかに記載の方法。
（６５）分子歯止めが酵素である、上記（６４）に記載の方法。
（６６）ポリマー単位を含むポリマーを解析するための装置であって、
ポリマーが中を通って移行しうるナノポア、
ナノポア中を通るポリマーの移行中にナノポアを横断して電圧を印加するように配置された制御回路、および
ｋが正整数であるポリマーのｋ個のポリマー単位であるｋマーの正体に依拠している測定をナノポア中で行うように配置された測定回路であって、
前記制御回路がナノポアを横断して電圧の異なるレベルを印加するように配置され、前記測定回路がナノポアを横断して印加される前記電圧の異なるレベルで、個々のｋマーに関して別々の測定を行うように配置されている、測定回路、および
前記電圧の前記異なるレベルで測定を解析してポリマーの少なくとも一部の正体を決定するように配置されている解析ユニット
を備える装置。
（６７）制御回路が、ナノポア中を通る前記ポリマーの異なる移行中にナノポアを横断して電圧の異なるレベルを印加するように配置されており、測定回路が前記電圧の異なるレベルでの前記異なる移行中に、個々のｋマーに関して別々の測定を行うように配置されている、上記（６６）に記載の装置。
（６８）制御回路が、ナノポア中を通るポリマーの前記移行中に、前記測定が前記個々のｋマーに依拠している状態の持続時間よりも短い繰返し周期を有する周期で前記電圧の前記異なるレベルを印加するように配置されており、測定回路が前記周期において前記電圧の前記異なるレベルで、個々のｋマーに関して別々の測定を行うように配置されている、上記（６６）に記載の装置。
（６９）ポリマー単位を含むポリマーを測定するための装置であって、
ポリマーが中を通って移行しうるナノポア、
ナノポア中を通るポリマーの移行中に、前記測定が前記個々のｋマーに依拠している状態の持続時間よりも短い繰返し周期を有する周期で前記電圧の異なるレベルを印加するように配置されている制御回路、および
ナノポアを横断して印加される前記電圧の異なるレベルで、個々のｋマーに関して別々の測定を行うように配置されている測定回路
を備える装置。
（７０）前記電圧の前記異なるレベルで測定を解析して、ポリマーの少なくとも一部の正体を決定するように配置されている解析ユニットをさらに備える、上記（６９）に記載の装置。

【図1】