(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-19
(54)【発明の名称】配列決定のためのヌクレオチド-試料スライド内の泡を検出するための機械学習モデル
(51)【国際特許分類】
G16B 30/00 20190101AFI20240312BHJP
C12Q 1/68 20180101ALI20240312BHJP
C12M 1/00 20060101ALI20240312BHJP
【FI】
G16B30/00
C12Q1/68
C12M1/00 A
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023560148
(86)(22)【出願日】2022-03-23
(85)【翻訳文提出日】2023-09-28
(86)【国際出願番号】 US2022071297
(87)【国際公開番号】W WO2022213027
(87)【国際公開日】2022-10-06
(32)【優先日】2021-04-02
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】500358711
【氏名又は名称】イルミナ インコーポレイテッド
(71)【出願人】
【識別番号】522471135
【氏名又は名称】イルミナ ソフトウェア, インコーポレイテッド
(74)【代理人】
【識別番号】100108453
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ブランドン・テイラー・ウェスターバーグ
(72)【発明者】
【氏名】ジュンチ・ユアン
(72)【発明者】
【氏名】ロバート・エズラ・ラングロイス
(72)【発明者】
【氏名】マーク・デイヴィッド・ハーム
(72)【発明者】
【氏名】ギャヴィン・デレク・パーナビー
(72)【発明者】
【氏名】トーマス・グロス
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA21
4B029FA15
4B029GA08
4B063QA20
4B063QR32
4B063QR35
4B063QS40
(57)【要約】
配列決定実行中の塩基コール中に取り込まれた(又はそれに由来する)データに基づいて、泡が核酸配列決定実行に影響を及ぼすときを正確かつ効率的に検出するための方法、システム、及び非一時的コンピュータ可読媒体が開示される。特に、1つ以上の実施形態では、開示されるシステムは、配列決定サイクル中に、核酸塩基コールを同定するデータ及び核酸塩基コールについての品質メトリックを同定するデータを受信する。開示されるシステムは、特定の核酸塩基コール及び品質メトリックについての閾値マーカーに基づいて、機械学習モデルを利用して、ヌクレオチド-試料スライド中の泡の存在を検出する。開示されたシステムは、泡の存在を単に検出するだけでなく、気泡、油泡、又はゴースト泡などの異なる検出された泡、又は配列決定中の他の出力を分類することもできる。開示されるシステムは、コールデータ及び品質メトリックを使用することによって、プラットフォームに依存しないアプローチにおいて容易に利用可能な配列決定データを使用して、一意に訓練された機械学習モデルを使用して、泡を検出することができる。
【特許請求の範囲】
【請求項1】
システムであって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサによって実行されると、前記システムに、
ヌクレオチド-試料スライドについて、核酸ポリマーを配列決定するサイクルについての核酸塩基コールを含むコールデータを受信することと、
前記ヌクレオチド-試料スライドについて、前記サイクルについての前記核酸塩基コールにおけるエラーを推定する品質メトリックを含む品質データを受信することと、
前記サイクルについての前記核酸塩基コールから、少なくとも1つの核酸塩基に対応する前記核酸塩基コールの第1のサブセット、及び前記品質メトリックについての閾値品質メトリックを満たす前記核酸塩基コールの第2のサブセット、を決定することと、
前記核酸塩基コールの前記第1のサブセット及び前記核酸塩基コールの前記第2のサブセットに基づいて泡検出機械学習モデルを利用して、前記ヌクレオチド-試料スライド内の泡の存在を検出することと、
を行わせる命令を含む非一時的コンピュータ可読媒体と、
を含むシステム。
【請求項2】
前記少なくとも1つのプロセッサによって実行されると、前記システムに、
前記ヌクレオチド-試料スライドのセクションについての前記コールデータ及び前記品質データを受信することと、
前記ヌクレオチド-試料スライドの前記セクション内の前記泡の存在を検出することと、
を行わせる命令を更に含む、請求項1に記載のシステム。
【請求項3】
前記少なくとも1つのプロセッサによって実行されると、前記システムに、
フローセルのタイル内の前記泡を検出することによって、前記ヌクレオチド-試料スライドの前記セクション内の前記泡の存在を検出すること
を行わせる命令を更に含む、請求項2に記載のシステム。
【請求項4】
前記少なくとも1つのプロセッサによって実行されると、前記システムに、
前記核酸ポリマーを配列決定する前記サイクルについて、アデニンコールのサブセット、チミンコールのサブセット、シトシンコールのサブセット、又はグアニンコールのサブセットのうちの少なくとも1つを決定することによって、前記少なくとも1つの核酸塩基に対応する前記核酸塩基コールの前記第1のサブセットを決定すること
を行わせる命令を更に含む、請求項1に記載のシステム。
【請求項5】
前記少なくとも1つのプロセッサによって実行されると、前記システムに、
前記泡検出機械学習モデルの層を利用して、アデニンコールの前記サブセット、グアニンコールの前記サブセット、及び前記核酸ポリマーを配列決定する前記サイクルについての前記閾値品質メトリックを満たす前記核酸塩基コールの前記第2のサブセットを含む入力マトリックスから特徴を抽出することによって、前記泡検出機械学習モデルを利用して前記泡の存在を検出すること
を行わせる命令を更に含む、請求項4に記載のシステム。
【請求項6】
前記少なくとも1つのプロセッサによって実行されると、前記システムに、
前記ヌクレオチド-試料スライド内の気泡、油泡、又はゴースト泡のうちの少なくとも1つを検出することによって前記泡の存在を検出すること
を行わせる命令を更に含む、請求項1に記載のシステム。
【請求項7】
前記泡検出機械学習モデルが、特徴抽出層、分類層、及び前記特徴抽出層と前記分類層との間の適応最大プーリング層、を含む、畳み込みニューラルネットワークを含む、請求項1に記載のシステム。
【請求項8】
前記少なくとも1つのプロセッサによって実行されると、前記システムに、
前記泡検出機械学習モデルを利用して、前記ヌクレオチド-試料スライドのセクションが前記泡を含む確率を生成することと、
前記確率が、前記泡の前記存在を示す閾値を満たすと判定することと、
を行わせる命令を更に含む、請求項1に記載のシステム。
【請求項9】
前記少なくとも1つのプロセッサによって実行されると、前記システムに、
前記核酸ポリマーを配列決定する所与のサイクルについての前記ヌクレオチド-試料スライドの各セクションについての単一画像を含む1チャネルデータ、
前記核酸ポリマーを配列決定する前記所与のサイクルについての前記ヌクレオチド-試料スライドの各セクションについての2つの画像を含む2チャネルデータ、又は
前記核酸ポリマーを配列決定する前記所与のサイクルについての前記ヌクレオチド-試料スライドの各セクションについての4つの画像を含む4チャネルデータ、
に基づく前記核酸塩基コールを含む前記コールデータを受信すること
を行わせる命令を更に含む、請求項1に記載のシステム。
【請求項10】
前記少なくとも1つのプロセッサによって実行されると、前記システムに、
前記核酸ポリマーを配列決定する前記サイクルのうちの1つ以上のサイクル中に前記泡の存在を決定すること
を行わせる命令を更に含む、請求項1に記載のシステム。
【請求項11】
少なくとも1つのプロセッサによって実行されると、コンピューティング装置に、
ヌクレオチド-試料スライドについて、核酸ポリマーを配列決定するサイクルについての核酸塩基コールを含むコールデータを受信することと、
前記ヌクレオチド-試料スライドについて、前記サイクルについての前記核酸塩基コールにおけるエラーを推定する品質メトリックを含む品質データを受信することと、
前記サイクルについての前記核酸塩基コールから、少なくとも1つの核酸塩基に対応する前記核酸塩基コールの第1のサブセット、及び前記品質メトリックについての閾値品質メトリックを満たす前記核酸塩基コールの第2のサブセットを決定することと、
前記核酸塩基コールの前記第1のサブセット及び前記核酸塩基コールの前記第2のサブセットに基づいて泡検出機械学習モデルを利用して、前記ヌクレオチド-試料スライド内の泡の存在を検出することと、
を行わせる命令を含む、非一時的コンピュータ可読媒体。
【請求項12】
前記泡検出機械学習モデルが、サポートベクトルマシン又は適応ブースティング機械学習モデルのうちの少なくとも1つを含む、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項13】
前記少なくとも1つのプロセッサによって実行されると、前記コンピューティング装置に、
前記泡の前記存在の検出に基づいて、前記コンピューティング装置上に表示するために、前記ヌクレオチド-試料スライド内の前記泡の存在を示すアラートを提供すること
を行わせる命令を更に含む、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項14】
前記少なくとも1つのプロセッサによって実行されると、前記コンピューティング装置に、
前記ヌクレオチド-試料スライドのセクションについての前記コールデータ及び前記品質データを受信することと、
前記ヌクレオチド-試料スライドの前記セクション内の前記泡の存在を検出することと、
を行わせる命令を更に含む、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項15】
前記少なくとも1つのプロセッサによって実行されると、前記コンピューティング装置に、
フローセルのタイル内の前記泡を検出することによって、前記ヌクレオチド-試料スライドの前記セクション内の前記泡の存在を検出すること
を行わせる命令を更に含む、請求項14に記載の非一時的コンピュータ可読媒体。
【請求項16】
前記少なくとも1つのプロセッサによって実行されると、前記コンピューティング装置に、
前記核酸ポリマーを配列決定する前記サイクルのサイクル中に前記泡の存在を決定すること
を行わせる命令を更に含む、請求項11に記載の非一時的コンピュータ可読媒体。
【請求項17】
コンピュータ実装方法であって、
ヌクレオチド-試料スライドについて、核酸ポリマーを配列決定するサイクルについての核酸塩基コールを含むコールデータを受信することと、
前記ヌクレオチド-試料スライドについて、前記サイクルについての前記核酸塩基コールにおけるエラーを推定する品質メトリックを含む品質データを受信することと、
前記サイクルについての前記核酸塩基コールから、少なくとも1つの核酸塩基に対応する前記核酸塩基コールの第1のサブセット、及び前記品質メトリックについての閾値品質メトリックを満たす前記核酸塩基コールの第2のサブセットを決定することと、
前記核酸塩基コールの前記第1のサブセット及び前記核酸塩基コールの前記第2のサブセットに基づいて泡検出機械学習モデルを利用して、前記ヌクレオチド-試料スライド内の泡の存在を検出することと、
を含むコンピュータ実装方法。
【請求項18】
前記少なくとも1つの核酸塩基に対応する前記核酸塩基コールの前記第1のサブセットを決定することが、
前記核酸ポリマーを配列決定する前記サイクルについて、アデニンコールのサブセット、チミンコールのサブセット、シトシンコールのサブセット、又はグアニンコールのサブセットのうちの少なくとも1つを決定すること
を含む、請求項17に記載のコンピュータ実装方法。
【請求項19】
前記泡検出機械学習モデルを利用して前記泡の存在を検出することに基づいて、核酸塩基コールの品質メトリックを修正すること
を更に含む、請求項17に記載のコンピュータ実装方法。
【請求項20】
前記泡の存在を検出することが、
前記ヌクレオチド-試料スライド内の気泡、油泡、又はゴースト泡のうちの少なくとも1つを検出すること
を含む、請求項17に記載のコンピュータ実装方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年4月2日に出願された米国特許仮出願第63/170,072号の利益及び優先権を主張するものである。上記出願は、参照によりその全体が本明細書に組み込まれる。
【背景技術】
【0002】
近年、バイオテクノロジーの企業及び研究機関は、ヌクレオチドの配列決定及び分析のためのハードウェア及びソフトウェアプラットフォームの改良を行っている。例えば、いくつかの既存の核酸配列決定システムは、従来のSanger配列決定を使用することによって、核酸配列の個々の核酸塩基を決定する。対照的に、いくつかの既存のシステムは、合成による配列決定(sequencing-by-synthesis、SBS)を行うことによって、かかる核酸塩基配列を決定する。SBSを使用することによって、既存のシステムは、より大きな塩基コールデータセットからより正確な塩基コールを検出し、他の配列決定情報を捕捉するために、並行して合成される数千、数万、又はそれ以上の核酸ポリマーをモニターすることができる。いくつかの場合では、既存のシステムは、フローセルなどのヌクレオチド-試料スライドのウェル内のモノクローナルコロニーにおいてオリゴヌクレオチドを合成する。かかるオリゴヌクレオチドに組み込まれた核酸塩基から色を照射する蛍光タグの画像をカメラが撮影した後、例えば、いくつかの既存のシステムは、配列決定データ分析ソフトウェアを有する装置に画像データを送信し、塩基コールについて画像データを分析し、核酸ポリマーについての核酸塩基配列(例えば、核酸ポリマーの遺伝子コード領域)を決定する。
【0003】
配列決定におけるこれらの進歩にもかかわらず、既存の核酸配列決定システムは、例えば、塩基コールの精度及びエラー検出を阻害し、ヌクレオチド試料の非効率的な再配列決定及び再分析を必要とし、配列決定装置上の特定のハードウェアにエラー検出を限定するという、いくつかの技術的欠点を示す。実際、配列決定装置又はスライドを通過する流体及び気体が画像データの基礎となる不規則性を生成する可能性があるため、既存のシステムは多くの場合不正確に塩基コールを行うか、又は信頼できない画像データを取り込む。例えば、ヌクレオチド-試料スライド中の泡(例えば、空気又は油の泡)は、塩基コールについてのかかる画像データからのデータシグネチャを妨害するか、その中にノイズを生成するか、又はさもなければデータ品質問題を引き起こす可能性がある。かかる泡は、塩基コールについてのデータシグネチャを歪めるだけでなく、実行品質又は歩留まりを阻害又は低下させる可能性がある。泡によって引き起こされる問題にもかかわらず、既存の核酸配列決定システム及び既存の配列決定データ分析ソフトウェアの両方は、泡を検出する有効な手段を欠くことが多い。
【0004】
泡に起因するエラー又は他の配列決定エラーに部分的に起因して、既存の核酸配列決定システムは、多くの場合、ヌクレオチド試料を非効率的に再配列決定及び再分析する。特に、既存のシステム及びソフトウェアは、泡の妨害によって影響を受けたデータを補正するための品質データを生成するために、追加の処理、演算(コンピューティング)、記憶リソース、及び時間を実行又は消費することが多い。例示すると、配列決定の実行は、失敗した配列決定反応、混入、不十分な試料ローディング、又は泡の存在などのいくつかの問題のタイプにさらされ得る。既存のシステムは、多くの場合、泡の存在を同定すること、又は他のエラーから泡の妨害を区別することができないため、かかるシステムは、多くの場合、問題の同定に成功する前に、ユーザが配列決定実行を繰り返すことを必要とする。
【0005】
泡を検出するための基本的な機械的方法が開発又は検討されてきたが、かかる検出方法は非効率的であり、特定のプラットフォームタイプに限定されることがある。例えば、既存の核酸配列決定システムは、泡又は他の配列決定エラー源の存在を同定するために、配列決定実行についての追加情報を必要とすることが多い。より具体的には、チュービングを通してカートリッジに流体を流す従来の核酸配列決定システムは、多くの場合、泡の存在を示すデータを取り込むために追加のハードウェアを必要とする。例えば、既存のシステムは、多くの場合、追加のチュービングカメラ、チュービング検出器、又は他のタイプのセンサを必要とする。ある特定の場合には、かかるシステムは、チュービングを通過する泡を同定するために、超音波又は容量感知検出器を使用する。しかし、配列決定装置上のかかるローカルハードウェアは、チュービングを伴う湿式プラットフォームに限定され、かかる泡検出方法を実装するために追加の処理、記憶、及び分析リソースを必要とする。
【0006】
湿式配列決定プラットフォームにおいて泡を検出するための既存の機構の非効率性の先で、いくつかのかかる泡検出方法は、配列決定装置上の特定のハードウェアに限定される。言及したように、いくつかの従来の核酸配列決定システムは、ハードウェアベースの泡検出器を利用することによって泡を検出しようと試みる。いくつかの従来の核酸配列決定システムが、泡を検出するためにチュービング又は他の構成要素内にセンサを含むことができる場合であっても、かかる検出ハードウェアは、高価であるだけでなく、乾式配列決定プラットフォームにおいて実行不可能でもある。例えば、乾式配列決定プラットフォームは、多くの場合、流体を消耗品内に流し込むチュービングを欠いている単回使用消耗品に対して流体工学動作を行う。かかる乾式配列決定プラットフォームは、専用の泡検出センサを利用することができないか、又はかかるセンサは、高価な配列決定装置のかさばる再設計又は消耗可能なヌクレオチド-試料スライドを必要とすることによって非実用的であるかのいずれかである。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】米国特許第8392126号明細書
【特許文献2】米国特許第6210891号明細書
【特許文献3】米国特許第6258568号明細書
【特許文献4】米国特許第6274320号明細書
【特許文献5】国際公開第2004/018497号
【特許文献6】米国特許第7057026号明細書
【特許文献7】国際公開第91/06678号
【特許文献8】国際公開第2007/123744号
【特許文献9】米国特許第7427673号明細書
【特許文献10】米国特許出願公開第2007/0166705号明細書
【特許文献11】米国特許出願公開第2006/0188901号明細書
【特許文献12】米国特許出願公開第2006/0240439号明細書
【特許文献13】米国特許出願公開第2006/0281109号明細書
【特許文献14】国際公開第2005/065814号
【特許文献15】米国特許出願公開第2005/0100900号明細書
【特許文献16】国際公開第2006/064199号
【特許文献17】国際公開第2007/010251号
【特許文献18】米国特許出願公開第2012/0270305号明細書
【特許文献19】米国特許出願公開第2013/0260372号明細書
【特許文献20】米国特許出願公開第2013/0079232号明細書
【特許文献21】米国特許第6969488号明細書
【特許文献22】米国特許第6172218号明細書
【特許文献23】米国特許第6306597号明細書
【特許文献24】米国特許第7001792号明細書
【特許文献25】米国特許第7329492号明細書
【特許文献26】米国特許第7211414号明細書
【特許文献27】米国特許第7315019号明細書
【特許文献28】米国特許第7405281号明細書
【特許文献29】米国特許出願公開第2008/0108082号明細書
【特許文献30】米国特許出願公開第2009/0026082号明細書
【特許文献31】米国特許出願公開第2009/0127589号明細書
【特許文献32】米国特許出願公開第2010/0137143号明細書
【特許文献33】米国特許出願公開第2010/0282617号明細書
【特許文献34】米国特許出願公開第2010/0111768号明細書
【特許文献35】米国特許出願第13/273666号(米国特許出願公開第2012/0270305号明細書)
【非特許文献】
【0008】
【非特許文献1】Ewing B, Green P. Base-calling of Automated Sequencer Traces Using Phred. II. Error Probabilities. Genome Res. 1998 Mar.; 8(3):186-194. PMID: 9521922
【非特許文献2】Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. and Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-99
【非特許文献3】Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11
【非特許文献4】Ronaghi, M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363
【非特許文献5】Metzker, Genome Res. 15:1767-1776 (2005)
【非特許文献6】Ruparel et al., Proc Natl Acad Sci USA 102: 5932-7 (2005)
【非特許文献7】Deamer, D. W. & Akeson, M. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000)
【非特許文献8】Deamer, D. and D. Branton, "Characterization of nucleic acids by nanopore analysis". Acc. Chem. Res. 35:817-825 (2002)
【非特許文献9】Li, J., M. Gershow, D. Stein, E. Brandin, and J. A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003)
【非特許文献10】Soni, G. V., & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007)
【非特許文献11】Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007)
【非特許文献12】Cockroft, S. L., Chu, J., Amorin, M. & Ghadiri, M. R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem. Soc. 130, 818-820 (2008)
【非特許文献13】Levene, M.J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003)
【非特許文献14】Lundquist, P.M. et al. "Parallel confocal detection of single molecules in real time." Opt. Lett. 33, 1026-1028 (2008)
【非特許文献15】Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)
【発明の概要】
【課題を解決するための手段】
【0009】
本開示は、当技術分野における利益を提供し、かつ/又は、上記の問題のうちの1つ以上を解決するシステム、方法、及び非一時的コンピュータ可読記憶媒体の1つ以上の実施形態を説明する。例えば、開示されるシステムは、機械学習モデルを使用して、泡が核酸配列決定実行に影響を及ぼすときに、かかる配列決定実行中の塩基コール中に取り込まれた(又はそれに由来する)データに基づいて正確かつ効率的に検出する。例示すると、開示されるシステムは、核酸塩基コールを同定するデータ及びかかる核酸塩基コールについての品質メトリックを同定するデータを、配列決定サイクル中に配列決定プラットフォームから受信することができる。品質メトリックについての特定の核酸塩基コール及び閾値マーカーに基づいて、機械学習モデルは、ヌクレオチド-試料スライド中の泡の存在を検出することができる。コールデータ及び品質メトリックを使用することによって、開示されるシステムは、プラットフォームに依存しないアプローチにおいて容易に利用可能な配列決定データを使用して、一意に訓練された機械学習モデルを使用して泡を検出することができる。
【0010】
いくつかの場合では、開示されるシステムは、配列決定サイクル中にヌクレオチド-試料スライド(例えば、フローセル)の特定のセクション(切片)又はユニット(例えば、タイル)内の泡を同定するように訓練された機械学習モデルを使用する。単に泡の存在を検出することを超えて、いくつかの例では、開示されるシステムはまた、油泡(oil bubble)、気泡(air bubble)、又はゴースト泡(ghost bubble)などの異なる検出された泡を分類することができ、あるいはタイル位置合わせ不良及びドロップタイルなどの他の出力を配列決定中に同定することができる。
【0011】
本開示の1つ以上の実施形態の追加の特徴及び利点は、以下の説明に記載され、一部は説明から明らかになるか、又はかかる例示的な実施形態の実施によって習得され得る。
【図面の簡単な説明】
【0012】
様々な実施形態が、以下に要約される添付の図面の使用を通じて更に具体的かつ詳細に、記載及び説明される。
【
図1】泡検出システムが本開示の1つ以上の実施形態に従って動作することができる環境を図示する。
【
図2】本開示の1つ以上の実施形態による、泡の存在を検出する泡検出システムの概観図を図示する。
【
図3】本開示の1つ以上の実施形態による、1チャネル、2チャネル、及び4チャネル配列データに関して動作する泡検出システムの概観図を図示する。
【
図4A】本開示の1つ以上の実施形態による、異なるエラー分類に対応するデータシグネチャをグラフ化する例示的なチャートを図示する。
【
図4B】本開示の1つ以上の実施形態による、異なるエラー分類に対応するデータシグネチャをグラフ化する例示的なチャートを図示する。
【
図4C】本開示の1つ以上の実施形態による、異なるエラー分類に対応するデータシグネチャをグラフ化する例示的なチャートを図示する。
【
図5】本開示の1つ以上の実施形態による、例示的な泡検出機械学習モデルを図示する。
【
図6A】1つ以上の実施形態による、泡検出機械学習モデルを訓練する泡検出システムと、フローセル内の泡を伴う例示的空間画像とを図示する。
【
図6B】1つ以上の実施形態による、泡検出機械学習モデルを訓練する泡検出システムと、フローセル内の泡を伴う例示的空間画像とを図示する。
【
図6C】1つ以上の実施形態による、泡検出機械学習モデルを訓練する泡検出システムと、フローセル内の泡を伴う例示的空間画像とを図示する。
【
図7】本開示の1つ以上の実施形態による、泡の存在を検出するための一連の動作を図示する。
【
図8】本開示の1つ以上の実施形態による、例示的なコンピューティング装置のブロック図を図示する。
【発明を実施するための形態】
【0013】
本開示は、機械学習モデルを利用して、核酸配列決定実行中に取り込まれた(又はそれから導出された)データに基づいてヌクレオチド-試料スライド内の泡の存在を検出する泡検出システムの1つ以上の実施形態を説明する。いくつかの実施形態では、例えば、泡検出システムは、配列決定サイクル中の核酸塩基コールについての塩基コールデータ、及び配列決定サイクル中のかかる核酸塩基コールのエラーを推定する品質メトリックを同定する品質データに、アクセスするか、又はそれらを受信する。このようなコールデータ及び品質データは、ヌクレオチド-試料スライド(例えば、フローセル)又はスライドのセクションに特異的であり得る。コールデータ及び品質データから、泡検出システムは、少なくとも1つの核酸塩基に対応する核酸塩基コールのサブグループ(例えば、アデニン及びグアニン塩基コールのサブグループ)及び閾値品質値を満たすヌクレオチドコールのサブグループを決定する。入力としてのデータのこれらのサブグループに基づいて、泡検出システムは、機械学習モデルを利用して、ヌクレオチド-試料スライド内の泡の存在を検出する。いくつかのかかる実施形態では、かかる泡検出機械学習モデルは、検出された泡のタイプを分類する。
【0014】
直前に示したように、いくつかの実施形態では、泡検出システムは、核酸ポリマーを配列決定するサイクルについての核酸塩基コールを含むコールデータを受信する。概して、泡検出システムは、各配列決定サイクルで核酸塩基を同定するコールデータを受信する。泡検出システムは、様々なタイプのデータに従って編成又はパッケージ化されたコールデータを受信することができる。例えば、泡検出システムは、1チャネルデータ、2チャネルデータ、又は4チャネルデータに従って編成されたコールデータを受信することができる。いずれの場合も、泡検出システムは、様々なタイプの配列決定プラットフォームからコールデータを受信し、利用することができる。
【0015】
更に上述したように、泡検出システムはまた、サイクルについての核酸塩基コールにおけるエラーを推定する品質メトリックを含む品質データを受信する。いくつかの実施形態では、品質メトリックは、ヌクレオチド-試料スライドについての塩基コール精度を示す。例えば、品質メトリックは、不正確な塩基コールの確率を示す値を含むことができる。1つ以上の実施形態では、品質メトリックは、ヌクレオチド-試料スライドのセクションについての不正確な塩基コールの確率が、Q20スコアについて100分の1、Q30スコアについて1,000分の1、Q40スコアについて10,000分の1などであることを示す品質スコア(又はQスコア)を含むが、泡検出システムは、泡の存在を決定することの一部として任意の数の品質メトリックを柔軟に受信する。
【0016】
コールデータに基づいて、いくつかの実施形態では、泡検出システムは、少なくとも1つの核酸塩基に対応する核酸塩基コールのサブセットを決定する。例えば、ある特定の実装形態では、泡検出システムは、アデニンコール、チミンコール、シトシンコール、又はグアニンコールの割合を決定する。一例では、泡検出システムは、アデニンコールを含む各サイクルにおける塩基コールの割合又はパーセンテージ、及びチミンコールを含む各サイクルにおける塩基コールの割合又はパーセンテージを決定する。したがって、ある特定の実装形態では、泡検出システムは、ヌクレオチド-試料スライドの特定のセクション内のアデニンに対応する核酸塩基コールのパーセンテージ(又は他のサブセット)及びグアニンに対応する核酸塩基コールのパーセンテージ(又は他のサブセット)を決定する。
【0017】
品質データに基づいて、ある特定の場合では、泡検出システムはまた、品質メトリックについての閾値品質メトリックを満たす核酸塩基コールのサブセットを決定することができる。いくつかの実施形態では、泡検出システムは、閾値品質メトリックを決定する。例えば、泡検出システムは、サイクル中の塩基コールについての閾値品質メトリックがQ30に等しく、99.9%の精度又は所与の塩基コールが不正確である1,000分の1の確率に対応することを決定し得る。泡検出システムは、決定された閾値品質メトリックを満たす塩基コールの割合又はパーセンテージを更に決定する。特に、泡検出システムは、受信した品質データからの品質メトリックを閾値品質メトリックと比較する。したがって、ある特定の実装形態では、泡検出システムは、ヌクレオチド-試料スライドの特定のセクション内の閾値品質メトリックを満たす核酸塩基コールのパーセンテージ(又は他のサブセット)を決定する。
【0018】
核酸塩基コールの関連するサブセットを決定すると、ある特定の場合には、泡検出システムは、少なくとも1つの核酸塩基に対応する核酸塩基コールの第1のサブセット及び閾値品質メトリックを満たす核酸塩基コールの第2のサブセットを含む泡検出機械学習モデルについての入力マトリックスを生成する。より具体的には、一例において、泡検出システムは、アデニンコールのサブセット、グアニンコールのサブセット、及び閾値品質メトリックを満たす核酸塩基コールのサブセット(例えば、配列決定サイクルの総数内の各サイクルについて)を使用して、入力マトリックスをコンパイルする。泡検出システムは、配列決定サイクルの数に基づいて入力マトリックスを調整することによって、様々な入力サイズに対応することができる。例えば、一実施形態では、入力マトリックスは、長さNの3つの一次元入力チャネルを含み、3つの入力チャネルは、アデニンコールのサブセット、グアニンコールのサブセット、及び閾値品質メトリックを満たす核酸塩基コールの第2のサブセットを含み、Nは、配列決定サイクルの数に等しい。
【0019】
入力形式にかかわらず、泡検出システムは、泡検出機械学習モデルを使用して、コールデータ及び品質データのサブセットに基づいてヌクレオチド-試料スライド内の泡の存在を検出することができる。かかる泡の存在を検出するために、泡検出システムは、様々なタイプの機械学習モデルを利用することができる。例えば、いくつかの実施形態では、泡検出システムは、畳み込みニューラルネットワーク(CNN)等のニューラルネットワークを利用して、泡を検出する。他の実施形態では、泡検出システムは、他のタイプの機械学習モデルを利用して、泡を検出する。例えば、いくつかの実装形態では、泡検出システムは、サポートベクトルマシン(SVM)又は適応ブースティング(Adaptive Boosting)機械学習モデルを実装する。
【0020】
上記で示唆したように、泡検出システムは、従来の核酸配列決定システム及び対応する配列決定データ分析ソフトウェアと比較して、いくつかの技術的利益及び技術的改善を提供する。特に、泡検出システムは、既存の核酸配列決定システム又は対応するソフトウェアが配列決定を妨害する泡の存在を検出する精度を改善することができる。開示された泡検出システムは、現況技術又は従来技術によってマッチングされていないヌクレオチド-試料スライド内の泡を検出する第1種機械学習モデルを導入する。上述したように、既存のシステムは、配列決定を妨害する泡を直接検出することも、特定のプラットフォームに限定された泡を検出するために機械的センサを使用することもできない。かかる既存のシステムとは異なり、開示される泡検出システムは、利用可能なデータ、すなわち、核酸塩基コールを同定するコールデータ及びかかる核酸塩基コールについての品質メトリックを同定する品質データの固有の分析に基づいて、ヌクレオチド-試料スライド内の泡を正確に検出するように訓練された機械学習モデルを利用する。コールデータ及び品質データに依存することによって、泡検出システムは、訓練された泡検出機械学習モデルを利用して、ヌクレオチド-試料スライド内の泡の存在を正確に検出する(及び時には泡のタイプを同定する)ことができる。従来の機械的泡検出方法とは異なり、泡検出システムは、容易に利用可能なコールデータ及び品質データを使用することによって、様々な配列決定プラットフォームにわたってその機械学習モデルを適用することができる。
【0021】
新規で正確な泡検出方法に加えて、いくつかの実施形態では、泡検出システムは、ヌクレオチド-試料スライドの特定のセクション内(例えば、フローセルのタイル内又はフローセルのタイル群内)の泡の存在、及び泡によって影響を受ける対応するコールデータを正確に検出することができる。より具体的には、ある特定の場合において、泡検出システムは、スライドセクションに特異的なコールデータ及び品質データを渡す泡検出機械学習モデルを利用して、泡によって影響を受けるヌクレオチド-試料スライドのセクションを自動的に検出する。ヌクレオチド-試料スライドのどのセクションが影響を受けたかを特定することによって、泡検出システムは、不正確なデータを削除し、配列決定データの精度及び全体的な品質を改善することができる。例示すると、いくつかの実装形態では、泡検出システムは、コールデータからヌクレオチド-試料スライドのセクションについてのリードを除去するか、又は泡によって影響を受けたヌクレオチド-試料スライドの特定のセクションに対応するリード又は核酸塩基コールについての品質メトリックを低減する。いくつかの場合において、泡検出システムは、検出された泡がサイズ閾値に等しいか若しくはそれを超える場合、又は核酸塩基コールについてのデータシグネチャがノルムから特定の閾値だけ異なる場合、核酸塩基コールを除去するか、又は品質メトリックを低減する。
【0022】
改善された精度に加えて、泡検出システムは、従来の核酸配列決定システム及び対応する配列決定データ分析ソフトウェアが核酸ポリマーについての核酸塩基配列を決定する効率を改善する。泡がヌクレオチド-試料スライドに影響を及ぼすか、又は他の方法で妨害するときを同定することによって、泡検出システムは、特定のエラーをトラブルシューティングし、その後、高品質のデータを達成するために複数の配列決定サイクルを実行及び再実行する必要をなくす。いくつかのかかる場合において、泡検出システムは、泡によって影響を受けたヌクレオチド-試料スライドの特定のセクションを同定して、データのどの対応する部分が泡によって破損又は妨害されているかを特異的に同定する。更に、泡検出システムはまた、特定のタイプの泡(例えば、油、空気、又はゴースト)、又は補正のための他の特定のエラータイプ(例えば、タイル位置合わせ不良又はタイル脱落)を分類することによって、配列決定の効率を改善することができる。したがって、泡検出システムは、核酸ポリマーを正確に配列決定するために廃棄又は再評価される必要がある、ヌクレオチド-試料スライドのセクションについてのデータ又はサイクル数を認識及び最小化することによって、核酸ポリマーの配列決定の効率を改善する。
【0023】
いくつかの実施形態では、再配列決定作業を低減すること、又は特定の泡影響データを同定することを超えて、泡検出システムは、配列決定実行(ラン)内で泡を同定するために典型的に必要とされるリソースを低減することによって、従来の核酸配列決定システム及び対応する配列決定データ分析ソフトウェアと比較して効率を改善する。前述のように、泡検出システムは、泡検出機械学習モデルを利用して、配列決定ラン内の泡を検出する。少なくとも1つの実施形態では、泡検出システムは、軽量CNNを利用して、泡の存在を同定する。したがって、配列決定装置(例えば、チュービングセンサ)上の付加的ハードウェアの使用を必要とする代わりに、又は付加的情報を処理するために演算的に重いニューラルネットワークを使用する代わりに、いくつかの実施形態では、泡検出システムは、種々の配列決定プラットフォームから利用可能なコールデータ及び品質データを分析するために、演算的に軽い機械学習モデルをより効率的に利用する。したがって、かかる場合、泡検出システムは、泡を検出するために画像又は他のセンサデータを使用することと比較して、低いデータフットプリントを作成する。
【0024】
改善された効率とは無関係に、泡検出システムはまた、核酸配列決定システム及び対応する配列決定データ分析ソフトウェアが泡を検出する柔軟性を改善する。上記のように、いくつかの実装形態では、泡検出システムは、プラットフォームに依存せず、いくつかの流体ベースの配列決定装置上のもののような追加のチューブセンサを含まない。特に、泡検出システムは、多数の配列決定プラットフォームから容易にアクセス可能な塩基コール及び品質データを柔軟に利用する。少なくとも1つの実施形態では、泡検出システムは、泡検出システムが可変入力サイズをより柔軟に分析することを可能にする適応最大プーリング層を有するCNNを利用する。したがって、泡検出システムは、追加のハードウェアを必要とせずに、既存の配列決定プラットフォームによって実装及び利用することができる。更に、いくつかの実施形態では、泡検出システムは、特定用途向け集積回路(ASIC)又はフィールドプログラマブルゲートアレイ(FPGA)などの様々な構成可能回路を利用して柔軟に適用される。
【0025】
前述の議論によって示されるように、本開示は、泡検出システムの特徴及び利点を説明するために、種々の用語を利用する。ここで、かかる用語の意味に関して更なる詳細を提供する。例えば、本明細書で使用される場合、用語「ヌクレオチド-試料スライド」は、試料についてヌクレオチドセグメントを配列決定するためのオリゴヌクレオチドを含むプレート又はスライドを指す。いくつかの実施形態では、ヌクレオチド-試料スライドは、試薬及び緩衝液が移動することができる流体チャネルを含有するスライドを配列決定の一部として含む。例えば、1つ以上の実施形態では、ヌクレオチド-試料スライドは、小さな流体チャネル及びアダプター配列に相補的な短いオリゴヌクレオチドを含むフローセルを含む。
【0026】
本明細書で使用される場合、用語「コールデータ」は、個々の核酸塩基又は核酸ポリマーについての核酸塩基の配列を示す画像データ又は他のデジタル情報を指す。特に、コールデータは、ヌクレオチド-試料スライドのカメラによって撮影された画像からの強度値(例えば、個々のクラスターについての色又は光強度値)、又は核酸ポリマーについての個々の核酸塩基若しくは核酸塩基の配列を示す他のデータを含むことができる。コールデータは、強度値に加えて、又は代替として、配列中の個々の核酸塩基を示すクロマトグラムピーク又は電流変化を含むことができる。更に、いくつかの実施形態では、コールデータは、個々の核酸塩基(例えば、A、T、C、又はG)を同定する個々の核酸塩基コールを含む。例えば、コールデータは、核酸ポリマーについての配列中の核酸塩基コールについてのデータ、特定の塩基(例えば、アデニン、シトシン、チミン、又はグアニン)に対応する核酸塩基コールの数を含むことができる。いくつかの実施形態では、コールデータは、合成による配列決定(SBS)を利用する配列決定装置からの情報を含む。
【0027】
本明細書で使用される場合、「核酸塩基コール」という用語は、配列決定サイクルについてオリゴヌクレオチドに付加するか又はオリゴヌクレオチド内に組み込む特定の核酸塩基の割り当て又は決定を指す。特に、核酸塩基コールは、ヌクレオチド-試料スライド上のオリゴヌクレオチド内に組み込まれたヌクレオチドのタイプの割り当て又は決定を示す。いくつかの場合では、核酸塩基コールは、ヌクレオチド-試料スライドのナノウェル中のオリゴヌクレオチドに添加されたヌクレオチドから生じる強度値への核酸塩基の割り当て又は決定を含む。あるいは、核酸塩基コールは、ヌクレオチド-試料スライドのナノポアを通過するヌクレオチドから生じるクロマトグラムピーク又は電流変化への核酸塩基の割り当て又は決定を含む。核酸塩基コールを使用することによって、配列決定システムは、核酸ポリマーの配列を決定する。例えば、単一の核酸塩基コールは、アデニンコール、シトシンコール、グアニンコール、又はチミンコールを含むことができる。
【0028】
本明細書で更に使用される場合、「配列決定サイクル」又は単に「サイクル」という用語は、オリゴヌクレオチドに核酸塩基を付加若しくは組み込む反復、又は並行してオリゴヌクレオチドに核酸塩基を付加若しくは組み込む反復を指す。特に、サイクルは、オリゴヌクレオチドに、又は並行してオリゴヌクレオチドに付加又は組み込まれた個々の核酸塩基を示すデータを用いて1つ以上の画像を分析する反復を含むことができる。したがって、核酸ポリマーの配列決定の一部としてサイクルを繰り返すことができる。例えば、1つ以上の実施形態では、各配列決定サイクルは、DNA鎖若しくはRNA鎖が単一方向のみで読み取られる単一リード、又はDNA鎖若しくはRNA鎖が両端から読み取られるペアエンドリードのいずれかを伴う。更に、ある特定の場合において、各配列決定サイクルは、特定のオリゴヌクレオチドに付加又は組み込まれた特定の核酸塩基を決定するための画像データを生成するために、ヌクレオチド-試料スライド又はヌクレオチド-試料スライドの複数のセクションの画像を撮影するカメラを伴う。画像撮影段階に続いて、配列決定システムは、組み込まれた核酸塩基から特定の蛍光標識を除去し、核酸ポリマーが完全に配列決定されるまで別の配列決定サイクルを実施することができる。1つ以上の実施形態では、「サイクル」は、合成による配列決定(SBS)ラン内の配列決定サイクルを指す。
【0029】
本明細書で使用される場合、用語「核酸ポリマー」は、核酸の単位から構成される高分子を指す。特に、核酸ポリマーは、配列中に異なる窒素含有複素環塩基から構成される高分子を含むことができる。例えば、核酸ポリマーは、デオキシリボ核酸(DNA)、リボ核酸(RNA)、又は核酸の他のポリマー形態若しくは以下に記載される核酸のキメラ若しくはハイブリッド形態のセグメント又は分子を含むことができる。より具体的には、いくつかの場合において、核酸ポリマーは、キットによって調製又は単離され、配列決定装置によって受け取られた試料中に見出されるものである。
【0030】
本明細書で使用される場合、「品質データ」という用語は、配列決定サイクルについての核酸塩基コールの精度又は品質を示す情報を指す。特に、品質データは、概して、配列決定サイクル内の1つ以上の塩基コールの精度を示す。例えば、品質データは、1つ以上の品質メトリックを含むことができる。
【0031】
本明細書で使用される場合、用語「品質メトリック」は、配列決定サイクルについての核酸塩基コールの精度を示す特定のスコア又は他の尺度を指す。特に、品質メトリックは、1つ以上の予測核酸塩基コールがエラーを含む可能性を示す値を含む。例えば、ある特定の実装形態では、品質メトリックは、配列決定サイクル内の任意の所与の塩基コールのエラー確率を予測するQスコアを含むことができる。
【0032】
本明細書で使用される場合、「泡」という用語は、気体、液体、又は他の材料を封入する球形又は球状の小球又は他の収容体を指す。特に、泡は、ヌクレオチド-試料スライドに入ることができ、配列決定サイクルのデータ品質に影響を及ぼすことができる球状の小球を指す。例えば、泡は、ヌクレオチド-試料スライド内に生じる気泡又は油泡を含むことができる。
【0033】
ここで、泡検出システムの例示的な実施形態及び実装形態を示す例示的な図に関連して、泡検出システムに関して更なる詳細を提供する。例えば、
図1は、泡検出システム106が1つ以上の実施形態に従って動作するシステム環境(又は「環境」)100の概略図を示す。図示されるように、環境100は、ネットワーク112を介してユーザクライアント装置108及び配列決定装置114に接続された1つ以上のサーバー装置102を含む。
図1は泡検出システム106の一実施形態を示すが、代替的な実施形態及び構成が可能である。
【0034】
図1に示されるように、サーバー装置102、ユーザクライアント装置108、及び配列決定装置114は、ネットワーク112を介して接続される。したがって、環境100の構成要素の各々は、ネットワーク112を介して通信することができる。ネットワーク112は、コンピューティング装置が通信することができる任意の適切なネットワークを含む。例示的なネットワークを、
図8に関連して以下で更に詳細に説明する。
【0035】
図1によって示されるように、配列決定装置114は、核酸ポリマーを配列決定するための装置を含む。いくつかの実施形態では、配列決定装置114は、試料から抽出された核酸セグメントを分析して、配列決定装置114上で直接的又は間接的のいずれかで本明細書に記載されるコンピュータ実装方法及びシステムを利用して、データを生成する。より具体的には、配列決定装置114は、ヌクレオチド-試料スライド内で、試料から抽出された核酸セグメントを受け取り、分析する。1つ以上の実施形態では、配列決定装置114は、SBSを利用し、核酸ポリマーを配列決定する。いくつかの実施形態では、配列決定装置114は、ネットワーク112を介して通信することに加えて、又は代替として、ネットワーク112を迂回し、ユーザクライアント装置108と直接通信する。
【0036】
図1によって更に示されるように、サーバー装置102は、核酸塩基コールを決定するための、又は核酸ポリマーを配列決定するためのデータなどの電子データを生成、受信、分析、記憶、受信、及び送信することができる。
図1に示すように、サーバー装置102は、配列決定装置114からデータを受信し得る。例えば、サーバー装置102は、コールデータ、品質データ、及び核酸ポリマーの配列決定に関連する他のデータを含む配列決定データを収集及び/又は受信することができる。サーバー装置102は、ユーザクライアント装置108とも通信することができる。特に、サーバー装置102は、核酸塩基配列、エラーデータ、及び他の情報をユーザクライアント装置108に送信することができる。
【0037】
いくつかの実施形態では、サーバー装置102は、分散型サーバーを含み、サーバー装置102は、ネットワーク112にわたって分散され、異なる物理的場所に位置する、いくつかのサーバー装置を含む。サーバー装置102は、コンテンツサーバー、アプリケーションサーバー、通信サーバー、ウェブホスティングサーバー、又は別のタイプのサーバーを含むことができる。
【0038】
図1に更に示されるように、サーバー装置102は、配列決定システム104を含むことができる。概して、配列決定システム104は、配列決定装置114から受信した配列決定データを分析して、核酸ポリマーについての核酸塩基配列を決定する。例えば、配列決定システム104は、配列決定装置114から生データを受信し、核酸セグメントについての核酸塩基配列を決定することができる。いくつかの実施形態では、配列決定システム104は、DNA及び/又はRNAセグメント中の核酸塩基の配列を決定する。核酸ポリマーについての配列を処理及び決定することに加えて、配列決定システム104はまた、配列決定データを分析し、配列決定サイクルにおける不規則性を検出する。特に、配列決定システム104は、泡検出システム106を使用して、配列決定サイクル内の泡を検出し、対応する通知をユーザクライアント装置108に送信することができる。
【0039】
上述のように、また
図1に図示するように、泡検出システム106は、配列決定装置114からのデータを分析して、配列決定装置114に関連付けられたヌクレオチド-試料スライド内の泡の存在を検出する。より具体的には、いくつかの実施形態では、泡検出システム106は、配列決定装置114からコールデータ及び品質データを受信する。コールデータ及び品質データに基づいて、泡検出システム106は、少なくとも1つの核酸塩基に対応する核酸塩基コールの第1のサブセット、及び閾値品質メトリックを満たす核酸塩基コールの第2のサブセットを決定する。核酸塩基コールの第1のサブセット及び核酸塩基コールの第2のサブセットに基づいて、泡検出システム106は、泡検出機械学習モデルを実装して、泡の存在を検出する。したがって、泡検出システム106は、1つ以上の機械学習モデル(例えば、ニューラルネットワーク、SVM、適応ブースティング)を含むことができる。
【0040】
図1に更に図示され示されるように、ユーザクライアント装置108は、デジタルデータを生成し、記憶し、受信し、送信することができる。特に、ユーザクライアント装置108は、配列決定装置114から配列決定データを受信することができる。更に、ユーザクライアント装置108は、サーバー装置102と通信して、核酸塩基配列、並びに泡の存在を示すアラートなどの配列決定サイクル内の不規則性の報告を受信することができる。したがって、ユーザクライアント装置108は、配列決定データ及び泡の通知をグラフィカルユーザインターフェース内でユーザクライアント装置108に関連付けられたユーザに提示することができる。
【0041】
図1に図示するユーザクライアント装置108は、様々なタイプのクライアント装置を含むことができる。例えば、いくつかの実施形態では、ユーザクライアント装置108は、デスクトップコンピュータ若しくはサーバー、又は他のタイプのクライアント装置等の非モバイル装置を含む。更に他の実施形態では、ユーザクライアント装置108は、ラップトップ、タブレット、携帯電話、又はスマートフォンなどのモバイル装置を含む。ユーザクライアント装置108に関する更なる詳細は、
図8に関して以下で説明する。
【0042】
図1に図示するように、ユーザクライアント装置108は、配列決定アプリケーション110を含む。配列決定アプリケーション110は、ユーザクライアント装置108上に記憶され、実行されるウェブアプリケーション又はネイティブアプリケーション(例えば、モバイルアプリケーション、デスクトップアプリケーション)であってもよい。配列決定アプリケーション110は、泡検出システム106からデータを受信することができ、ユーザクライアント装置108における表示のために、配列決定データを提示することができる。更に、配列決定アプリケーション110は、ヌクレオチド-試料スライドのセクション内の泡の存在を示す通知を提供することができる。
【0043】
図1に更に図示されるように、泡検出システム106は、配列決定アプリケーション110の一部として、ユーザクライアント装置108上に位置してもよい。図示されるように、いくつかの実施形態では、泡検出システム106は、ユーザクライアント装置108上に(例えば、完全に又は部分的に位置して)実装される。加えて、又は代替として、いくつかの実装形態では、泡検出システム106は、配列決定装置114上に(例えば、完全に又は部分的に位置して)実装される。更に他の実施形態では、泡検出システム106は、環境100の1つ以上の他の構成要素によって実装される。特に、泡検出システム106は、サーバー装置102、ネットワーク112、ユーザクライアント装置108、及び配列決定装置114にわたって様々な異なる方法で実装することができる。
【0044】
図1は、ネットワーク112を介して通信する環境100の構成要素を図示しているが、ある特定の実装形態では、環境100の構成要素は、ネットワークを迂回して互いに直接通信することもできる。例えば、前述したように、ユーザクライアント装置108は、配列決定装置114と直接通信することができる。加えて、ユーザクライアント装置108は、泡検出システム106と直接通信することができる。更に、泡検出システム106は、サーバー装置102又は環境100内の他の場所に収容された、又はそれによってアクセスされる1つ以上のデータベースにアクセスすることができる。
【0045】
上記のように、泡検出システム106は、ヌクレオチド-試料スライド内の泡の存在を検出することができる。例えば、
図2は、1つ以上の実施形態による、ヌクレオチド-試料スライド内の泡の存在を検出するために一連の動作200を実行する泡検出システム106を図示する。一連の動作200の一部として、泡検出システム106は、コールデータを受信する動作202、品質データを受信する動作204、核酸塩基コールの第1のサブセット及び第2のサブセットを決定する動作206、並びに泡の存在を検出する動作208を実行する。
【0046】
図2に示すように、一連の動作200は、コールデータを受信する動作202を含む。特に、動作202を実行するとき、泡検出システム106は、核酸ポリマーを配列決定するサイクルについての核酸塩基コールを含むか又は示すコールデータを受信する。いくつかの場合では、泡検出システム106は、各配列決定サイクルについての核酸塩基コールを示す配列決定装置からのコールデータ(例えば、配列決定装置114からのイメージングデータ)にアクセスする。例えば、
図2に図示するように、泡検出システム106は、各配列決定サイクル及びヌクレオチド-試料スライドのセクションについてのアデニン(A)コール、チミン(T)コール、シトシン(C)コール、又はグアニン(G)コールを示す強度値を含む各サイクルについての画像データを受信する。いくつかの実施形態では、コールデータはまた、特定のサイクル内でコールされた特定の核酸塩基の総数又はパーセンテージを示す。
図2は、強度値を示す色を有する画像データとしてコールデータを示しているが、泡検出システム106は、バイナリ塩基コール(BCL)シーケンスファイル又はInterOpメトリックファイルの一部としてのコールデータなど、任意の適切なフォーマットでコールデータを受信することができる。
【0047】
ある特定の実装形態では、泡検出システム106は、動作202を実行するときに画像データを受信することに加えて、又は代替として、核酸ポリマーを配列決定するサイクルにわたる個々の核酸塩基コールを含むコールデータを受信する。例えば、いくつかの場合では、コールデータは、ヌクレオチド-試料スライドの特定のサイクル及びセクションについてのA、T、C、又はGコールについての明示的なデータ又はテキスト表示を含む。上記のように、コールデータはまた、特定のサイクル内でコールされた特定の核酸塩基の総数又はパーセンテージを含むことができる。
【0048】
図2に更に図示されるように、一連の動作200は、泡検出システム106が品質データを受信する動作204を実行することを含む。上記のように、品質データは、サイクルについての核酸塩基コールにおけるエラーを推定する品質メトリックを含む。特に、泡検出システム106は、各サイクルについて誤った核酸塩基コールの確率を示す品質データを配列決定装置から受信する。例えば、
図2に図示するように、品質データは、各サイクルに対して呼び出された(コールされた)塩基の総数に対応する品質メトリックを含む。
図2は、特定の品質メトリックに関連付けられた総塩基コールの分布として品質データを示しているが、泡検出システム106は、BCLファイル又はInterOpメトリックファイル内の品質メトリックなど、任意の適切なフォーマットで品質データを受信することができる。1つ以上の実施形態では、品質データは、以下で更に詳細に説明するような品質メトリックを含む。
【0049】
上記で更に示されるように、いくつかの実施形態では、品質メトリックは、不正確な核酸塩基コールの確率又は塩基コール精度に関連する品質スコアを含む。例えば、1つ以上の実施形態では、品質メトリックは、Illuminaによって開発されたPhredアルゴリズム又は改訂Phredアルゴリズムに基づくPhred品質スコアを含む。いくつかの実施形態では、泡検出システム106は、Method and System for Determining the Accuracy of DNA Base Identification、米国特許第8,392,126号(2009年9月23日出願)によって説明されるように、品質メトリックとしてPhredスコアを決定又は使用するものであり、その内容は、参照によりその全体が本明細書に組み込まれる。Q10のPhred品質スコアは、10回に1回の不正確な核酸塩基コールの確率と等価であり、これは、10個の核酸塩基配列決定リードごとに1つのエラーが含まれる可能性が高いことを意味する。以下の表は、追加のPhred品質スコア並びに不正確な核酸塩基コールのそれらの同等の確率及び核酸塩基コール精度を含む。
【0050】
【0051】
Phred品質スコアに関する更なる詳細は、Ewing B, Green P.Base-calling of Automated Sequencer Traces Using Phred.II.Error Probabilities.Genome Res. 1998 Mar.;8(3):186-194.PMID:9521922に示されており、その全体が参照により本明細書に組み込まれる。
【0052】
図2に更に図示されるように、一連の動作200は、核酸塩基コールの第1のサブセット及び第2のサブセットを決定する動作206を含む。特に、動作206を実行するとき、泡検出システム106は、少なくとも1つの核酸塩基に対応する核酸塩基コールの第1のサブセット、及び品質メトリックについての閾値品質メトリックを満たす核酸塩基コールの第2のサブセットを決定する。いくつかの実施形態では、第1のサブセット及び第2のサブセットは、ヌクレオチド-試料スライド(例えば、タイル)の所与のサイクル及び特定のセクションについての全ての核酸塩基コールのある割合又はパーセンテージを含む。以下の段落では、第1のサブセット及び第2のサブセットに関して更なる詳細を提供する。
【0053】
図2に図示されるように、泡検出システム106は、少なくとも1つの核酸塩基210に対応する第1のサブセットを決定する。例えば、
図2に図示されるように、泡検出システム106は、各サイクルについてアデニンコールのサブセット及びグアニンコールのサブセットを決定する。1つ以上の実施形態では、第1のサブセットは、特定の核酸塩基に対応する全ての核酸塩基コールの一部分を示すパーセンテージ値を含む。
図2は、アデニンコールのパーセンテージ及びグアニンコールのパーセンテージを決定することによって、少なくとも1つの核酸塩基210に対応する第1のサブセットを決定する泡検出システム106を示すが、泡検出システム106はまた、アデニンコール、チミンコール、シトシンコール、及びグアニンコールの任意の組み合わせを含む第1のサブセットを決定することもできる。
【0054】
図2に更に図示されるように、泡検出システム106はまた、閾値品質メトリック212を満たす第2のサブセットを決定する。泡検出システム106は、閾値品質メトリックを同定し、閾値品質メトリックを満たす核酸塩基コールのサブセットを決定する。いくつかの実装形態では、泡検出システム106は、ベンチマーク閾値品質メトリックを満たすか又は超える核酸塩基コールのパーセンテージ又は割合を含む閾値品質メトリックを決定する。例示すると、1つ以上の実施形態では、泡検出システム106は、閾値品質メトリックがQ30のPhred品質スコアに等しいと決定する。泡検出システム106は、各サイクルについて、Q30品質メトリックを満たすか又は超える核酸塩基コールのパーセンテージ(又は他のサブセット)を決定する。
【0055】
核酸塩基コールの第1のサブセット及び第2のサブセットを決定する動作206を実行した後、泡検出システム106は、泡の存在を検出する動作208を実行する。特に、動作208を実行するとき、泡検出システム106は、核酸塩基コールの第1のサブセット及び核酸塩基コールの第2のサブセットに基づく泡検出機械学習モデルを利用することによって、ヌクレオチド-試料スライド内の泡の存在を検出する。
図2に図示するように、例えば、泡検出システム106は、泡検出機械学習モデル216を利用して、入力マトリックス214を分析し、出力218を生成する。
【0056】
一連の動作200に加えて、いくつかの場合では、泡検出システム106は更に、泡の存在を示すアラートをコンピューティング装置に提供する。特に、泡検出システム106は、ユーザに関連付けられたコンピューティング装置を介して表示するための通知又はアラートを提供する。加えて、又は代替として、泡検出システム106は、配列決定装置にアラートを提供する。いずれの場合も、泡検出システム106は、アラート内に、泡又はエラーのタイプを示すエラー分類を含むことができる。更に、アラートは、泡が発生したヌクレオチド-試料スライドのセクション及び/又は配列決定サイクルを含む追加の情報を含むことができる。
【0057】
更に、いくつかの実装形態では、泡検出システム106は、泡の存在を検出することに基づいて1つ以上の補正動作を決定する。例示すると、いくつかの実装形態では、泡検出システム106は、泡の存在を検出することに基づいて、ヌクレオチド-試料スライドのサイクル、特定のサイクル、又は特定のセクションにおける特定のリードについての品質メトリックを低減する。いくつかの場合では、例えば、泡検出システム106は、対応するリードについての固有分子同定子(UMI)を同定することによって、品質メトリックを低減するサイクルにおける核酸塩基コールを同定することができる。それに加えて、又は代替として、泡検出システム106は、泡によって影響を受けたヌクレオチド-試料スライドのサイクル、特定のサイクル、又は特定のセクションにおける特定のリードを同定することに基づいて、コールデータから影響を受けたコールを削除することができる。いくつかの場合では、泡検出システム106は、泡の持続を決定することに基づいて、アラート内に、泡を解消するための提案された動作を含むことができる。例えば、検出された油泡の数が閾値を満たすと判定することに基づいて、泡検出システム106は、油漏れについて配列決定装置の部品をチェックするための、又はヌクレオチド-試料スライドを再装填するための提案された動作を含むアラートを提供する。
【0058】
前述のように、いくつかの実施形態では、泡検出システム106は、泡によって影響を受けるヌクレオチド-試料スライドの特定のセクションを同定する。一例では、ヌクレオチド-試料スライドのセクションは、フローセルのタイルを含む。したがって、1つ以上の実施形態では、泡検出システム106は、ヌクレオチド-試料スライドの特定のセクションについて一連の動作200を実行する。したがって、ある特定の実装形態では、泡検出システム106は、ヌクレオチド-試料スライドの単一のセクションについてのサイクルにわたるコールデータ及び品質データを受信する。したがって、泡検出システム106は、泡によって影響を受けたヌクレオチド-試料スライドの特定のセクションを同定することができる。
【0059】
図2に更に図示されるように、泡検出システム106は、泡検出機械学習モデル216への入力として入力マトリックス214を利用する。1つ以上の実施形態では、入力マトリックス214は、少なくとも1つの核酸塩基に対応する核酸塩基コールの第1のサブセット(例えば、アデニンコールのサブセット及びグアニンコールのサブセット)及び閾値品質メトリックを満たす核酸塩基コールの第2のサブセットについてのデータを含む。
図5に関して以下で説明するように、入力マトリックス214は、配列決定サイクルの数に基づいてサイズを変えることができる。
【0060】
図2によって更に図示されるように、泡検出システム106は、泡検出機械学習モデル216を実装する。泡検出機械学習モデル216は、入力マトリックス214から特徴を抽出して、ヌクレオチド-試料スライド内の泡の存在を同定する。泡検出機械学習モデル216は、様々なタイプの機械学習モデルを含むことができる。いくつかの実施形態では、泡検出機械学習モデル216は、CNNなどのニューラルネットワーク、又はSVM若しくはAdaptive Boosting機械学習モデルなどの様々なタイプの機械学習モデルを含む。
図5及び対応する説明は、1つ以上の実施形態による例示的なCNNを更に説明する。
【0061】
入力マトリックス214を泡検出機械学習モデル216に通した後、泡検出システム106は、泡検出機械学習モデル216を利用して、出力218を生成する。いくつかの実施形態では、出力218は、(i)ヌクレオチド-試料スライド内の泡の表示、及び(ii)エラー分類を含む。
図2に図示するように、例えば、出力218は、油泡、気泡、及びドロップアウトを含む潜在的なエラー分類を含む。追加の実施形態では、出力218は、ゴースト泡の追加のエラー分類を含む。
図4A~
図4C及び対応する段落は、1つ以上の実施形態による泡検出システム106によって生成されるエラー分類を更に説明する。
【0062】
図2は、1つ以上の実施形態による、ヌクレオチド-試料スライド内の泡の存在を決定する泡検出システム106の全般的概観を提供する。上述したように、泡検出システム106は、様々なタイプのコールデータに基づいて泡の存在を柔軟に決定することができる。
図3は、泡検出システム106がヌクレオチド-試料スライド内の泡の存在を決定する際に利用することができる異なるタイプのコールデータを示す。概して、
図3は、SBSサイクルの一部として得られた1チャネルデータ302、2チャネルデータ304、及び4チャネルデータ306を図示する。以下の段落は、これらのタイプのデータの各々を更に説明する。
【0063】
図3に図示するように、いくつかの実施形態では、コールデータは、1チャネルデータ302の形態の画像データを含むことができる。いくつかの実施形態では、
図3に図示されるように、1チャネルデータは、核酸ポリマーの配列決定の所与のサイクルについてのヌクレオチド-試料スライド308aのセクション310aの2画像複合体312を含む。ある特定の実施形態では、2画像複合体312は、異なる時間に捕捉された同じ検出チャネル、同じ色素、又は同じ蛍光標識を使用して各々撮影された2つの画像の組み合わせを含む。シーケンサーが各核酸塩基について異なる蛍光色素又は標識を使用する4チャネルSBS化学とは異なり、1チャネルSBS化学は、配列決定サイクルごとに1つの蛍光色素、2つの化学ステップ、及び2つのイメージングステップ(2つの画像を生成する)を使用する。1チャネル化学では、例えば、アデニンは除去可能な標識を有し、第1の画像318のみで標識される。シトシンは、標識に結合することができ第2の画像320でのみ標識される、リンカー基を有する。チミンは、永続的な蛍光標識を有し、したがって、第1の画像318及び第2の画像320の両方で標識される。グアニンは標識されないため、いずれの画像においても蛍光を発しない。泡検出システム106は、2つの画像にわたる各塩基についての異なる発光パターンを分析することに基づいて、核酸塩基コールを決定する。
【0064】
1つ以上の実施形態では、泡検出システム106は、強度情報に基づいて1チャネルデータを取得する。かかる実施形態では、2つの画像を撮影する代わりに、配列決定システム104は、単一の画像を撮影し、異なる強度値を異なる核酸塩基と関連付ける。特に、3つ以上の核酸塩基が、異なる強度で1つの蛍光色素又は標識に結合する。泡検出システム106は、強度範囲を特定の核酸塩基と関連付けるか、又は色素若しくは標識の欠如を特定の核酸塩基と関連付けることができる。したがって、泡検出システム106は、単一チャネルを使用して強度データに基づいて核酸塩基コールを決定する。
【0065】
図3に更に図示されるように、ある特定の場合では、泡検出システム106は、2チャネルデータ304の形式でコールデータを受信する。特に、2チャネルデータ304は、ヌクレオチド-試料スライド308bのセクション310bの2画像複合体314を含む。特に、2画像複合体314は2つの画像を含み、各画像は、2つの異なる色素又は異なる蛍光標識に特異的な検出チャネルを使用して撮影される。2チャネルSBSは、4つの核酸塩基コール全てを決定するために2つの蛍光色素及び2画像複合体314を使用することによって、4チャネルSBS化学と比較してヌクレオチド検出を簡略化する。例えば、一実施形態では、配列決定装置のカメラは、赤色及び緑色フィルタバンドを使用して画像を撮影する。チミン核酸塩基は緑色フルオロフォアで標識され、シトシンは赤色フルオロフォアで標識され、アデニンは赤色フルオロフォア及び緑色フルオロフォアの両方で標識される。グアニンは永続的に暗い。泡検出システム106は、2つのフィルタチャネルを使用して2画像複合体314を処理し、ヌクレオチド-試料スライド308bのセクション310b内の各クラスター内にどの核酸塩基が組み込まれているかを決定することによって、核酸塩基コールを決定する。
【0066】
更に上述したように、いくつかの実装形態では、泡検出システム106は、4チャネルデータ306の形態でコールデータを受信する。特に、4チャネルデータ306は、ヌクレオチド-試料スライド308cのセクション310cの4画像複合体316を含む。特に、4画像複合体316は4つの画像を含み、各画像は、4つの異なる色素又は蛍光標識のうちの1つに特異的な検出チャネルを使用して撮影される。4チャネルSBSサイクルは、4つ全ての異なる標識された塩基がヌクレオチド-試料スライドに加えられる化学ステップから始まる。イメージングサイクルは、4つの異なるフィルタチャネル又は波長帯域を使用した4画像複合体316の取り込みを開始し、含む。泡検出システム106は、4画像複合体316を処理して、どの核酸塩基がヌクレオチド-試料スライドにわたる各クラスター位置に組み込まれているかを決定する。
【0067】
泡検出システム106は、コールデータに基づいて核酸塩基コールのサブセットを決定する。特に、泡検出システム106は、1チャネルデータ302、2チャネルデータ304、及び/又は4チャネルデータ306を記憶し、処理し、分析して、各配列決定サイクルについての塩基コールを決定する。より具体的には、泡検出システム106は、撮影された画像にわたる各核酸塩基についての異なる発光パターンの分析によって核酸塩基を同定する。配列決定サイクルが完了すると、泡検出システム106は、核酸塩基コールの総数を決定する。泡検出システムは更に、特定の核酸塩基コールの数をサイクルについての核酸塩基コールの総数と比較することによって、個々の核酸塩基コールのサブセットを決定する。一例では、泡検出システム106は、所与のサイクルについて1000個の総塩基コールのうち310個のアデニンコールを決定する。この決定に基づいて、泡検出システム106は、アデニンコールのサブセット(%Aコール)が0.31に等しいと決定する。
【0068】
前述のように、ヌクレオチド-試料スライド内の泡の存在を検出することの一部として、いくつかの実施形態では、泡検出システム106は、泡検出機械学習モデルを利用して、アデニンコールのサブセット、グアニンコールのサブセット、及び核酸ポリマーを配列決定するサイクルについての閾値品質メトリックを満たす核酸塩基コールのサブセットに基づいてエラー分類を生成する。例えば、ある特定の実施形態では、泡検出システム106は、気泡、油泡、ゴースト泡、又はドロップアウトによって引き起こされるエラーを同定するエラー分類を生成する。各エラー分類は、コールデータ及び品質データからのメトリックについて異なるデータシグネチャに対応する。
【0069】
泡検出システム106は、泡を検出するか、又は
図4A~4Cに示される様々なデータシグネチャに対応する、かかるエラーを分類することができる。1つ以上の実施形態によれば、
図4A、4B、及び4Cは、配列決定ラン内のサイクルにわたるデータシグネチャとして示される入力データの進行をグラフ化する例示的なチャートを図示する。特に、
図4Aは、泡のないヌクレオチド-試料スライドに対応する例示的なデータシグネチャを示すデータチャートを図示する。
図4Bは、1つ以上の実施形態による、気泡、ゴースト泡、及び油泡に対応する例示的なデータシグネチャを図示する。
図4Cは、1つ以上の実施形態による、疑わしい泡、ドロップアウト、及び単一サイクル内で生じるドロップアウトに対応する例示的なデータシグネチャを図示する。
図4A~4Cは、泡検出機械学習モデル(アデニンコールのサブセット、グアニンコールのサブセット、及び閾値メトリックを満たす核酸塩基コールのサブセットを含む)へのデータ入力についてのチャートを示すが、泡検出システム106は、チャート自体をかかるモデルに入力しない。
【0070】
概観として、
図4A~4Cのチャートは、いくつかの共通の特徴を共有する。例えば、
図4A~4Cは、様々なエラー分類に対応するデータシグネチャを有する例示的なチャート412a~412gを図示する。図示されたチャート412a~412gによってグラフ化されたメトリックは、エラーパーセンテージ404a~404g、アデニンコールパーセンテージ406a~406g、グアニンコールパーセンテージ408a~408g、及びQ30充足パーセンテージ410a~410gを含む。より具体的には、チャート412a~412gは、配列決定ラン内の配列決定サイクルにわたるメトリックの進行を示す。エラーパーセンテージ404a~404gは、各サイクルにおける核酸塩基コールについて予測エラーのパーセンテージを示す。アデニンコールパーセンテージ406a~406gは、アデニンコールを含む各サイクルにおける全ての核酸塩基コールのパーセンテージ(又はサブセット)を示す。同様に、グアニンコールパーセンテージ408a~408gは、グアニンコールを含む各サイクルにおける全ての核酸塩基コールのパーセンテージ(又はサブセット)を示す。Q30充足パーセンテージ410a~410gは、Q30閾値品質メトリックを満たす(充足する)各サイクルにおける核酸塩基コールのパーセンテージを示す。1つ以上の他の実施形態では、泡検出システム106は、他のメトリックから特徴を抽出して、エラーを同定及び分類する。
【0071】
上述したように、
図4Aは、泡に関連しないチャート412aを示す。特に、チャート412aは、泡を含まないヌクレオチド-試料スライドについてのデータシグネチャを表示する。概して、泡は、比較的安定したメトリックを有するデータシグネチャに対応しない。例えば、エラーパーセンテージ404a、アデニンコールパーセンテージ406a、グアニンコールパーセンテージ408a、及びQ30充足パーセンテージ410aは、配列決定サイクルにわたって比較的安定したままである。チャート412aは、異なるエラーに対応するチャートを比較するためのベースラインを提供する。チャート412aに対応するデータに基づいて、泡検出システム106は、泡の存在を検出しない。
【0072】
対照的に、
図4Bは、気泡を示すデータシグネチャを伴うチャート412b、ゴースト泡を示すデータシグネチャを伴うチャート412c、及び油泡を示すデータシグネチャを伴うチャート412dを図示する。例えば、チャート412bは、気泡を含有するヌクレオチド-試料スライドについての核酸塩基コールを反映するデータシグネチャにおけるメトリックを含む。概して、気泡は、ヌクレオチド-試料スライド内の流体ライン及びチャネルに入る空気から生じる。気泡は、配列決定サイクルのイメージング段階中に発生して捕捉されると、配列決定リードのデータ品質に悪影響を及ぼす。例えば、イメージング段階中に、気泡は、画像の一部を不明瞭にするか、又は化学効率を低下させる可能性がある。より具体的には、気泡は、ヌクレオチド-試料スライドのガスケットからヌクレオチド-試料スライドに入り、イメージング中にラミネートがガスを放出する可能性がある。
【0073】
チャート412bによって示されるように、気泡は、エラーパーセンテージ404b及びグアニンコールパーセンテージ408bの両方においてスパイク(急上昇)を引き起こす一方で、アデニンコールパーセンテージ406b及びQ30充足パーセンテージ410bにおいてもディップ(急低下)を引き起こす。
図4Bに更に図示されるように、配列決定装置は、60回目の配列決定サイクルと80回目の配列決定サイクルとの間に気泡を捕捉した。チャート412bに示されるデータシグネチャに対応するデータに基づいて、泡検出システム106は、泡の存在を検出し、気泡を泡として分類する。
【0074】
図4Bに更に示されるように、チャート412cは、ゴースト泡を含むヌクレオチド-試料スライドについてのメトリックをグラフ化する。ゴースト泡は、イメージング段階の外部で生じる空気又は油の泡を指す。例えば、配列決定装置のカメラがヌクレオチド-試料スライドの写真を撮るときに生じる気泡及び油泡とは対照的に、ゴースト泡は、イメージング段階に至る(及びそれに続く)化学ステップに影響を及ぼすことによって品質データに影響を与える。例えば、ゴースト泡は、プライマー及びヌクレオチドがヌクレオチド-試料スライド上で洗浄される場合の取り込み中、又は蛍光末端ブロッキング基が除去される場合の脱ブロッキング中に生じ得る。
【0075】
チャート412cに図示されるように、80番目の配列決定サイクルの後のある時点で生じるゴースト泡は、エラーパーセンテージ404cを急速に増加させ、残りの配列決定サイクルにわたって上昇したままにする。加えて、Q30充足パーセンテージ410cは、エラーパーセンテージ404cを反映し、同じ配列決定サイクルで急低下する。チャート412cに更に図示されるように、アデニンコールパーセンテージ406c及びグアニンコールパーセンテージ408cは、対照と比較して同様のままである。チャート412cに示されるデータシグネチャに対応するデータに基づいて、泡検出システム106は、泡の存在を検出し、ゴースト泡を泡として分類する。
【0076】
図4Bにも示されるように、チャート412dは、油泡を含むヌクレオチド-試料スライドについてのメトリックをグラフ化する。概して、油泡は、配列決定装置の部品からの油がヌクレオチド-試料スライドに入るときに生じる。気泡と同様に、油泡は、配列決定サイクルのイメージング段階中に撮影される画像に影響を及ぼすことによって、データ品質に悪影響を及ぼす。より詳細には、油泡は、色素又は標識及び蛍光を吸収し、配列決定装置に過剰な蛍光を捕捉させる。例えば、チャート412dによって示されるように、20番目の配列決定サイクルと40番目の配列決定サイクルとの間に捕捉された油泡は、エラーパーセンテージ404d及びアデニンコールパーセンテージ406dに鋭いピークを引き起こす。チャート412dはまた、グアニンコールパーセンテージ408dにおけるより小さなディップと、Q30充足パーセンテージ410dにおけるより顕著なディップとをグラフ化する。チャート412dに示されるデータシグネチャに対応するデータに基づいて、泡検出システム106は、泡の存在を検出し、油泡を泡として分類する。
【0077】
上述したように、
図4Cは、追加のエラー分類に対応する例示的なチャートを図示する。特に、
図4Cは、疑わしい泡に対応するチャート412e、ドロップアウトに対応するチャート412f、及び単一サイクル内のドロップアウトに対応するチャート412gを図示する。
【0078】
図4Cに示されるように、例えば、チャート412eは、疑わしい泡を有するヌクレオチド-試料スライドについてのメトリックをグラフ化する。概して、疑わしい泡は、泡がないこと、前述の泡のうちの1つ(例えば、気泡、ゴースト泡、油泡)、又は別のタイプのエラーを示すことができる。特に、ある泡分類(例えば、気泡、ゴースト泡、及び油泡)は、別個のデータシグネチャとリンクされるが、かかるデータシグネチャはまた、いくつかの変動を含むことがある。加えて、泡に加えて他のエラーがデータの品質に影響を及ぼす可能性がある。したがって、いくつかの実施形態では、泡検出システム106は、チャート412e内のデータシグネチャに対応する核酸塩基コールのサブセットに基づいて、「泡なし(無泡)」の分類を生成する。あるいは、ある特定の実装形態では、泡検出システム106は、チャート412e中のデータシグネチャに対応する核酸塩基コールのサブセットに基づいて、「未知の泡タイプ」又は「未知のエラータイプ」の分類を生成する。1つ以上の実施形態では、疑わしい泡分類は、特定の泡分類の典型的なデータシグネチャ又は無泡データシグネチャ(例えば、
図4Aに図示されるような)からわずかに変動するデータシグネチャに対応する。
【0079】
例示すると、チャート412eは、エラーパーセンテージ404eにおけるピークと、Q30充足パーセンテージ410eにおける対応するディップとを示す。しかし、チャート412eのアデニンコールパーセンテージ406e及びグアニンコールパーセンテージ408eは、比較的影響を受けないままである。1つ以上の実施形態では、泡検出システム106は、空気、油、又はゴースト泡の特徴と類似するが、閾値差を超える入力マトリックスの特徴に基づいて、疑わしい泡の分類を決定する。チャート412eに示されるデータシグネチャに対応するデータに基づいて、泡検出システム106は、泡の存在を検出するが、泡を分類しない。
【0080】
図4Cは、ドロップアウトを有するヌクレオチド-試料スライドに対応するチャート412f及び412gを更に図示する。概して、ドロップアウトは、カメラが、ヌクレオチド-試料スライドのセクション内のセクション(例えば、フローセル内のタイル)又はクラスターの画像データを全く取り込まないか、又は限定された量しか取り込まない場合を指す。かかるドロップアウトは、特定の蛍光標識を欠くヌクレオチド又は特定の波長の光によって照射されない標識を有するヌクレオチドを示す暗信号又は強度値を有する画像データとは異なり、それを指すものではない。ドロップアウトは、配列決定サイクルの様々な段階で生じ得る。チャート412fによって示されるように、ドロップアウトは、SBS配列決定のクラスター又はセクション登録(位置合わせ)段階中に生じ得る。加えて、チャート412gによって示されるように、ドロップアウトは単一サイクルで生じ得る。
【0081】
上述したように、チャート412fは、クラスター又はセクション登録中に生じるドロップアウトの影響を図示する。概して、クラスターは、試料由来の核酸セグメント又はクローン化セグメントの群を指す。特に、クラスターは、同じDNA又はRNAセグメントの何千ものコピーを表す。例えば、1つ以上の実施形態では、クラスターは、ヌクレオチド-試料スライドのセクション(切片)に固定化される。いくつかの実施形態では、クラスターは、パターン化されたヌクレオチド-試料スライドを使用して均一に離間され得る。
【0082】
クラスター及びセクション登録中、配列決定システム104は、イメージングのためにクラスター及びセクションの位置を記録する。いくつかの実施形態では、配列決定システム104はまた、クラスター及びセクション登録中に強度値を記録する。概して、クラスター登録中に生じするドロップアウトにより、配列決定システム104は、配列決定サイクルの持続時間にわたって特定のクラスターを登録することができなくなる。チャート412fによって示されるように、セクション又はクラスター登録中に生じるドロップアウトは、より長く持続する効果をもたらす。特に、エラーパーセンテージ404fは、120番目の配列決定サイクル付近での急激な増加を示し、Q30充足パーセンテージ410fは、対応する低下を示す。チャート412fに示されるデータシグネチャに対応するデータに基づいて、泡検出システム106は、登録中にドロップアウトイベントを検出する。
【0083】
クラスター及びセクション登録中に生じるドロップアウトは、様々な原因を有し得る。例えば、クラスター登録中のドロップアウトは、ヌクレオチド-試料スライドの全セクションを覆う泡の存在を示し得る。更に、クラスター登録中のドロップアウトは、他のタイプの不規則性を示し得る。例えば、ドロップアウトは、ソフトウェア又はハードウェア機能におけるエラーを示し得る。一例では、ドロップアウトは、配列決定装置とユーザクライアント装置又はサーバー装置との間のダイレクトメモリアクセス(DMA)転送ができなかったことを示す。加えて、ドロップアウトは、特定のヌクレオチド-試料スライドセクション又はクラスターに関連するデータの削除をもたらすセンサ又はカメラにおけるハードウェア障害を知らせ得る。例えば、配列決定装置内のセンサは、焦点が合っていない場合がある。
【0084】
図4Cのチャート412gによって更に図示されるように、泡検出システム106は、配列決定サイクル中に生じるドロップアウトを検出することができる。特に、所与のサイクル中に、配列決定装置は、ヌクレオチド-試料スライドのクラスター又はセクションについてのデータを誤って除外する場合がある。例えば、配列決定装置は、サイクル中にセンサがヌクレオチド-試料スライドのクラスター又はセクションを低下させる機械的エラーを被る可能性がある。別の例では、配列決定装置は、配列決定実行中にドロップアウトを引き起こすリアルタイム分析(RTA)エラーを被る。チャート412gによって示されるように、単一の配列決定サイクルにおけるドロップアウトは、Q30充足パーセンテージ410gにおける顕著なディップ、及びエラーパーセンテージ404gにおけるより小さい対応するディップとして現れ得る。更に、アデニンコールパーセンテージ406g及びグアニンコールパーセンテージ408gの両方は、ドロップアウトによって影響を受けたサイクルに対応するデータギャップを有する。チャート412fに示されるデータシグネチャに対応するデータに基づいて、泡検出システム106は、単一サイクル中にドロップアウトイベントを検出する。
【0085】
図4B~
図4Cは、様々なエラー分類のデータシグネチャを表示する例示的なチャートを図示する。いくつかの実施形態では、泡検出システム106は、泡検出機械学習モデルを利用して、入力マトリックスから特徴を抽出し、泡の存在及び泡についての対応する分類を決定する。前述のように、泡検出機械学習モデルは、ニューラルネットワークを含むことができる。
図5は、1つ以上の実施形態による泡検出ニューラルネットワークの例示的な構成を図示する。特に、
図5は、特徴抽出層502と、分類層504と、適応最大プーリング層508とを含む泡検出ニューラルネットワーク500を示す。図示のように、泡検出ニューラルネットワーク500は、泡検出システム106が入力マトリックス510に適用する訓練されたニューラルネットワークを含む。泡検出システム106は更に、泡検出ニューラルネットワーク500を利用することによって、出力分類506を生成する。
【0086】
図5に示されるように、泡検出ニューラルネットワーク500は、訓練されたニューラルネットワークを含む。特に、1つ以上の実施形態では、泡検出システム106は、訓練データセットを利用して、泡検出ニューラルネットワーク500を訓練する。一実施形態では、泡検出システム106は、訓練入力マトリックスについてのグラウンド-トルース(ground truth)分類を含む訓練データセットにアクセスする。
図6A及び対応する説明は、1つ以上の実施形態による、泡検出システム106が泡検出ニューラルネットワーク500を訓練する方法に関する追加の説明を提供する。
【0087】
図5に更に図示されるように、泡検出システム106は、泡検出ニューラルネットワーク500を訓練後に入力マトリックス510に適用する。
図5に図示されるように、ヌクレオチド-試料スライドの各セクション(例えば、フローセルのタイル)について、入力マトリックス510は、長さNの3つの一次元入力チャネルを含み、Nは、ランにおけるSBSサイクルの数に等しい。いくつかの実施形態では、3つの一次元入力チャネルは、アデニンコールのサブセット、グアニンコールのサブセット、及び閾値品質メトリック(例えば、%Q30)を満たす核酸塩基コールのサブセットを含む。入力マトリックス510のサイズは可変であり、したがって、広範囲の配列決定ランの長さに対応することができる。
【0088】
泡を検出及び分類するために機械学習モデルを訓練することに加えて、ある特定の実装形態では、泡検出システム106は、特定の配列決定化学ステップ又は段階中に導入される泡を区別するように、かかるモデルを訓練する。異なるSBS又はサンガー化学ステップ若しくは段階で生じる泡は、固有のデータシグネチャをもたらす可能性がある。例えば、泡がヌクレオチド-試料スライドに入るか又は妨害する化学ステップ又は段階に特異的なかかる固有のデータシグネチャに対応する訓練データを使用することによって、泡検出システム106は、泡検出機械学習モデルを訓練して、特定のSBS化学ステップ又は段階中に導入された泡を検出し、区別することができる。いくつかの実施形態では、例えば、泡検出システム106は、配列決定ステップ(例えば、組み込み又は脱ブロック)中に、又はイメージングステップ(例えば、フローセル内の試薬のスキャンミックス)中に導入された泡を区別する。
【0089】
上述し、
図5に示すように、いくつかの実施形態では、泡検出ニューラルネットワーク500は軽量CNNを含む。泡検出ニューラルネットワーク500は、下位ネットワーク層(例えば、畳み込み層及び逆畳み込み層)と上位ニューラルネットワーク層(例えば、全結合層)とを有するCNNを含むことができる。代替実施形態では、泡検出ニューラルネットワーク500は、異なるニューラルネットワークアーキテクチャを採用する。更に、いくつかの実装形態では、泡検出ニューラルネットワーク500は、畳み込み演算後に次元を圧縮するための最大プーリング層の実装形態など、ダウンサンプリング方法を使用しない。かかる実装形態では、泡検出システム106は、特に、短い配列決定ラン(例えば、N=36)の場合、表現サイズを維持するために最大プーリング層を除外する。
【0090】
図5に更に図示されるように、泡検出ニューラルネットワーク500は、適応最大プーリング層508を含む。いくつかの実装形態では、適応最大プーリング層508は、泡検出ニューラルネットワーク500の特徴抽出層502と分類層504との間に位置する。適応最大プーリング層508を実装することによって、泡検出システム106は、表現サイズを指定し、分類層504への入力についての特徴を空間的に崩壊させる。適応最大プーリング層508の実装は、泡検出ニューラルネットワーク500の効率を改善する。
図5に示すCNNに対する代替形態では、いくつかの場合では、泡検出ニューラルネットワーク500は、適応最大プーリング層508を含まない。
【0091】
適応最大プーリング層508を使用することによって、いくつかの実施形態では、泡検出ニューラルネットワーク500は、並進不変になる。より具体的には、並進不変ネットワークは、入力の特定の変化に関係なく同じ出力を生成する。一例において、泡検出ニューラルネットワーク500の並進不変バージョンは、ヌクレオチド-試料スライドセクション内の泡の存在及び分類を単に示すが、泡が生じた特定のサイクルを示さない。適応最大プーリング層508のパラメータを除去又は調整することによって、泡検出システム106は、出力に含めるべき追加の分類を指定することができる。例えば、泡検出ニューラルネットワーク500は、エラー分類に加えて、泡が生じた特定のサイクルの表示を生成することができる。
【0092】
上述したように、
図5は、泡検出ニューラルネットワーク500の一部として分類層504を図示する。ここで示されるように、分類層504は、特徴抽出層502によって抽出された特徴を分類する全結合ニューラルネットワークを含む。1つ以上の実装形態では、分類層504は、マルチクラス出力を生成し、ヌクレオチド-試料スライドの単一のセクションについて複数のエラー分類を示すことができる。例えば、分類層504は、単一のセクションについて油泡及び気泡の両方の分類を生成することができる。
【0093】
図5に更に図示するように、泡検出ニューラルネットワーク500は、出力分類506を含む。いくつかの実施形態では、泡検出ニューラルネットワーク500は、対応する信頼度又は確率スコアを出力する。特定の分類についての信頼度又は確率スコアが信頼度閾値を満たすと判定することに基づいて、泡検出システム106は、入力マトリックス510についての油泡、気泡、又はドロップアウトのいずれかの特定の分類を決定する。言い換えれば、泡検出システム106は、泡又はドロップアウトイベント(事象)を検出し、特定の閾値を満たす信頼スコアに基づいて、それを油泡、気泡、又はドロップアウトのいずれかとして分類する。
図5は、油泡、気泡、及びドロップアウト分類を図示するが、出力分類506は、任意の数の追加の分類を含むことができる。例えば、出力分類506は、ゴースト泡分類、位置合わせドロップアウト分類、イメージングドロップアウト分類、疑わしい泡分類、及び他のエラー分類を含むことができる。
【0094】
図5の泡検出ニューラルネットワーク500は、1つ以上の実装形態によるCNNの例示的な構成を示す。他の実施形態では、泡検出システム106は、様々な他の構成を有する機械学習モデルを利用する。あるいは、泡検出システム106は、異なる構成を有するニューラルネットワークを利用して、泡によって影響を受ける特定のサイクルを同定することができる。例えば、ある特定の実装形態では、泡検出システム106は、CNNにアテンションレイヤを組み込み、泡によって影響を受けるヌクレオチド-試料スライド上の特定の位置(例えば、クラスター、セクション)を示す分類を生成する。泡検出システム106は、他のタイプのディープニューラルネットワークを実装することもできる。例えば、泡検出システム106は、長期短期記憶(LSTM)ネットワーク又は他のタイプの再帰型ニューラルネットワークを実装することができる。更に、追加の実施形態では、泡検出システム106は、異なるタイプの機械学習モデルを泡検出ニューラルネットワーク500として利用する。いくつかの例では、泡検出システム106は、SVM又は適応ブースティング(AdaBoost)機械学習モデルを利用する。
【0095】
いくつかの実施形態では、泡検出システム106は、空間画像(又は再構成された空間画像)に対応する核酸塩基コールデータを使用して、ヌクレオチド-試料スライドのセクション内の泡の存在を検出する。例えば、前述したように、泡検出システム106は、ヌクレオチド-試料スライドのセクション(例えば、タイル)又はサブセクション(例えば、サブタイル)の空間画像を使用して、画像-機械学習モデルを訓練し、泡を検出又は分類することができる。いくつかの実施形態では、例えば、泡検出システム106は、泡検出機械学習モデル(例えば、泡検出ニューラルネットワーク500)を訓練するために、正確に検出された泡の存在又は不在を伴う空間画像データに対応する核酸塩基コールデータ(例えば、BCL又はBAMファイルからの)についてのグラウンド-トルース分類標識を同定する。
【0096】
直前に示唆されたように、
図6A~6Cは、概して、1つ以上の実施形態による、空間画像に対応する核酸塩基コールデータを使用して、画像機械学習モデル及び泡検出機械学習モデルを訓練する泡検出システム106を図示する。特に、
図6Aは、ヌクレオチド-試料-スライドセクションの空間画像を使用して画像-機械学習モデルを訓練し、かかる空間画像及び対応する核酸塩基コールデータについてのグラウンド-トルース分類標識を生成し、核酸塩基コールデータ及びグラウンド-トルース分類標識を利用して、泡検出-機械学習モデルを更に訓練する泡検出システム106を図示する。
図6Bは、1つ以上の実施形態による泡検出システム106によって生成される例示的な空間画像を図示する。
図6Cは、1つ以上の実施形態による、ヌクレオチド-試料スライドの一部分を描写する例示的な配列決定実行画像を図示する。
【0097】
上述したように、いくつかの実装形態では、泡検出システム106は、画像機械学習モデル608を利用して、ヌクレオチド-試料スライドのセクション又はサブセクションの空間画像(又は再構成された空間画像)に基づいて泡を検出又は分類する。例示すると、
図6Aは、空間画像606a~606nを使用して画像機械学習モデル608を訓練し、空間画像606a~606nに対応する核酸塩基コールデータ602a~602n及びグラウンド-トルース分類標識604a~604nを同定する泡検出システム106を示す。泡検出システム106は、その後、核酸塩基コールデータ602a~602n及びグラウンド-トルース分類標識604a~604nを使用して、泡検出機械学習モデル622を訓練する。
図6Aは、画像機械学習モデル608を訓練する泡検出システム106を図示するが、画像機械学習モデル608のかかる訓練又は使用は、任意選択であり、1つ以上の実施形態を表す。実際、いくつかの実施形態では、泡検出システム106は、核酸塩基コールデータ602a~602n及びグラウンド-トルース分類標識604a~604nの一部又は全部を使用して、画像機械学習モデル608を訓練又は使用することなく、泡検出機械学習モデル622を訓練する。したがって、
図6Aは、かかる訓練及び使用が任意選択であることを示すよう、画像機械学習モデル608の周りの点線と、対応する出力及び決定された損失とを含む。
【0098】
簡単に述べると、本開示は、
図6Aに示される、後続の訓練反復の概要が後に続く、初期訓練反復を説明する。概観として、
図6Aによって描写される初期訓練反復において、泡検出システム106は、核酸塩基コールデータ602aを利用して、空間画像606aを生成又は再構築する。泡検出システム106は、空間画像606aを画像機械学習モデル608についての入力として利用し、続いて泡分類610aを生成する。
【0099】
図6Aに図示するように、泡検出システム106は、核酸塩基コールデータ602a~602nを利用して、空間画像606a~606nを生成する。1つ以上の実施形態では、核酸塩基コールデータ602a~602nは、所与の配列決定サイクルについてのヌクレオチド-試料スライド内のセクション又はサブセクションに対応する核酸塩基コール及び品質メトリックを含む。ある特定の状況において、泡検出システム106は、BCLシーケンスファイル又はBAM(
*.bam)ファイルからの核酸塩基コールデータ602a~602nにアクセスする。いくつかのかかる核酸塩基コールデータは、例えば、ヌクレオチド-試料スライドのタイル又はサブタイル内の泡の存在を示す核酸塩基コールのパターン(例えば、Aコール又はGコールの円形パターン)を含むことができる。
【0100】
図6Aに更に図示されるように、1つ以上の実施形態では、泡検出システム106は、核酸塩基コールデータ602a~602nに基づいて空間画像606a~606nを生成又は再構成する。概して、泡検出システム106は、ヌクレオチド-試料スライド上のクラスターの位置に従って配置されたBCL又はBAMファイルから核酸塩基コールの空間表現を生成することによって、核酸塩基コールを空間パターンに組み込む。一例では、泡検出システム106は、核酸塩基を特定の色とリンクさせることによって空間画像606a~606nを色分けする。例えば、泡検出システム106は、Aコールを黄色に、Gコールを青色に、Cコールを赤色に、Tコールを緑色に関連付けることができる。泡検出システム106、
図6Bは、1つ以上の実施形態による例示的な空間画像を図示する。
【0101】
1つ以上の実施形態では、泡検出システム106は、空間画像606a~606nのサイズを縮小した後、それらを画像機械学習モデル608に入力する。少なくとも1つの例では、泡検出システム106は、空間画像606a~606nをダウンサンプリングする。例えば、泡検出システム106は、空間画像606a~606nを処理して、入力についての高周波数情報を除去し、低周波数情報を保持する。したがって、いくつかの場合では、泡検出システム106は、画像機械学習モデル608を空間画像606a~606nの低周波数バージョンに適用して、効率を改善することができる。
【0102】
例えば、初期訓練反復の一部として空間画像606aを入力した後、泡検出システム106は、画像機械学習モデル608を実行する。上記で示唆したように、画像機械学習モデル608は、CNNなどのニューラルネットワークであり得る。いくつかの場合では、画像機械学習モデル608は、いくつかの例を挙げると、高密度畳み込みネットワーク(DenseNet)又は残差ニューラルネットワーク(ResNet)の形態をとる。
【0103】
図6Aに更に図示されるように、初期訓練反復についての入力データを受信すると、画像機械学習モデル608は、泡分類610aを決定する。更に、画像機械学習モデル608は、入力データ内の空間パターンに基づいて、ヌクレオチド-試料スライドのセクション又はサブセクション内の検出された泡の位置を予測する。例えば、画像-機械学習モデル608は、ヌクレオチド-試料スライドのセクション内の泡の存在及び位置を示す標識を含む泡分類610aを生成する。概して、泡は、核酸塩基コールデータ602a又は空間画像606a内の環状空間パターンと関連付けられる。したがって、いくつかの実施形態では、泡分類610aは、泡の位置とともに泡分類を含む。例えば、泡分類610aは、泡又は泡の一部分を含むヌクレオチド-試料スライドの予測されるセクション又はサブセクションを示すことができる。泡分類610aは、同様に、泡又は泡の一部分を含まないヌクレオチド-試料スライドの予測されるセクション又はサブセクションを示すことができる。
【0104】
図6Aに更に図示されるように、泡検出システム106は、損失関数612を使用して、泡分類610aをグラウンド-トルース分類標識604aと比較する。いくつかの実装形態では、グラウンド-トルース分類標識604aは、核酸塩基コールデータ602aに対応するグラウンド-トルース泡分類及び泡位置を含む。例えば、グラウンド-トルース分類標識604aは、(i)泡又は泡の一部分を含むヌクレオチド-試料スライドの特定のセクション又はサブセクション、及び(ii)泡又は泡の一部分を含まないヌクレオチド-試料スライドの特定のセクション又はサブセクションを示すことができる。
【0105】
画像機械学習モデル608の形式に応じて、泡検出システム106は、損失関数612について様々な損失関数を使用することができる。ある特定の実施形態では、泡検出システム106は、(例えば、CNNについての)クロスエントロピー損失関数を使用する。例えば、泡検出システム106は、DenseNet若しくはResNetについてのピクセル単位のクロスエントロピー損失関数、又は何らかの他の適切な損失関数(例えば、ピクセル単位のL1若しくはL2、特徴単位の知覚損失)を使用することができる。損失関数612の形式にかかわらず、泡検出システム106は、泡分類610aとグラウンド-トルース分類標識604aとの比較に基づいて、損失関数612から損失614a~614nを決定する。実際に、ある特定の実装形態では、損失614a~614nは、ヌクレオチド-試料スライドの特定のセクション(例えば、タイル又はサブタイル)についての別個の損失を含むことができる。
【0106】
損失関数612から決定された損失614a~614nに基づいて、泡検出システム106は、その後、画像機械学習モデル608のパラメータを調整する。パラメータを調整することによって、泡検出システム106は、画像機械学習モデル608が複数の訓練反復を通して空間画像に基づいて泡の存在及び位置を決定する、精度を増加させる。実際、
図6Aに更に示されるように、泡検出システム106は、後続の訓練反復を実行する。
図6Aによって示唆されるように、いくつかの実施形態では、泡検出システム106は、空間画像606b~606nを画像機械学習モデル608に反復的に入力して泡分類610b~610nを生成し、泡分類610b~610nをグラウンド-トルース分類標識604b~604nと反復的に比較して損失614b~614nを決定し、画像機械学習モデル608のパラメータを反復的に調整する。いくつかの場合では、泡検出システム106は、画像機械学習モデル608のパラメータ(例えば、値又は重み)が訓練反復にわたって有意に変化しなくなるまで、又はそうでなければ収束基準を満たすまで、訓練反復を実行する。
【0107】
上記で示唆したように、いくつかの実施形態では、泡検出システム106は、泡検出機械学習モデルについての訓練データセットを同定することの一部として、画像機械学習モデル608を利用する。加えて、又は代替として、いくつかの実施形態では、泡検出システム106は、泡検出機械学習モデルとして画像機械学習モデル608を利用する。更に追加の実施形態では、泡検出システム106は、泡検出機械学習モデル622に加えて画像機械学習モデル608を利用し、生成された分類の精度を改善する。一例では、泡検出システム106は、画像機械学習モデル608を利用して、泡検出機械学習モデル622によって生成された偽陽性を除去する。
【0108】
上述したように、ある特定の実装形態では、泡検出システム106は、画像機械学習モデル608を利用して、泡検出機械学習モデルについての訓練データセット620を同定又は生成する。例えば、いくつかの場合では、泡検出システム106は、訓練データセット620の一部として、核酸塩基コール602a~602nから核酸塩基コールを同定し、画像機械学習モデル608は、対応する空間画像によって示されるヌクレオチド-試料スライドのセクション(例えば、タイル又はサブタイル)内の泡の存在(又は不在)を正確に検出する。訓練データセット620についてBCL又はBAMファイルからかかる核酸塩基コールを同定すると、泡検出システム106は、同様に、訓練データセット620について、泡の存在(又は不在)を正確に示すグラウンド-トルース分類標識604a~604nから対応するグラウンド-トルース分類標識を同定する。いくつかの例では、グラウンド-トルース分類標識は、訓練データセット620内に含めるために選択された対応する核酸塩基コールについて、ヌクレオチド-試料スライドのセクション内の泡の存在(又は不在)を正確に示すように修正される。
図6Aに示されるように、泡検出システム106は、訓練データセット620内に含めるために、画像機械学習モデル608から正確に検出された泡の存在又は不在を生成した空間画像について、(i)核酸塩基コール、(ii)対応する品質メトリック、及び(iii)対応するグラウンド-トルース分類標識の組み合わせを選択する。
【0109】
訓練データセット620を同定するために画像機械学習モデル608を使用する代わりに、いくつかの実施形態では、泡検出システム106は、訓練データセット620の一部として、研究者が、対応する空間画像によって描写されるヌクレオチド-試料スライドのセクション(例えば、タイル又はサブタイル)内の泡の存在(又は不在)を正確に検出する、核酸塩基コール602a~602nからの核酸塩基コールを同定する。言い換えれば、いくつかの実施形態では、泡検出システム106は、(画像機械学習モデル608ではなく)技術的専門知識を有する人間によって同定された空間画像606a~606nを使用して、訓練データセット620内に含めるために核酸塩基コール602a~602nから核酸塩基コールを選択する。いくつかのかかる場合において、泡検出システム106は、人間によって同定された泡を含む(又は泡を含まない)セクションを有するかかる空間画像に対応するBCL又はBAMファイルからの核酸塩基コールを使用する。
図6Aに示されるように、泡検出システム106は、代替として、訓練データセット620内に含めるために、技術者又は研究者が泡の存在又は不在を正確に検出した空間画像について、(i)核酸塩基コール、(ii)対応する品質メトリック、及び(iii)対応するグラウンド-トルース分類標識の組み合わせを選択する。
【0110】
訓練データセット620がどのように選択されるかにかかわらず、
図6Aに更に示されるように、泡検出システム106は、訓練データセット620を利用して、泡検出機械学習モデル622(例えば、
図5に図示される泡検出ニューラルネットワーク500)を訓練する。上記のように、いくつかの場合では、泡検出システム106は、少なくとも1つの核酸塩基に対応する核酸塩基コールの第1のサブセット及び閾値品質メトリックを満たす核酸塩基コールの第2のサブセットを含む訓練データセット620からの訓練入力マトリックスを利用する。より具体的には、泡検出システム106は、訓練データセット620からのアデニンコールのサブセット(例えば、パーセンテージ)、グアニンコールのサブセット、及び閾値品質メトリック(例えば、Q30)を満たす核酸塩基コールのサブセットを含む訓練入力マトリックスを生成する。かかる実施形態では、泡検出機械学習モデル622は、エラー分類(例えば、気泡、油泡など)を生成するように訓練される。
【0111】
訓練データセット620から核酸塩基コールのかかるサブセットを入力する代わりに、いくつかの実施形態では、泡検出システム106は、泡検出機械学習モデル622に、ヌクレオチド-試料スライドのセクション内のクラスターに従って配置された核酸塩基コール及び対応する品質メトリックを入力する。泡検出機械学習モデル622についての入力としてクラスターに従って配置された核酸塩基コールを使用することによって、泡検出システム106は、泡の存在又は不在を示す核酸塩基コールのパターンを同定することができる。例えば、かかる核酸塩基コールは、ヌクレオチド-試料スライドのセクション(例えば、タイル又はサブタイル)内の泡の存在を示す核酸塩基コールのパターン(例えば、Aコールの円形パターン又はGコールの円形パターン)を反映し得る。
【0112】
訓練データセット620の形式にかかわらず、
図6Aによって示されるように、泡検出システム106は、訓練データセット620を使用して、泡検出機械学習モデル622を訓練する。最初の訓練反復において、例えば、泡検出システム106は、訓練データセット620から、少なくとも1つの核酸塩基に対応する核酸塩基コールの第1のサブセット及び閾値品質メトリックを満たす核酸塩基コールの第2のサブセットを含む入力マトリックスを入力する。あるいは、泡検出システム106は、ヌクレオチド-試料スライドのセクション内のクラスターに従って配置された核酸塩基コール、及び訓練データセット620からの対応する品質メトリックを入力する。
【0113】
入力データに基づいて、泡検出機械学習モデル622は、泡の存在又は不在を示す予測分類標識624を決定する。いくつかの場合では、予測分類標識624は、粒子状タイプの泡(例えば、気泡、油泡)及びヌクレオチド-試料スライドの特定のセクションの存在又は不在を示す。例えば、予測分類標識624は、フローセルのタイル又はサブタイル内の泡の存在又は不在を示すことができる。上述したように、1つ以上の実施形態では、泡検出システム106は、予測分類標識624からの個々の分類に対応する信頼度スコアを決定する。したがって、泡検出システム106は、生成された信頼スコアに基づいて予測分類標識624を決定することができる。
【0114】
図6Aに更に示されるように、泡検出システム106は、損失関数626を使用して、予測分類標識624を訓練データセット620からの対応するグラウンド-トルース分類標識と比較する。いくつかの実装形態では、訓練データセット620からのグラウンド-トルース分類標識は、入力核酸塩基コールデータ及び品質メトリックに対応するグラウンド-トルース泡分類及び泡位置を含む。上記の訓練プロセスと同様に、例えば、グラウンド-トルース分類標識は、(i)泡又は泡の一部を含むヌクレオチド-試料スライドの特定のセクション又はサブセクション、及び(ii)泡又は泡の一部を含まないヌクレオチド-試料スライドの特定のセクション又はサブセクションを示すことができる。
【0115】
泡検出機械学習モデル622の形式に応じて、泡検出システム106は、損失関数626に対して様々な損失関数を使用することができる。ある特定の実施形態では、泡検出システム106は、(例えば、CNNについての)クロスエントロピー損失関数を使用する。しかし、任意の適切な損失関数を損失関数626として使用することができる。損失関数626の形式にかかわらず、泡検出システム106は、予測分類標識624と訓練データセット620からの対応するグラウンド-トルース分類標識との比較に基づいて、損失関数628から損失626aを決定する。実際に、ある特定の実装形態では、損失628aは、ヌクレオチド-試料スライドの特定のセクション(例えば、タイル又はサブタイル)についての別個の損失を含み得る。
【0116】
損失関数626から決定された損失628aに基づいて、泡検出システム106は、その後、泡検出機械学習モデル622のパラメータを調整する。パラメータを調整することによって、泡検出システム106は、泡検出機械学習モデル622が複数の訓練反復にわたって泡の存在及び位置を決定する精度を増加させる。実際、
図6Aに更に示されるように、泡検出システム106は、後続の訓練反復を実行する。
図6Aによって示唆されるように、いくつかの実施形態では、泡検出システム106は、訓練データセット620からの核酸塩基コール及び品質メトリックから導出されたデータを泡検出機械学習モデル622に反復的に入力して、予測分類標識を生成し、予測分類標識を訓練データセット620からの対応するグラウンド-トルース分類標識と反復的に比較して、損失628a~628nを決定し、泡検出機械学習モデル622のパラメータを反復的に調整する。いくつかの場合では、泡検出システム106は、泡検出機械学習モデル622のパラメータ(例えば、値又は重み)が訓練反復にわたって有意に変化しなくなるまで、又はそうでなければ収束基準を満たすまで、訓練反復を実行する。
【0117】
予測分類標識を生成することに加えて、いくつかの実装形態では、泡検出システム106は、泡検出機械学習モデル622を訓練して、泡のサイズを推論する。特に、泡検出機械学習モデル622は、訓練データセット620の核酸塩基コールから特徴を抽出して、同定された泡のサイズを予測することができる。例示すると、泡検出システム106は、泡検出機械学習モデル622を訓練して、核酸塩基コール及び品質メトリックから導出された空間データに基づいて予測泡の直径を決定することができる。あるいは、泡検出システム106は、泡検出機械学習モデル622を訓練して、核酸塩基コールのパーセント又はQ30パーセントにおけるスパイク又はディップの強度に基づいて泡のサイズを決定する。したがって、泡検出システム106は、泡検出機械学習モデル622を訓練し、入力データの分析に基づいて予測泡サイズを生成することができる。
【0118】
前述のように、いくつかの実施形態では、泡検出システム106は、泡の存在を決定することに基づいて、ヌクレオチド-試料スライドの所与のリード、サイクル、セクション、又はサブセクションについての品質メトリック(例えば、Qスコア)を低減する。いくつかの実施形態では、泡検出システム106は、検出された泡のサイズ又は直径に基づいて品質メトリックを低減する。例えば、泡検出システム106は、泡検出機械学習モデル622を使用して、検出された泡の予測直径を生成し、より大きい直径サイズを品質メトリックのより大きい低減と関連付ける。更に、いくつかの実施形態では、泡検出システム106は、閾値泡直径値を決定し、それを下回ると泡検出システム106は品質メトリックを変更しない。特に、泡検出システム106は、より小さい泡が読取り品質に対する影響を無視できると判定することができる。
【0119】
前述のように、泡検出システム106は、核酸塩基コールに対応する空間パターンを含む空間画像を同定又は生成することができる。
図6Bは、1つ以上の実施形態による例示的な空間画像を図示する。特に、
図6Bは、空間パターン638を有するタイル640を含む空間画像636を図示する。図示されるように、泡検出システム106は、核酸塩基コール642を使用して、空間画像636を構築する。あるいは、泡検出システム106は、技術者又は研究者がタイル640内の泡を同定する空間画像として、空間画像636を受信する。
【0120】
前述のように、いくつかの実施形態では、泡検出システム106は、空間画像636内で同定された空間パターンの形状を分析して、泡又は他のアーチファクトの存在又は不在を決定することができる。
図6Bによって示されるように、例えば、泡検出機械学習モデル622は、泡を表すものとしてGコールの円形パターンを検出することができる。実際、ある特定の実装形態では、泡検出システム106は、特定の核酸塩基コール(例えば、Aコール又はGコール)の円形空間パターンを泡と関連付け、非円形又は代替の空間パターンを他のタイプのアーチファクトと関連付ける。後者のアーチファクトに関しては、例えば、泡検出システム106は、代替の空間パターンを、低占有率領域又はアンプリコン領域などのアーチファクトと関連付けることができる。
【0121】
ヌクレオチド-試料スライド内の泡の実際の例を視覚化するのを助けるために、本開示は
図6Cを含める。特に、
図6Cは、タイル656a~656cを含むタイルを含むフローセル658の一部分を示す、配列決定実行画像650を図示する。
図6Cに図示されるように、配列決定実行画像650は、種々のタイルを横断するか又は種々のタイル内に存在する泡654a~654cに対応する暗い円形領域を示す。例えば、
図6Cは、泡654bがタイル656a及びタイル656bにまたがっている一方で、泡654cがタイル656c内に含まれることを図示する。
【0122】
図6Cは、フローセル上の泡の外観を示す例示的な配列決定実行画像を図示する。前述したように、画像データへのアクセス、記憶、及び処理は、演算コストが高く、多くの場合非実用的である。したがって、いくつかの実装形態では、泡検出システム106は、配列決定実行画像650にアクセスせず、代わりに、核酸塩基コールデータ及び品質メトリック(種々のファイルタイプから)にアクセス及び処理して、上記で説明されるように、泡の存在又は不在を確認する。
【0123】
図1~
図6B、対応する本文、及び実施例は、泡検出システム106のいくつかの異なる方法、システム、装置、及び非一時的コンピュータ可読媒体を提供する。上記に加えて、1つ以上の実施形態はまた、
図7に示される動作のフローチャート等の、特定の結果を達成するための動作を含むフローチャートに関して説明することができる。更に、本明細書で説明される動作は、互いに並行して、又は同じ若しくは同様の動作の異なる出現と並行して、繰り返されるか、又は実行され得る。
【0124】
図7は、ヌクレオチド-試料スライド内の泡の存在を検出するための一連の動作700のフローチャートを図示する。
図7は、一実施形態による動作を図示するが、代替実施形態は、
図7に示される動作のいずれかを省略、追加、再配列、及び/又は修正してもよい。
図7の動作は、方法の一部として実行することができる。あるいは、非一時的コンピュータ可読媒体は、1つ以上のプロセッサによって実行されると、コンピューティング装置に
図7の動作を実行させる命令を含むことができる。いくつかの実施形態では、システムは、
図7の動作を実行することができる。
【0125】
1つ以上の実施形態では、一連の動作700は、
図8に図示するコンピューティング装置などの1つ以上のコンピューティング装置上で実施される。加えて、いくつかの実施形態では、一連の動作700は、核酸ポリマーを配列決定するためのデジタル環境において実施される。例えば、一連の動作700は、泡検出機械学習モデルを含むメモリを有するコンピューティング装置上で実施される。いくつかの実施形態では、メモリはまた、グラウンド-トルース分類及び訓練入力マトリックスを含む訓練データを記憶する。
【0126】
図7に図示するように、一連の動作700は、コールデータを受信する動作702を含む。特に、動作702は、ヌクレオチド-試料スライドについて、核酸ポリマーを配列決定するサイクルについての核酸塩基コールを含むコールデータを受信することを含む。いくつかの実施形態では、動作702は、核酸ポリマーを配列決定する所与のサイクルについてのヌクレオチド-試料スライドの各セクションについての単一の画像を含む1チャネル強度データ、核酸ポリマーを配列決定する所与のサイクルについてのヌクレオチド-試料スライドの各セクションについての2つの画像を含む2チャネルデータ、又は、核酸ポリマーを配列決定する所与のサイクルについてのヌクレオチド-試料スライドの各セクションについての4つの画像を含む4チャネルデータ、に基づく核酸塩基コールを含むコールデータを受信することを更に含む。
【0127】
図7に図示される一連の動作700は、品質データを受信する動作704を含む。特に、動作704は、ヌクレオチド-試料スライドについて、サイクルについての核酸塩基コールにおけるエラーを推定する品質メトリックを含む品質データを受信することを含む。
【0128】
一連の動作700は、核酸塩基コールの第1のサブセット及び核酸塩基コールの第2のサブセットを決定する動作706を含む。特に、動作706は、サイクルについての核酸塩基コールから、少なくとも1つの核酸塩基に対応する核酸塩基コールの第1のサブセット、及び品質メトリックについての閾値品質メトリックを満たす核酸塩基コールの第2のサブセットを決定することを含む。いくつかの実施形態では、動作706は、核酸ポリマーを配列決定するサイクルについて、アデニンコールのサブセット、チミンコールのサブセット、シトシンコールのサブセット、又はグアニンコールのサブセットのうちの少なくとも1つを決定することによって、少なくとも1つの核酸塩基に対応する核酸塩基コールの第1のサブセットを決定することを更に含む。
【0129】
図7に更に図示するように、一連の動作700は、泡検出ニューラルネットワークを利用して、泡の存在を検出する動作708を含む。特に、動作708は、核酸塩基コールの第1のサブセット及び核酸塩基コールの第2のサブセットに基づく泡検出機械学習モデルを利用して、ヌクレオチド-試料スライド内の泡の存在を検出することを含む。加えて、1つ以上の実施形態では、泡検出ニューラルネットワークは、サポートベクターマシン又は適応ブースティング機械学習モデルのうちの少なくとも1つを含む。
【0130】
いくつかの実装形態では、動作708は、泡検出機械学習モデルの層を利用して、アデニンコールのサブセット、グアニンコールのサブセット、及び核酸ポリマーを配列決定するサイクルについての閾値品質メトリックを満たす核酸塩基コールの第2のサブセットを含む入力マトリックスから特徴を抽出することによって、泡検出機械学習モデルを利用して泡の存在を検出することを更に含む。更に、1つ以上の実施形態では、動作708は、ヌクレオチド-試料スライド内の気泡、油泡、又はゴースト泡のうちの少なくとも1つを検出することによって泡の存在を検出することを含む。加えて、いくつかの実施形態では、泡検出機械学習モデルは、特徴抽出層、分類層、及び特徴抽出層と分類層との間の適応最大プーリング層を含む畳み込みニューラルネットワークを含む。
【0131】
1つ以上の実施形態では、動作708は、泡検出機械学習モデルを利用して、ヌクレオチド-試料スライドのセクションが泡を含有する確率を生成し、確率が泡の存在を示す閾値を満たすと判定することによって、泡の存在を検出する追加の動作を更に含む。
【0132】
いくつかの実施形態では、一連の動作700は、ヌクレオチド-試料スライドのセクションについてのコールデータ及び品質データを受信する追加の動作と、ヌクレオチド-試料スライドのセクション内の泡の存在を検出する追加の動作とを含む。より具体的には、いくつかの実施形態では、追加の動作は、フローセルのタイル内の泡を検出することによって、ヌクレオチド-試料スライドのセクション内の泡の存在を検出することを更に含む。
【0133】
加えて、いくつかの実装形態では、一連の動作700は、核酸ポリマーを配列決定するサイクルのうちの1つ以上のサイクル中に泡の存在を決定する追加の動作を更に含む。
【0134】
更に、1つ以上の実施形態では、一連の動作700は、コンピューティング装置上に表示するために、ヌクレオチド-試料スライド内の泡の存在を示すアラートを提供する動作を更に含む。
【0135】
加えて、いくつかの実施態様では、一連の動作700は、核酸ポリマーを配列決定するサイクルのサイクル中に泡の存在を決定する追加の動作を含む。
【0136】
本明細書に記載の方法は、様々な核酸配列決定技術と併せて使用することができる。特に適用可能な技術は、核酸を、それらの相対的位置が変化しないようにアレイ内の固定位置に付着させ、アレイが繰り返し撮像されるものである。例えば、1つのヌクレオチド塩基型を別のヌクレオチド塩基型と区別するために使用される異なる標識と一致する異なる色チャネルで画像が得られる実施形態は、特に適用可能である。いくつかの実施形態では、標的核酸のヌクレオチド配列を決定するプロセスは、自動化プロセスであり得る。好ましい実施形態は、合成による配列決定(sequencing-by-synthesis「SBS」)技術を含む。
【0137】
SBS技術は、全般的に、鋳型鎖に対するヌクレオチドの反復的付加による、新生核酸鎖の酵素的伸長を伴う。SBSの従来の方法では、単一のヌクレオチドモノマーが、各送達においてポリメラーゼの存在下で標的ヌクレオチドに提供され得る。しかしながら、本明細書に記載の方法では、送達中のポリメラーゼの存在下で、複数の種類のヌクレオチドモノマーを標的核酸に提供することができる。
【0138】
以下に記載されるSBS技術は、シングルリード配列決定又はペアエンド配列決定を利用することができる。シングルリード配列決定において、配列決定装置は、塩基対の配列を生成するために、一方の末端から他方の末端までフラグメントを読み取る。対照的に、ペアエンド配列決定中、配列決定装置は、1つの読み取りで開始し、同じ方向で指定された読み取り長さの読み取りを終了し、フラグメントの反対端から別の読み取りを開始する。
【0139】
SBSは、ターミネーター部分を有するヌクレオチドモノマー、又は任意のターミネーター部分を欠くヌクレオチドモノマーを利用することができる。ターミネーターを欠くヌクレオチドモノマーを利用する方法としては、例えば、以下に更に詳細に記載されるように、γ-リン酸標識ヌクレオチドを使用するピロ配列決定及び配列決定が挙げられる。ターミネーターを含まないヌクレオチドモノマーを使用する方法では、各サイクルに添加されるヌクレオチドの数は、概ね可変であり、テンプレート配列及びヌクレオチド送達のモードに依存する。ターミネーター部分を有するヌクレオチドモノマーを利用するSBS技術では、ターミネーターは、ジデオキシヌクレオチドを利用する従来のSanger配列決定の場合のように使用される配列決定条件下で有効に不可逆的であり得るか、又はターミネーターは、Solexa(現Illumina)によって開発された配列決定方法の場合のように可逆的であり得る。
【0140】
SBS技術は、標識部分を有するヌクレオチドモノマー、又は標識部分を欠くヌクレオチドモノマーを使用することができる。したがって、標識の蛍光などの標識の特性、分子量又は電荷などのヌクレオチドモノマーの特性、ピロリン酸の放出などのヌクレオチドの組み込みの副生成物などに基づいて、組み込みイベントを検出することができる。2つ以上の異なるヌクレオチドが配列決定試薬中に存在する実施形態では、異なるヌクレオチドは、互いに区別可能であり得るか、又は代替的に、2つ以上の異なる標識は、使用される検出技術の下で区別可能であり得る。例えば、配列決定試薬中に存在する異なるヌクレオチドは、異なる標識を有することができ、それらは、Solexa(現Illumina)によって開発された配列決定方法によって例示される適切な光学系を使用して区別することができる。
【0141】
好ましい実施形態としては、パイロシークエンシング(パイロ配列決定)技術が挙げられる。パイロ配列決定は、特定のヌクレオチドが新生鎖に組み込まれるときに無機ピロリン酸塩(PPi)の放出を検出する(Ronaghi,M.,Karamohamed,S.,Pettersson,B.,Uhlen,M.and Nyren,P.(1996)「Real-time DNA sequencing using detection of pyrophosphate release.」Analytical Biochemistry 242(1),84-9、Ronaghi,M.(2001)「Pyrosequencing sheds light on DNA sequencing.」Genome Res. 11(1),3-11、Ronaghi,M.,Uhlen,M.and Nyren,P.(1998)「A sequencing method based on real-time pyrophosphate.」Science 281(5375),363、米国特許第6,210,891号、同第6,258,568号及び同第6,274,320号、参照によりその開示の全体が本明細書に組み込まれる)。パイロシークエンシングにおいて、放出されたPPiは、ATPスルフラーゼによってアデノシン三リン酸(adenosine triphosphate、ATP)に即座に変換されることによって検出することができ、生成されたATPのレベルはルシフェラーゼで生成された光子を介して検出される。配列決定される核酸は、アレイ中の特徴部に付着させることができ、アレイは、アレイの特徴部にヌクレオチドを組み込むことにより生成される化学発光シグナルを捕捉するために画像化することができる。アレイを特定のヌクレオチド型(例えば、T、C、又はG)で処理した後に、画像を得ることができる。各ヌクレオチド型の添加後に得られる画像は、アレイ内のどの特徴部が検出されるかに関して異なる。画像内のこれらの差異は、アレイ上の特徴部の異なる配列コンテンツを反映する。しかしながら、各特徴部の相対的な位置は、画像内で変わらないままである。画像は、本明細書に記載の方法を使用して記憶、処理、及び分析することができる。例えば、アレイを各異なるヌクレオチド型で処理した後に得られる画像は、可逆的ターミネーターベースの配列決定方法についての異なる検出チャネルから得られる画像について、本明細書に例示されるものと同じ方法で処理することができる。
【0142】
別の例示的な種類のSBSでは、サイクル配列決定は、例えば、その開示が参照により組み込まれる、国際公開第04/018497号及び米国特許第7,057,026号に記載されているような切断可能な又は光漂白可能な色素標識を含む可逆的ターミネーターヌクレオチドを段階的に添加することによって達成される。この手法は、Solexa(現在のIllumina Inc.)によって商品化されており、国際公開第91/06678号及び同第07/123,744号にも記載されており、これらのそれぞれは、参照により本明細書に組み込まれる。終端の両方を逆転させることができ、蛍光標識が開裂された蛍光標識ターミネーターの可用性は、効率的な循環可逆的終端(cyclic reversible termination、CRT)配列決定を容易にする。ポリメラーゼはまた、これらの修飾されたヌクレオチドを効率的に組み込み、かつそこから伸長するように共操作することもできる。
【0143】
好ましくは、可逆的ターミネーターベースの配列決定実施形態では、標識は、SBS反応条件下での伸長を実質的に阻害しない。しかしながら、検出標識は、例えば、開裂又は分解によって除去可能であり得る。画像は、アレイ化された核酸特徴部への標識の組み込み後に撮影することができる。特定の実施形態では、各サイクルは、アレイへの4つの異なるヌクレオチド型の同時送達を伴い、各ヌクレオチド型は、スペクトル的に異なる標識を有する。次に、4つの異なる標識の1つに選択的な検出チャネルをそれぞれ使用して、4つの画像を得ることができる。代替的に、異なるヌクレオチド型を順次追加することができ、各追加ステップの間にアレイの画像を得ることができる。このような実施形態では、各画像は、特定の型のヌクレオチドを組み込んだ核酸特徴部を示す。各特徴部のシーケンスコンテンツが異なるため、様々な画像に様々な特徴部が存在するか、存在しない。しかしながら、特徴部の相対的な位置は、画像内で変わらないままである。このような可逆的ターミネーター-SBS法から得られる画像は、本明細書に記載されるように保存、処理、及び分析することができる。画像撮影ステップに続いて、標識を除去することができ、その後のヌクレオチド添加及び検出のサイクルについて可逆的ターミネーター部分を除去することができる。特定のサイクルで検出された後、及び後続のサイクルの前に標識を除去すると、サイクル間のバックグラウンド信号及びクロストークを低減できるという利点がある。有用な標識及び除去方法の例を以下に記載する。
【0144】
特定の実施形態では、ヌクレオチドモノマーの一部又は全ては、可逆的ターミネーターを含むことができる。このような実施形態では、可逆的ターミネーター/開裂可能なフルオロフォア(fluor)は、3’エステル結合を介してリボース部分に結合したフルオロフォア(fluor)を含むことができる(Metzker,Genome Res.15:1767-1776(2005)、これは参照により本明細書に組み込まれる)。他の手法は、ターミネーターの化学を蛍光標識の切断から分離している(参照によりその全体が本明細書に組み込まれる、Ruparel et al.,Proc Natl Acad Sci USA 102:5932-7(2005))。Ruparelらは、少量の3’アリル基を使用して伸長をブロックするが、パラジウム触媒で短時間処理することにより容易に脱ブロックすることができる可逆性ターミネーターの開発について説明している。フルオロフォアは、長波長UV光への30秒の曝露によって容易に開裂することができる光開裂可能リンカーを介して基に付着された。したがって、ジスルフィド還元又は光開裂のいずれかを開裂可能なリンカーとして使用することができる。可逆的終端への別の手法は、dNTP上に嵩高な染料を配置した後に続く自然終端の使用である。dNTP上の帯電した嵩高な染料の存在は、立体障害及び/又は静電障害を介して効果的なターミネーターとして作用することができる。1つの組み込みイベントの存在は、染料が除去されない限り、それ以上の結合を防止する。染料の開裂は、フルオロフォア(fluor)を除去し、終端を効果的に逆転させる。修飾ヌクレオチドの例はまた、米国特許第7,427,673号及び米国特許第7,057,026,号に記載されており、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる。
【0145】
本明細書に記載の方法及びシステムと共に利用することができる追加の例示的なSBSシステム及び方法は、米国特許出願公開第2007/0166705号、米国特許出願公開第2006/0188901号、米国特許第7,057,026号、米国特許出願公開第2006/0240439号、米国特許出願公開第2006/0281109号、国際公開第05/065814号、米国特許出願公開第2005/0100900号、国際公開第06/064199号、国際公開第07/010,251号、米国特許出願公開第2012/0270305号、及び米国特許出願公開第2013/0260372号に記載されており、これらの開示は、参照によりその全体が本明細書に組み込まれる。
【0146】
いくつかの実施形態は、4つ未満の異なる標識を使用する4つの異なるヌクレオチドの検出を利用することができる。例えば、SBSは、組み込まれた資料である米国特許出願公開第2013/0079232号に記載される方法及びシステムを使用して実施することができる。第1の例として、ヌクレオチド型の対は、同じ波長で検出することができるが、対のうちの1つのメンバーに対する強度の差に基づいて、又は、対の他の部材について検出された信号と比較して明らかなシグナルを出現又は消失させる、対の1つのメンバーへの変化(例えば、化学修飾、光化学修飾、又は物理的改質を行うことを介して)に基づいて区別され得る。第2の例として、4つの異なるヌクレオチド型のうちの3つを特定の条件下で検出することができ、一方、第4のヌクレオチド型は、それらの条件下で検出可能な標識がないか、又はそれらの条件下で最小限に検出される(例えば、バックグラウンド蛍光による最小限の検出など)。最初の3つのヌクレオチド型を核酸に組み込むことは、それらの対応するシグナルの存在に基づいて決定することができ、第4のヌクレオチド型を核酸に組み込むことは、任意のシグナルの不在又は最小限の検出に基づいて決定することができる。第3の例として、1つのヌクレオチド型は、2つの異なるチャネルで検出される標識を含むことができ、一方、他のヌクレオチド型は、チャネルのうちの1つ以下で検出される。前述の3つの例示的な構成は、相互に排他的であるとはみなされず、様々な組み合わせで使用することができる。3つ全ての例を組み合わせた例示的な実施形態は、第1のチャネルで検出される第1のヌクレオチド型(例えば、第1の励起波長によって励起されたときに第1のチャネルで検出される標識を有するdATP)、第2のチャネルで検出される第2のヌクレオチド型(例えば、第2の励起波長によって励起されたときに第2のチャネルで検出される標識を有するdCTP)、第1及び第2のチャネルの両方において検出される第3のヌクレオチド型(例えば、第1及び/又は第2の励起波長によって励起されたときに両方のチャネルで検出される少なくとも1つの標識を有するdTTP)、及びいずれのチャネルでも検出されないか、又は最小限に検出される標識を欠く第4のヌクレオチド型(例えば、標識のないdGTP)を使用する蛍光ベースのSBS法である。
【0147】
更に、組み込まれた資料である米国特許出願公開第2013/0079232号に記載のように、配列決定データは、単一のチャネルを使用して得ることができる。このようないわゆる1つの染料配列決定方法では、第1のヌクレオチド型は標識されるが、第1の画像が生成された後に標識が除去され、第2のヌクレオチド型は、第1の画像が生成された後にのみ標識される。第3のヌクレオチド型は、第1及び第2の画像の両方においてその標識を保持し、第4のヌクレオチド型は、両方の画像において標識されていないままである。
【0148】
いくつかの実施形態は、ライゲーション技術による配列決定を利用することができる。このような技術は、DNAリガーゼを利用してオリゴヌクレオチドを組み込み、そのようなオリゴヌクレオチドの組み込みを識別する。オリゴヌクレオチドは、典型的には、オリゴヌクレオチドがハイブリダイズする配列中の特定のヌクレオチドの同一性と相関する異なる標識を有する。他のSBS方法と同様に、標識された配列決定試薬で核酸配列のアレイを処理した後、画像を得ることができる。各画像は、特定の型の標識を組み込んだ核酸特徴部を示す。各特徴部のシーケンスコンテンツが異なるため、様々な画像に様々な特徴部が存在するか、存在しないが、特徴部の相対的な位置は、画像内で変わらないままである。ライゲーションベースの配列決定方法から得られる画像は、本明細書に記載されるように保存、処理、及び分析することができる。本明細書に記載の方法及びシステムと共に利用することができる例示的なSBSシステム及び方法は、米国特許第6,969,488号、米国特許第6,172,218号、及び米国特許第6,306,597号に記載されており、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる。
【0149】
いくつかの実施形態は、ナノ細孔配列決定を利用することができる(Deamer,D.W. & Akeson,M.「Nanopores and nucleic acids:prospects for ultrarapid sequencing.」Trends Biotechnol.18,147-151(2000)、Deamer,D.and D.Branton,「Characterization of nucleic acids by nanopore analysis」.Acc.Chem.Res.35:817-825(2002)、Li,J.,M.Gershow,D.Stein,E.Brandin,and J.A.Golovchenko,「DNA molecules and configurations in a solid-state nanopore microscope」Nat.Mater.2:611-615(2003)、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる)。そのような実施形態では、標的核酸はナノ細孔を通過する。ナノ細孔は、α-ヘモリジンなどの合成孔又は生体膜タンパク質であり得る。標的核酸がナノ細孔を通過するとき、各塩基対は、細孔の電気コンダクタンスの変動を測定することによって識別することができる。(米国特許第7,001,792号、Soni,G.V.& Meller,「A.Progress toward ultrafast DNA sequencing using solid-state nanopores.」Clin.Chem.53,1996-2001(2007)、Healy,K.「Nanopore-based single-molecule DNA analysis.」Nanomed.2,459-481(2007)、Cockroft,S.L.,Chu,J.,Amorin,M.& Ghadiri,M.R.「A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution.」J.Am Chem.Soc.130,818-820(2008)、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる)。ナノ細孔配列決定から得られるデータは、本明細書に記載されるように、保存、処理、及び分析することができる。具体的には、データは、本明細書に記載される光学画像及び他の画像の例示的な処理に従って、画像として処理することができる。
【0150】
いくつかの実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを伴う方法を利用することができる。ヌクレオチドの組み込みは、例えば、各々が参照により本明細書に組み込まれる、米国特許第7,329,492号及び米国特許第7,211,414号に記載されているようなフルオロフォア含有ポリメラーゼとγ-ホスフェート標識ヌクレオチドとの間の蛍光共鳴エネルギー移動(FRET)相互作用を介して検出することができ、又はヌクレオチドの組み込みは、例えば、参照により本明細書に組み込まれる米国特許第7,315,019号に記載されているようなゼロモード導波路、並びに、例えば、各々が参照により本明細書に組み込まれる、米国特許第7,405,281号及び米国特許出願公開第2008/0108082号に記載されているような蛍光ヌクレオチド類似体及び操作ポリメラーゼを使用して検出することができる。照明は、蛍光標識されたヌクレオチドの組み込みが低バックグラウンドで観察され得るように、表面繋留ポリメラーゼの周囲のゼプトリットルスケールの体積に制限することができる(Levene,M.J.et al.「Zero-mode waveguides for single-molecule analysis at high concentrations.」Science,299,682-686(2003)、Lundquist,P.M.et al.「Parallel confocal detection of single molecules in real time.」Opt.Lett.33,1026-1028 (2008)、Korlach,J.et al.「Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures.」Proc.Natl.Acad.Sci.USA 105,1176-1181(2008)、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる)。このような方法から得られる画像は、本明細書に記載されるように、記憶、処理、及び分析することができる。
【0151】
いくつかのSBS実施形態は、伸長産物へのヌクレオチドの組み込み時に放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づく配列決定は、Ion Torrent(Guilford,CT、Life Technologiesの子会社)から市販されている電気検出器及び関連技術、又は、米国特許出願公開第2009/0026082(A1)号、米国特許出願公開第2009/0127589(A1)号、米国特許出願公開第2010/0137143(A1)号、若しくは米国特許出願公開第2010/0282617(A1)号に記載されている配列決定方法及びシステムであり、これらの各々は、参照により本明細書に組み込まれる。動力学的除外を使用して標的核酸を増幅するための本明細書に記載の方法は、プロトンを検出するために使用される基質に容易に適用することができる。より具体的には、本明細書に記載の方法を使用し、プロトンを検出するために使用されるアンプリコンのクローン集団を産生することができる。
【0152】
上記のSBS方法は、複数の異な標的核酸が同時に操作されるように、多重形式で有利に実施することができる。特定の実施形態では、異なる標的核酸は、共通の反応容器又は特定の基質の表面上で処理することができる。これにより、配列決定試薬の簡便な送達、未反応試薬の除去、及び取り込み事象の検出が多重方式で可能になる。表面結合された標的核酸を使用する実施形態では、標的核酸は、アレイ形式であり得る。アレイ形式では、標的核酸は、典型的には、空間的に区別可能な方式で表面に結合され得る。標的核酸は、直接共有付着、ビーズ若しくは他の粒子への付着、又は表面に付着したポリメラーゼ若しくは他の分子への結合によって結合され得る。アレイは、各部位(特徴とも称される)における標的核酸の単一コピーを含むことができ、又は同じ配列を有する複数のコピーは、各部位若しくは特徴に存在することができる。複数のコピーは、以下で更に詳細に記載されるブリッジ増幅又はエマルジョンPCRなどの増幅方法によって生成することができる。
【0153】
本明細書に記載の方法は、例えば、少なくとも約10個の特徴/cm2、100個の特徴/cm2、500個の特徴/cm2、1,000個の特徴/cm2、5,000個の特徴/cm2、10,000個の特徴/cm2、50,000個の特徴/cm2、100,000個の特徴/cm2、1,000,000個の特徴/cm2、5,000,000個の特徴/cm2、又はそれ超を含む、様々な密度のいずれかの特徴を有するアレイを使用することができる。
【0154】
本明細書に記載の方法の利点は、複数の標的核酸の迅速かつ効率的な検出を並行して提供することである。したがって、本開示は、上記で例示されるものなどの当該技術分野において既知の技術を使用して核酸を調製及び検出することができる統合システムを提供する。したがって、本開示の統合システムは、増幅試薬及び/又は配列決定試薬を1つ以上の固定化されたDNAフラグメントに送達することができる流体成分を含むことができ、システムは、ポンプ、弁、リザーバ、流体ラインなどの構成要素を含む。フローセルは、標的核酸を検出するための統合システムで構成及び/又は使用することができる。例示的なフローセルは、例えば、米国特許第2010/0111768(A1)号及び米国特許出願第13/273,666号に記載され、これらの各々は、参照により本明細書に組み込まれる。フローセルについて例示されるように、統合システムの流体構成要素の1つ以上を増幅方法及び検出方法に使用することができる。核酸配列決定の実施形態を一例として取ると、統合システムの流体構成要素の1つ以上を、本明細書に記載の増幅方法、及び上記に例示したような配列決定方法における配列決定試薬の送達に使用することができる。代替的に、統合システムは、増幅方法を実施し、検出方法を実施するための別々の流体システムを含むことができる。増幅された核酸を作成し、また核酸の配列を決定することができる統合配列決定システムの例としては、MiSeq(商標)プラットフォーム(Illumina Inc.,San Diego,CA)、及び参照により本明細書に組み込まれる、米国特許出願第13/273,666号に記載のデバイスが挙げられるが、これらに限定されない。
【0155】
上記の配列決定システムは、配列決定装置によって受け取られた試料中に存在する核酸ポリマーを配列決定する。本明細書で定義されるように、「試料」及びその誘導体は、最も広い意味で使用され、標的を含むことが疑われる任意の試料、培養物などを含む。いくつかの実施形態では、試料は、DNA、RNA、PNA、LNA、キメラ又はハイブリッド形態の核酸を含む。試料は、1以上の核酸を含有する任意の生物学的試料、臨床試料、外科試料、農業試料、大気試料又は水試料を含むことができる。この用語はまた、任意の単離された核酸試料、例えば、ゲノムDNA、新鮮凍結又はホルマリン固定パラフィン包埋核酸試料を含む。試料は、単一個体、遺伝的に関連するメンバーからの核酸試料のコレクション、遺伝的に関連しないメンバーからの核酸試料、腫瘍試料及び正常組織試料のような単一個体からの核酸試料(適合)、又は母体被験体から得られた母体及び胎児DNAのような遺伝物質の2つの異なる形態を含む単一供給源からの試料、又は植物又は動物DNAを含む試料中の混入細菌DNAの存在に由来し得ることも想定される。いくつかの実施形態では、核酸物質の供給源は、例えば新生児スクリーニングに典型的に使用されるような新生児から得られた核酸を含むことができる。
【0156】
核酸試料は、ゲノムDNA(genomic DNA、gDNA)などの高分子量物質を含むことができる。試料は、FFPE又は保管されたDNA試料から得られた核酸分子などの低分子量物質を含むことができる。別の実施形態では、低分子量物質は、酵素的又は機械的にフラグメント化されたDNAを含む。試料は、無細胞循環DNAを含むことができる。いくつかの実施形態では、試料は、生検、腫瘍、擦過物、スワブ、血液、粘液、尿、血漿、精液、毛髪、レーザ捕捉顕微解剖、外科的切除、及び他の臨床的又は実験室で得られた試料から得られた核酸分子を含むことができる。いくつかの実施態様では、試料は、疫学、農業、法医学又は病原性の試料であり得る。いくつかの実施態様では、試料は、ヒト又は哺乳動物源などの動物から得られた核酸分子を含むことができる。別の実施態様では、試料は、植物、細菌、ウイルス又は真菌などの非哺乳類源から得られた核酸分子を含むことができる。いくつかの実施態様では、核酸分子の供給源は、保存された又は絶滅した試料若しくは種であり得る。
【0157】
更に、本明細書中に開示される方法及び組成物は、法医学試料からの分解及び/又はフラグメント化されたゲノムDNAなどの低品質核酸分子を有する核酸試料を増幅するのに有用であり得る。一実施態様では、法医学試料は、犯罪現場から得られた核酸、行方不明者DNAデータベースから得られた核酸、法医学調査と関連した研究所から得られた核酸を含むことができ、又は法執行機関、1つ以上のミリタリーサービス若しくはそのような隊員によって得られた法医学試料を含むことができる。核酸試料は、例えば、口腔スワブ、紙、布、又は唾液、血液、若しくは他の体液で含浸され得る他の基質に由来する、精製された試料又は溶解物を含む粗DNAであり得る。したがって、いくつかの実施態様では、核酸試料は、ゲノムDNAなどの、少量のDNA又はフラグメント化されたDNAの部分を含むことができる。いくつかの実施形態では、標的配列は、限定されるものではないが、血液、痰、血漿、精液、尿及び血清を含む1つ以上の体液に存在し得る。いくつかの実施態様では、標的配列は、犠牲者の毛髪、皮膚、組織試料、剖検又は遺体から得ることができる。いくつかの実施態様では、1つ以上の標的配列を含む核酸は、死亡した動物又はヒトから得ることができる。いくつかの実施態様では、標的配列は、微生物、植物又は昆虫学的DNAなど非ヒトDNAから得られた核酸を含むことができる。いくつかの実施形態では、標的配列又は増幅された標的配列は、ヒト同定を目的とする。いくつかの実施形態では、本開示は、概して、法医学試料の特徴を同定するための方法に関する。いくつかの実施形態では、本開示は、概して、本明細書に開示された1つ以上の標的特異的プライマー、又は本明細書に概説されたプライマー設計基準を用いて設計された1以上の標的特異的プライマーを使用するヒト同定方法に関する。一実施形態では、少なくとも1つの標的配列を含む法医学試料又はヒト同定試料は、本明細書に開示された標的特異的プライマーのいずれか1つ以上を用いて、又は本明細書に概説されたプライマー基準を用いて増幅することができる。
【0158】
泡検出システム106の構成要素は、ソフトウェア、ハードウェア、又はその両方を含むことができる。例えば、泡検出システム106の構成要素は、コンピュータ可読記憶媒体上に記憶され、1つ以上のコンピューティング装置(例えば、ユーザクライアント装置108)のプロセッサによって実行可能な1つ以上の命令を含むことができる。1つ以上のプロセッサによって実行されると、泡検出システム106のコンピュータ実行可能命令は、コンピューティング装置に、本明細書で説明される泡検出方法を実行させることができる。あるいは、泡検出システム106の構成要素は、特定の機能又は機能群を実行するための専用処理装置などのハードウェアを含むことができる。加えて、又は代替として、泡検出システム106の構成要素は、コンピュータ実行可能命令及びハードウェアの組み合わせを含むことができる。
【0159】
更に、泡検出システム106に関して本明細書で説明される機能を実行する泡検出システム106の構成要素は、例えば、スタンドアロンアプリケーションの一部として、アプリケーションのモジュールとして、アプリケーションのプラグインとして、他のアプリケーションによって呼び出され得るライブラリ関数(複数可)として、及び/又はクラウドコンピューティングモデルとして実装され得る。したがって、泡検出システム106の構成要素は、パーソナルコンピューティング装置又はモバイル装置上のスタンドアロンアプリケーションの一部として実装され得る。加えて、又は代替として、泡検出システム106の構成要素は、限定するものではないが、Illumina BaseSpace、Illumina DRAGEN、又はIllumina TruSightソフトウェアを含む、配列決定サービスを提供する任意のアプリケーションにおいて実装されてもよい。「Illumina」、「BaseSpace」、「DRAGEN」、及び「TruSight」は、米国及び/又は他の国におけるIllumina,Inc.の登録商標又は商標である。
【0160】
本開示の実施形態は、以下でより詳細に論じられるように、例えば、1つ以上のプロセッサ及びシステムメモリ等のコンピュータハードウェアを含む、専用又は汎用コンピュータを含み、又は利用してもよい。本開示の範囲内の実施形態はまた、コンピュータ実行可能命令及び/又はデータ構造を搬送又は記憶するための物理的及び他のコンピュータ可読媒体を含む。特に、本明細書で説明されるプロセスのうちの1つ以上は、非一時的コンピュータ可読媒体において具現化され、1つ以上のコンピューティング装置(例えば、本明細書で説明されるメディアコンテンツアクセス装置のうちのいずれか)によって実行可能な命令として少なくとも部分的に実装されてもよい。概して、プロセッサ(例えば、マイクロプロセッサ)は、非一時的コンピュータ可読媒体(例えば、メモリなど)から命令を受信し、それらの命令を実行し、それによって、本明細書で説明するプロセスのうちの1つ以上を含む、1つ以上のプロセスを実行する。
【0161】
コンピュータ可読媒体は、汎用コンピュータシステム又は専用コンピュータシステムによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータ実行可能命令を記憶するコンピュータ可読媒体は、非一時的コンピュータ可読記憶媒体(装置)である。コンピュータ実行可能命令を搬送するコンピュータ可読媒体は、伝送媒体である。したがって、限定ではなく例として、本開示の実施形態は、少なくとも2つの明確に異なる種類のコンピュータ可読媒体、すなわち非一時的コンピュータ可読記憶媒体(装置)及び伝送媒体を含むことができる。
【0162】
非一時的コンピュータ可読記憶媒体(装置)は、RAM、ROM、EEPROM、CD-ROM、(例えば、RAMに基づく)ソリッドステートドライブ(SSD)、フラッシュメモリ、相変化メモリ(PCM)、他のタイプのメモリ、他の光ディスクストレージ、磁気ディスクストレージ若しくは他の磁気ストレージ装置、又はコンピュータ実行可能命令若しくはデータ構造の形態で所望のプログラムコード手段を記憶するために使用することができ、汎用若しくは専用コンピュータによってアクセスすることができる任意の他の媒体を含む。
【0163】
「ネットワーク」は、コンピュータシステム及び/又はモジュール及び/又は他の電子装置間の電子データの移送を可能にする1つ以上のデータリンクとして定義される。情報が、ネットワーク又は別の通信接続(ハードワイヤード、ワイヤレス、又はハードワイヤード若しくはワイヤレスの組み合わせのいずれか)を介してコンピュータに転送又は提供されるとき、コンピュータは、その接続を伝送媒体として適切に認識する。伝送媒体は、コンピュータ実行可能命令又はデータ構造の形態で所望のプログラムコード手段を搬送するために使用することができ、汎用又は専用コンピュータによってアクセスすることができるネットワーク及び/又はデータリンクを含むことができる。上記の組み合わせも、コンピュータ可読媒体の範囲内に含まれるべきである。
【0164】
更に、様々なコンピュータシステム構成要素に到達すると、コンピュータ実行可能命令又はデータ構造の形態のプログラムコード手段は、伝送媒体から非一時的コンピュータ可読記憶媒体(装置)に(又はその逆に)自動的に転送され得る。例えば、ネットワーク又はデータリンクを介して受信されたコンピュータ実行可能命令又はデータ構造は、ネットワークインターフェースモジュール(例えば、NIC)内のRAMにバッファリングされ、次いで、最終的に、コンピュータシステムRAM及び/又はコンピュータシステムにおけるより揮発性の低いコンピュータ記憶媒体(装置)に転送され得る。したがって、非一時的コンピュータ可読記憶媒体(装置)は、伝送媒体も(又は更に主に)利用するコンピュータシステム構成要素に含まれ得ることを理解されたい。
【0165】
コンピュータ実行可能命令は、例えば、プロセッサで実行されると、汎用コンピュータ、専用コンピュータ、又は専用処理装置に、ある機能又は機能群を実行させる命令及びデータを含む。いくつかの実施形態では、コンピュータ実行可能命令は、汎用コンピュータ上で実行され、汎用コンピュータを、本開示の要素を実装する専用コンピュータに変える。コンピュータ実行可能命令は、例えば、バイナリ、アセンブリ言語などの中間フォーマット命令、又は更にソースコードであってもよい。主題は、構造的特徴及び/又は方法論的動作に特有の言語で説明されているが、添付の特許請求の範囲において定義される主題は、説明された特徴又は上述の動作に必ずしも限定されないことを理解されたい。むしろ、説明された特徴及び動作は、特許請求の範囲を実装する例示的な形態として開示される。
【0166】
当業者は、本開示が、パーソナルコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、メッセージプロセッサ、ハンドヘルド装置、マルチプロセッサシステム、マイクロプロセッサベース又はプログラム可能な家庭用電化製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、携帯電話、PDA、タブレット、ページャ、ルータ、スイッチなどを含む、多くのタイプのコンピュータシステム構成を有するネットワークコンピューティング環境で実施され得ることを理解するであろう。本開示はまた、ネットワークを介して(ハードワイヤードデータリンク、ワイヤレスデータリンク、又はハードワイヤード及びワイヤレスデータリンクの組み合わせのいずれかによって)リンクされたローカル及びリモートコンピュータシステムが両方ともタスクを実行する分散システム環境において実施され得る。分散システム環境では、プログラムモジュールは、ローカルメモリ記憶装置及びリモートメモリ記憶装置の両方に位置することができる。
【0167】
本開示の実施形態は、クラウドコンピューティング環境において実装することもできる。本明細書では、「クラウドコンピューティング」は、構成可能なコンピューティングリソースの共有プールへのオンデマンドネットワークアクセスを可能にするためのモデルとして定義される。例えば、クラウドコンピューティングは、構成可能なコンピューティングリソースの共有プールへのユビキタスで便利なオンデマンドアクセスを提供するために、市場で使用され得る。構成可能なコンピューティングリソースの共有プールは、仮想化を介して迅速に設定され、低い管理労力又はサービスプロバイダ対話で公開され、次いで、それに応じて拡大縮小され得る。
【0168】
クラウドコンピューティングモデルは、例えば、オンデマンドセルフサービス、広域ネットワークアクセス、リソースプーリング、迅速な弾力性、測定されたサービス等の種々の特性から構成することができる。クラウドコンピューティングモデルはまた、例えば、Software as a Service(SaaS)、Platform as a Service(PaaS)、及びInfrastructure as a Service(IaaS)などの様々なサービスモデルを公開することができる。クラウドコンピューティングモデルは、プライベートクラウド、コミュニティクラウド、パブリッククラウド、ハイブリッドクラウドなどの異なる展開モデルを使用して展開することもできる。本明細書及び特許請求の範囲において、「クラウドコンピューティング環境」は、クラウドコンピューティングが採用される環境である。
【0169】
図8は、上記で説明したプロセスのうちの1つ以上を実行するように構成され得るコンピューティング装置800のブロック図を図示する。コンピューティング装置800などの1つ以上のコンピューティング装置が、泡検出システム106及び配列決定システム104を実装することができることが理解されよう。
図8によって示されるように、コンピューティング装置800は、プロセッサ802、メモリ804、ストレージ(記憶)装置806、I/Oインターフェース808、及び通信インターフェース810を含むことができ、これらは、通信インフラストラクチャ812によって通信可能に結合され得る。ある特定の実施形態では、コンピューティング装置800は、
図8に示されるものよりも少ない又は多い構成要素を含むことができる。以下の段落は、
図8に示されるコンピューティング装置800の構成要素を更に詳細に説明する。
【0170】
1つ以上の実施形態では、プロセッサ802は、コンピュータプログラムを構成する命令などの命令を実行するためのハードウェアを含む。限定ではなく、例として、ワークフローを動的に修正するための命令を実行するために、プロセッサ802は、内部レジスタ、内部キャッシュ、メモリ804、又はストレージ装置806から命令を取り出し(又はフェッチし)、それらを復号して実行することができる。メモリ804は、データ、メタデータ、及びプロセッサによる実行のためのプログラムを記憶するために使用される揮発性又は不揮発性メモリであってもよい。記憶装置806は、本明細書に記載の方法を実行するためのデータ又は命令を記憶するための、ハードディスク、フラッシュディスクドライブ、又は他のデジタル記憶装置などの記憶装置を含む。
【0171】
I/Oインターフェース808は、ユーザが、コンピューティング装置800に入力を提供し、コンピューティング装置800から出力を受信し、そうでなければコンピューティング装置800にデータを転送し、コンピューティング装置800からデータを受信することを可能にする。I/Oインターフェース808は、マウス、キーパッド若しくはキーボード、タッチスクリーン、カメラ、光学スキャナ、ネットワークインターフェース、モデム、他の既知のI/O装置、又はかかるI/Oインターフェースの組み合わせを含むことができる。I/Oインターフェース808は、限定はしないが、グラフィックスエンジン、ディスプレイ(例えば、ディスプレイスクリーン)、1つ以上の出力ドライバ(例えば、ディスプレイドライバ)、1つ以上のオーディオスピーカ、及び1つ以上のオーディオドライバを含む、ユーザに出力を提示するための1つ以上の装置を含むことができる。ある特定の実施形態では、I/Oインターフェース808は、ユーザに提示するためにグラフィカルデータをディスプレイに提供するように構成される。グラフィカルデータは、1つ以上のグラフィカルユーザインターフェース及び/又は特定の実装に役立ち得る任意の他のグラフィカルコンテンツを表してもよい。
【0172】
通信インターフェース810は、ハードウェア、ソフトウェア、又はその両方を含むことができる。いずれにしても、通信インターフェース810は、コンピューティング装置800と1つ以上の他のコンピューティング装置又はネットワークとの間の通信(例えば、パケットベースの通信など)のための1つ以上のインターフェースを提供することができる。限定ではなく例として、通信インターフェース810は、Ethernet(イーサネット)(登録商標)若しくは他の有線ベースのネットワークと通信するためのネットワークインターフェースコントローラ(NIC)若しくはネットワークアダプタ、又はWI-FIなどのワイヤレスネットワークと通信するためのワイヤレスNIC(WNIC)若しくはワイヤレスアダプタを含むことができる。
【0173】
更に、通信インターフェース810は、様々なタイプの有線又は無線ネットワークとの通信を容易にすることができる。通信インターフェース810はまた、様々な通信プロトコルを使用して、通信を容易にすることもできる。通信インフラストラクチャ812はまた、コンピューティング装置800の構成要素を互いに結合するハードウェア、ソフトウェア、又はその両方を含むことができる。例えば、通信インターフェース810は、1つ以上のネットワーク及び/又はプロトコルを使用して、特定のインフラストラクチャによって接続された複数のコンピューティング装置が互いに通信して、本明細書で説明するプロセスの1つ以上の態様を実行することを可能にすることができる。例示すると、配列決定プロセスは、複数の装置(例えば、クライアント装置、配列決定装置、及びサーバー装置)が配列決定データ及びエラー通知などの情報を交換することを可能にすることができる。
【0174】
前述の明細書において、本開示は、その特定の例示的な実施形態を参照して説明された。本開示の様々な実施形態及び態様は、本明細書で論じられる詳細を参照して説明され、添付の図面は様々な実施形態を図示する。上記の説明及び図面は、本開示の例示であり、本開示を限定するものとして解釈されるべきではない。本開示の様々な実施形態の完全な理解を提供するために、多数の特定の詳細が説明される。
【0175】
本開示は、その趣旨又は本質的な特徴から逸脱することなく、その他の特定の形態で具現化されてもよい。記載された実施形態は、全ての点において、例示的なものに過ぎず、限定的ではないと見なされるべきである。例えば、本明細書で説明される方法は、より少ない又はより多いステップ/動作を用いて行われてもよく、又はステップ/動作は、異なる順序で行われてもよい。更に、本明細書で説明されるステップ/動作は、互いに並行して、又は同じ若しくは同様の動作の異なる出現と並行して、繰り返されるか、又は実行され得る。したがって、本願の範囲は、前述の説明ではなく、添付の特許請求の範囲によって示される。特許請求の範囲の意味及び均等範囲内に含まれる全ての変更は、それらの範囲内に包含されるものである。
【符号の説明】
【0176】
100 システム環境
102 サーバー装置
104 配列決定システム
106 泡検出システム
108 ユーザクライアント装置
110 配列決定アプリケーション
112 ネットワーク
114 配列決定装置
800 コンピューティング装置
802 プロセッサ
804 メモリ
806 記憶装置
808 I/Oインターフェース
810 通信インターフェース
812 通信インフラストラクチャ
【国際調査報告】