IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ライフ テクノロジーズ コーポレーションの特許一覧

特許7254165アレイベースのPCRのための画像を駆使した品質管理
<>
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図1
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図2
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図3
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図4
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図5
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図6
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図7
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図8
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図9
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図10
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図11
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図12
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図13
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図14
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図15
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図16
  • 特許-アレイベースのPCRのための画像を駆使した品質管理 図17
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-30
(45)【発行日】2023-04-07
(54)【発明の名称】アレイベースのPCRのための画像を駆使した品質管理
(51)【国際特許分類】
   G16B 25/00 20190101AFI20230331BHJP
   C12M 1/00 20060101ALI20230331BHJP
   C12M 1/34 20060101ALI20230331BHJP
   G16B 40/10 20190101ALI20230331BHJP
【FI】
G16B25/00
C12M1/00 A
C12M1/34 B
G16B40/10
【請求項の数】 15
(21)【出願番号】P 2021511637
(86)(22)【出願日】2019-08-29
(65)【公表番号】
(43)【公表日】2021-12-16
(86)【国際出願番号】 US2019048862
(87)【国際公開番号】W WO2020047288
(87)【国際公開日】2020-03-05
【審査請求日】2021-03-10
(31)【優先権主張番号】62/725,894
(32)【優先日】2018-08-31
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】502221282
【氏名又は名称】ライフ テクノロジーズ コーポレーション
(74)【代理人】
【識別番号】100094569
【弁理士】
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【弁理士】
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【弁理士】
【氏名又は名称】須田 洋之
(74)【代理人】
【氏名又は名称】松下 満
(74)【代理人】
【識別番号】100098475
【弁理士】
【氏名又は名称】倉澤 伊知郎
(74)【代理人】
【識別番号】100130937
【弁理士】
【氏名又は名称】山本 泰史
(74)【代理人】
【識別番号】100144451
【弁理士】
【氏名又は名称】鈴木 博子
(74)【代理人】
【識別番号】100123630
【弁理士】
【氏名又は名称】渡邊 誠
(72)【発明者】
【氏名】チュ ヨン
(72)【発明者】
【氏名】マジュンバー ニヴェディータ
(72)【発明者】
【氏名】アリミナティ マンジュラ
(72)【発明者】
【氏名】チェン ヨンジ
(72)【発明者】
【氏名】パペンフス ケヴィン
【審査官】藤澤 美穂
(56)【参考文献】
【文献】特開2011-135855(JP,A)
【文献】特表2008-506098(JP,A)
【文献】特開2009-109402(JP,A)
【文献】特表2012-504412(JP,A)
【文献】米国特許出願公開第2017/0175169(US,A1)
【文献】特表2018-505680(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16B 5/00-99/00
C12M 1/00
C12M 1/34
(57)【特許請求の範囲】
【請求項1】
システムであって、
PCRシステムと、
反応アレイプレートと、
前記PCRシステムにおける前記反応アレイプレートの画像シーケンスを受信して、受信した画像シーケンスが入力されるように構成された畳み込みニューラルネットワーク(CNN)と、を含み、
前記CNNの出力に基づいて、前記PCRシステムを制御し、
前記CNNの前記出力は、前記画像シーケンスの各画像をROXスポッティング予測、ROXストリッピング予測、明るいROX予測、スポットポイントブリッジ予測、および再構築エラー予測に変換させる、システム。
【請求項2】
前記制御が、停止制御である、請求項1に記載のシステム。
【請求項3】
前記反応アレイプレートの貫通孔中心と前記CNNの層内のアレイとの間のマッピング機能をさらに含む、請求項1に記載のシステム。
【請求項4】
前記CNNの出力層は、最終的完全に接続されていない、請求項1に記載のシステム。
【請求項5】
前記CNNから出力された特徴を受信し、前記特徴を不良モード予測に変換するように前記CNNに結合された少なくとも1つのリカレントニューラルネットワーク(RNN)をさらに含む、請求項に記載のシステム。
【請求項6】
複数のRNNを含み、複数のRNNの予測が、パーセプトロンによって組み合わされて、少なくとも1つの不良モードの最終予測となる、請求項に記載のシステム。
【請求項7】
前記CNNが、
54x54アレイを備えた入力層と、
32個の54x54アレイを備えた第1の畳み込み層と、
64個の18x18アレイを備えた第2の畳み込み層と、をさらに含む、請求項1に記載のシステム。
【請求項8】
前記CNNが、
192個のノードを備えた第1の完全に接続された層と、
前記第1の完全に接続された層に結合され、48個のノードを備えた、第2の完全に接続された層と、
前記第2の完全に接続された層に結合され、前記反応アレイプレートの正常または不良を示す出力信号を生成する出力層と、をさらに備える、請求項に記載のシステム。
【請求項9】
前記出力層が、前記反応アレイプレートの不良モードの予測をさらに生成する、請求項に記載のシステム。
【請求項10】
方法であって、
反応アレイプレートに対してPCRシステムを動作させることと、
前記反応アレイプレートに対する前記PCRシステムの動作中に、前記反応アレイプレートの複数のサブアレイからの画像シーケンスを複数の畳み込みニューラルネットワーク(CNN)に入力することと、
前記画像シーケンスに基づいて前記反応アレイプレートの不良モード予測を生成するために、前記CNNを動作させることと、
前記CNNの出力に基づいて、前記反応アレイプレート製造するための、または前記PCRシステムの制御のための1つ又は複数の設定を行うことと、を含み、
前記CNNの前記出力が、前記画像シーケンスの各画像をROXスポッティング予測、ROXストリッピング予測、明るいROX予測、スポットポイントブリッジ予測、および再構築エラー予測に変換させる、方法。
【請求項11】
前記制御が、停止制御である、請求項10に記載の方法。
【請求項12】
前記反応アレイプレートの貫通孔中心を複数の前記CNNのうちの異なるCNNにマッピングすることをさらに含む、請求項10に記載の方法。
【請求項13】
前記CNNのうちの1つ以上の前記CNNは、その出力層が、最終的完全に接続されていない、請求項10に記載の方法。
【請求項14】
前記CNNから出力された特徴を受信し、前記特徴を前記不良モード予測に変換するために、前記CNNの前記出力を少なくとも1つのリカレントニューラルネットワーク(RNN)に結合することをさらに含む、請求項13に記載の方法。
【請求項15】
複数のRNNを含み、複数のRNNの予測が、パーセプトロンによって組み合わされて、少なくとも1つの不良モードの最終予測となる、請求項14に記載の方法。
【発明の詳細な説明】
【背景技術】
【0001】
深層学習は、非構造化生データから直接複雑かつ抽象的なパターンを学習するために、大量のデータでトレーニングされた大規模な深層ニューラルネットワークである。従来の機械学習アルゴリズムは、タスク固有であり、幅広い分野の専門知識を持つエンジニアによって設計された手作りの機能に大きく依存している。対照的に、深層学習には、生データから効果的な特徴を直接発見し、より単純な特徴を組み合わせることによって複雑な特徴を学習する優れた機能がある。深層学習は、画像分類、コンピュータビジョン、音声認識、自然言語処理(NLP、natural language processing)、医用画像診断などの様々な分野で、最先端のパフォーマンスを既に実証している。例えば、GoogleおよびMicrosoftは、ImageNet画像分類タスクに畳み込みニューラルネットワーク(CNN、Convolution Neural Network)を適用し、画像分類で人間を上回る4.9%および4.6%のエラー率を報告した。
【0002】
現在、ポリメラーゼ連鎖反応(PCR、Polymerase Chain Reactions)の実行に利用されるアッセイ反応プレートなどの製造品質管理では、画像の再構築および品質管理(QC、quality control)を手動で視覚的にチェックして問題を識別し、アッセイ反応プレートの製造の不良の根本原因を判定している。しかしながら、製造プロセス中に画像を視覚的にチェックすることは、時間がかかり、エラーが発生しやすく、面倒な作業である。また、生産能力が制限され、反応プレートアレイ製品の顧客への納品が遅れることがよくある。
【0003】
いくつかのPCRシステムは、最大スループットを実現するように設計されており、約4時間で最大4つの3,072反応プレートを同時に実行できる。このようなシステムおよび反応プレートは、わずかナノリットルの試料量を使用することが多く、試料およびアッセイをプレートアレイにローディングするための複雑なワークフローを備えた専用の器具が必要である。複雑なワークフローおよび消耗品の難しい使用は、感度および精度を低下させることにより、アレイの反応品質に影響を与える可能性がある。この複雑さの別の副作用は、アレイの製造歩留まりが低下することである。シートコーティング、再構築、または試料のローディングに関連するアレイ製造の不良は一般的である。例えば、PCRを実行しているアレイプレートには、以下を含むがこれらに限定されない特定のローディング関連のアーティファクトがある場合がある。
1.ブリッジング-流体がいくつかの隣接する反応ユニットの周りに溢れ、それらの間にブリッジを形成して、反応の完全性を損なう場合。
2.漏れ-反応プレートの封止ユニットが破損し、液体が外部チャンバに漏れる可能性がある。
3.アッセイスポッティングの問題-事前にスポッティングされたアッセイフォーマットについて、いくつかの反応ユニットにはアッセイがローディングされない場合がある。
【0004】
これらのシートコーティング、再構築、または試料ローディングの問題は、再構築および品質管理(QC)画像を視覚的にチェックすることで検出できる。したがって、QC画像から問題を自動的に識別し、製造プロセス中の不良の根本原因を迅速に判定することが非常に重要である。PCR反応は、OpenArrayまたは他のアレイベースのPCRプラットフォームのPCRの実行前、実行中、または実行後に撮影された画像で試料のローディングの問題などの異常な動作を示す可能性があるため、顧客対応ソフトウェアのこれらのタイプの不良モードを自動的に検出し、トラブルシューティングのステップを顧客にとってはるかに効率的かつ簡単にすることが望ましい。
【発明の概要】
【0005】
本システムは、畳み込みニューラルネットワーク(CNN)などの深層ニューラルネットワークを利用して、アレイプレートの再構築およびQC画像の異常を検出し、不良モードを識別する。一定期間の正常シートおよび不良シートの両方を含むQC画像は、製造データサーバから取得される。データは、正常または異なる不良モードに基づいて分類される。各QC画像には、1つまたは複数のサブアレイに関連付けられた2つ以上の不良モードがある場合があるため、QC画像は(例えば48個の)サブアレイ画像に分割され、各サブアレイには、正常、または明るいRox、Roxスポッティング、Roxストリッピング、ストップポイントブリッジング、および再構築エラーを含む5つの不良モードに注釈を付けられる。注釈付きサブアレイ画像は、CNNモデルのトレーニング、評価、および試験に使用される。次に、トレーニングされ、かつ検証されたモデルを使用して、アレイプレートの再構築およびQC画像の不良およびそれらのモードを認識できる。
【0006】
畳み込みニューラルネットワーク(CNN)は、二次元または三次元でモデル化されたデータセットの特徴を分類するのに特に適している。これにより、画像をコンピュータメモリで三次元(幅と高さの二次元、色構成要素や強度などのピクセル特徴の三次元)で表すことができるため、CNNは画像分類により一般に普及している。例えば、サイズ480x480ピクセルのカラーJEG画像は、480x480x3のアレイを使用して、コンピュータメモリモデル化でき、三次元の各値は、0~255の範囲のピクセルの赤、緑、または青の色構成要素の強度である。この数値のアレイをトレーニングされたCNNに入力すると、画像が特定のクラスになる確率を表す出力が生成される(猫の場合は.80、犬の場合は.15、鳥の場合は.05など)。画像分類は、入力画像を撮影し、クラス(猫、犬など)または画像を最もよく表すクラスの確率を出力するタスクである。
【0007】
基本的に、CNNはデータセットを入力し、一連の畳み込み変換、非線形活性化関数(RELUなど)、プーリング工程(maxpoolなどのダウンサンプリング)、および出力層(softmaxなど)を通過させて分類を生成する。
任意の特定の要素または行為の考察を容易に識別するために、参照番号における最上位桁(複数可)は、その要素が最初に導入された、図の番号を指す。
【図面の簡単な説明】
【0008】
図1】一実施形態によるqPCRシステム100を示す。
図2】一実施形態によるプロセス200を示す。
図3】一実施形態によるプレート調製300を示す。
図4】一実施形態によるQC画像条件400を示す。
図5】一実施形態による畳み込みニューラルネットワーク500を示す。
図6】一実施形態による畳み込みニューラルネットワーク層600を示す。
図7】一実施形態によるプレート調製700を示す。
図8】一実施形態によるPCR品質管理システム800を示す。
図9】一実施形態によるPCR品質管理システム900を示す。
図10】一実施形態による検証結果1000を示す。
図11】一実施形態による検証結果1100を示す。
図12】一実施形態によるPCR品質管理システム1200を示す。
図13】一実施形態によるリカレントニューラルネットワーク1300を示す。
図14】一実施形態によるPCR品質管理システム1400を示す。
図15】一実施形態によるPCR品質管理システム1500を示す。
図16】一実施形態によるクラウド学習および制御システム1600を示す。
図17】本発明の実施形態を組み込むことができるコンピューティングデバイス1700の例示的なブロック図。
【発明を実施するための形態】
【0009】
PCRアッセイアレイの背景で説明されているローディングの問題は、PCR反応の実行前、実行中、または実行後に撮影された画像を評価することで検出され得る。畳み込みニューラルネットワーク(CNN)は、異常のないPCR実行のデータを使用したトレーニングに基づいて、不良モードを認識し、未知の(分類されていない)不良モードを識別するようにトレーニングされ、かつ適用される。
【0010】
不良モードを示す特徴の人間による識別に依存する従来のトラブルシューティング方法と比較して、CNNは感度および特異性を向上させ、以前は分類されていなかった問題の認識を学習できる。単一または複数のCNNは、直列または並列に適用できる。いくつかの実施形態では、リカレントニューラルネットワーク(RNN)は、CNNと合わせて適用され得る。
【0011】
一実施形態によれば、深層ニューラルネットワーク、より具体的には畳み込みニューラルネットワーク(CNN)を利用して、OpenArray(登録商標)再構築およびQC画像の異常を検出し、不良モードを識別することができる。OpenArray QC画像は、OpenArray製造データサーバからダウンロードできる。これには、以前の器具実行からの正常シートと不良シートの両方が含まれる。次に、データは、正常モードまたは異なる不良モードに基づいて分類できる。各QC画像には、1つまたは複数のサブアレイに関連付けられた2つ以上の不良モードが含まれる場合があるため、プロセスはQC画像を(例えば)48個のサブアレイ画像に分割し、各サブアレイに正常、または明るいRox、Roxスポッティング、Roxストリッピング、ストップポイントブリッジング、および再構築エラーを含む5つの不良モードの1つ以上に注釈を付けることができる。注釈付きサブアレイ画像は、CNNモデルのトレーニング、評価、および試験に使用される。次に、トレーニングされ、かつ検証されたモデルを利用して、OpenArrayの再構築およびQC画像の不良およびそれらのモードを認識できる。
【0012】
一実施形態では、深層学習ニューラルネットワークを動作させて不良モードを識別するプロセスは、以下を伴い得る。
4.製造データサーバから正常および不良のプレートのアレイ品質管理(QC)画像をダウンロードすること。
5.QC画像ごとに、スポット発見アルゴリズムを使用してアレイ内のすべての貫通孔(反応ユニット)中心を発見し、識別された貫通孔中心に基づいてアレイ画像全体を48個のサブアレイ画像に分割する。
6.48個のサブアレイ画像すべてを注釈ツールにローディングし、それらを視覚的に検査して、正常、または明るいRox、Roxスポッティング、Roxストリッピング、ストップポイントブリッジング、および再構築エラーを含む5つの不良モードとして標識付けする。
7.すべてのQC画像に対して2)および3)を繰り返して、注釈付きのトレーニングおよび検証データセットを構築する。
8.トレーニングするネットワークとして、1つ以上の隠れ層を持つ畳み込みニューラルネットワークを使用する。
9.完全に接続された層を出力層として使用して、入力サブアレイ画像の予測を出力する。
10.Softmaxクロスエントロピーコスト関数を適用して、予測と注釈付き標識との間の損失を計算する。
11.Adamオプティマイザーまたは他の勾配降下オプティマイザーを使用して上述のネットワークの重みを更新し、各トレーニングステップでトレーニングデータセットからランダムに選択されたトレーニング試料のミニバッチに対する損失を最小化する。
12.予め定められたトレーニングステップ数に達するまでトレーニングプロセスを継続し、特定のトレーニングステップごとにトレーニングされたネットワークを保存する。
13.トレーニングプロセスに含まれていない検証データセット内のサブアレイ画像の独立したサブセットによって、トレーニングプロセス中に保存された、トレーニングされたモデルを評価する。最良のトレーニングされたモデルとして、評価損失またはエラー率が最小のトレーニングされたモデルを選択する。
14.貫通孔の中心が識別された新しいQC画像の場合、アレイ画像全体をいくつかの数(48個など)のサブアレイ画像に分割する。選択された、トレーニングされたモデルをこれらのサブアレイ画像に適用して、正常または不良を予測する。すべてのサブアレイ画像が良好である場合、アレイQCは正常であり、それ以外の場合、アレイQCは不良になる。システムはまた、どの1つ以上のサブアレイが不良になるか、かつどの不良モードであるかを予測することもできる。
15.ノイズ、回転、並進オフセット、明るさもしくはコントラストの変化、または敵対的生成ネット(GAN)によるシミュレートされたサブアレイ画像の追加などのデータ拡張技術を使用して、トレーニングされたモデルの堅牢性を向上させることができる。
16.トレーニング中に、ドロップアウトまたは重み減衰などの技術を使用して、トレーニングされたモデルの一般性を向上させることができる。
【0013】
図1は、反応プレート104、試料ローディング器具102、リアルタイムPCR器具108、試料混合物106、コンピュータシステム124、およびユーザインターフェース130を含むqPCRシステム100を示す。反応プレート104は、各々がqPCR実験のための反応位置として機能する複数の貫通孔を備えた複数のサブアレイを備える。貫通孔の各々は、アッセイ110でコーティングすることができる。いくつかの構成では、アッセイ110は、試料DNA中のヌクレオチド配列を特異的に標的とするプローブである。試料DNAの増幅中、プローブは、リアルタイムPCR器具108によって検出されるレポーター色素の放出を介して、標的配列の存在を示す。反応プレート104は、試料ローディング器具102において標的ポリヌクレオチド配列112と組み合わされる。反応プレート104を標的ポリヌクレオチド配列112と組み合わせる前に、標的ポリヌクレオチド配列112は、反応混合物118を含む試料混合物106において調製される。反応混合物118は、少なくとも、ポリメラーゼ116、プライマー136、および受動参照色素114を含む。ポリメラーゼ116は、PCR反応中に二本鎖DNAを増幅する。試料ローディング器具102は、特定の量の試料混合物106を、反応プレート104内の意図された各貫通孔にローディングする。試料ローディング器具102が反応プレート104の調製を完了すると、反応プレート104はリアルタイムPCR器具108にローディングされる。リアルタイムPCR器具108は、DNA複製のための特定のフェーズを誘発する異なる温度範囲を循環するサーモサイクラーを含む。第1のフェーズは、二本鎖DNAを変性させる高温フェーズである。次のフェーズでは、プライマーおよびポリメラーゼを標的ポリヌクレオチド配列112の近くの位置にアニーリングし、アッセイ110が標的ポリヌクレオチド配列112とハイブリダイズすることを可能にする。第3のフェーズは、ポリメラーゼがDNA鎖の複製を開始する伸長/複製フェーズである。複製フェーズの間、ポリメラーゼ116は、ハイブリダイズされたアッセイ110および標的ポリヌクレオチド配列112に遭遇し得る。ポリメラーゼ116がアッセイ110に遭遇すると、アッセイ110のレポーター色素が切断され、その結果、貫通孔で蛍光信号が観察される。リアルタイムPCR器具108は、複製プロセス中に貫通孔の各々からレポーター色素を検出する検出器120を備える。検出された信号は、メモリ126、ならびに情報を保存し、かつ処理して、試料混合物106内の標的配列のコピー数およびインスタンスを示すクラスター分析プロット132を生成するプロセッサ128を備えたコンピュータシステム124に報告される。リアルタイムPCR器具108は、受動参照色素画像134を捕捉するカメラ122を追加的に備える。受動参照色素画像134は、試料ローディング器具102による反応プレート104の成功したローディングの定性的指標として利用され、かつクラスター分析プロット132からの任意の異常な結果への洞察を提供し得る。クラスター分析プロット132および受動参照色素画像134の両方は、ユーザインターフェース130を介して表示可能であり得る。
【0014】
当業者に通知されるように、PCR分析は、遺伝子標的を増幅するために複数の熱サイクルを循環するための様々なプロトコルを有する熱循環器具において実施される。本教示の様々な実施形態では、増幅のために実施されるサイクル数は、約20~40サイクルであり得る。本教示の様々な実施形態では、増幅のために実施されるサイクル数は、40サイクルより大きくてもよい。遺伝子標的の増幅のために、熱サイクリング器具は、第1の熱サイクル数に関連付けられ得る特定のサイクル時間で、PCR実験の第1の熱サイクルを実施し得る。
【0015】
遺伝子型決定分析の様々な実施形態では、2つ以上のDNA試料が、第1のプローブおよび第2のプローブでプローブされる。プロセッサは、データ収集のための様々なプロトコルのいずれかに基づいてqPCR器具から受信することができ、第1回目の第1のデータセットは、2つ以上のDNA試料の各々について、第1回目の第1のプローブ強度および第2のプローブ強度を含む。プロセッサは、データ収集のための様々なプロトコルのいずれかに基づいてqPCR器具から受信することができ、第2回目の第2のデータセットは、2つ以上のDNA試料の各々について、第2回目の第1のプローブ強度および第2のプローブ強度を含む。
【0016】
本教示の様々な実施形態によれば、ユーザインターフェースは、第1回目および第2回目に受信されたデータセットの分析のための視覚化ツールをエンドユーザに提示することができる。前述のように、複数の試料をバッチで遺伝子型決定分析のために処理して、データ集約型のデータセットを生成することができる。本教示によるシステムおよび方法の様々な実施形態は、このようなデータ集約型データセットの評価および分析においてエンドユーザを支援し得る視覚化ツールの実施形態を提供する。本教示によるシステムおよび方法の様々な実施形態について、エンドユーザからの入力に応答して、プロセッサは、第1のデータセットを使用して、第1のプローブ強度対第2のプローブ強度の第1のプロットを生成し得る。さらに、プロセッサは、エンドユーザからの入力に応答して、第2のデータセットを使用して、第2のプローブ強度の関数として第1のプローブ強度の第2のプロットを生成し得る。本教示のシステムおよび方法の様々な実施形態によれば、プロセッサは、エンドユーザからの入力に応答して、第1のプロットおよび第2のプロットを表示し得る。様々な実施形態では、入力は、データを段階的に表示するためのユーザインターフェースを備えた対話型プロセスであり得る。このような実施形態では、エンドユーザは、表示のために任意の順序で任意のデータセットを選択し得る。
【0017】
様々な実施形態では、プロセッサは、PCR実験の実行時間中にデータを受信し得る。例えば、プロセッサは、第1のデータセットの収集後、かつ第2のデータセットの収集の前に、qPCR器具から第1のデータセットを受信し得る。さらに、このプロトコルは、実行時間全体にわたって拡張され得、その結果、例えば、プロセッサは、第2のデータセットの収集後、かつ後続のデータセットの収集の前に、qPCR器具から第2のデータセットを受信し得る。
【0018】
いくつかの実施形態では、プロセッサは、熱サイクルが完了した後、qPCR器具から第1のデータセットおよび第2のデータセットを受信し得る。例えば、プロセッサは、コンピュータ可読媒体に保存された後、第1のデータセットおよび第2のデータセットを受信し得る。
【0019】
いくつかの構成では、視覚化ツールは、エンドユーザが遺伝子型決定データセットの様々な側面を表示するのを支援し、それによって遺伝子型決定データの分析を容易にすることができる。様々な実施形態では、プロセッサは、第2のデータセットと第1のデータセットとの間の軌道線を示すプロットを表示することができる。様々な実施形態では、プロセッサは、第1のデータセットの第1のプロット品質値上に表示し、第2のデータセットの第2のプロット品質値上に表示することができる。様々な実施形態によれば、ユーザインターフェースは、試料テーブル上で行われ、遺伝子型決定データのプロット上に動的に表示される選択間の相互作用を提供する。様々な実施形態では、エンドユーザによって行われた、視覚化ツールのユーザインターフェースからの選択は例えば、エンドユーザが例えば、曖昧なエンドポイントデータのトラブルシューティングを行い、手動呼び出しを行い、軌跡線を使用してクラスターの視覚化を支援し、遺伝子型の割り当てを強化し、アッセイ条件(つまり、標識プローブ、アッセイバッファーなど)を最適化し、かつ分析条件を最適化するが、それらに限定されないことを可能にするための動的分析を提供し得るが、それに限定されない。
【0020】
様々な実施形態では、システムは、例えば、クラスター分析プロット132に示されたグラフに従って、表され得るデータセットを利用するがそれに限定されない。このような表現は、異なる波長で発光する2つの色素を利用した分析から生じる可能性があり、これらの色素は、生物学的試料のゲノム遺伝子座の2つの対立遺伝子のうちの1つに向けられた標識プローブの各々に関連付けることができる。このような二重反応では、3つの潜在的な遺伝子型の各々について個別の信号セットが生成される。クラスター分析プロットに示されているように、信号2と信号1のデカルト座標系では、このようなグラフィック表現に示されている各データポイントは、所与の3つの個別の信号セットのうちの1つに座標を有する場合がある。したがって、各データポイントについて、複数の試料の個別の信号セットをデータセット内のデータポイントとして保存し得る。このようなデータセットは、様々なコンピュータ可読媒体に保存され、分析中または分析後に動的に分析され得、これについては、後で詳しく説明する。
【0021】
遺伝子型決定データの視覚化のための方法およびシステムの実施形態の特徴を実証するために使用されるこのようなタイプのアッセイの1つは、TaqMan(登録商標)試薬を利用することができ、例えば、後に議論されるように、FAMおよびVIC色素標識を使用し得るがそれらに限定されない。しかしながら、当業者は、本教示の方法およびシステムの様々な実施形態によって分析され得るデータを生成するために、標識プローブ試薬を含む様々なアッセイが利用され得ることを認識するであろう。
【0022】
「標識プローブ」という用語は概して、様々な実施形態によれば、典型的には定量分析またはqPCR分析、およびエンドポイント分析のために、増幅反応で使用される分子を指す。このような標識プローブは、標的ポリヌクレオチドの増幅を監視するために使用され得る。いくつかの実施形態では、増幅反応に存在するオリゴヌクレオチド標識プローブは、時間の関数として生成されるアンプリコン(複数可)の量を監視するのに好適である。このようなオリゴヌクレオチド標識プローブには、本明細書に記載の5’-エキソヌクレアーゼアッセイTaqMan(登録商標)標識プローブ(米国特許第5,538,848号も参照)、様々なステムループ分子ビーコン(例えば、米国特許第No.6,103,476号および第5,925,517号およびTyagi and Kramer,1996,Nature Biotechnology 14:303-308を参照)、ステムレスまたは線形ビーコン(例えば、WO99/21881を参照)、PNA Molecular Beacons(商標)(例えば、米国特許第6,355,421号および第6,593,091号を参照)、線形PNAビーコン(例えば、Kubista et al.,2001,SPIE4264:53-58を参照)、非FRET標識プローブ(例えば、米国特許第6,150,097号を参照)、Sunrise(登録商標)/Amplifluor(登録商標)標識プローブ(米国特許第6,548,250号)、ステムループおよびデュプレックスScorpion(商標)標識プローブ(Solinas et al.,2001,Nucleic Acids Research 29:E96および米国特許第6,589,743号)、バルジループ標識プローブ(米国特許第6,590,091号)、疑似ノット標識プローブ(米国特許第6,589,250号)、サイクリコン(米国特許第6,383,752号)、MGB Eclipse(商標)プローブ(Epoch Biosciences)、ヘアピン標識プローブ(米国特許第6,596,490号)、ペプチド核酸(PNA)ライトアップ標識プローブ、自己組織化ナノ粒子標識プローブ、ならびに、例えば、米国特許第6,485,901号、Mhlanga et al.,2001,Methods 25:463-471;Whitcombe et al.,1999,Nature Biotechnology17:804-807、Isacsson et al.,2000,Molecular Cell Labeling probes.14:321-328、Svanvik et al.,2000,Anal Biochem.281:26-35、Wolffs et al.,2001,Biotechniques766:769-771、Tsourkas et al.,2002,Nucleic Acids Research30:4208-4215、Riccelli et al.,2002,Nucleic Acids Research30:4088-4093、Zhang et al.,2002 Shanghai.34:329-332、Maxwell et al.,2002,J.Am.Chem.Soc.124:9606-9612、Broude et al.,2002,Trends Biotechnol、20:249-56、Huang et al.,2002,Chem Res.Toxicol.15:118-126、およびYu et al.,2001,J.Am.Chem.Soc.14:11155-11161に記載されている、フェロセン修飾標識プローブを含むが、それらに限定されない。標識プローブは、ブラックホールクエンチャー(Biosearch)、アイオワブラック(IDT)、QSYクエンチャー(分子標識プローブ)、およびDabsylおよびDabcelスルホン酸塩/カルボン酸塩クエンチャー(Epoch)を含むこともできる。標識プローブは、2つのプローブを含むことができ、例えば、蛍光体が一方のプローブ上にあり、クエンチャーが他方の上にあり、標的上の2つのプローブのハイブリダイゼーションがともに信号を消光させるか、または標的上のハイブリダイゼーションが、蛍光の変化を介して信号特性を変化させる。標識プローブはまた、カルボン酸基の代わりにスルホン酸基を有するフルオレセイン色素のスルホン酸誘導体、フルオレセインのホスホルアミダイト形態、CY5のホスホルアミダイト形態(例えば、Amershamから入手可能)を含み得る。
【0023】
本明細書で使用される場合、「核酸試料」という用語は、本教示による生物学的試料中に見出される核酸を指す。試料は、侵襲的または非侵襲的に収集され得ることが企図される。試料は、繊維、織物、紙巻きタバコ、チューインガム、接着剤、土壌、または無生物上に、それらにおいて、それらの中にあるか、またはそれらと合わせて見出されることができる。本明細書で使用される「試料」は、その最も広い意味で使用され、遺伝子標的または標的ポリヌクレオチドが誘導され得る核酸を含む試料を指す。試料は、細胞、細胞から単離された染色体(例えば、中期染色体の広がり)、ゲノムDNA、RNA、cDNAなどを含むことができる。試料は、植物、家畜、家庭用ペット、およびヒトの試料を含むがそれらに限定されない、核酸を含有する任意の生物を包含する動物または野菜起源のものであり得、複数の供給源に由来し得る。これらの供給源には、全血、毛髪、血液、尿、組織生検、リンパ液、骨、骨髄、歯、羊水、毛髪、皮膚、精液、肛門分泌物、膣分泌物、発汗、唾液、頬スワブ、様々な環境試料(農業、水、土壌など)、研究試料、精製試料、および溶解細胞が含まれるが、これらに限定されない。標的ポリヌクレオチド配列を含む核酸試料は、例えば、機械的力、超音波処理、制限エンドヌクレアーゼ切断または当技術分野で知られている任意の方法などの手順の使用を含む、当技術分野で知られている様々な試料調製手順のいずれかを使用して試料から単離できることが理解されよう。
【0024】
本明細書で使用される「標的ポリヌクレオチド」、「遺伝子標的」などの用語は、本明細書で交換可能に使用され、目的の特定の核酸配列を指す。「標的」は、増幅が求められ、他の核酸分子の存在下で、またはより大きな核酸分子内に存在することができるポリヌクレオチド配列であり得る。標的ポリヌクレオチドは、任意の供給源から得ることができ、任意の数の異なる組成構成要素を含むことができる。例えば、標的は核酸(例えば、DNAまたはRNA)であり得る。標的は、メチル化、非メチル化、またはその両方であり得る。さらに、目的の特定の核酸配列の文脈で使用される「標的」は、その代用物、例えば増幅産物、および天然配列をさらに指すことが理解されよう。いくつかの実施形態では、目的の特定の核酸配列は、例えば、法医学試料に見出され得るような、分解された供給源に由来する短いDNA分子である。本教示の対象となる特定の核酸配列は、上に列挙したように、いくつかの生物および供給源のいずれかに由来することができる。
【0025】
本明細書で使用される場合、「DNA」は、ゲノムDNA、cDNA、単離された核酸分子、ベクターDNA、および染色体DNAなど、当技術分野で理解される様々な形態のデオキシリボ核酸を指す。「核酸」は、あらゆる形態のDNAまたはRNAを指す。単離された核酸分子の例には、ベクターに含まれる組換えDNA分子、異種宿主細胞に維持される組換えDNA分子、部分的または実質的に精製された核酸分子、および合成DNA分子が含まれるが、それらに限定されない。典型的には、「単離された」核酸は、核酸が由来する生物のゲノムDNAにおいて、核酸に自然に隣接する配列(すなわち、核酸の5’および3’末端に位置する配列)を含まない。さらに、cDNA分子などの「単離された」核酸分子は概して、組換え技術によって生成される場合、他の細胞材料または培養培地を実質的に含まず、または化学合成される場合、化学前駆体または他の化学物質を含まない。
【0026】
いくつかの実施形態では、PCR増幅産物は、例えば、PCT特許出願第WO2009/059049号に記載されているように、PCR増幅プライマーにコンジュゲートされた蛍光色素によって検出され得る。PCR増幅産物は、増幅産物の染色、例えば銀染色などを含むがこれらに限定されない他の技術によっても検出することができる。
【0027】
いくつかの実施形態では、検出は、器具を含み、すなわち、コンピュータアルゴリズムを含むことができるが、含む必要はない自動または半自動の検出手段を使用する。いくつかの実施形態では、器具は、携帯型、可搬型であるか、または、例えば、増幅産物の検出が行われる実験室、病院、または他の環境にある、可動性または可搬型の低い構成要素に挿入できる携帯型構成要素を含む。特定の実施形態では、検出ステップは、少なくとも1つの増幅ステップ、1つの配列判定ステップ、1つの単離ステップ、1つの分離ステップ、例えば、少なくとも1つの蛍光スキャナを含むキャピラリー電気泳動器具、少なくとも1つのグラフ化、記録、もしくは読み取り構成要素、吸光度モニタもしくは蛍光スキャナおよびグラフレコーダと結合されたクロマトグラフィーカラム、記録および/もしくは検出構成要素を備えた質量分析計と結合されたクロマトグラフィーカラム、少なくとも1つのUV/可視光スキャナおよび少なくとも1つのグラフ化、記録、または読み取り構成要素を備えた分光光度計器具、スキャナもしくはCCDカメラなどのデータ記録デバイスを備えたマイクロアレイ、または、少なくとも1つの蛍光スキャナおよび少なくとも1つのグラフ化、記録、もしくは読み取り構成要素を備えた配列判定器具から選択された検出構成要素を有する配列判定器具、蛍光体標識された可逆的ターミネーターヌクレオチドを含む合成器具による配列判定、DNAポリメラーゼによるヌクレオチドの取り込みに続くピロリン酸塩(PPi)の放出の検出を含むパイロ配列判定法、ペアエンド配列判定、ポロニー配列判定、単一分子配列判定、ナノポア配列判定、および、ハイブリダイゼーションによる、もしくは参照により本明細書に組み込まれる、Lin,B et al.“Recent Patents on Biomedical Engineering(2008)1(1)60-67に記載されるライゲーションによる配列判定と組み合わされるか、またはそれらの継続である。
【0028】
特定の実施形態では、検出ステップは、増幅ステップ、例えば、Q-PCRなどのリアルタイム分析と組み合わされるがそれに限定されない。検出ステップを実施するための例示的な手段には、ABI PRISM(登録商標)Genetic Analyzer器具シリーズ、ABI PRISM(登録商標)DNA Analyzer器具シリーズ、ABI PRISM(登録商標)配列検出システム器具シリーズ、およびApplied BiosystemsリアルタイムPCR器具シリーズ(すべてApplied Biosystems製)、ならびに、Applied BiosystemsマイクロアレイおよびApplied Biosystems 1700化学発光マイクロアレイアナライザー、その他の市販のマイクロアレイなどのマイクロアレイおよび関連ソフトウェア、ならびに、とりわけ、Affymetrix、AgilentおよびAmersham Biosciencesなどから入手できる分析システム(Gerry et al.,J.Mol.Biol.292:251-62,1999、De Bellis et al.,Minerva Biotec 14:247-52,2002、およびStears et al.,Nat.Med.9:140-45,2003(補足を含む)も参照)またはビーズアレイプラットフォーム(イルミナ、カリフォルニア州サンディエゴ)が含まれる。例示的なソフトウェアには、GeneMapper(商標)ソフトウェア、GeneScan(登録商標)分析ソフトウェア、およびGenotyper(登録商標)ソフトウェア(すべてApplied Biosystems製)が含まれる。
【0029】
いくつかの実施形態では、増幅産物は、アンプリコンの少なくとも一部の質量電荷比(m/z)に基づいて検出し、かつ定量化することができる。例えば、いくつかの実施形態では、プライマーは、増幅産物に組み込まれ、質量分析計の検出に使用することができる質量タグ、電荷タグ、切断可能部分、または同位体を含むがそれらに限定されない、質量分析適合性レポーターグループを含む(例えば、Haff and Smirnov,Nucl.Acids Res.25:3749-50,1997、およびSaueret et al.,Nucl.Acids Res.31:e63,2003も参照)。増幅産物は、質量分析によって検出することができる。いくつかの実施形態では、プライマーは、検出のための増幅産物の一部の放出を容易にするために、制限酵素部位、切断可能部分などを含む。特定の実施形態では、多数の増幅産物は、液体クロマトグラフィーまたはキャピラリー電気泳動によって分離され、ESIまたはMALDIに供され、そして質量分析によって検出される。質量分析の説明は、とりわけ、The Expanding Role of Mass Spectrometry in Biotechnology,Gary Siuzdak,MCC Press,2003に記載されている。
【0030】
いくつかの実施形態では、検出することは、手動または視覚的な読み取りまたは評価、またはそれらの組み合わせを含む。いくつかの実施形態では、検出することは、自動化または半自動化されたデジタルまたはアナログの読み取りを含む。いくつかの実施形態では、検出することは、リアルタイム分析またはエンドポイント分析を含む。いくつかの実施形態では、検出することは、TaqMan(登録商標)低密度アレイ(Applied Biosystems)を含むがそれに限定されないマイクロ流体デバイスを含む。いくつかの実施形態では、検出することは、リアルタイム検出器具を含む。例示的なリアルタイム器具には、ABI PRISM(登録商標)7000配列検出システム、ABI PRISM(登録商標)7700配列検出システム、Applied Biosystems7300リアルタイムPCRシステム、Applied Biosystems7500リアルタイムPCRシステム、Applied Biosystems7900 HT、高速リアルタイムPCRシステム(すべてApplied Biosystems製)、LightCycler(商標)システム(ロシュモレキュラー)、Mx3000P(商標)リアルタイムPCRシステム、Mx3005P(登録商標)リアルタイムPCRシステム、およびMx4000(登録商標)マルチプレックス定量PCRシステム(Stratagene、カリフォルニア州ラホーヤ)、ならびにスマートサイクラーシステム(Cepheid、Fisher Scientificにより流通)が含まれる。リアルタイム器具の説明は、とりわけ、それぞれの製造社のユーザのマニュアル、McPherson、DNA Amplification:Current Technologies and Applications,Demidov and Broude,eds.,Horizon Bioscience,2004、および米国特許第6,814,934号に記載されている。
【0031】
「増幅反応混合物」および/または「マスターミックス」という用語は、標的核酸を増幅するために使用される様々な(いくつかまたはすべての)試薬を含む水溶液を指し得る。かかる反応は、固体支持体または半固体支持体(例えば、アレイ)を使用して実施される場合もある。反応は、ユーザによって所望に応じてシングルプレックスまたはマルチプレックス型式で実施される場合もある。これらの反応は、典型的には、酵素、水性緩衝液、塩、増幅プライマー、標的核酸、およびヌクレオシド三リン酸を含む。増幅反応混合物および/またはマスターミックスは、例えば、緩衝液(例えば、Tris)、1つ以上の塩(例えば、MgC、KCl)、グリセロール、dNTP(dA、dT、dG、dC、dU)、組換えBSA(ウシ血清アルブミン)、色素(例えば、ROX受動参照色素)、1つ以上の洗剤、ポリエチレングリコール(PEG)、ポリビニルピロリドン(PVP)、ゼラチン(例えば、魚もしくはウシ源)、および/または消泡剤のうちの1つ以上を含み得る。状況に応じて、混合物は、完全または不完全増幅反応混合物のいずれかであり得る。いくつかの実施形態では、マスターミックスは、増幅反応での使用前に増幅プライマーを含まない。いくつかの実施形態では、マスターミックスは、増幅反応での使用前に標的酢酸を含まない。いくつかの実施形態では、増幅マスターミックスは、増幅プライマーとの接触前に標的核酸試料と混合される。
【0032】
いくつかの実施形態では、増幅反応混合物は、増幅プライマーおよびマスターミックスを含む。いくつかの実施形態では、増幅反応混合物は、増幅プライマー、検出可能に標識付けられたプローブおよびマスターミックスを含む。
【0033】
いくつかの実施形態では、増幅プライマーおよびマスターミックスの反応混合物、または増幅プライマー、プローブ、およびマスターミックスの反応混合物は、保管容器または反応容器内で乾燥する。いくつかの実施形態では、増幅プライマーおよびマスターミックスの反応混合物、または増幅プライマー、プローブ、およびマスターミックスの反応混合物は、保管容器または反応容器内で凍結乾燥する。いくつかの実施形態では、本開示は概して、単一の対照核酸分子からの複数の標的特異的配列の増幅に関する。例えば、いくつかの実施形態では、単一の対照核酸分子はRNAを含むことができ、他の実施形態では、その単一の対照核酸分子は、DNAを含むことができる。標的特異的プライマーおよびプライマー対は、核酸分子の特定の領域、例えば、対照核酸分子を増幅することができる標的特異的配列である。いくつかの実施形態では、標的特異的プライマーは、RNAの逆転写をプライミングして、標的特異的cDNAを生成することができる。いくつかの実施形態では、標的特異的プライマーは、標的DNAまたはcDNAを増幅することができる。いくつかの実施形態では、選択的増幅に必要DNAの量は、約1ng~1マイクログラムであり得る。いくつかの実施形態では、1つ以上の標的配列の選択的増幅に必要なDNAの量は、約1ng、約5ng、または約10ngである。いくつかの実施形態では、標的配列の選択的増幅に必要なDNAの量は、約10ng~約200ngである。
【0034】
本明細書で使用される場合、「反応容器」という用語は、概して、反応が本教示によって生じ得る任意の容器、チャンバ、デバイス、カード、プレート、チップ、アレイ、またはアセンブリを指す。いくつかの実施形態では、反応容器は、例えば、Micro Amp(商標)Optical tube(Life Technologies Corp.、カリフォルニア州カールスバッド)などの0.2mLまたは0.5mL反応管、もしくは微小遠心管などの、しかしそれらに限定されない微小管、または分子生物学研究所で一般的に実用される種類の他の容器であり得る。いくつかの実施形態では、反応容器は、マルチウェルプレート(48、96、または384ウェルマイクロタイタープレートなど)のウェル、スライドガラス上のスポット、マイクロ流体デバイスのTaqMan(商標)Array CardまたはTaqMan(商標)低密度アレイを含むが、それに限定されないチャネルもしくはチャンバ内のウェル、またはTaqMan(商標)OpenArray(商標)リアルタイムPCRプレートの貫通孔(Applied Biosystems、Thermo Fisher Scientific)を含む。例えば、限定ではないが、複数の反応容器が同じ支持体上に存在することができる。例えば、OpenArray(商標)プレートは反応プレート3072貫通孔である。かかるプレート内のかかる貫通孔は、単一のTaqMan(商標)アッセイを含み得る。いくつかの実施形態では、例えばCaliperまたはFluidigmから入手可能なラボオンチップ型デバイスは、反応容器を提供することができる。様々な反応容器が市販されているか、または本教示との関連で使用するために設計され得ることが認識されるであろう。
【0035】
「ハイブリダイズする」および「アニールする」という基語の変形を含むが、これらに限定されない「アニールすること」および「ハイブリダイズすること」という用語は、互換的に使用され、二本鎖、三本鎖、または他のより高次の構造の形成をもたらす、1つの核酸の別の核酸とのヌクレオチド塩基対合相互作用を意味する。一次相互作用は、典型的には、ヌクレオチド塩基特異的であり、例えば、ワトソン・クリックおよびフーグスティーン型水素結合による、A:T、A:U、およびG:Cである。特定の実施形態では、塩基の積み重ねおよび疎水性相互作用は、二本鎖の安定性にも寄与し得る。プライマーおよびプローブが相補的配列にアニールする条件は、当該技術分野で周知であり、例えば、Nucleic Acid Hybridization,A Practical Approach,Hames and Higgins,eds.,IRL Press,Washington,D.C.(1985)およびWetmur and Davidson,Mol.Biol.31:349(1968)に記載されている。
【0036】
概して、かかるアニーリングが行われるかは、とりわけ、標的隣接配列および/もしくはアンプリコン中のプライマーの相補的部分の相補的部分およびそれらの対応する結合部位、またはレポータープローブの対応する相補的部分およびその結合部位の長さ、pH、温度、一価および二価陽イオンの存在、ハイブリダイズしている領域内のGヌクレオチドとCヌクレオチドの割合、培地の粘度、ならびに変性剤の存在によって影響される。このような可変物は、ハイブリダイゼーションに必要な時間に影響を及ぼす。したがって、好ましいアニーリング条件は、特定の用途に依存するであろう。しかしながら、このような条件は、過度の実験なしに当業者によって日常的に判定され得る。好ましくは、アニーリング条件は、プライマーおよび/またはプローブが、対応する標的隣接配列またはアンプリコン中の相補的配列と選択的にハイブリダイズするが、第2の反応温度で反応組成物中の異なる標的核酸または非標的配列に著しい程度にハイブリダイズしないことを可能にするように選択される。
【0037】
図2は、PCR増幅、具体的にはPCR増幅で利用される5’ヌクレアーゼアッセイで利用される一実施形態によるプロセス200を示す。プロセス200は、すべてのサイクルで発生し、生成物の指数関数的蓄積を妨害しないこのアッセイプロセスの4つのステージを示している。4つのステージは、重合フェーズ202、鎖置換フェーズ204、切断フェーズ206、および完了フェーズ208を含む。重合フェーズ202の間に、順方向プライマーおよび逆方向プライマーは、標的配列210の近くの二本鎖DNA210のセクションの複製を開始する。順方向プライマー(5’->3’)は、DNAポリメラーゼが不活性である温度で機能し、不要な複製を回避するホットスタートポリメラーゼ224(Taqポリメラーゼ)を含む。プローブ212は、レポーター色素218、相補配列226、非蛍光クエンチャー220、および副溝結合剤222を含む。プローブ212は、相補配列226を介して標的配列210にハイブリダイズする。非蛍光消光剤220および副溝結合剤222は、分子がプローブ212の3’末端に付着するように機能する。プローブが無傷である場合、非蛍光クエンチャー220(NFQ、non-fluorescent quencher)は、レポーター色素218が蛍光信号を発するのを防ぐ。非蛍光消光剤220は蛍光を発しないので、より低い背景信号を生成し、その結果、定量化の精度が向上する。副溝結合剤222(MGB、minor groove binder)は、プローブの長さを増やさずにプローブの溶融温度(Tm)を上げ、より短いプローブの設計を可能にする。重合フェーズ202の間、ホットスタートポリメラーゼ224は、レポーター色素218がプローブ212の5’側に付着した状態でプローブ212に向かって移動する。
【0038】
鎖置換フェーズ204では、ホットスタートポリメラーゼ224は、レポーター色素218を置換するハイブリダイズしたプローブ212と相互作用する。切断フェーズ206では、ホットスタートポリメラーゼ224は、プローブ212からレポーター色素218を切断する。切断により、レポーター色素がクエンチャー色素から分離される。非蛍光消光剤220がレポーター色素218をもはや遮断しないと、分離されたレポーター色素216はその蛍光を増加させる。蛍光の増加は、標的配列がプローブに相補的であり、PCR中に増幅される場合にのみ発生する。器具は、二本鎖DNA214上の標的配列の存在を示すレポーター色素からの蛍光を検出する。プローブ212の標的配列210へのハイブリダイゼーションのために、ホットスタートポリメラーゼ224は、完了フェーズ208を示す相補的配列226で停止する。
【0039】
図3は、反応プレート104がrtPCR器具にローディングされる前のプレート調製300を示す。反応プレート104は、複数のサブアレイを含み、各サブアレイ308は、複数の貫通アレイ貫通孔304を含む。各貫通孔は、アッセイ110の反応位置として機能し得る。いくつかの構成では、反応プレート104は48個のサブアレイを備え、各サブアレイは、各々33nLの反応体積を保持することができる64個の貫通孔を備える。前述の構成では、反応プレート104は、3072個の貫通孔を備える。
【0040】
反応プレート104の構成に応じて、アレイ貫通孔304のいくつかは、それらの中にスポットされたアッセイ110を含むであろう。各貫通孔は、アッセイ110をスポットすることができる親水性内部を備える。親水性の貫通孔は、反応を封じ込める疎水性の表面にも囲まれている。
【0041】
設定された体積を各所望のアレイ貫通孔304に正確にローディングするために、試料ローディング器具102が利用される。試料ローディング器具102は、設定された量の試料混合物106を反応プレート104の各所望の貫通孔にアリコートする。いくつかの構成では、チップブロック310は、試料ローディング器具102によって利用されて、試料混合物を反応プレート104の貫通孔に分配する。
【0042】
試料ローディング器具102が運転されると、チップブロック310は、反応プレート104を横切って移動することができ、設定された量の試料混合物106が特定のアレイ貫通孔304に送達されることを可能にする。試料ローディング器具102がその実行を完了すると、反応プレート104は、ローディングされた反応プレート306に変換され、ここで、複数のサブアレイ、例えば、サブアレイ312は、標的ポリヌクレオチド配列112を含むローディングされた貫通孔302を備える。
【0043】
図4を参照すると、QC画像条件400は、不十分なデータ収集につながる特徴的な欠陥を示す受動参照色素画像を示している。スポットされた試料プレートがrtPCR器具にローディングされると、スポットされたプレートの画像が蛍光灯の下で撮影される。蛍光灯により、受動参照色素が蛍光を発し、試料混合物(すなわち、標的ポリヌクレオチドおよび反応混合物)の存在を示す。受動参照色素画像は、器具に関連付けられたコンピュータシステムによって収集され、かつ保存される。受動参照色素画像は、品質管理プロセスの早い段階で分析して、試料をアレイプレートにスポットすることに関連付けられたエラーがあったかどうかを判断し得る。
【0044】
画像402は、グリッドパターンに配置された明るく照らされたドットを示す正常画像を示している。各ドットは貫通孔を表し、正常画像は、均一な背景で同じ明るさのすべての貫通孔を示している。
【0045】
画像404、画像406、画像408、画像410、および画像412は、アレイプレートのスポッティングに関連付けられた共通の不良状態を表している。画像404は、明るいロックスと呼ばれる不良状態のうちの1つを表している。明るいROXは、他の貫通孔と比較して、いくつかの貫通孔に明るいスポット416が見えることを示している。明るいスポット416は、プレートの不適切なスポッティングを示し得る、より明るい貫通孔における受動参照色素のより高い存在を示し得る。画像406は、ランダムな貫通孔が他の貫通孔よりも暗く見え、アレイプレート全体に分布しているROXスポッティングを表している。場合によっては、より暗い貫通孔は、部分的にローディングされた貫通孔を示している可能性がある。画像408は、いくつかのより暗い見た目の貫通孔がほぼ線形のパターンでアレイプレート上に配置されているROXストリッピングを表す。場合によっては、ROXストリッピングは、プレートがプレートホルダーの右側にあるストップブロックにしっかりと固定されていない、オートローダーの位置がずれている、またはオートローダーの先端に気泡および/または泡が多すぎることを示している可能性がある。画像404、画像406、および画像408では、影響を受ける貫通孔が少なくとも7つある場合、画像は不良と見なされるが、判定が貫通孔の関連する明るさに基づいていることから、いくつかの不良の識別は主観的なものであるため、絶対的なカットオフはない。
【0046】
画像410は、スポットポイントブリッジと呼ばれる不良状態を表している。スポットポイントブリッジ414は、いくつか(2つまたは4つ)の隣接する貫通孔を接続する背景領域に灰色の「ブリッジ」として現れる。スポットポイントブリッジ414は、オートローダーチップブロックの不適切な除去によって引き起こされる可能性があり、これにより、試料混合物のいくつかが貫通孔からこぼれる。画像412は再構築エラーを表しており、少なくとも1つのランダムな空の貫通孔によって特徴付けられている。再構築エラーは、アレイプレートの問題またはオートローダーでのアレイの構成の問題を示している可能性がある。
【0047】
図5は、例示的な畳み込みニューラルネットワーク500を示す。畳み込みニューラルネットワーク500は、畳み込み層504で視覚化されるように、そのニューロンを三次元(幅、高さ、奥行き)に配置する。畳み込みニューラルネットワーク500の各層は、入力の3D体積をニューロン活性化の3D出力体積に変換する。この例では、入力層502は画像をエンコードするので、その幅および高さは画像の寸法になり、奥行きは3(赤、緑、青のチャネル)になる。畳み込み層504は、入力層502の出力をさらに変換し、出力層506は、畳み込み層504の出力を画像コンテンツのうちの1つ以上の分類に変換する。一実施形態では、畳み込みニューラルネットワーク500は、1つの入力層502、6つの隠れ層(1つ以上が畳み込み層504であり得る)、および出力層506を利用し得る。1つ以上の畳み込み層504に加えて、畳み込みニューラルネットワーク500は、プーリング層および完全に接続された層を利用し得る。
【0048】
図6は、例示的な畳み込みニューラルネットワーク層600をより詳細に示している。画像の入力層領域602領域の入力層領域604の例示的なサブ領域は、畳み込み層606内の畳み込み層サブ領域608のセットによって分析される。入力層領域602は、長さおよび幅が32x32ニューロン(例えば、32x32ピクセル)であり、奥行き3ニューロン(例えば、ピクセルあたり3つのカラーチャネル)である。畳み込み層606内の各ニューロンは、空間的に(高さおよび幅において)入力層領域602内の局所領域にのみ接続されているが、全奥行き(すなわち、入力が画像である場合はすべてのカラーチャネル)に接続されている。畳み込み層サブ領域608の各ニューロンが入力層領域604のサブ領域のすべてのニューロンからの入力を受信することができる入力層領域602の入力層領域604のサブ領域を分析する畳み込み層サブ領域608の奥行きに沿って複数のニューロン(この例では5つ)があることに留意されたい。
【0049】
図7を参照すると、ニューラルネットワーク700は、入力層702、第1の畳み込み層704、第1の畳み込み層706、第2の畳み込み層708、第2の畳み込み層710、第1の完全に接続された層712、および第2の完全に接続された層714を備える。
【0050】
入力層702は、54×54アレイであり得る。54x54アレイは、アレイプレートのサブアレイであり得る。例えば、アレイプレートは、サブアレイの4x12アレイとして配置され得る。したがって、各アレイプレートは48個のサブアレイに分割することができ、各サブアレイは、それが正常であるか不良であるかを判定するためにニューラルネットワーク700に送られる。アレイ内の各値は、カラーチャネル、例えばR、G、Bカラーチャネル、または黒/白のカラースケールの表現である場合がある。次に、入力層702は、第1の畳み込み層704に畳み込まれる。第1の畳み込み層704は、各々が54×54である32個のアレイを備える。第1の畳み込み層704は、第1のプーリング層706にプールされる。プーリング機能は、第1の畳み込み層704の3×3領域で動作するマックスプール機能であり得る。次に、第1のプーリング層706は、各々が18×18である32個のアレイを備え得る。次に、第1のプーリング層706は、第2の畳み込み層708に畳み込まれる。第2の畳み込み層708は、各々が18×18である64個のアレイを有し得る。第2の畳み込み層708は、第2のプーリング層710にプールされる。プーリング機能は、第2の畳み込み層708の3×3領域で動作するマックスプール機能であり得る。次に、第2のプーリング層710は、各々が6×6である64個のアレイを備え得る。64個の6×6アレイの各々は、192個のノードを有し得る第1の完全に接続された層712に送られる。次に、第1の完全に接続された層712は、48個のノードを有し得る第2の完全に接続された層714に完全に接続される。次に、出力層716は、2つの状態、正常または不良を有し、第2の完全に接続された層714に完全に接続されている。出力層716はまた、不良のタイプ(クラス)を予測することができる。
【0051】
ニューラルネットワーク700は、製造データサーバから正常および不良のプレートの履歴QC画像を最初に検索することによって訓練し、かつ動作することができる。各画像について、アレイ内の貫通孔(反応ユニット)中心がスポット検出アルゴリズムによって検出され、アレイ画像全体が、識別された貫通孔中心に基づいて48個のサブアレイ画像に分割される。48個のサブアレイ画像が注釈ツールにローディングされ、検査され、正常または、明るいRox、Roxスポッティング、Roxストリッピング、ストップポイントブリッジング、および再構築エラーが含まれる5つの不良モードを有する不良として標識付けされる。前の2つのステップは、注釈付きのトレーニングおよび検証データセットを構築するためにQC画像に対して繰り返される。1つ以上の隠れ層を持つ畳み込みニューラルネットワークが初期化され、トレーニングされるネットワークとして利用される。完全に接続された層は、入力サブアレイ画像の予測を出力するための出力層として利用される。Softmaxクロスエントロピーコスト関数を適用して、予測と注釈付き標識の間の損失を計算する。Adamオプティマイザーまたは他の勾配降下オプティマイザーを使用して、上述のネットワークの重みを更新し、各トレーニングステップでトレーニングデータセットからランダムに選択されたトレーニング試料のミニバッチに対する損失を最小化する。トレーニングプロセスは、予め定められたトレーニングステップ数に達するまで継続され、特定のトレーニングステップごとにトレーニングされたネットワークが保存される。トレーニングプロセス中に保存されたトレーニングされたモデルは、トレーニングプロセスに含まれていない検証データセット内のサブアレイ画像の独立したサブセットによって評価される。次に、評価損失またはエラー率が最小のトレーニングされたモデルが、最良なトレーニングされたモデルとして選択される。トレーニング中に、ドロップアウトまたは重み減衰などの技術を使用して、トレーニングされたモデルの一般性を向上させることができる。
【0052】
動作中、貫通孔の中心が識別された新しいQC画像では、アレイ画像全体が48個のサブアレイ画像に分割される。選択された、トレーニングされたモデルをこれらのサブアレイ画像に適用して、正常または不良を予測する。すべてのサブアレイ画像が良好な場合、アレイQCは正常である可能性であり、それ以外の場合、アレイQCは不良になる。ニューラルネットワーク700はまた、どのサブアレイがどの不良モードによって不良になるかを予測することができる。
【0053】
ノイズ、回転、並進オフセット、明るさもしくはコントラストの変化、または敵対的生成ネット(GAN)によるシミュレートされたサブアレイ画像の追加などのさらなるデータ拡張技術を利用して、トレーニングされたモデルの堅牢性を向上させることができる。
【0054】
転移学習は、複数のデータソースを活用してデータ不足の問題を克服する手法である。転移学習を使用することにより、同様の問題について既にトレーニングされたネットワークが修正され、次いで標識付けされたデータの一部で再トレーニングされる。ここで、ニューラルネットワーク700は、ImageNetデータなどの他の画像データセットから学習されたモデルを使用し、最終分類層を新しい完全に接続された層に置き換えて、アレイベースのPCRデータの正常モードおよび不良モードを予測することができる。
【0055】
図8を参照すると、PCR品質管理システム800は、PCRシステム802、CNN804、およびコンピュータシステム806を備える。PCRシステム802は、QC画像を生成し、それらをCNN804に送信する。CNN804は、上述のニューラルネットワーク700の実施形態であり得る。CNN804は、QC画像が正常であるか不良であるかを判定する。結果は、コンピュータシステム806に送信される。結果には、QC画像が正常であるか不良であるか、どのサブアレイが不良であるか、どの不良モードによって不良であるかが含まれる場合がある。コンピュータシステム806は、結果をユーザに表示し、結果を保存し、結果の加算変換を実施し、PCRシステム802を制御するか、または反応プレートアレイの製造を向上させるためのプロセスパラメータを設定することができる。コンピュータシステム806はまた、結果に基づいて、例えば、不良結果を提供するPCRシステム802の動作を停止するか、または不良の場合にPCRシステム802を修正するなどして、PCRシステム802を変更することができる。PCRシステム802は、それぞれ異なる時間に一連のQC画像を生成することができる。これらのQC画像は、CNN804に直列に送信できる。各画像について、CNN804は、結果をコンピュータシステム806に提供する。
【0056】
図9を参照すると、PCR品質管理システム900は、PCRシステム802、コンピュータシステム806、CNN902、およびCNN904を備える。PCR品質管理システム900は、PCR品質管理システム800と同様に動作し得る。しかしながら、PCR品質管理システム900は、複数のCNN(CNN902、CNN904など)を初期化することができる。次に、各CNNはサブアレイのうちの1つで利用される。いくつかのQC画像は48個のサブアレイを備え、48個のCNNを動作させてもよい。次に、コンピュータシステム806は、CNNの各々からの結果を組み合わせることができる。結果には、1つのサブアレイが不良状態を有するかどうか、どのサブアレイが不良であるか、どの条件によって各サブアレイが不良であるかが含まれる場合がある。
【0057】
図10を参照すると、検証結果1000が示されている。行は注釈付きの分類を表し、列は選択されたネットワークからの予測を表す。左上のボックスは、注釈付き標識が正常であり、予測された分類が正常であるときである。所与の試験に対して、1166個のこのような結果があった。右上のボックスは、注釈付き標識が正常であり、予測された分類が不良である場合である。所与の試験に対して、73個のこのような結果があった。左下のボックスは、注釈付き標識が不良であり、予測された分類が正常である場合である。所与の試験に対して、70個のこのような結果があった。右下のボックスは、注釈付き標識が不良であり、予測される分類が不良である場合である。所与の試験に対して、1196個のこのような結果があった。結果として得られる感度(真陽性/注釈付き陽性)は94.1%である。結果として得られる特異性(真陰性/注釈付き陰性)は94.5%である。結果として得られる精度((真陽性+真陰性)/総母集団)は94.3%である。
【0058】
図11を参照すると、検証結果1100が示されている。検証結果1100は、注釈付き分類を予測された分類と比較する。分類には、正常モード、ならびに明るいROX、ROXスポッティング、ROXストリッピング、ストップポイントブリッジング、および再構築の5つの不良モードが含まれる。
【0059】
図12を参照すると、PCR品質管理システム1200は、PCRシステム802、コンピュータシステム806、完全に接続されたネットワーク1202、およびCNN1204を備える。PCRシステム802は、QC画像を生成し、それらを完全に接続されたネットワーク1202に送信する。完全に接続されたネットワーク1202は、1つ以上の隠れ層を備えた完全に接続された層を備え得る。オートエンコーダなどの教師なし学習をQC画像に適用して、単純または複雑な機能を学習してもよく、それを次いでCNN1204またはその他の完全に接続されたネットワークの入力として使用して、QC画像を正常モードおよび異なる不良モードに分類してもよい。CNN1204は、上述のニューラルネットワーク700の実施形態であり得る。CNN1204は、QC画像が正常であるか不良であるかを判定する。結果は、コンピュータシステム806に送信される。結果には、QC画像が正常であるか不良であるか、どのサブアレイが不良であるか、どの不良モードによって不良であるかが含まれる場合がある。コンピュータシステム806は、結果をユーザに表示し、結果を保存し、結果の加算変換を実施し、反応プレートアレイの将来の製造パラメータを調整し、かつPCRシステム802を制御することができる。コンピュータシステム806はまた、結果に基づいて、例えば、不良結果を提供するPCRシステム802の動作を停止するか、または不良の場合にPCRシステム802を修正するなどして、PCRシステム802を変更することができる。PCRシステム802は、各々異なる時間に一連のQC画像を生成することができる。これらのQC画像は、CNN1204に直列に送信できる。各画像について、CNN1204は、結果をコンピュータシステム806に提供する。PCR品質管理システム1200はまた、図9に示されるものと同様に、複数のCNN1204を利用することができ、各CNN1204は、サブアレイを受信する。さらに、複数の完全に接続されたネットワーク1202を初期化することができ、各々がサブアレイを受信する。各サブアレイの完全に接続されたネットワーク1202の出力は、CNN1204に送信され得る。
【0060】
図13は、リカレントニューラルネットワーク1300(RNN)を示している。変数x[t]はステージtでの入力である。例えば、x[1]は、配列内の特定の要素を選択するワンホットベクトルである可能性がある。変数s[t]は、ステージtでの非表示状態である。それはネットワークの「メモリ」である。変数s[t]は、前の非表示状態および現在のステージでの入力に基づいて計算される:s[t]=f(Ux[t]+Ws[t-1])。活性化関数fは通常、tanhまたはReLUなどの非線形性である。第1の非表示状態を計算するために必要な入力s(-1)は、典型的に、すべてゼロに初期化される。変数o[t]は、ステージtでの出力である。例えば、予測は語彙全体の確率のベクトルである可能性がある:o[t]=softmax(Vs[t])。リカレントニューラルネットワーク1300を使用して、PCR反応の過程にわたるQC画像の進化を調べることができる。1つまたは複数のCNNがリカレントニューラルネットワーク1300(またはCNNごとに1つなどの複数のRNN)に入力することができ、リカレントニューラルネットワーク1300は、CNN画像分類が時間の経過によってどのように進化するかに基づいて分類予測を出力する。CNNは、CNNが正常/不良を予測しないが、リカレントニューラルネットワーク1300への入力として分類特徴のセットを送信するように、修正された出力層を有することができる。特徴は、例えば、第2の完全に接続された層の結果であり得る。複数のRNNが使用されている場合(例えば、CNNごとに1つ)、分析システムは多層パーセプトロン(汎用ANN)を利用して、RNN予測を組み合わせて不良モードの最終予測を行うことができる。
【0061】
図14を参照すると、PCR品質管理システム1400は、PCRシステム802、コンピュータシステム806、CNN902、およびRNN1402を備える。PCRシステム802は、一連のQC画像をCNN902に送信する。このシリーズは、反応プレートの定期的なサンプリングに基づいている。次に、各画像には、分類または特徴を判定するためにCNN902が適用される(例えば、完全に接続された最終的な出力層は適用されない)。次に、これはRNN1402に送信される。RNN1402は、一連の分類または特徴を受信する。次に、RNN1402は、PCRシステム802が不良である、またはRNN1402によって判定されたQC画像の変化のためにPCRシステム802が不良である可能性があるなどの出力を判定する。RNN1402はまた、不良モードを判定し得る。コンピュータシステム806は、結果をユーザに表示し、結果を保存し、結果の加算変換を実施し、かつPCRシステム802を制御することができる。コンピュータシステム806はまた、結果に基づいて、例えば、不良結果を提供するPCRシステム802の動作を停止するか、または不良の場合にPCRシステム802を修正するなどして、PCRシステム802を変更することができる。
【0062】
図15を参照すると、PCR品質管理システム1500は、PCRシステム802、コンピュータシステム806、CNN902、CNN904、およびRNN1502を備える。PCRシステム802は、一連のQC画像をCNN902およびCNN904に送信する。CNN902、CNN904、および他のCNNは、QC画像のサブアレイを直列に受信することができる。このシリーズは、反応プレートの定期的なサンプリングに基づいている。次に、各画像には、サブアレイの分類または特徴を判定するためにCNNが適用される(例えば、完全に接続された最終的な出力層は適用されない)。次に、これはRNN1502に送信される。RNN1502は、サブアレイごとに1つずつ、並列の複数のRNNとすることもできる。RNN1502は、一連の分類または特徴を受信する。次に、RNN1502は、PCRシステム802が不良である、またはRNN1502によって判定されたQC画像の変化のためにPCRシステム802が不良である可能性があるなどの出力を判定する。RNN1502はまた、不良モードを判定し得る。コンピュータシステム806は、結果をユーザに表示し、結果を保存し、結果の加算変換を実施し、かつPCRシステム802を制御することができる。コンピュータシステム806はまた、結果に基づいて、例えば、不良結果を提供するPCRシステム802の動作を停止するか、または不良の場合にPCRシステム802を修正するなどして、PCRシステム802を変更することができる。
【0063】
図16は、一実施形態によるクラウド学習および制御システム1600を示す。クラウド学習および制御システム1600は、学習システム1612、例えば、本明細書に開示される実施形態のうちの1つ以上を含むクラウド分析システム1610を備える。いくつかのPCR実行または他の実験(例えば、PCRラボ器具1604、PCRラボ器具1606、およびPCRラボ器具1608)からの実験データは、クラウド分析システム1610によってインターネット1602または他のネットワークを介して監視される。クラウド分析システム1610は、実験データを処理し、学習された構成パラメータをフィードバックとして提供して、現在または将来の実験のために構成設定PCR器具を調整する。
【0064】
図17は、本発明の実施形態を組み込むことができるコンピューティングデバイス1700の例示的なブロック図である。図17は、本明細書に記載の技術的プロセスの態様を実行するための機械システムの単なる例示であり、特許請求の範囲を限定するものではない。当業者は、他の変形例、修正例、および代替例を認識するであろう。一実施形態では、コンピューティングデバイス1700は、典型的には、モニタまたはグラフィカルユーザインターフェース1702、データ処理システム1720、通信ネットワークインターフェース1712、入力デバイス(複数可)1708、出力デバイス(複数可)1706などを含む。
【0065】
図17に示されるように、データ処理システム1720は、バスサブシステム1718を介していくつかの周辺デバイスと通信する1つ以上のプロセッサ(複数可)1704を含み得る。これらの周辺デバイスは、入力デバイス(複数可)1708、出力デバイス(複数可)1706、通信ネットワークインターフェース1712、ならびに揮発性メモリ1710および不揮発性メモリ1714などの記憶サブシステムを含み得る。
【0066】
揮発性メモリ1710および/または不揮発性メモリ1714は、コンピュータ実行可能命令を保存することができ、したがって、プロセッサ(複数可)1704に適用され、かつ実行されると、本明細書に開示されるプロセスおよびニューラルネットワークの実施形態を実装するロジック1722を形成する。
【0067】
入力デバイス(複数可)1708は、データ処理システム1720に情報を入力するためのデバイスおよび機構を含む。これらは、キーボード、キーパッド、モニタまたはグラフィカルユーザインターフェース1702に組み込まれたタッチスクリーン、音声認識システム、マイクロフォンなどの音声入力デバイス、および他のタイプの入力デバイスを含み得る。様々な実施形態では、入力デバイス(複数可)1708は、コンピュータマウス、トラックボール、トラックパッド、ジョイスティック、ワイヤレスリモート、描画タブレット、音声コマンドシステム、視線追跡システムなどとして具体化することができる。入力デバイス(複数可)1708は、典型的には、ユーザが、ボタンのクリックなどのコマンドを介して、モニタまたはグラフィカルユーザインターフェース1702に表示されるオブジェクト、アイコン、制御領域、テキストなどを選択することを可能にする。
【0068】
出力デバイス(複数可)1706は、データ処理システム1720から情報を出力するためのデバイスおよび機構を含む。これらは、当技術分野でよく理解されているように、モニタまたはグラフィカルユーザインターフェース1702、スピーカ、プリンタ、赤外線LEDなどを含み得る。
【0069】
通信ネットワークインターフェース1712は、通信ネットワーク(例えば、通信ネットワーク1716)およびデータ処理システム1720外部デバイスにインターフェースを提供する。通信ネットワークインターフェース1712は、他のシステムからデータを受信し、他のシステムにデータを送信するためのインターフェースとして機能し得る。通信ネットワークインターフェース1712の実施形態は、Ethernetインターフェース、モデム(電話、衛星、ケーブル、ISDN)、(非同期)デジタル加入者線(DSL、Digital subscriber line)、FireWire、USB、BluetoothまたはWi-Fiなどの無線通信インターフェース、近距離通信無線インターフェース、セルラーインターフェースなどを含み得る。
【0070】
通信ネットワークインターフェース1712は、アンテナ、ケーブルなどを介して通信ネットワーク1716に結合され得る。いくつかの実施形態では、通信ネットワークインターフェース1712は、データ処理システム1720の回路基板上に物理的に統合され得るか、または場合によっては、「ソフトモデム(soft modem)」などのソフトウェアまたはファームウェアにおいて実装され得る。
【0071】
コンピューティングデバイス1700は、HTTP、TCP/IP、RTP/RTSP、IPX、UDPなどのプロトコルを使用してネットワークを介した通信を可能にするロジックを含み得る。
【0072】
揮発性メモリ1710および不揮発性メモリ1714は、本明細書に記載のプロセスの様々な実施形態を実装するためのコンピュータ可読データおよび命令を保存するように構成された有形媒体の例である。他のタイプの有形メディアには、取り外し可能なメモリ(プラグイン可能なUSBメモリデバイス、モバイルデバイスSIMカードなど)、CD-ROM、DVDなどの光ストレージメディア、フラッシュメモリなどの半導体メモリ、非一時的な読み取り専用メモリ(ROM)、バッテリバックアップされた揮発性メモリ、ネットワーク化されたストレージデバイスなどが含まれる。揮発性メモリ1710および不揮発性メモリ1714は、本発明の範囲に該当する開示されたプロセスおよび他の実施形態の機能を提供する基本的なプログラミングおよびデータ構築を保存するように構成され得る。
【0073】
本発明の実施形態を実装するロジック1722は、揮発性メモリ1710および/または不揮発性メモリ1714によって具現化され得る。上述のロジック1722の命令は、揮発性メモリ1710および/または不揮発性メモリ1714から読み取られ、プロセッサ1704によって実行され得る。揮発性メモリ1710および不揮発性メモリ1714はまた、ロジック1722によって使用されるデータを保存するためのリポジトリを提供し得る。
【0074】
揮発性メモリ1710および不揮発性メモリ1714は、プログラム実行中に命令およびデータを保存するためのメインランダムアクセスメモリ(RAM)および読み取り専用の非一時的な命令が保存される読み取り専用メモリ(ROM)を含むいくつかのメモリを含み得る。揮発性メモリ1710および不揮発性メモリ1714は、プログラムおよびデータファイルのための永続的(不揮発性)ストレージを提供するファイルストレージサブシステムを含み得る。揮発性メモリ1710および不揮発性メモリ1714は、取り外し可能なフラッシュメモリなどの取り外し可能なストレージシステムを含み得る。
【0075】
バスサブシステム1718は、データ処理システム1720の様々な構成要素およびサブシステムが意図されたように互いに通信することを可能にするための機構を提供する。通信ネットワークインターフェース1712は、単一のバスとして概略的に示されているが、バスサブシステム1718のいくつかの実施形態は、複数の別個のバスを利用することができる。
【0076】
コンピューティングデバイス1700が、スマートフォン、デスクトップコンピュータ、ラップトップコンピュータ、ラックマウント型コンピュータシステム、コンピュータサーバ、またはタブレットコンピュータデバイスなどのデバイスであり得ることは、当業者には容易に明らかであろう。当技術分野で一般に知られているように、コンピューティングデバイス1700は、複数のネットワーク化されたコンピューティングデバイスの集合として実装され得る。さらに、コンピューティングデバイス1700は、典型的には、そのタイプおよび性質が当技術分野で周知であるオペレーティングシステムロジック(図示せず)を含むであろう。
【0077】
追加の用語と解釈
本明細書で使用される用語は、関連技術におけるそれらの通常の意味、または文脈におけるそれらの使用によって示される意味を与えられるべきであるが、明示的な定義が提供される場合、その意味が支配する。
【0078】
「サポートベクターマシン」とは、分類および回帰分析に使用されるデータを分析する、関連する学習アルゴリズムを備えた教師あり学習モデルを指す。各々が2つのカテゴリの一方または他方に属するとマークされたトレーニング例のセットを考慮すると、SVMトレーニングアルゴリズムは、新しい例を一方のカテゴリまたは他方に割り当てるモデルを構築し、非確率的バイナリ線形分類器にする。SVMモデルは、空間内のポイントとしての例の表現であり、個別のカテゴリの例が可能な限り広い明確なギャップによって分割されるようにマッピングされる。次に、新しい例が同じ空間にマッピングされ、ギャップのどちら側にあるかに基づいてカテゴリに属すると予測される。SVMは、線形分類の実施に加えて、いわゆるカーネルトリックを使用して非線形分類を効率的に実施し、入力を高次元の特徴空間に暗黙的にマッピングできる。
【0079】
「カーネル」とは、高次元の暗黙的な特徴空間で、その空間のデータの座標を計算することなく、特徴空間内のすべてのデータ対の投影間の内積を計算するだけで動作するカーネル関数を指す。この動作は、多くの場合、座標の明示的な計算よりも計算コストが低くなる。SVMで使用する場合、このアプローチは「カーネルトリック」と呼ばれる。
【0080】
「ReLU」は、int入力の正の部分として定義された活性化関数である整流関数を指す。これはランプ関数とも呼ばれ、電気信号理論の半波整流に類似している。ReLuは、深層ニューラルネットワークにおける一般的な活性化関数である。
【0081】
「損失関数」は、コスト関数またはエラー関数(ガウスエラー関数と混同しない)とも呼ばれ、1つ以上の変数の値をそれらの値に関連付けられたいくつかの「コスト」を直感的に表す実数にマッピングする関数である。
【0082】
「双曲線正接関数」とは、tanh(x)=sinh(x)/cosh(x)の形式の関数を指す。tanh関数は、人工ニューラルネットワークにおける一般的な活性化関数である。シグモイドと同様に、tanh関数もシグモイド(「s」字型)であるが、代わりに(-1,1)の範囲の値を出力する。したがって、tanhへの強い負の入力は負の出力にマッピングされる。追加的に、ゼロ値の入力のみがゼロに近い出力にマッピングされる。これらの特性により、トレーニング中にネットワークが「スタック」する可能性が低くなる。
【0083】
「シグモイド関数」とは、f(x)=1/(exp(-x))の形式の関数を指す。シグモイド関数は、人工ニューラルネットワークにおける活性化関数として使用される。広範囲の入力値を0-1、場合によっては-1から1の範囲にマッピングする特性がある。
【0084】
「バックプロパゲーション」とは、人工ニューラルネットワークで使用されるアルゴリズムを指し、ネットワークで使用される重みの計算に必要な勾配を計算する。これは一般に、1つ以上の隠れ層を持つニューラルネットワークを指す用語である深層ニューラルネットワークをトレーニングするために使用される。バックプロパゲーションの場合、損失関数は、ケースがネットワークを介して伝播した後、ネットワーク出力とその期待される出力との間の差を計算する。
【0085】
「Softmax関数」とは、f(xi)=exp(xi)/sum(exp(x))の形式の関数を指し、合計はxのセットに対して取得される。Softmaxは、人工ニューラルネットワークの異なる層(多くの場合、出力層)で使用され、それらの層への入力の分類を予測する。Softmax関数は、「n」個の異なるイベントにわたるイベントxiの確率分布を計算する。一般的な意味で、この関数は、考えられるすべての標的クラスに対する各標的クラスの確率を計算する。計算された確率は、標的クラスが入力で表されていることを予測するのに役立つ。Softmaxを使用する主な利点は、出力確率の範囲である。範囲は0から1になり、すべての確率の合計は1に等しくなる。複数分類モデルに使用されるSoftmax関数の場合、各クラスの確率が返され、標的クラスの確率が高くなる。この式は、指定された入力値の指数(e-power)、および入力内のすべての値の指数値の合計を計算する。次に、入力値の指数関数と指数値の合計の比率がSoftmax関数の出力になる。
【0086】
「CTC損失関数」とは、タイミングが可変である配列の問題に取り組むためにLSTMネットワークなどのリカレントニューラルネットワーク(RNN)をトレーニングするための、接続主義時間分類、ニューラルネットワーク出力のタイプおよび関連付けられたスコアリング関数を指す。CTCネットワークには連続出力(例えば、Softmax)があり、標識の確率をモデル化するためのトレーニングを通じて適合される。CTCは、境界およびタイミングの学習を試みない。標識配列は、空白を無視して、配置のみが異なる場合、同等であると見なされる。同等の標識配列は様々な方法で発生する可能性がある。これにより、スコアリングは重要なタスクになる。幸いなことに、そのための効率的な順方向および逆方向アルゴリズムがある。次に、CTCスコアをバックプロパゲーションアルゴリズムとともに使用して、ニューラルネットワークの重みを更新できる。CTCに適合したニューラルネットワークへの代替アプローチには、隠れマルコフモデル(HMM)が含まれる。
【0087】
「ゲート付き回帰ユニット(GRU)」とは、リカレントニューラルネットワークのゲート機構を指す。GRUは、LSTMよりも小さいデータセットで優れたパフォーマンスを示す場合がある。出力ゲートがないため、LSTMよりもパラメータが少なくなる。
【0088】
「ビーム検索」とは、限られたセットの中で最も有望なノードを展開することによってグラフを探索するヒューリスティック検索アルゴリズムを指す。ビーム検索は、メモリ要件を削減する最良優先探索の最適化である。最良優先探索は、ヒューリスティックに従ってすべての部分解(状態)を順序付けるグラフ検索である。ただし、ビーム検索では、事前に決定された数の最良の部分解のみが候補として保持される。したがって、これは欲張り法である。ビーム検索では、幅優先探索を使用して検索ツリーを構築する。ツリーの各レベルで、現在のレベルの状態のすべての後続を生成し、ヒューリスティックコストの昇順で並べ替える。ただし、各レベル(ビーム幅と呼ばれる)で最良な状態の事前に決定された数βのみが保存される。次に、それらの状態のみが展開される。ビーム幅が大きいほど、プルーニングされる状態は少なくなる。ビーム幅が無限大の場合、状態はプルーニングされず、ビーム検索は幅優先探索と同じである。ビーム幅は、検索の実施に必要なメモリを制限する。ゴール状態は潜在的にプルーニングされる可能性があるため、ビーム検索は完全性(解が存在する場合、アルゴリズムが解をもって終了するという保証)を犠牲にする。ビーム検索は最適ではない(すなわち、最良な解が見出される保証はない)。一般に、ビーム検索は最初に見出された解を返す。機械翻訳のビーム検索は異なるケースである。構成された最大検索深度(つまり、翻訳長)に達すると、アルゴリズムは様々な深度で検索中に見出された解を評価し、最良のもの(最も確率が高いもの)を返す。ビーム幅は固定または可変のいずれかである。可変ビーム幅を使用する1つのアプローチは、最小の幅から始まる。解が見出されない場合は、ビームが広げられ、手順が繰り返される。
【0089】
「Adamオプティマイザー」とは、古典的な確率的勾配降下法の代わりに使用できる最適化アルゴリズムを指し、トレーニングデータに基づいてネットワークの重みを反復的に更新する。確率的勾配降下法は、すべての重みの更新に対して単一の学習率(アルファと呼ばれる)を維持し、学習率はトレーニング中に変化しない。学習率は、ネットワークの重み(パラメータ)ごとに維持され、学習が進むにつれて個別に適応される。Adamは、確率的勾配降下法の他の2つの拡張の利点を組み合わせている。具体的には、スパース勾配の問題(例えば、自然言語およびコンピュータビジョンの問題)のパフォーマンスを向上させるパラメータごとの学習率を維持する適応勾配アルゴリズム(AdaGrad)、および、重みの勾配の最近の大きさの平均(例えば、それがどれだけ速く変化しているか)に基づいて適応されるパラメータごとの学習率を維持する二乗平均平根伝搬(RMSProp)である。これは、アルゴリズムがオンラインおよび非定常の問題(例えば、ノイズ問題)でうまく機能することを意味する。Adamは、AdaGradとRMSPropの両方の利点を認識している。Adamは、RMSPropのように平均一次モーメント(平均)に基づいてパラメータ学習率を適応させる代わりに、勾配の二次モーメントの平均(中心のない分散)も利用する。具体的には、アルゴリズムは勾配と二乗勾配の指数移動平均を計算し、パラメータベータ1およびベータ2はこれらの移動平均の減衰率を制御する。移動平均の初期値と、1.0に近いベータ1およびベータ2の値(推奨)により、モーメント推定値がゼロに向かってバイアスされる。このバイアスは、最初にバイアスされた推定値を計算してから、バイアス補正された推定値を計算することによって克服される。
【0090】
「アッセイ」は、PCR反応混合物において、2つの標的特異的プライマーまたは2つのプライマー、および標的を増幅するために使用されるプローブを指す。
【0091】
「順方向プライマー」は、アンプリコンの5’末端に隣接するオリゴヌクレオチドを指す。逆方向プライマーおよび順方向プライマーは、標的を増幅するためのPCR反応において一緒に使用される。
【0092】
「希釈剤」とは、試料または標準をPCR反応に加える前に希釈するために使用される試薬を指す。
【0093】
「データ収集」とは、器具の実行中に、器具が反応プレートの各ウェルからの蛍光データを検出するプロセスを指す。器具は信号を電子データに変換し、実験ファイルにデータを保存する。
【0094】
「ROX色素」とは、反応中に蛍光が変化しない不活性色素を指し、ピペッティングエラーまたは器具の制限などのアーティファクトが原因で発生する可能性のあるウェル間の差異を正規化するために、定量的リアルタイムPCR反応に追加できる。ROX受動参照色素は、10mM Tris-HCl(pH8.6)、0.1mM EDTA、および0.01%TweenTM-20中の5-カルボキシ-X-ローダミンの25μM溶液で構成されている。多くの器具では最終濃度500nMの色素を使用する必要があるが、フィルターセットが最適化された新しい器具では50nMで使用する必要がある。
【0095】
「参照色素」とは、ROX色素を参照することを指す。
【0096】
「受動参照」とは、PCR増幅とは無関係に蛍光信号を生成し、各反応に一定濃度で添加される色素を指す。受動参照信号はすべてのウェルで一貫している必要があるため、レポーター色素信号を正規化して、ウェル間のわずかな体積の違いによって引き起こされるPCRに関連しない蛍光変動を考慮するために使用される。受動参照信号への正規化は概して、技術的な複製の中で著しく高い精度のデータをもたらする。
【0097】
「レポーター」とは、増幅を検出するために使用される蛍光色素を指す。TaqMan(登録商標)試薬では、レポーター色素が5’末端に結合する。
【0098】
「逆方向プライマー」は、アンプリコンの3’末端に隣接するオリゴヌクレオチドを指す。逆方向プライマーおよび順方向プライマーは、標的を増幅するためのPCR反応において一緒に使用される。
【0099】
本明細書の「回路」は、少なくとも1つの個別の電気回路を有する電気回路、少なくとも1つの集積回路を有する電気回路、少なくとも1つの用途固有の集積回路を有する電気回路、コンピュータプログラムによって構成された汎用コンピューティングデバイスを形成する回路(例えば、本明細書に記載のプロセスまたはデバイスを少なくとも部分的に実行するコンピュータプログラムによって構成された汎用コンピュータ、または本明細書に記載のプロセスまたはデバイスを少なくとも部分的に実行するコンピュータプログラムによって構成されたマイクロプロセッサ)、メモリデバイスを形成する回路(例えば、ランダムアクセスメモリの形式)、または通信デバイス(例えば、モデム、通信スイッチ、または光電気機器)を形成する回路を指す。
【0100】
本明細書における「ファームウェア」は、読み取り専用メモリまたはメディアに保存されたプロセッサ実行可能命令として具体化されたソフトウェアロジックを指す。
【0101】
本明細書における「ハードウェア」は、アナログまたはデジタル回路として具体化された論理を指す。
【0102】
本明細書における「ロジック」は、制御および/または手順信号、および/または設定および値(例えば、抵抗、インピーダンス、静電容量、インダクタンス、電流/電圧定格など)を備える、その材料および/または材料エネルギー構成経由の、デバイスの動作に影響を与えるように、適用され得る、機械メモリ回路、非一時的機械可読媒体、および/または回路を指す。磁気媒体、電子回路、電気および光メモリ(揮発性および不揮発性の両方)、ならびにファームウェアは、ロジックの例である。ロジックは、純粋な信号またはソフトウェア自体を明確に除外するが、ソフトウェアを含み、それによって問題の構成を形成する、マシンメモリを除外しない。
【0103】
本明細書における「ソフトウェア」は、マシンメモリ(例えば、揮発性または不揮発性メモリまたはメディアの読み取り/書き込み)においてプロセッサ実行可能命令として実装されるロジックを指す。
【0104】
本明細書において、「一実施形態」または「実施形態」への言及は、必ずしも同じ実施形態を指すとは限らない。文脈が明確に別段の定めをしない限り、説明および特許請求の範囲全体を通して、「含む(comprise)」、「含む(comprising)」などの単語は、排他的または網羅的な意味ではなく、包括的な意味(つまり、「含むがこれに限定されない」という意味)で解釈されるべきである。単数形または複数形を使用する単語は、明示的に単一または複数形に限定されない限り、それぞれ複数形または単数形も含む。追加的に、「本明細書において」、「上述の」、「以下に」という語および同様の意味の語は、この出願で使用される場合、本出願の特定の部分ではなく、本出願全体を指す。クレームが2つ以上の項目のリストを参照して「または」という単語を使用する場合、明示的にどちらかに限定されない限り、その単語は、語の以下の解釈:リスト内の任意の項目、リスト内のすべての項目、およびリスト内の項目の任意の組み合わせのすべてを網羅する。本明細書で明示的に定義されていない用語は、関連技術(複数可)の技術を有する者によって一般的に理解されるような従来の意味を有する。
【0105】
本明細書で説明される様々なロジック機能動作は、当該動作または機能を反映する名詞または名詞句を使用して参照されるロジックで実装され得る。例えば、アソシエーション動作は、「アソシエータ」または「コレレータ」によって実行され得る。同様に、切り替えは、「スイッチ」による選択、「セレクタ」による選択などによって実行され得る。
【0106】
前述の開示は、例示的な態様および/または実施形態を論じているが、添付の特許請求の範囲によって定義される記載された態様および/または実施形態の範囲から逸脱することなく、本明細書において様々な変更および修正を行うことができることに留意されたい。さらに、記載された態様および/または実施形態の要素は、単数形で説明または請求され得るが、単数形への限定が明示的に述べられていない限り、複数形が企図される。追加的に、任意の態様および/または実施形態のすべてまたは一部は、別段の記載がない限り、他の任意の態様および/または実施形態のすべてまたは一部とともに利用することができる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17