(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-05
(45)【発行日】2023-07-13
(54)【発明の名称】ジェノタイピングPCRアッセイのための機械学習システム
(51)【国際特許分類】
G16B 25/00 20190101AFI20230706BHJP
G16B 40/10 20190101ALI20230706BHJP
G06N 20/00 20190101ALI20230706BHJP
G06N 20/10 20190101ALI20230706BHJP
C12Q 1/686 20180101ALN20230706BHJP
【FI】
G16B25/00
G16B40/10
G06N20/00 160
G06N20/10
C12Q1/686 Z
(21)【出願番号】P 2021511645
(86)(22)【出願日】2019-08-28
(86)【国際出願番号】 US2019048551
(87)【国際公開番号】W WO2020047081
(87)【国際公開日】2020-03-05
【審査請求日】2021-03-10
(32)【優先日】2018-08-30
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】502221282
【氏名又は名称】ライフ テクノロジーズ コーポレーション
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【氏名又は名称】松下 満
(74)【代理人】
【識別番号】100098475
【氏名又は名称】倉澤 伊知郎
(74)【代理人】
【識別番号】100130937
【氏名又は名称】山本 泰史
(74)【代理人】
【識別番号】100144451
【氏名又は名称】鈴木 博子
(74)【代理人】
【識別番号】100123630
【氏名又は名称】渡邊 誠
(72)【発明者】
【氏名】ワン タチン
(72)【発明者】
【氏名】ブルゾスカ ピウス
(72)【発明者】
【氏名】シェルトン エリオット
【審査官】藤澤 美穂
(56)【参考文献】
【文献】特表2012-523645(JP,A)
【文献】国際公開第2013/138727(WO,A1)
【文献】国際公開第2018/119443(WO,A1)
【文献】特開2008-278783(JP,A)
【文献】特表2008-526249(JP,A)
【文献】ATHAMANOLAP, P. et al.,Trainable High Resolution Melt Curve Machine Learning Classifier for Large-Scale Reliable Genotyping of Sequence Variants,PLoS One,2014年10月02日,p.1-10,URL : https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0109094,DOI : 10.1371/journal.pone.0109094
(58)【調査した分野】(Int.Cl.,DB名)
G16B 5/00-99/00
G06N 20/00
G06N 20/10
C12Q 1/686
(57)【特許請求の範囲】
【請求項1】
品質管理システムであって、
アッセイを含むqPCRシステムと、
前記アッセイに対する前記qPCRシステムの動作から生じる生画像データの第1の信号を受信するように前記qPCRシステムに結合された記憶システムと、
コンピューティングシステムであって、
前記第1の信号を受信し、
前記記憶システムから標識データセットである生画像データの第2の信号を受信し、
サポートベクターマシン(SVM)を動作させて、前記第2の信号に基づいて前記第1の信号の遺伝子型の分類を生成して、前記分類に基づいて前記qPCRシステムを調整する電子回路を含む、コンピューティングシステムと、を備え
、
前記SVMは、放射基底関数カーネルを含み、
前記放射基底関数カーネルは、
【数1】
を含む、品質管理システム。
【請求項2】
前記SVMは、以下のソフトマージンパラメータ
【数2】
をさらに含む、請求項
1に記載の品質管理システム。
【請求項3】
前記記憶システムおよびSVMは、クラウドサーバシステムによって提供される、請求項1に記載の品質管理システム。
【請求項4】
前記SVMは、前記アッセイのモデルを生成するように構成されている、請求項1に記載の品質管理システム。
【請求項5】
前記モデルは、SVM線形、多項式、および放射型分類器カーネルのうちの1つを含む、請求項
4に記載の品質管理システム。
【請求項6】
品質管理方法であって、
アッセイに対してqPCRシステムを動作させて、生画像データの第1の信号を生成することと、
標識データセットを含む生画像データの第2の信号を記憶システムから受信することと、
サポートベクターマシン(SVM)を動作させて、前記第2の信号に基づいて前記第1の信号の遺伝子型の分類を生成すること、を含み、前記SVMは、
【数3】
を含むカーネルと、
【数4】
を含むソフトマージンパラメータと、を有し、
さらに、前記分類を適用して
、前記qPCRシステムを動作させるプロセ
スを調整すること、を含む、品質管理方法。
【請求項7】
前記記憶システムおよびSVMは、クラウドサーバシステムによって提供される、請求項
6に記載の品質管理
方法。
【発明の詳細な説明】
【背景技術】
【0001】
いくつかの従来のPCRアッセイジェノタイピング方法論(例えば、Taqman(登録商標))は、教師なし重心最小クラスタ分離シグマ(MCSS)アルゴリズムに基づく。MCSSカットオフ(例えば5.0)が、品質管理(QC)の間にアッセイを不合格または合格としてタグ付けするために経験的に選択される。しかしながら、厳しいカットオフは、アッセイが微妙な差異で分類されないことを意味する。例えば、カットオフが5.0である場合、MCSS=5.0は、QC合格分類となり、MCSS=4.9は、QC不合格分類となる。これにより、許容可能であり得る多くの製品がQC不合格となり、したがって、製造ロスが増加する。
【発明の概要】
【0002】
アッセイアレイのための新規の分類方法論が、サポートベクターマシン分類および学習に基づいて開示されており、細胞系と生物学的サンプルとをジェノタイピングするために実装され得る。新規の方法論は、遺伝子型を分類し、qPCR反応およびサンプルを遺伝子型分類を用いてタグ付けするためのモデルトレーニングを通じて、過去のジェノタイピング結果を考慮に入れることにより、以前のQC法の問題のある曖昧さを改善する。
【図面の簡単な説明】
【0003】
任意の特定の要素または行為の考察を容易に識別するために、参照番号における最上位桁(複数可)は、その要素が最初に導入された、図の番号を指す。
【0004】
【
図1】1つの実施形態によるプロセス100を示す。
【
図2】1つの実施形態によるqPCRシステム200を示す。
【
図3】1つの実施形態によるプレート調製300を示す。
【
図4】1つの実施形態によるジェノタイピングシステム400を示す。
【
図5】1つの実施形態による放射型アルゴリズム500を示す。
【
図6】1つの実施形態によるSVM qPCRアッセイモデル600を示す。
【
図7】1つの実施形態によるクラウド学習および管理システム700を示す。
【
図8】本発明の実施形態を組み込み得るコンピューティングデバイス800の例示的なブロック図である。
【発明を実施するための形態】
【0005】
図1は、PCR増幅に利用される1つの実施形態によるプロセス100、具体的にはPCR増幅に利用される5’ヌクレアーゼアッセイを示す。プロセス100は、すべてのサイクルで発生し、産物の指数関数的蓄積を妨害しない、本アッセイプロセスの4つの段を示す。4つの段は、重合段階102、鎖置換段階104、切断段階106、および完了段階108を含む。重合段階102の間、順方向プライマーおよび逆方向プライマーが、標的配列110の近くで、二本鎖DNA114のあるセクションの複製を開始する。順方向プライマー(5’->3’)は、ホットスタートポリメラーゼ124(Taqポリメラーゼ)を含み、それは、DNAポリメラーゼが不活性である温度で機能し、不要な複製を回避する。プローブは、レポーター色素118、相補配列126、非蛍光クエンチャー120、およびマイナーグルーブバインダー122を含む。プローブは、相補配列126を介して、標的配列110にハイブリダイズする。非蛍光クエンチャー120およびマイナーグルーブバインダー122は、分子がプローブの3’末端に付着すると、機能する。プローブがそのままである場合、非蛍光クエンチャー120(NFQ)は、レポーター色素118が蛍光信号を発するのを防止する。非蛍光クエンチャー120が蛍光を発しないので、より低いバックグラウンド信号を生成し、その結果、定量化の精度が改善される。マイナーグルーブバインダー122(MGB)は、プローブの融解温度(Tm)を、その長さを増加させることなく上昇させ、より短いプローブの設計を可能にする。重合段階102の間、ホットスタートポリメラーゼ124がプローブに向かって動き、レポーター色素118はプローブの5’側に付着している。
【0006】
鎖置換段階104では、ホットスタートポリメラーゼ124が、ハイブリダイズされたプローブと相互作用して、レポーター色素118を置換する。切断段階106では、ホットスタートポリメラーゼ124が、プローブからレポーター色素118を切断する。切断により、レポーター色素はクエンチャー色素から分離され、非蛍光クエンチャー120はもはやレポーター色素118をブロックせず、分離されたレポーター色素116はその蛍光を増加させる。蛍光の増加は、標的配列がプローブに相補的であり、PCR中に増幅される場合にのみ発生する。装置は、二本鎖DNA114上の標的配列の存在を示すレポーター色素からの蛍光を検出する。標的配列110へのプローブのハイブリダイゼーションのため、ホットスタートポリメラーゼ124は、相補的配列126で停止し、完了段階108を示す。
【0007】
図2は、反応プレート204、サンプル装填装置202、リアルタイムPCR装置208、サンプル混合物206、コンピュータシステム220、およびユーザインターフェース226を備えるqPCRシステム200を示す。反応プレート204は、qPCR実験のための反応位置として機能する複数の貫通孔を各々が備える、複数のサブアレイを備える。貫通孔の各々は、アッセイ210でコーティングされ得る。いくつかの構成では、アッセイ210は、サンプルDNA中のヌクレオチド配列を特異的に標的とするプローブである。サンプルDNAの増幅の間、プローブは、リアルタイムPCR装置208によって検出されるレポーター色素の放出によって、標的配列の存在を示す。反応プレート204は、サンプル装填装置202内で、標的ポリヌクレオチド配列212と組み合わされる。反応プレート204を標的ポリヌクレオチド配列212と組み合わせる前に、標的ポリヌクレオチド配列212は、反応ミックス216を含むサンプル混合物206において調製される。反応ミックス216は、少なくとも、ポリメラーゼ214およびプライマー230を含む。ポリメラーゼ214は、PCR反応中に二本鎖DNAを増幅させる。サンプル装填装置202は、特定量のサンプル混合物206を、反応プレート204の意図された各貫通孔に装填する。サンプル装填装置202が、反応プレート204の準備を完了すると、反応プレート204は、リアルタイムPCR装置208内に装填される。リアルタイムPCR装置208は、DNA複製のための特定の段階をトリガする異なる温度範囲を循環させるサーモサイクラーを動作させるためのコンピュータシステム220によって構成されている。反応プレート204は、DNA鎖を変性させ、相補的塩基間の水素結合を切断し、2つの一本鎖DNA分子を生成する高熱段階(94~98℃(201~208°F))を含む、いくつかの複製サイクルを経る。変性段階の後に、アニーリング段階が続き、そこでは、反応温度が、20~40秒間、50~65℃(122~149°F)に下げられる。アニーリング段階は、DNA中の標的配列へのプライマーおよびプローブセットのアニーリングを可能にする。アニーリング段階の後に、延長/伸長段階が続き、そこでは、温度が、約75~80℃(167~176°F)である、Taq(Thermus aquaticus)ポリメラーゼの熱安定性DNAポリメラーゼの最適活性温度に調整される。伸長/延長段階の間、ポリメラーゼは、プライマーの位置の隣から始まる相補鎖を合成し、新しい相補鎖を、それが標的配列上のプローブに当接するまで、合成し続ける。ポリメラーゼがプローブと相互作用すると、プローブは、リアルタイムPCR装置208の検出器218によって検出される蛍光マーカーを放出する。検出器218からの情報は、貫通孔のうちの1つに対応する第1の信号として、コンピュータシステム220によって記録される。検出された信号は、情報を記憶および処理して、サンプル混合物206中の標的配列のコピー数およびインスタンスを示すクラスタ分析プロット228を生成する、メモリ222およびプロセッサ224を備えるコンピュータシステム220に報告される。コンピュータシステム220は、ジェノタイピング結果をユーザインターフェース226に通信して、クラスタ分析プロット228を表示する。
【0008】
当業者には知らされているように、PCR分析は、遺伝子標的を増幅するために、複数の熱サイクルを循環するための様々なプロトコルを有する熱サイクル装置で実施される。本教示の様々な実施形態において、増幅のために実施されるサイクル数は、約20~40サイクルであり得る。本教示の様々な実施形態に対して、増幅のために実施されるサイクル数は、40サイクルよりも大きくてもよい。遺伝子標的の増幅のために、熱サイクル装置は、PCR実験の第1の熱サイクルを、第1の熱サイクル数に関連し得る特定のサイクル時間で実施し得る。
【0009】
ジェノタイピング分析の様々な実施形態において、2つ以上のDNAサンプルが、第1のプローブおよび第2のプローブを用いて探査される。プロセッサは、第1の時間に、データ収集のための様々なプロトコルのうちのいずれかに基づいてqPCR装置から、2つ以上のDNAサンプルの各々について、第1の時間における第1のプローブ強度および第2のプローブ強度を含む第1のデータセットを受信し得る。プロセッサは、第2の時間に、データ収集のための様々なプロトコルのうちのいずれかに基づいてqPCR装置から、2つ以上のDNAサンプルの各々について、第2の時間における第1のプローブ強度および第2のプローブ強度を含む第2のデータセットを受信し得る。
【0010】
本教示の様々な実施形態によれば、ユーザインターフェースは、第1の時間および第2の時間に受信したデータセットの分析のための視覚化ツールを、エンドユーザに提示し得る。前述したように、複数のサンプルを、バッチで、ジェノタイピング分析のために処理して、データ集約型のデータセットを生成してもよい。本教示によるシステムおよび方法の様々な実施形態は、そのようなデータ集約型データセットの評価および分析においてエンドユーザを支援し得る視覚化ツールの実施形態を提供する。本教示によるシステムおよび方法の様々な実施形態のために、エンドユーザからの入力に応答して、プロセッサは、第1のデータセットを使用して、第1のプローブ強度対第2のプローブ強度の第1のプロットを生成し得る。さらに、プロセッサは、エンドユーザからの入力に応答して、第2のデータセットを使用して、第2のプローブ強度の関数としての第1のプローブ強度の第2のプロットを生成し得る。本教示のシステムおよび方法の様々な実施形態によれば、プロセッサは、エンドユーザからの入力に応答して、第1のプロットおよび第2のプロットを表示し得る。様々な実施形態において、入力は、データを段階的に表示するためのユーザインターフェースを用いた対話型プロセスであり得る。そのような実施形態では、エンドユーザは、表示のために、任意のデータセットを任意の順序で選択し得る。
【0011】
様々な実施形態において、プロセッサは、PCR実験の実行時間中にデータを受け取り受信し得る。例えば、プロセッサは、第1のデータセットの収集の後で、第2のデータセットの収集の前に、qPCR装置から第1のデータセットを受信し得る。さらに、このプロトコルは、実行時間全体にわたって拡張され得、したがって、例えば、プロセッサは、第2のデータセットの収集の後で、後続のデータセットの収集の前に、qPCR装置から第2のデータセットを受信し得る。
【0012】
いくつかの実施形態では、プロセッサは、熱サイクルが完了した後に、qPCR装置から第1のデータセットおよび第2のデータセットを受信し得る。例えば、プロセッサは、第1のデータセットおよび第2のデータセットを、それがコンピュータ可読媒体に記憶された後に受信し得る。
【0013】
いくつかの構成では、視覚化ツールは、ジェノタイピングデータセットの様々な態様を表示することにおいてエンドユーザを支援し、それによってジェノタイピングデータの分析を容易にし得る。様々な実施形態において、プロセッサは、第2のデータセットと第1のデータセットとの間の軌跡ラインを示すプロットを表示し得る。様々な実施形態において、プロセッサは、第1のデータセットに対して第1のプロット品質値で表示し、第2のデータセットに対して第2のプロット品質値で表示し得る。様々な実施形態によれば、ユーザインターフェースは、サンプル表上で行われ、ジェノタイピングデータのプロット上に動的に表示される、選択間の相互作用を提供する。様々な実施形態において、視覚化ツールのユーザインターフェースからエンドユーザによって行われる選択は、例えば、限定されないが、エンドユーザが、例えば、限定されないが、曖昧なエンドポイントデータを解決すること、手動呼び出しを行うこと、軌跡ラインを使用してクラスタの視覚化を支援して遺伝子型の割り当てを強化すること、アッセイ条件(すなわち、標識用プローブ、アッセイバッファなど)を最適化すること、および分析条件を最適化することを可能にするための、動的分析を提供し得る。
【0014】
様々な実施形態において、システムは、例えば、限定されないが、クラスタ分析プロット228に示されるグラフに従って表され得るデータセットを利用する。そのような表現は、生物学的サンプル中のゲノム遺伝子座の2つの対立遺伝子の一方に向けられた標識用プローブの各々に関連付けることができる、異なる波長で発光する2つの色素を利用した分析から生じ得る。そのような二重反応では、考えられる3つの遺伝子型の各々について、個別の信号セットが生成される。クラスタ分析プロットに示されているように、信号2対信号1のデカルト座標系では、そのようなグラフィック表現に示されている各データポイントは、所与の3つの個別の信号セットのうちの1つにおいて座標を有し得る。したがって、各データポイントについて、複数のサンプルの個別の信号セットを、データポイントとしてデータセット内に記憶し得る。そのようなデータセットは、様々なコンピュータ可読媒体に記憶され、後でより詳しく説明するように、分析中または分析後のいずれかに動的に分析され得る。
【0015】
ジェノタイピングデータを視覚化するための方法およびシステムの実施形態の特徴を実証するために使用される、1つのそのようなタイプのアッセイは、TaqMan(登録商標)試薬を利用することができ、例えば、限定されないが、後で説明するように、FAMおよびVIC色素標識を使用し得る。しかしながら、当業者は、標識用プローブ試薬を含む様々なアッセイを利用して、本教示の方法およびシステムの様々な実施形態に従って分析され得るデータを生成し得ることを認識するであろう。
【0016】
「標識用プローブ」という用語は、一般に、様々な実施形態によれば、典型的には定量分析またはqPCR分析、ならびにエンドポイント分析のために、増幅反応に使用される分子を指す。そのような標識用プローブは、標的ポリヌクレオチドの増幅をモニタリングするために使用され得る。いくつかの実施形態において、増幅反応に存在するオリゴヌクレオチド標識用プローブは、時間の関数として生成されるアンプリコン(複数可)の量をモニタリングするのに好適である。そのようなオリゴヌクレオチド標識用プローブには、限定されないが、本明細書に記載の5’-エキソヌクレアーゼアッセイTaqMan(登録商標)標識用プローブ(米国特許第5,538,848号も参照)、様々なステムループ分子ビーコン(例えば、米国特許第6,103,476号および同第5,925,517号、ならびにTyagi and Kramer,1996,Nature Biotechnology 14:303-308を参照)、ステムレスまたは線形ビーコン(例えば、WO99/21881を参照)、PNA Molecular Beacons(商標)(例えば、米国特許第6,355,421号および同第6,593,091号を参照)、線形PNAビーコン(例えば、Kubista et al.,2001,SPIE 4264:53-58を参照)、非FRET標識用プローブ(例えば、米国特許第6,150,097号を参照)、Sunrise(登録商標)/Amplifluor(登録商標)標識用プローブ(米国特許第6,548,250号)、ステムループおよびデュプレックスScorpion(商標)標識用プローブ(Solinas et al.,2001,Nucleic Acids Research 29:E96および米国特許第6,589,743号)、バルジループ標識用プローブ(米国特許第6,590,091号)、疑似ノット標識用プローブ(米国特許第6,589,250号)、サイクリコン(米国特許第6,383,752号)、MGB Eclipse(商標)プローブ(Epoch Biosciences)、ヘアピン標識用プローブ(米国特許第6,596,490号)、ペプチド核酸(PNA)ライトアップ標識用プローブ、自己組織化ナノ粒子標識用プローブ、ならびに、例えば米国特許第6,485,901号、Mhlanga et al.,2001,Methods 25:463-471、Whitcombe et al.,1999,Nature Biotechnology.17:804-807、Isacsson et al.,2000,Molecular Cell Probes.14:321-328、Svanvik et al.,2000, Anal Biochem.281:26-35、Wolffs et al.,2001,Biotechniques 766:769-771、Tsourkas et al.,2002,Nucleic Acids Research.30:4208-4215、Riccelli et al.,2002,Nucleic Acids Research 30:4088-4093、Zhang et al.,2002 Shanghai.34:329-332、Maxwell et al.,2002,J.Am.Chem.Soc.124:9606-9612、Broude et al.,2002,Trends Biotechnol.20:249-56、Huang et al.,2002,Chem Res.Toxicol.15:118-126、およびYu et al.,2001,J.Am.Chem.Soc 14:11155-11161に記載されている、フェロセン修飾標識用プローブが含まれる。標識用プローブは、ブラックホールクエンチャー(Biosearch)、アイオワブラック(IDT)、QSYクエンチャー(分子標識用プローブ)、ならびにDabsylおよびDabcelのスルホン酸塩/カルボン酸塩クエンチャー(Epoch)を含むこともできる。標識用プローブは、2つの標識用プローブを含むことができ、例えば、蛍光体が一方のプローブ上にあり、クエンチャーが他方の上にあり、標的上での2つの標識用プローブのハイブリダイゼーションが信号を消光させるか、または標的上でのハイブリダイゼーションが、蛍光の変化を介して信号シグナチャを変化させる。標識用プローブはまた、カルボキシレート基の代わりにスルホン酸基を有するフルオレセイン色素のスルホン酸誘導体、フルオレセインのホスホルアミダイト形態、CY5のホスホルアミダイト形態(例えば、Amershamから入手可能)を含み得る。
【0017】
本明細書で使用される場合、「核酸サンプル」という用語は、本教示による生物学的サンプル中に見出される核酸を指す。サンプルは、侵襲的または非侵襲的に収集され得ることが企図される。サンプルは、繊維、布地、巻きタバコ、チューインガム、接着材料、土壌、または無生物の上に、中に、内部に、それらに由来して存在するか、またはそれらと一緒に見出すことができる。本明細書で使用される場合の「サンプル」は、その最も広い意味で使用され、遺伝子標的または標的ポリヌクレオチドがそれから誘導され得る核酸を含有するサンプルを指す。サンプルは、細胞、細胞から単離された染色体(例えば、ある広がりの中期染色体)、ゲノムDNA、RNA、cDNAなどを含むことができる。サンプルは、植物、家畜、家庭用ペット、およびヒトのサンプルを含むがこれらに限定されない、核酸を含有する任意の生物を包含する動物または植物起源のものとすることができ、複数の供給源から誘導することができる。これらの供給源には、全血、毛髪、血液、尿、組織生検、リンパ液、骨、骨髄、歯、羊水、毛髪、皮膚、精液、肛門分泌物、膣分泌物、発汗、唾液、口腔内スワブ、様々な環境サンプル(例えば、農業、水、および土壌)、研究サンプル、精製サンプル、および溶解細胞が含まれ得るが、これらに限定されない。標的ポリヌクレオチド配列を含有する核酸サンプルは、例えば、機械的力、超音波処理、制限エンドヌクレアーゼ切断などの手順の使用を含む、当技術分野で知られている様々なサンプル調製手順のいずれか、または当技術分野で知られている任意の方法を使用して、サンプルから単離できることが理解されよう。
【0018】
本明細書で使用される場合の「標的ポリヌクレオチド」、「遺伝子標的」などの用語は、本明細書で互換的に使用され、特定の関心対象核酸配列を指す。「標的」は、増幅が求められ、他の核酸分子の存在下で、またはより大きな核酸分子内に存在することができるポリヌクレオチド配列とすることができる。標的ポリヌクレオチドは、任意の供給源から得ることができ、任意の数の異なる組成コンポーネントを含むことができる。例えば、標的は、核酸(例えば、DNAまたはRNA)とすることができる。標的は、メチル化、非メチル化、またはその両方とすることができる。さらに、特定の関心対象核酸配列のコンテクストで使用される「標的」は、追加的に、その代用物、例えば増幅産物、および天然配列を指すことが理解されよう。いくつかの実施形態では、特定の関心対象核酸配列は、例えば、限定されないが、法医学的サンプル中に見出すことができるような、劣化供給源から誘導される短鎖DNA分子である。本教示の特定の関心対象核酸配列は、上記したように、いくつかの生物および供給源のうちのいずれかから誘導することができる。
【0019】
本明細書で使用される場合、「DNA」は、ゲノムDNA、cDNA、単離された核酸分子、ベクターDNA、および染色体DNAなど、当技術分野で理解されるような様々な形態のデオキシリボ核酸を指す。「核酸」は、任意の形態のDNAまたはRNAを指す。単離された核酸分子の例には、ベクターに含有される組換えDNA分子、異種宿主細胞中に維持される組換えDNA分子、部分的または実質的に精製された核酸分子、および合成DNA分子が含まれるが、これらに限定されない。典型的には、「単離された」核酸は、核酸が誘導される生物のゲノムDNA中で、核酸に自然に隣接する配列(すなわち、核酸の5’および3’末端に位置する配列)を含まない。さらに、cDNA分子などの「単離された」核酸分子は、一般に、組換え技術によって生成される場合には、他の細胞材料もしくは培地を実質的に含まず、または化学合成される場合には、化学的前駆体もしくは他の化学物質を含まない。
【0020】
いくつかの実施形態では、PCR増幅産物は、例えばPCT特許出願第WO2009/059049号に記載されているように、PCR増幅プライマーにコンジュゲートされた蛍光色素によって検出され得る。PCR増幅産物は、増幅産物の染色、例えば銀染色などを含むがこれらに限定されない他の技術によっても検出することができる。
【0021】
いくつかの実施形態では、検出は、装置、すなわち、コンピュータアルゴリズムを、必要ではないが、含むことができる、自動または半自動の検出手段を使用することを含む。いくつかの実施形態では、装置は、携帯型、可搬型であるか、または、例えば増幅産物の検出が行われる実験室、病院、もしくは他の環境にある、可動性もしくは可搬性の低いコンポーネント内に挿入することができる携帯型コンポーネントを含む。特定の実施形態では、検出ステップは、少なくとも1つの増幅ステップ、1つのシーケンシングステップ、1つの単離ステップ、1つの分離ステップ、例えば、限定されないが、少なくとも1つの蛍光スキャナおよび少なくとも1つのグラフ作成、記録、または読み取りコンポーネントを備えるキャピラリー電気泳動装置、吸光度モニタまたは蛍光スキャナおよびグラフレコーダに結合されたクロマトグラフィーカラム、記録および/または検出コンポーネントを備える質量分析計に結合されたクロマトグラフィーカラム、少なくとも1つのUV/可視光スキャナおよび少なくとも1つのグラフ作成、記録、または読み取りコンポーネントを備える分光光度計装置、スキャナまたはCCDカメラなどのデータ記録装置を有するマイクロアレイ、もしくは、少なくとも1つの蛍光スキャナおよび少なくとも1つのグラフ作成、記録、または読み取りコンポーネントを備えるシーケンシング装置、フルオロフォア標識可逆的ターミネーターヌクレオチドを含む、合成によるシーケンシング装置、DNAポリメラーゼによるヌクレオチドの取り込みに続くピロホスフェート(PPi)放出の検出を含むピロシーケンシング法、ペアエンドシーケンシング、ポロニーシーケンシング、単一分子シーケンシング、ナノポアシーケンシング、およびハイブリダイゼーションによるかまたは参照により本明細書に組み込まれるLin,B.et al.“Recent Patents on Biomedical Engineering(2008)1(1)60-67に説明されているような連結反応によるシーケンシングから選択される、検出コンポーネントを有するシーケンシング装置、と組み合わされるか、またはそれらの継続部である。
【0022】
特定の実施形態において、検出ステップは、増幅ステップ、例えば、限定されないが、Q-PCRなどのリアルタイム分析と組み合わされる。検出ステップを実施するための例示的な手段には、ABI PRISM(登録商標)遺伝子分析装置シリーズ、ABI PRISM(登録商標)DNA分析装置シリーズ、ABI PRISM(登録商標)配列検出システム装置シリーズ、およびApplied BiosystemsリアルタイムPCR装置シリーズ(すべてApplied Biosystems製)、ならびに、Applied BiosystemsマイクロアレイおよびApplied Biosystems1700化学発光マイクロアレイ分析器などのマイクロアレイおよび関連ソフトウェア、とりわけAffymetrix、Agilent、およびAmersham Biosciencesから入手可能な、他の市販のマイクロアレイおよび分析システム(Gerry et al.,J.Mol.Biol.292:251-62,1999、De Bellis et al.,Minerva Biotec 14:247-52,2002、およびStears et al.,Nat.Med.9:140-45、including supplements,2003も参照)、またはビーズアレイプラットフォーム(Illumina、カリフォルニア州サンディエゴ)が含まれる。例示的なソフトウェアには、GeneMapper(商標)ソフトウェア、GeneScan(登録商標)分析ソフトウェア、およびGenotyper(登録商標)ソフトウェア(すべてApplied Biosystems製)が含まれる。
【0023】
いくつかの実施形態において、増幅産物は、アンプリコンの少なくとも一部の質量対電荷比(m/z)に基づいて、検出および定量化することができる。例えば、いくつかの実施形態において、プライマーは、増幅産物に組み込まれ、質量分析計の検出に使用することができる質量タグ、電荷タグ、切断可能部分、または同位体を含むがこれらに限定されない、質量分析適合性レポーター基を含む(例えば、Haff and Smirnov, Nucl.Acids Res.25:3749-50,1997、およびSauer et al.,Nucl.Acids Res.31:e63,2003を参照)。増幅産物は、質量分析によって検出することができる。いくつかの実施形態において、プライマーは、検出のために増幅産物の一部の放出を容易にするために、制限酵素部位、切断可能部分などを含む。特定の実施形態において、多数の増幅産物が、液体クロマトグラフィーまたはキャピラリー電気泳動によって分離され、ESIまたはMALDIに供され、そして質量分析によって検出される。質量分析の説明は、その他では、The Expanding Role of Mass Spectrometry in Biotechnology, Gary Siuzdak, MCC Press, 2003に見出すことができる。
【0024】
いくつかの実施形態において、検出することは、手動もしくは視覚的な読み取りもしくは評価、またはそれらの組み合わせを含む。いくつかの実施形態において、検出することは、自動化または半自動化されたデジタルまたはアナログの読み取りを含む。いくつかの実施形態において、検出することは、リアルタイム分析またはエンドポイント分析を含む。いくつかの実施形態において、検出することは、TaqMan(登録商標)低密度アレイ(Applied Biosystems)を含むがこれに限定されない、マイクロ流体デバイスを含む。いくつかの実施形態において、検出することは、リアルタイム検出装置を含む。例示的なリアルタイム装置には、ABI PRISM(登録商標)7000配列検出システム、ABI PRISM(登録商標)7700配列検出システム、Applied Biosystems 7300リアルタイムPCRシステム、Applied Biosystems 7500リアルタイムPCRシステム、Applied Biosystems 7900 HT高速リアルタイムPCRシステム(すべてApplied Biosystems製)、LightCycler(商標)システム(Roche Molecular)、Mx3000P(商標)リアルタイムPCRシステム、Mx3005P(商標)リアルタイムPCRシステム、およびMx4000(登録商標)マルチプレックス定量PCRシステム(Stratagene、カリフォルニア州ラホーヤ)、ならびにスマートサイクラーシステム(Cepheid、Fisher Scientificによって販売)が含まれる。リアルタイム装置の説明は、その他では、それぞれの製造業者のユーザズマニュアル、McPherson、DNA Amplification:Current Technologies and Applications,Demidov and Broude,eds.,Horizon Bioscience,2004、および米国特許第6,814,934号に見出すことができる。
【0025】
「増幅反応混合物」および/または「マスターミックス」という用語は、標的核酸を増幅するために使用される様々な(いくつかまたはすべての)試薬を含む水溶液を指し得る。かかる反応は、固体支持体または半固体支持体(例えば、アレイ)を使用して実施される場合もある。反応はまた、ユーザによって所望に応じて単独または多重型式で実施され得る。これらの反応は、典型的には、酵素、水性緩衝液、塩、増幅プライマー、標的核酸、およびヌクレオシド三リン酸を含む。いくつかの実施形態において、増幅反応ミックスおよび/またはマスターミックスは、例えば、緩衝液(例えば、Tris)、1種以上の塩(例えば、MgC、KCl)、グリセロール、dNTP(dA、dT、dG、dC、dU)、組換えBSA(仔ウシ血清アルブミン)、色素(例えば、ROX受動参照色素)、1種以上の洗剤、ポリエチレングリコール(PEG)、ポリビニルピロリドン(PVP)、ゼラチン(例えば、魚もしくは仔ウシ源)、および/または消泡剤のうちの1つ以上を含み得る。状況に応じて、混合物は、完全または不完全増幅反応混合物のいずれかであり得る。いくつかの実施形態において、マスターミックスは、増幅反応での使用前に増幅プライマーを含まない。いくつかの他の実施形態において、マスターミックスは、増幅反応における使用の前に、標的核酸を含まない。いくつかの実施形態において、増幅マスターミックスは、増幅プライマーとの接触前に標的核酸試料と混合される。
【0026】
いくつかの実施形態において、増幅反応混合物は、増幅プライマーおよびマスターミックスを含む。いくつかの実施形態において、増幅反応混合物は、増幅プライマー、検出可能に標識されたプローブ、およびマスターミックスを含む。
【0027】
いくつかの実施形態において、増幅プライマーおよびマスターミックスの反応混合物、または増幅プライマー、プローブ、およびマスターミックスの反応混合物は、保管容器または反応容器内で乾燥する。いくつかの実施形態において、増幅プライマーおよびマスターミックスの反応混合物、または増幅プライマー、プローブ、およびマスターミックスの反応混合物は、保管容器または反応容器内で凍結乾燥される。いくつかの実施形態において、本開示は、一般に、単一の対照核酸分子からの複数の標的特異的配列の増幅に関する。例えば、いくつかの実施形態において、その単一の対照核酸分子は、RNAを含むことができ、他の実施形態において、その単一の対照核酸分子は、DNAを含むことができる。いくつかの実施形態において、標的特異的プライマーおよびプライマー対は、核酸分子、例えば対照核酸分子の、特定の領域を増幅することができる標的特異的配列である。いくつかの実施形態において、標的特異的プライマーは、RNAの逆転写をプライミングして、標的特異的cDNAを生成することができる。いくつかの実施形態において、標的特異的プライマーは、標的DNAまたはcDNAを増幅することができる。いくつかの実施形態において、選択的増幅に必要なDNAの量は、約1ng~1マイクログラムとすることができる。いくつかの実施形態において、1つ以上の標的配列の選択的増幅に必要なDNAの量は、約1ng、約5ng、または約10ngとすることができる。いくつかの実施形態において、標的配列の選択的増幅に必要なDNAの量は、約10ng~約200ngである。
【0028】
本明細書で使用される場合、「反応容器」という用語は、一般に、本教示に従って反応が起こり得る任意の容器、チャンバ、デバイス、またはアセンブリを指す。いくつかの実施形態において、反応容器は、微小管、例えば、限定されないが、Micro Amp(商標)光学管(Life Technologies Corp.、カリフォルニア州Carlsbad)などの0.2mLもしくは0.5mL反応管、または微小遠心管、または分子生物学研究所で一般的に実用化されている種類の他の容器であり得る。いくつかの実施形態において、反応容器は、(48、96、または384ウェルマイクロタイタープレートなどの)マルチウェルプレートのウェル、スライドガラス上のスポット、TaqMan(商標)アレイカード内のウェル、またはTaqMan(商標)低密度アレイを含むがこれに限定されない、マイクロ流体デバイスのチャネルもしくはチャンバ、またはTaqMan(商標)OpenArray(商標)リアルタイムPCRプレート(Applied Biosystems、Thermo Fisher Scientific)の貫通孔を含み得る。例えば、限定ではないが、複数の反応容器が、同じ支持体上に存在することができる。OpenArray(商標)プレートは、例えば、反応プレート3072貫通孔である。かかるプレート内のかかる各貫通孔は、単一のTaqMan(商標)アッセイを含有し得る。いくつかの実施形態において、例えばCaliperまたはFluidigmから入手可能なラボオンチップ様デバイスが、反応容器を提供することができる。様々な反応容器が、市販されているか、または本教示に関連して使用するために設計できることが認識されるであろう。
【0029】
「ハイブリダイズする」および「アニールする」という基語の変形を含むがこれらに限定されない、「アニールすること」および「ハイブリダイズすること」という用語は、互換的に使用され、二本鎖、三本鎖、または他のより高次の構造の形成をもたらす、1つの核酸の、別の核酸とのヌクレオチド塩基対合相互作用を意味する。一次相互作用は、典型的には、ヌクレオチド塩基特異的であり、例えば、ワトソン・クリックおよびフーグスティーン型水素結合による、A:T、A:U、およびG:Cである。特定の実施形態において、塩基積み重ねおよび疎水性相互作用も、二本鎖の安定性に寄与し得る。プライマーおよびプローブが相補的配列にアニールする条件は、当該技術分野で周知であり、例えば、Nucleic Acid Hybridization,A Practical Approach,Hames and Higgins,eds.,IRL Press,Washington,D.C.(1985)およびWetmur and Davidson,Mol.Biol.31:349(1968)に記載されている。
【0030】
概して、かかるアニーリングが行われるかは、とりわけ、標的隣接配列および/もしくはアンプリコン中のプライマーの相補的部分の相補的部分およびそれらの対応する結合部位、またはレポータープローブの対応する相補的部分およびその結合部位の長さ、pH、温度、一価および二価陽イオンの存在、ハイブリダイズしている領域内のGヌクレオチドとCヌクレオチドの割合、培地の粘度、ならびに変性剤の存在によって影響される。かかる可変要素は、ハイブリダイゼーションに必要な時間に影響を及ぼす。したがって、好ましいアニーリング条件は、特定の用途に依存するであろう。しかしながら、かかる条件は、過度の実験なしに、当業者が日常的に決定することができる。好ましくは、アニーリング条件は、プライマーおよび/またはプローブが、対応する標的隣接配列またはアンプリコン中の相補的配列と選択的にハイブリダイズするが、第2の反応温度で反応組成物中の異なる標的核酸または非標的配列に著しい程度にハイブリダイズしないことを可能にするように選択される。
【0031】
図3は、qPCR装置内に装填される前の反応プレート308のためのプレート調製300を示す。反応プレート308は、複数のサブアレイを備え、各サブアレイ314は、複数のスルーアレイ貫通孔306を備える。各貫通孔は、アッセイ318の反応位置として機能し得る。いくつかの構成において、反応プレート308は、48個のサブアレイを備え、各サブアレイは、33nLの反応容量を各々が保持できる64個の貫通孔を備える。前述の構成において、反応プレート308は、3072個の貫通孔を備える。
【0032】
反応プレート308の構成に応じて、アレイ貫通孔306のいくつかは、それらの中に配置されたアッセイ318を含むであろう。各貫通孔は、アッセイ318が配置され得る親水性内部を備える。親水性貫通孔は、反応を封じ込める疎水性の表面にも囲まれている。
【0033】
設定量を各所望のアレイ貫通孔306に正確に装填するために、サンプル装填装置302が利用される。サンプル装填装置302は、設定量のサンプル混合物312を、反応プレート308の各所望の貫通孔にアリコートする。いくつかの構成において、チップブロック316が、サンプル装填装置302によって利用されて、プライマー324およびポリメラーゼ326の反応ミックス328を含むサンプル混合物312を反応プレート308の貫通孔内に分注する。
【0034】
サンプル装填装置302が動作されると、チップブロック316は、反応プレート308を横切って動き、設定量のサンプル混合物312が特定のアレイ貫通孔306に送達されることを可能にし得る。サンプル装填装置302がその実行を完了すると、反応プレート308は、装填済反応プレート310に変換され、ここで、複数のサブアレイ、例えばサブアレイ322は、標的ポリヌクレオチド配列320を含む装填済貫通孔304を備える。
【0035】
図4を参照すると、ジェノタイピングシステム400は、qPCRシステム402および学習システム404を備える。学習システム404は、サポートベクターマシン406、データ記憶システム408、人間分類器410、標識データセット412、および分類モデル414をさらに備える。
【0036】
qPCRシステム402は、qPCRシステム200の一実施形態であり得る。qPCRシステム402は、FAM(登録商標)およびVIC(登録商標)蛍光色素の強度を含む信号を生成する。次いで、この強度のベクターは、学習システム404、サポートベクターマシン406およびデータ記憶システム408の両方へ送信される。ベクターは、重心最小クラスタ分離シグマ(MCSS)クラスタの数、アッセイアドレス、MCSS値などの値でさらに拡張され得る。
【0037】
サポートベクターマシン406は、qPCRシステム402からデータベクターを受信する。サポートベクターマシン406は、最小値-最大値スケーリングまたはZスコア正規化を利用することによって、入力生データベクターを正規化し得る。次いで、サポートベクターマシン406は、分類モデル414からモデルを選択し得る。モデルは、SVM線形、多項式、および放射型分類器(RBF)カーネルから選択され得る。RBFカーネルは、次のようであり得る:
【数1】
ここで、xは、データベクターであり、γは、調整可能パラメータである。モデルはまた、ハードマージンまたはソフトマージンを有し得る。ソフトマージンは、次のようであり得る:
【数2】
ここで、wおよびbは、超平面のパラメータであり、x
nは、データベクターであり、y
nは、i番目の標的であり、ζは、スラック変数であり、Cは、調整可能パラメータである。各モデルはまた、ハイパーパラメータのセットを有し得る。例えば、RBFカーネルを利用するモデルは、10~1000の値など、関連γ値を有し得る。追加的に、ソフトマージンを利用するモデルは、0.01~30の値など、関連C値を有し得る。パラメータは、動作効率と精度との間のバランスをとるように選択され得る。選択されたモデルは、例えば、0.3のC値および300のγ値を有し得る。サポートベクターマシン406は、選択されたモデルを利用して、データベクターの遺伝子型予測を決定する。データセットは3つのクラスを含むので、1つ対残り(OvR)戦略を利用して、新しいインスタンスの遺伝子型を割り当てる。この戦略は、クラス(ここでは、3つのクラス)ごとに1つの分類器を利用する。次いで、各分類器は、入力データベクターについて動作し、例えば、1つの分類器は「11」状態用、1つは「12」状態用、1つは「22」状態用である。サポートベクターマシン406は、各分類器の出力に基づいて、「11」状態、「12」状態、および「22」状態の間で選択し得る。次いで、決定された分類が出力される。
【0038】
データ記憶システム408は、qPCRシステム402からのデータ出力を記憶する。データ記憶システム408は、モデルをトレーニングするために利用される履歴データを、モデルがトレーニングされた後にqPCRシステム402によって生成される追加データとともに、記憶し得る。新しいモデルが、データ記憶システム408に記憶された更新データセットから生成され得る。データ記憶システム408は、2つ以上のqPCRシステム402からのデータをさらに記憶し得る。
【0039】
人間分類器410は、データ記憶システム408に記憶されたデータに標識を適用して、標識データセット412を生成する。標識は、「11」状態、「12」状態、および「22」状態を含む。次いで、標識データセット412を利用して、各分類モデル414をトレーニングする。
【0040】
分類モデル414は、qPCRシステム402の動作に影響を及ぼし得る。分類モデル414は、他の分類モデル414とは異なる入力セットを利用し得る。次いで、選択された分類モデル414は、qPCRシステム402からの出力データベクターを決定し得る。各分類モデル414は、多数派遺伝子型(MG)および遺伝子型一致(GC)を含み得る標識データセット412を受信することによってトレーニングされ得る。MGは、一対のアッセイ-サンプル組み合わせが与えられたとして、最高頻度を有する遺伝子型である。生物学的に、qPCR反応の遺伝子型は一貫し得るので、MG=max(G11、G12、G22)であり、ここで、G11、G12、およびG22は、ホモ接合体(G11およびG22)ならびにヘテロ接合体(G12)の遺伝子型頻度である。GCは、履歴データ内の多数派遺伝子型のインスタンス数をqPCR反応(アッセイ-サンプル対)の総数で割ったパーセンテージであり、GC=100*(MGインスタンス/総インスタンス数)である。不合格のqPCR反応は、約50万のインスタンスからなる記憶データセット(別名、不良インスタンス)から抽出され、次いで、過去に不合格となったことのない別の50万のインスタンス(良好インスタンス)がランダムに選択される。これは、トレーニングおよびテストに利用される入力データである。各分類モデル414は、3つの分類器を含み得る。各分類器は、標識データセット412を2つのカテゴリ、つまりクラスの一部か、またはクラスの一部ではないかに分割するための超平面(wおよびb値)を決定する。例えば、第1の分類器は、データベクターが「11」であるか、または「11」でないかを決定する。第2の分類器は、データベクターが「12」であるか、または「12」でないかを決定する。第3の分類器は、データベクターが「22」であるか、または「22」でないかを決定する。既存の(ベースライン)ジェノタイピングとSVMベースのジェノタイピングとの間の精度が比較される。モデルの結果は、統計的有意性の観点から、同様、より良い、より悪いの3つのカテゴリのうちの1つになり得る。「最良」の予測モデルは、グリッド検索を利用した後、SVMのカーネルおよびパラメータの観点から決定される。一旦モデルが「最良」であると決定されると、その堅牢性が、4分割交差検証によって検証される。入力データセットは、4つのグループに分割される。次いで、モデルは、3つのグループで再トレーニングされ、4つのグループを用いてテストされる。これが、4回行われ、各グループは、1回はテストグループになる。トレーニング結果は、SVMベースのアルゴリズムが、同じデータセットに基づき、従来のモデルよりも少なくとも約20%高い精度を予測することを示す。結果はまた、SVM-RBFが、既存のものが遺伝子型予測を行うことができない、1クラスタまたは2クラスタのデータを救済できることも示す。加えて、SVMベースのアルゴリズムは、従来のアルゴリズムによってタグ付けされた、余計な低ROXのインスタンスのうちの50%を超えるものを救済する。
【0041】
場合によっては、生データは、qPCRシステムの動作からの生画像データを含む。生画像データは、qPCRシステムの動作中にイメージセンサによって生成されたピクセル値のアレイを含む。
【0042】
図5を参照すると、放射型アルゴリズム500は、テストおよびトレーニングデータを受信する(ブロック502)。次いで、テストおよびトレーニングデータが正規化される(ブロック504)。最小値-最大値スケーリングまたはZスコア正規化を利用し得る。特定のカーネルが選択される(ブロック506)。カーネルは、線形、多項式、および放射型分類器(RBF)カーネルを含み得る。次いで、カーネルのパラメータ範囲が決定される(ブロック508)。例えば、RBFカーネルの場合、γ値は、10~1000の範囲であり得る。次いで、放射型アルゴリズム500は、SVMがハードマージンを有するか、またはソフトマージンを有するかを決定する(決定ブロック510)。マージンがソフトである場合、スラックペナルティ変数Cの範囲が決定される(ブロック512)。例えば、範囲は、0.01~30であり得る。一旦Cの範囲が決定されるか、またはマージンがハードである場合、グリッド検索が、トレーニングデータセットのパラメータの範囲(複数可)に対して実施される(ブロック514)。グリッド検索は、パラメータの範囲をパラメータの特定の組み合わせに変換し得る。例えば、前述の範囲のグリッド値は、C=0.01、γ=10、C=3、γ=10o、およびC=30、γ=1000であり得る。他の値を利用してもよい。次いで、テストデータを利用して、グリッド検索によって生成されたモデルをテストし、モデルパラメータを選択し得る(ブロック516)。モデルは、動作効率、精度、確度などに基づいて選択され得る。次いで、選択されたモデルは、4分割交差検証法を利用して検証される(ブロック518)。テストおよびトレーニングデータは、4つのグループに分割され得る。3つのグループを利用して、選択されたパラメータを利用するモデルを再トレーニングする。次いで、第4のグループを利用して、結果として得られたモデルをテストする。これが、4回実施され、各グループは、1回は「テスト」グループとなる。モデルは、異なるデータセットでトレーニングできる能力について評価される。
【0043】
図6を参照すると、SVM qPCRアッセイモデル600は、入力データベクターを受信する(ブロック602)。入力データベクターは、FAM(登録商標)およびVIC(登録商標)蛍光色素の強度、ならびにいくつかの実施形態において、重心最小クラスタ分離シグマ(MCSS)クラスタの数、アッセイアドレス、MCSS値などの値を含む他の情報を含む、qPCRシステムからの出力であり得る。次いで、入力データベクターは、正規化される(ブロック604)。最小値-最大値スケーリングまたはZスコアの正規化を利用してもよい。SVM qPCRアッセイモデル600は、モデルをトレーニングするために利用される正規化方法を決定し、同じ方法を利用し得る。決定されたパラメータを有するカーネルが、入力データベクターに適用される(ブロック606)。これにより、正規化された入力が、トレーニング済モデルに適切な次元の空間に変換され得る。超平面が、変換された入力データベクターに適用されて、符号(すなわち、分類)が決定される(ブロック608)。3つ以上の分類が存在するので、複数の分類器(超平面)が利用され得る。分類ごとに1つの超平面が利用され得る。各超平面/分類器は、入力データベクターがその分類を有するか、またはその分類を有さないかをそれぞれ示す、符号「+1」または「-1」を返す。ただ1つの「+1」を有する入力データベクターには、その分類が与えられ得る。ブロック606およびブロック608には、以下を利用し得る。
【数3】
ここで、φは、入力データベクターに対するカーネル変換であり、wおよびbは、モデルのトレーニング中に決定されたモデルに対する超平面のパラメータである。ここでは、3つの分類が存在するので、3つの超平面が存在する。
【0044】
図7は、1つの実施形態によるクラウド学習および制御システム700を示す。クラウド学習および制御システム700は、学習システム404、例えば本明細書に開示される実施形態のうちの1つ以上を備える、クラウド分析システム710を備える。いくつかのPCR実行または他の実験(例えば、PCRラボ装置704、PCRラボ装置706、およびPCRラボ装置708)からの実験データは、インターネット702または他のネットワークを介して、クラウド分析システム710によってモニタリングされる。クラウド分析システム710は、実験データを処理し、学習された構成パラメータを、現在または将来の実験のために構成設定PCR装置を調整するためのフィードバックとして提供する。
【0045】
図8は、本発明の実施形態を組み込み得るコンピューティングデバイス800の例示的なブロック図である。
図8は、本明細書に記載の技術的プロセスの態様を実行するための機械システムの単なる例示であり、特許請求の範囲を限定するものではない。当業者は、他の変形、修正、および代替を認識するであろう。1つの実施形態において、コンピューティングデバイス800は、典型的には、モニタまたはグラフィカルユーザインターフェース802、データ処理システム820、通信ネットワークインターフェース812、入力デバイス(複数可)808、出力デバイス(複数可)806などを含む。
【0046】
図8に示されるように、データ処理システム820は、バスサブシステム818を介していくつかの周辺デバイスと通信する1つ以上のプロセッサ(複数可)804を含み得る。これらの周辺デバイスには、入力デバイス(複数可)808、出力デバイス(複数可)806、通信ネットワークインターフェース812、ならびに揮発性メモリ810および不揮発性メモリ814などの記憶サブシステムが含まれ得る。
【0047】
揮発性メモリ810および/または不揮発性メモリ814は、コンピュータ実行可能命令を記憶することができ、したがって、プロセッサ(複数可)804に適用されそれによって実行されると、本明細書に開示される分析および制御プロセスの実施形態を実装するロジック822を形成する。
【0048】
入力デバイス(複数可)808は、データ処理システム820に情報を入力するためのデバイスおよびメカニズムを含む。これらには、キーボード、キーパッド、モニタまたはグラフィカルユーザインターフェース802に組み込まれたタッチスクリーン、音声認識システムなどの音声入力デバイス、マイクロフォン、および他のタイプの入力デバイスが含まれ得る。様々な実施形態において、入力デバイス(複数可)808は、コンピュータマウス、トラックボール、トラックパッド、ジョイスティック、ワイヤレスリモート、描画タブレット、音声コマンドシステム、視線追跡システムなどとして具現化され得る。入力デバイス(複数可)808は、典型的には、ユーザが、モニタまたはグラフィカルユーザインターフェース802上に現れるオブジェクト、アイコン、制御領域、テキストなどを、ボタンのクリックなどのコマンドを介して、選択することを可能にする。
【0049】
出力デバイス(複数可)806は、データ処理システム820から情報を出力するためのデバイスおよびメカニズムを含む。これらには、当技術分野でよく理解されているように、モニタまたはグラフィカルユーザインターフェース802、スピーカ、プリンタ、赤外線LEDなどが含まれ得る。
【0050】
通信ネットワークインターフェース812は、通信ネットワーク(例えば、通信ネットワーク816)およびデータ処理システム820の外部のデバイスへのインターフェースを提供する。通信ネットワークインターフェース812は、他のシステムからデータを受信し、他のシステムにデータを送るためのインターフェースとして機能し得る。通信ネットワークインターフェース812の実施形態には、イーサネットインターフェース、モデム(電話、衛星、ケーブル、ISDN)、(非同期)デジタル加入者線(DSL)、FireWire、USB、BluetoothまたはWi-Fiなどの無線通信インターフェース、近距離通信無線インターフェース、携帯電話インターフェースなどが含まれ得る。
【0051】
通信ネットワークインターフェース812は、アンテナ、ケーブルなどを介して通信ネットワーク816に結合され得る。いくつかの実施形態において、通信ネットワークインターフェース812は、データ処理システム820の回路基板上に物理的に統合され得るか、または場合によっては、「ソフトモデム」などのソフトウェアもしくはファームウェアなどで実装され得る。
【0052】
コンピューティングデバイス800は、HTTP、TCP/IP、RTP/RTSP、IPX、UDPなどのプロトコルを使用して、ネットワークを介した通信を可能にするロジックを含み得る。
【0053】
揮発性メモリ810および不揮発性メモリ814は、本明細書に記載のプロセスの様々な実施形態を実装するためのコンピュータ可読データおよび命令を記憶するように構成された有形媒体の例である。他のタイプの有形媒体には、リムーバブルメモリ(例えば、プラグイン式USBメモリデバイス、モバイルデバイスSIMカード)、CD-ROM、DVDなどの光記憶媒体、フラッシュメモリなどの半導体メモリ、非一時的な読み取り専用メモリ(ROMS)、バッテリバックアップされた揮発性メモリ、ネットワーク化された記憶デバイスなどが含まれる。揮発性メモリ810および不揮発性メモリ814は、開示されたプロセスと、本発明の範囲内にある、それらの他の実施形態との機能を提供する、基本的なプログラミングおよびデータ構成を記憶するように構成され得る。
【0054】
本発明の実施形態を実装するロジック822は、揮発性メモリ810および/または不揮発性メモリ814によって具現化され得る。当該ロジック822の命令は、揮発性メモリ810および/または不揮発性メモリ814から読み取られ、プロセッサ(複数可)804によって実行され得る。揮発性メモリ810および不揮発性メモリ814はまた、ロジック822によって使用されるデータを記憶するための保存場所を提供し得る。
【0055】
揮発性メモリ810および不揮発性メモリ814は、プログラム実行中に命令およびデータを記憶するための主ランダムアクセスメモリ(RAM)と、読み取り専用の非一時的命令が記憶されている読み取り専用メモリ(ROM)と、を含む、いくつかのメモリを含み得る。揮発性メモリ810および不揮発性メモリ814は、プログラムおよびデータファイルのための永続的(不揮発性)記憶装置を提供するファイル記憶サブシステムを含み得る。揮発性メモリ810および不揮発性メモリ814は、リムーバブルフラッシュメモリなどのリムーバブル記憶システムを含み得る。
【0056】
バスサブシステム818は、データ処理システム820の様々なコンポーネントおよびサブシステムが意図されたように互いに通信することを可能にするためのメカニズムを提供する。通信ネットワークインターフェース812は、単一バスとして概略的に示されているが、バスサブシステム818のいくつかの実施形態は、複数の別個のバスを利用し得る。
【0057】
コンピューティングデバイス800が、スマートフォン、デスクトップコンピュータ、ラップトップコンピュータ、ラックマウント型コンピュータシステム、コンピュータサーバ、またはタブレットコンピュータデバイスなどのデバイスであり得ることは、当業者には容易に明らかであろう。当技術分野で一般に知られているように、コンピューティングデバイス800は、複数のネットワーク化されたコンピューティングデバイスの集合として実装され得る。さらに、コンピューティングデバイス800は、典型的には、そのタイプおよび性質が当技術分野で周知のオペレーティングシステムロジック(図示せず)を含むであろう。
【0058】
追加の用語および解釈
本明細書で使用される用語は、関連技術におけるそれらの通常の意味、または文脈におけるそれらの使用によって示される意味を与えられるべきであるが、明示的な定義が提供される場合、その意味が制御する。
【0059】
「カーネル」は、高次元の暗黙的な特徴空間内で、その空間におけるデータの座標を計算することなく、むしろ特徴空間内のすべてのデータ対の射影間の内積を計算するだけで動作する、カーネル関数を指す。この動作は、多くの場合、座標の明示的な計算よりも計算コストが低くなる。SVMで使用する場合、このアプローチは、「カーネルトリック」と呼ばれる。
【0060】
「サポートベクターマシン」は、分類および回帰分析に使用されるデータを分析する関連学習アルゴリズムを有する教師あり学習モデルを指す。2つのカテゴリのうちの一方または他方に属すると各々がマークされたトレーニング例のセットが与えられると、SVMトレーニングアルゴリズムは、新しい例を一方または他方のカテゴリに割り当てるモデルを構築し、それを非確率的バイナリ線形分類器とする。SVMモデルは、個別のカテゴリの例が可能な限り広い明確なギャップによって分割されるようにマッピングされた、空間内の点としての例の表現である。次いで、新しい例が、同じ空間内にマッピングされ、それらがギャップのどちら側にあるかに基づいて、あるカテゴリに属すると予測される。線形分類を実施することに加えて、SVMは、いわゆるカーネルトリックを使用して非線形分類を効率的に実施し、入力を高次元の特徴空間内に暗黙的にマッピングすることができる。
【0061】
本明細書における「回路」は、少なくとも1つの個別の電気回路を有する電気回路、少なくとも1つの集積回路を有する電気回路、少なくとも1つの用途固有の集積回路を有する電気回路、コンピュータプログラムによって構成される汎用コンピューティングデバイス(例えば、本明細書に記載のプロセスもしくはデバイスを少なくとも部分的に実行するコンピュータプログラムによって構成される汎用コンピュータ、または本明細書に記載のプロセスもしくはデバイスを少なくとも部分的に実行するコンピュータプログラムによって構成されるマイクロプロセッサ)を形成する回路、メモリデバイスを形成する回路(例えば、ランダムアクセスメモリの形式)、または通信デバイス(例えば、モデム、通信スイッチ、または光電気機器)を形成する回路を指す。
【0062】
本明細書における「ファームウェア」は、読み取り専用メモリまたは媒体に記憶されたプロセッサ実行可能命令として具現化されたソフトウェアロジックを指す。
【0063】
本明細書における「ハードウェア」は、アナログまたはデジタル回路として具現化されたロジックを指す。
【0064】
本明細書における「ロジック」は、制御および/または手順信号、および/または設定および値(例えば、抵抗、インピーダンス、静電容量、インダクタンス、電流/電圧定格など)を備える、その材料および/または材料エネルギー構成経由の、デバイスの動作に影響を与えるように、適用され得る、機械メモリ回路、非一時的機械可読媒体、および/または回路を指す。磁気媒体、電子回路、電気および光メモリ(揮発性および不揮発性の両方)、ならびにファームウェアは、ロジックの例である。ロジックは、具体的には、純粋な信号またはソフトウェア自体を除外する(しかしながら、ソフトウェアを含み、それによって事柄の構成を形成するマシンメモリは除外しない)。
【0065】
本明細書における「ソフトウェア」は、マシンメモリ内のプロセッサ実行可能命令(例えば、揮発性または不揮発性メモリまたは媒体を読み取る/書き込む)として実装されるロジックを指す。
【0066】
本明細書において、「1つの実施形態」または「一実施形態」への言及は、そういう場合もあるが、必ずしも同じ実施形態を指すとは限らない。文脈が明確に別様に要求しない限り、説明および特許請求の範囲全体を通して、「備える」、「備えている」などの語は、排他的または網羅的な意味ではなく、包括的な意味、つまり、「含むがこれに限定されない」という意味で解釈されるべきである。単数形または複数形を使用する語は、明示的に単一のものまたは複数のものに限定されない限り、それぞれ複数形または単数形も含む。追加的に、「本明細書に」、「上記に」、「以下に」という語および同様の意味の語は、本出願で使用される場合、本出願を全体として指し、本出願のいかなる特定の部分を指すものではない。請求項が2つ以上の項目の列挙を参照して「または」という語を使用する場合、その語は、明示的に一方または他方に限定されない限り、以下の解釈のすべてを網羅する:列挙内の項目のうちのいずれか、列挙内の項目のすべて、および列挙内の項目の任意の組み合わせ。本明細書で明示的に定義されていない任意の用語は、関連技術の当業者(複数可)によって一般的に理解されるような従来の意味を有する。
【0067】
本明細書に記載の様々な論理機能動作は、動作または機能を反映する名詞または名詞句を使用して参照されるロジックで実装され得る。例えば、関連付け動作は、「アソシエータ」または「コレレータ」によって実行され得る。同様に、スイッチングは、「スイッチ」によって、選択は「セレクタ」によって実行され得るなどとなり得る。