(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-07-14
(54)【発明の名称】スマートqPCR
(51)【国際特許分類】
C12M 1/00 20060101AFI20230707BHJP
C12Q 1/6851 20180101ALI20230707BHJP
G01N 33/50 20060101ALI20230707BHJP
【FI】
C12M1/00 A
C12Q1/6851 Z
G01N33/50 P
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022577273
(86)(22)【出願日】2021-06-11
(85)【翻訳文提出日】2023-02-13
(86)【国際出願番号】 US2021037130
(87)【国際公開番号】W WO2021257412
(87)【国際公開日】2021-12-23
(32)【優先日】2020-06-15
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】502221282
【氏名又は名称】ライフ テクノロジーズ コーポレーション
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100098475
【氏名又は名称】倉澤 伊知郎
(74)【代理人】
【識別番号】100130937
【氏名又は名称】山本 泰史
(74)【代理人】
【識別番号】100144451
【氏名又は名称】鈴木 博子
(74)【代理人】
【識別番号】100123630
【氏名又は名称】渡邊 誠
(72)【発明者】
【氏名】ジョージ ウォレス
(72)【発明者】
【氏名】チャンダ ディーパンカー
【テーマコード(参考)】
2G045
4B029
4B063
【Fターム(参考)】
2G045DA12
2G045DA13
2G045DA14
2G045FB01
2G045FB02
4B029AA23
4B063QA01
4B063QQ41
4B063QR08
4B063QR42
4B063QR62
4B063QR66
4B063QS25
4B063QS34
4B063QX02
(57)【要約】
人工ニューラルネットワークを使用して、特定の試料が標的分子を含むか否かに関する、改善された自動化された予測を提供する、深層学習方法を実装する、本発明の実施形態が開示されている。いくつかの実施形態において、畳み込みニューラルネットワークが使用される。いくつかの実施形態において、人工ニューラルネットワークは、クラス重み付けされた誤差判定を使用してトレーニングされる。これら及び他の実施形態が、本明細書に開示されている。
【選択図】
図1
【特許請求の範囲】
【請求項1】
非一時的コンピュータ可読媒体に記憶された実行可能コードを備えるコンピュータプログラム製品であって、前記実行可能コードは、定量ポリメラーゼ連鎖反応(qPCR)機器の出力の処理に使用するための人工ニューラルネットワークを実装するために1つ以上のコンピュータプロセッサ上で実行可能であり、前記qPCR機器は、前記qPCR機器を使用して実施される1つ以上のqPCR検定から増幅データを生成するように構成され、前記人工ニューラルネットワークは、
前記qPCR機器の複数の熱サイクルの各サイクル後に測定された蛍光値に対応する増幅データから得られる入力データを受信するように構成された、入力層と、
1つ以上の畳み込み層を備える、複数の隠れ層と、
出力層と、
を備え、
前記人工ニューラルネットワークは、前記qPCR機器によって処理される特定の生体試料に対応する入力データを使用して、前記生体試料の複数の可能な増幅分類から選択される増幅分類を判定するように構成されている、コンピュータプログラム製品。
【請求項2】
前記入力データは、複数のサイクルの各々において、正規化された蛍光値、及び前記増幅データに対する曲線フィットの1つ以上の導関数値を含む、請求項1に記載のコンピュータプログラム製品。
【請求項3】
前記増幅データに対する前記曲線フィットは、前記正規化された蛍光値に対する曲線フィットである、請求項2に記載のコンピュータプログラム製品。
【請求項4】
前記1つ以上の導関数値は、少なくとも3つの導関数値を含む、請求項2に記載のコンピュータプログラム製品。
【請求項5】
前記1つ以上の導関数値は、少なくとも4つの導関数値を含む、請求項2に記載のコンピュータプログラム製品。
【請求項6】
前記複数の隠れ層は、1つ以上の分離可能な畳み込み層を備える、請求項1~5のいずれか一項に記載のコンピュータプログラム製品。
【請求項7】
前記複数の隠れ層は、1つ以上の分離可能な畳み込み層と、1つ以上の通常の畳み込み層と、を備える、請求項1~5のいずれか一項に記載のコンピュータプログラム製品。
【請求項8】
前記複数の隠れ層は、複数の完全接続層を更に備える、請求項1に記載のコンピュータプログラム製品。
【請求項9】
前記複数の隠れ層は、プーリング層を備えるが、完全接続層を備えない、請求項1~7のいずれか一項に記載のコンピュータプログラム製品。
【請求項10】
前記複数の可能な増幅分類は、増幅されている、増幅されていない、及び不定を含む、請求項1~9のいずれか一項に記載のコンピュータプログラム製品。
【請求項11】
前記可能な増幅分類の各々の増幅分類は、確率として表現される、請求項1~10のいずれか一項に記載のコンピュータプログラム製品。
【請求項12】
定量ポリメラーゼ連鎖反応(qPCR)機器の出力を処理するために人工ニューラルネットワークをトレーニングする方法であって、前記qPCR機器は、前記qPCR機器を使用して実施される1つ以上のqPCR検定から増幅データを生成するように構成され、前記人工ニューラルネットワークは、前記増幅データを使用して、複数の分類を使用して、前記増幅データに対応する増幅結果を分類するように処理され、前記方法は、
トレーニング試料に対してqPCRを実施することから得られるトレーニング増幅データを、前記人工ニューラルネットワークに提供することと、
前記複数の分類の各々についてクラス重みを判定することであって、前記クラス重みが、前記複数の分類の各分類に属するトレーニング試料の一部に対応する、判定することと、
前記クラス重みを使用して、特定のトレーニング試料について、前記人工ニューラルネットワークによってなされた分類判定に対応するクラス重み付けされた誤差判定を得ることと、
前記クラス重み付けされた誤差判定を使用して、前記人工ニューラルネットワークのパラメータ値を調節し、誤差を低減することと、を含む、方法。
【請求項13】
複数のそれぞれの分類に対応する複数のそれぞれのクラス重み付け誤差判定は、前記トレーニングデータにおいてより少なく表される分類を、前記トレーニングデータにおいてより多く表される前記複数の分類のうちの別のものを重み付けするよりも、より大きく重み付けする、請求項12に記載の方法。
【請求項14】
前記複数の分類は、増幅されている、増幅されていない、及び不定を含む、請求項12又は13に記載の方法。
【請求項15】
前記複数の分類の各々は、確率として表現される、請求項12~14のいずれか一項に記載の方法。
【請求項16】
前記クラス重み付けされた誤差判定を得るために、交差エントロピー損失関数がクラス重みと組み合わせて使用される、請求項12~15のいずれか一項に記載の方法。
【請求項17】
非一時的コンピュータ可読媒体に記憶された実行可能コードを備えるコンピュータプログラム製品であって、前記実行可能コードは、人工ニューラルネットワークを使用して定量ポリメラーゼ連鎖反応(qPCR)機器の出力を処理するために1つ以上のコンピュータプロセッサ上で実行可能であり、前記qPCR機器は、前記qPCR機器を使用して実施される1つ以上のqPCR検定から増幅データを生成するように構成され、前記実行可能コードは、増幅データを前処理して、前記人工ニューラルネットワークの入力層への入力データとして提供するための前処理されたデータを得るために、前記1つ以上のコンピュータプロセッサ上で実行可能であり、前記前処理は、
前記増幅データが、前記人工ニューラルネットワークの入力層の対応する次元のサイズとは異なる、前記qPCR機器のサイクルの数に対応するか否かを判定することと、
前記サイクルの数が前記サイズと異なる場合、前記前処理されたデータを前記サイズにフィッティングすることと、を含む、コンピュータプログラム製品。
【請求項18】
前記前処理されたデータを前記サイズにフィッティングすることは、切り捨てられたデータが前記サイズにフィットするように前記増幅データを切り捨てることを含む、請求項17に記載のコンピュータプログラム製品。
【請求項19】
前記前処理されたデータを前記サイズにフィッティングすることは、補間されたデータが前記サイズにフィットするように前記増幅データを補間することを含む、請求項17に記載のコンピュータプログラム製品。
【請求項20】
前記前処理されたデータは、前記切り捨てられたデータで表される各サイクルに対する1つ以上の導関数値を更に含み、前記1つ以上の導関数値は、切り捨てられていないデータに対する曲線フィットに基づいて判定される、請求項18に記載のコンピュータプログラム製品。
【請求項21】
前記前処理されたデータは、前記補間されたデータで表される各サイクルに対する1つ以上の導関数値を更に含み、前記1つ以上の導関数値は、補間されていないデータに対する曲線フィットに基づいて判定される、請求項19に記載のコンピュータプログラム製品。
【請求項22】
前記人工ニューラルネットワークは、1つ以上の畳み込み層を備える、請求項17~21のいずれか一項に記載のコンピュータプログラム製品。
【請求項23】
定量ポリメラーゼ連鎖反応(qPCR)システムであって、
生体試料を処理し、前記試料に対応する増幅データを生成するように構成された、qPCR機器と、
前記増幅データを受信するように、かつ請求項1~11及び17~22のいずれか一項に記載のコンピュータプログラム製品の実行可能命令コードを受信、記憶、及び実行するように構成された、1つ以上のコンピュータと、を備える、定量ポリメラーゼ連鎖反応システム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年6月15日に出願された米国仮特許出願第63/039,307号の優先権の利益を主張するものである。本文献及び本明細書で考察される他の全ての外部資料は、その全体が参照により組み込まれるものとする。
【背景技術】
【0002】
本開示は、概して、標的が生体試料中に存在するか否かを判定するための技術に関する。
【0003】
リアルタイム(定量としても既知である)ポリメラーゼ連鎖反応(qPCR)実験から得られる増幅曲線は、標的が生体試料(例えば血液又は食物試料)中に存在するか否かを判定するために使用され得る。典型的なqPCR実験において、試料の蛍光は、実験の各熱サイクル後に測定される。特定の試料と関連付けられたサイクル番号に対する蛍光値のプロットは、その試料の増幅曲線を形成する。従来、アルゴリズムが増幅曲線を分析し、及び/又は人間が増幅曲線をレビューし、増幅曲線の特性の視覚的な、又は他の分析に基づいて、関連する試料が増幅されたことを判定し、そのことが、標的分子が試料内に存在していたことを示す。関連する試料が増幅されたことを判定するための典型的なアルゴリズム技術は、関連付けられた増幅曲線が、固定された、又は増幅曲線の特性に基づいて算出された閾値を超えたか否かを判定することを伴う。閾値を超えた場合、曲線は増幅されていると判定され、閾値を超えない場合、曲線は、増幅されていないと判定される。
【発明の概要】
【0004】
増幅の自動的な判定は、試料分析のスループットを増加させるために重要であり、そのことが、科学研究を促進し、かつ時間的制約がある臨床的に重要な情報の提供を改善し得る。増幅を自動的に判定する既存の方法は、精度を改善するための技術及びパラメータの組み合わせに依存してきた。しかしながら、より良好な精度が必要とされている。本発明の実施形態は、人工ニューラルネットワークを使用して、特定の試料が標的分子を含むか否かに関する、改善された自動化された予測を提供する、深層学習法を実装する。
【図面の簡単な説明】
【0005】
【
図1】本発明の実施形態によるシステムを例解する。
【
図2】1つ以上のコンピュータプロセッサによって実行されたときに、
図1の実施形態のコンピュータプログラム製品によって実装される人工ニューラルネットワークを例解する。
【
図3】
図2に例解された前処理ブロックの更なる詳細を例解する。
【
図4】本発明の実施形態によるニューラルネットワークをトレーニングする方法を例解するフロー図である。
【0006】
本発明は、以上の図面を参照しながら説明されるが、図面は、例解的であることが意図されており、他の実施形態も本発明の趣旨に合致しその範囲内である。
【発明を実施するための形態】
【0007】
ここで、様々な実施形態が、実施形態の実施の具体例の一部を形成し、例解として実施形態の具体例を図示する添付図面を参照しながら、より完全に説明される。しかしながら、本明細書は、多くの異なる形態で具現化され得、本明細書に提示された実施形態に限定されるものと解釈されるべきではなく、むしろ、これらの実施形態は、本明細書が完全かつ完成したものとなり、当業者に本発明の範囲を十分に伝えるように提供される。数ある中でも、本明細書は、方法又はデバイスとして具現化され得る。したがって、本明細書の様々な実施形態のいずれも、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、又はソフトウェア及びハードウェアの態様を組み合わせた実施形態の形態を採り得る。したがって、以下の明細は、限定的な意味で解釈されるべきではない。
【0008】
図1は、本発明の例示的な実施形態によるシステム1000を例解する。システム1000は、ポリメラーゼ連鎖反応(「PCR」)機器101、1つ以上のコンピュータ103、及びユーザデバイス107を備える。
【0009】
人工ニューラルネットワーク102を実装するための命令は、記憶装置105に記憶されているコンピュータプログラム製品104内に存在し、これらの命令はプロセッサ106によって実行可能である。プロセッサ106がコンピュータプログラム製品104の命令を実行しているとき、その命令又はその一部は、典型的には作業メモリ109にロードされ、その命令はそこからプロセッサ106によって容易にアクセスされる。例解された実施形態において、コンピュータプログラム製品104は、記憶装置105又は別の非一時的コンピュータ可読媒体(異なるデバイス及び異なる場所における媒体にわたって分散されることを含み得る)に記憶される。代替的な実施形態において、記憶媒体は一時的なものである。
【0010】
一実施形態において、プロセッサ106は実際には、大規模な並列計算をサポートする少なくとも数千個の算術論理ユニットを備えるグラフィックス処理ユニット(GPU)を含む、追加的な作業メモリ(個別に例解されていない追加的なプロセッサ及びメモリ)を備え得る、複数のプロセッサを備える。GPUは、典型的な汎用プロセッサ(CPU)よりも効率良く関係する処理タスクを実行することができるため、深層学習アプリケーションにおいて利用されることが多い。他の実施形態は、効率良い並列処理をサポートするシストリック配列及び/又は他のハードウェア構成を備える、1つ以上の特殊な処理ユニットを備える。いくつかの実施形態において、かかる特殊なハードウェアは、CPU及び/又はGPUと連動して動作して、本明細書に説明される様々な処理を実行する。いくつかの実施形態において、かかる特殊なハードウェアは、特定用途向け集積回路等(特定用途向けである集積回路の一部を指し得る)、フィールドプログラマブルゲートアレイ等、又はそれらの組み合わせを備える。しかしながら、いくつかの実施形態において、プロセッサ106のようなプロセッサは、必ずしも本発明の趣旨及び範囲から逸脱することなく、1つ以上の汎用プロセッサ(好ましくは複数のコアを有する)として実装され得る。
【0011】
ユーザデバイス107は、ニューラルネットワーク102によって実行された処理の結果を表示するためのディスプレイ108を含む。代替的な実施形態において、ニューラルネットワーク102のようなニューラルネットワーク又はその一部は、記憶デバイスに記憶され、PCR機器101及び/又はユーザデバイス107に存在する1つ以上のプロセッサによって実行され得る。かかる代替案は、本発明の範囲から逸脱しない。
【0012】
図2は、
図1の実施形態のコンピュータプログラム製品に記憶された命令の実行によって実装される、ニューラルネットワーク102の一実施形態の詳細を例解する。例解された実施形態を要約すると、ニューラルネットワーク102は、主に畳み込みニューラルネットワークである。一般的に、ここで説明されるような畳み込みニューラルネットワークは、少なくとも1つの畳み込み層を有するが、畳み込み層に加えて他のタイプの層(例えば多層パーセプトロン(MLP)層)を有することが多い。ニューラルネットワーク102への入力は、分析される試料の増幅曲線に対応する。具体的には、それらはPCR実験の各熱サイクル後に測定される蛍光に対応する正規化された蛍光値であり、増幅曲線と称されることが多い。例解された実施形態において、入力はまた、同じ点の各々におけるその曲線の1次、2次、及び3次導関数値を含む。代替的な実施形態において、高次及び低次の導関数の異なる組み合わせを使用することができる。1つの代替的な実施形態において、入力は、増幅曲線の1次、2次、3次、及び4次導関数値を含む。
【0013】
例解された実施形態において、ニューラルネットワークの3つの出力は、(1)試料が増幅した(関心のある系列が存在した)確率、(2)試料増幅がデータからは不定である(関心のある系列が存在したか否かが不定である)確率、及び(3)試料が増幅しなかった(関心のある系列が存在しなかった)確率を含む。
【0014】
畳み込みニューラルネットワークにおいて、畳み込み層への入力は、1つ以上の「フィルタ」を用いて畳み込まれ、各フィルタは、値の配列(1次元又は多次元)を含む。畳み込みは、入力にわたってフィルタ値を一緒に、かつ段階的に移動させ、各段階において、入力の関係する部分とフィルタとの間で、値の要素毎の乗算であるアダマール積を実行するプロセスとして理解され得る。各ステップにおけるアダマール積の出力は、合計されて、出力配列の一部となる単一の値を生成する。これは典型的には「特徴マップ」と称される。特徴マップは、フィルタが配列にわたって段階的に移動するにつれて、値毎に埋められる。1つ以上の特徴マップは、畳み込み層の畳み込み演算の出力である。これらの特徴マップは、例えば、整流線形ユニット(「ReLU」)関数のような非線形活性化関数に入力され得、その出力が、ニューラルネットワークの次の層に供給され得る。
【0015】
例解された実施形態の説明を更に詳細に続けると、ニューラルネットワーク102は、前処理ブロック220、入力層210、隠れ層230、及び出力層250を備える。前処理ブロック220は、典型的には、40サイクルのPCR実験の各サイクル後に検出される蛍光値に対応する40個の入力である、入力C1~C40を受け取る(すなわち、入力C1~C40は、PCR実験によって処理される試料の増幅曲線に対応する)。実際には、60回にも及ぶ入力サイクルが存在し得る。以下で更に考察される代替的な実施形態において、40回のサイクルより多い又は少ないサイクルを使用するPCR実験に起因する増幅曲線は、様々な技術を使用して、例解された実施形態によって処理することができる。一般性を損なうことなく、40サイクルの入力の場合に基づいて説明することとする。前処理ブロック220は、所与の増幅曲線の正規化された値が1の最大値(最大値ノルム)を有し、いくつかの代替的な実施形態においては0の最小値も有するように、増幅曲線値を正規化する。前処理ブロック220はまた(
図3の状況において以下に更に説明されるように)、40個の正規化された蛍光値から、40個の増幅曲線の点の各々における平滑化された1~n次の導関数を判定する。実際には、一般的な用法は、平滑化された4次導関数の使用で止まることであり得る。これらの導関数はまた、各導関数について1の最大値を有するような最大値ノルムのものとされる。代替的に、これらの導関数は、各導関数について1の絶対最大値を有するような絶対最大ノルムのものとすることができる。例解された例において、前処理ブロック220は、1次、2次、及び3次導関数値を計算する。前処理ブロックは、2次元の40X4配列についての値を、入力層210に提供する。入力配列は、40個の列及び4個の行を有し、40個の列は、PCR実験の40回のサイクルに対応し、4個の行はそれぞれ、増幅曲線の40回のサイクルの各々における正規化された蛍光値並びにその正規化された1次、2次及び3次導関数に対応していると理解され得る。
【0016】
入力層210は、入力データの40X4の配列を、分離可能な畳み込み層231に提供する。例解された実施形態において、分離可能な畳み込み層231は、16個の異なるフィルタ(「カーネル」とも称される)を利用する。一実施形態において、フィルタは、3X4であり、すなわち、各フィルタは、3つの値の長さと、入力データの深度に対応する4つの値の深度と、を有する。各フィルタ値は、その最適値がニューラルネットワークのトレーニングプロセスを通して学習される、重みパラメータである。代替的な実施形態において、本明細書に説明される畳み込み層及び分離可能な畳み込み層の各々において、より多くの又はより少ないフィルタを使用することができる。ここで例解されている実施形態に図示されているフィルタの数は好ましいものであるが、本発明の趣旨及び範囲から必ずしも逸脱することなく、代替の実施形態においては、異なり得る。
【0017】
例解された実施形態において、畳み込み層は1のストライドを使用し、増幅曲線の各端部にゼロを追加することによって入力データの各行がパディングされる、「Same」パディングを使用する。これは、畳み込みプロセスが、入力データと同じ長さ次元を有する(層231の場合、その長さは40である)特徴マップを作成することを可能にする。代替的な実施形態は、必ずしも本発明の趣旨及び範囲から逸脱することなく、異なるパディング、例えばValidパディングを使用する。
【0018】
分離可能な畳み込み層231は、深度毎の分離可能な畳み込みを実行する。この実施形態において、それは、40X4の入力配列が、各々が40X1のサイズである4つの「サブ」配列に分離されることを意味する。同様に、各3X4フィルタは、各々が3X1のサイズである4つの「サブ」フィルタに分離される。各それぞれのサブ配列は、それぞれのサブフィルタを用いて畳み込まれ、40X1の特徴マップを作成する。その結果の特徴マップは、「積層」され、40X4の特徴マップを提供する。この40X4の特徴マップに対して、1X4のフィルタを用いて畳み込まれる、点毎の畳み込みが実行される。この点毎のステップは、40X1配列を出力し、これは、40X4の入力配列を用いた3X4のフィルタの通常の畳み込みの場合に結果として得られるであろうものと同じサイズの特徴マップである。
【0019】
40X4の入力データに対して、16個の異なる3X4のフィルタの各々について、分離可能な畳み込みが実行される。これは、40X16の出力データに帰着する。例解された実施形態において、この出力データは、最終的な40X16のデータが後続する層に出力される前に、非線形活性化関数を通過させられる。この実施形態において、この関数は、ReLU関数であり、全ての負の値がゼロに変更され、全ての正の値が変更されないことを意味する。代替的な実施形態において、他の活性化関数が使用され得る。ここで例解されている実施形態において、活性化関数は、例解されている各畳み込み層の出力において使用されるが、これらの活性化関数のための処理ブロックは、図面においては別個に図示されてはいない。
【0020】
その結果のデータは次いで、分離可能な畳み込み層232に渡される。分離可能な畳み込み層232は、16個ではなく8個だけのフィルタが使用され、したがって40X8の出力配列に帰着することを除いて、層231が実行するものと同じタイプの分離可能な畳み込み演算を実行する。例解された実施形態において、層232についてのフィルタサイズは、40X16の入力データの深度に合致するように、3X16である。
【0021】
分離可能な畳み込み層232は、その出力をプーリング層233に渡す。ここで例解されている実施形態において、プーリング層233は、8のデータ深度を維持しながら、データ長を40から20に低減させるために、平均プーリングを適用する。これは、例えば、20X8のデータ配列を出力するために、各深度におけるデータにわたって2X1のウィンドウを動作させ、各ウィンドウ内の値の平均を取ることによって達成され得る。例解された実施形態において、平均プーリングが使用される。代替的な実施形態において、最大値プーリング、最小値プーリング、又は他のタイプのプーリングが使用される。
【0022】
プーリング層233により出力された20X8のデータは、分離可能な畳み込み層234によって処理される。この層は16個のフィルタを使用し、20X16のデータ配列を出力する。分離可能な畳み込み層235は、層234から出力された20X16の配列を受け取り、それを処理するために8個のフィルタを使用し、したがって畳み込み層236に20X8配列を出力する。
【0023】
畳み込み層236は、8個のフィルタを使用して通常の畳み込みを実行する。通常の畳み込みにおいは、フィルタとデータとは、畳み込みに先立って「サブフィルタ」と「サブ配列」とに分離されることはない。むしろ、所与のフィルタは、データ配列全体を通してステップ状とされ、したがって、各フィルタの畳み込み処理は、単一の特徴マップに帰着する。この実施形態において、各フィルタは、入力配列のデータ深度に合致するように3X8であり、行の各端部におけるパディングとともに、各特徴マップの長さが入力配列の長さに合致することを可能とする。しかしながら、代替的な実施形態において、異なる深度フィルタが使用され得、出力配列の長さは、必ずしも入力配列の長さと合致する必要はない。例解された実施形態において、各フィルタの入力配列との畳み込みは、20X1の特徴マップに帰着する。所与の8個のフィルタに対して、層236は、20X8の配列を畳み込み層237に出力し、この畳み込み層237が、同様に8個のフィルタを使用して、データに対して同じ通常の畳み込み演算を実行し、20X8のデータをプーリング層238に出力する。
【0024】
プーリング層238は、プーリング層233と同様に動作して、入力データの長さを半分に(20から10に)低減し、したがって、プーリング層238は、10X8の配列出力を、分離可能な畳み込み層239に提供する。
【0025】
分離可能な畳み込み層239は、16個のフィルタを適用し、10X16のデータを、分離可能な畳み込み層240に出力する。層240は、8個のフィルタを適用する分離可能な畳み込みを実行し、畳み込み層241に10X8のデータを出力する。
【0026】
畳み込み層241は、3個のフィルタを適用して、プーリング層242への10X3の出力を生成する。ポーリング層242は、グローバル平均プーリングを適用して1X3の出力をソフトマックス層243に提供し、このソフトマックス層243は、ソフトマックス関数を適用して、合計が1になる確率の形態で、出力層250への1X3の出力を生成する。出力層250は、3つの値:P1、P2、及びP3を保持する。P1は、分析された増幅曲線データが、標的系列が存在した試料(増幅された試料系列)に対応する確率である。P3は、分析された増幅曲線データが、標的配列が存在しなかった試料(増幅されていない試料系列)に対応する確率である。また、P2は、分析された増幅曲線データが、標的配列が存在したか否かを判定することができない試料に対応する確率である。
【0027】
本発明の実施形態は、特定の典型的なニューラルネットワークの態様を含むが、本発明の範囲内の例解される実施形態及び代替的な実施形態の他の多くの態様が、PCR機器によって処理される試料中に対象の標的物質が存在するか否かを自動的に判定するという状況において、コンピュータ処理効率と結果の正確さとの最適なバランスを達成する、特定のニューラルネットワーク構造、入力及び入力前処理選択、並びに学習方法を備える。例えば、
図2に図示される特定のニューラルネットワーク構造は、選択された代替的な変形とともに、PCR増幅の判定を自動化するための、許容可能な計算予測及び効率性能を提供する。許容可能な精度は、通常の畳み込み層のみを使用する(分離可能な畳み込み層を用いない)実施形態においても見出され、かかる実施形態は、当然ながら本発明の範囲内である。同時に、
図2の実施形態に図示されるように、層のいくつか又は多くにおける分離可能な畳み込みの使用は、優れた精度を依然として提供しながら、学習されるべきニューラルネットワークパラメータの数を低減させるという利点を提供する。
【0028】
例解された実施形態は、40ノードの入力層を提供する。多くのPCR検定は、試料を40回の熱サイクルに曝し、各サイクル後に蛍光を測定し、したがってニューラルネットワークに供給するための40個の別個のデータ点を提供する。40回のサイクルの増幅曲線を含むトレーニングデータのより大きな利用可能性は、例解された実施形態が、異なるサイズの入力層ではなく、40ノードの入力層を実装する、重要な理由である。代替的な実施形態において、40個のノードよりも大きい又は小さいサイズを有する入力層が使用され得る。しかしながら、かかる代替例は、適切なサイズの入力データを用いてニューラルネットワークを再トレーニングすることを必要とするであろう。したがって、例えば、より多くのサイクルの回数を有する実験を用いた、40サイクルのデータに対して既にトレーニングされているネットワークの使用に対応するための有益な解決法は、40ノードの入力層を有するニューラルネットワークにフィットするように切り捨て又は補間を利用することである。いくつかの場合において、これらの実施形態は、データ入力の前処理に関して、異なるアプローチを必要とする。関係する技術の実施形態は、
図3の状況において以下に更に考察される。
【0029】
図3は、
図2に例解された実施形態の前処理ブロック220の更なる詳細を例解する。例解されているように、前処理ブロック220は、正規化ブロック310及び導関数入力判定ブロック320を含む。
【0030】
例解された実施形態において、40個の増幅曲線値が、正規化ブロック310によって正規化される。具体的には、正規化ブロック310は、増幅曲線について測定された蛍光値を受け取る。「増幅曲線」という用語は、実際には、特定の試料の増幅プロセスの各サイクルの後に取られた蛍光測定値に基づく蛍光値のセットを指す。これらの離散値は、技術的にはそれ自体「曲線」ではないが、それらは、曲線がフィットされ得る値であり、「増幅曲線」という用語は、離散値のセット自体及び/又はそれらの値にフィットされ得る曲線を大まかに指すために本分野において使用されることが多い。
【0031】
測定された蛍光値は、典型的には相対蛍光単位(「RFU」)で表現される。ブロック310は、各曲線の値を正規化し、各曲線について最小値及び最大値が同じになるように正規化された値を得る。例解された実施形態において、正規化後の各曲線についての最小値が0であり、各曲線についての最大値が1となるような、典型的な正規化手順が使用される。正規化された増幅曲線値を含む正規化ブロック310の出力は、ニューラルネットワーク102の入力層210に提供される。
【0032】
例解された実施形態において、正規化ブロック310の出力はまた、導関数入力判定ブロック320に提供される。例解された実施形態において、導関数入力判定ブロック320は、増幅曲線に対応する40個の値の各々について、それら40個の値に対する曲線フィットの、対応するサイクルにおける1次、2次、及び3次の導関数を判定する。代替的な実施形態において、他の次数の導関数値が判定され、かつ使用され得る。一実施形態において、1次、2次、3次、及び4次の導関数値が、非導関数の正規化された値とともに、判定され、かつ使用される。
【0033】
各増幅曲線について、正規化ブロック310の出力は、入力層210に提供されるデータの配列において、導関数入力判定ブロック320の出力と組み合わせられる。例えば、例解された実施形態において、所与の増幅曲線について、データの40X4の配列が提供される。この40X4の配列は、40回のサイクルの増幅プロセスの各サイクル後に試料から取られた蛍光測定値に対応する、40個の正規化された蛍光値を含み、これらの値に対する曲線フィット上のそれらの40個の点の各々において、対応する点における曲線の1次、2次、及び3次の導関数値も含む。
【0034】
40回よりも多いサイクルを用いた実験からのqPCRデータを取り扱うように適合された実施形態において、以下は、ニューラルネットワーク102によって処理される増幅曲線についてのデータが、Nが40よりも大きいN回のサイクルからのデータ(「Nサイクルデータ」)に対応する、代替的な実装形態を説明する。
【0035】
第1のかかる実施形態において、以下の処理が実行される:(a)Nサイクルデータを40サイクルに切り捨てること、及び(b)元のNサイクルデータに曲線をフィッティングし、次いで切り捨てられたデータにおける40回のサイクルの各々における曲線の導関数を判定することによって、導関数値を判定すること。
【0036】
第2のかかる実施形態において、以下の処理が実行される:(a)Nサイクルデータを40サイクルに補間すること、及び(b)元のNサイクルデータに曲線をフィッティングし、次いで補間されたデータにおける40回のサイクルの各々における曲線の導関数を判定することによって、導関数値を判定すること。
【0037】
第3のかかる実施形態において、以下の処理が実行される:(a)Nサイクルデータを40回のサイクルに補間すること、及び(b)補間されたデータに曲線をフィッティングし、次いで補間されたデータにおける40回のサイクルの各々における曲線の導関数を判定することによって、導関数値を判定すること。
【0038】
Nサイクルデータを40回のサイクル(又はいくつかの他の回数のサイクル)にフィットするための以上に言及された技術は、畳み込みニューラルネットワークを備える実施形態に限定されないことは、留意されるべきである。むしろ、これらの技術は、ニューラルネットワークが特定の回数のサイクルに対応するデータに対してトレーニングされているが、その後、異なる回数のサイクルを用いる実験からの結果を分析するために使用される、いずれの機械学習qPCRデータ処理アプリケーションにも、潜在的に適用可能である。これは、異なるサイズのデータを使用してニューラルネットワークを再トレーニングする必要性を潜在的に回避する。
【0039】
図4は、本発明の実施形態によるトレーニング方法400を例解する。トレーニング方法400は、既知の(又は少なくとも既知のものとして扱われる)増幅結果と関連付けられた増幅曲線を含むトレーニングデータを使用して、増幅曲線に基づいて試料の増幅を予測するためにニューラルネットワーク102をトレーニングする、コンピュータ処理を含む。
【0040】
ステップ401は、トレーニングデータを受け取る。例解された実施形態において、トレーニングデータは、qPCR実験から生成された複数の増幅曲線を含む。各増幅曲線について、トレーニングデータはまた、増幅曲線と関連付けられた注釈の形態で結果を含む。例解された実施形態において、注釈は、(1)増幅された(標的が存在する)、(2)不定、及び(3)増幅されていない(標的が存在しない)の3つの結果のうちの1つを含む。一実施形態において、これらの結果は、それぞれの値1、0、及び-1によって表される。ステップ401は、トレーニングデータにおける各結果の数を計数する。
【0041】
ステップ402は、
図3の状況において以上に考察された様態で、各増幅曲線についてトレーニングデータを前処理する。ステップ403は次いで、前処理されたデータ(各増幅曲線について、対応する正規化された増幅曲線値及び判定された導関数値を含む)を、ニューラルネットワーク102を通して伝搬させる。
【0042】
ニューラルネットワーク102は、各分類について確率値を出力する。確率値は、曲線が増幅された試料と関連付けられるか否かに関するニューラルネットワークの予測を表す。例えば、
図2を参照すると、現在の重みでのニューラルネットワーク102の処理が、ことによると増幅された試料に対応すると判定する増幅曲線について、ニューラルネットワーク102は、それぞれ出力P1(増幅されている確率)、出力P2(不定である確率)、及び出力P3(増幅されていない確率)において、0.90、0.08、及び0.02の値を出力し得る。
【0043】
所与のトレーニング増幅曲線についてクラス確率が出力された後、ステップ404は、トレーニングセットにおける注釈付き結果に関する誤差を測定する。様々な損失(誤差)尺度が使用され得る。1つの実施形態は、以下の式によって与えられるカテゴリ交差エントロピー関数を使用する:
【数1】
式中、
C
0は、カテゴリ交差エントロピー関数である。
y
iは、ニューラルネットワークによって与えられる、現在のトレーニング増幅曲線がクラスiに属する確率である。
y
i’は、クラスiに属する「既知の」確率であり、すなわち、トレーニング試料からの注釈付き結果である。これは二値であり、注釈付けされたクラスについては1であり、他については0である。
【0044】
以上の式を先に参照された例に適用し、ニューラルネットワーク102が、増幅されている確率0.9、不定である確率0.08、及び増幅されていない確率0.02(トレーニングデータはこれらのクラスについてそれぞれ1、0、0を示す)を判定すると仮定すると、誤差は以下によって与えられる:
【数2】
【0045】
好ましい実施形態において、誤差関数は、誤差がトレーニングデータにおけるクラスの表現に依存するように、クラスの重み付けを組み込むように修正される。すなわち、誤差は、誤差が算出された試料と同じクラスのトレーニング試料の数に依存して、異なるように重み付けされる。一実施形態において、修正された損失関数について以下の式が使用される:
【数3】
式中、
Lは、クラスの重み付けを含む更新された損失関数である。
L
iは、所与のトレーニング試料に対する損失である(例えばその試料について式(1)中のC
0によって与えられるような)。
w
iは、所与のトレーニング試料についての重み(以下で更に説明されるような、その試料のクラスに対して計算されたクラス重みw
jに基づく)である。
nは、トレーニングデータセット内の試料の総数である。
【0046】
好ましい実施形態において、数が少ないクラスと関連付けられた損失をより大きく重み付けする、クラス重み付け式が使用される。一実施形態において、以下のクラス重み付け式が使用される:
【数4】
式中、
w
jは、クラスjにおける試料について計算された誤差(「損失」)に適用される重みである。この例において、増幅されている、不定である、及び増幅されていないの3つのクラスが存在する。
n
jは、クラスj=1、2、3についてのトレーニングデータにおける増幅曲線の総数であり、換言すれば、n
1は、増幅されていると注釈付けされたトレーニング曲線の総数である。
n
2は、不定であると注釈付けされたトレーニング曲線の総数であり、n
3は、増幅されていないと注釈付けされたトレーニング曲線の総数である。
n
maxは、最大のクラスにおけるトレーニング試料の数である。
r
maxは、最小のクラスについての重み値(最大の重みとなり得る)と、最大のクラスについての重み値(最小の重みとなり得る)との間の所望の比率である、調節可能なパラメータである。
【0047】
代替的な実施形態において、他のクラス重み付け式を使用することができる。一例を挙げると、以上の式(3)において与えられるw
jについての式に対する代替は、以下の式(4)で提供される:
【数5】
式中、
αは、数が少ないクラスにどれだけの相対的な追加の重みが適用されるかを判定する、重み付け指数である。
【0048】
図4の説明を続けると、ステップ405は、誤差が許容可能に小さいか否か、及び/又はもはや減少していないか否かを判定する。ステップ405の結果が肯定的である場合、方法400はステップ410において終了する。ステップ405の結果が否定的である場合、ステップ407において、誤差がネットワークを通して逆伝搬され、ノード接続重みが調節される。一例において、これらのステップは、関係する誤差/損失関数に関する各フィルタ値について偏導関数が判定され、関係する接続重みの誤差への寄与と、その寄与が増加しているか、又は減少しているかを判定する確率勾配降下法とともに、典型的な逆伝搬処理を適用する。接続重みの誤差への寄与が減少している場合、重みは、どのような学習速度定数が使用されていても、それに等しい量だけ、直近に調節された方向と同じ方向に調節される。接続重みの誤差への寄与が増加している場合、重みは、学習速度定数に等しい量だけ、直近に調節された方向とは反対の方向に調節される。
【0049】
接続重みがネットワーク全体で調節された後、追加的な前処理されたトレーニングデータが、重み調節されたネットワークを通して供給される。処理はステップ404に戻り、誤差が許容可能に小さい及び/又はもはや減少していないとステップ405が判定するまで、ループが繰り返される。
【0050】
ニューラルネットワークが大規模なトレーニングデータセット上でトレーニングされると、より限られたデータセットを有する特定の検定のためにニューラルネットワークをカスタマイズするために、限定的な再トレーニングを行うことが可能である。転移学習は、画像分類、物体認識、翻訳、音声合成、及び多くの他のドメインのために既存のニューラルモデルを再利用するために好適に使用されてきた。転移学習を使用することにより、一般的な増幅判定のために既にトレーニングされているネットワークが、本発明のいくつかの実施形態において、カスタマイズされたアプリケーション固有のモデルのために再トレーニングされ得る。
【0051】
例えば、既存のトレーニングデータセットから学習された一般的なモデルが再利用され、後段の層が追加的な顧客又はアプリケーションデータを用いて再トレーニングされて、異なる顧客及びアプリケーションのための特定のモデルを生成し得る。以前の層に保存されたトレーニングされた特徴は再利用され、後段の層における重みのみが更新されることとなるので、トレーニングのためにははるかに少ない顧客又はアプリケーションのトレーニングデータしか必要とされない。本発明のいくつかの実施形態において使用される転移学習は、自身の特定のアプリケーションに対してより良好な増幅判定性能を得るために、顧客が自身の注釈付きデータを活用して、一般的なスマートqPCRニューラルネットワークを最適化することを可能にし得る。更に、データを生成するために使用される各プレートから最大限の情報を得るように設計された、特別な希釈系列データ生成プロトコルを使用して、追加的な顧客又はアプリケーションデータを生成することができる。
【0052】
モデルを再トレーニングするためにユーザにより実行されるプロセスは、一からのトレーニングと同様である。まず、注釈付きのトレーニングデータセット、検証データセット、及びテストデータセットを選択する。次いで、トレーニングデータセットを使用することによりモデルをトレーニングし、トレーニングを監視する。次に、検証データセットを使用することにより最良にトレーニングされたモデルを選択し、テストデータセットにより選択されたモデルをテストする。しかしながら、一から始める代わりに、一般的なトレーニングされたモデルからトレーニングが始まるため、必要とされる試料の数は非常に少なく、トレーニング時間もベースラインモデルのトレーニングに必要とされる時間と比べてはるかに短くなる(数分だけとなり得る)。
【0053】
本発明は、例解された実施形態に関して特に説明されたが、本開示に基づいて様々な変更、修正、及び適合がなされ得、それらが本発明の範囲内にあることが意図されていることは、理解されるであろう。本発明は、最も実用的かつ好ましい実施形態と現在考えられるものに関連して説明されたが、本発明は、開示された実施形態に限定されるものではなく、逆に、以上及び以下の様々な実施形態の参照によって説明される、本発明の根本的な原理の範囲内に含まれる様々な修正及び等価な構成を網羅することが意図されていることは、理解されるべきである。
【国際調査報告】