特表2023-530304 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ライフ　テクノロジーズ　コーポレーションの特許一覧

特表2023-530304スマートｑＰＣＲ

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2023-07-14

(54)【発明の名称】スマートｑＰＣＲ

(51)【国際特許分類】

C12M 1/00 20060101AFI20230707BHJP

C12Q 1/6851 20180101ALI20230707BHJP

G01N 33/50 20060101ALI20230707BHJP

【ＦＩ】

C12M1/00 A

C12Q1/6851 Z

G01N33/50 P

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2022577273

(86)(22)【出願日】2021-06-11

(85)【翻訳文提出日】2023-02-13

(86)【国際出願番号】 US2021037130

(87)【国際公開番号】W WO2021257412

(87)【国際公開日】2021-12-23

(31)【優先権主張番号】63/039,307

(32)【優先日】2020-06-15

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】502221282

【氏名又は名称】ライフテクノロジーズコーポレーション

(74)【代理人】

【識別番号】100094569

【弁理士】

【氏名又は名称】田中伸一郎

(74)【代理人】

【識別番号】100103610

【弁理士】

【氏名又は名称】▲吉▼田和彦

(74)【代理人】

【識別番号】100109070

【弁理士】

【氏名又は名称】須田洋之

(74)【代理人】

【識別番号】100098475

【弁理士】

【氏名又は名称】倉澤伊知郎

(74)【代理人】

【識別番号】100130937

【弁理士】

【氏名又は名称】山本泰史

(74)【代理人】

【識別番号】100144451

【弁理士】

【氏名又は名称】鈴木博子

(74)【代理人】

【識別番号】100123630

【弁理士】

【氏名又は名称】渡邊誠

(72)【発明者】

【氏名】ジョージウォレス

(72)【発明者】

【氏名】チャンダディーパンカー

【テーマコード（参考）】

2G045

4B029

4B063

【Ｆターム（参考）】

2G045DA12

2G045DA13

2G045DA14

2G045FB01

2G045FB02

4B029AA23

4B063QA01

4B063QQ41

4B063QR08

4B063QR42

4B063QR62

4B063QR66

4B063QS25

4B063QS34

4B063QX02

(57)【要約】

人工ニューラルネットワークを使用して、特定の試料が標的分子を含むか否かに関する、改善された自動化された予測を提供する、深層学習方法を実装する、本発明の実施形態が開示されている。いくつかの実施形態において、畳み込みニューラルネットワークが使用される。いくつかの実施形態において、人工ニューラルネットワークは、クラス重み付けされた誤差判定を使用してトレーニングされる。これら及び他の実施形態が、本明細書に開示されている。
【選択図】図１

【特許請求の範囲】

【請求項1】

非一時的コンピュータ可読媒体に記憶された実行可能コードを備えるコンピュータプログラム製品であって、前記実行可能コードは、定量ポリメラーゼ連鎖反応（ｑＰＣＲ）機器の出力の処理に使用するための人工ニューラルネットワークを実装するために１つ以上のコンピュータプロセッサ上で実行可能であり、前記ｑＰＣＲ機器は、前記ｑＰＣＲ機器を使用して実施される１つ以上のｑＰＣＲ検定から増幅データを生成するように構成され、前記人工ニューラルネットワークは、
前記ｑＰＣＲ機器の複数の熱サイクルの各サイクル後に測定された蛍光値に対応する増幅データから得られる入力データを受信するように構成された、入力層と、
１つ以上の畳み込み層を備える、複数の隠れ層と、
出力層と、
を備え、
前記人工ニューラルネットワークは、前記ｑＰＣＲ機器によって処理される特定の生体試料に対応する入力データを使用して、前記生体試料の複数の可能な増幅分類から選択される増幅分類を判定するように構成されている、コンピュータプログラム製品。

【請求項2】

前記入力データは、複数のサイクルの各々において、正規化された蛍光値、及び前記増幅データに対する曲線フィットの１つ以上の導関数値を含む、請求項１に記載のコンピュータプログラム製品。

【請求項3】

前記増幅データに対する前記曲線フィットは、前記正規化された蛍光値に対する曲線フィットである、請求項２に記載のコンピュータプログラム製品。

【請求項4】

前記１つ以上の導関数値は、少なくとも３つの導関数値を含む、請求項２に記載のコンピュータプログラム製品。

【請求項5】

前記１つ以上の導関数値は、少なくとも４つの導関数値を含む、請求項２に記載のコンピュータプログラム製品。

【請求項6】

前記複数の隠れ層は、１つ以上の分離可能な畳み込み層を備える、請求項１～５のいずれか一項に記載のコンピュータプログラム製品。

【請求項7】

前記複数の隠れ層は、１つ以上の分離可能な畳み込み層と、１つ以上の通常の畳み込み層と、を備える、請求項１～５のいずれか一項に記載のコンピュータプログラム製品。

【請求項8】

前記複数の隠れ層は、複数の完全接続層を更に備える、請求項１に記載のコンピュータプログラム製品。

【請求項9】

前記複数の隠れ層は、プーリング層を備えるが、完全接続層を備えない、請求項１～７のいずれか一項に記載のコンピュータプログラム製品。

【請求項10】

前記複数の可能な増幅分類は、増幅されている、増幅されていない、及び不定を含む、請求項１～９のいずれか一項に記載のコンピュータプログラム製品。

【請求項11】

前記可能な増幅分類の各々の増幅分類は、確率として表現される、請求項１～１０のいずれか一項に記載のコンピュータプログラム製品。

【請求項12】

定量ポリメラーゼ連鎖反応（ｑＰＣＲ）機器の出力を処理するために人工ニューラルネットワークをトレーニングする方法であって、前記ｑＰＣＲ機器は、前記ｑＰＣＲ機器を使用して実施される１つ以上のｑＰＣＲ検定から増幅データを生成するように構成され、前記人工ニューラルネットワークは、前記増幅データを使用して、複数の分類を使用して、前記増幅データに対応する増幅結果を分類するように処理され、前記方法は、
トレーニング試料に対してｑＰＣＲを実施することから得られるトレーニング増幅データを、前記人工ニューラルネットワークに提供することと、
前記複数の分類の各々についてクラス重みを判定することであって、前記クラス重みが、前記複数の分類の各分類に属するトレーニング試料の一部に対応する、判定することと、
前記クラス重みを使用して、特定のトレーニング試料について、前記人工ニューラルネットワークによってなされた分類判定に対応するクラス重み付けされた誤差判定を得ることと、
前記クラス重み付けされた誤差判定を使用して、前記人工ニューラルネットワークのパラメータ値を調節し、誤差を低減することと、を含む、方法。

【請求項13】

複数のそれぞれの分類に対応する複数のそれぞれのクラス重み付け誤差判定は、前記トレーニングデータにおいてより少なく表される分類を、前記トレーニングデータにおいてより多く表される前記複数の分類のうちの別のものを重み付けするよりも、より大きく重み付けする、請求項１２に記載の方法。

【請求項14】

前記複数の分類は、増幅されている、増幅されていない、及び不定を含む、請求項１２又は１３に記載の方法。

【請求項15】

前記複数の分類の各々は、確率として表現される、請求項１２～１４のいずれか一項に記載の方法。

【請求項16】

前記クラス重み付けされた誤差判定を得るために、交差エントロピー損失関数がクラス重みと組み合わせて使用される、請求項１２～１５のいずれか一項に記載の方法。

【請求項17】

非一時的コンピュータ可読媒体に記憶された実行可能コードを備えるコンピュータプログラム製品であって、前記実行可能コードは、人工ニューラルネットワークを使用して定量ポリメラーゼ連鎖反応（ｑＰＣＲ）機器の出力を処理するために１つ以上のコンピュータプロセッサ上で実行可能であり、前記ｑＰＣＲ機器は、前記ｑＰＣＲ機器を使用して実施される１つ以上のｑＰＣＲ検定から増幅データを生成するように構成され、前記実行可能コードは、増幅データを前処理して、前記人工ニューラルネットワークの入力層への入力データとして提供するための前処理されたデータを得るために、前記１つ以上のコンピュータプロセッサ上で実行可能であり、前記前処理は、
前記増幅データが、前記人工ニューラルネットワークの入力層の対応する次元のサイズとは異なる、前記ｑＰＣＲ機器のサイクルの数に対応するか否かを判定することと、
前記サイクルの数が前記サイズと異なる場合、前記前処理されたデータを前記サイズにフィッティングすることと、を含む、コンピュータプログラム製品。

【請求項18】

前記前処理されたデータを前記サイズにフィッティングすることは、切り捨てられたデータが前記サイズにフィットするように前記増幅データを切り捨てることを含む、請求項１７に記載のコンピュータプログラム製品。

【請求項19】

前記前処理されたデータを前記サイズにフィッティングすることは、補間されたデータが前記サイズにフィットするように前記増幅データを補間することを含む、請求項１７に記載のコンピュータプログラム製品。

【請求項20】

前記前処理されたデータは、前記切り捨てられたデータで表される各サイクルに対する１つ以上の導関数値を更に含み、前記１つ以上の導関数値は、切り捨てられていないデータに対する曲線フィットに基づいて判定される、請求項１８に記載のコンピュータプログラム製品。

【請求項21】

前記前処理されたデータは、前記補間されたデータで表される各サイクルに対する１つ以上の導関数値を更に含み、前記１つ以上の導関数値は、補間されていないデータに対する曲線フィットに基づいて判定される、請求項１９に記載のコンピュータプログラム製品。

【請求項22】

前記人工ニューラルネットワークは、１つ以上の畳み込み層を備える、請求項１７～２１のいずれか一項に記載のコンピュータプログラム製品。

【請求項23】

定量ポリメラーゼ連鎖反応（ｑＰＣＲ）システムであって、
生体試料を処理し、前記試料に対応する増幅データを生成するように構成された、ｑＰＣＲ機器と、
前記増幅データを受信するように、かつ請求項１～１１及び１７～２２のいずれか一項に記載のコンピュータプログラム製品の実行可能命令コードを受信、記憶、及び実行するように構成された、１つ以上のコンピュータと、を備える、定量ポリメラーゼ連鎖反応システム。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本出願は、２０２０年６月１５日に出願された米国仮特許出願第６３／０３９，３０７号の優先権の利益を主張するものである。本文献及び本明細書で考察される他の全ての外部資料は、その全体が参照により組み込まれるものとする。

【背景技術】

【0002】

本開示は、概して、標的が生体試料中に存在するか否かを判定するための技術に関する。

【0003】

リアルタイム（定量としても既知である）ポリメラーゼ連鎖反応（ｑＰＣＲ）実験から得られる増幅曲線は、標的が生体試料（例えば血液又は食物試料）中に存在するか否かを判定するために使用され得る。典型的なｑＰＣＲ実験において、試料の蛍光は、実験の各熱サイクル後に測定される。特定の試料と関連付けられたサイクル番号に対する蛍光値のプロットは、その試料の増幅曲線を形成する。従来、アルゴリズムが増幅曲線を分析し、及び／又は人間が増幅曲線をレビューし、増幅曲線の特性の視覚的な、又は他の分析に基づいて、関連する試料が増幅されたことを判定し、そのことが、標的分子が試料内に存在していたことを示す。関連する試料が増幅されたことを判定するための典型的なアルゴリズム技術は、関連付けられた増幅曲線が、固定された、又は増幅曲線の特性に基づいて算出された閾値を超えたか否かを判定することを伴う。閾値を超えた場合、曲線は増幅されていると判定され、閾値を超えない場合、曲線は、増幅されていないと判定される。

【発明の概要】

【0004】

増幅の自動的な判定は、試料分析のスループットを増加させるために重要であり、そのことが、科学研究を促進し、かつ時間的制約がある臨床的に重要な情報の提供を改善し得る。増幅を自動的に判定する既存の方法は、精度を改善するための技術及びパラメータの組み合わせに依存してきた。しかしながら、より良好な精度が必要とされている。本発明の実施形態は、人工ニューラルネットワークを使用して、特定の試料が標的分子を含むか否かに関する、改善された自動化された予測を提供する、深層学習法を実装する。

【図面の簡単な説明】

【0005】

【図1】本発明の実施形態によるシステムを例解する。

【図2】１つ以上のコンピュータプロセッサによって実行されたときに、図１の実施形態のコンピュータプログラム製品によって実装される人工ニューラルネットワークを例解する。

【図3】図２に例解された前処理ブロックの更なる詳細を例解する。

【図4】本発明の実施形態によるニューラルネットワークをトレーニングする方法を例解するフロー図である。

【0006】

本発明は、以上の図面を参照しながら説明されるが、図面は、例解的であることが意図されており、他の実施形態も本発明の趣旨に合致しその範囲内である。

【発明を実施するための形態】

【0007】

ここで、様々な実施形態が、実施形態の実施の具体例の一部を形成し、例解として実施形態の具体例を図示する添付図面を参照しながら、より完全に説明される。しかしながら、本明細書は、多くの異なる形態で具現化され得、本明細書に提示された実施形態に限定されるものと解釈されるべきではなく、むしろ、これらの実施形態は、本明細書が完全かつ完成したものとなり、当業者に本発明の範囲を十分に伝えるように提供される。数ある中でも、本明細書は、方法又はデバイスとして具現化され得る。したがって、本明細書の様々な実施形態のいずれも、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、又はソフトウェア及びハードウェアの態様を組み合わせた実施形態の形態を採り得る。したがって、以下の明細は、限定的な意味で解釈されるべきではない。

【0008】

図１は、本発明の例示的な実施形態によるシステム１０００を例解する。システム１０００は、ポリメラーゼ連鎖反応（「ＰＣＲ」）機器１０１、１つ以上のコンピュータ１０３、及びユーザデバイス１０７を備える。

【0009】

人工ニューラルネットワーク１０２を実装するための命令は、記憶装置１０５に記憶されているコンピュータプログラム製品１０４内に存在し、これらの命令はプロセッサ１０６によって実行可能である。プロセッサ１０６がコンピュータプログラム製品１０４の命令を実行しているとき、その命令又はその一部は、典型的には作業メモリ１０９にロードされ、その命令はそこからプロセッサ１０６によって容易にアクセスされる。例解された実施形態において、コンピュータプログラム製品１０４は、記憶装置１０５又は別の非一時的コンピュータ可読媒体（異なるデバイス及び異なる場所における媒体にわたって分散されることを含み得る）に記憶される。代替的な実施形態において、記憶媒体は一時的なものである。

【0010】

一実施形態において、プロセッサ１０６は実際には、大規模な並列計算をサポートする少なくとも数千個の算術論理ユニットを備えるグラフィックス処理ユニット（ＧＰＵ）を含む、追加的な作業メモリ（個別に例解されていない追加的なプロセッサ及びメモリ）を備え得る、複数のプロセッサを備える。ＧＰＵは、典型的な汎用プロセッサ（ＣＰＵ）よりも効率良く関係する処理タスクを実行することができるため、深層学習アプリケーションにおいて利用されることが多い。他の実施形態は、効率良い並列処理をサポートするシストリック配列及び／又は他のハードウェア構成を備える、１つ以上の特殊な処理ユニットを備える。いくつかの実施形態において、かかる特殊なハードウェアは、ＣＰＵ及び／又はＧＰＵと連動して動作して、本明細書に説明される様々な処理を実行する。いくつかの実施形態において、かかる特殊なハードウェアは、特定用途向け集積回路等（特定用途向けである集積回路の一部を指し得る）、フィールドプログラマブルゲートアレイ等、又はそれらの組み合わせを備える。しかしながら、いくつかの実施形態において、プロセッサ１０６のようなプロセッサは、必ずしも本発明の趣旨及び範囲から逸脱することなく、１つ以上の汎用プロセッサ（好ましくは複数のコアを有する）として実装され得る。

【0011】

ユーザデバイス１０７は、ニューラルネットワーク１０２によって実行された処理の結果を表示するためのディスプレイ１０８を含む。代替的な実施形態において、ニューラルネットワーク１０２のようなニューラルネットワーク又はその一部は、記憶デバイスに記憶され、ＰＣＲ機器１０１及び／又はユーザデバイス１０７に存在する１つ以上のプロセッサによって実行され得る。かかる代替案は、本発明の範囲から逸脱しない。

【0012】

図２は、図１の実施形態のコンピュータプログラム製品に記憶された命令の実行によって実装される、ニューラルネットワーク１０２の一実施形態の詳細を例解する。例解された実施形態を要約すると、ニューラルネットワーク１０２は、主に畳み込みニューラルネットワークである。一般的に、ここで説明されるような畳み込みニューラルネットワークは、少なくとも１つの畳み込み層を有するが、畳み込み層に加えて他のタイプの層（例えば多層パーセプトロン（ＭＬＰ）層）を有することが多い。ニューラルネットワーク１０２への入力は、分析される試料の増幅曲線に対応する。具体的には、それらはＰＣＲ実験の各熱サイクル後に測定される蛍光に対応する正規化された蛍光値であり、増幅曲線と称されることが多い。例解された実施形態において、入力はまた、同じ点の各々におけるその曲線の１次、２次、及び３次導関数値を含む。代替的な実施形態において、高次及び低次の導関数の異なる組み合わせを使用することができる。１つの代替的な実施形態において、入力は、増幅曲線の１次、２次、３次、及び４次導関数値を含む。

【0013】

例解された実施形態において、ニューラルネットワークの３つの出力は、（１）試料が増幅した（関心のある系列が存在した）確率、（２）試料増幅がデータからは不定である（関心のある系列が存在したか否かが不定である）確率、及び（３）試料が増幅しなかった（関心のある系列が存在しなかった）確率を含む。

【0014】

畳み込みニューラルネットワークにおいて、畳み込み層への入力は、１つ以上の「フィルタ」を用いて畳み込まれ、各フィルタは、値の配列（１次元又は多次元）を含む。畳み込みは、入力にわたってフィルタ値を一緒に、かつ段階的に移動させ、各段階において、入力の関係する部分とフィルタとの間で、値の要素毎の乗算であるアダマール積を実行するプロセスとして理解され得る。各ステップにおけるアダマール積の出力は、合計されて、出力配列の一部となる単一の値を生成する。これは典型的には「特徴マップ」と称される。特徴マップは、フィルタが配列にわたって段階的に移動するにつれて、値毎に埋められる。１つ以上の特徴マップは、畳み込み層の畳み込み演算の出力である。これらの特徴マップは、例えば、整流線形ユニット（「ＲｅＬＵ」）関数のような非線形活性化関数に入力され得、その出力が、ニューラルネットワークの次の層に供給され得る。

【0015】

例解された実施形態の説明を更に詳細に続けると、ニューラルネットワーク１０２は、前処理ブロック２２０、入力層２１０、隠れ層２３０、及び出力層２５０を備える。前処理ブロック２２０は、典型的には、４０サイクルのＰＣＲ実験の各サイクル後に検出される蛍光値に対応する４０個の入力である、入力Ｃ１～Ｃ４０を受け取る（すなわち、入力Ｃ１～Ｃ４０は、ＰＣＲ実験によって処理される試料の増幅曲線に対応する）。実際には、６０回にも及ぶ入力サイクルが存在し得る。以下で更に考察される代替的な実施形態において、４０回のサイクルより多い又は少ないサイクルを使用するＰＣＲ実験に起因する増幅曲線は、様々な技術を使用して、例解された実施形態によって処理することができる。一般性を損なうことなく、４０サイクルの入力の場合に基づいて説明することとする。前処理ブロック２２０は、所与の増幅曲線の正規化された値が１の最大値（最大値ノルム）を有し、いくつかの代替的な実施形態においては０の最小値も有するように、増幅曲線値を正規化する。前処理ブロック２２０はまた（図３の状況において以下に更に説明されるように）、４０個の正規化された蛍光値から、４０個の増幅曲線の点の各々における平滑化された１～ｎ次の導関数を判定する。実際には、一般的な用法は、平滑化された４次導関数の使用で止まることであり得る。これらの導関数はまた、各導関数について１の最大値を有するような最大値ノルムのものとされる。代替的に、これらの導関数は、各導関数について１の絶対最大値を有するような絶対最大ノルムのものとすることができる。例解された例において、前処理ブロック２２０は、１次、２次、及び３次導関数値を計算する。前処理ブロックは、２次元の４０Ｘ４配列についての値を、入力層２１０に提供する。入力配列は、４０個の列及び４個の行を有し、４０個の列は、ＰＣＲ実験の４０回のサイクルに対応し、４個の行はそれぞれ、増幅曲線の４０回のサイクルの各々における正規化された蛍光値並びにその正規化された１次、２次及び３次導関数に対応していると理解され得る。

【0016】

入力層２１０は、入力データの４０Ｘ４の配列を、分離可能な畳み込み層２３１に提供する。例解された実施形態において、分離可能な畳み込み層２３１は、１６個の異なるフィルタ（「カーネル」とも称される）を利用する。一実施形態において、フィルタは、３Ｘ４であり、すなわち、各フィルタは、３つの値の長さと、入力データの深度に対応する４つの値の深度と、を有する。各フィルタ値は、その最適値がニューラルネットワークのトレーニングプロセスを通して学習される、重みパラメータである。代替的な実施形態において、本明細書に説明される畳み込み層及び分離可能な畳み込み層の各々において、より多くの又はより少ないフィルタを使用することができる。ここで例解されている実施形態に図示されているフィルタの数は好ましいものであるが、本発明の趣旨及び範囲から必ずしも逸脱することなく、代替の実施形態においては、異なり得る。

【0017】

例解された実施形態において、畳み込み層は１のストライドを使用し、増幅曲線の各端部にゼロを追加することによって入力データの各行がパディングされる、「Ｓａｍｅ」パディングを使用する。これは、畳み込みプロセスが、入力データと同じ長さ次元を有する（層２３１の場合、その長さは４０である）特徴マップを作成することを可能にする。代替的な実施形態は、必ずしも本発明の趣旨及び範囲から逸脱することなく、異なるパディング、例えばＶａｌｉｄパディングを使用する。

【0018】

分離可能な畳み込み層２３１は、深度毎の分離可能な畳み込みを実行する。この実施形態において、それは、４０Ｘ４の入力配列が、各々が４０Ｘ１のサイズである４つの「サブ」配列に分離されることを意味する。同様に、各３Ｘ４フィルタは、各々が３Ｘ１のサイズである４つの「サブ」フィルタに分離される。各それぞれのサブ配列は、それぞれのサブフィルタを用いて畳み込まれ、４０Ｘ１の特徴マップを作成する。その結果の特徴マップは、「積層」され、４０Ｘ４の特徴マップを提供する。この４０Ｘ４の特徴マップに対して、１Ｘ４のフィルタを用いて畳み込まれる、点毎の畳み込みが実行される。この点毎のステップは、４０Ｘ１配列を出力し、これは、４０Ｘ４の入力配列を用いた３Ｘ４のフィルタの通常の畳み込みの場合に結果として得られるであろうものと同じサイズの特徴マップである。

【0019】

４０Ｘ４の入力データに対して、１６個の異なる３Ｘ４のフィルタの各々について、分離可能な畳み込みが実行される。これは、４０Ｘ１６の出力データに帰着する。例解された実施形態において、この出力データは、最終的な４０Ｘ１６のデータが後続する層に出力される前に、非線形活性化関数を通過させられる。この実施形態において、この関数は、ＲｅＬＵ関数であり、全ての負の値がゼロに変更され、全ての正の値が変更されないことを意味する。代替的な実施形態において、他の活性化関数が使用され得る。ここで例解されている実施形態において、活性化関数は、例解されている各畳み込み層の出力において使用されるが、これらの活性化関数のための処理ブロックは、図面においては別個に図示されてはいない。

【0020】

その結果のデータは次いで、分離可能な畳み込み層２３２に渡される。分離可能な畳み込み層２３２は、１６個ではなく８個だけのフィルタが使用され、したがって４０Ｘ８の出力配列に帰着することを除いて、層２３１が実行するものと同じタイプの分離可能な畳み込み演算を実行する。例解された実施形態において、層２３２についてのフィルタサイズは、４０Ｘ１６の入力データの深度に合致するように、３Ｘ１６である。

【0021】

分離可能な畳み込み層２３２は、その出力をプーリング層２３３に渡す。ここで例解されている実施形態において、プーリング層２３３は、８のデータ深度を維持しながら、データ長を４０から２０に低減させるために、平均プーリングを適用する。これは、例えば、２０Ｘ８のデータ配列を出力するために、各深度におけるデータにわたって２Ｘ１のウィンドウを動作させ、各ウィンドウ内の値の平均を取ることによって達成され得る。例解された実施形態において、平均プーリングが使用される。代替的な実施形態において、最大値プーリング、最小値プーリング、又は他のタイプのプーリングが使用される。

【0022】

プーリング層２３３により出力された２０Ｘ８のデータは、分離可能な畳み込み層２３４によって処理される。この層は１６個のフィルタを使用し、２０Ｘ１６のデータ配列を出力する。分離可能な畳み込み層２３５は、層２３４から出力された２０Ｘ１６の配列を受け取り、それを処理するために８個のフィルタを使用し、したがって畳み込み層２３６に２０Ｘ８配列を出力する。

【0023】

畳み込み層２３６は、８個のフィルタを使用して通常の畳み込みを実行する。通常の畳み込みにおいは、フィルタとデータとは、畳み込みに先立って「サブフィルタ」と「サブ配列」とに分離されることはない。むしろ、所与のフィルタは、データ配列全体を通してステップ状とされ、したがって、各フィルタの畳み込み処理は、単一の特徴マップに帰着する。この実施形態において、各フィルタは、入力配列のデータ深度に合致するように３Ｘ８であり、行の各端部におけるパディングとともに、各特徴マップの長さが入力配列の長さに合致することを可能とする。しかしながら、代替的な実施形態において、異なる深度フィルタが使用され得、出力配列の長さは、必ずしも入力配列の長さと合致する必要はない。例解された実施形態において、各フィルタの入力配列との畳み込みは、２０Ｘ１の特徴マップに帰着する。所与の８個のフィルタに対して、層２３６は、２０Ｘ８の配列を畳み込み層２３７に出力し、この畳み込み層２３７が、同様に８個のフィルタを使用して、データに対して同じ通常の畳み込み演算を実行し、２０Ｘ８のデータをプーリング層２３８に出力する。

【0024】

プーリング層２３８は、プーリング層２３３と同様に動作して、入力データの長さを半分に（２０から１０に）低減し、したがって、プーリング層２３８は、１０Ｘ８の配列出力を、分離可能な畳み込み層２３９に提供する。

【0025】

分離可能な畳み込み層２３９は、１６個のフィルタを適用し、１０Ｘ１６のデータを、分離可能な畳み込み層２４０に出力する。層２４０は、８個のフィルタを適用する分離可能な畳み込みを実行し、畳み込み層２４１に１０Ｘ８のデータを出力する。

【0026】

畳み込み層２４１は、３個のフィルタを適用して、プーリング層２４２への１０Ｘ３の出力を生成する。ポーリング層２４２は、グローバル平均プーリングを適用して１Ｘ３の出力をソフトマックス層２４３に提供し、このソフトマックス層２４３は、ソフトマックス関数を適用して、合計が１になる確率の形態で、出力層２５０への１Ｘ３の出力を生成する。出力層２５０は、３つの値：Ｐ１、Ｐ２、及びＰ３を保持する。Ｐ１は、分析された増幅曲線データが、標的系列が存在した試料（増幅された試料系列）に対応する確率である。Ｐ３は、分析された増幅曲線データが、標的配列が存在しなかった試料（増幅されていない試料系列）に対応する確率である。また、Ｐ２は、分析された増幅曲線データが、標的配列が存在したか否かを判定することができない試料に対応する確率である。

【0027】

本発明の実施形態は、特定の典型的なニューラルネットワークの態様を含むが、本発明の範囲内の例解される実施形態及び代替的な実施形態の他の多くの態様が、ＰＣＲ機器によって処理される試料中に対象の標的物質が存在するか否かを自動的に判定するという状況において、コンピュータ処理効率と結果の正確さとの最適なバランスを達成する、特定のニューラルネットワーク構造、入力及び入力前処理選択、並びに学習方法を備える。例えば、図２に図示される特定のニューラルネットワーク構造は、選択された代替的な変形とともに、ＰＣＲ増幅の判定を自動化するための、許容可能な計算予測及び効率性能を提供する。許容可能な精度は、通常の畳み込み層のみを使用する（分離可能な畳み込み層を用いない）実施形態においても見出され、かかる実施形態は、当然ながら本発明の範囲内である。同時に、図２の実施形態に図示されるように、層のいくつか又は多くにおける分離可能な畳み込みの使用は、優れた精度を依然として提供しながら、学習されるべきニューラルネットワークパラメータの数を低減させるという利点を提供する。

【0028】

例解された実施形態は、４０ノードの入力層を提供する。多くのＰＣＲ検定は、試料を４０回の熱サイクルに曝し、各サイクル後に蛍光を測定し、したがってニューラルネットワークに供給するための４０個の別個のデータ点を提供する。４０回のサイクルの増幅曲線を含むトレーニングデータのより大きな利用可能性は、例解された実施形態が、異なるサイズの入力層ではなく、４０ノードの入力層を実装する、重要な理由である。代替的な実施形態において、４０個のノードよりも大きい又は小さいサイズを有する入力層が使用され得る。しかしながら、かかる代替例は、適切なサイズの入力データを用いてニューラルネットワークを再トレーニングすることを必要とするであろう。したがって、例えば、より多くのサイクルの回数を有する実験を用いた、４０サイクルのデータに対して既にトレーニングされているネットワークの使用に対応するための有益な解決法は、４０ノードの入力層を有するニューラルネットワークにフィットするように切り捨て又は補間を利用することである。いくつかの場合において、これらの実施形態は、データ入力の前処理に関して、異なるアプローチを必要とする。関係する技術の実施形態は、図３の状況において以下に更に考察される。

【0029】

図３は、図２に例解された実施形態の前処理ブロック２２０の更なる詳細を例解する。例解されているように、前処理ブロック２２０は、正規化ブロック３１０及び導関数入力判定ブロック３２０を含む。

【0030】

例解された実施形態において、４０個の増幅曲線値が、正規化ブロック３１０によって正規化される。具体的には、正規化ブロック３１０は、増幅曲線について測定された蛍光値を受け取る。「増幅曲線」という用語は、実際には、特定の試料の増幅プロセスの各サイクルの後に取られた蛍光測定値に基づく蛍光値のセットを指す。これらの離散値は、技術的にはそれ自体「曲線」ではないが、それらは、曲線がフィットされ得る値であり、「増幅曲線」という用語は、離散値のセット自体及び／又はそれらの値にフィットされ得る曲線を大まかに指すために本分野において使用されることが多い。

【0031】

測定された蛍光値は、典型的には相対蛍光単位（「ＲＦＵ」）で表現される。ブロック３１０は、各曲線の値を正規化し、各曲線について最小値及び最大値が同じになるように正規化された値を得る。例解された実施形態において、正規化後の各曲線についての最小値が０であり、各曲線についての最大値が１となるような、典型的な正規化手順が使用される。正規化された増幅曲線値を含む正規化ブロック３１０の出力は、ニューラルネットワーク１０２の入力層２１０に提供される。

【0032】

例解された実施形態において、正規化ブロック３１０の出力はまた、導関数入力判定ブロック３２０に提供される。例解された実施形態において、導関数入力判定ブロック３２０は、増幅曲線に対応する４０個の値の各々について、それら４０個の値に対する曲線フィットの、対応するサイクルにおける１次、２次、及び３次の導関数を判定する。代替的な実施形態において、他の次数の導関数値が判定され、かつ使用され得る。一実施形態において、１次、２次、３次、及び４次の導関数値が、非導関数の正規化された値とともに、判定され、かつ使用される。

【0033】

各増幅曲線について、正規化ブロック３１０の出力は、入力層２１０に提供されるデータの配列において、導関数入力判定ブロック３２０の出力と組み合わせられる。例えば、例解された実施形態において、所与の増幅曲線について、データの４０Ｘ４の配列が提供される。この４０Ｘ４の配列は、４０回のサイクルの増幅プロセスの各サイクル後に試料から取られた蛍光測定値に対応する、４０個の正規化された蛍光値を含み、これらの値に対する曲線フィット上のそれらの４０個の点の各々において、対応する点における曲線の１次、２次、及び３次の導関数値も含む。

【0034】

４０回よりも多いサイクルを用いた実験からのｑＰＣＲデータを取り扱うように適合された実施形態において、以下は、ニューラルネットワーク１０２によって処理される増幅曲線についてのデータが、Ｎが４０よりも大きいＮ回のサイクルからのデータ（「Ｎサイクルデータ」）に対応する、代替的な実装形態を説明する。

【0035】

第１のかかる実施形態において、以下の処理が実行される：（ａ）Ｎサイクルデータを４０サイクルに切り捨てること、及び（ｂ）元のＮサイクルデータに曲線をフィッティングし、次いで切り捨てられたデータにおける４０回のサイクルの各々における曲線の導関数を判定することによって、導関数値を判定すること。

【0036】

第２のかかる実施形態において、以下の処理が実行される：（ａ）Ｎサイクルデータを４０サイクルに補間すること、及び（ｂ）元のＮサイクルデータに曲線をフィッティングし、次いで補間されたデータにおける４０回のサイクルの各々における曲線の導関数を判定することによって、導関数値を判定すること。

【0037】

第３のかかる実施形態において、以下の処理が実行される：（ａ）Ｎサイクルデータを４０回のサイクルに補間すること、及び（ｂ）補間されたデータに曲線をフィッティングし、次いで補間されたデータにおける４０回のサイクルの各々における曲線の導関数を判定することによって、導関数値を判定すること。

【0038】

Ｎサイクルデータを４０回のサイクル（又はいくつかの他の回数のサイクル）にフィットするための以上に言及された技術は、畳み込みニューラルネットワークを備える実施形態に限定されないことは、留意されるべきである。むしろ、これらの技術は、ニューラルネットワークが特定の回数のサイクルに対応するデータに対してトレーニングされているが、その後、異なる回数のサイクルを用いる実験からの結果を分析するために使用される、いずれの機械学習ｑＰＣＲデータ処理アプリケーションにも、潜在的に適用可能である。これは、異なるサイズのデータを使用してニューラルネットワークを再トレーニングする必要性を潜在的に回避する。

【0039】

図４は、本発明の実施形態によるトレーニング方法４００を例解する。トレーニング方法４００は、既知の（又は少なくとも既知のものとして扱われる）増幅結果と関連付けられた増幅曲線を含むトレーニングデータを使用して、増幅曲線に基づいて試料の増幅を予測するためにニューラルネットワーク１０２をトレーニングする、コンピュータ処理を含む。

【0040】

ステップ４０１は、トレーニングデータを受け取る。例解された実施形態において、トレーニングデータは、ｑＰＣＲ実験から生成された複数の増幅曲線を含む。各増幅曲線について、トレーニングデータはまた、増幅曲線と関連付けられた注釈の形態で結果を含む。例解された実施形態において、注釈は、（１）増幅された（標的が存在する）、（２）不定、及び（３）増幅されていない（標的が存在しない）の３つの結果のうちの１つを含む。一実施形態において、これらの結果は、それぞれの値１、０、及び－１によって表される。ステップ４０１は、トレーニングデータにおける各結果の数を計数する。

【0041】

ステップ４０２は、図３の状況において以上に考察された様態で、各増幅曲線についてトレーニングデータを前処理する。ステップ４０３は次いで、前処理されたデータ（各増幅曲線について、対応する正規化された増幅曲線値及び判定された導関数値を含む）を、ニューラルネットワーク１０２を通して伝搬させる。

【0042】

ニューラルネットワーク１０２は、各分類について確率値を出力する。確率値は、曲線が増幅された試料と関連付けられるか否かに関するニューラルネットワークの予測を表す。例えば、図２を参照すると、現在の重みでのニューラルネットワーク１０２の処理が、ことによると増幅された試料に対応すると判定する増幅曲線について、ニューラルネットワーク１０２は、それぞれ出力Ｐ１（増幅されている確率）、出力Ｐ２（不定である確率）、及び出力Ｐ３（増幅されていない確率）において、０．９０、０．０８、及び０．０２の値を出力し得る。

【0043】

所与のトレーニング増幅曲線についてクラス確率が出力された後、ステップ４０４は、トレーニングセットにおける注釈付き結果に関する誤差を測定する。様々な損失（誤差）尺度が使用され得る。１つの実施形態は、以下の式によって与えられるカテゴリ交差エントロピー関数を使用する：

【数1】

式中、
Ｃ₀は、カテゴリ交差エントロピー関数である。
ｙ_iは、ニューラルネットワークによって与えられる、現在のトレーニング増幅曲線がクラスｉに属する確率である。
ｙ_i’は、クラスｉに属する「既知の」確率であり、すなわち、トレーニング試料からの注釈付き結果である。これは二値であり、注釈付けされたクラスについては１であり、他については０である。

【0044】

以上の式を先に参照された例に適用し、ニューラルネットワーク１０２が、増幅されている確率０．９、不定である確率０．０８、及び増幅されていない確率０．０２（トレーニングデータはこれらのクラスについてそれぞれ１、０、０を示す）を判定すると仮定すると、誤差は以下によって与えられる：

【数2】

【0045】

好ましい実施形態において、誤差関数は、誤差がトレーニングデータにおけるクラスの表現に依存するように、クラスの重み付けを組み込むように修正される。すなわち、誤差は、誤差が算出された試料と同じクラスのトレーニング試料の数に依存して、異なるように重み付けされる。一実施形態において、修正された損失関数について以下の式が使用される：

【数3】

式中、
Ｌは、クラスの重み付けを含む更新された損失関数である。
Ｌ_iは、所与のトレーニング試料に対する損失である（例えばその試料について式（１）中のＣ₀によって与えられるような）。
ｗ_iは、所与のトレーニング試料についての重み（以下で更に説明されるような、その試料のクラスに対して計算されたクラス重みｗ_jに基づく）である。
ｎは、トレーニングデータセット内の試料の総数である。

【0046】

好ましい実施形態において、数が少ないクラスと関連付けられた損失をより大きく重み付けする、クラス重み付け式が使用される。一実施形態において、以下のクラス重み付け式が使用される：

【数4】

式中、
ｗ_jは、クラスｊにおける試料について計算された誤差（「損失」）に適用される重みである。この例において、増幅されている、不定である、及び増幅されていないの３つのクラスが存在する。
ｎ_jは、クラスｊ＝１、２、３についてのトレーニングデータにおける増幅曲線の総数であり、換言すれば、ｎ₁は、増幅されていると注釈付けされたトレーニング曲線の総数である。
ｎ₂は、不定であると注釈付けされたトレーニング曲線の総数であり、ｎ₃は、増幅されていないと注釈付けされたトレーニング曲線の総数である。
ｎ_maxは、最大のクラスにおけるトレーニング試料の数である。
ｒ_maxは、最小のクラスについての重み値（最大の重みとなり得る）と、最大のクラスについての重み値（最小の重みとなり得る）との間の所望の比率である、調節可能なパラメータである。

【0047】

代替的な実施形態において、他のクラス重み付け式を使用することができる。一例を挙げると、以上の式（３）において与えられるｗ_jについての式に対する代替は、以下の式（４）で提供される：

【数5】

式中、
αは、数が少ないクラスにどれだけの相対的な追加の重みが適用されるかを判定する、重み付け指数である。

【0048】

図４の説明を続けると、ステップ４０５は、誤差が許容可能に小さいか否か、及び／又はもはや減少していないか否かを判定する。ステップ４０５の結果が肯定的である場合、方法４００はステップ４１０において終了する。ステップ４０５の結果が否定的である場合、ステップ４０７において、誤差がネットワークを通して逆伝搬され、ノード接続重みが調節される。一例において、これらのステップは、関係する誤差／損失関数に関する各フィルタ値について偏導関数が判定され、関係する接続重みの誤差への寄与と、その寄与が増加しているか、又は減少しているかを判定する確率勾配降下法とともに、典型的な逆伝搬処理を適用する。接続重みの誤差への寄与が減少している場合、重みは、どのような学習速度定数が使用されていても、それに等しい量だけ、直近に調節された方向と同じ方向に調節される。接続重みの誤差への寄与が増加している場合、重みは、学習速度定数に等しい量だけ、直近に調節された方向とは反対の方向に調節される。

【0049】

接続重みがネットワーク全体で調節された後、追加的な前処理されたトレーニングデータが、重み調節されたネットワークを通して供給される。処理はステップ４０４に戻り、誤差が許容可能に小さい及び／又はもはや減少していないとステップ４０５が判定するまで、ループが繰り返される。

【0050】

ニューラルネットワークが大規模なトレーニングデータセット上でトレーニングされると、より限られたデータセットを有する特定の検定のためにニューラルネットワークをカスタマイズするために、限定的な再トレーニングを行うことが可能である。転移学習は、画像分類、物体認識、翻訳、音声合成、及び多くの他のドメインのために既存のニューラルモデルを再利用するために好適に使用されてきた。転移学習を使用することにより、一般的な増幅判定のために既にトレーニングされているネットワークが、本発明のいくつかの実施形態において、カスタマイズされたアプリケーション固有のモデルのために再トレーニングされ得る。

【0051】

例えば、既存のトレーニングデータセットから学習された一般的なモデルが再利用され、後段の層が追加的な顧客又はアプリケーションデータを用いて再トレーニングされて、異なる顧客及びアプリケーションのための特定のモデルを生成し得る。以前の層に保存されたトレーニングされた特徴は再利用され、後段の層における重みのみが更新されることとなるので、トレーニングのためにははるかに少ない顧客又はアプリケーションのトレーニングデータしか必要とされない。本発明のいくつかの実施形態において使用される転移学習は、自身の特定のアプリケーションに対してより良好な増幅判定性能を得るために、顧客が自身の注釈付きデータを活用して、一般的なスマートｑＰＣＲニューラルネットワークを最適化することを可能にし得る。更に、データを生成するために使用される各プレートから最大限の情報を得るように設計された、特別な希釈系列データ生成プロトコルを使用して、追加的な顧客又はアプリケーションデータを生成することができる。

【0052】

モデルを再トレーニングするためにユーザにより実行されるプロセスは、一からのトレーニングと同様である。まず、注釈付きのトレーニングデータセット、検証データセット、及びテストデータセットを選択する。次いで、トレーニングデータセットを使用することによりモデルをトレーニングし、トレーニングを監視する。次に、検証データセットを使用することにより最良にトレーニングされたモデルを選択し、テストデータセットにより選択されたモデルをテストする。しかしながら、一から始める代わりに、一般的なトレーニングされたモデルからトレーニングが始まるため、必要とされる試料の数は非常に少なく、トレーニング時間もベースラインモデルのトレーニングに必要とされる時間と比べてはるかに短くなる（数分だけとなり得る）。

【0053】

本発明は、例解された実施形態に関して特に説明されたが、本開示に基づいて様々な変更、修正、及び適合がなされ得、それらが本発明の範囲内にあることが意図されていることは、理解されるであろう。本発明は、最も実用的かつ好ましい実施形態と現在考えられるものに関連して説明されたが、本発明は、開示された実施形態に限定されるものではなく、逆に、以上及び以下の様々な実施形態の参照によって説明される、本発明の根本的な原理の範囲内に含まれる様々な修正及び等価な構成を網羅することが意図されていることは、理解されるべきである。

【図1】

【図2】

【図3】

【図4】

【国際調査報告】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版