(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-24
(45)【発行日】2022-09-01
(54)【発明の名称】シークエンシング分析の関連において正規化を実施するための方法および装置
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20220825BHJP
G06T 7/00 20170101ALI20220825BHJP
C12M 1/34 20060101ALI20220825BHJP
【FI】
C12Q1/6869 Z
G06T7/00 630
C12M1/34 B
(21)【出願番号】P 2019570107
(86)(22)【出願日】2018-06-19
(86)【国際出願番号】 EP2018066278
(87)【国際公開番号】W WO2018234314
(87)【国際公開日】2018-12-27
【審査請求日】2021-04-30
(32)【優先日】2017-06-20
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】507214038
【氏名又は名称】キアゲン ゲーエムベーハー
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(72)【発明者】
【氏名】オェーストライヒ カリーリョ, フェルナンド
(72)【発明者】
【氏名】ローヘル, マイコ
(72)【発明者】
【氏名】ツェルファス, トルステン
【審査官】北村 悠美子
(56)【参考文献】
【文献】BIOINFORMATICS,2014年,Vol.30, No.9, pp.1214-1219
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00-3/00
C12M 1/00-3/10
C12N 15/00-15/90
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
DNAのシークエンシング分析を実施するように取得される強度値の正規化を実施するための方法
であって、前記方法
は、
4つのチャネル
に関する複数の画像データ
を受信するステップ
であって、各画像データ
は、
前記4つのチャネルのうちの個別のチャネル
に関して、
1つのサイクル内の前記複数の画像データ
の画像の全ての位置にわたる強度分布を記述する、ステップと、
前記
4つのチャネル
に関するパラメータ化分布を取得するための前記
4つのチャネル
に関する全ての位置にわたる前記強度分布のパラメータ化のステップ
であって、前記
4つのチャネル
に関する前記パラメータ化分布は、前記
4つのチャネル
に関する全ての位置にわたる前記強度値の平均を使用して記述される、ステップと、
前記
4つのチャネル
の全てに関する共通分布を取得するように、前記
4つのチャネル
に関する前記パラメータ化分布を組み合わせるステップ
であって、前記共通分布は、前記
4つのチャネルの全てのパラメータ化分布の平均を表す、ステップと、
前記
4つのチャネル
の各々に関して、前記個別のチャネル
に関する個別の伝達関数が、対応する強度分布を前記共通分布にマップするように、伝達関数を決定するステップ
と
を含む、方法
。
【請求項2】
前記パラメータ化のステップ
および決定するステップ
は、
前記4つのチャネルに関して実施され、前記4つのチャネルのそれぞれが特異的ヌクレオチドに属する
、かつ/または
前記パラメータ化のステップ
および決定するステップ
は、
前記4つのチャネルに関して実施され、前記4つのチャネルのそれぞれ
が、4つの特異的ヌクレオチドをマークする4つの明確に異なる蛍光染料のうちの1つを決定するようにフィルタ処理される
、
請求項1に記載の方法
。
【請求項3】
前記
4つのチャネル
内の各位置は、その独自の配列および/またはその独自のDNA配列に属する、請求項1または2に記載の方法
。
【請求項4】
前記個別の伝達関数は、前記共通分布への前記対応する強度分布の線形変換を可能にする、請求項1-
3のうちの1項に記載の方法
。
【請求項5】
前記個別の伝達関数は、前記共通分布への前記対応する強度分布の非線形変換を可能にする、請求項1-
4のうちの1項に記載の方法
。
【請求項6】
前記
4つのチャネル
のうちの1つ以上のものまたは全てに関する前記強度分布は、明確に異なる平均および明確に異なる標準偏差を伴うガウス分布によって記述される、請求項1-
5のうちの1項に記載の方法
。
【請求項7】
前記ガウス分布によって記述される前記個別のチャネル
に関する前記個別の伝達関数は、前記対応する強度分布から
前記平均を減算する数学演算および/または前記対応する強度分布を
前記標準偏差で除算する数学演算を含む、請求項
6に記載の方法
。
【請求項8】
前記
4つのチャネル
のうちの1つに関する、またはより多くに関する、または全てに関する、前記強度分布は、非正規分布によって記述される、請求項
5に記載の方法
。
【請求項9】
前記個別の伝達関数は、対数変換、平方根変換、ボックス・コックス変換、またはYeo-Johnson変換を可能にする、請求項
8に記載の方法
。
【請求項10】
前記パラメータ化のステップ
、組み合わせるステップ
、および決定するステップ
は、複数のサイクルの各々に対して個別に実施される、請求項1-
9のうちの1項に記載の方法
。
【請求項11】
前記パラメータ化のステップ
、組み合わせるステップ
、および決定するステップ
は、
いくつかのサイクル
に関して実施される、請求項1-
9のうちの1項に記載の方法
。
【請求項12】
前記伝達関数を決定するステップ
は、前記個別のチャネル
に関する前記個別の伝達関数が平滑化関数を含むように実施され、
前記平滑化関数は、
前記いくつかのサイクル
にわたる前記強度値の最大変化を記述する、かつ/または、前記平滑化関数は、前記強度値が
前記いくつかのサイクル
にわたって平滑化されるように決定される
、
請求項
11に記載の方法
。
【請求項13】
各個別の伝達関数は、正規化関数を含み、
前記正規化関数は、前記
4つのチャネル
の強度値が、全てのチャネル
に関して
前記いくつかのサイクル
にわたって正規化されるように、決定される
、請求項
11または
12に記載の方法
。
【請求項14】
前記個別の正規化関数は、
前記いくつかのサイクル
にわたる1つ以上のチャネル
の動向が検出されない場合に、決定される
、請求項
13に記載の方法
。
【請求項15】
前記
4つのチャネル
の全てに関する前記共通分布は、各チャネルに対して共通分布関数を含む関数のセットによって記述され、前記共通分布関数のうちの少なくとも2つは、相互と異なり、
各個別の伝達関数は、前記個別のチャネル
に関する前記個別の伝達関数が、前記対応する強度分布を対応する共通分布関数にマップするように、決定される
、
請求項
11に記載の方法
。
【請求項16】
前記
共通分布関数は、
前記いくつかのサイクル
にわたる1つ以上のチャネル
の動向が検出される場合に、決定される
、請求項15に記載の方法
。
【請求項17】
各伝達関数は、平滑化関数を含み、前記平滑化関数は、
前記いくつかのサイクル
にわたる前記強度値の最大変化を記述する、かつ/または、前記平滑化関数は、前記個別のチャネル
に使用される前記強度値が
前記いくつかのサイクル
にわたって平滑化されるように決定される
、請求項
15または
16に記載の方法
。
【請求項18】
全ての位置にわたる前記強度分布および/または前記パラメータ化分布は、前記
4つのチャネル
のうちの個別のチャネルに関する個別の強度値に相関してカウント数を記述する、かつ/または
少なくとも2つの、全ての関連する、または全てのチャネル
に関する前記共通分布は、前記
4つのチャネルの少なくとも2つの、全ての関連する、または全てのパラメータ化分布の平均を表し、かつ/または、少なくとも2つの、全ての関連する、または全てのチャネルに関する前記共通分布は、少なくとも2つの、全ての関連する、または全てのチャネル
に関する平均強度値に相関して平均カウント数を記述する、
請求項1-
17のうちの1項に記載の方法
。
【請求項19】
コンピュータプログラムをその上に記憶しているコンピュータ可読デジタル記憶媒体であって、前記コンピュータプログラムは、プログラムコードを有し、前記プログラムコードは、コンピュータ上で起動するときに、請求項1-
18のうちの1項に記載の方法
を実施する、コンピュータ可読デジタル記憶媒体。
【請求項20】
DNAのシークエンシング分析を実施するように取得される強度値の正規化を実施するための方法(100、200)の正規化を実施するための装置であって、
4つのチャネル
に関する複数の画像データ
を受信するためのインターフェースであって、各画像データ
は、
前記4つのチャネルのうちの個別のチャネル
に関して、
1つのサイクル内の前記複数の画像データ
の画像の全ての位置にわたる強度分布を記述する、インターフェースと、
プロセッサであって、前記プロセッサは、前記
4つのチャネル
に関する全ての位置にわたる前記強度分布をパラメータ化し、前記
4つのチャネル
に関するパラメータ化分布を取得するように構成され、かつ、前記
4つのチャネル
に関する前記パラメータ化分布を組み合わせ、前記
4つのチャネル
の全てに関する共通分布を取得するように構成され、前記
4つのチャネル
に関する前記パラメータ化分布は、前記
4つのチャネル
に関する全ての位置にわたる前記強度値の平均を使用して記述され、前記共通分布は、前記
4つのチャネルの全てのパラメータ化分布の平均を表す、プロセッサと
を備え、
前記プロセッサは、前記
4つのチャネル
の各々に関して、前記個別のチャネル
に関する個別の伝達関数が、対応する強度分布を前記共通分布にマップするように、伝達関数を決定する
ように構成される、装置。
【発明の詳細な説明】
【背景技術】
【0001】
本発明の実施形態は、シークエンシング分析を実施するように取得される強度値の正規化を実施するための方法を参照する。付加的実施形態は、対応するコンピュータプログラムおよび対応する装置を参照する。
【発明の概要】
【課題を解決するための手段】
【0002】
次世代シークエンシング(NGS)は、並行して何百万ものDNA分子の配列を特性評価する。この目的で、何百万ものDNA分子が、撮像画面上の異なる位置でランダムに固定化され、クローンDNA分子の局所クラスタを形成するように複製される。これらのテンプレート分子のシークエンシングは、特異的ヌクレオチド(A、C、G、およびT)毎に4つの明確に異なる蛍光染料を伴って蛍光標識ヌクレオチドを組み込む、相補的DNAの合成によって実施される。特異的シークエンシング化学は、各シークエンシング反復(サイクル)が一度に1つだけのヌクレオチドを組み込むことを確実にする。サイクル毎に、シークエンシング装置(シーケンサ)は、個別の蛍光染料によって規定されるヌクレオチド規定波長毎に1つずつ、4つの明確に異なるフィルタ設定(チャネル)を用いて、画像を撮影する。シークエンシング工程全体は、したがって、n×c個の画像のセットによって表され、nは、チャネルの数(典型的には4)に等しく、cは、サイクルの数に等しい。
【0003】
本設定は、シークエンシングサイクル毎に全てのチャネルに関して収集される画像の配列からテンプレートDNA分子のヌクレオチド配列の推論を可能にする。テンプレートDNAクラスタの位置が把握されることを考慮して、本所与の位置における全てのチャネルにわたる強度プロファイルは、組み込まれた蛍光標識ヌクレオチドの推論を可能にする(ベースコール)。理論上、ゼロではない強度が、テンプレートDNAに存在するヌクレオチドに類似する、1つだけのチャネル内で検出可能であるべきである。撮像およびシークエンシング雑音を含む、種々の要因が、本最適事例からの導出をもたらし、ゼロではない強度は、典型的には、全てのチャネルに関して観察される。所与の位置に関して全てのシークエンシングサイクルにベースコールを実施することは、全ヌクレオチド配列の推論(読取)を可能にする。
【0004】
上記に示されるように、チャネルの間の信号分布は、ベースコールを決定する。しかしながら、本最適事例からの偏差(すなわち、1つだけのチャネルがゼロではない強度値によって特性評価される)は、以下の2つの構成要素に起因し得る。
i)バイアス
【0005】
ii)雑音
【0006】
最初のものが、ゼロからの系統的オフセットとして表されることができる一方で、後者は、サンプル間の本オフセットの周囲の変動によって表されることができる。重要なこととして、これらの構成要素は、チャネル特有であり得、したがって、偏バイアスされたベースコールにつながり得る。いくつかのチャネル特有のバイアス導入現象が、既知であり、典型的には、ベースコールにつながるアルゴリズムチェーンで補正される。これらは、バックグラウンド補正およびクロストーク補正を含む。しかしながら、既知の現象のみが、そのようなモデルベースのアプローチを使用して補正されることができる。したがって、改良されたアプローチの必要性がある。
【0007】
ベースコールの概念、または特に、バイアスおよび雑音効果に低減した影響を及ぼす、ベースコール手順に使用される事後画像分析を提供することが、本発明の目的である。
【0008】
本目的は、独立請求項の主題によって解決される。
【0009】
本発明の実施形態は、シークエンシング分析を実施するように取得される強度値の正規化を実施するための方法を提供する。本方法は、「複数のチャネルに関する複数の画像データを受信するステップ」、「複数のチャネルに関する全ての位置または全ての位置のサブセットにわたる強度分布のパラメータ化」、「複数のチャネルに関するパラメータ化分布を組み合わせるステップ」、および「複数のチャネルのそれぞれに関して、伝達関数を決定するステップ」という4つの基本的ステップを含む。画像データは、(例えば、シークエンシング装置によって生成される)複数の画像を含む。各受信された画像は、個別のチャネルに関して、例えば、4つのチャネルA、C、G、およびT(4つの塩基に属する)に関して、個別の画像の全ての位置にわたる、または少なくとも全ての位置のサブセットにわたる空間光密度分布の観点から、強度分布を記述する。強度分布は、複数のチャネルのそれぞれに関するパラメータ化分布を取得するようにパラメータ化される。複数のチャネルに関するパラメータ化分布から開始して、パラメータ化分布は、複数のチャネルの全てに関する、または少なくとも2つに関する共通分布を取得するように、目標と組み合わせられる。チャネル毎に伝達関数を決定する最後のステップは、個別のチャネルに関する個別の伝達関数が、対応する強度分布を共通分布にマップするように、実施される。
【0010】
本明細書に開示される教示は、強度分布が、典型的には、チャネル特有であり、チャネル間の系統的差につながるという所見に基づく。しかしながら、画像全体にわたって、A-、C-、G-、およびT-ベースコールの数は、ランダムに均等に分配されるべきであるため、全てのチャネルの全体的強度レベルは、相互に同等になり得る。同等性を維持するために、全てまたは関連するチャネルは、その強度レベルに関して適合されることができる。これは、各チャネル特有の強度分布を1つの共通分布に縮約し、その後、個別のチャネルに関する対応する補正係数が(縮約された)共通分布にマップされ得るように、それを決定するときに達成される。個別のチャネルに関する補正係数の使用は、全てのチャネルにわたるアンバイアス強度プロファイルを生成し、(低減した系統的差を伴わないまたは伴う)アンバイアスベースコールにつながる。ここで、バイアスにつながる正確な現象を把握することなく、ベースコールの補正が実施され得ることが有益である。
【0011】
別の実施形態によると、パラメータ化のステップは、最尤推定、最大事後推定、1つ以上のチャネルまたは全てのチャネルに関する要約統計を決定するサブステップ、または1つ以上のチャネルまたは全てのチャネルの強度分布を記述する規定パラメータセット(例えば、該分布の最大値および最小値)を決定するサブステップを使用して、実施される。決定する手順に関する推定は、有益なこととして、異なる強度分布が相互に同等になるように、同分布をパラメータ化することを可能にする。
【0012】
実施形態によると、2つのタイプの強度分布、すなわち、非正規分布および正規分布の間の区別が、行われる。一般的に、強度分布のタイプは、典型的には、非線形変換が非正規分布に使用され、線形変換が正規分布に使用されるように、伝達関数のタイプに影響を及ぼす。例えば、複数のチャネルのうちの1つ以上のものに関する、または全てに関するパラメータ化分布は、明確に異なる平均および明確に異なる標準偏差によるガウス分布によって記述される。ここで、個別のチャネルに関する個別の伝達関数はまた、対応する強度分布から平均を減算する、および/または対応する強度分布を標準偏差で除算する数学演算を含む、ガウス分布によって記述されることもできる。別の実施形態によると、対数変換、平方根変換、ボックス・コックス変換、またはYeo-Johnson変換のような伝達関数が、非正規強度分布に使用されることができる。代替として、非正規分布を近似正規分布に変換することを可能にする、別の変換が、適用されることができる。異なるシークエンシング分析技法または手順に関する強度分布が、そのタイプに関して変動するため、正規化プロセスが各ユースケースに適用され得るように、異なるタイプの強度分布を取り扱うことを可能にする、異なる変換アプローチを有することが有益である。
【0013】
上記の実施形態は、シークエンシング分析の1サイクル内で異なるチャネルにわたって正規化を実施することを示唆するが、さらなる実施形態によると、パラメータ化、組み合わせるステップ、および決定するステップが、複数のサイクルに関して実施されることに留意されたい。この場合、本方法は、伝達関数が平滑化関数を含むように、同関数を決定するステップを含む。ここで、平滑化は、サイクル間に急上昇が存在しないように、伝達関数が複数のサイクルにわたって強度分布を平滑化することを意味し、すなわち、平滑化関数は、同関数がサイクルの数にわたる強度値の最大変化を記述するように、および/または少なくとも2つの後続のサイクル内の強度値が一定のレベルに留まるように、選択される。本事例は、後続のサイクルのチャネル特有の分布が類似し、したがって、それらの特性評価パラメータ(すなわち、分布パラメータまたは要約統計)は相関性があるという仮定に依存する。別の変形例によると、複数のサイクルにわたる正規化は、分析の全てのサイクルにわたる正規化が行われ得るように、実施されてもよい。ここで、個別のチャネルに関する個別の伝達関数は、複数のオプションの強度値が、全てのチャネルに関してサイクルの数にわたって正規化されることを可能にする、および/または強度値がサイクルの数にわたって平均一定レベルに留まるように、正規化関数を含む。本アプローチは、強度ドリフトのような効果を補正することを可能にする。しかしながら、サイクルの数の減少または増加する強度値を引き起こす動向が存在する場合において、本アプローチは、シークエンシング分析に悪影響を及ぼし得る。したがって、正規化関数は、サイクルの数にわたる1つ以上のチャネルの動向が予期または検出されない場合のみに、決定される。本動向検出は、伝達関数を複数のチャネルおよびサイクルに適用する前に、画像データに基づいて実施されてもよい。
【0014】
当然ながら、異なるチャネルおよび異なるサイクルにわたって正規化(共通標的分布のパラメータ化、組み合わせ、および決定)を実施することが可能である。したがって、別の実施形態によると、基本的方法は、異なるように、すなわち、複数の画像データを受信するステップおよび強度分布の優先順位付けが、複数のチャネルおよびサイクルに関して実施され、組み合わせるステップおよび決定するステップが、複数のサイクルに関して実施されるように、実施されてもよい。別の言い方をすれば、これは、伝達関数が、複数のチャネルにわたるマッピングの代わりに、複数のサイクルにわたるマッピングを可能にすることを意味する。ここで、本移動関数の関連で議論されるような原理は、少なくとも1つのチャネルに関して適用されてもよい。上記で記述されるように、サイクルおよびチャネルにわたって強度分布を正規化するステップの組み合わせもまた、可能である。
【0015】
上記の実施形態は、チャネルの(必ずではないが)好ましくは全てが共通分布関数にマップされるという仮定から始まる。しかしながら、特に、複数のサイクルにわたる平滑化が実施される場合において、共通分布関数が、チャネル毎に、または独立して少なくとも2つのチャネルに関して、決定されることが有益であり得る。ここで、複数のチャネルの全てに関する共通分布は、チャネル毎に共通分布関数を含む、関数のセットによって記述されてもよく、共通分布関数のうちの少なくとも2つは、相互と異なる。各個別の伝達関数は、個別のチャネルに関する個別の伝達関数が、対応する強度分布をチャネルの対応する共通分布関数にマップするように、決定される。上記のように、複数のサイクルにわたる平滑化が実施される場合、複数の共通分布関数を有する、本アプローチが、選択される。ここで、複数の共通分布関数は、サイクルの数にわたる1つ以上のチャネルの動向が予期または検出される場合に、有益に使用され得る。
【0016】
別の実施形態によると、コンピュータプログラムは、上記の方法または方法ステップのうちの1つを実施するためのプログラムコードを有する。
【0017】
別の実施形態によると、シークエンシング分析を実施するように取得される強度値の正規化を実施するための装置が、提供される。ここでは、装置は、インターフェースと、プロセッサとを備える。インターフェースは、複数の画像データを受信し、プロセッサは、パラメータ化、組み合わせ、および伝達関数の決定を実施する。
本発明は、例えば、以下を提供する。
(項目1)
シークエンシング分析を実施するように取得される強度値の正規化を実施するための方法(100)であって、前記方法(100)は、
複数のチャネル(a-d)に関する複数の画像データ(11a-11d、15a-15d)を受信するステップ(110)であって、各画像データ(11a-11d、15a-15d)は、個別のチャネル(a-d)に関して、前記複数の画像データ(11a-11d、15a-15d)の画像の全ての位置にわたる強度分布を記述する、ステップと、
前記複数のチャネル(a-d)に関するパラメータ化分布を取得するための前記複数のチャネル(a-d)に関する全ての位置にわたる前記強度分布のパラメータ化(120)と、
前記複数のチャネル(a-d)の全てに関する共通分布を取得するように、前記複数のチャネル(a-d)に関する前記パラメータ化分布を組み合わせるステップ(130)と、
前記複数のチャネル(a-d)の各々に関して、前記個別のチャネル(a-d)に関する個別の伝達関数が、対応する強度分布を前記共通分布にマップするように、伝達関数を決定するステップ(140)と
を含む、方法(100)。
(項目2)
前記パラメータ化(120)および決定するステップ(140)は、それぞれが特異的ヌクレオチドに属する4つのチャネル(a-d)に関して実施される、かつ/または
前記パラメータ化(120)および決定するステップ(140)は、それぞれ、4つの特異的ヌクレオチドをマークする4つの明確に異なる蛍光染料のうちの1つを決定するようにフィルタ処理される4つのチャネル(a-d)に関して実施される、
項目1に記載の方法(100)。
(項目3)
前記複数のチャネル(a-d)内の各位置は、その独自の配列および/またはその独自のDNA配列に属する、項目1または2に記載の方法(100)。
(項目4)
パラメータ化(120)のステップは、最尤推定、最大事後推定、1つ以上のチャネルまたは全てのチャネル(a-d)に関する要約統計を決定する(140)サブステップ、または1つ以上のチャネルまたは全てのチャネル(a-d)の強度分布を記述する規定パラメータセットを決定する(140)サブステップを使用して、実施される、前記項目のうちの1項に記載の方法(100)。
(項目5)
前記個別の伝達関数は、前記共通分布への前記対応する強度分布の線形変換を可能にする、前記項目のうちの1項に記載の方法(100)。
(項目6)
前記個別の伝達関数は、前記共通分布への前記対応する強度分布の非線形変換を可能にする、項目1-5のうちの1項に記載の方法(100)。
(項目7)
前記複数のチャネル(a-d)のうちの1つ以上のものまたは全てに関する前記強度分布は、明確に異なる平均および明確に異なる標準偏差を伴うガウス分布によって記述される、前記項目のうちの1項に記載の方法(100)。
(項目8)
前記ガウス分布によって記述される前記個別のチャネル(11a-11d)に関する前記個別の伝達関数は、前記対応する強度分布から平均を減算する数学演算および/または前記対応する強度分布を標準偏差で除算する数学演算を含む、項目7に記載の方法(100)。
(項目9)
前記複数のチャネル(a-d)のうちの1つに関する、またはより多くに関する、または全てに関する、前記強度分布は、非正規分布によって記述される、項目6に記載の方法(100)。
(項目10)
前記個別の伝達関数は、対数変換、平方根変換、ボックス・コックス変換、またはYeo-Johnson変換を可能にする、項目9に記載の方法(100)。
(項目11)
前記パラメータ化(120)、組み合わせるステップ(130)、および決定するステップ(140)は、各サイクルに対して個別に実施される、前記項目のうちの1項に記載の方法(100)。
(項目12)
前記パラメータ化(120)、組み合わせるステップ(130)、および決定するステップ(140)は、複数のサイクル(11-15)または全てのサイクル(11-15)に関して実施される、項目1-10のうちの1項に記載の方法(100)。
(項目13)
前記伝達関数を決定するステップ(140)は、前記個別のチャネル(a-d)に関する前記個別の伝達関数が平滑化関数を含むように実施され、
前記平滑化関数は、サイクル(11-15)の数にわたる前記強度値の最大変化を記述する、かつ/または、前記平滑化関数は、前記強度値がサイクル(11-15)の数にわたって平滑化されるように決定される(140)、
項目12に記載の方法(100)。
(項目14)
各個別の伝達関数は、正規化関数を含み、
前記正規化関数は、前記複数のチャネル(a-d)の強度値が、全てのチャネル(a-d)に関してサイクル(11-15)の数にわたって正規化されるように、決定される(140)、項目12または13に記載の方法(100)。
(項目15)
前記個別の正規化関数は、サイクル(11-15)の数にわたる1つ以上のチャネル(a-d)の動向が検出されない場合に、決定される(140)、項目14に記載の方法(100)。
(項目16)
前記複数のチャネル(a-d)の全てに関する前記共通分布は、各チャネルに対して共通分布関数を含む関数のセットによって記述され、前記共通分布関数のうちの少なくとも2つは、相互と異なり、
各個別の伝達関数は、前記個別のチャネル(a-d)に関する前記個別の伝達関数が、前記対応する強度分布を対応する共通分布関数にマップするように、決定される(140)、
項目12に記載の方法(100)。
(項目17)
前記複数の共通分布関数は、サイクル(11-15)の数にわたる1つ以上のチャネル(a-d)の動向が検出される場合に、決定される(140)、項目15に記載の方法(100)。
(項目18)
各伝達関数は、平滑化関数を含み、前記平滑化関数は、サイクル(11-15)の数にわたる前記強度値の最大変化を記述する、かつ/または、前記平滑化関数は、前記個別のチャネル(a-d)に使用される前記強度値がサイクル(11-15)の数にわたって平滑化されるように決定される(140)、項目16または17に記載の方法(100)。
(項目19)
全ての位置にわたる前記強度分布および/または前記パラメータ化分布は、前記複数のチャネル(a-d)のうちの個別のチャネルに関する個別の強度値に相関してカウント数を記述する、かつ/または
少なくとも2つの、全ての関連する、または全てのチャネル(a-d)に関する前記共通分布は、前記複数のチャネルの少なくとも2つの、全ての関連する、または全てのパラメータ化分布の平均を表し、かつ/または、少なくとも2つの、全ての関連する、または全てのチャネルに関する前記共通分布は、少なくとも2つの、全ての関連する、または全てのチャネル(a-d)に関する平均強度値に相関して平均カウント数を記述する、
項目1-18のうちの1項に記載の方法(100)。
(項目20)
コンピュータプログラムをその上に記憶しているコンピュータ可読デジタル記憶媒体であって、前記コンピュータプログラムは、プログラムコードを有し、前記プログラムコードは、コンピュータ上で起動するときに、前記項目のうちの1項に記載の方法(200)を実施する、コンピュータ可読デジタル記憶媒体。
(項目21)
シークエンシング分析を実施するように取得される強度値の正規化を実施するための方法(100、200)の正規化を実施するための装置であって、
複数のチャネル(a-d)に関する複数の画像データ(15a-15d)を受信するためのインターフェースであって、各画像データ(11a-11d、15a-15d)は、個別のチャネル(a-d)に関して、前記複数の画像データ(11a-11d、15a-15d)の画像の全ての位置にわたる強度分布を記述する、インターフェースと、
プロセッサであって、前記プロセッサは、前記複数のチャネル(a-d)に関する全ての位置にわたる前記強度分布をパラメータ化し、前記複数のチャネル(a-d)に関するパラメータ化分布を取得するように構成され、かつ、前記複数のチャネル(a-d)に関する前記パラメータ化分布を組み合わせ、前記複数のチャネル(a-d)の全てに関する共通分布を取得するように構成される、プロセッサと
を備え、
前記プロセッサは、前記複数のチャネル(a-d)の各々に関して、前記個別のチャネル(a-d)に関する個別の伝達関数が、対応する強度分布を前記共通分布にマップするように、伝達関数を決定する(140)ように構成される、装置。
【図面の簡単な説明】
【0018】
本発明の実施形態が、続いて、添付の図面を参照して議論されるであろう。
【
図1a】
図1aは、ある実施形態による、正規化が複数のチャネル(1つのサイクル)にわたって実施される、シークエンシング分析に使用される画像データに属する、強度値の正規化を実施するための方法を図示する、フローチャートを示す。
【
図1b】
図1bは、別の実施形態による、正規化が複数のサイクルにわたって実施される、強度値の正規化のための方法を図示する、フローチャートを示す。
【
図1c】
図1cは、シークエンシング分析の原理を図示するための異なるチャネルおよび異なるサイクルに属する画像データの概略図を示す。
【
図1d】
図1d-1eは、シークエンシング分析に使用される単一チャネル間の強度差を図示する、概略図を示す。
【
図1e】
図1d-1eは、シークエンシング分析に使用される単一チャネル間の強度差を図示する、概略図を示す。
【
図1f】
図1fは、実施形態による、正規化によって達成される改良を図示するための強度分布の概略図を示す。
【
図2a】
図2a-cは、ある実施形態による、強度分布およびその正規化を図示する概略図を示す。
【
図2b】
図2a-cは、ある実施形態による、強度分布およびその正規化を図示する概略図を示す。
【
図2c】
図2a-cは、ある実施形態による、強度分布およびその正規化を図示する概略図を示す。
【0019】
【
図3a】
図3a-cは、複数のサイクルにわたって正規化を実施することの原理を図示するための強度分布特性評価パラメータの概略図を示す。
【
図3b】
図3a-cは、複数のサイクルにわたって正規化を実施することの原理を図示するための強度分布特性評価パラメータの概略図を示す。
【
図3c】
図3a-cは、複数のサイクルにわたって正規化を実施することの原理を図示するための強度分布特性評価パラメータの概略図を示す。
【発明を実施するための形態】
【0020】
下記では、実施形態が、続いて、添付の図面を参照して詳細に議論されるであろう。ここでは、同じ参照番号が、その記述が相互に適用可能かつ交換可能であるように、類似または同じ機能を有する方法ステップ上の要素に提供される。
【0021】
図1aは、強度値の正規化を実施するための基本的方法100を示す。本方法100は、主に、シークエンシング分析に使用される。シークエンシング分析またはDNA分析に関して、テンプレート分子の一本鎖DNA断片は、単一の塩基またはヌクレオチド(一般に、着目分子)が蛍光染料を使用して検出され得るように、拡張される。
【0022】
これは、
図1cによって例示的に図示される。
図1cは、シークエンシング装置によって生成される画像の例示的セットを示す。シークエンシングサイクル11-15毎に、n個の画像11a-11d/11a-15dのセットが、チャネル(規定蛍光染料に属する)毎に1つずつ、収集される。いくつかの画像では、チャネルA-Dは、(DNA)シークエンシングに使用される公式標識である、A、C、G、およびTと称されることに留意されたい。強度値は、符号化される。白色ピクセルが、フルオロフォアによる放射光を表し得る一方で、暗いピクセル面積は、背景強度を表し得る。
【0023】
典型的には、4つの区別可能な蛍光染料が使用されるように、4つのヌクレオチド(A、C、G、およびT)の間で区別が行われる。各チャネルが、独自のチャネルを使用して検出されることができる。チャネルは、複数の画像11a-11dが1つのサイクル中に分析される必要があるように、異なるフィルタ設定を使用して分析されることができる。各サイクルは、シークエンシング反復(サイクル11、サイクル12、サイクル13等、サイクル15等を参照)を指す。その背景は、各シークエンシング反復/サイクル11-15中に、1つだけのヌクレオチドが検出され得ることである。完全を期するためのみに、単一サイクル11-15の間に、新しい塩基/ヌクレオチドが組み込まれ得るように、蛍光染料を開裂するステップと、シークエンシングプライマを拡張するステップとを含む、手順が実施されることに留意されたい。
【0024】
シークエンシングサイクル11-15毎に、n個の画像(11a-11d)のセットが要求される。シークエンシング工程全体は、n×c個の画像11a-15dのセットによって表され、nは、チャネルの数(典型的には4)に等しく、cは、サイクルの数(ここでは5)に等しい。別の言い方をすれば、これは、各シークエンシング工程が2つの主要な次元、すなわち、サイクルの数によって画定される次元およびチャネルの数によって画定される次元を有することを意味する。
【0025】
上記に示されるように、チャネルa-d(A、C、G、およびT)の間の信号分布は、ベースコールを決定する。最適な事例では、1つだけのチャネルが、ゼロではない強度値によって特性評価される。本最適な事例は、
図1dによって示される。
図1dによって図示されるように、チャネルcのみが、信号を出力する。そのような場合において、画像の検査された位置における検査されたサイクル内で、タイプcのヌクレオチドが検出されることが、断言され得る。
【0026】
しかしながら、実際には、測定された強度信号は、バイアスおよび雑音成分によって歪曲される。そのようなバイアスされた強度値は、
図1eによって示される。ここで、個別のチャネルに属する各信号のバイアスおよび信号成分は、異なる斜線によってマークされる。典型的には、これらの成分は、具体的チャネル内のゼロからの系統的オフセットにつながる。バイアスに起因して、チャネルaおよびdに関する強度値は、ほぼ同一である。したがって、2つのチャネルは、容易に相互に区別され得ない。
【0027】
方法100は、正規化を実施することによって、バイアスおよび/または雑音へのチャネル特有の寄与を除去することが可能である。ここで、データ駆動型アプローチは、(好ましくは、1つのサイクル11、12等、または15内で)全てのチャネルA-Dにわたって強度値を正規化することを可能にする。第1のステップ110内では、複数のチャネルに関する複数の画像データ、すなわち、
図1Cの実施例に関して、画像11a-11aが、受信される。各画像11a-11dは、個別のチャネルA-Dに関して、個別の画像要素11a-11dの全ての位置にわたる、または各画像11a-11dの一部のみが分析されるべきであるときに少なくとも全ての位置のサブセットにわたる強度分布を記述する。その後、第1のサイクル11に関する全ての画像データが、利用可能である。
【0028】
画像11a-11d、または少なくとも2つの画像の関連する位置にわたる強度分布は、複数のチャネルに関するパラメータ化分布を取得するために、パラメータ化される。本ステップは、参照番号120によってマークされる。パラメータ化分布は、例えば、要約統計であることができる、または具体的パラメータ、例えば、平均を使用して、記述されることができる。したがって、ステップ120は、要約統計のような個別のチャネルの挙動を記述する有意なパラメータまたはパラメータセットを決定するサブセットを含むことができる。代替として、最尤推定または事後推定が、使用されることができる。
【0029】
ここでは、全ての位置にわたる強度分布および/またはパラメータ化分布は、例えば、複数のチャネルa-dのうちの個別のチャネルに関する個別の強度値に相関してカウント数を記述することに留意されたい(
図2a参照)。したがって、強度分布は、2次元空間内で画定される。
【0030】
次のステップ120内で、全てまたは少なくとも2つのチャネルa-d(A、C、G、およびT)に関する複数のパラメータ化分布は、第1のサイクル内の全てまたは関連するチャネルに関する共通分布が取得され得るように、組み合わせられる。例えば、共通分布は、全てまたは全ての関連するパラメータ化分布の平均であってもよい。
【0031】
共通分布との関連で、(少なくとも2つ、全ての関連する、または全てのチャネルa-dに関する)共通分布は、複数のチャネルの(少なくとも2つの)全ての関連する(または全ての)パラメータ化分布/強度分布の平均を表すことに留意されたい。例えば、(少なくとも2つの)全ての関連する(または全ての)チャネルに関する共通分布は、少なくとも2つ、全ての関連する、または全てのチャネルa-dに関する平均強度値に相関して平均カウント数を記述し得る(
図2c参照)。その結果として、共通分布または共通分布内の各点は、例えば、パラメータ化分布から導出される、少なくとも2つのパラメータ(カウント数および強度)によって画定され得る。その結果として、共通分布はまた、2次元空間内で画定される。
【0032】
共通分布から開始して、個別のチャネル11a-11dの強度値は、チャネル11a-11d毎に個別の伝達関数を使用して、共通分布にマップされることができる。本ステップは、参照番号140によってマークされる。個別の伝達関数は、画像11a-11cをフィルタ処理または正規化するために使用されることができる。個別の伝達関数が、個別のチャネル11a-11dの全てまたは少なくとも全ての関連する位置(全ての位置のサブセット)に基づいて決定されるため、伝達関数は、チャネル特有の効果が回避または排除され得るように、チャネル11a-11dが平均化された同一の挙動を有することを可能にする。
【0033】
実施例:単に、1つのチャネルが別のチャネルよりも実質的に高い輝度を有するという基本的実施例から開始して、決定された伝達関数が、明るいチャネル全体、特に、チャネル内の単一の位置の各強度値の減光を可能にすることが明らかである。減光(チャネル特有の伝達関数の適用)に起因して、チャネル内の信号位置に属する強度値は、伝達関数または正規化手順を適用しない場合よりも同等になる。
【0034】
ここでは、個別のチャネル11a-11d、またはより詳細に、個別のチャネル11a-11dの各関連する位置(全ての位置のサブセット)または少なくとも1つの位置の画像分析が、個別の伝達関数を強度値に適用している間に実施される場合、異なるチャネル11a-11dの強度値は、相互から区別可能である。これは、
図1fによって図示される。
【0035】
図1fは、左側の図に
図1fの測定された強度値を示す。個別のチャネルへの個別の伝達関数の適用は、
図1dに関して議論されるような強度の図にほぼ同じである、4つのチャネル内の(関連する位置/1つの位置に関する)強度値が達成され得るように、バイアスの除去を可能にする。ここでは、本バイアスは、ベースコールから直接抽出されることができないが、上記で記述されるような全てのベースコールにわたって強度値分布を介して推定される必要があることが重要である。伝達関数の適用に起因して、チャネル特有のバイアスは、フィルタ正規化、およびチャネルCへの明白なベースコールを可能にすることによって、除去される。
【0036】
強度値へのチャネル特有の伝達関数の適用は、参照番号150によってマークされる随意のステップである。方法ステップ110-140の使用は、伝達関数の決定を可能にし、全ての方法ステップ110-150の実施は、1つのサイクル内でチャネルの正規化を可能にする。したがって、基本的アプローチから開始して、ステップ150は、随意のステップである。
【0037】
実施形態では、正規化は、異なるチャネルを相互に正規化する状況で記述されているが、正規化はまた、加えて、または代替として、1つ以上のチャネルが複数のサイクルにわたって正規化されるように実施されることもできる。本アプローチは、方法200のブロック図を示す、
図1Bによって図示される。方法200は、基本的ステップ210-240と、随意のステップ250とを含む。ステップ210は、ステップ110と同等であり、画像データは、1つのサイクル11の画像を備えるだけではなく、複数のサイクルまたは全てのサイクルに属する画像も備える。ステップ220内で、受信された画像の全ての位置にわたる、または全ての関連する位置にわたる強度分布は、パラメータ化される。その後、少なくとも、複数のサイクルにわたる1つのチャネルに関する、パラメータ化分布は、複数のサイクルにわたる少なくとも1つのチャネルに関する共通分布を取得するために、組み合わせられる。ステップは、参照番号230によってマークされる。本ステップは、随意に、複数のサイクルおよびチャネルに関する共通分布が取得されるように、実施されてもよい。共通分布から開始して、少なくとも複数のサイクル11-15に関する個別の伝達関数の決定が、ステップ240内で実施される。ステップ250は、画像分析中に決定された伝達関数を適用する随意のステップである。
【0038】
図2Aおよび2Cに関して、上記の方法の背景が、記述されるであろう。
【0039】
図2Aは、(x軸にわたってプロットされる)個別の強度値に関するカウント数(y軸)を図示する、略図を示す。ここで、観察された値は、参照番号40Oによってマークされる。本観察された信号40Oは、2つの信号部分、すなわち、雑音40Nおよび実信号40Sに起因する。全ての位置にわたる所与のチャネルに関する強度分布の本概略図は、観察された強度分布40Oが、雑音分布40Nから引き出される強度および信号分布40Sから引き出される強度を伴う位置の結果であることを明確にする。雑音の分布および信号分布に依存して、観察された分布は、二峰性である場合とそうではない場合がある。本略図は、所与のチャネルの中で観察される強度値40Oが、確率変数によってモデル化され得るという点で、他の言葉で記述されることができる。位置毎に、確率変数は、2つの明確に異なる分布のうちの1つ、すなわち、チャネルが組み込まれたヌクレオチド合致を示す場合は「信号分布」40S、他の場合は「雑音分布」40Nから引き出される。全ての位置にわたる観察された強度分布は、両方の分布の組み合わせによって特性評価されるであろう。強度分布は、チャネル特有であり、
図2Bによって見られ得るような系統的差につながり得る。
【0040】
図2Bは、2つのチャネル4001および4002の強度分布の概略図を示す。ここで、観察された強度分布4001および4002は、両方のチャネルに関して明確に異なる。本差異は、バイアスされたベースコールにつながり得る。
【0041】
チャネル特有の伝達関数の使用によって、全ての位置4001および4002にわたる観察された強度は、同強度が共通分布にしたがうように、歪曲されることができる。これは、アプローチの目標が、全てのチャネル特有の強度分布を1つの共通分布に縮約し、それによって、全てのチャネルにわたるアンバイアス強度プロファイルを生成し、2つのアンバイアスベースコールを残すことを意味する。本縮約は、方法100を使用して決定されるチャネル特有の伝達関数の平均を介して行われてもよい。結果は、
図2Cに示される。
【0042】
図2Cは、(共通分布に対応する)2つのチャネルに関する補正された強度分布の概略図を示す。ここでは、補正された強度の略図は、参照番号4001’および4002’によってマークされる。チャネル特有の強度分布4001’および4002’の本縮約は、アンバイアスベースコールにつながり得る。
【0043】
ここでは、個別のチャネル内の全ての位置の観察された強度値は、強度分布4001’および4002’が達成されるように、伝達関数を使用して歪曲される。
【0044】
2つ以上のチャネルの間の正規化から開始して、1つの分布への全てのチャネル特有の強度分布の縮約を可能にする、個別の伝達関数を決定するための好ましい方法が、議論されるであろう。これに関して、観察された強度分布は、特性評価される必要がある。
【0045】
全てのチャネル特有の強度分布を1つの共通分布に縮約するために、観察された強度分布は、特性評価される必要がある。分布特性評価は、2つのアプローチ、すなわち、i)定義された分布のパラメータ化およびii)未定義分布の特性評価に分類されることができる。第1の事例は、雑音および信号につながる現象が把握され、結果として生じる観察された分布群が導出されることができる場合に、適用される。この場合、パラメータ化は、最尤推定または最大事後推定のような確率的モデル化および標準手順によって実施されることができる。観察された強度分布の確率的モデルが把握されない場合、特性評価は、要約統計を介して起こり得る。基礎的分布の複雑性およびチャネル特有の分布が明確に異なる程度に応じて、これは、単一の要約統計または要約統計の組み合わせによって実施されることができる。一般的な適用可能な要約統計は、平均、最頻値、標準偏差(SD)、および順序統計を含む。
【0046】
全てのチャネルに関する特性評価された強度分布のセットを考慮すると、第2のステップは、全てのチャネル特有の分布が縮約され得る、共通分布を見出すことである。これは、結果として生じる強度分布が規定パラメータまたは要約統計によって特性評価される分布にしたがうように、データのチャネル特有の変換によって実施される。変換の性質は、基礎的分布に依存し、単純な線形変換、非線形変換、線形または非線形変換のセット、または両方のセットの組み合わせであってもよい。最も単純な事例では、強度分布は、ガウス分布によって記述され得る。この場合、チャネル特有の分布は、平均の減算およびSDによる除算によってガウス分布を正規化することによって、縮約されることができる。
【0047】
複数のチャネルの間の強度分布正規化の類似的に、その代わりに、またはそれに加えて、サイクル特有の正規化が、使用されることができる。
【0048】
上記に記述される強度正規化アプローチは、全てのサイクルに、またはサイクル毎に個別に適用されてもよい。後者の場合は、シークエンシングサイクルの関数として導入される差異(すなわち、ドリフト)を補正するために望ましくあり得る。ドリフトは、例えば、サイクル特有のシークエンシング構成(すなわち、適合撮像または化学)の場合に、または減衰または増加する性能に起因して、起こり得る。サイクル特有の正規化は、上記で記述されるように実施されることができる。代替として、サイクル状況が、正規化変換を平滑化するために使用されることができる。本事例は、後続のサイクルのチャネル特有の分布が類似し、したがって、それらの特性評価パラメータ(すなわち、分布パラメータまたは要約統計)は相関性があるという仮定に依存する。平滑化に関して、チャネル特有の分布特性評価は、サイクル毎に、またはサイクルのグループに関して、上記で記述されるように実施される。平滑化は、スライド窓アプローチ(平均、中央値、ガウスフィルタ、局所モデル適合)またはサイクルセット全体(例えば、多項式)上のモデル適合を含む、種々の関数によって実施されてもよい。規定標的分布への変換モデルを推定するために、平滑化関数によって推定されるパラメータが、分布特性評価から導出されるパラメータの代わりに使用される。
【0049】
本アプローチは、
図3A-3Cを参照して議論されるであろう。
【0050】
図3Aは、1つの分布特性評価パラメータ、ここでは、平均の概略図を示す。平均は、要約統計の実施例として、2つのチャネルに関する強度分布を特性評価するために使用されることができる。2つのチャネルに関する本パラメータは、参照番号44M1および44M2によってマークされる。平均は、ドットによって示されるように、サイクル毎に個別に決定され、サイクル数と対比してプロットされる。分かり得るように、後続の平均は、相関性があるが、有意な雑音を示す。雑音は、除去されることができ、平滑化された線をもたらす。雑音除去後、平均は、バイアスされたベースコールにつながり得る、系統的差を示す、両方のチャネルの間の有意差を保つ。平滑化された線は、次いで、例えば、チャネル特有の正規化に関して、雑音の多いサイクル特有の値の代わりに使用されてもよい。
【0051】
系統的差を排除するために、分布は、上記で議論されるアプローチを使用して正規化されることができ、それに従って、複数のチャネルは、各チャネルが共通分布にマップされるように、伝達関数を使用して歪曲される。変換は、パラメータ対サイクルの一般的動向が保たれるように実施されることができる。
【0052】
本アプローチは、平滑化された平均44MS1’および44MS2’とともに、2つのチャネルの歪曲された平均44M1’および44M2’を示す、
図3Bによって図示される。歪曲された値44M1’および44M2’および44MS1’および44MS2’は、サイクルに対する平均の全体的動向を完全なままにするが、平均が両方のチャネルに関して類似するように、サイクル毎に分布を正規化する。ここで、標的分布は、平均が0~1の間でスケーリングされるように選択される。これは、標的分布の定義および本分布に到達するための変換の導出によって達成されることができる。一般的動向が保たれるべきである場合、定義された標的分布は、これを反映するべきである。動向が同一である場合、全てのチャネルに関して、縮約は、ここで示されるような定義された値(最小=0、最大=1)の間で特性評価パラメータを正規化することによって、達成されることができる。
【0053】
別の言い方をすれば、これは、ある実施形態によると、平滑化とともに単一チャネルの間の正規化が使用され得ることを意味する。チャネル間正規化に起因して、同チャネルの間の区別が、向上され、平滑化は、後続のサイクルの間の急上昇の回避を可能にする。
【0054】
別の実施形態によると、さらなるアプローチは、パラメータプロファイルが複数のサイクルに対して定常であるように、他のチャネルに対するチャネルおよび全てのサイクルにわたる範囲の両方を正規化する。本アプローチは、
図3Cによって図示される。
図3Cは、その平滑化されたバージョン44MS1”および44MS2”とともに、2つのチャネル44M1”および44M2”の平均を示す。分かり得るように、本第2のアプローチは、シークエンシング工程全体にわたる定常分布の生成を可能にする。これは、全てのサイクルに関して同じであるべきである、標的分布の定義によって達成される。個別のチャネルに関する取得された伝達関数は、シークエンシング分析中に/それを実施するために、チャネルを正規化するように使用されることができる。
【0055】
下記で、拡張実施例が、議論されるであろう。4つの明確に異なるチャネル内で強度を測定し、サイクル毎に、チャネル特有の強度値が、明確に異なる平均を伴うが同じSDを伴うガウス分布に従って、分布されることを仮定する。この場合、強度分布正規化は、単純である。すなわち、i)サイクル毎のチャネル特有の分布が、強度の平均によって特性評価される。ii)平均対サイクルが、チャネル毎に個別に決定され、適切な方法(例えば、窓付き手段)を使用して平滑化される。iii)サイクル毎の標的分布が、決定される。さらに、強度の平均は、全てのチャネルに関する類似関数を伴ってサイクルに対して増加し、本一般的動向を保つことを所望すると仮定する。平均対サイクル動向を保つために、標的分布の平均は、0~1に及び、全体的動向にしたがう規定される。iv)変換は、平滑化された観察されるチャネル平均を減算し、標的分布の平均を加算することによって実施される。
【0056】
チャネル強度分布を縮約することの一実施例は、標準化を介した明確に異なる平均および標準偏差(すなわち、平均=0、SD=1)、または結果として生じる近似的正規分布の標準化が後に続く、近似的正規分布への非正規分布の変換(例えば、対数変換、平方根変換、ボックス・コックス変換、Yeo-Johnson変換)を用いて、ガウス分布を正規化するステップを含んでもよい。
【0057】
上記の議論を参照して、全ての実施形態が方法との関連で記述されているが、本概念はまた、装置としても実装され得ることに留意されたい。ここで、全ての上記の実装側面はまた、装置との関連で使用されてもよい。
【0058】
いくつかの側面は、装置との関連で記述されているが、これらの側面はまた、対応する方法の記述も表し、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応することが明らかである。類似的に、方法ステップとの関連で記述される側面はまた、対応する装置の対応するブロックまたはアイテムまたは特徴の記述も表す。方法ステップのうちのいくつかまたは全ては、例えば、マイクロプロセッサ、プログラマブルコンピュータ、または電子回路のようなハードウェア装置によって(またはそれを使用して)、実行されてもよい。いくつかの実施形態では、最も重要な方法ステップのうちのある1つ以上のものは、そのような装置によって実行されてもよい。
【0059】
ある実装要件に応じて、本発明の実施形態は、ハードウェアで、またはソフトウェアで実装されることができる。実装は、個別の方法が実装されるように、プログラマブルコンピュータシステムと協働する(または協働することが可能である)、電子的可読制御信号をその上に記憶している、デジタル記憶媒体、例えば、フロッピー(登録商標)ディスク、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリを使用して、実施されることができる。したがって、デジタル記憶媒体は、コンピュータ可読であり得る。
【0060】
本発明による、いくつかの実施形態は、本明細書に記述される方法のうちの1つが実施されるように、プログラマブルコンピュータシステムと協働することが可能である、電子的可読制御信号を有する、データキャリアを備える。
【0061】
概して、本発明の実施形態は、プログラムコードを伴うコンピュータプログラムとして実装されることができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で起動するときに、方法のうちの1つを実施するために動作可能である。プログラムコードは、例えば、機械可読キャリア上に記憶されてもよい。
【0062】
他の実施形態は、機械可読キャリア上に記憶された本明細書に記述される方法のうちの1つを実施するためのコンピュータプログラムを備える。
【0063】
換言すると、発明の方法の実施形態は、したがって、コンピュータプログラムがコンピュータ上で起動するときに、本明細書に記述される方法のうちの1つを実施するためのコンピュータプログラムを有する、コンピュータプログラムである。
【0064】
発明の方法のさらなる実施形態は、したがって、その上に記録された、本明細書に記述される方法のうちの1つを実施するためのコンピュータプログラムを備える、データキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は、典型的には、有形および/または非一過性である。
【0065】
発明の方法のさらなる実施形態は、したがって、本明細書に記述される方法のうちの1つを実施するためのコンピュータプログラムを表す、データストリームまたは一連の信号である。データストリームまたは一連の信号は、例えば、データ通信接続を介して、例えば、インターネットを介して、転送されるように構成されてもよい。
【0066】
さらなる実施形態は、本明細書に記述される方法のうちの1つを実施するように構成または適合される、処理手段、例えば、コンピュータ、またはプログラマブル論理デバイスを備える。
【0067】
さらなる実施形態は、本明細書に記述される方法のうちの1つを実施するためのコンピュータプログラムをその上にインストールしている、コンピュータを備える。
【0068】
本発明による、さらなる実施形態は、本明細書に記述される方法のうちの1つを実施するためのコンピュータプログラムを受信機に(例えば、電子的に、または光学的に)転送するように構成される、装置またはシステムを備える。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイス、または同等物であってもよい。装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを備えてもよい。
【0069】
いくつかの実施形態では、プログラマブル論理デバイス(例えば、フィールドプログラマブルゲートアレイ)が、本明細書に記述される方法の機能性のうちのいくつかまたは全てを実施するために使用されてもよい。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記述される方法のうちの1つを実施するために、マイクロプロセッサと協働してもよい。概して、本方法は、好ましくは、任意のハードウェア装置によって実施される。
【0070】
上記で記述される実施形態は、本発明の原理のための例証にすぎない。本明細書に記述される配列および詳細の修正および変形例が、当業者に明白であろうことを理解されたい。したがって、本明細書の実施形態の記述および解説によって提示される具体的詳細ではなくて、直下に記載の特許請求の範囲のみによって限定されることが意図される。