特許7232260 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ キンドリル・インクの特許一覧

特許7232260ＤＮＡ計算による機械学習（ＭＬ）のモデル化

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-02-21

(45)【発行日】2023-03-02

(54)【発明の名称】ＤＮＡ計算による機械学習（ＭＬ）のモデル化

(51)【国際特許分類】

G06N 20/00 20190101AFI20230222BHJP

【ＦＩ】

G06N20/00

【請求項の数】 25

(21)【出願番号】P 2020555042

(86)(22)【出願日】2019-05-24

(65)【公表番号】

(43)【公表日】2021-09-24

(86)【国際出願番号】 IB2019054334

(87)【国際公開番号】W WO2019229607

(87)【国際公開日】2019-12-05

【審査請求日】2021-09-27

(31)【優先権主張番号】15/994,145

(32)【優先日】2018-05-31

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】521555742

【氏名又は名称】キンドリル・インク

【氏名又は名称原語表記】ＫｙｎｄｒｙｌＩｎｃ．

【住所又は居所原語表記】ＯｎｅＶａｎｄｅｒｂｉｌｔＡｖｅｎｕｅ，１５ｔｈＦｌｏｏｒ，ＮｅｗＹｏｒｋ，ＮｅｗＹｏｒｋ１００１７，ＵＳＡ

(74)【代理人】

【識別番号】110000420

【氏名又は名称】弁理士法人ＭＩＰ

(72)【発明者】

【氏名】ディアマンティ、ゲイリー、フランシス

(72)【発明者】

【氏名】ボウマン、アーロン

(72)【発明者】

【氏名】マーゾラティ、マウロ

【審査官】渡辺順哉

(56)【参考文献】

【文献】米国特許出願公開第２０１７／０１１６３７２（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

(57)【特許請求の範囲】

【請求項1】

機械学習モデルを生成するためのコンピュータ実装方法であって、
２つ以上のプロセッサによって、トレーニング・データ・セットを識別することと、
前記２つ以上のプロセッサによって、初期ベータ値のウィンドウを定義することであって、前記初期ベータ値が、各条件付き期待値における前記識別されたトレーニング・データ・セットに対するバイアスを表す、前記定義することと、
前記２つ以上のプロセッサによって、前記トレーニング・データ・セットからの各特徴ベクトルに対応する前記各条件付き期待値を正則化することであって、前記条件付き期待値に対する正則化の２つ以上の方法が、特徴ベクトルごとに並列に実行される、前記正則化することと、
前記２つ以上のプロセッサによって、前記正則化から生じる前記条件付き期待値から導出されたモデルの複数の集団を作成することと、
前記２つ以上のプロセッサによって、前記作成された集団のうちの最良適合集団を前記機械学習モデルとして生成することであって、前記機械学習モデルが、前記トレーニング・データ・セットとは区別される入力に基づいて対象の結果を予測する、前記生成することと
を含んでおり、
前記２つ以上のプロセッサが、１つまたは複数のデジタル・プロセッサおよび１つまたは複数のＤＮＡプロセッサを含んでいる、コンピュータ実装方法。

【請求項2】

前記正則化することが、
前記１つまたは複数のデジタル・プロセッサによって、正則化指標

【数1】

を各条件付き期待値に追加することを含んでおり、

【数2】

が残差平方和を示し、

【数3】

が、正則化方法に従う正則化の大きさのランクである、請求項１に記載のコンピュータ実装方法。

【請求項3】

前記正則化に使用される前記正則化方法がラッソ回帰（ＬＡＳＳＯ）であり、

【数4】

である、請求項２に記載のコンピュータ実装方法。

【請求項4】

前記正則化に使用される正則化方法がリッジ回帰（ＲＲ）であり、

【数5】

である、請求項２に記載のコンピュータ実装方法。

【請求項5】

前記１つまたは複数のＤＮＡプロセッサによって、前記正則化からの前記条件付き期待値を各ＤＮＡ鎖としてエンコードすることをさらに含んでおり、前記エンコーディングおよび前記正則化が、前記各ＤＮＡ鎖を介して互いに相互作用する、請求項１に記載のコンピュータ実装方法。

【請求項6】

前記エンコーディングが、
前記１つまたは複数のＤＮＡプロセッサによって、前記定義されたウィンドウ内の各ベータ値に基づいてヌクレオチドを増幅することと、
前記増幅されたヌクレオチドを各核酸塩基としてエンコードすることと、
前記エンコードされた核酸塩基を現在のＤＮＡ鎖に追加することと、
前記正則化からのＤＮＡ鎖を前記追加からの前記現在のＤＮＡ鎖に連結することと
を含んでいる、請求項５に記載のコンピュータ実装方法。

【請求項7】

前記２つ以上のプロセッサによって、前記各条件付き期待値におけるベータ値を変更することによって、前記正則化された条件付き期待値に対する外的影響を考慮に入れることをさらに含んでおり、前記変更されたベータ値が、各外的影響の重みを増やすか、または減らす、請求項１に記載のコンピュータ実装方法。

【請求項8】

コンピュータ・プログラムであって、
１以上のデジタル・プロセッサおよび１以上のＤＮＡプロセッサを含む２つ以上のプロセッサに、
トレーニング・データ・セットを識別することと、
初期ベータ値のウィンドウを定義することであって、前記初期ベータ値が、各条件付き期待値における前記識別されたトレーニング・データ・セットに対するバイアスを表す、
前記定義することと、
前記トレーニング・データ・セットからの各特徴ベクトルに対応する前記各条件付き期待値を正則化することであって、前記条件付き期待値に対する正則化の２つ以上の方法が、特徴ベクトルごとに並列に実行される、前記正則化することと、
前記正則化から生じる前記条件付き期待値から導出されたモデルの複数の集団を作成することと、
前記作成された集団のうちの最良適合集団を機械学習モデルとして生成することであって、前記機械学習モデルが、前記トレーニング・データ・セットとは区別される入力に基づいて対象の結果を予測する、前記生成することと
を実行させる、コンピュータ・プログラム。

【請求項9】

前記正則化することが、
前記１つまたは複数のデジタル・プロセッサによって、正則化指標

【数6】

を各条件付き期待値に追加することを含んでおり、

【数7】

が残差平方和を示し、

【数8】

が、正則化方法に従う正則化の大きさのランクである、請求項８に記載のコンピュータ・プログラム。

【請求項10】

前記正則化に使用される前記正則化方法がラッソ回帰（ＬＡＳＳＯ）であり、

【数9】

である、請求項９に記載のコンピュータ・プログラム。

【請求項11】

前記正則化に使用される正則化方法がリッジ回帰（ＲＲ）であり、

【数10】

である、請求項９に記載のコンピュータ・プログラム。

【請求項12】

前記１以上のＤＮＡプロセッサによって、前記正則化からの前記条件付き期待値を各ＤＮＡ鎖としてエンコードすることをさらに含んでおり、前記エンコードすることおよび前記正則化が、前記各ＤＮＡ鎖を介して互いに相互作用する、請求項８に記載のコンピュータ・プログラム。

【請求項13】

前記エンコードすることが、
前記１以上のＤＮＡプロセッサによって、前記定義されたウィンドウ内の各ベータ値に基づいてヌクレオチドを増幅することと、
前記増幅されたヌクレオチドを各核酸塩基としてエンコードすることと、
前記エンコードされた核酸塩基を現在のＤＮＡ鎖に追加することと、
前記正則化からのＤＮＡ鎖を前記追加からの前記現在のＤＮＡ鎖に連結することと
を含んでいる、請求項１２に記載のコンピュータ・プログラム。

【請求項14】

前記２つ以上のプロセッサによって、前記各条件付き期待値におけるベータ値を変更することによって、前記正則化された条件付き期待値に対する外的影響を考慮に入れることをさらに含んでおり、前記変更されたベータ値が、各外的影響の重みを増やすか、または
減らす、請求項８に記載のコンピュータ・プログラム。

【請求項15】

システムであって、
メモリと、
前記メモリと通信する２つ以上のプロセッサと、
機械学習モデルを生成するための方法を実行するために前記メモリを介して前記２つ以上のプロセッサによって実行可能なプログラム命令と
を備えており、前記方法が、
トレーニング・データ・セットを識別することと、
初期ベータ値のウィンドウを定義することであって、前記初期ベータ値が、各条件付き期待値における前記識別されたトレーニング・データ・セットに対するバイアスを表す、前記定義することと、
前記トレーニング・データ・セットからの各特徴ベクトルに対応する前記各条件付き期待値を正則化することであって、前記条件付き期待値に対する正則化の２つ以上の方法が
、特徴ベクトルごとに並列に実行される、前記正則化することと、
前記正則化から生じる前記条件付き期待値から導出されたモデルの複数の集団を作成することと、
前記作成された集団のうちの最良適合集団を前記機械学習モデルとして生成することであって、前記機械学習モデルが、前記トレーニング・データ・セットとは区別される入力に基づいて対象の結果を予測する、前記生成することとを含んでおり、
前記２つ以上のプロセッサが、１つまたは複数のデジタル・プロセッサおよび１つまたは複数のＤＮＡプロセッサを含んでいる、システム。

【請求項16】

前記正則化することが、
前記１つまたは複数のデジタル・プロセッサによって、正則化指標

【数11】

を各条件付き期待値に追加することを含んでおり、

【数12】

が残差平方和を示し、

【数13】

が、正則化方法に従う正則化の大きさのランクである、請求項１５に記載のシステム。

【請求項17】

前記正則化に使用される前記正則化方法が、ラッソ回帰（ＬＡＳＳＯ）、リッジ回帰（
ＲＲ）、および非正則化から選択され、前記正則化方法がＬＡＳＳＯである場合は

【数14】

であり、前記正則化方法がＲＲである場合は

【数15】

であり、前記正則化方法が非正則化である場合は、正則化が適用されていないことを示すＲｎ＝０である、請求項１６に記載のシステム。

【請求項18】

前記１つまたは複数のＤＮＡプロセッサによって、前記正則化からの前記条件付き期待値を各ＤＮＡ鎖としてエンコードすることをさらに含んでおり、前記エンコーディングおよび前記正則化が、前記各ＤＮＡ鎖を介して互いに相互作用する、請求項１５に記載のシステム。

【請求項19】

【請求項20】

前記２つ以上のプロセッサによって、前記各条件付き期待値におけるベータ値を変更することによって、前記正則化された条件付き期待値に対する外的影響を考慮に入れることをさらに含んでおり、前記変更されたベータ値が、各外的影響の重みを増やすか、または減らす、請求項１５に記載のシステム。

【請求項21】

機械学習モデルを生成するためのコンピュータ実装方法であって、
１つまたは複数のＤＮＡプロセッサによって、条件付き期待値に対応するＤＮＡ鎖を構築することであって、前記条件付き期待値が、トレーニング・データ・セットからの特徴ベクトルに対応する、前記構築することと、
前記１つまたは複数のＤＮＡプロセッサによって、前記構築からの前記条件付き期待値のベータ値に基づいてヌクレオチドを増幅することと、
前記１つまたは複数のＤＮＡプロセッサによって、前記増幅されたヌクレオチドを核酸塩基としてエンコードすることと、
前記１つまたは複数のＤＮＡプロセッサによって、前記エンコードされた核酸塩基を構築からの前記ＤＮＡ鎖に追加することと
を含んでいる、コンピュータ実装方法。

【請求項22】

２つ以上のプロセッサによって、前記追加からの前記ＤＮＡ鎖をデジタル・モデルに変換することと、
前記２つ以上のプロセッサによって、前記変換からの前記デジタル・モデルを含んでいるデジタル・モデルの複数の集団を作成することと、
前記２つ以上のプロセッサによって、前記作成された集団のうちの最良適合集団を前記機械学習モデルとして生成することであって、前記機械学習モデルが、前記トレーニング・データ・セットとは区別される入力に基づいて対象の結果を予測する、前記生成することと
をさらに含んでおり、
前記２つ以上のプロセッサが、１つまたは複数のデジタル・プロセッサおよび１つまたは複数のＤＮＡプロセッサを含んでいる、請求項２１に記載のコンピュータ実装方法。

【請求項23】

機械学習モデルを生成するためのコンピュータ実装方法であって、
１つまたは複数のＤＮＡプロセッサによって、正則化指標を含んでいる条件付き期待値を取得することと、
前記１つまたは複数のＤＮＡプロセッサによって、前記取得からの前記条件付き期待値に対応するＤＮＡ鎖を構築することであって、前記条件付き期待値が、トレーニング・データ・セットからの特徴ベクトルに対応する、前記構築することと、
前記１つまたは複数のＤＮＡプロセッサによって、前記構築からの前記条件付き期待値のベータ値に基づいてヌクレオチドを増幅することと、
前記１つまたは複数のＤＮＡプロセッサによって、前記増幅されたヌクレオチドを核酸塩基としてエンコードすることと、
前記１つまたは複数のＤＮＡプロセッサによって、前記エンコードされた核酸塩基を構築からの前記ＤＮＡ鎖に追加することと、
前記１つまたは複数のＤＮＡプロセッサによって、正則化方法に基づく核酸に対する数を含んでいる正則化されたＤＮＡ鎖を受信することと、
前記１つまたは複数のＤＮＡプロセッサによって、前記受信からの前記正則化されたＤＮＡを追加からの前記ＤＮＡ鎖に連結することと
を含んでいる、コンピュータ実装方法。

【請求項24】

２つ以上のプロセッサによって、前記連結されたＤＮＡ鎖をデジタル・モデルに変換することと、
前記２つ以上のプロセッサによって、前記変換からの前記デジタル・モデルを含んでいるデジタル・モデルの複数の集団を作成することと、
前記２つ以上のプロセッサによって、前記作成された集団のうちの最良適合集団を前記機械学習モデルとして生成することであって、前記機械学習モデルが、前記トレーニング・データ・セットとは区別される入力に基づいて対象の結果を予測する、前記生成することと
をさらに含んでおり、
前記２つ以上のプロセッサが、１つまたは複数のデジタル・プロセッサおよび１つまたは複数のＤＮＡプロセッサを含んでいる、請求項２３に記載のコンピュータ実装方法。

【請求項25】

前記正則化指標が

【数16】

であり、

【数17】

が残差平方和を示し、

【数18】

が、正則化方法に従う正則化の大きさのランクであり、前記正則化方法がラッソ回帰（Ｌ
ＡＳＳＯ）である場合、

【数19】

であり、前記正則化方法がリッジ回帰（ＲＲ）である場合、

【数20】

である、請求項２３に記載のコンピュータ実装方法。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は機械学習技術に関し、より詳細には、ＤＮＡ計算によって並列に正則化されるように機械学習モデルを生成するための方法、コンピュータ・プログラム製品、およびシステムに関する。

【背景技術】

【0002】

従来の機械学習（ＭＬ：machine learning）技術では、ＭＬモデルをトレーニング・データと異なる入力データに役立つようにするべく、ＭＬモデルによるトレーニング・データの過学習の問題を解決するために、トレーニング・データが正則化されることが多い。しかし、トレーニング・データのそのような正則化は、計算負荷の大きいプロセスである。また、現在使用できる多くの正則化方法は、ＭＬモデルの正則化において特殊な利点を提供するため、多種多様な入力データに使用されるようにＭＬモデルを堅牢にするには、大幅に正則化されたトレーニング・データが必要になるということが知られている。

【発明の概要】

【0003】

１つの態様では、方法の提供によって従来技術の欠点が克服され、追加の利点がもたらされる。機械学習モデルを生成するための方法は、例えば、２つ以上のプロセッサによって、トレーニング・データ・セットを識別することと、２つ以上のプロセッサによって、初期ベータ値のウィンドウを定義することであって、この初期ベータ値が、各条件付き期待値における識別されたトレーニング・データ・セットに対するバイアスを表す、定義することと、２つ以上のプロセッサによって、トレーニング・データ・セットからの各特徴ベクトルに対応する各条件付き期待値を正則化することであって、条件付き期待値に対する正則化の２つ以上の方法が、特徴ベクトルごとに並列に実行される、正則化することと、２つ以上のプロセッサによって、正則化から生じる条件付き期待値から導出されたモデルの複数の集団（ensembles）を作成することと、２つ以上のプロセッサによって、作成された集団のうちの最良適合集団（best fit ensemble）を機械学習モデルとして生成することであって、機械学習モデルが、トレーニング・データ・セットとは区別される入力に基づいて対象の結果を予測する、生成することとを含んでおり、２つ以上のプロセッサは、１つまたは複数のデジタル・プロセッサおよび１つまたは複数のＤＮＡプロセッサを含む。

【0004】

第１の態様から見ると、本発明は、機械学習モデルを生成するためのコンピュータ実装方法を提供し、このコンピュータ実装方法は、２つ以上のプロセッサによって、トレーニング・データ・セットを識別することと、２つ以上のプロセッサによって、初期ベータ値のウィンドウを定義することであって、この初期ベータ値が、各条件付き期待値における識別されたトレーニング・データ・セットに対するバイアスを表す、定義することと、２つ以上のプロセッサによって、トレーニング・データ・セットからの各特徴ベクトルに対応する各条件付き期待値を正則化することであって、条件付き期待値に対する正則化の２つ以上の方法が、特徴ベクトルごとに並列に実行される、正則化することと、２つ以上のプロセッサによって、正則化から生じる条件付き期待値から導出されたモデルの複数の集団を作成することと、２つ以上のプロセッサによって、作成された集団のうちの最良適合集団を機械学習モデルとして生成することであって、機械学習モデルが、トレーニング・データ・セットとは区別される入力に基づいて対象の結果を予測する、生成することとを含んでおり、２つ以上のプロセッサは、１つまたは複数のデジタル・プロセッサおよび１つまたは複数のＤＮＡプロセッサを含む。

【0005】

本発明は、正則化することが、１つまたは複数のデジタル・プロセッサによって、正則化指標（regularization metric）

【数1】

を各条件付き期待値に追加することを含んでおり、

【数2】

が残差平方和を示し、

【数3】

が、正則化方法に従う正則化の大きさのランクである、コンピュータ実装方法を提供するのが好ましい。

【0006】

本発明は、正則化に使用される正則化方法がラッソ回帰（ＬＡＳＳＯ：LeastAbsolute Shrinkage and Selection Operator）であり、

【数4】

である、コンピュータ実装方法を提供するのが好ましい。

【0007】

本発明は、正則化に使用される正則化方法がリッジ回帰（ＲＲ：RidgeRegression）であり、

【数5】

である、コンピュータ実装方法を提供するのが好ましい。

【0008】

本発明は、１つまたは複数のＤＮＡプロセッサによって、正則化からの条件付き期待値を各ＤＮＡ鎖としてエンコードすることをさらに含んでいるコンピュータ実装方法を提供するのが好ましく、エンコードすることおよび正則化は、各ＤＮＡ鎖を介して互いに相互作用する。

【0009】

本発明は、エンコードすることが、１つまたは複数のＤＮＡプロセッサによって、定義されたウィンドウ内の各ベータ値に基づいてヌクレオチドを増幅することと、増幅されたヌクレオチドを各核酸塩基としてエンコードすることと、エンコードされた核酸塩基を現在のＤＮＡ鎖に追加することと、正則化からのＤＮＡ鎖を追加からの現在のＤＮＡ鎖に連結することとを含んでいる、コンピュータ実装方法を提供するのが好ましい。

【0010】

本発明は、２つ以上のプロセッサによって、各条件付き期待値におけるベータ値を変更することによって、正則化された条件付き期待値に対する外的影響を考慮に入れることをさらに含んでいるコンピュータ実装方法を提供するのが好ましく、変更されたベータ値が、各外的影響の重みを増やすか、または減らす。

【0011】

別の態様から見ると、本発明は、２つ以上のプロセッサによって読み取り可能な、機械学習モデルを生成するための方法を実行するために２つ以上のプロセッサによって実行するための命令を格納しているコンピュータ可読ストレージ媒体を備えているコンピュータ・プログラム製品を提供し、この方法は、トレーニング・データ・セットを識別することと、初期ベータ値のウィンドウを定義することであって、この初期ベータ値が、各条件付き期待値における識別されたトレーニング・データ・セットに対するバイアスを表す、定義することと、トレーニング・データ・セットからの各特徴ベクトルに対応する各条件付き期待値を正則化することであって、条件付き期待値に対する正則化の２つ以上の方法が、特徴ベクトルごとに並列に実行される、正則化することと、正則化から生じる条件付き期待値から導出されたモデルの複数の集団を作成することと、作成された集団のうちの最良適合集団を機械学習モデルとして生成することであって、機械学習モデルが、トレーニング・データ・セットとは区別される入力に基づいて対象の結果を予測する、生成することとを含んでおり、２つ以上のプロセッサは、１つまたは複数のデジタル・プロセッサおよび１つまたは複数のＤＮＡプロセッサを含む。

【0012】

本発明は、正則化することが、１つまたは複数のデジタル・プロセッサによって、正則化指標

【数6】

を各条件付き期待値に追加することを含んでおり、

【数7】

が残差平方和を示し、

【数8】

が、正則化方法に従う正則化の大きさのランクである、コンピュータ・プログラム製品を提供するのが好ましい。

【0013】

本発明は、正則化に使用される正則化方法がラッソ回帰（ＬＡＳＳＯ）であり、

【数9】

である、コンピュータ・プログラム製品を提供するのが好ましい。

【0014】

本発明は、正則化に使用される正則化方法がリッジ回帰（ＲＲ）であり、

【数10】

である、コンピュータ・プログラム製品を提供するのが好ましい。

【0015】

本発明は、１つまたは複数のＤＮＡプロセッサによって、正則化からの条件付き期待値を各ＤＮＡ鎖としてエンコードすることをさらに含んでいるコンピュータ・プログラム製品を提供するのが好ましく、エンコードすることおよび正則化は、各ＤＮＡ鎖を介して互いに相互作用する。

【0016】

【0017】

本発明は、２つ以上のプロセッサによって、各条件付き期待値におけるベータ値を変更することによって、正則化された条件付き期待値に対する外的影響を考慮に入れることをさらに含んでいるコンピュータ・プログラム製品を提供するのが好ましく、変更されたベータ値が、各外的影響の重みを増やすか、または減らす。

【0018】

別の視点から見ると、本発明は、メモリと、メモリと通信する２つ以上のプロセッサと、機械学習モデルを生成するための方法を実行するためにメモリを介して２つ以上のプロセッサによって実行可能なプログラム命令とを備えているシステムを提供し、この方法は、トレーニング・データ・セットを識別することと、初期ベータ値のウィンドウを定義することであって、この初期ベータ値が、各条件付き期待値における識別されたトレーニング・データ・セットに対するバイアスを表す、定義することと、トレーニング・データ・セットからの各特徴ベクトルに対応する各条件付き期待値を正則化することであって、条件付き期待値に対する正則化の２つ以上の方法が、特徴ベクトルごとに並列に実行される、正則化することと、正則化から生じる条件付き期待値から導出されたモデルの複数の集団を作成することと、作成された集団のうちの最良適合集団を機械学習モデルとして生成することであって、機械学習モデルが、トレーニング・データ・セットとは区別される入力に基づいて対象の結果を予測する、生成することとを含んでおり、２つ以上のプロセッサは、１つまたは複数のデジタル・プロセッサおよび１つまたは複数のＤＮＡプロセッサを含む。

【0019】

本発明は、正則化することが、１つまたは複数のデジタル・プロセッサによって、正則化指標

【数11】

を各条件付き期待値に追加することを含んでおり、

【数12】

が残差平方和を示し、

【数13】

が、正則化方法に従う正則化の大きさのランクである、システムを提供するのが好ましい。

【0020】

本発明は、正則化に使用される正則化方法が、ラッソ回帰（ＬＡＳＳＯ）、リッジ回帰（ＲＲ）、および非正則化から選択され、正則化方法がＬＡＳＳＯである場合は

【数14】

であり、正則化方法がＲＲである場合は

【数15】

であり、正則化方法が非正則化である場合は、正則化が適用されていないことを示すＲ_ｎ＝０である、システムを提供するのが好ましい。

【0021】

本発明は、１つまたは複数のＤＮＡプロセッサによって、正則化からの条件付き期待値を各ＤＮＡ鎖としてエンコードすることをさらに含んでいるシステムを提供するのが好ましく、エンコードすることおよび正則化は、各ＤＮＡ鎖を介して互いに相互作用する。

【0022】

【0023】

本発明は、２つ以上のプロセッサによって、各条件付き期待値におけるベータ値を変更することによって、正則化された条件付き期待値に対する外的影響を考慮に入れることをさらに含んでいるシステムを提供するのが好ましく、変更されたベータ値が、各外的影響の重みを増やすか、または減らす。

【0024】

別の態様から見ると、本発明は、機械学習モデルを生成するためのコンピュータ実装方法を提供し、このコンピュータ実装方法は、１つまたは複数のＤＮＡプロセッサによって、条件付き期待値に対応するＤＮＡ鎖を構築することであって、この条件付き期待値が、トレーニング・データ・セットからの特徴ベクトルに対応する、構築することと、１つまたは複数のＤＮＡプロセッサによって、構築からの条件付き期待値のベータ値に基づいてヌクレオチドを増幅することと、１つまたは複数のＤＮＡプロセッサによって、増幅されたヌクレオチドを核酸塩基としてエンコードすることと、１つまたは複数のＤＮＡプロセッサによって、エンコードされた核酸塩基を構築からのＤＮＡ鎖に追加することとを含む。

【0025】

本発明は、２つ以上のプロセッサによって、追加からのＤＮＡ鎖をデジタル・モデルに変換することと、２つ以上のプロセッサによって、変換からのデジタル・モデルを含んでいるデジタル・モデルの複数の集団を作成することと、２つ以上のプロセッサによって、作成された集団のうちの最良適合集団を機械学習モデルとして生成することであって、機械学習モデルが、トレーニング・データ・セットとは区別される入力に基づいて対象の結果を予測する、生成することとをさらに含んでいるコンピュータ実装方法を提供するのが好ましく、２つ以上のプロセッサは、１つまたは複数のデジタル・プロセッサおよび１つまたは複数のＤＮＡプロセッサを含む。

【0026】

別の態様から見ると、本発明は、機械学習モデルを生成するためのコンピュータ実装方法を提供し、このコンピュータ実装方法は、１つまたは複数のＤＮＡプロセッサによって、正則化指標を含んでいる条件付き期待値を取得することと、１つまたは複数のＤＮＡプロセッサによって、取得からの条件付き期待値に対応するＤＮＡ鎖を構築することであって、条件付き期待値が、トレーニング・データ・セットからの特徴ベクトルに対応する、構築することと、１つまたは複数のＤＮＡプロセッサによって、構築からの条件付き期待値のベータ値に基づいてヌクレオチドを増幅することと、１つまたは複数のＤＮＡプロセッサによって、増幅されたヌクレオチドを核酸塩基としてエンコードすることと、１つまたは複数のＤＮＡプロセッサによって、エンコードされた核酸塩基を構築からのＤＮＡ鎖に追加することと、１つまたは複数のＤＮＡプロセッサによって、正則化方法に基づく核酸に対する数を含んでいる正則化されたＤＮＡ鎖を受信することと、１つまたは複数のＤＮＡプロセッサによって、受信からの正則化されたＤＮＡを追加からのＤＮＡ鎖に連結することとを含んでいる。

【0027】

本発明は、２つ以上のプロセッサによって、連結されたＤＮＡ鎖をデジタル・モデルに変換することと、２つ以上のプロセッサによって、変換からのデジタル・モデルを含んでいるデジタル・モデルの複数の集団を作成することと、２つ以上のプロセッサによって、作成された集団のうちの最良適合集団を機械学習モデルとして生成することであって、機械学習モデルが、トレーニング・データ・セットとは区別される入力に基づいて対象の結果を予測する、生成することとをさらに含んでいるコンピュータ実装方法を提供するのが好ましく、２つ以上のプロセッサは、１つまたは複数のデジタル・プロセッサおよび１つまたは複数のＤＮＡプロセッサを含む。

【0028】

本発明は、正則化指標が

【数16】

であり、

【数17】

が残差平方和を示し、

【数18】

が、正則化方法に従う正則化の大きさのランクであり、正則化方法がラッソ回帰（ＬＡＳＳＯ）である場合、

【数19】

であり、正則化方法がリッジ回帰（ＲＲ）である場合、

【数20】

である、コンピュータ実装方法を提供するのが好ましい。

【0029】

その他の特徴が、本明細書において示された手法によって実現される。コンピュータ・プログラム製品およびシステムを含むが、これらに限定されない、本発明のその他の実施形態および態様は、本明細書において詳細に説明され、請求される発明の一部と見なされる。

【0030】

本発明の１つまたは複数の態様は、本明細書の最後にある特許請求の範囲において例として具体的に指摘され、明確に請求される。本発明の前述およびその他の目的、特徴、および長所は、添付の図面と併せて行われる以下の詳細な説明から明らかになる。

【図面の簡単な説明】

【0031】

【図1】本明細書において示される１つまたは複数の実施形態に従って、ＤＮＡ計算による機械学習のモデル化のためのシステムを示す図である。

【図2】本明細書において示される１つまたは複数の実施形態に従って、システムのＤＮＡ機械学習エンジンによって実行される動作のフローチャートを示す図である。

【図3】本明細書において示される１つまたは複数の実施形態に従って、システムの正則化プロセスおよびベータ・エンコーディング・プロセスによって実行される各動作のフローチャートを示す図である。

【図4】本明細書において示される１つまたは複数の実施形態に従って、システムのＤＮＡ集団モデル化プロセスによって実行される動作のフローチャートを示す図である。

【図5】本明細書において示される１つまたは複数の実施形態に従って、システムの正則化プロセスおよびベータ・エンコーディング・プロセスによって利用される方程式を示す図である。

【図6】本発明の１つまたは複数の実施形態に従って、ＤＮＡに基づくコンピューティング・システムを示す図である。

【図7】本発明の１つまたは複数の実施形態に従って、クラウド・コンピューティング・ノードを示す図である。

【図8】本発明の１つまたは複数の実施形態に従って、クラウド・コンピューティング環境を示す図である。

【図9】本発明の１つまたは複数の実施形態に従って、抽象モデル・レイヤを示す図である。

【発明を実施するための形態】

【0032】

図１は、本明細書において示される１つまたは複数の実施形態に従って、ＤＮＡ計算による機械学習（ＭＬ）のモデル化のためのシステム１００を示している。

【0033】

ＤＮＡ計算は、デオキシリボ核酸（ＤＮＡ）を使用する計算の一分野であり、ＤＮＡは、既知のすべての生命体および多くのウイルスの成長、発達、機能、および再生において使用される遺伝的指令を運ぶヌクレオチドの糸状の鎖である。したがって、ＤＮＡ計算は、生化学、ＤＮＡナノテクノロジー、または分子生物学ハードウェア（molecular biology hardware）、あるいはその組み合わせも利用して、シリコンに基づく従来のコンピュータ・テクノロジーによってこれまで処理されていた問題を説明し、解決する。ＤＮＡ計算は、従来のデジタル・コンピュータ技術と共に使用されてよい。ＤＮＡ計算は、ＤＮＡの多くの異なる分子が、提示された問題に対する多くの異なる可能性または解あるいはその両方に対応する多くのＤＮＡ鎖を同時に形成するというＤＮＡの側面を利用するため、ＤＮＡ計算は、並列性の高い高速計算に関して特に有利である。

【0034】

機械学習（ＭＬ）によるモデル化との関連において、過学習とは、トレーニング・データにおける詳細およびノイズを学習することによって、そのような詳細およびノイズが、新しい入力データの適用時にモデルの性能に悪影響を与える程度まで、トレーニング・データを過剰に良くモデル化するモデル化の問題のことを指す。ＭＬモデルの過学習を解決するには、トレーニング・データにおけるノイズおよびランダムな変動がＭＬモデルにモデル化されないように、トレーニング・データを正則化する必要がある。本明細書では、「正則化」という用語は、過学習および不均衡データなどの不良設定の機械学習モデルに伴う問題、ならびに特徴選択および特徴抽出のためのランダム変数の数を減らす次元縮小に伴う問題を解決するプロセスを示す。本明細書では、「過学習」という用語は、機械学習モデルに対して正則化を使用する目的を表すために使用される。

【0035】

システム１００は、トレーニング・データ１０５からの学習に基づいてＤＮＡ集団モデル１９５を生成するＤＮＡ機械学習エンジン１２０を含んでいる。ＤＮＡ機械学習エンジン１２０に対するトレーニング・データ１０５は、ＤＮＡ集団モデル１９５と呼ばれる機械学習モデルをトレーニングするためのデータのセットである。述べたように、ＤＮＡ機械学習エンジン１２０は、ＤＮＡ集団モデル１９５における前述の不良設定問題を防ぐこと、または最小限に抑えること、あるいはその両方を行うように、トレーニング・データ１０５を正則化するために考案された。

【0036】

機械学習（ＭＬ）によるモデル化との関連において、機械学習エンジン１２０での過学習とは、トレーニング・データにおける詳細およびノイズを学習することによって、そのような詳細およびノイズが、新しい入力データの適用時にモデルの性能に悪影響を与える程度まで、トレーニング・データを過剰に良くモデル化するモデル化の問題のことを指す。ＭＬモデルの過学習を解決するには、トレーニング・データにおけるノイズおよびランダムな変動がＭＬモデルにモデル化されないように、トレーニング・データを正則化する必要がある。

【0037】

ＤＮＡ機械学習エンジン１２０は、ベータ値エンコーディング・プロセス１３０、ＤＮＡ集団モデル化プロセス１４０、乱数発生器１５０、および１つまたは複数の正則化プロセス１６０を含んでいる。

【0038】

ベータ値エンコーディング・プロセス１３０は、バイアス値を含んでいる正則化方程式をＤＮＡ鎖にエンコードする。本明細書では、「ベータ値」、「ベータの大きさ」、「バイアス」、および「バイアス値」という用語は、交換可能なように使用される。他のプロセス１４０、１５０、および１６０との関係におけるベータ値エンコーディング・プロセス１３０の詳細な動作が、図２および３、ならびに対応する説明において示されている。本明細書では、「ＤＮＡ鎖」および「ＤＮＡ配列」という用語は、２つのＤＮＡ鎖を含んでいるＤＮＡ分子の二重らせん構造の半分である、ヌクレオチドと呼ばれるモノマー単位の連続を示すために、交換可能なように使用される。各ヌクレオチドは、シトシン（Ｃ）、グアニン（Ｇ）、アデニン（Ａ）、またはチミン（Ｔ）という４つの核酸塩基のうちの１つを含んでいる。ＤＮＡ計算は、Ａが常にＴと対になり、Ｃが常にＧと対になるため、１つのＤＮＡ鎖が、同じＤＮＡ分子内の他のＤＮＡ鎖の補完的像になるという特性を利用する。

【0039】

ＤＮＡ集団モデル化プロセス１４０は、ベータ値エンコーディング・プロセス１３０によってエンコードされたベータ値および１つまたは複数の正則化プロセス１６０によって正則化されているトレーニング・データ１０５に基づいて、ＤＮＡ集団モデル１９５を生成する。他のプロセス１３０、１５０、および１６０との関係におけるＤＮＡ集団モデル化プロセス１４０の詳細な動作が、図２および対応する説明において示されている。ＤＮＡ集団モデル化プロセス１４０の詳細な動作が、図４および対応する説明において示されている。

【0040】

１つまたは複数の正則化プロセス１６０は、過学習を解決することによって、機械学習モデルをより一般的に適用可能にするために、トレーニング・データ１０５の各インスタンスについて、図５ではラムダと呼ばれる正則化項を追加する。他のプロセス１３０、１４０、および１５０との関係における１つまたは複数の正則化プロセス１６０の詳細な動作が、図２および３、ならびに対応する説明において示されている。

【0041】

本発明の特定の実施形態では、１つまたは複数の正則化プロセス１６０が、それぞれラッソ回帰（ＬＡＳＳＯまたはＬ１）正則化方法およびリッジ回帰（ＲＲまたはＬ２）正則化方法を利用する２つの正則化プロセスとして実装される。トレーニング・データ１０５に対する係数の過学習を防ぐために、ＬＡＳＳＯ（Ｌ１）正則化およびリッジ回帰（Ｌ２）正則化は、両方とも各正則化項をモデル化方程式に追加する。ＬＡＳＳＯ（Ｌ１）正則化の正則化項は重みの和であり、一方、リッジ回帰（Ｌ２）正則化の正則化項は重みの平方和である。Ｌ１正則化およびＬ２正則化の両方の各方程式の例が、図５および対応する説明において示されている。

【0042】

ＤＮＡ機械学習エンジン１２０は、並列処理の目的でＤＮＡコンピュータ１７０に結合される。本発明の一実施形態では、ＤＮＡコンピュータ１７０は、ポリメラーゼ連鎖反応（ＰＣＲ）コンポーネント、ゲル電気泳動コンポーネント、ＤＮＡエンコーダ、およびＤＮＡデコーダを含むが、これらに限定されない、さまざまなコンポーネントを含んでいる。ＤＮＡコンピュータ１７０の例が、図６および対応する説明において示されている。ＤＮＡ機械学習エンジン１２０は、従来のデータまたはユーザ・インターフェイスあるいはその両方の目的でデジタル・コンピュータ１８０にも結合される。

【0043】

本発明の特定の実施形態では、ＤＮＡ機械学習エンジン１２０は、ＤＮＡコンピュータ１７０およびデジタル・コンピュータ１８０の両方を利用するハイブリッド・プロセスである。同じ実施形態において、ＤＮＡ機械学習エンジン１２０は、デジタル技術に基づいて従来のデータ処理インフラストラクチャとインターフェイスをとるために、デジタル・コンピュータ１８０を利用すると同時に、ＤＮＡ鎖としてエンコードされたデジタル・データを処理して並列性の高い高速動作を実現するために、ＤＮＡコンピュータ１７０を利用する。

【0044】

システム１００は、正則化の原理をＤＮＡ機械学習に拡張し、ＤＮＡ計算によって提供される複数の種類の正則化を並列に採用する機械学習を示す。システム１００は、さまざまな種類の正則化から恩恵を受けて正確な予測を行うＤＮＡ集団モデル１９５を生成する。システム１００は、正則化されたトレーニング・データに加えて正則化されていないトレーニング・データをＤＮＡ機械学習に利用することによって、ＤＮＡ集団モデル１９５の候補モデルの組み合わせの数を指数関数的に増やす。システム１００は、候補モデルの最良適合の組み合わせをＤＮＡ集団モデル１９５として決定するため、組み合わせの数を拡大することによって、機械学習に基づく予測の精度を大幅に改善する。

【0045】

図２は、本明細書において示される１つまたは複数の実施形態に従って、図１のＤＮＡ機械学習エンジン１２０によって実行される動作のフローチャートを示している。

【0046】

ブロック２１０で、ＤＮＡ機械学習エンジン１２０は、ＤＮＡ集団モデル１９５をトレーニングするためのトレーニング・データ１０５のセットを識別する。次にＤＮＡ機械学習エンジン１２０は、ブロック２２０に進む。

【0047】

本発明の一実施形態では、ＤＮＡ機械学習エンジン１２０は、初期バイアス（β_０）、およびｎ個のトレーニング・データ・インスタンスに関する各バイアスとトレーニング・データ・インスタンスの積（β_ｊｘ_ｊ）の和として出力関数ｆ（ｘ）を定式化することにおいて、図５の単純な線形回帰方程式ＥＱＬＲを利用し、ここで、１≦ｊ≦ｎである。
ｆ（ｘ）＝β_０＋β_１ｘ_１＋．．．＋β_ｎｘ_ｎ

【0048】

ブロック２２０で、ＤＮＡ機械学習エンジン１２０は、初期ベータ値（β_０．．．β_ｎ）を選択し、各初期ベータ値（β_ｍｎ）を囲むウィンドウを定義する。次にＤＮＡ機械学習エンジン１２０は、ブロック２３０に進む。

【0049】

ベータ値は、述べたように、機械学習モデルのバイアスを示す。本発明の実施形態は、統計および機械学習において、大きいバイアス、またはバイアスを囲む大きすぎるウィンドウは、機械学習モデルが入力の特徴とターゲット出力の間の関連する関係を見逃すことを引き起こす可能性があり、これは過学習とは反対の種類の誤りである、ということを認識している。したがって、トレーニング・データを正則化して過学習問題を解決することは、ベータ値の各ウィンドウとバランスを取る必要があり、これは一般に、バイアスと分散の間のトレードオフとして知られている。

【0050】

本発明の一実施形態では、ＤＮＡ機械学習エンジン１２０は、乱数発生器１５０を使用して乱数を生成し、その後、生成された乱数を既定の範囲に拡大縮小することによって、各ベータ値を選択する。ベータ値は定数ではないため、各ベータ値を囲むウィンドウは、各ベータ値が設定される範囲を表す。

【0051】

図５の期待値方程式ＥＱＥＸＰでは、項

【数21】

が、変数（

【数22】

）の関数として（Ｙ）の条件付き期待値を示し、項β_０ｊは初期バイアス値であり、項β_ｍｎｘ_ｔはウィンドウｍｎでのバイアス値（β_ｍｎ）とトレーニング・データ１０５のインスタンス（ｘ_ｔ）の積を示す。各トレーニング・データ・インスタンス（ｘ_ｔ）は、特徴ベクトルとも呼ばれる。

【0052】

例えば、線形回帰方程式は
ｆ（ｘ）＝β_０＋β_１ｘ_１＋β_２ｘ_２
であり、ここで図５のＥＱＬＲから、ｎ＝２である。ＤＮＡ機械学習エンジン１２０は、初期ベータ値、β_０、β_１、およびβ_２をランダムに選択し、定数ａ、ｃ、ｄ、およびｅを含む同じ式によって縮小する。ＤＮＡ機械学習エンジン１２０は、第１のベータ値（β_０）に対する６のウィンドウ、第２のベータ値（β_１）に対する３のウィンドウ、および第３のベータ値（β_２）に対する５のウィンドウも定義する。

【0053】

【数23】

【0054】

その結果、各ベータ値に対して次のウィンドウが生成される。
β_０：β_０１＝３０，β_０２＝４２
β_１：β_１１＝１２，β_１２＝１８
β_２：β_２１＝２８，β_２２＝３８
ここで、２つのデータ点β_０１およびβ_０２は第１のベータ値（β_０）の範囲を示し、この範囲は、第１のベータ値に対する６のウィンドウの２倍のサイズである。第２および第３のベータ値は、２つのデータ点を含む各範囲で表される。

【0055】

下記の方程式ＥＱ１～ＥＱ８は、トレーニング・データ１０５からの特徴ベクトル（ｘ_１）を前提として、ベータ値の確率を示している。他のベータ値および対応する線形結合が、第１のベータ値（β_０）の場合と同様に定式化できるため、方程式ＥＱ１～ＥＱ８では、第１のベータ値（β_０）のみが示されている。ＤＮＡ機械学習エンジンは、既定の試行回数にわたって、確率を最大化するための選択肢について、次の方程式ＥＱ１～ＥＱ８を調べる。

【0056】

【数24】

【0057】

ＤＮＡ機械学習エンジン１２０は、ＤＮＡコンピュータ１７０を使用して並列にブロック２３０、２４０、および２５０を実行する。本発明の特定の実施形態では、ＲＲおよびＬＡＳＳＯ以外の正則化方法が任意選択的に構成され、ブロック２３０、２４０、および２５０と共に並列に実行される。ブロック２３０、２４０、および２５０が並列に実行されるため、各ブロックの多数のスレッドが互いに相互作用する。ブロック２３０、２４０、および２５０の詳細な動作が、図３および対応する説明において示されている。

【0058】

ブロック２３０で、ＤＮＡ機械学習エンジン１２０は、ブロック２４０のベータ値エンコーディング・プロセスと連動して、リッジ回帰（ＲＲまたはＬ２）正則化によって、ブロック２１０からのトレーニング・データ・セットを正則化する。次にＤＮＡ機械学習エンジン１２０は、ブロック２６０に進む。

【0059】

ブロック２４０の１つのスレッドで、ＤＮＡ機械学習エンジン１２０は、ブロック２３０のＲＲ正則化プロセスからのベータ値および正則化指標を対応するＤＮＡ鎖にエンコードし、その後、さらに処理するために、連結されたＤＮＡ鎖をＲＲ正則化プロセスに返す。ブロック２４０の別のスレッドで、ＤＮＡ機械学習エンジン１２０は、ブロック２５０のＬＡＳＳＯ正則化プロセスからのベータ値および正則化指標を対応するＤＮＡ鎖にエンコードし、その後、さらに処理するために、連結されたＤＮＡ鎖をＬＡＳＳＯ正則化プロセスに返す。

【0060】

ブロック２５０で、ブロック２３０と同様に、ＤＮＡ機械学習エンジン１２０は、ブロック２４０のベータ値エンコーディング・プロセスと連動して、ラッソ回帰（ＬＡＳＳＯまたはＬ１）正則化によって、ブロック２１０からのトレーニング・データ・セットを正則化する。次にＤＮＡ機械学習エンジン１２０は、ブロック２６０に進む。

【0061】

ブロック２６０で、ＤＮＡ機械学習エンジン１２０は、ブロック２３０、２４０、または２５０からの結果に基づくＤＮＡ鎖グループに基づいて、集団モデルを生成する。次にＤＮＡ機械学習エンジン１２０は、ブロック２７０に進む。ブロック２６０の詳細な動作が、図４および対応する説明において示されている。

【0062】

ブロック２７０で、ＤＮＡ機械学習エンジン１２０は、ブロック２６０から生成された集団モデルがＤＮＡ集団モデル１９５に対して事前に設定された条件を満たすかどうかを判定する。ＤＮＡ機械学習エンジン１２０が、ブロック２６０からの集団モデルがＤＮＡ集団モデル１９５に対して事前に設定された条件を満たしているということを決定した場合、ＤＮＡ機械学習エンジン１２０はブロック２８０に進む。ＤＮＡ機械学習エンジン１２０が、ブロック２６０からの集団モデルがＤＮＡ集団モデル１９５に対して事前に設定された条件を満たしていないということを決定した場合、ＤＮＡ機械学習エンジン１２０はブロック２３０、２４０、および２５０のプロセスの並列ユニットにループバックする。

【0063】

本発明の特定の実施形態では、ＤＮＡ集団モデル１９５に対して事前に設定された条件は、イベントの履歴データおよびリアルタイム・データ・フィードなどに基づいて、集団がイベント中の特定の結果が進行することを予測する際に集団によって行われる予測の、事前に設定された精度である。

【0064】

ブロック２８０で、ＤＮＡ集団モデル１９５に対して事前に設定された条件が集団モデルによって満たされているため、ＤＮＡ機械学習エンジン１２０が、ブロック２７０からの集団をＤＮＡ集団モデル１９５として生成する。２つ以上の集団がブロック２７０のテストに合格した場合、ＤＮＡ集団モデル１９５が、トレーニング・データ・セットとは区別される入力に基づいて特定の精度で対象の結果を予測するように、ＤＮＡ機械学習エンジン１２０が、最良適合集団をＤＮＡ集団モデル１９５として生成する。次にＤＮＡ機械学習エンジン１２０は、ブロック２１０から識別されたトレーニング・データ・セットの処理を終了する。

【0065】

図３は、本明細書において示される１つまたは複数の実施形態に従って、図２の正則化プロセス２３０、２５０、およびベータ・エンコーディング・プロセス２４０によって実行される各動作のフローチャートを示している。

【0066】

ブロック２３０またはブロック２５０のいずれかの代わりに、ブロック３１０、３２０、および３３０が、各スレッド内で正則化用のユニットとして実行される。図２のブロック２３０におけるＲＲ正則化および図２のブロック２５０におけるＬＡＳＳＯ正則化は、ブロック３１０、３２０、および３３０でＤＮＡコンピュータ１７０によって実行する各スレッドを含んでいる。各正則化スレッドは、図２のベータ値エンコーディング・プロセス２４０と相互作用し、その詳細がブロック３５０、３６０、３７０、および３８０に示されている。

【0067】

ブロック３１０で、ＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０が、正則化指標（

【数25】

）を、図５のＥＱＥＸＰ（

【数26】

）に示されている条件付き期待値を定式化する各方程式に追加する。

【0068】

その結果、ＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０は、図５のＥＱＲＥＧ、

【数27】

で正則化された条件付き期待値を生成し、この条件付き期待値は、データ転送、共有メモリ空間での記録、およびデジタル・コンピュータ１８０で従来使用できる任意のその他の方法を使用して、ブロック３５０で、ベータ値エンコーディング・プロセス２４０に使用可能にされる。次に、ＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０がブロック３２０に進む。

【0069】

期待値方程式ＥＱＥＸＰと同様に、図５の正則化された期待値方程式ＥＱＲＥＧにおいて、項

【数28】

は、Ｙの条件付き期待値を変数（

【数29】

）の関数として示し、ここで、項β_０ｊは初期バイアス値であり、項β_ｍｎｘ_ｔはウィンドウｍｎでのバイアス値（β_ｍｎ）とトレーニング・データ１０５のインスタンス（ｘ_ｔ）の積を示し、項（

【数30】

）はＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０のいずれかに対する正則化指標である。Ｙは、ＤＮＡ集団モデル１９５内の集団のうちの１つである。

【0070】

正則化指標（

【数31】

）は、図５のＥＱＲＴで、ＲＳＳおよびＲ_ｎの和として表されており、ここで、ＲＳＳは残差平方和であり、Ｒ_ｎは正則化の大きさのランク、または単に大きさである。

【0071】

【数32】

ここで、

【数33】

【0072】

ＲＳＳの項で、ｙ_ｉはＤＮＡ集団モデル１９５内の各集団を表すラベルであり、ｘ_ｉｊはトレーニング・データ１０５内の各インスタンスを表す特徴ベクトルであり、β_０は初期ベータ値である。Ｒ_ｎの項で、パラメータλはバイアスの許容誤差の範囲（通常は、範囲［０．０１，１０］内）を示す既定の正則化項であり、Ｒ（β_ｉ）は正則化方法によって示される正則化項である。図５のＥＱＲＲにも示されているように、リッジ回帰（ＲＲ）正則化２３０の正則化項は、重みの平方（

【数34】

）の和である。したがって、ＲＲ正則化２３０における正則化指標（

【数35】

）は次のように定式化される。

【0073】

【数36】

【0074】

図５のＥＱＬＡＳＳＯに示されているように、ＬＡＳＳＯ正則化プロセス２５０の正則化項は、重み（Ｒ（β_ｊ）＝｜β_ｊ｜）の和である。したがって、ＬＡＳＳＯ正則化２５０における正則化指標（

【数37】

）は次のように定式化される。

【0075】

【数38】

【0076】

本発明の実施形態は、ＲＳＳが最小化されるベータ値を推定するために、最小二乗法が従来使用されていたということを認識している。非常に大きいベータ値にペナルティを科すことによって、不均衡データの過学習を回避するため、および特徴選択を実行するために、正則化の大きさＲ_ｎが、最小化されたＲＳＳに追加される。

【0077】

ブロック３２０で、ＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０が、正則化の大きさＲ_ｎをランク付けすることによって、追加する核酸の数を決定する。各正則化プロセス２３０または２５０は、核酸を示す決定された数を、ブロック３８０でベータ値エンコーディング・プロセス２４０に使用できるようにする。それに応じて、ＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０は、その後、ベータ値エンコーディング・プロセス２４０のブロック３８０から連結されたＤＮＡ鎖を受信する。次に、ＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０がブロック３３０に進む。

【0078】

ブロック３３０で、ＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０は、ベータ・エンコーディング・プロセス２４０のブロック３８０から受信されたＤＮＡ鎖を水素結合部位において中和することによって、ベータ値の可能性がある採用される組み合わせの数を減らす。

【0079】

中和された各ＤＮＡ鎖は、液体内の運動が損なわれ、これによって、ＤＮＡ鎖が、解に対応する他の既存のＤＮＡ鎖に結合することを少なくする。解に結合するＤＮＡ鎖を少なくすることによって、ベータ値の可能性がある採用される解の数を減らす。

【数39】

（図５のＥＱＲＥＧ）をエンコードするＤＮＡ鎖が取り出される場合、その後の各解の相対数が、すべてのベータ値を一緒に結合するときに重みとして働く。ブロック３３０の最後で、ＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０は、ＤＮＡの形態での

【数40】

（図５のＥＱＲＥＧ）のエンコーディングを完了する。

【0080】

ブロック３１０で述べたように、各正則化プロセスは、各正則化指標で表されるように、水素結合部位において中和された核酸が一緒につながれる方法に影響を与える。ＲＲ正則化プロセス２３０は、中和する核酸の数を決定するために、ランクの二乗を利用する。ＬＡＳＳＯ正則化プロセス２５０は、各ランクを利用する。絶対値を使用する任意のその他の正則化方法では、中和する核酸の数を決定するためのランクが選択される。

【0081】

前述したように、ベータ値エンコーディング・プロセス２４０の複数のスレッドが、それぞれ他の正則化スレッド（ＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０のいずれか）と相互作用する。

【0082】

ブロック３５０で、ベータ値エンコーディング・プロセス２４０は、ブロック３１０から受信された正則化方程式に対応するか、または直接ブロック２２０からの非正則化方程式に対応する、複数のＤＮＡ鎖を構築する。述べたように、ブロック３１０は、ＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０のいずれかをユニットとして実行するスレッドの一部である。本発明の一実施形態では、ベータ値エンコーディング・プロセス２４０は、並列処理のためにＤＮＡ鎖を複製することにおいて、ポリメラーゼ連鎖反応（ＰＣＲ）を利用する。次にベータ値エンコーディング・プロセス２４０は、ブロック３６０に進む。

【0083】

ブロック３６０で、ベータ値エンコーディング・プロセス２４０が、ブロック２２０で定義されたウィンドウ内のベータ値の各大きさに基づいてヌクレオチドを増幅し、その後、増幅されたヌクレオチドを核酸塩基レベルでエンコードする。本発明の実施形態は、ヌクレオチドがＤＮＡ鎖の構成要素であるということを認識している。次にベータ値エンコーディング・プロセス２４０は、ブロック３７０に進む。

【0084】

ブロック３７０で、ベータ値エンコーディング・プロセス２４０が、ブロック３６０からのエンコードされた核酸塩基を、ブロック３５０で構築された現在のＤＮＡ鎖に追加する。次にベータ値エンコーディング・プロセス２４０は、ブロック３８０に進む。

【0085】

ブロック３８０で、ベータ値エンコーディング・プロセス２４０は、ブロック３２０からの正則化されＤＮＡ鎖を現在のＤＮＡ鎖に連結し、連結されたＤＮＡ鎖を、ＲＲ正則化プロセス２３０またはＬＡＳＳＯ正則化プロセス２５０のいずれかのブロック３２０に使用できるようにする。代替として、ベータ値エンコーディング・プロセス２４０が現在のＤＮＡ鎖を生成し、ブロック３５０で構築された現在のＤＮＡ鎖が、非正則化方程式に対応する。次に、ベータ値エンコーディング・プロセス２４０が、ブロック３５０から構築された現在のＤＮＡ鎖のエンコーディングを終了する。

【0086】

図４は、本明細書において示される１つまたは複数の実施形態に従って、図２のＤＮＡ集団モデル化プロセス２６０によって実行される動作のフローチャートを示している。

【0087】

ブロック４１０で、ＤＮＡ集団モデル化プロセス２６０は、熱または圧力あるいはその両方などの外的影響に伴ってベータ値を変更することによって、正則化プロセス２３０、２５０のブロック３３０の結果から新しい結果を生成する。ＤＮＡ集団モデル化プロセス２６０は、ベータ値を増やすことによって、条件付き期待値に対する外的影響に対応する重みを減らす。ベータ値を減らすことによって、条件付き期待値における外的影響の重みが増やされ、外的影響と対象の結果の間の関係がより密接にモデル化される。次にＤＮＡ集団モデル化プロセス２６０は、ブロック４２０に進む。

【0088】

ブロック４２０で、ＤＮＡ集団モデル化プロセス２６０は、ゲル電気泳動を新しい結果に適用することによって、ブロック４１０から生成された新しい結果を分離する。次にＤＮＡ集団モデル化プロセス２６０は、ブロック４３０に進む。

【0089】

ゲル電気泳動は、解析される高分子のサイズおよび電荷に基づく、ＤＮＡまたはリボ核酸（ＲＮＡ）あるいはその両方およびそれらの断片などの高分子の分離および解析のための方法である。生化学および分子生物学において、ゲル電気泳動は、ＤＮＡ／ＲＮＡ断片の混合集団を長さによって分離して、ＤＮＡ／ＲＮＡ断片のサイズを推定するため、または電荷によってタンパク質を分離するために使用されるということが、確立されている。

【0090】

ブロック４３０で、ＤＮＡ集団モデル化プロセス２６０は、長さによって、ブロック４２０から生じるＤＮＡ鎖を事前に定義された数のグループに分離する。ＤＮＡ鎖の長さまたはサイズは、エンコードされて変更されている各ベータ値を示す。次にＤＮＡ集団モデル化プロセス２６０は、ブロック４４０に進む。

【0091】

ブロック４４０で、ＤＮＡ集団モデル化プロセス２６０が、正則化の種類に基づいて、ブロック４３０の各グループからサンプルを作成する。したがって、ＲＲ正則化プロセス２３０およびＬＡＳＳＯ正則化プロセス２５０が採用される実施形態では、ＤＮＡ集団モデル化プロセス２６０が、ＲＲ正則化プロセス２３０によって正則化されたＤＮＡ鎖の１つのグループ、およびＬＡＳＳＯ正則化プロセス２５０によって正則化されたＤＮＡ鎖の別のグループに特有の長さによって、多数のサンプルを作成する。次にＤＮＡ集団モデル化プロセス２６０は、ブロック４５０に進む。

【0092】

ブロック４５０で、ＤＮＡ集団モデル化プロセス２６０は、ブロック４４０からサンプリングされた長さごと、正則化方法ごとのＤＮＡサンプルを、デジタル・モデルに変換する。デジタル・データの形態へのＤＮＡ鎖の変換は、ＤＮＡデコーディングまたは単にデコーディングとも呼ばれる。次にＤＮＡ集団モデル化プロセス２６０は、ブロック４６０に進む。

【0093】

ブロック４６０で、ＤＮＡ集団モデル化プロセス２６０は、各長さの正則化グループに対して、デジタル・モデルから１つまたは複数のＤＮＡ集団を作成する。次にＤＮＡ集団モデル化プロセス２６０は、ブロック４７０に進む。

【0094】

本発明の特定の実施形態では、ＤＮＡ集団モデル化プロセス２６０は、それぞれ正則化されたＤＮＡ入力に加えて、正則化されていないＤＮＡ入力を使用してよい。本発明の同じ実施形態では、ＤＮＡ集団モデル化プロセス２６０が、それぞれ、正則化されていないサンプルから、ＲＲによって正則化されている別のサンプルから、およびＬＡＳＳＯによって正則化されているさらに別のサンプルからの３つの組み合わせを含んでいるＤＮＡ集団を作成する。したがって、ＤＮＡ集団モデル化プロセス２６０は、正則化された入力に基づいて９つの可能性のある組み合わせを生成し、その後、図３のブロック３７０でのように、正則化されていないエンコード済み核酸塩基を正則化されたエンコード済みＤＮＡ鎖に追加することによって、ＤＮＡ集団モデル化プロセス２６０は、２７個の組み合わせ候補を生成し、これらの組み合わせ候補から、ＤＮＡ集団モデル１９５の最良適合が決定される。組み合わせ候補の数は、（ｎ！／（ｋ！（ｎ－ｋ）！））として計算され、ここで、ｎは要素の数を示し、ｋは一緒に選択する要素の数を示す。

【0095】

ブロック４７０で、ＤＮＡ集団モデル化プロセス２６０が、ＤＮＡ集団に基づく予測における精度の特定のパーセンテージなどの、事前に設定された基準に従って、ブロック４６０から作成された１つまたは複数のＤＮＡ集団をテストする。次にＤＮＡ集団モデル化プロセス２６０は、図２のブロック２７０に進む。

【0096】

図２～４に示された動作に従って、本発明の一実施形態では、ＤＮＡ機械学習エンジン１２０が、テニスの試合中の任意の時点で試合の結果を予測するために、ＤＮＡ集団モデルを生成する。入力データは、初期履歴データ、リアルタイム・データ・フィード、およびソーシャル・データを含んでよい。初期履歴データは、各プレイヤーの現在の記録、各プレイヤーの現在の公式ランキング、プレイヤー間の以前の試合結果、気温、湿度を含む以前の試合の各々の気象条件、オーストラリア、フランス、米国を含むトーナメントの場所／国ごとの記録、およびハード、クレー、芝生を含むコートの種類ごとの記録を含むが、これらに限定されない。リアルタイム・データ・フィードは、現在のセット・スコア、現在のゲーム・スコア、凡ミスの数、およびファースト・サーブのパーセンテージを含むが、これらに限定されない。ソーシャル・データは、各ソーシャル・ネットワークにおける人気、各プレイヤーの検索ランキング／ヒット数を含むが、これらに限定されない。

【0097】

各データ項目の各インスタンスは、テニスの試合の結果を予測するためのＤＮＡ集団モデルを生成するプロセスにおいて、図２のブロック２２０での初期ベータ値として選択される、独立変数である。ＤＮＡ機械学習エンジン１２０は、現在の試合に適用できない重みにペナルティを科すために、２つの異なる種類の正則化を使用する。例えば、ＤＮＡ機械学習エンジン１２０は、現在の試合が芝生コート上である場合、クレー・コート上の試合に関するプレイヤーの記録には、芝生コート上の記録ほどには重みを付けない。

【0098】

ＤＮＡ機械学習エンジン１２０は、モデルの前述の目的に従って、図１のブロック２１０でモデルのセットをトレーニングするためのトレーニング・データ・セットを最初に取得する。ＤＮＡ機械学習エンジン１２０は、前述の例からのすべてのデータ項目について、モデルのセットの各モデルを開始する。ＤＮＡ機械学習エンジン１２０は、ブロック２４０で各モデルをＤＮＡ鎖に変換するために、線形回帰および正則化指標に基づいて同じ構成を共有しながら、ＲＲおよびＬＡＳＳＯ（それぞれ、ブロック２３０および２５０）という２種類の正則化を開始する。ＤＮＡ機械学習エンジン１２０は、ベータ値エンコーディング・プロセス２４０においてＰＣＲを介して、正則化項のペナルティを増幅する。ブロック２６０で、ＤＮＡ機械学習エンジン１２０は、ブロック４１０で、連結された正則化済みのＤＮＡ鎖がモデルに影響を与える方法を変更するための外部因子を追加し、ブロック４２０および４３０で、ゲル電気泳動を介して、鎖の長さに基づいてＤＮＡ鎖を並べ替え、ブロック４５０で、ＤＮＡ鎖をデジタル・モデルにデコードし、その後ブロック４６０で、複数の集団モデルを作成する。ＤＮＡ機械学習エンジン１２０は、テスト・データ・セットを使用して各集団モデルをテストする。集団モデルが特定の基準を満たさない場合、ＤＮＡ機械学習エンジン１２０は、エンコーディングおよび正則化、それに続く集団の変更および作成を、ユニットとして繰り返す。

【0099】

この集団モデルは、履歴データおよびリアルタイム・データ・フィードを使用して、現在のテニスの試合のスコアを試合中の任意の時点で予測するためのものである。

【0100】

図５は、本明細書において示される１つまたは複数の実施形態に従って、正則化プロセス２３０、２５０、およびベータ・エンコーディング・プロセス２４０において利用される方程式を示している。

【0101】

方程式ＥＱＬＲは、線形回帰方程式の一般化された形態である。ＤＮＡ機械学習エンジン１２０との関連において、方程式ＥＱＬＲの詳細が、図３のブロック２１０および２２０の説明に示されている。

【0102】

方程式ＥＱＥＸＰは、特徴ベクトルを条件とする期待値方程式である。ＤＮＡ機械学習エンジン１２０との関連において、方程式ＥＱＥＸＰの詳細が、図２のブロック２２０および図３のブロック３１０の説明に示されている。

【0103】

方程式ＥＱＲＥＧは、正則化指標を含んでいる正則化された条件付き期待値方程式である。ＤＮＡ機械学習エンジン１２０との関連において、方程式ＥＱＲＥＧの詳細が、図３のブロック３１０および３３０の説明に示されている。

【0104】

方程式ＥＱＲＴは、正則化された期待値方程式の正則化指標である。ＤＮＡ機械学習エンジン１２０との関連において、方程式ＥＱＲＴの詳細が、図３のブロック３１０の説明に示されている。

【0105】

方程式ＥＱＲＲは、リッジ回帰（ＲＲ）正則化プロセス２３０の正則化項である。ＤＮＡ機械学習エンジン１２０との関連において、方程式ＥＱＲＲの詳細が、図３のブロック３１０の説明に示されている。

【0106】

方程式ＥＱＬＡＳＳＯは、ラッソ回帰（ＬＡＳＳＯ）正則化プロセス２５０の正則化項である。ＤＮＡ機械学習エンジン１２０との関連において、方程式ＥＱＬＡＳＳＯの詳細が、図３のブロック３１０の説明に示されている。

【0107】

本発明の特定の実施形態は、機械学習モデルを生成するための候補モデルの組み合わせの数を拡大すること、およびその結果、機械学習モデルによって行われる予測の精度を改善することを含む、さまざまな技術計算の利点を提供することができる。本発明の特定の実施形態は、ＤＮＡ計算を利用することによって、さまざまな事前に選択された方法を並列に使用してトレーニング・データを正則化する。本発明の特定の実施形態は、ＤＮＡコンピュータを使用して、正則化されていないトレーニング・データおよび正則化されたトレーニング・データの両方を並列に利用することによって、機械学習モデルの候補モデルの組み合わせの数を指数関数的に増やす。本発明の特定の実施形態は、予約されるスケジューリング・サービスの種類に基づいて、ＳａａＳ（Software-as-a-Service）、ＰａａＳ（Platform-as-a-Service）、ＤＢａａＳ（Database-as-a-Service）、およびこれらの組み合わせを含むさまざまな種類のクラウド・プラットフォーム／データセンターを使用して実装されてよい。したがって、グループ内の協力のためのスケジューリング・サービスが、世界中の任意の場所から、それらを必要としている任意の種類の実体に提供されてよい。

【0108】

図６は、本発明の１つまたは複数の実施形態に従って、ＤＮＡに基づくコンピューティング・システム６００を示している。

【0109】

述べたように、本発明の実施形態は、ＤＮＡ計算の確立された計算フェーズが、（１）ＤＮＡに基づくソース入力６０５を使用することによる問題のパラメータ・ツリーの形成、（２）特定のＤＮＡ配列への問題のエンコーディング、（３）設計プールおよび方法プールならびにそれらの再結合を含むＤＮＡプールから事前に選択されたハイブリダイゼーション方法を利用することによる、さまざまなＤＮＡ配列間のハイブリダイズ、（４）特定の望ましいＤＮＡ配列の抽出を含むＤＮＡの突然変異、（５）パラメータ－問題の文脈に戻す、抽出されたＤＮＡ配列のグラフィカルなデコーディング、ならびに（６）ＤＮＡプール内のＤＮＡ計算問題の時間要件および空間要件の改善を試みるコード最適化を含むということを、認識する。前述の計算フェーズの最後で、ＤＮＡターゲット出力６９５が生成される。本発明の実施形態は、ＤＮＡターゲット出力６９５が、ＤＮＡ計算および従来のデジタル計算の両方を利用して、ハイブリッド・コンピューティング・システムにおいて計算可能なデジタル出力に変換されるということも認識する。

【0110】

ＤＮＡに基づくコンピュータ６１０のＤＮＡ鎖全体が、能動コンポーネントおよび受動コンポーネントという２つの部分に分割される。

【0111】

能動コンポーネントは、ハイブリダイゼーション（フェーズ３）に関与する。このコンポーネントは、アーキテクチャの詳細および命令セットの詳細を表す。能動コンポーネントは、エンコーディング段階（フェーズ２）において作成され、ハイブリダイゼーション段階（フェーズ３）において拡大され、エンコーディング段階では基本的なアーキテクチャの詳細がＤＮＡ文字列に追加され、再結合段階（フェーズ３）の間に、より細かい特徴がＤＮＡ文字列に追加されるということを示す。基本的なアーキテクチャの詳細の例としては、１２８ビットの命令長が挙げられるが、これに限定されない。より細かい特徴の詳細の例としては、桁上げ保存加算器（ＣＳＡ：Carry Save Adder）の使用が挙げられるが、これに限定されない。

【0112】

受動コンポーネントは、突然変異段階（フェーズ４）において形成される。受動コンポーネントは、ＤＮＡに基づくコンピュータ６１０の有限状態マシン（ＦＳＭ：Finite State Machine）記述、ネットリスト、および基本配置の詳細を含む。「ネットリスト」は、電子設計のさまざまなコンポーネント間の接続を定義し、「配置」は、ＤＮＡに基づくコンピュータ６１０のコア領域内のさまざまなコンポーネントに正確な位置を割り当てるプロセスである。さまざまなＤＮＡに基づくコンピュータの能動コンポーネントは、ハイブリダイゼーション段階（フェーズ３）の間に互いに反応し、一方、受動コンポーネントは、突然変異段階（フェーズ４）の間に形成される。受動コンポーネントは、ハイブリダイゼーション段階の間に能動的に関与しないが、２つの相互作用するＤＮＡに基づくコンピュータのＦＳＭの詳細は、各命令セットに基づいて子孫によって継承される。次に、継承されたＦＳＭが、子孫の実際のＦＳＭを形成するためのガイドラインとして使用される。

【0113】

ＤＮＡに基づくコンピュータ６１０は、ＤＮＡに基づく電界効果トランジスタ（ＤＮＡＦＥＴ）６２０、ＤＮＡに基づくストレージ・システム６３０、およびＤＮＡマイクロアレイ６４０を含む。

【0114】

ＤＮＡＦＥＴ６２０は、バイオセンサとして機能するように、ＤＮＡ分子の部分電荷に起因する電界効果を使用する、電界効果トランジスタである。バイオセンサは、分析物を検出する分析デバイスとして働く。この分析物は、生物学的コンポーネントを物理化学的検出器に結合する。バイオセンサは、通常、生物学的認識コンポーネント、バイオトランスデューサ・コンポーネント、ならびに信号増幅器、プロセッサ、およびディスプレイなどの電子システムを含む。トランスデューサおよび電子システムを、相補型金属酸化膜半導体（ＣＭＯＳ）に基づくマイクロセンサ・システムとして結合することができる。トランジスタが、電子機器内の回路に沿った電子の流れを制御するように、生物学において、ＤＮＡに基づくトランジスタ（トランスクリプタと呼ばれる）は、トランスクリプタがＤＮＡ鎖に沿って移動するときに、特定のタンパク質（ＲＮＡポリメラーゼ）の流れを制御する。

【0115】

ＤＮＡに基づくストレージ・システム６３０は、ＤＮＡに基づくコンピュータ６１０内のＤＮＡの塩基配列にデジタル・データを格納する。ＤＮＡに基づくストレージ・システム６３０は、電子機器におけるようなシリコン・チップを使用する代わりに、生きている細胞内でデータを記録するために使用される。したがって、ＤＮＡに基づくストレージ・システム６３０は、発達、老化、および癌に発生する変化などの細胞の過程を研究するために、細胞分裂の追跡を可能にする。ＤＮＡに基づくストレージ・システム６３０は、市販されているオリゴヌクレオチド合成装置を格納に使用し、ＤＮＡ塩基配列決定装置を取り出しに使用して作成された、人工ＤＮＡを使用する。ビットおよび対応するＤＮＡ塩基をマッピングする単純なコードが使用されてきたが、そのようなコードは、同じ塩基が長く続くことをもたらし、その結果、そのような長いＤＮＡ塩基配列が誤りを引き起こしやすいということが知られている。ＤＮＡに基づくストレージ・システム６３０は、ハード・ドライブおよび磁気テープなどの、さまざまな種類のストレージ媒体を実装する。

【0116】

ＤＮＡマイクロアレイ６４０は、小型の固体支持体であり、これらの固体支持体の上の固定位置に、数千の異なる遺伝子からのＤＮＡ配列が固定されるか、または取り付けられる。支持体の例としては、顕微鏡のスライド・ガラス、シリコン・チップ、およびナイロン膜が挙げられるが、これらに限定されない。処理対象のＤＮＡ鎖が、支持体の上に印刷されるか、配置されるか、または直接合成される。その結果、ＤＮＡマイクロアレイ６４０内の各点は、ＤＮＡ、相補的ＤＮＡ（ｃＤＮＡ）、またはオリゴヌクレオチドのいずれかになる。デジタル・コンピュータに支援されて、マイクロアレイ上の各点に結び付けられたメッセンジャーＲＮＡ（ｍＲＮＡ）の量が正確に測定され、細胞内の遺伝子発現のプロファイルを生成する。ＤＮＡマイクロアレイ６４０内の点を使用することによって、特定の遺伝子配列または遺伝子突然変異あるいはその両方を識別するために、マイクロアレイ内の遺伝子配列が、規則に従う方法または固定された方法で、支持体に取り付けられる。ＤＮＡマイクロアレイ６４０は、サンプル内の遺伝子がどの程度豊富であるかを示す、サンプル内の遺伝子の発現レベルを決定するため、または細胞内の２つ以上の異なる種類での遺伝子転写を比較するためにも使用される。

【0117】

ＤＮＡに基づくコンピュータ６１０は、ＤＮＡＦＥＴまたはプロセッサ６２０、ＤＮＡに基づくストレージ・システム６３０、およびＤＮＡマイクロアレイ６４０の各機能に対応する各目的を持っている、さまざまなＤＮＡプールの集合として、ＤＮＡプール６２０を含んでいる。ＤＮＡプールは、互いに相互作用する設計プールおよび方法プールを含んでいる。設計プールは、ＤＮＡＦＥＴ６２０および複数の異なる機能ユニットにおけるような、さまざまな処理コンポーネントの完全な各設計を格納するということが知られている。マイクロプロセッサのアーキテクチャの詳細、命令セット、およびＦＳＭ設計が、ＤＮＡ配列として設計プールに格納される。ＤＮＡＦＥＴ６２０におけるように、プロセッサ文字列が、取り出しを容易にするために、インデックス付けされた配列形式で格納される。ＤＮＡＦＥＴ６２０におけるように、各プロセッサが効力係数に関連付けられ、この効力係数は、特定の特性（指標）を有する子孫を生成することにおけるプロセッサの能力を示す。方法プールは、ハイブリダイゼーション段階（フェーズ３）において使用されるさまざまな発見的問題解決法およびそれらの各有効性値を格納する。

【0118】

図７～９は、本明細書において示された１つまたは複数の態様に従って、クラウド・コンピューティング・システムを含む、計算のさまざまな態様を示している。

【0119】

本開示にはクラウド・コンピューティングに関する詳細な説明が含まれているが、本明細書において示された内容の実装は、クラウド・コンピューティング環境に限定されないと理解されるべきである。本発明の実施形態は、現在既知であるか、または今後開発される任意のその他の種類のコンピューティング環境と組み合わせて実装できる。

【0120】

クラウド・コンピューティングは、構成可能な計算リソース（例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、およびサービス）の共有プールへの便利なオンデマンドのネットワーク・アクセスを可能にするためのサービス提供モデルであり、管理上の手間またはサービス・プロバイダとのやりとりを最小限に抑えて、これらのリソースを迅速にプロビジョニングおよび解放することができる。このクラウド・モデルは、少なくとも５つの特徴、少なくとも３つのサービス・モデル、および少なくとも４つのデプロイメント・モデルを含むことができる。

【0121】

特徴は、次のとおりである。
オンデマンドのセルフ・サービス：クラウドの利用者は、サーバの時間、ネットワーク・ストレージなどの計算能力を一方的に、サービス・プロバイダとの人間的なやりとりを必要とせず、必要に応じて自動的にプロビジョニングすることができる。
幅広いネットワーク・アクセス：能力は、ネットワークを経由して利用可能であり、標準的なメカニズムを使用してアクセスできるため、異種のシン・クライアントまたはシック・クライアント・プラットフォーム（例えば、携帯電話、ラップトップ、およびＰＤＡ）による利用を促進する。
リソース・プール：プロバイダの計算リソースは、プールされ、マルチテナント・モデルを使用して複数の利用者に提供される。さまざまな物理的および仮想的リソースが、需要に従って動的に割り当ておよび再割り当てされる。場所に依存しないという感覚があり、利用者は通常、提供されるリソースの正確な場所に関して管理することも知ることもないが、さらに高い抽象レベルで場所（例えば、国、州、またはデータセンター）を指定できる場合がある。
迅速な順応性：能力は、迅速かつ柔軟に、場合によっては自動的にプロビジョニングされ、素早くスケールアウトし、迅速に解放されて素早くスケールインすることができる。プロビジョニングに使用できる能力は、利用者には、多くの場合、無限に見え、任意の量をいつでも購入できる。
測定されるサービス：クラウド・システムは、計測機能を活用することによって、サービスの種類（例えば、ストレージ、処理、帯域幅、およびアクティブなユーザのアカウント）に適した抽象レベルで、リソースの使用を自動的に制御および最適化する。リソースの使用量は監視、制御、および報告することができ、利用されるサービスのプロバイダと利用者の両方に透明性が提供される。

【0122】

サービス・モデルは、次のとおりである。
ＳａａＳ（Software as a Service）：利用者に提供される能力は、クラウド・インフラストラクチャ上で稼働しているプロバイダのアプリケーションの利用である。それらのアプリケーションは、Ｗｅｂブラウザなどのシン・クライアント・インターフェイスを介して、さまざまなクライアント・デバイスからアクセスできる（例えば、Ｗｅｂベースの電子メール）。利用者は、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または個々のアプリケーション機能を含む基盤になるクラウド・インフラストラクチャを、限定的なユーザ固有のアプリケーション構成設定を行う可能性を除き、管理することも制御することもない。
ＰａａＳ（Platform as a Service）：利用者に提供される能力は、プロバイダによってサポートされるプログラミング言語およびツールを使用して作成された、利用者が作成または取得したアプリケーションをクラウド・インフラストラクチャにデプロイすることである。利用者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージを含む基盤になるクラウド・インフラストラクチャを管理することも制御することもないが、デプロイされたアプリケーション、および場合によってはアプリケーション・ホスティング環境の構成を制御することができる。
ＩａａＳ（Infrastructure as a Service）：利用者に提供される能力は、処理、ストレージ、ネットワーク、およびその他の基本的な計算リソースのプロビジョニングであり、利用者は、オペレーティング・システムおよびアプリケーションを含むことができる任意のソフトウェアをデプロイして実行できる。利用者は、基盤になるクラウド・インフラストラクチャを管理することも制御することもないが、オペレーティング・システム、ストレージ、およびデプロイされたアプリケーションを制御することができ、場合によっては、選択されたネットワーク・コンポーネント（例えば、ホスト・ファイアウォール）を限定的に制御できる。

【0123】

デプロイメント・モデルは、次のとおりである。
プライベート・クラウド：このクラウド・インフラストラクチャは、ある組織のためにのみ運用される。この組織またはサード・パーティによって管理することができ、オンプレミスまたはオフプレミスに存在することができる。
コミュニティ・クラウド：このクラウド・インフラストラクチャは、複数の組織によって共有され、共有する関心事（例えば、任務、セキュリティ要件、ポリシー、およびコンプライアンスに関する考慮事項）を共有している特定のコミュニティをサポートする。これらの組織またはサード・パーティによって管理することができ、オンプレミスまたはオフプレミスに存在することができる。
パブリック・クラウド：このクラウド・インフラストラクチャは、一般公衆または大規模な業界団体が使用できるようになっており、クラウド・サービスを販売する組織によって所有される。
ハイブリッド・クラウド：このクラウド・インフラストラクチャは、データとアプリケーションの移植を可能にする標準化された技術またはプロプライエタリな技術（例えば、クラウド間の負荷バランスを調整するためのクラウド・バースト）によって固有の実体を残したまま互いに結合された２つ以上のクラウド（プライベート、コミュニティ、またはパブリック）の複合である。

【0124】

クラウド・コンピューティング環境は、ステートレス、疎結合、モジュール性、および意味的相互運用性に重点を置いたサービス指向の環境である。クラウド・コンピューティングの中心になるのは、相互接続されたノードのネットワークを含んでいるインフラストラクチャである。

【0125】

ここで図７を参照すると、コンピュータ・システム／クラウド・コンピューティング・ノードの例の概略図が示されている。クラウド・コンピューティング・ノード１０は、適切なクラウド・コンピューティング・ノードの一例に過ぎず、本明細書に記載された本発明の実施形態の使用または機能の範囲に関して、いかなる制限を示唆することも意図されていない。いずれにせよ、クラウド・コンピューティング・ノード１０は、前述した機能のいずれかを実装すること、または実行すること、あるいはその両方を行うことができる。

【0126】

クラウド・コンピューティング・ノード１０内には、他の多数の汎用または専用のコンピューティング・システム環境または構成で運用できるコンピュータ・システム１２が存在する。コンピュータ・システム１２と共に使用するのに適した周知のコンピューティング・システム、環境、または構成、あるいはその組み合わせの例としては、パーソナル・コンピュータ・システム、サーバ・コンピュータ・システム、シン・クライアント、シック・クライアント、ハンドヘルドまたはラップトップ・デバイス、マイクロプロセッサ・システム、マイクロプロセッサベース・システム、セット・トップ・ボックス、プログラマブル・コンシューマ・エレクトロニクス、ネットワークＰＣ、マイクロコンピュータ・システム、メインフレーム・コンピュータ・システム、およびこれらの任意のシステムまたはデバイスを含む分散クラウド・コンピューティング環境などが挙げられるが、これらに限定されない。

【0127】

コンピュータ・システム１２は、コンピュータ・システムによって実行されているプログラム・プロセスなどの、コンピュータ・システムによって実行可能な命令との一般的な関連において説明されてよい。通常、プログラム・プロセスは、特定のタスクを実行するか、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、論理、データ構造などを含んでよい。コンピュータ・システム１２は、通信ネットワークを介してリンクされたリモート処理デバイスによってタスクが実行される、分散クラウド・コンピューティング環境内で実践されてよい。分散クラウド・コンピューティング環境において、プログラム・プロセスは、メモリ・ストレージ・デバイスを含む、ローカルおよびリモートの両方のコンピュータ・システム・ストレージ媒体に配置されてよい。

【0128】

図７に示すように、クラウド・コンピューティング・ノード１０内のコンピュータ・システム１２は、汎用コンピューティング・デバイスの形態で示されている。コンピュータ・システム１２のコンポーネントは、１つまたは複数のプロセッサ１６、システム・メモリ２８、およびシステム・メモリ２８を含むさまざまなシステム・コンポーネントをプロセッサ１６に結合するバス１８を含んでよいが、これらに限定されない。

【0129】

バス１８は、メモリ・バスまたはメモリ・コントローラ、ペリフェラル・バス、アクセラレーテッド・グラフィックス・ポート、および任意のさまざまなバス・アーキテクチャを使用するプロセッサまたはローカル・バスを含む、任意の複数の種類のバス構造のうちの１つまたは複数を表す。例として、そのようなアーキテクチャは、ＩＳＡ（Industry Standard Architecture）バス、ＭＣＡ（Micro Channel Architecture）バス、ＥＩＳＡ（Enhanced ISA）バス、ＶＥＳＡ（Video Electronics Standards Association）ローカル・バス、およびＰＣＩ（Peripheral Component Interconnects）バスを含むが、これらに限定されない。

【0130】

コンピュータ・システム１２は、通常、さまざまなコンピュータ・システム可読媒体を含む。そのような媒体は、コンピュータ・システム１２によってアクセスできる任意の使用可能な媒体であってよく、揮発性および不揮発性媒体、取り外し可能および取り外し不可の媒体を含む。

【0131】

システム・メモリ２８は、ランダム・アクセス・メモリ（ＲＡＭ）３０またはキャッシュ・メモリ３２あるいはその両方などの、揮発性メモリの形態でのコンピュータ・システム可読媒体を含むことができる。コンピュータ・システム１２は、その他の取り外し可能／取り外し不可、揮発性／不揮発性のコンピュータ・システム・ストレージ媒体をさらに含んでよい。単に例として、取り外し不可、不揮発性の磁気媒体（図示せず。通常は「ハード・ドライブ」と呼ばれる）に対する読み取りと書き込みを行うために、ストレージ・システム３４を提供することができる。図示されていないが、取り外し可能、不揮発性の磁気ディスク（例えば、「フロッピー（Ｒ）・ディスク」）に対する読み取りと書き込みを行うための磁気ディスク・ドライブ、およびＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、またはその他の光媒体などの取り外し可能、不揮発性の光ディスクに対する読み取りと書き込みを行うための光ディスク・ドライブを提供することができる。そのような例では、それぞれを、１つまたは複数のデータ媒体インターフェイスによってバス１８に接続することができる。下で詳細に示され、説明されているように、メモリ２８は、本発明の実施形態の機能を実行するように構成されたプログラム・プロセスのセット（例えば、少なくとも１つの）を備える少なくとも１つのプログラム製品を含んでよい。

【0132】

プログラム・プロセス４２のセット（少なくとも１つの）を含んでいる１つまたは複数のプログラム４０がメモリ２８に格納されてよく、これに限定されないが、例えば、オペレーティング・システム、１つまたは複数のアプリケーション・プログラム、その他のプログラム・プロセス、およびプログラム・データが格納されてよい。オペレーティング・システム、１つまたは複数のアプリケーション・プログラム、その他のプログラム・プロセス、およびプログラム・データまたはこれらの組み合わせの各々は、図１のＤＮＡ機械学習エンジン１２０の実装を含んでよい。プログラム・プロセス４２は、ＤＮＡ機械学習エンジン１２０におけるように、通常、本明細書に記載された本発明の実施形態の機能または方法あるいはその両方を実行する。

【0133】

また、コンピュータ・システム１２は、キーボード、ポインティング・デバイス、ディスプレイ２４などの１つまたは複数の外部デバイス１４、ユーザがコンピュータ・システム１２と相互作用できるようにする１つまたは複数のデバイス、またはコンピュータ・システム１２が１つまたは複数の他のコンピューティング・デバイスと通信できるようにする任意のデバイス（例えば、ネットワーク・カード、モデムなど）、あるいはその組み合わせと通信してもよい。そのような通信は、入出力（Ｉ／Ｏ）インターフェイス２２を介して行うことができる。さらに、コンピュータ・システム１２は、ローカル・エリア・ネットワーク（ＬＡＮ）、一般的な広域ネットワーク（ＷＡＮ）、またはパブリック・ネットワーク（例えば、インターネット）、あるいはその組み合わせなどの１つまたは複数のネットワークと、ネットワーク・アダプタ２０を介して通信することができる。図に示されているように、ネットワーク・アダプタ２０は、バス１８を介してコンピュータ・システム１２の他のコンポーネントと通信する。図示されていないが、その他のハードウェア・コンポーネントまたはソフトウェア・コンポーネントあるいはその両方を、コンピュータ・システム１２と併用できるということが理解されるべきである。その例として、マイクロコード、デバイス・ドライバ、冗長プロセッサ、外部ディスク・ドライブ・アレイ、ＲＡＩＤシステム、テープ・ドライブ、およびデータ・アーカイブ・ストレージ・システムなどが挙げられるが、これらに限定されない。

【0134】

ここで図８を参照すると、例示的なクラウド・コンピューティング環境５０が示されている。図示されているように、クラウド・コンピューティング環境５０は、クラウドの利用者によって使用されるローカル・コンピューティング・デバイス（例えば、パーソナル・デジタル・アシスタント（ＰＤＡ）または携帯電話５４Ａ、デスクトップ・コンピュータ５４Ｂ、ラップトップ・コンピュータ５４Ｃ、または自動車コンピュータ・システム５４Ｎ、あるいはその組み合わせなど）が通信できる１つまたは複数のクラウド・コンピューティング・ノード１０を含んでいる。ノード１０は、互いに通信してよい。ノード１０は本明細書において前述されたプライベート・クラウド、コミュニティ・クラウド、パブリック・クラウド、またはハイブリッド・クラウド、あるいはこれらの組み合わせなどの１つまたは複数のネットワーク内で、物理的または仮想的にグループ化されてよい（図示せず）。これによって、クラウド・コンピューティング環境５０は、クラウドの利用者がローカル・コンピューティング・デバイス上でリソースを維持する必要のないインフラストラクチャ、プラットフォーム、またはＳａａＳ、あるいはその組み合わせを提供できる。図８に示されたコンピューティング・デバイス５４Ａ～Ｎの種類は、例示のみが意図されており、コンピューティング・ノード１０およびクラウド・コンピューティング環境５０は、任意の種類のネットワークまたはネットワーク・アドレス可能な接続（例えば、Ｗｅｂブラウザを使用した接続）あるいはその両方を経由して任意の種類のコンピュータ制御デバイスと通信することができると理解される。

【0135】

ここで図９を参照すると、クラウド・コンピューティング環境５０（図８）によって提供される機能的抽象レイヤのセットが示されている。図９に示されたコンポーネント、レイヤ、および機能は、例示のみが意図されており、本発明の実施形態がこれらに限定されないということが、あらかじめ理解されるべきである。図示されているように、次のレイヤおよび対応する機能が提供される。

【0136】

ハードウェアおよびソフトウェア・レイヤ６０は、ハードウェア・コンポーネントおよびソフトウェア・コンポーネントを含む。ハードウェア・コンポーネントの例としては、メインフレーム６１、ＲＩＳＣ（Reduced Instruction Set Computer）アーキテクチャベースのサーバ６２、サーバ６３、ブレード・サーバ６４、ストレージ・デバイス６５、ならびにネットワークおよびネットワーク・コンポーネント６６が挙げられる。一部の実施形態では、ソフトウェア・コンポーネントは、ネットワーク・アプリケーション・サーバ・ソフトウェア６７およびデータベース・ソフトウェア６８を含む。

【0137】

仮想化レイヤ７０は、仮想サーバ７１、仮想ストレージ７２、仮想プライベート・ネットワークを含む仮想ネットワーク７３、仮想アプリケーションおよびオペレーティング・システム７４、ならびに仮想クライアント７５などの仮想的実体の例を提供できる抽象レイヤを備える。

【0138】

一例を挙げると、管理レイヤ８０は、以下で説明される機能を提供することができる。リソース・プロビジョニング８１は、クラウド・コンピューティング環境内でタスクを実行するために利用される計算リソースおよびその他のリソースの動的調達を行う。計測および価格設定８２は、クラウド・コンピューティング環境内でリソースが利用される際のコスト追跡、およびそれらのリソースの利用に対する請求書の作成と送付を行う。一例を挙げると、それらのリソースは、アプリケーション・ソフトウェア・ライセンスを含んでよい。セキュリティは、クラウドの利用者およびタスクの同一性検証を行うとともに、データおよびその他のリソースの保護を行う。ユーザ・ポータル８３は、クラウド・コンピューティング環境へのアクセスを利用者およびシステム管理者に提供する。サービス・レベル管理８４は、必要なサービス・レベルを満たすように、クラウドの計算リソースの割り当てと管理を行う。サービス水準合意（ＳＬＡ：Service Level Agreement）計画および実行８５は、今後の要求が予想されるクラウドの計算リソースの事前準備および調達を、ＳＬＡに従って行う。

【0139】

ワークロード・レイヤ９０は、クラウド・コンピューティング環境で利用できる機能の例を示している。このレイヤから提供されてよいワークロードおよび機能の例としては、マッピングおよびナビゲーション９１、ソフトウェア開発およびライフサイクル管理９２、仮想クラスルーム教育の配信９３、データ分析処理９４、トランザクション処理９５、および本明細書において説明されているＤＮＡ機械学習エンジン１２０によって提供されるような共同スケジューリング・サービスのための処理コンポーネントが挙げられる。

【0140】

本発明は、任意の可能な統合の技術的詳細レベルで、システム、方法、またはコンピュータ・プログラム製品、あるいはその組み合わせであってよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を含んでいるコンピュータ可読ストレージ媒体を含んでよい。

【0141】

コンピュータ可読ストレージ媒体は、命令実行デバイスによって使用するための命令を保持および格納できる有形のデバイスであることができる。コンピュータ可読ストレージ媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適切な組み合わせであってよいが、これらに限定されない。コンピュータ可読ストレージ媒体のさらに具体的な例の非網羅的リストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュ・メモリ）、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ）、ポータブル・コンパクト・ディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリ・スティック、フロッピー（Ｒ）・ディスク、パンチカードまたは命令が記録されている溝の中の隆起構造などの機械的にエンコードされるデバイス、およびこれらの任意の適切な組み合わせを含む。本明細書において使用されるとき、コンピュータ可読ストレージ媒体は、それ自体が、電波またはその他の自由に伝搬する電磁波、導波管またはその他の送信媒体を伝搬する電磁波（例えば、光ファイバ・ケーブルを通過する光パルス）、あるいはワイヤを介して送信される電気信号などの一過性の信号であると解釈されるべきではない。

【0142】

本明細書に記載されたコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から各コンピューティング・デバイス／処理デバイスへ、またはネットワーク（例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、または無線ネットワーク、あるいはその組み合わせ）を介して外部コンピュータまたは外部ストレージ・デバイスへダウンロードされ得る。このネットワークは、銅伝送ケーブル、光伝送ファイバ、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組み合わせを備えてよい。各コンピューティング・デバイス／処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェイスは、コンピュータ可読プログラム命令をネットワークから受信し、それらのコンピュータ可読プログラム命令を各コンピューティング・デバイス／処理デバイス内のコンピュータ可読記憶媒体に格納するために転送する。

【0143】

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ（ＩＳＡ）命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路のための構成データ、あるいは、Ｓｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋などのオブジェクト指向プログラミング言語、および「Ｃ」プログラミング言語または同様のプログラミング言語などの手続き型プログラミング言語を含む１つまたは複数のプログラミング言語の任意の組み合わせで記述されたソース・コードまたはオブジェクト・コードであってよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で全体的に実行すること、ユーザのコンピュータ上でスタンドアロン・ソフトウェア・パッケージとして部分的に実行すること、ユーザのコンピュータ上およびリモート・コンピュータ上でそれぞれ部分的に実行すること、あるいはリモート・コンピュータ上またはサーバ上で全体的に実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ）または広域ネットワーク（ＷＡＮ）を含む任意の種類のネットワークを介してユーザのコンピュータに接続されてよく、または接続は、（例えば、インターネット・サービス・プロバイダを使用してインターネットを介して）外部コンピュータに対して行われてよい。一部の実施形態では、本発明の態様を実行するために、例えばプログラマブル論理回路、フィールドプログラマブル・ゲート・アレイ（ＦＰＧＡ）、またはプログラマブル・ロジック・アレイ（ＰＬＡ）を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用することによって、電子回路をパーソナライズするためのコンピュータ可読プログラム命令を実行してよい。

【0144】

本発明の態様は、本明細書において、本発明の実施形態に従って、方法、装置（システム）、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、ならびにフローチャート図またはブロック図あるいはその両方に含まれるブロックの組み合わせが、コンピュータ可読プログラム命令によって実装され得るということが理解されるであろう。

【0145】

これらのコンピュータ可読プログラム命令は、コンピュータまたはその他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能／動作を実施する手段を作り出すべく、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されてマシンを作り出すものであってよい。これらのコンピュータ可読プログラム命令は、命令が格納されたコンピュータ可読ストレージ媒体がフローチャートまたはブロック図あるいはその両方のブロックに指定される機能／動作の態様を実施する命令を含んでいる製品を備えるように、コンピュータ可読ストレージ媒体に格納され、コンピュータ、プログラム可能なデータ処理装置、または他のデバイス、あるいはその組み合わせに特定の方式で機能するように指示できるものであってもよい。

【0146】

コンピュータ可読プログラム命令は、コンピュータ上、その他のプログラム可能な装置上、またはその他のデバイス上で実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能／動作を実施するように、コンピュータ実装プロセスを生成するために、コンピュータ、その他のプログラム可能なデータ処理装置、またはその他のデバイスに読み込まれ、コンピュータ上、その他のプログラム可能な装置上、またはその他のデバイス上で一連の動作可能なステップを実行させるものであってもよい。

【0147】

図内のフローチャートおよびブロック図は、本発明のさまざまな実施形態に従って、システム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。これに関連して、フローチャートまたはブロック図内の各ブロックは、規定された論理機能を実装するための１つまたは複数の実行可能な命令を備える、命令のモジュール、セグメント、または部分を表してよい。一部の代替の実装では、ブロックに示された機能は、図に示された順序とは異なる順序で発生してよい。例えば、連続して示された２つのブロックは、実際には、含まれている機能に応じて、実質的に同時に実行されるか、または場合によっては逆の順序で実行されてよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、ならびにブロック図またはフローチャート図あるいはその両方に含まれるブロックの組み合わせは、規定された機能または動作を実行するか、または専用ハードウェアとコンピュータ命令の組み合わせを実行する専用ハードウェアベースのシステムによって実装され得るということにも注意する。

【0148】

本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、制限することを意図していない。本明細書において使用されるとき、単数形「ある（ａ）」、「１つの（ａｎ）」、および「その（ｔｈｅ）」は、文脈で特に明示的に示されない限り、複数形も含むよう意図されている。「備える（ｃｏｍｐｒｉｓｅ）」（および「備え（ｃｏｍｐｒｉｓｅｓ）」、「備えている（ｃｏｍｐｒｉｓｉｎｇ）」などの「備える（ｃｏｍｐｒｉｓｅ）」のすべての形態）、「持つ（ｈａｖｅ）」（および「持ち（ｈａｓ）」、「持っている（ｈａｖｉｎｇ）」などの「持つ（ｈａｖｅ）」のすべての形態）、「含む（ｉｎｃｌｕｄｅ）」（および「含み（ｉｎｃｌｕｄｅｓ）」、「含んでいる（ｉｎｃｌｕｄｉｎｇ）」などの「含む（ｉｎｃｌｕｄｅ）」のすべての形態）、および「包含する（ｃｏｎｔａｉｎ）」（および「包含し（ｃｏｎｔａｉｎｓ）」、「包含している（ｃｏｎｔａｉｎｉｎｇ）」などの「包含する（ｃｏｎｔａｉｎ）」のすべての形態）の各用語が無制限の連結動詞であるということが、さらに理解されるであろう。そのため、１つまたは複数のステップまたは要素を「備える」、「持つ」、「含む」、または「包含する」方法またはデバイスは、それらの１つまたは複数のステップまたは要素を保有するが、それらの１つまたは複数のステップまたは要素の保有のみに限定されない。同様に、１つまたは複数の特徴を「備える」、「持つ」、「含む」、または「包含する」方法のステップまたはデバイスの要素は、それらの１つまたは複数の特徴を保有するが、それらの１つまたは複数の特徴の保有のみに限定されない。さらに、特定の方法で構成されたデバイスまたは構造は、少なくともその方法で構成されるが、示されていない方法で構成されてもよい。

【0149】

特許請求の範囲内のすべてのミーンズまたはステップ・プラス・ファンクション要素の対応する構造、材料、動作、および均等なものは、もしあれば、具体的に請求されるとき、その他の請求される要素と組み合わせて機能を実行するための任意の構造、材料、または動作を含むことが意図されている。本明細書において示された説明は、例示および説明の目的で提示されているが、網羅的であることは意図されておらず、開示された形態に限定されない。本開示の範囲から逸脱することなく多くの変更および変形が、当業者にとって明らかである。本明細書において示された１つまたは複数の態様の原理および実際的な応用を最も適切に説明するため、およびその他の当業者が、企図されている特定の用途に適しているようなさまざまな変更を伴う多様な実施形態に関して、本明細書に記載されている１つまたは複数の態様を理解できるようにするために、実施形態が選択されて説明された。

【図1】