特許7195514 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ インターナショナル・ビジネス・マシーンズ・コーポレーションの特許一覧

特許7195514がん確率のライブラリ・スクリーニングのためのコンピュータ実装方法、コンピュータ・プログラム製品、およびシステム（がん確率のライブラリ・スクリーニング）

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-12-16

(45)【発行日】2022-12-26

(54)【発明の名称】がん確率のライブラリ・スクリーニングのためのコンピュータ実装方法、コンピュータ・プログラム製品、およびシステム（がん確率のライブラリ・スクリーニング）

(51)【国際特許分類】

G16H 50/00 20180101AFI20221219BHJP

G16B 40/30 20190101ALI20221219BHJP

【ＦＩ】

G16H50/00

G16B40/30

【請求項の数】 14

(21)【出願番号】P 2020535049

(86)(22)【出願日】2018-12-21

(65)【公表番号】

(43)【公表日】2021-03-25

(86)【国際出願番号】 IB2018060485

(87)【国際公開番号】W WO2019135143

(87)【国際公開日】2019-07-11

【審査請求日】2021-05-25

(31)【優先権主張番号】15/864,278

(32)【優先日】2018-01-08

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】390009531

【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション

【氏名又は名称原語表記】ＩＮＴＥＲＮＡＴＩＯＮＡＬＢＵＳＩＮＥＳＳＭＡＣＨＩＮＥＳＣＯＲＰＯＲＡＴＩＯＮ

【住所又は居所原語表記】ＮｅｗＯｒｃｈａｒｄＲｏａｄ，Ａｒｍｏｎｋ，ＮｅｗＹｏｒｋ１０５０４，ＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】100112690

【弁理士】

【氏名又は名称】太佐種一

(72)【発明者】

【氏名】チャッタジー、アビジット

(72)【発明者】

【氏名】ワン、ウェンディ

【審査官】森田充功

(56)【参考文献】

【文献】特表２０１６－５３７６９９（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１６Ｈ１０／００－８０／００

Ｇ１６Ｂ４０／３０

(57)【特許請求の範囲】

【請求項1】

コンピュータ実装方法であって、
１つまたは複数のプロセッサにより、ある状態と診断もしくは予備診断されるか、または、前記状態と診断されないものとして指定される患者のペプチド・ライブラリを含む生データ・セットを取得することと、
前記１つまたは複数のプロセッサにより、前記生データ・セットを所定数のグループに分割することであり、不適合データ・グループをその他のグループから取り出すことを含む、前記分割することと、
前記１つまたは複数のプロセッサにより、前記その他のグループに対して主成分分析を実行して、前記その他のグループにおける特徴の頻度に基づいて、前記１つまたは複数のプロセッサにより、前記その他のグループのデータにおける共通特徴を識別し、前記その他のグループにおける発生頻度に基づいて、係数により表される主成分を含む前記共通特徴を重み付けすることと、
前記１つまたは複数のプロセッサにより、所定レベルの検証精度を生じる最小数の前記主成分を決定することと、
前記１つまたは複数のプロセッサにより、ロジスティック回帰モデルにおける最良適合のパラメータとして前記最小数の主成分を利用することによって予測モデルを生成することであり、前記予測モデルが、所定の閾値内に前記状態が存在する尤度および前記所定の閾値内に前記状態が存在しない尤度から成る群から選択される２値結果を提供する、前記生成することと、
を含み、
前記主成分分析の実行に先立って、前記１つまたは複数のプロセッサにより、すべてのペプチドにわたりペプチドのペプチド値を合算するとともに各発現値を結果の合計値で割って比を演算することによって、前記生データ・セットを含むペプチドを正規化することを含む、
むコンピュータ実装方法。

【請求項2】

コンピュータ実装方法であって、
１つまたは複数のプロセッサにより、ある状態と診断もしくは予備診断されるか、または、前記状態と診断されないものとして指定される患者のペプチド・ライブラリを含む生データ・セットを取得することと、ここで、前記ペプチド・ライブラリが、１２－ｍｅｒペプチド・ライブラリを含む、
前記１つまたは複数のプロセッサにより、前記生データ・セットを所定数のグループに分割することであり、不適合データ・グループをその他のグループから取り出すことを含む、前記分割することと、
前記１つまたは複数のプロセッサにより、前記その他のグループに対して主成分分析を実行して、前記その他のグループにおける特徴の頻度に基づいて、前記１つまたは複数のプロセッサにより、前記その他のグループのデータにおける共通特徴を識別し、前記その他のグループにおける発生頻度に基づいて、係数により表される主成分を含む前記共通特徴を重み付けすることと、
前記１つまたは複数のプロセッサにより、所定レベルの検証精度を生じる最小数の前記主成分を決定することと、
前記１つまたは複数のプロセッサにより、ロジスティック回帰モデルにおける最良適合のパラメータとして前記最小数の主成分を利用することによって予測モデルを生成することであり、前記予測モデルが、所定の閾値内に前記状態が存在する尤度および前記所定の閾値内に前記状態が存在しない尤度から成る群から選択される２値結果を提供する、前記生成することと、
を含むコンピュータ実装方法。

【請求項3】

コンピュータ実装方法であって、
１つまたは複数のプロセッサにより、ある状態と診断もしくは予備診断されるか、または、前記状態と診断されないものとして指定される患者のペプチド・ライブラリを含む生データ・セットを取得することと、ここで、前記状態ががんを含む、
前記１つまたは複数のプロセッサにより、前記生データ・セットを所定数のグループに分割することであり、不適合データ・グループをその他のグループから取り出すことを含む、前記分割することと、
前記１つまたは複数のプロセッサにより、前記その他のグループに対して主成分分析を実行して、前記その他のグループにおける特徴の頻度に基づいて、前記１つまたは複数のプロセッサにより、前記その他のグループのデータにおける共通特徴を識別し、前記その他のグループにおける発生頻度に基づいて、係数により表される主成分を含む前記共通特徴を重み付けすることと、
前記１つまたは複数のプロセッサにより、所定レベルの検証精度を生じる最小数の前記主成分を決定することと、
前記１つまたは複数のプロセッサにより、ロジスティック回帰モデルにおける最良適合のパラメータとして前記最小数の主成分を利用することによって予測モデルを生成することであり、前記予測モデルが、所定の閾値内に前記状態が存在する尤度および前記所定の閾値内に前記状態が存在しない尤度から成る群から選択される２値結果を提供する、前記生成することと、
を含むコンピュータ実装方法。

【請求項4】

前記状態が、乳がんを含む、請求項３に記載の方法。

【請求項5】

前記状態が、ステージ１の乳がんを含む、請求項３又４に記載の方法。

【請求項6】

前記１つまたは複数のプロセッサにより、前記係数を適用して前記不適合データ・グループに使用する特徴を計算することによって前記予測モデルをテストすることと、
前記１つまたは複数のプロセッサにより、前記不適合データ・グループの前記特徴を前記主成分と比較することによって前記予測モデルを調節することと、
をさらに含む、請求項１～５いずれか１項に記載のコンピュータ実装方法。

【請求項7】

前記分割が、前記グループに割り当てる前記生データ・セットのレコードを選択する乱数を生成することを含む、請求項１～６いずれか１項に記載のコンピュータ実装方法。

【請求項8】

前記その他のグループに対して主成分分析を実行することが、
前記１つまたは複数のプロセッサにより、トレーニング・データ集合を生成することであり、前記トレーニング・データ集合の各トレーニング・データ集合が、前記その他のグループのうちの１つを除くすべてのグループのデータを含む、前記生成することと、
前記１つまたは複数のプロセッサにより、各トレーニング・データ集合に対して個別に主成分分析を実行することによって、各トレーニング・データ集合の共通特徴を識別することと、
前記１つまたは複数のプロセッサにより、前記その他のグループを単一のトレーニング・セットとして利用することにより主成分分析を実行することによって、前記単一のトレーニング・セットの共通特徴を識別することと、
各トレーニング・データ集合の前記共通特徴および前記単一のトレーニング・セットの前記共通特徴について、前記その他のグループの数に等しい回数の相互検証を実行することによって、前記主成分を識別するとともに前記係数を決定することと、
を含む、請求項１～７いずれか１項に記載のコンピュータ実装方法。

【請求項9】

前記所定レベルの検証精度が、前記回数に基づく最高の検証精度である、請求項１～７いずれか１項に記載のコンピュータ実装方法。

【請求項10】

前記１つまたは複数のプロセッサにより、所与の個人の１２－ｍｅｒペプチド・ライブラリを含む新たな生データを取得することと、
前記１つまたは複数のプロセッサにより、前記予測モデルを前記新たな生データに適用して、前記所与の個人の２値結果を決定することと、
をさらに含む、請求項１又は２に記載のコンピュータ実装方法。

【請求項11】

前記予測モデルを適用することが、前記係数を利用して前記新たな生データに対する主成分分析を実行することと、ロジスティック回帰を実行して前記２値結果を生成することと、を含む、請求項１０に記載のコンピュータ実装方法。

【請求項12】

コンピュータ・プログラムであって、請求項１～１１のいずれか１項に記載の方法の各ステップをコンピュータに実行させるための、コンピュータ・プログラム。

【請求項13】

請求項１２に記載のコンピュータ・プログラムを記録した、コンピュータ可読記憶媒体。

【請求項14】

システムであって、
メモリと、
前記メモリと通信するプロセッサと、
方法を実行するように前記メモリを介して前記プロセッサにより実行可能なプログラム命令と、
を備え、前記方法は、請求項１～１１のいずれか１項に記載の方法の各ステップを含む、前記システム。

【発明の詳細な説明】

【技術分野】

【0001】

本出願は、一般に、がん予測モデルのコンピュータ処理方法および装置に関し、より詳細には、患者の生データ・セット（ペプチド・ライブラリ）に基づき、がん予測モデルの生成のための方法および装置に関する。

【背景技術】

【0002】

米国においては、約８人に１人の女性（すなわち、１２％）が生涯のうちに、浸潤性乳がん（invasive breast cancer）を患う。２０１７年より前、公衆衛生機関は、米国の女性において、新たに２５２，７１０症例が浸潤性乳がんと診断され、新たに６３，４１０症例が非浸潤性（non-invasive）（上皮内（in situ））乳がんと診断されると推定していた。上皮内がんの症例では、悪性細胞（malignant cell）が腫瘍として存在する一方、腫瘍が見つかった場所の基底膜（basement membrane）を越えては、転移も浸潤も起こっていない。治療法の改善にも関わらず、２０１７年の乳がんによる米国女性の死亡者数は、およそ４０，６１０人と推定されるが、これは減少を表しており、１９８９年以降は毎年、特に５０歳以下の女性では、死亡者数が減少している。ただし、乳がんは依然として、米国の女性においては、各種がんのうちで死の主要な原因となっている。女性の新たに診断されるがんのうち、およそ３０％が乳がんと推定される。乳がんのリスク増大に関する一定の遺伝的指標が存在するものの、およそ８５％の乳がんは、乳がんの家系ではない女性に発症する。現在、乳がんの最も重要なリスク要因は、性別（女性）および年齢（加齢）である。

【発明の概要】

【発明が解決しようとする課題】

【0003】

患者の生データ・セット（ペプチド・ライブラリ）に基づき、がん予測モデルを生成する。

【課題を解決するための手段】

【0004】

従来技術の欠点は、状態の尤度を予測するコンピュータ・プログラム製品の提供によって克服され、別の利点がもたらされる。このコンピュータ・プログラム製品は、処理回路により可読な記憶媒体であって、方法を実行するように処理回路により実行するための命令を格納した記憶媒体を備える。この方法は、たとえば、１つまたは複数のプロセッサにより、ある状態と診断もしくは予備診断されるか、または、当該状態と診断されないものとして指定される患者のペプチド・ライブラリ（peptide library）を含む生データ・セットを取得することと、１つまたは複数のプロセッサにより、生データ・セットを所定数のグループに分割することであり、不適合（holdout）データ・グループをその他のグループから取り出すことを含む、分割することと、１つまたは複数のプロセッサにより、その他のグループに対して主成分分析を実行して、その他のグループにおける特徴の頻度に基づいて、１つまたは複数のプロセッサにより、その他のグループのデータにおける共通特徴を識別し、その他のグループにおける発生頻度に基づいて、係数により表される主成分を含む共通特徴を重み付けすることと、１つまたは複数のプロセッサにより、所定レベルの検証精度（validation accuracy）を生じる最小数の主成分を決定することと、１つまたは複数のプロセッサにより、ロジスティック回帰モデルにおける最良適合（best fit）のパラメータとして最小数の主成分を利用することによって予測モデルを生成することであり、予測モデルが、所定の閾値内に状態が存在する尤度および所定の閾値内に状態が存在しない尤度から成る群から選択される２値結果を提供する、生成することと、を含む。

【0005】

従来技術の欠点は、状態の尤度を予測する方法の提供によって克服され、別の利点がもたらされる。この方法は、たとえば、１つまたは複数のプロセッサにより、ある状態と診断もしくは予備診断されるか、または、当該状態と診断されないものとして指定される患者のペプチド・ライブラリを含む生データ・セットを取得することと、１つまたは複数のプロセッサにより、生データ・セットを所定数のグループに分割することであり、不適合データ・グループをその他のグループから取り出すことを含む、分割することと、１つまたは複数のプロセッサにより、その他のグループに対して主成分分析を実行して、その他のグループにおける特徴の頻度に基づいて、１つまたは複数のプロセッサにより、その他のグループのデータにおける共通特徴を識別し、その他のグループにおける発生頻度に基づいて、係数により表される主成分を含む共通特徴を重み付けすることと、１つまたは複数のプロセッサにより、所定レベルの検証精度を生じる最小数の主成分を決定することと、１つまたは複数のプロセッサにより、ロジスティック回帰モデルにおける最良適合のパラメータとして最小数の主成分を利用することによって予測モデルを生成することであり、予測モデルが、所定の閾値内に状態が存在する尤度および所定の閾値内に状態が存在しない尤度から成る群から選択される２値結果を提供する、生成することと、を含む。

【0006】

従来技術の欠点は、状態の尤度を予測するシステムの提供によって克服され、別の利点がもたらされる。このシステムは、メモリと、メモリと通信する１つまたは複数のプロセッサと、方法を実行するようにメモリを介して１つまたは複数のプロセッサにより実行可能なプログラム命令と、を備える。この方法は、たとえば、１つまたは複数のプロセッサにより、ある状態と診断もしくは予備診断されるか、または、当該状態と診断されないものとして指定される患者のペプチド・ライブラリを含む生データ・セットを取得することと、１つまたは複数のプロセッサにより、生データ・セットを所定数のグループに分割することであり、不適合データ・グループをその他のグループから取り出すことを含む、分割することと、１つまたは複数のプロセッサにより、その他のグループに対して主成分分析を実行して、その他のグループにおける特徴の頻度に基づいて、１つまたは複数のプロセッサにより、その他のグループのデータにおける共通特徴を識別し、その他のグループにおける発生頻度に基づいて、係数により表される主成分を含む共通特徴を重み付けすることと、１つまたは複数のプロセッサにより、所定レベルの検証精度を生じる最小数の主成分を決定することと、１つまたは複数のプロセッサにより、ロジスティック回帰モデルにおける最良適合のパラメータとして最小数の主成分を利用することによって予測モデルを生成することであり、予測モデルが、所定の閾値内に状態が存在する尤度および所定の閾値内に状態が存在しない尤度から成る群から選択される２値結果を提供する、生成することと、を含む。

【0007】

本明細書においては、１つまたは複数の態様に関する方法およびシステムも記載・請求する。さらに、本明細書においては、１つまたは複数の態様に関するサービスを記載するとともに、請求する場合もある。

【0008】

本明細書に記載の技術によって、付加的な特徴および利点が実現される。本発明のいくつかの実施形態において、この方法は、１つまたは複数のプロセッサにより、係数を適用して不適合グループに使用する特徴を計算することによって予測モデルをテストすることと、１つまたは複数のプロセッサにより、不適合グループの特徴を主成分と比較することによって予測モデルを調節することと、を含む。本発明のいくつかの実施形態においては、ペプチド・ライブラリが１２－ｍｅｒペプチド・ライブラリを含むか、または、状態がステージ１の乳がんを含むか、あるいはその両方である。本発明のいくつかの実施形態において、分割は、グループに割り当てる生データ・セットのレコードを選択する乱数を生成することを含む。

【0009】

本発明のいくつかの実施形態において、この方法は、主成分分析の実行に先立って、１つまたは複数のプロセッサにより、すべてのペプチドにわたりペプチドのペプチド値を合算するとともに各発現値を結果の合計値で割って比を演算することによって、生データ・セットを含むペプチドを正規化することを含む。

【0010】

本発明のいくつかの実施形態において、その他のグループに対して主成分分析を実行することは、１つまたは複数のプロセッサにより、トレーニング・データ集合を生成することであり、トレーニング・データ集合の各トレーニング・データ集合が、その他のグループのうちの１つを除くすべてのグループのデータを含む、生成することと、１つまたは複数のプロセッサにより、各トレーニング・データ集合に対して個別に主成分分析を実行することによって、各トレーニング・データ集合の共通特徴を識別することと、１つまたは複数のプロセッサにより、その他のグループを単一のトレーニング・セットとして利用することにより主成分分析を実行することによって、単一のトレーニング・セットの共通特徴を識別することと、各トレーニング・データ集合の共通特徴および単一のトレーニング・セットの共通特徴について、その他のグループの数に等しい回数の相互検証を実行することによって、主成分を識別するとともに係数を決定することと、を含む。本発明のいくつかの実施形態において、所定レベルの検証精度は、回数に基づく最高の検証精度である。

【0011】

本発明のいくつかの実施形態において、この方法は、１つまたは複数のプロセッサにより、所与の個人の１２－ｍｅｒペプチド・ライブラリを含む新たな生データを取得することと、１つまたは複数のプロセッサにより、予測モデルを新たな生データに適用して、所与の個人の２値結果を決定することと、を含む。本発明のいくつかの実施形態において、予測モデルを適用することは、係数を利用して新たな生データに対する主成分分析を実行することと、ロジスティック回帰を実行して２値結果を生成することと、を含む。

【0012】

本明細書の最後の特許請求の範囲において、１つまたは複数の態様を詳細に示すとともに、一例として明確に請求する。上記および他の目的、特徴、および利点については、添付の図面と併せた以下の詳細な説明によって明らかとなる。

【図面の簡単な説明】

【0013】

【図1】本発明のいくつかの実施形態の特定の態様を示したワークフローである。

【図2】本発明のいくつかの実施形態の特定の態様を示したワークフローである。

【図3】本発明の一実施形態の特定の態様を示した図である。

【図4】本発明のいくつかの実施形態の特定の態様を示したワークフローである。

【図5】クラウド・コンピューティング環境において利用可能なコンピューティング・ノードの一実施形態を示した図である。

【図6】本発明の実施形態に係るクラウド・コンピューティング環境を示した図である。

【図7】本発明の実施形態に係る抽象化モデル・レイヤを示した図である。

【発明を実施するための形態】

【0014】

添付の図面は、それぞれの全体を通して同じ参照番号が同一または機能的に同様の要素を表し、本明細書に組み込まれるとともにその一部を構成するものであるが、本発明をさらに示すとともに、本発明の詳細な説明と併せて、本発明の原理を説明するのに役立つ。当業者が理解する通り、添付の図面は、理解の容易化のために提供され、本発明の特定の実施形態の態様を示す。本発明は、図面に示す実施形態に限定されない。

【0015】

当業者が理解する通り、本願の全体を通して言及するプログラム・コードは、ソフトウェアおよびハードウェアの両者を含む。たとえば、本発明の特定の実施形態におけるプログラム・コードは、固定機能のハードウェアを含む一方、他の実施形態においては、記載の機能のソフトウェアベースの実装を利用する。特定の実施形態は、両種のプログラム・コードを組み合わせる。１つまたは複数のプログラムとも称するプログラム・コードの一例を図５に示すが、一組（少なくとも一組）のプログラム・モジュール４２を有するプログラム／ユーティリティ４０がメモリ２８に格納されていてもよい。

【0016】

本発明の実施形態は、乳がんが最終的に存在する確率の増大を認識するコンピュータ実装方法、コンピュータ・プログラム製品、およびコンピュータ・システムを含み、１つまたは複数のプログラムが１２アミノ酸（１２－ｍｅｒ）ペプチド・ライブラリ、免疫グロブリンＧ（ＩｇＧ）抗体、ならびにさまざまなコンピュータ・データ・モデリングおよびコンピュータ管理を適用することによって、この決定を許容範囲内の精度レベルとする。ペプチド・ライブラリは、さまざまなペプチドを符号化したランダムなデオキシリボ核酸（ＤＮＡ）配列で構成され、バクテリオファージに取り付けられたターゲットを認識可能である。一方、ＩｇＧは、最も豊富な種類の抗体であり、すべての体液中に存在して、細菌およびウイルス感染に対する保護を担う。

【0017】

本発明の実施形態の態様は、既存のコンピューティング技術の改良を表し、コンピューティングと密接に結びついている。具体的に、本発明の実施形態は、大量のデータを扱うとともに、データからロジスティック・モデルを構築する改良された方法を表す。たとえば、本発明の実施形態は、最終結果における観測データ・レートを低減する。プログラム・コードが低効率の２値ビニング手順を使用するのではなく、パターンの構築に利用されるデータを前処理するためである。

【0018】

本発明の実施形態の態様がコンピューティングと密接に結びついているのは、少なくとも、本発明の実施形態によって生成される、トレーニング・データから生成される自動生成自己学習予測モデルを含む電子モデルがコンピューティングの外側では生成不可能であり、また、コンピューティングの外側には存在しないためである。本発明の実施形態において最初に利用されるレコードは、１つまたは複数のデータベースに含まれる１つまたは複数のデータ・セット中の機械可読電子レコードである。また、結果としてのモデルも電子的であり、コンピューティング・リソースを利用して別の電子データ・セットに適用される。プログラム・コードによる別のデータ・セットへの適用によって、将来のある時点（たとえば、所定の時点）において乳がんが存在する可能性の予測のためにモデルが生成された事象または状態の確率でレコードを識別可能な機械可読データ・モデルが得られる本発明の実施形態の特定の態様を実現することは、データの量および性質の両者から個人には不可能である。

【0019】

本発明の実施形態は、結果を提供可能な速度のために個人および既存のシステムでは不可能なユーティリティを提供する。有用化のため、本発明の実施形態のプログラム・コードは、限られた期間内で、モデルの生成および更新を行うとともに、結果（モデルに適合するレコードの識別）を提供する。たとえば、個人が医療機関を訪れるシナリオにおいて、個人および医療機関は、データ（ペプチド）ライブラリ中の個々の値で電子的に表されるように、予測モデルが求めるデータに一致するレコード中の項目を個人が有するかに関する情報の取得の恩恵を受けることになる。この情報が訪問中に提供され得ない場合は、ほぼ間違いなく、個人または医療機関にとって有用とはならない。このため、本発明の実施形態において、プログラム・コードは、個人の所与のサンプルを分析するとともに、予測モデルを実時間または近実時間で適用する。これにより、本発明の実施形態は、ライブラリに記録された大量のペプチドが、本発明の実施形態のプログラム・コードにより生成された予測モデルと適合するかに基づいて、電子データ・ライブラリの実時間分析を可能にする。

【0020】

本発明の実施形態は、演算効率および有効性を増大させる一定の利点をもたらすことから、コンピュータ技術と密接に結びついた利点および改良を提供する。たとえば、以下により詳しく説明する通り、本発明の実施形態は、予想質問結果に基づいて分散処理を利用することにより、重要な分析成果物のための時間を短縮する。この分散処理によれば、プログラム・コードは、複数の分析プロセスを同時に実行可能である。本発明の特定の実施形態の一部は、クラウド・アーキテクチャに移行させることで、サービスとしてのソフトウェア（ＳａａＳ）の提供物としてユーザが利用可能となる。クラウド・アーキテクチャにおけるリソースの無制限の演算能力は、データが豊富な環境におけるシステムの効率要求を満たすためのプログラム・コードによる同時質問およびプロセスの分散の補助に適している。

【0021】

また、本発明の実施形態は、機械学習を利用することから、コンピュータ技術と密接に結びついた利点および改良を提供する。データ高密度環境における事象（たとえば、状態）識別の既存の手法に対する本発明のいくつかの実施形態の有利な一態様では、利用可能なツールにおける選択肢を制限する手法である機械学習問題の代わりに、統計的問題として、その他何らかの方法により事象識別および認識の問題に取り組む。機械学習の利用により、本発明の実施形態では、事象を含むレコードを識別可能であるが、当該事象を直接識別する情報は存在しない。たとえば、機械学習の使用により、プログラム・コードは、診断未確定患者の１２－ｍｅｒペプチド・ライブラリを用いて、乳がんを患う確率で個々の患者を識別可能である。すなわち、患者がすでにこの病気を患っていることをデータが示しているわけではない。場合により、プログラム・コードは、機械学習を利用することにより、個人と関連するデータにおいて反対のことが示される場合に、当該個人が乳がんを患う閾値確率を有する旨を示すことができる。このため、プログラム・コードは、１つまたは複数のメモリ・デバイスに格納された既存の確立データを単に識別して読み出しているわけではない。むしろ、プログラム・コードは、パターンを確立し、機械学習アルゴリズムを継続的にトレーニングしてパターンを適用し、結果の予測モデルを利用して、データによりまだ明確に示されていない事象のインスタンスを識別する。

【0022】

本発明の一実施形態においては、統計的手順である主成分分析（ＰＣＡ）を１つまたは複数のプログラムが利用して、トレーニング・データ集合中の多くの個人に一致する１つまたは複数の特徴と関連する概念または成分集合を決定する。ＰＣＡは、場合により相関する変数の観測集合を主成分と称する線形無相関の変数の値集合に変換する直交変換を含む。主成分の数は、元の変数の数以下である。このため、本発明の一実施形態において、プログラム・コードは、親概念を利用して、複数の副成分を生成する。この変換は、最初の主成分が考え得る最大の分散を有し（すなわち、可能な限り多くのデータ変動性を考慮し）、後続の各成分が先行成分に直交する制約下で考え得る最大の分散を有するように規定される。結果としてのベクトルは、無相関直交基底集合である。ＰＣＡは、元の変数の相対スケーリングの影響を受けやすい。

【0023】

本発明の種々実施形態の態様は、予測モデルの生成および適用に基づいて個人の乳がんの確率を予測するコンピュータ実装方法、コンピュータ・システム、またはコンピュータ・プログラム製品、あるいはその組み合わせを利用する既存のシステムに対する利点を提供する。既存の方法では、遺伝的多型（polymorphism）に対する乳がんマーカ、ＤＮＡの遺伝暗号（genetic code）の変化、組織の採取、過剰発現のバイオマーカを検出する尿サンプルまたは母乳サンプル、あるいはその両方、質量分析の利用による術前サンプルの分析、遺伝子発現プロファイルの分析、リボ核酸（ＲＮＡ）からの遺伝子発現データの分析、ならびに反応を誘発する免疫療法薬（Immunotherapeutic agent）もしくはワクチンの導入に依拠していた。これら既存の方法に対して、本発明の実施形態においては、１２－ｍｅｒペプチドの免疫徴候サンプル（immunosignature sample）の分析ならびに乳がん患者の計測可能リスクを示すパターンの生成および認識の両者を行うプログラム・コードのトレーニングに部分的に基づいて、１つまたは複数のプログラムが予測モデルを生成して適用する。

【0024】

図１は、本発明の特定の実施形態のいくつかの態様の全体ワークフロー１００を提供する。図２は、図１のワークフロー１００に含まれる態様を別途詳細化したワークフロー２００である。

【0025】

最初に図１を参照して、本発明のいくつかの実施形態においては、１つまたは複数のプログラムが生の電子データ・セットを取得する（１１０）。本発明の一実施形態において、生の電子データは、抗ヒトＩｇＧ抗体を用いた１２－ｍｅｒペプチド・ライブラリ・スクリーニングによる生のデータを含む。データ・セットには、最大１２万（１２０Ｋ）個の値を含んでいてもよく、各値は、ある方法（グリーン色素（green dye）の使用を含む蛍光標識（fluorescent labeling）が挙げられるが、これに限定されない）により分離された１２アミノ酸長のペプチドを表す。データ・セットには、プレステージ１もしくはステージ１の乳がんと過去に診断された個人ならびにこのように診断されていない個人に関するデータを含む。データ・セット中のレコードは、この特性化を示すようにラベル付与される。

【0026】

１つまたは複数のプログラムは、データ・セットを利用して、プレステージ１またはステージ１の乳がんを有する個人と関連するデータを、この診断のないデータにより表される個人から区別する予測モデルを生成する（１２０）。本発明の一実施形態において１つまたは複数のプログラムにより生成された予測モデルは、分類器または分類アルゴリズムとして理解可能である。予測モデルを生成するプロセスについては、図２においてより詳しく論じる。ただし、予測モデルの生成において、１つまたは複数のプログラムは、データ・セットをトレーニング・データとして利用するとともに、このデータ・セットにより提供されるトレーニングに基づいて、予測モデルを生成する。

【0027】

１つまたは複数のプログラムは、プレステージ１またはステージ１の乳がんと過去に診断されたかが不明であり、現時点でこの診断がないかも不明な個人と関連するデータを取得する（１３０）。本発明の一実施形態において、データは、この個人の１２－ｍｅｒライブラリにおける各ペプチドの値を含む。このデータは、１２０Ｋ個の値を含んでいてもよい。

【0028】

本発明の一実施形態において、１つまたは複数のプログラムは、予測モデルを個人と関連するデータに適用して、個人と関連するデータがある状態のある確率を示しているかを決定する（１４０）。この状態は、個人（たとえば、腫瘍のある個人）が乳がんと診断される（所与の範囲内の）尤度または予測モデルの適用から所与の期間内に個人が乳がんと診断される尤度、あるいはその両方のうちの１つまたは複数であってもよい。たとえば、本発明のいくつかの実施形態は、将来のある時点で識別される状態の確率を返すモデルを生成するものであり、１つまたは複数のプログラムがモデルを適用した２年後が挙げられるが、これに限定されない。

【0029】

図２は、図１と比較してより詳細なワークフロー２００であり、本発明のいくつかの実施形態の種々態様を示している。図１に示すように、本発明のいくつかの実施形態においては、１つまたは複数のプログラムが生の電子データを取得し（１１０）、このデータを利用して予測モデルを生成する（１２０）。図２は、このモデルの生成に関する別途詳細を提供する。

【0030】

図２を参照して、本発明の一実施形態において、１つまたは複数のプログラムは、１）過去にステージ１の乳がんと診断されるか、もしくは、乳がんの予備診断を受けた個人との関連または２）乳がんと明確に診断されていない（すなわち、従来の診断手段を利用して、乳がんであるか、もしくは、がんの初期ステージであることが示されていない）個人との関連、という２つのカテゴリの一方に属することに応じて各個人のレコードにラベルが付与されたデータ・セットを取得する（２１０）。後述の通り、データには、１２－ｍｅｒペプチドの識別を含み、ペプチド・ライブラリとして理解可能である。本発明の実施形態において、１つまたは複数のプログラムは、データを処理して、モデル生成の効率を向上させる。本発明のいくつかの実施形態において、１つまたは複数のプログラムは、アミノ酸配列部（たとえば、ｄｉｍ：１１００＋ｂｙ１２０ｋ＋）および特徴部（たとえば、ｄｉｍ：１１００＋ｂｙ５（サンプルＩＤ、ステータス、ソース、ＰｒｅＤｘ、およびウェハを含む））にデータを分離する。

【0031】

１つまたは複数のプログラムは、レコードをグループに対してランダムに割り当てることにより、レコードを所定数のグループに分離する（２２０）。本発明のいくつかの実施形態において、１つまたは複数のプログラムは、複数の乱数シードを生成し、シードごとに、レコードを所定数のグループに分離する。たとえば、乱数が２５の場合、１つまたは複数のプログラムは、各２５番目のレコードをレコードのうちの１つに割り当てることになる。１つまたは複数のプログラムは、さまざまなシードを連続的に生成し、これらのシードを利用して、レコードのグループに対するランダムな割り当てを行うことになる。グループは、各グループがその他の各グループと等しい（または、同じような）量のデータを含むように、１つまたは複数のプログラムにより生成される。本発明の一実施形態においては、ランダム化に基づいて、１つまたは複数のプログラムがレコードを６つのグループに分離する。

【0032】

本発明の実施形態において、１つまたは複数のプログラムがデータを６グループのデータ・セット（たとえば、３つのチャネルによる２Ｋ－ｍｅｒ）に割り当てた場合は、名称がファイル名に従うグループ数（たとえば、６）に等しい数のサブリストを伴って、アミノ配列部および特徴部の両部がリスト・オブジェクトとしてＲに格納され得る。サンプルＩＤ－ラベル対は、すべてのサブデータ・セットにより共有されて、テーブル構成していてもよい。サンプルＩＤおよびステータス（または、ラベル）は、アミノ酸配列データをインデックス化するキーとして組み合わされる。クラスまたはサンプルＩＤ等のフィルタリングのため、１つまたは複数のプログラムは、この小さなテーブルにおいてフィルタリングを実行した後、列インデックスを用いて、対応するアミノ酸配列データを抽出することができる。１つまたは複数のプログラムは、アミノ酸配列データをフィルタリングした場合（これにより、すべてのデータ・セットによるサンプルの共有を保つ場合）、テーブルと同じ順序になるように列の順序を変更する。本発明の実施形態において、不均衡なクラスを扱うため、１つまたは複数のプログラムは、ダウン・サンプリングおよびアップ・サンプリングを利用して、トレーニング用のクラスの均衡分散を生成する。

【0033】

１つまたは複数のプログラムは、不適合として生成したグループのうちの１つを選択し、（不適合未満の）グループと同数の相互検証の実行に利用されるその他のグループを指定する（各検証では、検証の反復ごとに、その他の各グループをテスト／検証セットとして使用する一方、（不適合およびテスト・セット未満の）その他のグループをトレーニング・セットとして利用する）（２３０）。本明細書において論じるＰＣＡ分析（たとえば、２５０）の一部として、１つまたは複数のプログラムは、（分離グループ未満の）グループ数と同じ数（すなわち、回数）だけ、この検証を実行する。このため、１つまたは複数のプログラムは、６つのグループを生成した場合、５回の相互検証を実行する。この検証の実行においては、相互検証に含まれるグループ（すなわち、最初に差し引かれたグループ未満のグループ総数）のうち、別の１つのグループがテスト・グループとして取り出される。１つまたは複数のプログラムは、その他のグループ（すなわち、最初に差し引かれたグループおよびテスト・グループ未満のすべてのグループ）をトレーニングに利用するが、テスト・グループは、検証の実行に利用される。１つまたは複数のプログラムは、これらのグループをそれぞれ検証セットとして利用すべく循環的に、（最初に差し引かれたグループ未満の）グループ数に等しい回数だけ、この動作を繰り返す。このため、相互検証の回数は、トレーニング・データ集合の数と同等である。

【0034】

６つのグループの例に戻る。１つまたは複数のプログラムは、６つのグループによって、第１のグループを取り出す。１つまたは複数のプログラムは、その他５つのグループを利用して、５回の相互検証を実行する。この検証の実行において、１つまたは複数のプログラムは、５つのグループのうちの１つをテスト・グループとして選択し、このグループで検証を実行する一方、その他のグループをトレーニング・データとして利用する。１つまたは複数のプログラムは、５つのグループのうち、テスト・グループとして指定されるグループを変更して、この検証ステップを繰り返す。１つまたは複数のプログラムは、５つのグループすべてがテスト・グループとして機能するまで循環的に、この動作を繰り返す。

【0035】

図２を再び参照して、本発明のいくつかの実施形態において、１つまたは複数のプログラムは、サンプル（または、電子レコードにより表される個人）ごとに、約１０万（１２０Ｋ）個のペプチド全体の値を合算した後、各発現値を合計で割って比を演算することにより、グリーン色素により識別されたライブラリ中の１２０Ｋ個のペプチドを正規化する（２４０）。値の正規化によって、１つまたは複数のプログラムは、個人および１２０Ｋペプチド・ライブラリの全体にわたって、発現値を比較することができる。本発明の一実施形態において、正規化のため、１つまたは複数のプログラムは、個人のサンプルごとに１２０Ｋ個のペプチド全体で発現値を加算した後、各発現値を合計で割る。

【0036】

図２に示す実施形態では、１２０Ｋという数字を一例として使用するが、当業者が理解する通り、さまざまなサンプルにおいて識別するとともに本発明の実施形態において利用するペプチドの数は、これより多くすることも可能であるし、少なくすることも可能である。

【0037】

本発明のいくつかの実施形態において、１つまたは複数のプログラムは、各トレーニング・セット（上記指定の通り、グループによりテスト・グループが除外された場合は、最初の不適合グループ未満）について、ＰＣＡを利用することにより、トレーニング・セット中の（電子レコードにより表される）多くの個人に共通する多くの特徴を決定する（２５０）。ＰＣＡ分析は、使用される乱数シードごとに、相互検証ステップ全体で安定した値を提供する。当業者が理解する通り、ＰＣＡは、場合により相関する変数の観測集合を主成分と称する線形無相関の変数の値集合に変換する直交変換を含む。主成分の数は、元の変数の数以下である。このため、本発明の一実施形態において、プログラム・コードは、テスト・データに基づき、（正規化により）識別された発現値を利用して、複数の共通特徴を生成する。この変換は、最初の主成分が考え得る最大の分散を有し（すなわち、可能な限り多くのデータ変動性を考慮し）、後続の各成分が先行成分に直交する制約下で考え得る最大の分散を有するように規定される。結果としてのベクトルは、無相関直交基底集合である。ＰＣＡは、元の変数の相対スケーリングの影響を受けやすい。

【0038】

図２を再び参照するに、本発明の一実施形態において、１つまたは複数のプログラムは、ＰＣＡを実行することにより、テスト・データにおいて表された個人と関連する特徴を決定する（２５０）。ＰＣＡにおいて、１つまたは複数のプログラムは、テスト・データにおいて最も代表的な特徴を決定する。ＰＣＡの部分的な結果として、１つまたは複数のプログラムにより生成された最終的なモデルには、個人に共通する特徴の累積的な理解を含んでいてもよい。１つまたは複数のプログラムは、このデータを利用して、分散が最も大きな特徴を推定するとともに、当該項の順序を決定するようにしてもよい。

【0039】

１つまたは複数のプログラムは、相互検証の中でＰＣＡ（たとえば、２５０）を動作させる。相互検証のすべてのステップについて、１つまたは複数のプログラムは、トレーニング・セットに対してＰＣＡを動作させ、このＰＣＡ結果による加重をモデルに送って予測を行う前に、加重を用いて検証を変換することにより、検証精度を演算する。本発明の一実施形態において、１つまたは複数のプログラムは、相互検証ステップのほか、最終的な評価ステップ（たとえば、後述の２６０）ごとに、各トレーニング・セットに対してＰＣＡを実行するとともに、サブデータ・セットごとに結果のリストをファイルに書き込む。１つまたは複数のプログラムは、このＰＣＡ結果ファイルの内容を相互検証およびモデリングに利用する場合に、当該ファイルをメモリに読み込む。

【0040】

個々のテスト・データ・グループのＰＣＡの完了後、１つまたは複数のプログラムは、グループ（たとえば、５回の例における不適合未満の全５つのグループ）を連結トレーニング・データ・セットとして組み合わせるとともに、ＰＣＡを実行する（２６０）。図３は、トレーニング・セットに対して１つまたは複数のプログラムにより取得されたＰＣＡ結果の一例であって、回数１～５は、個々のトレーニング・セットに関する結果であり、回数６は、相互検証全体に関する結果である。

【0041】

１つまたは複数のプログラムは、ロジスティック回帰（ＬＲ）モデルにおける最良適合のパラメータとして、ＰＣＡにより識別された（たとえば、優性に基づいて選択された）多くの特徴を利用して予測モデルを生成することにより、（予測）２値結果（たとえば、元のラベル付与データと同様に、ある程度の誤差またはコントロール・データ内のステージ１の乳がん）を取得する（２７０）。この態様の結果がＰＣＡ係数の生成である（たとえば、２７０）。図２に示すように、本発明のいくつかの実施形態において、１つまたは複数のプログラムは、（２値）クラス・ラベル（この場合は、ステージ１またはコントロール）の予測を目的として、ＰＣＡをデータ・セットに適用するとともに、結果としての主成分を利用して、ロジスティック回帰モデルを構築する。図２および図３に示すように、１つまたは複数のプログラムは、相互検証を利用して、モデルに含まれる最良の主成分数を調節する（たとえば、１０は最初の１０成分を意味し、１００は最初の１００成分を意味する）。１つまたは複数のプログラムは、回数に対して最高の検証を生じる最小数（最良数）を選択する。たとえば、合計６つのグループおよび５回の検証を利用する本発明の実施形態において、１つまたは複数のプログラムは、最高の５回検証精度を生じる最小数（最良数）を選択する。１つまたは複数のプログラムは、このパラメータを用いたモデルに基づいて、テストの精度を評価する。これら本発明の６グループの実施形態において、１つまたは複数のプログラムは、相互検証を実行して、１２－ｍｅｒ（グリーン）による複数の主成分を有するＬＲモデルが最大９５％の平均検証精度を生じ、テスト・セットに対する評価においても高い精度が持続するものと決定する。

【0042】

本発明のいくつかの実施形態において、１つまたは複数のプログラムは、単一のＰＣＡ導出特徴を利用して、モデルを生成する（たとえば、データ中の分散を説明する最も優勢な特徴を利用する）。たとえば、一部のモデルでは、平均検証精度が９５．０８％（０．００５％）、ＲＯＣ曲線下側の平均検証面積（ＡＵＣ）が９６．０２％（０．００６％）、テスト精度が９６．７２％、テストＡＵＣが９５．５５％となり得るため、１２－ｍｅｒデータに由来する最初の３つの主成分しか含まない可能性がある。本発明のいくつかの実施形態において、１つまたは複数のプログラムは、最高の検証精度および検証ＡＵＣを生じるパラメータを選択する。

【0043】

１つまたは複数のプログラムは、ＰＣＡ係数を利用して不適合データ（元から不適合であったグループ）に使用する特徴を計算することにより、予測モデル（最良適合モデル）をテストおよび調節する（２８０）。この調節は、上述の繰り返しＰＣＡ手順とともに、機械学習として理解され得る。１つまたは複数のプログラムは、情報が既知のデータ・セットを利用してさまざまなステップを繰り返すことにより、モデルが状態有無の決定に利用する認識特徴（パターン）の精度を調節して向上させ得る。

【0044】

１つまたは複数のプログラムは、所与の個人の１２－ｍｅｒペプチド・ライブラリを含む新たなデータのサンプルを取得する（２９０）。１つまたは複数のプログラムは、調節済み予測モデルを適用して、個人をスコアリングすることにより、潜在的なステージ１の乳がんの有無の結果を確率で予測する（２９５）。１つまたは複数のプログラムは、生成ＰＣＡ係数を用いてＰＣＡ演算を実行するとともにＬＲを実行することにより、調節済み予測モデルを適用して（２値）予測（たとえば、モデルに基づくステージ１の確率またはステージ１の取得不可能な確率）を生成する。このため、１つまたは複数のプログラムは、予測モデルの調節パラメータとして主成分を利用する。

【0045】

図４は、本発明のいくつかの実施形態の特定の態様を示したワークフロー４００である。具体的に、１つまたは複数のプログラムは、得られたデータを６つのグループに分割する一実施形態を示す。本発明のいくつかの実施形態において、１つまたは複数のプログラムは、個人の１２－ｍｅｒペプチド・ライブラリ発現を表し、１）基準がんの存在または可能性を示すステージ１または予測ステージ１および２）第１のカテゴリの指標がないことを示すコントロール、という１つまたは２つのカテゴリに分割されたデータを取得する（４１０）。１つまたは複数のプログラムは、ランダムな異なる乱数シードを使用して（個人を表す）レコードを異なるグループに割り当てることにより、データを６つの等サイズ・グループに分割する（４２０）。

【0046】

１つまたは複数のプログラムは、６つのグループのうちの１つを不適合として指定するとともに、その他のグループを相互検証に使用する（４３０）。上述の通り、すべてのグループが検証セットとして使用されるまで、１つまたは複数のプログラムが検証を循環的に５回繰り返すため、検証は５回の相互検証である。１つまたは複数のプログラムは、約１２０Ｋ個のペプチド全体の値を合算した後、各発現値を合計で割って比を演算することにより、ライブラリ中の１２０Ｋ個のペプチドの発現値を正規化する（４４０）。本発明の一実施形態において、正規化のため、１つまたは複数のプログラムは、個人のサンプルごとに１２０Ｋ個のペプチド全体で発現値を加算した後、各発現値を合計で割る。１つまたは複数のプログラムは、ＰＣＡを実行することにより、データの所与のトレーニング・セットにおいて表される多くの個人に共通する多くの特徴を決定して、（トレーニング・セットにおいて表される多くの個人以下の）多くの特徴を生成する（４５０）。データには４つのトレーニング・セットが存在し、各トレーニング・セットは、不適合グループではない５つのグループのうちの４つから成る。１つまたは複数のプログラムは、各トレーニング・セットに対してＰＣＡを実行する。

【0047】

１つまたは複数のプログラムは、５回分をトレーニング・データ組み合わせ集合として組み合わせるとともに、ＰＣＡを組み合わせ集合に適用して、多くの特徴を決定する（４６０）。１つまたは複数のプログラムは、相互検証においてＰＣＡを動作させる場合、全部で、（６つのサブデータ・セット）＊（テスト用の全体として５回分＋１ｃｖセット）＝３６回のＰＣＡを実行する。１つまたは複数のプログラムは、２値結果（ステージ１またはコントロール）を予測するロジスティック回帰（ＬＲ）モデルの最良適合のパラメータとして多くの特徴を通すことにより、最高の５回検証精度を生じる最小数の特徴を選択して、モデルに適合させる（４７０）。１つまたは複数のプログラムは、トレーニング・データから計算されたＰＣＡ係数を利用して不適合データに使用する特徴を演算することにより、結果としての最良適合モデルを不適合データに対してテスト／調節する（４８０）。

【0048】

モデルが生成されたら、当該モデルを使用して、個人の１２－ｍｅｒペプチド・ライブラリ発現の新たな任意サンプルをスコアリングすることにより、潜在的なステージ１の乳がんの有無の結果を確率で予測することができる。この新たなサンプルに対してスコアリングを演算するため、１つまたは複数のプログラムは、トレーニング・データによる係数を（再度）使用し、ＬＲモデルに適用して予測することにより、ＰＣＡ演算を実行する。

【0049】

本発明の実施形態は、ある状態と診断もしくは予備診断されるか、または、当該状態と診断されないものとして指定される患者のペプチド・ライブラリを含む生データ・セットを取得する１つまたは複数のプロセッサにより実行される１つまたは複数のプログラムを含むコンピュータ実装方法、コンピュータ・プログラム製品、およびコンピュータ・システムを含む。１つまたは複数のプログラムは、生データ・セットを所定数のグループに分割するが、この分割は、不適合データ・グループをその他のグループから取り出すことを含む。１つまたは複数のプログラムは、その他のグループに対して主成分分析を実行して、その他のグループにおける特徴の頻度に基づいて、１つまたは複数のプロセッサにより、その他のグループのデータにおける共通特徴を識別し、その他のグループにおける発生頻度に基づいて、係数により表される主成分を含む共通特徴を重み付けする。１つまたは複数のプログラムは、所定レベルの検証精度を生じる最小数の主成分を決定する。１つまたは複数のプログラムは、ロジスティック回帰モデルにおける最良適合のパラメータとして最小数の主成分を利用することによって予測モデルを生成するが、この予測モデルは、所定の閾値内に状態が存在する尤度および所定の閾値内に状態が存在しない尤度から成る群から選択される２値結果を提供する。

【0050】

また、本発明のいくつかの実施形態において、１つまたは複数のプログラムは、係数を適用して不適合グループに使用する特徴を計算することによって予測モデルをテストするとともに、不適合グループの特徴を主成分と比較することによって予測モデルを調節する。ペプチド・ライブラリは、１２－ｍｅｒペプチド・ライブラリを含んでいてもよい。上記状態は、ステージ１の乳がんを含んでいてもよい。

【0051】

本発明のいくつかの実施形態において、１つまたは複数のプログラムは、分割する場合、グループに割り当てる生データ・セットのレコードを選択する乱数を生成する。

【0052】

本発明のいくつかの実施形態において、１つまたは複数のプログラムは、主成分分析の実行に先立って、すべてのペプチドにわたりペプチドのペプチド値を合算するとともに各発現値を結果の合計値で割って比を演算することにより、生データ・セットを含むペプチドを正規化する。

【0053】

本発明のいくつかの実施形態において、１つまたは複数のプログラムは、その他のグループに対して主成分分析を実行する場合、トレーニング・データ集合を生成するが、このトレーニング・データ集合の各トレーニング・データ集合は、その他のグループのうちの１つを除くすべてのグループのデータを含む。１つまたは複数のプログラムは、各トレーニング・データ集合に対して個別に主成分分析を実行することによって、各トレーニング・データ集合の共通特徴を識別する。１つまたは複数のプログラムは、その他のグループを単一のトレーニング・セットとして利用することにより主成分分析を実行することによって、単一のトレーニング・セットの共通特徴を識別する。また、１つまたは複数のプログラムは、各トレーニング・データ集合の共通特徴および単一のトレーニング・セットの共通特徴について、その他のグループの数に等しい回数の相互検証を実行することによって、主成分を識別するとともに係数を決定する。

【0054】

本発明のいくつかの実施形態において、所定レベルの検証精度は、回数に基づく最高の検証精度である。

【0055】

本発明のいくつかの実施形態において、１つまたは複数のプログラムは、所与の個人の１２－ｍｅｒペプチド・ライブラリを含む新たな生データを取得する。１つまたは複数のプログラムは、予測モデルを新たな生データに適用して、所与の個人の２値結果を決定する。本発明のいくつかの実施形態において、１つまたは複数のプログラムは、予測モデルを適用する場合、係数を利用して新たな生データに対する主成分分析を実行するとともに、ロジスティック回帰を実行して２値結果を生成する。

【0056】

ここで図５を参照して、この図は、コンピューティング・ノードの一例を模式的に示しており、クラウド・コンピューティング・ノード１０が可能である。クラウド・コンピューティング・ノード１０は、好適なクラウド・コンピューティング・ノードの一例に過ぎず、本明細書に記載の本発明の実施形態の使用または機能の範囲に関する制限の示唆を何ら意図したものではない。いずれにしろ、クラウド・コンピューティング・ノード１０は、実装または上述の機能のいずれかの実行、あるいはその両方が可能である。本発明の一実施形態において、ＰＣＡを実行する処理デバイスを含むコンピューティング・リソースは、たとえば１つまたは複数のクラウド・コンピューティング・ノード１０の一部として理解可能であり（図５）、クラウド・コンピューティング・ノード１０の一部の例でない場合は、クラウド・コンピューティング・ノード１０の態様を含む１つまたは複数の一般的なコンピューティング・ノードの一部として理解可能である。

【0057】

クラウド・コンピューティング・ノード１０には、他の多くの汎用または専用コンピューティング・システム環境または構成と作用するコンピュータ・システム／サーバ１２が存在する。コンピュータ・システム／サーバ１２との併用に適し得る周知のコンピューティング・システム、環境、または構成、あるいはその組み合わせの例としては、パーソナル・コンピュータ・システム、サーバ・コンピュータ・システム、シン・クライアント、シック・クライアント、手持ち式もしくはラップトップ・デバイス、マルチプロセッサ・システム、マイクロプロセッサベースのシステム、セット・トップ・ボックス、プログラム可能な家電製品、ネットワークＰＣ、ミニコンピュータ・システム、メインフレーム・コンピュータ・システム、ならびに上記システムもしくはデバイスのいずれかを含む分散クラウド・コンピューティング環境が挙げられるが、これらに限定されない。

【0058】

コンピュータ・システム／サーバ１２は、プログラム・モジュール等、コンピュータ・システムにより実行されるコンピュータ・システム実行可能命令の一般的背景にて記述されていてもよい。一般的に、プログラム・モジュールとしては、特定のタスクの実行または特定の抽象データ型の実装を行うルーチン、プログラム、オブジェクト、コンポーネント、ロジック、データ構造等が挙げられる。コンピュータ・システム／サーバ１２は、通信ネットワークを通じてつながったリモート処理デバイスによりタスクが実行される分散クラウド・コンピューティング環境において実現されるようになっていてもよい。分散クラウド・コンピューティング環境においては、メモリ記憶デバイスを含むローカルおよびリモートの両コンピュータ・システム記憶媒体にプログラム・モジュールが配置されていてもよい。

【0059】

図５に示すように、クラウド・コンピューティング・ノード１０として利用可能なコンピュータ・システム／サーバ１２は、汎用コンピューティング・デバイスの形態で示している。コンピュータ・システム／サーバ１２の構成要素としては、１つまたは複数のプロセッサまたは処理ユニット１６、システム・メモリ２８、およびシステム・メモリ２８を含むさまざまなシステム構成要素をプロセッサ１６に結合するバス１８が挙げられるが、これらに限定されない。

【0060】

バス１８は、任意の複数種類のバス構造のうちの１つまたは複数を表し、多様なバス・アーキテクチャのいずれかを用いたメモリ・バスもしくはメモリ・コントローラ、周辺機器用バス、アクセラレイテッド・グラフィックス・ポート、ならびにプロセッサもしくはローカル・バスが挙げられる。非限定的な一例として、このようなアーキテクチャとしては、業界標準アーキテクチャ（ＩＳＡ）バス、マイクロ・チャネル・アーキテクチャ（ＭＣＡ）バス、拡張ＩＳＡ（ＥＩＳＡ）バス、ビデオ・エレクトロニクス規格協会（ＶＥＳＡ）ローカル・バス、および周辺機器相互接続（ＰＣＩ）バスが挙げられる。

【0061】

コンピュータ・システム／サーバ１２は通常、多様なコンピュータ・システム可読媒体を含む。このような媒体は、コンピュータ・システム／サーバ１２によりアクセス可能な任意の利用可能な媒体であってもよく、揮発性および不揮発性媒体、リムーバブルおよび非リムーバブル媒体の両者を含む。

【0062】

システム・メモリ２８は、ランダム・アクセス・メモリ（ＲＡＭ）３０またはキャッシュ・メモリ３２、あるいはその両方等、揮発性メモリの形態のコンピュータ・システム可読媒体を含み得る。コンピュータ・システム／サーバ１２は、他のリムーバブル／非リムーバブル、揮発性／不揮発性コンピュータ・システム可読媒体をさらに含んでいてもよい。非リムーバブル不揮発性磁気媒体（図示しないが、通常は「ハード・ドライブ」と称する）に対する読み書き用として、ストレージ・システム３４を設けることも可能であるが、一例に過ぎない。図示はしていないものの、リムーバブル不揮発性磁気ディスク（たとえば、「フロッピー・ディスク」）に対する読み書き用の磁気ディスク・ドライブならびにＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、もしくは他の光学媒体等のリムーバブル不揮発性光ディスクに対する読み書き用の光ディスク・ドライブを設けることも可能である。このような場合は、１つまたは複数のデータ媒体インターフェースによって、それぞれをバス１８に接続可能である。以下に別途図示および説明する通り、メモリ２８は、本発明の実施形態の機能を実行するように構成された一組（たとえば、少なくとも一組）のプログラム・モジュールを有する少なくとも１つのプログラム製品を含んでいてもよい。

【0063】

非限定的な一例として、一組（少なくとも一組）のプログラム・モジュール４２を有するプログラム／ユーティリティ４０のほか、オペレーティング・システム、１つまたは複数のアプリケーション・プログラム、他のプログラム・モジュール、およびプログラム・データがメモリ２８に格納されていてもよい。オペレーティング・システム、１つもしく複数のアプリケーション・プログラム、他のプログラム・モジュール、およびプログラム・データ、またはこれらの何らかの組み合わせはそれぞれ、ネットワーキング環境の一実施態様を含んでいてもよい。プログラム・モジュール４２は一般的に、本明細書に記載の本発明の実施形態の機能または方法、あるいはその両方を実行する。

【0064】

また、コンピュータ・システム／サーバ１２は、キーボード、ポインティング・デバイス、ディスプレイ２４等の１つもしくは複数の外部デバイス１４、ユーザによる当該コンピュータ・システム／サーバ１２との相互作用を可能にする１つもしくは複数のデバイス、または当該コンピュータ・システム／サーバ１２による１つもしくは複数の他のコンピューティング・デバイスとの通信を可能にする任意のデバイス（たとえば、ネットワーク・カード、モデム等）、あるいはその組み合わせと通信するようになっていてもよい。このような通信は、入出力（Ｉ／Ｏ）インターフェース２２を介して発生し得る。さらに、コンピュータ・システム／サーバ１２は、ネットワーク・アダプタ２０を介して、ローカル・エリア・ネットワーク（ＬＡＮ）、一般的なワイド・エリア・ネットワーク（ＷＡＮ）、またはパブリック・ネットワーク（たとえば、インターネット）、あるいはその組み合わせ等の１つまたは複数のネットワークと通信可能である。図示のように、ネットワーク・アダプタ２０は、バス１８を介して、コンピュータ・システム／サーバ１２の他の構成要素と通信する。図示はしていないものの、コンピュータ・システム／サーバ１２と併せて、他のハードウェアまたはソフトウェア構成要素、あるいはその両方を使用することも可能であることが了解されるものとする。その例としては、マイクロコード、デバイス・ドライバ、冗長処理ユニット、外部ディスク・ドライブ・アレイ、ＲＡＩＤシステム、テープ・ドライブ、およびデータ記録ストレージ・システム等が挙げられるが、これらに限定されない。

【0065】

本開示はクラウド・コンピューティングに関する詳細な説明を含むものの、本明細書に列挙の教示内容の実装は、クラウド・コンピューティング環境に限定されないことが了解されるものとする。むしろ、本発明の実施形態は、その他任意の種類の既知のコンピューティング環境または今後開発されるコンピューティング環境と併せて実現可能である。

【0066】

クラウド・コンピューティングは、最小限の管理労力またはサービス提供者との相互作用で迅速に設定および公開し得る設定可能なコンピューティング・リソース（たとえば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、およびサービス）の共用プールへの簡便なオンデマンド・ネットワーク・アクセスを可能にするサービス提供のモデルである。このクラウド・モデルには、少なくとも５つの特性、少なくとも３つのサービス・モデル、および少なくとも４つの配置モデルを含み得る。

【0067】

特性は、以下の通りである。

【0068】

オンデマンド・セルフサービス：クラウド利用者は、サービス提供者との人間の相互作用の必要なく、必要に応じて自動的に、サーバ時間およびネットワーク・ストレージ等のコンピューティング機能を一方的に設定可能である。

【0069】

広範なネットワーク・アクセス：各機能は、ネットワーク上で利用可能であり、シン／シックを問わず異種クライアント・プラットフォーム（たとえば、携帯電話、ラップトップ、およびＰＤＡ）による使用を促進する標準的な機構を通じてアクセスされる。リソース・プーリング：マルチテナント・モデルを用いることにより、複数の利用者に対してサービスするために、提供者のコンピューティング・リソースがプールされる。その際、要求に応じて、さまざまな物理的リソースおよび仮想的リソースが動的に割り当ておよび再割り当てされる。利用者は一般的に、提供されるリソースの正確な場所を制御も把握もできないが、より高い抽象化レベル（たとえば、国、州、またはデータセンタ）では場所を特定し得る点において、ある意味で場所の独立性が存在する。迅速な柔軟性：各機能は、場合によっては自動的に、高速スケール・アウトするように迅速かつ柔軟に設定され、高速スケール・インするように迅速に公開され得る。利用者にとって、設定に利用可能な機能は、見かけ上は制限なく、いつでも如何なる量でも購入可能である。

【0070】

サービス測定：クラウド・システムは、サービスの種類（たとえば、ストレージ、処理、帯域幅、およびアクティブ・ユーザ・アカウント）に適した何らかの抽象化レベルでの測定機能を利用することによって、リソースの使用を自動的に制御および最適化する。リソースの使用量は、モニタリング、制御、および報告によって、利用サービスの提供者および利用者の両者に透明性をもたらし得る。

【0071】

サービス・モデルは、以下の通りである。

【0072】

サービスとしてのソフトウェア（ＳａａＳ）：利用者に提供される機能は、クラウド・インフラ上で動作する提供者のアプリケーションを使用する。これらのアプリケーションは、ウェブ・ブラウザ等のシン・クライアント・インターフェースを通じて、さまざまなクライアント・デバイスからアクセス可能である（たとえば、ウェブベースの電子メール）。利用者は、ネットワーク、サーバ、オペレーティング・システム、ストレージ、あるいは個々のアプリケーション機能等、下層のクラウド・インフラを管理も制御もしない。ただし、ユーザ固有の限定されたアプリケーション構成の設定については、この限りではない。

【0073】

サービスとしてのプラットフォーム（ＰａａＳ）：利用者に提供される機能は、提供者がサポートするプログラミング言語およびツールを用いて作成された利用者作成または取得アプリケーションをクラウド・インフラ上に配置する。利用者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージ等、下層のクラウド・インフラを管理も制御もしない。ただし、配置されたアプリケーションと、場合によっては、アプリケーション・ホスティング環境の構成とを制御する。

【0074】

サービスとしてのインフラ（ＩａａＳ）：利用者に提供される機能は、処理、ストレージ、ネットワーク、および他の基本的なコンピューティング・リソースを設定するが、利用者は、オペレーティング・システムおよびアプリケーション等、任意のソフトウェアを配置および実行可能である。利用者は、下層のクラウド・インフラを管理も制御もしない。ただし、オペレーティング・システム、ストレージ、配置されたアプリケーションを制御するとともに、場合によっては、選択されたネットワーク・コンポーネント（たとえば、ホストのファイアウォール）を限定的に制御する。

【0075】

配置モデルは、以下の通りである。

【0076】

プライベート・クラウド：このクラウド・インフラは、ある組織のために単独で運用される。また、当該組織またはサード・パーティにより管理され、オンプレミスまたはオフプレミスとして存在し得る。

【0077】

コミュニティ・クラウド：このクラウド・インフラは、複数の組織により共有され、懸案事項（たとえば、ミッション、セキュリティ要件、ポリシー、およびコンプライアンス事項）を共有する特定のコミュニティをサポートする。また、当該組織またはサード・パーティにより管理され、オンプレミスまたはオフプレミスとして存在し得る。

【0078】

パブリック・クラウド：このクラウド・インフラは、一般の人々または大規模な業界団体が利用可能で、クラウド・サービスを販売する組織により所有される。

【0079】

ハイブリッド・クラウド：このクラウド・インフラは、２つ以上のクラウド（プライベート、コミュニティ、またはパブリック）の組み合わせであり、それぞれに固有のエンティティは維持する一方、データおよびアプリケーションの移植性（たとえば、クラウド間の負荷分散のためのクラウド・バースティング）を実現する標準または個別の技術により結合される。

【0080】

クラウド・コンピューティング環境は、無国籍、低結合、モジュール方式、およびセマンティック相互運用性に焦点を当てたサービス指向型である。クラウド・コンピューティングの中心には、相互接続ノードのネットワークを含むインフラがある。

【0081】

ここで図６を参照して、この図は、例示的なクラウド・コンピューティング環境５０を示している。図示のように、クラウド・コンピューティング環境５０は、たとえば個人用デジタル補助装置（ＰＤＡ）もしくは携帯電話５４Ａ、デスクトップ・コンピュータ５４Ｂ、ラップトップ・コンピュータ５４Ｃ、または自動車コンピュータ・システム５４Ｎ、あるいはその組み合わせ等、クラウド利用者が使用するローカルのコンピューティング・デバイスの通信を可能にする１つまたは複数のクラウド・コンピューティング・ノード１０を具備する。ノード１０は、互いに通信するようにしてもよい。これらは、上述のプライベート、コミュニティ、パブリック、もしくはハイブリッド・クラウド、またはその組み合わせ等、１つまたは複数のネットワークにおいて物理的または仮想的にグループ化されていてもよい（図示せず）。これにより、クラウド・コンピューティング環境５０は、クラウド利用者がローカルのコンピューティング・デバイス上でリソースを維持する必要のないサービスとしてのインフラ、プラットフォーム、またはソフトウェア、あるいはその組み合わせを提供することができる。図６に示すコンピューティング・デバイス５４Ａ～５４Ｎの種類は、例示を意図したものに過ぎず、コンピューティング・ノード１０およびクラウド・コンピューティング環境５０は、（たとえば、ウェブ・ブラウザを用いることにより）任意の種類のネットワークまたはネットワーク・アドレス指定可能な接続、あるいはその両方において、任意の種類のコンピュータ・デバイスと通信可能であることが了解される。

【0082】

ここで図７を参照して、この図は、クラウド・コンピューティング環境５０（図６）が提供する一組の機能的抽象化レイヤを示している。図７に示すコンポーネント、レイヤ、および機能は、例示を意図したものに過ぎず、本発明の実施形態はこれらに限定されないことが予め了解されるものとする。図示のように、以下のレイヤおよび対応する機能が提供される。

【0083】

ハードウェアおよびソフトウェア・レイヤ６０は、ハードウェアおよびソフトウェア・コンポーネントを含む。ハードウェア・コンポーネントの例としては、メインフレーム６１、ＲＩＳＣ（縮小命令セット・コンピュータ）アーキテクチャ・ベースのサーバ６２、サーバ６３、ブレード・サーバ６４、記憶デバイス６５、およびネットワーク／ネットワーキング・コンポーネント６６が挙げられる。いくつかの実施形態において、ソフトウェア・コンポーネントとしては、ネットワーク・アプリケーション・サーバ・ソフトウェア６７およびデータベース・ソフトウェア６８が挙げられる。

【0084】

仮想化レイヤ７０は、抽象化レイヤを提供し、考え得る仮想エンティティの例としては、仮想サーバ７１、仮想ストレージ７２、仮想ネットワーク７３（仮想プライベート・ネットワークを含む）、仮想アプリケーション／オペレーティング・システム７４、および仮想クライアント７５が挙げられる。

【0085】

一例において、管理レイヤ８０は、後述の機能を提供するようにしてもよい。リソース設定８１は、クラウド・コンピューティング環境におけるタスクの実行に利用されるコンピューティング・リソース等のリソースの動的な調達を提供する。測定・価格設定８２は、クラウド・コンピューティング環境においてリソースが利用される場合のコスト追跡ならびにこれらリソースの消費に対する請求もしくはインボイスを提供する。一例において、これらのリソースには、アプリケーション・ソフトウェア・ライセンスを含み得る。セキュリティは、クラウド利用者およびタスクの識別情報確認のほか、データおよび他のリソースの保護を提供する。ユーザ・ポータル８３は、利用者およびシステム管理者に対してクラウド・コンピューティング環境へのアクセスを提供する。サービス・レベル管理８４は、所要サービス・レベルを満足するように、クラウド・コンピューティング・リソースの割り当ておよび管理を提供する。サービス・レベル合意（ＳＬＡ）計画・実行８５は、ＳＬＡに従って将来的な要件が見込まれるクラウド・コンピューティング・リソースの事前の取り決めおよび調達を提供する。

【0086】

ワークロード・レイヤ９０は、クラウド・コンピューティング環境を利用可能な機能の例を提供する。このレイヤから提供可能なワークロードおよび機能の例としては、マッピングおよびナビゲーション９１、ソフトウェア開発・ライフサイクル管理９２、仮想教室／教育提供９３、データ解析処理９４、トランザクション処理９５、および予測モデル生成９６が挙げられる。

【0087】

本発明は、考え得る任意の技術的詳細統合レベルにおけるシステム、方法、またはコンピュータ・プログラム製品、あるいはその組み合わせであってもよい。コンピュータ・プログラム製品は、本発明の態様をプロセッサに実行させるコンピュータ可読プログラム命令が格納された（１つまたは複数の）コンピュータ可読記憶媒体を具備していてもよい。

【0088】

コンピュータ可読記憶媒体としては、命令実行デバイスが使用する命令を保持および格納し得る有形デバイスが可能である。コンピュータ可読記憶媒体は、たとえば電子記憶デバイス、磁気記憶デバイス、光学記憶デバイス、電磁記憶デバイス、半導体記憶デバイス、またはこれらの任意好適な組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的な一覧には、携帯型コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ）、リードオンリー・メモリ（ＲＯＭ）、消去・プログラム可能リードオンリー・メモリ（ＥＰＲＯＭもしくはフラッシュ・メモリ）、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ）、携帯型コンパクト・ディスク・リードオンリー・メモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリ・スティック、フロッピー・ディスク、パンチカードもしくは命令が記録された溝中の隆起構造等の機械的符号化デバイス、ならびにこれらの任意好適な組み合わせを含む。本明細書において、コンピュータ可読記憶媒体は、電波等の自由伝搬電磁波、導波路等の送信媒体を伝搬する電磁波（たとえば、光ファイバ・ケーブルを通過する光パルス）、またはワイヤを通じて送信される電気信号等、本質的に一過性の信号としては解釈されないものとする。

【0089】

本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から各コンピューティング／処理デバイスにダウンロードすることも可能であるし、ネットワーク、たとえばインターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、または無線ネットワーク、あるいはその組み合わせを介して外部コンピュータまたは外部記憶デバイスにダウンロードすることも可能である。ネットワークは、送信銅ケーブル、送信光ファイバ、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組み合わせを含んでいてもよい。各コンピューティング／処理デバイスのネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、当該コンピュータ可読プログラム命令を転送して、各コンピューティング／処理デバイス内のコンピュータ可読記憶媒体に格納する。

【0090】

本発明の動作を実行するコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ（ＩＳＡ）命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路の設定データ、あるいはＳｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋等のオブジェクト指向プログラミング言語ならびにＣプログラミング言語もしくは類似のプログラミング言語等の手続き型プログラミング言語を含む１つまたは複数のプログラミング言語の任意の組み合わせで記述されたソース・コードまたはオブジェクト・コードであってもよい。コンピュータ可読プログラム命令は、独立型ソフトウェア・パッケージとして全部または一部をユーザのコンピュータ上で実行してもよいし、一部をユーザのコンピュータ上、一部をリモート・コンピュータ上で実行してもよいし、全部をリモート・コンピュータまたはサーバ上で実行してもよい。後者のシナリオでは、ローカル・エリア・ネットワーク（ＬＡＮ）またはワイド・エリア・ネットワーク（ＷＡＮ）等、任意の種類のネットワークを通じてリモート・コンピュータがユーザのコンピュータに接続されていてもよいし、（たとえば、インターネット・サービス・プロバイダを用いることによりインターネットを通じて）外部コンピュータに接続されていてもよい。いくつかの実施形態においては、本発明の態様を実行するため、コンピュータ可読プログラム命令の状態情報を利用して電子回路をカスタマイズすることにより、たとえばプログラマブル論理回路、フィールドプログラマブル・ゲート・アレイ（ＦＰＧＡ）、またはプログラマブル・ロジック・アレイ（ＰＬＡ）を含む電子回路がコンピュータ可読プログラム命令を実行するようにしてもよい。

【0091】

本明細書においては、本発明の実施形態に係る方法、装置（システム）、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して、本発明の態様を説明している。フローチャート図またはブロック図あるいはその両方の各ブロックならびにフローチャート図またはブロック図あるいはその両方のブロックの組み合わせは、コンピュータ可読プログラム命令により実装可能であることが了解される。

【0092】

これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラム可能データ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックに規定の機能／動作を実装する手段を生成するように、汎用コンピュータ、専用コンピュータ、または他のプログラム可能データ処理装置のプロセッサに提供されてマシンを作り出すものであってよい。また、これらのコンピュータ可読プログラム命令は、命令が格納されたコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックに規定の機能／動作の態様を実装する命令を含む製造品を含むように、コンピュータ可読記憶媒体に格納され、コンピュータ、プログラム可能データ処理装置、または他のデバイス、あるいはその組み合わせに対して特定の様態で機能するように指示し得るものであってもよい。

【0093】

また、コンピュータ可読プログラム命令は、コンピュータ、他のプログラム可能装置、または他のデバイス上での実行される命令が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックに規定の機能／動作を実装するように、コンピュータ実装プロセスを作り出すべく、コンピュータ、他のプログラム可能データ処理装置、または他のデバイスにロードされ、コンピュータ、他のプログラム可能装置、または他のデバイス上で一連の動作ステップを実行させるものであってもよい。

【0094】

図中のフローチャートおよびブロック図は、本発明の種々実施形態に係るシステム、方法、およびコンピュータ・プログラム製品の考え得る実施態様のアーキテクチャ、機能、および動作を示している。この点、フローチャートまたはブロック図の各ブロックは、特定の論理機能を実装する１つまたは複数の実行可能命令を含む命令のモジュール、セグメント、または一部を表し得る。いくつかの代替実施態様において、ブロックに記載の機能は、図面に記載の順序から外れて発生するようになっていてもよい。たとえば、連続して示す２つのブロックが実際のところは、関与する機能に応じて、実質的に同時に実行されるようになっていてもよいし、場合により逆の順序で実行されるようになっていてもよい。また、ブロック図またはフローチャート図あるいはその両方の各ブロックならびにブロック図またはフローチャート図あるいはその両方のブロックの組み合わせは、特定の機能または動作を実行する専用ハードウェアベースのシステムにより実装することも可能であるし、専用ハードウェアおよびコンピュータ命令の組み合わせを実行することも可能であることに留意されたい。

【0095】

本明細書において使用する専門用語は、特定の実施形態を説明することを目的としているに過ぎず、何ら限定する意図はない。本明細書において、単数形「ある（ａ）」、「一（ａｎ）」、および「その（ｔｈｅ）」は、文脈上の別段の明確な指定のない限り、複数形も同様に含むことが意図される。本明細書において使用する場合の用語「備える（ｃｏｍｐｒｉｓｅｓ）」または「備えている（ｃｏｍｐｒｉｓｉｎｇ）」、あるいはその両方は、記載の特徴、整数、ステップ、動作、要素、またはコンポーネント、あるいはその組み合わせの存在を指定するものの、１つまたは複数の他の特徴、整数、ステップ、動作、要素、コンポーネント、またはその群、あるいはその組み合わせの存在または追加を除外するものではないことがさらに了解される。

【0096】

以下の特許請求の範囲において、すべてのミーンズ・プラス・ファンクション要素またはステップ・プラス・ファンクション要素の対応する構造、材料、動作、および同等物が存在する場合は、具体的に請求される他の特許請求の範囲に係る要素との組み合わせで機能を実行する任意の構造、材料、または動作を含むことが意図される。１つまたは複数の実施形態の記載は、例示および説明を目的として提示したものであるが、網羅性または開示の形態への限定を意図したものではない。当業者には、多くの改良および変形が明らかとなるであろう。上記実施形態は、種々態様および実際の用途を最もよく説明するとともに、当業他者が企図される特定の使用に適した種々改良を伴う種々実施形態を理解できるように選定および記載したものである。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

知財求人

青山学院大学 (神奈川県相模原市中央区淵野辺)

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版