特許第6388901号(P6388901)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ナントミクス,エルエルシーの特許一覧

<>
  • 特許6388901-診断テストを特定するための経路分析 図000002
  • 特許6388901-診断テストを特定するための経路分析 図000003
  • 特許6388901-診断テストを特定するための経路分析 図000004
  • 特許6388901-診断テストを特定するための経路分析 図000005
  • 特許6388901-診断テストを特定するための経路分析 図000006
  • 特許6388901-診断テストを特定するための経路分析 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6388901
(24)【登録日】2018年8月24日
(45)【発行日】2018年9月12日
(54)【発明の名称】診断テストを特定するための経路分析
(51)【国際特許分類】
   G06F 19/24 20110101AFI20180903BHJP
   C12Q 1/04 20060101ALI20180903BHJP
   C12Q 1/68 20180101ALI20180903BHJP
   G01N 33/50 20060101ALI20180903BHJP
   G01N 33/68 20060101ALI20180903BHJP
【FI】
   G06F19/24
   C12Q1/04
   C12Q1/68
   G01N33/50 P
   G01N33/68
【請求項の数】19
【全頁数】18
(21)【出願番号】特願2016-232168(P2016-232168)
(22)【出願日】2016年11月30日
(62)【分割の表示】特願2015-563138(P2015-563138)の分割
【原出願日】2014年6月30日
(65)【公開番号】特開2017-97884(P2017-97884A)
(43)【公開日】2017年6月1日
【審査請求日】2017年3月15日
(31)【優先権主張番号】61/840,669
(32)【優先日】2013年6月28日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】516001591
【氏名又は名称】ナントミクス,エルエルシー
(74)【代理人】
【識別番号】100114775
【弁理士】
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【弁理士】
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【弁理士】
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100191086
【弁理士】
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】ベンズ,ステファン,チャールズ
(72)【発明者】
【氏名】ラビザデフ,シャフルーズ
(72)【発明者】
【氏名】スートゥー,クリストファー
(72)【発明者】
【氏名】ウェインガーテン,ポール
(72)【発明者】
【氏名】タオ,チュンリン
【審査官】 山内 裕史
(56)【参考文献】
【文献】 特表2005−500832(JP,A)
【文献】 特表2004−521407(JP,A)
【文献】 特表2004−524604(JP,A)
【文献】 米国特許出願公開第2007/0172844(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 19/10−19/28
C12Q 1/04
C12Q 1/68
G01N 33/50
G01N 33/68
(57)【特許請求の範囲】
【請求項1】
特異的な疾患細胞株のオミクス・データに基づいて薬剤を使用して、1人の患者において病気を治療するためのマーカを判定する方法であって、
それぞれ複数の特異的な疾患細胞株のオミクス・データから導き出された複数の特異的なデータセットを格納し、それぞれのデータセットには複数の経路要素データが含まれる経路モデル・データベースを機械学習システムに情報的に連結することであって、前記複数の特異的な疾患細胞株が前記1人の患者からの細胞を含むことと、
前記機械学習システムにより、前記複数の特定的な疾患細胞株に関連付けられ、前記薬剤に反応する前記複数の特異的な疾患細胞株のうちのそれぞれの1つの感度レベルを示す感度データを受け取ることと、
前記機械学習システムにより、前記経路モデル・データベースにおいて前記複数の特異的な疾患細胞株に対応する前記複数の経路要素データを横断することにより、前記複数の特異的な疾患細胞株に関する前記感度データとの相関関係を有する発現を推測することと、
前記機械学習システムにより、前記相関関係に基づいて前記病気を治療する前記薬剤を推奨するために前記1人の患者の細胞により示される発現レベル閾値を判定することと、
を含む方法。
【請求項2】
前記発現は前記複数の特異的な疾患細胞株内に存在する可能な発現から推測される、請求項1に記載の方法。
【請求項3】
前記発現を推測することは、前記複数の疾患細胞株内に存在する前記可能な発現のうちのそれぞれの1つに対して、
前記複数の経路要素データにしたがって前記複数の特異的な疾患細胞株内に存在する前記1つの発現の等級を示すデータ点を生成することと、
前記機械学習システムにより、前記1つの発現の前記等級と、前記複数の特異的な疾患細胞株に関する前記感度データと、の間の相関関係を導き出すことと、
を含む、請求項2に記載の方法。
【請求項4】
前記可能な発現に対応する前記導き出された相関関係から最適な相関関係を有する前記発現を推測するために機械学習を使用することをさらに含む、請求項3に記載の方法。
【請求項5】
前記薬剤を用いて前記複数の特異的な疾患細胞株のサンプル疾患細胞を技師または機械によりテストすることにより前記感度データを生成することをさらに含む、請求項1に記載の方法。
【請求項6】
前記1人の患者からの細胞が健康な細胞である、請求項1に記載の方法。
【請求項7】
前記1人の患者からの細胞が新生物細胞である、請求項1に記載の方法。
【請求項8】
前記1人の患者からの細胞が異なる組織からのものである、請求項1に記載の方法。
【請求項9】
前記患者の推奨療法を含む出力データを前記機械学習システムにより生成することをさらに含む、請求項1に記載の方法。
【請求項10】
サンプル疾患細胞を前記患者から採取することと、
前記サンプル疾患細胞内に存在する前記発現の等級を測定し、前記推奨療法が前記発現の前記測定された等級に基づいて前記機械学習システムにより生成されることと、
をさらに含む、請求項9に記載の方法。
【請求項11】
前記複数の特異的な疾患細胞株は前記薬剤に対する感度に関して互いに異なる、請求項1に記載の方法。
【請求項12】
前記複数の特異的な疾患細胞株のうちの第1セットは前記薬剤を用いる治療に対して感度を有し、前記複数の特異的な疾患細胞株のうちの第2セットは前記薬剤を用いる治療に対して抵抗性を有する、請求項1に記載の方法。
【請求項13】
前記オミクス・データは遺伝子コピー数データ、遺伝子突然変異データ、遺伝子メチル化データ、遺伝子発現データ、RNAスプライス情報データ、siRNAデータ、RNA翻訳データ、およびタンパク質活性データからなる群から選択された、請求項1に記載の方法。
【請求項14】
前記特異的なデータセットはPARADIGMデータセットである、請求項1に記載の方法。
【請求項15】
前記経路要素データは遺伝子の発現状態、タンパク質のタンパク質レベル、および/またはタンパク質のタンパク質活性である、請求項1に記載の方法。
【請求項16】
特異的な疾患細胞株のオミクス・データに基づいて薬剤を使用して、1人の患者において病気を治療するためのマーカを判定するためのシステムであって、
それぞれ複数の特異的な疾患細胞株のオミクス・データから導き出され、それぞれのデータセットが複数の経路要素データを含む複数の特異的なデータセットを格納する経路モデル・データベースであって、前記複数の特異的な疾患細胞株が前記1人の患者からの細胞を含む経路モデル・データベースと、
前記経路情報モデル・データベースに情報的に連結され、且つ、 前記複数の特異的な疾患細胞株に関連付けられ、前記薬剤に反応する前記複数の特異的な疾患細胞株のうちのそれぞれの1つの感度レベルを示す感度データを受け取ること、
前記経路モデル・データベースにおいて前記複数の特異的な疾患細胞株に対応する前記複数の経路要素データを横断することにより、前記複数の特異的な疾患細胞株に関する前記感度データとの相関関係を有する発現を推測すること、および
前記相関関係に基づいて前記病気を治療する前記薬剤を推奨するために前記1人の患者の細胞により示される発現レベル閾値を判定すること、
を行うようプログラムされた、機械学習システムと、
を含むシステム。
【請求項17】
前記1人の患者からの細胞が健康な細胞であるか、または前記1人の患者からの細胞が新生物細胞であるか、または前記1人の患者からの細胞が異なる組織からのものである、請求項16に記載のシステム。
【請求項18】
前記機械学習システムは、前記複数の疾患細胞株内に存在する前記可能な発現のうちのそれぞれの1つに対して、
前記複数の経路要素データにしたがって前記複数の特異的な疾患細胞株内に存在する前記1つの発現の等級を示すデータ点を生成することと、
前記1つの発現の前記等級と、前記複数の特異的な疾患細胞株に関する前記感度データと、の間の相関関係を導き出すことと、
を行うことにより、前記発現を推測するようプログラムされた、請求項17に記載のシステム。
【請求項19】
前記機械学習システムは、前記可能な発現に対応する前記導き出された相関関係から最適な相関関係を有する前記発現を推測するために機械学習を使用するようさらにプログラムされた、請求項18に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、2013年6月28日に出願された、米国特許出願第61/840,669号の優先権を主張する。本明細書で論じられる上記の資料および他のすべての付帯的な資料は、参照することにより、その全体が本明細書に援用される。援用される参考文献における用語の定義および使用が本明細書で提供される当該用語の定義に一致しないかまたは矛盾する場合には、本明細書で提供される当該用語の定義が適用され、参考文献における当該用語の定義は適用されない。
【0002】
本発明の分野は経路分析であり、より詳細には、薬剤を使用して細胞または患者の治療のために推定上の診断的マーカおよび/または予後的マーカを特定するためにPARADIGMを使用する経路分析である。
【背景技術】
【0003】
以下の説明は本発明の発明主題を理解する上で有用となり得る情報を含む。本明細書で提供される情報のいずれもが必ずしも先行技術ではなく、また請求される発明主題に必ずしも関するものでないことが、または特定的または明示的に参照されるあらゆる出版物が必ずしも先行技術ではないことが、承認される。
【0004】
本明細書で指定されるすべての出版物は、それぞれの個々の出版物または特許出願が具体的且つ個別的に参照することにより援用されることが意図される場合と同程度に、参照することにより援用される。援用される参考文献における用語の定義および使用が本明細書で提供される当該用語の定義に一致しないかまたは矛盾する場合には、本明細書で提供される当該用語の定義が適用され、参考文献における当該用語の定義は適用されない。
【0005】
新薬開発はしばしば、機械論的な想定またはスクリーニングにより、および理論的設計様式におけるリード化合物の精製により、駆動される。係る想定および/またはスクリーニングの手順がしばしば特定的な標的または特定的な薬剤に対して効果的である一方で、性能に関する薬剤の効果および/または標的に関連付けられた成分の調節は通常、考慮されない。例えばキナーゼ阻害剤は、1つまたは複数の特定的なキナーゼの阻害に対して良好に定められ得るが、その阻害剤の他の要素の効果、またはキナーゼに関連付けられたシグナリング経路の機能は通常、未知である。したがって作用の機構に関する有効性はキナーゼ特異性テストを介して調査され得る一方で、細胞が薬剤の効果に対して補償的機構を示すため係るテストは多くの場合、診断ツールまたは予後ツールとしては好適でない。
【0006】
近年では、生体内経路のコンピュータ内経路モデルを取得するための様々な改善されたシステムおよび方法が説明されており、代表的なシステムおよび方法がWO2011/139345およびWO2013/062505で説明されている。係るモデルのさらなる改良は、異なる経路要素および経路間の相互相関関係を特定することを支援するための方法を開示するWO2014/059036(本明細書では「PARADIGM」と総称される)で提供された。係るモデルは、様々なシグナリング経路の相互接続性および様々な経路を通るシグナルの流れに関する価値ある洞察を提供する一方で、係るモデリングを使用することの多数の側面は理解されず、認識されることさえなかった。
【発明の概要】
【発明が解決しようとする課題】
【0007】
したがって、特に薬剤の効能に関する診断テストおよび予後テストを特定および/または開発するための改善されたシステムおよび方法を提供することが依然として必要とされる。
【0008】
本発明の発明主題は、患者の細胞の1つまたは複数の特徴に基づいて特定の治療が特定の患者に対して効果的であるかどうかを判定するための診断テストが特定される、装置、システム、および方法を提供する。1つまたは複数の病気を治療する潜在的能力を有する薬剤または他の治療が開発されたとき、係る薬剤は病気に関する異なる細胞株に対して異なる効果を有し得る。例えば1つの疾患細胞株はこの薬剤に対して極めて高い感度を有し得る(例えば薬剤が、この細胞株に対して病気を阻害することにおいて効果が非常に大きい)一方で、他の疾患細胞株はこの薬剤に対して極めて高い抵抗性を有し得る(例えば、薬剤がこの細胞株に対して病気を阻害することにおいて効果が非常に小さい)。係る感度データおよび他の形態のテスト結果の収集は、症状、疾患、および病気の診断および/または治療において有用であり得る。それぞれの細胞株が薬剤に対してどのように反応するかに関する情報(薬剤に対する細胞株の感度レベル)は、患者から採取されたサンプル細胞を使用し、それによりその対応する細胞株を示唆することにより(例えば薬剤を異なる細胞株に導入し、その反応を測定することにより)比較的容易に収集され得るが、したがって期待される薬剤有効性は依然として難題である。
【課題を解決するための手段】
【0009】
したがって本発明主題の1つの態様では、機械学習システムは、薬剤または他の形態の治療に対する異なる細胞株の感度データとの望ましい相関関係を有する測定可能な細胞の特徴を、多数の異なる測定可能な細胞の特徴から推測するようプログラムされる。機械学習システムは、次に、薬剤または他の形態の治療を投与することを推奨するために患者が示すべき細胞の特徴の閾値レベルを相関関係に基づいて判定するようプログラムされる。
【0010】
いくつかの実施形態では、機械学習システムは経路モデル・データベースに情報的に連結される。経路モデル・データベースはそれぞれ複数の特異的な疾患細胞株のオミクス・データから導き出された複数のデータセットを格納する。それぞれの異なるデータセットは異なる疾患細胞株に対応する経路要素データを含む。機械学習システムは、多数の測定可能な細胞の特徴のうちのそれぞれの細胞の特徴に対して、経路モデル・データベースに格納された経路要素データにしたがって、複数の特異的な疾患細胞株の特徴の等級に基づいて発現を推測するデータを生成するために経路モデル・データベースを使用するようプログラムされる。
【0011】
その後、機械学習システムは、それぞれの細胞発現に対して、細胞発現の推測される等級と、複数の特異的な疾患細胞株に関する感度データと、の間の相関関係を導き出すようプログラムされる。これらの導き出された相関関係を比較することにより、機械学習システムは複数の疾患細胞株に関する感度データとの最も望ましい(例えば最適な)相関関係を有する単一の発現を特定することができる。本発明主題では、導き出された相関関係を機械学習システムが比較することにより、感度データとの最も望ましい相関関係を有する単一の特徴、特徴の組み合わせ、または特徴の配列を含み得る相関関係が特定されることが可能となると考えられる。
【0012】
本発明主題の1つの観点では、感度データまたは他のテスト結果は、特定的な結果を生成するにあたり必要となる治療の量に基づき得る。治療は、抗新生物薬、治療的および/または予防的な医薬品、栄養補助薬剤、および他の化合物、ならびに放射線、運動、断食、心理療法、および他のモダリティまたは処方計画の投与を含むが、これらに限定されない。テスト結果の性質は、相当に変化し得、薬剤を用いての治療に対する反応性(例えばGI50値、IC50値)、全身作用、アポトーシス、局所効果、および細胞効果の誘導を含み得る。
【0013】
本発明主題では、測定可能な細胞の特徴は、酵素活性、調節活性、代謝活性、転写、翻訳、および/または翻訳後修飾を含む発現活性、シグナリング経路、および他の様々な細胞経路、ならびに受容体、キナーゼ、調節要素、および他の細胞複合体または細胞要素を含むものと考えられる。細胞の特徴が少なくとも想定されるかまたは既知の分子標的を有することは、一般的に好適である。
【0014】
機械学習システムが推測するようプログラムされた測定可能な細胞発現は、単一の特徴、特徴の組み合わせ、または特徴の配列であり得る。機械学習システムは異なる細胞株の感度データを受け取るようプログラムされ、その結果、機械学習システムが細胞の特徴に推測される等級とそれぞれの細胞株とを関連付けることが可能となる。感度データは、実験室または他の好適な環境において技師または機械により様々なテストまたは手順を実行することにより、収集され得る。
【0015】
他の態様では、発明者らは特異的な疾患細胞株のオミクス・データに基づいて薬剤を使用して病気を治療するためのマーカを判定する方法について検討する。この方法は、経路モデル・データベースがそれぞれ複数の特異的な疾患細胞株のオミクス・データから導き出された複数の特異的なデータセットを格納し、それぞれのデータセットは複数の経路要素データを含む、経路モデル・データベースを機械学習システムに情報的に連結するステップを含む。機械学習システムは、複数の特異的な疾患細胞株に関連付けられた感度データを受け取る。感度データは、薬剤に反応する複数の特異的な疾患細胞株のうちのそれぞれの1つの感度レベルを示し、薬剤を用いて複数の特異的な疾患細胞株のサンプル疾患細胞をテストすることにより生成され得る。
【0016】
さらなるステップでは、機械学習システムは、経路モデル・データベースにおいて複数の特異的な疾患細胞株に対応する複数の経路要素データを横断することにより、複数の特異的な疾患細胞株に関する感度データとの相関関係を有する細胞の特徴(例えば1つの複合体または複数の複合体)を推測する。次に機械学習システムは、相関関係に基づいて病気を治療する薬剤を推奨するために患者により示される発現レベル閾値を判定する。
【0017】
発現が様々な方法で定められることに注意すべきである。例えば発現は、少なくとも複合体の濃度、複数の複合体の組み合わせ、または2つ以上の複合体間の濃度の比、により定められ得る。
【0018】
最も一般的には、発現は、複数の特異的な疾患細胞株内に存在する可能な発現から推測される。複数の疾患細胞株内に存在する可能な発現のうちのそれぞれ1つに対する発現を推測するとき、複数の経路要素データにしたがって複数の特異的な疾患細胞株内に存在する可能な発現のうちのそれぞれの1つに対する等級を示すデータ点が生成されることが検討される。次に機械学習システムは、可能な発現のうちのそれぞれの1つに対する等級と、複数の特異的な疾患細胞株に関する感度データと、の間の相関関係を導き出し得る。したがって機械学習が、可能な発現に対応する導き出された相関関係から最適な相関関係を有する発現を推測するために使用され得ることが理解されるべきである。
【0019】
本発明主題を限定するものではないが、患者に対する推奨療法を含む出力データが生成されることが一般的に好適である。サンプル疾患細胞が患者から採取され得、サンプル疾患細胞内に存在する発現の等級は、生成される推奨療法が発現の測定された等級に基づくものとなるよう、測定され得る。
【0020】
異なる観点から見ると、複数の特異的な疾患細胞株は薬剤に対する感度に関して互いに異なることが理解されるべきである。例えば複数の特異的な疾患細胞株のうちの第1セットは薬剤を用いた治療に対して感度を有する一方で、複数の特異的な疾患細胞株のうちの第2セットは薬剤を用いた治療に対して抵抗性を有する。
【0021】
オミクス・データに関して、すべての既知のオミクス・データは好適であると考えられ、好ましいオミクス・データは、遺伝子コピー数データ、遺伝子突然変異データ、遺伝子メチル化データ、遺伝子発現データ、RNAスプライス情報データ、siRNAデータ、RNA翻訳データ、およびタンパク質活性データを含む。同様に、多数のデータ形式が本明細書における使用に対して適切であると考えられるが、特に好適なデータ形式はPARADIGMデータセットである。経路要素データは相当に変化し得るが、経路要素データは、遺伝子の発現状態、タンパク質のタンパク質レベル、および/またはタンパク質のタンパク質活性を含む。
【0022】
別の観点から見ると、発明者らは、特異的な疾患細胞株のオミクス・データに基づいて薬剤を使用して病気を治療するためのマーカを判定するためのシステムについて検討する。このシステムは、それぞれ複数の特異的な疾患細胞株のオミクス・データから導き出された複数の特異的なデータセットを格納するための経路モデル・データベースを含み、それぞれのデータセットは複数の経路要素データを含む。このシステムは、経路モデル・データベースに情報的に連結された機械学習システムをさらに含む。機械学習システムは、(i)複数の特異的な疾患細胞株に関連付けられ、薬剤に反応する複数の特異的な疾患細胞株のうちのそれぞれの1つの感度レベルを示す感度データを受け取ることと、(ii)経路モデル・データベースにおいて複数の特異的な疾患細胞株に対応する複数の経路要素データを横断することにより、複数の特異的な疾患細胞株に関する感度データとの相関関係を有する発現を推測することと、(iii)相関関係に基づいて病気を治療する薬剤を推奨するために患者により示される発現レベル閾値を判定することと、を行うようプログラムされる。
【0023】
上述のように、発現が、複数の特異的な疾患細胞株内に存在する可能な発現から推測されると考えられる。機械学習システムは、(i)複数の経路要素データにしたがって複数の特異的な疾患細胞株内に存在する1つの発現の等級を示すデータ点を生成することと、(ii)1つの発現の等級と、複数の特異的な疾患細胞株に関する感度データと、の間の相関関係を導き出すことと、を行うことにより、複数の疾患細胞株内に存在する可能な発現のうちのそれぞれの1つに対する発現を推測するようプログラムされる。加えて機械学習システムは、可能な発現に対応する導き出された相関関係から最適な相関関係を有する発現を推測するために機械学習を使用するようさらにプログラムされ得る。
【0024】
別の観点から見ると、発明者らは、機械学習システムを含むコンピュータ・システムに1つの方法を実行させるためのプログラム命令を含む非一時的コンピュータ可読媒体について検討する。機械学習システムは、それぞれ複数の特異的な疾患細胞株のオミクス・データから導き出された複数の特異的なデータセットを格納する経路モデル・データベースに情報的に連結される。なおそれぞれのデータセットは複数の経路要素データを含む。この方法は、(i)機械学習システムにより、複数の特異的な疾患細胞株に関連付けられ、薬剤に反応する複数の特異的な疾患細胞株のうちのそれぞれの1つの感度レベルを示す感度データを受け取るステップと、(ii)機械学習システムにより、経路モデル・データベースにおいて複数の特異的な疾患細胞株に対応する複数の経路要素データを横断することにより、複数の特異的な疾患細胞株に関する感度データとの相関関係を有する発現を推測するステップと、(iii)機械学習システムにより、相関関係に基づいて病気を治療する薬剤を推奨するために患者により示される発現レベル閾値を判定するステップと、を含む。
【0025】
最も一般的には、発現は、複数の特異的な疾患細胞株内に存在する可能な発現から推測される。加えて、発現を推測するステップは、(i)複数の経路要素データにしたがって複数の特異的な疾患細胞株内に存在する1つの発現の等級を示すデータ点を生成するステップと、(ii)機械学習システムにより、1つの発現の等級と、複数の特異的な疾患細胞株に関する感度データと、の間の相関関係を導き出すステップと、を含む。推測するステップが複数の疾患細胞株内に存在する可能な発現のうちのそれぞれの1つに対して実行され得ることを理解すべきである。次に機械学習システムは、可能な発現に対応する導き出された相関関係から最適な相関関係を有する発現を推測するために使用され得る。
【図面の簡単な説明】
【0026】
図1】いくつかの実施形態の機械学習システム例を示す図である。
図2】特定的な治療に反応する細胞株の異なる感度レベルを示すグラフである。
図3】細胞株の感度レベルと、細胞株内に存在する測定された発現の等級と、の間の関係を示すグラフである。
図4】細胞株の感度レベルと、細胞株内に存在する別の測定された発現の等級と、の間の関係を示すグラフである。
図5】細胞株の感度レベルと、細胞株内に存在するさらに別の測定された発現の等級と、の間の関係を示すグラフである。
図6】細胞株の感度レベルと、細胞株内に存在するさらに別の測定された発現の等級と、の間の関係を示すグラフである。
【発明を実施するための形態】
【0027】
コンピュータに関する任意の言語が任意の好適な計算装置(サーバ、インターフェース、システム、データベース、エージェント、ピア、エンジン、モジュール、コントローラ、または個別的もしくは集合的に動作する他種類の計算装置を含む)の任意の好適な組み合わせを含むものと読解されるべきであることを理解すべきである。計算装置が、有形の非一時的コンピュータ可読記憶媒体(例えば、ハード・ドライブ、ソリッドステート・ドライブ、RAM、フラッシュ、ROM、その他)上に格納されたソフトウェア命令を実行するよう構成されたプロセッサを含むことを理解すべきである。ソフトウェア命令は好適には、開示される装置に関して以下で説明する役割、責任、または他の機能性を提供するよう計算装置を構成する。特に好適な実施形態では、様々なサーバ、システム、データベース、またはインターフェースは、おそらくはHTTP、HTTPS、AES、公開−秘密鍵交換、ウェブ・サービスAPI、既知の財務トランザクション・プロトコル、または他の電子情報交換方法に基づいて、標準化されたプロトコルまたはアルゴリズムを使用してデータを交換する。データ交換は好適には、パケット交換網、インターネット、LAN、WAN、VPN、または他種類のパケット交換網上で行われる。
【0028】
以下の説明では本発明主題の多数の実施形態例が提供される。それぞれの実施形態は発明要素の単一の組み合わせを表すが、本発明主題は、開示される要素のすべての可能な組み合わせを含むものと考えられる。したがって1つの実施形態が要素A、要素B、および要素Cを含み、第2の実施形態が要素Bおよび要素Dを含む場合、本発明主題は、明示的に開示されない場合であったとしても、要素A、要素B、要素C、または要素Dの他の残余の組み合わせも含むものと考えられる。
【0029】
本明細書で使用されるよう、文脈上別様に指示されない限り、「〜に連結された」という用語は、直接的連結(2つの要素が互いに接触する状態で互いに連結される)および間接的連結(少なくとも1つの追加的要素が2つの要素間に配置される)の両方を含むことを意図するものである。したがって「〜に連結された」という用語および「〜と連結された」という用語は同義語的に使用される。
【0030】
いくつかの実施形態では、本発明主題の特定的な実施形態を説明し請求するために使用される、構成要素の数、濃度などの特性、反応状態、その他を表現する数値は、いくつかの事例では「約」という用語により修飾されるものと理解されるべきである。したがっていくつかの実施形態では、本明細書および添付の請求項において説明される数値パラメータは、特定の実施形態により取得されることが求められる所望の特性に応じて変化し得る近似値である。いくつかの実施形態では、数値パラメータは、報告された有効数字の数値に照らし、通常の丸め技法を適用することにより、解釈されるべきである。本発明主題のいくつかの実施形態の広範な範囲を説明する数値範囲および数値パラメータは近似値であるが、特定的な実施形態で説明される数値は実用的に正確に報告される。本発明主題のいくつかの実施形態で提示される数値は、それぞれのテスト測定において見出される標準偏差から必然的に生じる特定的な誤差を含み得る。
【0031】
本明細書の説明で且つ以下の請求項を通して使用される、「a」、「an」、および「the」の意味は文脈が明らかに別段の指示を述べていないかぎり、複数の参照を含む。また本明細書の説明で使用される「〜における」の意味は、文脈が明らかに別段の指示を述べていないかぎり、「〜における」および「〜上の」を含む。
【0032】
文脈が別段の指示を述べていないかぎり、本明細書で説明されるすべての範囲は、当該範囲の両方の端点を含むものと解釈されるべきであり、開区間の範囲は商業的に実際的な値のみを含むものと解釈されるべきである。本明細書における値の範囲の記載は、当該範囲に含まれるそれぞれの別個の値を個別的に参照することの短縮化された方法として機能することを単に意図するものである。本明細書において別段の指示がないかぎり、範囲に含まれるそれぞれの個別的値は、本明細書に個別的に記載されているのと同様に、本明細書に組み込まれる。同様に、すべての一覧の値は、文脈が別段の指示を示さないかぎり、中間の値を含むものとして解釈されるべきである。
【0033】
本明細書に記載のすべての方法は、本明細書で別段の指示がないかぎり、または文脈上に明らかな矛盾がないかぎり、任意の好適な順序で実行され得る。本明細書における特定的な実施形態に関して提供される、あらゆるおよびすべての例示または例示的な言語(例えば「〜など」)の使用は、請求の範囲に別様の記載がないかぎり、単に本発明主題をより良好に例示することを意図するものにすぎず、本発明主題の範囲に制限を加えるものではない。本明細書におけるいずれの言語も、請求項に記載のない要素が本発明主題の実施に不可欠であることを表すものとして解釈されるべきではない。
【0034】
本明細書で開示される本発明主題の代替的な要素または実施形態のグループ化は限定として解釈されるべきではない。それぞれのグループ・メンバーは、個別的に、または当該グループの他のメンバーまたは本明細書で見られる他の要素との任意の組み合わせにおいて、参照または請求され得る。グループの1つまたは複数のメンバーは、利便性および/または特許要件の理由のために、グループに加えられること、またはグループから削除されること、が可能である。係る加入または削除が生じたとき、本明細書は変更されたグループを含むものと考えられ、したがって添付の請求項で使用されるすべてのマーカッシュ・グループの記載が満足される。
【0035】
本発明の発明主題は、患者の細胞の1つまたは複数の特徴に基づいて、特定的な治療(例えば、薬剤、薬剤化合物、治療処方計画、その他)が特定的な患者に対して有効であるかどうかを判定するための診断テストが特定される、装置、システム、および方法を提供する。1つまたは複数の病気を治療する潜在的能力を有する薬剤または他の治療が開発されたとき、係る薬剤は病気に関する異なる細胞株に対して異なる効果を有し得る。例えば1つの疾患細胞株はこの薬剤に対して極めて高い感度を有し得る(例えば薬剤が、この細胞株に対して病気を阻害することにおいて効果が非常に大きい)一方で、他の疾患細胞株はこの薬剤に対して極めて高い抵抗性を有し得る(例えば、薬剤がこの細胞株に対して病気を阻害することにおいて効果が非常に小さい)。係る感度データおよび他の形態のテスト結果の収集は、症状、疾患、および病気の診断および/または治療において有用であり得る。それぞれの細胞株が薬剤に対してどのように反応するかに関する情報(薬剤に対する細胞株の感度レベル)は、患者から採取されたサンプル細胞を使用し、それによりその対応する細胞株を示唆することにより(例えば薬剤を異なる細胞株に導入し、その反応を測定することにより)比較的容易に収集され得るが、したがって期待される薬剤有効性は依然として難題である。
【0036】
したがって本発明主題の1つの態様では、機械学習システムは、薬剤または他の形態の治療に対する異なる細胞株の感度データとの望ましい相関関係を有する測定可能な細胞の特徴を、細胞株内に存在する多数の異なる測定可能な細胞の特徴から推測するようプログラムされる。機械学習システムは、次に、薬剤または他の形態の治療を投与することを推奨するために患者が示すべき細胞の特徴の閾値レベルを相関関係に基づいて判定するようプログラムされる。
【0037】
いくつかの実施形態では、機械学習システムは経路モデル・データベースに情報的に連結される。いくつかの実施形態では、経路モデル・データベースは、Pathway Recognition Algorithm Using Data Integration on Genomic Model(PARADIGM)データベースを含む。PARADIGMデータベースについては、2011年4月29日に出願されたCharles J.Vaskeらに付与された国際公開第WO2011/139345号、および2011年10月26日に出願されたCharles J.Vaskeらに付与された国際公開第WO2013/062505号において、さらに詳述されている。
【0038】
経路モデル・データベースはそれぞれ複数の特異的な疾患細胞株のオミクス・データから導き出された複数のデータセットを格納する。それぞれの異なるデータセットは異なる疾患細胞株に対応する経路要素データを含む。機械学習システムは、多数の測定可能な細胞の特徴のそれぞれの細胞発現に対して、経路モデル・データベースに格納された経路要素データにしたがって、複数の特異的な疾患細胞株の発現の等級を推測するデータを生成するために経路モデル・データベースを使用するようプログラムされる。
【0039】
その後、機械学習システムは、それぞれの細胞の特徴に対して、細胞発現の推測される等級と、複数の特異的な疾患細胞株に関する感度データと、の間の相関関係を導き出すようプログラムされる。これらの導き出された相関関係を比較することにより、機械学習システムは複数の疾患細胞株に関する感度データとの最も望ましい(例えば最適な)相関関係を有する単一の発現を識別することができる。いくつかの実施形態では機械学習システムは、感度データとの最も望ましい相関関係を有する単一の発現を識別するために機械学習アルゴリズム(例えばサポート・ベクター・マシン(SVM)など)を使用する。SVM機械学習アルゴリズムに関するさらなる詳細は、Ben−Hurらによる「A User’s Guide to Support Vector Machines」をタイトルとする出版物に説明されており、当該出版物は本明細書に参照することにより、その全体が本明細書に援用される。単一の発現は、感度データとの最も望ましい相関関係を有する、単一の測定可能な細胞の特徴、測定可能な細胞の特徴の組み合わせ、または測定可能な細胞の特徴の配列を含み得るものと考えられる。
【0040】
本発明主題の1つの観点では、感度データまたは他のテスト結果は、特定的な結果を生成するにあたり必要となる治療の量に基づき得る。治療は、抗新生物薬、治療的および/または予防的な医薬品、栄養補助薬剤、および他の化合物、ならびに放射線、運動、断食、心理療法、および他のモダリティまたは処方計画の投与を含むが、これらに限定されない。テスト結果の性質は、相当に変化し得、薬剤を用いての治療に対する反応性(例えばGI50値、IC50値)、全身作用、局所効果、および細胞効果を含み得る。
【0041】
本発明主題では、測定可能な細胞の特徴は、酵素活性、調節活性、代謝活性、転写、翻訳、および/または翻訳後修飾を含む発現活性、シグナリング経路、および他の様々な細胞経路、ならびに受容体、キナーゼ、調節要素、および他の細胞複合体または細胞要素を含むものと考えられる。細胞の特徴が少なくとも想定されるかまたは既知の分子標的を有することは、一般的に好適である。いくつかの実施形態では細胞の特徴に関する濃度または他の量的説明は特徴を修飾するために使用される。
【0042】
機械学習システムが推測するようプログラムされた単一の細胞発現は、単一の特徴、特徴の組み合わせ、または特徴の配列であり得る。単一の測定可能な特徴を推測するために、機械学習システムは最初に、異なる細胞株の感度データを受け取るようプログラムされる。感度データは、実験室または他の好適な環境において技師または機械により様々なテストまたは手順を実行することにより、収集され得る。
【0043】
患者の疾患細胞株に基づいて個別化された治療を医療関係者が患者に提供することを可能にすることを含む多数の有利な技術的効果を、開示される技術が提供することを理解すべきである。
【0044】
図1は、本発明主題のいくつかの実施形態の例示的な機械学習システム100を図示する。機械学習システム100は、データベース・インターフェース・モジュール110と、機械学習マネージャ120と、ユーザ・インターフェース・モジュール130と、相関関係モジュール140と、マーカ判定モジュール150と、を含む。機械学習マネージャ120は、ユーザ・インターフェース・モジュール130、データベース・インターフェース・モジュール110、相関関係モジュール140、およびマーカ判定モジュール150にコマンドを送信することと、ユーザ・インターフェース・モジュール130、データベース・インターフェース・モジュール110、相関関係モジュール140、およびマーカ判定モジュール150から情報および/または他のデータ要素を受け取ることと、を行うようプログラムされる。機械学習マネージャ120は、モジュール110、モジュール130、モジュール140、およびモジュール150間でデータ要素を伝達するためのコンジットとしても機能する。機械学習マネージャ120は、インターフェース・モジュール110および130から分析モジュール140および150へと、相関関係モジュール140とマーカ判定モジュール150との間で、および最終的にはユーザ端末138へ出力するためにユーザ・インターフェース・モジュール130へと、データ要素の流れを向ける。
【0045】
ユーザ・インターフェース・モジュール130は、実験室132から各調査済み細胞株に対応するデータセットを受け取るために、入力装置(例えばコンピュータ端末など)に情報的に連結される。ユーザ・インターフェース・モジュール130において受け取られたデータセットは治療有効性データ136およびオミクス・データ134を含む。オミクス・データおよび治療有効性データを生成するために好適な様々な手順、テスト、および分析が実験室132により各調査済み細胞株に対して実行される。その結果、治療有効性データ136およびオミクス・データ134がそれぞれの調査済み細胞株に対して導き出される。
【0046】
オミクス・データは、ゲノミクス、リピドミクス、プロテオミクス、トランスクリプトミクス、メタボロミクス、メタボノミクス、栄養ゲノミクス、および細胞の他の特徴ならびに生物学的機能に関する情報を含むが、これらに限定されない。調査済み細胞株は、単一または複数の異なる組織または解剖学的領域からの細胞、単一または複数の異なる宿主からの細胞、ならびに任意の順列の組み合わせを含み得る。加えて調査済み細胞株は健康な細胞、不健康な細胞、または任意の組み合わせを含み得る。好適な実施形態では、調査済み細胞株は新生物細胞を含む。
【0047】
本発明主題のいくつかの実施形態では、評価された治療は複数の病気を治療することにおいて効果的であり得る。そのため、調査済み細胞株は好適には、複数の異なる組織および解剖学的領域からの細胞、特異的な病気、症状、または疾患を有する複数の細胞、または両方の何らかの組み合わせを含む。
【0048】
実験室132により生成されたオミクス・データ134がそれぞれの調査済み細胞株の様々な特徴を評価するにあたっての十分な情報を含むものと本発明の発明主題により考えられる。細胞の特徴は、酵素活性、調節活性、代謝活性、転写、翻訳、および/または翻訳後修飾を含む発現活性、シグナリング経路、および他の様々な細胞経路、ならびに受容体、キナーゼ、調節要素、および他の細胞構造、細胞複合体、または細胞要素を含む。
【0049】
図1に図示される実施形態では、評価された治療に関するテスト結果は治療有効性データ136を含む。治療有効性データ136は、異なる特異的な細胞株に対して治療がどの程度効果的であるかを示す。換言すると、治療有効性データ136(「感度データ」としても知られる)は、特定的な治療に対して各細胞株がどの程度の感度を有するか(例えば、きわめて高い感度からきわめて高い抵抗性までの尺度で)を示すデータを含む。治療は、抗新生物薬、治療的および/または予防的な医薬品、栄養補助薬剤、および他の化合物、ならびに放射線、運動、断食、心理療法、および他のモダリティまたは処方計画の投与を含み得る。加えて評価された治療は、化合物および/またはモダリティの投与のあらゆる妥当な組み合わせを含み得る。テスト結果の性質は、相当に変化し得、薬剤を用いての治療に対する反応性(例えばGI50値、IC50値)、全身作用、局所効果、および細胞効果を含み得る。
【0050】
特定的な治療に対する治療有効性データ136を導き出して測定するための方法は多数存在する。例えば有効性データは、評価された治療をそれぞれの疾患細胞株に投与して、それぞれの疾患細胞株上における評価された治療の効果を測定することにより、導き出され得る。測定は、細胞株における病気の阻害効果閾値を得るために必要とされる薬剤の量(例えば病気の活性を半分だけ低減するために必要となる薬剤の量)に基づき得る。
【0051】
図2は、NANT3456が1組の細胞株上でどの程度効果的であるかを示す例示的な1組の治療有効性データ136のグラフ表現を示すグラフ200を示す。NANT3456は2014年5月8日に出願されたWO/2014/071378において詳述されており、参照することにより本明細書に援用される。いくつかの実施形態では、図2上のデータ点は、異なる組織からの特異的な細胞株、同一の組織からの特異的な細胞株、またはこれらの任意の組み合わせを表す。さらに細胞株は、単一の宿主、複数の特異的な宿主、または任意の組み合わせから導き出され得る。この実施例ではNANT3456は、1組の細胞株(例えば、細胞株MV411、TT、AN3CA、K562、PC3、HCT116、ASPC1、MDAMB231、TF1、NCIH23、MIAPACA2、HS766T、CAPAN2、A549、HT29、U937、BXPC3、CAPAN1、およびSU8686)に関連付けられた病気を治療する能力を有するものとして知られる。グラフ200における様々な丸印のデータ点260および265は上述の様々な細胞株を表す。例えばデータ点225は細胞株MV411を、データ点230は細胞株TTを、データ点235は細胞株PC3を、データ点240はNCIH23を、データ点245は細胞株HT29を、データ点250は細胞株CAPAN1を、以下その他を、表し得る。
【0052】
グラフ200の唯一の軸(軸205)は可能な治療有効性値の範囲(例えば−4から6)を示す。この実施例では、治療有効性値は、薬剤/治療に対するGI50値に対するlog10単位のナノモル薬剤濃度(例えば、有効性閾値を達成するための薬剤の濃度)で表される。したがって−4の治療有効性値(グラフ200の左端)は薬剤が治療に対してきわめて高い感度を有することを示し、6の治療有効性値(グラフ200の右端)は薬剤が治療に対してきわめて高い抵抗性を有することを示す。したがってグラフ200に示すように、細胞株225、細胞株230、および細胞株235は、細胞株240、細胞株245、および細胞株250よりも、NANT3456に対して感度が高い。
【0053】
治療有効性データ136およびオミクス・データ134を受け取ると、ユーザ・インターフェース・モジュール130はこれらのデータセットを機械学習マネージャ120に伝達するようプログラムされる。次に機械学習マネージャは相関関係を生成するために治療有効性データ136およびオミクス・データ134を相関関係モジュール140に送る。いくつかの実施形態では治療有効性データ136を受け取ると、相関関係モジュール140はまず治療有効性データ136に基づいて細胞株を2つのグループ(高感度の細胞株および抵抗性の細胞株)に分割(分類)する。
【0054】
これらの実施形態のうちのいくつかでは、相関関係モジュール140は、有効性値閾値未満となる(感度または有効性が有効性値閾値よりも高い)細胞株が感度を有する細胞株とみなされ、有効性値閾値を越える(感度または有効性が有効性値閾値よりも低い)細胞株が抵抗性を有する細胞株とみなされるよう有効性値閾値を特定することにより、1セットの細胞株を分割し得る。有効性値閾値は、この治療有効性データセット136におけるすべての治療有効性値の中央値を取ることにより、生成され得る。例えば相関関係モジュール140は有効性値閾値を1.7(グラフ200の点線220により示される)とすることができる。したがってデータ点グループ260により表される細胞株(細胞株225、230、および235を含む黒丸データ点により示される)は感度を有する細胞株とみなされ、データ点グループ265により表される細胞株(細胞株240、245、および250を含む白丸データ点により示される)は抵抗性を有する細胞株とみなされる。いくつかの実施形態では細胞株を、感度を有するグループと、抵抗性を有するグループと、に分割することは、様々な機械学習アルゴリズムがオミクス・データ134と治療有効性データ136との間の相関関係を推測することを可能にする。相関関係を推測することに関する詳細については以下でさらに詳しく述べる。
【0055】
図1に戻って参照すると、機械学習システム100のデータベース・インターフェース・モジュール110は、経路モデル・データベース160から機械学習システム100へとデータセットを伝達するために、経路モデル・データベース160と情報的に連結される。いくつかの実施形態では、経路モデル・データベースは、それぞれ複数の特異的な疾患細胞株のオミクス・データから導き出された複数のデータセットを格納する。それぞれの異なるデータセットは異なる疾患細胞株に対応する経路要素データを含む。いくつかの実施形態では、例えば、経路モデル・データベースは、Pathway Recognition Algorithm Using Data Integration on Genomic Model(PARADIGM)データベースを含む。PARADIGMデータベースについては、2011年4月29日に出願されたCharles J.Vaskeらに付与された国際公開第WO2011/139345号、および2011年10月26日に出願されたCharles J.Vaskeらに付与された国際公開第WO2013/062505号において、さらに詳述されている。
【0056】
いくつかの実施形態では、データセットは経路モデル・データベース160とインターフェース・モジュール110との間で送受信され、それにより、新しいデータがインターフェース・モジュール110により経路モデル・データベース160に追加されることが可能となる。
【0057】
機械学習システム100の相関関係モジュール140は、薬剤有効性データ136からのデータセットと、経路モジュール・データベース160からのデータセットと組み合わせられたオミクス・データ134と、の間の相関関係を分析および評価するようプログラムされる。係るデータセットは、データセット142における例として図示される。いくつかの実施形態では相関関係モジュール140は、調査済み細胞株の薬剤有効性のうちの一部またはすべてと、細胞株内に存在するすべての可能な発現と、の間の相関関係を評価するようプログラムされる。これを行うために、相関関係モジュール140はまず、疾患細胞株内に見出され得るすべての可能な発現を特定する。これらの可能な発現は、疾患細胞株内に存在するあらゆる単一の特徴と、特徴のあらゆるおよびすべての可能な順列の組み合わせと、を含み得る。例えば特徴A、特徴B、および特徴Cが疾患細胞株内に見出される場合、可能な発現は、特徴Aと、特徴Bと、特徴Cと、特徴Aおよび特徴Bの組み合わせと、特徴Aおよび特徴Cの組み合わせと、特徴Bおよび特徴Cの組み合わせと、特徴A、特徴B、および特徴Cの組み合わせと、を含み得る。
【0058】
それぞれの疾患細胞株に対して、相関関係モジュール140は、経路モデル・データベース160内の経路要素データを横断し、それにより異なる可能な発現の等級を推測する。この推測ステップを実行するために、いくつかの実施形態の相関関係モジュール140は、(ユーザ・インターフェース・モジュール130を介して受け取られた)それぞれの細胞株に対するオミクス・データ134を採取し、オミクス・データ134に基づいて経路モデル・データベース160内の経路要素データを横断し、経路要素データ内に存在する発現からの活性を記録する。いくつかの実施形態では、等級の推測は上述のPARADIGMなどのコンピュータ・システムにより実行される。次に、特定された可能な発現すべてにおけるそれぞれの発現に対して、相関関係モジュール140は、細胞株の発現等級と、細胞株の治療有効性データと、の間の相関関係を導き出す。図3図6は、異なるグラフ(グラフ300、グラフ400、グラフ500、およびグラフ600)を示す。これらのグラフは、異なる発現と、治療有効性データと、の間の相関関係を表す。この相関関係は、経路モデル・データベース160から推測された発現データと治療有効性データとを用いて相関関係モジュール140により生成されたものである。
【0059】
例えば図3はグラフ300を図示し、グラフ300は発現(複合体Aの濃度)と治療有効性データ136との間の相関関係を示す。軸305はグラフ200の軸205と同様であり、治療有効性値(薬剤NANT3456に対するGI50値に対するlog10単位のナノモル薬剤濃度で表される)を表す。軸310は、低い等級(軸310の底部)から高い等級(軸310の上部)まで、発現の等級(この実施例では発現の等級:複合体Aの濃度)を表す。軸310に沿った値は発現の通常の濃度の小数部で表される。グラフ200と同様に、グラフ300内のそれぞれのデータ点は異なる細胞株を表す。例えばデータ点225は細胞株MV411を、データ点230は細胞株TTを、データ点235は細胞株PC3を、データ点240はNCIH23を、データ点245は細胞株HT29を、データ点250は細胞株CAPAN1を、以下その他を、表し得る。
【0060】
同様に図4は異なる発現(複合体Bの濃度)と治療有効性データ136との間の相関関係を表すグラフ400を図示し、図5は異なる発現(複合体Aおよび複合体Bの濃度)と治療有効性データ136との間の相関関係を表すグラフ500を表し、図6はさらに別の発現(複合体Cの濃度)と治療有効性データ136との間の相関関係を示すグラフ500を図示する。図3図6に示されるように、異なる発現と薬剤NANT3456の治療有効性との間の相関関係は変動し得る。いくつかの実施形態では相関関係モジュール140はこの相関関係データのすべてを、さらなる分析のためにマーカ判定モジュール150に送る。4つの異なる発現に対する相関関係のみが示されてはいるが、相関関係モジュール140はすべての可能な発現(異なる複合体、複合体の組み合わせのすべての順列、その他)に対して、より多数の相関関係グラフを生成し得るものと考えられる。
【0061】
上述のようにマーカ判定モジュール150は、相関関係モジュール140から受け取った相関関係データに基づいて最も望ましい(例えば最適な)相関関係を有する発現をすべての可能な発現から選択し、薬剤/治療の投与を推奨するために患者が示すべき発現等級値閾値を判定するよう、プログラムされる。いくつかの実施形態では判定モジュール150はまず、相関関係モジュール140により生成された相関関係のすべてに対して、感度を有する細胞株(図2に示すグループ260)と抵抗性を有する細胞株(図2に示すグループ265)とを最適に分離する発現等級値閾値を見出し、発現等級値閾値で2グループの細胞株をどの程度良好に分割するかに基づいて、その相関関係に対して信頼性スコアを割り当てる。例えば、2グループの細胞株を1つの等級値の両サイドに適切に分割することができる等級値が存在する(例えばすべての感度を有する細胞株が当該等級値より大きい発現等級を有し、すべての抵抗性を有する細胞株が当該等級値より小さい発現等級を有し、その逆もまた成り立つ)場合、マーカ判定モジュール150は当該値を発現値閾値として選択する。例えば、2グループの細胞株を、ある範囲の等級値の両側に適切に分割することができる当該範囲の等級値が存在する(例えばすべての感度を有する細胞株が当該範囲の等級値より大きい発現等級を有し、すべての抵抗性を有する細胞株が当該範囲の等級値より小さい発現等級を有し、その逆もまた成り立つ)場合、マーカ判定モジュール150は当該範囲の等級値のうちの任意の1つ(例えば中央値)を選択する。上述のシナリオでは発現等級値閾値が2グループの細胞株を完全に分離することができるため、マーカ判定モジュール150は上述の相関関係のうちのそれぞれに対して100%の信頼性スコアを割り当てるであろう。
【0062】
一方、係る等級が存在しない場合、マーカ判定モジュール150は、可能な限りより多くの細胞株を分離する等級値(例えば当該等級値閾値に対し、グラフの誤ったサイドに現れる細胞株がほとんどないようにさせる等級値)を選択する。これらのシナリオでは、マーカ判定モジュール150は、グラフの誤ったサイド上に現れる細胞株のパーセンテージだけ信頼性スコアを低下させる。
【0063】
上述のステップを相関関係グラフ300に対して適用すると、マーカ判定モジュール150は閾値として等級値−0.18(閾値315により示される)を選択するであろう。なぜなら当該等級値により、最小個数の細胞株がグラフの「誤った」サイド上に現れることとなるためである。図3に示すように、合計24個のデータ点のうちで3つの黒いデータ点(グループ260に属する)および8つの白いデータ点(グループ265に属する)が閾値の誤ったサイド上に現れる。その結果、当該閾値を有する複合体を使用することにより、偽陽性のリスクが存在する(例えば当該複合体に基づく閾値は、患者が感度を示す場合に、患者が抵抗性を示すものと示し得る)。したがってマーカ判定モジュール150は13/24(54%)の信頼性スコアを割り当てる。これらの発現のうちのいくつかが治療有効性データに対して比例の関係を有することに注意されたい。一方、いくつかの他の発現、例えば図3に示す発現(複合体Aの濃度)は、治療有効性データに対して逆比例の関係を有し得る。すなわち細胞内に見られる複合体Aの濃度が低いほど、NANT3456の治療から、より効果的な結果が生じることが示唆される。この実施形態では、マーカ判定モジュール150は、患者のサンプル細胞における発現の濃度を特定することに関するエラー率による発現(例えば複合体A)の濃度に対する最小診断関連値も特定する。
【0064】
同様にグラフ400に対して、マーカ判定モジュール150は図4における閾値415により示される−0.25の等級値閾値を選択し、20/24(83%)の信頼性スコアを割り当てる。グラフ400において示される相関関係は、発現と治療有効性値との間に比例の関係を示す。グラフ500に対して、マーカ判定モジュール150は図5における閾値515により示される−0.16の等級値閾値を選択し、20/24(83%)の信頼性スコアを割り当てる。グラフ500において示される相関関係は、発現と治療有効性値との間に逆比例の関係を示す。グラフ600に対して、マーカ判定モジュール150は図6における閾値615により示される−0.29の等級値閾値を選択し、24/24(100%)の信頼性スコアを割り当てる。グラフ600において示される相関関係は、発現と治療有効性値との間に比例の関係を示す。
【0065】
異なる相関関係グラフの信頼性スコアに基づいて、マーカ判定モジュール150は、グラフ600に対する発現(複合体Cの濃度)が、最も高い(100%)の信頼性スコアを有するため、治療有効性データとの最も望ましい相関関係を有すると判定する。グラフ600に対する等級値閾値(−0.29の複合体Cの濃度)は、薬剤NANT3456が患者に対して好適であるかどうかを判定するための診断テストの一部としても使用される。いくつかの実施形態では機械学習システム100は、(この実施例におけるグラフ600などの最も望ましい相関関係グラフと発現等級閾値とを含む)診断テストもユーザに(ユーザ端末138などの出力ディスプレイ装置を介して)提示(表示)する。
【0066】
薬剤NANT3456が治療のために指定された病気のうちの1つを有する任意の患者に対して、患者からサンプル疾患細胞を採取し、複合体Cに対する等級値を取得する(例えばサンプル疾患細胞における複合体Cの濃度を測定する)ことができる。その診断テストにしたがって、そのサンプル細胞が通常の濃度の小数部として−0.29より高い複合体Cの濃度を有する患者には、その治療を使用すること(例えば薬剤NANT3456を用いること)が推奨され、そのサンプル細胞が通常の濃度の小数部として−0.29より低い複合体Cの濃度を有する患者には、その治療を使用すること(例えば薬剤NANT3456を用いること)は推奨されない。
【0067】
すでに説明したものの他に、より多数の改変例が本明細書に記載の発明概念から逸脱することなく可能であることが当業者には理解されるべきである。したがって本発明主題は、添付の請求項の趣旨に含まれる以外は、制限されるべきではない。さらに明細書および請求項の両方を解釈する際、すべての用語は、文脈と一貫した最も広い可能な広い様式で解釈されるべきである。特に「含む」および「含んだ」という用語は、要素、成分、またはステップが、明示的には参照されない他の要素、成分、またはステップとともに存在し、利用され、または組み合わされ得ることを示す非排他的な様式で、要素、成分、またはステップを参照するものとして解釈されるべきである。明細書および請求項がA、B、C、……、およびNからなる群から選択される要素のうちの少なくとも1つを参照する場合、当該文章は、AプラスNまたはBプラスN、その他ではなく、当該群からのただ1つの要素を要求するものとして解釈されるべきである。
図1
図2
図3
図4
図5
図6