IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ガーダント ヘルス, インコーポレイテッドの特許一覧

<>
  • 特開-がんの進化の検出および診断 図1
  • 特開-がんの進化の検出および診断 図2A
  • 特開-がんの進化の検出および診断 図2B
  • 特開-がんの進化の検出および診断 図2C
  • 特開-がんの進化の検出および診断 図2D
  • 特開-がんの進化の検出および診断 図3
  • 特開-がんの進化の検出および診断 図4
  • 特開-がんの進化の検出および診断 図5
  • 特開-がんの進化の検出および診断 図6
  • 特開-がんの進化の検出および診断 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024112831
(43)【公開日】2024-08-21
(54)【発明の名称】がんの進化の検出および診断
(51)【国際特許分類】
   G16H 10/40 20180101AFI20240814BHJP
【FI】
G16H10/40
【審査請求】有
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2024075758
(22)【出願日】2024-05-08
(62)【分割の表示】P 2021195284の分割
【原出願日】2017-02-02
(31)【優先権主張番号】62/290,375
(32)【優先日】2016-02-02
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.ANDROID
(71)【出願人】
【識別番号】515059083
【氏名又は名称】ガーダント ヘルス, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ヘルミー エルトーキー
(72)【発明者】
【氏名】アミルアリ タラサズ
(57)【要約】
【課題】がんの進化の検出および診断の提供。
【解決手段】本開示は、多数の治療介入のうちのいずれかの後に、対象の初期状態、例えば、がんを有する対象の体細胞変異状況が、後続状態を発症する確率を判定するための方法を提供する。そのような確率は、対象の所望される転帰の確率を最大化する特定の処置過程に関する情報を、医療提供者に提供するために使用することができる。本開示はまた、がんの進化を検出またはモニタリングするための方法およびシステムを提供する。そのような方法およびシステムは、がんの処置に対する患者の応答および耐性の発生を予測するため、ならびに他の利点のために使用することができる。
【選択図】なし
【特許請求の範囲】
【請求項1】
図面に記載の発明。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本願は、2016年2月2日に出願された米国仮特許出願第62/290,375号に基づく優先権を主張しており、この仮特許出願は、全体が参考として本明細書中に援用される。
【背景技術】
【0002】
背景
がんは、世界中で大きな負担となっている疾患である。毎年、世界中で何千万もの個体が、がんと診断され、そのような個体のうちの半数を上回るものが、がんの処置を効果的に行うことができず、最終的には死に至り得る。多くの国では、がんは、心臓血管疾患に続いて、2番目に多い死因にランクされている。
【0003】
ヒト腫瘍における遺伝的脆弱性を標的とする薬物が、現在、有効ながんの治療法として、臨床において検証されている。しかしながら、そのような処置に対する耐性の獲得により、それらの有用性は著しく制限され得、進行がんの臨床管理に対する実質的な課題のままとなっている。抗がん薬での処置に対する耐性は、対象における個々の変動性ならびに腫瘍内での遺伝子バリアントの出現および増殖を含む、様々な因子により生じ得る。広範な抗がん薬に対する耐性の獲得の最も一般的な原因は、抗がん薬を検出し、それを細胞から排出する、1つまたは複数のエネルギー依存性トランスポーターの発現であるが、他の耐性機序としては、薬物に誘導されるアポトーシスに対する非感受性および薬物解毒機序の誘導を挙げることができる。
【0004】
化学療法薬に対する耐性の発生は、全身に転移したかまたは拡がった固形腫瘍、例えば、乳房、前立腺、肺、および結腸のものなどを有するがん患者にとって頻繁なものであり、死に至る結果となることも多い。一部の事例では、特定の変異機序が、薬物耐性の獲得に直接的に寄与し、他の事例では、非変異性の可能性としてエピジェネティクスの機序が、重大な役割を果たすとみられる。
【0005】
腫瘍の薬物耐性の機械的特徴付けの至適基準は、処置前および再発後に取得した腫瘍組織の詳細な研究を、耐性エフェクター候補の実験による確認と一緒に、含む。
【発明の概要】
【課題を解決するための手段】
【0006】
要旨
本明細書において認識されるように、がんの処置に対する患者の応答および耐性の出現を予測するための代替的なツールには、かなりの必要性が存在する。
【0007】
本開示は、がんの進化を検出またはモニタリングするための方法およびシステムを提供する。そのような方法およびシステムは、がんの処置に対する患者の応答および耐性の発生を予測するため、ならびに他の利点のために使用することができる。
【0008】
一態様では、本開示は、コンピュータにより実装される方法であって、(a)第1の時点において、がんを有する複数の対象に関する情報を取得し、そして第1の時点における情報に基づいて、第1の状態のセットを生成するために、複数の対象のそれぞれの第1の状態を判定するステップであって、情報が、複数の対象のそれぞれの対象について、少なくとも、無細胞体液からの核酸のジェノタイピングを行うことによって得られた腫瘍の遺伝子プロファイルおよび第1の時点の前に対象に提供された任意の処置を含む、ステップと、(b)第1の時点よりも後の1つまたは複数の第2の時点において、複数の対象に関する情報を取得し、そして1つまたは複数の第2の時点のうちの所与の一時点における情報に基づいて、後続状態のセットを生成するために、1つまたは複数の第2の時点のそれぞれにおける複数の対象のそれぞれの第2の状態を判定するステップと、(c)(a)からの第1の状態のセットおよび(b)からの後続状態のセットを使用するステップであって、所与の第1の状態が、所与の第1の状態よりも後の後期時点における状態のセットの中で、第2の状態をもたらす確率を判定するように構成される予測アルゴリズムを生成するステップとを含む、方法を提供する。一部の実施形態では、本方法は、(d)早期時点における状態のセットの中での所与の第1の状態に関して、所与の第1の状態が、後期時点における状態のセットの中で第2の状態をもたらす確率を判定するステップと、(e)(d)において判定された確率を示す電子出力を生成するステップとをさらに含む。
【0009】
一態様では、本開示は、コンピュータにより実装される方法であって、(a)第1の時点において、がんを有する複数の対象に関する情報を取得し、そして第1の時点における情報に基づいて、第1の状態のセットを生成するために、複数の対象のそれぞれの第1の状態を判定するステップであって、情報が、複数の対象のそれぞれの対象について、少なくとも、少なくとも50個の遺伝子のジェノタイピングを行うことによって得られた腫瘍の遺伝子プロファイルおよび第1の時点の前に対象に提供された任意の処置を含む、ステップと、(b)第1の時点よりも後の1つまたは複数の第2の時点において、複数の対象に関する情報を取得し、そして1つまたは複数の第2の時点のうちの所与の一時点における情報に基づいて、後続状態のセット生成するために、1つまたは複数の第2の時点のそれぞれにおける複数の対象のそれぞれの第2の状態を判定するステップと、(c)(a)からの第1の状態のセットおよび(b)からの後続状態のセットを使用するステップであって、所与の第1の状態が、所与の第1の状態よりも後の後期時点における状態のセットの中で、第2の状態をもたらす確率を判定するように構成される予測アルゴリズムを生成するステップとを含む、方法を提供する。一部の実施形態では、本方法は、(d)早期時点における状態のセットの中での所与の第1の状態に関して、所与の第1の状態が、後期時点における状態のセットの中で第2の状態をもたらす確率を判定するステップと、(e)(d)において判定された確率を示す電子出力を生成するステップとをさらに含む。
【0010】
一部の実施形態では、情報を取得するステップが、複数の対象由来の無細胞デオキシリボ核酸(cfDNA)のシーケンシングを行うステップと、任意選択で、複数の対象のそれぞれの問診を実施するステップとを含む。一部の実施形態では、処置は、第1の時点の前に対象に提供されていた。一部の実施形態では、本方法は、1つまたは複数の決定ツリーを生成するステップを含み、それぞれの決定ツリーが、ルートノード、1つまたは複数の決定ブランチ、1つまたは複数の決定ノード、および1つまたは複数の終端ノードを含み、ルートノードにおける状態が、第1の時点を表し、1つまたは複数の決定ブランチが、代替えの処置を表し、1つまたは複数の決定ノードおよび1つまたは複数の終端ノードが、後続状態を表す。一部の実施形態では、1つまたは複数の決定ブランチは、複数の決定ブランチを含む。一部の実施形態では、後続状態は、対象が生きているかまたは死んでいるかを示す対象の生存状態を含む。一部の実施形態では、後続状態は、対象生存率を含む。一部の実施形態では、第1の状態のそれぞれは、1つまたは複数の体細胞変異の共通のセットを含む。一部の実施形態では、情報は、対象のプロファイルをさらに含む。
【0011】
一部の実施形態では、確率は、少なくとも部分的に、複数の処置選択肢の中からの処置選択の関数である。一部の実施形態では、1つまたは複数の第2の時点は、複数の後続時点を含む。一部の実施形態では、本方法は、複数の後続時点において、確率を判定するステップをさらに含む。一部の実施形態では、時点は、少なくとも3つの時点または少なくとも4つの時点を含む。一部の実施形態では、第1の時点は、対象が処置を受ける前であり、後続時点は、対象が処置を受けた後である。一部の実施形態では、第2の処置が、後続時点における後続状態に基づいて、後続時点の後に投与される。
【0012】
一部の実施形態では、複数の対象に関する情報は、対象の患者プロファイルからの1つまたは複数の特徴を含み、この特徴は、年齢、性別、ジェンダー、遺伝子プロファイル、酵素レベル、器官機能、生活の質、医療介入の頻度、寛解の状況、および患者の転帰からなる群から選択される。一部の実施形態では、遺伝子プロファイルは、がんの危険性を増加させるか、薬物動態に影響を及ぼすか、または薬物感受性に影響を及ぼす、1つまたは複数の遺伝子座における対象の遺伝子型を含む。一部の実施形態では、複数の対象に関する情報は、対象の腫瘍プロファイルからの1つまたは複数の特徴を含み、この特徴は、1つまたは複数の遺伝子バリアント、起源組織、腫瘍量、腫瘍の薬物感受性、および腫瘍のステージからなる群から選択される。一部の実施形態では、1つまたは複数の特徴は、対象由来の無細胞核酸分子をアッセイすることによって判定される。一部の実施形態では、1つまたは複数の遺伝子バリアントを定量化して、1つまたは複数の体細胞変異を含む無細胞核酸分子の比率を判定する。一部の実施形態では、本方法は、1つまたは複数の体細胞変異の比率が、第1の時点と、1つまたは複数の後続時点との間で、増加しているかまたは減少しているかを判定するステップをさらに含む。一部の実施形態では、本方法は、1つまたは複数の体細胞変異の比率が、1つまたは複数の後続時点のうちの複数の間で、増加しているかまたは減少しているかを判定するステップをさらに含む。一部の実施形態では、1つまたは複数の体細胞変異の比率は、増加している。一部の実施形態では、1つまたは複数の体細胞変異は、増加しており、さらに、体細胞変異は、処置に対する耐性と関連している。一部の実施形態では、アッセイすることは、高スループットシーケンシングを含む。
【0013】
別の態様では、本開示は、(a)第1の時点において、がんを有する対象に関する情報を取得するステップであって、情報が、患者プロファイル、腫瘍プロファイル、または処置からの対象の少なくとも1つの特徴を含む、ステップと、(b)第1の時点における情報に基づいて、対象の初期状態を判定するステップと、(c)対象の初期状態に基づいて、1つまたは複数の後続時点のそれぞれにおいて、複数の後続状態のそれぞれの確率を判定し、それによって、状態の転帰に関する確率のセットを提供するステップと、(d)状態の転帰に関する確率のセットに少なくとも部分的に基づいて、対象が特定の転帰を得る確率を最適化する、がんの処置の推奨を生成するステップと、(e)(d)において生成された推奨を示す電子出力を生成するステップとを含む、方法を提供する。一部の実施形態では、確率は、少なくとも部分的に、複数の処置選択肢の中からの処置選択の関数である。一部の実施形態では、1つまたは複数の後続時点は、複数の後続時点を含む。一部の実施形態では、本方法は、複数の後続時点において、確率を判定するステップをさらに含む。一部の実施形態では、時点は、少なくとも3つの時点を含む。一部の実施形態では、時点は、少なくとも4つの時点を含む。一部の実施形態では、第1の時点は、対象が処置を受ける前であり、後続時点は、対象が処置を受けた後である。一部の実施形態では、第2の処置が、後続時点における後続状態に基づいて、後続時点の後に投与される。一部の実施形態では、対象の少なくとも1つの特徴は、患者プロファイルからであり、年齢、ジェンダー、遺伝子プロファイル、酵素レベル、器官機能、生活の質、医療介入の頻度、寛解の状況、および患者の転帰からなる群から選択される。
【0014】
一部の実施形態では、遺伝子プロファイルは、遺伝性がん遺伝子である1つまたは複数の遺伝子座における対象の遺伝子型を含む。一部の実施形態では、遺伝子プロファイルは、薬物動態に影響を及ぼす1つまたは複数の遺伝子座における対象の遺伝子型を含む。一部の実施形態では、遺伝子プロファイルは、薬物感受性に影響を及ぼす1つまたは複数の遺伝子座における対象の遺伝子型を含む。一部の実施形態では、対象の少なくとも1つの特徴は、腫瘍プロファイルからであり、1つまたは複数の体細胞変異、起源組織、腫瘍量、腫瘍の薬物感受性、および腫瘍のステージからなる群から選択される。一部の実施形態では、少なくとも1つの特徴は、対象由来の無細胞核酸分子をアッセイすることによって判定される。
【0015】
一部の実施形態では、体細胞変異を定量化して、1つまたは複数の体細胞変異を含む腫瘍に由来する無細胞核酸分子の比率を判定する。
【0016】
一部の実施形態では、本方法は、1つまたは複数の体細胞変異の比率が、第1の時点と、1つまたは複数の後続時点との間で、増加しているかまたは減少しているかを判定するステップをさらに含む。一部の実施形態では、本方法は、1つまたは複数の体細胞変異の比率が、1つまたは複数の後続時点のうちの複数の間で、増加しているかまたは減少しているかを判定するステップをさらに含む。一部の実施形態では、アッセイすることは、高スループットシーケンシングを含む。一部の実施形態では、腫瘍プロファイルは、腫瘍組織生検に由来しない。
【0017】
一態様では、本開示は、(a)対象に関する、少なくとも、腫瘍の遺伝子プロファイルおよび対象に以前提供されていたかまたは現在提供されている処置があればそれを含む、情報を取得し、情報に基づいて、対象の初期状態を判定するステップと、(b)決定ツリーを提供するステップであって、ルートノードが、初期対象状態を表し、決定ブランチが、対象に利用可能な代替えの処置を表し、機会ノードが、不確実性の点を表し、決定ノードまたは終端ノードが、後続状態を表す、ステップと、(c)対象が終端ノードにおいて生存している状態を達成する確率を最大化する、対象の処置過程を提供するステップと、(d)(c)において判定された処置過程を示す電子出力を生成するステップとを含む、方法を提供する。
【0018】
一態様では、本開示は、(a)通信ネットワーク上で、1つまたは複数の医療サービス提供者との1つまたは複数の通信リンクを確立するステップと、(b)通信ネットワーク上で、1つまたは複数の医療サービス提供者から、1つまたは複数の対象に関する医療情報を受信するステップと、(c)医療サービス提供者から、1つまたは複数の対象のそれぞれに由来する無細胞デオキシリボ核酸(cfDNA)を含む1つまたは複数の試料を受け取るステップと、(d)cfDNAのシーケンシングを行い、cfDNAに存在する1つまたは複数の遺伝子バリアントを特定するステップと、(e)1つまたは複数の対象のそれぞれについての情報を有するデータベースを作成または供給するステップであって、情報が、特定された遺伝子バリアントおよび受信された医療情報の両方を含む、ステップと、(f)データベースおよびコンピュータにより実装されるアルゴリズムを使用して、対象の初期状態に基づいて、複数の異なる治療介入のそれぞれについて、後続状態の確率を予測する、少なくとも1つの予測モデルを生成するステップとを含む、方法を提供する。
【0019】
一態様では、本開示は、1つまたは複数のコンピュータプロセッサによって実行すると、(a)第1の時点において、がんを有する複数の対象に関する情報を取得し、そして第1の時点における情報に基づいて、第1の状態のセットを生成するために、複数の対象のそれぞれの第1の状態を判定するステップであって、情報が、複数の対象のそれぞれの対象について、少なくとも、無細胞体液からの核酸のジェノタイピングを行うことによって得られた腫瘍の遺伝子プロファイルおよび第1の時点の前に対象に提供された任意の処置を含む、ステップと、(b)第1の時点よりも後の1つまたは複数の第2の時点において、複数の対象に関する情報を取得し、そして1つまたは複数の第2の時点のうちの所与の一時点における情報に基づいて、後続状態のセットを生成するために、1つまたは複数の第2の時点のそれぞれにおける複数の対象のそれぞれの第2の状態を判定するステップと、(c)(a)からの第1の状態のセットおよび(b)からの後続状態のセットを使用するステップであって、所与の第1の状態が、所与の第1の状態よりも後の後期時点における状態のセットの中で、第2の状態をもたらす確率を判定するように構成される予測アルゴリズムを生成するステップとを含む方法を実装する、機械により実行可能なコードを含む、非一過的コンピュータ可読媒体を提供する。
【0020】
一態様では、本開示は、1つまたは複数のコンピュータプロセッサによって実行すると、(a)第1の時点において、がんを有する複数の対象に関する情報を取得し、そして第1の状態のセットを生成するために、第1の時点における情報に基づいて、複数の対象のそれぞれの第1の状態を判定するステップであって、情報が、複数の対象のそれぞれの対象について、少なくとも、少なくとも50個の遺伝子のジェノタイピングを行うことによって得られた腫瘍の遺伝子プロファイルおよび第1の時点の前に対象に提供された任意の処置を含む、ステップと、(b)第1の時点よりも後の1つまたは複数の第2の時点において、複数の対象に関する情報を取得し、そして1つまたは複数の第2の時点のうちの所与の一時点における情報に基づいて、後続状態のセットを生成するために、1つまたは複数の第2の時点のそれぞれにおける複数の対象のそれぞれの第2の状態を判定するステップと、(c)(a)からの第1の状態のセットおよび(b)からの後続状態のセットを使用するステップであって、所与の第1の状態が、所与の第1の状態よりも後の後期時点における状態のセットの中で、第2の状態をもたらす確率を判定するように構成される予測アルゴリズムを生成するステップとを含む方法を実装する、機械により実行可能なコードを含む、非一過的コンピュータ可読媒体を提供する。
【0021】
一態様では、本開示は、(a)対象に関する、少なくとも、腫瘍の遺伝子プロファイルおよび対象に以前提供されていたかまたは現在提供されている処置があればそれを含む、情報を取得し、情報に基づいて、対象の初期状態を判定するステップと、(b)決定ツリーを提供するステップであって、ルートノードが、初期対象状態を表し、決定ブランチが、対象に利用可能な代替えの処置を表し、機会ノードが、不確実性の点を表し、決定ノードまたは終端ノードが、後続状態を表す、ステップと、(c)対象が終端ノードにおいて生存している状態を達成する確率を最大化する、対象の処置過程を提供するステップと、(d)処置過程を対象に投与するステップとを含む、方法を提供する。一部の実施形態では、本方法は、(e)初期状態よりも後の第2の時点において、対象に関する、少なくとも、腫瘍の遺伝子プロファイルおよび対象に以前提供されていたかまたは現在提供されている処置があればそれを含む、情報を取得し、情報に基づいて、複数の後続状態の中から、対象の第2の状態を判定するステップと、(f)第2の状態に基づいて、対象が終端ノードにおいて生存している状態を達成する確率を最大化する、対象の後続の処置過程を提供するステップと、(g)後続の処置過程を対象に投与するステップとをさらに含む。一部の実施形態では、本方法は、(e)初期状態よりも後の第2の時点において、対象に関する、少なくとも、腫瘍の遺伝子プロファイルおよび対象に以前提供されていたかまたは現在提供されている処置があればそれを含む、情報を取得し、情報に基づいて、複数の後続状態の中から、対象の第2の状態を判定するステップと、(f)第2の状態に基づいて、対象が終端ノードにおいて生存している状態を達成する確率を最大化する、対象の後続の処置過程を提供するステップと、(g)後続の処置過程を対象に投与するステップとをさらに含む。
【0022】
一態様では、本開示は、がんを有する対象のための複数の代替えの処置の中からある処置過程を提供するステップを含む方法であって、対象が、複数の決定ブランチを含む決定ツリーによって特徴付けられており、それぞれの決定ブランチが、複数の代替えの処置の中から1つの代替えの処置を表し、その処置過程が、対象が終端ノードにおいて生存している状態を達成する確率を最大化する、方法を提供する。
【0023】
本開示のさらなる態様および利点は、以下の詳細な説明から当業者には容易に明らかとなるが、そこには、本開示の例証的な実施形態のみが示され、記載されている。理解されるように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、すべてが本開示から逸脱することなく、様々な自明の事項における修正が可能である。したがって、図面および説明は、制限的ではなく、例証的な性質と解釈されるものである。
参照による組込み
【0024】
本明細書において言及されるすべての刊行物、特許、および特許出願は、それぞれ個別の刊行物、特許、または特許出願が、具体的かつ個別に参照により組み込まれると示されるのと同程度に、参照により本明細書に組み込まれる。
【0025】
本発明の新規な特性は、添付の特許請求の範囲に詳細に記載されている。本発明の特性および利点のより良好な理解は、例証的な実施形態について記載し、本発明の原理が利用されている、以下の詳細な説明、ならびに添付の図面を参照することによって得られる。
【図面の簡単な説明】
【0026】
図1図1は、対象の様々な疾患状態における変異を分析するための例示的な方法を示す。
【0027】
図2A図2Aは、がんゲノムにおける様々な例示的な異常を示す。
【0028】
図2B図2Bは、進化的な回避経路を検出するための例示的なシステムを示す。
【0029】
図2C図2Cは、図2Bのシステムによって生成される例示的なモデルを示す。
【0030】
図2D図2Dは、腫瘍の進化歴中に発達する、例示的な、正常細胞およびがんサブクローンの不均一な集団を示す。
【0031】
図3図3は、デオキシリボ核酸(DNA)の配列の読取りにおけるエラー率およびバイアスを低減させるための例示的なプロセスを示す。
【0032】
図4図4は、インターネットにより実現される、がんを有する対象のレポートのアクセスの概略図を示す。
【0033】
図5図5は、遺伝子バリアントと関連する複数の遺伝子を示す。
【0034】
図6図6は、初期状態を示すルートノード(長方形)、異なる治療介入を示す決定ブランチ(矢印)、および機会ブランチ(矢印)が後続状態を示す終端ノード(三角形)または決定ノード(正方形)のいずれかに生じている機会ノード(円形)を含む、決定ツリーを示す。
【0035】
図7図7は、本明細書において提供される方法を実装するようにプログラミングされるか、またはそうでなければそのように構成される、コンピュータシステムを示す。
【発明を実施するための形態】
【0036】
詳細な説明
遺伝子バリアントは、遺伝子座における代替的な形態である。ヒトゲノムにおいて、ヌクレオチド位置のうちのおよそ0.1%は多型である、すなわち、集団の少なくとも1%に生じる第2の遺伝子形態で存在している。変異は、遺伝子バリアントを生殖細胞系に導入し得、がんなどの疾患細胞にも導入し得る。hg19またはNCBIのBuild 37もしくはBuild 38などの参照配列は、「野生型」または「正常な」ゲノムを表すことを意図している。しかしながら、それらは、単一の配列を有するという点で、正常とも考えることができる一般的な多型を識別しない。
【0037】
遺伝子バリアントには、配列バリアント、コピー数バリアント、およびヌクレオチド修飾バリアントが含まれる。配列バリアントは、遺伝子のヌクレオチド配列における変化である。コピー数バリアントは、ゲノムの一部分のコピー数が野生型から偏移していることである。遺伝子バリアントとしては、例えば、一塩基多型(SNP)、挿入、欠失、逆転、転換、転位、遺伝子融合、染色体融合、遺伝子短縮、コピー数多型(例えば、異数性、部分異数性、倍数性、遺伝子増幅)、核酸化学修飾における異常な変化、エピジェネティックパターンにおける異常な変化、および核酸メチル化における異常な変化が挙げられる。
【0038】
「ポリヌクレオチド」という用語は、本明細書において使用されるとき、一般に、1つまたは複数の核酸サブユニットを含む分子を指す。ポリヌクレオチドには、アデノシン(A)、シトシン(C)、グアニン(G)、チミン(T)、およびウラシル(U)、またはそれらのバリアントから選択される1つまたは複数のサブユニットが含まれ得る。ヌクレオチドは、A、C、G、T、もしくはU、またはそれらのバリアントを含み得る。ヌクレオチドは、成長している核酸の鎖に組み込むことができる任意のサブユニットを含み得る。そのようなサブユニットは、A、C、G、T、もしくはUであるか、あるいは1つもしくは複数の相補的なA、C、G、T、もしくはUに特異的であるか、またはプリンに相補的であるか(すなわち、AもしくはG、またはそれらのバリアント)もしくはピリミジンに相補的である(すなわち、C、T、もしくはU、またはそれらのバリアント)、任意の他のサブユニットであり得る。サブユニットは、個々の核酸塩基または塩基の群(例えば、AA、TA、AT、GC、CG、CT、TC、GT、TG、AC、CA、またはそれらのウラシル対応物)が、分解されるのを可能にし得る。一部の実施例では、ポリヌクレオチドは、デオキシリボ核酸(DNA)もしくはリボ核酸(RNA)、またはそれらの誘導体である。ポリヌクレオチドは、一本鎖であっても二本鎖であってもよい。
【0039】
「対象」という用語は、本明細書において使用されるとき、一般に、動物、例えば、哺乳動物(例えば、ヒト)もしくは鳥類(例えば、鳥)、または他の生物、例えば、植物を指す。より具体的には、対象は、脊椎動物、哺乳動物、マウス、霊長類、サル、またはヒトであり得る。動物には、家畜動物、競技動物、および愛玩動物が含まれるが、これらに限定されない。対象は、健康な個体、疾患もしくは疾患の傾向を有するかもしくは有すると疑われる個体、または治療を必要とするかもしくは治療を必要とすると疑われる個体であり得る。対象は、患者であり得る。
【0040】
「ゲノム」という用語は、一般に、生物の遺伝情報の全体を指す。ゲノムは、DNAまたはRNAのいずれかでコードされ得る。ゲノムは、タンパク質をコードするコーディング領域、ならびに非コーディング領域を含み得る。ゲノムは、1つの生物におけるすべての染色体の配列を一緒に含み得る。例えば、ヒトゲノムは、合計で46個の染色体を有する。これらのすべての配列が一緒になって、ヒトゲノムを構成する。「参照ゲノム」は、典型的に、ハプロイドゲノムを指す。参照ゲノムとしては、例えば、hg19、またはNCBIのBuild 37もしくはBuild 38が挙げられる。
【0041】
「アダプター(adaptor)」、「アダプター(adapter)」、および「タグ」という用語は、本明細書全体を通じて、同義で使用される。アダプターまたはタグは、ライゲーション、ハイブリダイゼーション、または他のアプローチを含む任意のアプローチによって、「タグ付け」しようとするポリヌクレオチド配列に連結することができる。
【0042】
「ライブラリーアダプター(library adaptor)」または「ライブラリーアダプター(library adapter)」という用語は、本明細書において使用されるとき、一般に、生物学的試料(本明細書において「試料」とも)において、同一性(例えば、配列)を使用してポリヌクレオチドを区別することができる、分子(例えば、ポリヌクレオチド)を指す。
【0043】
「シーケンシングアダプター」という用語は、本明細書において使用されるとき、一般に、シーケンシング機器が、シーケンシングを可能にするように標的ポリヌクレオチドと相互作用することなどによって、標的ポリヌクレオチドをシーケンシングするのを可能にするように適合される、分子(例えば、ポリヌクレオチド)を指す。シーケンシングアダプターは、標的ポリヌクレオチドを、シーケンシング機器によってシーケンシングすることを可能にする。ある実施例では、シーケンシングアダプターは、シーケンシングシステムの固体支持体、例えば、フローセルに付着した捕捉ポリヌクレオチドにハイブリダイズまたは結合するヌクレオチド配列を含む。別の実施例では、シーケンシングアダプターは、ポリヌクレオチドにハイブリダイズまたは結合してヘアピンループを生成する、ヌクレオチド配列を含み、このヘアピンループは、標的ポリヌクレオチドをシーケンシングシステムによってシーケンシングすることを可能にする。シーケンシングアダプターは、シーケンサーモチーフを含み得、これは、他の分子(例えば、ポリヌクレオチド)のフローセル配列に相補的であり、標的ポリヌクレオチドのシーケンシングを行うためにシーケンシングシステムによって使用可能である、ヌクレオチド配列であり得る。シーケンサーモチーフはまた、合成によるシーケンシング(SBS)など、シーケンシングにおいて使用するためのプライマー配列を含み得る。シーケンサーモチーフは、ライブラリーアダプターをシーケンシングシステムに連結し、標的ポリヌクレオチドのシーケンシングを行うために必要とされる、配列を含み得る。
【0044】
本明細書において使用されるとき、「少なくとも」、「多くとも」、または「約」という用語は、系列の前にある場合、別途示されない限り、その系列のそれぞれのメンバーを参照する。
【0045】
参照される数値に関連する、用語「約」およびその文法上の同等物は、その値から最大で±10%の範囲の値を含み得る。例えば、「約10」という量は、9~11の量を含み得る。他の実施形態では、参照される数値に関連する「約」という用語は、その値の±10%、9%、8%、7%、6%、5%、4%、3%、2%、または1%の範囲の値を含み得る。
【0046】
一般に、様々な処置に応答した経時的な腫瘍進化の予測モデルを生成するため、およびそのモデルを使用して、対象(例えば、患者)の処置を選択するための方法が、本明細書において開示される。予測モデルは、少なくとも、腫瘍の遺伝子プロファイル、ならびに任意選択で患者プロファイルおよび/または処置に基づく。結果は、ケアを改善するために、患者または医療提供者に開示され得る。
【0047】
一部の事例では、情報は、無細胞体液(例えば、cfDNA)のジェノタイピングを行うことによって得られた腫瘍からの遺伝子プロファイルを含む。一部の事例では、情報は、対象に提供された処置および/または治療介入をさらに含む。一部の事例では、情報は、対象のプロファイルをさらに含む。
【0048】
情報は、対象と関連する状態を判定するために使用することができる。状態は、対象の後続状態を予測することに関連する情報を含み得る。例えば、状態は、対象が、生きているかまたは死んでいるかを示し得る。状態は、対象の余命中央値を示し得る。状態は、腫瘍における医学的に関連性のある体細胞変異(例えば、KRASバリアント)を示し得る。状態は、薬物耐性(例えば、セツキシマブ耐性)を示し得る。
【0049】
情報は、特定の状態を呈する対象の様々なエンドポイントの確率を示す、1つまたは複数の決定ツリーを生成するために使用され得る。決定ブランチが、ルートノード(第1の決定ノードと考えることができる)から生じ得る。決定ブランチは、エンドポイント(終端ノードとも呼ばれる)または機会ノードのいずれかへとつながり得る。終端ノードまたはエンドポイントは、状態を表し得る。機会ノード(または事象ノード)は、不確実性の点であり得、そこから異なる結果となることが可能である。不確実性は、機会ノードから生じている機会ブランチ(事象ブランチ)を通じて解決され得る。それぞれの機会ブランチは、終端ノード、または複数の決定ブランチが生じる決定ノード(それ自体が、状態を表し得る)のいずれかにつながり得る。これらの決定ブランチは順に、すべてのブランチが、エンドポイントまたは終端ノードにつながるまで、連続的な様式で、エンドポイントまたは機会ノードへとつながり得る。
【0050】
決定ツリーにおけるルートノードは、初期状態であり得る。初期状態は、「がん診断」と同じくらい広範であり得る。より典型的には、ルートノードは、対象の遺伝子プロファイルの何らかの態様を示す。例えば、ルートノードは、cfDNAにおいて検出された1つまたは複数の遺伝子バリアント、例えば、特定のがん遺伝子における変異体の存在および/または正常なDNAと比較したそれらの量を示し得る。ルートノードからのそれぞれの決定ブランチは、異なる処置過程(または処置がないこと)を表し得る。例えば、処置過程は、異なる化学療法または免疫療法のレジメン、外科手術の種類、または放射線照射を表し得る。終端ノードは、状態、例えば、生存または死亡、例えば、診断からある特定の期間内におけるもの(例えば、5年生存率)を表し得る。決定ノードは、新たな状態を表し、そこから新しい決定がなされ得る。例えば、決定ノードは、化学療法耐性をもたらす遺伝子バリアントの発生である。そのようなバリアントは、腫瘍が化学療法に対する応答を回避し、異なる治療的アプローチが必要となり得る、回避経路を表し得る。
【0051】
有利なことには、本明細書において開示される方法は、特定の状態に適用される何らかの治療介入(例えば、特定の遺伝子プロファイルを有するがんのための特定の化学療法剤)が、がんが治療介入を回避し得る特定の状態(例えば、遺伝子バリアント)をもたらすことになる確率を判定するように構成される、予測アルゴリズムを生成することができる。そのような確率は、複数回の処置および回避を通じて判定され得る。結果として、特定の一連の治療介入が、特定の回避様式、最終的な回避(例えば、死亡)、または所与の頻度もしくは確率でがんが検出できない状態をもたらすことを判定することができる。
【0052】
本開示は、決定ツリーにおいて、それぞれのブランチまたはそれぞれの終端ノードに、確率を割り当てるための予測アルゴリズムを生成する方法を提供する。本方法は、それぞれのブランチにおける結果を、データが記憶されている複数の対象から計算することができる、データベースを利用し得る。確率は、例えば、対象の訓練セットを取得し、それらを、状態に分類し、処置および/または治療介入を記録し、次いで、転帰(例えば、最終状態)の頻度を判定することによって、判定することができる。訓練セットにおける所与の転帰の頻度を使用して、その確率を判定することができる。
【0053】
したがって、特定の状態を呈する複数の対象について、複数の決定ブランチが特定され得、特定のエンドポイントまたはそのブランチの末端の決定ノードの機会が、判定され得る。例えば、図6を参照すると、「EGFR変異体」という状態を呈する個体の中では、決定ブランチには、処置Aおよび処置Bが含まれ得る。
【0054】
図6において、処置Aは、機会ノードAにつながっており、処置Bは、機会ノードBにつながっている。機会ノードAは、その時点で5年生存率(終端ノード)75%、およびその時点での「回避A」の発生(決定ノードA)25%につながっている。回避Aは、1つの決定ブランチ-処置Cを有し得る。これは、機会ノードCにつながっており、そこから、2つの機会ブランチが終端ノードへと生じている:40%が5年生存および60%が死亡。合計すると、このブランチは、5年生存の機会が85%、死亡の機会が15%となる。
【0055】
図6において、処置Bは、機会ノードBにつながっている。機会ノードBは、その時点で5年生存率(終端ノード)60%、およびその時点での「回避B」の発生(決定ノードB)40%につながっている。回避Bは、1つの決定ブランチ-処置Dを有し得る。これは、機会ノードDにつながっており、そこから、2つの機会ブランチが終端ノードへと生じている:40%が5年生存および60%が死亡。合計すると、このブランチは、5年生存の機会が76%、死亡の機会が24%となる。
【0056】
任意の決定ノードにおいてより多くのデータ点(対象)を追加することにより、判定される最終的な確率の信頼性が増加し得る。一部の事例では、初期状態を使用して、後続状態(例えば、中間状態(例えば、決定ノードにおいて)または最終状態)を予測することができる。一部の事例では、初期状態は、所与の頻度で後続状態(例えば、中間状態または最終状態)につながるものとして分類される。後続状態は、以前の状態からの決定の後に達成される状態である。例えば、状態1の後に、治療介入が適用され、それよりも後の時点の状態が、後続状態である。後続状態は、そこからさらなる決定が行われない終端状態であってもよく、または後続状態は、そこから別の決定が行われる中間状態であってもよい。
【0057】
初期状態は、対象に関して判定された情報または情報のサブセットに基づいて、対象をクラスタリングすることによって判定することができる。対象に関する情報または対象の訓練セットを使用して、クラスターを生成することができる。例えば、情報は、カテゴリによるものであり得(例えば、KRASバリアントが腫瘍試料に存在するかまたは不在であるか)、対象は、共通のカテゴリ値に基づいてクラスタリングされ得る。一部の事例では、対象に関する情報は、定量的である。対象は、当該技術分野において公知の任意の方法によって、定量的データを使用して、クラスタリングされ得る。例示的な方法としては、k平均クラスタリング法、階層的クラスタリング法、またはセントロイドに基づくクラスタリング法が挙げられるが、これらに限定されない。クラスタリングは、主成分分析などの方法によって低減された数の次元に投影されているデータを含む、データの目視検査に基づき得る。クラスタリングを使用して、対象がどのクラスターに入るかを定義するクラスター境界を作成することができる。
【0058】
プロファイルは、1つまたは複数の特性のそれぞれについての値(定量的または定性的)を含む。プロファイルは、例えば、表現型特性、遺伝子特性、人口統計特性、または病歴(送達された治療介入の履歴を含む)に関する情報を含み得る。遺伝子プロファイルは、様々な遺伝子特性、例えば、ある遺伝子座における遺伝子バリアント(例えば、コピー数情報の配列情報)に関する値を含む。例えば、遺伝子プロファイルは、病的(例えば、がん)細胞における、いくつかの遺伝子座における生殖細胞系遺伝子型または体細胞遺伝子型を含み得る。状態は、プロファイルにおける特性の1つまたは複数の値であり得る。
【0059】
情報は、腫瘍の遺伝子プロファイルを含む、腫瘍プロファイルを含み得る。情報は、対象に関する遺伝子情報を含む、対象プロファイルを含み得る。情報は、対象が受けた以前の処置または治療介入を含み得る。
【0060】
腫瘍のプロファイルは、起源組織、腫瘍量、腫瘍の薬物感受性、腫瘍のステージ、腫瘍のサイズ、腫瘍の代謝プロファイル、腫瘍の転移状況、腫瘍量、または腫瘍の不均一性を含み得る。
【0061】
腫瘍のプロファイルは、様々な方法によって得ることができる腫瘍の遺伝子プロファイルを含み得る。例えば、腫瘍の遺伝子プロファイルは、高スループットシーケンシングまたはジェノタイピングアレイによって、対象からの生物学的試料に由来する核酸を分析することによって、得ることができる。核酸は、DNAまたはRNAであり得る。核酸は、試料から単離される。遺伝子プロファイルを得るために使用される試料は、腫瘍生検、微細針吸引生検、または腫瘍細胞由来の核酸を含有する無細胞体液であり得る。例えば、無細胞体液は、対象の血液、血漿、血清、尿、唾液、粘膜分泌物、喀痰、糞便、脳脊髄液、および涙液からなる群から選択される体液に由来し得る。
【0062】
例えば、がんの危険性のある対象由来の血液を、本明細書において記載されるように、採血および調製して、無細胞ポリヌクレオチド集団を生成することができる。一実施例では、これが、無細胞DNA(cfDNA)である。本開示のシステムおよび方法を用いて、存在しているある特定のがんにおいて存在し得る変異またはコピー数多型を検出することができる。本方法は、疾患の症状または他の特質の不在に関係なく、体内のがん性細胞の存在を検出することに役立ち得る。
【0063】
核酸の抽出および精製のための方法は、当該技術分野において周知である。例えば、核酸は、フェノール、フェノール/クロロホルム/イソアミルアルコール、またはTRIzolおよびTriReagentを含む類似の製剤を用いた有機抽出によって、精製することができる。抽出技法の他の非限定的な例としては、(1)有機抽出に続いて、例えば、自動化核酸抽出装置、例えば、Applied Biosystems(Foster
City、CA)から入手可能なModel 341 DNA Extractorの使用を伴ってかまたは伴わずに、フェノール/クロロホルム有機試薬を使用する、エタノール沈降、(2)静止相(stationary phase)吸収法、ならびに(3)典型的には「塩析」方法と称される沈降法である、塩に誘導される核酸沈降法が挙げられる。核酸の単離および/または精製の別の例は、核酸が特異的または非特異的に結合する磁性粒子を使用し、続いて、磁石を使用してビーズを単離し、核酸を洗浄し、ビーズから溶出させ得る。一部の実施形態では、上述の単離方法には、望ましくないタンパク質を試料から排除するのに役立つ酵素消化ステップ、例えば、プロテイナーゼKまたは他の同様のプロテアーゼによる消化が先行し得る。所望される場合、RNase阻害剤を、溶解緩衝液に添加してもよい。ある特定の細胞または試料の種類については、タンパク質変性/消化ステップを、プロトコールに追加することが望ましい場合がある。精製方法は、DNA、RNA、または両方を単離するように誘導され得る。DNAおよびRNAの両方を、抽出手順の最中または後に一緒に単離する場合、一方または両方を互いに別個に精製するために、さらなるステップが用いられ得る。抽出された核酸の部分的画分もまた、例えば、サイズ、配列、または他の物理的性質もしくは化学的性質による精製により、生成することができる。
【0064】
試料から抽出されたポリヌクレオチドのシーケンシングを行って、シーケンシングリードを生成することができる。例示的なシーケンシング技法としては、例えば、エマルジョンポリメラーゼ連鎖反応(PCR)(例えば、Roche 454からのピロシーケンシング、Ion Torrentからの半導体シーケンシング、Life TechnologiesからのライゲーションによるSOLiDシーケンシング、Intelligent Biosystemsからの合成によるシーケンシング)、フローセル上でのブリッジ増幅(例えば、Solexa/Illumina)、Wildfire技術による等温増幅(Life Technologies)、またはローリングサークル増幅(Complete Genomics、Intelligent Biosystems、Polonator)によって生成されるロロニー(rolony)/ナノボールを挙げることができる。事前のクローン増幅を伴うことなく単一分子の直接的なシーケンシングが可能である、Heliscope(Helicos)、SMRT技術(Pacific Biosciences)、またはナノ細孔シーケンシング(Oxford Nanopore)などのシーケンシング技術が、好適なシーケンシングプラットフォームであり得る。シーケンシングは、標的の富化を伴ってかまたは伴わずに実施され得る。富化され得る例示的な遺伝子および/または領域は、図5に見出される。富化は、例えば、核酸試料またはシーケンシングライブラリーの、アレイに配置されているかまたはビーズに付着しているプローブへのハイブリダイゼーションによって実施され得る。一部の事例では、試料に由来するポリヌクレオチドを、シーケンシングの前および/または最中に、任意の好適なアプローチ(例えば、PCR)によって増幅させる。
【0065】
非限定的な例として、初期遺伝子材料を含有する試料が提供され、無細胞DNAが抽出され得る。試料には、低い存在度で、標的核酸が含まれ得る。例えば、正常なゲノムまたは生殖細胞系ゲノムに由来する核酸が、試料において優勢であり得、この試料は、20%を上回らない、10%を上回らない、5%を上回らない、1%を上回らない、0.5%を上回らない、または0.1%を上回らない、遺伝子変化を含有する少なくとも1つの他のゲノム、例えば、がんゲノム、胎児ゲノム、または別の個体もしくは種に由来するゲノムに由来する核酸も含む。次に、初期遺伝子材料を、タグ付けした親ポリヌクレオチドのセットに変換し、シーケンシングを行い、シーケンシングリードを得ることができる。一部の事例では、これらの配列のリードは、バーコード情報を含有し得る。他の実施例では、バーコードは利用されない。タグ付けは、初期遺伝子材料中の分子に、配列タグを付加することを含み得る。配列タグは、同じ参照配列にマッピングされるすべての固有なポリヌクレオチドが、固有の識別タグを有するように、選択され得る。配列タグは、同じ参照物にマッピングされるすべての固有なポリヌクレオチドが、固有の識別タグを有するわけではないように、選択され得る。変換は、高い効率で、例えば、初期核酸分子のうちの少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、または少なくとも80%に、実施され得る。タグ付けした親ポリヌクレオチドのセットを増幅させて、増幅した子孫ポリヌクレオチドのセットを得ることができる。増幅は、例えば、少なくとも10、100、1,000、または10,000倍であり得る。増幅した子孫ポリヌクレオチドのセットは、得られるシーケンシングリードが、(1)タグ付けした親ポリヌクレオチドのセットにおいて標的数の固有の分子をカバーし、かつ(2)ある標的カバレッジ倍率(例えば、親ポリヌクレオチドの5倍~10倍のカバレッジ)、タグ付けした親ポリヌクレオチドのセットにおいて固有の分子をカバーするような両方のサンプリング率で、シーケンシングのためにサンプリングされる。シーケンシングリードのセットを集約して、固有のタグ付けした親ポリヌクレオチドに対応するコンセンサス配列のセットを得ることができる。シーケンシングリードは、分析に含めるために、品質確認が行われ得る。例えば、品質管理スコアに満たないシーケンシングリードは、プールから除去され得る。
【0066】
シーケンシングリードは、特定の固有の親分子に由来する子孫分子のリードを表すファミリーにソートすることができる。例えば、増幅された子孫ポリヌクレオチドのファミリーは、単一の親ポリヌクレオチドに由来するこれらの増幅された分子を構成し得る。ファミリー内の子孫の配列を比較することによって、当初の親ポリヌクレオチドのコンセンサス配列を、推定することができる。これにより、タグ付けされたプール内で固有の親ポリヌクレオチドを表すコンセンサス配列のセットが得られる。このプロセスにより、配列に信頼性スコアが割り当てられ得る。シーケンシングの後に、リードには、品質スコアが割り当てられ得る。品質スコアは、閾値に基づいて、これらのリードが後続の分析において有用であり得るかどうかを示す、リードの表示であり得る。一部の事例では、いくつかのリードは、後続のマッピングステップを実施するのに十分な品質または長さではない。所定の品質スコア(例えば、90%を上回る)を有するシーケンシングリードを、データからフィルタリングすることができる。指定された品質スコア閾値を満たすシーケンシングリードは、参照ゲノム、またはコピー数多型を含有しないことが判明している鋳型配列に、マッピングされ得る。マッピングアライメント後に、シーケンシングリードには、マッピングスコアが割り当てられ得る。マッピングスコアは、それぞれの位置が固有にマッピングされるか、されないかを示す、参照配列にマッピングし戻された表示またはリードであり得る。事例では、リードは、コピー数多型分析とは無関係の配列であり得る。例えば、一部のシーケンシングリードは、混入ポリヌクレオチドを起源とし得る。シーケンシングリードが、少なくとも90%、95%、99%、99.9%、99.99%、または99.999%がミスマッピングされている(例えば、誤ってマッピングされている)ことを示すマッピングスコアを有するシーケンシングリードは、データセットからフィルタリングされ得る。他の事例では、所定のパーセンテージよりも低いマッピングスコアが割り当てられたシーケンシングリードは、データセットからフィルタリングされ得る。
【0067】
指定された品質スコア閾値を満たすシーケンシングリードは、参照ゲノム、またはコピー数多型を含有しないことが公知の鋳型配列に、マッピングされ得る。マッピングアライメント後に、シーケンシングリードには、マッピングスコアが割り当てられ得る。事例では、リードは、コピー数多型分析とは無関係の配列であり得る。データのフィルタリングおよびマッピングの後に、複数のシーケンシングリードにより、染色体のカバレッジ領域が生成される。これらの染色体領域は、可変の長さのウインドウまたはビンに分割され得る。一部の事例では、ウインドウ領域のそれぞれは、ほぼ同じ数の固有にマッピング可能な塩基を含有するような、サイズにされ得る。加えて、ゲノム全体で、シーケンシングすることが困難であるかまたは実質的に高いGCバイアスを含有することが判明している所定のウインドウは、データセットからフィルタリングされ得る。例えば、染色体のセントロメア近傍に収まることが公知の領域(すなわち、セントロメアDNA)は、偽陽性結果をもたらし得る高頻度反復配列を含有することが公知である。これらの領域は、フィルタリングされ得る。正規化を実施して、試料のシーケンシングリードに対するGCコンテンツの影響を補償してもよい。異常に高い濃度の他の高頻度反復配列、例えば、マイクロサテライトDNAを含有する領域など、ゲノムの他の領域が、データセットからフィルタリングされ得る。
【0068】
無細胞ポリヌクレオチド配列に由来する例示的なゲノムについては、次のステップは、それぞれのウインドウ領域のリードカバレッジを判定することを含む。これは、バーコードありのリードまたはバーコードなしのリードのいずれかを使用して、実施され得る。バーコードなしの場合、これまでのマッピングステップが、異なる塩基位置のカバレッジを提供し得る。十分なマッピングスコアおよび品質スコアを有し、フィルタリングされない染色体ウインドウ内に入るシーケンシングリードを、計数することができる。カバレッジリードの数には、それぞれのマッピング可能な位置のスコアが割り当てられ得る。バーコードが関与する場合、同じバーコード、物理的特性、またはこれら2つの組合せを有するすべての配列は、すべてが試料親分子に由来するため、1つのリードに集約され得る。このステップにより、増幅を伴うステップなど、先行するステップのいずれかの間に導入されている可能性があるバイアスを低減することができる。例えば、一つの分子は10回増幅されたが、別の分子が1000回増幅されている場合、それぞれの分子は、集約後には1回だけ表示され、それによって、不均等な増幅の影響がない状態にする。固有のバーコードを有するリードのみが、それぞれのマッピング可能な位置で計数され得、割り当てられるスコアに影響を及ぼし得る。この理由のため、バーコードライゲーションステップを、生じるバイアスが最低量となるように最適化された様式で実施することが、重要である。それぞれの塩基の配列は、その特定の場所に関して最も優勢なヌクレオチドリードとしてアライメントされ得る。さらに、固有の分子の数を、それぞれの位置で計数して、それぞれの位置で同時の定量化を導くことができる。このステップにより、増幅を伴うステップなど、先行するステップのいずれかの間に導入されている可能性があるバイアスを低減することができる。
【0069】
それぞれのウインドウ領域の別個のコピー数状態を利用して、染色体領域におけるコピー数多型を特定することができる。一部の事例では、同じコピー数を有するすべての隣接するウインドウ領域を、1つのセグメントに統合して、コピー数多型状態の存在または不在を報告することができる。一部の事例では、様々なウインドウが、フィルタリングされた後に他のセグメントと統合され得る。
【0070】
遺伝子プロファイル(例えば、腫瘍または対象の遺伝子プロファイル)を判定するための方法は、エラー率を有し得る。例えば、シーケンシング方法は、約0.1%、約0.5%、約1%、またはそれよりも高い、塩基ごとのエラー率を有し得る。一部の事例では、所与の遺伝子座に遺伝子バリアントを含む腫瘍細胞に由来する核酸は、塩基ごとのシーケンシングエラー率に類似するかまたはそれよりも低い比率で、その遺伝子座を含む全核酸中にわずかに存在する。そのような状況では、ジェノタイピングまたはシーケンシングのエラーと、低頻度で存在する遺伝子バリアントとの間を区別することは困難であり得る。エラー率を低減させるために、WO2014/149134(参照によりその全体が組み込まれる)に記載されているものなど、ある特定の手法が実施され得る。
【0071】
腫瘍の遺伝子プロファイルは、参照物と比較して体細胞変異を含み得る。参照物は、参照ゲノム、例えば、ヒト参照ゲノムであり得る。参照ゲノムは、対象の生殖細胞系ゲノムであってもよい。遺伝子プロファイルは、腫瘍細胞の一部またはすべてによって獲得された、様々な遺伝子バリアントを含み得る。遺伝子バリアントは、例えば、単一ヌクレオチドバリアント、全体的もしくは小規模な構造的バリアント、または短い挿入もしくは欠失であり得る。例えば、図2Aに示されるように、がんゲノムにおける一般的な異常は、異常な染色体数(異数性)およびがんゲノムの染色体構造をもたらし得る。図2Aにおいて、上の線は、生殖細胞系ゲノムのゲノムを示し、下の線は、体細胞異常を有するがんゲノムを示す。二重線は、ヘテロ接合性およびホモ接合性の変化を鑑別することが有用な場合に、使用される。点は、単一のヌクレオチドの変化を表し、一方で線および矢印は、構造的変化を示す。
【0072】
腫瘍の遺伝子プロファイルは、それぞれのバリアントに関する定量的情報を含み得る。例えば、デジタルシーケンシングによる無細胞DNAの遺伝子分析により、第1のがん遺伝子の遺伝子座にマッピングする1,000個のリードを得ることができ、そのうち900個のリードが、生殖細胞系配列に対応し、100個のリードが、腫瘍細胞に存在するバリアントに対応する。同じ遺伝子分析により、第2のがん遺伝子の遺伝子座にマッピングする1,000個のリードを得ることができ、そのうち980個のリードが、生殖細胞系配列に対応し、20個のリードが、10%の腫瘍量を示すバリアントに対応する。全体的な腫瘍量が、第1のがん遺伝子の遺伝子座に基づいて無細胞DNA中約10%であるが、腫瘍細胞のごく一部(約20%)が、第2のがん遺伝子の遺伝子座にバリアントを有し得ることを推測することができる。そのような定量的情報は、腫瘍の遺伝子プロファイルに含まれ得、経時的にまたは処置に応答して、モニタリングされ得る。
【0073】
腫瘍の遺伝子プロファイルには、体細胞バリアントに関する情報が含まれ得る。これらとしては、変異、挿入欠失(挿入または欠失)、コピー数多型、転換、転位、逆転、欠失、異数性、部分異数性、倍数性、染色体不安定性、染色体構造改変、遺伝子融合、染色体融合、遺伝子短縮、遺伝子増幅、遺伝子重複、染色体病変、DNA病変、核酸化学修飾における異常な変化、エピジェネティックパターンにおける異常な変化、核酸メチル化における異常な変化、感染、およびがんが挙げられるが、これらに限定されない。
【0074】
一部の事例では、ジェノタイピングは、無細胞体液からの核酸のジェノタイピングを行うことを含む。そのような方法は、複数の腫瘍細胞からの遺伝子情報を捕捉することができ、腫瘍の不均一性および腫瘍の進化の両方に関する情報を推測することが可能となる。一部の事例では、ジェノタイピングは、少なくとも1つの時点、少なくとも2つの時点、少なくとも3つの時点、少なくとも4つの時点、少なくとも5つの時点、少なくとも6つの時点、少なくとも7つの時点、少なくとも8つの時点、少なくとも9つの時点、または少なくとも10個の時点から得られた試料に実施し得る。一部の事例では、ジェノタイピングは、少なくとも50、55、60、65、70、75、80、85、90、95、100、120、140、160、180、または200個、またはそれよりも多くの遺伝子座の遺伝子型を判定することを含む。一部の事例では、遺伝子座は、遺伝子である。一部の事例では、遺伝子座は、がん遺伝子である。がん遺伝子は、腫瘍成長を駆動する変異を含む遺伝子である。例示的ながん遺伝子は、WO2009045443に見出すことができ、これは、参照によりその全体が本明細書に組み込まれる。がん遺伝子は、図5に列挙されている遺伝子を含み得る。
【0075】
一部の事例では、腫瘍の遺伝子プロファイルは、腫瘍進化に関する情報を含み得る。例えば、KRAS変異が存在する腫瘍由来の無細胞DNAの比率が増加している場合、KRASを標的とする特定の処置に対して耐性である腫瘍細胞の比率が、時間とともに増加していることが推測され得る。図1は、処置に応答した腫瘍進化のモデルを開発する例示的な方法を示す。図1のプロセスは、複数の対象の腫瘍の遺伝子プロファイルデータならびに腫瘍処置および当初の処置を収集すること(10)を含む。遺伝子プロファイルを使用して、処置に対する耐性を引き起こす腫瘍細胞によって取られる進化的な回避経路を特定するか、または推測することができる(12)。個々の対象の腫瘍の遺伝子プロファイルを、モデルに当てはめて、腫瘍細胞が処置に対する耐性をもたらす遺伝子バリアントを獲得する確率を得ることができる(14)。
【0076】
より複雑なモデルを使用して、例えば、無細胞DNAにおける異なるバリアントの相対的発生率に基づいて、腫瘍の不均一性を測定することができる。図2Bは、様々な状態転帰の確率を判定するための例示的なシステムを示す。このシステムは、隠れマルコフモデル(HMM)であり得、これは、モデリングされているシステムが、観測されない(隠れた)状態を有するマルコフ過程であることが想定される、統計学的マルコフモデルである。単純マルコフモデル(マルコフ連鎖と同様)では、状態は、観測者に直接見えており、したがって、状態遷移確率が、唯一のパラメーターである。隠れマルコフモデルでは、状態は、直接見ることができないが、状態に応じた出力は、見ることができる。それぞれの状態は、可能性のある出力トークン全体にわたる確率分布を有する。したがって、HMMによって生成されるトークンの配列により、状態の配列に関する情報を得ることができる。隠れマルコフモデルは、混合成分がそれぞれの観測に選択されるのを制御する隠れた変数(または潜在的変数)が、互いに独立しているのではなく、マルコフ過程を通じて関連付けられている、混合分布モデル(mixture model)の一般化と考えることができる。図2Bに示されるように、HMMは、典型的に、隠れた状態のセット、状態遷移確率の行列、および出力確率の行列によって定義される。そのようなモデルを構築するための一般的な方法としては、隠れマルコフモデル(HMM)、人工ニューラルネットワーク、ベイジアンネットワーク、サポートベクターマシン、およびランダムフォレストが挙げられるが、これらに限定されない。そのような方法は、当業者に公知であり、参照によりその全体が本明細書に組み込まれるMITPressによって刊行されたMohriら、Foundationsof Machine Learning(2012年)、および参照によりその全体が本明細書に組み
込まれるCambridge University Pressによって刊行されたMacKay、Information Theory, Inference,andLearning Algorithms(2003年)に詳細に記載されている。
【0077】
無細胞ポリヌクレオチドの試料中の腫瘍ポリヌクレオチドの相対量は、本明細書において、「腫瘍量」と称される。腫瘍量は、腫瘍サイズに関連し得る。経時的に試験すると、腫瘍量を使用して、がんが進行しているか、安定しているか、または寛解状態にあるかを判定することができる。一部の実施形態では、推測される腫瘍量の信頼区間はオーバーラップせず、疾患進展の方向を示す。腫瘍量および疾患進展の方向は、診断信頼性指標(diagnostic confidence indication)を有し得る。「診断信頼性指標」という用語は、本明細書において使用されるとき、遺伝子バリアントの存在およびその存在がどの程度信頼されるかを示すように割当てられた、表現、数、順位、程度、または値を指す。例えば、この表現は、とりわけ、2進数の値、またはA~Zの英数字順位であり得る。さらに別の実施例では、診断信頼性指標は、とりわけ、0~100の任意の値を有し得る。さらに別の実施例では、診断信頼性指標は、範囲または程度、例えば、「低い」または「高い」、「より多い」または「より少ない」、「増加した」または「減少した」によって表すことができる。低い診断信頼性指標は、遺伝子バリアントの存在が、それほど信頼できない(遺伝子バリアントはノイズの可能性がある)ことを意味し得る。高い診断信頼性指標は、遺伝子バリアントが存在している可能性が高いことを意味し得、一実施形態では、その診断信頼性指標が、100のうち25~30よりも低い場合には、結果が信頼できないと考える。
【0078】
一実装では、実質的に同時に、または複数の時点にわたって、採取された複数の試料からの測定値を使用して、それぞれのバリアントの診断信頼性指標を、コピー数多型(CNV)または変異の観測を予測する信頼性を示すように調節することができる。信頼性は、複数の時点における測定を使用してがんが進行しているか、寛解状態にあるか、または安定しているかを判定することによって、増加し得る。診断信頼性指標は、多数の公知の統計学的方法のうちのいずれかによって割り当てることができ、少なくとも部分的に、測定値がある期間にわたって観測される頻度に基づき得る。例えば、現在の結果と以前の結果との統計学的相関付けを、行うことができる。代替として、それぞれの診断について、最大尤度または最大事後決定を、複数の測定値または時点から特定の試験事象が生じる頻度に基づいて行うことができるように、隠れマルコフモデルを構築してもよい。このモデルの一部として、特定の決定についてのエラーの確率および結果として得られる診断信頼性指標が、同様に出力され得る。この様式では、パラメーターの測定値は、それらがノイズ範囲内にあるかどうかに関係なく、信頼区間とともに提供され得る。経時的に試験することで、経時的に信頼性区間を比較することによって、がんが進行しているか、安定しているか、または寛解状態にあるかの予測信頼性を増加させることができる。2つの時点は、約1ヶ月から約1年、約1年から約5年、または約3ヶ月を超えることなく、離れていてもよい。
【0079】
図2Cは、次世代シーケンシングデータから腫瘍系統発生を推測するための図2Bのシステムによって生成される例示的なモデルを示す。サブクローンは、進化的な変異獲得のプロセスによって、互いに関連する。この実施例では、3つのクローン(葉ノード)は、4つの単一ヌクレオチドバリアント(SNV)セットA、B、C、およびDの異なる組合せによって特徴付けられる。ツリーのエッジにあるパーセンテージは、この特定のSNVのセットを有する細胞の画分を示し、例えば、全細胞の70%がAを有し、40%がさらにBを有し、7%のみがA、B、およびDを有する。
【0080】
図2Dは、腫瘍の進化歴中に発達する、例示的な、正常細胞およびがんサブクローンの不均一な集合を示す。腫瘍の進化歴により、正常細胞(小さな円盤)およびがんサブクローン(大きな円盤、三角形、正方形)の不均一な集合が生じる。それらの子孫によって完全に置き換えられている内部ノード(SNVセットAおよびBを含み、CまたはDを有さないものなど)は、もはや腫瘍の一部ではない。
【0081】
医療予後診断提供者と1つまたは複数の医療サービス提供者、例えば、医師、病院、医療保険者(例えば、Blue Cross)またはマネジドケア組織(例えば、Kaiser Permanente)との間に、パートナーシップが確立され得る。医療サービス提供者は、医療予後診断提供者に、cfDNAを含む1つまたは複数の対象試料、および対象に関する遺伝子情報に加えて、またはそれ以外に、医療情報を含む、1つまたは複数の医療記録を提供し得る。医療情報は、医療予後診断提供者が医療記録にアクセスすることを可能にする、安全な通信リンクを通じて、提供され得る。医療予後診断提供者は、試料に由来するcfDNAのシーケンシングを行うことができ(またはシーケンシングを行っており)、本開示の方法において使用されるべき情報を含む、医療記録を作成することができる。医療サービス提供者は、cfDNAを含む新しい試料を提供することができ、そして/または決定ノードを通る情報対象を更新することができる。予測モデルは、新しい情報が利用可能となると、反復的に更新され得る。
【0082】
遺伝子プロファイルを決定するプロセスの概要を、図3に提供する。このプロセスでは、血液試料または他の身体試料に由来する遺伝子材料を受け取る(102)。プロセスは、遺伝子材料に由来するポリヌクレオチドを、タグ付けした親ヌクレオチドに変換する(104)。タグ付けした親ヌクレオチドを、増幅して、増幅された子孫ポリヌクレオチドを得る(106)。増幅したポリヌクレオチドのサブセットのシーケンシングを行って、シーケンシングリードを得(108)、これを、それぞれが固有のタグ付けした親ヌクレオチドから生成された、ファミリーにグループ分けする(110)。選択された遺伝子座において、プロセスは、それぞれのファミリーにそれぞれのファミリーの信頼性スコアを割り当てる(112)。次いで、以前の読取りを使用して、コンセンサスを判定する。これは、それぞれのファミリーの以前の信頼性スコアを考察することによって行われ、一貫した以前の信頼性スコアが存在する場合、現在の信頼性スコアが増加する(114)。以前の信頼性スコアは存在するが、一貫性がない場合、現在の信頼性スコアは、一実施形態では、修正されない(116)。他の実施形態では、信頼性スコアは、一貫性がない以前の信頼性スコアに関して、所定の様式で調節される。ファミリーの検出が初めてである場合、現在の信頼性スコアは、誤った読取りである可能性があるため、低減され得る(118)。プロセスは、信頼性スコアに基づいて、タグ付けした親ポリヌクレオチドのセット内の遺伝子座におけるファミリーの頻度を推測することができる(120)。
【0083】
一時的な情報により、変異またはコピー数多型の検出に関する情報を強化することができるが、他のコンセンサス方法を適用してもよい。他の実施形態では、履歴の比較を、特定の参照配列にマッピングする他のコンセンサス配列と併せて使用して、遺伝子変化の事象を検出することができる。特定の参照配列にマッピングするコンセンサス配列を測定し、対照試料に対して正規化してもよい。参照配列にマッピングする分子の測定を、ゲノム全体で比較して、コピー数が変動するか、またはヘテロ接合性が消失した、ゲノム内の領域を特定することができる。コンセンサス方法としては、例えば、デジタル通信理論、情報理論、またはバイオインフォマティクスから導出される、線形または非線形のコンセンサス配列構築方法(例えば、投票、平均化、統計的、最大事後確率もしくは最大尤度検出、動的プログラミング、ベイジアン、隠れマルコフ、またはサポートベクターマシンの方法など)が挙げられる。配列リードカバレッジを判定した後、確率論的モデリングアルゴリズムを適用して、それぞれのウインドウ領域の正規化された核酸配列リードカバレッジを、別個のコピー数状態に変換する。一部の事例では、このアルゴリズムは、次のうちの1つまたは複数を含み得る:隠れマルコフモデル、動的プログラミング、サポートベクターマシン、ベイジアンネットワーク、トレリス復号、ビタビ復号、期待値最大化、カルマンフィルタリング手法、およびニューラルネットワーク。
【0084】
この後に、レポートが生成され得る。例えば、コピー数多型(CNV)は、ゲノム内の様々な位置、ならびにそれぞれの位置におけるコピー数多型の対応する増加または減少または維持を示すグラフとして報告され得る。加えて、コピー数多型を使用して、無細胞ポリヌクレオチド試料中に、どれほどの疾患材料(またはコピー数多型を有する核酸)が存在するかを示す、パーセンテージスコアを報告することができる。
【0085】
図4は、インターネットにより実現される、がんを有する対象のレポートのアクセスの概略図を示す。図4のシステムは、携帯型DNAシーケンサーまたはデスクトップ型DNAシーケンサーを使用し得る。DNAシーケンサーは、DNAシーケンシングプロセスを自動化するために使用される科学機器である。DNAの試料の場合であれば、DNAシーケンサーを使用して、4つの塩基:アデニン、グアニン、シトシン、およびチミンの順序を判定する。DNA塩基の順序は、リードと称される文字列として報告される。一部のDNAシーケンサーはまた、ヌクレオチドに付着した蛍光色素を起源とする光シグナルを分析するため、光学機器と考えることができる。
【0086】
腫瘍プロファイルは、腫瘍の起源組織に関する情報を含み得る。検出およびプロファイリングされ得るがんの種類および数としては、血液のがん、脳のがん、肺がん、皮膚がん、鼻のがん、喉のがん、肝臓がん、骨がん、リンパ腫、膵臓がん、皮膚がん、大腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固形状態の腫瘍、不均一腫瘍、均一腫瘍などが挙げられるが、これらに限定されない。
【0087】
腫瘍プロファイルは、腫瘍の薬物感受性に関する情報を含み得る。腫瘍の薬物感受性は、目的の薬物に対する単離腫瘍細胞の応答を測定または判定することによって、直接的に判定することができる。腫瘍の薬物感受性は、腫瘍のジェノタイピングを行うことによって判定することができる。
【0088】
腫瘍プロファイルは、腫瘍のサイズおよび/または腫瘍のステージに関する情報を含み得る。腫瘍のサイズは、身体スキャニング技術、外科手術、または任意の公知の方法によって、測定することができる。腫瘍のステージは、身体検査、撮像研究、研究室試験、病理レポート、および/または外科手術レポートに基づいて、判定することができる。
【0089】
対象プロファイルは、対象の遺伝子プロファイルを含み得る。対象の遺伝子プロファイルは、対象に由来する非がん性組織をアッセイすることによって、判定することができる。対象の遺伝子プロファイルは、対象由来の無細胞体液に由来する核酸をアッセイすることによって、判定することができる。非がん性組織に由来する核酸は、例えば、初期核酸のプールにおけるそれらの頻度によって、または核酸分子の長さによって、特定することができる。腫瘍細胞に由来する核酸分子は、160~180塩基の第1のモード、および320~360塩基の第2のモードを有し得る。非がん性組織に由来する核酸分子は、より広い分布を有し得、多くの分子は、長さが400塩基よりも大きい。分子のサイズは、初期DNA分子もしくはライブラリー断片のサイズ選択によって制御することができるか、または対になったリードを参照ゲノムにマッピングすることによって、情報学的に制御することができる。
【0090】
対象の遺伝子プロファイルは、処置の効果を改変し得るバリアントに関してアッセイすることを含み得る。例えば、そのようなバリアントは、薬物の薬物動態に影響を及ぼし得る。薬物動態に影響を及ぼす一般的なバリアントは、薬物の輸送または薬物の代謝に影響を及ぼし得る。薬物動態に影響を及ぼすバリアントは、SpringerScience& Business Mediaによって2014年に刊行された、M. A. Rudekら、The HandbookofAnticancerPharmacokinetics and Pharmacodynamicsに記載されており、これは、参照によりその全体が
本明細書に組み込まれる。
【0091】
対象の遺伝子プロファイルは、がん進展に影響を及ぼすバリアントに関してアッセイすることを含み得る。そのような変異は、例えば、TP53またはBRCA1など、腫瘍抑制因子産物の効率を低減させる、遺伝性変異であり得る。
【0092】
一部の実施形態では、対象プロファイルは、遺伝子以外の情報を含む。そのような情報としては、対象の年齢、患者が受けた他の薬物の有効性、対象に関する臨床情報、および家族の病歴を挙げることができる。対象に関する臨床情報は、追加の臨床情報、例えば、器官機能、例えば、肝臓および腎臓の機能、血球計数、心臓機能、肺および呼吸器の機能、ならびに感染状況を含み得る。対象に関する臨床情報は、年齢、性別、ジェンダー、遺伝子プロファイル、酵素レベル、器官機能、生活の質、医療介入の頻度、寛解の状況、および/または患者の転帰を含み得る。対象のプロファイルには、以前の処置に関する情報が含まれ得る。処置は、例えば、外科手術による除去、放射線照射、または化学療法の投与であり得る。情報は、定性的(どの処置を受けたかを示す)であってもよく、または定量的、例えば、用量、期間、およびタイミングの情報を含むものであってもよい。対象の情報は、対象が生きているかまたは死んでいるかを含み得る。対象の情報を、様々な時点で収集して、対象の集団について、中央値生存率、6ヶ月生存率、1年生存率、2年生存率、3年生存率、5年生存率、またはそれよりも長いものを生成することができる。
【0093】
状態(例えば、初期状態)を判定することは、対象に関する情報を取得し、その情報に基づいて、対象を状態に割り当てることを含み得る。一部の事例では、状態は、情報のサブセットに基づいて判定される。例えば、状態は、訓練セットから対象をクラスタリングすることによって判定することができ、新しい対象は、どのクラスターが最も近いかを判定することによって、状態に割り当てられ得る。
【0094】
クラスタリングを使用して、定量的データを、カテゴリデータに変換することができる。例えば、ある特定のがんの医薬は、肝臓の損傷を引き起こし得る。そのようながんの医薬を受けている対象の血液中の肝臓酵素(例えば、ASTおよびALT)のレベルを、測定することができる。肝臓酵素レベルのクラスタリングまたは目視検査により、上昇した肝臓酵素レベルを有する一部の対象および正常な肝臓酵素レベルを有する一部の対象が明らかとなり得る。肝臓酵素レベルは、所与のレベルよりも高い肝臓酵素を有する対象を「上昇」として、所与のレベルよりも低いものを「正常」として定義することによって、カテゴリ変数に変換することができる。
【0095】
カテゴリデータおよび定量的データは、組み合わせることができる。1つの例示的な方法では、カテゴリデータは、カテゴリデータを「ダミー値」に変換することによって、定量的データを必要とする方法において使用するために変換することができる。例えば、上昇した肝臓酵素レベルを有する患者には、1の値が割り当てられ得、一方で正常な肝臓酵素レベルを有する患者には、0の値が割り当てられ得る。カテゴリ変数を定量的変数に変換する他の方法としては、エフェクトコーディング、コントラストコーディング、およびナンセンスコーディングが挙げられる。
【0096】
状態は、目的の転帰(例えば、生存、寛解の状況、または耐性が生じる前の時間の長さ)を表し得、これを記録することができる。対象のセット(例えば、訓練セット)を使用して、判定される目的の転帰に対する初期状態および/または処置の効果サイズおよび相互作用を判定することができる。これらの効果サイズおよび相互作用を使用して、分類器または予測モデルを開発することができる。初期状態から特性の効果サイズおよび相互作用条件を判定するための方法としては、例えば、線形および対数回帰分析を含む回帰分析;最短収縮セントロイド分析;安定化線形判別分析;サポートベクターマシン;ガウス過程;条件付き推測ツリーフォレスト;ランダムフォレスト;最短セントロイド;ナイーブベイズ;射影追跡LDAツリー;多項ロジスティック回帰;スタンプ型決定ツリー;人工ニューラルネットワーク;バイナリ決定ツリー;および/または条件付き推測ツリーを挙げることができる。分類器または予測モデルの精度および感度は、分類器または予測モデルを構築するために使用されなかった対象のサブセット(例えば、試験セット)において、予測精度を測定することによって、判定することができる。
【0097】
一部の事例では、予測因子の効果サイズを判定し、影響の少ない変数を除去する。変数選択の方法は、当該技術分野において公知であり、例えば、変数選択のためのフィルター法および/またはラッパー法を挙げることができる。フィルター法は、変数と転帰との相関性など、一般的な特性に基づく。ラッパー法は、変数のサブセットを一緒に評価して、最適な変数の組合せを判定する。選択された変数を使用して、対象の状態を判定するために使用される情報のサブセットを判定することができる。
【0098】
一部の事例では、対象の訓練セットは、同じ組織型の腫瘍を有する。一部の事例では、対象は、同じジェンダー、同じ年齢、同じエスニックバックグラウンド、または同じ危険因子など、類似のデモグラフィックプロファイルのものである。ジェンダーは、男性または女性であり得る。例示的な危険因子としては、アルコール消費、タバコの使用および使用方法、食事、運動、発がん物質への仕事上の曝露、旅行の頻度、ならびに紫外線への曝露および/または日焼けが挙げられる。一部の事例では、訓練セットの対象は、すべて、がんを有する患者である。一部の事例では、訓練セットの対象は、すべて、がんと一致する症状を有し、がんに関して試験を受けている患者である。一部の事例では、訓練セットの対象は、がんと一致する症状を有し、がんの処置を受けている患者である。対象の特徴は、複数の対象のそれぞれの対象に関する情報に含まれ得る。
【0099】
対象の初期状態を使用して、対象の所与の後続状態の確率を判定することができる。確率は、分類器または予測モデルを使用して、判定することができる。
【0100】
分類器または予測モデルを使用して、所与のプロファイルを有する対象に好ましい処置を特定することができる。例えば、対象の所与の転帰の確率を判定するための分類器または予測モデルを使用することは、1つまたは複数の決定ツリーを生成することを含み得る。第1の時点における状態は、ルートノード(初期決定ノードである)によって表すことができ、代替えの処置は、決定ブランチによって表すことができる。一部の事例では、決定ブランチは、終端状態(そこからはさらなる決定は行われない)または中間状態ノードにつながり得、この中間状態ノードは、それ自体が、決定ノードであり得る。中間状態ノードは、対象の1つもしくは複数の腫瘍内における、処置に対する腫瘍の耐性を付与する遺伝子バリアントの出現;後続の生検または撮像手順の結果;および/または一般的にはある時点における対象からの情報の変化もしくは変化の欠如を表し得る。例えば、中間ノードは、処置の1週間後、処置の2週間後、処置の3週間後、処置の4週間後、処置の1ヶ月後、処置の2ヶ月後、処置の3ヶ月後、処置の6ヶ月後、処置の1年後、処置の2年後、処置の3年後、処置の4年後、または処置の5年後における、対象からの情報を含み得る。中間ノードは、医療ケア提供者が、今後の処置オプションに関する決定を行う(例えば、化学療法レジメンを完了した後に、腫瘍を除去するための外科手術による介入の後に、および能動的モニタリングレジメン中の特定の時点で)、中間状態を表し得る。
【0101】
中間ノードは、処置に対する耐性の発生に関する情報を含み得る。例えば、腫瘍における特定のバリアントの存在は、耐性が発生していることを示し得る。処置の間の経時的な特定のバリアントの増加は、そのバリアント、または少なくとも第2の未確認のバリアントが、処置に対する耐性の発生と関連していることを示し得る。そのようなバリアントが出現する確率は、特定の進化トラックで腫瘍ダウンの素因となる特定のバリアントの存在によって改変され得る。中間ノードは、対象の(例えば、患者の)健康に関する情報を含み得る。
【0102】
腫瘍プロファイルおよび/または対象プロファイルは、1つまたは複数の後続時点において、判定され得る。後続時点の腫瘍および/または対象プロファイルからの情報を使用して、後続状態を判定することができる。後続状態が判定されると、後続状態を、新しい初期状態として使用して、他の後続ノードの確率を更新することができる。例えば、対象が、KRAS遺伝子の増幅事象とは同時に発生しないKRASバリアントを発症した場合、決定ツリーは、KRAS遺伝子増幅事象の確率の低減を反映するように更新され得る。
【0103】
一部の事例では、後続状態は、終端ノードによって表される(例えば、対象が死亡したか、または完全な寛解に至った)。後続状態は、処置の後の時点であり得る。後続状態は、追加の生検を採取した時点であり得る。生検は、液体生検であり得る。
【0104】
一部の事例では、終端ノードは、そこからさらなる医療決定が行われない状態を表す。一部の事例では、終端ノードは、対象の死亡を表す。一部の事例では、終端ノードは、対象においてがんを検出できないことを表す。
【0105】
一部の事例では、処置を推奨することは、対象からの情報が、分類器または予測モデルで生成されたどのクラスターに属するかを判定することを含む。判定することは、上述の方法によって判定されるクラスター境界に基づき得る。一部の事例では、決定することは、対象からの情報が最も近いクラスターを選択することに基づき得る。選択することは、少なくとも部分的に、距離相関に基づき得る。
【0106】
そのような分類器または予測モデルを使用して、患者の処置を選択することができる。例えば、所与の遺伝子プロファイルおよび腫瘍の遺伝子プロファイルを有する患者には、生存率(例えば、5年生存率および/または寛解率)を最大化する治療法が選択され得る。患者は、経時的にモニタリングされ得る。その治療法に対する耐性を付与するか、またはその治療法に対する耐性を発生する危険性の増加をもたらす、遺伝子変異が生じた場合には、新しい状態に基づいて、5年生存率および/または寛解を最大化する第2の処置または異なる処置が、投与され得る。対象の生存率および/または生存年数を最大化するのに適切な処置が、選択され得る。
【0107】
処置は、当業者には公知であり、例は、NCCNのClinical Practice Guidelines in Oncology(商標)またはAmerican Society of Clinical Oncology(ASCO)の診療ガイドラインに記載されている。処置に使用される薬物の例は、National Comprehensive Cancer Network(NCCN)のDrugs and Biologics Compendium(商標)、Thomson MicromedexのDrugDex(登録商標)Elsevier Gold Standard’s Clinical Pharmacology概論、およびAmerican Hospital Formulary Service-Drug Information Compendium(登録商標)を含む、CMSに承認された概論に見出すことができる。
コンピュータシステム
【0108】
本開示は、本開示の方法を実装するようにプログラミングされたコンピュータシステムを提供する。図7は、がん進化を検出またはモニタリングするようにプログラミングされるか、またはそうでなければそのように構成される、コンピュータシステム701を示す。
【0109】
コンピュータシステム701は、中央処理ユニット(CPU、本明細書において「プロセッサ」および「コンピュータプロセッサ」とも)705を含み、これは、シングルコアもしくはマルチコアプロセッサであり得るか、または並列処理のための複数のプロセッサであり得る。コンピュータシステム701はまた、メモリまたはメモリ位置710(例えば、ランダムアクセスメモリ、読出し専用メモリ、フラッシュメモリ)、電子記憶ユニット715(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース720(例えば、ネットワークアダプター)、ならびに周辺デバイス725、例えば、キャッシュ、他のメモリ、データ記憶ユニット、および/もしくは電子ディスプレイアダプターも含む。メモリ710、記憶ユニット715、インターフェース720、および周辺デバイス725は、通信バス(実線)、例えば、マザーボードを通じて、CPU705と通信状態にある。記憶ユニット715は、データを記憶するためのデータ記憶ユニット(またはデータリポジトリ)であり得る。コンピュータシステム701は、通信インターフェース720を活用して、コンピュータネットワーク(「ネットワーク」)730に作動可能に連結され得る。ネットワーク730は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信するイントラネットおよび/もしくはエクストラネットであり得る。一部の事例では、ネットワーク730は、遠距離通信および/またはデータネットワークである。ネットワーク730は、クラウドコンピューティングなどの分散型コンピューティングを可能にすることができる、1つまたは複数のコンピュータサーバを含み得る。ネットワーク730は、一部の事例では、コンピュータシステム701を活用して、コンピュータシステム701に連結されたデバイスが、クライアントまたはサーバとして挙動することを可能にし得る、ピアトゥピアネットワークを実装することができる。
【0110】
CPU705は、プログラムまたはソフトウェアで具現化され得る、一連の機械可読命令を実行することができる。命令は、メモリ710などのメモリ位置に記憶され得る。命令は、CPU705へと指示され得、これが、続いて、本開示の方法を実装するように、CPU705をプログラミングするか、またはそうでなければそのように構成し得る。CPU705によって実施される動作の例としては、フェッチ、復号、実行、およびライトバックを挙げることができる。
【0111】
CPU705は、集積回路など、回路の一部であり得る。システム701の1つまたは複数の他の構成要素が、回路に含まれ得る。一部の事例では、回路は、特定用途向け集積回路(ASIC)である。
【0112】
記憶ユニット715は、ドライバ、ライブラリー、および保存されたプログラムなど、ファイルを記憶することができる。記憶ユニット715は、ユーザデータ、例えば、ユーザの選好およびユーザプログラムを記憶することができる。コンピュータシステム701は、一部の事例では、コンピュータシステム701に対して外部にある、例えば、イントラネットまたはインターネットを通じてコンピュータシステム701と通信するリモートサーバに位置する、1つまたは複数の追加のデータ記憶ユニットを含み得る。
【0113】
コンピュータシステム701は、ネットワーク730を通じて、1つまたは複数のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム701は、ユーザ(例えば、患者または医療提供者)のリモートコンピュータシステムと通信し得る。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、ポータブルPC)、スレートもしくはタブレットPC(例えば、Apple(登録商標)のiPad(登録商標)、Samsung(登録商標)のGalaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)のiPhone(登録商標)、Android対応デバイス、Blackberry(登録商標))、または携帯情報端末が挙げられる。ユーザは、ネットワーク730を介して、コンピュータシステム701にアクセスすることができる。
【0114】
本明細書において記載される方法は、コンピュータシステム701の電子記憶位置、例えば、メモリ710または電子記憶ユニット715上などに記憶された、機械(例えば、コンピュータプロセッサ)により実行可能なコードを用いて実装され得る。機械により実行可能なコードまたは機械により読取り可能なコードは、ソフトウェアの形態で提供され得る。使用の際、コードが、プロセッサ705によって実行され得る。一部の事例では、コードは、記憶ユニット715から取り出され、プロセッサ705による即時アクセスのために、メモリ710に記憶され得る。一部の状況では、電子記憶ユニット715は、除外され得、機械により実行可能な命令は、メモリ710に記憶される。
【0115】
コードは、コードを実行するように適合されたプロセッサを有する機械で使用するために、プリコンパイルされている、およびそのように構成され得るか、または実行時にコンパイルされてもよい。コードは、コードがプリコンパイルまたは即時コンパイルの様式で実行されるのを可能にするように選択され得る、プログラミング言語で供給され得る。
【0116】
コンピュータシステム701など、本明細書において提供されるシステムおよび方法の態様は、プログラミングで具現化され得る。この技術の様々な態様は、典型的には、機械(またはプロセッサ)により実行可能なコードおよび/または機械可読媒体の一種で運搬もしくは具現化される関連データの形態をした、「製品」または「製造品」であると考えることができる。機械により実行可能なコードは、メモリ(例えば、読出し専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)、またはハードディスクなど、電子記憶ユニットに記憶され得る。「記憶」型の媒体としては、コンピュータ、プロセッサなどのありとあらゆる有形メモリ、またはそれらの関連モジュール、例えば、様々な半導体メモリ、テープドライブ、ディスクドライブなどが含まれ得る。これらは、ソフトウェアプログラミングの任意の時点において、非一過的記憶ユニットを提供し得る。ソフトウェアのすべてまたは一部分は、時折、インターネットまたは様々な他の電気通信網を通じて通信され得る。そのような通信は、例えば、ソフトウェアを1つのコンピュータまたはプロセッサから別のものへ、例えば、管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへ、ロードすることを可能にし得る。したがって、ソフトウェアエレメントを保持し得る別の種類の媒体としては、光波、電波、および電磁波、例えば、ローカルデバイス間の物理的インターフェースを通じて、有線および光学の地上ネットワークを通じて、ならびに様々なエアリンク上で、使用されるものが挙げられる。そのような波を有する物理的エレメント、例えば、有線または無線リンク、光リンクなどはまた、ソフトウェアを保持する媒体と考えることができる。本明細書において使用されるとき、非一過的有形「記憶」媒体に限定されない限り、コンピュータまたは機械「可読媒体」などの用語は、実行のために命令をプロセッサに提供することに関与する任意の媒体を指す。
【0117】
したがって、コンピュータにより実行可能なコードなど、機械可読媒体は、有形記憶媒体、搬送波媒体、または物理的伝送媒体を含むがこれらに限定されない、多数の形態を取り得る。不揮発性記憶媒体としては、例えば、光ディスクまたは磁気ディスク、例えば、任意のコンピュータなどにおける記憶デバイスのうちのいずれか、例えば、図面に示されているデータベースなどを実装するために使用することができるものが挙げられる。揮発性記憶媒体としては、動的メモリ、例えば、そのようなコンピュータプラットフォームの主メモリが挙げられる。有形伝送媒体としては、同軸ケーブル、銅線、および光ファイバ、例えば、コンピュータシステム内のバスを含む電線が挙げられる。搬送波伝送媒体は、電気信号もしくは電磁信号または音波もしくは光波、例えば、無線(RF)および赤外線(IR)データ通信の際に生成されるものの形態を取り得る。したがって、コンピュータ可読媒体の一般的な形態としては、例えば、次のものが挙げられる:フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード紙テープ、任意の他の、孔のパターンによる物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、任意の他のメモリチップもしくはカートリッジ、データもしくは命令を伝送する搬送波、そのような搬送波を伝送するケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび/もしくはデータを読み取ることができる任意の他の媒体。これらのコンピュータ可読媒体の形態の多くは、実行のために1つまたは複数の命令の1つまたは複数のシーケンスをプロセッサに搬送することに関与し得る。
【0118】
コンピュータシステム701は、例えば、がんの進化と関連するかまたはそれを示す、1つまたは複数の結果を提供するための、ユーザインタフェース(UI)740を備える電子ディスプレイ735を含み得るか、またはそれと通信し得る。UIの例としては、グラフィカルユーザインターフェース(GUI)およびウェブベースユーザインターフェースが挙げられるが、これらに限定されない。
【0119】
本開示の方法およびシステムは、1つまたは複数のアルゴリズムを用いて実装することができる。アルゴリズムは、中央処理ユニット705により実行すると、ソフトウェアによって実装され得る。アルゴリズムは、例えば、がんの進化を検出またはモニタリングするための本開示の方法を実装することができる。
【実施例0120】
(実施例1)
処置耐性の発生のモデルの構築
がんを有する対象は、それらの年齢、ジェンダー、がんの種類、がんのステージ、および器官機能を含む、患者プロファイルを判定するために、身体スクリーニングを受ける。対象は、採血を受け、これを処理して細胞を除去し、核酸を有する無細胞体液を得る。核酸のシーケンシングを行い、患者の遺伝子プロファイルおよび腫瘍の遺伝子プロファイルを判定する。対象には、医師によって処置が処方される。患者を、経時的に追跡し、腫瘍の遺伝子プロファイルを、3ヶ月ごとに取得する。患者の転帰を、それぞれの時点で記録する。
【0121】
所与の患者プロファイル(患者の遺伝子プロファイルを含む)および腫瘍の遺伝子プロファイルを有する患者が、任意の所与の時点において、特定の患者転帰を有する確率に基づいて、隠れマルコフモデルを構築する。
(実施例2)
処置耐性の発生のモデルの使用
【0122】
がんを有する対象を、入院させる。対象プロファイルおよび腫瘍プロファイルを取得する。対象プロファイルおよび腫瘍プロファイルを、モデル、例えば、実施例1において生成したモデルの初期状態として使用する。対象の転帰を、モデルに基づいて予測し、対象の予測生存期間(例えば、月数または年数で測定)を最大化するように、処置を選択する。対象の腫瘍プロファイルを、3ヶ月ごとに更新し、モデルへの新しい初期状態入力として使用する。所与の後続時点において、腫瘍プロファイルが、現在の処置に対する耐性を有するサブクローンが発生したことを示す。これに応答して、対象の予測生存期間を最大化するように、新しい処置を選択する。対象には、第1の処置(例えば、第1選択肢の治療法)に対して耐性である腫瘍細胞を標的とする第2の処置(例えば、第2選択肢の治療法)が与えられる。
(実施例3)
決定ツリーによる対象の表示
【0123】
対象が結腸がんを有する65歳の男性であることを示す初期ノードに、対象を関連付け、腫瘍プロファイルは、低頻度のKRAS変異が対象の無細胞DNAにおいて検出されることを示す。初期ノードから生じる1つのブランチは、パニツムマブおよびセツキシマブでの処置を示し、第2のブランチは、パニツムマブおよびセツキシマブでの処置が、マイトジェン活性化プロテインキナーゼ酵素(MEK)阻害剤と併せて投与されることを示す。これらのブランチは、耐性発生および耐性発生の欠如を示す、中間ノードに接続する。耐性発生の確率は、MEK阻害剤との共処置を含むブランチに沿った中間ノードでは、MEK阻害剤での共処置を欠くブランチよりも低い。それぞれの中間ノードは、死亡および完全な寛解を示す、終端ノードと関連付けられている。完全な寛解の確率は、MEK阻害剤との共処置を含む決定ブランチに沿った終端ノードでは、より高い。
【0124】
本明細書において記載される実施形態の例証は、様々な実施形態の構造の全般的な理解を提供することを意図している。例証は、本明細書において記載される構造または方法を利用する装置およびシステムのエレメントおよび特性のすべてに関する完全な説明としての機能を果たすようには意図されない。多数の他の実施形態が、本開示を考察することにより、当業者には明らかであり得る。本開示から、他の実施形態が利用および導出され得、結果として、構造的および論理的な置換および変化が、本開示の範囲から逸脱することなく、なされ得る。したがって、本開示および図面は、制限的ではなく例証的と解釈されるものである。
【0125】
本開示の1つまたは複数の実施形態は、単に便宜上かつ本出願の範囲を任意の特定の発明または発明的概念に自主的に制限するように意図することなく、「本発明」という用語によって、個別および/または集合的に、本明細書において参照され得る。さらに、特定の実施形態が本明細書において例証され、説明されているが、同じかまたは類似の目的を達成するように設計された任意の後続の配設が、示されている特定の実施形態の代わりに用いられ得ることを理解されたい。本開示は、様々な実施形態のありとあらゆる後続の適合形および変化形を網羅することを意図する。上述の実施形態の組合せ、および本明細書において具体的に記載されていない他の実施形態が、説明を考察することにより、当業者には明らかである。
【0126】
本発明の好ましい実施形態が本明細書において示され、説明されているが、そのような実施形態が単なる例示として提供されていることは、当業者には明らかである。本発明が本明細書内に提供されている特定の実施例によって制限されることは、意図されない。本発明は、前述の明細書への参照とともに記載されているが、本明細書における実施形態の説明および例証は、制限する意味で解釈されるものではない。当業者であれば、本発明から逸脱することなく、多数の変化形、変更、および置換を想起し得る。さらに、本発明のすべての態様は、本明細書において記載されている特定の表現、構成、または相対的比率に制限されず、それらは、様々な条件および変数に依存することを理解すべきである。本明細書において記載される本発明の実施形態に対する様々な代替形態を、本発明の実践に用いることができることを理解されたい。したがって、本発明は、あらゆるそのような代替形、修正形、変化形、または均等物も網羅すべきであることが企図される。以下の特許請求の範囲が本発明の範囲を定めること、ならびにこれらの特許請求の範囲内の方法と構造、およびそれらの均等物が、それによって網羅されることが意図される。
本発明の実施形態の例として、以下の項目が挙げられる。
(項目1)
コンピュータにより実装される方法であって、
(a)第1の時点において、がんを有する複数の対象に関する情報を取得し、そして前記第1の時点における前記情報に基づいて、第1の状態のセットを生成するために、前記複数の対象のそれぞれの第1の状態を判定するステップであって、前記情報が、前記複数の対象のそれぞれの対象について、少なくとも、無細胞体液からの核酸のジェノタイピングを行うことによって得られた腫瘍の遺伝子プロファイルおよび前記第1の時点の前に前記対象に提供された任意の処置を含む、ステップと、
(b)前記第1の時点よりも後の1つまたは複数の第2の時点において、前記複数の対象に関する前記情報を取得し、そして前記1つまたは複数の第2の時点のうちの所与の一時点における前記情報に基づいて、後続状態のセットを生成するために、前記1つまたは複数の第2の時点のそれぞれにおける前記複数の対象のそれぞれの第2の状態を判定するステップと、
(c)(a)からの前記第1の状態のセットおよび(b)からの前記後続状態のセットを使用するステップであって、所与の第1の状態が、前記所与の第1の状態よりも後の後期時点における状態のセットの中で、第2の状態をもたらす確率を判定するように構成される予測アルゴリズムを生成するステップと
を含む、方法。
(項目2)
(d)より早い時点における状態のセットの中での前記所与の第1の状態に関して、前記所与の第1の状態が、前記より遅い時点における前記状態のセットの中で、前記第2の状態をもたらす前記確率を判定するステップと、
(e)(d)において判定された前記確率を示す電子出力を生成するステップと
をさらに含む、項目1に記載の方法。
(項目3)
コンピュータにより実装される方法であって、
(a)第1の時点において、がんを有する複数の対象に関する情報を取得し、そして前記第1の時点における前記情報に基づいて、第1の状態のセットを生成するために、前記複数の対象のそれぞれの第1の状態を判定するステップであって、前記情報が、前記複数の対象のそれぞれの対象について、少なくとも、少なくとも50個の遺伝子のジェノタイピングを行うことによって得られた腫瘍の遺伝子プロファイルおよび前記第1の時点の前に前記対象に提供された任意の処置を含む、ステップと、
(b)前記第1の時点よりも後の1つまたは複数の第2の時点において、前記複数の対象に関する前記情報を取得し、そして前記1つまたは複数の第2の時点のうちの所与の一時点における前記情報に基づいて、後続状態のセットを生成するために、前記1つまたは複数の第2の時点のそれぞれにおける前記複数の対象のそれぞれの第2の状態を判定するステップと、
(c)(a)からの前記第1の状態のセットおよび(b)からの前記後続状態のセットを使用するステップであって、所与の第1の状態が、前記所与の第1の状態よりも後の後期時点における状態のセットの中で、第2の状態をもたらす確率を判定するように構成される予測アルゴリズムを生成するステップと
を含む、方法。
(項目4)
(d)より早い時点における状態のセットの中での前記所与の第1の状態に関して、前記所与の第1の状態が、前記より遅い時点における前記状態のセットの中で、前記第2の状態をもたらす前記確率を判定するステップと、
(e)(d)において判定された前記確率を示す電子出力を生成するステップと
をさらに含む、項目3に記載の方法。
(項目5)
前記情報を取得するステップが、前記複数の対象由来の無細胞デオキシリボ核酸(cfDNA)のシーケンシングを行うことと、任意選択で、前記複数の対象のそれぞれの問診を実施することとを含む、項目1または3に記載の方法。
(項目6)
処置が、前記第1の時点の前に前記対象に提供されていた、項目1または3に記載の方法。
(項目7)
1つまたは複数の決定ツリーを生成するステップをさらに含み、それぞれの決定ツリーが、ルートノード、1つまたは複数の決定ブランチ、1つまたは複数の決定ノード、および1つまたは複数の終端ノードを含み、前記ルートノードにおける状態が、前記第1の時点を表し、前記1つまたは複数の決定ブランチが、代替えの処置を表し、前記1つまたは複数の決定ノードおよび前記1つまたは複数の終端ノードが、後続状態を表す、項目1または3に記載の方法。
(項目8)
前記1つまたは複数の決定ブランチが、複数の決定ブランチを含む、項目7に記載の方法。
(項目9)
前記後続状態が、前記対象が生きているかまたは死んでいるかを示す前記対象の生存状態を含む、項目1または3に記載の方法。
(項目10)
前記後続状態が、対象生存率を含む、項目1または3に記載の方法。
(項目11)
前記第1の状態のそれぞれが、1つまたは複数の体細胞変異の共通のセットを含む、項目1または3に記載の方法。
(項目12)
前記情報が、対象のプロファイルをさらに含む、項目1または3に記載の方法。
(項目13)
前記確率が、少なくとも部分的に、複数の処置選択肢の中からの処置選択の関数である、項目1または3に記載の方法。
(項目14)
前記1つまたは複数の第2の時点が、複数の後続時点を含む、項目1から4のいずれか一項に記載の方法。
(項目15)
複数の後続時点において、前記確率を判定するステップをさらに含む、項目14に記載の方法。
(項目16)
前記時点が、少なくとも3つの時点または少なくとも4つの時点を含む、項目15に記載の方法。
(項目17)
前記第1の時点が、前記対象が前記処置を受ける前であり、前記後続時点が、前記対象が前記処置を受けた後である、項目1に記載の方法。
(項目18)
第2の処置が、前記後続時点における前記後続状態に基づいて、前記後続時点の後に投与される、項目13に記載の方法。
(項目19)
前記複数の対象に関する前記情報が、前記対象の患者プロファイルからの1つまたは複数の特徴を含み、この特徴が、年齢、性別、ジェンダー、遺伝子プロファイル、酵素レベル、器官機能、生活の質、医療介入の頻度、寛解の状況、および患者の転帰からなる群から選択される、項目1に記載の方法。
(項目20)
前記遺伝子プロファイルが、がんの危険性を増加させるか、薬物動態に影響を及ぼすか、または薬物感受性に影響を及ぼす、1つまたは複数の遺伝子座における対象の遺伝子型を含む、項目19に記載の方法。
(項目21)
前記複数の対象に関する前記情報が、前記対象の腫瘍プロファイルからの1つまたは複数の特徴を含み、この特徴が、1つまたは複数の遺伝子バリアント、起源組織、腫瘍量、腫瘍の薬物感受性、および腫瘍のステージからなる群から選択される、項目1に記載の方法。
(項目22)
前記1つまたは複数の特徴が、前記対象由来の無細胞核酸分子をアッセイすることによって判定される、項目21に記載の方法。
(項目23)
前記1つまたは複数の遺伝子バリアントを定量化して、前記1つまたは複数の体細胞変異を含む無細胞核酸分子の比率を判定する、項目22に記載の方法。
(項目24)
前記1つまたは複数の体細胞変異の前記比率が、前記第1の時点と、前記1つまたは複数の後続時点との間で、増加しているかまたは減少しているかを判定するステップをさらに含む、項目23に記載の方法。
(項目25)
前記1つまたは複数の体細胞変異の前記比率が、前記1つまたは複数の後続時点のうちの複数の間で、増加しているかまたは減少しているかを判定するステップをさらに含む、項目23に記載の方法。
(項目26)
前記1つまたは複数の体細胞変異の前記比率が、増加している、項目24または25に記載の方法。
(項目27)
前記1つまたは複数の体細胞変異が、増加しており、さらに、前記体細胞変異が、前記処置に対する耐性と関連している、項目26に記載の方法。
(項目28)
前記アッセイすることが、高スループットシーケンシングを含む、項目22に記載の方法。
(項目29)
(a)第1の時点において、がんを有する対象に関する情報を取得するステップであって、前記情報が、患者プロファイル、腫瘍プロファイル、または処置からの前記対象の少なくとも1つの特徴を含む、ステップと、
(b)前記第1の時点における前記情報に基づいて、前記対象の初期状態を判定するステップと、
(c)前記対象の前記初期状態に基づいて、1つまたは複数の後続時点のそれぞれにおいて、複数の後続状態のそれぞれの確率を判定するステップであって、それによって、状態の転帰に関する確率のセットを提供するステップと、
(d)状態の転帰に関する前記確率のセットに少なくとも部分的に基づいて、前記対象が特定の転帰を得る確率を最適化する、前記がんの処置の推奨を生成するステップと、
(e)(d)において生成された前記推奨を示す電子出力を生成するステップと
を含む、方法。
(項目30)
前記確率が、少なくとも部分的に、複数の処置選択肢の中からの処置選択の関数である、項目29に記載の方法。
(項目31)
前記1つまたは複数の後続時点が、複数の後続時点を含む、項目29または30に記載の方法。
(項目32)
複数の後続時点において、前記確率を判定するステップをさらに含む、項目31に記載の方法。
(項目33)
前記時点が、少なくとも3つの時点を含む、項目29に記載の方法。
(項目34)
前記時点が、少なくとも4つの時点を含む、項目29に記載の方法。
(項目35)
前記第1の時点が、前記対象が前記処置を受ける前であり、前記後続時点が、前記対象が前記処置を受けた後である、項目29に記載の方法。
(項目36)
第2の処置が、前記後続時点における前記後続状態に基づいて、前記後続時点の後に投与される、項目35に記載の方法。
(項目37)
前記対象の前記少なくとも1つの特徴が、前記患者プロファイルからであり、年齢、ジェンダー、遺伝子プロファイル、酵素レベル、器官機能、生活の質、医療介入の頻度、寛解の状況、および患者の転帰からなる群から選択される、項目29に記載の方法。
(項目38)
前記遺伝子プロファイルが、遺伝性がん遺伝子である1つまたは複数の遺伝子座における対象の遺伝子型を含む、項目29に記載の方法。
(項目39)
前記遺伝子プロファイルが、薬物動態に影響を及ぼす1つまたは複数の遺伝子座における対象の遺伝子型を含む、項目29に記載の方法。
(項目40)
前記遺伝子プロファイルが、薬物感受性に影響を及ぼす1つまたは複数の遺伝子座における対象の遺伝子型を含む、項目29に記載の方法。
(項目41)
前記対象の前記少なくとも1つの特徴が、前記腫瘍プロファイルからであり、1つまたは複数の体細胞変異、起源組織、腫瘍量、腫瘍の薬物感受性、および腫瘍のステージからなる群から選択される、項目29に記載の方法。
(項目42)
前記少なくとも1つの特徴が、前記対象由来の無細胞核酸分子をアッセイすることによって判定される、項目40に記載の方法。
(項目43)
前記体細胞変異を定量化して、前記1つまたは複数の体細胞変異を含む前記腫瘍に由来する無細胞核酸分子の比率を判定する、項目42に記載の方法。
(項目44)
前記1つまたは複数の体細胞変異の前記比率が、前記第1の時点と、前記1つまたは複数の後続時点との間で、増加しているかまたは減少しているかを判定するステップをさらに含む、項目43に記載の方法。
(項目45)
前記1つまたは複数の体細胞変異の前記比率が、前記1つまたは複数の後続時点のうちの複数の間で、増加しているかまたは減少しているかを判定するステップをさらに含む、項目43に記載の方法。
(項目46)
前記アッセイすることが、高スループットシーケンシングを含む、項目42に記載の方法。
(項目47)
前記腫瘍プロファイルが、腫瘍組織生検に由来しない、項目29に記載の方法。
(項目48)
(a)対象に関する、少なくとも、腫瘍の遺伝子プロファイルおよび前記対象に以前提供されていたかまたは現在提供されている処置があればそれを含む、情報を取得し、そして前記情報に基づいて、前記対象の初期状態を判定するステップと、
(b)決定ツリーを提供するステップであって、ルートノードが、初期対象状態を表し、決定ブランチが、前記対象に利用可能な代替えの処置を表し、機会ノードが、不確実性の点を表し、決定ノードまたは終端ノードが、後続状態を表す、ステップと、
(c)前記対象が終端ノードにおいて生存している状態を達成する確率を最大化する、前記対象の処置過程を提供するステップと、
(d)(c)において判定された前記処置過程を示す電子出力を生成するステップと
を含む、方法。
(項目49)
(a)通信ネットワーク上で、1つまたは複数の医療サービス提供者との1つまたは複数の通信リンクを確立するステップと、
(b)前記通信ネットワーク上で、前記1つまたは複数の医療サービス提供者から、1つまたは複数の対象に関する医療情報を受信するステップと、
(c)前記医療サービス提供者から、前記1つまたは複数の対象のそれぞれに由来する無細胞デオキシリボ核酸(cfDNA)を含む1つまたは複数の試料を受け取るステップと、
(d)前記cfDNAのシーケンシングを行い、そして前記cfDNAに存在する1つまたは複数の遺伝子バリアントを特定するステップと、
(e)前記1つまたは複数の対象のそれぞれについての情報を有するデータベースを作成または補足するステップであって、前記情報が、特定された遺伝子バリアントおよび受信された医療情報の両方を含む、ステップと、
(f)前記データベースおよびコンピュータにより実装されるアルゴリズムを使用するステップであって、対象の初期状態に基づいて、複数の異なる治療介入のそれぞれについて、後続状態の確率を予測する、少なくとも1つの予測モデルを生成するステップと
を含む、方法。
(項目50)
1つまたは複数のコンピュータプロセッサによって実行すると、
(a)第1の時点において、がんを有する複数の対象に関する情報を取得し、そして前記第1の時点における前記情報に基づいて、第1の状態のセットを生成するために、前記複数の対象のそれぞれの第1の状態を判定するステップであって、前記情報が、前記複数の対象のそれぞれの対象について、少なくとも、無細胞体液からの核酸のジェノタイピングを行うことによって得られた腫瘍の遺伝子プロファイルおよび前記第1の時点の前に前記対象に提供された任意の処置を含む、ステップと、
(b)前記第1の時点よりも後の1つまたは複数の第2の時点において、前記複数の対象に関する前記情報を取得し、そして前記1つまたは複数の第2の時点のうちの所与の一時点における前記情報に基づいて、後続状態のセットを生成するために、前記1つまたは複数の第2の時点のそれぞれにおける前記複数の対象のそれぞれの第2の状態を判定するステップと、
(c)(a)からの前記第1の状態のセットおよび(b)からの前記後続状態のセットを使用するステップであって、所与の第1の状態が、前記所与の第1の状態よりも後の後期時点における状態のセットの中で、第2の状態をもたらす確率を判定するように構成される予測アルゴリズムを生成するステップと
を含む方法を実装する、機械により実行可能なコードを含む、非一過的コンピュータ可読媒体。
(項目51)
1つまたは複数のコンピュータプロセッサによって実行すると、
(a)第1の時点において、がんを有する複数の対象に関する情報を取得し、そして前記第1の時点における前記情報に基づいて、第1の状態のセットを生成するために、前記複数の対象のそれぞれの第1の状態を判定するステップであって、前記情報が、前記複数の対象のそれぞれの対象について、少なくとも、少なくとも50個の遺伝子のジェノタイピングを行うことによって得られた腫瘍の遺伝子プロファイルおよび前記第1の時点の前に前記対象に提供された任意の処置を含む、ステップと、
(b)前記第1の時点よりも後の1つまたは複数の第2の時点において、前記複数の対象に関する前記情報を取得し、そして後続状態のセットを生成するために、前記1つまたは複数の第2の時点のうちの所与の一時点における前記情報に基づいて、前記1つまたは複数の第2の時点のそれぞれにおける前記複数の対象のそれぞれの第2の状態を判定するステップと、
(c)(a)からの前記第1の状態のセットおよび(b)からの前記後続状態のセットを使用するステップであって、所与の第1の状態が、前記所与の第1の状態よりも後の後期時点における状態のセットの中で、第2の状態をもたらす確率を判定するように構成される予測アルゴリズムを生成するステップと
を含む方法を実装する、機械により実行可能なコードを含む、非一過的コンピュータ可読媒体。
(項目52)
(a)対象に関する、少なくとも、腫瘍の遺伝子プロファイルおよび前記対象に以前提供されていたかまたは現在提供されている処置があればそれを含む、情報を取得し、そして前記情報に基づいて、前記対象の初期状態を判定するステップと、
(b)決定ツリーを提供するステップであって、ルートノードが、初期対象状態を表し、決定ブランチが、前記対象に利用可能な代替えの処置を表し、機会ノードが、不確実性の点を表し、決定ノードまたは終端ノードが、後続状態を表す、ステップと、
(c)前記対象が終端ノードにおいて生存している状態を達成する確率を最大化する、前記対象の処置過程を提供するステップと、
(d)前記処置過程を前記対象に投与するステップと
を含む、方法。
(項目53)
(e)前記初期状態よりも後の第2の時点において、対象に関する、少なくとも、腫瘍の遺伝子プロファイルおよび前記対象に以前提供されていたかまたは現在提供されている処置があればそれを含む、情報を取得し、そして前記情報に基づいて、複数の後続状態の中から、前記対象の第2の状態を判定するステップと、
(f)前記第2の状態に基づいて、前記対象が終端ノードにおいて生存している状態を達成する確率を最大化する、前記対象の後続の処置過程を提供するステップと、
(g)前記後続の処置過程を前記対象に投与するステップと
をさらに含む、項目52に記載の方法。
(項目54)
がんを有する対象のための複数の代替えの処置の中から処置過程を提供するステップを含む方法であって、前記対象が、複数の決定ブランチを含む決定ツリーによって特徴付けられており、それぞれの決定ブランチが、前記複数の代替えの処置の中から1つの代替えの処置を表し、その処置過程が、前記対象が終端ノードにおいて生存している状態を達成する確率を最大化する、方法。
図1
図2A
図2B
図2C
図2D
図3
図4
図5
図6
図7
【手続補正書】
【提出日】2024-06-17
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
1つまたは複数のコンピュータプロセッサによって実行される方法であって、
(a)対象に関する、少なくとも、腫瘍の遺伝子プロファイルおよび前記対象に以前に提供されていたかまたは現在提供されている処置があればそれを含む、情報を取得し、前記情報に基づいて、前記対象の初期状態を判定するステップと;
(b)決定ツリーを提供するステップであって、ルートノードが、初期対象状態を表し、決定ブランチが、前記対象に利用可能な代替えの処置を表し、機会ノードが、不確実性の点を表し、決定ノードまたは終端ノードが、後続状態を表し、
前記決定ブランチのそれぞれのブランチに確率が割り当てられ、前記終端ノードのそれぞれのノードに確率が割り当てられ、
それぞれの決定ブランチの確率の1つまたは複数と、それぞれの終端ノードの確率の1つまたは複数が、少なくとも部分的に、複数の処置選択肢の中からの処置選択の関数であり、
それぞれの決定ブランチの確率の1つまたは複数と、それぞれの終端ノードの確率の1つまたは複数が、データベースと、1つまたは複数の機械学習アルゴリズムから生成される、ステップと、
(c)前記対象が終端ノードにおいて生存している状態を達成する確率を最大化する、前記対象の処置過程を提供するステップと、
(d)(c)において提供された処置過程を示す電子出力を生成するステップと、
を含む、方法。
【請求項2】
前記遺伝子プロファイルが、遺伝性がん遺伝子である1つまたは複数の遺伝子座における前記対象の遺伝子型を含む、請求項1に記載の方法。
【請求項3】
前記遺伝子プロファイルが、薬物動態に影響を及ぼす1つまたは複数の遺伝子座における前記対象の遺伝子型を含む、請求項1に記載の方法。
【請求項4】
前記遺伝子プロファイルが、薬物感受性に影響を及ぼす1つまたは複数の遺伝子座における前記対象の遺伝子型を含む、請求項1に記載の方法。
【請求項5】
前記対象に関する前記情報が、前記腫瘍の前記遺伝子プロファイルからの前記対象の少なくとも1つの特徴を含み、1つまたは複数の体細胞変異、起源組織、腫瘍量、腫瘍の薬物感受性、および腫瘍のステージからなる群より選択される、請求項1に記載の方法。
【請求項6】
前記少なくとも1つの特徴が、前記対象由来の無細胞核酸分子をアッセイすることによって判定される、請求項5に記載の方法。
【請求項7】
体細胞変異を定量化して、前記1つまたは複数の体細胞変異を含む腫瘍に由来する無細胞核酸分子の比率を判定する、請求項6に記載の方法。
【請求項8】
前記1つまたは複数の体細胞変異の前記比率が、第1の時点と、1つまたは複数の後続時点との間で、増加しているかまたは減少しているかを判定するステップをさらに含む、請求項7に記載の方法。
【請求項9】
前記1つまたは複数の体細胞変異の前記比率が、1つまたは複数の後続時点のうちの複数の間で、増加しているかまたは減少しているかを判定するステップをさらに含む、請求項7に記載の方法。
【請求項10】
前記アッセイすることが、高スループットシーケンシングを含む、請求項6に記載の方法。
【請求項11】
前記腫瘍の前記遺伝子プロファイルが、腫瘍組織生検に由来しない、請求項1に記載の方法。
【請求項12】
前記対象が終端ノードにおいて生存している状態を達成する確率を最大化することが、前記対象が、複数のクラスターを含むデータベース中の対象のクラスターに対応すると判定することを含む、請求項1に記載の方法。
【請求項13】
前記1つまたは複数の機械学習アルゴリズムが、隠れマルコフモデルである、請求項1に記載の方法。
【請求項14】
1つまたは複数のコンピュータプロセッサによって実行される方法であって、
(a)対象に関する、少なくとも、腫瘍の遺伝子プロファイルおよび前記対象に以前に提供されていたかまたは現在提供されている処置があればそれを含む、情報を取得し、前記情報に基づいて、前記対象の初期状態を判定するステップと;
(b)決定ツリーを提供するステップであって、ルートノードが、初期対象状態を表し、決定ブランチが、前記対象に利用可能な代替えの処置を表し、機会ノードが、不確実性の点を表し、決定ノードまたは終端ノードが、後続状態を表し、
前記決定ブランチのそれぞれのブランチに確率が割り当てられ、前記終端ノードのそれぞれのノードに確率が割り当てられ、
それぞれの決定ブランチの確率の1つまたは複数と、それぞれの終端ノードの確率の1つまたは複数が、少なくとも部分的に、複数の処置選択肢の中からの処置選択の関数であり、
それぞれの決定ブランチの確率の1つまたは複数と、それぞれの終端ノードの確率の1つまたは複数が、データベースと、1つまたは複数の機械学習アルゴリズムから生成される、ステップと、
(c)前記対象が終端ノードにおいて生存している状態を達成する確率を最大化する、前記対象の処置過程を提供するステップであって、前記処置過程が前記対象に投与されるものである、ステップと、
を含む、方法。
【請求項15】
(e)前記初期状態よりも後の第2の時点において、対象に関する、少なくとも、腫瘍の遺伝子プロファイルおよび前記対象に以前提供されていたかまたは現在提供されている処置があればそれを含む、情報を取得し、前記情報に基づいて、複数の後続状態の中から、前記対象の第2の状態を判定するステップと、
(f)前記第2の状態に基づいて、前記対象が終端ノードにおいて生存している状態を達成する確率を最大化する、前記対象の後続の処置過程を提供するステップであって、前記第2の状態が、前記後続の処置過程が前記対象に投与されるものであるかどうかの指標となる、ステップと、
をさらに含む、請求項14に記載の方法。
【請求項16】
1つまたは複数のコンピュータプロセッサによって実行される方法であって、
(a)通信ネットワーク上で、1つまたは複数の医療サービス提供者との1つまたは複数の通信リンクを確立するステップと;
(b)前記通信ネットワーク上で、前記1つまたは複数の医療サービス提供者から、1つまたは複数の対象に関する医療情報を受信するステップと、
(c)前記医療サービス提供者から、前記1つまたは複数の対象のそれぞれに由来する無細胞デオキシリボ核酸(cfDNA)を含む1つまたは複数の試料を受け取るステップと、
(d)前記cfDNAのシーケンシングを行い、前記cfDNAに存在する1つまたは複数の遺伝子バリアントを特定するステップと、
(e)前記1つまたは複数の対象のそれぞれについての情報を有するデータベースを作成または供給するステップであって、前記情報が、特定された遺伝子バリアントおよび受信された医療情報の両方を含む、ステップと、
(f)前記データベースおよびコンピュータにより実装されるアルゴリズムを使用して、前記対象の初期状態に基づいて、複数の異なる治療介入のそれぞれについて、後続状態の確率を予測する、少なくとも1つの予測モデルを生成するステップと、
を含み、
前記コンピュータにより実装されるアルゴリズムが、
決定ツリーを提供するステップであって、ルートノードが、初期対象状態を表し、決定ブランチが、前記対象に利用可能な代替えの処置を表し、機会ノードが、不確実性の点を表し、決定ノードまたは終端ノードが、後続状態を表し、
前記決定ブランチのそれぞれのブランチに確率が割り当てられ、前記終端ノードのそれぞれのノードに確率が割り当てられ、
それぞれの決定ブランチの確率の1つまたは複数と、それぞれの終端ノードの確率の1つまたは複数が、少なくとも部分的に、複数の処置選択肢の中からの処置選択の関数であり、
それぞれの決定ブランチの確率の1つまたは複数と、それぞれの終端ノードの確率の1つまたは複数が、1つまたは複数の機械学習アルゴリズムから生成される、ステップ
を含む、方法。