(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-13
(54)【発明の名称】コピー数変化を同定するためのシステム及び方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20241106BHJP
C12M 1/34 20060101ALI20241106BHJP
A61P 35/00 20060101ALI20241106BHJP
A61K 45/00 20060101ALI20241106BHJP
C12N 15/12 20060101ALN20241106BHJP
C12N 15/55 20060101ALN20241106BHJP
【FI】
C12Q1/6869 Z
C12M1/34 B
A61P35/00
A61K45/00
C12N15/12
C12N15/55
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024526000
(86)(22)【出願日】2022-11-01
(85)【翻訳文提出日】2024-06-06
(86)【国際出願番号】 US2022079043
(87)【国際公開番号】W WO2023081639
(87)【国際公開日】2023-05-11
(32)【優先日】2021-11-03
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】517192663
【氏名又は名称】ファウンデーション・メディシン・インコーポレイテッド
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】リー, メイチュアン
(72)【発明者】
【氏名】レイボヴィッツ, ジェフリー
(72)【発明者】
【氏名】ヤン, レイ
【テーマコード(参考)】
4B029
4B063
4C084
【Fターム(参考)】
4B029AA07
4B029BB20
4B029FA15
4B063QA11
4B063QQ42
4B063QS36
4B063QS39
4C084AA17
4C084NA05
4C084ZB26
(57)【要約】
ゲノム中の標的ゲノムセグメントのコピー数を決定するための方法が記載される。本方法は、例えば、複数のゲノムセグメントについての複数の配列決定深度シグナルを取得することであって、配列決定深度シグナルは、ゲノムセグメント中の遺伝子座にアラインメントされた配列リードの数に対応し、複数のゲノムセグメントは、標的ゲノムセグメントを含む、取得することと、複数の配列決定深度シグナルから、複数のゲノムセグメントについての第1、第2、及び第3の統計モーメントを決定することと、第1、第2、及び第3の統計モーメントから、試料についての腫瘍純度及び腫瘍倍数性を決定することと、標的ゲノムセグメントについての配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性に基づいて、標的ゲノムセグメントのコピー数を決定することと、を含み得る。本方法は、決定されたコピー数に基づいて、試料についてのゲノムプロファイルを生成することを更に含み得る。
【選択図】
図1
【特許請求の範囲】
【請求項1】
対象由来の試料のゲノム中の標的ゲノムセグメントのコピー数を決定するための方法であって、
コンピュータシステムの1つ以上のプロセッサを使用して、前記試料の前記ゲノム中の複数のゲノムセグメントについての複数の配列決定深度シグナルを取得することであって、配列決定深度シグナルは、ゲノムセグメント中の遺伝子座にアラインメントされた配列リードの数に関連付けられ、前記複数のゲノムセグメントは、標的ゲノムセグメントを含む、取得することと、
前記1つ以上のプロセッサを使用して、前記複数のゲノムセグメントについて、前記複数の配列決定深度シグナルから第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントを決定することと、
前記1つ以上のプロセッサを使用して、前記第1の統計モーメント、前記第2の統計モーメント、及び前記第3の統計モーメントから前記試料の腫瘍純度及び腫瘍倍数性を決定することと、
前記標的ゲノムセグメントについての複数の配列決定深度シグナル、前記腫瘍純度、及び前記腫瘍倍数性を使用して、前記試料の前記ゲノム中の前記標的ゲノムセグメントの前記コピー数を決定することと、
前記コンピュータシステムによって、前記決定されたコピー数に基づいて前記試料についてのゲノムプロファイルを生成することと、を含む、方法。
【請求項2】
前記試料の前記複数の配列決定深度シグナルは、プロセス一致対照を使用して正規化される、請求項1に記載の方法。
【請求項3】
前記ゲノムをセグメント化して、前記複数のゲノムセグメントを生成することを更に含む、請求項1に記載の方法。
【請求項4】
前記ゲノムは、前記複数の配列決定深度シグナルに基づいてセグメント化される、請求項3に記載の方法。
【請求項5】
前記ゲノムは、循環バイナリセグメント化(CBS)法を使用してセグメント化される、請求項3に記載の方法。
【請求項6】
前記腫瘍純度及び前記腫瘍倍数性を決定することは、非線形方程式のセットを解くことを含む、請求項1に記載の方法。
【請求項7】
前記試料は、肺がん、結腸がん、卵巣がん、乳がん、前立腺がん、及び/又は膵臓がんを有する個体由来である、請求項1に記載の方法。
【請求項8】
前記標的ゲノムセグメントは、目的の遺伝子を含む、請求項1に記載の方法。
【請求項9】
前記目的の遺伝子は、ホスファターゼ及びテンシンホモログ(PTEN)遺伝子、乳がん1(BRCA1)遺伝子、又は乳がん2(BRCA2)遺伝子である、請求項8に記載の方法。
【請求項10】
前記目的の遺伝子は、腫瘍形成遺伝子又は細胞形質転換遺伝子である、請求項8に記載の方法。
【請求項11】
前記腫瘍形成遺伝子又は細胞形質転換遺伝子は、MLL融合遺伝子、BCR-ABL、TEL-AML I、EWS-FL11、TLS-FUS、PAX3-FKHR、Bcl-2、AML1-ETO、AML1-MTG8、Ras、Fos PDGF、RET、APC、NF-1、Rb、p53、又はMDM2を含む、請求項10に記載の方法。
【請求項12】
前記目的の遺伝子は、過剰発現した遺伝子である、請求項8に記載の方法。
【請求項13】
前記過剰発現した遺伝子は、多剤耐性遺伝子、サイクリン遺伝子、β-カテニン遺伝子、テロメラーゼ遺伝子;c-myc、n-myc、Bel-2、Erb-B1、Erb-B2、変異Ras遺伝子、変異Mos遺伝子、変異Raf遺伝子、又は変異Met遺伝子である、請求項12に記載の方法。
【請求項14】
前記目的の遺伝子は、腫瘍抑制遺伝子である、請求項8に記載の方法。
【請求項15】
前記腫瘍抑制遺伝子は、p53、p21、RB1、WTI、NF1、VHL、APC、DAPキナーゼ、p16、ARF、ニューロフィブロミン、又はPTENである、請求項14に記載の方法。
【請求項16】
標的ゲノムセグメントのコピー数を含むデータセットを生成するための方法であって、前記コピー数は、請求項1に記載の方法によって決定される、方法。
【請求項17】
前記標的ゲノムセグメントの前記決定されたコピー数に基づいて、前記試料中の前記標的ゲノムセグメントのコピー数変化(CNA)を決定することを更に含む、請求項1に記載の方法。
【請求項18】
前記試料中の前記ゲノムセグメントの前記コピー数変化(CNA)を決定することは、
a)前記標的ゲノムセグメントの前記決定されたコピー数を、前記標的ゲノムセグメントの参照コピー数と比較することと、
b)前記標的ゲノムセグメントの前記決定されたコピー数と前記参照コピー数との間の差の存在によって、前記比較から前記コピー数変化(CNA)を決定することと、を含む、請求項17に記載の方法。
【請求項19】
前記決定されたコピー数変化(CNA)を医学的診断及び/又は処置におけるバイオマーカーとして使用することを更に含む、請求項17記載の方法。
【請求項20】
前記決定されたコピー数は、前記標的ゲノムセグメントのマイナー対立遺伝子のコピー数である、請求項17に記載の方法。
【請求項21】
前記標的ゲノムセグメントのマイナー対立遺伝子のコピー数を決定することと、前記標的ゲノムセグメントの前記マイナー対立遺伝子のヘテロ接合性の喪失(LOH)を決定することと、を更に含む、請求項1に記載の方法。
【請求項22】
前記標的ゲノムセグメントの前記マイナー対立遺伝子の前記ヘテロ接合性の喪失(LOH)を決定することは、
a)0より大きく、かつ前記決定された腫瘍倍数性と2の和より小さい、前記標的ゲノムセグメントの前記決定されたコピー数の存在を決定することと、
b)a)の前記決定された存在に基づいて、
1)1に等しい、前記標的ゲノムセグメントの前記決定されたコピー数、
2)前記標的ゲノムセグメントの前記決定されたマイナー対立遺伝子コピー数に等しい、前記標的ゲノムセグメントの前記決定されたコピー数、又は
3)0に等しい、前記標的ゲノムセグメントの前記決定されたマイナー対立遺伝子コピー数、のうちのいずれか1つの存在によって前記ヘテロ接合性の喪失(LOH)を決定することと、を含む、請求項21に記載の方法。
【請求項23】
ゲノムワイドLOH(gLOH)パーセンテージスコアを、LOHセグメントの長さの合計を全ゲノムの長さで除算したものとして決定することを更に含む、請求項21に記載の方法。
【請求項24】
前記ヘテロ接合性の喪失(LOH)を相同組換え欠損(HRD)のバイオマーカーとして使用することを更に含む、請求項21に記載の方法。
【請求項25】
前記決定されたコピー数、前記決定された腫瘍純度、及び/又は前記決定された腫瘍倍数性に基づいて、前記試料の腫瘍変異負荷(TMB)を決定することを更に含む、請求項1に記載の方法。
【請求項26】
前記腫瘍変異負荷(TMB)を決定することは、
a)前記試料の前記複数の配列決定深度シグナルから複数の遺伝的バリアントを取得することと、
b)前記複数の遺伝的バリアントを、前記決定されたコピー数、前記決定された腫瘍純度、及び/又は前記決定された腫瘍倍数性と一緒に、体細胞起源のものである複数の遺伝的バリアントを決定及び出力するように構成されたモデルに入力することと、
c)前記モデルの前記出力に基づいて、前記ゲノムの100万塩基対当たりの体細胞起源の遺伝的バリアントの数を計算することによって、前記試料の前記腫瘍変異負荷(TMB)を決定することと、を含む、請求項25に記載の方法。
【請求項27】
前記決定された腫瘍変異負荷(TMB)を、医学的診断及び/又は処置におけるバイオマーカーとして使用することを更に含む、請求項25に記載の方法。
【請求項28】
前記決定されたコピー数、前記決定された腫瘍純度、及び/又は前記決定された腫瘍倍数性に基づいて、前記試料中の遺伝的バリアントの変異状態を特徴付けることを更に含む、請求項1に記載の方法。
【請求項29】
前記遺伝的バリアントの前記変異状態を特徴付けることは、
a)前記試料の前記複数の配列決定深度シグナルから遺伝的バリアントを取得することと、
b)遺伝的バリアントの変異状態を決定するように構成されたモデルを取得することと、
c)前記遺伝的バリアントを、前記決定されたコピー数、前記決定された腫瘍純度、及び/又は前記決定された腫瘍倍数性と一緒に前記モデルに入力し、前記遺伝的バリアントの前記変異状態を出力することによって、前記遺伝的バリアントの前記変異状態を特徴付けることと、を含む、請求項28に記載の方法。
【請求項30】
前記遺伝的バリアントの前記変異状態は、体細胞起源若しくは生殖細胞系起源、ホモ接合性状態若しくはヘテロ接合性状態、サブクローナル状態、又はそれらの組み合わせである、請求項28に記載の方法。
【請求項31】
前記試料の前記ゲノムプロファイルは、前記対象における疾患を診断するか、又はその診断を確認するために使用される、請求項1に記載の方法。
【請求項32】
前記疾患は、がんである、請求項31に記載の方法。
【請求項33】
前記試料の前記ゲノムプロファイルに基づいて、前記対象に投与するための抗がん治療を選択することを更に含む、請求項32に記載の方法。
【請求項34】
前記試料の前記ゲノムプロファイルに基づいて、前記対象に投与する抗がん治療の有効量を決定することを更に含む、請求項33に記載の方法。
【請求項35】
前記対象に前記抗がん治療を投与することを更に含む、請求項33に記載の方法。
【請求項36】
前記抗がん治療は、化学治療、放射線治療、免疫治療、標的治療、又は外科手術を含む、請求項33に記載の方法。
【請求項37】
がんを有する個体に対する処置を選択するための方法であって、前記方法は、
a)前記個体由来の試料中のコピー数変化(CNA)を決定することであって、前記CNAは、請求項17に記載の方法に従って決定される、決定することと、
b)前記決定されたCNAをバイオマーカーとして使用して、1つ以上の処置選択肢に対する前記個体の応答を予測することと、
c)前記予測された応答に基づいて、前記1つ以上の処置選択肢から前記個体に適した処置を選択することと、を含む、方法。
【請求項38】
がんを有する個体に対する処置を選択するための方法であって、前記方法は、
a)前記個体由来の試料中のヘテロ接合性の喪失(LOH)を決定することであって、前記LOHは、請求項21に記載の方法に従って決定される、決定することと、
b)前記決定されたLOHをバイオマーカーとして使用して、1つ以上の処置選択肢に対する前記個体の応答を予測することと、
c)前記予測された応答に基づいて、前記1つ以上の処置選択肢から前記個体に適した処置を選択することと、を含む、方法。
【請求項39】
がんを有する個体に対する処置を選択するための方法であって、前記方法は、
a)前記個体由来の試料中の腫瘍変異負荷(TMB)を決定することであって、前記TMBは、請求項25に記載の方法に従って決定される、決定することと、
b)前記決定されたTMBをバイオマーカーとして使用して、1つ以上の処置選択肢に対する前記個体の応答を予測することと、
c)前記予測された応答に基づいて、前記1つ以上の処置選択肢から前記個体に適した処置を選択することと、を含む、方法。
【請求項40】
がんを有する個体に対する処置を選択するための方法であって、前記方法は、
a)前記個体由来の試料中の遺伝的バリアントの変異状態を特徴付けることであって、前記変異状態は、請求項28に記載の方法に従って特徴付けられる、特徴付けることと、
b)前記遺伝的バリアントの前記特徴付けられた変異状態に基づいて、1つ以上の処置選択肢に対する前記個体の応答を予測することと、
c)前記予測された応答に基づいて、前記1つ以上の処置選択肢から前記個体に適した処置を選択することと、を含む、方法。
【請求項41】
前記遺伝的バリアントの前記変異状態は、体細胞又は生殖細胞系である前記遺伝的バリアントの起源である、請求項40記載の方法。
【請求項42】
前記選択された処置を前記個体に投与することを更に含む、請求項37に記載の方法。
【請求項43】
前記試料は、組織生検試料、液体生検試料、又は正常対照を含む、請求項37に記載の方法。
【請求項44】
前記試料は、液体生検試料であり、かつ血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含む、請求項43に記載の方法。
【請求項45】
前記試料は、液体生検試料であり、かつ循環腫瘍細胞(CTC)を含む、請求項43に記載の方法。
【請求項46】
前記試料は、液体生検試料であり、かつ無細胞DNA(cfDNA)、循環腫瘍DNA(ctDNA)、又はそれらの任意の組み合わせを含む、請求項43に記載の方法。
【請求項47】
前記選択された処置は、薬物投与、化学治療、放射線治療、免疫治療、標的治療、遺伝子治療、外科手術、又はそれらの任意の組み合わせを含む、請求項37に記載の方法。
【請求項48】
前記選択された処置は、チェックポイント阻害剤を前記個体に投与することを含む、請求項37に記載の方法。
【請求項49】
デバイスの1つ以上のプロセッサによる実行のための1つ以上のプログラムを含む非一時的コンピュータ可読記憶媒体であって、前記1つ以上のプログラムは、前記1つ以上のプロセッサによって実行されると、前記デバイスに請求項1に記載の方法を実施させる命令を含む、非一時的コンピュータ可読記憶媒体。
【請求項50】
1つ以上のプロセッサと、前記1つ以上のプロセッサに通信可能に結合され、前記1つ以上のプロセッサによって実行されると、前記デバイスに請求項1に記載の方法を実施させる命令を記憶するように構成されたメモリと、を備える、システム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年11月3日に出願された米国仮特許出願第63/275,154号の優先権の利益を主張し、その内容は、その全体が参照により本明細書に組み込まれる。
【0002】
本開示は、ゲノムコピー数変化を同定するための方法及びシステム、並びにその使用に関する。
【背景技術】
【0003】
がんゲノムは、がん発生に関連する重要な体細胞変化を特徴とする。これらの変化は、単一塩基変化から、数キロベースから染色体全体までのサイズ範囲の欠失及び重複の両方を含む大きな染色体断片のコピー数変化(CNA)までの範囲であり得る。特定のがんゲノムに関連する体細胞CNAの同定は、がんゲノム分析における重要な領域である。様々な研究により、特定の遺伝子のCNAが精密医学における重要な予測及び予後バイオマーカーであることが示されており、例えば、PTEN喪失は、多変量解析において疾患特異的死亡率と有意に関連することが示されている。ドライバ変異と称される体細胞変異のわずかな割合のみががん表現型に寄与するが、ほとんどの体細胞変異はランダムであり、すなわち、これらのパッセンジャー変異は疾患に寄与していない。個体の生涯の間に起こる体細胞CNAは、がん、特に固形腫瘍の発生の主要な一因である。
【0004】
CNAを測定するために、ハイスループット次世代配列決定(NGS)及び他の技術が導入されている。例えば、NGSは、参照ゲノムの間隔にアラインメントされたリードの予想される数からの偏差としてCNAを同定することが示されており、配列決定深度及び技術に応じて、CNAを単一ヌクレオチド分解能まで測定することができる。技術開発と並行して、単一試料中のCNAを同定するための多数の計算方法が開発されてきた。しかしながら、腫瘍純度及び腫瘍倍数性は、NGS分析に実質的に影響を及ぼし、結果の解釈を変更する。
【0005】
現在、腫瘍純度及び腫瘍倍数性の推定は、カバレッジ深度及びマイナー対立遺伝子頻度(MAF)情報を活用することによって、試料中の腫瘍細胞を正常細胞と統計的に区別することに大きく依存している。このアプローチに関する最も重要な問題は、識別可能性の問題であり、腫瘍純度及び腫瘍倍数性の異なる組み合わせは、しばしば、観察されたデータを等しく十分に説明することができ、一貫性のない(すなわち、不安定、不正確な)推定をもたらす。
【0006】
したがって、コピー数変化を同定するための改善された方法及びシステムが必要とされている。特に、コピー数変化を決定する際の精度及び正確度が改善された効率的な計算方法が必要とされている。かかる方法は、がんゲノム解析、診断、及び処置に有益である。
【発明の概要】
【0007】
本明細書において、高い精度及び正確度でコピー数変化を同定するための、コンピュータ実装方法を含む方法が提供される。がんゲノム解析、診断、及び処置を含む様々な適用のためのかかる方法の使用が、本明細書において更に提供される。コピー数を推定するための以前の方法は、例えば、対数比適用範囲データ及び数千のヘテロ接合性の一塩基多型(SNP)についての対立遺伝子頻度に基づいていた。この実験データをセグメント化し、モデル化して、全体的な腫瘍純度及び腫瘍倍数性を推定し、並びにセグメント当たりのコピー数及びマイナー対立遺伝子頻度(MAF)が決定される。次いで、対数比及びMAFデータを、各セグメントについてゲノム全体のコピー数を予測する統計的コピー数モデルによって適合させている。過剰パラメータ化に起因して、コピー数を決定するための従来の方法は、典型的には識別可能ではなく、すなわち、実験データは、統計モデルパラメータ値の2つ以上のセット(例えば、腫瘍純度、腫瘍倍数性、及びセグメントコピー数)によって記述され得、これは、コピー数の不安定な予測をもたらす。
【0008】
開示される方法は、腫瘍純度及び腫瘍倍数性についての固有の値を決定するために解くことができる非線形方程式の系を生成するためのモーメントの方法に基づいており、これは次に、セグメントコピー数及びマイナー対立遺伝子頻度(MAF)を決定するために使用することができる。本方法は、コピー数推定の安定性及び信頼性に起因して、以前の方法と比較して、より高い精度、正確度、及び計算効率を有し、したがって、コピー数を推定し、コピー数変化を同定するための以前の方法を超える進歩を提供する。本明細書では、かかる方法を実施するための例示的なコンピュータ可読記憶媒体及び電子デバイスも提供される。
【0009】
一態様では、本開示は、対象からの試料のゲノム中の標的ゲノムセグメントのコピー数を決定するための方法であって、試料から複数の核酸分子を提供することと、1つ以上のアダプターを、複数の核酸分子からの1つ以上の核酸分子上にライゲーションすることと、1つ以上のライゲーションされた核酸分子を増幅して、複数の核酸分子を形成することと、増幅された核酸分子から増幅された核酸分子を捕捉することと、シーケンサー(例えば、次世代シーケンサー又は超並列シーケンサー)を使用して、捕捉された核酸分子を配列決定して、捕捉された核酸分子を表す複数の配列リードを取得することであって、複数の配列リードのうちの1つ以上は、試料のゲノム中の複数のゲノムセグメントと重複する、取得することと、コンピュータシステムの1つ以上のプロセッサを使用して、試料のゲノム中の複数のゲノムセグメントについての複数の配列決定深度シグナルを取得することであって、配列決定深度シグナルは、ゲノムセグメント中の遺伝子座にアラインメントされた配列リードの数に関連付けられ、複数のゲノムセグメントは、標的ゲノムセグメントを含む、ことと、1つ以上のプロセッサを使用して、複数のゲノムセグメントについて、複数の配列決定深度シグナルから第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントを決定することと、1つ以上のプロセッサを使用して、第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントから試料の腫瘍純度及び腫瘍倍数性を決定することと、標的ゲノムセグメントについての複数の配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性を使用して、試料のゲノム中の標的ゲノムセグメントのコピー数を決定することと、を含む、方法を提供する。いくつかの実施形態では、本方法は、コンピュータシステムによって、決定されたコピー数に基づいて、試料についてのゲノムプロファイルを生成することを更に含む。
【0010】
いくつかの実施形態では、対象は、がんを有する疑いがあるか、又はがんを有すると決定される。いくつかの実施形態では、本方法は、対象から組織試料を取得することを更に含む。いくつかの実施形態では、試料が、組織生検試料、液体生検試料、又は正常対照を含む。いくつかの実施形態では、試料が、液体生検試料であり、かつ血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含む。いくつかの実施形態では、試料が、液体生検試料であり、循環腫瘍細胞(CTC)を含む。いくつかの実施形態では、試料が、液体生検試料であり、かつ無細胞DNA(cfDNA)、循環腫瘍DNA(ctDNA)、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、複数の核酸分子は、腫瘍核酸分子と非腫瘍核酸分子との混合物を含む。いくつかの実施形態では、腫瘍核酸分子は、不均質組織生検試料の腫瘍部分に由来し、かつ非腫瘍核酸分子は、不均質組織生検試料の正常部分に由来する。いくつかの実施形態では、試料は、液体生検試料を含み、腫瘍核酸分子は、液体生検試料の循環腫瘍DNA(ctDNA)画分に由来し、非腫瘍核酸分子は、液体生検試料の非腫瘍無細胞DNA(cfDNA)画分に由来する。いくつかの実施形態では、1つ以上のアダプターは、増幅プライマー、フローセルアダプター配列、基質アダプター配列、又は試料インデックス配列を含む。いくつかの実施形態では、捕捉された核酸分子は、1つ以上のベイト分子へのハイブリダイゼーションによって増幅された核酸分子から捕捉される。いくつかの実施形態では、1つ以上のベイト分子が、1つ以上の核酸分子を含み、各核酸分子が、捕捉された核酸分子の領域に相補的な領域を含む。いくつかの実施形態では、核酸分子を増幅することは、ポリメラーゼ連鎖反応(PCR)増幅技術、非PCR増幅技術、又は等温増幅技術を実施することを含む。いくつかの実施形態では、配列決定は、超並列配列決定(MPS)技術、全ゲノム配列決定(WGS)、全エクソーム配列決定、標的配列決定、直接配列決定、又はサンガー配列決定技術の使用を含む。いくつかの実施形態では、配列決定は、超並列配列決定を含み、超並列配列決定技術は、次世代配列決定(NGS)を含む。いくつかの実施形態では、配列決定は、次世代シーケンサーを含む。いくつかの実施形態では、本方法は、1つ以上のプロセッサによって、決定された腫瘍純度、腫瘍倍数性、標的ゲノムセグメントのコピー数、試料についてのゲノムプロファイル、又はこれらの任意の組み合わせを含むレポートを生成することを更に含む。いくつかの実施形態では、本方法は、レポートを医療提供者に送信することを更に含む。いくつかの実施形態では、レポートは、コンピュータネットワーク又はピアツーピア接続を介して送信される。
【0011】
別の態様では、本開示は、対象由来の試料のゲノム中の標的ゲノムセグメントのコピー数を決定するための方法であって、コンピュータの1つ以上のプロセッサを使用して、試料のゲノム中の複数のゲノムセグメントについての複数の配列決定深度シグナルを取得することであって、配列決定深度シグナルは、ゲノムセグメント中の遺伝子座にアラインメントされた配列リードの数に関連付けられ、複数のゲノムセグメントは、標的ゲノムセグメントを含む、取得することと、1つ以上のプロセッサを使用して、複数のゲノムセグメントについて、複数の配列決定深度シグナルから第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントを決定することと、1つ以上のプロセッサを使用して、第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントから試料についての腫瘍純度及び腫瘍倍数性を決定することと、標的ゲノムセグメントについての複数の配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性を使用して、試料のゲノム中の標的ゲノムセグメントのコピー数を決定することと、を含む、方法を提供する。いくつかの実施形態では、本方法は、コンピュータシステムによって、決定されたコピー数に基づいて、試料についてのゲノムプロファイルを生成することを更に含む。
【0012】
いくつかの実施形態では、試料の複数の配列決定深度シグナルは、プロセス一致対照を使用して正規化される。いくつかの実施形態では、本方法は、ゲノムをセグメント化して、複数のゲノムセグメントを生成することを更に含む。いくつかの実施形態では、ゲノムは、配列決定深度シグナルに基づいてセグメント化される。いくつかの実施形態では、ゲノムは、循環バイナリセグメント化(CBS)法を使用してセグメント化される。いくつかの実施形態では、腫瘍純度及び腫瘍倍数性を決定することは、非線形方程式のセットを解くことを含む。いくつかの実施形態では、本方法は、試料の核酸を配列決定して、試料に由来する配列リードを生成することを更に含む。いくつかの実施形態では、試料に由来する配列リードは、超並列配列決定を使用して試料の核酸を配列決定することによって生成される。いくつかの実施形態では、試料は、肺がん、結腸がん、卵巣がん、乳がん、前立腺がん、及び/又は膵臓がんを有する個体に由来する。いくつかの実施形態では、標的ゲノムセグメントは、目的の遺伝子を含む。いくつかの実施形態では、目的の遺伝子は、ホスファターゼ及びテンシンホモログ(PTEN)遺伝子、乳がん1(BRCA1)遺伝子、又は乳がん2(BRCA2)遺伝子である。いくつかの実施形態では、目的の遺伝子は、腫瘍形成遺伝子又は細胞形質転換遺伝子である。いくつかの実施形態では、腫瘍形成遺伝子又は細胞形質転換遺伝子は、MLL融合遺伝子、BCR-ABL、TEL-AML I、EWS-FL11、TLS-FUS、PAX3-FKHR、Bcl-2、AML1-ETO、AML1-MTG8、Ras、Fos PDGF、RET、APC、NF-1、Rb、p53、又はMDM2を含む。いくつかの実施形態では、目的の遺伝子は、過剰発現した遺伝子である。いくつかの実施形態では、過剰発現した遺伝子は、多剤耐性遺伝子、サイクリン遺伝子、β-カテニン遺伝子、テロメラーゼ遺伝子;c-myc、n-myc、Bel-2、Erb-B1、Erb-B2、変異Ras遺伝子、変異Mos遺伝子、変異Raf遺伝子、又は変異Met遺伝子である。いくつかの実施形態では、目的の遺伝子は、腫瘍抑制遺伝子である。いくつかの実施形態では、腫瘍抑制遺伝子は、p53、p21、RB1、WTI、NF1、VHL、APC、DAPキナーゼ、p16、ARF、ニューロフィブロミン、又はPTENである。
【0013】
標的ゲノムセグメントのコピー数を含むデータセットを生成するための方法もまた本明細書に開示され、コピー数は、本明細書に記載される方法のいずれかによって決定される。
【0014】
前述の実施形態のいずれかと組み合わされ得るいくつかの実施形態では、本方法は、標的ゲノムセグメントの決定されたコピー数に基づいて、試料中の標的ゲノムセグメントのコピー数変化(CNA)を決定することを更に含む。いくつかの実施形態では、試料中のゲノムセグメントのコピー数変化(CNA)を決定することは、標的ゲノムセグメントの決定されたコピー数を、標的ゲノムセグメントの参照コピー数と比較することと、標的ゲノムセグメントの決定されたコピー数と参照コピー数との間の差の存在によって、比較からコピー数変化(CNA)を決定することと、を含む。いくつかの実施形態では、本方法は、決定されたコピー数変化(CNA)を医学的診断及び/又は処置におけるバイオマーカーとして使用することを更に含む。いくつかの実施形態では、決定されたコピー数は、標的ゲノムセグメントのマイナー対立遺伝子のコピー数である。
【0015】
前述の実施形態のいずれかと組み合わせられ得るいくつかの実施形態では、本方法は、標的ゲノムセグメントのマイナー対立遺伝子のコピー数を決定することと、標的ゲノムセグメントのマイナー対立遺伝子のヘテロ接合性の喪失(LOH)を決定することと、を更に含む。いくつかの実施形態では、標的ゲノムセグメントのマイナー対立遺伝子のヘテロ接合性の喪失(LOH)を決定することは、a)0より大きく、かつ決定された腫瘍倍数性と2の和より小さい、標的ゲノムセグメントの決定されたコピー数の存在を決定することと、b)a)の決定された存在に基づいて、1に等しい、標的ゲノムセグメントの決定されたコピー数、標的ゲノムセグメントの決定されたマイナー対立遺伝子コピー数に等しい、標的ゲノムセグメントの決定されたコピー数、又は0に等しい、標的ゲノムセグメントの決定されたマイナー対立遺伝子コピー数、のうちのいずれか1つの存在によってヘテロ接合性の喪失(LOH)を決定することと、を含む。いくつかの実施形態では、本方法は、ゲノムワイドLOH(gLOH)パーセンテージスコアを、LOHセグメントの長さの合計を全ゲノムの長さで除算したものとして計算することを更に含む。いくつかの実施形態では、本方法は、ヘテロ接合性の喪失(LOH)を、相同組換え欠損(HRD)についてのバイオマーカーとして使用することを更に含む。
【0016】
前述の実施形態のうちのいずれかと組み合わされ得るいくつかの実施形態では、本方法は、決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性に基づいて、試料の腫瘍変異負荷(TMB)を決定することを更に含む。いくつかの実施形態では、腫瘍変異負荷(TMB)を決定することは、試料の複数の配列決定深度シグナルから複数の遺伝的バリアントを取得することと、複数の遺伝的バリアントを、決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性と一緒に、体細胞起源のものである複数の遺伝的バリアントを決定及び出力するように構成されたモデルに入力することと、モデルの出力に基づいて、ゲノムの100万塩基対当たりの体細胞起源の遺伝的バリアントの数を計算することによって、試料の腫瘍変異負荷(TMB)を決定することと、を含む。いくつかの実施形態では、本方法は、決定された腫瘍変異負荷(TMB)を医学的診断及び/又は処置におけるバイオマーカーとして使用することを更に含む。
【0017】
前述の実施形態のいずれかと組み合わされ得るいくつかの実施形態では、本方法は、決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性に基づいて、試料中の遺伝的バリアントの変異状態を特徴付けることを更に含む。いくつかの実施形態では、遺伝的バリアントの変異状態を特徴付けることは、試料の複数の配列決定深度シグナルから遺伝的バリアントを取得することと、遺伝的バリアントの変異状態を決定するように構成されたモデルを取得することと、遺伝的バリアントを、決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性と一緒にモデルに入力し、遺伝的バリアントの変異状態を出力することにより、遺伝的バリアントの変異状態を特徴付けることと、を含む。いくつかの実施形態では、遺伝的バリアントの変異状態は、体細胞起源若しくは生殖細胞系起源、ホモ接合性状態若しくはヘテロ接合性状態、サブクローン状態、又はそれらの組み合わせである。
【0018】
いくつかの実施形態では、試料について決定されたコピー数に基づくゲノムプロファイルを使用して、対象における疾患を診断するか、又はその診断を確認することができる。いくつかの実施形態では、疾患が、がんである。いくつかの実施形態では、本方法は、試料のゲノムプロファイルに基づいて、対象に投与する抗がん治療を選択することを更に含み得る。いくつかの実施形態では、本方法は、試料のゲノムプロファイルに基づいて、対象に投与する抗がん治療の有効量を決定することを更に含み得る。いくつかの実施形態では、本方法は、対象に抗がん治療を投与することを更に含み得る。いくつかの実施形態では、抗がん治療が、化学治療、放射線治療、免疫治療、標的治療、又は外科手術を含む。いくつかの実施形態では、がんは、B細胞がん(多発性骨髄腫)、黒色腫、乳がん、肺がん、気管支がん、結腸直腸がん、前立腺がん、膵臓がん、胃がん、卵巣がん、膀胱がん、脳がん、中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮内膜がん、口腔のがん、咽頭のがん、肝臓がん、腎臓がん、精巣がん、胆道がん、小腸がん、虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫、消化管間質腫瘍(GIST)、結腸がん、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性障害(MPD)、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、慢性リンパ性白血病(CLL)、赤血球増加症Vera、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ血管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭状がん、乳頭状腺がん、髄様がん、気管支原性がん、腎細胞がん、肝がん、胆管がん、絨毛がん、精上皮がん、胎児性がん、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体細胞腫、神経膠芽腫、聴神経芽腫、乏突起膠腫、髄膜腫、神経芽腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、無形成性骨髄化生、好酸球増加症候群、全身性肥満細胞症、家族性好酸球増加症、慢性好酸球性白血病、神経内分泌がん、又はカルチノイド腫瘍である。
【0019】
別の態様では、本開示は、がんを有する個体のための処置を選択するための方法であって、個体由来の試料中のコピー数変化(CNA)を決定することであって、CNAは、前述の実施形態のいずれか1つの方法に従って決定される、決定することと、決定されたCNAをバイオマーカーとして使用して、1つ以上の処置選択肢に対する個体の応答を予測することと、予測された応答に基づいて、1つ以上の処置選択肢から個体に適した処置を選択することと、を含む、方法を提供する。
【0020】
別の態様では、本開示は、がんを有する個体のための処置を選択するための方法であって、個体由来の試料中のヘテロ接合性の喪失(LOH)を決定することであって、LOHは、前述の実施形態のいずれか1つの方法に従って決定される、決定することと、決定されたLOHをバイオマーカーとして使用して、1つ以上の処置選択肢に対する個体の応答を予測することと、予測された応答に基づいて、1つ以上の処置選択肢から個体に適した処置を選択することと、を含む、方法を提供する。
【0021】
別の態様では、本開示は、がんを有する個体のための処置を選択するための方法であって、個体由来の試料中の腫瘍変異負荷(TMB)を決定することであって、TMBは、前述の実施形態のいずれか1つの方法に従って決定される、決定することと、決定されたTMBをバイオマーカーとして使用して、1つ以上の処置選択肢に対する個体の応答を予測することと、予測された応答に基づいて、1つ以上の処置選択肢から個体に適した処置を選択することと、を含む、方法を提供する。
【0022】
更に別の態様では、本開示は、がんを有する個体のための処置を選択するための方法であって、個体由来の試料中の遺伝的バリアントの変異状態を特徴付けることであって、変異状態は、前述の実施形態のいずれか1つの方法に従って特徴付けられる、特徴付けることと、遺伝的バリアントの特徴付けられた変異状態に基づいて、1つ以上の処置選択肢に対する個体の応答を予測することと、予測された応答に基づいて、1つ以上の処置選択肢から個体に適した処置を選択することと、を含む、方法を提供する。
【0023】
いくつかの実施形態では、遺伝的バリアントの変異状態は、体細胞又は生殖細胞系である遺伝的バリアントの起源である。いくつかの実施形態では、本方法は、選択された処置を個体に投与することを更に含む。いくつかの実施形態では、がんは、B細胞がん(多発性骨髄腫)、黒色腫、乳がん、肺がん、気管支がん、結腸直腸がん、前立腺がん、膵臓がん、胃がん、卵巣がん、膀胱がん、脳がん、中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮内膜がん、口腔のがん、咽頭のがん、肝臓がん、腎臓がん、精巣がん、胆道がん、小腸がん、虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫、消化管間質腫瘍(GIST)、結腸がん、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性障害(MPD)、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、慢性リンパ性白血病(CLL)、赤血球増加症Vera、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ血管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭状がん、乳頭状腺がん、髄様がん、気管支原性がん、腎細胞がん、肝がん、胆管がん、絨毛がん、精上皮がん、胎児性がん、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体細胞腫、神経膠芽腫、聴神経芽腫、乏突起膠腫、髄膜腫、神経芽腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、無形成性骨髄化生、好酸球増加症候群、全身性肥満細胞症、家族性好酸球増加症、慢性好酸球性白血病、神経内分泌がん、又はカルチノイド腫瘍である。いくつかの実施形態では、試料が、組織生検試料、液体生検試料、又は正常対照を含む。いくつかの実施形態では、試料が、液体生検試料であり、かつ血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含む。いくつかの実施形態では、試料が、液体生検試料であり、循環腫瘍細胞(CTC)を含む。いくつかの実施形態では、試料が、液体生検試料であり、かつ無細胞DNA(cfDNA)、循環腫瘍DNA(ctDNA)、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、選択された処置は、薬物投与、化学治療、放射線治療、免疫治療、標的治療、遺伝子治療、外科手術、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、選択された処置は、チェックポイント阻害剤を個体に投与することを含む。いくつかの実施形態では、本方法は、処置を選択するプロセスからレポートを生成又は更新することを更に含む。いくつかの実施形態では、本方法は、レポートを個体又は臨床医に送信することを更に含む。いくつかの実施形態では、本方法は、非一時的コンピュータ可読記憶媒体上にレポートを記憶することを更に含む。いくつかの実施形態では、本方法は、コンピュータディスプレイ上にレポートを表示することを更に含む。
【0024】
本明細書で更に提供されるのは、デバイスの1つ以上のプロセッサによって実行される1つ以上のプログラムを含む非一時的コンピュータ可読記憶媒体であって、1つ以上のプログラムが、1つ以上のプロセッサによって実行された場合、前述の実施形態のいずれか1つの方法をデバイスに実施させる命令を含む、非一時的コンピュータ可読記憶媒体である。
【0025】
本明細書で更に提供されるのは、前述の実施形態のいずれか1つの方法を実施することから生成されるレポートを含む非一時的コンピュータ可読記憶媒体である。
【0026】
本開示はまた、1つ以上のプロセッサと、メモリと、1つ以上のプログラムと、を含む電子デバイスを提供し、1つ以上のプログラムは、1つ以上のプロセッサによって実行されたとき、デバイスに前述の実施形態のいずれか1つの方法を実施させる命令を含む。いくつかの実施形態では、電子デバイスは、前述の実施形態のいずれか1つの方法を実施することから生成されたレポートを提示するための1つ以上のディスプレイを更に含む。
【0027】
参照による組み込み
この明細書で言及される全ての刊行物、特許及び特許出願は、あたかも各個々の刊行物、特許又は特許出願が参照によりその全体が組み込まれることが具体的かつ個別的に示されているのと同程度に、その全体が参照により本明細書に組み込まれる。本明細書の用語と組み込まれた参考文献の用語との間に矛盾がある場合、本明細書の用語が支配する。
【図面の簡単な説明】
【0028】
開示される方法、デバイス、及びシステムの様々な態様は、添付の特許請求の範囲に詳細に記載されている。開示される方法、デバイス、及びシステムの特徴及び利点のより良い理解は、例示的な実施形態の以下の詳細な説明及び添付の図面を参照することによって得られるであろう。
【0029】
【
図1】試料中の標的ゲノムセグメントのコピー数を決定するための例示的なプロセスの図を示す。
【
図2】試料中の標的ゲノムセグメントのコピー数及び標的ゲノムセグメントのマイナー対立遺伝子コピー数を決定するための別の例示的なプロセスの図を示す。
【
図3】試料中の標的ゲノムセグメントのコピー数変化(CNA)を決定するための例示的なプロセスの図を示す。
【
図4】試料中の標的ゲノムセグメントのマイナー対立遺伝子のヘテロ接合性の喪失(LOH)を決定するのための例示的なプロセスの図を示す。
【
図5】試料の腫瘍変異負荷(TMB)を決定するための例示的なプロセスの図を示す。
【
図6】試料中の遺伝的バリアントの変異状態を特徴付けるための例示的なプロセスの図を示す。
【
図7】決定されたコピー数変化(CNA)をバイオマーカーとして使用することによって、がんを有する個体のための処置を選択するための例示的なプロセスの図を示す。
【
図8】決定されたヘテロ接合性の喪失(LOH)をバイオマーカーとして使用することによって、がんを有する個体についての処置を選択するための例示的なプロセスの図を示す。
【
図9】決定された腫瘍変異負荷(TMB)をバイオマーカーとして使用することによって、がんを有する個体のための処置を選択するための例示的なプロセスの図を示す。
【
図10】遺伝的バリアントの特徴付けられた変異状態に基づいて、がんを有する個体に対する処置を選択するための例示的なプロセスの図を示す。
【
図11】本開示の一実施形態による例示的なコンピューティングシステムを示す。
【
図12】本明細書に説明されるシステムのいくつかの例による、例示的なコンピュータシステム又はコンピュータネットワークを示す。
【
図13】例示的な試料についてゲノムワイドヘテロ接合性喪失(gLOH)スコアを推定する際の、本明細書中に記載される方法の1つの実施形態と以前の方法との比較を示す。
【
図14】別の例示的な試料についてゲノムワイドヘテロ接合性喪失(gLOH)スコアを推定する際の、本明細書中に記載される方法の1つの実施形態と以前の方法との比較を示す。
【
図15】更に別の例示的な試料についてゲノムワイドヘテロ接合性喪失(gLOH)スコアを推定する際の、本明細書中に記載される方法の1つの実施形態と以前の方法との比較を示す。
【
図16】更に別の例示的な試料についてゲノムワイドヘテロ接合性喪失(gLOH)スコアを推定する際の、本明細書中に記載される方法の1つの実施形態と以前の方法との比較を示す。
【
図17】更に別の例示的な試料についてゲノムワイドヘテロ接合性喪失(gLOH)スコアを推定する際の、本明細書中に記載される方法の1つの実施形態と以前の方法との比較を示す。
【
図18】更に別の例示的な試料についてゲノムワイドヘテロ接合性喪失(gLOH)スコアを推定する際の、本明細書中に記載される方法の1つの実施形態と以前の方法との比較を示す。
【
図19】更に別の例示的な試料についてゲノムワイドヘテロ接合性喪失(gLOH)スコアを推定する際の、本明細書中に記載される方法の1つの実施形態と以前の方法との比較を示す。
【
図20】更に別の例示的な試料についてゲノムワイドヘテロ接合性喪失(gLOH)スコアを推定する際の、本明細書中に記載される方法の1つの実施形態と以前の方法との比較を示す。
【
図21】パーセント係数分散(%CV)に関して、例示的試料についてゲノムワイドヘテロ接合性喪失(gLOH)スコアを推定する際の、本明細書中に記載される方法の1つの実施形態と以前の方法との比較を示す。
【
図22】ベイト標的を推定する際の本明細書中に記載される方法の1つの実施形態と以前の方法との比較を示す例示的試料についての3000~3500の平均推定コピー数。
【発明を実施するための形態】
【0030】
コピー数変化(CNA)推定は、複雑なバイオマーカー値、例えば、ゲノムワイドヘテロ接合性喪失(gLOH)スコアを導出するための基礎であるため、がんゲノム解析において特に重要である。しかしながら、以前のCNAモデルには多くの制限がある。以前のCNAモデルのほとんどは同定可能ではなく、したがって、推定される腫瘍純度及びコピー数変化は不安定であり(すなわち、不正確)、これは、より信頼性の低い複雑なバイオマーカー値をもたらす可能性がある。更に、以前のCNAモデルの計算方法はあまり効率的ではなく、したがってそれらの計算コストはより高い。
【0031】
有利には、本明細書に開示される方法は、以前に使用された方法の多くと比較した場合、コピー数を決定する際に優れた正確度、精度、及び計算効率をもたらすことが見出されている。本明細書に記載されるモデルは、集団モーメント(例えば、検討中の変数の累乗の期待値)を目的のパラメータ(例えば、腫瘍純度、腫瘍倍数性、コピー数)の関数として表すことによって考案される。これらの式は、試料モーメントに等しく設定される。本方法は、腫瘍純度及び腫瘍倍数性の一意の値を決定するために解くことができる非線形方程式系を生成するために、識別可能であるモーメント法を使用してモデルパラメータを推定し、次いで、セグメントコピー数及びマイナー対立遺伝子頻度(MAF)を決定するために使用することができ、したがって、従来の方法がしばしば直面する過剰パラメータ化の問題を克服する。本方法は、各モデルパラメータを明示的かつ一意的に推定することができるため、推定されたパラメータ、例えば、コピー数、腫瘍純度、及び腫瘍倍数性は、他の方法から得られたものよりも有意に安定/精密(すなわち、反復可能)及び正確(すなわち、真の値に近い)である。
【0032】
以下の説明は、当業者が様々な実施形態を作成及び使用することを可能にするために提示される。特定のデバイス、技術、及び用途の説明は、例としてのみ提供される。本明細書で説明される例に対する様々な修正は、当業者には容易に明らかになり、本明細書で定義される一般原理は、様々な実施形態の趣旨及び範囲から逸脱することなく、他の例及び適用例に適用され得る。したがって、様々な実施形態は、本明細書で説明され、示された例に限定されるものではなく、特許請求の範囲と一致する範囲を与えられるべきである。
【0033】
本明細書に引用される刊行物、特許出願、及び特許を含む全ての参考文献は、各参考文献が参照により組み込まれることが個々にかつ具体的に示され、その全体が本明細書に記載されているのと同程度に、参照により本明細書に組み込まれる。
【0034】
定義
以下の説明は、様々な要素を説明するために「第1」、「第2」、などという用語を使用するが、これらの要素は、それらの用語によって限定されるべきではない。これらの用語は、1つの要素を別の要素と区別するためにのみ使用される。例えば、説明される様々な実施形態の範囲から逸脱することなく、第1のグラフィック表現を第2のグラフィック表現と称することができ、同様に、第2のグラフィック表現を第1のグラフィック表現と称することができる。第1のグラフィカル表現及び第2のグラフィカル表現は両方ともグラフィカル表現であるが、それらは同じグラフィカル表現ではない。
【0035】
本明細書で説明される様々な実施形態の説明で使用される用語は、特定の実施形態を説明することだけを目的としており、限定することを意図していない。説明される様々な実施形態及び添付の特許請求の範囲の説明で使用されるように、単数形「a」、「an」、及び「the」は、文脈が明らかにそうでないことを示さない限り、複数形も含むことを意図している。本明細書で使用される「及び/又は」という用語は、関連する列挙された項目のうち1つ以上のあらゆる可能な組み合わせを指し、包含することも理解されるであろう。本明細書で使用される場合、「含む(includes)」、「含む(including)」、「含む(comprises)」、及び/又は「含む(comprising)」という用語は、記載された特徴、整数、ステップ、操作、要素、及び/又は成分の存在を明示するが、1つ以上の他の特徴、整数、ステップ、操作、要素、成分、及び/又はそれらの群の存在又は追加を排除しないことが更に理解されるであろう。
【0036】
「場合(if)」という用語は、文脈に応じて、「とき(when)」又は「とき(upon)」又は「決定に応答して」又は「検出に応答して」を意味すると任意選択的に解釈される。同様に、「決定された場合」又は「[述べられた条件又は事象]が検出された場合」という句は、状況に応じて、「決定したとき」又は「決定したことに応答して」又は「[述べられた条件又は事象]を検出したとき」又は「[述べられた条件又は事象]を検出したことに応答して」を意味すると任意選択的に解釈される。
【0037】
「推定」という用語は、観察された試料データから集団の1つ以上のパラメータの値を計算する公式手順を指し、結果として得られるパラメータの計算値は「推定量」として知られている。本開示の目的のために、「決定する」、「推定する」、「同定する」、「検出する」、及び「予測する」という用語は、本明細書では互換的に使用され得る。
【0038】
「配列決定深度シグナル」という用語は、対照の配列決定深度に対する試料の配列決定深度の比を指す。
【0039】
「プロセス一致対照」という用語は、分析される試料に使用されるものと同じ試料調製及び配列決定パイプラインを使用して処理される対照試料を指すが、プロセス一致対照試料は、分析のための試料が由来した対象に由来しない。プロセス一致対照を使用して、例えば、試料の配列決定カバレッジを正規化することができる。いくつかの例において、プロセス一致対照は、例えば、複数のHapMap細胞株からのDNAの混合物を含み得る。
【0040】
「アルゴリズム」という用語は、特にコンピュータによって問題を解決するための手順又は命令のセットを指す。いくつかの例では、アルゴリズムを使用して、予測に使用することができる特定のパラメータ又は状態の表現である「モデル」すなわち、を開発することができる。本開示の目的のために、「アルゴリズム」という用語は、「方法」という用語と交換可能に使用され得る。
【0041】
「統計モーメント」又は単に「モーメント」という用語は、確率分布の属性又は特性を記述するための統計パラメータを指す。いくつかの実施形態では、モーメントは、中心に置かれてもよく(すなわち、変数の平均に対して)、これは、「中心に置かれたモーメント」又は「中心モーメント」としても知られる。
【0042】
「モーメントの方法」は、母集団パラメータの推定の方法を指す。これは、母集団モーメント(すなわち、検討中のランダム変数の累乗の期待値)を、目的のパラメータの関数として表現することによって開始する。
【0043】
「コピー数変化」、「コピー数異常」、又は「CNA」という用語は、正常細胞におけるゲノムセグメントのコピー数からの変動、例えば、正常ヒト体細胞における2つのコピーからの変動をもたらす、腫瘍又はがん性細胞におけるゲノムセグメントの獲得又は喪失を指す。
【0044】
「ゲノムワイドLOHパーセント」、「ゲノムワイドLOH」、「gLOH」という用語は、LOHセグメントの長さの合計を全ゲノムの長さで除算したものとして計算される、ゲノム全体にわたるLOH発生率の測定値(すなわち、ゲノム中のLOHセグメントのパーセンテージ)を指す。
【0045】
本明細書で互換的に使用される「個体」、「対象」、及び「患者」という用語は、がんなどの疾患に罹患しているヒトの男性又は女性、成人、小児又は乳児を指す。
【0046】
「がん」という用語は、異常細胞の制御されない増殖を特徴とする様々な疾患の広範な群を指し、「腫瘍」という用語は、異常細胞の制御されない増殖の塊を指す。いくつかの実施形態では、「がん」及び「腫瘍」という用語は、例えば、がん試料又は腫瘍試料におけるように互換的に使用され得る。
【0047】
本明細書で互換的に使用される「遺伝的バリアント」、「バリアント」、及び「変異」という用語は、置換、挿入、欠失、又は任意の他の変化によって、1つ以上のヌクレオチドが参照配列と異なるゲノム配列を指す。例えば、腫瘍試料中のバリアントは、参照配列、例えば、正常対照からのものとは異なる腫瘍ゲノム中のゲノム配列を指す。
【0048】
対象の「処置」又は「治療」は、疾患に関連する症状、合併症、状態又は生化学的徴候の発症、進行、発生、重症度又は再発を逆転、緩和、改善、阻害、減速又は予防する目的で、対象に対して実施される任意のタイプの介入若しくはプロセス、又は対象への活性剤の投与を指す。いくつかの実施形態では、処置は、処置を受けない場合に予想される生存と比較して生存を延長することを指すことができる。
【0049】
「免疫治療」という用語は、免疫応答を誘導すること、増強すること、抑制すること、又はそうでなければ改変することを含む方法による、疾患に罹患しているか、又は疾患に罹患するか若しくは疾患の再発を患うリスクがある対象の処置を指す。
【0050】
「個別化医療」、「個体化医療」及び「精密医療」という用語は、患者をある特定の疾患にかかりやすくするか若しくはかかりやすくし、かつ/又はある特定の処置に応答させる、患者の固有の分子プロファイル及び/又は遺伝子プロファイルに基づいて、各患者の個々の特徴に合わせて医療手順を調整することを指す。個別化医療は、どの医療処置が各患者にとって安全かつ有効である可能性が高いか、及びどの医療処置がそうでない可能性が高いかを予測する能力を高めている。
【0051】
「バイオマーカー」及び「マーカー」という用語は、正常な生物学的プロセス、病原性プロセス、又は曝露若しくは介入(治療的介入を含む)に対する応答の指標として測定される定義された特徴をいうために本明細書中で交換可能に使用される。
【0052】
「コンピュータ」、「プロセッサ」、及び「メモリ」という用語は全て、電子デバイス又は他の技術デバイスを指す。
【0053】
「表示する」又は「表示すること」という用語は、電子デバイス上に表示することを意味する。
【0054】
本明細書で互換的に使用される「コンピュータ可読媒体(computer readable medium)」及び「コンピュータ可読媒体(computer readable media)」という用語は、コンピュータによって可読形態で情報を記憶する有形の物理的物体に完全に限定される。これらの用語は、任意の無線信号、有線ダウンロード信号、及び任意の他の一時的な信号を除外する。
【0055】
ゲノムセグメントのコピー数を決定するための方法
一態様では、本開示は、試料(例えば、腫瘍試料)のゲノム中の標的ゲノムセグメントのコピー数を決定するための方法であって、試料から複数の核酸分子を提供することと、シーケンサー(超並列シーケンサーなど)によって複数の核酸分子を配列決定して、複数の核酸配列についての複数の配列リードを取得することと、コンピュータシステムの1つ以上のプロセッサを使用して、試料のゲノム中の複数のゲノムセグメントについての複数の配列決定深度シグナルを取得することであって、配列決定深度シグナルは、ゲノムセグメント中の遺伝子座にアラインメントされた配列リードの数に関連付けられ、複数のゲノムセグメントは、標的ゲノムセグメントを含む、取得することと、1つ以上のプロセッサを使用して、複数のゲノムセグメントについて、複数の配列決定深度シグナルから第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントを決定することと、1つ以上のプロセッサを使用して、第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントから試料についての腫瘍純度及び腫瘍倍数性を決定することと、標的ゲノムセグメントについての複数の配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性を使用して、試料のゲノム中のゲノムセグメントのコピー数を決定することと、を含む、方法を提供する。いくつかの例では、本方法は、コンピュータシステムによって、決定されたコピー数に基づいてゲノムプロファイルを生成することを更に含み得る。
【0056】
別の態様では、試料(例えば、腫瘍試料)のゲノム中の標的ゲノムセグメントのコピー数を決定するためのコンピュータ実装方法であって、コンピュータの1つ以上のプロセッサを使用して、試料のゲノム中の複数のゲノムセグメントについての複数の配列決定深度シグナルを取得することであって、配列決定深度シグナルは、ゲノムセグメント中の遺伝子座にアラインメントされた配列リードの数に関連付けられ、複数のゲノムセグメントは、標的ゲノムセグメントを含む、取得することと、1つ以上のプロセッサを使用して、複数のゲノムセグメントについて、複数の配列決定深度シグナルから第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントを決定することと、1つ以上のプロセッサを使用して、第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントから試料についての腫瘍純度及び腫瘍倍数性を決定することと、標的ゲノムセグメントについての複数の配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性を使用して、試料のゲノム中の標的ゲノムセグメントのコピー数を決定することと、を含む方法が本明細書で提供される。いくつかの例では、コンピュータ実装方法は、コンピュータシステムによって、決定されたコピー数に基づいてゲノムプロファイルを生成することを更に含み得る。
【0057】
図1は、かかる例示的なプロセス100の図を示す。
図1のステップ102では、複数の配列決定深度シグナルが、試料(例えば、腫瘍試料)中の複数のゲノムセグメント(すなわち、ゲノムのサブセグメント)について取得され、ここで複数のゲノムセグメントは、標的ゲノムセグメントを含み得る。以下により詳細に記載されるように、配列決定深度シグナルは、ゲノムセグメント中の遺伝子座にアラインメントされた配列リードの数と関連する。
【0058】
図1のステップ104では、第1、第2、及び第3の統計モーメント(すなわち、分布の形状を記述する統計パラメータ)は、以下により詳細に記述されるように、複数の配列決定深度シグナルから決定される。
【0059】
図1のステップ106では、腫瘍純度及び腫瘍倍数性は、例えば、以下でより詳細に説明するように、モーメントの方法を使用して生成された一組の非線形方程式を解くことによって、複数のシーケンシング深度シグナルの第1、第2、及び第3の統計的モーメントに基づいて試料について決定される。
【0060】
図1のステップ108では、標的ゲノムセグメントのコピー数は、標的ゲノムセグメントの配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性に基づいて決定される。
【0061】
図1のステップ110では、決定されたコピー数は、任意選択的に、試料についてのゲノムプロファイルを生成することの一部として使用される。
【0062】
プロセス100は、例えば、ソフトウェアプラットフォームを実装する1つ以上の電子デバイスを使用して実施され得る。いくつかの例では、プロセス100は、クライアント-サーバシステムを使用して実施され、プロセス100のブロックは、サーバとクライアントデバイスとの間で、任意の方法で分割される。他の例では、プロセス100のブロックは、サーバと複数のクライアントデバイスとの間で分割される。したがって、プロセス100の一部は、クライアント-サーバシステムの特定のデバイスによって実施されるものとして本明細書に記載されているが、プロセス100はそのように限定されないことを理解されたい。他の例では、プロセス100は、クライアントデバイスのみ、又は複数のクライアントデバイスのみを使用して実施される。プロセス100では、いくつかのブロックが、任意選択的に結合され、いくつかのブロックの順序が、任意選択的に変更され、いくつかのブロックが、任意選択的に省略される。いくつかの例では、プロセス100と組み合わせて追加のステップを実施することができる。したがって、図示されている(及び以下により詳細に説明されている)動作は、本質的に例示的なものであり、したがって、限定するものとみなされるべきではない。
【0063】
ゲノムセグメントの配列決定分析
本方法は、コンピュータの1つ以上のプロセッサを使用して、試料のゲノム中の複数のゲノムセグメントについての複数の配列決定深度シグナルを取得するステップを含むことができ、配列決定深度シグナルは、ゲノムセグメント中の遺伝子座にアラインメントされた配列リードの数に関連付けられ、複数のゲノムセグメントは、標的ゲノムセグメントを含む。配列決定深度シグナルは、正規化され得る。例えば、プロセス一致対照を使用して、配列決定深度シグナルを正規化してもよい。それによって、正規化された配列決定深度シグナルは、局在化されたコピー数についての情報を含む。
【0064】
いくつかの実施形態では、本方法は、試料由来の核酸を配列決定して、試料に由来する配列リードを生成することを更に含む。
【0065】
いくつかの実施形態では、試料に由来する配列リードは、超並列配列決定などの配列決定法を使用して、試料からの核酸を配列決定することによって生成される。
【0066】
次世代配列決定(NGS)とも称される超並列配列決定技術を使用して、試料中のコピー数変化を同定することができる。NGS技術の例としては、合成による配列決定、ライゲーションによる配列決定、及びハイブリダイゼーションによる配列決定が挙げられるが、これらに限定されない。超並列配列決定プロセスの例には、454 Corporationによって使用されるパイロ配列決定、IlluminaのSolexaシステム、SOLiD(商標)(Sequencing by Oligonucleotide Ligation and Detection)システム(Life Technologies Inc.)、及びPersonal Genome Machine又はProton Sequencer(Life Technologies Inc)などのIon Torrent Sequencingシステムが含まれる。NGS試料処理、リードマッピング、正規化、バリアントコーリング、及びデータ解釈に関する様々な方法及び技術が当技術分野で公知である。例えば、Kulski,J.K.,2016.Next-generation sequencing-an overview of the history,tools,and“omic”applications.Next generation sequencing-advances,applications and challenges,pp.3-60.Quinn,T.P.,Erb,I.,Richardson,M.F.and Crowley,T.M.,2018.Understanding sequencing data as compositions:an outlook and review.Bioinformatics,34(16),pp.2870-2878.を参照することができる。
【0067】
いくつかの実施形態では、本方法は、配列決定することの前に、1つ以上のハイブリダイゼーションベイト分子を使用することによって、複数の核酸分子から核酸分子のサブセットを捕捉することを更に含む。このプロセスは、標的濃縮としても知られている。
【0068】
いくつかの実施形態では、配列決定深度シグナルを正規化する。配列決定データ正規化の様々な方法及び技術が当技術分野で公知であり、本明細書に記載される方法において使用され得る。
【0069】
いくつかの実施形態では、試料(例えば、腫瘍試料)の複数の配列決定深度シグナルは、対照を使用して正規化される。いくつかの実施形態では、対照は正常(すなわち、腫瘍を含有しない)試料である。いくつかの実施形態では、対照は、プロセス一致正常試料である。
【0070】
いくつかの実施形態では、複数の配列決定深度シグナルを、Lowess回帰を使用するGC含量バイアス補正に供する。
【0071】
様々なタイプのがん試料又は腫瘍試料を本方法とともに使用することができる。腫瘍の例としては、乏突起膠腫、上衣腫、髄膜腫、リンパ腫、ユーイング肉腫、軟骨肉腫、骨肉腫、横紋筋肉腫、神経鞘腫、髄芽腫、乳房、副腎、膵臓、副甲状腺、下垂体、甲状腺、肛門、結腸直腸、食道、胆嚢、胃、肝がん、小腸、子宮頸部、子宮内膜、子宮、ファロピウス管、卵巣、膣、外陰部、喉頭、口腔咽頭、急性リンパ性白血病、急性骨髄性白血病、慢性リンパ性白血病、慢性骨髄性白血病、ヘアリー細胞白血病、中皮腫、非小細胞肺がん、小細胞肺がん、AIDS関連リンパ腫、皮膚T細胞リンパ腫、ホジキン病、非ホジキンリンパ腫、骨髄腫、陰茎、前立腺、黒色腫、カポジ肉腫、精巣、膀胱、腎臓、及び尿道腫瘍が挙げられるが、これらに限定されない。
【0072】
本方法は、任意のタイプのがんを有する個体に使用することができる。がんの非限定的な例としては、黒色腫(例えば、転移性悪性黒色腫)、腎臓がん(例えば、明細胞がん)、前立腺がん(例えば、ホルモン不応性前立腺腺がん)、膵臓がん、乳がん、結腸がん、肺がん(例えば、非小細胞肺がん)、食道がん、頭頸部の扁平上皮がん、肝臓がん、卵巣がん、子宮頸がん、及び甲状腺がんを挙げることができる。
【0073】
いくつかの実施形態では、試料は、肺がん、卵巣がん、乳がん、前立腺がん、又は膵臓がんを有する患者に由来する。
【0074】
腫瘍細胞又は腫瘍組織を含む試料(例えば、腫瘍試料)は、例えば、患者から採取された生検から得ることができる。
【0075】
本発明の方法は、様々なレベルの腫瘍純度の試料に対して使用され得る。いくつかの実施形態では、腫瘍純度は、約1%、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約15%、約20%、約25%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、又は100%である。
【0076】
いくつかの実施形態では、腫瘍純度は、約1%~約2%、約1%~約3%、約1%~約4%、約1%~約5%、約1%~約6%、約1%~約7%、約1%~約8%、約1%~約9%、約1%~約10%、約1%~約15%、約1%~約20%、約1%~約25%、約1%~約30%、約1%~約35%、約1%~約40%、約1%~約45%、約1%~約50%、約1%~約55%、約1%~約60%、約1%~約65%、約1%~約70%、約1%~約75%、約1%~約80%、約1%~約85%、約1%~約90%、約1%~約95%、又は約1%~100%の範囲内である。
【0077】
いくつかの実施形態では、腫瘍純度は、約2%~約3%、約2%~約4%、約2%~約5%、約2%~約6%、約2%~約7%、約2%~約8%、約2%~約9%、約2%~約10%、約2%~約15%、約2%~約20%、約2%~約25%、約2%~約30%、約2%~約35%、約2%~約40%、約2%~約45%、約2%~約50%、約2%~約55%、約2%~約60%、約2%~約65%、約2%~約70%、約2%~約75%、約2%~約80%、約2%~約85%、約2%~約90%、約2%~約95%、又は約2%~100%の範囲である。
【0078】
いくつかの実施形態では、腫瘍純度は、約3%~約4%、約3%~約5%、約3%~約6%、約3%~約7%、約3%~約8%、約3%~約9%、約3%~約10%、約3%~約15%、約3%~約20%、約3%~約25%、約3%~約30%、約3%~約35%、約3%~約40%、約3%~約45%、約3%~約50%、約3%~約55%、約3%~約60%、約3%~約65%、約3%~約70%、約3%~約75%、約3%~約80%、約3%~約85%、約3%~約90%、約3%~約95%、又は約3%~100%の範囲である。
【0079】
いくつかの実施形態では、腫瘍純度は、約4%~約5%、約4%~約6%、約4%~約7%、約4%~約8%、約4%~約9%、約4%~約10%、約4%~約15%、約4%~約20%、約4%~約25%、約4%~約30%、約4%~約35%、約4%~約40%、約4%~約45%、約4%~約50%、約4%~約55%、約4%~約60%、約4%~約65%、約4%~約70%、約4%~約75%、約4%~約80%、約4%~約85%、約4%~約90%、約4%~約95%、又は約4%~100%の範囲内である。
【0080】
いくつかの実施形態では、腫瘍純度は、約5%~約6%、約5%~約7%、約5%~約8%、約5%~約9%、約5%~約10%、約5%~約15%、約5%~約20%、約5%~約25%、約5%~約30%、約5%~約35%、約5%~約40%、約5%~約45%、約5%~約50%、約5%~約55%、約5%~約60%、約5%~約65%、約5%~約70%、約5%~約75%、約5%~約80%、約5%~約85%、約5%~約90%、約5%~約95%、又は約5%~100%の範囲である。
【0081】
いくつかの実施形態では、腫瘍純度は、約10%~約15%、約10%~約20%、約10%~約25%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約65%、約10%~約70%、約10%~約75%、約10%~約80%、約10%~約85%、約10%~約90%、約10%~約95%、又は約10%~100%の範囲内である。
【0082】
いくつかの実施形態では、腫瘍純度は、約20%~約25%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約65%、約20%~約70%、約20%~約75%、約20%~約80%、約20%~約85%、約20%~約90%、約20%~約95%、又は約20%~100%の範囲である。
【0083】
いくつかの実施形態では、腫瘍純度は、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約65%、約30%~約70%、約30%~約75%、約30%~約80%、約30%~約85%、約30%~約90%、約30%~約95%、又は約30%~100%の範囲である。
【0084】
いくつかの実施形態では、腫瘍純度は、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約65%、約40%~約70%、約40%~約75%、約40%~約80%、約40%~約85%、約40%~約90%、約40%~約95%、又は約40%~100%の範囲である。
【0085】
いくつかの実施形態では、腫瘍純度は、約50%~約55%、約50%~約60%、約50%~約65%、約50%~約70%、約50%~約75%、約50%~約80%、約50%~約85%、約50%~約90%、約50%~約95%、又は約50%~100%の範囲である。
【0086】
いくつかの実施形態では、腫瘍純度は、約60%~約65%、約60%~約70%、約60%~約75%、約60%~約80%、約60%~約85%、約60%~約90%、約60%~約95%、又は約60%~100%の範囲である。いくつかの実施形態では、腫瘍純度は、約70%~約75%、約70%~約80%、約70%~約85%、約70%~約90%、約70%~約95%、又は約70%~100%の範囲である。いくつかの実施形態では、腫瘍純度は、約80%~約85%、約80%~約90%、約80%~約95%、又は約80%~100%の範囲である。いくつかの実施形態では、腫瘍純度は、約90%~約95%、約95%~約100%、又は約90%~100%の範囲である。
【0087】
いくつかの実施形態では、標的ゲノムセグメントは、目的の遺伝子を含む。本開示は、試料中の目的の様々な遺伝子のコピー数を決定するために使用され得る。腫瘍形成及び/又は細胞形質転換に関連する遺伝子の例としては、MLL融合遺伝子、BCR-ABL、TEL-AML I、EWS-FL11、TLS-FUS、PAX3-FKHR、Bcl-2、AML1-ETO、AML1-MTG8、Ras、Fos PDGF、RET、APC、NF-1、Rb、p53、MDM2など;多剤耐性遺伝子などの過剰発現遺伝子;サイクリン;β-カテニン;テロメラーゼ遺伝子;c-myc、n-myc、Bel-2、Erb-B1及びErb-B2;並びにRas、Mos、Raf、及びMetなどの変異遺伝子が挙げられる。腫瘍抑制遺伝子の例としては、p53、p21、RB1、WTI、NF1、VHL、APC、DAPキナーゼ、p16、ARF、ニューロフィブロミン、及びPTENが挙げられるが、これらに限定されない。抗がん治療に有用な核酸剤によって標的化され得る遺伝子の例としては、インテグリン、セレクチン、及びメタロプロテイナーゼのような腫瘍移動に関連するタンパク質をコードする遺伝子;血管内皮成長因子(VEGF)又はWO2011/097533 PCTfUS2011/023823 VEGFrのような新しい血管の形成を促進するタンパク質をコードする抗脈管形成遺伝子;エンドスタチン、アンギオスタチン、及びVEGF-R2のような新血管形成を阻害するタンパク質をコードする抗脈管形成遺伝子;並びにインターロイキン、インターフェロン、線維芽細胞成長因子(a-FGF及び((3-FGF)、インスリン様成長因子(例えば、IGF-1及びIGF-2)、血小板由来成長因子(PDGF)、腫瘍壊死因子(TNF)、形質転換成長因子(例えば)、TGF-a及びTGF-3、表皮成長因子(EGF)、ケラチノサイト成長因子(KGF)、幹細胞因子及びそのレセプターc-Kit(SCF/c-Kit)リガンド、CD40L/CD40、VLA-4 VCAM-1、ICAM-1/LFA-1、hyalurin/CD44などのようなタンパク質をコードする遺伝子が挙げられる。当業者によって認識されるように、前述の実施例は排他的ではない。
【0088】
いくつかの実施形態では、目的の遺伝子は、ホスファターゼ及びテンシンホモログ(PTEN)遺伝子、乳がん1(BRCA1)遺伝子、又は乳がん2(BRCA2)遺伝子である。
【0089】
いくつかの実施形態では、本方法は、複数のゲノムセグメントを生成するためにゲノムをセグメント化することを更に含む。いくつかの実施形態では、ゲノムは、配列決定深度シグナルを使用してセグメント化される。いくつかの実施形態では、ゲノムは、循環バイナリセグメント化(CBS)アルゴリズムを使用してセグメント化される。いくつかの実施形態では、ゲノムは、対立遺伝子頻度も考慮する方法を使用してセグメント化される。
【0090】
循環バイナリセグメント化(CBS)アルゴリズムは、ゲノムを等しいコピー数のセグメントに分割し、CBSは、各セグメントが均一になり、その結果、更なる分割がシグナルレベルの統計学的に有意な差をもたらさなくなるまで、配列決定深度シグナルデータを個々のセグメントに再帰的に分割する。1つの試料の異数性及びデータ品質に依存して、セグメントの数は、22から数百の範囲であり得る。CBSの更なる詳細は、Olshenet al.Circular binary segmentation for the analysis of array-based DNA copy number data.Biostatistics,5(4):557-572,2004.に見出すことができる。
【0091】
いくつかの実施形態では、S
iがゲノムセグメントである場合、l
iを既知のその長さとし、C
iをそのコピー数とする。試料の腫瘍倍数性Ψは、
【数1】
である。R
ijがS
i内の標的jに対する正規化された配列決定深度シグナルを表すランダム変数であり、pが腫瘍純粋度である場合、R
ijを次のような正規分布としてモデル化することができる。
【数2】
ここで、σ
riは、観察されたノイズを反映する、セグメントS
iにおける対数比データの標準偏差(SD)である。
【0092】
同様に、ランダム変数f
ijが、セグメントS
i内のSNPのマイナー対立遺伝子頻度(MAF)を表し、M
iが、S
iにおけるマイナー対立遺伝子のコピー数であり、整数0≦M
i≦C
iとして分布し、そしてσ
fiが、セグメントS
iにおけるSNPデータのSDである場合、f
ijを以下のようにモデル化することができる。
【数3】
配列決定深度シグナル及びMAFのこのモデルを考慮して、2ステップアプローチを使用して、各セグメントでのモデルパラメータC
i及びM
i、並びにゲノムワイドモデルパラメータ腫瘍純度(p)及び倍数性(Ψ)の最適な適合を見出すことができる。
【0093】
統計モーメント
本方法はまた、1つ以上のプロセッサを使用して、複数のゲノムセグメントについて、複数の配列決定深度シグナルから第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントを決定するステップを含み得る。
【0094】
p(x)(確率質量関数)及びf(x)(確率密度関数)に関するモーメント及び中心モーメントの表現は、以下の通りである。
●Xの第nのモーメントは、E[Xn]として表され、ここで、E[Xn]は以下のとおりである。
【数4】
●Xの第nの中央モーメントは、μ[Xn]として表され、ここで、μ[Xn]は以下のとおりである。
【数5】
【0095】
モーメント及び中心モーメントの例は、以下を含むことができる。
1)第1のモーメント、例えば、データの中心傾向の尺度である平均、例えば、平均値。
2)第2の中心モーメント、例えば、平均値からの観察の広がりを測定する分散、例えば、ランダム変数のその平均からの偏差の二乗。
3)正規化又は標準化されたときに、歪度と称されることがあり、平均の周りの確率分布の対称性を測定する第3の中心モーメント。
【0096】
いくつかの実施形態では、以下のモーメントを使用することができる。R
ijは、正規化された配列決定深度シグナルを表すランダム変数であり(R
o
ijはR
ijについて観察された値である)、ここでi=1,…,Iはセグメントの数を示し、j=1,…,n
iはセグメントS
i中の標的(例えば、遺伝子座)の数を示す。セグメントS
i中のコピー数C
iを考えると、以下のように仮定することができる。
1)R
ijの第1のモーメント:
【数6】
2)中心に置かれたR
ijの第2のモーメント:
【数7】
3)中心に置かれたR
ijの第3のモーメント:
【数8】
各セグメント内のコピー数の分布:Ci~Pois(λ)
【0097】
いくつかの実施形態では、各セグメントR
i内の平均配列決定深度シグナルを表す変数S
iは、以下のように確立することができる。
【数9】
【0098】
次いで、第1のモーメント、第2の中心モーメント、及び第3の中心モーメントを含むRiのモーメントを、全てのセグメントのデータに基づいて決定することができる。
【0099】
腫瘍純度及び倍数性を推定するためのモーメントの方法
本方法は、1つ以上のプロセッサを使用して、第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントから試料についての腫瘍純度及び腫瘍倍数性を決定するステップを更に含むことができる。いくつかの実施形態では、本方法は、モーメント推定の方法を使用して、腫瘍純度及び腫瘍倍数性を決定することができる。
【0100】
要するに、モーメントの方法は、試料モーメント(測定されたモーメント、Mi)を、パラメータXiに対する理論的モーメント(推定されたモーメント、E(Xi))と等しくすることを含む。以下に示されるように、得られた方程式のセットを解くことによって、理論的モーメントの計算に関与する目的のパラメータを推定することができる。モーメントの方法を実装する例示的なプロセスは、以下の通りである。
1)第1の試料モーメントM1を第1の理論的モーメントE(X1)と等しくする。
2)第2の試料モーメントM2を第2の理論的モーメントE(X2)と等しくする。
3)試料モーメントMkを、対応する理論的モーメントE(Xk)、k=3、4、…、と等しくすることを継続し、ここで、kは、推定されるパラメータの数に等しい。
4)パラメータに対する方程式のセットを解く。
【0101】
いくつかの実施形態では、非線形方程式のセットが、モーメント法に従って確立される。いくつかの実施形態では、腫瘍純度及び腫瘍倍数性を決定することは、非線形方程式のセットを解くことを含む。
【0102】
n
iを仮定すると、各セグメントにおける標的の数は、十分に大きくすることができ、モーメントの方法による非線形方程式のセットは、以下の方程式系(4)で確立される。
【数10】
ここで、R
1,…,R
Iのモーメントは、E(R
i)、V(R
i)及びμ
3(R
i)を推定するために使用される。
【0103】
具体的には、3つの未知のパラメータ:腫瘍純度p、腫瘍倍数性Ψ、及びλ(すなわち各セグメント内のコピー数の分布におけるランダム変数:Ci~Pois(λ))は、上記の非線形方程式系を解くことによって解くことができる。3つの未知のパラメータに対する制約は、0<p<1、Ψ>0及びλ>0であることに留意されたい。
【0104】
いくつかの実施形態では、計算プロセスを容易にするために、パラメータを再パラメータ化することができる。例えば、以下のパラメータ化を実施することができる。
【数11】
Ψ=e
β及びλ=e
γ。
【0105】
いくつかの実施形態では、非線形方程式のセットを解くことは、Rソフトウェアパッケージ「BB」を使用することを含む。
【0106】
標的ゲノムセグメントのコピー数の決定
腫瘍純度及び腫瘍倍数性を決定した後、次いで、標的ゲノムセグメントのコピー数を、標的ゲノムセグメントについての複数の配列決定深度シグナルを使用して決定することができる。
【0107】
例として、推定純度
【数12】
及び倍数性
【数13】
を取得した後、任意の所与のセグメントC
iにおける推定コピー数S
iを、推定純度
【数14】
及び倍数性
【数15】
に基づいて決定することができる。C
iは、例えば、式(5)を用いて解くことができる。
【数16】
【0108】
ここで、R
o
ijは、セグメントi上の標的jについての観察された(正規化された)配列決定深度シグナルである。推定C
iが負である場合、C
i=0とする。C
iの解は、
【数17】
と
【数18】
との間の距離を制約C
i≧0で最小化する。
【0109】
いくつかの実施形態では、本方法は、標的ゲノムセグメントについてのマイナー対立遺伝子コピー数を決定することを更に含む。
【0110】
例として、各セグメントS
iにおけるマイナー対立遺伝子M
iのコピー数は、推定された
【数19】
倍数性
【数20】
及びコピー数
【数21】
に基づいて推定され得る。例えば、M
iは、以下の式を使用して直接解くことができる。
【数22】
【0111】
ここで、f
o
ijは、セグメントi上の標的jについて観察されたマイナー対立遺伝子頻度である。推定されたM
iが負である場合、M
i=0であり、
【数23】
と推定される場合、
【数24】
である。解は、
【数25】
と
【数26】
との間の距離を制約
【数27】
で最小化する。
【0112】
図2は、標的ゲノムセグメントについてのコピー数及びマイナー対立遺伝子コピー数を決定するための例示的なプロセス200についてのフローチャートを提供する。
図2のステップ202では、配列深度シグナルR
ijを正規化するために正規化方法が適用される。例えば、配列リードデータは、入力デバイスから受信されてもよく、配列リードデータは、複数のゲノムセグメントに対する複数の配列決定深度シグナルを含み、複数の配列決定深度シグナルは、試料に由来する配列決定データと関連付けられ、複数のゲノムセグメントは、標的ゲノムセグメントを含む。
【0113】
図2のステップ204では、セグメント化法を正規化された配列深度シグナルデータに適用してゲノムをセグメント化する。いくつかの例では、例えば、循環バイナリセグメント化(CBS)法などのセグメント化法を適用して、ゲノムを、各セグメントが同じコピー数を有するセグメントにセグメント化することができる。
【0114】
図2のステップ206では、平均配列深度シグナルは各セグメントに対して決定され、正規化された配列深度シグナルの分布に対する第1、第2、及び第3のモーメントを推定するために使用される。例えば、R
o
1、…、R
o
Iに対する値は、各セグメントS
iに対する実験データから決定され、次いでE(R
i)、V(R
i)及びμ
3(R
i)を推定するために使用される。
【0115】
図2のステップ208では、試料の腫瘍純度及び腫瘍倍数性は、モーメント法によって生成された非線形方程式のセット(例えば、式(4))を解くことによって決定される。
【0116】
図2のステップ210では、コピー数、C
i、及びマイナー対立遺伝子のコピー数、M
i、各セグメントについてS
iは、例えば、式(5)及び(6)を解くことによって推定される。
【0117】
コンピュータによって実装される場合、試料のゲノム中の標的ゲノムセグメントのコピー数を決定するための方法は、
a)入力デバイスから配列決定情報のデータセットを受信することであって、
データセットは、複数のゲノムセグメントについての複数の配列決定深度シグナルを含み、複数の配列決定深度シグナルが、腫瘍試料に由来する配列決定データに関連付けられ、複数のゲノムセグメントは、標的ゲノムセグメントを含む、受信することと、
b)標的ゲノムセグメントのコピー数を予測するために、データセットをモデルに自動的に入力することであって、
モデルは、複数の正規化された配列決定深度シグナルから第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントを推定し、標的ゲノムセグメントの腫瘍純度値、腫瘍倍数性値、及びコピー数を予測するように構成される、入力することと、
c)予測された腫瘍純度値、予測された腫瘍倍数性値、及び標的ゲノムセグメントの予測されたコピー数を出力することと、
d)任意選択的に、出力を表示デバイス上に表示することと、を含み得る。
【0118】
いくつかの実施形態では、モデルはまた、予測腫瘍純度値、予測腫瘍倍数性値、及び標的ゲノムセグメントの予測コピー数に加えて、標的ゲノムセグメントについての予測マイナー対立遺伝子コピー数を予測し、出力することもできる。
【0119】
コピー数変化(CNA)を決定するための方法
いくつかの例では、本方法は、標的ゲノムセグメントの決定されたコピー数に基づいて、試料中の標的ゲノムセグメントのコピー数変化(CNA)を決定することを更に含み得る。コピー数変化は、単一ヌクレオチド塩基変化(例えば、SNP)とは異なり、通常、例えば、数キロベースから全染色体までのサイズ範囲の比較的大きな染色体断片の変化から生じる。CNAは、がんにおいて特に見られ、その発生及び進行において主要な寄与を果たすゲノム材料の断片の欠失又は増幅を含みうる。
【0120】
図3は、標的ゲノムセグメントのコピー数変化を決定するための例示的なプロセス300のフローチャートを提供する。
図3のステップ302では、複数の配列決定深度シグナルが、試料中の複数のゲノムセグメントについて取得され、複数のゲノムセグメントは、標的ゲノムセグメントを含み、複数の配列決定深度シグナルは、試料に由来する配列決定データと関連付けられる。
【0121】
図3のステップ304では、第1、第2、及び第3の統計モーメントが、複数の配列決定深度シグナルから決定される。
【0122】
図3のステップ306では、腫瘍純度及び腫瘍倍数性は、例えば、モーメントの方法を使用して生成された非線形方程式のセットを解くことによって、複数の配列決定深度シグナルについての第1、第2、及び第3の統計モーメントに基づいて試料について決定される。
【0123】
図3のステップ308では、標的ゲノムセグメントのコピー数は、本明細書の他の箇所に記載されるように、例えば、モーメントの方法を使用して生成された追加の非線形方程式を解くことによって、標的ゲノムセグメントについての配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性に基づいて決定される。
【0124】
図3のステップ310では、試料中の標的ゲノムセグメントについての推定コピー数を、参照試料中の標的ゲノムセグメントについてのコピー数と比較する。
【0125】
図3のステップ312では、コピー数変化(CAN)は、試料中の標的ゲノムセグメントについての推定コピー数と参照についての推定コピー数との間の差異を検出することによって、試料中の標的ゲノムセグメントについて同定される。
【0126】
参照コピー数は、ゲノム(例えば、試料ゲノム又は腫瘍ゲノム)中のコピー数が逸脱し得る正常ゲノム中のコピー数を表す。参照コピー数は、対照試料に由来し得る。いくつかの実施形態では、対照試料は、例えば、対の正常(すなわち、非腫瘍)試料である。いくつかの実施形態では、対照試料は、例えば、試料についてのプロセス一致正常対照である。
【0127】
コンピュータによって実装される場合、試料中の標的ゲノムセグメントのコピー数変化(CNA)を決定することは、
a)入力デバイスから配列決定情報のデータセットを受信することであって、
データセットは、複数のゲノムセグメントについての複数の配列決定深度シグナル及び標的ゲノムセグメントの参照コピー数を含み、複数の配列決定深度シグナルは、試料に由来する配列決定データに関連付けられ、複数のゲノムセグメントは、標的ゲノムセグメントを含む、受信することと、
b)標的ゲノムセグメントのコピー数変化(CNA)を予測するために、データセットをモデルに自動的に入力することであって、
モデルは、複数の正規化された配列決定深度シグナルから第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントを推定し、標的ゲノムセグメントの腫瘍純度値、腫瘍倍数性値、及びコピー数を予測し、標的ゲノムセグメントの予測コピー数と標的ゲノムセグメントの参照コピー数との間の差を計算するように構成される、入力することと、
c)標的ゲノムセグメントの予測されたコピー数と標的ゲノムセグメントの参照コピー数との間の計算された差を、決定されたコピー数変化(CNA)として出力することと、
d)任意選択的に、出力を表示デバイス上に表示することと、を含み得る。
【0128】
いくつかの実施形態では、本方法は、決定されたコピー数変化(CNA)を医学的診断及び/又は処置におけるバイオマーカーとして使用することを更に含み得る。CNA及びバイオマーカーとしてのその使用についての更なる詳細は、例えば、Lu,Zhihao,et al.“Tumor copy-number alterations predict response to immune-checkpoint-blockade in gastrointestinal cancer.”Journal for immunotherapy of cancer 8.2 (2020)、及びFumet,Jean-David,et al.“Tumour mutational burden as a biomarker for immunotherapy:Current data and emerging concepts.”European Journal of Cancer 131 (2020):40-50.を参照することができる。更なる詳細については、また、以下のセクション「医学的処置を選択するための方法」を参照されたい。
【0129】
ヘテロ接合性の喪失(LOH)を決定するための方法
本方法は、標的ゲノムセグメントの決定されたマイナー対立遺伝子コピー数に基づいて、標的ゲノムセグメントのマイナー対立遺伝子のヘテロ接合性の喪失(LOH)を決定することを更に含み得る。
【0130】
ヘテロ接合性の喪失(LOH)は、目的の多型ゲノム遺伝子座におけるヘテロ接合性からホモ接合性への変化をいう。ヒトゲノム内の多型遺伝子座(例えば、SNP)は、その個体が典型的には生物学的父から1コピー及び生物学的母から1コピーを受け取るため、個体の生殖細胞系内でヘテロ接合性であり得る。しかし、体細胞では、このヘテロ接合性は、ホモ接合性、すなわち、LOHに(変異を介して)変化し得る。LOHは、複数の機構から生じ得る。例えば、いくつかの場合において、1つの染色体の遺伝子座が体細胞において欠失され得る。他の染色体(男性については他の非性染色体)上に存在したままである遺伝子座は、影響を受けた細胞のゲノム内に存在するその遺伝子座の1つのコピー(2つのコピーの代わりに)のみが存在するため、LOH遺伝子座である。このタイプのLOH事象は、コピー数の減少をもたらす。他の場合には、体細胞中の1つの染色体(例えば、男性についての1つの非性染色体)の遺伝子座は、他の染色体由来のその遺伝子座のコピーで置換され得、それによって、置換された遺伝子座内に存在し得る任意のヘテロ接合性を排除する。かかる場合、各染色体上に存在したままである遺伝子座はLOH遺伝子座であり、コピーニュートラルLOH遺伝子座と称することができる。
【0131】
図4は、標的ゲノムセグメントのマイナー対立遺伝子のヘテロ接合性の喪失(LOH)を決定するための例示的なプロセス400のフローチャートを提供する。
図4のステップ402では、複数の配列決定深度シグナルが、試料中の複数のゲノムセグメントについて取得され、複数のゲノムセグメントは、標的ゲノムセグメントを含み、複数の配列決定深度シグナルは、試料に由来する配列決定データと関連付けられる。
【0132】
図4のステップ404では、第1、第2、及び第3の統計モーメントが、複数の配列決定深度シグナルから決定される。
【0133】
図4のステップ406では、腫瘍純度及び腫瘍倍数性は、例えば、モーメントの方法を使用して生成された非線形方程式のセットを解くことによって、複数の配列決定深度シグナルについての第1、第2、及び第3の統計モーメントに基づいて試料について決定される。
【0134】
図4のステップ408では、標的ゲノムセグメントのコピー数は、本明細書の他の箇所に記載されるように、例えば、モーメントの方法を使用して生成された追加の非線形方程式を解くことによって、標的ゲノムセグメントについての配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性に基づいて決定される。
【0135】
図4のステップ410では、標的ゲノムセグメントについてのマイナー対立遺伝子コピー数が決定される。
【0136】
図4のステップ412では、標的ゲノムセグメントについての推定コピー数値が0より大きくかつ(腫瘍倍数性+2)未満であるか否かの決定がなされる。
【0137】
図4のステップ414では、以下により詳細に記載されるように、ヘテロ接合性の喪失(LOH)が標的ゲノムセグメントのマイナー対立遺伝子について生じたか否かの決定がなされる。
【0138】
いくつかの実施形態では、標的ゲノムセグメントのマイナー対立遺伝子のLOHを決定するためのステップは、以下の通りである。推定コピー数Ci、マイナー対立遺伝子のコピー数Mi及び倍数性Ψを考慮すると、
セグメントSiについて:
(1)Ci≧Ψ+2:LOHではない(増幅)。
(2)Ci=0:LOHではない(喪失)。
(3)0<Ci<Ψ+2:
(a)Ci=1又はCi=<Mi又はMi=0:LOH
(b)その他:LOHではない。
【0139】
したがって、標的ゲノムセグメントのマイナー対立遺伝子のLOHは、0より大きく、推定倍数性と2との和より小さい標的ゲノムセグメントの推定コピー数の存在を決定することと、1に等しい標的ゲノムセグメントの推定コピー数、標的ゲノムセグメントのマイナー対立遺伝子の推定コピー数に等しい標的ゲノムセグメントの推定コピー数、及び0に等しい標的ゲノムセグメントのマイナー対立遺伝子の推定コピー数のいずれか1つの存在を決定することと、によって同定することができる。
【0140】
いくつかの実施形態では、LOHは、試料のゲノムワイドLOH(gLOH)のパーセントである。いくつかの実施形態では、全ゲノム長に対するLOHセグメント長の割合としてのgLOHスコアは、以下の式を使用して導出することができる。
【数28】
ここで、1(S
iはLOHである)は以下のようなインジケータ関数である。
S
iがLOHである場合、1(S
iはLOHである)=1である。
S
iがLOHでない場合、1(S
iはLOHである)=0である。
【0141】
染色体長に対するLOHセグメント長の割合が90%を超える染色体については、その上のセグメントは、場合により、式(7)の分子におけるgLOHスコア計算から除外される。
【0142】
コンピュータによって実装される場合、標的ゲノムセグメントのマイナー対立遺伝子のヘテロ接合性の喪失(LOH)を決定することは、
a)入力デバイスから配列決定情報のデータセットを受信することであって、
データセットは、標的ゲノムセグメントの予測される決定されたコピー数及び標的ゲノムセグメントの予測されるマイナー対立遺伝子コピー数を含む、受信することと、
b)データセットをモデルに自動的に入力してヘテロ接合性の喪失(LOH)を予測することであって、モデルは、
0より大きく、かつ予測された腫瘍倍数性と2との和より小さい標的ゲノムセグメントの予測されたコピー数の第1の存在を確認することと、
1)1に等しい、標的ゲノムセグメントの予測コピー数、
2)標的ゲノムセグメントの予測されるマイナー対立遺伝子コピー数に等しい、標的ゲノムセグメントの予測されるコピー数、又は
3)0に等しい、標的ゲノムセグメントの予測マイナー対立遺伝子コピー数、のうちのいずれか1つの第2の存在を確認することと、を行うように構成されている、予測することと、
c)第1の存在及び第2の存在の両方が確認される場合、LOHの存在を示す第1の値を出力するか、又は第1の存在及び第2の存在のうちの少なくとも1つが確認されない場合、LOHの非存在を示す第2の値を出力することと、
d)任意選択的に、出力を表示デバイス上に表示することと、を含み得る。
【0143】
ゲノムワイドLOH(gLOH)特徴は、相同組換え欠損(HRD)のバイオマーカーとして使用することができる。相同組換え欠損(HRD)は、相同組換えプロセスの低減又は障害を指す。理論に束縛されることを望むものではないが、相同組換えはDNA修復に関与するため、相同組換え欠損試料は、二本鎖切断などのDNA損傷を修復することができないか、又はその能力が低下すると考えられる。したがって、HRDである試料は、ゲノムエラー又は染色体異常を蓄積し、HRDのバイオマーカーとして使用することができる。LOH及びHRDの決定におけるその使用は、公開された国際出願WO/2011/160063号に詳細に記載されており、その全内容は参照により本明細書に組み入れられる。更なる詳細については、また、以下のセクション「医学的処置を選択するための方法」を参照されたい。
【0144】
腫瘍変異負荷(TMB)を決定するための方法
本方法は、決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性に基づいて、試料の腫瘍変異負荷(TMB)を決定することを更に含み得る。
図5は、かかる例示的なプロセスの図を示す。
【0145】
腫瘍変異負荷(TMB)は、調べられたゲノム配列のメガ塩基(すなわち、100万塩基対)当たりの体細胞変異の数、すなわち、変異/Mbとして計算される、腫瘍における体細胞変異の存在量の尺度である。
【0146】
次世代配列決定データからTMBを計算するための方法及び技術は、当技術分野において公知である。しかしながら、例えば、腫瘍純度、腫瘍倍数性、配列決定の方法、及び配列決定カバレッジを含む様々な要因が、TMBの推定の成功を妨げる可能性がある。TMBを推定するためのロバストな計算方法は、これらの交絡因子を考慮に入れる必要がある。
【0147】
本開示は、TMBのロバストな推定の助けとなるモデルにおける入力又は補因子として使用することができる、腫瘍純度及び腫瘍倍数性の高度に安定かつ正確な推定を提供する。
【0148】
図5を参照すると、例示的なプロセス3873のフローチャートが提供されており、本方法における試料の腫瘍変異負荷(TMB)を決定することは、以下を含み得る。
【0149】
図5のステップ502では、複数の配列決定深度シグナルが、試料中の複数のゲノムセグメントについて取得され、複数のゲノムセグメントは、標的ゲノムセグメントを含み、複数の配列決定深度シグナルは、試料に由来する配列決定データと関連付けられる。
【0150】
図5のステップ504では、第1、第2、及び第3の統計モーメントが、複数の配列決定深度シグナルから決定される。
【0151】
図5のステップ506では、腫瘍純度及び腫瘍倍数性は、複数の配列決定深度シグナルについての第1、第2、及び第3の統計モーメントに基づいて試料について決定される。
【0152】
図5のステップ508では、標的ゲノムセグメントのコピー数は、標的ゲノムセグメントについての配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性に基づいて決定される。
【0153】
図5のステップ520では、複数の遺伝的バリアントが、試料についての複数の配列決定深度シグナルを使用して同定される。
【0154】
図5のステップ522では、複数の遺伝的バリアントを、決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性と一緒に、複数の遺伝的バリアントの起源を体細胞又は生殖細胞系であると判定及び出力するように構成されたアルゴリズムモデルに入力する。
【0155】
図5のステップ524では、試料ゲノムのメガ塩基当たりの体細胞起源の遺伝的バリアントの数を計算することによって、試料について腫瘍変異負荷(TMB)を決定する。
【0156】
コンピュータによって実装される場合、標的ゲノムセグメントのマイナー対立遺伝子のヘテロ接合性の喪失(LOH)を決定することは、
a)入力デバイスから配列決定情報のデータセットを受信することであって、
データセットは、試料の複数の配列決定深度シグナルからの複数の遺伝的バリアント、予測されるコピー数、予測される腫瘍純度、及び/又は予測される腫瘍倍数性を含む、受信することと、
b)データセットをモデルに自動的に入力して、腫瘍変異負荷(TMB)を予測することであって、モデルは、体細胞又は生殖細胞系である複数の遺伝的バリアントの起源を決定し、メガ塩基当たりの体細胞起源の遺伝的バリアントの数を予測TMBとして計算するように構成される、予測することと、
c)TMBを出力することと、
d)任意選択的に、出力を表示デバイス上に表示することと、を含み得る。
【0157】
TMBは、免疫チェックポイント阻害剤に対する応答のバイオマーカーとして使用することができる。より高い変異負荷を有する腫瘍は、ネオ抗原を発現し、免疫チェックポイント阻害剤の存在下でより強い免疫応答を誘導する可能性が高いという仮説が立てられている。したがって、いくつかの実施形態では、本方法は、同定された腫瘍変異負荷(TMB)を、医学的診断及び/又は処置におけるバイオマーカーとして使用することを更に含む。
【0158】
TMB及びバイオマーカーとしてのその使用に関する更なる詳細は、例えば、Chalmerset al.Analysis of 100,000 human cancer genomes reveals the landscape of tumor mutational burden.Genome Med 2017;9:34,Goodman et al.Tumor mutational burden as an independent predictor of response to immunotherapy in diverse cancers.Mol Cancer Ther 2017;16:2598-608,及びBudczies et al.Integrated analysis of the immunological and genetic status in and across cancer types:impact of mutational signatures beyond tumor mutational burden.Oncoimmunology2018;7:e1526613.に見出すことができる。更なる詳細については、また、以下のセクション「医学的処置を選択するための方法」を参照されたい。
【0159】
バリアントの変異状態を特徴付ける方法
本方法は、決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性に基づいて、試料中の遺伝的バリアントの変異状態(例えば、体細胞対生殖細胞系、ホモ接合性対ヘテロ接合性、及び/又はサブクローナル)を特徴付けることを更に含み得る。
図6は、かかる例示的なプロセスの図を示す。
【0160】
図6を参照すると、例示的なプロセス600のフローチャートが提供されており、本方法における試料の腫瘍変異負荷(TMB)を決定することは、以下を含み得る。
【0161】
図6のステップ602では、複数の配列決定深度シグナルが、試料中の複数のゲノムセグメントについて取得され、複数のゲノムセグメントは、標的ゲノムセグメントを含み、複数の配列決定深度シグナルは、試料に由来する配列決定データと関連付けられる。
【0162】
図6のステップ604では、第1、第2、及び第3の統計モーメントが、複数の配列決定深度シグナルから決定される。
【0163】
図6のステップ606では、腫瘍純度及び腫瘍倍数性は、複数の配列決定深度シグナルについての第1、第2、及び第3の統計モーメントに基づいて試料について決定される。
【0164】
図6のステップ608では、標的ゲノムセグメントのコピー数は、標的ゲノムセグメントについての配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性に基づいて決定される。
【0165】
図6のステップ620では、遺伝的バリアントが、試料についての複数の配列決定深度シグナルに基づいて同定される。
【0166】
図6のステップ622では、遺伝的バリアントの変異状態を決定するように構成されたアルゴリズムが検索される。
【0167】
図6のステップ624では、遺伝的バリアントの変異状態は、遺伝的バリアントを、決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性と一緒にアルゴリズムに入力し、遺伝的バリアントの変異状態を出力することによって特徴付けられる。
【0168】
コンピュータによって実装される場合、試料中の1つ以上の遺伝子バリアントの変異状態を特徴付けることを決定することは、
a)入力デバイスから配列決定情報のデータセットを受信することであって、
データセットは、試料の複数の配列決定深度シグナルからの1つ以上の遺伝的バリアントを含む、受信することと、
b)データセットをモデルに自動的に入力して、遺伝的バリアントの変異状態を特徴付けることであって、モデルは、遺伝的バリアントが、体細胞若しくは生殖細胞系の起源、ホモ接合性若しくはヘテロ接合性の接合性、及び/又はサブクローナル若しくはその他のクローン性を有するかどうかを判定するように構成される、特徴付けることと、
c)1つ以上の遺伝子バリアントについての変異状態の決定を出力することと、
d)任意選択的に、出力を表示デバイス上に表示することと、を含み得る。
【0169】
例として、変異状態の特徴付けは、体細胞-生殖細胞系-接合性(SGZ)アルゴリズムを実装することによって達成され得る(Sun,et al.,“A computational approach to distinguish somatic vs.germline origin of genomic alterations from deep sequencing of cancer specimens without a matched normal”,PLoS computational biology,14(2):e1005965,2018)。
【0170】
いくつかの実施形態では、遺伝的バリアントの変異状態は、体細胞起源若しくは生殖細胞系起源、ホモ接合性状態若しくはヘテロ接合性状態、サブクローン状態、又はそれらの組み合わせである。本開示は、試料を配列決定することによって同定された1つ以上のバリアントの体細胞/生殖細胞系状態を決定するために、例えば、体細胞-生殖細胞系-接合性(SGZ)アルゴリズムへの入力として使用することができる、腫瘍純度、腫瘍倍数性、及びCNAの高度に安定かつ正確な推定を提供する。
【0171】
体細胞生殖細胞系接合性(SGZ)は、試料のハイスループット配列決定から同定されたバリアントの、体細胞対生殖細胞系起源、ホモ接合対ヘテロ接合性状態、又はサブクローン状態(例えば、整数コピー数値によって適合され得ないサブクローン欠失事象)を予測するための計算方法である。SGZは、患者が一致する正常対照を必要とせず、臨床研究における広範な適用を可能にする。SGZは、腫瘍含有量、腫瘍倍数性、及び局所コピー数を考慮して、変化の対立遺伝子頻度(AF)をモデル化することによって同定された各変化の体細胞状態対生殖細胞系状態を予測する。更なる詳細については、また、以下のセクション「医学的処置を選択するための方法」を参照されたい。
【0172】
医療処置を選択する方法
いくつかの実施形態では、本明細書に記載される方法は、疾患に対する個体の素因及び感受性を示し、医学的状態の臨床医の診断を補助し、かつ/又は医学的処置に対する個体の応答及び生存確率を予測するために使用され得る、バイオマーカーを提供する。いくつかの実施形態では、本明細書に開示されるバイオマーカーは、個別化医療における病因、予後、診断、及び標的治療のために使用することができる。
【0173】
バイオマーカーは、例えば、疾患を診断すること又は疾患のリスクを予測すること、疾患の初期徴候を検出するために健康な人々を監視すること、処置が有効であるか否かを判定すること、特定の薬物が有用であり得る人々の特定の群を標的化すること、有害作用の可能性をより早期に予測することによってより安全な薬物を生成することを含む、医学研究及び臨床診療の多くの局面において有用である。
【0174】
バイオマーカーは、測定され得る任意の生物学的指標であり得る。例えば、バイオマーカーは、DNA、RNA、タンパク質、代謝産物などの細胞実体及び分子実体からの測定値であり得るか、又はそれらは、形質などの遺伝的及び生理学的特徴からの測定値であり得る。バイオマーカーは、定量的又は定性的のいずれかであり得る。定性的バイオマーカーは、はい/いいえ又は存在/非存在分析内の病原性プロセス検出に関与し得るが、定量的バイオマーカーは、閾値効果又は用量効果を有する病原性プロセス検出に関与する。
【0175】
いくつかの実施形態では、本明細書で開示されるバイオマーカーは、ゲノムセグメントのコピー数、ゲノムセグメントのマイナー対立遺伝子のコピー数、腫瘍純度、腫瘍倍数性、コピー数変化(CNA)、ヘテロ接合性の喪失(LOH)、ヘテロ接合性のゲノムワイド喪失(gLOH)、腫瘍変異負荷(TMB)、及びバリアントの変異状態からなる群から選択される。
【0176】
いくつかの実施形態では、本開示は、本明細書に記載されるバイオマーカーに基づいて処置を選択するための方法を提供する。
【0177】
CNAに基づく
したがって、本方法は、がんを有する個体のための処置を選択することであって、
a)個体由来の試料中のコピー数変化(CNA)を決定することであって、CNAは、前述の実施形態のいずれか1つの方法に従って決定される、決定することと、
b)決定されたCNAをバイオマーカーとして使用して、1つ以上の処置選択肢に対する個体の応答を予測することと、
c)予測された応答に基づいて、1つ以上の処置選択肢から個体に適した処置を選択することと、を更に含み得る。
【0178】
いくつかの実施形態では、本方法は、選択された処置を個体に投与することを更に含み得る。
【0179】
いくつかの実施形態では、選択された処置は、チェックポイント阻害剤の投与である。いくつかの実施形態では、チェックポイント阻害剤は、PD-1阻害剤、PD-Ll阻害剤、CTLA-4阻害剤、LAG3阻害剤、IDO(1/2)阻害剤、TIGIT阻害剤、及びB7-H3阻害剤からなる群から選択される。
【0180】
図7は、バイオマーカーとして決定されたコピー数変化(CNA)を使用することによって、がんを有する個体のための処置を選択するのための例示的なプロセス700のフローチャートを提供する。
【0181】
図7のステップ702では、コピー数変化(CNA)は、本明細書に開示される方法のいずれかに従って、個体由来の試料において同定される。
【0182】
図7のステップ704では、1つ以上の処置選択肢に対する個体の応答は、同定されたCNAに基づいて予測され、ここでCNAは、例えば、疾患状態についてのバイオマーカーとして役立つ。
【0183】
図7のステップ706では、処置選択肢は、予測された応答に基づいて、個体に適した1つ以上の処置選択肢から選択される。
【0184】
コンピュータによって実装される場合、コピー数変化(CNA)に基づいてがんを有する個体のための処置を選択することは、
a)入力デバイスから配列決定情報のデータセットを受信することであって、
データセットは、個体からの試料中の1つ以上のゲノムセグメントにおける1つ以上のコピー数変化(CNA)を含む、受信することと、
b)データセットをモデルに自動的に入力して、1つ以上の処置選択肢に対する個体の応答を予測することであって、応答は、1つ以上のCNAに関連付けられる、予測することと、
c)予測された応答を出力することと、
d)任意選択的に、出力を表示デバイス上に表示することと、
e)予測された応答に基づいて、1つ以上の処置選択肢からの処置の選択を引き起こすことと、を含み得る。
【0185】
いくつかの実施形態では、CNAは目的の遺伝子に関連する。いくつかの実施形態では、目的の遺伝子は、例えば、ホスファターゼ及びテンシンホモログ(PTEN)遺伝子、乳がん1(BRCA1)遺伝子、又は乳がん2(BRCA2)遺伝子である。
【0186】
LOHに基づく
別の態様では、本方法は、がんを有する個体のための処置を選択することであって、
a)個体由来の試料中のヘテロ接合性喪失(LOH)を決定することであって、LOHは、前述の実施形態のいずれか1つの方法に従って決定される、決定すること、
b)決定されたLOHをバイオマーカーとして使用して、1つ以上の処置選択肢に対する個体の応答を予測することと、
c)予測された応答に基づいて、1つ以上の処置選択肢から個体に適した処置を選択することと、を更に含み得る。
【0187】
図8は、決定されたヘテロ接合性の喪失(LOH)をバイオマーカーとして使用することによって、がんを有する個体についての処置を選択するための例示的なプロセスについてのフローチャートを提供する。
【0188】
図8のステップ802では、ヘテロ接合性の喪失(LOH)は、本明細書に開示される方法のいずれかに従って個体由来の試料において同定される。
【0189】
図8のステップ804では、1つ以上の処置選択肢に対する個体の応答は、同定されたLOHに基づいて予測され、ここでLOHは、例えば、疾患状態についてのバイオマーカーとして役立つ。
【0190】
図8のステップ806では、処置選択肢は、予測された応答に基づいて、個体に適した1つ以上の処置選択肢から選択される。
【0191】
いくつかの実施形態では、LOHは、標的ゲノムセグメントのマイナー対立遺伝子のLOHである。いくつかの実施形態では、本方法は、全ゲノム長におけるLOHセグメント長の百分率として、ゲノムワイドヘテロ接合性喪失(gLOH)を計算することを更に含む。
【0192】
いくつかの実施形態では、1つ以上の処置選択肢に対する個体の応答を予測することは、gLOH値と所定の閾値との間の差を検出することを含む。
【0193】
いくつかの実施形態では、本方法は、選択された処置を個体に投与することを更に含み得る。
【0194】
いくつかの実施形態では、選択された処置は、チェックポイント阻害剤の投与である。いくつかの実施形態では、チェックポイント阻害剤は、PD-1阻害剤、PD-Ll阻害剤、CTLA-4阻害剤、LAG3阻害剤、IDO(1/2)阻害剤、TIGIT阻害剤、及びB7-H3阻害剤からなる群から選択される。
【0195】
コンピュータによって実装される場合、パーセントゲノムワイドLOH(gLOH)に基づいてがんを有する個体のための処置を選択することは、
a)入力デバイスから配列決定情報のデータセットを受信することであって、
データセットは、個体由来の試料中のゲノムワイドLOH(gLOH)の割合、及び1つ以上の処置選択肢に関連付けられた1つ以上の所定の閾値を含む、受信することと、
b)1つ以上の処置選択肢に対する個体の応答を予測するためにデータセットをモデルに自動的に入力することであって、モデルは、1つ以上の処置選択肢の各々についてgLOHと所定の閾値とを比較し、予測された応答として1つ以上の比較を出力するように構成される、入力することと、
c)予測された応答を出力することと、
d)任意選択的に、出力を表示デバイス上に表示することと、
e)予測された応答に基づいて、1つ以上の処置選択肢からの処置の選択を引き起こすことと、を含み得る。
【0196】
いくつかの実施形態では、モデルは、gLOHが1つ以上の処置選択肢の各々について所定の閾値よりも大きいかどうかを判定し、1つ以上の判定を予測応答として出力するように構成される。
【0197】
TMBに基づく
更に別の態様では、本方法は、がんを有する個体のための処置を選択することであって、
a)個体由来の試料中の腫瘍変異負荷(TMB)を決定することであって、TMBは、前述の実施形態のいずれか1つの方法に従って決定される、決定することと、
b)決定されたTMBをバイオマーカーとして使用して、1つ以上の処置選択肢に対する個体の応答を予測することと、
c)予測された応答に基づいて、1つ以上の処置選択肢から個体に適した処置を選択することと、を更に含み得る。
【0198】
図9は、決定された腫瘍変異負荷(TMB)をバイオマーカーとして使用することによって、がんを有する個体のための処置を選択するための例示的なプロセス900のフローチャートを提供する。
【0199】
図9のステップ902では、腫瘍変異負荷(TMB)は、本明細書に開示される方法のいずれかに従って、個体由来の試料において同定される。
【0200】
図9のステップ904では、1つ以上の処置選択肢に対する個体の応答は、同定されたTMBに基づいて予測され、ここでTMBは、例えば、疾患状態についてのバイオマーカーとして役立つ。
【0201】
図9のステップ906では、処置選択肢は、予測された応答に基づいて、個体に適した1つ以上の処置選択肢から選択される。
【0202】
いくつかの実施形態では、1つ以上の処置選択肢に対する個体の応答を予測することは、TMB値と所定の閾値との間の差を検出することを含む。
【0203】
いくつかの実施形態では、本方法は、選択された処置を個体に投与することを更に含み得る。いくつかの実施形態では、選択された処置は、チェックポイント阻害剤の投与である。いくつかの実施形態では、免疫チェックポイント阻害剤は、PD-1阻害剤、PD-Ll阻害剤、CTLA-4阻害剤、LAG3阻害剤、IDO(1/2)阻害剤、TIGIT阻害剤、及びB7-H3阻害剤からなる群から選択される。
【0204】
変異状態に基づく
更に別の態様では、本方法は、がんを有する個体のための処置を選択することであって、
a)個体由来の試料中の遺伝的バリアントの変異状態を特徴付けることであって、変異状態は、前述の実施形態のいずれか1つの方法に従って特徴付けられる、特徴付けることと、
b)遺伝的バリアントの特徴付けられた変異状態に基づいて、1つ以上の処置選択肢に対する個体の応答を予測することと、
c)予測された応答に基づいて、1つ以上の処置選択肢から個体に適した処置を選択することと、を更に含み得る。
【0205】
図10は、遺伝的バリアントの特徴付けられた変異状態に基づいて、がんを有する個体のための処置を選択するための例示的なプロセス1000のフローチャートを提供する。いくつかの実施形態では、遺伝的バリアントの変異状態は、体細胞起源若しくは生殖細胞系起源、ホモ接合性状態若しくはヘテロ接合性状態、サブクローン状態、又はそれらの組み合わせである。
【0206】
図10のステップ1020では、遺伝的バリアントの変異状態は、本明細書に開示される方法のいずれかに従って、個体由来の試料において同定される。
【0207】
図10のステップ1040では、1つ以上の処置選択肢に対する個体の応答は、遺伝的バリアントの特徴付けられた変異状態に基づいて予測され、ここで、遺伝的バリアントの変異状態は、例えば、疾患状態についてのバイオマーカーとして役立つ。
【0208】
図10のステップ1060では、処置選択肢は、予測された応答に基づいて、個体に適した1つ以上の処置選択肢から選択される。
【0209】
いくつかの実施形態では、遺伝的バリアントの変異状態は、体細胞又は生殖細胞系である遺伝的バリアントの起源である。
【0210】
コンピュータによって実装される場合、バリアント変異状態に基づいてがんを有する個体のための処置を選択することは、
a)入力デバイスから配列決定情報のデータセットを受信することであって、
データセットは、個体由来の試料からの1つ以上の遺伝的バリアントに関連付けられた1つ以上の変異状態を含む、受信することと、
b)1つ以上の変異状態に基づいて、1つ以上の処置選択肢に対する個体の応答を予測するように構成されたモデルに、データセットを自動的に入力することと、
c)予測された応答を出力することと、
d)任意選択的に、出力を表示デバイス上に表示することと、
e)予測された応答に基づいて、1つ以上の処置選択肢からの処置の選択を引き起こすことと、を含み得る。
【0211】
本明細書中に開示されるバイオマーカーを使用することによって処置を選択するための方法は、任意の型のがんを有する個体に利益を与え得る。がんの非限定的な例としては、B細胞がん(例えば、多発性骨髄腫)、黒色腫、乳がん、肺がん(非小細胞肺がん又はNSCLCなど)、気管支がん、結腸直腸がん、前立腺がん、膵臓がんが含まれるが、これらに限定されない、胃がん、卵巣がん、膀胱がん、脳又は中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮がん又は子宮内膜がん、口腔又は咽頭がん、肝がん、腎臓がん、精巣がん、胆道がん、小腸又は付属器がん、唾液腺がん、甲状腺がん、副腎腺がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫瘍、胃腸間質腫瘍(GIST)、結腸がん、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性障害(MPD)、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、慢性リンパ性白血病(CLL)、多発性細胞血症ベラ、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨形成性肉腫、脊索腫、血管肉腫、内皮肉腫滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭がん、乳頭腺がん、髄質がん、気管支原性がん、腎細胞がん、肝細胞腫、胆管がん、絨毛がん、セミノーマ、胚性がん腫、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星状細胞腫、髄芽細胞腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽細胞腫、聴神経腫、乏突起膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、アグノーゲン性骨髄性化生、高好酸球性症候群、全身性肥満細胞症、家族性高好酸球増加症、慢性好酸球性白血病、神経内分泌がん、がん様腫瘍などが挙げられる。
【0212】
いくつかの実施形態では、がんは、肺がん、卵巣がん、乳がん、前立腺がん、又は膵臓がんである。
【0213】
様々なタイプの処置が、本明細書に開示される方法とともに使用され得る。がん処置の例としては、限定されるものではないが、積極的サーベイランス、観察、外科的介入、化学治療、免疫治療、放射線治療(外照射治療、定位放射線手術(ガンマナイフ)、及び分割定位放射線治療(FSR)など)、局所治療、全身治療、ワクチン治療、ウイルス治療、分子標的治療、又はそれらの組み合わせが挙げられる。
【0214】
いくつかの実施形態では、選択される処置は、薬物投与、化学治療、放射線治療、免疫治療、及び/又は遺伝子治療である。
【0215】
様々なタイプの薬物が、本明細書に開示される方法とともに使用されてもよい。抗がん剤の非限定的な例には、ソラフェンブ、レゴラフェニブ、イマチニブ、エリブリン、ゲムシタビン、カペシタビン、パゾパニブ、ラパチニブ、ダブラフェニブ、リンゴ酸スチニブ、クリゾチニブ、エベロリムス、トリシロリムス、シロリムス、アキシチニブ、ゲフィチニブ、アナストロール、ビカルタミド、フルベストラント、ラリトレクス、ペメトレキセド、酢酸ゴセリリン、エルロチニンブ、ベムラフェニブ、ビジデジブ、クエン酸タモキシフェン、パクリタキセル、ドセタキセル、カバジタキセル、オキサリプラチン、ジブアフリベルセプト、ベバシズマブ、トラスツズマブ、ペルツズマブ、パンティウムマブ、タキサン、ブレオマイシン、メルファレン、プラムバギン、カンプトサール、マイトマイシン-C、ドキソルビシン、ペグ化ドキソルビシン、フォルフォリ5-フルオロウラシル、テモゾロミド、パシレオチド、テガフール、ギメラシル、オテラシ、イトラコナゾール、ボルテゾミブ、レナリドマイド、及びロミデプシンが挙げられる。
【0216】
がん化学治療薬の例としては、ドキソルビシン、エピルビシン、5-フルオロウラシル、パクリタキセル、ドセタキセル、シスプラチン、ブレオマイシン、メルファレン、プルンバギン、イリノテカン、マイトマイシンC、及びミトキサントロンが挙げられるが、これらに限定されない。例として、使用され得、臨床試験の段階にあり得る一部の他のがん化学治療薬としては、レスミノスタット、タスキニモド、レファメチニブ、ラパチニブ、タイバーブ、アレネジル、パシレオチド、シグニフォル、チシリムマブ、トレメリムマブ、ランソプラゾール、PrevOnco、ABT-869、リニファニブ、チバンチニブ、タルセバ、エルロチニブ、スティバルガ、レゴラフェニブ、フルオロソラフェニブ、ブリバニブ、リポソームドキソルビシン、レンバチニブ、ラムシルマブ、ペレチノイン、ルチコ、ムパルフォスタット、テイスノ、テガフール、ギメラシル、オテラシル、及びオランチニブが挙げられる。
【0217】
がん薬物が効果を有し得る細胞標的の例としては、免疫チェックポイントタンパク質、mTORC、RAFキナーゼ、MEKキナーゼ、ホスホイノシトールキナーゼ3、線維芽細胞成長因子レセプター、多重チロシンキナーゼ、ヒト上皮増殖因子レセプター、血管内皮成長因子、他の新脈管形成因子、熱ショックタンパク質;Smo(平滑)レセプター、FMS様チロシンキナーゼ3レセプター、アポトーシスタンパク質インヒビター、サイクリン依存性キナーゼ、デアセチラーゼ、ALKチロシンキナーゼレセプター、セリン/スレオニン-プロテインキナーゼPim-1、ポルキュピンアシルトランスフェラーゼ、ヘッジホッグ経路、プロテインキナーゼC、mDM2、Glypciin 3、ChK1、肝細胞増殖因子METレセプター、上皮増殖因子ドメイン様7、Notch経路、Srcファミリーキナーゼ、DNAメチルトランスフェラーゼ、DNAインターカレーター、チミジンシンターゼ、微小管機能破壊剤、DNA架橋剤、DNA鎖破壊剤、DNAアルキル化剤、JNK依存性p53 Ser15リン酸化誘導剤、DNAトポイソメラーゼインヒビター、Bcl-2、及びフリーラジカル発生剤が挙げられるが、これらに限定されない。
【0218】
いくつかの実施形態では、処置は単独治療である。いくつかの実施形態では、処置は、免疫チェックポイント阻害剤を個体に投与することである。
【0219】
いくつかの実施形態では、処置は併用治療である。いくつかの実施形態では、処置は、化学治療、操作されたキメラ抗原受容体(CAR)T細胞を投与すること、免疫チェックポイント阻害剤を投与すること、及び放射線治療からなる群から選択される任意の組み合わせである。いくつかの実施形態では、化学治療は、ヒストンデアセチラーゼ阻害剤(HDAC)、テモゾロミド、ダカルバジン(DTIC)、ベムラフェニブ、ダブラフェニブ及びトラメチニブからなる群から選択される薬物を投与することである。いくつかの実施形態では、免疫チェックポイント阻害剤は、PD-1阻害剤、PD-Ll阻害剤、CTLA-4阻害剤、LAG3阻害剤、IDO(1/2)阻害剤、TIGIT阻害剤、及びB7-H3阻害剤からなる群から選択される。
【0220】
いくつかの実施形態では、処置を選択することは、特定の時間に与えられる薬物の量及び薬物を投与するスケジュールを含む、薬物投与レジメンを選択することを含む。
【0221】
更に、処置を選択する方法は、処置の選択からレポートを生成又は更新することを含み得る。いくつかの実施形態では、本方法は、レポートを個体又は臨床医に送信することを更に含む。いくつかの実施形態では、本方法は、非一時的コンピュータ可読記憶媒体上にレポートを記憶することを更に含む。いくつかの実施形態では、本方法は、コンピュータディスプレイ上にレポートを表示することを更に含む。
【0222】
使用方法
いくつかの例では、開示された方法は、(i)対象(例えば、がんを有することが疑われるか、又はがんを有すると決定された対象)から試料を取得するステップと、(ii)試料から核酸分子(例えば、腫瘍核酸分子と非腫瘍核酸分子との混合物)を抽出するステップと、(iii)試料から抽出された核酸分子に1つ以上のアダプター(例えば、1つ以上の増幅プライマー、フローセルアダプター配列、基質アダプター配列、又は試料インデックス配列)をライゲーションするステップと、(iv)(例えば、ポリメラーゼ連鎖反応(PCR)増幅技術、非PCR増幅技術、又は等温増幅技術を使用して)核酸分子を増幅するステップと、(v)(例えば、捕捉された核酸分子の領域に相補的な領域をそれぞれ含む1つ以上の核酸分子をそれぞれ含む1つ以上のベイト分子へのハイブリダイゼーションによって)増幅された核酸分子から核酸分子を捕捉するステップと、(vi)例えば、次世代(例えば、超並列)シーケンサーを使用して、例えば、次世代(超並列)配列決定技術、全ゲノム配列決定(WGS)技術、全エクソーム配列決定技術、標的配列決定技術、直接配列決定技術、又はサンガー配列決定技術を使用して、試料から抽出された核酸分子(又はそれに由来するライブラリプロキシ)を配列決定するステップと、(vii)対象(又は患者)、介護者、ヘルスケア提供者、医師、腫瘍学者、電子カルテシステム、病院、診療所、診療所、第三者支払人、保険会社、又は官公庁にレポート(例えば、電子レポート、ウェブベースのレポート、又は紙のレポート)を生成、表示、送信、及び/又は送達するステップと、のうちの1つ以上を更に含み得る。いくつかの例では、レポートは、本明細書に記載の方法からの出力を含む。いくつかの例では、レポートの全部又は一部は、オンライン又はウェブベースのヘルスケアポータルのグラフィカルユーザインターフェースに表示されることができる。いくつかの例では、レポートは、コンピュータネットワーク又はピアツーピア接続を介して送信される。
【0223】
開示される方法は、様々な試料のうちのいずれかとともに使用され得る。例えば、いくつかの例では、試料は、組織生検試料、液体生検試料、又は正常対照を含み得る。いくつかの例では、試料は、液体生検試料であり得、血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含み得る。いくつかの例では、試料は、液体生検試料であり得、循環腫瘍細胞(CTC)を含み得る。いくつかの例では、試料は、液体生検試料であり得、無細胞DNA(cfDNA)、循環腫瘍DNA(ctDNA)、又はそれらの任意の組み合わせを含み得る。
【0224】
いくつかの例では、試料から抽出された核酸分子は、腫瘍核酸分子と非腫瘍核酸分子との混合物を含むことができる。いくつかの例では、腫瘍核酸分子は、異種組織生検試料の腫瘍部分に由来することができ、非腫瘍核酸分子は、異種組織生検試料の正常部分に由来することができる。いくつかの例では、試料は、液体生検試料を含むことができ、腫瘍核酸分子は、液体生検試料の循環腫瘍DNA(ctDNA)画分に由来することができ、非腫瘍核酸分子は、液体生検試料の非腫瘍無細胞DNA(cfDNA)画分に由来することができる。
【0225】
いくつかの例では、コピー数又はコピー数変化を決定するための開示される方法は、対象(例えば、患者)における疾患又は他の状態(例えば、がん、遺伝的障害(ダウン症候群及び脆弱性Xなど)、神経障害、又はバリアント、例えば、コピー数変化の検出が、当該疾患を診断、処置、又は予測することに関連する任意の他の疾患タイプ)の存在を診断するために(又はその診断の一部として)使用され得る。いくつかの例では、開示される方法は、本明細書の他の箇所で説明されるように、様々ながんのうちのいずれかの診断に適用可能であり得る。
【0226】
いくつかの例では、コピー数又はコピー数変化を決定するための開示される方法は、胎児DNAにおける遺伝的障害を予測するために使用され得る。(例えば、侵襲的又は非侵襲的出生前検査のために)。例えば、侵襲的羊水穿刺、絨毛絨毛サンプリング(cVS)、若しくは胎児臍帯サンプリング技術を使用して得られた試料、又は無細胞DNA(cfDNA)試料の非侵襲的サンプリング(母体cfDNAと胎児cfDNAとの混合物を含む)を使用して得られた試料から抽出された胎児DNAを配列決定して得られた配列リードデータが、例えば、ダウン症(トリソミー21)、トリソミー18、トリソミー13、X及びY染色体の余分なコピー又は欠損と関連付けられたバリアント、例えば、コピー数変化を同定するために、開示される方法に従って処理され得る。
【0227】
いくつかの例では、コピー数又はコピー数変化を決定するための開示される方法を使用して、例えば、1つ以上の遺伝子座について決定されたコピー数の値に基づいて、臨床試験のための対象(例えば、患者)を選択することができる。いくつかの例では、例えば、1つ以上の遺伝子座のコピー数変化の同定に基づく、臨床試験のための患者選択は、標的治療の開発を加速させ、処置決定の医療成果を改善することができる。
【0228】
いくつかの例では、コピー数又はコピー数変化を決定するための開示される方法は、対象のための適切な治療又は処置(例えば、抗がん治療又は抗がん処置)を選択するために使用され得る。いくつかの例では、例えば、抗がん治療又は処置は、ポリ(ADP-リボース)ポリメラーゼ阻害薬(PARPi)、白金化合物、化学治療、放射線治療、標的治療(例えば、免疫治療)、外科手術、又はそれらの任意の組み合わせの使用を含み得る。
【0229】
いくつかの例では、コピー数変化を決定するための開示される方法は、対象における疾患(例えば、がん)を処置する際に使用され得る。例えば、本明細書に開示される方法のいずれかを使用して1つ以上の遺伝子座についてのコピー数変化を決定することに応答して、有効量の抗がん治療又は抗がん処置を対象に投与することができる。
【0230】
いくつかの例では、コピー数又はコピー数変化を決定するための開示される方法は、対象における疾患の進行又は再発(例えば、がん又は腫瘍の進行又は再発)をモニタリングするために使用され得る。例えば、いくつかの例では、本方法は、第1の時点で対象から得られた第1の試料中のコピー数変化を決定(例えば、検出)するために使用され、第2の時点で対象から得られた第2の試料中のコピー数変化を決定(例えば、検出)するために使用されてもよく、第1の決定と第2の決定との比較は、疾患進行又は再発を監視することを可能にする。いくつかの例では、第1の時点は、患者が治療又は処置を投与される前に選択され、第2の時点は、対象が治療又は処置を投与された後に選択される。
【0231】
いくつかの例では、開示される方法は、例えば、検出されたコピー数変化の変化に応答して、処置用量を調整すること及び/又は異なる処置を選択することによって、対象のための治療又は処置(例えば、抗がん処置又は抗がん治療)を調整するために使用され得る。
【0232】
いくつかの例では、開示された方法を使用して決定されたコピー数又はコピー数変化の値は、試料に関連する予後又は診断指標として使用され得る。例えば、いくつかの例では、予後又は診断指標は、試料中の疾患(例えば、がん)の存在の指標、疾患(例えば、がん)が試料中に存在する可能性の指標、試料が由来した対象が疾患(例えば、がん)を発症することになる可能性の指標(すなわち、危険因子)、又は試料が由来した対象が特定の治療又は処置に応答することになる可能性の指標を含み得る。
【0233】
いくつかの例では、コピー数又はコピー数変化を決定するための開示される方法は、特定の疾患(例えば、がん)の検出、モニタリング、危険因子の予測、又は処置の選択の一部として、被験体に由来する試料中の1つ以上の遺伝子座におけるバリアント配列の存在の同定を含むゲノムプロファイリングプロセスの一部として実施され得る。いくつかの例では、ゲノムプロファイリングのために選択されるバリアントパネルは、選択された遺伝子座セットにおけるバリアント配列の検出を含み得る。いくつかの例では、ゲノムプロファイリングのために選択されるバリアントパネルは、包括的ゲノムプロファイリング(CGP)、単一のアッセイで数百の遺伝子(関連するがんバイオマーカーを含む)を評価するために使用される次世代配列決定(NGS)アプローチを介して、複数の遺伝子座でのバリアント配列の検出を含み得る。ゲノムプロファイリングプロセスの一部としてコピー数を決定するため又はコピー数変化を検出するための開示される方法を含めること(又は対象のゲノムプロファイルの一部としてコピー数を決定するため又はコピー数変化を検出するための開示される方法からの出力を含めること)は、例えば、所与の患者試料におけるコピー数変化の存在を独立して確認することによって、ゲノムプロファイルに基づいて行われる、例えば、疾患検出コール及び処置決定の妥当性を改善することができる。
【0234】
いくつかの例では、ゲノムプロファイルは、個体のゲノム及び/又はプロテオームにおける遺伝子(又はそのバリアント配列)、コピー数変異、エピジェネティック形質、タンパク質(又はその改変)、及び/又は他のバイオマーカーの存在に関する情報、並びに個体の対応する表現型形質、並びに遺伝的又はゲノム形質、表現型形質、及び環境因子の間の相互作用に関する情報を含み得る。
【0235】
いくつかの例では、被験者のゲノムプロファイルは、包括的ゲノムプロファイリング(CGP)試験、核酸配列決定に基づく試験、遺伝子発現プロファイリング試験、がんホットスポットパネル試験、DNAメチル化試験、DNA断片化試験、RNA断片化試験、又はそれらの任意の組み合わせからの結果を含むことができる。
【0236】
いくつかの例では、本方法は、生成されたゲノムプロファイルに基づいて、処置又は治療(例えば、抗がん剤、抗がん処置、又は抗がん治療)を対象に投与又は適用することを更に含み得る。抗がん剤又は抗がん処置は、がん細胞の処置に有効である化合物を指し得る。抗がん剤又は抗がん治療の例は、アルキル化剤、代謝拮抗物質、天然産物、ホルモン、化学治療、放射線治療、免疫治療、外科手術、又は特定の細胞シグナル伝達経路の欠陥、例えば、DNAミスマッチ修復(MMR)経路の欠陥を標的とするように構成された治療を含むが、これらに限定されない。
【0237】
試料
開示される方法及びシステムは、対象(例えば、患者)から収集される核酸(例えば、DNA又はRNA)を含む様々な試料(本明細書では検体とも称される)のうちのいずれかとともに使用され得る。例としては、限定されるものではないが、腫瘍試料、組織試料、生検試料、血液試料(例えば、末梢全血試料)、血漿試料、血清試料、リンパ試料、唾液試料、痰試料、尿試料、婦人科液試料、循環腫瘍細胞(CTC)試料、脳脊髄液(CSF)試料、心嚢液試料、胸水試料、腹水(腹膜液)試料、糞便(又は便)試料、又は他の体液、分泌物、及び/若しくは排泄物試料(あるいはそれらに由来する細胞試料)が挙げられる。ある特定の例では、試料は、凍結試料又はホルマリン固定パラフィン包埋(FFPE)試料であり得る。
【0238】
いくつかの例では、試料は、組織切除(例えば、外科的切除)、針生検、骨髄生検、骨髄吸引、皮膚生検、内視鏡生検、細針吸引、口腔スワブ、鼻腔スワブ、膣スワブ、又は細胞学的スミア、擦り傷、洗浄又は洗浄液(管腔洗浄液又は気管支肺胞洗浄液など)などによって収集され得る。
【0239】
いくつかの例では、試料は、液体生検試料であり、例えば、全血、血漿、血清、尿、便、痰、唾液、又は脳脊髄液を含み得る。いくつかの例では、試料は、液体生検試料であり得、循環腫瘍細胞(CTC)を含み得る。いくつかの例では、試料は、液体生検試料であり得、無細胞DNA(cfDNA)、循環腫瘍DNA(ctDNA)、又はそれらの任意の組み合わせを含み得る。
【0240】
いくつかの例では、試料は、1つ以上の前悪性又は悪性細胞を含み得る。本明細書で使用される場合、前悪性腫瘍とは、まだ悪性ではないが、悪性になる準備ができている細胞又は組織を指す。ある特定の例では、試料は、固形腫瘍、軟部組織腫瘍、又は転移性病変から取得され得る。ある特定の例では、試料は、血液悪性腫瘍又は前悪性腫瘍から取得され得る。他の例では、試料は、手術マージンからの組織又は細胞を含み得る。ある特定の例では、試料は、腫瘍浸潤リンパ球を含み得る。いくつかの例では、試料は、1つ以上の非悪性細胞を含み得る。いくつかの例では、試料は、原発性腫瘍又は転移(例えば、転移生検試料)であるか、又はその一部であり得る。いくつかの例では、試料は、隣接部位(例えば、腫瘍に隣接する部位)と比較して、腫瘍(例えば、腫瘍細胞)のパーセントが最も高い部位(例えば、腫瘍部位)から得られ得る。いくつかの例では、試料は、隣接部位(例えば、腫瘍に隣接する部位)と比較して、最大腫瘍病巣(例えば、顕微鏡下で視覚された際の最大数の腫瘍細胞)を有する部位(例えば、腫瘍部位)から得られ得る。
【0241】
いくつかの例では、開示される方法は、一次対照(例えば、正常組織試料)を分析することを更に含み得る。いくつかの例では、開示される方法は、一次対照が利用可能であるかどうかを決定すること、及び利用可能である場合、当該一次対照から対照核酸(例えば、DNA)を単離することを更に含み得る。いくつかの例では、試料は、一次対照が利用可能ではない場合、任意の正常対照(例えば、正常隣接組織(NAT))を含み得る。いくつかの例では、試料は、組織学的に正常な組織であり得るか、又はそれを含み得る。いくつかの例では、本方法は、本明細書に説明される方法を使用して、試料、例えば、組織学的に正常な試料(例えば、外科的組織マージンから)を評価することを含む。いくつかの例では、開示される方法は、例えば、一次対照を伴わない試料中の当該NATからの非腫瘍組織をマクロ切開することによって、非腫瘍細胞が濃縮された部分試料を取得することを更に含み得る。いくつかの例では、開示される方法は、一次対照及びNATが利用できないと決定することと、一致対照なしで分析のために当該試料をマーキングすることとを更に含み得る。
【0242】
いくつかの例では、組織学的に正常な組織(例えば、そうでなければ組織学的に正常な組織マージン)から得られた試料は、依然として、本明細書に説明されるバリアント配列などの遺伝子変化を含み得る。したがって、本方法は、検出された遺伝子変化の存在に基づいて、試料を再分類することを更に含み得る。いくつかの例では、複数の試料(例えば、異なる対象からの)が同時に処理される。
【0243】
開示される方法及びシステムは、様々な組織試料(又はその疾患状態)、例えば、固形組織試料、軟組織試料、転移性病変、又は液体生検試料のうちのいずれかから抽出された核酸の分析に適用され得る。組織の例としては、限定されるものではないが、結合組織、筋肉組織、神経系組織、上皮組織、及び血液が挙げられる。組織試料は、動物又は人体内の器官のいずれかから収集され得る。ヒト器官の例としては、脳、心臓、肺、肝臓、腎臓、膵臓、脾臓、甲状腺、乳腺、子宮、前立腺、大腸、小腸、膀胱、骨、皮膚などが挙げられるが、これらに限定されない。
【0244】
いくつかの例では、試料から抽出された核酸は、デオキシリボ核酸(DNA)分子を含み得る。開示される方法による分析のために好適であり得るDNAの例としては、限定されるものではないが、ゲノムDNA又はその断片、ミトコンドリアDNA又はその断片、無細胞DNA(cfDNA)、及び循環腫瘍DNA(ctDNA)が挙げられる。無細胞DNA(cfDNA)は、アポトーシス及びネクローシス中に正常及び/又はがん細胞から放出されるDNAの断片から構成され、血流中を循環し、及び/又は他の体液中に蓄積する。循環腫瘍DNA(ctDNA)は、血流中を循環し、及び/又は他の体液中に蓄積するがん細胞及び腫瘍から放出されるDNAの断片から構成される。
【0245】
いくつかの例では、DNAは、試料から有核細胞から抽出される。いくつかの例では、試料は、例えば、試料が主に赤血球、過剰な細胞質を含有する病変細胞、又は線維症を有する組織で構成される場合、有核細胞性が低い。いくつかの例では、有核細胞性が低い試料は、DNA抽出のために、より多くの、例えば、より大きな組織体積を必要とし得る。
【0246】
いくつかの例では、試料から抽出された核酸は、リボ核酸(RNA)分子を含み得る。開示される方法による分析のために好適であり得るRNAの例としては、限定されるものではないが、総細胞RNA、特定の存在量のRNA配列の枯渇後の総細胞RNA(例えば、リボソームRNA)、無細胞RNA(cfRNA)、メッセンジャーRNA(mRNA)又はその断片、総RNAのポリ(A)尾部mRNA画分、リボソームRNA(rRNA)又はその断片、転移RNA(tRNA)又はその断片、及びミトコンドリアRNA又はその断片が挙げられる。いくつかの例では、RNAは、試料から抽出され、例えば、逆転写反応を使用して相補的DNAに変換され得る。いくつかの例では、cDNAは、ランダムプライムcDNA合成法によって産生される。他の例では、cDNA合成は、オリゴ(dT)含有オリゴヌクレオチドによるプライミングによって成熟mRNAのポリ(A)尾部で開始される。枯渇、ポリ(A)濃縮、及びcDNA合成のための方法は、当業者に周知である。
【0247】
いくつかの例では、試料は、例えば、腫瘍細胞又は腫瘍細胞核を含む、腫瘍含有量を含み得る。いくつかの例では、試料は、少なくとも5~50%、10~40%、15~25%、又は20~30%の腫瘍細胞核を有する腫瘍含有量を含み得る。いくつかの例では、試料は、少なくとも5%、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、又は少なくとも50%の腫瘍細胞核の腫瘍含有量を含み得る。いくつかの例では、腫瘍核のパーセントは、試料中の腫瘍細胞の数を、核を有する試料中の全ての細胞の総数で除算することによって決定(例えば、計算)される。いくつかの例では、例えば、試料が肝細胞を含む肝臓試料であるとき、異なる腫瘍含有量計算が、2倍又は2倍超の核を有する肝細胞の存在、他のDNA含有量、例えば、非肝細胞、体細胞核の存在に起因して必要とされ得る。いくつかの例では、遺伝子変化、例えば、バリアント配列の検出の感度、又は、例えば、マイクロサテライト不安定性の決定の感度は、試料の腫瘍含有量に依存し得る。例えば、より低い腫瘍含有量を有する試料は、所与のサイズの試料に対する検出のより低い感度を結果的にもたらし得る。
【0248】
いくつかの例では、上記のように、試料は、例えば、腫瘍からの、又は正常組織からの、核酸(例えば、DNA、RNA(又はRNAに由来するcDNA)、又は両方)を含む。ある特定の例では、試料は、例えば、腫瘍又は正常組織由来の非核酸成分、例えば、細胞、タンパク質、炭水化物、又は脂質を更に含み得る。
【0249】
対象
いくつかの例では、試料は、ある条件若しくは疾患(例えば、過剰増殖性疾患又は悲がん指標)を有するか、又はある条件若しくは疾患を有すると疑われる対象(例えば、患者)から得られる(例えば、収集される)。いくつかの例では、過剰増殖性疾患は、がんである。いくつかの例では、がんは、固形腫瘍又はその転移性形態である。いくつかの例では、がんは、血液がん、例えば、白血病又はリンパ腫である。
【0250】
いくつかの例では、対象は、がんを有するか、又はがんを有するリスクがある。例えば、いくつかの例では、対象は、がん(例えば、がんを発症するためのベースラインのリスクを増加させる遺伝子変異を有すること)に対する遺伝的素因を有する。いくつかの例では、対象は、がんを発症するリスクを増加させる環境変動(例えば、放射線又は化学物質)に曝露されている。いくつかの例では、対象は、がんの発症について監視されることを必要とする。いくつかの例では、対象は、例えば、抗がん治療(又は抗がん処置)で処置された後に、がんの進行又は退縮について監視されることを必要としている。いくつかの例では、対象は、がんの再発について監視されることを必要としている。いくつかの例では、対象は、微小残存病変(MRD)について監視されることを必要としている。いくつかの例では、対象は、がんに対して処置されていたか、又は処置されている。いくつかの例では、対象は、抗がん治療(又は抗がん処置)で処置されていない。
【0251】
いくつかの例では、対象(例えば、患者)は、1つ以上の標的治療で処置されているか、又は以前に処置されたことがある。いくつかの例では、例えば、標的治療で以前に処置されたことがある患者について、標的治療後試料(例えば、検体)が得られる(例えば、収集される)。いくつかの例では、標的治療後試料は、標的治療の完了後に得られた試料である。
【0252】
いくつかの例では、患者は、標的治療で以前に処置されていない。いくつかの例では、例えば、以前に標的治療で処置されていない患者について、試料は、切除、例えば、元の切除、又は再発後の切除(例えば、治療後の疾患再発後)を含む。
【0253】
がん
いくつかの例では、試料は、がんを有する対象から取得される。例示的ながんとしては、限定されるものではないが、B細胞がん(例えば、多発性骨髄腫)、黒色腫、乳がん、肺がん(非小細胞肺がん又はNSCLCなど)、気管支がん、結腸直腸がん、前立腺がん、膵臓がんが含まれるが、これらに限定されない、胃がん、卵巣がん、膀胱がん、脳又は中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮がん又は子宮内膜がん、口腔又は咽頭がん、肝がん、腎臓がん、精巣がん、胆道がん、小腸又は付属器がん、唾液腺がん、甲状腺がん、副腎腺がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫瘍、胃腸間質腫瘍(GIST)、結腸がん、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性障害(MPD)、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、慢性リンパ性白血病(CLL)、多発性細胞血症ベラ、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨形成性肉腫、脊索腫、血管肉腫、内皮肉腫滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭がん、乳頭腺がん、髄質がん、気管支原性がん、腎細胞がん、肝細胞腫、胆管がん、絨毛がん、セミノーマ、胚性がん腫、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星状細胞腫、髄芽細胞腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽細胞腫、聴神経腫、乏突起膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、アグノーゲン性骨髄性化生、高好酸球性症候群、全身性肥満細胞症、家族性高好酸球増加症、慢性好酸球性白血病、神経内分泌がん、がん様腫瘍などが挙げられる。
【0254】
いくつかの例では、がんは、血液悪性腫瘍(又は前悪性腫瘍)である。本明細書で使用される場合、血液悪性腫瘍は、造血又はリンパ組織の腫瘍、例えば血液、骨髄、又はリンパ節に影響を及ぼす腫瘍を指す。例示的な血液悪性腫瘍には、白血病(例えば、急性リンパ芽球性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ性白血病(CLL)、慢性骨髄性白血病(CML)、有毛細胞白血病、急性単球性白血病(AMoL)、慢性骨髄単球性白血病(CMML)、若年性骨髄単球性白血病(JMML)、又は大顆粒リンパ性白血病)、リンパ腫(例えば、AIDS関連リンパ腫、皮膚T細胞リンパ腫、ホジキンリンパ腫(例えば、古典的ホジキンリンパ腫又は結節性リンパ球優位型ホジキンリンパ腫)、菌状息肉症、非ホジキンリンパ腫(例えば、B細胞非ホジキンリンパ腫(例えば、バーキットリンパ腫、小リンパ性リンパ腫(CLL/SLL)、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、免疫芽球性大細胞リンパ腫、前駆Bリンパ芽球性リンパ腫、又はマントル細胞リンパ腫)又はT細胞非ホジキンリンパ腫(菌状息肉症、未分化大細胞リンパ腫、又は前駆Tリンパ芽球性リンパ腫))、原発性中枢神経系が含まれるが、これらに限定されない。
【0255】
核酸抽出及び処理
DNA又はRNAは、当業者に既知の様々な技術のうちのいずれかを使用して、組織試料、生検試料、血液試料、又は他の体液試料から抽出され得る(例えば、国際特許出願公開第2012/092426号の実施例1、Tan,et al.(2009),“DNA,RNA,and Protein Extraction:The Past and The Present”,J.Biomed.Biotech.2009:574398、the technical literature for the Maxwell(登録商標)16 LEV Blood DNA Kit(Promega Corporation,Madison,WI)、及びthe Maxwell 16 Buccal Swab LEV DNA Purification Kit Technical Manual(Promega Literature #TM333,January 1,2011,Promega Corporation,Madison,WI)を参照されたい)。RNA単離のためのプロトコルは、例えば、Maxwell(登録商標)16 Total RNA Purification Kit Technical Bulletin(Promega Literature#TB351、2009年8月、Promega Corporation、Madison、WI)に開示されている。
【0256】
典型的なDNA抽出手順は、例えば、(i)DNAが抽出されることになる流体試料、細胞試料、又は組織試料の収集と、(ii)必要な場合、DNA及び他の細胞質成分を放出するための細胞膜の破壊(すなわち、細胞溶解)と、(iii)タンパク質、脂質、及びRNAを沈殿させるための濃厚塩溶液による液体試料又は溶解した試料の処置、その後の、沈殿したタンパク質、脂質、及びRNAを分離するための遠心分離と、(iv)細胞膜溶解ステップ中に使用された洗剤、タンパク質、塩、又は他の試薬を除去するための上清からのDNAの精製と、を含む。
【0257】
細胞膜の破壊は、様々な機械的剪断(例えば、フレンチプレス又は細針)又は超音波破壊技術を使用して実施され得る。細胞溶解ステップは、多くの場合、脂質、細胞及び核膜を溶解するための洗剤及び界面活性剤の使用を含む。いくつかの例では、溶解ステップは、タンパク質を破壊するためのプロテアーゼの使用、及び/又は試料中のRNAの消化のためのRNaseの使用を更に含み得る。
【0258】
DNA精製のための好適な技術の例としては、限定されるものではないが、(i)氷冷エタノール又はイソプロパノール中の沈殿、その後の遠心分離(例えば、酢酸ナトリウムの添加による、イオン強度を増加させることによって増強され得るDNAの沈殿)と、(ii)フェノール-クロロホルム抽出、その後の、核酸を含有する水相を、変性タンパク質を含有する有機相から分離するための遠心分離と、(iii)核酸が緩衝液のpH及び塩濃度に応じて固相(例えば、シリカ又はその他)に吸着する固相クロマトグラフィーと、が挙げられる。
【0259】
いくつかの例では、DNAに結合された細胞及びヒストンタンパク質は、プロテアーゼを添加することによって、又は酢酸ナトリウム若しくは酢酸アンモニウムでタンパク質を沈殿させることによって、あるいはDNA沈殿ステップの前のフェノール-クロロホルム混合物による抽出を通じて除去され得る。
【0260】
いくつかの例では、DNAは、様々な好適な市販のDNA抽出及び精製キットのうちのいずれかを使用して抽出され得る。例としては、限定されるものではないが、Qiagen(Germantown、MD)製のQIAamp(ヒト試料からのゲノムDNAの単離用)及びDNAeasy(動物又は植物試料からのゲノムDNAの単離用)キット、又はPromega(Madison、WI)製のMaxwell(登録商標)及びReliaPrep(商標)シリーズが挙げられる。
【0261】
上記のように、いくつかの例では、試料は、ホルマリン固定(ホルムアルデヒド固定、又はパラホルムアルデヒド固定)、パラフィン包埋(FFPE)組織調製を含み得る。例えば、FFPE試料は、基質、例えば、FFPEブロックに包埋された組織試料であり得る。ホルムアルデヒド固定又はパラホルムアルデヒド固定、パラフィン包埋(FFPE)組織から核酸(例えば、DNA)を単離するための方法が、例えば、Cronin,et al.,(2004)Am J Pathol.164(1):35-42、Masuda,et al.,(1999)Nucleic Acids Res.27(22):4436-4443、Specht,et al.,(2001)Am J Pathol.158(2):419-429、Ambion RecoverAll(商標)Total Nucleic Acid Isolation Protocol(Ambion,Cat.No.AM1975,September 2008)、Maxwell(登録商標)16 FFPE Plus LEV DNA Purification Kit Technical Manual(Promega Literature #TM349,February 2011)、E.Z.N.A.(登録商標)FFPE DNA Kit Handbook(OMEGA bio-tek,Norcross,GA,product numbers D3399-00,D3399-01,and D3399-02,June 2009)、並びにQIAamp(登録商標)DNA FFPE Tissue Handbook(Qiagen,Cat.No.37625,October 2007)に開示されている。例えば、RecoverAll(商標)Total Nucleic Acid Isolation Kitは、高温でキシレンを使用してパラフィン包埋試料を可溶化し、ガラス繊維フィルタにかけて核酸を捕捉する。Maxwell(登録商標)16 FFPE Plus LEV DNA Purification Kitを、Maxwell(登録商標)16 Instrumentとともに、FFPE組織の1から10μm切片のゲノムDNAを精製するために使用する。シリカクラッド常磁性粒子(PMP)を用いてDNAを精製し、低溶出容量で溶出する。E.Z.N.A.(登録商標)FFPE DNA Kitは、ゲノムDNAの単離のためにスピンカラム及び緩衝系を使用する。QIAamp(登録商標)DNA FFPE Tissue Kitは、ゲノム及びミトコンドリアDNAの精製にQIAamp(登録商標)DNA Micro technologyを使用する。
【0262】
いくつかの例では、開示される方法は、試料から抽出された核酸の収量値を決定又は取得することと、決定された値を参照値と比較することを更に含み得る。例えば、決定又は取得された値が参照値未満である場合、核酸は、ライブラリ構築を進める前に増幅され得る。いくつかの例では、開示される方法は、試料中の核酸断片のサイズ(又は平均サイズ)に対する値を決定又は取得することと、決定又は取得された値を、参照値、例えば、少なくとも100、200、300、400、500、600、700、800、900、又は1000塩基対(bps)のサイズ(又は平均サイズ)と比較することと、を更に含み得る。いくつかの例では、本明細書に説明される1つ以上のパラメータは、この決定に応答して、調整又は選択され得る。
【0263】
単離後、核酸は、典型的には、わずかにアルカリ性の緩衝液、例えば、Tris-EDTA(TE)緩衝液中、又は超純水中で溶解される。いくつかの例では、単離された核酸(例えば、ゲノムDNA)は、当業者に既知の様々な技術のうちのいずれかを使用することによって、断片化又は剪断され得る。例えば、ゲノムDNAは、物理的剪断法、酵素的切断法、化学的切断法、及び当業者に周知の他の方法によって断片化され得る。DNA剪断のための方法は、例えば、国際特許出願公開第2012/092426号の実施例4に説明されている。いくつかの例では、DNA剪断法の代替法を使用して、ライブラリ調製中のライゲーションステップを回避することができる。
【0264】
ライブラリ調製
いくつかの例では、試料から単離された核酸は、ライブラリを構築するために使用され得る(例えば、本明細書に説明される核酸ライブラリ)。いくつかの例では、核酸は、上記に説明された方法のうちのいずれかを使用して断片化され、任意選択的に、鎖末端損傷の修復に供され、任意選択的に、アダプター、プライマー、及び/若しくはバーコード(例えば、増幅プライマー、配列決定アダプター、フローセルアダプター、基質アダプター、試料バーコード若しくはインデックス、及び/又は固有の分子識別子配列)を合成するためにライゲーションされ、サイズ選択され(例えば、分取ゲル電気泳動による)、並びに/又は増幅される(例えば、PCR、非PCR増幅技術、又は等温増幅技術を使用して)。いくつかの例では、断片化及びアダプターライゲーションされた核酸群は、標的配列のハイブリダイゼーションベースの選択の前に明示的なサイズ選択又は増幅なしに使用される。いくつかの例では、核酸は、当業者に周知の様々な特異的又は非特異的核酸増幅方法のうちのいずれかによって増幅される。いくつかの例では、核酸は、例えば、ランダムプライム鎖置換増幅などの全ゲノム増幅法によって増幅される。次世代配列決定のための核酸ライブラリ調製技術の例は、例えば、van Dijk,et al.(2014),Exp.Cell Research 322:12-20,and Illumina’s genomic DNA sample preparation kitに説明されている。
【0265】
いくつかの例では、結果的に得られる核酸ライブラリは、ゲノムの複雑さの全て又は実質的に全てを含み得る。この文脈における「実質的に全て」という用語は、実際には、手順の初期ステップ中にゲノム複雑性のいくらかの望ましくない喪失があり得る可能性を指す。本明細書に説明される方法はまた、核酸ライブラリがゲノムの一部である場合、例えば、ゲノムの複雑性が設計によって低減される場合に有用である。いくつかの例では、ゲノムの任意の選択された部分は、本明細書に説明される方法とともに使用され得る。例えば、ある特定の実施形態では、エクソーム全体又はそのサブセットが単離される。いくつかの例では、ライブラリは、少なくとも95%、90%、80%、70%、60%、50%、40%、30%、20%、10%、又は5%のゲノムDNAを含み得る。いくつかの例では、ライブラリは、少なくとも95%、90%、80%、70%、60%、50%、40%、30%、20%、10%、又は5%のゲノムDNAを含むゲノムDNAのcDNAコピーからなり得る。ある特定の例では、核酸ライブラリを生成するために使用される核酸の量は、5マイクログラム未満、1マイクログラム未満、500ng未満、200ng未満、100ng未満、50ng未満、10ng未満、5ng未満、又は1ng未満であり得る。
【0266】
いくつかの例では、ライブラリ(例えば、核酸ライブラリ)は、核酸分子の集合を含む。本明細書に説明されるように、ライブラリの核酸分子は、標的核酸分子(例えば、腫瘍核酸分子、参照核酸分子及び/又は対照核酸分子、本明細書ではそれぞれ第1、第2及び/又は第3の核酸分子とも称される)を含むことができる。ライブラリの核酸分子は、単一の対象又は個体に由来し得る。いくつかの例では、ライブラリは、2以上の対象(例えば、2、3、4、5、6、7、8、9、10、20、30以上の対象)に由来する核酸分子を含み得る。例えば、異なる対象由来の2つ以上のライブラリは、2以上の対象由来の核酸分子を有するライブラリを形成するために組み合わせられ得る(各対象に由来する核酸分子は、任意選択的に、特定の対象に対応する固有の試料バーコードにライゲーションされる)。いくつかの例では、対象は、がん又は腫瘍を有するか、又は有するリスクがあるヒトである。
【0267】
いくつかの例では、ライブラリ(又はその一部分)は、1つ以上のサブゲノム区間を含み得る。いくつかの例では、サブゲノム区間は、単一ヌクレオチド位置、例えば、その位置のバリアントが腫瘍表現型と関連付けられている(陽性又は陰性に)ヌクレオチド位置であり得る。いくつかの例では、サブゲノム区間は、2つ以上のヌクレオチド位置を含む。そのような例は、長さが少なくとも2、5、10、50、100、150、250、又は250超のヌクレオチド位置の配列を含む。サブゲノム区間は、例えば、1つ以上の全遺伝子(又はその一部分)、1つ以上のエクソン若しくはコーディング配列(又はその一部分)、1つ以上のイントロン(又はその一部分)、1つ以上のマイクロサテライト領域(又はその一部分)、又はそれらの任意の組み合わせを含み得る。サブゲノム区間は、天然に存在する核酸分子、例えば、ゲノムDNA分子の断片の全部又は一部を含み得る。例えば、サブゲノム区間は、配列決定反応に供されるゲノムDNAの断片に対応し得る。いくつかの例では、サブゲノム区間は、ゲノム供給源からの連続配列である。いくつかの例では、サブゲノム区間は、ゲノム中で連続していない配列を含み、例えば、cDNA中のサブゲノム区間は、スプライシングの結果として形成されたエクソン-エクソン接合部を含み得る。いくつかの例では、サブゲノム区間は、腫瘍核酸分子を含む。いくつかの例では、サブゲノム区間は、非腫瘍核酸分子を含む。
【0268】
分析のための遺伝子座の標的化
本明細書に説明される方法は、本明細書に説明されるように、例えば、ゲノム遺伝子座セット(例えば、遺伝子座又はその断片)から、対象区間セット(例えば、標的配列)を評価するための方法と組み合わせて、又はその一部として使用され得る。
【0269】
いくつかの例では、開示される方法によって評価されるゲノム遺伝子座セットは、変異体形態で、細胞分裂、増殖若しくは生存に対する効果と関連付けられるか、又はがん、例えば、本明細書に説明されるがんと関連付けられる、複数の、例えば、遺伝子を含む。
【0270】
いくつかの例では、開示される方法によって評価される遺伝子座セットは、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、又は100超の遺伝子座を含む。
【0271】
いくつかの例では、選択された遺伝子座(本明細書では標的遺伝子座又は標的配列とも称される)又はその断片は、対象ゲノムの非コーディング配列、コーディング配列、遺伝子内領域、又は遺伝子間領域を含む、対象区間を含み得る。例えば、対象区間は、非コーディング配列又はその断片(例えば、プロモーター配列、エンハンサー配列、5’非翻訳領域(5’UTR)、3’非翻訳領域(3’UTR)、又はそれらの断片)、その断片のコーディング配列、エクソン配列又はその断片、イントロン配列又はその断片を含み得る。
【0272】
標的捕捉試薬
本明細書に説明される方法は、分析のための複数の特定の標的配列(例えば、遺伝子配列又はその断片)を選択及び捕捉するために、核酸ライブラリを複数の標的捕捉試薬と接触させることを含み得る。いくつかの例では、標的捕捉試薬(すなわち、標的分子に結合し、それによって、標的分子の捕捉を可能にする分子)が、分析される対象区間を選択するために使用される。例えば、標的捕捉試薬は、標的分子にハイブリダイズし(すなわち、それに相補的である)、それによって、標的核酸の捕捉を可能にし得るベイト分子、例えば、核酸分子(例えば、DNA分子又はRNA分子)であり得る。いくつかの例では、標的捕捉試薬、例えば、ベイト分子(又はベイト配列)は、捕捉オリゴヌクレオチド(又は捕捉プローブ)である。いくつかの例では、標的核酸は、ゲノムDNA分子、RNA分子、RNA分子由来のcDNA分子、マイクロサテライトDNA配列などである。いくつかの例では、標的捕捉試薬は、標的に対する溶液相ハイブリダイゼーションに好適である。いくつかの例では、標的捕捉試薬は、標的に対する固相ハイブリダイゼーションに好適である。いくつかの例では、標的捕捉試薬は、標的に対する溶液相ハイブリダイゼーション及び固相ハイブリダイゼーションの両方に好適である。標的捕捉試薬の設計及び構築は、例えば、国際特許出願公開第2020/236941号により詳細に説明され、その内容全体は参照により本明細書に組み込まれる。
【0273】
本明細書に説明される方法は、配列決定されることになる標的核酸分子を選択するための標的捕捉試薬の適切な選択によって、1つ以上の対象からの試料(例えば、がん組織検体、液体生検試料など)からの多数のゲノム遺伝子座(例えば、遺伝子又は遺伝子産物(例えば、mRNA)、マイクロサテライト遺伝子座など)の最適化された配列決定を提供する。いくつかの例では、標的捕捉試薬は、特定の標的遺伝子座、例えば、特定の標的遺伝子座又はその断片にハイブリダイズし得る。いくつかの例では、標的捕捉試薬は、特定の標的遺伝子座群、例えば、特定の遺伝子座群又はその断片にハイブリダイズし得る。いくつかの例では、標的特異的及び/又は群特異的標的捕捉試薬の混合を含む複数の標的捕捉試薬が使用され得る。
【0274】
いくつかの例では、核酸配列決定のための複数の標的配列を捕捉するために核酸ライブラリと接触した複数の標的捕捉試薬(例えば、ベイトセット)中の標的捕捉試薬(例えば、ベイト分子)の数は、10超、50超、100超、200超、300超、400超、500超、600超、700超、800超、900超、1,000超、1,250超、1,500超、1,750超、2,000超、3,000超、4,000超、5,000超、10,000超、25,000超、又は50,000超である。
【0275】
いくつかの例では、標的捕捉試薬配列の全長は、約70ヌクレオチド~1000ヌクレオチドであり得る。一例では、標的捕捉試薬の長さは、約100~300ヌクレオチド、110~200ヌクレオチド、又は120~170ヌクレオチド長である。上記のものに加えて、約70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、300、400、500、600、700、800及び900ヌクレオチド長の中間オリゴヌクレオチド長を本明細書に説明される方法で使用することができる。いくつかの実施形態では、約70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220又は230塩基のオリゴヌクレオチドを使用することができる。
【0276】
いくつかの例では、各標的捕捉試薬配列は、(i)標的特異的捕捉配列(例えば、遺伝子座又はマイクロサテライト遺伝子座特異的相補配列)、(ii)アダプター、プライマー、バーコード、及び/又は固有の分子識別子配列、並びに(iii)一端若しくは両端のユニバーサルテールを含み得る。本明細書に使用される際、「標的捕捉試薬」という用語は、標的特異的標的捕捉配列又は標的特異的標的捕捉配列を含む標的捕捉試薬オリゴヌクレオチド全体を指し得る。
【0277】
いくつかの例では、標的捕捉試薬中の標的特異的捕捉配列は、約40ヌクレオチド~1000ヌクレオチド長である。いくつかの例では、標的特異的捕捉配列は、約70ヌクレオチド~300ヌクレオチド長である。いくつかの例では、標的特異的配列は、約100ヌクレオチド~200ヌクレオチド長である。更に他の例では、標的特異的配列は、約120ヌクレオチド~170ヌクレオチド長、典型的には120ヌクレオチド長である。上記のものに加えて、中間の長さ、例えば、約40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、300、400、500、600、700、800及び900ヌクレオチド長の標的特異的配列、並びに上記の長さの間の長さの標的特異的配列もまた、本明細書中に記載される方法において使用され得る。
【0278】
いくつかの例では、標的捕捉試薬は、1つ以上の再編成を含む対象区間、例えば、ゲノム再編成を含むイントロンを選択するように設計され得る。そのような例では、標的捕捉試薬は、選択効率を高めるために反復配列がマスクされるように設計される。再編成が既知の連結配列を有するこれらの例では、相補的標的捕捉試薬を連結配列に設計して選択効率を高めることができる。
【0279】
いくつかの例では、開示される方法は、2つ以上の異なる標的カテゴリを捕捉するように設計された標的捕捉試薬の使用を含み得、各カテゴリは、異なる標的捕捉試薬設計戦略を有する。いくつかの例では、本明細書に開示される、ハイブリダイゼーションベースの捕捉方法及び標的捕捉試薬組成物は、標的配列セットの捕捉及び均質なカバレッジを提供するが、一方で、標的化された配列セットの外側のゲノム配列のカバレッジを最小化することができる。いくつかの例では、標的配列は、ゲノムDNAのエクソーム全体又はその選択されたサブセットを含み得る。いくつかの例では、標的配列は、例えば、大きな染色体領域(例えば、染色体腕全体)を含み得る。本明細書に開示される方法及び組成物は、複合標的核酸配列セットについて異なる配列決定深度及びカバレッジのパターンを達成するための異なる標的捕捉試薬を提供する。
【0280】
典型的には、DNA分子が標的捕捉試薬配列として使用されるが、RNA分子も使用することができる。いくつかの例では、DNA分子標的捕捉試薬は、一本鎖DNA(ssDNA)又は二本鎖DNA(dsDNA)であり得る。いくつかの例では、RNA-DNA二重鎖は、DNA-DNA二重鎖よりも安定であり、したがって、潜在的により良好な核酸の捕捉を提供する。
【0281】
いくつかの例では、開示される方法は、1つ以上の核酸ライブラリから捕捉された、選択された核酸分子セット(例えば、ライブラリキャッチ)を提供することを含む。例えば、本方法は、1つ又は複数の核酸ライブラリを提供することであって、各々が、1つ以上の対象からの1つ以上の試料から抽出された複数の核酸分子(例えば、複数の標的核酸分子及び/又は参照核酸分子)を含む、提供することと、1つ又は複数のライブラリ(例えば、溶液ベースのハイブリダイゼーション反応における)を、1、2、3、4、5、5つ超の複数の標的捕捉試薬(例えば、オリゴヌクレオチド標的捕捉試薬)と接触させて、複数の標的捕捉試薬/核酸分子ハイブリッドを含むハイブリダイゼーション混合物を形成することと、例えば、当該ハイブリダイゼーション混合物を、当該ハイブリダイゼーション混合物からの複数の標的捕捉試薬/核酸分子ハイブリッドの分離を可能にする結合実体と接触させることによって、当該複数の標的捕捉試薬/核酸分子ハイブリッドをハイブリダイゼーション混合物から分離し、それによって、ライブラリキャッチ(例えば、1つ又は複数のライブラリからの選択又は濃縮された核酸分子の部分群)を提供することと、を含み得る。
【0282】
いくつかの例では、開示される方法は、ライブラリキャッチを増幅することを更に含み得る(例えば、PCRを実施することによって)。他の例では、ライブラリキャッチは、増幅されない。
【0283】
いくつかの例では、標的捕捉試薬は、必要に応じて説明書、標準、緩衝液若しくは酵素又は他の試薬を含み得るキットの一部であり得る。
【0284】
ハイブリダイゼーション条件
上記のように、本明細書に開示される方法は、ライブラリ(例えば、核酸ライブラリ)を、複数の標的捕捉試薬と接触させて、選択されたライブラリ標的核酸配列(すなわち、ライブラリキャッチ)と接触させることを含み得る。接触ステップは、例えば、溶液ベースのハイブリダイゼーションで行われ得る。いくつかの例では、本方法は、1回以上の追加の溶液ベースのハイブリダイゼーションに関してハイブリダイゼーションステップを繰り返すことを含む。いくつかの例では、本方法は、ライブラリキャッチを、同じか又は異なる標的捕捉試薬の集合との1回以上の追加の溶液ベースのハイブリダイゼーションに供することを更に含む。
【0285】
いくつかの例では、接触ステップは、固体支持体、例えば、アレイを使用して行われる。ハイブリダイゼーションのための好適な固体支持体は、例えば、Albert,T.J.et al.(2007)Nat.Methods 4(11):903-5、Hodges,E.et al.(2007)Nat.Genet.39(12):1522-7、及びOkou,D.T.et al.(2007)Nat.Methods 4(11):907-9に説明されており、それらの内容は、その全体が参照により本明細書に組み込まれる。
【0286】
本明細書の方法での使用に適合させることができるハイブリダイゼーション方法は、例えば、国際特許出願公開第2012/092426号に記載されているように、当技術分野で記載されている。複数の標的核酸に標的捕捉試薬をハイブリダイズするための方法は、例えば、国際特許出願公開第2020/236941号により詳細に説明され、その内容全体は参照により本明細書に組み込まれる。
【0287】
配列決定方法
本明細書に開示される方法及びシステムは、核酸を配列決定するための方法又はシステム(例えば、次世代配列決定システム)と組み合わせて、又はその一部として使用されて、試料中のサブゲノム区間内の1つ以上の遺伝子座と重複する複数の配列リードを生成し、それによって、例えば、複数の遺伝子座における遺伝子対立配列を決定し得る。本明細書で使用される「次世代配列決定」(又は「NGS」)はまた、「超並列配列決定」とも称され得、個々の核酸分子(例えば、単一分子配列決定では)又は個々の核酸分子のクローン的に拡大されたプロキシのヌクレオチド配列をハイスループット様式(例えば、103、104、105、又は105超の分子が同時に配列決定される)で決定する任意の配列決定方法を指す。
【0288】
次世代配列決定法は、当技術分野で公知であり、例えば、参照により本明細書に組み込まれる、Metzker、M.(2010)Nature Biotechnology Reviews 11:31-46に説明されている。本明細書に開示される方法及びシステムを実装するときに使用するために好適な配列決定方法の他の例は、例えば、国際特許出願公開第2012/092426号に説明されている。いくつかの例では、配列決定は、例えば、全ゲノム配列決定(WGS)、全エクソーム配列決定、標的配列決定、又は直接配列決定を含み得る。いくつかの例では、配列決定は、例えば、サンガー配列決定を使用して実施され得る。いくつかの例では、配列決定は、断片の両端が配列決定されることを可能にし、かつ、例えば、ゲノム再編成、反復配列要素、遺伝子融合、及び新規の転写物の検出のための高品質のアラインメント可能な配列データを生成する、ペアエンド配列決定技術を含み得る。
【0289】
開示される方法及びシステムは、Roche 454、Illumina Solexa、ABI-SOLiD、ION Torrent、Complete Genomics、Pacific Bioscience、Helicos、及び/又はPolonatorプラットフォームなどの、配列決定プラットフォームを使用して実装され得る。いくつかの例では、配列決定は、Illumina MiSeq配列決定を含み得る。いくつかの例では、配列決定は、Illumina HiSeq配列決定を含み得る。いくつかの例では、配列決定は、Illumina NovaSeq配列決定を含み得る。試料から抽出された核酸中の多数の標的ゲノム遺伝子座を配列決定するための最適化された方法は、例えば、国際特許出願公開第2020/236941号により詳細に説明され、その内容全体は参照により本明細書に組み込まれる。
【0290】
ある特定の例では、開示される方法は、(a)複数の正常及び/若しくは腫瘍核酸分子を含むライブラリを試料から取得するステップ、(b)標的核酸分子への標的捕捉試薬のハイブリダイゼーションを可能にする条件下でライブラリを1、2、3、4、5、又は5つ超の複数の標的捕捉試薬と同時に若しくは順次接触させ、それによって、選択された捕捉された正常及び/若しくは腫瘍核酸分子セット(すなわち、ライブラリキャッチ)を提供するステップ、(c)例えば、ハイブリダイゼーション混合物を、ハイブリダイゼーション混合物からの標的捕捉試薬/核酸分子ハイブリッドの分離を可能にする結合実体と接触させることによって、核酸分子の選択されたサブセット(例えば、ライブラリキャッチ)をハイブリダイゼーション混合物から分離するステップ、(d)ライブラリキャッチを配列決定して、1つ以上の対象区間(例えば、1つ以上の標的配列)と重複する複数のリード(例えば、配列リード)を、変異(又は変化)を含み得る当該ライブラリキャッチ、例えば、体細胞変異又は生殖細胞系変異を含むバリアント配列から取得するステップ、(e)本明細書の他の箇所で説明されるアラインメント方法を使用して当該配列リードをアラインメントするステップ、並びに/又は(f)複数のうちの1つ以上の配列リードから対象区間内のヌクレオチド位置にヌクレオチド値を割り当てる(例えば、ベイズ法又は本明細書に説明される他の方法を使用して、例えば、変異を呼び出す)ステップのうちの1つ以上を含む。
【0291】
いくつかの例では、1つ以上の対象区間に対する配列リードを取得することは、少なくとも1、少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも450、少なくとも500、少なくとも550、少なくとも600、少なくとも650、少なくとも700、少なくとも750、少なくとも800、少なくとも850、少なくとも900、少なくとも950、少なくとも1,000、少なくとも1,250、少なくとも1,500、少なくとも1,750、少なくとも2,000、少なくとも2,250、少なくとも2,500、少なくとも2,750、少なくとも3,000、少なくとも3,500、少なくとも4,000、少なくとも4,500、又は少なくとも5,000の遺伝子座、例えば、ゲノム遺伝子座、遺伝子座、マイクロサテライト遺伝子座などを配列決定することを含み得る。いくつかの例では、1つ以上の対象区間に対する配列リードを取得することは、この段落に説明された範囲内の任意の数の遺伝子座、例えば、少なくとも2,850の遺伝子座に対する対象区間を配列決定することを含み得る。
【0292】
いくつかの例では、1つ以上の対象区間に対する配列リードを取得することは、少なくとも20塩基、少なくとも30塩基、少なくとも40塩基、少なくとも50塩基、少なくとも60塩基、少なくとも70塩基、少なくとも80塩基、少なくとも90塩基、少なくとも100塩基、少なくとも120塩基、少なくとも140塩基、少なくとも160塩基、少なくとも180塩基、少なくとも200塩基、少なくとも220塩基、少なくとも240塩基、少なくとも260塩基、少なくとも280塩基、少なくとも300塩基、少なくとも320塩基、少なくとも340塩基、少なくとも360塩基、少なくとも380塩基、又は少なくとも400塩基の配列リード長(又は平均配列リード長)を提供する配列決定方法を用いて対象区間を配列決定することを含む。いくつかの例では、1つ以上の対象区間に対する配列リードを取得することは、この段落に説明された範囲内の任意の数の塩基の配列リード長(又は平均配列リード長)、例えば、56塩基の配列リード長(又は平均配列リード長)を提供する配列決定方法を用いて対象区間を配列決定することを含み得る。
【0293】
いくつかの例では、1つ以上の対象区間に対する配列リードを取得することは、平均で少なくとも100×以上のカバレッジ(又は深度)で配列決定することを含み得る。いくつかの例では、1つ以上の対象区間に対する配列リードを取得することは、平均で少なくとも100×、少なくとも150×、少なくとも200×、少なくとも250×、少なくとも500×、少なくとも750×、少なくとも1,000×、少なくとも1,500×、少なくとも2,000×、少なくとも2,500×、少なくとも3,000×、少なくとも3,500×、少なくとも4,000×、少なくとも4,500×、少なくとも5,000×、少なくとも5,500×、又は少なくとも6,000×以上のカバレッジ(又は深度)で配列決定することを含み得る。いくつかの例では、1つ以上の対象区間に対する配列リードを取得することは、この段落で説明された値の範囲内の任意の値を有する平均カバレッジ(又は深度)、例えば、少なくとも160×で配列決定することを含み得る。
【0294】
いくつかの例では、1つ以上の対象区間に対する配列リードを取得することは、約90%、92%、94%、95%、96%、97%、98%、又は99%超の配列決定された遺伝子座に対して、少なくとも100×~少なくとも6,000×の範囲の任意の値を有する平均配列決定深度で配列決定することを含む。例えば、いくつかの例では、対象区間に対するリードを取得することは、少なくとも99%の配列決定された遺伝子座に対して少なくとも125×の平均配列決定深度で配列決定することを含む。別の例として、いくつかの例では、対象区間に対するリードを取得することは、少なくとも95%の配列決定された遺伝子座に対して少なくとも4,100×の平均配列決定深度で配列決定することを含む。
【0295】
いくつかの例では、ライブラリ中の核酸種の相対存在量は、配列決定実験によって生成されたデータ中のそれらの同族配列の出現の相対数(例えば、所与の同族配列に対する配列リードの数)をカウントすることによって推定され得る。
【0296】
いくつかの例では、開示される方法及びシステムは、本明細書に説明されるように、対象区間セット(例えば、遺伝子座)に対するヌクレオチド配列を提供する。ある特定の事例では、配列は、一致正常対照(例えば、野生型コントロール)、及び/又は一致腫瘍対照(例えば、原発性対転移性)を含む方法を使用せずに提供される。
【0297】
いくつかの例では、本明細書で使用される場合、配列決定深度のレベル(例えば、配列決定深度のX倍レベル)は、重複リード(例えば、PCR重複リード)の検出及び除去の後に得られるリードの数(例えば、固有リード)を指す。他の例では、例えば、コピー数変化(CNA)の検出を支援するために、重複リードが評価される。
【0298】
アラインメント
アラインメントは、リードをある場所、例えば、ゲノム場所又は遺伝子座と一致させるプロセスである。いくつかの例では、NGSリードは、既知の参照配列(例えば、野生型配列)にアラインメントされ得る。いくつかの例では、NGSリードは、デノボアセンブリされ得る。NGSリードに対する配列アラインメントの方法は、例えば、Trapnell,C.and Salzberg,S.L.Nature Biotech.,2009,27:455-457.デノボ配列アセンブリの例は、例えばWarren R.et al.,Bioinformatics,2007,23:500-501、Butler J.et al.,Genome Res.,2008,18:810-820、及びZerbino D.R.and Birney E.,Genome Res.,2008,18:821-829に説明されている、配列アラインメントの最適化は、例えば、国際特許出願公開第2012/092426号に記載されているように、当技術分野で説明されている。配列アラインメント方法の追加の説明が、例えば、国際特許出願公開第2020/236941号により詳細に説明され、その内容全体は参照により本明細書に組み込まれる。
【0299】
ミスアラインメント(例えば、ゲノム内の不正確な場所における短いリードからの塩基対の配置)、例えば、代替対立遺伝子のリードが代替対立遺伝子リードのヒストグラムピークからシフトされ得るため、実際のがん変異の周りの配列コンテキスト(例えば、反復配列の存在)に起因するリードのミスアラインメントは、変異検出の感度の低下につながり得、変異検出の感度の低下につながり得る。ミスアラインメントを引き起こし得る配列コンテキストの他の例は、ショートタンデムリピート、散在反復配列、低複雑性領域、挿入-欠失(インデル)、及びパラログを含む。実際の変異が存在しない場合に問題のある配列状況が生じる場合、ミスアラインメントは、実際の参照ゲノム塩基配列のリードを誤った場所に配置することによって、「変異」対立遺伝子のアーチファクトのリードを導入し得る。多重遺伝子分析のための変異呼び出しアルゴリズムは、低存在量の変異に対してさえも感受性でなければならないため、配列ミスアラインメントは、偽陽性発見率を増加させ、及び/又は特異性を低下させ得る。
【0300】
いくつかの例では、本明細書に開示される方法及びシステムは、複数の個別的に調整されたアラインメント方法又はアルゴリズムの使用を統合して、配列決定方法、特に、多数の多様なゲノム遺伝子座における多数の多様な遺伝的事象の超並列配列決定に依存する方法で、ベース呼び出し性能を最適化し得る。いくつかの例では、開示される方法及びシステムは、1つ以上のグローバルアラインメントアルゴリズムの使用を含み得る。いくつかの例では、開示される方法及びシステムは、1つ以上のローカルアラインメントアルゴリズムの使用を含み得る。使用され得るアラインメントアルゴリズムの例としては、限定されるものではないが、Burrows-Wheeler Alignment(BWA)ソフトウェアバンドル(例えば、Li,et al.(2009),“Fast and Accurate Short Read Alignment with Burrows-Wheeler Transform”,Bioinformatics 25:1754-60、Li,et al.(2010),Fast and Accurate Long-Read Alignment with Burrows-Wheeler Transform”,Bioinformatics epub.PMID:20080505参照)、Smith-Watermanアルゴリズム(例えば、Smith,et al.(1981),“Identification of Common Molecular Subsequences”,J.Molecular Biology 147(1):195-197参照)、Striped Smith-Watermanアルゴリズム(例えば、Farrar (2007),“Striped Smith-Waterman Speeds Database Searches Six Times Over Other SIMD Implementations”,Bioinformatics 23(2):156-161参照)、Needleman-Wunschアルゴリズム(Needleman,et al.(1970)“A General Method Applicable to the Search for Similarities in the Amino Acid Sequence of Two Proteins”,J.Molecular Biology 48(3):443-53)、又はそれらの任意の組み合わせが挙げられる。
【0301】
いくつかの例では、本明細書に開示される方法及びシステムはまた、配列アセンブリアルゴリズム、例えば、Arachne配列決定アセンブリアルゴリズム(例えば、Batzoglou,et al.(2002),“ARACHNE:A Whole-Genome Shotgun Assembler”,Genome Res.12:177-189参照)の使用も含み得る。
【0302】
いくつかの例では、配列リードを分析するために使用されるアラインメント方法は、異なるゲノム遺伝子座における異なるバリアント(例えば、点変異、挿入、欠失など)の検出のために個別的にカスタマイズ又は調整されない。いくつかの例では、異なるゲノム遺伝子座で検出される異なるバリアントの少なくともサブセットの検出のために個別的にカスタマイズ又は調整される異なるアラインメント方法がリードを分析するために使用される。いくつかの例では、異なるゲノム遺伝子座で各異なるバリアントを検出するために個別的にカスタマイズ又は調整される異なるアラインメント方法がリードを分析するために使用される。いくつかの例では、調整は、(i)配列決定される遺伝子座(例えば、遺伝子座、マイクロサテライト遺伝子座、又は他の対象区間)、(ii)試料と関連付けられた腫瘍タイプ、(iii)配列決定されるバリアント、又は(iv)試料若しくは対象の特徴のうちの1つ以上の関数であり得る。配列決定されるいくつかの特定の対象区間に個別的に調整されるアラインメント条件の選択又は使用は、速度、感度及び特異性の最適化を可能にする。この方法は、比較的多数の多様な対象区間に対するリードのアラインメントが最適化される場合に特に有効である。いくつかの例では、本方法は、再編成のために最適化されたアラインメント方法と、再編成と関連付けられていない対象区間のために最適化された他のアラインメント方法の併用を含む。
【0303】
いくつかの例では、本明細書に開示される方法は、配列リードを分析、例えば、アラインメントするためのアラインメント方法を選択又は使用することを更に含み、当該アラインメント方法は、(i)腫瘍タイプ、例えば、試料中の腫瘍タイプ、(ii)配列決定される対象区間の場所(例えば、遺伝子座)、(iii)配列決定される対象区間内のバリアントのタイプ(例えば、点変異、挿入、欠失、置換、コピー数変異(CNV)、再編成、又は融合)、(iv)分析される部位(例えば、ヌクレオチド位置)、(v)試料のタイプ(例えば、本明細書に説明される試料)、及び/又は(vi)評価される対象区間内若しくはその近くの隣接配列(例えば、例えば、対象区間内又はその近くの反復配列の存在に起因する対象区間のミスアラインメントに対する、その予想される傾向に従って)のうちの1つ以上の関数であるか、それらに応じて選択されるか、それらに対して最適化される。
【0304】
いくつかの例では、本明細書に開示される方法は、面倒なリード、例えば、再編成を有するリードの迅速かつ効率的なアラインメントを可能にする。したがって、対象区間に対するリードが再編成、例えば、転座を伴うヌクレオチド位置を含むいくつかの例では、本方法は、適切に調整され、以下を含むアラインメント方法を使用することを含み得る。(i)リードとのアラインメントのための再編成参照配列を選択することであって、当該再編成参照配列が再編成(いくつかの例では、参照配列はゲノム再編成と同一ではない)とアラインメントする、選択すること、及び(ii)リードを当該再編成参照配列と比較、例えば、アラインメントすること。
【0305】
いくつかの例では、代替的な方法が、問題のあるリードをアラインメントするために使用され得る。これらの方法は、比較的多数の多様な対象区間に対するリードのアラインメントが最適化される場合に特に有効である。例として、試料を分析する方法は、(i)第1のパラメータセットを使用するリードの比較(例えば、アラインメント比較)を実施し(例えば、第1のマッピングアルゴリズムを使用するか、又は第1の参照配列との比較によって)、当該リードが第1のアラインメント基準を満たす(例えば、リードが当該第1の参照配列で、例えば、特定の数のミスマッチ未満でアラインメントされ得る)かどうかを決定することと、(ii)当該リードが第1のアラインメント基準を満たさない場合、第2のパラメータセットを使用して第2のアラインメント比較を実施する(例えば、第2のマッピングアルゴリズムを使用するか、又は第2の参照配列との比較によって)ことと、(iii)任意選択的に、当該リードが第2の基準を満たす(例えば、当該リードが当該第2の参照配列で、例えば、特定の数未満のミスマッチ未満でアラインメントされ得る)かどうかを決定することであって、当該第2のパラメータセットが、例えば、当該第1のパラメータセットと比較して、バリアントに対するリードとのアラインメント(例えば、再編成、挿入、欠失、又は転座)を結果的にもたらす可能性が高い、当該第2の参照配列の使用を含む、決定することと、を含み得る。
【0306】
いくつかの例では、開示される方法における配列リードのアラインメントは、本明細書の他の箇所に説明される変異呼び出し方法と組み合わせられ得る。本明細書で論じられるように、実際の変異を検出するための感度の低下は、分析されている遺伝子又はゲノム遺伝子座(例えば、遺伝子座)の予想される変異部位の周りのアラインメントの質を(手動で又は自動化された様式で)評価することによって対処することができる。いくつかの例では、評価されることになる部位は、ヒトゲノム(例えば、HG19ヒト参照ゲノム)又はがん変異(例えば、COSMIC)のデータベースから得られ得る。問題があると特定された領域は、例えば、Smith-Watermanアラインメントなどのより遅いがより正確なアラインメントアルゴリズムを使用するアラインメント最適化(又は再アラインメント)によって、関連する配列状況においてより良好な性能を与えるように選択されたアルゴリズムを使用して修復することができる。一般的なアラインメントアルゴリズムが問題を改善することができない場合、カスタマイズされたアラインメントアプローチが、例えば、置換を含む可能性が高い遺伝子に対する最大の異なるミスマッチペナルティパラメータの調整、特定の腫瘍タイプに共通である特定の変異タイプ(例えば、黒色腫のC□T)に基づいて、特定のミスマッチペナルティパラメータを調整すること、又はある特定の試料タイプに共通である特定の変異タイプ(例えば、FFPEに共通である置換)に基づいて、特定のミスマッチペナルティパラメータを調整することによって作成され得る。
【0307】
ミスアラインメントに起因する評価された対象区間の特異性の低下(偽陽性率の増加)は、配列決定データ内の全ての変異呼び出しの手動又は自動検査によって評価され得る。ミスアラインメントに起因して偽の変異呼び出しが発生しやすいことが判明した領域は、上記に論じられたアラインメント改善に供され得る。アルゴリズム的な改善策が可能でない場合、問題領域からの「変異」を標的遺伝子座のパネルから分類又はスクリーニングすることができる。
【0308】
変異呼び出し
ベース呼び出しは、配列決定デバイスの生の出力、例えば、オリゴヌクレオチド分子中のヌクレオチドの決定された配列を指す。変異呼び出しは、配列決定されている所与のヌクレオチド位置に対してヌクレオチド値、例えば、A、G、T、又はCを選択するプロセスを指す。典型的には、位置に対する配列リード(又はベース呼び出し)は、2つ以上の値を提供することになり、例えば、いくつかのリードがTを示すことになり、いくつかがGを示すことになる。変異呼び出しは、正しいヌクレオチド値、例えば、それらの値のうちの1つを配列に割り当てるプロセスである。「変異」呼び出しと称されるが、任意のヌクレオチド位置、例えば、変異体対立遺伝子、野生型対立遺伝子、変異体若しくは野生型として特徴付けられていない対立遺伝子に対応する位置、又は可変性を特徴としない位置にヌクレオチド値を割り当てるために適用することができる。
【0309】
いくつかの例では、開示される方法は、特に、試料、例えば、がんを有する対象からの試料中の多数の多様なゲノム遺伝子座(例えば、遺伝子座、マイクロサテライト領域など)における多数の多様な遺伝子事象の超並列配列決定に依存する方法において、配列決定データに適用されるときの性能を最適化するために、カスタマイズ又は調整された変異呼び出しアルゴリズム又はパラメータの使用を含み得る。変異呼び出しの最適化は、例えば、国際特許出願公開第2012/092426号に記載されているように、当技術分野で説明されている。
【0310】
変異呼び出しのための方法は、以下のうちの1つ以上を含むことができる:参照配列内の各位置での情報に基づいて独立した呼び出しを行う(例えば、配列リードを調べること;ベースコール及び品質スコアを調べること;潜在的な遺伝子型が与えられたときの観察された塩基及び品質スコアの確率を計算すること;及び遺伝子型(例えば、ベイズ則を使用する)の割り当て);偽陽性を除去すること(例えば、深度閾値を使用して、予想よりもはるかに低い又は高い読み取り深度を有するSNPを拒否する;小さいインデルに起因する偽陽性を除去するための局所再調整);連鎖不平衡(LD)/帰属に基づく分析を実施して、呼び出しを改良すること。
【0311】
特定の遺伝子型及び位置に関連する遺伝子型尤度を計算するために使用される式は、例えば、Li H.and Durbin R.Bioinformatics,2010;26(5):589-95に説明されている。特定のがん型における特定の変異に対する事前の予想は、そのがん型からの試料を評価するときに使用することができる。そのような可能性は、がん変異の公開データベース、例えば、Catalogue of Somatic Mutation in Cancer(COSMIC)、HGMD(Human Gene Mutation Database)、the SNP Consortium、Breast Cancer Mutation Data Base(BIC)及びBreast Cancer Gene Database(BCGD)から得ることができる。
【0312】
LD/インピュテーションベースの分析の例は、例えば、Browning,B.L.and Yu,Z.Am.J.Hum.Genet.2009,85(6):847-61に説明されている。低カバレッジSNP呼び出し方法の例は、例えば、Li,Y.,et al.,Annu.Rev.Genomics Hum.Genet.2009,10:387-406に説明されている。
【0313】
アラインメント後、変異呼び出し方法(例えば、ベイジアン変異呼び出し方法)を使用して置換の検出が実施され得、これは、対象区間の各々の各塩基、例えば、評価される遺伝子又は他の遺伝子座のエクソンに適用され、代替対立遺伝子の存在が観察される。この方法は、変異の存在下でリードデータを観測する確率を、ベースコールエラーのみの存在下でリードデータを観測する確率と比較する。この比較が変異の存在を十分に強く支持する場合、変異を呼び出すことができる。
【0314】
ベイズ変異検出手法の利点は、変異の存在確率と塩基呼び出しエラーの確率のみとの比較を、その部位における変異の存在の事前予想によって重み付けできることである。代替対立遺伝子のいくつかのリードが所与のがん型について頻繁に変異した部位で観察される場合、変異の証拠の量が通常の閾値を満たさない場合であっても、変異の存在が確実に呼び出され得る。次いで、この柔軟性を使用して、より希少な変異/より低い純度の試料の検出感度を高めるか、又は読み取りカバレッジの減少に対して試験をより堅牢にすることができる。がんにおいてゲノム中のランダムな塩基対が変異している可能性は約1e-6である。例えば、典型的な多遺伝子性がんゲノムパネルの多くの部位で生じる特異的変異の可能性は、桁違いに高くなり得る。これらの尤度は、がん変異の公開データベース(例えば、COSMIC)に由来し得る。
【0315】
インデル呼び出しは、典型的には関連する信頼スコア又は統計的証拠指標を含む、挿入又は欠失によって参照配列とは異なる配列決定データ中の塩基を見つけるプロセスである。インデル呼び出しの方法は、候補インデルを同定するステップ、局所再アラインメントによって遺伝子型尤度を計算するステップ、並びにLDベースの遺伝子型推論及びコールを行うステップを含み得る。典型的には、ベイズ法を使用して潜在的インデル候補を取得し、次いでこれらの候補をベイズフレームワーク内の参照配列とともに試験する。
【0316】
候補インデルを生成するためのアルゴリズムは、例えば、McKenna,A.,et al.,Genome Res.2010;20(9):1297-303、Ye,K.,et al.,Bioinformatics,2009; 25(21):2865-71、Lunter,G.,and Goodson,M.,Genome Res.2011;21(6):936-9、及びLi,H.,et al.(2009),Bioinformatics 25(16):2078-9に説明されている。
【0317】
インデル呼び出し及び個体レベルの遺伝子型尤度を生成する方法としては、例えば、Dindelアルゴリズム(Albers C.A.et al.,Genome Res.2011;21(6):961-73)が挙げられる。例えば、ベイジアンEMアルゴリズムを使用して、リードを分析し、初期インデル呼び出しを行い、各候補インデルについて遺伝子型尤度を生成し、続いて、例えば、QCALL(Le S.Q.and Durbin R.Genome Res.2011;21(6):952-60)を使用して遺伝子型を補完することができる。インデルを観察する事前の予想などのパラメータは、インデルのサイズ又は位置に基づいて調整することができる(例えば、増加又は減少)。
【0318】
がんDNAの分析のための50%又は100%の対立遺伝子頻度からの限られた偏差に対処する方法が開発されている。(例えば、SNVMix -Bioinformatics.2010 March 15;26(6):730-736参照。) しかしながら、本明細書に開示される方法は、1%~100%の範囲の頻度(又は対立遺伝子画分)(すなわち、0.01~1.0の範囲の対立遺伝子画分)、及び、特に、50%未満のレベルの変異体対立遺伝子の存在の可能性の考慮を可能にする。このアプローチは、例えば、天然(マルチクローナル)腫瘍DNAの低純度FFPE試料における変異の検出に特に重要である。
【0319】
いくつかの例では、配列リードを分析するために使用される変異呼び出し方法は、異なるゲノム遺伝子座における異なる変異の検出のために個別的にカスタマイズ又は調整されない。いくつかの例では、異なるゲノム遺伝子座で検出される異なる変異の少なくともサブセットのために個別的にカスタマイズ又は微調整される異なる変異呼び出し方法が使用される。いくつかの例では、各異なるゲノム遺伝子座で検出される各異なる変異のために個別的にカスタマイズ又は微調整される異なる変異呼び出し方法が使用される。カスタマイズ又は調整は、本明細書に説明される因子、例えば、試料中のがんのタイプ、配列決定される対象区間が位置する遺伝子若しくは遺伝子座、又は配列決定されるバリアントのうちの1つ以上に基づくことができる。配列決定される対象区間の数に対して個別的にカスタマイズ又は微調整された変異呼び出し方法のこの選択又は使用は、変異呼び出しの速度、感度、及び特異性の最適化を可能にする。
【0320】
いくつかの例では、ヌクレオチド値は、固有の変異呼び出し方法を使用してX個の固有の対象区間の各々のヌクレオチド位置に割り当てられ、Xは、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも1000、少なくとも1500、少なくとも2000、少なくとも2500、少なくとも3000、少なくとも3500、少なくとも4000、少なくとも4500、少なくとも5000以上である。呼び出し方法は異なり、それによって、例えば、異なるベイズ事前値に依存することによって一意であり得る。
【0321】
いくつかの例では、当該ヌクレオチド値を割り当てることは、タイプの腫瘍における当該ヌクレオチド位置におけるバリアント、例えば、変異を示すリードを観察する以前(例えば、文献)の期待値であるか又はそれを表す値の関数である。
【0322】
いくつかの例では、本方法は、少なくとも10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900又は1,000個のヌクレオチド位置についてヌクレオチド値(例えば、変異の呼び出し)を割り当てることを含み、各割り当ては、タイプの腫瘍における当該ヌクレオチド位置におけるバリアント、例えば変異を示すリードを観察する以前(例えば、文献)の期待値であるか又はそれを表す固有の(他の割り当ての値とは対照的な)値の関数である。
【0323】
いくつかの例では、当該ヌクレオチド値を割り当てることは、バリアントが特定の頻度(例えば、1%、5%、10%など)で試料中に存在する場合及び/又はバリアントが存在しない場合(例えば、塩基呼び出しエラーのみに起因してリードにおいて観察される)、当該ヌクレオチド位置で当該バリアントを示すリードを観察する確率を表す値のセットの関数である。
【0324】
いくつかの例では、本明細書に説明される変異呼び出し方法は、(a)当該X個の対象区間の各々におけるヌクレオチド位置について、(i)タイプXの腫瘍の当該ヌクレオチド位置におけるバリアント、例えば、変異を示すリードを観察する以前(例えば、文献)の期待値であるか又はそれを表す第1の値と、(ii)バリアントがある頻度(例えば、1%、5%、10%など)で試料中に存在する場合、及び/又はバリアントが存在しない(例えば、ベース呼び出しエラー単独に起因して、リード内で観察される)場合、当該ヌクレオチド位置で当該バリアントを示すリードを観察する可能性を表す第2の値のセットと、を取得することと、(b)当該値に応答して、例えば、本明細書に説明されるベイズ法によって、第1の値を使用する第2のセット内の値の間の比較を重み付けすること(例えば、変位の存在の事後確率を計算すること)によって、当該ヌクレオチド位置の各々に、当該リードからのヌクレオチド値(例えば、変異を呼び出す)を割り当て、それによって、当該試料を分析することと、を含み得る。
【0325】
変異呼び出し方法の追加の説明が、例えば、国際特許出願公開第2020/236941号により詳細に説明され、その内容全体は参照により本明細書に組み込まれる。
【0326】
コンピュータ可読媒体(ソフトウェア)
本開示の前述の方法のいずれも、非一時的コンピュータ可読記憶媒体(コンピュータ可読媒体-CRMとも称される)上に記録された命令のセットとして指定されるコンピュータプログラムプロセスとして実装され得る。
【0327】
本方法は、デバイスの1つ以上のプロセッサによって実行される1つ以上のプログラムを含む非一時的コンピュータ可読記憶媒体であって、1つ以上のプログラムが、1つ以上のプロセッサによって実行された場合、前述の実施形態のいずれか1つの方法をデバイスに実施させる命令を含む、非一時的コンピュータ可読記憶媒体を提供する。
【0328】
前述の実施形態のいずれか1つの方法を実施することから生成されたレポートを含む非一時的コンピュータ可読記憶媒体も本明細書で提供される。
【0329】
コンピュータ可読記憶媒体の例は、RAM、ROM、読み出し専用コンパクトディスク(CD-ROM)、記録可能コンパクトディスク(CD-R)、書き換え可能コンパクトディスク(CD-RW)、読み出し専用デジタル多用途ディスク(例えば、DVD-ROM、二層DVD-RO)、様々な記録可能/書き換え可能DVD(、例えば、DVD-RAM、DVD-RW、DVD+RWなど)、フラッシュメモリ(例えば、SDカード、mini-SDカード、micro-SDカードなど)、磁気及び/又はソリッドステートハードドライブ、超高密度光ディスク、任意の他の光又は磁気媒体、及びフロッピー(登録商標)ディスクを含む。いくつかの実施形態では、コンピュータ可読記憶媒体は、ソリッドステートデバイス、ハードディスク、CD-ROM、又は任意の他の不揮発性コンピュータ可読記憶媒体である。
【0330】
コンピュータ可読記憶媒体は、少なくとも1つの処理ユニットによって実行可能であり、様々な動作を実施するための命令セットを含む、コンピュータ実行可能命令セット(例えば、「コンピュータプログラム」)を記憶することができる。
【0331】
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、又はコードとしても知られる)は、コンパイル型又はインタープリタ型言語、宣言型又は手続き型言語を含む、任意の形態のプログラム言語で書くことができ、スタンドアロンプログラムとして、又はモジュール、コンポーネント、若しくはサブルーチン、オブジェクト、若しくはコンピューティング環境での使用に適した他のコンポーネントとして含む、任意の形態で展開することができる。コンピュータプログラムは、ファイルシステム内のファイルに対応してもよいが、その必要はない。プログラムは、他のプログラム又はデータを保持するファイルの一部(例えば、マークアップ言語文書に格納された1つ以上のスクリプト)、問題のプログラム専用の単一のファイル、又は複数の協調ファイル(例えば、1つ以上のモジュール、サブプログラム、又はコードの一部を格納するファイル)に格納することができる。コンピュータプログラムは、1つのコンピュータ上で、又は1つのサイトに位置するか、若しくは複数のサイトにわたって分散され、通信ネットワークによって相互接続された複数のコンピュータ上で実行されるように展開され得る。コンピュータプログラム又はコンピュータコードの例は、コンパイラによって生成されるようなマシンコード、及びインタープリタを使用してコンピュータ、電子コンポーネント、又はマイクロプロセッサによって実行されるより高レベルのコードを含むファイルを含む。
【0332】
いくつかの実施形態では、本開示の複数のソフトウェア態様は、本開示の別個のソフトウェア態様を残しながら、より大きいプログラムの下位部分として実装され得る。いくつかの実装形態では、複数のソフトウェア態様を別個のプログラムとして実装することもできる。本明細書で説明されるソフトウェア態様を一緒に実装する別個のプログラムの任意の組み合わせは、本開示の範囲内である。いくつかの実装形態では、ソフトウェアプログラムは、1つ以上の電子システム上で動作するようにインストールされたとき、ソフトウェアプログラムの動作を実行及び実施する1つ以上の特定のマシン実装形態を定義する。
【0333】
電子デバイス及びシステム
更に、本開示の前述の方法のうちのいずれか1つは、1つ以上のコンピュータシステム又は他の形態の装置において実装されてもよい。装置の例としては、コンピュータ、タブレットパーソナルコンピュータ、パーソナルデジタルアシスタント、及び携帯電話が挙げられるが、これらに限定されない。
【0334】
本方法は、1つ以上のプロセッサと、メモリと、1つ以上のプログラムとを含む電子デバイスを提供し、1つ以上のプログラムは、1つ以上のプロセッサによって実行されると、デバイスに、前述の実施形態のうちのいずれか1つに記載の方法を行わせる命令を含む。
【0335】
いくつかの実施形態では、電子デバイスは、1つ以上のディスプレイを更に含み得る。いくつかの実施形態では、電子デバイスは、前述の実施形態のいずれか1つの方法を実施することから生成されたレポートを提示するための1つ以上のディスプレイを含む。
【0336】
いくつかの実施形態では、電子デバイスは、サーバコンピュータ、クライアントコンピュータ、パーソナルコンピュータ、ユーザデバイス、タブレットPC、ラップトップコンピュータ、パーソナルデジタルアシスタント(PDA)、携帯電話、又はその機械によって行われるアクションを指定する、連続的又は別様の命令のセットを実行可能な任意の機械であってもよい。いくつかの実施形態では、電子デバイスは、キーボード及びポインティングデバイス、タッチデバイス、ディスプレイデバイス、並びにネットワークデバイスを更に含み得る。
【0337】
ユーザとの対話を提供するために、本明細書で説明する主題の実装形態は、ユーザに情報を表示するための本明細書で説明するディスプレイデバイスと、仮想又は物理キーボードと、ユーザがコンピュータに入力を提供することができる指、ペンシル、マウス又はトラックボールなどのポインティングデバイスとを有するコンピュータ上で実装され得る。他の種類のデバイスを使用して、ユーザとの対話を提供することもでき、例えば、ユーザに提供されるフィードバックは、視覚フィードバック、聴覚フィードバック、又は触覚フィードバックなどの任意の形態の感覚フィードバックとすることができ、ユーザからの入力は、音響、速度、又は触覚入力を含む任意の形態で受信することができる。
図11は、一実施形態によるコンピューティングデバイス又はシステムの例を例示する。デバイス1100は、ネットワークに接続されたホストコンピュータとすることができる。デバイス1100は、クライアントコンピュータ又はサーバとすることができる。
図11に示されるように、デバイス1100は、パーソナルコンピュータ、ワークステーション、サーバ、又はハンドヘルド計算デバイス(携帯電子デバイス、例えば、電話又はタブレット)などの任意の好適なタイプのマイクロプロセッサベースのデバイスであり得る。デバイスは、例えば、1つ以上のプロセッサ1110、入力デバイス1120、出力デバイス1130、メモリ又は記憶デバイス1140、通信デバイス1160、及び核酸シーケンサー1170を含み得る。メモリ又は記憶デバイス1140に常駐するソフトウェア1150は、例えば、オペレーティングシステム、及び本明細書に説明される方法を実施するためのソフトウェアを含み得る。入力デバイス1120及び出力デバイス1130は、一般に、本明細書に記載のものに対応していてもよく、コンピュータと接続可能であってもよく、又はコンピュータと一体化していてもよい。
【0338】
入力デバイス1120は、タッチスクリーン、キーボード若しくはキーパッド、マウス、又は音声認識デバイスなどの入力を提供する任意の好適なデバイスであってもよい。出力デバイス1130は、タッチスクリーン、触覚デバイス、又はスピーカなど、出力を提供する任意の好適なデバイスであってもよい。
【0339】
ストレージ1140は、ストレージ(例えば、RAM(揮発性及び不揮発性)、キャッシュ、ハードドライブ、又はリムーバブルストレージディスクを含む、電気的、磁気的、又は光学的メモリ)を提供する任意の好適なデバイスであり得る。通信デバイス1160は、ネットワークインターフェースチップ又はデバイスなどのネットワークを介してシグナルを送受信し得る任意の好適なデバイスを含み得る。コンピュータの構成要素は、例えば、有線メディア(例えば、物理システムバス1180、イーサネット接続、若しくは任意の他の有線転送技術)を介して、又は無線(例えば、Bluetooth(登録商標)、Wi-Fi(登録商標)、又は任意の他の無線技術)で、任意の好適な様式で接続することができる。
【0340】
ソフトウェアモジュール1150は、ストレージ1140に実行可能な命令として記憶され、プロセッサ1110によって実行されることができ、例えば、オペレーティングシステム及び/又は本開示の方法の機能を具現化するプロセスを含むことができる(例えば、上記のデバイスに具現化される)。
【0341】
ソフトウェアモジュール1150はまた、命令実行システム、装置、若しくはデバイス(例えば、本明細書に記載のもの)によって、又はそれらと接続して使用するための任意の非一時的コンピュータ可読記憶媒体内に記憶及び/又は転送することができ、命令実行システム、装置、若しくはデバイスからの、ソフトウェアに関連付けられた命令をフェッチし、命令を実行することができる。本開示の文脈において、コンピュータ可読記憶媒体は、ストレージ1140などの任意の媒体であり得、命令実行システム、装置、若しくはデバイスによって、又はそれらと接続して使用するためのプロセスを含む若しくは記憶することができる。コンピュータ可読記憶媒体の例としては、単一の機能ユニットとして動作するハードドライブ、フラッシュドライブ、及び配信モジュールなどのメモリユニットを挙げることができる。また、本明細書に記載の様々なプロセスは、上記の実施形態及び技法に従って動作するように構成されたモジュールとして具現化され得る。更に、プロセスは別個に示され、かつ/又は説明され得るが、当業者は、上記のプロセスが他のプロセス内のルーチン又はモジュールであり得ることを理解するであろう。
【0342】
ソフトウェアモジュール1150はまた、命令実行システム、装置、若しくは上述したものなどのデバイスによって、又はそれらと接続して使用するための任意の伝送媒体内に伝播され得、命令実行システム、装置、若しくはデバイスからの、ソフトウェアに関連付けられた命令をフェッチし、命令を実行し得る。本開示の文脈において、伝送媒体は、任意の媒体とし得、命令実行システム、装置、若しくはデバイスによって、又はそれらと接続して使用するための伝送プログラミングを通信、伝播、又は伝送し得る。伝送可読媒体は、電子、磁気、光学、電磁気、若しくは赤外線の有線又は無線伝播媒体を含み得るが、これらに限定されない。
【0343】
デバイス1100は、任意の好適なタイプの相互接続された通信システムであり得る、ネットワーク(例えば、
図12に示され、及び/又は以下に説明される、ネットワーク1204)に接続され得る。ネットワークは、任意の好適な通信プロトコルを実装し得、任意の好適なセキュリティプロトコルによって保護され得る。ネットワークは、無線ネットワーク接続(T1若しくはT3回線)、ケーブルネットワーク、DSL、又は電話回線などの、ネットワークシグナルの送受信を実装し得る任意の好適な配置のネットワークリンクを含み得る。
【0344】
デバイス1100は、任意のオペレーティングシステム、例えば、ネットワーク上で動作するのに好適なオペレーティングシステムを使用して実装され得る。ソフトウェアモジュール1150は、C、C++、Java、又はPythonなどの任意の好適なプログラミング言語で書くことができる。様々な実施形態では、本開示の機能を具現化するアプリケーションソフトウェアは、異なる構成で(例えば、クライアント/サーバ配置で、又はウェブベースのアプリケーション若しくはウェブサービスとしてのウェブブラウザを介して)展開され得る。いくつかの実施形態では、オペレーティングシステムは、1つ以上のプロセッサ、例えば、プロセッサ1110によって実行される。
【0345】
デバイス1100は、任意の適切な核酸配列決定機器とすることができるシーケンサー1170を更に含むことができる。
【0346】
図12は、一実施形態によるコンピューティングシステムの例を例示する。システム1200では、デバイス1100(例えば、上記に説明され、
図11に例示される)は、ネットワーク1204に接続され、これはまた、デバイス1206にも接続されている。いくつかの実施形態では、デバイス1206は、シーケンサーである。例示的なシーケンサーは、限定されないが、Roche/454のGenome Sequencer(GS)FLX System、Illumina/SolexaのGenome Analyzer(GA)、IlluminaのHiSeq 2500、HiSeq 3000、HiSeq 4000、及びNovaSeq 6000配列決定システム、Life/APGのSupport Oligonucleotide Ligation Detection(SOLiD)システム、PolonatorのG.007システム、Helicos BioSciencesのHeliScope Gene配列決定システム、又はPacific BiosciencesのPacBio RSシステムを含む。
【0347】
デバイス1100及び1206は、例えば、ローカルエリアネットワーク(LAN)、仮想プライベートネットワーク(VPN)、又はインターネットなどのネットワーク1204を介して適切な通信インターフェースを使用して通信することができる。いくつかの実施形態では、ネットワーク1204は、例えば、インターネット、イントラネット、仮想プライベートネットワーク、クラウドネットワーク、有線ネットワーク、又は無線ネットワークとすることができる。デバイス1100及び1206は、イーサネット、IEEE802.11b無線などの無線又は有線通信を介して、部分的又は全体的に通信することができる。追加的に、デバイス1100及び1206は、例えば、好適な通信インターフェースを使用して、モバイル/セルラーネットワークなどの第2のネットワークを介して通信することができる。デバイス1100と1206との間の通信は、メールサーバ、モバイルサーバ、メディアサーバ、電話サーバなどの様々なサーバを更に含むか、それらと通信することができる。いくつかの実施形態では、デバイス1100及び1206は、(ネットワーク1204を介した通信の代わりに、又はそれに加えて)、例えば、イーサネット、IEEE802.11b無線などの無線又は有線通信を介して、直接通信することができる。いくつかの実施形態では、デバイス1100及び1206は、直接接続とすることができるか、又はネットワーク(例えば、ネットワーク1204)を介して発生することができる通信1208を介して通信する。
【0348】
デバイス1100及び1206のうちの一方又は全ては、一般に、本明細書に説明される様々な例に従ってネットワーク1204を介して情報を提供及び/又は受信するために、ローカル若しくはリモートのデータベース又は他のデータ及びコンテンツのソースからアクセスされる論理(例えば、httpウェブサーバロジック)を含むか、又はデータをフォーマットするようにプログラムされる。
【0349】
本開示及び実施例は、添付の図面を参照して十分に説明されているが、様々な変形及び変更が当業者にとって明らかになることに留意されたい。そのような変形及び変更は、特許請求の範囲によって定義される本開示及び例の範囲内に含まれると理解されるべきである。
【実施例】
【0350】
以下の実施例は、提供される実施形態を例示するために提供され、本開示の範囲を限定することは意図されない。
【0351】
実施例1:参照方法と比較した、コピー数変化を決定する際の本明細書に記載の方法の優れた精度
この実施例は、当技術分野における以前の方法と比較して、試料におけるコピー数変化を決定するために、本明細書に記載される方法を使用することを目的とするプロジェクトを例示する。
【0352】
特に、このプロジェクトは、方法の優位性を評価するための基準としてゲノムワイドヘテロ接合性喪失(gLOH)を推定する際に、精度又は安定性、すなわち、測定値が互いにどれほど近いかに焦点を当てる。
【0353】
材料
この実施例では、表1に示される合計8つの試料を使用して、一部の以前のモデルと比較して、本開示のモデルを使用してgLOHスコア及びコピー数推定を評価した。
【表1】
【0354】
これらの中で、試料No.1、No.2及びNo.4は、5つの異なるレベルの腫瘍純度を有していた。20%、25%、30%、40%、50%の試料No.3は、6つの異なるレベルの腫瘍純度を有していた。20%、25%、30%、35%、40%、50%の試料No.5は、5つの異なるレベルの腫瘍純度を有していた。5%、7%、10%、20%、30%の試料No.6は、5つの異なるレベルの腫瘍純度を有していた。20%、25%、30%、35%、40%、並びに試料No.7及びNo.8は、1つの腫瘍純度レベルを有した。
【0355】
各腫瘍純度レベルについて、約10~20回の反復実験を行った。これは、試料No.1、No.2、No.3、No.4、No.5、No.6について合計約50~100回の反復、及び試料No.7及びNo.8について約20回の反復をもたらした。インビトロ診断(IVD)アッセイは完全に精密ではあり得なかったため、いくらかの変動性が予想されたが、全ての再現された結果は、それらが正確に同じ試料からのものであったため、類似のgLOHスコア及びCNAを有することが予想された。
【0356】
結果
gLOHスコア推定の精度を、本開示のモデルと、Gibbsモデル(例えば、Sun et al.(2018)、同書を参照されたい)、モデルのファミリーからのグリッドベースの選択に基づく改善されたモデル(例えば、Sun et al.(2018)、同書;及びVan Loo et al.「Allele-Specific Copy Number Analysis of Tumors」、Van Loo,et al.“Allele-Specific Copy Number Analysis of Tumors”,Proc Natl Acad Sci USA 2010 107(39):16910-5)を参照されたい)、Rookieモデル(内部で開発された確率的CNAコーラー)、L0モデル(例えば、Van Loo et al.(2010)、同書を参照されたい)、L1モデル(例えば、Van Loo et al.(2010)、同書を参照されたい)、及びL2モデル(例えば、Van Loo et al.(2010)、同書を参照されたい)を含む6つの参照モデルとの間で比較した。異なるモデルについてのgLOHスコア推定性能を
図13~
図20に示す。L3モデル及びL4モデル(例えば、Van Loo,et al.(2010)、同書を参照されたい)は、これらの2つのモデルが、複製物の大部分について、特に試料No.2、No.7、及びNo.8について、CNA推定値を提供しなかったので、本明細書中の比較に含まれなかった。
【0357】
図13の試料No.1及び
図14のNo.2について、本明細書に記載されるモデルのgLOHスコア推定は、本明細書に記載されるモデルが各標的純度内でより小さい分散及び異なる標的純度にわたってより一貫したgLOHスコア推定を有したため、6つの参照モデルよりも精密であった。
【0358】
図15の試料No.3、
図16の試料No.4、
図18の試料No.6、
図19の試料No.7、及び
図20の試料No.8について、本明細書に記載されるモデルのgLOHスコア推定は、ギブズモデル及び改良モデルと同程度に精密であった。
図17の試料No.5に関して、本明細書に記載のモデルは、純度が高い場合、例えば、純度20%及び30%で良好に機能した。重要なことに、本明細書に記載されるモデルと比較して、6つ全ての参照モデルは、推定されたgLOHスコア0によって示されるように、純度が低い場合、例えば、5%及び7%の純度で、かなり悪く機能した。更に、8つの試料のgLOHスコアのパーセント変動係数(%CV)を、表2及び
図21にまとめる。
図21から、本明細書に記載されるモデルの%CVが他の競合物よりもはるかに小さいことが示され、これは、本明細書に記載されるモデルのgLOHスコア推定が6つの参照モデルのものよりもはるかに精密であることを示唆する。
【表2】
【0359】
試料No.2について、参照モデルのgLOHスコア推定の精度は、推定されたgLOHスコアが、例えば、20%~50%で、異なる標的純度にわたって大きすぎる分散を示したため、極めて望ましくなかった。これは、参照モデルのコピー数推定値が不安定であるためであった。
【0360】
異なる標的純度及びモデルにわたるベイト標的3000~3500の平均推定コピー数についてボックスプロットを作成した。
図22では、本明細書に記載されるモデルの安定なgLOHスコアは、異なる標的純度にわたる安定なコピー数推定に起因することが見出されている。対照的に、その識別不能なモデリングが不安定な推定コピー数をもたらしたGibbsモデル及びRookieなどの参照モデルについては、例えば、ベイト標的3000~3500にわたる平均コピー数は、標的純度20%及び30%で約2であったが、Gibbsモデルについては標的純度50%で4に増加し、最終的に不安定なgLOHスコアをもたらした。試料No.1についても同様の不安定なパターンが見られた。
【0361】
最後に、本明細書に記載されるモデルと参照モデル、特にギブズモデルとの間で計算効率を比較した。表3に示されるように、本明細書中に記載されるモデルについての計算時間は、当該分野で概して使用される2つの方法であるGibbs及びRookieよりも少なくとも76倍短い(すなわち、計算コストは76倍安く、又は計算効率は76倍高い)。L0、L1、及びL2の計算コストは、Gibbs及びRookieほど高価ではないが、それらのgLOHスコア推定は、極めて不安定であり、したがって、望ましくないことが示される。
【表3】
【0362】
総括すると、この実施例は、本開示の成功した実装形態を実証するものである。重要なことに、本明細書に記載の方法は、ゲノムワイドヘテロ接合性喪失(gLOH)の推定において、当技術分野における一部の参照方法よりも優れた精度/安定性を示した。重要なことに、本明細書に記載される方法はまた、当技術分野における方法と比較して計算的により効率的であることが示され、コピー数変化を同定するための他の方法を超える進歩を提供する。
【0363】
実施例2:参照方法と比較した、コピー数変化を決定する際の本明細書に記載の方法の優れた精度
本実施例は、当技術分野における以前の方法と比較して、試料中のコピー数変化を決定するために本明細書に記載される方法を使用することを目的とする別のプロジェクトを例示する。
【0364】
特に、このプロジェクトは、方法の優位性を評価するための基準として、ゲノムワイドヘテロ接合性喪失(gLOH)を推定する際の精度(すなわち、測定値が真の値にどれほど近いか)に焦点を当てる。
【0365】
材料
相同組換え欠損(HRD)は、細胞が、二本鎖切断を修復するためのプロセスである相同性媒介性組換えを受けることができない表現型である。HRDは、概して、BRCA1及びBRCA2などの遺伝子における機能変化の喪失によって引き起こされる。BRCA1及びBRCA2二対立遺伝子不活性化は、試料中の野生型対立遺伝子のLOH、ホモ接合性欠失、又は2つ以上のBRCA1若しくはBRCA2変化を有する変異として定義された。このプロジェクトでは、本明細書に記載されるモデルと改善されたモデルとの間でBRCA1及びBRCA2二対立遺伝子不活性化の分類性能を比較することによって、gLOHスコア精度を評価した。具体的には、BRCA1及びBRCA2二対立遺伝子不活性化を、改善モデルからの推定コピー数に基づいて定義した。合計21010個の試料が含まれ、1353個の試料は卵巣がんを有し、2237個の試料は乳がんを有し、869個の試料は前立腺がんを有し、1421個の試料は膵臓がんを有し、15130個の試料は他のタイプのがんを有していた。
【0366】
結果
各がんタイプについて、gLOHスコアの閾値として0.16を使用して、感受性及び特異性を計算した。表4は、本明細書に記載されるモデルの感度及び特異度の合計が、前立腺がん及び他のがんタイプにおいて改善されたモデルの感度及び特異度の合計よりも大きく、全体的ながんタイプについて同じであることを示す。
【0367】
しかしながら、BRCA1及びBRCA2二対立遺伝子不活性化は、改良モデルからの推定コピー数によって定義された。したがって、改善されたモデルの精度、すなわち、感度及び特異性は過大評価された。更に、本明細書に記載のモデルの精度は、BRCA1及びBRCA2二対立遺伝子不活性化が改良モデルに有利であったとしても、改良モデルと同様であり、これは、本明細書に記載のモデルが少なくとも改良モデルと同程度に正確であることを示唆している。
【表4】
【0368】
まとめると、この例は、本開示の別の成功した実装形態を実証する。この例として、本明細書に記載の方法は、当技術分野における一部の参照方法に対して、ゲノムワイドヘテロ接合性喪失(gLOH)の推定において優れた精度を示した。
【0369】
例示的な実施態様
本明細書に説明される方法及びシステムの例示的な実施態様は、以下を含む。
1.対象由来の試料のゲノム中の標的ゲノムセグメントのコピー数を決定するための方法であって、
試料から取得された複数の核酸分子を提供することと、
1つ以上のアダプターを複数の核酸分子からの1つ以上の核酸分子上にライゲーションすることと、
複数の核酸分子からの1つ以上のライゲーションされた核酸分子を増幅することと、
増幅された核酸分子から増幅された核酸分子を捕捉することと、
シーケンサーを 使用して、捕捉された核酸分子を表す複数の配列リードを取得するために捕捉された核酸分子を配列決定することであって、複数の配列リードのうちの1つ以上は、試料のゲノム中の複数のゲノムセグメントと重複する、配列決定することと、
コンピュータシステムの1つ以上のプロセッサを使用して、試料のゲノム中の複数のゲノムセグメントについての複数の配列決定深度シグナルを取得することであって、配列決定深度シグナルは、ゲノムセグメント中の遺伝子座にアラインメントされた配列リードの数に関連付けられ、複数のゲノムセグメントは、標的ゲノムセグメントを含む、取得することと、
1つ以上のプロセッサを使用して、複数のゲノムセグメントについて、複数の配列決定深度シグナルから第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントを決定することと、
1つ以上のプロセッサを使用して、第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントから試料の腫瘍純度及び腫瘍倍数性を決定することと、
標的ゲノムセグメントについての複数の配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性を使用して、試料のゲノム中の標的ゲノムセグメントのコピー数を決定することと、
コンピュータシステムによって、決定されたコピー数に基づいて試料についてのゲノムプロファイルを生成することと、を含む、方法。
2.対象は、がんを有する疑いがあるか、又はがんを有すると判定される、条項1に記載の方法。
3.対象から試料を取得することを更に含む、条項1又は条項2に記載の方法。
4.試料は、組織生検試料、液体生検試料、又は正常対照を含む、条項1~3のいずれか一項に記載の方法。
5.試料は、液体生検試料であり、かつ血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含む、条項4に記載の方法。
6.試料は、液体生検試料であり、かつ循環腫瘍細胞(CTC)を含む、条項4に記載の方法。
7.試料は、液体生検試料であり、かつ無細胞DNA(cfDNA)、循環腫瘍DNA(ctDNA)、又はそれらの任意の組み合わせを含む、条項4に記載の方法。
8.複数の核酸分子は、腫瘍核酸分子と非腫瘍核酸分子との混合物を含む、条項1~7のいずれか一項に記載の方法。
9.腫瘍核酸分子は、不均質組織生検試料の腫瘍部分に由来し、かつ非腫瘍核酸分子は、不均質組織生検試料の正常部分に由来する、条項8に記載の方法。
10.試料は、液体生検試料を含み、腫瘍核酸分子は、液体生検試料の循環腫瘍DNA(ctDNA)画分に由来し、非腫瘍核酸分子は、液体生検試料の非腫瘍無細胞DNA(cfDNA)画分に由来する、条項8に記載の方法。
11.1つ以上のアダプターは、増幅プライマー、フローセルアダプター配列、基質アダプター配列、又は試料インデックス配列を含む、条項1~10のいずれか一項に記載の方法。
12.捕捉された核酸分子は、1つ以上のベイト分子へのハイブリダイゼーションによって増幅された核酸分子から捕捉される、条項1~11のいずれか一項に記載の方法。
13.1つ以上のベイト分子は、1つ以上の核酸分子を含み、各核酸分子は、捕捉された核酸分子の領域に相補的な領域を含む、条項12に記載の方法。
14.核酸分子を増幅することは、ポリメラーゼ連鎖反応(PCR)増幅技術、非PCR増幅技術、又は等温増幅技術を実施することを含む、条項1~13のいずれか一項に記載の方法。
15.配列決定は、超並列配列決定(MPS)技術、全ゲノム配列決定(WGS)、全エクソーム配列決定、標的配列決定、直接配列決定、又はサンガー配列決定技術の使用を含む、条項1~14のいずれか一項に記載の方法。
16.配列決定は、超並列配列決定を含み、超並列配列決定技術は、次世代配列決定(NGS)を含む、条項15に記載の方法。
17.シーケンサーは、次世代シーケンサーを含む、条項1~16のいずれか一項に記載の方法。
18.1つ以上のプロセッサによって、決定された腫瘍純度、腫瘍倍数性、標的ゲノムセグメントのコピー数、試料についてのゲノムプロファイル、又はこれらの任意の組み合わせを含むレポートを生成することを更に含む、条項1~17のいずれか一項に記載の方法。
19.レポートをヘルスケア提供者に送信することを更に含む、条項18に記載の方法。
20.レポートは、コンピュータネットワーク又はピアツーピア接続を介して送信される、条項19に記載の方法。
21.対象由来の試料のゲノム中の標的ゲノムセグメントのコピー数を決定するための方法であって、
コンピュータシステムの1つ以上のプロセッサを使用して、試料のゲノム中の複数のゲノムセグメントについての複数の配列決定深度シグナルを取得することであって、配列決定深度シグナルは、ゲノムセグメント中の遺伝子座にアラインメントされた配列リードの数に関連付けられ、複数のゲノムセグメントは、標的ゲノムセグメントを含む、取得することと、
1つ以上のプロセッサを使用して、複数のゲノムセグメントについて、複数の配列決定深度シグナルから第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントを決定することと、
1つ以上のプロセッサを使用して、第1の統計モーメント、第2の統計モーメント、及び第3の統計モーメントから試料の腫瘍純度及び腫瘍倍数性を決定することと、
標的ゲノムセグメントについての複数の配列決定深度シグナル、腫瘍純度、及び腫瘍倍数性を使用して、試料のゲノム中の標的ゲノムセグメントのコピー数を決定することと、
コンピュータシステムによって、決定されたコピー数に基づいて試料についてのゲノムプロファイルを生成することと、を含む、方法。
22.試料の複数の配列決定深度シグナルは、プロセス一致対照を使用して正規化される、条項21に記載の方法。
23.ゲノムをセグメント化して、複数のゲノムセグメントを生成することを更に含む、条項21又は条項22に記載の方法。
24.ゲノムは、複数の配列決定深度シグナルに基づいてセグメント化される、条項23に記載の方法。
25.ゲノムは、循環バイナリセグメント化(CBS)法を使用してセグメント化される、条項23又は24に記載の方法。
26.腫瘍純度及び腫瘍倍数性を決定することは、非線形方程式のセットを解くことを含む、条項21~25のいずれか一項に記載の方法。
27.試料の核酸を配列決定して、試料に由来する配列リードを生成することを更に含む、条項21~26のいずれか一項に記載の方法。
28.試料に由来する配列リードは、超並列配列決定を使用して試料の核酸を配列決定することによって生成される、条項21~27のいずれか一項に記載の方法。
29.超並列配列決定は、次世代配列決定(NGS)を含む、条項28に記載の方法。
30.試料は、肺がん、結腸がん、卵巣がん、乳がん、前立腺がん、及び/又は膵臓がんを有する個体に由来する、条項21~29のいずれか一項に記載の方法。
31.標的ゲノムセグメントは、目的の遺伝子を含む、条項21~30のいずれか一項に記載の方法。
32.目的の遺伝子は、ホスファターゼ及びテンシンホモログ(PTEN)遺伝子、乳がん1(BRCA1)遺伝子、又は乳がん2(BRCA2)遺伝子である、条項31に記載の方法。
33.目的の遺伝子は、腫瘍形成遺伝子又は細胞形質転換遺伝子である、条項31に記載の方法。
34.腫瘍形成遺伝子又は細胞形質転換遺伝子は、MLL融合遺伝子、BCR-ABL、TEL-AML I、EWS-FL11、TLS-FUS、PAX3-FKHR、Bcl-2、AML1-ETO、AML1-MTG8、Ras、Fos PDGF、RET、APC、NF-1、Rb、p53、又はMDM2を含む、条項33に記載の方法。
35.目的の遺伝子は、過剰発現した遺伝子である、条項31に記載の方法。
36.過剰発現した遺伝子は、多剤耐性遺伝子、サイクリン遺伝子、β-カテニン遺伝子、テロメラーゼ遺伝子;c-myc、n-myc、Bel-2、Erb-B1、Erb-B2、変異Ras遺伝子、変異Mos遺伝子、変異Raf遺伝子、又は変異Met遺伝子である、条項35に記載の方法。
37.目的の遺伝子は、腫瘍抑制遺伝子である、条項31に記載の方法。
38.腫瘍抑制遺伝子は、p53、p21、RB1、WTI、NF1、VHL、APC、DAPキナーゼ、p16、ARF、ニューロフィブロミン、又はPTENである、条項37に記載の方法。
39.標的ゲノムセグメントのコピー数を含むデータセットを生成するための方法であって、コピー数は、条項21~38のいずれか一項に記載の方法によって決定される、方法。
40.標的ゲノムセグメントの決定されたコピー数に基づいて、試料中の標的ゲノムセグメントのコピー数変化(CNA)を決定することを更に含む、条項21~39のいずれか一項に記載の方法。
41.試料中のゲノムセグメントのコピー数変化(CNA)を決定することは、
a)標的ゲノムセグメントの決定されたコピー数を、標的ゲノムセグメントの参照コピー数と比較することと、
b)標的ゲノムセグメントの決定されたコピー数と参照コピー数との間の差の存在によって、比較からコピー数変化(CNA)を決定することと、を含む、条項40に記載の方法。
42.決定されたコピー数変化(CNA)を医学的診断及び/又は処置におけるバイオマーカーとして使用することを更に含む、条項40又は条項41に記載の方法。
43.決定されたコピー数は、標的ゲノムセグメントのマイナー対立遺伝子のコピー数である、条項40~42のいずれか一項に記載の方法。
44.標的ゲノムセグメントのマイナー対立遺伝子のコピー数を決定することと、標的ゲノムセグメントのマイナー対立遺伝子のヘテロ接合性の喪失(LOH)を決定することと、を更に含む、条項21~43のいずれか一項に記載の方法。
45.標的ゲノムセグメントのマイナー対立遺伝子のヘテロ接合性の喪失(LOH)を決定することは、
a)0より大きく、かつ決定された腫瘍倍数性と2の和より小さい、標的ゲノムセグメントの決定されたコピー数の存在を決定することと、
b)a)の決定された存在に基づいて、
1)1に等しい、標的ゲノムセグメントの決定されたコピー数、
2)標的ゲノムセグメントの決定されたマイナー対立遺伝子コピー数に等しい、標的ゲノムセグメントの決定されたコピー数、又は
3)0に等しい、標的ゲノムセグメントの決定されたマイナー対立遺伝子コピー数、のうちのいずれか1つの存在によってヘテロ接合性の喪失(LOH)を決定することと、を含む、条項44に記載の方法。
46.ゲノムワイドLOH(gLOH)パーセンテージスコアを、LOHセグメントの長さの合計を全ゲノムの長さで除算したものとして決定することを更に含む、条項44又は条項45に記載の方法。
47.ヘテロ接合性の喪失(LOH)を相同組換え欠損(HRD)のバイオマーカーとして使用することを更に含む、条項44~46のいずれか一項に記載の方法。
48.決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性に基づいて、試料の腫瘍変異負荷(TMB)を決定することを更に含む、条項21~47のいずれか一項に記載の方法。
49.腫瘍変異負荷(TMB)を決定することは、
a)試料の複数の配列決定深度シグナルから複数の遺伝的バリアントを取得することと、
b)複数の遺伝的バリアントを、決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性と一緒に、体細胞起源のものである複数の遺伝的バリアントを決定及び出力するように構成されたモデルに入力することと、
c)モデルの出力に基づいて、ゲノムの100万塩基対当たりの体細胞起源の遺伝的バリアントの数を計算することによって、試料の腫瘍変異負荷(TMB)を決定することと、を含む、条項48に記載の方法。
50.決定された腫瘍変異負荷(TMB)を医学的診断及び/又は処置におけるバイオマーカーとして使用することを更に含む、条項48又は条項49に記載の方法。
51.決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性に基づいて、試料中の遺伝的バリアントの変異状態を特徴付けることを更に含む、条項21~50のいずれか一項に記載の方法。
52.遺伝的バリアントの変異状態を特徴付けることは、
a)試料の複数の配列決定深度シグナルから遺伝的バリアントを取得することと、
b)遺伝的バリアントの変異状態を決定するように構成されたモデルを取得することと、
c)遺伝的バリアントを、決定されたコピー数、決定された腫瘍純度、及び/又は決定された腫瘍倍数性と一緒にモデルに入力し、遺伝的バリアントの変異状態を出力することによって、遺伝的バリアントの変異状態を特徴付けることと、を含む、条項51に記載の方法。
53.遺伝的バリアントの変異状態は、体細胞起源若しくは生殖細胞系起源、ホモ接合性状態若しくはヘテロ接合性状態、サブクローナル状態、又はそれらの組み合わせである、条項51又は条項52に記載の方法。
54.試料のゲノムプロファイルは、対象における疾患を診断するか、又はその診断を確認するために使用される、条項21~53のいずれか一項に記載の方法。
55.疾患は、がんである、条項54に記載の方法。
56.試料のゲノムプロファイルに基づいて、対象に投与するための抗がん治療を選択することを更に含む、条項55に記載の方法。
57.試料のゲノムプロファイルに基づいて、対象に投与する抗がん治療の有効量を決定することを更に含む、条項56に記載の方法。
58.対象に抗がん治療を施すことを更に含む、条項56又は条項57に記載の方法。
59.抗がん治療は、化学治療、放射線治療、免疫治療、標的治療、又は外科手術を含む、条項56~58のいずれか一項に記載の方法。
60.がんは、B細胞がん(多発性骨髄腫)、黒色腫、乳がん、肺がん、気管支がん、結腸直腸がん、前立腺がん、膵臓がん、胃がん、卵巣がん、膀胱がん、脳がん、中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮頸部がん、子宮内膜がん、口腔のがん、咽頭のがん、肝臓がん、腎臓がん、精巣がん、胆道がん、小腸がん、虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫、消化管間質腫瘍(GIST)、結腸がん、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性障害(MPD)、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、慢性リンパ性白血病(CLL)、真性赤血球増加症、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ血管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭状がん、乳頭腺がん、髄様がん、気管支原性がん、腎細胞がん、肝がん、胆管がん、絨毛がん、精上皮がん、胎児性がん、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体細胞腫、血管芽細胞腫、聴神経芽腫、乏突起膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、原発性骨髄線維症、好酸球増加症候群、全身性肥満細胞症、家族性好酸球増加症、慢性好酸球性白血病、神経内分泌がん、又はカルチノイド腫瘍である、条項55~59のいずれか一項に記載の方法。
61.がんを有する個体に対する処置を選択するための方法であって、
a)個体由来の試料中のコピー数変化(CNA)を決定することであって、CNAは、条項40~43のいずれか一項に記載の方法に従って決定される、決定することと、
b)決定されたCNAをバイオマーカーとして使用して、1つ以上の処置選択肢に対する個体の応答を予測することと、
c)予測された応答に基づいて、1つ以上の処置選択肢から個体に適した処置を選択することと、を含む、方法。
62.がんを有する個体に対する処置を選択するための方法であって、
a)個体由来の試料中のヘテロ接合性の喪失(LOH)を決定することであって、LOHは、条項44~47のいずれか一項に記載の方法に従って決定される、決定することと、
b)決定されたLOHをバイオマーカーとして使用して、1つ以上の処置選択肢に対する個体の応答を予測することと、
c)予測された応答に基づいて、1つ以上の処置選択肢から個体に適した処置を選択することと、を含む、方法。
63.がんを有する個体に対する処置を選択するための方法であって、
個体由来の試料中の腫瘍変異負荷(TMB)を決定することであって、TMBは、条項48~50のいずれか一項に記載の方法に従って決定される、決定することと、
決定されたTMBをバイオマーカーとして使用して、1つ以上の処置選択肢に対する個体の応答を予測することと
予測された応答に基づいて、1つ以上の処置選択肢から、個体に適した処置を選択することと、を含む、方法。
64.がんを有する個体に対する処置を選択するための方法であって、
個体由来の試料中の遺伝的バリアントの変異状態を特徴付けることであって、変異状態は、条項51~53のいずれか一項に記載の方法に従って特徴付けられる、特徴付けることと、
遺伝的バリアントの特徴付けられた変異状態に基づいて、1つ以上の処置選択肢に対する個体の応答を予測することと、
予測された応答に基づいて、1つ以上の処置選択肢から、個体に適した処置を選択することと、を含む、方法。
65.遺伝的バリアントの変異状態は、体細胞又は生殖細胞系である遺伝的バリアントの起源である、条項64に記載の方法。
66.選択された処置を個体に投与することを更に含む、条項61~65のいずれか一項に記載の方法。
67.がんは、B細胞がん(多発性骨髄腫)、黒色腫、乳がん、肺がん、気管支がん、結腸直腸がん、前立腺がん、膵臓がん、胃がん、卵巣がん、膀胱がん、脳がん、中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮頸部がん、子宮内膜がん、口腔のがん、咽頭のがん、肝臓がん、腎臓がん、精巣がん、胆道がん、小腸がん、虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫、消化管間質腫瘍(GIST)、結腸がん、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性障害(MPD)、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、慢性リンパ性白血病(CLL)、真性赤血球増加症、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ血管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭状がん、乳頭腺がん、髄様がん、気管支原性がん、腎細胞がん、肝がん、胆管がん、絨毛がん、精上皮がん、胎児性がん、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体細胞腫、血管芽細胞腫、聴神経芽腫、乏突起膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、原発性骨髄線維症、好酸球増加症候群、全身性肥満細胞症、家族性好酸球増加症、慢性好酸球性白血病、神経内分泌がん、又はカルチノイド腫瘍である、条項61~66のいずれか一項に記載の方法。
68.試料は、組織生検試料、液体生検試料、又は正常対照を含む、条項61~67のいずれか一項に記載の方法。
69.試料は、液体生検試料であり、かつ血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含む、条項68に記載の方法。
70.試料は、液体生検試料であり、かつ循環腫瘍細胞(CTC)を含む、条項68に記載の方法。
71.試料は、液体生検試料であり、かつ無細胞DNA(cfDNA)、循環腫瘍DNA(ctDNA)、又はそれらの任意の組み合わせを含む、条項68に記載の方法。
72.選択された処置は、薬物投与、化学治療、放射線治療、免疫治療、標的治療、遺伝子治療、外科手術、又はそれらの任意の組み合わせを含む、条項61~71のいずれか一項に記載の方法。
73.選択された処置は、チェックポイント阻害剤を個体に投与することを含む、条項61~72のいずれか一項に記載の方法。
74.処置を選択する方法からレポートを生成又は更新することを更に含む、条項61~73のいずれか一項に記載の方法。
75.レポートを個体又は臨床医に送信することを更に含む、条項74に記載の方法。
76.レポートを非一時的コンピュータ可読記憶媒体に記憶することを更に含む、条項74又は条項75に記載の方法。
77.レポートをコンピュータディスプレイ上に表示することを更に含む、条項74~76のいずれか一項に記載の方法。
78.デバイスの1つ以上のプロセッサによって実行される1つ以上のプログラムを含む非一時的コンピュータ可読記憶媒体であって、1つ以上のプログラムは、1つ以上のプロセッサによって実行された場合、条項1~77のいずれか一項に記載の方法をデバイスに実施させる命令を含む、非一時的コンピュータ可読記憶媒体。
79.条項21~77のいずれか一項に記載の方法を実施することから生成されたレポートを含む、非一時的コンピュータ可読記憶媒体。
80.1つ以上のプロセッサと、1つ以上のプロセッサに通信可能に結合され、1つ以上のプロセッサによって実行されると、電子デバイス(又はシステム)に条項1~77のいずれか一項に記載の方法を実施させる命令を記憶するように構成されたメモリと、を備える、電子デバイス(又はシステム)。
81.条項21~77のいずれか一項の方法を実施することから生成されたレポートを提示するための1つ以上のディスプレイを更に備える、条項79の電子デバイス(又はシステム)。
【0370】
以上から、開示される方法及びシステムの特定の実施態様が例示及び説明されたが、様々な修正がそれらになされ得、本明細書で企図されることが理解されるべきである。本明細書内に提供される特定の例によって本発明が限定されることも意図していない。本発明は、上述の明細書を参照して説明されたが、本明細書の好ましい実施形態の説明及び例示は、限定の意味で解釈されることを意味していない。更に、本発明の全ての態様は、様々な条件及び変数に依存する、本明細書に記載された特定の描写、構成、又は相対的割合に限定されないことを理解されたい。本発明の実施形態の形態及び詳細に置ける様々な修正が当業者にとって明らかであろう。したがって、本発明はまた、任意のそのような修正例、変形例、及び均等物も包含するものと企図される。
【国際調査報告】