(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-15
(54)【発明の名称】治療を選択し、予想される治療転帰を判定するための木ベースのモデル
(51)【国際特許分類】
G16B 40/00 20190101AFI20231208BHJP
C12Q 1/6883 20180101ALN20231208BHJP
C12Q 1/6886 20180101ALN20231208BHJP
【FI】
G16B40/00
C12Q1/6883 Z
C12Q1/6886 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023533926
(86)(22)【出願日】2021-12-02
(85)【翻訳文提出日】2023-06-02
(86)【国際出願番号】 US2021061647
(87)【国際公開番号】W WO2022120075
(87)【国際公開日】2022-06-09
(32)【優先日】2020-12-03
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】517192663
【氏名又は名称】ファウンデーション・メディシン・インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】コメント, リア
(72)【発明者】
【氏名】パルミジャーニ, ジョヴァンニ
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA07
4B063QA19
4B063QQ02
4B063QQ42
4B063QQ58
4B063QR08
4B063QR62
4B063QS25
(57)【要約】
本明細書では、対象を治療するときに予想される疾患治療転帰を判定するための方法及びシステム、対象の治療オプションを選択するための方法及びデバイス、並びに対象の疾患を治療する方法について説明する。方法は、対象についての複数の対象特性を受信することと、疾患についての治療オプションに対応する木ベースのモデルにアクセスすることであって、木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションを用いて治療された場合の予想される治療転帰を判定することと、を含むことができる。
【特許請求の範囲】
【請求項1】
方法であって、
疾患を有する対象からの試料から取得された複数の核酸分子を提供することと、
1つ以上のアダプターを前記複数の核酸分子からの1つ以上の核酸分子上にライゲーションすることと、
前記複数の核酸分子から前記1つ以上のライゲーションされた核酸分子を増幅することと、
前記増幅された核酸分子から増幅された核酸分子を捕捉することと、
シーケンサーによって、前記捕捉された核酸分子を配列決定して、前記捕捉された核酸分子を表す複数の配列読み取り値を取得することと、
1つ以上のプロセッサによって、前記配列読み取り値に基づく配列読み取り値分析データを含むゲノムプロファイルを生成することと、
前記1つ以上のプロセッサを使用して、前記配列読み取り値分析データに基づく1つ以上の遺伝子座についてのバイオマーカ値を含む対象特性を識別することと、
1つ以上のプロセッサにおいて、前記対象についての複数の追加の対象特性を受信することと、
前記1つ以上のプロセッサを使用して、前記疾患についての治療オプションに対応する木ベースのモデルにアクセスすることであって、前記木ベースのモデルが、複数の以前の患者の特性及び前記対応する治療オプションについての関連付けられた治療転帰に基づいて生成される、アクセスすることと、
前記1つ以上のプロセッサを使用して、前記複数の対象特性及び前記木ベースのモデルから、前記対象が前記対応する治療オプションを用いて治療されることを条件として、前記対象についての予想される治療転帰を判定することと、を含む、方法。
【請求項2】
前記予想される治療転帰を判定することが、前記複数の対象特性と前記複数の以前の患者の特性との間の共通性に基づいて、各木ベースのモデルにおける複数のノードに重み付けすることを含む、請求項1に記載の方法。
【請求項3】
各木ベースのモデルが、木ベースの回帰モデルである、請求項1又は2に記載の方法。
【請求項4】
各木ベースのモデルが、アンサンブル木モデルである、請求項1~3のいずれか一項に記載の方法。
【請求項5】
各木ベースのモデルが、ベイズ加法型回帰木モデルである、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記複数の以前の患者の少なくとも第1の部分についての前記治療転帰が、1回以上の臨床試験の間に判定された治療転帰である、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記複数の以前の患者の少なくとも第1の部分についての前記治療転帰が、1回以上の臨床試験の間に判定された治療転帰である、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記複数の以前の患者の前記第1の部分についての前記治療転帰が、複数の臨床試験の間に判定された治療転帰である、請求項7に記載の方法。
【請求項9】
前記複数の以前の患者の少なくとも第2の部分についての前記治療転帰が、臨床試験以外で判定された治療転帰である、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記木ベースのモデルの少なくとも一部分が、臨床試験以外で判定された治療転帰を有する1人以上の追加の以前の患者についての複数の特性を用いて再判定される、請求項9に記載の方法。
【請求項11】
前記木ベースのモデルの少なくとも一部分が、
臨床試験以外で判定された以前の患者からのデータを使用して適合され、
臨床試験の間に判定された以前の患者からのデータを使用して判定された複数のノードを含む、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記木ベースのモデルの少なくとも一部分が、臨床試験の間に判定された以前の患者からの少なくともデータを使用して更に適合される、請求項11に記載の方法。
【請求項13】
前記治療転帰及び前記予想される治療転帰が、全生存期間、無憎悪生存期間、腫瘍反応、前記対象におけるctDNAレベルの変化、疾患寛解、又は治療に対する抵抗についての治療転帰である、請求項1~12のいずれか一項に記載の方法。
【請求項14】
前記予想される治療転帰が、予想される治療転帰尤度の分布である、請求項1~13のいずれか一項に記載の方法。
【請求項15】
前記予想される治療転帰が、複数の期間についての予想される治療転帰尤度の分布である、請求項14に記載の方法。
【請求項16】
前記複数の対象特性が、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症、以前の療法のリスト、ベースラインctDNA値、診療所環境、又は全身状態のうちの1つ以上を含み、
前記複数の以前の患者の特性が、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症、以前の療法のリスト、ベースラインctDNA値、診療所環境、又は全身状態のうちの1つ以上を含み、
前記複数の対象特性の少なくとも一部分が、前記以前の患者の少なくとも一部分についての前記複数の以前の患者の特性の少なくとも一部分と同じタイプの特性である、請求項1~15のいずれか一項に記載の方法。
【請求項17】
前記複数の対象特性及び前記複数の患者特性についての前記以前の療法のリストが、各以前の療法に費やされた時間のリストを含む、請求項16に記載の方法。
【請求項18】
前記複数の対象特性及び前記複数の患者特性についての前記診療所環境が、学術環境又は社会環境として分類される、請求項16又は17に記載の方法。
【請求項19】
前記共存症が、糖尿病又は心臓病である、請求項16~18のいずれか一項記載の方法。
【請求項20】
前記複数の対象特性及び前記複数の患者特性についての前記バイオマーカ値が、EGFRバリアント状態、NTRKバリアント状態、RETバリアント状態、ALK再構成バリアント状態、腫瘍突然変異負荷量(TMB)、HLAヘテロ接合性消失(LOH)状態、バリアントの生殖系列状態、バリアントの体細胞状態、マイクロサテライト不安定性(MSI)状態、相同組換え修復欠損(HRD)状態、全ゲノムヘテロ接合性消失(gLOH)状態、コピー数変化(CNA)状態、PD-L1発現レベル状態、ホルモン受容体状態、PSA発現レベル状態、又はPSA発現レベル増加率である、請求項1~19のいずれか一項に記載の方法。
【請求項21】
前記木ベースのモデルが、以前の予測分布からのドローに少なくとも部分的に基づいて投入される、請求項1~20のいずれか一項に記載の方法。
【請求項22】
前記木ベースのモデルが、所定の以前の分布又はデータによって通知される以前の分布を少なくとも部分的に使用して投入される、請求項1~21のいずれか一項に記載の方法。
【請求項23】
前記木ベースのモデルが、プルーニングされて、共変量空間のより疎な区分を生成する、請求項1~22のいずれか一項に記載の方法。
【請求項24】
前記予想される治療転帰を判定することが、1つ以上の木が治療転帰予測を提供することができない場合に、前記1つ以上の木を前記木ベースのモデルから省略することを含む、請求項1~23のいずれか一項に記載の方法。
【請求項25】
前記治療転帰が、がん免疫治療オプション若しくは化学療法治療オプション、又はその両方を含む、請求項1~24のいずれか一項に記載の方法。
【請求項26】
2つ以上の異なる治療オプションについての予想される治療転帰を比較することを更に含む、請求項1~25のいずれか一項に記載の方法。
【請求項27】
前記疾患が、がん、筋肉硬化症、又は末期腎疾患である、請求項1~26のいずれか一項に記載の方法。
【請求項28】
前記疾患が、がんである、請求項1~27のいずれか一項に記載の方法。
【請求項29】
前記がんが、B細胞がん(多発性骨髄腫)、黒色腫、乳がん、肺がん、気管支がん、結腸直腸がん、前立腺がん、膵臓がん、胃がん、卵巣がん、膀胱がん、脳がん、中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮がん、子宮内膜がん、口腔のがん、咽頭のがん、肝臓がん、腎臓がん、精巣がん、胆道がん、小腸がん、虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫、消化管間質腫瘍(GIST)、結腸がん、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性障害(MPD)、急性リンパ性白血病(ALL)、急性骨髄球性白血病(AML)、慢性骨髄球性白血病(CML)、慢性リンパ性白血病(CLL)、赤血球増加症Vera、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ血管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭状がん、乳頭状腺がん、髄様がん、気管支原性がん、腎細胞がん、肝がん、胆管がん、絨毛がん、精上皮がん、胎児性がん、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体細胞腫、神経膠芽腫、聴神経芽腫、乏突起膠腫、髄膜腫、神経芽腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、無形成性骨髄化生、好酸球増加症候群、全身性肥満細胞症、家族性好酸球増加症、慢性好酸球性白血病、神経内分泌がん、又はカルチノイド腫瘍である、請求項28に記載の方法。
【請求項30】
前記対象から前記試料を取得することを更に含む、請求項1~29のいずれか一項に記載の方法。
【請求項31】
前記試料が、組織生検試料、液体生検試料、又は正常対照を含む、請求項1~30のいずれか一項に記載の方法。
【請求項32】
前記試料が、液体生検試料であり、かつ血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含む、請求項31に記載の方法。
【請求項33】
前記試料が、液体生検試料であり、循環腫瘍細胞(CTC)を含む、請求項31に記載の方法。
【請求項34】
前記試料が、液体生検試料であり、かつ無細胞DNA(cfDNA)、循環腫瘍DNA(ctDNA)、又はそれらの任意の組み合わせを含む、請求項31に記載の方法。
【請求項35】
前記複数の核酸分子が、腫瘍核酸分子と非腫瘍核酸分子との混合物を含む、請求項1~34のいずれか一項に記載の方法。
【請求項36】
前記腫瘍核酸分子が、不均質組織生検試料の腫瘍部分に由来し、前記非腫瘍核酸分子が、前記不均質組織生検試料の正常部分に由来する、請求項35に記載の方法。
【請求項37】
前記試料が液体生検試料を含み、前記腫瘍核酸分子が前記液体生検試料の循環腫瘍DNA(ctDNA)画分に由来し、前記非腫瘍核酸分子が前記液体生検試料の非腫瘍無細胞DNA(cfDNA)画分に由来する、請求項35に記載の方法。
【請求項38】
前記1つ以上のアダプターが、増幅プライマー、フローセルアダプター配列、基質アダプター配列、又は試料インデックス配列を含む、請求項1~37のいずれか一項に記載の方法。
【請求項39】
前記捕捉された核酸分子が、1つ以上のベイト分子へのハイブリダイゼーションによって前記増幅された核酸分子から捕捉される、請求項1~38のいずれか一項に記載の方法。
【請求項40】
前記1つ以上のベイト分子が、1つ以上の核酸分子を含み、各核酸分子が、捕捉された核酸分子の領域に相補的な領域を含む、請求項39に記載の方法。
【請求項41】
核酸分子を増幅することが、ポリメラーゼ連鎖反応(PCR)増幅技術、非PCR増幅技術、又は等温増幅技術を実施することを含む、請求項1~40のいずれか一項に記載の方法。
【請求項42】
前記配列決定が、超並列配列決定(MPS)技術、全ゲノム配列決定(WGS)、全エクソーム配列決定、標的配列決定、直接配列決定、又はサンガー配列決定技術の使用を含む、請求項1~41のいずれか一項に記載の方法。
【請求項43】
前記配列決定が超並列配列決定を含み、前記超並列配列決定技術が次世代配列決定(NGS)を含む、請求項42に記載の方法。
【請求項44】
前記シーケンサーが、次世代シーケンサーを含む、請求項1~43のいずれか一項に記載の方法。
【請求項45】
前記複数の配列決定読み取り値のうちの1つ以上が、前記試料内の1つ以上のサブゲノム区間内の1つ以上の遺伝子座と重なり合う、請求項1~44のいずれか一項に記載の方法。
【請求項46】
前記1つ以上のプロセッサによって、前記対象が対応する治療オプションを用いて治療された場合の前記対象の予想される治療転帰のリストを含むレポートを生成することを更に含む、請求項1から45のいずれか一項に記載の方法。
【請求項47】
前記レポートを医療提供者に送信することを更に含む、請求項46に記載の方法。
【請求項48】
前記レポートが、コンピュータネットワーク又はピアツーピア接続を介して送信される、請求項47に記載の方法。
【請求項49】
疾患を有する対象についての予想される治療転帰を判定する方法であって、
1つ以上のプロセッサにおいて、前記対象についての複数の対象特性を受信することと、
前記1つ以上のプロセッサを使用して、前記疾患についての治療オプションに対応する木ベースのモデルにアクセスすることであって、前記木ベースのモデルが、複数の以前の患者の特性及び前記対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、
前記1つ以上のプロセッサを使用して、前記複数の対象特性及び前記木ベースのモデルから、前記対象が前記対応する治療オプションを用いて治療されることを条件として、前記対象についての予想される治療転帰を判定することと、を含む、方法。
【請求項50】
疾患を有する対象についての予想される治療転帰を判定する方法であって、
1つ以上のプロセッサにおいて、前記対象についての複数の対象特性を受信することと、
前記1つ以上のプロセッサを使用して、2つ以上の木ベースのモデルにアクセスすることであって、各木ベースのモデルが、前記疾患についての治療オプションに対応し、各木ベースのモデルが、複数の以前の患者の特性及び前記対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、
前記1つ以上のプロセッサを使用して、前記複数の対象特性及び前記2つ以上の木ベースのモデルから、前記対象が前記対応する治療オプションを用いて治療されることを条件として、前記対象についての予想される治療転帰を判定することと、を含む、方法。
【請求項51】
疾患を有する対象についての治療を選択する方法であって、
請求項50に記載の2つ以上の治療オプションについて前記対象についての予想される治療転帰を判定することと、
各治療オプションの前記予想される治療転帰に基づいて、前記対象における前記疾患を治療するうえで有効である可能性が最も高い前記治療オプションを選択することと、を含む、方法。
【請求項52】
疾患を有する対象を治療する方法であって、
請求項50に記載の2つ以上の治療オプションについて前記対象についての予想される治療転帰を判定することと、
各治療オプションの前記予想される治療転帰に基づいて、前記対象における前記疾患を治療するうえで有効である可能性が最も高い前記治療オプションを選択することと、
前記選択された治療オプションを前記対象に施すことと、を含む、方法。
【請求項53】
前記予想される治療転帰を判定することが、前記複数の対象特性と前記複数の以前の患者の特性との間の共通性に基づいて各木ベースのモデルにおける複数のノードに重み付けすることを含む、請求項49~52のいずれか一項に記載の方法。
【請求項54】
各木ベースのモデルが、木ベースの回帰モデルである、請求項49~53のいずれか一項に記載の方法。
【請求項55】
各木ベースのモデルが、アンサンブル木モデルである、請求項49~54のいずれか一項に記載の方法。
【請求項56】
各木ベースのモデルが、ベイズ加法型回帰木モデルである、請求項49~55のいずれか一項に記載の方法。
【請求項57】
前記木ベースのモデルにおける不確かさが、マルコフ連鎖モンテカルロ法、バギングプロセス、又は非ベイズモデルを使用して考慮される、請求項49~56のいずれか一項に記載の方法。
【請求項58】
前記木ベースのモデルにおける不確かさが、マルコフ連鎖モンテカルロ法を使用して考慮される、請求項49~57のいずれか一項に記載の方法。
【請求項59】
前記木ベースのモデルが、以前の予測分布からのドローに少なくとも部分的に基づいて投入される、請求項49~58のいずれか一項に記載の方法。
【請求項60】
前記木ベースのモデルが、所定の以前の分布又はデータによって通知される以前の分布を少なくとも部分的に使用して投入される、請求項49~59のいずれか一項に記載の方法。
【請求項61】
前記木ベースのモデルが、プルーニングされて共変量空間のより疎な区分を生成する、請求項49~60のいずれか一項に記載の方法。
【請求項62】
前記予想される治療転帰を判定することが、1つ以上の木が治療転帰予測を提供することができない場合に前記1つ以上の木を前記木ベースのモデルから省略することを含む、請求項49~61のいずれか一項に記載の方法。
【請求項63】
前記治療オプションが、がん免疫治療オプション若しくは化学療法治療オプション、又はその療法を含む、請求項49~62のいずれか一項に記載の方法。
【請求項64】
2つ以上の異なる治療オプションについての予想される治療転帰を比較することを更に含む、請求項49~63のいずれか一項に記載の方法。
【請求項65】
前記複数の以前の患者の少なくとも第1の部分についての前記治療転帰が、1回以上の臨床試験の間に判定された治療転帰である、請求項49~64のいずれか一項に記載の方法。
【請求項66】
前記複数の以前の患者の前記第1の部分についての前記治療転帰が、複数の臨床試験の間に判定された治療転帰である、請求項65に記載の方法。
【請求項67】
前記複数の以前の患者の少なくとも第2の部分についての前記治療転帰が、臨床試験以外で判定された治療転帰である、請求項49~65のいずれか一項に記載の方法。
【請求項68】
前記木ベースのモデルの少なくとも一部分が、臨床試験以外で判定された治療転帰を有する1人以上の追加の以前の患者についての複数の特性を用いて再判定される、請求項67に記載の方法。
【請求項69】
前記木ベースのモデルの少なくとも一部分が、
臨床試験以外で判定された以前の患者からのデータを使用して適合され、
臨床試験の間に判定された以前の患者からのデータを使用して判定された複数のノードを含む、請求項49~68のいずれか一項に記載の方法。
【請求項70】
前記木ベースのモデルの少なくとも一部分が、臨床試験の間に判定された以前の患者からの少なくともデータを使用して更に適合される、請求項69に記載の方法。
【請求項71】
前記治療転帰及び前記予想される治療転帰が、全生存期間、無憎悪生存期間、腫瘍反応、前記対象におけるctDNAレベルの変化、疾患寛解、又は治療に対する抵抗についての治療転帰である、請求項49~70のいずれか一項に記載の方法。
【請求項72】
前記予想される治療転帰が、予想される治療転帰尤度の分布である、請求項49~71のいずれか一項に記載の方法。
【請求項73】
前記予想される治療転帰が、複数の期間についての予想される治療転帰尤度の分布である、請求項72に記載の方法。
【請求項74】
前記疾患が、がん、筋肉硬化症、又は末期腎疾患である、請求項49~73のいずれか一項に記載の方法。
【請求項75】
前記疾患が、がんである、請求項49~74のいずれか一項に記載の方法。
【請求項76】
前記治療オプションが、2つの治療オプションを含む、請求項50~75のいずれか一項に記載の方法。
【請求項77】
前記治療オプションが、3つ以上の治療オプションを含む、請求項50~75のいずれか一項に記載の方法。
【請求項78】
前記治療オプションが、がん免疫治療オプション若しくは化学療法治療オプション、又はその両方を含む、請求項49~77のいずれか一項に記載の方法。
【請求項79】
前記複数の対象特性が、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症、以前の療法のリスト、ベースラインctDNA値、診療所環境、又は全身状態のうちの1つ以上を含み、
前記複数の以前の患者の特性が、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症、以前の療法のリスト、ベースラインctDNA値、診療所環境、又は全身状態のうちの1つ以上を含み、
前記複数の対象特性の少なくとも一部分が、前記以前の患者の少なくとも一部分についての前記複数の以前の患者の特性の少なくとも一部分と同じタイプの特性である、請求項49~78のいずれか一項に記載の方法。
【請求項80】
前記複数の対象特性及び前記複数の患者特性についての前記以前の療法のリストが、各々の以前の療法に費やされた時間のリストを含む、請求項79に記載の方法。
【請求項81】
前記複数の対象特性及び前記複数の患者特性についての前記診療所環境が、学術環境又は社会環境として分類される、請求項79又は80に記載の方法。
【請求項82】
前記複数の対象特性及び前記複数の患者特性についての前記バイオマーカ値が、EGFRバリアント状態、NTRKバリアント状態、RETバリアント状態、ALK再構成バリアント状態、腫瘍突然変異負荷量(TMB)、HLAヘテロ接合性消失(LOH)状態、バリアントの生殖系列状態、バリアントの体細胞状態、マイクロサテライト不安定性(MSI)状態、相同組換え修復欠損(HRD)状態、全ゲノムヘテロ接合性消失(gLOH)状態、コピー数変化(CNA)状態、PD-L1発現レベル状態、ホルモン受容体状態、PSA発現レベル状態、又はPSA発現レベル増加率である、請求項79~81のいずれか一項に記載の方法。
【請求項83】
前記共存症が、糖尿病又は心臓病である、請求項79~82のいずれか一項記載の方法。
【請求項84】
各木ベースのモデルが、前記1つ以上のプロセッサによってアクセスされるように構成されたメモリ上に記憶される、請求項49~83のいずれか一項に記載の方法。
【請求項85】
電子ディスプレイ上に、
前記対象における前記疾患を治療するうえで有効である可能性が最も高い前記治療オプション、又は
1つ以上の治療オプションについての前記予想される治療転帰を表示することを含む、請求項49~84のいずれか一項に記載の方法。
【請求項86】
前記対象又は前記対象の医療提供者に、
前記対象における前記疾患を治療するうえで有効である可能性が最も高い前記治療オプション、又は
1つ以上の治療オプションについての前記予想される治療転帰を示すレポートを報告することを含む、請求項49~85のいずれか一項に記載の方法。
【請求項87】
前記レポートが、電子レポートである、請求項86に記載の方法。
【請求項88】
前記レポートが、非電子レポートである、請求項86に記載の方法。
【請求項89】
前記以前の患者の特性のうちの少なくとも1つ又は前記対象特性のうちの少なくとも1つが、以前の患者又は前記対象から取得された核酸分子を配列決定することによって判定される、請求項49~88のいずれか一項に記載の方法。
【請求項90】
システムであって、
1つ以上のプロセッサと、
前記1つ以上のプロセッサに通信可能に結合され、命令を記憶するように構成されたメモリであって、前記命令が、前記1つ以上のプロセッサによって実行されると、前記システムに請求項49~89のいずれか一項に記載の方法を実施させる、メモリとを備える、システム。
【請求項91】
1つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、前記1つ以上のプログラムが命令を含み、前記命令が、システムの1つ以上のプロセッサによって実行されると、前記システムに請求項49~89のいずれか一項に記載の方法を実行させる、非一時的コンピュータ可読記憶媒体。
【請求項92】
疾患を有する対象を治療する方法であって、
請求項51~89のいずれか一項に記載の方法に従って前記対象についての治療を選択することと、
前記疾患を治療するうえで有効である可能性が最も高い前記治療オプションを前記対象に施すことと、を含む、方法。
【請求項93】
方法であって、
1つ以上のプロセッサにおいて、試料に関連付けられた複数の配列読み取り値を対象から受信することと、
前記1つ以上のプロセッサを使用して、前記複数の配列読み取り値を分析して、配列読み取り値分析データを含むゲノムプロファイルを生成することと、
前記1つ以上のプロセッサを使用して、前記配列読み取り値分析データに基づく1つ以上の遺伝子座についてのバイオマーカ値を含む対象特性を識別することと、
1つ以上のプロセッサにおいて、前記対象についての複数の追加の対象特性を受信することと、
前記1つ以上のプロセッサを使用して、前記疾患についての治療オプションに対応する木ベースのモデルにアクセスすることであって、前記木ベースのモデルが、複数の以前の患者の特性及び前記対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、
前記1つ以上のプロセッサを使用して、前記複数の対象特性及び前記木ベースのモデルから、前記対象が前記対応する治療オプションを用いて治療されることを条件として、前記対象についての予想される治療転帰を判定することと、を含む、方法。
【請求項94】
前記予想される治療転帰を判定することが、前記複数の対象特性と前記複数の以前の患者の特性との間の共通性に基づいて、各木ベースのモデルにおける複数のノードに重み付けすることを含む、請求項93に記載の方法。
【請求項95】
各木ベースのモデルが、木ベースの回帰モデルである、請求項93又は94に記載の方法。
【請求項96】
各木ベースのモデルが、アンサンブル木モデルである、請求項93~95のいずれか一項に記載の方法。
【請求項97】
各木ベースのモデルが、ベイズ加法型回帰木モデルである、請求項93~96のいずれか一項に記載の方法。
【請求項98】
前記複数の以前の患者の少なくとも第1の部分についての前記治療転帰が、1回以上の臨床試験の間に判定された治療転帰である、請求項93~97のいずれか一項に記載の方法。
【請求項99】
前記複数の以前の患者の少なくとも第1の部分についての前記治療転帰が、1回以上の臨床試験の間に判定された治療転帰である、請求項93~98のいずれか一項に記載の方法。
【請求項100】
前記複数の以前の患者の前記第1の部分についての治療転帰が、複数の臨床試験の間に判定された治療転帰である、請求項99に記載の方法。
【請求項101】
前記複数の以前の患者の少なくとも第2の部分についての前記治療転帰が、臨床試験以外で判定された、請求項93~100のいずれか一項に記載の方法。
【請求項102】
前記木ベースのモデルの少なくとも一部分が、臨床試験以外で判定された治療転帰を有する1人以上の追加の以前の患者についての複数の特性を用いて再判定される、請求項101に記載の方法。
【請求項103】
前記木ベースのモデルの少なくとも一部分が、
臨床試験以外で判定された以前の患者からのデータを使用して適合され、
臨床試験の間に判定された以前の患者からのデータを使用して判定された複数のノードを含む、請求項93~102のいずれか一項に記載の方法。
【請求項104】
前記木ベースのモデルの少なくとも一部分についてが、臨床試験の間に判定された以前の患者からの少なくともデータを使用して更に適合される、請求項103に記載の方法。
【請求項105】
前記治療転帰及び前記予想される治療転帰が、全生存期間、無憎悪生存期間、腫瘍反応、前記対象におけるctDNAレベルの変化、疾患寛解、又は治療に対する抵抗についての治療転帰である、請求項93~104のいずれか一項に記載の方法。
【請求項106】
前記予想される治療転帰が、予想される治療転帰尤度の分布である、請求項93~105のいずれか一項に記載の方法。
【請求項107】
前記予想される治療転帰が、複数の期間についての予想される治療転帰尤度の分布である、請求項106に記載の方法。
【請求項108】
前記複数の対象特性が、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症、以前の療法のリスト、ベースラインctDNA値、診療所環境、又は全身状態のうちの1つ以上を含み、
前記複数の以前の患者の特性が、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症、以前の療法のリスト、ベースラインctDNA値、診療所環境、又は全身状態のうちの1つ以上を含み、
前記複数の対象特性の少なくとも一部分が、前記以前の患者の少なくとも一部分についての前記複数の以前の患者の特性の少なくとも一部分と同じタイプの特性である、請求項93~107のいずれか一項に記載の方法。
【請求項109】
前記複数の対象特性及び前記複数の患者特性についての前記以前の療法のリストが、各々の以前の療法に費やされた時間のリストを含む、請求項108に記載の方法。
【請求項110】
前記複数の対象特性及び前記複数の患者特性についての前記診療所環境が、学術環境又は社会環境として分類される、請求項108又は109に記載の方法。
【請求項111】
前記複数の対象特性及び前記複数の患者特性についての前記バイオマーカ値が、EGFRバリアント状態、NTRKバリアント状態、RETバリアント状態、ALK再構成バリアント状態、腫瘍突然変異負荷量(TMB)、HLAヘテロ接合性消失(LOH)状態、バリアントの生殖系列状態、バリアントの体細胞状態、マイクロサテライト不安定性(MSI)状態、相同組換え修復欠損(HRD)状態、全ゲノムヘテロ接合性消失(gLOH)状態、コピー数変化(CNA)状態、PD-L1発現レベル状態、ホルモン受容体状態、PSA発現レベル状態、又はPSA発現レベル増加率である、請求項108~110のいずれか一項に記載の方法。
【請求項112】
前記共存症が、糖尿病又は心臓病である、請求項108~111のいずれか一項記載の方法。
【請求項113】
前記木ベースのモデルが、以前の予測分布からのドローに少なくとも部分的に基づいて投入される、請求項93~112のいずれか一項に記載の方法。
【請求項114】
前記木ベースのモデルが、所定の以前の分布又はデータによって通知される以前の分布を少なくとも部分的に使用して投入される、請求項93~113のいずれか一項に記載の方法。
【請求項115】
前記木ベースのモデルが、プルーニングされて共変量空間のより疎な区分を生成する、請求項93~114のいずれか一項に記載の方法。
【請求項116】
前記予想される治療転帰を判定することが、1つ以上の木が治療転帰予測を提供することができない場合に、前記1つ以上の木を前記木ベースのモデルから省略することを含む、請求項93~115のいずれか一項に記載の方法。
【請求項117】
前記治療転帰が、がん免疫治療オプション若しくは化学療法治療オプション、又はその両方を含む、請求項93~116のいずれか一項に記載の方法。
【請求項118】
2つ以上の異なる治療オプションについての予想される治療転帰を比較することを更に含む、請求項93~117のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年12月3日に出願された米国仮特許出願第63/121,195号の利益を主張し、その全体が参照により本明細書に組み込まれる。
【0002】
本明細書では、対象を治療する際に予想される疾患治療転帰を判定するための方法及びデバイス、対象についての治療オプションを選択するための方法及びデバイス、並びに対象の疾患を治療する方法について説明する。
【背景技術】
【0003】
薬剤の有効性に関する最高品質の証拠が臨床試験から得られることが多く、それによって、試験対象集団における平均的な効果の要約統計量が提供される。臨床試験に登録された患者集団は通常、使用目的集団よりも少なく、使用目的集団は、疾患予後、治療位置、又は試験選択基準に関する他の因子において異なり得る。したがって、特に臨床試験において、患者が階層化されないか、又は患者を治療するための所与の意図のトータルプロファイルを有する患者が含まれないときに、臨床試験研究群外の患者が、所与の治療にどのように反応するであろうかを予測することが困難である場合がある。医師が個々の患者について治療の決定を下そうとするときに、その特定の患者についての効果は、臨床試験集団についての平均効果よりも重要である。すなわち、治療中の医療提供者は、選択された患者集団についての臨床試験結果にかかわらず、特定の患者が治療にどのように反応するかを知ることを望む。
【0004】
医師は、患者を治療するための2つ以上の治療オプションを有することが多いが、治療オプションが、臨床試験患者集団を治療するために使用されるときにはより効果が低い場合でも、これらの治療オプションのうちのどれが、特定の患者を治療するうえで最も有効であるかを判定しなければならない。
【発明の概要】
【課題を解決するための手段】
【0005】
本明細書では、疾患を有する対象の治療を選択するための方法及びデバイス、患者に治療オプションを施す際に予想される治療転帰を判定するための方法、及びこれらの方法を実施するためのデバイスについて説明する。また、上記の方法によって選択された治療を使用して患者を治療する方法及び治療のためのシステムについて説明する。
【0006】
方法は、1つ以上の回帰モデル(例えば、ベイズ加法型回帰木モデル又は他の木ベースの回帰モデルなどの木ベースのモデル)を使用することを含むことができ、これらのモデルの各々は、患者がモデルに対応する治療オプションを用いて治療された場合に患者についての予想される治療転帰を判定することができる。各決定木モデルは、複数の以前の患者の特性及びそのような特性に関連付けられた関連する治療転帰(例えば、患者治療転帰)に基づいて訓練することができる。以前の患者は、例えば、臨床試験に参加した患者であるか、又は現実世界の患者(すなわち、治療転帰が臨床試験以外で判定された患者)であり得る。
【0007】
いくつかの例では、方法は、疾患を有する対象からの試料から取得された複数の核酸分子を提供することと、複数の核酸分子からの1つ以上の核酸分子上に1つ以上のアダプターをライゲーションすることと、複数の核酸分子からの1つ以上のライゲーションされた核酸分子を増幅することと、増幅された核酸分子から増幅された核酸分子を捕捉することと、シーケンサーによって、捕捉された核酸分子を配列して、捕捉された核酸分子を表す複数の配列読み取り値を取得することと、1つ以上のプロセッサによって、配列読み取り値に基づいて配列読み取り値分析データを含むゲノムプロファイルを生成することと、1つ以上のプロセッサを使用して、配列読み取り値分析データに基づいて1つ以上の遺伝子座についてのバイオマーカ値を含む対象特性を識別することと、1つ以上のプロセッサにおいて、対象についての複数の追加の対象特性を受信することと、1つ以上のプロセッサを使用して、疾患についての治療オプションに対応する木ベースのモデルにアクセスすることであって、木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションによって治療されることを条件として、対象についての予想される治療転帰を判定することと、を含み得る。
【0008】
いくつかの実装形態では、方法は、1つ以上のプロセッサにおいて、対象から試料に関連する複数の配列読み取り値を受信することと、1つ以上のプロセッサを使用して、複数の配列読み取り値を分析して、配列読み取り値分析データを含むゲノムプロファイルを生成することと、1つ以上のプロセッサを使用して、配列読み取り値分析データに基づいて1つ以上の遺伝子座についてのバイオマーカ値を含む対象特性を識別することと、1つ以上のプロセッサにおいて、対象についての複数の追加の対象特性を受信することと、1つ以上のプロセッサを使用して、疾患についての治療オプションに対応する木ベースのモデルにアクセスすることであって、木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションによって治療されることを条件として、対象についての予想される治療転帰を判定することと、を含む。
【0009】
いくつかの例では、予想される治療転帰を判定することは、複数の対象特性及び複数の以前の患者の特性との間の共通性に基づいて、各木ベースのモデルにおける複数のノードに重み付けすることを含む。
【0010】
いくつかの例では、各木ベースのモデルは、木ベースの回帰モデルである。いくつかの例では、各木ベースのモデルは、アンサンブル木モデルである。いくつかの例では、各木ベースのモデルは、ベイズ加法型回帰木モデルである。
【0011】
いくつかの例では、複数の以前の患者の少なくとも第1の部分についての治療転帰は、1つ以上の臨床試験の間に判定された治療転帰である。
【0012】
いくつかの例では、治療転帰及び予想される治療転帰は、全生存期間、無憎悪生存期間、腫瘍反応、対象におけるctDNAレベルの変化、疾患寛解、又は治療に対する抵抗についての転帰である。
【0013】
いくつかの例では、複数の対象特性は、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症、以前の療法のリスト、ベースラインctDNA値、診療所環境、又は全身状態のうちの1つ以上を含み、複数の以前の患者の特性は、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症、以前の療法のリスト、ベースラインctDNA値、診療所環境、又は全身状態のうちの1つ以上を含み、複数の対象特性の少なくとも一部分は、以前の患者の少なくとも一部分についての複数の以前の患者の特性の少なくとも一部分と同じタイプの特性である。
【0014】
いくつかの例では、複数の対象特性及び複数の患者特性についてのバイオマーカ値は、EGFRバリアント状態、NTRKバリアント状態、RETバリアント状態、ALK再構成バリアント状態、腫瘍突然変異負荷量(TMB)、HLAヘテロ接合性消失(LOH)状態、バリアントの生殖系列状態、バリアントの体細胞状態、マイクロサテライト不安定性(MSI)状態、相同組換え修復欠損(HRD)状態、全ゲノムヘテロ接合性消失(gLOH)状態、コピー数変化(CNA)状態、PD-L1発現レベル状態、ホルモン受容体状態、PSA発現レベル状態、又はPSA発現レベル増加率である。
【0015】
いくつかの例では、疾患は、がんである。例えば、がんは、B細胞がん(多発性骨髄腫)、黒色腫、乳がん、肺がん、気管支がん、結腸直腸がん、前立腺がん、膵臓がん、胃がん、卵巣がん、膀胱がん、脳がん、中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮がん、子宮内膜がん、口腔のがん、咽頭のがん、肝臓がん、腎臓がん、精巣がん、胆道がん、小腸がん、虫垂がん、唾液腺がん、甲状腺がん、副腎がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫、消化管間質腫瘍(GIST)、結腸がん、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性障害(MPD)、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性骨髄球性白血病(CML)、慢性リンパ性白血病(CLL)、赤血球増加症Vera、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ血管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭状がん、乳頭状腺がん、髄様がん、気管支原性がん、腎細胞がん、肝がん、胆管がん、絨毛がん、精上皮がん、胎児性がん、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体細胞腫、神経膠芽腫、聴神経芽腫、乏突起膠腫、髄膜腫、神経芽腫、網膜芽細胞腫、濾胞性リンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞がん、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、無形成性骨髄化生、好酸球増加症候群、全身性肥満細胞症、家族性好酸球増加症、慢性好酸球性白血病、神経内分泌がん、又はカルチノイド腫瘍であり得る。
【0016】
いくつかの例では、方法は、対象から試料を取得することを更に含む。いくつかの例では、試料は、組織生検試料、液体生検試料、又は正常対照を含む。いくつかの例では、試料は、液体生検試料であり、かつ血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含む。いくつかの例では、試料は、液体生検試料であり、循環腫瘍細胞(CTC)を含む。いくつかの例では、試料は、液体生検試料であり、無細胞DNA(cfDNA)、循環腫瘍DNA(ctDNA)、又は任意のそれらの組み合わせを含む。いくつかの例では、複数の核酸分子は、腫瘍核酸分子と非腫瘍核酸分子との混合物を含むことができる。いくつかの例では、腫瘍核酸分子は、不均質組織生検試料の腫瘍部分に由来し、非腫瘍核酸分子は、不均質組織生検試料の正常部分に由来する。
【0017】
いくつかの例では、試料は、液体生検試料を含み、腫瘍核酸分子は、液体生検試料の循環腫瘍DNA(ctDNA)画分に由来し、非腫瘍核酸分子は液体生検試料の非腫瘍無細胞DNA(cfDNA)画分に由来する。
【0018】
いくつかの例では、1つ以上のアダプターは、増幅プライマー、フローセルアダプター配列、基質アダプター配列、又は試料インデックス配列を含む。
【0019】
いくつかの例では、捕捉された核酸分子は、1つ以上のベイト分子へのハイブリダイゼーションによって増幅された核酸分子から捕捉される。いくつかの例では、1つ以上のベイト分子は、1つ以上の核酸分子を含み、各核酸分子が、捕捉された核酸分子の領域に相補的な領域を含む。
【0020】
いくつかの例では、核酸分子を増幅することは、ポリメラーゼ連鎖反応(PCR)増幅技術、非PCR増幅技術、又は等温増幅技術を行うことを含むことができる。
【0021】
いくつかの例では、配列決定は、超並列配列決定(MPS)技術、全ゲノム配列決定(WGS)、全エクソーム配列決定、標的配列決定、直接配列決定、又はサンガー配列決定技術の使用を含む。いくつかの例では、配列決定は超並列配列決定を含み、超並列配列決定技術は次世代配列決定(NGS)を含む。
【0022】
いくつかの例では、シーケンサーは、次世代シーケンサーを含む。
【0023】
いくつかの例では、複数の配列読み取り値のうちの1つ以上は、試料内の1つ以上のサブゲノム区間内で1つ以上の遺伝子座と重なり合う。
【0024】
いくつかの例では、方法は、対象が対応する治療オプションを用いて治療された場合の対象についての予想される治療転帰のリストを含むレポートを生成することを更に含む。いくつかの例では、方法は、例えば、医療提供者にレポートを送信することを含む。いくつかの例では、レポートは、コンピュータネットワーク又はピアツーピア接続を介して送信される。
【0025】
疾患(がんなど)を有する対象についての予想される治療転帰を判定する方法(コンピュータ実装方法であり得る)は、1つ以上のプロセッサにおいて、対象についての複数の対象特性を受信することと、1つ以上のプロセッサを使用して、木ベースのモデル(例えば、アンサンブル回帰木モデルなどの木ベースの回帰モデル)にアクセスすることであって、木ベースのモデルが、1つ以上のプロセッサによってアクセスされるように構成されたメモリ上に記憶され得、疾患についての治療オプションに対応し、木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションによって治療されることを条件として、対象についての予想される治療転帰を判定することと、を含み得る。複数の以前の患者の特性及び関連する治療転帰は、臨床試験の間に、又は臨床試験以外で(すなわち、実世界データ)、又はその両方で判定され得る。例えば、木ベースのモデルは、実世界データを使用して適合され得、木ベースのモデルのノードは、臨床試験データを使用して重み付け又は判定され得る。いくつかの実施形態では、木ベースのモデルは、ベイズ加法型回帰木モデルである。
【0026】
疾患(がんなど)を有する対象についての予想される治療転帰(例えば、又は2つの治療オプション、又は2つ以上の治療オプション)を判定する方法(コンピュータ実装方法であり得る)は、1つ以上のプロセッサにおいて、対象についての複数の対象特性を受信することと、1つ以上のプロセッサを使用して、2つ以上の木ベースのモデル(例えば、アンサンブル回帰木モデルなどの木ベースの回帰モデル)にアクセスすることであって、木ベースのモデルが、1つ以上のプロセッサによってアクセスされるように構成されたメモリ上に記憶され得、各木ベースのモデルが、疾患についての治療オプションに対応し、各木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び2つ以上の木ベースのモデルから、対象が対応する治療オプションによって治療されることを条件として、対象についての予想される治療転帰を判定することと、を含み得る。複数の以前の患者の特性及び関連する治療転帰は、臨床試験の間に、又は臨床試験以外で(すなわち、実世界データ)、又はその両方で判定され得る。例えば、木ベースのモデルは、実世界データを使用して適合され得、木ベースのモデルのノードは、臨床試験データを使用して重み付け又は判定され得る。いくつかの実施形態では、木ベースのモデルは、ベイズ加法型回帰木モデルである。
【0027】
疾患(がんなど)を有する対象の治療(例えば、2つの治療オプション又は3つ以上の治療オプションから選択された治療)を選択する方法は、1つ以上のプロセッサにおいて、対象についての複数の対象特性を受信することと、1つ以上のプロセッサを使用して、2つ以上の木ベースのモデル(例えば、アンサンブル回帰木モデルなどの木ベースの回帰モデル)にアクセスすることであって、木ベースのモデルが、1つ以上のプロセッサによってアクセスされるように構成されたメモリ上に記憶され得、各木ベースのモデルが、疾患についての治療オプションに対応し、各木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションによって治療されることを条件として、対象についての予想される治療転帰を判定することと、各治療オプションの予想される治療転帰に基づいて、対象における疾患を治療するうえで有効である可能性が最も高い治療オプションを選択することと、を含み得る。複数の以前の患者の特性及び関連する治療転帰は、臨床試験の間に、又は臨床試験以外で(すなわち、実世界データ)、又はその両方で判定され得る。例えば、木ベースのモデルは、実世界データを使用して適合され得、木ベースのモデルのノードは、臨床試験データを使用して重み付け又は判定され得る。いくつかの実施形態では、木ベースのモデルは、ベイズ加法型回帰木モデルである。
【0028】
いくつかの実施形態では、予想される治療転帰を判定することは、複数の対象特性と複数の以前の患者の特性との間の共通性に基づいて各木ベースのモデルにおける複数のノードに重み付けすることを含む。
【0029】
木ベースのモデルにおける不確かさは、マルコフ連鎖モンテカルロ法、バギングプロセス、又は非ベイズモデルを使用して考慮される。いくつかの実施形態では、木ベースのモデルにおける不確かさは、マルコフ連鎖モンテカルロ法を使用して考慮される。
【0030】
治療転帰及び/又は予想される治療転帰は、例えば、全生存期間、無憎悪生存期間、腫瘍反応、対象におけるctDNAレベルの変化、疾患寛解、又は治療に対する抵抗であり得る。
【0031】
例えば、予想される治療転帰は、複数の期間についての予想される治療転帰尤度の分布などの予想される治療転帰尤度の分布であり得る。
【0032】
いくつかの実施形態では、疾患は、がん、筋肉硬化症、又は末期腎疾患である。いくつかの実施形態では、疾患はがんである。いくつかの実施形態では、治療オプションは、がん免疫学治療オプション若しくは化学療法治療オプション、又はその両方を含む。
【0033】
複数の対象特性は、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症、以前の療法のリスト、ベースラインctDNA値、診療所環境、又は全身状態のうちの1つ以上を含み得る。複数の以前の患者の特性は、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症(例えば、糖尿病若しくは心臓病)、以前の療法のリスト(任意選択的に、各々の以前の療法に費やされた時間のリスト)、ベースラインctDNA値、診療所環境(例えば、学術環境若しくは社会環境として分類される)、又は全身状態のうちの1つ以上を含み得る。複数の対象特性の少なくとも一部分は、以前の患者の少なくとも一部分についての複数の以前の患者の特性の少なくとも一部分と同じタイプの特性であり得る。例示的なバイオマーカ値は、EGFRバリアント状態、NTRKバリアント状態、RETバリアント状態、ALK再構成バリアント状態、腫瘍突然変異負荷量(TMB)、HLAヘテロ接合性消失(LOH)状態、バリアントの生殖系列状態、バリアントの体細胞状態、マイクロサテライト不安定性(MSI)状態、相同組換え修復欠損(HRD)状態、全ゲノムヘテロ接合性消失(gLOH)状態、コピー数変化(CAN)状態、PD-L1発現レベル状態、ホルモン受容体状態、PSA発現レベル状態、又はPSA発現レベル増加率を含み得る。
【0034】
上記のいずれかの方法は、対象における疾患を治療するうえで有効である可能性が最も高い治療オプション、又は1つ以上の治療オプションについての予想される治療転帰を電子ディスプレイ上に表示させることを更に含み得る。
【0035】
上記のいずれかの方法は、対象又は対象の医療提供者に、対象における疾患を治療するうえで有効である可能性が最も高い治療オプション、又は1つ以上の治療オプションについての予想される治療転帰を示すレポート(電子レポートであっても又は非電子レポートであり得る)を報告することを更に含み得る。
【0036】
本明細書では、1つ以上のプロセッサと、1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶するメモリと、を含むシステム(例えば、1つ以上の電子デバイス)であって、1つ以上のプログラムが、上記の方法のいずれかを実施するための命令を含む、システムについても説明する。
【0037】
例えば、システムは、1つ以上のプロセッサと、1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶するメモリと、を含み得、1つ以上のプログラムが、疾患(がんなど)を有する対象についての予想される治療転帰を判定するための命令を含み、プログラムが、1つ以上のプロセッサにおいて、対象についての複数の対象特性を受信することと、1つ以上のプロセッサを使用して、木ベースのモデル(例えば、アンサンブル回帰木モデルなどの木ベースの回帰モデル)にアクセスすることであって、木ベースのモデルが、メモリ上に記憶され得、疾患についての治療オプションに対応し、木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションによって治療された場合に対象についての予想される治療転帰を判定することと、を含み得る。複数の以前の患者の特性及び関連する治療転帰は、臨床試験の間に、又は臨床試験以外で(すなわち、実世界データ)、又はその両方で判定され得る。例えば、木ベースのモデルは、実世界データを使用して適合され得、木ベースのモデルのノードは、臨床試験データを使用して重み付け又は判定され得る。いくつかの実施形態では、木ベースのモデルは、ベイズ加法型回帰木モデルである。
【0038】
システムは、1つ以上のプロセッサと、1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶するメモリと、を含み得、1つ以上のプログラムが、疾患(がんなど)を有する対象についての予想される治療転帰(例えば、又は2つの治療オプション、又は3つ以上の治療オプション)を判定するための命令を含み、プログラムが、1つ以上のプロセッサにおいて、対象についての複数の対象特性を受信することと、1つ以上のプロセッサを使用して、2つ以上の木ベースのモデル(例えば、アンサンブル回帰木モデルなどの木ベースの回帰モデル)にアクセスすることであって、木ベースのモデルが、メモリ上に記憶され得、各木ベースのモデルが、疾患についての治療オプションに対応し、各木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションによって治療された場合に対象についての予想される治療転帰を判定することと、を含み得る。複数の以前の患者の特性及び関連する治療転帰は、臨床試験の間に、又は臨床試験以外で(すなわち、実世界データ)、又はその両方で判定され得る。例えば、木ベースのモデルは、実世界データを使用して適合され得、木ベースのモデルのノードは、臨床試験データを使用して重み付け又は判定され得る。いくつかの実施形態では、木ベースのモデルは、ベイズ加法型回帰木モデルである。
【0039】
システムは、1つ以上のプロセッサと、1つ以上のプロセッサによって実行されるように構成された1つ以上のプログラムを記憶するメモリと、を含み得、1つ以上のプログラムが、疾患(がんなど)を有する対象の治療(例えば、2つの治療オプション、又は3つ以上の治療オプションから選択される治療)を選択するための命令を含み、プログラムが、1つ以上のプロセッサにおいて、対象についての複数の対象特性を受信することと、1つ以上のプロセッサを使用して、2つ以上の木ベースのモデル(例えば、アンサンブル回帰木モデルなどの木ベースの回帰モデル)にアクセスすることであって、木ベースのモデルが、メモリ上に記憶され得、各木ベースのモデルが、疾患についての治療オプションに対応し、各木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションによって治療された場合に対象についての予想される治療転帰を判定することと、各治療オプションの予想される治療転帰に基づいて、対象における疾患を治療するうえで有効である可能性が最も高い治療オプションを選択することと、を含み得る。複数の以前の患者の特性及び関連する治療転帰は、臨床試験の間に、又は臨床試験以外で(すなわち、実世界データ)、又はその両方で判定され得る。例えば、木ベースのモデルは、実世界データを使用して適合され得、木ベースのモデルのノードは、臨床試験データを使用して重み付け又は判定され得る。いくつかの実施形態では、木ベースのモデルは、ベイズ加法型回帰木モデルである。
【0040】
本明細書では、疾患を有する対象を治療する方法であって、上記の方法のいずれか1つに従って対象の治療を選択することと、疾患を治療するうえで有効である可能性が最も高い治療オプションを対象に施すことと、を含むことができる方法についても説明する。例えば、対象を治療する方法は、疾患(がんなど)を有する対象の治療(例えば、2つの治療オプション、又は3つ以上の治療オプションから選択される治療)を選択することを含むことができ、1つ以上のプロセッサにおいて、対象についての複数の対象特性を受信することと、1つ以上のプロセッサを使用して、2つ以上の木ベースのモデル(例えば、アンサンブル回帰木モデルなどの木ベースの回帰モデル)にアクセスすることであって、木ベースのモデルが、メモリ上に記憶され得、各木ベースのモデルが、疾患についての治療オプションに対応し、各木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションによって治療された場合に対象についての予想される治療転帰を判定することと、各治療オプションの予想される治療転帰に基づいて、対象における疾患を治療するうえで有効である可能性が最も高い治療オプションを選択することと、疾患を治療するうえで有効である可能性が最も高い治療オプションを対象に施すことと、を含み得る。複数の以前の患者の特性及び関連する治療転帰は、臨床試験の間に、又は臨床試験以外で(すなわち、実世界データ)、又はその両方で判定され得る。例えば、木ベースのモデルは、実世界データを使用して適合され得、木ベースのモデルのノードは、臨床試験データを使用して重み付け又は判定され得る。いくつかの実施形態では、木ベースのモデルは、ベイズ加法型回帰木モデルである。
【図面の簡単な説明】
【0041】
【
図1】いくつかの実施形態によるアンサンブル木回帰モデルを適合させる例示的な方法を示す。
【
図2A】いくつかの実施形態による、臨床試験データを分析して木ノードを投入するために使用される、実世界データによって生成されたアンサンブル木回帰モデルの例示的な使用を示す。
【
図2B】いくつかの実施形態による、臨床試験データがノードに重み付けするためにどのように使用されるかの例示的な方法を示す。
【
図3】いくつかの実施形態による、実世界データに依拠して、更新された木ベースのモデルを生成する学習ループを示す。
【
図4】疾患を有する対象についての予想される治療転帰を判定するための例示的なプロセスを示す。
【
図5A】いくつかの実施形態による、コンピューティングデバイスの例を示す。
【
図5B】一実施形態による、コンピューティングシステムの例を示す。
【発明を実施するための形態】
【0042】
本明細書に記載の方法は、疾患を有する対象についての予想される治療転帰を判定するか、又は対象を治療するための治療オプションを選択するうえで有用である場合がある。例えば、対象又は対象のための医療提供者は、治療オプションが有害事象のリスク又は治療費に値するかどうかを検討することがあり、治療が成功する可能性が高いことを対象に通知することは、有効な治療を行ううえで顕著な利点をもたらす。いくつかの状況では、対象又は対象のための医療提供者は、2つ以上の異なる治療オプションのうち疾患を最も効果的に治療する治療オプションを決定する場合がある。例えば、臨床試験が、調査された臨床試験集団全体にわたって、第1の治療オプションが、疾患を治療するうえで、第2の治療オプションよりも有効であることを実証したという理由だけでは、治療中の特定の対象について、第1の治療オプションが、第2の治療オプションよりも有効である可能性がより高いことを示すわけではない。本明細書に記載の方法は、1つ以上の治療オプションの個人的な予測を提供することができ、対象又は医療提供者は、対象の特性に基づいて対象に最適な治療オプションを選択することができる。
【0043】
本明細書に記載の方法は、ロバストであり、多数の疾患に使用され得る。例えば、この方法は、疾患ががん、筋肉硬化症、又は末期腎疾患であるときに使用され得る。いくつかの実施形態では、疾患はがんである。
【0044】
疾患を有する対象についての予想される治療転帰を判定するための例示的なコンピュータ実装方法は、1つ以上のプロセッサにおいて、対象についての複数の対象特性を受信することと、1つ以上のプロセッサを使用して、疾患についての治療オプションに対応する木ベースのモデルにアクセスすることであって、木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションによって治療された場合に対象についての予想される治療転帰を判定することと、を含むことができる。この予測方法は、複数の異なる治療オプションについての予想される治療転帰を判定するように拡張することができる。例えば、疾患を有する対象についての予想される治療転帰を判定するためのコンピュータ実装方法は、1つ以上のプロセッサにおいて、対象についての複数の対象特性を受信することと、1つ以上のプロセッサを使用して、2つ以上の木ベースのモデルにアクセスすることであって、各木ベースのモデルが、疾患についての治療オプションに対応し、各木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションによって治療された場合に対象についての予想される治療転帰を判定することと、を含むことができる。
【0045】
予想される治療転帰又は2つ以上の異なる治療オプションを知ることは、対象における疾患を治療するうえで有効である可能性が最も高い治療転帰を選択するうえで有用である。例えば、疾患を有する対象についての治療を選択する方法は、2つ以上の治療オプションについて対象の予想される治療転帰を判定することと、各治療オプションの予想される治療転帰に基づいて、患者における疾患を治療するうえで有効である可能性が最も高い治療オプションを選択することと、を含むことができる。2つ以上の治療オプションについての対象の予想される治療転帰は、本明細書に記載の方法のいずれかを使用して、例えば、1つ以上のプロセッサにおいて、対象についての複数の対象特性を受信することと、1つ以上のプロセッサを使用して、2つ以上の木ベースのモデルにアクセスすることであって、各木ベースのモデルが、疾患についての治療オプションに対応し、各木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、1つ以上のプロセッサを使用して、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションによって治療された場合に対象についての予想される治療転帰を判定することと、を含む、コンピュータ実装方法を使用することによって判定することができる。
【0046】
患者について治療オプションが選択されると、患者は、治療オプションを患者に施すことによって疾患を治療することができる。
【0047】
定義
他に定義されない限り、本明細書において使用される全ての技術的用語は、本開示が属する分野の当業者によって一般的に理解されるのと同じ意味を有する。
【0048】
本明細書において使用される場合、単数形「1つの(a)」、「1つの(an)」、及び「その(the)」は、文脈上他に明確に指示されない限り、複数の言及を含む。本明細書における「又は」の任意の参照は、特に明記しない限り、「及び/又は」を包含するものである。
【0049】
本明細書における値又はパラメータ「約」への言及は、その値又はパラメータ自体を対象とする変動を含む(及び説明する)。例えば、「約X」という記載は、「X」という記載を含む。
【0050】
「個人」、「患者」、及び「対象」という用語は、同義的に使用され、哺乳類を指す。
【0051】
本明細書に記載される本発明の態様及び変形は、態様及び変形「からなる」及び/又は「から本質的になる」を含むことが理解される。本明細書では、「備える(comprising)」(及び「comprise」及び「comprises」などの「comprising」の任意の形態又は変形)、「有する(having)」(及び「have」及び「has”などの”having”の任意の形態又は変形)、「含む(including)」(及び”includes」及び「include」などの「including」の任意の形態又は変形)、又は「含有する(containing)」(及び「contains」及び「contain」などの「containing」の任意の形態又は変形)という用語は、包括的又はオープンエンドであり、更なる記載されていない添加物、構成要素、整数、要素、又は方法ステップを省略しない。
【0052】
「サブゲノム区間」(又は「サブゲノム配列間隔」)という用語が、本明細書で使用される場合、ゲノム配列の一部分を指す。
【0053】
「対象区間」という用語が、本明細書で使用される場合、サブゲノム区間又は発現されたサブゲノム区間(例えば、サブゲノム区間の転写された配列)を指す。
【0054】
「バリアント配列」又は「バリアント」という用語は、本明細書で使用される場合、交換可能に使用され、対応する「正常」又は「野生型」配列に対する修飾核酸配列を指す。いくつかの例では、バリアント配列は、「短バリアント配列」(又は「短バリアント」)、すなわち、長さが約50塩基対未満のバリアント配列であり得る。
【0055】
値の範囲が提供される場合、その範囲の上限と下限との間の各介在値、及びその状態範囲内の任意の他の記載値又は介在値は、本開示の範囲内に含まれることを理解されたい。記載された範囲が上限又は下限を含む場合、それらの含まれる限界のいずれかを除外した範囲も本開示に含まれる。
【0056】
本明細書において使用されるセクションの見出しは、編成のみを目的としており、記載された主題を限定するものと解釈されるべきではない。説明は、当業者が本発明を製造及び使用することを可能にするために提示され、特許出願及びその要件の文脈で提供される。記載された実施形態に対する様々な修正は、当業者にとって容易に明らかであり、本明細書の一般的な原理は、他の実施形態に適用され得る。したがって、本発明は、示された実施形態に限定されることを意図するものではなく、本明細書に記載された原理及び特徴と一致する最も広い範囲が与えられるべきである。
【0057】
図は、様々な実施形態によるプロセスを示している。例示的なプロセスでは、いくつかのブロックは、任意選択的に組み合わされ、いくつかのブロックの順序は、任意選択的に変更され、いくつかのブロックは、任意選択的に省略される。いくつかの例では、例示的なプロセスと組み合わせて追加のステップが実行されることができる。したがって、図示されている(及び以下により詳細に説明されている)動作は、本質的に例示的なものであり、したがって、限定するものとみなされるべきではない。
【0058】
本明細書で参照される全ての刊行物、特許、及び特許出願の開示は、それぞれ、参照によりその全体が本明細書に援用される。参照により援用される参考文献が本開示と矛盾する限り、本開示が優先するものとする。
【0059】
治療転帰予測モデル
本明細書に記載の方法は、所与の患者が対応する治療オプションを用いて治療された場合の治療転帰を予測する(すなわち、対応する治療オプションについての予想される治療転帰を判定する)ために、木ベースのモデル及び対象についての複数の対象特性を使用することができる。木ベースのモデルの各々は、所与の治療オプションに対応することができ、複数の木ベースのモデルを使用して、予想される治療転帰を比較して、例えば、対象における疾患を治療するうえで有効である可能性が最も高い治療オプションを判定することができる。
【0060】
木ベースのモデルは、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成することができる。複数の以前の患者の特性は、複数の対象特性と厳密に一致する必要はないが、特性のセットがある程度重複することが好ましい。
【0061】
木ベースのモデル(単数又は複数)は、木ベースの回帰モデルであり得る。いくつかの実施形態では、木ベースのモデルは、アンサンブル木モデル(例えば、アンサンブル木ベースの回帰モデル)である。例えば、木ベースのモデルは、ベイズ加法型回帰木(BART)モデルであり得る。例示的なベイズ加法型回帰モデルは、Chipman et al.,BART:Bayesian additive regression trees,Ann.Appl.Stat.,vol.4,no.1,pp.266-298(2010)に記載されている。Athey et al.,Generalized random forests,Annals of Statistics,vol.47,no.2,pp.1148-1178(2019)も参照されたい。
【0062】
以前の患者についてのデータ(例えば、治療オプションについての治療転帰とともに、複数の以前の患者の特性又は以前の患者)が、木ベースのモデルを生成するために使用される。いくつかの実施形態では、データの少なくとも一部分は、1回以上の(例えば、複数の)臨床試験の間に判定される(すなわち、「臨床試験データ」)。データに複数の臨床試験が使用される場合、臨床試験では、以前の患者の同じ特性又は以前の患者の異なる特性が収集されている場合がある。いくつかの実施形態では、データの少なくとも一部分は、臨床試験以外で判定される(すなわち、「実世界データ」)。臨床試験以外で判定されたデータは、以前の患者の特性、治療オプション、及び治療オプションを関連付けたデータベース上に記憶され得る。例えば、Foundation-Flatiron臨床ゲノムデータベースなどの、臨床ゲノムデータベース(CGDB)が使用され得る。臨床試験の間に判定される以前の患者の特性のセットは、臨床試験以外で判定される以前の患者の特性のセットと同じ又は異なり得、少なくとも部分的に重複し得る。
【0063】
臨床試験データ及び実世界データは、木ベースのモデルを生成するために異なるように使用され得る。例えば、木ベースのモデルが、実世界データを使用して適合され得、木ベースのモデルのノードが、臨床試験データを使用して判定され得る。すなわち、実世界データは、木構造を生成するために使用することができ、木構造は、臨床試験データを分析して木のノードを投入するために使用される。より多くの実世界データが収集されるにつれて、追加の実世界データを使用して木ベースのモデルを再判定することができる。
図1を参照されたく、ここでは、アンサンブル木回帰モデルを適合させる例示的な方法を示す。木ベースのモデルにおける不確かさが、例えば、マルコフ連鎖モンテカルロ法、バギングプロセス、又は非ベイズモデルを使用して考慮され得る。いくつかの実施形態では、木ベースのモデルにおける不確かさは、マルコフ連鎖モンテカルロ法を使用して考慮され得る。木ベースのモデルを含むノードは、実世界データからの複数の以前の患者の特性と臨床試験データからの複数の以前の患者の特性との間の共通性に基づいて重み付けされ得る。例えば、実世界データからの以前の患者の特性と同じ臨床試験データからの以前の患者の特性に関連するノードは、予想される治療転帰を推定するためにより重く重み付けされ、一方、より顕著な不一致については、より軽く重み付けされる。
図2A及び
図2Bを参照すると
図2A及び
図2Bは、臨床試験データを分析して木ノードを投入するために使用される実世界データによって生成されたアンサンブル木回帰モデルの使用を明示している。
【0064】
次いで、生成された木ベースのモデルを使用して、対象特性のセットを有する対象が木ベースのモデルについての治療オプションにどのように反応するかを予測することができる。すなわち、疾患についての治療オプションに対応する木ベースのモデルを使用して、対象が対応する治療オプションを用いて治療された場合の対象についての予想される治療転帰を判定することができる。いくつかの実施形態では、対象についての予想される治療転帰は、以前の患者(例えば、臨床試験からの以前の患者)についての治療転帰の加重平均である。例えば、以下のことを使用して、治療オプションzについての対象の個人化された予想される治療転帰Yの後方ドローを判定することができる。いくつかの実施形態では、重みが正規化される。
【数1】
以前の患者に使用される治療転帰のタイプは、対象の予想される治療転帰と同じタイプの治療転帰であり得る。例示的な治療転帰(又は予想される治療転帰)は、全生存期間、無憎悪生存期間、腫瘍反応、対象におけるctDNAレベルの変化、疾患寛解、又は治療に対する抵抗であり得る。他の治療転帰もまた、検討され得る。判定された予想される治療転帰は分布(例えば、予想される治療転帰尤度の分布)であり得る。例えば、分布は、複数の期間についての予想される治療転帰尤度であり得る。例えば、予想される治療転帰は、第1の期間後の予想される治療転帰及び第2の期間後の予想される治療転帰を提供し得る。単に一例として、予想される治療転帰は、対象が対応する治療オプションを用いて治療された場合の6か月後の生存尤度及び5年後の生存尤度を提供し得る。
【0065】
いくつかの実施形態では、木ベースのモデルは、連続的な測度、例えば、時間又は傾向スコアに基づくターゲットスムージングを組み込み得る。例示的なスムージング技法は、Starling,Jennifer E.,et al.“BART with targeted smoothing:An analysis of patient-specific stillbirth risk.”The Annals of Applied Statistics 14.1(2020):28-50.)に記載されている。別の例によれば、ベイズ因果林モデルは、ターゲットスムージング技法を組み込み得る。ベイズ因果林とともに使用される例示的なスムージング技法は、Starling,Jennifer E.,et al.“Targeted smooth Bayesian causal forests:An analysis of heterogeneous treatment effects for simultaneous versus interval medical abortion regimens over gestation.”arXiv preprint arXiv:1905.09405(2019)に記載されている。
【0066】
以前の患者の特性又は対象特性は、患者の任意の特徴であり得る。例示的な特性は、限定はしないが、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症(例えば、糖尿病若しくは心臓病)、以前の療法のリスト(任意選択的に、各々の以前の療法に費やされた時間のリストを更に含み得る)、ベースラインctDNA値(例えば、腫瘍画分)、診療所環境(例えば、治療用の社会環境若しくは学術環境)、又は全身状態のうちの1つ以上を含む。例示的なバイオマーカ値は、限定はしないが、EGFRバリアント状態、NTRKバリアント状態、RETバリアント状態、ALK再構成バリアント状態、腫瘍突然変異負荷量(TMB)、HLAヘテロ接合性消失(LOH)状態、バリアントの生殖系列状態、バリアントの体細胞状態、マイクロサテライト不安定性(MSI)状態、相同組換え修復欠損(HRD)状態、全ゲノムヘテロ接合性消失(gLOH)状態、コピー数変化(CAN)状態、PD-L1発現レベル状態、ホルモン受容体状態、PSA発現レベル状態、又はPSA発現レベル増加率を含み得る。
【0067】
いくつかの実施形態では、以前の患者のデータは、例えば、新しい対象予測が、以前の患者のデータが不十分である木によって判定された共変量空間区分に分類されるときに、木ベースのモデルを使用して1つ以上の治療オプションを判定するには不十分である場合がある。この例では、木ベースのモデルにおいて使用されるデータは、(1)以前の予測分布からのドローに基づいて投入すること、(2)それらの患者が新しい対象と同様の特性(例えば、事前に指定された以前の分布若しくはデータによって通知された以前の分布)を有していた以前のモデルからのデータを使用すること、(3)木ベースのモデルにおける木をプルーニングして共変量空間のより疎な区分を作成すること、又は(4)計算から反復を除去する(例えば、その特定の「b」ドローを複合マルコフ連鎖モンテカルロに含めずに省略するか、若しくは木ベースのアンサンブルの場合に、アンサンブルから違反する木を選択的に削除する)こと、(5)共変量空間区分のその特定の組み合わせについての否定的な知見若しくは「結果なし」知見を返す(例えば、空のノードが生じる患者プロファイルについての結果として返さないことを選択する)こと、(6)又はこれらの技法のうちの1つ以上の組み合わせによって選択され得る。
【0068】
木ベースのモデルは、追加の実世界データが利用可能になったときに更新することができ、治療された対象からのデータを使用した更新を含むことができる。これによって、
図3に示すように、学習ループを生成することができる。
【0069】
治療オプション(すなわち、2つ以上)は、各治療オプションに対応する木ベースのモデルを使用して比較され得る。いくつかの実施形態では、2つの治療オプションが比較される。すなわち、対象が対応する治療オプションを用いて治療された場合の対象についての予想される治療転帰は、2つの治療オプションについて判定され得る。いくつかの実施形態では、3つ以上の治療オプションが比較される。すなわち、対象が対応する治療オプションを用いて治療された場合の対象についての予想される治療転帰は、3つ以上の治療オプションについて判定され得る。一例として、治療オプションz及び治療オプションz’は、以下に従って比較され得、
【数2】
式中、x
*は、対象についての複数の対象特性を示し、Yは、治療オプションについての判定された予想される治療転帰であり、bは、代表的なドロー(例えば、間引きされ、組み合わされたモンテカルロドローの数)をインデックス付けする。
【0070】
本明細書に記載の方法を使用して評価される治療オプションは、任意の治療薬、外科処置、又は任意の他の医療若しくはホメオパシー介入であり得る。治療オプションは、疾患タイプに依存し得る。例えば、方法を使用して、例えば、がんを有する対象を治療するためにがん免疫治療オプション、化学療法治療オプション、又は複合療法(例えば、がん免疫治療オプションと化学療法治療オプションの療法)のうちから選択し得る。
【0071】
1つ以上の治療オプションについての判定された予想される治療転帰、又は対象における疾患を治療するうえで有効である可能性が最も高い治療オプションは、(例えば、電子システムの一部分としての電子ディスプレイを使用して)表示されるか、又は報告され(例えば、対象若しくは対象の医療提供者に報告され)得る。このレポートは、電子レポート(例えば、電子カルテ)、又は非電子レポート(例えば、報告書であり、例えば、用紙への記録として保存されるか又は対象若しくは対象の医療提供者に送り届けられ得る)であり得る。いくつかの例では、レポートの全部又は一部は、オンライン又はウェブベースのヘルスケアポータルのグラフィカルユーザインターフェースに表示され得る。いくつかの例では、レポートは、コンピュータネットワーク又はピアツーピア接続を介して送信される。
【0072】
図4は、疾患を有する対象についての予想される治療転帰を判定する方法の非制限的な例を提供する。プロセス400は、例えば、ソフトウェアプラットフォームを実装する1つ以上の電子デバイスを使用して実行することができる。いくつかの例では、プロセス400は、クライアント-サーバシステムを使用して実行され、プロセス400のブロックは、サーバとクライアントデバイスとの間で、任意の方法で分割される。他の実施例では、プロセス400のブロックは、サーバと複数のクライアントデバイスとの間で分割される。したがって、プロセス400の一部分は、クライアント-サーバシステムの特定のデバイスによって実行されるものとして本明細書に記載されているが、プロセス400はそのように限定されないことを理解されたい。他の実施例では、プロセス400は、クライアントデバイスのみ、又は複数のクライアントデバイスのみを使用して実行される。プロセス400では、いくつかのブロックが、任意選択的に結合され、いくつかのブロックの順序が、任意選択的に変更され、いくつかのブロックが、任意選択的に省略される。いくつかの例では、プロセス400と組み合わせて追加のステップを実行することができる。したがって、図示されている(及び以下により詳細に説明されている)動作は、本質的に例示的なものであり、したがって、限定するものとみなされるべきではない。
【0073】
ステップ402において、プロセス400は、対象についての複数の対象特性を(例えば、1つ以上のプロセッサにおいて)受信することを含む。例示的な対象特性は、限定はしないが、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症、以前の療法のリスト、ベースラインctDNA値、診療所環境、又は全身状態を含むことができる。404において、疾患についての治療オプションに対応する木ベースのモデルに(例えば、1つ以上のプロセッサを使用して)アクセスする。木ベースのモデルは、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される。治療転帰は、例えば、1回以上の臨床試験の間に判定するか、又は臨床試験以外で判定することができる。例示的な治療転帰は、例えば、全生存期間、無憎悪生存期間、腫瘍反応、対象におけるctDNAレベルの変化、疾患寛解、又は治療に対する抵抗を含み得る。例示的な以前の患者の特性は、限定はしないが、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症、以前の療法のリスト、ベースラインctDNA値、診療所環境、又は全身状態を含むことができる。木ベースのモデルは、木ベースの回帰モデル及び/又はアンサンブル木モデルであり得、木ベースのモデルは、例えば、ベイズ加法型回帰モデルであり得る。木ベースのモデルにおける不確かさは、マルコフ連鎖モンテカルロ法、バギングプロセス、非ベイズモデル、又は任意の他の適切なプロセスを使用して考慮され得る。木ベースのモデルは、例えば、非一時的コンピュータ可読媒体に記憶され得る。
【0074】
対象についての予想される治療転帰が406において判定される。予想では、患者が、対応する治療オプションを用いて治療されると仮定される。対象及び木ベースのモデルについての複数の特性から判定が下される。予想は、複数の対象特性と複数の以前の患者の特性との間の共通性に基づいて各木ベースのモデルにおける複数のノードに重み付けすることによって行うことができる。
【0075】
本明細書に記載される方法を使用して、疾患を有する対象を治療することができる。例えば、疾患を有する対象を治療するための方法は、本明細書に記載された方法に従って2つ以上の治療オプションについて対象についての予想される治療転帰を判定することを含むことができる。2つ以上の治療オプションの中から、対象における疾患を治療するうえで有効である可能性が最も高い治療オプションが選択され得、選択された治療オプションが対象に施される。
【0076】
疾患及び治療オプション
本明細書に記載の方法は、疾患の治療転帰を予測するために使用され得る。例示的な疾患は、限定はしないが、過剰増殖性疾患(例えば、がん)、異数性障害(ダウン症、エドワーズ症候群、パトー症候群)、脆弱X症候群、又は神経障害(例えば、筋萎縮性側索硬化症、アルツハイマー病、パーキンソン病、脳卒中、又はギランバレー症候群)を含むことができる。いくつかの例では、疾患はがんである。いくつかの例では、がんは、固形腫瘍又はその転移性形態である。いくつかの例では、がんは血液がん、例えば、白血病又はリンパ腫である。
【0077】
いくつかの例では、対象は、がんを有するか、又はがんを有するリスクがある。例えば、いくつかの例では、対象は、がん(例えば、がんを発症するためのベースラインのリスクを増加させる突然変異を有すること)に対する遺伝的素因を有する。いくつかの例では、対象は、がんを発症するリスクを増加させる環境(例えば、放射線又は化学物質)に曝露されている。いくつかの例では、対象は、がんの発症について監視される必要がある。いくつかの例では、対象は、例えば、がん療法で治療された後に、がんの進行又は退行について監視される必要がある。いくつかの例では、対象は、がんの再発について監視される必要がある。いくつかの例では、対象は、微小残存病変(MRD)について監視されることを必要とする。いくつかの例では、対象は、がんに対して治療されていたか、又は治療されている。いくつかの例では、対象は、抗がん療法(又は抗がん治療)を用いて治療されていない。
【0078】
いくつかの例では、対象(例えば、患者)は、1つ以上の標的化療法を用いて治療されているか、又はすでに治療されている。いくつかの例では、標的化療法を用いて以前に治療されたことがある患者について、標的化後療法試料(例えば、標本)が得られる(例えば、採集される)。いくつかの例では、標的化後療法試料は、標的化療法の完了後に取得された試料である。
【0079】
いくつかの例では、患者は、標的化療法を用いて以前に治療されていない。いくつかの例では、以前に標的化療法を用いて治療されていない患者について、試料は切除、例えば、最初の切除、又は再発後の切除(例えば、治療後の疾患再発後の切除)を含む。
【0080】
例示的ながんには、限定しないが、B細胞がん(例えば、多発性骨髄腫)、黒色腫、乳がん、肺がん(非小細胞肺がん又はNSCLCなど)、気管支がん、結腸直腸がん、前立腺がん、膵臓がんが含まれるが、これらに限定されない、胃がん、卵巣がん、膀胱がん、脳又は中枢神経系がん、末梢神経系がん、食道がん、子宮頸がん、子宮がん又は子宮内膜がん、口腔又は咽頭がん、肝がん、腎臓がん、精巣がん、胆道がん、小腸又は付属器がん、唾液腺がん、甲状腺がん、副腎腺がん、骨肉腫、軟骨肉腫、血液組織のがん、腺がん、炎症性筋線維芽細胞腫瘍、胃腸間質腫瘍(GIST)、結腸がん、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨髄増殖性障害(MPD)、急性リンパ球性白血病(ALL)、急性骨髄球性白血病(AML)、慢性骨髄球性白血病(CML)、慢性リンパ球性白血病(CLL)、多発性細胞血症ベラ、ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫、脂肪肉腫、骨形成性肉腫、脊索腫、血管肉腫、内皮肉腫滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮がん、基底細胞がん、腺がん、汗腺がん、脂腺がん、乳頭がん、乳頭腺がん、髄質がん、気管支原性がん、腎細胞がん、肝細胞腫、胆管がん、絨毛がん、セミノーマ、胚性がん腫、ウィルムス腫瘍、膀胱がん、上皮がん、神経膠腫、星状細胞腫、髄芽細胞腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽細胞腫、聴神経腫、乏突起膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞腫、細胞リンパ腫、マントル細胞リンパ腫、肝細胞がんa、甲状腺がん、胃がん、頭頸部がん、小細胞がん、本態性血小板血症、アグノーゲン性骨髄性化生、高好酸球性症候群、全身性肥満細胞症、おなじみの高好酸球増加症、慢性好酸球性白血病、神経内分泌がん、がん様腫瘍などが含まれる。
【0081】
いくつかの例では、がんは、血液悪性腫瘍(又は前悪性腫瘍)である。本明細書で使用される場合、血液悪性腫瘍は、造血又はリンパ組織の腫瘍、例えば血液、骨髄、又はリンパ節に影響を及ぼす腫瘍を指す。例示的な血液悪性腫瘍には、白血病(例えば、急性リンパ芽球性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ性白血病(CLL)、慢性骨髄性白血病(CML)、有毛細胞白血病、急性単球性白血病(AMoL)、慢性骨髄単球性白血病(CMML)、若年性骨髄単球性白血病(JMML)、又は大顆粒リンパ球性白血病)、リンパ腫(例えば、AIDS関連リンパ腫、皮膚T細胞リンパ腫、ホジキンリンパ腫(例えば、古典的ホジキンリンパ腫又は結節性リンパ球優位型ホジキンリンパ腫)、菌状息肉症、非ホジキンリンパ腫(例えば、B細胞非ホジキンリンパ腫(例えば、バーキットリンパ腫、小リンパ球性リンパ腫(CLL/SLL)、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、免疫芽球性大細胞リンパ腫、前駆Bリンパ芽球性リンパ腫、又はマントル細胞リンパ腫)又はT細胞非ホジキンリンパ腫(菌状息肉症、未分化大細胞リンパ腫、又は前駆Tリンパ芽球性リンパ腫))、原発性中枢神経系が含まれるが、これらに限定されない。
【0082】
治療オプションは、治療される疾患に依存し得る。がんの治療についての例示的な治療オプションは、限定はしないが、いくつかの例では、例えば、抗がん療法若しくは治療は、ポリ(ADPリボース)ポリメラーゼ阻害剤(PARPi)、キナーゼ阻害剤(例えば、マルチキナーゼ阻害剤若しくはキナーゼ特異的阻害剤)、アルキル化剤、代謝拮抗剤、ホルモン、白金化合物、化学療法、放射線療法、標的化療法(例えば、免疫療法)、外科手術、又はそれらの任意の組み合わせの使用を含み得る。いくつかの実装形態では、治療オプションは、治療薬の投与であり得る。例えば、この方法は、同じ治療薬の2つ以上の異なる投与量についての治療転帰を判定するために使用され得、より良好な転帰を有する投与量が、対象に投与されるために選択され得、かつ/又は対象に投与され得る。いくつかの例では、この方法を使用して、対象に投与される治療薬の投与量を調整し得る。
【0083】
対象特性及び以前の患者の特性
以前の患者の特性又は対象特性は、患者の任意の特徴であり得る。例示的な特性は、限定はしないが、年齢、性別、人種、がん診断年、がん診断後時間、転移性疾患診断後時間、バイオマーカ値、共存症(例えば、糖尿病若しくは心臓病)、以前の療法のリスト(任意選択的に、各々の以前の療法に費やされた時間のリストを更に含み得る)、ベースラインctDNA値、診療所環境(例えば、治療用の社会環境若しくは学術環境)、又は全身状態のうちの1つ以上を含む。例示的なバイオマーカ値は、限定はしないが、EGFRバリアント状態(例えば、腫瘍関連融合の有無)、NTRKバリアント状態(例えば、腫瘍関連融合の有無)、RETバリアント状態(例えば、腫瘍関連融合の有無)、ALK再構成バリアント状態(例えば、腫瘍関連融合の有無)、腫瘍突然変異負荷量(TMB)、HLAヘテロ接合性消失(LOH)状態、バリアントの生殖系列状態、バリアントの体細胞状態、マイクロサテライト不安定性(MSI)状態、相同組換え修復欠損(HRD)状態、全ゲノムヘテロ接合性消失(gLOH)状態、コピー数変化(CAN)状態、PD-L1発現レベル状態、ホルモン受容体状態、PSA発現レベル状態、又はPSA発現レベル増加率を含み得る。いくつかの例では、バイオマーカ値は、1つ以上の遺伝子における、腫瘍関連バリアント、例えば、融合バリアントの有無であり得る。
【0084】
以前の患者の特性及び/又は対象特性の一部又は全部は、それぞれ、以前の患者又は対象から取得された生体試料における核酸分子を配列決定することによって判定され得る。例えば、生体試料中の核酸分子の配列決定を使用して、バイオマーカ値及び/又はベースラインctDNA値を判定することができる。配列読み取り値を使用して、配列読み取り値分析データを生成することができ、配列読み取り値分析データは、対象についてのゲノムプロファイルの一部分であり得る。「配列読み取り値分析データ」は、限定はしないが、バリアントコール(例えば、融合、再構成、ヌクレオチドバリアント、又はコピー変化バリアント)、腫瘍突然変異負荷量、ヘテロ接合性消失、マイクロサテライト不安定性、又は遺伝子発現データを含む、配列決定読み取り値から判定されるデータである。
【0085】
いくつかの例では、開示された方法は、(i)対象(例えば、がんを有することが疑われるか、又はがんを有すると判定された対象)から試料を取得するステップと、(ii)試料から核酸分子(例えば、腫瘍核酸分子と非腫瘍核酸分子との混合物)を抽出するステップと、(iii)試料から抽出された核酸分子に1つ以上のアダプター(例えば、1つ以上の増幅プライマー、フローセルアダプター配列、基質アダプター配列、又は試料インデックス配列)をライゲーションするステップと、(iv)(例えば、ポリメラーゼ連鎖反応(PCR)増幅技術、非PCR増幅技術、又は等温増幅技術を使用して)核酸分子を増幅するステップと、(v)(例えば、捕捉された核酸分子の領域に相補的な領域をそれぞれ含む1つ以上の核酸分子をそれぞれ含む1つ以上のベイト分子へのハイブリダイゼーションによって)増幅された核酸分子から核酸分子を捕捉するステップと、(vi)例えば、次世代(例えば、超並列)シーケンサーを使用して、例えば、次世代(超並列)配列決定技術、全ゲノム配列決定(WGS)技術、全エクソーム配列決定技術、標的配列決定技術、直接配列決定技術、又はサンガー配列決定技術を使用して、試料から抽出された核酸分子(又はそれに由来するライブラリープロキシ)を配列決定するステップと、(vii)対象(又は患者)、介護者、医療提供者、医師、腫瘍学者、電子カルテシステム、病院、診療所、診療所、第三者支払人、保険会社、又は官公庁にレポート(例えば、電子レポート、ウェブベースのレポート、又は紙のレポート)を生成、表示、送信、及び/又は送達するステップと、のうちの1つ以上を更に含み得る。いくつかの例では、レポートは、本明細書に記載の方法からの出力を含む。いくつかの例では、レポートの全部又は一部は、オンライン又はウェブベースのヘルスケアポータルのグラフィカルユーザインターフェースに表示され得る。いくつかの例では、レポートは、コンピュータネットワーク又はピアツーピア接続を介して送信される。
【0086】
開示された方法は、様々な試料のうちのいずれかとともに使用され得る。試料は、対象特性及び/又は以前の患者の特性を判定するために対象又は以前の患者から取得され得る。例えば、いくつかの例では、試料は、組織生検試料、液体生検試料、又は正常対照を含み得る。いくつかの例では、試料は、液体生検試料であり得、血液、血漿、脳脊髄液、痰、便、尿、又は唾液を含み得る。いくつかの例では、試料は、液体生検試料であり得、循環腫瘍細胞(CTC)を含み得る。いくつかの例では、試料は、液体生検試料であり得、無細胞DNA(cfDNA)、循環腫瘍DNA(ctDNA)、又はそれらの組み合わせを含み得る。特定の例では、試料は、ホルマリン固定パラフィン包埋(FFPE)試料であり得る。
【0087】
いくつかの例では、試料は、組織切除(例えば、外科切除)、針生検、骨髄生検、骨髄吸引、皮膚生検、内視鏡生検、細針吸引、口腔スワブ、鼻孔スワブ、膣スワブ、又は細胞学的スメア、スクレイピング、洗浄、又は洗浄(lavage)(乳管洗浄又は気管支肺胞洗浄)などによって採集され得る。
【0088】
他の例では、試料は、1つ以上の前悪性又は悪性細胞を含む。本明細書で使用される場合、前悪性腫瘍とは、まだ悪性ではないが、悪性になる準備ができている細胞又は組織を指す。特定の例では、試料は、固形腫瘍、軟部組織腫瘍、又は転移性病変から取得され得る。特定の例では、試料は、血液悪性腫瘍又は前悪性腫瘍から取得され得る。他の例では、試料は、手術マージンからの組織又は細胞を含み得る。特定の例では、試料は腫瘍浸潤リンパ球を含み得る。いくつかの例では、試料は、1つ以上の非悪性細胞を含み得る。いくつかの例では、試料は、原発性腫瘍又は転移(例えば転移生検試料)であり得るか、又はその一部分である。いくつかの例では、試料は、隣接部位(例えば、腫瘍に隣接する部位)と比較して、腫瘍(例えば、腫瘍細胞)のパーセントが最も高い部位(例えば、腫瘍部位)から取得され得る。いくつかの例では、試料は、隣接部位(例えば、腫瘍に隣接する部位)と比較して、最大の腫瘍病巣(例えば、顕微鏡下で視覚化される最大数の腫瘍細胞)を有する部位(例えば、腫瘍部位)から取得され得る。
【0089】
いくつかの例では、試料から抽出される核酸は、デオキシリボ核酸(DNA)分子を含み得る。開示された方法による分析に適し得るDNAの例には、限定はしないが、ゲノムDNA又はその断片、ミトコンドリアDNA又はその断片、無細胞DNA(cfDNA)、及び循環腫瘍DNA(ctDNA)が含まれる。無細胞DNA(cfDNA)は、アポトーシス及びネクローシスの間に正常及び/又はがん細胞から放出され、血流中を循環しかつ/又は他の体液中に蓄積されるDNAの断片で構成される。循環腫瘍DNA(ctDNA)は、血流中を循環しかつ/又は他の体液中に蓄積されるがん細胞及び腫瘍から放出されるDNAの断片で構成される。いくつかの例において、DNAは、試料由来の有核細胞から抽出される。いくつかの例では、試料は、例えば、試料が主に赤血球、過剰な細胞質を含有する病変細胞、又は線維症を有する組織で構成されるときに、有核細胞性が低い場合がある。いくつかの例では、有核細胞性が低い試料は、DNA抽出のために、より多くの、例えば、より大きな組織体積を必要とし得る。
【0090】
いくつかの例では、試料から抽出された核酸は、リボ核酸(RNA)分子を含み得る。開示された方法による分析に適し得るRNAの例には、限定しないが、総細胞RNA、特定の大量のRNA配列が枯渇した後の総細胞RNA(例えば、リボソームRNA)、無細胞RNA(cfRNA)、メッセンジャーRNA(mRNA)又はその断片、総RNAのポリ(A)尾部mRNA画分、リボソームRNA(rRNA)又はその断片、転移RNA(tRNA)又はその断片、及びミトコンドリアRNA又はその断片が含まれる。いくつかの例では、RNAは、試料から抽出され、例えば、逆転写反応を使用して相補的DNA(cDNA)に変換され得る。いくつかの例において、cDNAは、ランダムプライムcDNA合成法によって作製される。他の例において、cDNA合成は、オリゴ(dT)含有オリゴヌクレオチドによるプライミングによって成熟mRNAのポリ(A)尾部で開始される。枯渇、ポリ(A)濃縮及びcDNA合成のための方法は、当業者に周知である。
【0091】
いくつかの例では、試料は、例えば、腫瘍細胞又は腫瘍細胞核を含む腫瘍細胞含有率を含み得る。いくつかの例では、試料は、少なくとも5~50%、10~40%、15~25%、又は20~30%の腫瘍細胞含有率の腫瘍細胞核を含み得る。いくつかの例では、試料は、少なくとも5%、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、又は少なくとも50%の腫瘍細胞含有率の腫瘍細胞核を含み得る。いくつかの例では、腫瘍細胞核のパーセントは、試料中の腫瘍細胞の数を、核を有する試料中の全ての細胞の総数で割ることによって判定(例えば計算)される。いくつかの例では、例えば、試料が肝細胞を含む肝臓試料であるとき、他の、例えば、非肝細胞の、体細胞核のDNA含有量の2倍、又は2倍を超える核を有する肝細胞の存在に起因して、異なる腫瘍細胞含有率計算が必要になることがある。いくつかの例では、遺伝子変化、例えば、バリアント配列の検出感度、又は例えば、マイクロサテライト不安定性の判定は、試料の腫瘍細胞含有率に依存し得る。例えば、より低い腫瘍細胞含有率を有する試料は、所与のサイズの試料の検出感度がより低くなることがある。
【0092】
いくつかの例では、上記のように、試料は、例えば、腫瘍又は正常組織由来の核酸(例えば、DNA、RNA(若しくはRNA由来のcDNA)、又はその両方)を含む。特定の例では、試料は、例えば、腫瘍又は正常組織由来の非核酸成分、例えば、細胞、タンパク質、炭水化物又は脂質を更に含み得る。
【0093】
DNA又はRNAは、当業者に知られている様々な技法(例えば、国際特許出願公開第2012/092426号(Tan,et al.(2009))の実施例1、“DNA,RNA,and Protein Extraction:The Past and The Present”,J.Biomed.Biotech.2009:574398、the technical literature for the Maxwell(登録商標)16 LEV Blood DNA Kit(Promega Corporation,Madison,WI)、及びthe Maxwell 16 Buccal Swab LEV DNA Purification Kit Technical Manual(Promega Literature #TM333,January 1,2011,Promega Corporation,Madison,WI)を参照)のうちのいずれかを使用して組織試料、生検試料、血液試料、又は他の体液試料から抽出され得る。RNA単離のためのプロトコルは、例えば、Maxwell(登録商標)16 Total RNA Purification Kit Technical Bulletin(Promega Literature#TB351,August 2009,Promega Corporation,Madison,WI)に開示されている。
【0094】
典型的なDNA抽出手順は、例えば、(i)DNAが抽出される流体試料、細胞試料、又は組織試料を採集すること、(ii)必要に応じて細胞膜を破壊(すなわち、細胞溶解)してDNA及び他の細胞質成分を放出すること、(iii)流体試料又は溶解試料を濃縮食塩水で処理してタンパク質、脂質、及びRNAを析出させ、その後、遠心分離によって析出させたタンパク質、脂質、及びRNAを分離すること、(iv)上澄みからDNAを精製して洗剤、タンパク質、塩、又は細胞膜溶解ステップの間に使用される他の試薬を除去することを含む。
【0095】
細胞膜の破壊は、様々な機械的剪断(例えば、フレンチプレス若しくは細針を貫通させることによって)又は超音波破壊技法を使用して実行され得る。細胞溶解ステップは、洗剤及び界面活性剤を使用して脂質、細胞膜、及び核膜を可溶化することを含むことが多い。いくつかの例では、溶解ステップは、プロテアーゼを使用してタンパク質を分解すること、及び/又はRNaseを使用して試料中のRNAを消化することを更に含み得る。
【0096】
DNA精製のための好適な技法の例には、限定はしないが、(i)凍結エタノール又はイソプロパノールにおける析出を行い、その後、遠心分離を行う(DNAの析出は、イオン強度を増し、例えば、酢酸ナトリウムを添加することによって強化され得る)こと、(ii)フェノール-クロロホルム抽出を行い、その後、遠心分離を行ってタンパク質を含む有機相から核酸を含む水相を分離すること、並びに(iii)核酸が、緩衝液のpH及び塩濃度に応じて個相(例えば、シリカなど)に吸着される個相クロマトグラフィが含まれる。
【0097】
いくつかの例では、プロテアーゼを添加するか、又は酢酸ナトリウム若しくは酢酸アンモニウムによってタンパク質を析出させるか、又はDNA析出ステップの前のフェノール-クロロホルム混合物による抽出によって、DNAに結合された細胞及びヒストンタンパク質が除去され得る。
【0098】
いくつかの例では、DNAは、様々な好適な市販のDNA抽出及び精製キットのうちのいずれかを使用して抽出され得る。例には、限定はしないが、Qiagen(Germantown,MD)からのQIAamp(ヒト試料からゲノムDNAを単離するための)キット及びDNAeasy(動物若しくは植物試料からゲノムDNAを単離するための)キット、又はPromega(Madison,WI)からのMaxwell(登録商標)及びReliaPrep(商標)シリーズのキットが含まれる。
【0099】
上記のように、いくつかの例では、試料は、ホルマリン固定(ホルムアルデヒド固定又はパラホルムアルデヒド固定としても知られる)、パラフィン包埋(FFPE)組織標本を含み得る。例えば、FFPE試料は、マトリクスに包埋された組織試料、例えば、FFPEブロックであり得る。ホルムアルデヒド固定又はパラホルムアルデヒド固定、パラフィン包埋(FFPE)組織から核酸(例えば、DNA)を分離する方法は、例えば、Cronin,et al.,(2004)Am J Pathol.164(1):35-42;Masuda,et al.,(1999)Nucleic Acids Res.27(22):4436-4443、Specht,et al.,(2001)Am J Pathol.158(2):419-429;the Ambion RecoverAll(商標)Total Nucleic Acid Isolation Protocol(Ambion,Cat.No.AM1975,September 2008)、the Maxwell(登録商標)16 FFPE Plus LEV DNA Purification Kit Technical Manual(Promega Literature #TM349,February 2011)、the E.Z.N.A.(登録商標)FFPE DNA Kit Handbook (OMEGA bio-tek,Norcross,GA,product numbers D3399-00,D3399-01,and D3399-02,June 2009)、及びthe QIAamp(登録商標)DNA FFPE Tissue Handbook(Qiagen,Cat.No.37625,October 2007)に開示されている。例えば、RecoverAll(商標)Total Nucleic Acid Isolation Kitは、高温でキシレンを使用して、パラフィン包埋試料を可溶化し、ガラス繊維フィルタにかけて核酸を捕捉する。Maxwell(登録商標)16 FFPE Plus LEV DNA Purification Kitを、Maxwell(登録商標)16 Instrumentとともに、FFPE組織の1~10μmの切片のゲノムDNAを精製するために使用する。シリカクラッド常磁性粒子(PMP)を用いてDNAを精製し、低溶出容量で溶出する。E.Z.N.A.(登録商標)FFPE DNA Kitは、ゲノムDNAの単離のためにスピンカラム及び緩衝系を使用する。QIAamp(登録商標)DNA FFPE Tissue Kitは、ゲノム及びミトコンドリアDNAの精製にQIAamp(登録商標)DNA Micro technologyを使用する。
【0100】
いくつかの例では、開示された方法は、試料から抽出された核酸についての収率を判定又は取得することと、判定された値を参照値と比較することと、を更に含み得る。例えば、判定又は取得された値が参照値未満である場合、ライブラリ構築に進む前に核酸が増幅され得る。いくつかの例では、開示された方法は、試料中の核酸精製のサイズ(又は平均サイズ)の値を判定又は取得することと、判定又は取得された値を参照値、例えば、少なくとも100、200、300、400、500、600、700、800、900、又は1000個の塩基対(bps)のサイズ(又は平均サイズ)と比較することと、を更に含み得る。いくつかの例では、この判定に応答して本明細書に記載の1つ以上のパラメータが調整又は選択され得る。
【0101】
単離後に、核酸を典型的には、わずかにアルカリ性の緩衝液、例えば、トリス-EDTA(TE)緩衝液、又は超純水に溶解させる。いくつかの例では、単離された核酸(例えば、ゲノムDNA)は、当業者に周知の様々な技法のうちのいずれかを使用することによって精製化又は剪断され得る。例えば、ゲノムDNAは、物理的剪断法、酵素的切断法、化学的切断法、及び当業者に周知の他の方法によって断片化することができる。国際特許出願公開第2012/092426号の実施例4には、DNA剪断のための方法が記載されている。いくつかの例では、DNA剪断法の代替法を使用して、ライブラリ調製中のライゲーションステップを回避することもできる。
【0102】
いくつかの例では、試料から単離された核酸を使用して、ライブラリ(例えば、本明細書で説明するような核酸ライブラリ)を構築し得る。いくつかの例では、核酸は、上記で説明した方法のいずれかを使用して断片化され、任意選択的に鎖末端損傷を修復され、任意選択的に合成アダプター、プライマー、及び/若しくはバーコード(例えば、増幅プライマー、配列決定アダプター、フローセルアダプター、基板アダプター、試料バーコード若しくはインデックス、及び/又は一意の分子識別子配列)にライゲーションされ、(例えば、調製用ゲル電気泳動によって)サイズ選択され、かつ/又は(例えば、PCR、非PCR増幅技法、又は等温増幅技法を使用して)増幅される。他の例では、断片化及びアダプターライゲーションされた核酸群は、標的配列のハイブリダイゼーションベースの選択の前に明示的なサイズ選択又は増幅なしに使用される。いくつかの例では、核酸は、当業者に周知の様々な特異的又は非-特異的核酸増幅方法のうちのいずれかによって増幅される。いくつかの例では、核酸は、例えば、ランダムプライム鎖置換増幅などの全ゲノム増幅法によって増幅される。次世代配列決定のための核酸ライブラリ調製技法の例は、例えば、van Dijk,et al.(2014),Exp.Cell Research 322:12-20、及びIlluminaのゲノムDNA試料調製キットに記載されている。
【0103】
いくつかの例では、核酸ライブラリは、ゲノムの複雑さの全て又は実質的に全てを含み得る。この文脈における「実質的に全て」という用語は、実際には、手順の初期工程中にゲノム複雑性のいくらかの望ましくない喪失があり得る可能性を指す。本明細書中に記載される方法はまた、核酸ライブラリがゲノムの一部分を含む場合、例えば、ゲノムの複雑性が設計によって低減される場合に有用である。いくつかの例では、ゲノムの任意の選択された部分は、本明細書中に記載される方法とともに使用され得る。例えば、特定の実施形態では、エクソーム全体又はそのサブセットが単離される。いくつかの例では、ライブラリは、ゲノムDNAの少なくとも95%、90%、80%、70%、60%、50%、40%、30%、20%、10%、又は5%を含み得る。いくつかの例では、ライブラリは、ゲノムDNAの少なくとも95%、90%、80%、70%、60%、50%、40%、30%、20%、10%、又は5%のコピーを含むゲノムDNAのcDNAコピーからなり得る。特定の例では、核酸ライブラリを生成するために使用される核酸の量は、5マイクログラム未満、1マイクログラム未満、又は500ng未満、200ng未満、100ng未満、50ng未満、10ng未満、5ng未満、又は1ng未満であり得る。
【0104】
いくつかの例では、ライブラリ(例えば、核酸ライブラリ)は、核酸分子の集合を含む。本明細書に記載されるように、ライブラリの核酸分子は、標的核酸分子(例えば、腫瘍核酸分子、参照核酸分子及び/又は制御核酸分子;本明細書ではそれぞれ第1、第2及び/又は第3の核酸分子とも称される)を含むことができる。ライブラリの核酸分子は、単一の対象又は個体に由来し得る。いくつかの例では、ライブラリは、2人以上の対象(例えば、2人、3人、4人、5人、6人、7人、8人、9人、10人、20人、30人、又はそれ以上の対象)由来の核酸分子を含むことができる。例えば、異なる対象からの2つ以上のライブラリを組み合わせて、2人以上の対象からの核酸分子を有するライブラリを形成することができる(各対象由来の核酸分子は、任意選択的に特定の対象に対応する一意の試料バーコードにライゲーションされる)。いくつかの例では、対象は、がん若しくは腫瘍を有するか、又は有するリスクがあるヒトである。
【0105】
いくつかの例では、ライブラリ(又はその一部分)は、1つ以上のサブゲノム区間を含み得る。いくつかの例では、サブゲノム区間は、単一ヌクレオチド位置であり得、例えば、その位置のバリアントは、腫瘍表現型と(陽性又は陰性に)関連付けられる。いくつかの例では、サブゲノム区間は、2つ以上のヌクレオチド位置を含む。そのような例は、少なくとも2、5、10、50、100、150、250、又は250個より多いヌクレオチド位置の長さの配列を含む。サブゲノム区間は、例えば、1つ以上の遺伝子全体(若しくはその一部分)、1つ以上のエクソン若しくはコード配列(若しくはその一部分)、1つ以上のイントロン(若しくはその一部分)、1つ以上のマイクロサテライト領域(若しくはその一部分)、又はそれらの任意の組み合わせを含むことができる。サブゲノム区間は、自然に発生する核酸分子、例えば、ゲノムDNA分子の断片の全部又は一部分を含むことができる。例えば、サブゲノム区間は、配列決定反応に供されるゲノムDNAの断片に対応し得る。いくつかの例では、サブゲノム区間は、ゲノム供給源からの連続配列である。いくつかの例では、サブゲノム区間は、ゲノム中で連続していない配列を含み、例えば、cDNA中のサブゲノム区間は、スプライシングの結果として形成されたエクソン-エクソン接合部を含み得る。いくつかの例では、サブゲノム区間は腫瘍核酸分子を含む。いくつかの例では、サブゲノム区間は、非腫瘍核酸分子を含む。
【0106】
本明細書に記載の方法は、例えば、本明細書に記載のゲノム遺伝子座(例えば、遺伝子座又はその断片)のセットから、複数の対象区間(例えば、標的配列)又は対象区間のセットを評価する方法と組み合わせて、又はその一部分として使用することができる。
【0107】
いくつかの例では、開示された方法によって評価されるゲノム遺伝子座のセットは、突然変異形態において、細胞分裂、増殖若しくは生存に対する効果に関連するか、又はがん、例えば、本明細書に記載のがんに関連する複数の、例えば、遺伝子を含む。
【0108】
いくつかの例では、開示された方法によって評価される遺伝子座のセットは、少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、少なくとも10個、少なくとも20個、少なくとも30個、少なくとも40個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、又は100個より多い遺伝子座を含む。
【0109】
いくつかの例では、選択される遺伝子座(本明細書では標的遺伝子座若しくは標的配列とも称される)、又はその断片は、対象ゲノムの非コード配列、コード配列、遺伝子内領域、又は遺伝子間領域を含む対象区間を含み得る。例えば、対象区間は、非コード配列又はその断片(例えば、プロモーター配列、エンハンサー配列、5’非翻訳領域(5’UTR)、3’非翻訳領域(3’UTR)、又はその断片)、コード配列又はその断片、エクソン配列又はその断片、イントロン配列又はその断片を含むことができる。
【0110】
本明細書に記載の方法は、核酸ライブラリを複数の標的捕捉試薬に接触させて、分析のために、複数の特定の標的配列(例えば、遺伝子配列又はその断片)を選択し、捕捉することを含み得る。いくつかの例では、標的捕捉試薬(すなわち、標的分子に結合し、それによって、標的分子の捕捉を可能にする分子)を使用して、分析される対象区間を選択する。例えば、標的捕捉試薬は、標的分子にハイブリダイズし(すなわち、補完し)、それによって標的核酸の捕捉を可能にすることができるベイト分子、例えば、核酸分子(例えば、DNA分子又はRNA分子)であり得る。いくつかの例では、標的捕捉試薬、例えば、ベイト分子(又はベイト配列)は、捕捉オリゴヌクレオチド(又は捕捉プローブ)である。いくつかの例では、標的核酸は、ゲノムDNA分子、RNA分子、RNA由来のcDNA分子、マイクロサテライトDNA配列などである。いくつかの例では、標的捕捉試薬は、標的への溶液相ハイブリダイゼーションに適している。いくつかの例では、標的捕捉試薬は、標的への個相ハイブリダイゼーションに適している。いくつかの例では、標的捕捉試薬は、標的への溶液相ハイブリダイゼーション及び個相ハイブリダイゼーションの両方に適している。標的捕捉試薬の設計及び構築は、例えば、国際特許出願公開第2020/236941号により詳細に記載されており、その内容全体が参照により本明細書に組み込まれる。
【0111】
本明細書に記載の方法は、標的捕捉試薬を適切に選択して、配列決定される標的核酸分子を選択することによって、1人以上の対象からの試料(例えば、がん組織検体、液体生検試料など)からの多数のゲノム遺伝子座(例えば、遺伝子又は遺伝子産物(例えば、mRNA)、マイクロサテライト座など)の最適化された配列決定を可能にする。いくつかの例では、標的捕捉試薬は、特定の標的座、例えば、特定の標的遺伝子座又はその断片にハイブリダイズし得る。いくつかの例では、標的捕捉試薬は、標的座の特定のグループ、例えば、遺伝子座又はその断片の特定のグループにハイブリダイズし得る。いくつかの例では、標的特異的及び/又はグループ特異的標的捕捉試薬の混合物を含む複数の標的捕捉試薬が使用され得る。
【0112】
いくつかの例では、核酸配列決定のために複数の標的配列を捕捉するために核酸ライブラリに接触させる複数の標的捕捉試薬(例えば、ベイトセット)における標的捕捉試薬(例えば、ベイト分子)の数は、10個を超えるか、50個を超えるか、100個を超えるか、200個を超えるか、300個を超えるか、400個を超えるか、500個を超えるか、600個を超えるか、700個を超えるか、800個を超えるか、900個を超えるか、1000個を超えるか、1250個を超えるか、1500個を超えるか、1750個を超えるか、2000個を超えるか、3000個を超えるか、4000個を超えるか、5000個を超えるか、10000個を超えるか、25000個を超えるか、又は50000個を超える。
【0113】
いくつかの例では、標的捕捉試薬配列の全長は、約70ヌクレオチド~1000ヌクレオチドであり得る。一例では、標的捕捉試薬の長さは、約100~300ヌクレオチド、110~200ヌクレオチド、又は120~170ヌクレオチドの長さである。上記のものに加えて、約70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、300、400、500、600、700、800及び900ヌクレオチド長の中間オリゴヌクレオチド長を本明細書に記載の方法で使用することができる。いくつかの実施形態において、約70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220又は230塩基のオリゴヌクレオチドを使用することができる。
【0114】
いくつかの例では、各標的捕捉試薬配列は、(i)標的特異的捕捉配列(例えば、遺伝子座又はマイクロサテライト座特異的補配列)、(ii)アダプター、プライマー、バーコード、及び/又は一意の分子識別子配列、並びに(iii)一方又は両方の末端上の普遍尾部を含むことができる。「標的捕捉試薬」という用語を本明細書で使用する場合、標的特異的標的捕捉配列又は標的特異的標的捕捉配列を含む標的捕捉試薬オリゴヌクレオチド全体を指すことがある。
【0115】
いくつかの例では、標的捕捉試薬中の標的特異的捕捉配列は、約40ヌクレオチド~1000ヌクレオチド長である。いくつかの例では、標的特異的捕捉配列は、約70ヌクレオチド~300ヌクレオチド長である。いくつかの例では、標的特異的配列は、約100ヌクレオチド~200ヌクレオチド長である。更に他の例では、標的特異的配列は、約120ヌクレオチド~170ヌクレオチド長、典型的には120ヌクレオチド長である。上記のものに加えて、中間の長さ、例えば、約40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、300、400、500、600、700、800及び900ヌクレオチド長の標的特異的配列、並びに上記の長さの間の長さの標的特異的配列もまた、本明細書中に記載される方法において使用され得る。
【0116】
いくつかの例では、標的捕捉試薬は、1つ以上の再構成を含む対象区間、例えば、ゲノム再構成を含むイントロンを選択するように設計され得る。そのような例では、標的捕捉試薬は、選択効率を高めるために反復配列がマスクされるように設計される。再構成が既知の連結配列を有する実施形態では、相補的標的捕捉試薬を、連結配列を認識して選択効率を高めるように設計することができる。
【0117】
いくつかの例では、開示された方法は、2つ以上の異なる標的カテゴリを捕捉するように設計された標的捕捉試薬の使用を含み得、各カテゴリは異なる標的捕捉試薬設計戦略を有する。いくつかの例では、本明細書で開示されるハイブリダイゼーションベースの捕捉方法及び標的捕捉試薬組成物は、標的配列のセットの捕捉及び均質カバレッジを提供し、一方、配列の標的化セット以外のゲノム配列のカバレッジを最小限に抑え得る。いくつかの例では、標的配列は、ゲノムDNAからのエクソーム全体又はその選択されたサブセットを含み得る。いくつかの例では、標的配列は、大きな染色体領域(例えば、染色体腕全体)を含み得る。本明細書に開示される方法及び組成物は、標的核酸配列の複合セットについての異なる配列決定深さ及びカバレッジのパターンを達成するための異なる標的捕捉試薬を提供する。
【0118】
典型的には、DNA分子が標的捕捉試薬配列として使用されるが、RNA分子も使用することができる。いくつかの例では、DNA分子標的捕捉試薬は、一本鎖DNA(ssDNA)又は二本鎖DNA(dsDNA)であり得る。いくつかの例では、RNA-DNA二重鎖は、DNA-DNA二重鎖よりも安定であり、したがって、潜在的により良好な核酸の捕捉を提供する。
【0119】
いくつかの例では、開示された方法は、1つ以上の核酸ライブラリから捕捉された核酸分子の選択されたセット(例えば、ライブラリキャッチ)を提供することを含む。例えば、方法は、各々が、1人以上の対象由来の1つ以上の試料から抽出された複数の核酸分子(例えば、複数の標的核酸分子及び/又は基準核酸分子)を含む、1つ以上の核酸ライブラリを提供することであって、1つ以上のライブラリを(例えば、溶液ベースのハイブリダイゼーション反応において)1つ、2つ、3つ、4つ、5つ、又は5つより多い複数の標的捕捉試薬(例えば、オリゴヌクレオチド標的捕捉試薬)と接触させて、複数の標的捕捉試薬/核酸分子ハイブリッドを含むハイブリダイゼーション混合物を形成することと、例えば、上記ハイブリダイゼーション混合物を、ハイブリダイゼーション混合物から上記複数の標的捕捉試薬/核酸分子ハイブリッドを分離するのを可能にする結合エンティティと接触させることによって、上記ハイブリダイゼーション混合物から複数の標的捕捉試薬/核酸分子ハイブリッドを分離し、それによって、ライブラリキャッチ(例えば、1つ以上のライブラリ由来の核酸分子も選択又は濃縮されたサブグループ)を提供することと、を含み得る。
【0120】
いくつかの例では、開示された方法は、(例えば、PCRを実行することによって)ライブラリキャッチを増幅することを更に含み得る。他の例では、ライブラリキャッチは増幅されない。
【0121】
いくつかの例では、標的捕捉試薬は、任意選択的に、説明書、標準、緩衝液若しくは酵素又は他の試薬を含むことができるキットの一部分であり得る。
【0122】
上記のように、本明細書で開示された方法は、ライブラリ(例えば、核酸ライブラリ)を複数の標的捕捉試薬に接触させて、選択されたライブラリ標的核酸配列(すなわち、ライブラリキャッチ)を提供するステップを含み得る。接触ステップは、例えば、溶液ベースのハイブリダイゼーションで行うことができる。いくつかの例では、この方法は、1回以上の更なる溶液ベースのハイブリダイゼーションについてハイブリダイゼーションステップを繰り返すことを含む。いくつかの例では、この方法は、ライブラリキャッチを、同じか又は異なる標的捕捉試薬の集合との1回以上の更なる溶液ハイブリダイゼーションに供することを更に含む。
【0123】
いくつかの例では、接触ステップは、固体支持体、例えば、アレイ中で行われる。ハイブリダイゼーション用の好適な個体支持体は、例えば、Albert,T.J.et al.(2007)Nat.Methods 4(11):903-5、Hodges,E.et al.(2007)Nat.Genet.39(12):1522-7、及びOkou,D.T.et al.(2007)Nat.Methods 4(11):907-9に記載されており、これらの文献の内容は、参照によりその全体が本明細書に組み込まれる。
【0124】
本明細書の方法での使用に適合させることができるハイブリダイゼーション方法は、例えば、国際特許出願公開第2012/092426号に記載されているように、当技術分野で記載されている。標的捕捉試薬を複数の標的核酸にハイブリダイズするための方法は、国際特許出願公開第2020/236941号により詳細に記載されており、その内容全体が、参照により本明細書に組み込まれる。
【0125】
本明細書で開示された方法及びシステムは、核酸を配列決定して、試料中のサブゲノム区間内の1つ以上の遺伝子座と重なり合う複数の配列読み取り値を生成し、それによって、複数の遺伝子座における対立遺伝子配列を判定するための方法若しくはシステム(例えば、次世代配列決定システム)と組み合わせて、又はそれらの一部分として使用することができる。本明細書で使用される場合、「次世代配列決定」すなわち「NGS」は、「大量並行配列決定」とも称され、個々の核酸分子のヌクレオチド配列(例えば、一分子配列決定と同様)又は個々の核酸分子のクローン的に拡大されたプロキシ(例えば、103、104、105を超える分子又はそれを超える分子が同時に配列決定される)をハイスループット方式で判定する任意の配列決定方法を指す。
【0126】
次世代配列決定法は、当技術分野で公知であり、例えば、参照により本明細書に組み込まれるMetzker、M.(2010)Nature Biotechnology Reviews11:31-46に記載されている。本明細書で開示された方法及びシステムを実施するときに使用するのに適した配列決定方法の他の例は、例えば、国際特許出願公開第2012/092426号に記載されている。いくつかの例では、配列決定は、例えば、全ゲノム配列決定(WGS)、全エクソーム配列決定、ターゲット配列決定、又はダイレクト配列決定を含み得る。いくつかの例では、配列決定は、例えば、サンガー配列決定を使用して実行され得る。いくつかの例では、配列決定は、断片の両端の配列決定を可能にし、例えば、ゲノム再構成、反復配列要素、遺伝子融合、及び新規の転写物を検出するための高品質でアラインメント可能な配列データを生成するペアエンド配列決定技法を含み得る。
【0127】
開示された方法及びシステムは、Roche 454、Illumina Solexa、ABI-SOLiD、ION Torrent、Complete Genomics、Pacific Bioscience、Helicos、及び/又はPolonatorプラットフォームなどの配列決定プラットフォームを使用して実装され得る。いくつかの例では、配列決定は、Illumina MiSeq配列決定を含み得る。いくつかの例では、配列決定は、Illumina HiSeq配列決定を含み得る。いくつかの例では、配列決定は、Illumina NovaSeq配列決定を含み得る。試料から抽出された核酸中の多数の標的ゲノム遺伝子座を配列決定するための最適化された方法は、例えば、国際特許出願公開第2020/236941号により詳細に記載されており、その内容全体が、参照により本明細書に組み込まれる。
【0128】
いくつかの例では、開示された方法は、(a)試料由来の複数の正常及び/又は腫瘍核酸分子を含むライブラリを取得することと、(b)ライブラリを、標的捕捉試薬の標的核酸分子へのハイブリダイゼーションを可能にする条件下で1つ、2つ、3つ、4つ、5つ、又は5つより多い複数の標的捕捉試薬に接触させ、それによって、捕捉された正常及び/又は腫瘍核酸分子の選択されたセット(すなわち、ライブラリキャッチ)を提供することと、(c)例えば、ハイブリダイゼーション混合物を、ハイブリダイゼーション混合物から標的捕捉試薬/核酸分子ハイブリッドを分離するのを可能にする結合エンティティと接触させることによって、ハイブリダイゼーション混合物から核酸分子の選択されたサブセット(例えば、ライブラリキャッチ)を分離することと、(d)ライブラリキャッチを配列決定して、1つ以上の対象区間(例えば、1つ以上の標的配列)と重なり合う複数の読み取り値(例えば、配列読み取り値)を、突然変異(若しくは変化)、例えば、体細胞突然変異若しくは生殖細胞突然変異を含むバリアント配列を含み得る上記ライブラリキャッチから取得することと、(e)本明細書の他の部分で説明するアラインメント方法を使用して上記配列読み取り値をアラインメントすること、並びに/以上の配列読み取り値のうちの1つ以上の配列読み取り値から対象区間内のヌクレオチド位置のヌクレオチド値を割り当てる(例えば、ベイズ方法若しくは本明細書で説明する他の方法を使用して突然変異を呼び出す)ことと、を含む。
【0129】
いくつかの例では、1つ以上の対象区間についての配列読み取り値を取得することは、少なくとも1つ、少なくとも5つ、少なくとも10個、少なくとも20個、少なくとも30個、少なくとも40個、少なくとも150個、少なくとも200個、少なくとも250個、少なくとも300個、少なくとも350個、少なくとも400個、少なくとも450個、少なくとも500個、少なくとも550個、少なくとも600個、少なくとも650個、少なくとも700個、少なくとも750個、少なくとも800個、少なくとも850個、少なくとも900個、少なくとも950個、少なくとも1000個、少なくとも1250個、少なくとも1500個、少なくとも1750個、少なくとも2000個、少なくとも2250個、少なくとも2500個、少なくとも2750個、少なくとも3000個、少なくとも3500個、少なくとも4000個、少なくとも4500個、少なくとも5000個の座を配列決定することを含み得る。いくつかの例では、1つ以上の対象区間についての配列読み取り値を取得することは、このパラグラフに記載された範囲内の任意の数の座、例えば、少なくとも2850個の遺伝子座について対象区間を配列決定することを含み得る。
【0130】
いくつかの例では、1つ以上の対象区間についての配列読み取り値を取得することは、少なくとも20塩基、少なくとも30塩基、少なくとも40塩基、少なくとも50塩基、少なくとも60塩基、少なくとも70塩基、少なくとも80塩基、少なくとも90塩基、少なくとも100塩基、少なくとも120塩基、少なくとも140塩基、少なくとも160塩基、少なくとも180塩基、少なくとも200塩基、少なくとも220塩基、少なくとも240塩基、少なくとも260塩基、少なくとも280塩基、少なくとも300塩基、少なくとも320塩基、少なくとも340塩基、少なくとも360塩基、少なくとも380塩基、又は少なくとも400塩基の配列読み取り値長(又は平均配列読み取り値長)を提供する配列決定法を用いて対象区間を配列決定することを含む。いくつかの例では、1つ以上の対象区間についての配列読み取り値を取得することは、このパラグラフに記載された範囲内の任意の数の塩基の配列読み取り値長(又は平均配列読み取り値長)、例えば、56塩基の配列読み取り値長(又は平均配列読み取り値長)を提供する配列決定法を用いて対象区間を配列決定することを含み得る。
【0131】
いくつかの例では、1つ以上の対象区間についての配列読み取り値を取得することは、平均で少なくとも100x以上のカバレッジ(又は深さ)を用いて配列決定することを含み得る。いくつかの例では、1つ以上の対象区間についての配列読み取り値を取得することは、平均で少なくとも100x、少なくとも150x、少なくとも200x、少なくとも250x、少なくとも500x、少なくとも750x、少なくとも1000x、少なくとも1500x、少なくとも2000x、少なくとも2500x、少なくとも3000x、少なくとも3500x、少なくとも4000x、少なくとも4500x、少なくとも5000x、少なくとも5500x、又は少なくとも6000x、又はそれよりも大きいカバレッジ(又は深さ)を用いて配列決定することを含み得る。いくつかの例では、1つ以上の対象区間についての配列読み取り値を取得することは、このパラグラフに記載された範囲内の任意の値を有する平均カバレッジ(又は深さ)、例えば、少なくとも160xを用いて配列決定することを含み得る。
【0132】
いくつかの例では、1つ以上の対象区間についての配列読み取り値を取得することは、少なくとも100xから配列決定された遺伝子座の約90%、92%、94%、95%、96%、97%、98%、又は99%を超える少なくとも6000xまでの範囲の任意の値を有する平均配列決定深さを用いて配列決定することを含む。例えば、いくつかの例では、対象区間についての読み取り値を取得することは、配列決定された遺伝子座の少なくとも99%について少なくとも125xの平均配列決定深さを用いて配列決定することを含む。別の例として、いくつかの例では、対象区間についての読み取り値を取得することは、配列決定された遺伝子座の少なくとも95%について少なくとも4100xの平均配列決定深さを用いて配列決定することを含む。
【0133】
いくつかの例では、ライブラリ中の核酸種の相対存在量は、配列決定実験によって生成されたデータ中のそれらの同族配列の出現の相対数(例えば、所与の同族配列についての配列読み取り値の数)をカウントすることによって推定することができる。
【0134】
いくつかの例では、開示された方法及びシステムは、本明細書で説明するように、対象区間(例えば、遺伝子座)のセットについてのヌクレオチド配列を提供する。特定の例では、配列は、マッチする正常対照(例えば、野生型対照)及び/又はマッチする腫瘍対照(例えば、原発性対転移性)を含む方法を使用せずに提供される。
【0135】
いくつかの実施形態において、配列決定深さのレベル(例えば、配列決定深さのX倍レベル)が、本明細書中で使用されるときは、重複読み取り値、例えば、PCR重複読み取り値の検出及び除去の後における読み取り値の数(例えば、一意の読み取り値)を示す。他の例では、例えば、コピー数変化(CNA)の検出を支援するために、重複読み取り値が評価される。
【0136】
アラインメントは、読み取り値をある位置、例えば、ゲノム位置又は座とマッチングさせるプロセスである。いくつかのでは、NGS読み取り値は、参照配列(例えば、野生型配列)にアラインメントされ得る。いくつかの例では、NGS読み取り値は、新たにアセンブルされ得る。NGSの配列アラインメントの方法は、例えば、Trapnell C.and Salzberg S.L.Nature Biotech.,2009,27:455-457に記載されている。デノボ配列アセンブリの例は、例えば、Warren R.et al.、Bioinformatics、2007、23:500-501、Butler J.他、Genome Res.、2008、18:810~820;及びZerbino D.R.and Birney E.、Genome Res.、2008、18:821-829に記載されている。配列アラインメントの最適化は、例えば、国際特許出願公開第2012/092426号に記載されているように、当技術分野で説明されている。配列アラインメント方法についての更なる説明は、例えば、国際特許出願公開第2020/236941号に記載されており、その内容全体が参照により本明細書に組み込まれる。
【0137】
ミスアラインメント(例えば、ゲノム内の不正確な位置における短い読み取り値からの塩基対の配置)、例えば、実際のがん突然変異の周りの読み取り値の配列コンテキスト(例えば、反復配列の存在)に起因するミスアラインメントは、代替対立遺伝子の読み取り値が、代替対立遺伝子読み取り値のヒストグラムピークからシフトされ得るので、突然変異検出の感度の低下をもたらし得る。ミスアラインメントを生じさせ得る配列コンテキストの他の例には、ショートタンデムリピート、散在性反復、低複雑さ領域、挿入-欠失(インデル)、及びパラログが含まれる。実際の突然変異が存在しない場合に問題のある配列状況が生じる場合、ミスアラインメントは、参照ゲノム塩基の実際の読み取り値を誤った位置に配置することによって、「突然変異」対立遺伝子のアーチファクト読み取り値を投入し得る。多重遺伝子分析のための突然変異呼び出しアルゴリズムは、低存在量の突然変異に対しても感度が高くなければならないので、これらのミスアラインメントは偽陽性発見率を増加させ/特異性を低下させ得る。
【0138】
いくつかの例では、本明細書で開示される方法及びシステムは、複数の個別に調整されるアラインメント方法又はアルゴリズムを統合して、配列決定方法、特に、多数の多様なゲノム遺伝子座における多数の多様な遺伝イベントの大量並行配列決定に依存する方法における塩基呼び出し性能を最適化し得る。いくつかの例では、開示された方法及びシステムは、1つ以上のグローバルアラインメントアルゴリズムの使用を含み得る。いくつかの例では、開示された方法及びシステムは、1つ以上のローカルアラインメントアルゴリズムの使用を含み得る。使用され得るアラインメントアルゴリズムの例には、限定はしないが、Burrows-Wheeler Alignment(BWA)ソフトウェアバンドル(例えば、Li,et al.(2009),“Fast and Accurate Short Read Alignment with Burrows-Wheeler Transform”,Bioinformatics 25:1754-60、Li,et al.(2010),Fast and Accurate Long-Read Alignment with Burrows-Wheeler Transform”,Bioinformatics epub.PMID:20080505を参照されたい)、Smith-Watermanアルゴリズム(例えば、Smith,et al.(1981),“Identification of Common Molecular Subsequences”,J.Molecular Biology 147(1):195-197を参照されたい)、Striped Smith-Waterman アルゴリズム(例えば、Farrar(2007),“Striped Smith-Waterman Speeds Database Searches Six Times Over Other SIMD Implementations”,Bioinformatics 23(2):156-161を参照されたい)、Needleman-Wunschアルゴリズム(Needleman,et al.(1970)“A General Method Applicable to the Search for Similarities in the Amino Acid Sequence of Two Proteins”,J.Molecular Biology 48(3):443-53)、又はそれらの任意の組み合わせが含まれる。
【0139】
いくつかの例では、本明細書で開示された方法及びシステムは、配列アセンブリアルゴリズム、例えば、Arachne配列アセンブリアルゴリズム(例えば、Batzoglou,et al.(2002),“ARACHNE:A Whole-Genome Shotgun Assembler”,Genome Res.12:177-189を参照されたい)の使用を含み得る。
【0140】
いくつかの例では、配列読み取り値を分析するために使用されるアラインメント方法は、異なるゲノム遺伝子座における異なるバリアント(例えば、点突然変異、挿入、欠失など)の検出に個別にカスタマイズされることも調整されることもない。いくつかの例では、異なるアラインメント方法を使用して、異なるゲノム遺伝子座において検出される異なるバリアントの少なくともサブセットの検出に個別にカスタマイズされるか又は調整された読み取り値を分析する。いくつかの例では、異なるアラインメント方法を使用して、異なるゲノム遺伝子座における各異なるバリアントを検出するように個別にカスタマイズされるか又は調整された読み取り値を分析する。いくつかの例では、調整は、(i)遺伝子座(例えば、遺伝子座、マイクロサテライト座、又は他の対象区間)の配列決定、(ii)試料に関連付けられた腫瘍タイプ、(iii)バリアントの配列決定、又は(iv)試料若しくは対象の特性のうちの1つ以上の関数とすることができる。配列決定されるいくつかの特定の対象区間に個別に調整されるアラインメント条件の選択又は使用は、速度、感度及び特異性の最適化を可能にする。この方法は、比較的多数の多様な対象区間に対する読み取り値のアラインメントが最適化される場合に特に有効である。いくつかの例では、方法は、再構成のために最適化されたアラインメント方法を、再構成に関連しない対象区間のために最適化された他のアラインメント方法と組み合わせて使用することを含む。
【0141】
一実施形態において、方法は、配列読み取り値を分析、例えば、アラインメントするためのアラインメント方法を選択又は使用することを更に含み、上記アラインメント方法は、(i)腫瘍タイプ、例えば、試料中の腫瘍タイプ、(ii)配列決定されている対象区間の位置(例えば、遺伝子座)、(iii)配列決定されている対象区間内のバリアントのタイプ(例えば、点突然変異、挿入、欠失、置換、コピー数変化(CNV)、再構成、又は融合)、(iv)分析されている部位(例えば、ヌクレオチド位置)、(v)試料のタイプ(例えば、本明細書に記載の試料)、及び/又は(vi)(例えば、対象区間内又は対象区間近傍における反復配列の存在に起因する対象区間のミスアラインメントについての予想される傾向に応じて)評価されている対象区間内若しくは対象区間近傍の隣接配列の関数であるか、あるいはこれらに応じて選択されるか、あるいはこれらについて最適化される。
【0142】
いくつかの例では、本明細書中に開示された方法は、面倒な読み取り値、例えば、再構成を有する読み取り値の迅速かつ効率的なアラインメントを可能にする。したがって、対象区間(例えば、対象区間又は表現された対象区間)に対する読み取り値が再構成、例えば転座を伴うヌクレオチド位置を含むいくつかの例では、方法は、適切に調整され、(i)読み取り値とのアラインメントのための再配列参照配列を選択することであって、上記再配列参照配列が再配列(いくつかの実施形態において、参照配列はゲノム再構成と同一ではない)とアラインメントする、選択することと、(ii)読み取り値を上記再構成参照配列と比較し、例えば、アラインメントすることと、を含む、アラインメント方法を使用することを含むことができる。
【0143】
いくつかの例では、面倒な読み取り値をアラインメントするために、代替方法が使用され得る。これらの方法は、比較的多数の多様な対象区間に対するリードのアラインメントが最適化される場合に特に有効である。例として、試料を分析する方法は、(i)(例えば、第1のマッピングアルゴリズムを使用するか、又は第1の参照配列と比較することによって)パラメータの第1のセットを使用して読み取り値の比較(例えば、アラインメント比較)を実行し、上記読み取り値が第1のアラインメント基準を満たすかどうかを判定することと(例えば、読み取り値を第1の参照配列とアラインメントすることができ、例えば、不一致の数が特定の数より少ない)、(ii)上記読み取り値が第1のアラインメント基準を満たさない場合、(例えば、第1のマッピングアルゴリズムを使用するか、又は第2の参照配列と比較することによって)パラメータの第2のセットを使用して第2のアラインメント比較を実行することと、(iii)任意選択的に、上記読み取り値が上記第2の基準を満たすかどうかを判定する(例えば、読み取り値を上記第2の参照配列とアラインメントすることができ、例えば、不一致の数が特定の数より少ない)ことと、を含み、パラメータの上記第2のセットが、例えば、上記第2の参照配列の使用を含み、上記第2の参照配列が、上記パラメータの第1のセットと比較して、バリアント(例えば、再構成、挿入、欠失、又は転座)についての読み取り値とアラインメントする可能性がより高い。
【0144】
いくつかの例では、開示された方法における配列読み取り値のアラインメントは、本明細書の他の部分で説明する突然変異呼び出し方法と組み合わされ得る。本明細書で考察されるように、実際の突然変異を検出するための感度の低下は、分析されている遺伝子の予想される突然変異部位の周りのアラインメントの質を(手動で又は自動化された様式で)評価することによって対処することができる。いくつかの例では、評価される部位をヒトゲノム(例えば、HG19ヒト参照ゲノム)又はがん突然変異のデータベース(例えば、COSMIC)から取得することができる。問題があると特定された領域は、例えば、Smith-Watermanアラインメントなどのより遅いがより正確なアラインメントアルゴリズムを使用するアラインメント最適化(又は再アラインメント)によって、関連する配列状況においてより良好な性能を与えるように選択されたアルゴリズムを使用して修復することができる。一般的なアラインメントアルゴリズムでは問題を解消することができない場合、例えば、置換を含む可能性が高い遺伝子についての最大差ミスマッチペナルティパラメータを調整し、特定の腫瘍タイプ(例えば、メラノーマにおけるC→T)に共通する特定の突然変異タイプに基づいて特定のミスマッチペナルティパラメータを調整するか、又は特定の試料タイプに共通する特定の突然変異タイプ(例えば、FFPEに共通する置換)に基づいて特定のミスマッチペナルティパラメータを調整するかことによって、カスタマイズされたアラインメント手法を作成し得る。
【0145】
ミスアラインメントに起因する評価された対象区間の特異性の低下(偽陽性率の増加)は、配列決定データ中の全ての突然変異呼び出しの手動又は自動検査によって評価することができる。ミスアラインメントに起因して偽の突然変異呼び出しが発生しやすいことが判明した領域は、上で考察されるアラインメント救済を受けることができる。アルゴリズム的な改善策が可能でない場合、問題領域からの「突然変異」を標的化座のパネルから分類又はスクリーニングすることができる。
【0146】
塩基呼び出しは、配列決定デバイスの生出力、例えば、オリゴヌクレオチド分子におけるヌクレオチドの判定された配列を指す。突然変異呼び出しは、配列決定されている所与のヌクレオチド位置に対してヌクレオチド値、例えば、A、G、T又はCを選択するプロセスを指す。典型的には、位置についての配列読み取り値(又は塩基呼び出し)は、2つ以上の値を提供し、例えば、いくつかの読み取り値は、Tを示し、いくつかの読み取り値はGを示す。突然変異呼び出しは、配列に正しいヌクレオチド値、例えば、それらの値のうちの1つを割り当てるプロセスである。「突然変異」呼び出しと称されるが、任意のヌクレオチド位置、例えば、突然変異対立遺伝子、野生型対立遺伝子、突然変異若しくは野生型として特徴付けられていない対立遺伝子に対応する位置、又は可変性を特徴としない位置にヌクレオチド値を割り当てるために適用することができる。
【0147】
いくつかの例では、開示された方法は、特に、試料、例えば、がんを有する対象由来の試料中の多数の多様なゲノム遺伝子座(例えば、遺伝子座、マイクロサテライト領域など)における多数の多様な遺伝イベントの大量並行配列決定に依存する方法において、配列決定データに適用されるときに、カスタマイズされるか又は調整された突然変異呼び出しアルゴリズム又はそのパラメータを使用して、性能を最適化することを含み得る。突然変異呼び出しの最適化は、例えば、国際特許出願公開第2012/092426号に記載されているように、当技術分野で説明されている。
【0148】
突然変異呼び出しのための方法は、以下のうちの1つ以上を含むことができる:参照配列内の各位置での情報に基づいて独立した呼び出しを行う(例えば、配列読み取り値を調べること;ベースコール及び品質スコアを調べること;潜在的な遺伝子型が与えられたときの観察された塩基及び品質スコアの確率を計算すること;及び遺伝子型(例えば、ベイズ則を使用する)の割り当て);偽陽性を除去すること(例えば、深さ閾値を使用して、予想よりもはるかに低い又は高い読み取り深さを有するSNPを拒否する;小さいインデルに起因する偽陽性を除去するための局所再調整);連鎖不平衡(LD)/帰属に基づく分析を実行して、呼び出しを改良すること。
【0149】
特定の遺伝子型及び位置に関連する遺伝子型尤度を計算するための式は、例えば、Li H.and Durbin R.Bioinformatics、2010;26(5):589-95に記載されている。特定のがん型における特定の突然変異に対する事前の予想は、そのがん型からの試料を評価するときに使用することができる。そのような可能性は、がん突然変異の公開データベース、例えば、Catalogue of Somatic Mutation in Cancer(COSMIC)、HGMD(Human Gene Mutation Database)、The SNP Consortium、Breast Cancer Mutation Data Base(BIC)及びBreast Cancer Gene Database(BCGD)から得ることができる。
【0150】
LD/インピュテーションベースの分析の例は、例えば、Browning B.L.及びYu Z.Am.Hum.Genet.2009,85(6):847-61を参照されたい。低カバレッジSNP呼び出し方法の例は、例えば、Li,Y.,et al.,Annu.Rev.Genomics Hum.Genet.2009,10:387-406に記載されている。
【0151】
アラインメント後、突然変異呼び出し方法、例えば、ベイズ突然変異呼び出し方法を使用して置換の検出を実行することができる。これは、対象区間の各々の各塩基、例えば、評価される遺伝子のエクソンに適用され、代替対立遺伝子の存在が観察される。この方法は、突然変異の存在下でリードデータを観測する確率を、ベースコールエラーのみの存在下でリードデータを観測する確率と比較する。この比較が突然変異の存在を十分に強く支持する場合、突然変異を呼び出すことができる。
【0152】
ベイズ突然変異検出手法の利点は、突然変異の存在確率と塩基呼び出しエラーの確率のみとの比較を、その部位における突然変異の存在の事前予想によって重み付けできることである。代替対立遺伝子のいくつかのリードが所与のがん型について頻繁に突然変異した部位で観察される場合、突然変異の証拠の量が通常の閾値を満たさない場合であっても、突然変異の存在が確実に呼び出され得る。次いで、この柔軟性を使用して、より希少な突然変異/より低い純度の試料の検出感度を高めるか、又は読み取りカバレッジの減少に対して試験をより堅牢にすることができる。がんにおいてゲノム中のランダムな塩基対が突然変異している可能性は約1e-6である。例えば、典型的な多遺伝子性がんゲノムパネルの多くの部位において特異的突然変異が発生する可能性は、桁違いに高くなり得る。これらの尤度は、がん突然変異の公開データベース(例えば、COSMIC)から得ることができる。
【0153】
インデルコールは、典型的には関連する信頼スコア又は統計的証拠指標を含む、挿入又は欠失によって参照配列とは異なる配列特定データ中の塩基を見つけるプロセスである。インデルコールの方法は、候補インデルを識別するステップ、局所再アラインメントによって遺伝子型尤度を計算するステップ、並びにLDベースの遺伝子型推論及びコールを行うステップを含み得る。典型的には、ベイズ法を使用して潜在的インデル候補を取得し、次いでこれらの候補をベイズフレームワーク内の参照配列とともに試験する。
【0154】
候補インデルを生成するためのアルゴリズムは、例えば、McKenna,A.,et al.,Genome Res.2010;20(9):1297-303、Ye,K.,et al.,Bioinformatics,2009;25(21):2865-71、Lunter,G.,and Goodson,M.,Genome Res.2011;21(6):936-9、及びLi,H.,et al.(2009),Bioinformatics 25(16):2078-9に記載されている。
【0155】
インデルコール及び個体レベルの遺伝子型尤度を生成する方法としては、例えば、Dindelアルゴリズム(Albers C.A.ら、Genome Res.2011;21(6):961-73)が挙げられる。例えば、ベイジアンEMアルゴリズムを使用して、読み取り値を分析し、初期インデルコールを行い、各候補インデルについて遺伝子型尤度を生成し、続いて、例えば、QCALL(Le S.Q.及びDurbin R.Genome Res.2011;21(6):952-60)を使用して遺伝子型を補完することができる。インデルを観察する事前の予想などのパラメータは、インデルのサイズ又は位置に基づいて調整することができる(例えば、増加又は減少)。
【0156】
がんDNAの分析のための50%又は100%の対立遺伝子頻度からの限られた偏差に対処する方法が開発されている。(例えば、SNVMix-Bioinformatics.2010 March 15;26(6):730-736を参照されたい)しかしながら、本明細書で開示された方法は、1%~100%の範囲の頻度(又は対立遺伝子画分)(すなわち、0.01~1.0の範囲の対立遺伝子画分)で、特に50%より低いレベルで突然変異対立遺伝子が存在する可能性を考慮することができる。このアプローチは、天然(マルチクローナル)腫瘍DNAの例えば、低純度FFPE試料における突然変異の検出に特に重要である。
【0157】
いくつかの例では、配列読み取り値を分析するために使用される突然変異呼び出し方法は、異なるゲノム遺伝子座における異なる突然変異の検出について個別にカスタマイズされることも微調整されることもない。いくつかの例では、異なる突然変異呼び出し方法は、異なるゲノム遺伝子座において検出される異なる突然変異の少なくともサブセットについて個別にカスタマイズされるか又は微調整される。いくつかの例では、異なるゲノム遺伝子座において検出される各異なる突然変異体について個別にスタマイズされるか又は微調整された異なる突然変異呼び出し方法が使用される。カスタマイズ又は調整は、本明細書に記載の因子、例えば、試料中のがんのタイプ、配列決定される対象区間が位置する遺伝子若しくは座、又は配列決定されるバリアントの1つ以上に基づくことができる。配列決定されるいくつかの対象間隔について個別にカスタマイズされるか又は微調整される突然変異呼び出し方法をこのように選択又は使用すると、突然変異呼び出しの速度、感度、及び特異性を最適化することが可能になる。
【0158】
いくつかの例では、一意の突然変異呼び出し方法を使用して、X個の一意の対象区間の各々におけるヌクレオチド位置についてヌクレオチド値が割り当てられ、Xは、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも10個、少なくとも15個、少なくとも20個、少なくとも30個、少なくとも40個、少なくとも50個、少なくとも60個、少なくとも70個、少なくとも80個、少なくとも90個、少なくとも100個、少なくとも200個、少なくとも300個、少なくとも400個、少なくとも500個、少なくとも1000個、少なくとも1500個、少なくとも2000個、少なくとも2500個、少なくとも3000個、少なくとも3500個、少なくとも4000個、少なくとも4500個、少なくとも5000個であるか、又はそれよりも多い。呼び出し方法は異なり、それによって、例えば、異なるベイズ事前値に依存することによって一意であり得る。
【0159】
いくつかの例では、ヌクレオチド値を割り当てることは、タイプの腫瘍におけるヌクレオチド位置におけるバリアント、例えば、突然変異を示す読み取り値を観察する以前の(例えば、文献)予想値であるか又はそれを表す値の関数である。
【0160】
いくつかの例では、方法は、少なくとも10、20、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900又は1,000個のヌクレオチド位置についてヌクレオチド値(例えば、突然変異の呼び出し)を割り当てるステップを含み、各割り当ては、タイプの腫瘍におけるヌクレオチド位置におけるバリアント、例えば、突然変異を示す読み取り値を観察する以前の(例えば、文献)予想値であるか又はそれを表す固有の(他の割り当ての値とは対照的な)値の関数である。
【0161】
いくつかの例では、ヌクレオチド値を割り当てることは、バリアントがある頻度(例えば、1%、5%、10%など)で試料中に存在する場合及び/又はバリアントが存在しない場合(例えば、塩基呼び出しエラーのみに起因して読み取り値において観察される)、ヌクレオチド位置でバリアントを示す読み取り値を観察する確率を表す値のセットの関数である。
【0162】
いくつかの例では、本明細書に記載の突然変異呼び出し方法は、以下のステップ、即ち、(a)上記X個の対象区間の各々におけるヌクレオチド位置について、(i)タイプXの腫瘍内の上記ヌクレオチド位置におけるバリアント、例えば突然変異を示す読み取り値を観測する以前の(例えば、文献)予想値であるか又はそれを表す第1の値、並びに(ii)バリアントが試料中にある頻度(例えば、1%、5%、10%など)で存在し、かつ/又はバリアントが存在しない(例えば、塩基呼び出しエラーのみに起因して読み取り値に観測される)場合、上記ヌクレオチド位置における上記バリアントを示す読み取り値を観測する確率を表す値の第2のセットを取得することと、(b)上記値に応答して、例えば、第1の値を使用して(例えば、突然変異の存在の確率を計算して)第2のセット内の値間の比較に、例えば、本明細書に記載のベイズ法によって、重み付けすることによって、上記ヌクレオチド位置の各々について上記読み取り値からヌクレオチド値(例えば、突然変異の呼び出し)を割り当て、それによって、上記試料を分析することと、を含むことができる。
【0163】
突然変異呼び出し方法の更なる説明が、例えば、国際特許出願公開第2020/236941号に記載されており、その内容全体が参照により本明細書に組み込まれる。
【0164】
いくつかの例では、1つ以上の配列読み取り値を使用して対象についてのゲノムプロファイルを生成し得、ゲノムプロファイルは、追加のデータを更に(すなわち、配列読み取り値から生成されるデータに加えて)含み得る。いくつかの例では、ゲノムプロファイルは、個人のゲノム及び/又はプロテオームにおける遺伝子(又はバリアント配列)、コピー数変異、エピジェネティック形質、タンパク質(又はその修飾)、及び/又は他のバイオマーカの存在に関する情報、並びに個人の対応する表現型形質、並びに遺伝的又はゲノム形質、表現型形質、及び環境因子の間の相互作用に関する情報を含むことができる。対象のゲノムプロファイルは、包括的ゲノムプロファイリング(CGP)試験、遺伝子発現プロファイリング試験、がんホットスポットパネル試験、DNAメチル化試験、DNA断片化試験、RNA断片化試験、又はそれらの任意の組み合わせを使用した1つ以上の配列読み取り値の分析の結果(例えば、配列読み取り値分析データ)を含むことができる。対象のゲノムプロファイルを示す他のデータが、ゲノムプロファイルに含まれ得る。ゲノムプロファイルは、配列読み取り値の分析データに基づいて、対象を分類する情報及び/又は対象に対して使用される1つ以上の治療を識別する情報を更に含み得る。ゲノムプロファイルは、本明細書で説明するように、例えば、データのモデリングに基づいて、データの更なる処理が実行された後に分類及び/又は治療情報を含むように更新され得る。
【0165】
コンピュータシステム及び方法
本明細書に記載の方法は、1つ以上のコンピュータシステムを使用して実装されることができる。そのようなコンピュータシステムは、コンピュータシステムがそのような方法を実行するために1つ以上のプロセッサを実行するように構成された1つ以上のプログラムを含むことができる。コンピュータ実装方法の1つ以上のステップは、自動的に実行され得る。
【0166】
いくつかの例では、開示されたシステムは、シーケンサー、例えば、次世代シーケンサー(大量並行シーケンサーとも称される)を更に備え得る。次世代(又は大量並行)配列決定プラットフォームの例には、限定はしないが、Roche 454、Illumina Solexa、ABI-SOLiD、ION Torrent、又はPacific Bioscience配列決定プラットフォームが含まれる。
【0167】
図5Aは、一実施形態によるコンピューティングデバイスの例を示している。デバイス500は、ネットワークに接続されたホストコンピュータとすることができる。デバイス500は、クライアントコンピュータ又はサーバとすることができる。
図5に示されるように、デバイス500は、パーソナルコンピュータ、ワークステーション、サーバ、又はハンドヘルド計算デバイス(携帯電子デバイス、例えば、電話又はタブレット)などの任意の好適なタイプのマイクロプロセッサベースのデバイスであり得る。デバイスは、例えば、プロセッサ510、入力デバイス520、出力デバイス530、ストレージ540、及び通信デバイス560のうちの1つ以上を含むことができる。入力デバイス520及び出力デバイス530は、一般に、上述したものに対応することができ、コンピュータと接続可能とすることができるか又は一体化されることができる。
【0168】
入力デバイス520は、タッチスクリーン、キーボード若しくはキーパッド、マウス、又は音声認識デバイスなどの入力を提供する任意の好適なデバイスとすることができる。出力デバイス530は、タッチスクリーン、触覚デバイス、又はスピーカなど、出力を提供する任意の好適なデバイスとすることができる。いくつかの実施形態では、入力及び出力デバイス520/530は、同じ又は異なるデバイスとすることができる。
【0169】
ストレージ540は、RAM(揮発性及び不揮発性)、キャッシュ、ハードドライブ、又はリムーバブルストレージディスクを含む電気的、磁気的、又は光学的メモリなどのストレージを提供する任意の適切なデバイスとすることができる。通信デバイス560は、ネットワークインターフェースチップ又はデバイスなどの、ネットワークを介して信号を送受信することができる任意の好適なデバイスを含むことができる。コンピュータの構成要素は、物理バス580を介して、又は無線で(例えば、Bluetooth(登録商標)、Wi-Fi(登録商標)、又は任意の他の無線技術)など、任意の適切な方法で接続されることができる。
【0170】
ストレージ540に記憶され、プロセッサ510によって実行されることができるソフトウェア550は、例えば、(例えば、上述したようなデバイスにおいて具現化されるように)本開示の機能を具現化するプログラミングを含むことができる。
【0171】
ソフトウェア550はまた、命令実行システム、装置、若しくは上述したものなどのデバイスによって、又はそれらと接続して使用するための任意の非一時的コンピュータ可読記憶媒体内に記憶及び/又は転送されることができ、命令実行システム、装置、若しくはデバイスからの、ソフトウェアに関連付けられた命令をフェッチし、命令を実行することができる。本開示の文脈において、コンピュータ可読記憶媒体は、ストレージ540などの任意の媒体とすることができ、命令実行システム、装置、若しくはデバイスによって、又はそれらと接続して使用するためのプログラミングを含む若しくは記憶することができる。
【0172】
ソフトウェア550はまた、命令実行システム、装置、若しくは上述したものなどのデバイスによって、又はそれらと接続して使用するための任意の伝送媒体内に伝播されることができ、命令実行システム、装置、若しくはデバイスからの、ソフトウェアに関連付けられた命令をフェッチし、命令を実行することができる。本開示の文脈において、伝送媒体は、任意の媒体とすることができ、命令実行システム、装置、若しくはデバイスによって、又はそれらと接続して使用するための伝送プログラミングを通信、伝播、又は伝送することができる。伝送可読媒体は、電子、磁気、光学、電磁気、若しくは赤外線の有線又は無線伝播媒体を含むことができるが、これらに限定されない。
【0173】
デバイス500は、任意の好適な種類の相互接続された通信システムとすることができるネットワークへと接続されることができる。ネットワークは、任意の好適な通信プロトコルを実装することができ、任意の好適なセキュリティプロトコルによって保護されることができる。ネットワークは、無線ネットワーク接続(T1又はT3回線)、ケーブルネットワーク、DSL、又は電話回線などの、ネットワーク信号の送受信を実装することができる任意の好適な構成のネットワークリンクを含むことができる。
【0174】
デバイス500は、ネットワーク上で動作するのに好適な任意のオペレーティングシステムを実装することができる。ソフトウェア550は、C、C++、Java(登録商標)、又はPythonなどの任意の好適なプログラミング言語で書かれることができる。様々な実施形態では、本開示の機能を具現化するアプリケーションソフトウェアは、異なる構成で(例えば、クライアント/サーバ構成で、又はウェブベースのアプリケーション若しくはウェブサービスとしてのウェブブラウザを介して)展開されることができる。いくつかの実施形態では、オペレーティングシステムは、1つ以上のプロセッサ、例えばプロセッサ510によって実行される。
【0175】
デバイス500は、任意の適切な核酸配列決定機器とすることができるシーケンサー570を更に含むことができる。
【0176】
図5Bは、一実施形態によるコンピューティングシステムの例を示している。コンピューティングシステム590において、デバイス500(例えば、上記で説明され、
図5Aに示されている)が、ネットワーク592に接続され、ネットワーク592もデバイス594に接続されている。いくつかの実施形態では、デバイス594は、シーケンサー(例えば、次世代シーケンサー)である。例示的なシーケンサーは、限定されないが、Roche/454のGenome Sequencer(GS)FLX System、Illumina/SolexaのGenome Analyzer(GA)、IlluminaのHiSeq 2500、HiSeq 3000、HiSeq 4000、及びNovaSeq 6000配列決定システム、Life/APGのSupport Oligonucleotide Ligation Detection(SOLiD)システム、PolonatorのG.007システム、Helicos BioSciencesのHeliScope Gene配列決定システム、又はPacific BioSciencesのPacBio RSシステムを含む。
【0177】
デバイス500及び594は、例えば、ローカルエリアネットワーク(LAN)、仮想プライベートネットワーク(VPN)、又はインターネットなどのネットワーク592を介して適切な通信インターフェースを使用して通信することができる。いくつかの実施形態では、ネットワーク592は、例えば、インターネット、イントラネット、仮想プライベートネットワーク、クラウドネットワーク、有線ネットワーク、又は無線ネットワークとすることができる。デバイス500及び594は、イーサネット(登録商標)、IEEE802.11b無線などの無線又は有線通信を介して、部分的又は全体的に通信することができる。更に、デバイス500及び594は、例えば、好適な通信インターフェースを使用して、モバイル/セルラーネットワークなどの第2のネットワークを介して通信することができる。デバイス500と594との間の通信は、メールサーバ、モバイルサーバ、メディアサーバ、電話サーバなどの様々なサーバを更に含むか、それらと通信することができる。いくつかの実施形態では、デバイス500及び594は、(ネットワーク592を介した通信の代わりに、又はそれに加えて)、例えば、イーサネット(登録商標)、IEEE802.11b無線などの無線又は有線通信を介して、直接通信することができる。いくつかの実施形態では、デバイス500及び594は、通信596を介して通信し、これは、直接接続とすることができるか、又はネットワーク(例えば、ネットワーク592)を介して発生することができる。
【0178】
デバイス500及び594のうちの一方又は全ては、一般に、本明細書に記載の様々な例に従ってネットワーク592を介して情報を提供及び/又は受信するために、ローカル若しくはリモートのデータベース又は他のデータ及びコンテンツのソースからアクセスされる論理(例えば、httpウェブサーバロジック)を含むか、又はデータをフォーマットするようにプログラムされる。
【0179】
一例として、システム(例えば、電子デバイス)は、1つ以上のプロセッサと、1つ以上のプログラムを記憶する非一時的コンピュータ可読メモリと、を含み、1つ以上のプログラムは、1つ以上のプロセッサによって実行されるように構成され、1つ以上のプログラムは、がんを有する対象についての予想される治療転帰を判定する方法を実施するための命令を含む。1つ以上のプログラムは、1つ以上のプロセッサによって実行されると、1つ以上のプロセッサに、対象についての複数の対象特性を受信することと、疾患についての治療オプションに対応する木ベースのモデル(非一時的コンピュータ可読メモリに記憶され得る)にアクセスすることであって、木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションを用いて治療された場合の対象についての予想される治療転帰を判定することと、を行わせる。いくつかの例では、1つ以上のプログラムは、1つ以上のプログラムによって実行されると、1つ以上のプロセッサに、更に木ベースのモデルを生成させる。
【0180】
非一時的コンピュータ可読記憶媒体は、1つ以上のプログラムを記憶することができ、1つ以上のプログラムは、システムの1つ以上のプロセッサによって実行されると、システムに、本明細書で説明するように、疾患を有する対象についての予想される治療転帰を判定する方法を実行させる。1つ以上のプログラムは、1つ以上のプロセッサによって実行されると、1つ以上のプロセッサに、対象についての複数の対象特性を受信することと、疾患についての治療オプションに対応する木ベースのモデル(非一時的コンピュータ可読メモリに記憶され得る)にアクセスすることであって、木ベースのモデルが、複数の以前の患者の特性及び対応する治療オプションについての関連する治療転帰に基づいて生成される、アクセスすることと、複数の対象特性及び木ベースのモデルから、対象が対応する治療オプションを用いて治療された場合の対象についての予想される治療転帰を判定することと、を行わせる。いくつかの例では、1つ以上のプログラムは、1つ以上のプログラムによって実行されると、1つ以上のプロセッサに、更に木ベースのモデルを生成させる。
【0181】
本開示及び実施例は、添付の図面を参照して十分に説明されているが、様々な変更及び修正が当業者にとって明らかになることに留意されたい。そのような変更及び修正は、特許請求の範囲によって定義される本開示及び例の範囲内に含まれると理解されるべきである。
【0182】
前述の説明は、解説を目的として、特定の実施形態を参照して説明されている。しかしながら、上記の例示的な考察は、網羅的であること、又は本発明を開示された正確な形態に限定することを意図するものではない。上記の教示を考慮して、多くの修正及び変形が可能である。実施形態は、技術の原理及びそれらの実際の用途を最良に解説するために選択及び説明された。それにより、他の当業者は、企図される特定の使用に適した様々な修正を伴う技術及び様々な実施形態を最良に利用することが可能になる。
【国際調査報告】