IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ フランシス クリック インスティテュート リミテッドの特許一覧 ▶ ユニバーシティー カレッジ ロンドンの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-07-12
(54)【発明の名称】混合試料中のリンパ球の量の決定
(51)【国際特許分類】
   C12Q 1/68 20180101AFI20240705BHJP
【FI】
C12Q1/68
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024504149
(86)(22)【出願日】2022-07-22
(85)【翻訳文提出日】2024-03-19
(86)【国際出願番号】 EP2022070694
(87)【国際公開番号】W WO2023002046
(87)【国際公開日】2023-01-26
(31)【優先権主張番号】2110555.6
(32)【優先日】2021-07-22
(33)【優先権主張国・地域又は機関】GB
(31)【優先権主張番号】2203451.6
(32)【優先日】2022-03-11
(33)【優先権主張国・地域又は機関】GB
(81)【指定国・地域】
(71)【出願人】
【識別番号】524028795
【氏名又は名称】ザ フランシス クリック インスティテュート リミテッド
(71)【出願人】
【識別番号】511226591
【氏名又は名称】ユニバーシティー カレッジ ロンドン
【氏名又は名称原語表記】UNIVERSITY COLLEGE LONDON
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】ベンサム,ロバート
(72)【発明者】
【氏名】ワトキンス,トーマス ベンジャミン キングドン
(72)【発明者】
【氏名】マクグラナハン,ニコラス
(72)【発明者】
【氏名】スワントン,チャールズ
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QQ03
4B063QQ08
4B063QQ28
4B063QQ42
4B063QQ52
4B063QR08
4B063QR32
4B063QR35
4B063QR77
4B063QS39
4B063QX04
(57)【要約】
【課題】複数の細胞型からのゲノム材料を含む混合試料中のリンパ球の分画率を決定するための方法が記載される。
【解決手段】本方法は、VDJ組換えを受けるゲノム遺伝子座の少なくとも一部を含む所定のゲノム関心領域に沿った試料に関するリード深度プロファイルを取得することと、関心領域のサブセットから導出されたベースラインリード深度を参照して、リード深度を正規化することによって、複数のリード深度比(ri)を取得することと、VDJ組換えにより欠失される可能性が高い関心領域のサブセットに関する要約されたリード深度比値(rVDJ)を取得することと、試料中のリンパ球の分画率(f)を、要約されたリード深度比値(rVDJ)の関数として決定することと、を含む。リンパ球分画率に基づいて診断又は予後予測を提供する方法、及び関連のシステム及び製品についても記載される。
【選択図】図1
【特許請求の範囲】
【請求項1】
複数の細胞型からのゲノム材料を含む混合試料中のリンパ球の分画率を決定するための方法であって、
VDJ組換えを受けるゲノム遺伝子座の少なくとも一部を含む所定のゲノム関心領域に沿ったリード深度を含む前記試料のリード深度プロファイルを取得することと、
前記関心領域のサブセットから導出されたベースラインリード深度を参照して、前記所定の関心領域に沿って前記リード深度を正規化することによって、複数のリード深度比(r)を取得することと、
VDJ組換えにより欠失される可能性が高い前記関心領域のサブセットに関する要約されたリード深度比値(rVDJ)を取得することと、
前記試料中のリンパ球の前記分画率(f)を、前記要約されたリード深度比値(rVDJ)の関数として決定することと
を含む方法。
【請求項2】
VDJ組換えを受けるゲノム遺伝子座が、TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座から選択され、及び/又はリンパ球の前記分画率が、Tリンパ球の分画率、Bリンパ球の分画率、αβTリンパ球の分画率、γδTリンパ球の分画率、前記TCRA、TCRB、TCRG、TCRD、IGH、IGL、若しくはIGK遺伝子座の任意の遺伝子セグメントを含むB細胞若しくはT細胞の分画率、又は表8に列挙されている任意の遺伝子セグメントを含むB細胞若しくはT細胞の分画率である、請求項1に記載の方法。
【請求項3】
前記所定の関心領域が、前記TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座からの1つ又は複数のエクソンを含む、請求項2に記載の方法。
【請求項4】
前記所定の関心領域が、前記TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座からの複数のエクソンを含み、前記複数のエクソンが、前記それぞれの遺伝子座のV、D、及びCセグメントのそれぞれに対応する少なくとも1つのエクソンを含む、請求項2又は3に記載の方法。
【請求項5】
前記複数のエクソンが、前記それぞれの遺伝子座の複数のVセグメントに対応するエクソンを含む、請求項4に記載の方法。
【請求項6】
リード深度プロファイルが、配列決定データから、好ましくは全エクソーム配列決定、全ゲノム配列決定、又はパネル配列決定データから得られる、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記試料中のリンパ球の前記分画率(f)を前記要約されたリード深度比値(rVDJ)の関数として決定することが、前記試料中のリンパ球の前記分画率(f)を、前記要約されたリード深度比値(rVDJ)と、前記混合試料中での、前記所定の関心領域内で異数性である異常細胞の分画率(p)と、及び前記所定の関心領域内の前記異常細胞のコピー数(Ψ)との関数として決定することを含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記試料中のリンパ球の前記分画率(f)を決定することが、
【数1】
としてfの値を決定することを含み、ここでγは定数である、請求項7に記載の方法。
【請求項9】
前記試料中のリンパ球の前記分画率(f)を決定することが、
【数2】
としてfの値を決定することを含み、ここでγは定数である、請求項1~8のいずれか一項に記載の方法。
【請求項10】
VDJ組換えにより欠失される可能性が高い前記関心領域の前記サブセットが、VDJ組換えを受ける前記ゲノム遺伝子座の最後のVセグメントの終了位置と、VDJ組換えを受ける前記ゲノム遺伝子座のJセグメントの開始位置と、の間にある領域を含み、好ましくは、VDJ組換えにより欠失される可能性が高い前記関心領域の前記サブセットが、VDJ組換えを受ける前記ゲノム遺伝子座の1つ又は複数のDセグメント(例えば全てのDセグメントなど)を含む、請求項1~9のいずれか一項に記載の方法。
【請求項11】
モデルを前記複数のリード深度比に当てはめることをさらに含み、VDJ組換えにより欠失される可能性が高い前記関心領域のサブセットに関する要約されたリード深度比値(rVDJ)を取得することが、VDJ組換えにより欠失される可能性が高い前記関心領域の前記サブセット内の前記モデルの前記値に基づいて、要約されたリード深度比値を取得することを含み、任意選択で、前記モデルが、一般化線形モデル、前記関心領域内の複数のV及びJ遺伝子の位置に対応するように選択された複数の切断点を有する区分的制約付き線形モデル、又は、前記リード深度からのセグメント使用と、前記関心領域内の複数のV及びJ遺伝子のそれぞれの使用の以前の分布とをモデル化するベイズモデルである、請求項1~10のいずれか一項に記載の方法。
【請求項12】
前記関心領域のサブセットからベースラインリード深度を取得することをさらに含み、好ましくは、前記ベースラインリード深度が、前記関心領域の前記被験体全体にわたる要約されたリード深度値である、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記ベースラインリード深度を取得するために使用される前記関心領域の前記サブセットが、VDJ組換えにより欠失される可能性が低い前記関心領域のサブセットである、請求項1~12のいずれか一項に記載の方法。
【請求項14】
VDJ組換えにより欠失される可能性が低い前記関心領域の前記サブセットが、VDJ組換えを受ける前記ゲノム遺伝子座の最初のn個のVセグメントを含み、及び/又はVDJ組換えにより欠失される可能性が低い前記関心領域の前記サブセットが、VDJ組換えを受ける前記ゲノム遺伝子座の前記Cセグメントを含む、請求項13に記載の方法。
【請求項15】
リード深度プロファイルを取得することが、前記所定の関心領域にわたる複数の生のリード深度値を取得すること、及び前記リード深度値を平滑化することを含み、任意選択で、前記リード深度値を平滑化することが、所定の幅のウィンドウにわたる対応するローリング中央値によって前記生のリード深度値を置き換えることを含む、請求項1~14のいずれか一項に記載の方法。
【請求項16】
前記混合試料が血液試料又は腫瘍試料であり、及び/又は前記方法が、被験体から、複数の細胞型からのゲノム材料を含む混合試料を取得すること、及び/又は、被験体から、1つ又は複数のインビトロステップによって、複数の細胞型からのゲノム材料を含む混合試料からリード深度データを取得することをさらに含む、請求項1~15のいずれか一項に記載の方法。
【請求項17】
前記決定されたリンパ球分画率及び/又はそこから導出される任意の値を、例えばユーザインターフェースを介してユーザに提供することをさらに含む、請求項1~16のいずれか一項に記載の方法。
【請求項18】
がんと診断された被験体に関する予後予測を提供する方法であって、請求項1~17のいずれか一項に記載の方法を使用して、前記被験体からの1つ又は複数の腫瘍試料中の前記リンパ球分画率を決定することを含む方法。
【請求項19】
がんと診断された被験体が免疫療法に応答する可能性が高いかどうかを決定する方法であって、請求項1~17のいずれか一項に記載の方法を使用して、前記被験体からの1つ又は複数の腫瘍試料中の前記リンパ球分画率を決定することを含む方法。
【請求項20】
被験体がT細胞リンパ球減少症を有するかどうかを決定する方法であって、請求項1~17のいずれか一項に記載の方法を使用して、前記被験体からの1つ又は複数の試料中の前記リンパ球分画率を決定することを含む方法。
【請求項21】
プロセッサと、
前記プロセッサによって実行されるときに、請求項1~15又は17~20のいずれか一項に記載の方法のステップを前記プロセッサに実行させる命令を含むコンピュータ可読媒体と、
を備えるシステム。
【発明の詳細な説明】
【技術分野】
【0001】
開示の分野
本開示は、試料に由来するリード深度プロファイルに基づいて、腫瘍試料又は血液試料などの複数の細胞型を含む混合試料中のTリンパ球又はBリンパ球などのリンパ球の分画率を推定する方法、並びにそのような方法を実行するためのシステム及び関連の製品に関する。また、患者からの腫瘍試料からの推定される腫瘍浸潤リンパ球分画率に少なくとも部分的に基づいて、がん患者に関する予後予測を提供する方法も記載される。
【背景技術】
【0002】
背景
リンパ球は、ヒトの健康及び疾患に重要な役割を果たす人体の仕組みの重要な部分である。例えば、腫瘍の場合、免疫系は、腫瘍形成とその後のがんの進展との両方に影響を及ぼす重要な因子の1つとして広く認識されている。特にT細胞は、ネオアンチゲンを保有するがん細胞を排除することでがん免疫微小環境の重要な役割を果たしており、したがって腫瘍試料内のT細胞の数は重要な臨床因子である。実際、臨床所見での腫瘍の免疫微小環境の状態は、免疫療法に関する予後予測因子であり且つ応答予測因子であり得る。近年、免疫療法、特にチェックポイント阻害薬(CPI)が、多くのがん種に対する革新的な治療法として登場している。実際、悪性黒色腫及び非小細胞肺がん(NSCLC)は、抗CTL4療法又は抗PDL1療法後の無病生存率と全生存率との両方において顕著な改善を示している(Robert et al., 2011;Schadendorf et al., 2015;Topalian et al., 2012)。しかし、免疫療法に対する応答は普遍的ではなく、臨床的に有益な応答は、一部の患者でしか生じない(Goodman et al., 2017)。したがって、どの患者がCPIの恩恵を受けるかを決定することは非常に重要である。
【0003】
最新のデータは、CPIに対する応答が主に以下の2つの特徴によって支配されることを示唆している:次世代配列決定(NGS)から予測することができるネオアンチゲンの存在などの免疫刺激;及びその刺激に応答し得るT細胞の存在。浸潤性T細胞の存在は、長い間、卵巣がん(Zhang et al., 2003)や大腸がん(Galon et al., 2006)などのがん種における生存率の向上に関連付けられてきた。より最近の研究は、ネオアンチゲンの予測可能性に焦点を当てており、腫瘍変異負荷(TMB)の増加が、免疫療法に対する応答の最良の予測因子の1つとして現れている(Samstein et al., 2019)。Litchfield et al (2020)による最近の研究は、CPI応答の様々な潜在的なバイオマーカが汎がんCPI処理データセットでどの程度機能するかを体系的に調査した。特定された最良の予測性の2つの特徴は、あらゆるがん細胞に存在する変異を反映するクローン性TMBと、腫瘍浸潤リンパ球(TIL)の存在を示すT細胞に関するRNA配列決定由来のトランスクリプトームシグネチャ(例えば、CD8A RNA発現)とであった。
【0004】
したがって、TILの存在と量の両方を推定することががん治療において非常に重要である。しかし、現時点では、TILを推定するための普遍的な先進の方法はない。CIBERSORT(Newman et al., 2015)などのマイクロアレイシグネチャ、及びRNA-seq用のCIBERSORTx(Newman et al., 2019)、ESTIMATE(Yoshihara et al., 2013)、及びDanaherらによって編集されたものなどのRNA-seqシグネチャが、腫瘍試料中のTILのトランスクリプトームシグネチャを定量化するために使用されている。代替として、免疫浸潤の存在は、ヘマトキシリン・エオシン(H&E)組織病理学的スライドに基づいて、又は代替として、適切な細胞特異的染色、最も一般的には免疫組織化学的特性によって判定することができる。T細胞のより多くの表現型の知識が必要とされる場合、TCRの非常に多様なVDJ組換えCDR3領域をコードする配列に関する濃縮後に、T細胞受容体(TCR)の配列決定を行うことができる(Bolotin et al., 2012)。これらの方法は全て、腫瘍試料などの混合試料中の免疫細胞を同定する目的で専用のデータを獲得する必要がある。最近、McGrath et al. (2017)において、T細胞の再構成されたリード(超可変CDr3にまたがり、V及びJセグメントの両方を含むリード)を分離することによって、WESデータを使用して試料中のTCRレパートリーを特徴付けるアプローチが提案された。しかし、このアプローチは、非常に高い配列決定深度を必要とし、非T細胞集団での異数性の存在(例えばがんの場合によく起こる)に対処できず、TCRレパートリーを特徴付けることにしか適していない。
【発明の概要】
【発明が解決しようとする課題】
【0005】
したがって、既存の方法の欠点の1つ又は複数を軽減する、混合試料中のリンパ球の量を決定するための新規の方法の必要性がある。
【課題を解決するための手段】
【0006】
発明の簡単な説明
大まかに言うと、本発明者らは、腫瘍変異負荷を計算し、標的療法のためにアクショナブル(actionable)な変異を同定するために、全エクソーム配列決定(WES)、さらには全ゲノム配列決定(WGS)が腫瘍試料に対して頻繁に行われることを認識した。同様に、このタイプのデータは、新生児ケアなど他の疾患の文脈でも収集される頻度がますます高まっている。しかし、現時点では、WESを使用して免疫浸潤レベルを正確に推測することはできない。したがって、本発明者らは、VDJ組換え、例えばT細胞受容体アルファ(TCRA)遺伝子のVDJ組換え中のT細胞受容体切除サークル(TREC)に由来するシグナルを使用して、WES/WGS又は同様のデータからT細胞(又はB細胞)分画率を推定するための方法を開発する。このスコアは、試料中のT細胞(場合によってはB細胞)の割合を直接測定する。本発明者らはさらに、このスコアが、TRACERx100コホートにおけるRNA配列決定及び組織病理学的TILスコアリングに基づく直交免疫浸潤スコアと有意に相関することを実証した。免疫療法を受けている患者コホートのメタ解析を使用して、本発明者らは、このスコアががん免疫療法に対する応答を予測可能であり、変異負荷に勝る予測値を提供することを確認した。本発明者らはさらに、血液由来の生殖細胞系列試料からもT細胞分画率を計算することができることを実証することによって、本方法の幅広い適用性を示した。したがって、本方法は、WES(又はWGS)腫瘍試料の免疫微小環境の研究可能性を広げ、これは、直交データが利用可能でない場合には特に有用である。
【0007】
したがって、第1の態様では、本開示は、複数の細胞型からのゲノム材料を含む混合試料中のリンパ球の分画率を決定するための方法であって、VDJ組換えを受けるゲノム遺伝子座の少なくとも一部を含む所定のゲノム関心領域に沿ったリード深度を含む試料のリード深度プロファイルを取得することと、関心領域のサブセットから導出されたベースラインリード深度を参照して、所定の関心領域に沿ってリード深度を正規化することによって、複数のリード深度比(r)を取得することと、VDJ組換えにより欠失される可能性が高い関心領域のサブセットに関する要約されたリード深度比値(rVDJ)を取得することと、試料中のリンパ球の分画率(f)を、要約されたリード深度比値(rVDJ)の関数として決定することとを含む方法を提供する。
【0008】
本方法は、以下の任意選択の特徴の任意の1つ又は複数を有することがある。
【0009】
混合試料は、細胞若しくは組織試料(この場合、試料は、それぞれのゲノム材料をそれぞれ含む複数の細胞型を含むことがある)、又はそれらに由来する核酸の試料でよい。
【0010】
VDJ組換えを受けるゲノム遺伝子座は、TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座から選択されることがある。したがって、リンパ球の分画率は、Tリンパ球の分画率、Bリンパ球の分画率、αβTリンパ球の分画率、γδTリンパ球の分画率、TCRA、TCRB、TCRG、TCRD、IGH、IGL、若しくはIGK遺伝子座での任意の遺伝子セグメントを含むB細胞若しくはT細胞の分画率、又は表8に列挙された任意の遺伝子セグメント若しくは別の種での対応する遺伝子セグメントを含むB細胞若しくはT細胞の分画率であり得る(表8に列挙される座標は単なる指標であり、特に、別の参照配列での対応する座標が使用されてもよい)。VDJ組換えを受けるゲノム遺伝子座は、TCRA、TCRB、TCRG、又はIGH遺伝子座から選択されることがある。所定の関心領域は、TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座からの1つ又は複数のエクソンを含むことがある。所定の関心領域は、TCRA、TCRB、TCRG、又はIGH遺伝子座からの1つ又は複数のエクソンを含むことがある。所定の関心領域は、TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座からの複数のエクソンを含むことがあり、複数のエクソンは、それぞれの遺伝子座のV、D、及びCセグメントのそれぞれに対応する少なくとも1つのエクソンを含む。複数のエクソンは、それぞれの遺伝子座のV、D、J、及びCセグメントのそれぞれに対応する少なくとも1つのエクソンを含むことがある。複数のエクソンは、それぞれの遺伝子座の複数のVセグメントに対応するエクソンを含むことがある。所定の関心領域は、TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座からの複数のV、D、J、及び/又はCセグメントをコードする領域を含むことがある。所定の関心領域は、TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座からの複数のV、D、J、及び/又はCセグメントにある1つ又は複数の領域を含むことがある。所定の関心領域は、TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座からの全てのエクソンを含むことがある。所定の関心領域は、TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座の全て(すなわち、エクソンとイントロンとの両方を含む)を含むことがある。
【0011】
所定の関心領域は、TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座からのエクソンのサブセットを含むことがある。所定の関心領域は、TCRA、TCRB、TCRG、TCRD、IGH、IGL、又はIGK遺伝子座のサブセットを含むことがある。例えば、所定の領域は、例えば、リードデータの収集に使用されるプラットフォームに起因する偏り、エクソン若しくは領域でのGC含量に関連する偏り、又はエクソン若しくは領域でのカバレッジに関連する偏りなど、体系的な偏りに関連すると判断された任意のエクソン又は領域を除外することができる。例えば、一部のエクソン捕捉キットは、予想から逸脱した特定のエクソンでのカバレッジをもたらす偏りに関連していることが示されている。同様に、特定の領域は、例えば配列決定又はアライメントプロセスでのアーチファクトにより、全ゲノム配列決定で予想されるよりもカバレッジが低い又は高いことがある。そのようなエクソン又は領域は、例えば異なるプラットフォーム(例えば異なる捕捉キット)を使用して獲得されたものなど、同じ体系的な偏りを受けることを予想されないデータセット間でリードカバレッジを比較することによって特定することができる。例えば、複数の候補エクソン又は領域の平均logR比を、第1の試料セット及び第2の試料セット(2つの試料セットが同じ系統的な偏りを受けるとは予想されない)について計算することができ、各試料セットにわたる中央値を、複数の候補エクソン又は領域のそれぞれについて比較して、2つの試料セット間で大幅に異なるエクソン又は領域を特定することができる。例えば、閾値(例えば0.5)を超えるlogRの中央値間の差を、偏りを受ける可能性が高いエクソン/領域を除外するための基準として使用することができる。予想よりもカバレッジが低い又は高い領域は、複数の試料にわたる平均リード深度比データにモデル、例えば一般化線形モデルを当てはめ、当てはめられたモデルから所定の距離内にない要約された値(例えば平均値又は中央値)に関連付けられる所定のサイズ(例えば、100bp、200bp、500bp、1000bp)の任意の領域を除去することによって特定することができる。この代わりに又はこれに加えて、予想よりもカバレッジが低い又は高い領域は、複数の試料に関してリンパ球の分画率を決定し、ゲノムワイド関連性解析を行って、決定されたリンパ球分画率に関連する一塩基多型を同定することによって特定することができ、ここで、関連性の存在は、一塩基多型を含む所定のサイズの領域でのカバレッジの偏りを示す。したがって、本方法は、複数の試料に関してリンパ球の分画率を決定し、ゲノムワイド関連性研究を行って、決定されたリンパ球分画率に関連する一塩基多型を同定し、その一塩基多型を含む試料を選択し、選択された試料にわたる平均リード深度比データにモデルを当てはめ、当てはめられたモデルから所定の距離内にない要約された値(例えば平均値又は中央値)に関連する所定のサイズ(例えば100bp、200bp、500bp、1000bp)の領域を除去することによって、全ゲノム配列決定において予想されるよりもカバレッジが低い又は高い領域を特定することを含むことができる。
【0012】
リード深度又はリード深度比は、使用されるリード深度データ獲得プラットフォームに関連する偏りを補正するために処理され得る。例えば、リード深度/リード深度比はGC補正され得る。リード深度データのGC補正は、あらゆる位置でのリード深度に対するGC含量の影響を捕捉する線形モデルを使用して行うことができ、モデルの残差が、正規化されたリード深度値を表す。リード深度に対するGC含量の影響は、エクソン又は領域レベル(GCexon/GCregion)でGC含量を反映する項(ここで、領域は、例えば1000bp(この場合、GCregionは「GC1000bp」と呼ばれることがある)などの所定のサイズのウィンドウとして定義することができる)、及び所定の関心領域全体のレベルでGC含量を反映する項(例えば所定の関心領域に沿って1000bpウィンドウを使用するなど、平滑化されたデータに当てはめられたモデル、例えば線形モデルから得られるGCmacro)によって表すことができる。例えば、lm(basepair~GCexon+GC exon+GCmacro+GC macro)、又は同等にlm(basepair~GCregion+GC region+GCmacro+GC macro)(特にlm(basepair~GC1000bp+GC 1000bp+GCmacro+GC macro))の形式の線形モデルを使用することができ、ここで、「basepair」は、あらゆる位置でのリード深度である。そのようなモデルの残差は、補正されたカバレッジ値として使用することができる。補正された(例えばGC補正された)リード深度値を使用して、関心領域のサブセットから導出されるベースラインリード深度、及びVDJ組換えにより欠失される可能性が高い関心領域のサブセットに関する要約されたリード深度比値(rVDJ)を決定することができる。例えば、関心領域のそれぞれのサブセットでの補正値の中央値(又は、例えば中心性の統計的尺度など、他の要約された規準)を使用することができる。関心領域のサブセットが複数のゲノム位置(例えば、VDJ組換えを受ける可能性が高い領域の先頭及び末尾など)を含む場合、例えば最高値など、複数の中央値のうちの1つを使用することができる。リード深度プロファイルは、配列決定データ、好ましくは全エクソーム配列決定、全ゲノム配列決定(ローパスWGSを含み、浅いゲノム配列決定(shallow genome sequencing)とも呼ばれる)、又はパネル配列決定データから取得することができる。リード深度プロファイルがパネル配列決定データから得られるとき、パネル配列決定データは、所定のゲノム関心領域に関するデータを含む。例えば、データは、所定のゲノム関心領域を含む複数のゲノム領域を標的とする捕捉プローブを使用して取得されていることがある。リード深度プロファイルは、少なくとも0.1倍、少なくとも0.5倍、少なくとも2倍、少なくとも5倍、少なくとも10倍、好ましくは少なくとも15倍、好ましくは少なくとも20倍、より好ましくは少なくとも30倍の配列決定深度を有する配列決定データから取得され得る。リード深度プロファイルは、少なくとも10倍、好ましくは少なくとも15倍、好ましくは少なくとも20倍、より好ましくは少なくとも30倍の配列決定深度を有する全エクソーム配列決定データから取得され得る。リード深度プロファイルは、少なくとも0.1倍、少なくとも0.5倍、少なくとも2倍、少なくとも5倍、又は少なくとも10倍、好ましくは少なくとも2倍の配列決定深度を有する全ゲノム配列決定データから取得され得る。リード深度プロファイルは、例えば10倍、好ましくは15倍などの閾値未満の配列決定深度を有するエクソンを除去するためにフィルタリングされている配列決定データから取得され得る。リード深度プロファイルは、閾値(例えば2倍など)未満の配列決定深度を有する領域(例えば1000bpなどの固定サイズのウィンドウを使用して定義される)を除去するためにフィルタリングされた配列決定データから取得され得る。閾値(例えば10倍又は15倍など)を超える配列決定深度を有する所定のゲノム関心領域内に所定数未満のエクソンしか含まない配列決定データは破棄されることがある。例えば、閾値(例えば15倍)を超える配列決定深度を有する所定の関心領域(例えばTCRA遺伝子座)内に30個未満のエクソンしか含まないデータは破棄されることがある。そのような場合、試料に関して新たな配列データが獲得されることがあり、又はデータが十分なカバレッジを有する別の所定のゲノム関心領域を調査するために配列データが使用されることがある。
【0013】
要約されたリード深度値は、要約された対数リード深度比でもよい。対数は、底2の対数でよい。試料中のリンパ球の分画率(f)を要約されたリード深度比値(rVDJ)の関数として決定することが、試料中のリンパ球の分画率(f)を要約されたリード深度比値(rVDJ)と、混合試料中での、所定の関心領域内で異数性である異常細胞の分画率(p)と、所定の関心領域内の異常細胞のコピー数(Ψ)との関数として決定することを含むことがある。混合試料中の異常細胞の分画率(p)、及び所定の関心領域内での異常細胞のコピー数(Ψ)は、例えば、Van Loo et al.に記載されたASCAT法、又はRiester et al. (2016)に記載され、http://bioconductor.org/packages/PureCN/で入手可能なpureCN法など、当技術分野で知られている方法を使用して異常細胞特異的コピー数プロファイルを取得することによって決定され得る。試料中のリンパ球の分画率(f)を決定することが、
【数1】
としてfの値を決定することを含み、ここでγは定数である。試料中のリンパ球の分画率(f)を決定することが、
【数2】
としてfの値を決定することを含み、ここでγは定数である。パラメータγは、リード深度データを取得するために使用される解析プラットフォームに応じて調整することができる。例えば、Illumina Hiseqを使用するとき、γの値は=1になり得る(すなわち、このパラメータを全ての式から除去することができる)。理論に束縛されることを望まないが、パラメータγは、理論的に予想される値と比較したlogRプロファイル(「r」とも呼ばれる。この場合、logRは、関心領域と参照領域とのリード深度の対数比である)のプラットフォーム関連の「圧縮(compaction)」を捉えていると考えられる。例えば、同じコピー数を有すると予想される領域を比較するとき、rはゼロに等しくすべきである。したがって、このパラメータは、制御環境での期待値と比較することによって、特定のプラットフォームに関して設定されることがある。当業者には理解されるように、Ψ=2及び/又はp=0の場合(すなわち、試料が異常な細胞を含まない、又は他の領域を参照して異常とみなされ得る試料中の細胞が関心領域において異数体でない)、式(3)は式(7)と等価である。したがって、試料が異常細胞を含むことが予想されないとき(例えば生殖細胞系列試料)には式(3)を使用することができる。式(3)はまた、p及び/又はΨが未知である、不確かである、又は信頼できないとき(すなわち、所定の関心領域での異常細胞の割合及び/又はそれらの平均コピー数が未知である、不確かである、又は信頼できないとき)にも使用することができる。例えば、式(7)の結果が1-pを超える場合には、式(3)を使用することができる。理論に束縛されることを望まないが、本発明者らは、実際に試料が異常細胞を含む場合でさえ、リンパ球が混合試料中の細胞の比較的小さい割合を占める限り、式(3)が適切であると考える。
【0014】
VDJ組換えにより欠失される可能性が高い関心領域のサブセットは、VDJ組換えを受けるゲノム遺伝子座の最後のVセグメントの終了位置と、VDJ組換えを受けるゲノム遺伝子座のJセグメントの開始位置との間にある領域を含むことがある。VDJ組換えにより欠失される可能性が高い関心領域のサブセットは、VDJを受けるゲノム遺伝子座の1つ又は複数のDセグメント(例えば全てのDセグメントなど)を含むことがある。VDJ組換えにより欠失される可能性が高い関心領域のサブセットは、好ましくは、V又はCセグメントを含まない。この代わりに又はこれに加えて、VDJ組換えにより欠失される可能性が高い関心領域のサブセットは、Jセグメントを含まない。VDJ組換えにより欠失される可能性が高い関心領域のサブセットは、最後のV遺伝子セグメントと、VDJ組換えを受けるゲノム遺伝子座のJセグメントをコードする最初のセグメント、又はTCRAの場合にはTCRδ鎖の一部をコードする最初のセグメント、若しくは別の所定の関心領域内の任意の対応するセグメントとの間のギャップを含む、そのギャップからなる、又はそのギャップに含まれることがある。例えば、TCRA遺伝子座を調べて、本発明者らは、(80000bpのサイズを有し、位置22800000から始まる(領域chr14:22800000-22880000をもたらす)ように丸めた最後のTCRA VセグメントとTCRデルタ遺伝子の最初のセグメントとの間のギャップとして最大VDJ組換えの位置を定義することが適切であることを見出した。他の定義も可能であり、この領域のサイズの小さな変化が方法の性能に悪影響を及ぼすことは予想されない。最大VDJ組換えの領域は、他のVDJ遺伝子座に関しても同様のアプローチを使用して定義することができ、すなわち、最後のV遺伝子セグメントと最初のJ遺伝子セグメントとの間の領域の周囲又は内部に少なくとも部分的に位置する領域を定義することによって定義することができる。最大VDJ組換えの領域は、表7のゲノム座標、又は他の種若しくは参照ゲノムに関する対応する座標を使用して、それぞれのVDJ遺伝子座について定義することができる。VDJ組換えにより欠失される可能性が高い関心領域のサブセットは、VDJ組換えを受けるゲノム遺伝子座の任意のV又はJセグメントに対応する領域を含むことがある。これは、リンパ球の分画率が、TCRA、TCRB、TCRG、TCRD、IGH、IGL、若しくはIGK遺伝子座での任意の遺伝子セグメントを含むB細胞若しくはT細胞の分画率、又は表8に列挙された任意の遺伝子セグメント若しくは別の種での対応する遺伝子セグメントを含むB細胞若しくはT細胞の分画率であるときに使用することができる。
【0015】
本方法は、モデルを複数のリード深度比に当てはめることをさらに含むことがあり、VDJ組換えにより欠失される可能性が高い関心領域のサブセットに関する要約されたリード深度比値(rVDJ)を取得することが、VDJ組換えにより欠失される可能性が高い関心領域のサブセット内のモデルの値に基づいて、要約されたリード深度比値を取得することを含むことがある。モデルは、所定のゲノム関心領域に沿ったゲノム位置の関数として対数リード深度比を捕捉することができる。複数のリード深度比は、本明細書では「リード深度比プロファイル」と呼ばれることもある。当業者には理解されるように、複数のリード深度比はゲノム座標に沿って相互に編成され、したがって、この複数の値にモデルを当てはめるという言及は、ゲノム座標の関数として複数のリード深度比を含むデータシリーズにモデルを適合させることを表す。モデルは、一般化加算モデル、区分定数モデル、又はベイズモデルなどの一般化線形モデルでよい。モデルは、関心領域内の複数のV及びJ遺伝子の位置に対応するように選択された複数の切断点を有する区分的制約付き線形モデルでもよい。例えば、モデルは、表8に列挙された遺伝子の開始及び終了から、表8に列挙されたゲノム位置から、又は他の種若しくは参照ゲノムでの対応する遺伝子若しくは位置から選択される複数の切断点を有する区分的制約付き線形モデルでもよい。モデルは一般化線形モデルでもよく、配列データは、全エクソーム配列決定などのパネル捕捉法を使用して取得されていてもよい。モデルは区分的制約付き線形モデルでもよく、配列データは、全ゲノム配列決定を使用して取得されていてもよい。区分的制約付き線形モデルは、以下のさらなる制約の1つ又は複数(又は全て)を有することがある:モデルは、所定のゲノム関心領域内の最初のVセグメントの前に値0を有することがある;モデルは、所定のゲノム関心領域内の最後のJセグメントの後に値0を有することがある;モデルは、所定のゲノム関心領域内の後続の各Vセグメントの値が、ゲノム座標に沿って先行セグメントの値よりも低い値を有するようなものであり得る;モデルは、所定のゲノム関心領域内の後続の各Jセグメントの値が、ゲノム座標に沿って先行セグメントの値よりも高い値を有するようなものであり得る。平滑化された曲線(連続的定数か区分的定数かに関わらず)をデータに当てはめる任意のアプローチを、本開示の文脈において使用することができる。別の例として、モデルは、リード深度からのセグメント使用と、関心領域内の複数のV及びJ遺伝子のそれぞれの使用の以前の分布とをモデル化するベイズモデルでもよい。関心領域における複数のV及びJ遺伝子それぞれの使用の事前分布は、一様分布でよい。そのような分布は、各遺伝子が使用される等しい尤度を定義することができる。関心領域での複数のV及びJ遺伝子それぞれの使用の事前分布は、参照集団でのV及びJ遺伝子(セグメント)使用の事前知識を使用する分布でもよい。例えば、参照集団から得られるT細胞受容体配列決定データを使用して、参照集団でのV及びJ遺伝子使用の分布を決定することができる。参照集団はヒト集団でよい。参照集団は、年齢、性別、及びHLA型から選択される1つ又は複数の特定の特徴を有するヒト集団でもよい。モデルはベイズモデルでもよく、配列データは、全ゲノム配列決定を使用して取得されていてもよい。ベイズモデルは、勾配ベースのマルコフ連鎖モンテカルロ(MCMC)法を使用して実装されて、関心領域での各V及びJ遺伝子のセグメント使用に関する確率分布を計算することができる。
【0016】
一般に、要約された値は、中央値、平均、トリム平均、又は複数の値の中心性の任意の他の既知の統計的規準でよい。領域に関する要約されたリード深度比値は、その領域内の複数のリード深度比値に関する中心性の統計的規準でよい。モデル(例えば一般化加算モデル)がリード深度比プロファイルに当てはめられる実施形態では、領域に関する要約されたリード深度比値は、領域内での当てはめられたモデルの値に関する中心性の統計的規準として取得され得る。例えば、領域全体にわたる当てはめられたモデルの平均を使用することができる。区分的定数モデルがリード深度比プロファイルに当てはめられる実施形態では、領域に関する要約されたリード深度比値は、その領域に対応するセグメント又はその領域に対応する複数のセグメントに関する当てはめられたモデルの値、又はその領域内のセグメントに関するモデルの値として取得され得る。例えば、上述したように制約された区分的定数モデルを使用して、VDJ組換えにより欠失される可能性が高い関心領域のサブセットに関する要約されたリード深度比値が、モデルの最小値(これはまたモデルの0からの最大偏差に等しい)として選択されることがある。
【0017】
リンパ球の分画率が、TCRA、TCRB、TCRG、TCRD、IGH、IGL、若しくはIGK遺伝子座での任意の遺伝子セグメントを含むB細胞若しくはT細胞の分画率、又は表8に列挙された任意の遺伝子セグメント若しくは別の種での対応する遺伝子セグメントを含むB細胞若しくはT細胞の分画率であるとき、VDJ組換えにより欠失される可能性が高い関心領域のサブセットは、上記の遺伝子セグメントに対応し得る。遺伝子セグメントに関する要約されたリード深度比値は、遺伝子セグメントに関する要約されたリード深度比値と、先行する遺伝子セグメントに関する要約されたリード深度比値との差、又は差の絶対値でもよい。要約されたリード深度比の値は、要約された対数リード深度比でもよい。要約されたリード深度比は、リード深度比に当てはめられたモデルの値から取得され得る。どの対数も、底2の対数でよい。
【0018】
本方法は、複数のリード深度比に当てはめられたモデルに関する尤度を取得することをさらに含むことがあり、所定の閾値未満の尤度は、試料内の過剰なノイズを示す。本方法は、複数の候補モデル、及び複数の候補モデルの当てはめに関連する1つ又は複数の統計的規準(尤度及び/又は信頼区間など)を取得することと、統計的規準に基づいて候補モデルを選択することとをさらに含むことがある。例えば、所定の範囲内の信頼区間を有する尤度が最高のモデルを選択することができる。複数の候補モデルを取得することは、例えば、10、30、50、又は100モデルなど所定の数のモデルを取得することを含むことがある。
【0019】
本方法は、関心領域のサブセットからベースラインリード深度を取得することをさらに含むことがある。ベースラインリード深度は、関心領域の上記被験体全体にわたる要約されたリード深度値でよい。例えば、ベースラインリード深度は、関心領域の所定のサブセットにわたる中央値リード深度でもよい。ベースラインリード深度を取得するために使用される関心領域のサブセットは、VDJ組換えにより欠失される可能性が低い関心領域のサブセットでもよい。VDJ組換えにより欠失される可能性が低い関心領域のサブセットは、VDJ組換えを受けるゲノム遺伝子座の最初のn個のVセグメントを含むことがある。VDJ組換えにより欠失される可能性が低い関心領域のサブセットは、VDJ組換えを受けるゲノム遺伝子座のCセグメントを含むことがある。好ましくは、ベースラインリード深度を取得するために使用される関心領域のサブセットは、VDJ組換えを受けるゲノム遺伝子座のD又はJセグメントを含まない。実際、本明細書に開示される方法によれば、調査中のVDJ遺伝子座の先頭、末尾、若しくは先頭と末尾の両方(両方ではなく)、又はVDJ組換えによる影響を受けないコピー数値を有すると仮定することができる他の近接領域を使用することが可能である。ベースラインリード深度を取得するために使用される関心領域のサブセットは、表7でのゲノム座標、又は他の種若しくは参照ゲノムに関する対応する座標を使用して、それぞれのVDJ遺伝子座について定義することができる。
【0020】
理論に束縛されることを望まないが、より長い正規化領域の使用(例えば、先頭領域と末尾領域の両方を使用する、及び/又は先頭領域の長さを増加させる)は、リード深度データにおいて典型的なノイズを有利に補償すると考えられる。例えば、先頭領域を拡張して、頻繁に失われる可能性が低い多数のVセグメントを含めることができ、データが利用可能な場合(例えば全ゲノム配列決定データを使用するときなど)には遺伝子の外側の領域を含めることもできる。さらに、VDJ組換えに関連付けられるシグナルは遺伝子の先頭よりも遺伝子の末尾に近いので(Jセグメントが遺伝子の末尾の近くにクラスタ化されるため。一方、Vセグメントはより大きく広がっている)、遺伝子の先頭でのシグナルの使用が有益であると考えられる。さらに、例えば遺伝子座の前又は後など、調査中のVDJ遺伝子座の外側の領域を使用することも可能である。しかし、対象の遺伝子座からの距離が増加すると、見られるシグナルががん細胞内の異なるコピー数事象に対応する可能性が高くなり、したがって、調査中のVDJ遺伝子座での腫瘍コピー数を反映しなくなる。パラメータnは、適切な訓練データを使用して、例えばリンパ球分画率の直交規準と比較したときに訓練データにわたるリンパ球分画率の最も正確な推定量をもたらすnの値を選択することによって決定することができる。リンパ球分画率の直交規準は、例えば、トランスクリプトームデータ及び/又は組織病理学データに基づいて取得され得る。パラメータnは、8~16の間、10~14の間、例えば10、11、又は12でよい。
【0021】
リード深度プロファイルを取得することは、所定の関心領域にわたって複数の生のリード深度値を取得することと、リード深度値を平滑化することとを含むことがある。リード深度値を平滑化することは、所定の幅のウィンドウにわたる対応するローリング中央値によって生のリード深度値を置き換えることを含むことがある。ウィンドウの所定の幅は、約20bp~約200bpの間、又は約50bp~約150bpの間で選択され得る。例えば、リード深度プロファイルは、所定の関心領域に沿って50bpウィンドウでローリング中央値を計算することによって得られた値を含むこともある。本方法を使用して取得されたリンパ球分画率の推定量を、Danaherスコアなどリンパ球分画率の直交規準に対する様々な候補ウィンドウサイズと比較することによって、特定のデータセット、データのタイプ、又は状況についてウィンドウの適切なサイズを経験的に決定することができる。
【0022】
混合試料は、血液試料又は腫瘍試料でよい。本方法は、被験体から、複数の細胞型からのゲノム材料を含む混合試料を取得することをさらに含むことがある。本方法は、被験体から、1つ又は複数のインビトロステップによって、複数の細胞型からのゲノム材料を含む混合試料からリード深度データを取得することをさらに含むことがある。1つ又は複数のインビトロステップは、核酸抽出、ライブラリ調製、標的配列捕捉、配列決定、及び/又はコピー数アレイへのハイブリダイゼーションを含むことがある。当業者には理解されるように、試料中の核酸の存在を示すデータが例えば配列決定によって得られると、当技術分野で知られているように又は本明細書に記載されるように、例えば品質管理ステップ、参照ゲノムアライメントステップ(マッピングとも呼ばれる)、正規化ステップなどの追加のステップを適用することができる。本方法は、1つ又は複数のさらなる混合試料に対して本態様の任意の実施形態の方法を繰り返すことをさらに含むことがあり、ここで、最初の混合試料とさらなる混合試料とは同じ被験体から取得されており、最初の混合試料とさらなる混合試料とは腫瘍試料である。本方法は、最初の混合試料及びさらなる混合試料に関するリンパ球の分画率(f)に基づいて、1つ又は複数の要約されたリンパ球の分画率を取得することをさらに含むことがある。要約されたリンパ球の分画率は、最初の混合試料及びさらなる混合試料にわたる平均分画率、最初の混合試料及びさらなる混合試料にわたる最小分画率、最初の混合試料及びさらなる混合試料にわたる最大分画率、及び/又は最初の混合試料及びさらなる混合試料にわたる最小分画率と最初の混合試料及びさらなる混合試料にわたる最大分画率との倍率差として取得され得る。被験体について複数の混合試料が利用可能である場合、単一試料に関する個々のリンパ球分画率の代わりに、要約されたリンパ球の分画率の1つ又は複数を使用して、以下にさらに述べるように予後予測を提供することができる。例えば、複数の試料にわたる最小分画率、複数の混合試料にわたる最小及び最大分画率、及び/又は最初の混合試料及びさらなる混合試料にわたる最小分画率と最初の混合試料及びさらなる混合試料にわたる最大分画率との倍率差を使用して、被験体に関する予後予測を提供することができる。好ましくは、予後予測は、複数の試料にわたる最小分画率を使用して提供される。
【0023】
本方法は、決定されたリンパ球分画率及び/又はそこから導出される任意の値を、例えばユーザインターフェースを介してユーザに提供することをさらに含むことがある。そこから導出される値は、診断又は予後予測指標を含むことがある。
【0024】
当業者には理解されるように、(少なくともゲノムDNAの配列決定によって通常生成されるデータの量に起因する)本明細書に記載の操作の複雑さは、人間の精神活動の範囲を超えるほどである。したがって、(試料調製又は獲得ステップが記載されている場合など)文脈上別段の指示がない限り、本明細書に記載の方法の全てのステップはコンピュータで実行される。
【0025】
本開示の方法は、異なる診断及び/又は予後予測が被験体からの試料中の異なるレベルのリンパ球に関連することがある多くの臨床状況において使用できる。したがって、本開示は、リンパ球分画率の状態(例えば腫瘍浸潤リンパ球(TIL)状態)に従って被験体の集団を層別化するための方法にも関し、本方法は、集団内の各被験体からの1つ又は複数の試料(例えば腫瘍試料)に対して本開示の第1の態様の方法を実施することを含む。例えば、患者の1つ又は複数の腫瘍試料について推定されたリンパ球分画率に応じて、被験体を「免疫コールド」群と「免疫ホット」群に分けることができる。これは、個別化医療及び/又は臨床試験のための患者の識別に特に応用することができる。免疫コールドとして分類された患者は、免疫ホットとして分類された患者と比較して、チェックポイント阻害薬の使用など免疫療法に対する応答性が低いと予想される。したがって、免疫ホットは、免疫療法の恩恵を受ける可能性がより高いことがあり、免疫コールドは、代替治療選択肢の恩恵を受ける可能性がより高いことがある。この代わりに又はこれに加えて、分類された患者は、免疫ホットとして分類された患者よりも生存予後が不良になることがある。したがって、本開示の方法は、がんと診断された被験体を、1つ又は複数の免疫療法に対する異なる予後予測及び/又は感受性の予測を有する少なくとも2つの群に分類する際にも使用できる。
【0026】
したがって、さらなる態様によれば、本開示は、がんと診断された被験体に関する予後予測を提供する方法であって、第1の態様の任意の実施形態の方法を使用して、被験体からの1つ又は複数の腫瘍試料中のリンパ球分画率を決定することを含む方法を提供する。また、がんと診断された被験体をモニタリングする方法であって、第1の態様の任意の実施形態の方法を使用して、第1の時点で獲得された被験体からの1つ又は複数の腫瘍試料、及びさらなる時点で獲得された被験体からの1つ又は複数の腫瘍試料中のリンパ球分画率を決定することを含む方法も記載される。例えば、最初の時点は治療前でよく、さらなる時点は治療後でよい。代替として、最初の時点とさらなる時点とはどちらも治療後でよい。治療は、免疫療法を含む任意の抗がん療法を伴っていてよい。予後予測を提供する又は被験体をモニタリングする方法は、試料中のリンパ球分画率(例えばTリンパ球分画率など)に応じて、試料を免疫ホット又は免疫コールドとして分類することをさらに含むことがある。例えば、閾値(例えば、約0.1、すなわち約10%)を超えるリンパ球分画率を有する試料は免疫ホットとして分類されることがあり、閾値以下のリンパ球分画率を有する試料はコールドとして分類されることがある。本方法は、免疫コールドとして分類された患者からの試料の数に応じて、被験体を予後良好群と予後不良群とに分類することをさらに含むこともある。例えば、異なる腫瘍領域からの試料を解析するとき、免疫コールドとして分類された試料の数が閾値(例えば2など)以上であると、被験体が予後不良群に分類されることがある。予後不良群は、予後良好群と比較して、無再発生存率の減少及び/又は全生存率の減少と関連していることがある。リンパ球分画率及び/又は免疫コールド試料の数に関する閾値は、適切な訓練コホートを使用して、例えば、大幅に異なる予後予測に関連する群間で患者を分類することができる様々な閾値の性能を評価することによって決定することができる。がんと診断された被験体が免疫療法に応答する可能性が高いかどうかを決定する方法であって、第1の態様の任意の実施形態の方法を使用して被験体からの1つ又は複数の腫瘍試料中のリンパ球分画率を決定することを含む方法も記載される。本方法は、免疫療法に応答する可能性が高いと診断された被験体に免疫療法を投与することをさらに含むことがある。本方法は、免疫療法に応答する可能性が高いと診断された被験体に、免疫療法を伴う治療を推奨することを含むことがある。本方法は、被験体が免疫療法に応答する可能性が低いと診断された場合に、代替療法(例えば従来の化学療法や放射線療法など)を投与すること、及び/又は被験体に代替療法を伴う治療を推奨することを含むことがある。
【0027】
本方法は、免疫療法に応答する可能性が高い群と、免疫療法に応答する可能性が低い群とに被験体を分類することをさらに含むこともある。実際、本発明者らは、本開示に従って決定された、腫瘍中、さらには血液試料中のT細胞分画率が、免疫療法に対する応答の予測因子であることを実証した。例えば、本方法は、試料中のリンパ球分画率(例えばTリンパ球分画率など)に応じて、試料を免疫ホット又は免疫コールドとして分類することをさらに含むことがある。例えば、閾値(例えば、約0.1、すなわち約10%)を超えるリンパ球分画率を有する試料は免疫ホットとして分類されることがあり、閾値以下のリンパ球分画率を有する試料はコールドとして分類されることがある。次いで、被験体からの1つ又は複数の試料が免疫コールドである場合、その被験体を、免疫療法に応答する可能性が低い群に分類することができる。代替として、被験体からの試料が閾値未満のリンパ球分画率を有する場合、被験体は、免疫療法に応答する可能性が低い群に分類されることがあり、そうでない場合には、免疫療法に応答する可能性が高い群に分類されることがある。
【0028】
免疫療法は、免疫系の機能を調節する、及び/又はがんを治療するために既存の免疫機能を利用する任意の療法であり得る。免疫療法は、T細胞転移療法(腫瘍浸潤リンパ球(又はTIL)療法及びCAR-T細胞療法)、療法用抗体、がん治療ワクチン、チェックポイント阻害薬療法、及び免疫系調節因子(例えばインターフェロン及びインターロイキン)から選択されることがある。本方法は、被験体からの1つ又は複数の試料中のリンパ球分画率と、被験体に関する推定される腫瘍変異負荷とに基づいて、免疫療法(例えばCPI療法)に応答する可能性が高い群と、免疫療法(例えばCPI療法)に応答する可能性が低い群とに被験体を分類することを含むことがある。そのような分類は、多変量分類モデル(例えば、訓練された一般化線形モデルを使用する分類法)を使用して取得することができる。分類モデルのパラメータ(例えば、閾値、多変量モデルのパラメータ)は、適切な訓練コホートを使用して、例えば既知の免疫療法応答状態を有する被験体の群を使用して決定することができる。
【0029】
被験体がT細胞リンパ球減少症を有するかどうかを判定する方法であって、第1の態様の任意の実施形態の方法を使用して被験体からの1つ又は複数の試料中のリンパ球分画率を決定することを含む方法も記載される。1つ又は複数の試料は、血液試料でもよい。被験体は、新生児被験体でもよい。被験体がT細胞リンパ球減少症を有するかどうかを決定する方法は、重症複合免疫不全症をスクリーニングするための方法の文脈で行うことができる。本方法は、被験体をリンパ球減少症に関して治療すること、又は被験体にリンパ球減少症の治療を推奨することをさらに含むこともある。
【0030】
異常なリンパ球数に関連する疾患、障害、又は症状を有すると被験体を診断する方法であって、第1の態様の任意の実施形態の方法を使用して被験体からの1つ又は複数の試料中のリンパ球分画率を決定することを含む方法も記載される。また、異常なリンパ球数に関連する疾患、障害、又は症状を有すると診断された被験体をモニタリングする方法であって、第1の態様の任意の実施形態の方法を使用して被験体からの1つ又は複数の試料中のリンパ球分画率を決定することを含む方法も記載される。異常なリンパ球数に関連する疾患、障害、又は症状は、自己免疫疾患、骨髄疾患、又は感染症であり得る。
【0031】
さらなる態様によれば、本開示は、
少なくとも1つのプロセッサと、命令を含む少なくとも1つの非一時的なコンピュータ可読媒体とを備えるシステムであって、命令が、少なくとも1つのプロセッサによって実行されるときに、VDJ組換えを受けるゲノム遺伝子座の少なくとも一部を含む所定のゲノム関心領域に沿ったリード深度を含む試料のリード深度プロファイルを取得する操作と、関心領域のサブセットから導出されたベースラインリード深度を参照して、所定の関心領域に沿ってリード深度を正規化することによって、複数のリード深度比(r)を取得する操作と、VDJ組換えにより欠失される可能性が高い関心領域のサブセットに関する要約されたリード深度比値(rVDJ)を取得する操作と、試料中のリンパ球の分画率(f)を、要約されたリード深度比値(rVDJ)の関数として決定する操作とを少なくとも1つのプロセッサに実行させる、システムを提供する。本態様によるシステムは、第1の態様に関連して述べた任意の特徴を備えることがある。
【0032】
本態様によるシステムは、前述の態様の任意の実施形態の方法を実行するように構成され得る。特に、少なくとも1つの非一時的なコンピュータ可読媒体は、少なくとも1つのプロセッサによって実行されるときに、少なくとも1つのプロセッサに、第1の態様に関連して述べた任意の操作を含む操作を実行させる命令を含むことがある。システムは、プロセッサと動作可能に接続して、以下のうちの1つ又は複数をさらに備えることができる:ユーザインターフェースであり、命令により、プロセッサは、ユーザへの出力のために、少なくともリンパ球の推定量又はそこから導出される値をユーザインターフェースに提供する;1つ又は複数の配列リード深度データ獲得デバイス(例えば配列決定デバイスなど);1つ又は複数のデータストア、例えばシーケンスリード深度データストア。
【0033】
さらなる態様によれば、少なくとも1つのプロセッサによって実行されるとき、少なくとも1つのプロセッサに、本明細書に記載の任意の態様の任意の実施形態の方法を実行させる命令を含む非一時的なコンピュータ可読媒体が提供される。
【0034】
さらなる態様によれば、コードがコンピュータ上で実行されるとき、コンピュータに、本明細書に記載の任意の態様の任意の実施形態の方法を実行させるコードを含むコンピュータプログラムが提供される。
【0035】
本発明は、明らかに許容可能でない又は明示的に回避されている場合は除き、記載された態様及び好ましい特徴の組合せを含む。本発明のこれら及びさらなる態様及び実施形態を、添付の実施例及び図面を参照して以下でさらに詳細に述べる。
【図面の簡単な説明】
【0036】
図面の簡単な説明
図1】混合試料中のリンパ球分画率を決定する方法を概略的に示すフローチャートである。
図2】混合試料中のリンパ球分画率を決定するためのシステムの一実施形態を示す図である。
図3A】VDJ組換えシグナルを使用した、本明細書に記載の混合試料中のリンパ球分画率の決定の背景にある生物学的概念を概略的に示す図であり、標準的な腫瘍及びそれにマッチした生殖細胞系列の解析における体細胞コピー数変化の利得又は損失事象を検出するために、リード深度比シグナルがどのように使用されるかを概略的に示す。この解析では、細胞は、腫瘍細胞、T細胞、及び他の全ての間質細胞という3つの異なる細胞タイプからなる。
図3B】VDJ組換えシグナルを使用した、本明細書に記載の混合試料中のリンパ球分画率の決定の背景にある生物学的概念を概略的に示す図であり、VDJ組換えとTRECの除去に関連してTCRA遺伝子に焦点を当てたときに、この同じプロセスがどのように作用するかを概略的に示す図である。左下のパネルは、14qの周囲の領域と比較して、TCRA遺伝子内のTRACERx100データセットで検出された切断点の数の増加を示し、TRECシグナルが捕捉されることを示唆する。
図4A】マッチした腫瘍と比較して高い血液中のT細胞含量のレベルを示す2つのTRACERx100領域におけるリード深度比の例を示すプロットである。VDVセグメントは、TCRα遺伝子座とTCRδ遺伝子座との両方の可変セグメントを表す。
図4B】マッチした血液と比較して高い腫瘍中のT細胞含量のレベルを示す2つのTRACERx100領域におけるリード深度比の例を示すプロットである。VDVセグメントは、TCRα遺伝子座とTCRδ遺伝子座との両方の可変セグメントを表す。
図5】本開示の実施形態に従って、図3に示されるシグナルをどのようにしてT細胞分画率推定量に変換することができるかを概略的に示す図である。
図6A】様々な局所コピー数及び腫瘍純度値に関するナイーブTCRA T細胞分画率スコアに関する理論値を示す図である。点及び線は、実際のT細胞分画率によって色付けされており、直線の水平線は、点があるべき位置を示す。
図6B】TRACERx100コホートにわたるTCRA遺伝子の局所コピー数の分布を示す図である。
図6C】TRACERx100コホートにわたる腫瘍純度の分布を示す図である。
図6D】TRACERx100コホートに関するコピー数ごとの正確なスコアとナイーブスコアを示す図である。見て分かるように、コピー数が1である場合にはナイーブスコアは過大推定であり、コピー数が2を超える他の場合には過小推定である。
図7】細胞株データを使用した、本明細書に記載のアプローチの検証の結果を示す図である。T細胞由来の細胞株又は非T細胞由来の細胞株のいずれかのWESからの、計算されたTCRA T細胞分画率の円グラフが示されている。
図8A】シミュレートされたデータを使用して本明細書に記載のアプローチを検証した結果を示す図であり、バックグラウンドTCRAコピー数が2であり、T細胞分画率値が0.01~0.99の範囲であるシミュレートされたデータセットにおける、計算されたT細胞分画率と実際のT細胞分画率を示す。
図8B】シミュレートされたデータを使用して本明細書に記載のアプローチを検証した結果を示す図であり、24%のT細胞及び75%の腫瘍からなる試料(TCRAコピー数=1)からのシミュレートされた対数リード深度比を示す。
図8C】シミュレートされたデータを使用して本明細書に記載のアプローチを検証した結果を示す図であり、様々な腫瘍コピー数及び純度に関する、計算されたナイーブT細胞分画率と実際の分画率と差を示す。
図8D】シミュレートされたデータを使用して本明細書に記載のアプローチを検証した結果を示す図であり、様々な腫瘍コピー数及び純度に関する、TCRA T細胞分画率と実際の分画率との差を示す。
図9A】TRACERx100データにおける免疫浸潤の直交規準との比較によって、本明細書に記載のアプローチを検証した結果を示す図であり、推定されたT細胞分画率と、CD8+、T細胞、及び総TILに関するDanaher RNAベースのスコアとの関連性を示す。
図9B】TRACERx100データにおける免疫浸潤の直交規準との比較によって、本明細書に記載のアプローチを検証した結果を示す図であり、RNA-seq(Danaher、Davoli、EPIC、TIMER、CIBERSORT、及びxCell)又はDNA(TIL ExTRECT及びCDR3 VDJスコア)に基づく、病理学TILスコアと、CD8+T細胞含量の尺度との関連性を示す。
図9C】TRACERx100データにおける免疫浸潤の直交規準との比較によって、本明細書に記載のアプローチを検証した結果を示す図であり、推定されたTCRA T細胞分画率と、Danaher、Davoli、EPIC、TIMER、CIBERSORT、及びxCell法からの様々な免疫関連細胞タイプに関するRNAベースのスコアとの関連性を示す。スコアは、Spearmanのρ係数によって評価されたTCRA T細胞分画率との関連性の強さに従って並べられている。
図9D】TRACERx100データにおける免疫浸潤の直交規準との比較によって、本明細書に記載のアプローチを検証した結果を示す図であり、iDNA法に基づくCDR3 VDJリードスコアとTCRA T細胞分画率との関連性を示す。
図10A】免疫浸潤の直交規準との比較によって本明細書に記載のアプローチを検証した結果を示す図であり、メチル化データから計算されたTRACERx100データにおけるTCGA LUAD及びLUSC試料のリンパ球分画率と、CIBERSORTで計算されたTCRA T細胞分画率(A)との比較を示す。
図10B】免疫浸潤の直交規準との比較によって本明細書に記載のアプローチを検証した結果を示す図であり、メチル化データから計算されたTRACERx100データにおけるTCGA LUAD及びLUSC試料のリンパ球分画率と、CIBERSORTで計算されたCD8+T細胞分画率との比較を示す。
図11A】推定されたTCRA T細胞分画率に対するリードカバレッジ(A~B)又は潜在的なFFPE関連の変化(C)の影響に関して本明細書に記載のアプローチを検証した結果を示す図であり、異なる深度への5つのTRACERx100領域のダウンサンプリングを示す。
図11B】推定されたTCRA T細胞分画率に対するリードカバレッジ(A~B)又は潜在的なFFPE関連の変化(C)の影響に関して本明細書に記載のアプローチを検証した結果を示す図であり、様々な深度レベルへのシミュレートされたデータのダウンサンプリングを示す。
図11C】推定されたTCRA T細胞分画率に対するリードカバレッジ(A~B)又は潜在的なFFPE関連の変化(C)の影響に関して本明細書に記載のアプローチを検証した結果を示す図であり、CPI1000+コホート内の膀胱腫瘍及び悪性黒色腫に関するFFPE及び新鮮凍結試料でのTCRA T細胞分画率(非GC補正)値を示す。
図11D】推定されたTCRA T細胞分画率に対するリードカバレッジ(A~B)又は潜在的なFFPE関連の変化(C)の影響に関して本明細書に記載のアプローチを検証した結果を示す図であり、最高のCDR3リード数を有する5つのTRACERx100領域の様々な深度へのダウンサンプリング、及びその結果得られたCDR3リード数を示す。
図12A】TRACERx100コホート内の予後予測指標を得るためにTCRA T細胞分画率を使用した結果を示す図であり、TCRA T細胞分画率推定量から推測される、<10%のT細胞含量を有する領域の数によって定義される、高リスク患者と低リスク患者との間の生存率の差を示すカプラン・マイヤー曲線を示す。
図12B】TRACERx100コホート内の予後予測指標を得るためにTCRA T細胞分画率を使用した結果を示す図であり、TRACERx100でのLUAD及びLUSC組織学的サブタイプに関するカプラン・マイヤー曲線を示す。
図12C】TRACERx100コホート内の予後予測指標を得るためにTCRA T細胞分画率を使用した結果を示す図であり、TRACERx100でのLUAD及びLUSC組織学的サブタイプに関するカプラン・マイヤー曲線を示す。
図13A】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、TCGA LUAD及びLUSCでの全生存率を示すカプラン・マイヤー曲線であり、患者は、各群内のTCRA T細胞分画率の中央値によって分けられている。
図13B】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、LUAD単独での全生存率を示すカプラン・マイヤー曲線であり、患者は、各群内のTCRA T細胞分画率の中央値によって分けられている。
図13C】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、LUSC単独での全生存率を示すカプラン・マイヤー曲線であり、患者は、各群内のTCRA T細胞分画率の中央値によって分けられている。
図14】TRACERx100コホート内のTCRA T細胞分画率の解析の結果を示す図である。箱ひげ図が、TRACERx100での血液と腫瘍との間のTCRA T細胞分画率推定量の差を示す。
図15】TRACERx100コホート内のTCRA T細胞分画率の解析の結果を示す図である。組織学的特徴によって分けられた血液T細胞分画率と腫瘍T細胞分画率との比較。同じ患者からの領域は線で結ばれており、線のタイプは、全ての腫瘍領域が、TRACERx100でのマッチした血液T細胞分画率と比較して高いT細胞分画率を有する(長い破線)か、低いT細胞分画率を有する(実線)か、又は不均一なT細胞分画率を有する(短い破線)かによって決まっている。
図16A】TRACERx100コホート内のTCRA T細胞分画率の解析の結果を示す図であり、TRACERx100コホート内の血液試料と腫瘍試料との間のTCRA T細胞分画率の差を示す箱ひげ図である。
図16B】TRACERx100コホート内のTCRA T細胞分画率の解析の結果を示す図であり、TRACERx100コホート内の血中TCRA T細胞分画率の予測子を示す。
図16C】TRACERx100コホート内のTCRA T細胞分画率の解析の結果を示す図であり、LUAD(上)とLUSC(下)を腫瘍内に存在するコールド領域の数(左から右に増加)で割った値によって分けた、マルチ領域TRACERx100コホートに関するカプラン・マイヤー曲線を示す。ホット領域及びコールド領域は、全ての腫瘍領域の平均(0.08095)を閾値として使用することによって定義した。各カプラン・マイヤー曲線において、含める患者は、閾値の定義に使用されるコールド領域の数よりも多い合計領域を有する患者に限定した。
図16D】TRACERx100コホート内のTCRA T細胞分画率の解析の結果を示す図であり、TRACERx100コホート全体、並びにLUAD及びLUSC患者個別でのTCRA T細胞分画率に関連する様々なマルチ領域尺度に無病生存率を関係付ける個別のCox回帰モデルのハザード比を示す。相対領域免疫回避スコアは、最大領域TCRAスコアを最小領域(上位95%CI)TCRAスコアで割った値として定義される。
図16E】TRACERx100コホート内のTCRA T細胞分画率の解析の結果を示す図であり、最小及び最大領域TCRA T細胞分画率、腫瘍ステージ、年齢、及び性別を含むTRACERx100コホート全体のCox比例ハザードモデルを示す。
図16F】TRACERx100コホート内のTCRA T細胞分画率の解析の結果を示す図であり、LUAD(上)とLUSC(下)を腫瘍内に存在するコールド領域の数(左から右に増加)で割った値によって分けた、マルチ領域TRACERx100コホートに関するカプラン・マイヤー曲線を示す。ホット領域及びコールド領域は、全ての腫瘍領域の中央値(0.0736)を閾値として使用することによって定義した。各カプラン・マイヤー曲線において、含める患者は、閾値の定義に使用されるコールド領域の数よりも多い合計領域を有する患者に限定した。
図17A】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、TCGAコホート内のLUADに関して、血液試料と腫瘍試料との間のTCRA T細胞分画率の差を示す箱ひげ図である。
図17B】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、TCGAコホート内のLUSCに関して、血液試料と腫瘍試料との間のTCRA T細胞分画率の差を示す箱ひげ図である。
図17C】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、TCGAコホート内の血液でのLUADとLUSCとの間のTCRA T細胞分画率の差を示す箱ひげ図である。
図17D】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、腫瘍試料でのLUADとLUSCとの間のTCRA T細胞分画率の差を示す箱ひげ図である。
図17E】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、TCGA LUAD及びLUSCコホート内の血中TCRA T細胞分画率の予測子を示す。
図17F】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、TCGA LUADコホートの平均(0.109)を閾値として使用してコホートを免疫ホット群とコールド群に分けた、TCGA LUADコホートにおける全生存率及び無増悪生存率のカプラン・マイヤー曲線を示す。
図17G】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、全生存率(OS)と無増悪生存率(PFS)との両方に関するTCGA LUAD及びLUSCコホートに関するTCRA T細胞分画率についての個別のCox回帰モデルのハザード比を示す。
図17H】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、全生存率及び無増悪生存率について0~0.16の異なる閾値(0.0025刻み)に基づいて腫瘍試料をホットとコールドに分けた、TCGAに関するカプラン・マイヤープロットからのLog2(ハザード比)を示す。
図17I】TCGAコホート内のTCRA T細胞分画率の解析の結果を示す図であり、ホット腫瘍とコールド腫瘍を区別するための閾値としてTCGA LUADコホートの平均(0.109)を使用した、全生存率及び無増悪生存率についてのTCGA LUSCコホート及びTCGA LUAD & LUSCコホートに関するカプラン・マイヤー曲線を示す。
図18A】TRACERx100コホートにおける血液試料中のTCRA T細胞分画率の性差を示す箱ひげ図である。
図18B】TCGAコホートにおける血液試料中のTCRA T細胞分画率の性差を示す箱ひげ図である。
図18C】RACERx100コホートにおける生殖細胞系列血液試料に関する年齢とTCRA T細胞分画率との関連性を示す箱ひげ図である。
図18D】TCGAコホートにおける生殖細胞系列血液試料に関する年齢とTCRA T細胞分画率との関連性を示す箱ひげ図である。
図19】CPI1000+データセットのコホートの概要を示す図である。
図20】CPI1000+メタコホートにわたる非応答群と応答群とに関する計算された腫瘍TCRA T細胞分画率の有意差を示すバイオリンプロットを示す図である。0.1での黒い点線は、腫瘍を分けて、免疫ホット又はコールドのいずれかとして分類する。
図21】CPI1000+データにおけるクローン性TMBに対する腫瘍TCRA T細胞分画率を示すプロットを示す図である。破線は、コホートを高/低変異負荷及びホット/コールド腫瘍を有する4つの象限に分ける。差し込まれている円グラフは、CPI療法に応答した患者の割合を示す。
図22】個々のがん種の少なくとも10人の患者、及びDNAとRNA配列データの両方を含む複数のコホートにわたる免疫応答の予測子の単変量メタ解析の結果を示す図である。左のパネル:応答の予測値に関して、様々な臨床因子のOR値及び関連のp値を示すフォレストプロット。右のパネル:CPI1000+データセットでの個々の研究にわたるOR値のヒートマップ。RNA-seqとTCRA T細胞分画率との両方を利用可能なコホートに焦点を当てている。
図23】CPI1000+データセットにおけるCPI応答を予測するためのGLMモデルのROCプロットを示す図である(1:クローン性TMB、3:クローン性TMB+TCRA T細胞分画率、2:クローン性TMB+CD8A発現、4:クローン性TMB+TCRA T細胞分画率+CD8A発現)。
図24A】CPI肺データセットのコホートの概要を示す図である。上のパネルの赤い線は、CPIに対する応答がある(0.10)又は応答がない(0.0070)患者のTCRA T細胞分画率の中央値を反映している。腫瘍TCRA T細胞分画率は多くの場合にゼロであることに留意されたい。
図24B】DNA配列決定データを含むがRNA配列決定データは含んでいない3つのNSCLC CPIデータセットにわたる単変量メタ解析の結果を示す図である。
図25】リード深度正規化(図5でのステップ2を参照)で使用されるTCRA Vセグメントの数に応じた、TRACERx100コホート内の全ての領域に関するTCRA T細胞分画率(上)、使用されるセグメントの数に応じた、非ゼロであるTRACERx100コホート内の領域の割合(中央)、及び正規化に使用されるVセグメントの数に応じた、Danaher T細胞遺伝子シグネチャとの相関の-log(p値)(下)を示す図である。
図26A】TCGAデータで使用されるエクソン捕捉プロセスにおける偏りの影響の調査を示す図であり、TCGA LUADコホートからの単一試料におけるエクソンに関する対数リード深度比の例を示すプロットを示す。特定のセグメント、特にJ遺伝子エクソンは、カバレッジの偏りを示す二峰性分布を示す。
図26B】TCGAデータで使用されるエクソン捕捉プロセスにおける偏りの影響の調査を示す図であり、TRACERx100(青)又はTCGA LUAD(赤)コホートでの選択された範囲のエクソンに関する対数比値の中央値を示す。TCGA LUADコホート内の多くのエクソンは、はるかに低いカバレッジを有し、したがって低い対数比値を有する。
図26C】TCGAデータで使用されるエクソン捕捉プロセスにおける偏りの影響の調査を示す図であり、GC補正前のTCGAコホートに関する縮小されたエクソンセットを使用したTCRA T細胞分画率を示す。
図26D】TCGAデータで使用されるエクソン捕捉プロセスにおける偏りの影響の調査を示す図であり、GC補正後のTCGAコホートに関する縮小されたエクソンセットを使用したTCRA T細胞分画率を示す。
図27A】血液及び悪性組織内のTCRA T細胞分画率の感染関連決定因子の調査を示す図であり、KRAKENからの微生物リードと、血液試料中のTCRA T細胞分画率との関連性を示す。
図27B】血液及び悪性組織内のTCRA T細胞分画率の感染関連決定因子の調査を示す図であり、KRAKENからの微生物リードと、腫瘍試料中のTCRA T細胞分画率との関連性を示す。
図27C】血液及び悪性組織内のTCRA T細胞分画率の感染関連決定因子の調査を示す図であり、LUADにおいて、正規化されたリード数が腫瘍内のTCRA T細胞分画率と有意に関連付けられる微生物種を示す。
図27D】血液及び悪性組織内のTCRA T細胞分画率の感染関連決定因子の調査を示す図であり、LUSCにおいて、正規化されたリード数が腫瘍内のTCRA T細胞分画率と有意に関連付けられる微生物種を示す。
図28A】マルチ領域データを用いた、血液及び悪性組織でのTCRA T細胞分画率の決定因子の調査を示す図であり、正常な血液試料とペアにされたマルチ領域の顕微切除組織を含むPNEコホートの概要プロットを示す。
図28B】マルチ領域データを用いた、血液及び悪性組織でのTCRA T細胞分画率の決定因子の調査を示す図であり、PNEコホートにおける血中TCRA T細胞分画率の予測子を示す。
図28C】マルチ領域データを用いた、血液及び悪性組織でのTCRA T細胞分画率の決定因子の調査を示す図であり、PNEコホートにおける血中TCRA T細胞分画率の予測子を示す。
図28D】マルチ領域データを用いた、血液及び悪性組織でのTCRA T細胞分画率の決定因子の調査を示す図であり、Messaoudene et al.の乳がんコホートにおけるTCRA T細胞分画率に対する腫瘍試料位置の影響を示す。
図28E】マルチ領域データを用いた、血液及び悪性組織でのTCRA T細胞分画率の決定因子の調査を示す図であり、Messaoudene et al.のTRACERx100コホートにおけるTCRA T細胞分画率に対する腫瘍試料位置の影響を示す。
図28F】マルチ領域データを用いた、血液及び悪性組織でのTCRA T細胞分画率の決定因子の調査を示す図であり、ゲノム因子からのPNE試料中のTCRA T細胞分画率に関する線形モデルを示す。
図28G】マルチ領域データを用いた、血液及び悪性組織でのTCRA T細胞分画率の決定因子の調査を示す図であり、LUAD及びLUSCにおける血液及び腫瘍試料でのTCRA T細胞分画率との関連性について試験した59の微生物種に関するLog10 p値を示す。赤い線は、P=0.000423での有意性閾値を表す。
図28H】マルチ領域データを用いた、血液及び悪性組織でのTCRA T細胞分画率の決定因子の調査を示す図であり、PNEコホートにおける平均TCRA T細胞分画率の概要を示す。
図29A】マルチサンプル汎がんコホート内でのサブクローン性SCNAと免疫不均一性との関連性の調査を示す図であり、マルチサンプル汎がんコホートにわたる免疫不均一性の概要を示す。赤い破線は、0.1のTCRA T細胞分画率である。
図29B】マルチサンプル汎がんコホート内でのサブクローン性SCNAと免疫不均一性との関連性の調査を示す図であり、均一に免疫ホット(本明細書では、全ての領域が≧0.1のTCRA T細胞分画率を有すると定義される)、均一に免疫コールド(本明細書では、全ての領域が<0.1のTCRA T細胞分画率を有すると定義される)、又はホットとコールドの両方の領域を含む不均一、という3つのカテゴリーのうちの1つにおける患者の割合を示す。
図29C】マルチサンプル汎がんコホート内でのサブクローン性SCNAと免疫不均一性との関連性の調査を示す図であり、比較においていずれかの領域に固有のSCNA変化を伴うゲノムの合計比率として定義されるペアワイズSCNA不均一性に対してプロットされた、非常に類似したTCRA T細胞分画率(ペアごとの差<0.1)を有する1対の領域と、非常に異なるTCRA T細胞分画率(ペアごとの差≧0.1)を有する1対の領域との両方を有するものと定義される不均一な免疫浸潤を有するマルチサンプルの患者のサブセット(n=58)を示す。多数の領域を有する腫瘍からの偏りを加味するために、データは腫瘍ごとに平均化される。
図29D】マルチサンプル汎がんコホート内でのサブクローン性SCNAと免疫不均一性との関連性の調査を示す図であり、下のパネルでは、ゲノムにわたってサブクローン性利得(濃い赤色-0の水平線よりも上)又は損失(濃い青色-0よりも下)を有する汎がんの複数試料コホートにおける腫瘍の数を示す。水平線は、サブクローン性利得又は損失を有する30個を超える腫瘍を有する領域を表す(「方法」参照)。上のパネルでは、TCRA T細胞分画率とサブクローン利得(濃い赤色の点)又は損失(濃い青色の点)との関連性について試験した、160個のサイトバンド領域の-log10(p値)を示す。赤い水平線は有意性閾値を示し、1つの領域のみが有意であり、染色体12q24.31-32では損失事象がある。
図29E】マルチサンプル汎がんコホート内でのサブクローン性SCNAと免疫不均一性との関連性の調査を示す図であり、染色体12q24.31-32でのサブクローン性損失事象がある領域とない領域との間でのTCRA T細胞分画率の変化を示す。
図29F】マルチサンプル汎がんコホート内でのサブクローン性SCNAと免疫不均一性との関連性の調査を示す図であり、損失のある領域と損失のない領域とに対して行った、12q24.31-32のサブクローン性損失を含むTRACERx100腫瘍のLimma-Voom解析からのボルケーノプロットを示す。複数の仮説の調整後、8つの遺伝子のみが有意であり、そのうちの3つ(SPPL3、ABCB9、及びOGFOD2)が損失領域にあり、標識されている。
図30】WGSデータに関する図5の方法の実装を示す図である。GC補正と品質管理のためにビンベースのアプローチを使用するGAMモデルと、V及びJセグメントの既知の位置を使用するセグメントモデルとの2つの代替案が示されている。セグメントモデルは、以下の制約を有する。1.対数リード深度比を、V(D)Jセグメントの位置にアライメントする一定のセグメントからなる線形モデルとしてモデル化する。2.モデルは、最初のVセグメントの前に値0を有する。3.Vセグメントは、ゲノム内に出現する順序で単調減少している。例えば、TRVA2<TRVA1。4.Jセグメントは、ゲノム内に出現する順序で単調増加している。5.モデルは、最後のセグメントの後に値0を有する。
図31-1】図30のGAMモデルの例示的な出力を示す図である。
図31-2】図30のGAMモデルの例示的な出力を示す図である。
図32A】TRACERx100コホートを使用したWGS T細胞ExTRECTモデルのベンチマーキングの結果を示す図であり、WGSとWESのTCRA T細胞分画率スコアの比較を示す。
図32B】TRACERx100コホートを使用したWGS T細胞ExTRECTモデルのベンチマーキングの結果を示す図であり、T細胞に関するRNAseq Danaherスコアと比較したWGS T細胞分画率スコアを示す。
図32C】TRACERx100コホートを使用したWGS T細胞ExTRECTモデルのベンチマーキングの結果を示す図であり、TRACERx100コホート全体を使用した、B細胞に関するRNAseq Danaherスコアと比較したWGS B細胞分画率スコアを示す。
図32D】TRACERx100コホートを使用したWGS T細胞ExTRECTモデルのベンチマーキングの結果を示す図であり、セグメントモデル対数尤度試料が低い試料を除去した試料を含むコホートを使用した、B細胞に関するRNAseq Danaherスコアと比較したWGS B細胞分画率スコアを示す。
図32E】TRACERx100コホートを使用したWGS T細胞ExTRECTモデルのベンチマーキングの結果を示す図であり、WGS GAMモデルからのT細胞分画率スコアの比較を示す。
図32F】TRACERx100コホートを使用したWGS T細胞ExTRECTモデルのベンチマーキングの結果を示す図であり、WGSセグメントモデルからのT細胞分画率スコアの比較を示す。
図32G】TRACERx100コホートを使用したWGS T細胞ExTRECTモデルのベンチマーキングの結果を示す図であり、セグメントモデルからのTRDV1セグメント分画率と、TCRD遺伝子セグメントに関するKallistoからのTPM(100万当たりの転写産物)のRNAスコアとの比較を示す。
図33】減少された配列決定深度を有する図30の方法のロバスト性の解析結果を示す図である。T細胞ExTRECTスコアは、GAMモデル又はセグメントモデルのいずれかを使用して、ダウンサンプリングされたbamに関して取得した。
図34A】TCR及びBCRの多様性を調査するための図30でのセグメントモデルの使用を示す図であり、患者CRUK0085(TCRAに関して)についての例示的なVセグメント使用プロットを示す。
図34B】TCR及びBCRの多様性を調査するための図30でのセグメントモデルの使用を示す図であり、患者CRUK0085(TCRBに関して)についての例示的なVセグメント使用プロットを示す。
図34C】TCR及びBCRの多様性を調査するための図30でのセグメントモデルの使用を示す図であり、患者CRUK0085(TCRGに関して)についての例示的なVセグメント使用プロットを示す。
図34D】TCR及びBCRの多様性を調査するための図30でのセグメントモデルの使用を示す図であり、患者CRUK0045(IGHに関して)についての例示的なVセグメント使用プロットを示す。
図34E】TCR及びBCRの多様性を調査するための図30でのセグメントモデルの使用を示す図であり、様々なTCRA Vセグメントを利用したTRACERx100試料の割合のヒートマップを示す。
図34F】TCR及びBCRの多様性を調査するための図30でのセグメントモデルの使用を示す図であり、マッチしたRNAseqデータからMiXCRで呼び出されたVセグメントと、T細胞ExTRECTセグメントモデルから呼び出されたVセグメントとの数の比較を示す。
図34G】TCR及びBCRの多様性を調査するための図30でのセグメントモデルの使用を示す図であり、マッチしたRNAseqデータからMiXCRで呼び出されたVセグメントと、T細胞ExTRECTセグメントモデルから呼び出されたVセグメントとの数の比較を示す。
図34H】TCR及びBCRの多様性を調査するための図30でのセグメントモデルの使用を示す図であり、マッチしたRNAseqデータからMiXCRで呼び出されたVセグメントと、T細胞ExTRECTセグメントモデルから呼び出されたVセグメントとの数の比較を示す。
図34I】TCR及びBCRの多様性を調査するための図30でのセグメントモデルの使用を示す図であり、マッチしたRNAseqデータからMiXCRで呼び出されたVセグメントと、T細胞ExTRECTセグメントモデルから呼び出されたVセグメントとの数の比較を示す。
【発明を実施するための形態】
【0037】
詳細な説明
本発明の説明において、以下の用語を採用し、以下に示すように定義することを意図する。
【0038】
「及び/又は」は、本明細書で使用するとき、他方の有無に関係なく、指定された2つの特徴又は構成要素のそれぞれの具体的な開示として解釈されるものとする。例えば、「A及び/又はB」は、本明細書でそれぞれが個々に記載されているかのように、(i)A、(ii)B、並びに(iii)A及びBのそれぞれの具体的な開示として解釈されるものとする。
【0039】
「試料」とは、本明細書で使用するとき、細胞又は組織試料(例えば生検による)、生体液、抽出物(例えば被験体から得られるDNA抽出物)でよく、そこから、ゲノム配列決定(全ゲノム配列決定、全エクソーム配列決定、標的配列決定(「パネル」配列決定とも呼ばれる))又はコピー数アレイプロファイリングなどのゲノム解析のためにゲノム材料を得ることができる。試料は、(例えば生検により)被験体から得られる細胞、組織、又は生体液試料でよい。そのような試料は、「被験体試料」と呼ばれることがある。特に、試料は、血液試料若しくは腫瘍試料、又はそれらに由来する試料でよい。試料は、被験体から新たに得られたものでも、ゲノム解析前に処理及び/又は保管されているもの(例えば、凍結された、固定された、又は1つ又は複数の精製、濃縮、若しくは抽出ステップを施されたもの)でもよい。特に、試料は、細胞又は組織培養試料でよい。したがって、本明細書に記載の試料は、細胞又はそれらに由来するゲノム材料を含む任意のタイプの試料を表すことがあり、被験体から得られた生物学的試料からのものでも、例えば細胞株から得られた試料からのものでもよい。試料は、好ましくは、有顎脊椎動物(例えば有顎脊椎動物細胞試料又は有顎脊椎動物被験体からの試料など)、適切には哺乳動物(例えば、特にマウスやラットなどのモデル動物を含む、哺乳動物細胞試料また哺乳動物被験体からの試料など)、好ましくはヒト(例えばヒト細胞試料又はヒト被験体からの試料など)からのものである。いくつかの実施形態では、試料は、ヒト被験体などの被験体から得られた試料である。さらに、試料は輸送及び/又は保管されることがあり、収集は、ゲノム配列データ獲得(例えば配列決定)の場所から離れた場所で行われることがあり、及び/又はコンピュータ実装方法ステップは、試料収集の場所及び/又はゲノム配列データ獲得(例えば配列決定)の場所から離れた場所で行われることがある(例えば、コンピュータ実装方法ステップは、「クラウド」プロバイダなどのネットワーク接続されたコンピュータによって行われることがある)。
【0040】
「混合試料」とは、複数の細胞種、又は複数の細胞種に由来する遺伝物質を含むと仮定される試料を表す。被験体から得られた試料、例えば腫瘍試料は、典型的には混合試料である(1つ又は複数の精製及び/又は分離ステップを施されない限り)。好ましくは、混合試料は、リンパ球を含む、又はリンパ球を含むと仮定(予想)される試料である。適切には、試料は、リンパ球及び少なくとも1つの他の細胞型を含む。例えば、試料は腫瘍試料でよい。「腫瘍試料」とは、腫瘍に由来する、又は腫瘍から得られる試料を表す。そのような試料は、腫瘍細胞、免疫細胞(例えばリンパ球など)、及び他の正常な(非腫瘍)細胞を含むことがある。腫瘍試料の文脈では、「純度」という用語は、腫瘍細胞である試料中の細胞の割合(「がん細胞分画率」又は「腫瘍分画率」と呼ばれることもある)、又は細胞由来の遺伝物質を含む試料の場合には細胞の同等の割合を表す。遺伝物質を含む試料の文脈では、腫瘍分画率は、例えばASCAT(Van Loo et al., 2010)、ABSOLUTE(Carter et al., 2012)、ichorCNA(Adalsteinsson et al., 2017)など、腫瘍ゲノムと生殖細胞系列ゲノムのデコンボリューションを試みる配列解析プロセスを使用して推定することができる。腫瘍試料の文脈では、試料中のリンパ球は、「腫瘍浸潤リンパ球」(TIL)と呼ばれることもある。腫瘍試料は、被験体からの原発腫瘍試料、腫瘍関連リンパ節試料、又は転移部位からの試料でよい。腫瘍細胞又は腫瘍細胞に由来する遺伝物質を含む試料は、体液試料でよい。したがって、腫瘍細胞に由来する遺伝物質は、循環腫瘍DNA又はエクソソーム内の腫瘍DNAでよい。この代わりに又はこれに加えて、試料は循環腫瘍細胞を含むこともある。混合試料は、遺伝物質を抽出するために処理されている細胞、組織、又は体液の試料でよい。生物学的試料から遺伝物質を抽出するための方法は、当技術分野で知られている。リンパ球は、Tリンパ球、Bリンパ球、又はそれらの混合物でよい。特に、Tリンパ球は、αβTリンパ球及び/又はγδリンパ球を含むことがある。Bリンパ球は、IGL軽鎖を有するB細胞及び/又はIGK軽鎖を有するB細胞を含むことがある。
【0041】
「リンパ球分画率」という用語は、リンパ球である、又は特定のタイプのリンパ球(例えば、Tリンパ球、Bリンパ球、αβTリンパ球、TCR又はBCR遺伝子での任意の選択された遺伝子セグメントを含むTリンパ球又はBリンパ球など)である混合試料中のDNA含有細胞の割合を表す。「Tリンパ球分画率」という用語は、Tリンパ球である混合試料中のDNA含有細胞の割合を表す。「Bリンパ球分画率」という用語は、Bリンパ球である混合試料中のDNA含有細胞の割合を表す。本開示の文脈では、リンパ球分画率は、定量化されている特定のリンパ球集団においてVDJ組換えを受けるゲノム領域に由来するシグナルに基づいて推定される。したがって、リンパ球分画率は、より特定的には、VDJ組換えを受けた所定のゲノム関心領域を有することによって特徴付けられるリンパ球である混合試料中のDNA含有細胞の割合を表すことがある。所定のゲノム関心領域は、TCRA/TCRD、TCRB、TCRG、IGH、IGL、又はIGK遺伝子の領域(本明細書では、TCRA/TCRD、TCRB、TCRG、IGH、IGL、及びIGK遺伝子座とも呼ぶ)でよい。調査対象の種によっては、有袋類やサメに存在する特定のTCRの遺伝子座(例えばTCRμ)など、他のあまり一般的でない遺伝子座を使用することもできる。本方法で使用される所定の関心領域(ゲノム遺伝子座)の選択に応じて、リンパ球分画率は、リンパ球の異なる部分集団を捉えることがある。例えば、TCRB遺伝子座を使用することで、αβTリンパ球分画率の定量化が可能になり得る。別の例として、TCRD遺伝子座はTCRA遺伝子座内に完全に含まれていると考えられるので、TCRA遺伝子座を使用することで、複合のαβTリンパ球及びγδTリンパ球分画率の定量化が可能になり得る。さらに、TCRA遺伝子座内のTCRDに対応する1つ又は複数のセグメントを使用することで、γδTリンパ球であるαβリンパ球及びγδTリンパ球の分画率の定量化が可能になり得る。TCRDに対応する特定のセグメントの選択は、そのセグメントを使用して推定される分画率と、TCRD分画率を示す直交規準との相関に応じて行うことができる。別の例として、TCRG又はTCRD遺伝子座を使用することで、γδTリンパ球分画率の定量化が可能になり得る。TCRD遺伝子座は非常に小さく、したがってそれほど多くの有益なシグナルを含むとは予想されないため、γδTリンパ球分画率の定量化にはTCRG遺伝子座の使用が好ましいこともある。逆に、TCRA遺伝子座とTCRB遺伝子座又はTCRG遺伝子座との両方を使用することで、αβTリンパ球分画率とγδTリンパ球分画率との個別の定量化が可能になり得る。さらに別の例として、IGH遺伝子座を使用することで、B細胞(IGL軽鎖を有するかIGK軽鎖を有するかに関係なく)の定量化が可能になり得て、一方、IGL又はIGK遺伝子座を使用することで、IGL軽鎖又はIGK軽鎖のいずれかを有するB細胞の定量化が可能になり得る。さらに、リンパ球の複数の部分集団について個別のリンパ球分画率を定量化することができる。これらを追加して、リンパ球の複数又は全ての部分集団を表すリンパ球分画率を得ることができる。さらに、一部の混合試料は、主に又は排他的に単一のリンパ球集団を含むと仮定されることがある。したがって、単一の所定のゲノム関心領域を使用して推定されるリンパ球分画率が、その試料に関する(全体の)リンパ球分画率を表すと仮定することができる。例えば、試料が主にTリンパ球を含むと仮定することができ(又は逆の言い方をすると、Tリンパ球の割合に比べて比較的小さい割合のBリンパ球を含むと仮定することができ)、その大部分はαβTリンパ球であると予想することができる。したがって、そのような場合、リンパ球分画率は、TCRA又はTCRB遺伝子座に対応する単一の所定のゲノム関心領域を使用して推定される。同様に、一部の混合試料は、主に又は排他的に単一のTリンパ球集団を含むと仮定されることがある。したがって、単一の所定のゲノム関心領域を使用して推定されるリンパ球分画率が、その試料に関する(全体の)Tリンパ球分画率を表すと仮定することができる。例えば、αβTリンパ球は、試料中に存在する主要なタイプのTリンパ球であると仮定することができ、それにより、TCRA又はTCRB遺伝子座に対応する単一の所定のゲノム関心領域を使用してTリンパ球分画率を推定することができる。別の例として、TCRD遺伝子座は、TCRA遺伝子座内に完全に含まれていると考えられ(TCRA/TCRDと呼ばれる遺伝子座を共に形成する)、それにより、この単一の所定のゲノム関心領域を使用して推定されるリンパ球分画率は、試料に関する(全体の)Tリンパ球分画率(特にαβTリンパ球及びγδTリンパ球を含む)を表すと仮定することができる。
【0042】
TCRA遺伝子とは、ホモサピエンスにおける遺伝子ID6955(HGNC記号:TRA)を有するT細胞受容体アルファ遺伝子座、又は他の有顎脊椎動物における任意の相同領域を表す。ホモサピエンスでは、この遺伝子は、14番染色体の位置NC_000014.9(21621904..22552132)(アセンブリGRCh38.p13)にあり、この位置は、位置NC_000014.8(22090057..23021075)(アセンブリGRCh37.p13)とも呼ばれる。相同遺伝子座の例としては、マウスtcra遺伝子座(遺伝子ID:21473、14番染色体、アセンブリGRCm39-NC_000080.7(52665424..54461655)、アセンブリGRCm38.p6-NC_000080.6(52427967..54224198))が挙げられる。最大V(D)J組換えの領域として、及びTCRA遺伝子(及びTCRD遺伝子など、その中の任意の遺伝子)に関するベースラインリード深度を取得するために使用される領域として使用することができる座標の例が表7に提供されている。
【0043】
TCRB遺伝子とは、ホモサピエンスにおける遺伝子ID6957(HGNC記号:TRB)を有するT細胞受容体ベータ遺伝子座、又は他の有顎脊椎動物における任意の相同領域を表す。ホモサピエンスでは、この遺伝子は、7番染色体の位置NC_000007.14(142299011..142813287)(アセンブリGRCh38.p13)又はNC_000007.13(141998851..142510972)(アセンブリGRCh37.p13)にある。相同遺伝子座の例としては、マウスtcrb遺伝子座(遺伝子ID:21577、6番染色体、アセンブリGRCm39-NC_000072.7(40868230..41535305)又はアセンブリGRCm38.p6-NC_000072.6(40891296..41558371))が挙げられる。最大V(D)J組換えの領域として、及びTCRB遺伝子に関するベースラインリード深度を取得するために使用される領域として使用することができる座標の例が表7に提供されている。
【0044】
TCRG遺伝子とは、ホモサピエンスにおける遺伝子ID6965(HGNCシンボル:TRG)を有するT細胞受容体ガンマ遺伝子座、又は他の有顎脊椎動物における任意の相同領域を表す。ホモサピエンスでは、この遺伝子は、7番染色体の位置NC_000007.14(38240024..38368055、補体)(GRCh38.p13)又はNC_000007.13(38279625..38407656、補体)(GRCh37.p13)にある。相同遺伝子座の例としては、マウスtcrg遺伝子座(遺伝子ID:110067、13番染色体、アセンブリGRCm39-NC_000079.7(19362212..19540646)、アセンブリGRCm38.p6-NC_000079.6(19178042..19356476))が挙げられる。最大V(D)J組換えの領域として、及びTCRG遺伝子に関するベースラインリード深度を取得するために使用される領域として使用することができる座標の例が表7に提供されている。
【0045】
TCRD遺伝子とは、ホモサピエンスにおける遺伝子ID6964(HGNCシンボル:TRD)を有するT細胞受容体デルタ遺伝子座、又は他の有顎脊椎動物における任意の相同領域を表す。ホモサピエンスでは、この遺伝子は、14番染色体の位置NC_000014.9(22422546..22466577)(GRCh38.p13)又はNC_000014.8(22891537..22935569)(GRCh37.p13)にある。相同遺伝子座の例としては、マウスtcrd遺伝子座(遺伝子ID:110066、14番染色体、アセンブリGRCm39-NC_000080.7(54183530..54396655)、アセンブリGRCm38.p6-NC_000080.6(53946073..54159198))が挙げられる。最大V(D)J組換えの領域として、及びTCRD遺伝子に関するベースラインリード深度を取得するために使用される領域として使用することができる座標の例が表7(TCRAで使用される領域を参照して)及び表8(TCRA遺伝子座内のTCRDセグメントを参照して)に提供されている。
【0046】
IGH遺伝子とは、ホモサピエンスにおける遺伝子ID3492(HGNCシンボル:IGH)を有する免疫グロブリン重遺伝子座、又は他の有顎脊椎動物における任意の相同領域を表す。ホモサピエンスでは、この遺伝子は、14番染色体の位置NC_000014.9(105586437..106879844、補体)(GRCh38.p13)又はNC_000014.8(106032614..107288051、補体)(GRCh37.p13)にある。相同遺伝子座の例としては、マウスIgh遺伝子座(遺伝子ID:11507、12番染色体、アセンブリGRCm39-NC_000078.7(113222388..115973574、補体)、アセンブリGRCm38.p6-NC_000078.6(113258768..116009954、補体))が挙げられる。最大V(D)J組換えの領域として、及びIGH遺伝子に関するベースラインリード深度を取得するために使用される領域として使用することができる座標の例が表7に提供されている。
【0047】
IGL遺伝子とは、ホモサピエンスにおける遺伝子ID3535(HGNCシンボル:IGL)を有する免疫グロブリンラムダ遺伝子座、又は他の有顎脊椎動物における任意の相同領域を表す。ホモサピエンスでは、この遺伝子は、22番染色体の位置NC_000022.11(22026076..22922913)(GRCh38.p13)又はNC_000022.10(22380474..23265085)(GRCh37.p13)にある。相同遺伝子座の例としては、マウスIgl遺伝子座(遺伝子ID:111519、16番染色体、アセンブリGRCm39-NC_000082.7(18845608..19079594、補体)、アセンブリGRCm38.p6-NC_000082.6(19026858..19260844、補体))が挙げられる。
【0048】
IGK遺伝子とは、ホモサピエンスにおける遺伝子ID50802(HGNCシンボル:IGK)を有する免疫グロブリンカッパ遺伝子座、又は他の有顎脊椎動物における任意の相同領域を表す。ホモサピエンスでは、この遺伝子は、2番染色体の位置NC_000002.12(88857361..90235368)(GRCh38.p13)又はNC_000002.11(89890568..90274235)、(89156874..89630436、補体)(GRCh37.p13)にある。相同遺伝子座の例としては、マウスIgk遺伝子座(遺伝子ID:243469、6番染色体、アセンブリGRCm39-NC_000072.7(67532620..70703738)、アセンブリGRCm38.p6-NC_000072.6(67555636..70726754))が挙げられる。
【0049】
「配列データ」という用語は、特定の配列を有する試料中のゲノム材料の存在及び好ましくはその量も示す情報を表す。そのような情報は、配列決定技術を使用して、例えば次世代配列決定(NGS、例えば全エクソーム配列決定(WES)、全ゲノム配列決定(WGS)、又は捕捉されたゲノム遺伝子座の配列決定(標的又はパネル配列決定)など)を使用して、又は例えばコピー数多型アレイなどのアレイ技術若しくは他の分子計数アッセイを使用して取得することができる。NGS技術が使用されるとき、配列データは、特定の配列を有する配列決定リードの数のカウントを含むことがある。配列データは、当技術分野で知られている方法(Bowtie(Langmead et al., 2009)など)を使用して、参照配列、例えば参照ゲノムにマッピングすることができる。したがって、配列決定リード又は等価の非デジタルシグナルの数は、特定のゲノム位置に関連付けられることがある(「ゲノム位置」とは、配列データがマッピングされた参照ゲノム内の位置を表す)。「リード深度」という用語は、特定のゲノム位置にマッピングする試料中のゲノム材料の量を示すシグナルを表す。そのようなシグナルは、配列決定技術を使用して、例えば次世代配列決定(NGS、例えばWES、WGS、又は捕捉されたゲノム遺伝子座の配列決定など)を使用して、又は例えばコピー数多型アレイなどのアレイ技術を使用して取得することができる。NGS技術が使用されるとき、リード深度は、その言葉の一般的な意味の範囲内でのリード深度、すなわちゲノム位置にマッピングする配列決定リードの数のカウントでよい。アレイ技術が使用されるとき、リード深度は、特定のゲノム位置に関連付けられる強度値でよく、これを対照と比較して、特定の位置にマッピングするゲノム材料の量の指標を提供することができる。「リード深度プロファイル」という用語は、複数のゲノム位置に関するリード深度値の集合を表す。例えば、特定のゲノム位置iでのリード深度は、参照ゲノムでの位置iにある塩基でのリード深度を表すことがあり、リード深度プロファイルは、1つ又は複数の関心領域内の複数の位置iに関するリード深度を表すことがある。
【0050】
本明細書で使用するとき、「治療」とは、治療されている疾患の1つ又は複数の症状を、治療前の症状と比較して軽減、緩和、又は除去することを表す。「予防」(prevention又はprophylaxis)とは、疾患の症状の発症を遅延又は予防することを表す。予防は、絶対的である(疾患が起こらない)ことも、一部の個人でのみ又は限られた期間にわたってのみ有効なこともある。
【0051】
本明細書で使用するとき、「コンピュータシステム」という用語は、システムを具現化するため、又は上述した実施形態による方法を実行するためのハードウェア、ソフトウェア、及びデータストレージデバイスを含む。例えば、コンピュータシステムは、処理装置(中央処理装置(CPU)及び/又はグラフィック処理装置(GPU)など)、入力手段、出力手段、及びデータストレージを備えることがあり、これらは、1つ又は複数の接続されたコンピューティングデバイスとして具現化されることがある。好ましくは、コンピュータシステムは、ディスプレイを有し、又はディスプレイを有するコンピューティングデバイスを備え、(例えばビジネスプロセスの設計において)視覚的な出力表示を提供する。データストレージは、RAM、ディスクドライブ、又は他のコンピュータ可読媒体を含むことがある。コンピュータシステムは、ネットワークによって接続され、そのネットワークを介して互いに通信することができる複数のコンピューティングデバイスを含むことがある。コンピュータシステムがクラウドコンピュータからなる又はクラウドコンピュータを備えることもあることが明示的に想起される。
【0052】
本明細書で使用するとき、「コンピュータ可読媒体」という用語は、限定はしないが、コンピュータ又はコンピュータシステムによって直接読み取る及びアクセスすることができる任意の非一時的な媒体を含む。媒体は、限定はしないが、フロッピーディスク、ハードディスク記憶媒体、及び磁気テープなどの磁気記憶媒体;光ディスクやCD-ROMなどの光記憶媒体;RAM、ROM、及びフラッシュメモリを含むメモリなどの電気記憶媒体;並びに磁気/光記憶媒体など上記の媒体のハイブリッド及び組合せを含むことができる。
【0053】
混合試料中のリンパ球分画率の決定
本開示は、少なくとも所定のゲノム関心領域に関するリード深度データを含む試料からのリード深度データを使用して、混合試料中のリンパ球分画率を決定するための方法を提供する。図1を参照して例示的な方法を述べる。任意選択のステップ10で、複数の細胞型からのゲノム材料を含む混合試料を被験体から得ることができる。任意選択のステップ12で、例えば、全エクソーム配列決定、全ゲノム配列決定、又はパネル配列決定のうちの1つを使用して試料中のゲノム材料を配列決定することによって、混合試料から配列リード/リード深度データを取得することができる。ステップ14で、所定のゲノム関心領域に沿ったリード深度を含む試料に関するリード深度プロファイルが取得される。これは、所定の関心領域にわたって複数の生のリード深度値を取得するステップ14Aと、リード深度値を平滑化及び/又は補正(例えばGC補正)するステップ14Bとを含むことがある。
【0054】
ステップ16で、関心領域のサブセットからベースラインリード深度が取得される。これは、ベースラインリード深度を取得するために、VDJ組換えにより欠失される可能性が低い関心領域のサブセットとして使用することができる関心領域のサブセットを特定する任意選択のステップ16Aを含むことがある。例えば、VDJ組換えにより欠失される可能性が低い関心領域は、VDJ組換えを受けるゲノム遺伝子座の最初のn個のVセグメントを含む。パラメータnは、適切な訓練データを使用して、例えばリンパ球分画率の直交規準と比較したときに訓練データにわたるリンパ球分画率の最も正確な推定量をもたらすnの値を選択することによって決定することができる。リンパ球分画率の直交規準は、例えば、トランスクリプトームデータ及び/又は組織病理学データに基づいて取得され得る。
【0055】
ステップ18で、ステップ16において取得されたベースラインリード深度を参照して、所定の関心領域に沿ったリード深度を正規化することによって、複数のリード深度比(r)が取得される。これは、(複数のリード深度比(r)を含む)リード深度比プロファイルにモデルを当てはめて、平滑化されたリード深度プロファイルを取得する任意選択のステップ18Aを含むことがある。ステップ20で、VDJ組換えにより欠失される可能性が高い関心領域のサブセットに関して、要約されたリード深度比値(rVDJ)が取得される(任意選択で、VDJ組換えにより欠失される可能性が高い関心領域のサブセットにおいて、ステップ18Aで当てはめられたモデルの値に基づいて)。
【0056】
ステップ22で、混合試料中の異常細胞の分画率(p)(ここで、異常細胞とは、所定の関心領域内で異数性である細胞である)、及び所定の関心領域内での異常細胞のコピー数(Ψ)が、当技術分野で知られている方法を使用して異常細胞に特異的なコピー数プロファイルを取得することによって任意選択で決定され得る。ステップ24で、試料中のリンパ球の分画率(f)が、ステップ20で取得された要約されたリード深度比値(rVDJ)の関数として決定される。これは、要約されたリード深度比値(rVDJ)の関数としての試料中のリンパ球の分画率(f)、混合試料中の異常細胞の分画率(p)、及び所定の関心領域内の異常細胞のコピー数(Ψ)を決定することを含むことがある。
【0057】
任意選択のステップ26で、決定されたリンパ球分画率及び/又はそこから導出される任意の値が、例えばユーザインターフェースを介してユーザに提供され得る。そこから導出される値は、以下でさらに述べるように、予後予測及び/又は診断情報を含むことがある。
【0058】
用途
上記の方法には、様々な臨床状況での用途がある。例えば、がんの文脈では、腫瘍試料、又は好ましくは腫瘍からの複数の試料中のリンパ球分画率を決定することにより、腫瘍の免疫状態の指標が提供され得る。これは、非小細胞肺がん(本明細書で実証)、卵巣がん(例えば、Zhang et al., 2003を参照)、大腸がん(例えば、Galon et al., 2006を参照)、乳がん(例えば、Dieci et al., 2018を参照)、及び悪性黒色腫を含む様々ながんに関する予後予測値を有することが示されている。本発明者らは、血液及び/又は腫瘍試料中のT及び/又はB細胞分画率が、少なくともいくつかのがん種における予後を示唆することを実証した(実施例6、図35を参照)。
【0059】
したがって、被験体からの腫瘍の免疫状態の方法であって、被験体からの1つ又は複数の腫瘍試料中のリンパ球分画率を決定することを含む方法も本明細書に記載される。
【0060】
さらに、がんと診断された被験体に関する予後予測を提供する方法であって、被験体からの1つ又は複数の腫瘍試料中のリンパ球分画率を決定することを含む方法も本明細書に記載される。本方法は、試料中のリンパ球分画率(例えばTリンパ球分画率など)に応じて、試料を免疫ホット又は免疫コールドとして分類することをさらに含むことがある。例えば、閾値(例えば、約0.1、すなわち約10%)を超えるリンパ球分画率を有する試料は免疫ホットとして分類されることがあり、閾値以下のリンパ球分画率を有する試料はコールドとして分類されることがある。本方法は、免疫コールドとして分類された患者からの試料の数に応じて、被験体を予後良好群と予後不良群とに分類することをさらに含むこともある。例えば、異なる腫瘍領域からの試料を解析するとき、免疫コールドとして分類された試料の数が閾値(例えば2など)以上であると、被験体が予後不良群に分類されることがある。予後不良群は、予後良好群と比較して、無再発生存率の減少及び/又は全生存率の減少と関連していることがある。リンパ球分画率及び/又は免疫コールド試料の数に関する閾値は、適切な訓練コホートを使用して、例えば、大幅に異なる予後予測に関連する群間で患者を分類することができる様々な閾値の性能を評価することによって決定することができる。
【0061】
さらに、引き続きがんの文脈で、TILの存在は、特にチェックポイント阻害薬(CPI)(例えば、Litchfield et al., 2020を参照)、しかしまたT細胞転移療法(腫瘍浸潤リンパ球(又はTIL)療法及びCAR-T細胞療法)、療法用抗体、がん治療ワクチン、及び免疫系調節因子(例えばインターフェロン及びインターロイキン)も含む免疫療法に対する応答の可能性の増加に関連していることが示されている。したがって、がんと診断された被験体が免疫療法による治療から恩恵を受ける可能性が高いかどうかを決定する方法であって、被験体からの1つ又は複数の腫瘍試料中のリンパ球分画率を決定することを含む方法も本明細書に記載される。免疫療法は、がんを治療するために免疫系の機能を調節する任意の療法でよい。実際、任意のそのような療法は、腫瘍内の免疫細胞の有無によって影響を及ぼされる可能性が高いと考えられる。いくつかの実施形態では、免疫療法はCPI療法である。CPI療法は、例えば、抗CTL4薬又は抗PDL1薬による治療を含む。本方法は、免疫療法に応答する可能性が高い群と、免疫療法に応答する可能性が低い群とに被験体を分類することをさらに含むこともある。例えば、本方法は、試料中のリンパ球分画率(例えばTリンパ球分画率など)に応じて、試料を免疫ホット又は免疫コールドとして分類することをさらに含むことがある。次いで、被験体からの1つ又は複数の試料が免疫コールドである場合、その被験体を、免疫療法(例えばCPI療法)に応答する可能性が低い群に分類することができる。代替として、被験体からの試料が閾値未満のリンパ球分画率を有する場合、被験体は、免疫療法(例えばCPI療法)に応答する可能性が低い群に分類されることがあり、そうでない場合には、免疫療法(例えばCPI療法)に応答する可能性が高い群に分類されることがある。代替として、本方法は、被験体からの1つ又は複数の試料中のリンパ球分画率と、被験体に関する推定される腫瘍変異負荷とに基づいて、CPI療法に応答する可能性が高い群と、CPI療法に応答する可能性が低い群とに被験体を分類することをさらに含むことがある。そのような分類は、多変量モデルを使用して取得され得る。分類モデルのパラメータ(例えば、閾値、多変量モデルのパラメータ)は、適切な訓練コホートを使用して決定され得る。
【0062】
本明細書に記載のリンパ球分画率は、被験体が重症複合免疫不全症(SCID)及び/又はT細胞リンパ球減少症を有するかどうかを判定するために使用することもできる。これは、新生児ケアの文脈で特に使用される。実際、本方法の以前には、SCIDは通常、全血球数を使用して同定されていた。これは、理論的には、TREC自体の配列決定及び定量化を使用して確認することができるが、実際の臨床現場でこれが行われることはほとんどない。したがって、WESからのデータを使用してSCIDに関する診断を行うことができる機能は、潜在的に有害な生殖細胞系列変異を同定するために新生児のゲノムスクリーニングの一部として実施されることが増えており、非常に価値がある。したがって、本開示はまた、被験体、特に新生児被験体におけるT細胞リンパ球減少症及び/又はSCIDを同定する方法であって、被験体からの1つ又は複数の試料中で、本明細書に記載のリンパ球分画率を決定することを含む方法に関する。試料は、例えば血液試料でよい。
【0063】
本方法はまた、試料中の免疫細胞又は特定の種類の免疫細胞の有無又は量が診断又は予後予測を示唆する任意の臨床状況において使用することができる。例えば、一部の自己免疫疾患は、一部の骨髄疾患(例えば、再生不良性貧血など)や感染症(例えば、HIV、敗血症、インフルエンザ、マラリア、ウイルス性肝炎、結核、腸チフスなど)と同様に、リンパ球数の減少(例えば、狼瘡、関節リウマチなど)に関連付けられる。したがって、異常なリンパ球数に関連付けられる疾患、障害、又は症状を有するものとして被験体を診断する方法であって、被験体からの1つ又は複数の試料中のリンパ球分画率を決定することを含む方法も本明細書に記載される。
【0064】
本明細書に記載のリンパ球分画率は、例えばGWAS解析によって、一塩基多型(SNP)などの1つ又は複数の生殖細胞系列変異が例えば血液試料中のT/B細胞分画率の増加又は減少に関連付けられるかどうかを決定するために使用することもできる。これは、T細胞分画率の増加/減少の原因となり得るバリアント(生殖細胞系列変異)を同定するのに役立つことがある。
【0065】
システム
図2は、本開示による、混合試料中のリンパ球分画率を決定するため、及び/又はリンパ球分画率に少なくとも部分的に基づいて予後予測若しくは治療推奨を提供するためのシステムの一実施形態を示す。このシステムは、プロセッサ101及びコンピュータ可読メモリ102を備えるコンピューティングデバイス1を備える。図示される実施形態では、コンピューティングデバイス1は、ユーザインターフェース103も備え、ユーザインターフェース103は、画面として示されているが、例えば聴覚又は視覚的な信号によってユーザに情報を伝達する任意の他の手段を含むこともある。コンピューティングデバイス1は、例えばネットワーク6を介して、配列決定マシンなどのリード深度データ獲得手段3、及び/又はリード深度データを記憶する1つ又は複数のデータベース2に通信可能に接続される。1つ又は複数のデータベースは、例えば参照配列やパラメータなど、コンピューティングデバイス1によって使用することができる他のタイプの情報をさらに記憶することができる。コンピューティングデバイスは、スマートフォン、タブレット、パーソナルコンピュータ、又は他のコンピューティングデバイスでよい。コンピューティングデバイスは、本明細書に記載されるように、混合試料中のリンパ球分画率を決定するための方法を実行するように構成される。代替実施形態では、コンピューティングデバイス1は、リモートコンピューティングデバイス(図示せず)と通信するように構成され、リモートコンピューティングデバイス自体が、本明細書に記載されるように、混合試料中のリンパ球分画率を決定する方法を実行するように構成される。そのような場合、リモートコンピューティングデバイスは、リンパ球分画率を決定する方法の結果をコンピューティングデバイスに送信するように構成されることもある。コンピューティングデバイス1とリモートコンピューティングデバイスとの間の通信は、有線又は無線接続を介していてよく、ローカル又はパブリックネットワークを介して、例えばパブリックインターネットやWiFi(登録商標)を介して行うことができる。リード深度データ獲得手段は、コンピューティングデバイス1と有線接続することができ、又は図示されるように、例えばWiFi(登録商標)などの無線接続を介して通信することが可能であり得る。コンピューティングデバイス1とリード深度データ獲得手段3との間の接続は、直接的でも間接的(例えばリモートコンピュータを介するなど)でもよい。リード深度データ獲得手段3は、核酸試料、例えば細胞及び/又は組織試料から抽出されたゲノムDNA試料からリード深度データを獲得するように構成される。いくつかの実施形態では、試料は、DNA精製、断片化、ライブラリ調製、標的配列捕捉(例えばエクソン捕捉及び/又はパネル配列捕捉など)などの1つ又は複数の前処理ステップを受けることがある。好ましくは、試料は増幅を受けていないか、又は増幅を受けている場合には、その増幅が、例えば一意の分子識別子の使用などの増幅バイアス制御手段の存在下で行われた。ゲノムコピー数プロファイル(全ゲノムであるか配列特異的であるかにかかわらず)の決定に使用するのに適した任意の試料調製プロセスを、本開示の文脈内で使用することができる。リード深度データ獲得手段は、好ましくは次世代シーケンサである。配列データ獲得手段3は、(生の、又は一部処理された)配列データを記憶することができる1つ又は複数のデータベース2と直接的又は間接的に接続することがある。
【0066】
以下は例として提示するものであり、特許請求の範囲を限定するものとして解釈されるべきではない。
【実施例
【0067】
実施例
免疫微小環境は、腫瘍の進展に影響を及ぼし、免疫療法に関する予後予測因子であり且つ応答予測因子であり得る。しかし、腫瘍浸潤リンパ球(TIL)の測定は、適切なデータの不足によって制限される。DNAの全エクソーム配列決定(WES)は、腫瘍変異負荷を計算し、アクショナブルな変異を同定するためによく実施される。これらの例では、本発明者らは、T細胞受容体アルファ(TCRA)遺伝子のVDJ組換え中のT細胞受容体除去サークル(TREC)損失からのシグナルを使用して、WES試料からT細胞分画率を推定するための方法を開発する。本方法は、例えばTILを測定するために、がん試料を含む様々なタイプの臨床的に重要な試料に適用可能である。これらの例では、本発明者らは、このスコアが直交TIL推定量と有意に相関し、新鮮凍結試料又はホルマリン固定パラフィン包埋試料から計算することができることを示す。血中TCRA T細胞分画率は、腫瘍中の免疫浸潤、細菌配列決定リードの存在と相関され、女性の方が高かった。腫瘍TCRA T細胞分画率は、肺腺がんの予後予測因子となり、免疫療法で治療された腫瘍のメタアナリシスを使用して、このスコアが免疫療法に対する応答予測因子となり、変異負荷に勝る価値を提供することが明らかになった。このスコアをマルチサンプル汎がんコホートに適用して、腫瘍内の免疫浸潤の広範な多様性が明らかになった。SPPL3を含む12q24.31-32のサブクローン性損失は、TCRA T細胞分画率の低下と関連付けられた。本明細書に記載の方法であるT細胞ExTRECT(T細胞エクソームTRECツール)は、WES試料のT細胞浸潤を解明する。
【0068】
実施例1-WESデータからの試料中のT細胞分画率の推定
導入
腫瘍内のTILのレベルの決定は、腫瘍の免疫微小環境を理解するためにも、免疫療法に対する応答を予測するためにも非常に重要である。しかし、現時点では、TILを推定するための普遍的な先進の方法はない。CIBERSORT(Newman et al., 2015)などのマイクロアレイシグネチャ、及びRNA-seq用のCIBERSORTx(Newman et al., 2019)、ESTIMATE(Yoshihara et al., 2013)、及びDanaherらによって編集されたものなどのRNA-seqシグネチャが、腫瘍試料中のTILのトランスクリプトームシグネチャを定量化するために使用されている。代替として、免疫浸潤の存在は、ヘマトキシリン・エオシン(H&E)組織病理学的スライドに基づいて、又は代替として、適切な細胞特異的染色、最も一般的には免疫組織化学的特性によって判定することができる。T細胞のより多くの表現型の知識が必要とされる場合、TCRの非常に多様なVDJ組換えCDR3領域をコードする配列に関する濃縮後に、T細胞受容体(TCR)の配列決定を行うことができる(Bolotin et al., 2012)。
【0069】
既存のほとんどのT細胞定量化方法における重大な欠点は、それらの方法がWESに加えて追加の材料、時間、専門知識を必要とすることである。したがって、これらの方法は免疫応答の予測に役立ち得る追加の知識を提供するが、臨床現場へのこれらの方法の適用には、時間と支出の両方の増加が必要とされ、すでに高い免疫療法のコストにさらに加わる。
【0070】
本実施例では、本発明者らは、試料内のT細胞分画率をWESデータから直接推定するための方法を提案する。本方法は、VDJ組換え及びT細胞受容体切除サークル(TREC)の切除からの、体細胞コピー数に基づくシグナルを利用する。
【0071】
本方法は、全ゲノム配列決定法と標的パネルベース方法との両方を含む任意の形式のNGSプラットフォームから計算され、さらにVDJ組換えを受ける全ての遺伝子に拡張できる可能性を有する。
【0072】
結果
T細胞多様性はVDJ組換えの産物であり、T細胞受容体遺伝子内の様々な遺伝子セグメントが組み換わっている。この結果、多数の選択されていない遺伝子セグメントがTRECとしてTCRA遺伝子から切除される。このプロセスは、T細胞と他の細胞との間でのコピー数の相違をもたらし、T細胞はTCRA遺伝子内で欠失事象を実質的に受ける。
【0073】
標準的な体細胞コピー数変化推定ツール(例えば、ASCAT(Van Loo et al., 2010)、Sequenza(Favero et al., 2015)、FACETS(Shen & Seshan, 2015)、又はABSOLUTE(Carter et al., 2012))は、原理的には、がんの体細胞コピー数変化プロファイルを取得するために以下の2つの関連するシグナルに依拠する:腫瘍試料中のヘテロ接合性SNPの相対頻度を反映するB対立遺伝子頻度;及び腫瘍試料とそれにマッチした生殖細胞系列(多くの場合、血液試料からのバフィーコート)との間のリードの比率の対数を反映するリード深度比。リード深度比の任意の逸脱は、(図3Aに示されるように)特に腫瘍中のコピー数の変化を反映すると仮定される。しかし、TCRA遺伝子の文脈では、この仮定は当てはまらない。腫瘍中の体細胞コピー数変化のみを反映するのではなく、TCRA遺伝子に重なるリード深度比の逸脱は、同様に腫瘍試料中に存在するT細胞のTCRA遺伝子内の欠失事象の検出も反映する。これが損失事象であるか利得事象であるかは、(図3Bに示されるように)腫瘍試料と比較した血液中に存在するT細胞の割合の相違によって決まる。具体的には、配列決定された腫瘍試料中のT細胞含量が血液試料と比較して低い場合、腫瘍試料中で同定されるTCRA遺伝子からのリードがより多く、増幅シグナルを生じる(対数リード深度比>0)。逆に、腫瘍中のT細胞含量が血液と比較して高い場合には、TCRAリードが少なく、体細胞コピー数変化推定ツールは、欠失又は損失事象(リード深度比<0)を推測する。
【0074】
マルチ領域配列決定を受けた非小細胞肺がん(NSCLC)腫瘍のTRACERx100コホート(Jamal-Hanjani et al., 2017)のASCAT由来の体細胞コピー数変化プロファイルを調べて、本発明者らは、両方の切断点がTCRA遺伝子内にある体細胞コピー数変化セグメントが、(図1Bに示されるように)WESを受けた腫瘍領域の165/327で発生したことに注目した。TRACERx100コホートでのそのような2つのケースを調べて、リード深度比が、Dゲノムセグメントのゲノム位置でピークを成していることが分かった。この位置は、(図4に示されるように)TREC内に最も頻繁に含まれる位置である。したがって、これらのデータは、TRECのシグナルをWESデータから同定することができることを示唆する。
【0075】
このシグナルを明示的に利用して個々の試料内のT細胞分画率を計算するために、本発明者らは、TIL ExTRECT(T cell Exome T-cell Receptor Excision Circle Tool)を開発した。簡潔には、TIL ExTRECTは、TCRA遺伝子内でのリード深度比の解析に依拠して、WES試料中のT細胞浸潤を直接測定する。まず、VDJ組換えによる影響を受けていないTCRAの最初と最後でのゲノムセグメントを対照として使用して、TCRA遺伝子内の各位置でのリード深度を計算し、カバレッジ値の元のリード深度と対照ゲノムセグメント内の値の中央値との間で修正された対数リード深度比を計算する。最後に、配列決定された試料内の腫瘍細胞の分画率(腫瘍純度)とTCRA周辺の局所的体細胞コピー数との両方が分かっていることを前提として、対数(底2)リード深度比の偏差の大きさに基づいて、T細胞分画率の正確な推定量を計算することができる。腫瘍純度及び局所体細胞コピー数の知識が利用可能でない場合には、同様の予測値を有することを本発明者らが実証するナイーブ推定を行うこともできる(図5に示される方法のセクションで詳細に説明する)。特に、RNA-seqスコアとは異なり、TCRAスコアは、T細胞の割合の直接的な測定値を表す。本明細書では以後、これを「TCRA T細胞分画率」と呼ぶ。
【0076】
TIL ExTRECTの詳細な説明、並びに正規化のためのセグメントの選択及び選択されたエクソンの品質管理などパラメータの最適化については、以下の「方法」において述べる。TCRA T細胞分画率の精度を、以下の実施例2に記載の4つの直交アプローチを使用して検証した。次いで実施例3及び4で、その臨床的有用性を、2つの別個のアプローチを使用して実証した。最後に、実施例5で、様々な試料タイプでのT細胞免疫浸潤の重要な決定因子の評価におけるその使用を調査した。
【0077】
方法
腫瘍試料内の様々な細胞におけるTCRA遺伝子座の周辺での局所コピー数値の定義
二倍体であることが知られているT細胞及び他の間質細胞内には、TCRA遺伝子の2つのコピーがあり、TCRA遺伝子座の周辺でのコピー数は2に等しいと言うことができる。T細胞内で、VDJ組換え中に常に失われるTCRA遺伝子座内の領域があると仮定すると、これにより、(図3Bに示されるように)この小さいゲノムセグメントでのコピー数は0になる。腫瘍細胞では、14番染色体(TCRA遺伝子が位置する)にわたってコピー数の利得と損失の両方があり得て、2とは異なることがあるTCRA遺伝子の異なるコピー数状態が生じ得る。本方法は、がん細胞中の体細胞変化に由来するTCRA遺伝子内の切断点が存在しないことを仮定している(しかし、腫瘍細胞では、領域は全体として二倍体ではないことがある)。
【0078】
以下の2つのサブセクションでより詳細に説明するように、TCRA遺伝子の先頭(chr14:22090057(hg19))での平均コピー数は、ASCATを使用して試料中の全てのがん細胞から推測され、TCRA遺伝子での局所腫瘍コピー数と呼ばれる。これは、以下の式(7)によって提供されるSCNA認識TCRA T細胞分画率での用語として使用される。さらに、腫瘍の体細胞コピー数変化情報が入手可能でないとき、SCNAナイーブTCRA T細胞分画率(式(3))を使用することができ、これはナイーブTCRA T細胞分画率と呼ばれる。
【0079】
WESデータからのTCRA T細胞分画率の計算
Van Loo et al. (2010)に記載されているASCATアプローチ(腫瘍の対立遺伝子特異的コピー数解析)は、腫瘍細胞と非異常細胞との混合を含む試料から抽出されたDNAから対立遺伝子特異的コピー数を推定するための方法を提供する。以下の公式は、ゲノム位置iでの腫瘍倍数性を推定するためにASCATによって使用された式(Van Loo et al., 2010)であり、その位置でのB対立遺伝子頻度に関する第2の式(Van Loo et al.を参照)と組み合わせたものである。
【0080】
【数3】
【0081】
ここで、rは、位置iでのlogR(ゲノム遺伝子座での総コピー数を定量化する総シグナル強度の尺度)であり、γは、使用される技術に依存する定数であり(例えば、Illumina Hiseqに関してはγ=1の値が使用され得る)、pは、腫瘍純度(試料中の細胞集団の中での腫瘍細胞の分画率)であり、nAi及びnBiは、対立遺伝子特異的コピー数値であり、係数2は、正常組織について仮定される二倍体のコピー数を表し、Ψは、腫瘍試料の平均倍数性である。配列決定データと共にASCATを使用するとき、rは、ゲノム位置iでのリード深度比の対数(底2)であり、ここで、比は、同じゲノム位置での腫瘍試料と生殖細胞系列試料とに関するカバレッジ間の比である。
【0082】
本研究では、狙いは、試料中の細胞集団の中でのT細胞の分画率を特定することであった。さらに、この試料は、ゲノム遺伝子座iで未知の倍数性を有することがある異常細胞(例えば腫瘍細胞)を含むことがある。Van Loo et al.で調査された混合集団から類推して、r値は、他の(非T)細胞の中にT細胞を含む試料と、T細胞を含まない試料とのカバレッジの比を表す。例えば、腫瘍生検試料及びそれにマッチした血液試料は、腫瘍患者についてよく利用可能である。実際には、非腫瘍試料を使用してrを定量化することができる腫瘍状況とは対照的に、T細胞が明確に欠如している患者からの試料は知られていない。実際、腫瘍試料及びそれにマッチした血液試料の両方がT細胞を含む可能性が高い。したがって、本発明者らは、(以下のセクションで詳細に説明するように)単一の試料からlogRを推定する新たな公式及び方法を考案した。簡潔には、これは、VDJ組換えの影響を受けないコピー数値を有すると仮定される通常のバックグラウンド率として、TCRA遺伝子の先端と末端でのゲノム領域のカバレッジの中央値を使用することによって計算される(chr14:22090057-22298223、hg19ではchr14:23016447-23221076)。次いで、本発明者らは、TCRAゲノム領域にわたるカバレッジをこの中央値で割ることによって、TCRA遺伝子全体(chr14:22090057-23221076)にわたるrに関する推定量を作成する。したがって、このケースは、以下のように表すことができる。
【0083】
【数4】
【0084】
ここで、fは、試料のT細胞分画率であり、nは、TCRA遺伝子座(又は定量化すべき細胞のタイプに応じて、調査中の他のVDJ遺伝子座)でのT細胞のコピー数であり、γは、使用される技術に依存する定数であり(例えば、Illumina Hiseqではγ=1の値が使用され得る)、rは、以下で説明するように単一の試料から計算されたlogRであり、ΨSiは、TCRA遺伝子座(又は調査中の任意の他のVDJ遺伝子座)でのT細胞を除いた試料に関するコピー数であり、Ψは、VDJ組換えによる変化を考慮に入れない試料全体に関するこの遺伝子座でのコピー数である。VDJ組換えの最大点(rVDJと呼ばれる)を見ていると仮定すると、n≒0と仮定することができる。したがって、この位置では、式(2)は、式(2b)に簡略化される。
【0085】
【数5】
【0086】
この時点で、2つの異なる状況が存在し得る:(a)例えば、平均倍数性が常に2である正常な試料(例えば血液試料の場合)、又は平均倍数性が2ではないことがあるが、存在するT細胞の分画率が小さい試料(例えば低いT細胞含量を有するがん試料)に関して、Ψ≒ΨSiと仮定することができる場合;(b)上記の仮定は、例えばT細胞含量が小さくない腫瘍試料では当てはまらない場合。ケース(a)は、式2を式(3)に単純化するのに役立つ。
【0087】
【数6】
【0088】
これを、「ナイーブTCRA T細胞分画率」の式と呼ぶ。(a)での仮定が当てはまらない場合(ケース(b))、ΨとΨSiに関する以下の式を使用することができる:
ΨSi=2(1-p’)+p’Ψ (4)
Ψ=2(1-p)+pΨ (5)
【0089】
【数7】
【0090】
ここで、Ψは、TCRA遺伝子座での局所腫瘍コピー数(ASCATを使用して試料中の全てのがん細胞から推測される、TCRA遺伝子の開始位置(chr14:22090057(hg19))での平均コピー数として計算される)であり、p’は、最大VDJ組換えの位置にT細胞DNAが存在しないことを考慮に入れた、調整された腫瘍純度である。Ψは、TCRA遺伝子座(又は調査中の任意の他のVDJ遺伝子座)の開始位置での全てのがん細胞(すなわち、それぞれのサブクローンがその遺伝子座で異なるコピー数を有することがある全てのサブクローンにわたって)からの平均コピー数として計算される。これは、この遺伝子の先頭が、VDJ組換えからのシグナルを示さないと予想されるからである。したがって、遺伝子の末尾もVDJ組換えからのシグナルを示さないと予想されるので、結果に影響を及ぼすことなく、任意の実施形態において先頭の代わりに遺伝子の末尾を使用することもできる。理論に束縛されることを望まないが、VDJ組換えに関連付けられるシグナルは遺伝子の先頭よりも遺伝子の末尾に近いので(Jセグメントが遺伝子の末尾の近くにクラスタ化されるため。一方、Vセグメントはより大きく広がっている)、遺伝子の先頭でのシグナルの使用が有益であると考えられる。さらに、任意の実施形態において、例えば遺伝子座の前又は後など、調査中のVDJ遺伝子座の外側の領域にある全てのがん細胞からの平均コピー数を使用することも可能である(そのようなデータが利用可能な場合、例えば全エクソーム配列決定ではなく全ゲノム配列決定が使用される場合)。しかし、対象の遺伝子座からの距離が増加すると、見られるシグナルががん細胞内の異なるコピー数事象に対応する可能性が高くなり、したがって、調査中のVDJ遺伝子座での腫瘍コピー数を反映しなくなる。
【0091】
式(4)、(5)、及び(6)を式(2)に代入すると、式(7)が得られる。
【0092】
【数8】
【0093】
式(7)は、式(3)の「より完全な」バージョン(すなわち、式(3)を得るために立てられた全ての仮定を用いない式(2)の解)を表す。したがって、式(7)から始めて同じ仮定を適用することによって、式(3)を回復することが可能である。特に、これらががん細胞ではない(正常の2とは異なる倍数性を有する細胞でない;p=0)場合、式(7)は、即座に式(3)に単純化される。同様に、存在する腫瘍細胞でのTCRAの周辺の局所コピー数が正常な細胞と同じ(Ψ=2)である場合にも、この公式は、式(3)に単純化される。したがって、式(3)は、正常組織からの試料中のTCRA T細胞分画率を計算するために使用することができ、又は腫瘍純度若しくはコピー数の状態が未知である場合のナイーブ推定として使用することができる。
【0094】
言い換えると、試料の非がん成分(1-p)は、T細胞及び非T細胞サブセットに分けることによって書き換えることができる。すなわち、
(1-p)=(1-p)f’+(1-p)(1-f’)
ここで、f’は、T細胞である非腫瘍細胞の分画率を表し、以下の式のように、T細胞である試料の総T細胞分画率(f)に関係する。
【0095】
【数9】
【0096】
対立遺伝子特異的コピー数を無視して、ゲノム遺伝子座iでの腫瘍の総コピー数をΨとし、T細胞コンパートメントのコピー数をnとし、非T細胞正常細胞コンパートメントのコピー数を全てのゲノム遺伝子座で2とすると、以下の式が得られる。
【0097】
【数10】
【0098】
ここで、T細胞中のTCRA遺伝子でのVDJ組換え事象におけるゲノム位置を考察する。この位置ではn→0であり、さらにこの位置では、本明細書に記載するようにrVDJがリード深度比から直接推定されると仮定する。Ψは、VDJ組換えを考慮に入れない試料の平均コピー数として計算され、すなわち、Ψ=2(1-p)+pΨである。したがって、VDJ組換えのゲノム遺伝子座では、以下の式が成り立つ。
【0099】
【数11】
【0100】
この式へのf’に関する式の代入、及び試料内のT細胞分画率に関する式の変形は、上記の式(7)によって提供されることが分かる。対数比rVDJの値が>0である場合、結果として得られる分画率は負になることに留意されたい。このような場合、試料にはTILが存在せず、試料ノイズのみが測定されていると仮定することができる。したがって、fを0に設定することができる。逆に、腫瘍純度pが既知である場合(及び/又は腫瘍純度の計算に誤差がないと仮定することができる場合)、1-pよりも高いfの値は尤もらしくなく(試料の腫瘍純度+T細胞分画率を1よりも大きくすることはできないので)、より高い値が得られた場合には、fをこの値に切り捨てることができる。
【0101】
WESにおける単一試料からの対数リード深度比の計算
式(3)(T細胞含量のナイーブ推定の場合)又は式(7)(腫瘍コピー数及び純度が既知である場合)からT細胞分画率を計算するために、対数リード深度比rを、生のカバレッジデータから(すなわち、定量化すべき細胞集団をそれぞれ含む又は含まないマッチした試料からではなく、単一の試料から)推定する必要がある。
【0102】
簡潔には、このlogRは、TCRA遺伝子(又は定量化すべき細胞のタイプに応じて、調査中の任意の他のVDJ遺伝子座)の先端と末端でのゲノム領域のカバレッジの中央値を、VDJ組換えの影響を受けないコピー数値を有すると仮定される正常バックグラウンド率として使用することによって計算される。上で説明したように、任意の実施形態において、調査中のVDJ遺伝子座の先頭若しくは末尾(両方ではない)、又はVDJ組換えによって影響を受けないコピー数値を有すると仮定することができる他の(好ましくは近くの)領域を使用することも可能である。理論に束縛されることを望まないが、より長い正規化領域の使用(例えば、先頭領域と末尾領域の両方を使用する、及び/又は先頭領域の長さを増加させる)は、リード深度データにおいて典型的なノイズを有利に補償すると考えられる。例えば、先頭領域を拡張して、頻繁に失われる可能性が低い多数のVセグメントを含めることができ、データが利用可能な場合(例えば全ゲノム配列決定データを使用するときなど)には遺伝子の外側の領域を含めることもできる。このケースでは、以下の領域を使用した:chr14:22090057-22298223及びchr14:23016447-23221076(hg19)。次いで、TCRAゲノム領域(又は調査中の任意の他のVDJ遺伝子座)にわたるカバレッジをこの中央値で割ることによって、TCRA遺伝子全体(この場合には、chr14:22090057-23221076(hg19))にわたるrに関する推定量が得られる。この背景にある考え方が図5に示されている。
【0103】
より詳細には、アライメントされたBAMファイルからhg19(GRCh37に基づく)又はhg38(GRCh28)のいずれかに(データセットに応じて。例えばTCGAデータがhg38に事前アライメントされて取得されたが、TRACERx及び他のデータはhg19に施設内で(in house)アライメントされた)、個々の塩基レベルでのカバレッジが、samtools(バージョン1.3.1)の深度関数(パラメータ、-q20-Q20を有する)を使用して抽出される。これが行われた後、SureSelectヒト全エクソンプローブ(バージョン5)によって定義される既知のエクソン内の塩基のみがTRACERx内で使用され、次いで、各エクソン内で、リードが、50塩基対のウィンドウにおいてローリング中央値(すなわち、各50bpウィンドウ内の中央値が新たな値として取られる)で正規化される。ウィンドウのサイズは固定されず、いくつかの実施形態では、例えば20~200bpの間又は50~150bpの間など、50bpよりも大きい又は小さいウィンドウを使用することができることに留意されたい。本方法を使用して取得されたリンパ球分画率の推定量を、Danaherスコアなどリンパ球分画率の直交規準に対する様々な候補ウィンドウサイズと比較することによって、特定のデータセット、データのタイプ、又は状況についてウィンドウの適切なサイズを経験的に決定することができる。
【0104】
ベースラインカバレッジ値の中央値は、遺伝子の先頭と末尾の領域(chr14:22090057-22298223及びchr14:23016447-23221076(hg19)。TCRAの最初の12個のVセグメント及びCセグメントに対応する)を用いて、VDJ組換えによる影響を受けないと仮定されるTCRAの領域内で計算される。次いで、全てのカバレッジ値がこの値で割られ、次いで、「単一試料」対数比を計算するために対数が取られる。rVDJの計算を完了するために、最大VDJ組換えの位置でのモデルの平均値をrVDJに関する値として取って、一般化加法モデルがデータに当てはめられる。一般化加法モデルは、共変量の平滑関数と線形予測子の従来のパラメトリック成分との合計によって線形予測子が与えられる一般化線形モデルである。モデルは、平滑化されたラインをデータに実質的に当てはめ、これを行うための任意のアプローチを本開示の文脈で使用することができる(例えば、任意のタイプの一般化線形モデル、又は例えば区分的定数モデルの当てはめなど任意の他の平滑化アプローチを使用する)。このケースでは、Rでの「geom_smooth」関数を使用してモデルを当てはめた。これは、mgcvパッケージの「gam」関数(mgcv::gam)を公式y~s(x,bs=cs)と共に使用する(詳細は、https://rdrr.io/cran/mgcv/man/gam.htmlを参照)。この実装は、ペナルティ付き回帰スプラインを使用する一般化加法モデルの平滑関数を表す。このプロセスの図は、図5に示されている。最大VDJ組換えの位置は、最後のTCRA VセグメントとTCRデルタ遺伝子の最初のセグメントとの間のギャップとして定義され、80000bp(80kbp)のサイズを有するように丸められ、位置22800000から始まる(領域chr14:22800000-22880000をもたらす)。これについては以下で説明する。他の定義も可能であり、この領域のサイズを少し変えても大きな相違は生じないと予想される。最大VDJ組換えの領域は、他のVDJ遺伝子座に関しても同様のアプローチを使用して定義することができ、すなわち、最後のV遺伝子セグメントと最初のJ遺伝子セグメントとの間の領域の周囲又は内部に少なくとも部分的に位置する領域、例えば最後のV遺伝子セグメントと最初のJ遺伝子セグメントとの間のギャップに対応する領域を定義し、任意選択で、操作を容易にするために例えば最近傍kbp又は最近傍10kbpなどに丸めることによって定義することができる。
【0105】
要約すると、多くの腫瘍試料について式(7)を使用することができ、これにはTCRA遺伝子での腫瘍純度と腫瘍コピー数との両方の知識が必要である。全ての血液由来試料及び多くの腫瘍においてそうであるようにTCRAでのコピー数が正確に2である特別なケースでは、式(3)を使用してT細胞分画率を計算することができ、正確である。さらに、TCRAでの腫瘍純度及び腫瘍コピー数が未知である場合、式(3)は、T細胞分画率に関するナイーブ推定として機能することができる(しかし、上述した仮定が成り立つか否かに応じて、このナイーブ推定は正確ではないことがある)。これについて次のセクションで考察する。
【0106】
ナイーブTCRA T細胞分画率と、T細胞分画率の正確な推定量
図6Aは、式(2)、(3)、及び(7)から導出された理論値に基づき、様々な局所コピー数値及び腫瘍純度について、T細胞に関する推定ナイーブ値と様々な実際のT細胞分画率値との(理論上の)差を示す。低いT細胞分画率、及び2に近い局所コピー数値では、この推定は非常に正確である。図6B~Cは、TRACERx100コホートからの実データを使用して(このデータに関するより多くの情報は実施例2で提供される)、局所TCRAコピー数の分布がモード2を有し、腫瘍純度値が典型的には低いことを示す。図6Dは、局所TCRAコピー数が2ではないケースについて、ナイーブ推定量と計算された正確なT細胞分画率との相関を示す。
【0107】
対数比(rVDJ)の推定に使用されるセグメントの最適化
VDJの計算は、(i)最大VDJ組換えのセグメント、及び(ii)(上で説明したように比を計算することによって)TCRAゲノム領域にわたるカバレッジが比較される「正常ベースライン」を計算するために使用すべきセグメントの選択を必要とする。
【0108】
最大VDJ組換えの位置を表す限局性セグメントに関しては、最後のV遺伝子セグメントとTCRδ鎖の一部をコードする最初のセグメントとの間のギャップを使用した(hg19、chr14:22800000-22880000)。ゲノムのこの領域は、理論上は、T細胞受容体切除サークル(TREC)内にある可能性が高く、TRECを測定するPCRプライマのために以前に使用された領域(Kuss et al., 2005)と重複する。上で説明したように、対象のVDJ遺伝子座の最後のVセグメントと最初のJセグメントとの間の任意の領域を使用することができる。
【0109】
VDJ組換えで一般的に失われる可能性が低いV遺伝子セグメントを使用する正常ベースラインの計算では、配列決定ノイズがあるため、領域をできるだけ広くすることが望ましい(WESでの単一試料からの対数比の計算を参照)。しかし、より多くのV遺伝子セグメントが選択されるほど、これらの遺伝子セグメントがTRECによって切除された場所にT細胞クロノタイプが存在する可能性が高くなる(したがって、その領域でのカバレッジがVDJ組換えによって影響を及ぼされることになる)。
【0110】
局所セグメントに関しては、以下に概説する最適化スキームを使用して、最初のn個のV遺伝子セグメントと、最後のCセグメントとを選択した。最初のn個のVセグメントを順に取り、TRACERx100コホート全体にわたってスコア(TCRA T細胞分画率、f、非GC補正)を計算した(このコホートについてのさらなる詳細は実施例2を参照)。Vセグメントの数は、どのnが、fの非ゼロ値を最も多く有し、計算されたT細胞分画率とT細胞浸潤に関するDanaherトランスクリプトームスコア(T細胞浸潤の比較規準。実施例2を参照)との関連性を最大化したかに基づいて選択した。使用されるセグメントの長さがノイズのレベルを低下させることが判明した(すなわち、使用されるセグメントが多いほど、ノイズの観点から、より良い正規化が行われる)が、いくつかのケースで長すぎる場合には、特定のT細胞クロノタイプから欠失されたセグメントと重複する(すなわち、より長いセグメントは、1つ又は複数のT細胞クロノタイプで失われた1つ又は複数のセグメントを含む可能性が高くなる)。したがって、控えめに見積もって、Danaherスコアとの高い関連性と、できるだけ短いセグメントとの妥協点として、最初の12個のVセグメントを選択して使用した(図25に示される。ここで、上のプロットは、TRACERx100データにおいて正規化に使用されるVセグメントの数の関数としてTCRA T細胞分画率を示し、中央のプロットは、非ゼロ試料の対応する分画率を示し、下のプロットは、Spearmanの方法を使用して評価されたDanaher T細胞シグネチャとの相関の有意性を示す)。結果に大きな影響を及ぼすことなく、他の数のセグメント、例えば最初の11個のVセグメントなどを使用することもできることに留意されたい。
【0111】
TIL ExTRECT内で使用されるGC正規化方法
GC含量は、シーケンスカバレッジ値を偏らせることが知られている。したがって、TIL ExTRECTは、T細胞分画率の計算前にGC含量によってカバレッジ値を正規化することができる。これを行うために、GC含量は、各TCRAエクソンに関するGC含量(GCexon)が計算される局所エクソンレベルと、より大きなマクロスケール(GCmacro)との2つのスケールで計算される。このより大きなスケールでは、GC含量は、TCRA遺伝子全体にわたって1000bpウィンドウで計算される。次いで、一般化加法モデルをこのデータに当てはめて、TCRA遺伝子にわたるマクロスケールGC含量に関する平滑化された値を作成する。GC含量を正規化するために、全てのTCRAエクソン内のあらゆる塩基対のカバレッジ値を以下の線形モデルに入れる。
【0112】
【数12】
【0113】
次いで、このモデルの残差を、新たなGC正規化カバレッジ値として取る。特に明記しない限り、本明細書で使用される全てのTCRA T細胞分画率は、GC補正されている。
【0114】
GC補正後、スコアのベースラインは、TCRA遺伝子の先頭と末尾(chr14:22090057-22298223及びchr14:23016447-23221076(hg19))で中央値を取り、最大VDJ組換えの位置(chr14:22800000-22880000)で一般化加法モデル(GAM)の中央値を取ることによって再調整される。理論上、T細胞分画率が負になることはあり得ず、このために必然的にchr14:22800000-22880000での対数リード深度比が≦0でなければならないので、2つの中央値の最大値が新たなベースラインとして採用され、0に設定される。
【0115】
TIL ExTRECT内での信頼区間の計算
TCRA T細胞分画率に関する95%信頼区間を、以下の2つの要素を考慮して計算した:1)GC補正後の最終ベースライン調整におけるノイズ;2)TCRA T細胞分画率の最終計算で使用されるGAMモデルの当てはめの不確実性。
【0116】
ベースライン調整でのノイズを考慮に入れるために、調整値に関する95%信頼区間は、正規化に使用される領域でのカバレッジ値の標準偏差の1.96倍として計算した。GAMモデルの当てはめに関して、Rパッケージ「gratia」(v0.5.1)を使用して、同時信頼区間を計算した(confint関数を使用)。最後に、これら2つの不確実性の原因を組み合わせて、95%信頼区間を生成した。
【0117】
過大評価された腫瘍TCRAコピー数によるTCRA T細胞分画率の偏り
TCRA腫瘍コピー数の過大評価された値は、TCRA T細胞分画率に関する値の増加につながる。これは、ASCATなどのコピー数セグメンテーションアルゴリズムから選択されたソリューションの品質が低いために生じる可能性がある。これが当てはまることを示す1つの指標は、TIL ExTRECTからの計算されたTCRA T細胞分画率が、1-腫瘍純度の値を超えているかどうかである。これらのケースでは、所与のコピー数ソリューションは信頼できないと考えられ、代わりにTCRA腫瘍コピー数が2であると仮定するT細胞分画率に関するナイーブ推定が代替ソリューションとして使用される。
【0118】
実施例2-WES由来のTCRA T細胞分画率の検証
導入
実施例1で述べたTCRA T細胞分画率規準の精度を評価するために、本発明者らは4つの直交アプローチを使用した。
【0119】
第一に、T細胞含量の陽性及び陰性対照として、細胞株からのWESデータを使用した。第二に、様々なT細胞分画率値を含むシミュレート次世代配列決定(NGS)データを使用した。シミュレートされたデータは、スコアの精度に対する局所腫瘍TCRAコピー数及び腫瘍純度の影響を調査するためにも使用した。第三に、本発明者らは、スコアが複数のNSCLCコホート内の直交免疫関連データにどの程度匹敵するかを検査した。第四に、本発明者らは、スコアが、免疫含量を推測するための代替のDNAベースの方法とどの程度類似しているかを計算した。
【0120】
結果
実施例1で述べたアプローチの第1の検証として、本発明者らは、ゲノムの複雑さの度合いが異なる四倍体及び二倍体クローンを含むHCT116細胞株に由来する14個の独立した試料(Lopez et al. 2020)と、cancer cell line encyclopaediaからのT細胞リンパ腫から得た細胞株に由来する3つの試料(JURKAT、PEER、及びHPB-ALL)(Ghandi et al. 2019)とからなる細胞株からのWESデータを利用した。理論上は、HCT116細胞株からのNGSではTCRA T細胞分画率がゼロであるはずであり、T細胞リンパ腫由来の細胞株(全てVDJ組換えが行われているはずである)は、TCRA T細胞分画率が1であるはずである(T細胞としての細胞の100%を反映する)。確認できるように、HCT116細胞株は全て、(図7に示されるような)それらの二倍体又は四倍体の状態に関係なく、計算された分画率が0であった。逆に、3つのT細胞由来の細胞株は、ナイーブ推定で計算されたスコアが1に近かった(約0.95~約0.96)(図7を参照)。正確に100%の推定分画率からのこのわずかな差は、技術的要因(例えば、ミスアライメントされたリード)又は生物学的要因によって説明される可能性が高い。
【0121】
第2の検証アプローチとして、二値(有無)に勝るTCRA T細胞分画率の精度をさらに評価するために、様々なT細胞分画率に関して、様々なT細胞分画率値を含むシミュレートNGSデータを取得した(「方法」を参照)。図8Aで見られるように、バックグラウンドTCRAコピー数を2とした試料中でのシミュレートされたT細胞分画率と計算されたT細胞分画率との間には、非常に有意な、ほぼ完璧な関係があった(ρ=1、p<2.2e-16)。スコアの精度に対する局所腫瘍TCRAコピー数(「方法」を参照)及び腫瘍純度の影響のさらなる調査を、シミュレートされたデータを用いて調査し、(図8C~Dに示されるように)シミュレートされたTCRA T細胞分画率と推定されたTCRA T細胞分画率との間に有意な関係があることも実証された。
【0122】
第3の検証アプローチとして、本発明者らは、スコアが、TRACERx100コホート内、また肺腺がん(LUAD)TCGA(Cancer Genome Atlas Research Network, 2014)及び肺扁平上皮がん(LUSC)(Cancer Genome Atlas Research Network, 2012)コホート内の直交免疫関連データにどの程度匹敵するかを検査した。これらのNSCLCコホートは、RNA-seq、組織病理学的スライド、及びメチル化データを含む様々な異なるデータタイプからのT細胞含量に関する推定量を含んでいた。
【0123】
TRACERx100コホートは、100人の患者からの100個の腫瘍に由来する、WESを受けた327の腫瘍領域で構成されており、それぞれ、やはりWESを受けたマッチした生殖細胞系列血液試料を含む(表1を参照)。また、これらの腫瘍領域のうち189個は、マッチしたRNA-seqデータを有しており、そこからトランスクリプトームベースの免疫スコアを計算することができた。
【0124】
【表1】
【0125】
特に、本発明者らは、スコアが、TRACERx100コホート内の直交する非WES免疫関連データにどの程度匹敵するかを検査した。Danaher et al.、Davoli et al.、xCell、TIMER、EPIC、及びCIBERSORTからの様々な細胞型に関する免疫関連シグネチャスコアを、RNA-seqデータ(Rosenthal et al., 2019)を用いて189のTRACERx100領域について計算した。WESからのTCRA T細胞分画率は、様々な方法から導出された複数の免疫スコアと有意な正の関係を有することが判明した。最も強い関連性がある上位3つの項目は、全てT細胞関連であった(Danaher Th1:ρ=0.68,P=9.0e-23、xCell CD8 T細胞メモリρ=0.67,P=2.3e-22、及びDanaher T細胞:ρ=0.67,P=2.94e-22)。NK細胞に関するDavoliスコア(ρ=0.67,P=3.92e-22)及び、xCellで同定された活性化樹状細胞(ρ=0.61,P=1.26e-17)など他の非T細胞スコアも非常に高くランク付けされ、腫瘍免疫微小環境の複雑さを示し、またT細胞浸潤が他の免疫細胞からの浸潤と強い相関性を有することを示す。WESからのTCRA T細胞分画率は、CD8+細胞(ρ=0.62,P=9.6e-20)、T細胞(ρ=0.63,P=2.3e-20)、及び合計TIL(ρ=0.59,P=1.4e-17)に対応するDanaherトランスクリプトームシグネチャと有意な正の関係を有することが判明した(図9A、9Cに示される)。
【0126】
TCRA T細胞分画率をさらに確認するために、本発明者らは、88人の患者について入手可能な、病理学者によって手動で検査及びスコア付けされた病理組織学的H&Eスライドに基づいて、TCRA T細胞分画率とTILスコアとの関連性を評価した。確認できるように、TCRA T細胞分画率は、病理学TIL分画率推定量と有意に相関した。とりわけ、病理学TIL分画率推定量は、CD8+及びCD4+T細胞を排他的に含むわけではなく、したがってその推定量とTCRA T細胞分画率との完全な相関は予想されない。
【0127】
第4のアプローチとして、本発明者らは、合計カバレッジに対してVDJ組換え後のCDR3領域にアライメントする各WESでのリード数(CDR3 VDJスコア、詳細については「方法」を参照)に基づいて免疫含量を推測する代替のDNAベースの方法{Levy et al}とスコアがどの程度類似しているかを計算した。TRACERx100コホートにおいて、本発明者らは、TCRA T細胞分画率とCRD3 VDJスコアとの有意な正の相関を観察した(図9D、ρ=0.36、P=1.4e-13)。しかし、本発明者らは、TRACEERx100コホートでの高いカバレッジにもかかわらず、CDR3 VDJスコアは、配列決定深度によって大幅に制約されることに注目した。CDR3領域にアライメントするリードの数は典型的には非常に少ない(Q1=0、中央値=2、平均=2.335、Q3=3、最大=14)。T細胞ExTRECT由来のTCRA T細胞分画率及びCDR3 VDJスコアが配列決定カバレッジの相違に対してどの程度ロバストであるかを明示的に定量化するために、本発明者らは(以下に述べる)2つの相補的な方法を採用した。
【0128】
次に、RNA-seqデータと病理由来のTILスコアとの両方を含む腫瘍領域のサブセット(147領域)を選択して、本発明者らは、TCRA T細胞分画率、CDR3 VDJスコア、及びCD8+細胞に関する6つのRNA-seqベースの免疫尺度(Danaher、Davoli、xCell、TIMER、CIBERSORT、及びEPIC)がTILスコア(図9Bに示される)にどの程度匹敵するかを評価することもできた。Danaher CD8+スコアは、病理学TILと最も強い関連性(ρ=0.49)を有し、次いで本発明者らのTCRA T細胞分画率(ρ=0.41)、Davoli(ρ=0.4)、xCell(ρ=0.36)、CIBERSORT(ρ=0.23)、TIMER(ρ=0.2)、CDR3 VDJスコア(ρ=0.2)、及びEPIC(ρ=0.082)であり、EPIC以外の全てが有意に関連していた。したがって、TCRA T細胞分画率の推定は、代替のDNAベースの尺度を大幅に改良し、免疫細胞腫瘍浸潤量を明らかにするという点で先進のRNA-seqベースの免疫シグネチャに匹敵するが、多くの既存の方法とは異なり、T細胞分画率の正確な点推定量を提供する。
【0129】
さらに、本発明者らは、TCGAからのより低いカバレッジ(TRACERxにおける深度中央値426Xと比較して、カバレッジ中央値:LUAD=84、LUSC=88.2)を有する独立したNSCLCデータセットにおけるTIL ExTRECTをさらに評価した。LUAD及びLUSCコホートを構成する試料が表2に記載されている。本発明者らは、TCRA T細胞分画率をThorsson et al(Thorsson et al., 2018)からの免疫関連データと相関させた。Thorsson et al.では、DNAメチル化及びRNA-seq CIBERSORTベースのT細胞CD8分画率から「白血球分画率」と呼ばれる試料中の総TILの尺度が計算された。
【0130】
【表2】
【0131】
CIBERSORTベースのCD8+T細胞推定量と比較して、TCRA T細胞分画率は、Thorrsonらによって使用されたメチル化由来の白血球分画率とより強い関連性を有し(図10に示されるように、ρ=0.29、P=1.2e-18 vs.ρ=0.1、P=0.00097)、TCRA T細胞分画率が総TILのメチル化ベースの尺度とよく相関していること、及びこれがT細胞含量の特定のRNA尺度よりも潜在的に優れていることの両方を示す。
【0132】
さらに、本発明者らは、TIL ExTRECTからのTCRA T細胞分画率が配列決定カバレッジの相違に対してどの程度ロバストであるかを試験することを試みた。具体的には、正確なT細胞分画率推定量を得るために必要な最小配列決定深度を確認するために、本発明者らは、2つの相補的な方法を採用した。第一に、TRACERx100からの5つのNSCLC腫瘍領域を選択した。TIL ExTRECTからのTCRA T細胞分画率は0~0.35の範囲であった。次いで、これらの領域を、5、10、20、30、40、50、75、100、及び200倍のカバレッジに、個別に10回ダウンサンプリングした。本発明者らは、T細胞分画率推定量が30倍以上(ρ=0.84、P=1.4e-14)のカバレッジで一貫したままであることを発見した(図11Aに示される)。これと一貫性を保って、シミュレートされたデータは、30倍のカバレッジと既知のT細胞分画率との間の信頼できる対応関係を示した(図11Bに示される。ρ=0.96、P=1.9e-14)。本発明者らは、(図11Aに示されるように)カバレッジが10倍であっても有用な情報が取得可能であり得るが、20倍以下のカバレッジではTCRA T細胞分画率が忠実度を失い始めることを観察した。これは、特に検出限界を下回り始めるより低いT細胞分画率に関するノイズの増加によるものである可能性が高い。したがって、30倍未満(10倍及び20倍を含む)のカバレッジは、高いT細胞分画率と低いT細胞分画率とを区別するのに依然として有用であり得るが、非常に低いT細胞分画率の信頼できる推定量を取得するには十分ではないことがある。0.1未満のT細胞分画率が一般的であるため、30倍以上のカバレッジの使用は、さらなる確実性と幅広い適用性を提供する上で有利であり得る。対照的に、本発明者らは、T細胞浸潤を決定するためのCDR3法が低い配列決定カバレッジによって大きく歪められていることを発見した。最高のCDR3リードを有する5つの試料を選択し、50倍のカバレッジにダウンサンプリングしたとき、1つの試料では3つのリードが検出され、残りの試料では1つのCDR3リードのみであった(図11D)。これと一貫性を保って、Levy et al.によるTCGA BRCA解析でも、腫瘍の56%でCDR3リードが同定されなかったことは注目に値する。
【0133】
最後に、本発明者らは、複数の異なるデータセットでの試験から、試料が新鮮凍結かホルマリン固定パラフィン包埋(FFPE)かに依存してT細胞分画率に体系的な有意差がないことを特定した(「方法」及び図11Cを参照)。これは、本方法が、FFPE特有のDNA変化に敏感でないことを示唆する。
【0134】
したがって、本明細書に記載のTCRA T細胞分画率推定方法は、代替のDNAベースの尺度を改良し、免疫細胞腫瘍浸潤量を明らかにするという点で先進のRNA-seqベースの免疫シグネチャに匹敵するが、多くの既存の方法とは異なり、T細胞分画率の正確な点推定量を提供する。さらに、T細胞ExTRECTは、WESを受けた任意の試料に適用することができ、したがって腫瘍試料と血液試料との両方におけるT細胞分画率の解析を可能にする。
【0135】
方法
統計
この例での全ての統計試験及び他の全ての統計試験をR3.6.1で行った。試料サイズを事前決定するために統計的方法は使用しなかった。相関性を含む試験を、Rパッケージggpubr(v0.4.0)からの「stat_cor」をSpearmanの方法と共に使用して行った。分布の比較を含む試験は、特に明記されていない限り、「wilcox.test」を使用して又はペアでないオプションを使用して、「stat_compare_means」を使用して行った。対応するウィルコクソン検定に関する効果量を、rstatixパッケージ(v0.6.0)からの「wilcox_effsize」関数を使用して測定した。ハザード比及びp値を、カプラン・マイヤー曲線とCox比例ハザードモデルとの両方に関して「survival」パッケージ(v3.2-3)を使用して計算した。全ての統計試験について、含まれるデータポイントの数が、対応する図にプロットされる又はアノテーションを付けられる。
【0136】
免疫ホット及びコールド腫瘍領域の定義
これらの実施例を通じて、免疫ホット領域は、TIL ExTRECTによって測定したときに10%を超えるT細胞を含む領域として定義し、免疫コールド領域は、10%未満のT細胞を含む領域として定義した。この閾値は専門知識に基づいて定義し、解析の文脈及び目的に応じて他の閾値を使用することもできた。
【0137】
新鮮凍結試料とFFPE試料の比較
新鮮凍結試料とFFPE試料との両方でTCRA T細胞分画率が信頼でき一貫していることを試験するために、CPI応答コホートにおける6つの異なる研究について非GC補正TCRA T細胞分画率を計算した。これらの研究のうちの3つでは、FFPE組織由来のWESを利用し(n=460)、他の3つでは、新鮮凍結組織由来のWES試料を利用した(n=357)。線形モデルを当てはめ、組織学及びFFPE状態によってTCRA T細胞分画率を予測したところ(表6)、がん種がこの有意性の主な作用因子であり、FFPE状態は重要ではないことが明らかになった。さらに、FFPE試料及び新鮮凍結WES試料を有する悪性黒色腫及び膀胱腫瘍については、有意差は見られなかった(図11C)。したがって、WES試料が新鮮凍結組織に由来するかFFPE組織に由来するかは、TIL ExTRECTによって計算されるTCRA T細胞分画率の値に大きな影響を及ぼさないと結論付けることができる。
【0138】
【表3】
【0139】
シミュレートされたデータ
非GC補正TCRA T細胞スコアの結果を試験するためのシミュレートされたデータは、MASCoTE(Zaccaria & Raphael, 2020)腫瘍シミュレーション法からのツールと組み合わせてART Illumina(バージョン2.5.8)(Huang, Li, Myers, & Marth, 2012)を使用して作成した。簡潔には、ARTを使用して、カバレッジ30及びリード長150を有するHiSeq 2500 DNAシーケンサからのヒト14番染色体に関するシミュレートされたペアエンドFASTQファイルを生成した(パラメータ-p-ss HS25-f 30-na-1 150-m 200-s 10)。ここで、-ssは配列決定プラットフォームを表し、-fはカバレッジを表し、-lはリード長を表し、-mはDNAフラグメントの平均サイズを表し、-sはフラグメントサイズの標準偏差を表し、-naは、出力アライメントファイルを提供することができないことを示す(詳細については、https://manpages.debian.org/stretch/art-nextgen-simulation-tools/art_illumina.1を参照)。次いで、これらのFASTQファイルを、bwa mem(v0.7.15)を使用してヒトゲノムhg19にアライメントした。次いで、Picardツール(バージョン1.107)を使用して、得られたBAMファイルをクリーンアップ、ソート、及びインデックス付けした。TCRA遺伝子でのカバレッジのみがシミュレートされたデータの試験に重要であるので、chr14:20000000-24000000にマッピングする全てのリードのsamtools(バージョン1.3.1)ビューを用いてBAMファイルを作成した。このBAMファイルは、正常細胞及び腫瘍細胞のためのテンプレートとして役立った。chr14:20000000-22500000又はchr14:23000000-24000000にマッピングしたリードのみを抽出し、これらの結果を、samtools mergeを用いて単一のBAMファイルにマージすることによって、このBAMファイルからT細胞テンプレートを作成した。したがって、このT細胞BAMファイルは、位置chr14:22500000-23000000の間に、人為的に作成された100%の欠失を含む。このギャップの両側の領域のいずれかに一部マッピングしたリードは含まれていた(すなわち欠失されなかった)。リードサイズは150bpであるので、これらのリードの有無は欠失のサイズに比べて重要ではないと考えられる。このT細胞及び正常/がんBAMファイルを使用して、MASCoTE法で使用されるMixBam.pyモジュールを用いて、様々な混合BAMファイルを生成した。これにより、混合物のゲノム長とコピー数との両方に応じて正常/がん及びT細胞BAMをサンプリングすることにより、混合BAMが作成される。このようにして、異なるがん体細胞コピー数変化値を有する異なる割合の正常細胞、T細胞、及びがん細胞の集団を含むシミュレートされたデータを作成することができた。
【0140】
本方法を使用するシミュレートされたデータを、腫瘍純度=[0.25、0.5、0.75]、腫瘍コピー数=[1、3、4、5]、及びT細胞分画率=[0.01~0.25、0.01刻み]の可能な全ての組合せについて、及び0.01刻みで0.01~0.99の範囲のT細胞分画率を有する腫瘍コピー数2について作成した。このシミュレートされたデータの作成後、WESに適用される標準的なTIL ExTRECT法(実施例1に記載)で行われるように、TCRA遺伝子のエクソン内の位置からのリードのみを使用してT細胞分画率を計算した。TCRAの周辺での局所コピー数を1として、T細胞が24%、腫瘍が75%のシミュレートされた単一の実行に関する出力の例が図8Bに示されている。図8C及び図8Dは、様々な局所腫瘍コピー数及び純度値でのシミュレートされた値と計算値との差を示す。ナイーブスコアは、コピー数が2未満のときにはT細胞分画率を過大推定し、2を超えるときには過小推定する。しかし、正確なスコアはラインy=xに従い、それが実際に正確であることを示す。
【0141】
TCRA T細胞分画率推定に対する配列決定深度の影響の調査
より低いカバレッジの影響を評価するために、5つのTRACERx100領域を、それらが表すTCRA T細胞分画率の範囲に基づいて選択した(高=0.35、中=0.156、低=0.053、非常に低い=0.010、なし=0)。簡単にするために、全ての領域が、局所TCRA腫瘍コピー数2を有するものとした。研究としてのTRACERx100では、カバレッジの中央値が430.91倍であった。これらの試料は様々な深度を有していたが、samtoolsビューを-sオプションと共に使用して、領域の元の深度を考慮に入れて、アライメントされたBAMファイルを特定の深度までダウンサンプリングした。このようにして、異なるランダムシードから作成された10個のダウンサンプリングされた深度を作成し、200、100、75、50、40、30、20、10、及び5倍のカバレッジの深度でBAMファイルを形成した。これらのBAMを生成するためのダウンサンプリングの後、上述した方法を使用して、非GC補正TCRA T細胞分画率を推定した。
【0142】
捕捉キットのエクソン偏り検出、及びTCRA T細胞分画率の計算に使用されるエクソンの品質管理
一般的な品質管理ステップとして、TCRA T細胞分画率の計算に使用する前に、十分なカバレッジについて全てのエクソンをチェックした。中央値が15倍未満のエクソンは除去し、30個を超えるエクソンがこの閾値未満であった場合には、低いカバレッジにより試料を不合格としてマークした。
【0143】
TCGAデータセットを解析する過程で、使用した捕捉キット(Agilent SureSelect v2に基づく広範なカスタムセット)による偏りが観察された。この偏りは、Wangら(Wang, Kim, & Chuang, 2018)によって以前に述べられており、TCRAを含む4833個の遺伝子に影響を与える。この偏りは、特定のエクソンのカバレッジを予想よりもはるかに低くし、したがってスコアの計算に干渉した。この偏りの一例は、図26Aで見ることができる。この問題を解決するために、本発明者らは、TRACERx100及びTCGA LUADコホート内で、個々のエクソンにおける平均logR比(すなわち、上で説明したように、最初の12個のVセグメント及びCセグメントでのリードカバレッジの中央値に対するエクソンにおけるリードカバレッジの対数比の平均)を計算した(図26Bを参照)。TCGA LUSCコホートはこの解析には使用しなかったが、本発明者らは、このコホートからの結果がTCGA LUADコホートの結果と大きく異なるとは予想していない。0.5を超える中央値の差を有するエクソン(各エクソンごとに、各コホート内の全ての試料にわたって中央値を計算し、次いでコホート間の中央値の差を検査する)にフラグを付け、TCGA解析から除去した。これにより、99/192のエクソンが除外された。以下の解析では、これらのエクソンがTRACERx100データから除去され(ただし、偏りは、使用された捕捉キットに関連していると考えられるので、このデータは、TCGAデータと同じ偏りを受けるとは予想されない)、偏りがないときのこの縮小されたセットの使用における相違が最小限である(偏りが存在するときに観察することができる大きな影響に比べて)ことを示すことに留意されたい。Agilent SureSelect v2捕捉キットを使用した特にCPIデータセット(Rizvi et al., 2015;Shim et al., 2020)内の他のコホートも、同じ偏りを有することが観察され(すなわち、同じエクソンに影響を及ぼす偏り。上述したように全てのエクソンに関する中央値を計算し、これらと、偏りの影響を受けたデータセット(すなわちこの場合にはTCGA LUADコホート)からのエクソンの中央値との相関を調べることによって示される)、この縮小されたエクソンセットを用いて計算されたスコアを有する。さらに、GC補正後、TCRδ遺伝子セグメントの1つにおいてAgilent SureSelect v2捕捉キットを使用したとき、単一のエクソンで偏りが観察された。このセグメントは、TCRA分画率を計算するために使用される限局性領域内にあるので、また、縮小されたセット内のエクソンの数がより少ないので、このエクソンの小さな変化が、計算されたスコアに大きな影響を生み出す可能性がある。GC補正後、これがはるかに顕著であることが判明し、したがって、この効果が大きいTCGAなどのコホートでは、このエクソンも解析から除去した。
【0144】
本発明者らは、縮小されたエクソンセットを、追加のTCRδ遺伝子セグメントも除去されたTCGAコホートに適用し、TCRA T細胞スコアを比較したところ、LUADとLUSCとの両方からの腫瘍試料についてTCGAコホートとTRACERxコホートとの間での大きな相違を観察した(図26C:ウィルコクソン検定、LUAD:P<2.2e-16LUSC:P<2.2e-16)。しかし、この相違は、この縮小されたたエクソンセット内のGCの偏りに完全に起因するものである。GC補正法が使用されるとき、LUAD患者とのTCRA T細胞分画率の有意差はわずかであり、これはおそらくコホート集団の相違によりわずかにだけ有意である(図26D、ウィルコクソン検定、LUAD:P=0.028、LUSC:P=0.97)。
【0145】
本明細書における任意のコホートで使用された任意の他の捕捉キットで検出された、GC補正によって修正可能な偏り以外の他の偏りはなかった。しかし、Nimblegen捕捉キットを使用したコホートは、Agilent捕捉キットから定義されたエクソンのコホートとは十分に異なることが判明した。Nimblegen捕捉キットからの全ての試料は、Nimblegenエクソン捕捉領域から直接定義されたエクソンを使用して計算した。また、Nextera Rapid Capture及びIDT xGen Exome Research Panelなどいくつかの捕捉キットは、TCRA遺伝子内で極端に低いカバレッジを有することが確認された。これらのキットのエクソーム捕捉領域を手動でチェックしたところ、TCRA遺伝子内の領域がそれらの設計に含まれていないことが判明した。これらのキットを使用するデータセットに関して、TIL ExTRECTを使用してTCRA T細胞分画率を計算することはできない。
【0146】
CDR3 VDJスコアの計算
Levy et al.で概説されている手順に従って、CDR3 VDJスコアを計算した。TCRB(hg19:chr7:142000817-142510993)にアライメントする最初のリードと、アライメントされないリードとをsamtoolsで抽出し、この得られたbamを、bedtoolsを使用してfastqに変換し、次いで、得られた出力に対してツールIMSEQ(v1.1.0)を使用して、CDR3領域にアライメントするVDJ組換えリードを同定し、アライメントされたリードの数を、元のbamファイル内のリードの総数(samtools flagstatで測定)によって正規化して、CDR3 VDJスコアを作成した。
【0147】
TRACERx100患者
NSCLC TRACERx研究(https://clinicaltrials.gov/ct2/show/NCT01888601、独立研究倫理委員会によって承認済み、13/LO/1546)によってプロスペクティブに解析された最初の100人の患者を本研究に使用した。これは、Jamal-Hanjani et al.(Jamal-Hanjani et al., 2017)に元々記載されていた100人の患者のコホートと同一である。このコホートを簡単に説明すると、TRACERx研究への参加にはインフォームドコンセントが必須の要件だった。このNSCLCコホートは、男性68人、女性32人の患者からなり、年齢の中央値は68歳であった。最後に、このコホートは、主に初期段階の腫瘍(Ia(26)、Ib(36)、IIa(13)、IIb(11)、IIIa(13)、及びIIIb(1))で構成されており、28人の患者は補助療法も受けていた。WES(hg19にアライメントされた)試料とRNA-seq試料とはどちらも、最初の100人の患者に関するTRACERx研究から取得した。これらの試料を処理するための方法は、以前に記載されている通りである(Jamal-Hanjani et al., 2017)。特にWES試料については、製造業者の指示に従って、Agilent Human All Exome V5キットのカスタムバージョンを使用してエクソーム捕捉を行った。
【0148】
TCGA LUAD及びLUSCコホート
TCGA LUAD及びLUSCコホートからのアライメントされたBAMファイル(hg38)を、ゲノムデータコモンズ(データセットID:phs000178.v10.p8)からダウンロードした。ASCAT(v2.4.2)を使用して試料純度及び倍数性呼び出しを生成し、TCGAデータの以前の解析(Middleton et al., 2020)から取得した。簡潔には、腫瘍と正常のペア試料(データセットID:phs000178.v10.p8)からのAffymetrix SNP6プロファイルを、PennCNVライブラリ(K. Wang et al., 2007)によって処理し、ASCATで処理する前にGC補正されたBAF及び対数比を取得した。白血球分画率及びCD8+分画率を含む免疫関連データは、Thorsson et al. 2018から獲得した。
【0149】
がん細胞株データ
Lopez et al., 2020に記載されているように、非T細胞由来の細胞株HCT116をIllumina HiSeq 2500で配列決定し、hg19を使用してbwa memとアライメントした。T細胞由来の細胞株は、アクセッション番号PRJNA523380の下でSequence Read Archive(SRA)からダウンロードしたGhandi et al. 2019に記載されているデータセットからのものとした。VDJ組換えを受けていないので前駆体T細胞急性リンパ芽球性白血病由来の細胞株が除外されることを保証して、T細胞由来の細胞株を選択した。このプロセスにより、JURKAT、HPB-ALL、PEERの3つの細胞株からのWESデータが選択された。マッチする生殖細胞系列試料なしでASCATを実行するのは難しいため、全ての細胞株の働き(cell line work)にナイーブTCRA T細胞分画率を使用した。
【0150】
直交免疫尺度:1.RNA-seqシグネチャ
TRACERxで計算されたTILスコアと最も強く相関することが以前に実証されている(Rosenthal et al., 2019)ので、Danaher et al.(Danaher et al., 2018)の方法を、RNA-seq尺度からT細胞含量を推定する主要な方法として使用した。TCRA T細胞分画率に対して試験された他のRNA-seqシグネチャは、Davoli法(Davoli, Uno, Wooten, & Elledge, 2017)、xCell(Aran, Hu, & Butte, 2017)、TIMER(Li et al., 2017)、及びEPIC(Racle, de Jonge, Baumgaertner, Speiser, & Gfeller, 2017)であった。
【0151】
直交免疫尺度:2.病理学TILスコア
Rosenthal et al.(Rosenthal et al., 2019)に以前に記載されているように、国際免疫腫瘍学バイオマーカワーキンググループ(International Immuno-Oncology Biomarker Working Group)によって開発された、国際的に確立されたガイドラインを使用した組織病理学スライド(Hendry et al., 2017)から、TILを推定した。簡潔には、腫瘍領域に対する間質領域の相対的な割合を、所与の腫瘍領域の病理学スライドから決定した。間質コンパートメントについてTILを報告した(=間質TILのパーセント)。間質TILのパーセントを決定するために使用した分母は、間質細胞の数(すなわち、単核炎症細胞核を表す総間質核の分画率)ではなく、間質組織の面積(すなわち、腫瘍間の間質面積全体に対して単核炎症細胞が占める面積)であった。本方法は、訓練を受けた病理学者の間で再現可能であることが実証されている(Denkert et al., 2016)。個人間の一致を行い、これは高い再現性を示した。国際免疫腫瘍学バイオマーカワーキンググループは、ヘマトキシリンエオシンスライド上での最適なTIL評価に関して病理学者を訓練するための、無料で利用できるトレーニングツールを開発している(www.tilsincancer.org)。
【0152】
実施例3-TRACERx100及びTCGA NSCLCコホートにおけるWES由来のTCRA T細胞分画率の予後予測値の評価
導入
TIL ExTRECTの潜在的な臨床的有用性を調べるために、本発明者らはまず、TCRA T細胞分画率がTRACERx100 NSCLCコホートにおいて予後予測因子であるかどうかを考察した。TRACERx100コホート内の試料からの組織病理学的H&Eスライドから推測されるTILレベルは、以前に無病生存率と関連付けられている(AbdulJabbar et al., 2020)。したがって、本発明者らは、本明細書に記載の新規のTCRA T細胞分画率を使用して同様の関連性を確認することができるかどうかを調べた。また、TCGAからのデータを使用して同様の調査を行った。
【0153】
最後に、本発明者らは、独自のアプローチを使用して、これらのコホート内のマッチした血液試料中のTCRA T細胞分画率を定量化した。
【0154】
結果
患者の腫瘍内の免疫コールド領域の数に応じて(≧2の免疫コールド領域。ここで、免疫コールド領域は、TCRA T細胞分画率≦0.1の領域として定義される)、TRACERx100 NSCLCコホート内の患者を2つの群に分けたところ、有意差が明らかになった。すなわち、観察された2つ以上の免疫コールド領域の存在は、無再発生存率の減少と関連していることが判明した(図12Aを参照、ログランク検定P=0.0068、HR=2.3)。≧2の免疫コールド領域という閾値は、専門知識に基づいて選択した(例えば、AbdulJabbar et al., 2020を参照)。組織学的特性によってコホートを分けると、この有意性は、主にLUAD患者に由来するが、LUSC患者の無再発生存率には有意性がないことが明らかになった(図12B、LUAD:P=0.0037、HR=4.1;図12C、LUSC:P=ns、HR=1.12を参照)。
【0155】
TRACERx100コホートにおけるこの結果は、TCRA T細胞分画率がLUAD患者の無再発生存率と有意な関連性を有することを示唆する。しかし、本発明者らが、TCGA LUADデータセット(表2)における全生存率もTCRA T細胞分画率に関連するかどうかを評価したところ、TCRA T細胞分画率<0.1を有する免疫コールド領域の定義に基づいて患者を2つのカテゴリーに分けたとき、有意な関係性は観察されなかった(図13、ログランク検定、P=nsを参照)。TCGAデータセットは単一領域であり、サンプリングバイアスを受け、均一にコールドの領域である腫瘍と単一のコールド領域である腫瘍とを有する患者を区別することができない。TRACERx100と比べたTCGAコホート内での有意性の欠如は、生存率を予測する際のマルチ領域免疫データの重要性を示唆する。
【0156】
腫瘍試料中のTCRA T細胞浸潤の推定に加えて、TIL ExTRECTは、TRACERx100コホートからのマッチした血液試料にも適用することができる。本発明者らは、マッチした血液試料が、それらとペアを成す対応する原発腫瘍試料よりも有意に高いTCRA T細胞分画率を有することを観察した(図14参照、ウィルコクソン検定P=0.0012、効果量=0.16)。しかし、この割合は、DNAを含む細胞の割合を反映し、したがって赤血球が考慮される場合、血液中のT細胞のこの割合がはるかに低くなることに留意すべきである。特に、腫瘍TCRA T細胞分画率は、マッチした血液と比較して腫瘍領域で一貫して低いわけではなかった。実際、実質的に半数未満の腫瘍領域(139/339)は、マッチした血液よりも高いTCRA T細胞分画率を腫瘍領域内に含んでいた。これを領域レベルではなく患者レベルで要約すると、44人の患者は、全ての領域で、マッチした血液試料よりもスコアが低く、24人の患者は、全ての領域で、マッチした血液試料よりもスコアが高く、残りの32人は不均一であった。本発明者らはまた、腫瘍TCRA T細胞分画率が、LUADとLUSC(LUAD:ρ=0.39、P=1.2e-07、LUSC:ρ=0.45、P=7.8e-07、図15を参照)との両方において血液TCRA T細胞分画率と有意に関連していることを観察した(TRACERx100データを使用。データのマルチ領域性により、1つの血液試料が複数の腫瘍領域にマッチされる)。これは、血液中のTCRA T細胞分画率と、同じ患者からの腫瘍とが関連していることを示唆する。
【0157】
本発明者らは、TRACERx100コホートを組織学的特性によって分けて、血中TCRA T細胞分画率が、LUSCと比較してLUAD患者において有意に高く、(図16A、左のプロットを参照。ウィルコクソン検定P=0.0053、効果量=0.29)、原発腫瘍試料も、LUSC腫瘍と比較してLUADにおいて同定されたTCRA T細胞分画率がより高い(図16A、右プロットを参照。ウィルコクソン検定、P=2.2e-12、効果量=0.42)ことを見出した。同様の結果がTCGA腫瘍でも観察され(図17A~Dを参照)、本発明者らは、試料タイプに応じた有意差も見出し、血液中で見られるTCRA T細胞分画率が原発腫瘍よりも高かった(図17A及びBを参照。ウィルコクソン検定、LUAD:P<2.2e-16、効果量=0.28、LUSC:P<2.2e-16、効果量=0.38)。これらの結果は、強い免疫応答を刺激する腫瘍が、血中を循環するより高いT細胞レベルをもたらす可能性があり、又は潜在的に、血中のT細胞レベルの上昇により腫瘍内でより強い免疫応答が生じる可能性があることを示唆する。
【0158】
血液試料中のTCRA T細胞分画率の変化を説明することができる因子をさらに調査するために、本発明者らは、性別及び年齢を含む患者の臨床的特徴を考察した。実際、加齢中のヒト免疫系にはかなりの性的二型性があり(Marquez et al., 2020)、CD8+T細胞含量の減少は、加齢と男性との両方に関連していることに注目した。TRACERx100コホートとTCGAコホートとの両方に関して、血液試料中のTCRA T細胞分画率に関して男性患者と女性患者との間に有意差があり、女性においてレベルの増加が見られた(TRACERx100:図18A、ウィルコクソン検定P=0.027、効果量=0.22。TCGA:図18B、ウィルコクソン検定、P=1.2e-5、効果量=0.12)。年齢の影響は比較的弱かった。TRACERx100コホートは、有意ではないわずかな負の傾向を示し(図18Cを参照:ρ=-0.091、P=0.37)、TCGAコホートは、弱いが有意な関連性を示した(図18Dを参照:ρ=-0.095、P=0.013)。
【0159】
さらなる解析において、本発明者らは、LUADとLUSCとを別々に解析し、腫瘍内に存在するコールド領域の数に基づいて患者を免疫ホット群とコールド群とのいずれかに分けた。ここでは、全ての腫瘍領域での平均TCRA T細胞分画率(0.081)に基づく単純な閾値を使用し、各閾値で使用されるコールド領域の数を超える腫瘍に解析を限定した。図16Cでの結果は、LUADについて、閾値で使用されるコールド領域の数を増加するにつれて、免疫ホット群とコールド群との間で生存率により大きな有意性が生じることを示している(LUAD:≧2コールド領域、HR=3.1、P=0.0063 ログランク検定、LUAD:≧3コールド領域、HR=7.3、P=0.00024 ログランク検定)。対照的に、LUSCについては、異なる閾値のいずれについても、免疫コールド群と免疫ホット群との間で生存率に有意差はなかった(図16C)。免疫ホット領域又はコールド領域に関する閾値として平均の代わりに中央値(0.074)を使用しても同様の結果が得られた(図16F)。
【0160】
また、単一領域TCGA LUADコホートにおいて、本発明者らは、ホット腫瘍とコールド腫瘍との間の閾値として平均(0.11)を使用して、ホット腫瘍とコールド腫瘍との間の生存率における有意性を見出した(全生存率(OS):HR=0.61、P=0.0043、無増悪生存率(PFS):HR=0.67、P=0.016。図17Fを参照)。OSとPFSとの両方について、同様の結果をもたらす様々な可能な閾値があった(図17H)。免疫ホット腫瘍及びコールド腫瘍を定義するために同じ閾値を使用すると、TCGA LUSCコホートにおけるOS又はPFSのいずれについても生存率との有意な関連性は見られなかった(図17I)。
【0161】
次いで、本発明者らは、Cox回帰モデルを使用して、TCRA T細胞分画率に関係する異なるマルチ領域スコアを使用する連続解析が、同様に生存率に関して予後予測可能であるかどうかを確かめた。本発明者らは、各患者について以下の4つのスコアを選択して研究した:1)全領域にわたる平均TCRA T細胞分画率(腫瘍での全体的なT細胞浸潤の指標となる)、2)全ての領域にわたる最小TCRA T細胞分画率、3)全ての領域にわたる最大TCRA T細胞分画率、及び4)最大領域のTCRA T細胞分画率を、最小領域のTCRA T細胞分画率の上位95%信頼区間(0又は非常に小さい数による除算を避けるため)で割った値として定義されるTCRA T細胞分画率の発散。このスコアは、最大及び最小のTCRA T細胞分画率を有する領域間の倍率差を表し、高い場合にはT細胞の発散/不均一性を示し、おそらく免疫回避を受けたサブクローンを示すことがある。相対領域免疫回避スコアは最小スコアと最大スコアとによって決定されるので、本発明者らは、これらのスコアの両方を含むCoxモデルも構築した。この解析の結果は、図16D及び17Gに要約されている最低のTCRAスコア32を有する腫瘍領域の重要性と一貫性を保って、腫瘍領域にわたる最小TCRA分画率は、TRACERxコホート全体で予後予測因子であった(HR=0.52、P=0.048)。しかし、平均及び最大TCRA T細胞分画率はいずれのグループでも有意ではなかった。TCRA T細胞分画率発散スコアは、LUADで有意であった(HR=2.2、P=0.023 ログランク検定)。最小TCRAスコアと最大TCRAスコアとの両方を含むモデルは、コホート全体(最小:HR=0.5、P=0.005、最大:HR=1.5、P=0.061)とLUADサブセット(最小:HR=0.36、P=0.016、最大:HR=2.52、P=0.029)との両方で有意であった(図16Dを参照)。これは、TCRA T細胞分画率の不均一性を考察するときに、予測可能性が追加されることを示唆する。LUSCでは有意なTCRA関連スコアがなく、最大TCRA T細胞分画率は、最小と組み合わせて、LUADでのみ有意であった。
【0162】
最小及び最大TCRA T細胞分画率を、腫瘍ステージ、性別、及び年齢などの他の臨床表現型と組み合わせたとき、最小TCRA T細胞分画率は依然として有意であった(HR=0.52、P=0.022、図16Eを参照)。全生存率(OS)と無増悪生存率(PFS)との両方について単一領域TCGA生存率データを調べると、単変量Coxモデルでは、TCRA T細胞分画率はどの比較においても有意ではなく、最も近い関連性はOSモデルでのTCGA LUADであった(HR=0.85、P=0.069)。
【0163】
総合して、このデータは、TCRA T細胞がLUAD患者の生存率に関して予後予測因子であることを示唆していると本発明者らは考える。特に、本発明者らは、TRACERx100コホートでは、その小さいサイズにもかかわらず、より強い全体的なシグナルが見られることに注目した。これは、マルチ領域データによって明らかにされる腫瘍内の免疫不均一性の重要性を示す。
【0164】
方法
実施例1~2を参照。
【0165】
患者のマルチサンプル腫瘍コホート
TRACERxコホートを、Watkinsらによって最近提示されたコホートのサブセットと組み合わせることによって、マルチサンプル汎がんコホート(表5を参照)を作成した。腫瘍は、TIL ExTRECTを使用してTCRA T細胞分画率を計算することができる原発腫瘍内に配列決定された少なくとも2つの領域を有する場合に含まれた。したがって、最終的なコホートは、これらの患者についてやはり配列決定された任意の転移試料の追加を含むマルチ領域の原発腫瘍データセットからなっていた。
【0166】
【表4】
【0167】
TRACERx100に加えて、以下のデータセットを、最終的なマルチサンプル汎がんコホートに結合した。
1.Brastianos et al.-異なる組織型に由来する脳転移の研究に焦点を当てたコホート。このコホートから、マルチ領域の原発(primary)試料を含む腫瘍のみが含まれた。
2.Gerlinger et al.-明細胞腎がん(KIRC)患者のマルチサンプル原発コホート(primary cohort)。
3.Harbst et al.-皮膚悪性黒色腫(SKCM)患者のマルチ領域の原発コホート。
4.Lamy et al.-膀胱がん患者(BLCA)のマルチ領域の原発コホート。
5.Savas et al.-ER+及びトリプルネガティブ乳がん患者(BRCA ER+及びTNBC)の複数試料コホート。
6.Suzuki et al.-神経膠腫のマルチ領域の原発コホート。
7.Turajlic et al.-明細胞腎がん(KIRC)、腎乳頭がん(KIRP)、及び嫌色素性腎がん(KICH)患者のマルチ領域の原発コホート。
8.Messaudene et al.-HER2+及びER+乳がん患者のマルチ領域の原発コホート。
【0168】
様々なデータセットにおけるマルチ領域配列決定のためのサブ領域の選択
全てのマルチ領域コホートにおいて、2つの主な基準を念頭に置いて様々な方法(関連の文献を参照)によって領域を選択した。第1の基準は、ゲノム解析という主目的のために、高品質の突然変異及びコピー数解析を保証するために、間質を犠牲にして腫瘍含量を最大化することであり、第2の基準は、各領域が腫瘍の物理的に個別の及び離散した部分を表すことである。これらが別個の位置にない場合には、異なる手段を使用した。例えば、TRACERx100コホートでは、配列決定された領域は、最小で3mmの間隔であった。
【0169】
実施例4-TCRA T細胞分画率が、免疫チェックポイント遮断に対する応答を予測可能である
導入
TCRA T細胞分画率が臨床的に有用であり得る研究領域をさらに調べるために、本発明者らは、CPI1000+コホートからのデータ(Litchfield et al, 2020)を使用して、免疫チェックポイント遮断に対する応答を予測するためにTCRA T細胞分画率を利用することができるかどうかを評価した。
【0170】
結果
CPI1000+コホート(Litchfield et al, 2020)マルチ研究データセットは、8つの主要ながん種にわたって抗CTL4療法又は抗PDL1療法のいずれかを受けたCPI(チェックポイント阻害薬)治療後の1070個の腫瘍からなる(図19及び表3を参照)。応答は、患者が完全奏効(CR)又は部分奏効(PR)を伴う放射線学的応答を示すこととして定義し、一方、非応答群は、RECIST基準による安定疾患(SD)又は進行性疾患(PD)として定義した。表3は、WESデータとRNA-seqデータとの両方を含む腫瘍のパーセンテージを詳細に示す。
【0171】
【表5】
【0172】
CPIに対する応答を予測する際の腫瘍TCRA T細胞分画率の重要性と一貫性を保って、本発明者らは、コホート全体にわたって応答群と非応答群との間のTCRA T細胞分画率の有意差を観察した(図20を参照、P=2.3e-7、効果量=0.17)。応答群に関する腫瘍DNA試料中のTCRA T細胞分画率の中央値は0.053(Q1=0、Q3=0.17)であり、一方、非応答群では0.000268(Q1=0、Q3=0.084)であった。免疫コールド腫瘍(ここでは、<0.1のTCRA T細胞分画率を有する腫瘍として定義される)に関しては、非応答群において非常に有意に高かった(図21、免疫コールド腫瘍は点線よりも下の腫瘍、78%対63%、Fisherの正確な検定、オッズ比(OR)=0.47、P=2.25e-06)。
【0173】
変異負荷(高:総クローン性TMB≧68、低:クローン性TMB<68)と免疫微小環境(ホット:TCRA T細胞分画率≧0.016、コールド:TCRA T細胞分画率<0.016)との両方によってコホートを分けると、TCRA T細胞分画率と応答との関連性は、変異負荷とは無関係であることが分かる(図21を参照)。低い変異負荷の患者では、免疫ホット腫瘍の応答率は21%であるのに対し、免疫コールド腫瘍の応答率は8%である。高い変異負荷の腫瘍では、腫瘍が免疫ホットの場合には45%の応答率であり、コールドの場合には30%の応答率である。
【0174】
RNA-seqベースの測定と比較したTCRA T細胞分画率の有用性をさらに評価するために、RNA-seqとTCRA T細胞分画率との両方を有する個々のがん種に由来する10個よりも多い試料を用いた全ての研究を、単変量メタ解析のために選択した(図22を参照。7つの研究及び5つのがん種にわたる557人の患者)。予想通り、TCRA T細胞分画率(オッズ比(OR)=1.39、P=0.00858)、クローン性TMB(OR=1.59、P=6.021e-05)、及びCD8A発現(OR=1.45、P=0.0004479)は全て、応答と有意に関連することが分かった。血液からのTCRA T細胞分画率も腫瘍純度も、応答と有意な関連性は見られず、腫瘍と血液のTCRA T細胞分画率の差は有意傾向があった(OR=1.27、P=0.016)。
【0175】
次いで、本発明者らは、腫瘍TCRA T細胞分画率がTMB(腫瘍変異負荷)に勝る追加の臨床的有用性を提供するかどうか、さらにそれがCD8A発現などのRNA-seq尺度よりも大きく応答の予測を改善するかどうかを評価した。本発明者らは、患者が応答群であるか非応答群であるかを予測するために4つの一般化線形モデル(GLM)を作成した。第1のモデルは、クローン性TMBのみからなり、第2及び第3のモデルは、クローン性TMBをCD8A RNA-seq発現又はTCRA T細胞分画率と組み合わせて使用した。第4のモデルは、CD8A発現及びTCRA T細胞分画率の両方と組み合わせたクローン性TMBを使用した。CD8A発現又はTCRAのいずれかを使用すると、モデルの予測値が改善された(図23を参照。クローン性TMB単独の場合の0.62と比較して、CD8A発現ではAUC=0.66、TCRA T細胞分画率ではAUC=0.70)。しかし、これらのうち、クローン性TMB+TCRA T細胞分画率に関するモデル(ROC検定、P=0.0028、GLM:クローン性TMB+TCRA、AUC=0.68、GLM:クローン性TMB、AUC=0.62)のみが、クローン性TMB単独と比較して有意であった。TCRA T細胞分画率をCD8A発現と組み合わせても、モデルの予測値を有意に増加させることはできなかった(図23を参照。クローン性TMB+TCRAモデルP=0.72に対して、AUC=0.68、ROC検定)。しかし、4つのモデル全ての変数の有意性を調べると、TCRA T細胞分画率はCD8Aよりも有意であり(GLM:クローン性TMB+TCRA、P=4.62e-05;GLM:クローン性TMB+CD8A、P=0.000431)、単一モデルに結合されるとき、TCRA T細胞分画率は依然として有意であったが、CD8A発現は有意でなかった(TCRA、P=0.00601、CD8A、P=0.06246)。
【0176】
まとめると、これらの結果は、腫瘍TCRA T細胞分画率をCD8+浸潤のRNA-seq尺度の代替として使用することができ、さらに、WESベースのTCRA T細胞分画率推定がTMB推定量に予後予測値を追加することを示唆する。
【0177】
多くの場合にはRNA-seqが利用可能でないことを考慮して、本発明者らは次に、複合NSCLC CPIコホートにおけるTCRA T細胞分画率の予測可能性を評価した(表4を参照)。図24Aは、WESでアッセイされた266人の患者を含むこのコホートの概要を提供し、重要なことに、RNA-seq又は他の直交免疫尺度を含んでいない。単変量解析を実行したこの肺CPIコホートの解析(図24Bを参照)から、TCRA T細胞分画率(OR=1.44、P=0.005)及び血液TCRA T細胞分画率(OR=1.39、P=0.0015)は、CPIに対する応答と有意に関連することが分かった。個々の研究については、TCRA T細胞分画率が、HellmanコホートとShimコホートとの両方でOR>1を有していたが、Rizviコホートでは有さず、対照的に、血液TCRAは、3つの個別の研究全てでOR>1を有していた。これらの結果は、TCRA T細胞分画率をWESデータのみから計算することができること、並びにNSCLC及びマッチした血液からのそのような推定量が免疫療法に対する応答の予測因子であることを示す。
【0178】
【表6】
【0179】
方法
実施例1~2を参照。
【0180】
CPI1000+コホートのメタ解析
CPI1000+コホートは、Litchfield et al. (2020)に詳細に述べられており、以下のデータセットを含む。
1.Snyder et al.(Snyder et al., 2014)、進行性悪性黒色腫の抗CTLA-4治療後のコホート。
2.Van Allen et al.(Van Allen et al., 2016)、進行性悪性黒色腫の抗CTLA-4治療後のコホート。
3.Hugo et al.(Hugo et al., 2016)、進行性悪性黒色腫の抗PD-1治療後のコホート。
4.Riaz et al.(Riaz et al., 2017)、進行性悪性黒色腫の抗PD-1治療後のコホート。
5.Cristescu et al.(Cristescu et al., 2018)、進行性悪性黒色腫の抗PD-1治療後のコホート。
6.Cristescu et al.(Cristescu et al., 2018)、進行性頭頸部がんの抗PD-1治療後のコホート。
7.Cristescu et al.(Cristescu et al., 2018)、抗PD-1で治療後の「他の全ての腫瘍タイプ」のコホート(KEYNOTE-028及びKEYNOTE-012研究から)。
8.Snyder et al.(Snyder et al., 2017)、転移性尿路上皮がんの抗PD-L1治療後のコホート。
9.Mariathasan et al.(Mariathasan et al., 2018)、転移性尿路上皮がんの抗PD-L1治療後のコホート。
10.McDermot et al.(McDermott etal., 2018)、転移性腎細胞がんの抗PD-L1治療後のコホート。
11.Rizvi et al.(Rizvi et al., 2015)、非小細胞肺がんの抗PD-1治療後のコホート。
12.Hellman et al.、Litchfield et al., 2020によって使用された抗PD-1治療後の非小細胞肺がん試料のコホート。
13.Le et al.(Le et al., 2015)、抗PD-1療法での治療後の大腸がんコホート。
【0181】
これらの研究のうち、Snyder et al.(Snyder et al., 2017)は、TCRA遺伝子内のカバレッジが非常に不良であったため、解析から除外した。全ての試料を、純度及びコピー数データを有するbwa mem(v0.7.15)を使用してhg19にアライメントし、Litchfield et al. (2020)に記載されているようにASCATから計算した。特に、1008/1125(90%)の試料がWESデータを有し、941/1125(83%)の試料が、コピー数計算を可能にするのに十分な純度及びカバレッジを有し、TCRA T細胞分画率を計算できるようにした。これらの試料のうち833/1125(74%)は、マッチしたRNA-seqデータを有し、T細胞推定量の直交評価が可能であった。このデータセットの拡張に関して(Shim et al.(Shim etal., 2020))、NSCLC抗PD-1治療後のコホートを特異的NSCLC解析のために追加した。
【0182】
CPI応答に関する単変量及び多変量モデル
単変量モデルでは、Litchfield et al. (2020)からの適応された手順に従った。主な違いは、完全なデータ(CD8A、クローン性TMB、及びTCRA T細胞分画率に関するRNA-seq)を有する試料のみを含めたことである。単変量モデルのメタ解析は、Rパッケージ「meta」(バージョン4.13-0)を使用して行った。多変量モデルは、デフォルト値を使用する「stats」Rパッケージからの関数「glm」を使用して、一般化線形モデルで作成した。ROC曲線解析のためにRパッケージ「ROCR」(バージョン1.0-11)を使用した。
【0183】
実施例5-血液、正常組織、及び悪性組織中のTCRA T細胞分画率の決定因子
以前の解析は必然的に腫瘍組織内のT細胞浸潤に焦点を当てているが、本明細書に記載のTIL ExTRECT法は、WESを受けた任意の試料中のT細胞浸潤を調べる機会を提供する。したがって、本実施例では、本発明者らは、様々な試料タイプでのT細胞免疫浸潤の主要な決定因子を評価するための解析を行った。
【0184】
結果
本発明者らはまず、腫瘍解析のための正常対照として採取された血液中のT細胞浸潤の程度を調べた。TRACERx100コホート内では、血液中のTCRA T細胞分画率は男性に比べて女性で有意に高く、腫瘍試料TCRA T細胞分画率と血液TCRA T細胞分画率との間に有意な正の関係が観察された(図16B、組織学的特性:P=0.066、ES=0.19;性別:P=0.0057、ES=0.28;平均腫瘍浸潤:ρ=0.42、P=1.7e-05)。これらのデータは、腫瘍免疫浸潤が、循環する血液中のT細胞レベルに影響を及ぼす可能性があることを示唆する。性別及び平均腫瘍浸潤は、TCRA T細胞分画率の有意な単変量予測子であり、喫煙状況、年齢、組織学的特性を加味する血中TCRA T細胞分画率を予測する線形モデルでも依然として有意であった。対照的に、多変量モデルでは、LUAD患者とLUSC患者との間で血液中のT細胞浸潤に有意差は観察されなかった。本発明者らはまた、TCGA LUAD及びLUSCコホートから採取したマッチした血液試料を解析し、血液中のTCRA T細胞分画率を予測する線形モデルにおいて性別及び腫瘍組織学的特性が強い関連性を示すという同様の結果を見出した(図17E)。
【0185】
次いで、本発明者らは、上で及び表2で述べたように、TCGAからのより低いカバレッジを有する独立したNSCLCデータセットでT細胞ExTRECTを評価した。LUAD及びLUSC TCGA患者からの血液試料で、広く一貫した結果が観察された(図17E)。
【0186】
血液でのT細胞浸潤に影響を及ぼし得る別の因子は、体内の他の場所でのウイルス又は細菌感染の存在である。この仮説を調べるために、本発明者らは、Poore et al.に提示されたデータを使用し、バイオインフォマティクスツールKRAKENを使用して、LUAD及びLUSC TCGAコホートからのWGS血液試料及びRNA-seq腫瘍試料からのマイクロバイオームリードの数を定量化した。本発明者らは、微生物リード数が多い血液試料(中央値6.81より大きい)が、数が少ない群よりも有意に高い血中TCRA T細胞分画率を有することを観察した(図27A、P=0.00092、ES=0.31、ウィルコクソン検定)。対照的に、総微生物リード数と腫瘍TCRA T細胞分画率との間に関連性は観察されなかった。これは、ウイルス又は細菌の存在ががんで見られるT細胞分画率のレベルを引き上げないことを示唆する(図27B、P=n.s)。次いで、本発明者らは、個々の種のレベルで、TCRA T細胞分画率に関連するウイルス又は細菌が存在するかどうかを検査した(「方法」を参照)。血液試料について複数の仮説を調整した後でも、有意な関連性はなかった。腫瘍試料については、LUAD腫瘍とLUSC腫瘍とに関し、それぞれウィリアムシア属(genus Williamsia)及びパエニクロストリジウム属(genus Paeniclostridium)の細菌について1件のヒットがあった(図27C及び28G、LUADでのウィリアムシア(Williamsia):ρ=-0.17、P=0.00011、FDR P=0.013、図27D及び28G、LUSCでのパエニクロストリジウム(Paeniclostridium):ρ=-0.2、P=0.00013、FDR P=0.015)。しかし、これらはどちらも、TCRA T細胞分画率がより低い場合、正規化されたlog-cpm値が高い数値であった。これは、これらの細菌種の存在がT細胞浸潤の増加をもたらさないことがあり、免疫コールド腫瘍微小環境を利用する日和見種であり得ることを示唆する。
【0187】
血中TCRA T細胞分画率の重要な決定因子をさらに理解するために、本発明者らは、血液と生理学的に正常な食道上皮(PNE)組織との両方に由来するWES配列決定試料を調べた。特に、本発明者らは、Yokyama et al.に記載されているように、生理学的に正常な食道上皮(PNE)組織に由来する顕微解剖されたWES配列決定試料を含むデータセットを検査した。ここで、血液試料中で広範なTCRA T細胞分画率が計算されたが、PNE組織の大部分は、検出可能なT細胞浸潤を有さなかった(図28A図28H)。参加者をPNE試料中のT細胞浸潤の有無に応じて分けると、血中TCRA T細胞分画率との有意な関連性が明らかになり(図28B、P=0.021、ES=0.29)、ここでも腫瘍試料と同様に、正常組織での高レベルのT細胞浸潤が、血液中で見られるTCRA T細胞分画率に影響を及ぼすことが示された。血液中のT細胞分画率を予測する線形モデルでは、正常組織での浸潤レベルのみが有意に独立して予測因子であった(図28C)。別個の線形モデルでは、正常組織変異負荷又はがんドライバ変異状態などのゲノム因子は、PNE組織でのT細胞浸潤の予測因子でないことが分かった(図28F)。これは、検出されたT細胞浸潤が、進行中の免疫監視によるものではなく、微生物感染の存在によるものであり得ることを示唆する。
【0188】
腫瘍組織でのT細胞浸潤に影響を及ぼす因子をさらに評価するために、本発明者らは、最近発表された複数試料データの汎がんコホート(Watkins et al.)を利用し、同じ腫瘍の異なる領域が異なるレベルの免疫浸潤を示し得る程度、及びこの相違に関してゲノム塩基を同定することができるかどうかを調査した。本発明者らは、合計で、14のがん種の182の腫瘍から、739の腫瘍領域でのT細胞浸潤を評価することができた(表5を参照)。
【0189】
コホートにわたって様々なT細胞浸潤が観察された(図29A、範囲0~58%)。興味深いことに、配列決定された細胞を51%含む3番目に高いスコアは、患者RMH002からのKIRC腫瘍の単一領域内のT細胞を表すことが判明した。特に、患者RMH002は、腎摘出術前に抗血管新生薬スニチニブで14週間治療されており、スニチニブ治療は、KIRC腫瘍でのT細胞浸潤を増加させることが示されている(Haywood et al.)。腫瘍内のT細胞湿潤の多様性の程度を定量化するために、本発明者らは、計算されたTCRA T細胞分画率が全ての領域にわたって均一にホットであるかどうか(本明細書では、全ての領域で、コホート内の平均TCRA T細胞分画率が≧0.11であると定義する)、均一にコールドであるかどうか(全ての領域で<0.11であると定義する)、又はT細胞分画率が不均一であるかどうかに基づいて、各腫瘍を3つのカテゴリーのうちの1つに分類した。がん種によって評価された、均一にホット、均一にコールド、及び不均一な免疫浸潤を有する腫瘍の割合には有意差があり(図29B、カイ自乗検定:P=1.62e-07)、BRCA ER+腫瘍が最も不均一であり(83%)、LUSC腫瘍が最小の不均一性であった(22%)。また、免疫浸潤の程度、及びがん種にわたる異なる免疫群のカテゴリー「均一にホット」、「均一にコールド」、又は「不均一」の割合にも明らかな差があった。例えば、BLCAとLUSCとは同程度の数の不均一な腫瘍を含んでいたが(36%対37%)、BLCA腫瘍の約64%が均一にホットであり、0%が均一にコールドであった。一方、LUADでは、37%の腫瘍が均一にコールドであり、25%が均一にホットであった。これは、特定のがん種、とりわけBRCA ER+、BRCA HER+、LUAD、及びKIRCに関して、非常に局所的な免疫浸潤が存在し、かなりのサンプリングバイアスを受ける可能性があることを示唆する。
【0190】
次に、本発明者らは、ゲノム多様性と免疫多様性との間に関係があるかどうかを検査し、単一の腫瘍内で不均一な免疫応答をもたらし得る潜在的なメカニズムとして、サブクローン性SCNAの不均一性を調査した。本発明者らはまず、少なくとも3つの試料と、T細胞分画率の不均一な混合とを含む腫瘍に解析を限定した(「方法」を参照)。任意の2つの領域間でのペアワイズSCNA不均一性を、いずれかの領域に一意のSCNAを有するゲノムの割合の合計として計算した。図29Cは、ペアワイズ解析により、腫瘍内でTCRA T細胞分画率のより大きな差を有する領域のペア(≧全てのペアワイズ距離の平均0.065)が、より高いレベルのペアワイズSCNA不均一性を有する可能性がより高いことを示す(全ての事象:P=0.00021、効果量=0.352;利得事象:P=0.0045、効果量=0.324;損失又はLOH事象:P=0.024、効果量=0.257、n=77)。
【0191】
次に、任意の特定のサブクローンSCNA事象が免疫欠失又は活性化と関連しているかどうかを調べるために、本発明者らは、全汎がんの複数試料コホートでの30を超える腫瘍においてサブクローン性で損失又は利得を受けたサイトバンド領域を特定し(図29D)、これらの損失又は利得事象がTCRA T細胞分画率の変化と関連しているかどうかを試験した。1つのサイトバンドレベル事象のみ、すなわち12q24.31-32のサブクローン性損失のみが、TCRA T細胞分画率の減少と有意に関連することが分かった(図29E:P=1.3e-05、効果量=0.735)。
【0192】
この効果が単一の遺伝子によるものであるかどうかを決定するために、本発明者らは、TRACERx100コホート内で12q24.31-32のサブクローン性損失を有する腫瘍を選択し、関連するRNA-seqデータに対して差次的遺伝子発現解析を実行した。16168個の遺伝子を試験した後、複数試験補正後に以下の8個のみが有意に残った:SPPL3、C12orf76、LYRM9、CIT、UBE3B、ABCB9、OGFOD2、及びUSP30(図29F)。特に、SPPL3は、最も有意な遺伝子であり、ABCB9及びOGFOD2と共に12q24.31に位置する。SPPL3は、細胞表面のスフィンゴ糖脂質を上方制御するB3GNT5酵素活性を増強し、それによりクラスI HLA機能を妨げ、CD8+T細胞活性化を低下させることが最近判明している(Jongsma et al.)。したがって、これらのデータは、12q24.31のサブクローン性損失が、免疫回避のメカニズムとして、がん種にわたる腫瘍の進展(コホート内の腫瘍の18.7%又は34/182で生じる)の際に選択され得ることを示唆する。
【0193】
方法
実施例1~4を参照。
【0194】
KRAKEN TCGA解析
Poore et al.によって行われたKRAKEN(Wood & Salzberg)解析から出力された前処理されたマイクロバイオームデータを、ftp://ftp.microbio.me/pub/cancer_microbiome_analysis/からダウンロードした。
【0195】
血液試料と腫瘍試料との両方に関する高及び低KRAKENマイクロバイオーム群を作成するために、正規化されたlog-cpm値を含むファイルKraken-TCGA-Voom-SNM-Most-Stringent-Filtering-Data.csvをダウンロードし、各試料ごとに行を加算し、全体的な「マイクロバイオーム」スコアを得た。次いで、このスコアの中央値に基づいて、試料を高群と低群に分けた。
【0196】
TCRA T細胞分画率に影響を及ぼす任意の個々の微生物種の役割を調査するために、生データファイルKraken-TCGA-Raw-Data-17625-Samples.csvから呼び出されるTCGA LUAD及びLUSCコホートにおいて合計で1000個未満の生のリードを有する全ての種を除去することによって、Kraken-TCGA-Voom-SNM-Most-Stringent-Filtering-Data.csvファイルからの種の縮小リストを選択した。これにより合計で59の微生物種が残り、これらを、LUADとLUSCの両方での血液及び腫瘍試料に関してSpearmanの相関を使用して、TCRA T細胞分画率との関連性について個別に検査した。
【0197】
汎がんの複数試料コホートにおける利得、損失、及びLOH事象の特定
全エクソーム配列決定の解析を、Jamal-Hanjani et al.に以前に記載されているように行った。各試料ごとのコピー数セグメンテーション、腫瘍純度、及び倍数性を、以前に記載されているように(Jamal-Hanjani et al.)、ASCAT(Van Loo et al.)を使用して推定した。これらのデータを複数試料SCNA推定アプローチへの入力として使用して、ヘテロ接合性の損失の存在、並びに試料の倍数性に対する損失、中立、利得、及び増幅コピー数状態について、ゲノム全体の推定量を生成した。腫瘍の全ての試料で≧5の対数比値を有する各コピー数セグメントに存在する対数比値を、P<0.01の閾値を有する片側t検定を使用して、試料倍数調整した3つの対数比閾値と比較して検査した。これらの対数比閾値は、二倍体腫瘍において、損失の場合には<log2[1.5/2]、利得の場合には>log2[2.5/2]に相当した。損失又は利得として分類されなかったセグメントは中立として分類した。各セグメントについて、倍数性の定義に対するこれらの値を、単一の腫瘍からの全ての試料にわたるヘテロ接合性検出の損失と組み合わせた。
【0198】
ペアワイズサブクローン性SCNAスコア
ペアワイズサブクローン性SCNA尺度を計算するために、前の方法セクションで概説した分類を使用して、ペアワイズサブクローン性SCNAスコアの3つの群を作成した。まず、本発明者らは、倍数性又はLOHに対する利得又は損失のいずれかによって影響を及ぼされるセグメントを異常とみなし、単一患者の疾患からの領域の各ペアを比較し、両方の試料で異常である場合には異常領域をクローン性として分類し、一方のみの試料で異常である場合にはサブクローン性として分類した。これと同じプロセスを、倍数性に対する利得に関してのみ繰り返し、次いで倍数性及びLOHに対する損失を合わせて検討した。
【0199】
サイトバンドレベルSCNA解析
腫瘍間での比較を可能にするために、セグメントをhg19サイトバンドにマッピングした。複数のセグメントがサイトバンドにマッピングされる場合、サイトバンドとの最大の重複を有するセグメントのSCNA状態(倍数性に対する利得又は損失)を選択した。SCNA利得及び損失解析に関して、サイトバンドレベル事象がコホート全体にわたって30回を超えてサブクローン性で発生した場合、それらを選択した。次いで、同じ領域内でこの閾値を通るバンド(例えば、1p36上の全てのサイトバンド)を共にグループ化した。対応のあるウィルコクソン検定を使用して、サブクローン性SCNA事象を有する単一患者内の腫瘍領域が、事象のない領域に対してTCRA T細胞分画率の有意差を有するかどうかを評価した。
【0200】
不均一な免疫浸潤を有する複数試料腫瘍の選択
腫瘍を含めるには、少なくとも3つの領域が配列決定されており、以下の2つの要件を満たさなければならなかった。1)TCRA T細胞分画率の差が≧0.1であると定義される免疫浸潤の大きな変化を有する1対の領域を有すること、及び2)TCRA T細胞分画率の差が0.1未満であると定義される免疫浸潤の小さな変化を有する又は変化が全くない1対の領域を有すること。この要件に合う腫瘍の一例は、それぞれ0.01、0.01、及び0.2のTCRA T細胞分画率を有する3つの領域R1、R2、及びR3を有する腫瘍である。R1-R2ペアは、TCRA T細胞分画率の差が0であり、R1-R3ペアとR2-R3ペアとはどちらも大きな差0.19を有する。マルチサンプル腫瘍コホート内で、58人の患者がこれらの基準に合致した。
【0201】
サブクローン性12q24.31-32損失を有する患者に関するRNA-seq差次的遺伝子発現解析
サブクローン性12q24.31-32損失を有するTRACERx100 RNA-seq患者に対して、差次的遺伝子発現解析を行った。R4.0.0を使用して、最初にedgeRRパッケージ(バージョン3.32.1)を、試料固有のTMM(M値のトリム平均)正規化に使用し、次いで、標準のedgeRフィルタリング法を使用して、低い発現を有する遺伝子をフィルタ除去し、その後、limmaRパッケージ(バージョン3.46.0)からのLimma-Voom法を使用してVoomフィットを計算し、遺伝子発現差に関するp値を取得した。阻害因子及びp値として、患者及び組織学的特徴に関して加味される比較が、複数の試験についてFDR補正された。次いで、R EnhancedVolcanoパッケージ(バージョン1.8.0)を用いて結果を視覚化した。
【0202】
実施例6-WGSデータからの試料中のT細胞分画率の推定、B細胞分画率の推定、及び免疫クロノタイプの調査
導入
実施例1に記載し、実施例2~5で例示したアプローチは、全ゲノム配列データが利用可能な場合、αβT細胞以外の免疫細胞コンパートメントが対象である場合、及び/又は例えばクロノタイプを調査するために特定のV及びJセグメントの使用が対象である場合など、さらなる状況を調査するために使用することができる。本実施例では、本発明者らは、WGSデータに関して実施例1で述べた一般的なアプローチの実装を実証する。WESデータとWGSデータとの両方を含むTRACERx100コホートのサブセットを利用することによって、本発明者らは、WESデータでの使用とWGSデータでの使用との間で高い一致性を示す方法のWGSバージョンを検証した。さらに、本発明者らは、WGS試料内のより大きいカバレッジを利用して、V(D)J組換えの性質を考慮に入れるリード深度比のモデリングに関する代替モデル(セグメントモデル)を提供する。本発明者らは、直交RNA-seqデータを使用して、スコアが免疫微小環境を正確に描写していることを示し、ダウンサンプリングを使用して、本方法が2倍の深度まで正確であることを示す。次いで、本発明者らは、このアプローチを使用して、γδT細胞の分画率並びにTCR及びBCRの多様性を調査することができることも示す。最後に、本発明者らは、大きな汎がんコホートでの生存率を研究するための本方法の使用も実証する(データは図示せず)。
【0203】
結果
全エクソーム配列決定(WES)とは異なり、WGSは、ゲノム全体にわたるカバレッジを含む。コピー数変化を推定する文脈において、これは、以下のようないくつかの重要な進歩をもたらす。1)均一なカバレッジにより、コピー数切断点の位置の正確な特定が可能になる、及び2)GC含量による偏り、又は参照対立遺伝子の偏りなどの偏りが少なくなる。したがって、本発明者らは、WGSに適用された実施例1に記載のT細胞ExTRECT法が、より低い深度においてより高い精度でT細胞分画率を推定することができる可能性を有すると推論した。さらに、(上述したTCRAに加えて)他の6つの遺伝子TCRD、TCRG、TCRB、IGH、IGK、及びIGLもV(D)J組換えを受け、同様に定量化することができる可能性があり、場合により、試料内のαβ及びγδT細胞コンパートメント並びにB細胞の推定を可能にする。多くのWGSデータセットには付随する免疫データが欠けているため、これは特に有益である。本明細書に記載の方法は、追加のデータを必要とせずに、任意のWGS試料の試料の包括的な免疫プロファイルを提供することができる。
【0204】
上述した方法は、WES捕捉キットからのエクソンセグメントの代わりに1000bpウィンドウにGC補正及び品質管理を適用し、近くの領域よりもはるかに高い又は低いリード深度を有するという点で外れ値であるというエビデンスが取れた任意の100bpゲノムウィンドウを特定するために追加の品質管理を適用することによって、WGSに適応させた(詳細については「方法」を参照のこと)。この適応された方法(「適応GAM」と呼ぶ)の概要が図30に与えられている。さらに、本発明者らは、限局性領域及び正規化領域に関して異なるゲノム遺伝子座を選択することによって、同じWGS法をTCRB、TCRG、及びIGHに適用することができた(使用したゲノム位置については表7を参照。図31に例としてCRUK0085T1-R3のプロットを示す)。この特定のデータセットは、IGL及びIGKに関する方法の例示には適していなかった。なぜなら、これらの遺伝子座内の配列アライメントの品質には大きな問題があり、おそらく、それらの高い複雑さ及び参照配列の品質により、均一で偏りのない形で短いリード配列をマッピングすることが困難であるからである。それにもかかわらず、例えばより高品質の参照配列を利用することによって、より高品質のアライメントが利用可能である場合、同じ方法をこれらの遺伝子座に適用可能である。同様に、TCRA内でのTCRDの遺伝子座のサイズが小さいため、本方法はTCRDに直接は適用されなかった。しかし、以下に述べるセグメント使用ベースのアプローチは、TCRDセグメントを含むT細胞の分画率を推定することができた。
【0205】
WGSデータへの適用のベンチマーキング
WGSデータでの均一なカバレッジを利用するために、平滑な一般化線形モデル(GAM)に対する代替モデルを設計した。これは区分的制約付き線形モデルであり、切断点がV(D)J遺伝子座内のV及びJセグメントの既知の位置に強制的に配置される。この「セグメントモデル」は、方法及び図30で述べられており、GAMモデルに勝る以下の理論的利点を有する:1)実際のV(D)J組換え生物学に基づいている;2)個別のV及びJ遺伝子セグメントに関する個々の分画率を計算することができ、セグメント使用及びT又はB細胞受容体の多様性についての洞察が得られる、及び;3)TCRD特異的セグメントの分画率を、γδT細胞の指標として使用することができる。このモデルは、対象の領域にわたる十分なカバレッジを有する任意の配列決定データと共に使用することができる。特定のWESデータでは、使用される特定のエクソン捕捉キットが、対象の領域でのカバレッジに大きなギャップを有するので、このアプローチは(理論的には可能であるが)それほど有利ではなかった。しかし、他の捕捉データセットではそうではないこともある。
【0206】
マッチしたWES及びWGSが利用可能である322個のTRACERx100試料と直交RNAseqデータを含む126個のWGS試料とのセットでT及びB細胞の分画率を決定することによって、WGSデータに適用されたGAMモデルとセグメントモデルとの両方の精度を試験した。GAMモデルを使用してWES及びWGS TCRA T細胞分画率を比較して、本発明者らは、血液試料(ρ=0.71、P=4.7e-16、図32A)と腫瘍試料(ρ=0.72、P<2.2e-16、図32A)との両方において有意な相関を見出した。セグメントモデルを使用して、本発明者らは、GAMベースのWESスコアとの同様の有意な相関を見出した(血液:ρ=0.69、P=6.7e-15;腫瘍:ρ=0.7、P<2.2e-16、図32A)。しかし、どちらのモデルでも、WGS値は、T細胞分画率が低いほど高くなることが分かった。これは、WGSデータで可能な精度及び感度の向上によるものであり得る。これを裏付けるため、直交TRACERx100 RNAseqデータを検査すると、Danaher T細胞スコアとのより強い相関が、マッチしたWESスコアよりもWGSスコアで見られた(WES:ρ=0.64、P=1.6e-15、(Danaher T細胞スコア)=)1.9+8.3(ExTRECT T細胞分画率(WES))、WGS(GAM):ρ=0.82、P<2.2e-16、WGS(セグメントモデル):ρ=0.81、P<2.2e-16、図32B)。
【0207】
他の遺伝子座に関するアプローチの検証
マッチしたRNAseqデータから計算されたDanaherスコアを使用して、TCRB及びTCRGから計算されたT細胞分画率と、IGHから計算されたB細胞分画率との精度を直交的に検証した。T細胞Danaherスコアとの有意な相関が、TCRB(GAM:ρ=0.66、P<2.2e-16;セグメントモデル:ρ=0.81、P<2.2e-16、図32B)及びTCRG(GAM:ρ=0.64、P=3.1e-16、セグメントモデル:ρ=0.8、P<2.2e-16、図32C)に関して見られ、B細胞Danaherスコアとの有意な相関が、IGH(GAM:ρ=0.47、P=2.3e-8;セグメントモデル:ρ=0.44、P=2.1e-07、図32C)に関して見られた。セグメントモデルからのB細胞分画率スコアについては、B細胞分画率が高いがB細胞Danaherスコアが低いという明らかな外れ値の点がいくつかあった。これらのスコアは、セグメントモデルからの非常に低い対数尤度値を有する傾向があり、非常にノイズの多い試料及び低い適合性を示した。対数尤度<0を有する全ての試料を除去することにより、B細胞Danaherスコアとの相関が向上した(GAM:ρ=0.41、P=4.3e-06;セグメントモデル:ρ=0.6、P=5.1e-13)。全体として、これらの結果は、セグメントモデルが、GAMモデルからの対応する値よりもDanaherスコアとの強い関連性を有するスコアを生成することを示す。
【0208】
TCRA、TCRB、及びTCRGからの異なるT細胞分画率を比較すると、TCRB T細胞分画率はTCRA T細胞分画率と高い相関があったが、GAMモデルではその値は約半分であり(ρ=0.69、P<2.2e-16、y=0.00059+0.49x、図32E)、セグメントモデルでは半分をわずかに超えていた(ρ=0.91、P<2.2e-16、y=0.033+0.57x、図32F)。これはおそらく、TCRB対立遺伝子の1つだけが頻繁にV(D)J組換えを受ける対立遺伝子の除外に起因する。対照的に、TCRG T細胞分画率は、意外にも、典型的にはγδT細胞として特徴付けられるCD3+T細胞の1~5%よりも高く、TCRA T細胞分画率とも高い相関があることが分かった(GAM:ρ=0.71、P<2.2e-16、y=-0.028+0.71、図32E及びセグメントモデル:ρ=0.94、P<2.2e-16、y=0.005+x)。GAMモデルではTCRAと比較してTCRG分画率が0に近い試料の数が有意に多かったが(1.7%のTCRA T細胞分画率<1e-5に対して、32.8%のTCRG T細胞分画率<1e-5)、このシグナルが完全にγδT細胞によるものである場合には、試料の大部分での高い分画率、及びセグメントモデルにおける2つの間のほぼ正確な相関は生物学的に尤もらしくないと広く考えられる。代わりに、αβT細胞は、それらの最終的な系列を決定する前に最初にTCRG遺伝子座の再配列を受けることが知られており、セグメントモデルからの結果は、再配列されたTCRG遺伝子座を有することがαβT細胞のほぼ普遍的な特徴であり、TCRG遺伝子座は、T細胞分画率の正確な尺度を提供することができることを示唆する。
【0209】
TCRD遺伝子座は、TCRA遺伝子座内に完全に位置し、大量のノイズがあるため、利用可能なデータを含むGAMモデルを使用してγδT細胞の分画率に関するスコアを正確に生成するにはサイズが小さすぎる。しかし、セグメントモデルを使用して、TCRD遺伝子セグメントに由来するセグメントを含むT細胞の分画率を計算することができ、したがってγδT細胞から生じるT細胞の分画率を計算することができる。TRDV1に関するセグメントベースのスコアは、TRACERx100コホートにおけるTCRDセグメントTRDV1(ρ=0.25、P=0.0011、図32G)、TRDJ1+TRDJ2+TRDJ3+TRDJ4(ρ=0.15、P=0.047、図32G)、TRDC(ρ=0.23、P=0.0021、図32G)に関するTPM RNAseq値と有意に相関することが分かった。
【0210】
深度要件の調査
TCRA、TCRB、TCRG、又はIGH遺伝子座のいずれかからの様々なT及びB細胞分画率を表すTRACERx100試料のサブセット(n=19)をダウンサンプリング解析のために選択して、GAM又はセグメントモデルのいずれかが完全な深度スコアを総括することができる最低深度を確かめた。samtoolsを使用して、各試料を60倍、30倍、10倍、5倍、2倍、1倍、0.5倍、又は0.1倍の深度までランダムに4回ダウンサンプリングした。この解析の結果は図33に与えられており、全てのケースで、GAMモデルとセグメントモデルとの両方について2倍での全深度値に対する高い忠実度を示す(TCRA GAM:ρ=0.83、P<2.2e-16、TCRA seg:ρ=0.75、P=7.5e-15、TCRB GAM:ρ=0.46、P=2.7e-05、TCRB seg:ρ=0.53、P=8.4e-07、TCRG GAM:ρ=0.5、P=4.2e-06、TCRG seg:ρ=0.61 P=5e-09、T細胞平均GAM:ρ=0.74、P=1.9e-14、T細胞平均seg:ρ=0.76P=1.4e-15、IGH GAM:ρ=0.37、P=0.0011、IGH seg:ρ=0.56、P=1.3e-07、図33A~J)。しかし、この低い深度では、多くの場合、値は縮小される(例えば、1倍でのT細胞平均セグメントモデルはρ=0.59を有するが、全深度値と比較すると、線y=-0.028+1.6x上に点がある)。これらの低い深度のダウンサンプリングファイルでのスコアの観察される高い忠実度により、ビン(例えば、約100bp~約10000bpのビン、具体的には100bp~1000bpの間の値が特に有用である可能性が高い。上述したようにベンチマーキングアプローチを使用して近似値を選択することができる)でのカバレッジを計算することによって、GAMモデル又はセグメントモデルのいずれかを使用してローパスWGS試料(例えば、0.1倍以上、0.1倍~0.5倍の間、0.1倍~2倍の間など)で非常に良好に機能するようにT細胞ExTRECT法を設計することができる。
【0211】
免疫細胞レパートリー多様性を調査するためにExTRECTアプローチを使用することができる
より一般的なTCR及びBCRの多様性への洞察を得るために、上述したアプローチの使用を調査した。これは、セグメントモデルの最適な当てはめから予測されるV及びJセグメント使用を検査することによって試料内で行った。図34A~Cは、TRACERx患者CRUK0085において、様々な腫瘍領域及び生殖細胞系列血液試料にわたってTCRA、TCRB、及びTCRGについて使用されるVセグメントの割合を示し、図34Dは、TRACERx患者CRUK0045におけるIGHに関するVセグメント使用を示す。これらは、最大の組換えの位置に基づいて上で説明したのと同じfに関する式を使用して取得することができるが、代わりに、rVDJの値として関連セグメントに関するモデル推定量を使用して取得することもできる。これらのクロノタイププロットは、T細胞の半分以上がR4でのVセグメントTRAV18を使用すると予想され、TRBV29_1の割合が高いCRUK0085の場合など、より広いクロノタイプを有する試料を同定することができる本方法の可能性を示している。TRAVセグメントについて図34Eで示されるように、コホート全体にわたって、セグメント使用の割合の変化をプロットすることが可能である。この場合、明確なクラスタが形成されているにもかかわらず、組織学的特徴、臨床上の性別、又は腫瘍試料のデータか血液試料のデータかとの明確な関係性はなかった。バイオインフォマティクスソフトウェアMiXCR(Bolotin et al, 2015)を使用して、呼び出されたVセグメントと、マッチしたRNAseqデータから呼び出されたVセグメントとを比較すると、T細胞ExTRECTセグメントモデルから呼び出されたVセグメントの数との有意な相関が特定された(TCRA:ρ=0.54、P=1.5e-12、TCRB:ρ=0.39、P=6.6e-07、TCRG:ρ=0.29、P=0.00025、IGH:ρ=0.42、P=5.9e-08、図34F~I)。しかし、MiXCRで呼び出されるVセグメントの数は、全てのケースでT細胞ExTRECTモデルよりも顕著に多く、当てはめられるモデルが過剰に単純化されており、完全なTCR又はBCRの多様性を捉えていないことを示唆する。これは、単に「最適な」ソリューションではなく、最も適合するソリューションの試料を得ることにより、モデルから選択されたV及びJセグメントを拡張することによって対処することができる。例えば、(データへの当てはめの観点から)上位10、20、30、50、又は100のソリューションを選択し、例えばそれらの信頼区間に基づいて調査して、完全なTCR又はBCRの多様性を捉えるモデルを選択することができる。TCR又はBCRの多様性のいくつかの特徴ががんの予後及び/又は療法に対する応答を示唆することが示されているため、これらの結果は特に重要である。例えば、様々なタイプの多様性に関連するB細胞遺伝子発現シグネチャは、乳がん及び卵巣がんの予後を示唆することが分かっており(Iglesia et al., 2014)、TCRベースラインのクローン性及び治療後の拡張の決定を含むTCRレパートリー解析が、チェックポイント阻害薬療法に対する応答のバイオマーカ源であることが示されており(Aversa et al., 2020、Hopkins et al., 2018)、ベースラインでのTILでのTCRの多様性は、様々ながんで予後予測因子であることが分かった(Valpione et al., 2021)。
【0212】
汎がんコホートにおける、がんの免疫環境と、生存率、臨床的決定因子、及びがん種との関連性
T細胞ExTRECTセグメントモデルを、20の異なるがん種にわたる15000以上の参加者からなる大規模な汎がんWGSコホートに適用した。この解析は、TCRA、TCRB、及びTCRGに由来するT細胞分画率、IGHからのB細胞分画率、並びに個々のV及びJ遺伝子セグメントに関する分画率を提供した。これらの参加者の大多数は、マッチした血液生殖細胞系WGS試料を有し、残りの大多数の血液がん患者は、唾液又は他の正常組織からのマッチする生殖細胞系試料を有していた。これにより、大規模な汎がんコホートにおいて初めて、サンプリング時の患者血液中の免疫分画率の相違を調査する機会が得られた。
【0213】
この解析により、血液及び腫瘍試料における、がん種内及びがん種間における免疫ランドスケープの範囲での広範な多様性(TCRA T細胞分画率、0.01を超える分画率を有するモデルによって呼び出されるTRAVセグメントの数によって測定されるTCR多様性)が明らかになった。TCRA T細胞分画率と、セグメントモデルで呼び出されるTRAVセグメントの数との両方に関して、線形モデルを当てはめて、性別、年齢、及び祖先へのこれらの値の依存性を確かめることも可能である。これらのモデルを、血中TCRA T細胞分画率及び予測されるTRAVセグメントの数に関して当てはめて、例えば、汎がんコホートにおけるT細胞分画率及び多様性の減少に年齢が関連していること、及びこれが様々ながんサブタイプにわたって異なる程度で観察されるかどうかを調査することができる。
【0214】
そのような解析を、T細胞ExTRECTからのIGH B細胞分画率スコアに関して行い、様々ながん種にわたる血液及び腫瘍中でのIGH B細胞分画率、並びにIGH B細胞分画率及び多様性の臨床的決定因子(例えば、性別、年齢、祖先)を調査することもできる。
【0215】
血液中のT細胞分画率の決定に対する生殖細胞系列及び祖先の寄与を確かめるために、PLINK、及びがん又は汎がんコホート内の非血縁患者のセットを使用してGWAS解析を行うことができる(「方法」を参照)。性能を高めるために、血中TCRA、TCRB、及びTCRG T細胞分画率値についてGWASを個別に実行することができる。これらの値は、ゲノムの様々な領域から独立して計算され、3つ全てにおいて推奨される有意水準(P<1e-5)を超えるヒットを調べることにより、それらが、(実際のT細胞分画率シグナルではなく)マッピング品質及びカバレッジ値の低下に関連付けられるV(D)J遺伝子内のSNPから生じるデータ内のノイズ又はアーチファクトの結果ではないことを確信することができる。次いで、これらのGWASの1つ又は3つ全てで特定された任意のSNPに関して、様々ながん種でのこれらのSNPの濃縮を見ることができる。
【0216】
最後に、病院エピソード統計での最新記録から、例えばがんの診断日、死亡記録、及び最新のフォローアップ時間に関する使用データなどの生存データを解析することができる。次いで、例えば血液及び腫瘍試料中でTCRA T細胞及びIGH B細胞分画率に関してカプラン・マイヤー曲線を得することができ、各場合に、中央値によってコホートを高い分画率又は低い分画率に分ける。この解析は、血液/腫瘍中のTCRA T細胞分画率又は血液/腫瘍中のIGH B細胞分画率が生存率と有意に関連しているかどうかを調査するために使用することができる。
【0217】
最後に、免疫細胞分画率と他の臨床的特徴との関係性、及び様々ながん種にわたるその不均一性をより良く理解するために、血液及び腫瘍中のTCRA T細胞分画率と、血液及び腫瘍中のIGH B細胞分画率と、血液及び腫瘍中のγδT細胞の代用因子としてのTRDV1 T細胞分画率とで構成されるCox比例モデルを当てはめることができる。Coxモデルは、T又はB細胞分画率との生じ得る交絡する関連性を加味するために、年齢及び性別、並びに患者が術前に化学療法を受けたかどうかも含むことができる。この最後の因子は、がんが臨床的にどの程度悪性であったか又は後期のステージであったかに関する代用因子として含めることができる。がんのステージなどの代替規準を使用することもできる。そのような解析の結果は、任意の特定のコホートで実行されたCoxモデルからのzスコアのヒートマップを見ることによって検査することができる。これにより、血液/腫瘍中のTCRA T細胞分画率又は血液/腫瘍中のIGH B細胞分画率が、汎がんコホート及び任意の個々のがん種において重大なリスクであるかどうかを明らかにすることができる。
【0218】
方法
WGSからT細胞分画率を計算するための全体的なプロセスは、実施例1での方法に綿密に従った。これは、以前に定義した先頭と末尾でのTCRA遺伝子座内の領域を使用してカバレッジを正規化し、Illumina Hiseqに関してγ=1を使用して、単一試料のリード深度比、及びT細胞分画率に関する式(3)又は(7)での公式を計算することを含む。唯一の相違点は、rVDJの計算の詳細(最大V(D)J組換えの位置でのリード深度比の0からの偏差)にある。特に、実施例1に記載のGC補正法を、捕捉キットによって述べたエクソンではなくWGSに作用するように適応させた。GC含量は、上で説明したように、1000bpウィンドウ内(GC1000bp)と、全ての1000bpセグメントにわたってGAMモデルを使用して計算された平滑化バージョン(GCmacro)との2つのスケールで計算した。次いで、以下の線形モデルからの残差を当てはめて採用することによって、カバレッジ値をGC含量に関して正規化した。
【0219】
【数13】
【0220】
これは、局所GC含量が個々のエクソンのレベル(GCexon)ではなく1000bpウィンドウのレベル(GC1000bp)で計算されたことを除いて、実施例1で述べたものと同一である。
【0221】
最終ステップとして、ロバストな品質管理プロセスにより、1)コホート全体にわたる、又は2)コホートのサブセットに関連付けられ、既知の生殖細胞系列ゲノムバリアントにリンクされる、カバレッジに関する外れ値であった任意のV(D)遺伝子内の任意の100bpセグメントを特定した。最初のステップに関して、全てのGEL肺コホートのセットについて、全てのV(D)J遺伝子の平均GC補正比を計算した。これにより、周囲の領域と比較して極端に低いカバレッジ、又は極端に高いカバレッジを有するセグメントが明らかになった。GAMモデルを平均GC補正比に当てはめることにより、当てはめられたラインからの特定の閾値(±0.25)を上回るもの及び下回るものを除外することができる。これはTCRAでは良好に機能したが、TCRBなどの他の遺伝子では、GAMモデルの当てはめを妨げるクラスタ化された大きなセグメントが存在した。これらについて、いくつかの明らかな外れ値領域、例えばTCRBに関して0.25を超える平均GC比を有する全ての領域を最初に手動で除去した。このようにして特定されたセグメントの除去後、PLINKソフトウェアを使用したGWAS解析(Renteria et al., 2013を参照)の後、偏りを有する追加のセグメントが特定された。特に、GWAS解析を、T又はB細胞分画率に関連する任意のSNPを特定するために行った。特定のエクソンにおいてカバレッジの偏りを有する遺伝子領域を特定し、除去のためにフラグを立てた。スコアを再計算し、偏りの除去をチェックするためにGWASプロセスを繰り返した。除去されたセグメントは、特定の生殖細胞系列遺伝子型に関連する周囲領域と比べてカバレッジが過小又は過多であり、純粋にこのアーチファクトにより、遺伝子内の特定のバリアントをT又はB細胞分画率と強く関連させる。これらの場合、関連する遺伝子型を有する特定の試料を選択し、平均GC補正率を計算した。次いで、追加の外れ値セグメントを特定し、上述したのと同じ手順で削除のためのフラグを立て、PLINK/GWAS解析を再実行して、さらなるアーチファクトセグメントが存在しないことを保証した。
【0222】
本方法は、V(D)J組換えを受ける他のT細胞受容体遺伝子、TCRB及びTCRG並びにB細胞受容体IGHにも拡張され、上記の方法を使用し、しかしリード深度比の正規化に使用される位置と、最大偏差が予想される位置とを再定義した。一般に、最大偏差は、最後のVセグメントと最初のJセグメントの間に位置すると予想することができ、それに応じて領域を選択した。これは表7に与えられている。
【0223】
【表7】
【0224】
同様に、本方法は、セグメント使用を調べるためにも適用され、上述の方法を使用したが、rVDJの値には、調査中の特定の遺伝子に対応する特定のセグメントに関するセグメントモデルからの推定量(特に、特定のセグメント及び先行するセグメントに関するセグメントモデルからの推定量の差の絶対値。すなわち、図31に示されるように、調査中のセグメントの開始時に、Vセグメントが考慮されるかJセグメントが考慮されるかに応じて、減少又は増加)を使用した。したがって、表7での正規化領域は、以下の表8での各遺伝子(遺伝子hgnc symbol-start_hg38-end_hg38として提供される)に関する「最大V(D)J組換え領域」に相当するセグメントと共に使用される。γδT細胞の分画率の推定のために、TRDV1、TRDV2、TRDJ1、TRDJ2、TRDJ3、及びTRDJ4のいずれかを使用することができる(これらは全てTCRA遺伝子座内に位置する)。本発明者らは、VセグメントTRDV1が、γδT細胞に関連するRNAseq値と最も強く相関することを見出した。したがって、本実施例では、このセグメントをγδT細胞の分画率の推定に使用した。本実施例では、セグメント使用を調べるときにセグメントモデルを使用し、対応するセグメントに関するモデルからの推定量がrVDJの値を表す。しかし、表7及び8で提供される同じ領域は、好ましくはカバレッジがこれらの領域の研究を可能にするときにはGAMと組み合わせて使用することができ、調査すべき複数のセグメントのそれぞれについて要約された値を推定し、1対の連続するセグメントの第2のものに関するrVDJとして連続セグメント間の差を決定する。
【0225】
【表8】
【0226】
【表9】
【0227】
【表10】
【0228】
【表11】
【0229】
【表12】
【0230】
新たなT細胞ExTRECTV(D)Jセグメントモデルの作成
実施例1に記載の方法は、GAMモデルを使用してrVDJを計算し、したがって試料内のT細胞分画率を計算する。GAMモデルは、平滑化されたプロセスとしてのV(D)J組換えのプロセスのモデル化を簡素化する。これは、どのエクソーム捕捉キットによっても配列決定されていないTCRA遺伝子座内のゲノムの大きなセグメントでのカバレッジの不均一さにより、WESデータを使用するときに有用である。これは、データ内のノイズに対する脆弱性が増大するという犠牲を伴う。さらに、これは、V(D)J組換えプロセスの既知の生物学的現実と合致するようには制約されない。WESデータの場合、調査中の遺伝子座内のカバレッジが均一でないとき、利益がコストを上回る。しかし、WGSデータ(又は捕捉された特定の領域によるこの偏りを受けない任意の他のデータ)を使用すると、V(D)J組換えの生物学的プロセスに直接基づくモデルを使用することが可能である。これは、リード深度比を一連の一定の区分的セグメントとしてモデル化することによって実装され、切断点の位置は、V(D)J組換え後の欠失部位の取り得る先頭を表し、これは、V及びJ遺伝子セグメントの位置から既知であり、したがってモデルに対する制約として提供することができる。したがって、本発明者らは、セグメントが事前に選択され、V及びJセグメントの位置とアライメントするモデルを作成した。さらに、モデルは、リード深度比が0から始まり、そこから最大V(D)J組換えの点まで単調減少する必要があるというV(D)J組換えからの知識によって制約されることがある。例えば、TCRAV(D)J組換えでは、一部のTCR鎖のみが最初のTCRV-1セグメントを選択し、他の全てのVセグメントは欠失されるが、最後のVセグメント後には全てのTCR鎖が欠失を有する。同様にJセグメントに関しても、これらは0に達するまで単調増加する必要がある。
【0231】
このモデルを当てはめるために、V及びJ遺伝子に対応する既知の切断点を有する生じ得る各セグメント(表8を参照)を、1と0のベクトルに変換した。ここで、領域内では1であり、領域外では0である。次いで、(Rパッケージrestriktor v0.3からの関数を使用する)制約付き線形モデルを使用して、これらのベクトルを正規化されたリード比データに当てはめる。ここで、n個のVセグメントとm個のJセグメントのそれぞれに対して以下のように選択された不等式制約を用いる:V<0;V<V;…;V<Vn-1;J>V;J>J;.…;J>Jm-1;J<0。これらの適合値を使用すると、モデルの最大偏差、例えば最後のVセグメントからの値と、個々のセグメント、例えばγδT細胞を表すTCRA遺伝子座内のTRDV1又はTRDV2のいずれかに関連するセグメントからの個々の分画率とから、合計のT又はB細胞分画率を計算することができる。
【0232】
PLINKによるGWAS解析
PLINKを、血液からのWGS生殖細胞系列試料を含む非血縁参加者のコホートに対して実行し、最初の20の遺伝的PC、性別、年齢、及び疾患タイプに関する共変量を用いて制御した。PLINKの入力は、コホート全体でMAF>0.001を有するように前処理され、欠損及び十分な深度を含むQCフィルタを通過し、バリアント正規化を受け、全ての多重対立遺伝子バリアントを二対立遺伝子にされ、全てのバリアントがアライメントされて倹約的である(parsimonious)ことを保証されたバリアントであった。PLINKを実行する前のこれらの事前設定フィルタ及びQCに加えて、R2閾値0.2で500kbウィンドウでLDプルーニングを実行し、コホート内で全てのバリアントがMAF>0.001を有し、遺伝子型欠損が0.2以下であることを保証した。最後に、PLINKを実行する前に、閾値0.000001でハーディー・ワインベルク(Hardy-Weinberg)平衡検定を行った。
【0233】
実施例7-議論
免疫系は、腫瘍形成とその後のがんの進展との両方に影響を及ぼす重要な因子の1つとして広く認識されている。T細胞は、ネオアンチゲンを保有するがん細胞を排除することでがん免疫微小環境の重要な役割を果たしており、したがって腫瘍試料内のT細胞の数は、疾患の経過を決定し得る重要な臨床因子である。がんの文脈では、腫瘍の発生を促す体細胞変化を特徴付けるために、主に腫瘍組織のバルクDNA配列決定が使用されてきた。しかし、本発明者らは、本明細書で提示する方法により、DNA配列決定を試料の免疫微小環境の研究にも利用することができることを実証する。
【0234】
TRECは、新生児における重症複合免疫不全症(SCID)のスクリーニングの文脈で以前に臨床的に検査されており(van der Spek, Groenwold, van der Burg, & van Montfrans, 2015)、そこでは、TRECの欠如がT細胞リンパ球減少症の推測に使用されている。しかし、これらのスクリーニング法はTREC自体の配列決定及び定量化に基づいており、WESデータには基づいていない。乳がん単細胞ゲノム配列決定の最近の研究は、TCRA遺伝子内のT細胞での欠失事象を同定した(Baslan et al., 2020)。ここで、本発明者らは、この研究に基づいて、実施例1で詳細に述べるように、TRECを明示的に使用してWES試料中のT細胞分画率を推定する。
【0235】
本明細書に記載の方法(TIL ExTRECT)は、免疫浸潤の正確な推定量を提供し、その推定量が臨床的有用性を示す。本発明者らは、TCRA T細胞分画率推定量が直交免疫尺度と強く相関され、がん細胞株及びシミュレートされたWESデータがそれらの信頼性を裏付けることを見出した(実施例2)。さらに、本発明者らは、推測されたTCRA T細胞分画率がLUADにおいて予後予測因子であることを実証し、この知見をTCGA LUADコホートで検証する(実施例3)。これに関連して、本発明者らは、TCRA T細胞分画率が汎がんコホートにおけるCPIに対する応答と関連しており、クローン性TMB単独の予測値を改善することを示した(実施例4)。本発明者らはさらに、血液及び腫瘍試料中のTCRA T細胞分画率が、IGH B細胞分画率と同様に、汎がんコホート及び多くの特定のがん種における生存率の予測因子であることを実証した(実施例6)。TRDV1 T細胞分画率に基づいて推定されたγδT細胞の分画率は、特定のがん種における生存率の予測因子であることが分かった。
【0236】
さらに、TIL ExTRECTは、データセットでT細胞(又はB細胞)の分画率を計算できるようにした。これは以前は不可能であった。これを利用して、本発明者らは、血液中のT細胞分画率が不均一であり、男性よりも女性において有意に高く(現在の知見と一貫性がある)、予想通り微生物感染症にも関連していることを実証した(実施例5)。既知の免疫関連性を総括するだけでなく、以前の免疫アノテーションがないデータセットに対してT細胞ExTRECTを使用することができることが示された。RNA-seqを含まない汎がんの複数試料コホートにおいて、本発明者らは、異なるがん種にわたるT細胞浸潤の不均一性の程度の顕著な変化を観察する(実施例5)。この不均一性の多くはサブクローン性SCNAによって引き起こされているように見え、本発明者らは、12q24.31-32のサブクローン性損失がT細胞浸潤の有意な減少と関連していることを特定した。これは、細胞表面のスフィンゴ糖脂質の上方制御を引き起こし、それによってクラスI HLA分子の機能を妨げるSPPL3の発現の低下に関連していることがある。この損失は、複数のがん種における免疫回避メカニズムである可能性があり、サブクローン性で、したがって腫瘍の進展軌跡の後期に頻繁に生じる。
【0237】
実施例2において、本発明者らは、TCRA T細胞分画率が、異なるプラットフォームからの及び複数の異なるデータセットにわたる直交免疫尺度と強く相関していることを実証した。がん細胞株及びシミュレートされたWESデータにより、このスコアが、配列決定された試料内のT細胞の分画率に関する信頼できる推定量を提供することが裏付けられた。高い深度のTRACERx100試料のシミュレーション及びダウンサンプリングは、30倍のカバレッジが、信頼できるT細胞分画率を計算するのに十分なシグナルを提供することを示す(しかし、より低いカバレッジを使用して高いT細胞含量と低いT細胞含量とを区別することができ、これは、より粗いバイオマーカとして有用であり得る)。この比較的低いカバレッジは、ほとんどのDNA配列決定データセットに適用可能であることを意味する。実施例6では、本発明者らは、本方法をWGSデータに適用することができ、WESよりも高い解像度を有するシグナルをTCRA領域の外側で、より低い深度でさえ得ることができることを実証する。本発明者らは、直交RNA-seqデータを使用して、スコアが免疫微小環境を正確に描写していることを示し、ダウンサンプリングを使用して、本方法が2倍の深度まで正確であることを示す。実施例6で、本発明者らはさらに、γδT細胞分画率と、TCR及びBCRの多様性との両方を調査するための方法の可能性を実証する。WES及びWGS以外に、TCRA遺伝子(又は調査中のV(D)J組換えが行われている任意の遺伝子)を標的とする任意のNGS法が、このアプローチと適合性を有し得る。理論に束縛されることを望まないが、配列決定データは、例えばSNPアレイデータに好ましいと考えられる。なぜなら、SNPアレイデータは通常、対象のVDJ遺伝子座の主領域での解像度がかなり低いからである。さらに、TCRA遺伝子(又は調査中のV(D)J組換えを受けている遺伝子)を特異的に標的とし、TCRA T細胞分画率(又はTCRD、TCRG、TCRB、IGH、IGK、又はIGL細胞分画率)を提供する標的パネルベース配列決定アプローチを使用することができる。実際、そのようなアプローチを、診断ツールとしてのその使用を容易にするために、TMBを推定する現在のパネルベースの配列決定アプローチと組み合わせることは容易に想起できる。配列決定プラットフォーム固有の定数(式(2)、(3)、及び(7)でのγ。ここで、値1はWES又はWGSデータに適している)は、使用する配列決定プラットフォームに応じて調整することができる。さらに、GC含量の偏りなどのプラットフォーム固有の偏りを評価して考慮に入れることもできる。
【0238】
これらの理由により、TIL ExTRECTは、通常であればT細胞含量の不偏推定量を有さない以前に公開されたNGSがんデータセットの再解析の文脈において有用であり得る。TCRA T細胞分画率はまた、実施例4で実証したような免疫療法に対する応答との関連性、及び実施例6で実証したような生存率との関連性により、臨床における単純なバイオマーカとしての価値があり得る。
【0239】
手動又はデジタルで評価する前にFFPEブロックを取得、切断、染色する必要があるイメージングスライドなど、試料から免疫関連データを提供する他の方法もあるが、多くの場合、これらは利用可能でない又はロジスティクスの面で煩雑である。一方、T細胞ExTRECTは、研究で及び臨床でもますます一般的に使用されているDNA配列決定プラットフォームと組み合わせて使用することができる。
【0240】
本方法は、がん研究の枠組みの中で開発されたが、より幅広い臨床現場での応用を検討する価値がある。この尺度は、健康な又は疾患のある任意の組織又は血液から得られる任意のNGS解析から計算することができる。がんコホート内のマッチした血液試料の解析により、血中TCRA T細胞分画率と患者のがん種及び性別との間の有意な関係が実証され、このアプローチの可能性が示された(実施例3及び実施例6も参照)。さらに、肺CPIコホートでの血液試料のみの解析により、腫瘍試料自体の解析を行わずに、推測されるTCRA T細胞分画率が免疫療法に対する応答の予測因子であることが分かった(図24B)。さらに、血液試料中のTRECレベルの非NGSポリメラーゼ連鎖反応(PCR)定量化は、乳がん(Page et al.)及び前立腺がん(Madan et al.)での免疫療法の試験において、胸腺でのT細胞の生成を監視するために既に使用されている。さらに、T細胞ExTRECTは、腫瘍学以外にも応用され得る。血中TCRA T細胞分画率の将来の臨床的用途の1つは、SCID(治療に迅速な造血幹細胞移植が必要な重度のT細胞欠失をもたらすことが多い、まれな先天性症候群)の文脈におけるものであり得て、その場合、TIL ExTRECTを、新生児のゲノムスクリーニングと組み合わせて、潜在的な損傷を及ぼす生殖細胞系列変異とT細胞含量の減少とを同時に特定する。残念ながら、本明細書の執筆時点では、SCIDは、出生児の5万人に1人が罹患しているにもかかわらず、ほとんどの国で日常的な新生児スクリーニングの対象ではなく、大部分の症例は、重度の日和見感染症の後でのみ診断され、治療が手遅れになることが多い(Chan et al.)。TIL ExTRECTは、遺伝性疾患に関する新生児スクリーニング遺伝子パネル内にTCRAを含めることによってSCIDを特定できる可能性がある。
【0241】
T細胞とVDJ組換えとは有顎脊椎動物での適応免疫系の決定的特徴であるので、本明細書で提示される全般的な方法は、種にとらわれない。上記の実施例に記載したTIL ExTRECT法はヒトゲノム用に最適化されているが、本方法を、多くの研究用モデル生物(マウス、ニワトリ、フェレットなどを含む)を含む他の種にも拡張することができる(主に、使用すべき対応する特定のゲノム領域を定義し、任意の領域固有の偏りを評価してそれに対処することによって)。VDJ組換えは、TCRA T細胞分画率推定に対するこの新規のアプローチを裏付けるが、TCR-α受容体をコードする遺伝子に特有のものではないことも注目に値する。他のTCR遺伝子、すなわちβ、γ、及びδも、BCR免疫グロブリン遺伝子IGH、IGL、IGKと同様に、VDJ組換えを受ける。したがって、本方法は、実施例6で実証したように、IGL又はIGK軽鎖のいずれかを有するαβ、γδT細胞とB細胞との両方の分画率を計算するために使用することもできる。これらは、例えば、(hg19):TCRB chr7:141998851-142510972;TCRG chr7:38279625-38407656;IGH chr14:106032614-107288051;IGL chr22:22380474-23265085;IGK chr2:89156674-90274235、又は表7及び8の領域など、適切な染色体領域を使用することができ、領域固有の偏りを評価してそれに対処する。これらの他の免疫細胞タイプは一般的にあまり普及していないので、データ内のノイズや試料内の対象の細胞の分画率によってはこれらの一部は良好に機能しない可能性もあるが、この拡張された方法は、DNA配列決定データのみを利用してがん試料の免疫微小環境の詳細な説明を提供できる可能性がある(実施例6で実証される)。
【0242】
要約すると、本明細書に記載するアプローチ、すなわちTIL ExTRECTは、RNA配列決定を必要とせずに、ヒト及びモデルシステムデータセットの両方において、体細胞変化と共に免疫浸潤を特徴付けるための費用対効果の高い技法を提供することによって、基礎研究とトランスレーショナル研究との両方で重要な用途があり得る。
【0243】
参考文献
AbdulJabbar et al. (2020). Geospatial immune variability illuminates differential evolution of lung adenocarcinoma. Nature Medicine, 26(7), 1054-1062.
Aran, D., Hu, Z., & Butte, A. J. (2017). xCell: Digitally portraying the tissue cellular heterogeneity landscape. Genome Biology, 18(1), 1-14.
Aversa I, Malanga D, Fiume G, Palmieri C. Molecular T-Cell Repertoire Analysis as Source of Prognostic and Predictive Biomarkers for Checkpoint Blockade Immunotherapy. Int J Mol Sci. 2020 Mar 30;21(7):2378.
Baslan et al. (2020). Novel insights into breast cancer copy number genetic heterogeneity revealed by single-cell genome sequencing. ELife, 9, 1-21.
Bolotin et al. (2012). Next generation sequencing for TCR repertoire profiling: Platform-specific features and correction algorithms. European Journal of Immunology, 42(11), 3073-3083.
Bolotin, D. A. et al. MiXCR: software for comprehensive adaptive immunity profiling. Nat. Methods 12, 380-381 (2015).
Brastianos, P. K. et al. Genomic characterization of brain metastases reveals branched evolution and potential therapeutic targets. Cancer Discov. 5, 1164-1177 (2015).
Cancer Genome Atlas Research Network. (2012). Comprehensive genomic characterization of squamous cell lung cancers. Nature, 489(7417), 519-525.
Cancer Genome Atlas Research Network. (2014). Comprehensive molecular profiling of lung adenocarcinoma. Nature, 511(7511), 543-550.
Carter et al. (2012). Absolute quantification of somatic DNA alterations in human cancer. Nature Biotechnology, 30(5), 413-421.
Chan, K. & Puck, J. M. Development of population-based newborn screening for severe combined immunodeficiency. J. Allergy Clin. Immunol. 115, 391-398 (2005).
Cristescu et al. (2018). Pan-tumor genomic biomarkers for PD-1 checkpoint blockade-based immunotherapy. Science, 362(6411).
Danaher et al.(2018). Pan-cancer adaptive immune resistance as defined by the Tumor Inflammation Signature (TIS): Results from The Cancer Genome Atlas (TCGA). Journal for ImmunoTherapy of Cancer, 6(1), 1-17.
Davoli, T., Uno, H., Wooten, E. C., & Elledge, S. J. (2017). Tumor aneuploidy correlates with markers of immune evasion and with reduced response to immunotherapy. Science, 355(6322).
Denkert et al. (2016). Standardized evaluation of tumor-infiltrating lymphocytes in breast cancer: Results of the ring studies of the international immuno-oncology biomarker working group. Modern Pathology, 29(10), 1155-1164.
Dieci et al. (2018) Update on tumor-infiltrating lymphocytes (TILs) in breast cancer, including recommendations to assess TILs in residual disease after neoadjuvant therapy and in carcinoma in situ: A report of the International Immuno-Oncology Biomarker Working Group on Breast Cancer. Seminars in Cancer Biology, Volume 52, Part 2, 2018, Pages 16-25.
Favero et al. (2015). Sequenza: Allele-specific copy number and mutation profiles from tumor sequencing data. Annals of Oncology, 26(1), 64-70.
Galon et al. (2006). Type, density, and location of immune cells within human colorectal tumors predict clinical outcome. Science, 313(5795), 1960-1964.
Gerlinger, M. et al. Intratumor Heterogeneity and Branched Evolution Revealed by Multiregion Sequencing. N. Engl. J. Med. 366, 883-892 (2012).
Gerlinger, M. et al. Genomic architecture and evolution of clear cell renal cell carcinomas defined by multiregion sequencing. Nat. Genet. 46, 225-233 (2014).
Ghandi et al. (2019). Next-generation characterization of the Cancer Cell Line Encyclopedia. Nature, 569(7757), 503-508.
Goodman et al. (2017). Tumor mutational burden as an independent predictor of response to immunotherapy in diverse cancers. Molecular Cancer Therapeutics, 16(11), 2598-2608.
Harbst, K. et al. Multiregion whole-exome sequencing uncovers the genetic evolution and mutational heterogeneity of early-stage metastatic melanoma. Cancer Res. 76, 4765-4774 (2016).
Haywood et al. Sunitinib’s effect on tumor infiltration of CD8 T cells in renal cell carcinoma (RCC) and modulation of their function by altering VEGF-induced upregulation of PD1 expression. Journal of Clinical Oncology, 34(2),591 (2016).
Hendry, S., Salgado, R., Gevaert, T., Russell, P. A., John, T., Thapa, B., … Fox, S. B. (2017). Assessing Tumor-infiltrating Lymphocytes in Solid Tumors. Advances In Anatomic Pathology (Vol. 24).
Hopkins et al. T cell receptor repertoire features associated with survival in immunotherapy-treated pancreatic ductal adenocarcinoma. JCI Insight. 2018 Jul 12;3(13):e122092.
Huang, W., Li, L., Myers, J. R., & Marth, G. T. (2012). ART: A next-generation sequencing read simulator. Bioinformatics, 28(4), 593-594.
Hugo et al. (2016). Genomic and Transcriptomic Features of Response to Anti-PD-1 Therapy in Metastatic Melanoma. Cell, 165(1), 35-44.
Iglesia et al. Prognostic B-cell signatures using mRNA-seq in patients with subtype-specific breast and ovarian cancer. Clin Cancer Res. 2014 Jul 15;20(14):3818-29.
Jamal-Hanjani et al.(2017). Tracking the Evolution of Non-Small-Cell Lung Cancer. New England Journal of Medicine, 376(22), 2109-2121.
Jongsma et al. The SPPL3-Defined Glycosphingolipid Repertoire Orchestrates HLA Class I-Mediated Immune Responses. Immunity. 2021 Jan 12;54(1):132-150.e9. doi: 10.1016/j.immuni.2020.11.003. Epub 2020 Dec 2. Erratum in: Immunity. 2021 Feb 9;54(2):387. PMID: 33271119.
Lamy, P. et al. Paired exome analysis reveals clonal evolution and potential therapeutic targets in urothelial carcinoma. Cancer Res. 76, 5894-5906 (2016).
Le, D. T., Uram, J. N., Wang, H., Bartlett, B. R., Kemberling, H., Eyring, A. D., … Diaz, L. A. (2015). PD-1 Blockade in Tumors with Mismatch-Repair Deficiency. New England Journal of Medicine, 372(26), 2509-2520.
Levy, E., Marty, R., Garate Calderon, V.et al.Immune DNA signature of T-cell infiltration in breast tumor exomes.Sci Rep6,30064 (2016).
Li et al. (2017). TIMER: A web server for comprehensive analysis of tumor-infiltrating immune cells. Cancer Research, 77(21), e108-e110.
Litchfield et al. Meta-analysis of tumor and T cell-intrinsic mechanisms of sensitization to checkpoint inhibition. Cell 184.3 (2021): 596-614.
Lopez et al. (2020). Interplay between whole-genome doubling and the accumulation of deleterious alterations in cancer evolution. Nature Genetics, 52(3), 283-293.
Madan, R. A. et al. Clinical and immunologic impact of short-course enzalutamide alone and with immunotherapy in non-metastatic castration sensitive prostate cancer. J. Immunother. Cancer 9, (2021).
Mariathasan et al. (2018). TGFβ attenuates tumour response to PD-L1 blockade by contributing to exclusion of T cells. Nature, 554(7693), 544-548.
Marquez et al. (2020). Sexual-dimorphism in human immune system aging. Nature Communications, 11(1).
McDermott et al. (2018). Clinical activity and molecular correlates of response to atezolizumab alone or in combination with bevacizumab versus sunitinib in renal cell carcinoma. Nature Medicine, 24(6), 749-757.
McGrath et al. Detecting T cell receptor rearrangements in silico from non-targeted DNA-sequencing (WGS/WES). bioRxiv preprint doi.org/10.1101/201947; October 13, 2017.
Messaoudene, M. et al. T-cell bispecific antibodies in node-positive breast cancer: Novel therapeutic avenue for MHC class i loss variants. Ann. Oncol. 30, 934-944 (2019).
Middleton et al. (2020). The National Lung Matrix Trial of personalized therapy in lung cancer. Nature, 583(7818), 807-812.
Newman et al. (2015). Robust enumeration of cell subsets from tissue expression profiles. Nature Methods, 12(5), 453-457.
Newman et al. (2019). Determining cell type abundance and expression from bulk tissues with digital cytometry. Nature Biotechnology, 37(7), 773-782.
Page, D. B. et al. A phase II study of dual immune checkpoint blockade (ICB) plus androgen receptor (AR) blockade to enhance thymic T-cell production and immunotherapy response in metastatic breast cancer (MBC). J. Clin. Oncol. 37, TPS1106-TPS1106 (2019).
Poore GD, Kopylova E, Zhu Q, et al. Microbiome analyses of blood and tissues suggest cancer diagnostic approach. Nature. 2020;579(7800):567-574.
Racle et al. (2017). Simultaneous enumeration of cancer and immune cell types from bulk tumor gene expression data. ELife, 6, 1-25.
Riaz et al.(2017). Tumor and Microenvironment Evolution during Immunotherapy with Nivolumab. Cell, 171(4), 934-949.e15.
Renteria ME, Cortes A, Medland SE. Using PLINK for Genome-Wide Association Studies (GWAS) and data analysis. Methods Mol Biol. 2013;1019:193-213.
Riester, M., Singh, A.P., Brannon, A.R.et al.PureCN: copy number calling and SNV classification using targeted short read sequencing.Source Code Biol Med11,13 (2016).
Rizvi et al. (2015). Mutational landscape determines sensitivity to PD-1 blockade in non-small cell lung cancer. Science, 348(6230), 124-128.
Robert et al. (2011). Ipilimumab plus Dacarbazine for Previously Untreated Metastatic Melanoma. New England Journal of Medicine, 364(26), 2517-2526.
Rosenthal et al. (2019). Neoantigen-directed immune escape in lung cancer evolution. Nature, 567(7749), 479-485.
Samstein et al. (2019). Tumor mutational load predicts survival after immunotherapy across multiple cancer types. Nature Genetics, 51(2), 202-206.
Savas, P. et al. The Subclonal Architecture of Metastatic Breast Cancer: Results from a Prospective Community-Based Rapid Autopsy Program “CASCADE”. PLoS Med. 13, 1-25 (2016).
Schadendorf et al. (2015). Pooled analysis of long-term survival data from phase II and phase III trials of ipilimumab in unresectable or metastatic melanoma. Journal of Clinical Oncology, 33(17), 1889-1894.
Shen, R., & Seshan, V. (2015). FACETS : Fraction and Allele-Specific Copy Number Estimates from Tumor Sequencing. Memorial Sloan-Kettering Cancer Center, Dept. of Epidemiology & Biostatistics Working Paper Series., 1, 50. Retrieved from http://biostats.bepress.com/mskccbiostat/paper29
Shim et al. (2020). HLA-corrected tumor mutation burden and homologous recombination deficiency for the prediction of response to PD-(L)1 blockade in advanced non-small-cell lung cancer patients. Annals of Oncology, 31(7), 902-911.
Snyder et al. (2014). Genetic Basis for Clinical Response to CTLA-4 Blockade in Melanoma. New England Journal of Medicine, 371(23), 2189-2199.
Snyder et al. (2017). Contribution of systemic and somatic factors to clinical response and resistance to PD-L1 blockade in urothelial cancer: An exploratory multi-omic analysis. PLoS Medicine, 14(5), 1-24.
Suzuki, H. et al. Mutational landscape and clonal architecture in grade II and III gliomas. Nat. Genet. 47, 458-468 (2015).
Thorsson et al. (2018). The Immune Landscape of Cancer. Immunity, 48(4), 812-830.e14.
Topalian et al. (2012). Safety, Activity, and Immune Correlates of Anti-PD-1 Antibody in Cancer. New England Journal of Medicine, 366(26), 2443-2454.
Turajlic, S. et al. Deterministic Evolutionary Trajectories Influence Primary Tumor Growth: TRACERx Renal. Cell 173, 595-610.e11 (2018).
Valpione, S., Mundra, P.A., Galvani, E.et al.The T cell receptor repertoire of tumor infiltrating T cells is predictive and prognostic for cancer survival.Nat Commun12,4098 (2021).
Van Allen et al. (2016). Erratum for the report “genomic correlates of response to CTLA-4 blockade in metastatic melanoma.” Science, 352(6283), 207-212.
van der Spek, J., Groenwold, R. H. H., van der Burg, M., & van Montfrans, J. M. (2015). TREC Based Newborn Screening for Severe Combined Immunodeficiency Disease: A Systematic Review. Journal of Clinical Immunology, 35(4), 416-430.
Van Loo et al. (2010). Allele-specific copy number analysis of tumors. Proceedings of the National Academy of Sciences of the United States of America, 107(39), 16910-16915.
Wang et al. (2007). PennCNV: An integrated hidden Markov model designed for high-resolution copy number variation detection in whole-genome SNP genotyping data. Genome Research, 17(11), 1665-1674.
Wang, V. G., Kim, H., & Chuang, J. H. (2018). Whole-exome sequencing capture kit biases yield false negative mutation calls in TCGA cohorts. PLoS ONE, 13(10), 1-14.
Watkins, T. B. K. et al. Pervasive chromosomal instability and karyotype order in tumour evolution. Nature 587, 126-132 (2020).
Yokoyama, A., Kakiuchi, N., Yoshizato, T. et al. Age-related remodelling of oesophageal epithelia by mutated cancer drivers. Nature 565, 312-317 (2019).
Yoshihara et al. (2013). Inferring tumour purity and stromal and immune cell admixture from expression data. Nature Communications, 4.
Zaccaria, S., & Raphael, B. J. (2020). Accurate quantification of copy-number aberrations and whole-genome duplications in multi-sample tumor sequencing data. Nature Communications, 11(1).
Zhang et al. (2003). Intratumoral T Cells, Recurrence, and Survival in Epithelial Ovarian Cancer. New England Journal of Medicine, 348(3), 203-213.
Wood, D. E. & Salzberg, S. L. Kraken: Ultrafast metagenomic sequence classification using exact alignments. Genome Biol. 15, (2014).
【0244】
本明細書で引用する全ての参考文献は、個々の出版物、特許、又は特許出願の全体を参照により援用することが具体的に且つ個別に示されているかのような程度で、あらゆる目的でそれらの全体を参照により本明細書に援用する。
【0245】
本出願は、2021年7月22日に出願された英国特許出願第2110555.6号及び2022年3月11日に出願された英国特許出願第2203451.6号の優先権を主張する。両方の優先権出願の全内容を、あらゆる目的のために参照により本明細書に援用する。
【0246】
本明細書に記載する具体的な実施形態は、例として提供するものであり、限定として提供するものではない。記載される技術の範囲及び精神から逸脱することなく、記載される組成物、方法、及び技術の使用の様々な修正及び変形が当業者には明らかであろう。本明細書におけるサブタイトルは、便宜的にのみ含まれており、いかなる形でも本開示を限定するものとして解釈されるべきではない。
【0247】
本明細書に記載する任意の実施形態の方法は、コンピュータプログラムとして、又はコンピュータ上で実行されるときに上述した方法を実行するように構成されたコンピュータプログラムを含むコンピュータプログラム製品又はコンピュータ可読媒体として提供することもできる。
【0248】
文脈上別段の指示がない限り、上述した特徴の説明及び定義は、本発明の任意の特定の態様又は実施形態に限定されず、記載した全ての態様及び実施形態に等しく適用される。
【0249】
本明細書及び特許請求の範囲を通じて、以下の用語は、文脈上明らかに別段の指示がない限り、本明細書に明示的に関連付けられた意味を有する。「一実施形態において」という語句は、本明細書で使用するとき、同じ実施形態を指すこともあるが、必ずしも同じ実施形態を指すわけではない。さらに、「別の実施形態において」という語句は、本明細書で使用するとき、異なる実施形態を指すこともあるが、必ずしも異なる実施形態を指すわけではない。したがって、以下で述べるように、本発明の範囲又は精神から逸脱することなく、本発明の様々な実施形態を容易に組み合わせることができる。
【0250】
本明細書及び添付の特許請求の範囲で使用するとき、文脈上明らかに別段の指示がない限り、単数形「a」、「an」、及び「the」は複数の指示対象を含むことに留意されたい。本明細書において、範囲は、「約」ある特定の値から、及び/又は「約」別の特定の値までとして表現されることがある。そのような範囲が表現されるとき、別の実施形態は、上記1つの特定の値から及び/又は上記他の特定の値までを含む。同様に、先行詞「約」の使用によって値が近似値として表現されるとき、特定の値が別の実施形態を成すことを理解されたい。数値に関する用語「約」は任意選択であり、例えば±10%を意味する。
【0251】
以下の特許請求の範囲を含め、本明細書全体を通じて、文脈上別段の要求がない限り、「備える」及び「含む」という語、及び「備えて」、「備え」、及び「含み」などの語形変化は、指定された整数、ステップ、又は整数若しくはステップの群の包含を示唆し、任意の他の整数、ステップ、又は整数若しくはステップの群の除外を示唆するものではないことを理解されたい。
【0252】
本発明の他の態様及び実施形態は、文脈上別段の指示がない限り、用語「を備える」を、用語「からなる」又は「から本質的になる」に置き換えて上述した態様及び実施形態を提供する。
【0253】
以上の説明、添付の特許請求の範囲、又は添付図面で開示される特徴は、それらの特定の形式で、又は開示される機能を実施するための手段、若しくは開示される結果を得るための方法若しくはプロセスの観点から適宜表現されるが、本発明をその多様な形態で実現するために、個別に、そのような特徴の任意の組合せで利用することができる。
図1
図2
図3
図4
図5
図6A
図6B-C】
図6D
図7
図8A
図8B
図8C-D】
図9A
図9B
図9C
図9D
図10A-B】
図11A-B】
図11C
図11D
図12A-C】
図13A-C】
図14
図15
図16A
図16B
図16C
図16D
図16E
図16F
図17A-D】
図17E
図17F-G】
図17H-I】
図18A-B】
図18C-D】
図19
図20
図21
図22
図23
図24A-B】
図25
図26A
図26B
図26C-D】
図27A-D】
図28A-E】
図28F-H】
図29A-C】
図29D
図29E-F】
図30
図31-1】
図31-2】
図32A-E】
図32F-G】
図33A-D】
図33E-I】
図33F-J】
図34A-B】
図34C-D】
図34E
図34E-1】
図34F-I】
【国際調査報告】