(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-04-14
(54)【発明の名称】がんの予後に関するシステム及び方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20230407BHJP
C12Q 1/02 20060101ALI20230407BHJP
C12N 5/09 20100101ALI20230407BHJP
G16B 25/10 20190101ALI20230407BHJP
C12N 15/10 20060101ALN20230407BHJP
C12N 15/12 20060101ALN20230407BHJP
【FI】
C12Q1/6869 Z
C12Q1/02
C12N5/09
G16B25/10
C12N15/10 100Z
C12N15/12
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021576497
(86)(22)【出願日】2021-02-10
(85)【翻訳文提出日】2021-12-22
(86)【国際出願番号】 US2021017472
(87)【国際公開番号】W WO2021163204
(87)【国際公開日】2021-08-19
(32)【優先日】2020-02-14
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】500358711
【氏名又は名称】イルミナ インコーポレイテッド
(74)【代理人】
【識別番号】100107489
【氏名又は名称】大塩 竹志
(72)【発明者】
【氏名】ゴルカラム, マハディ
(72)【発明者】
【氏名】ジャン, シレ
(72)【発明者】
【氏名】リウ, リー
(72)【発明者】
【氏名】ワイズ, アーロン
(72)【発明者】
【氏名】ヤオ, ジョイー
(72)【発明者】
【氏名】カプラン, シャノン
(72)【発明者】
【氏名】ソー, アレックス
(72)【発明者】
【氏名】サルマンズ, マイケル
(72)【発明者】
【氏名】ビジャヤラガバン, ラーキー
【テーマコード(参考)】
4B063
4B065
【Fターム(参考)】
4B063QA19
4B063QQ03
4B063QQ08
4B063QQ52
4B063QS39
4B063QX02
4B065AA93X
4B065AC20
4B065CA46
(57)【要約】
潜在的な予後バイオマーカーは、化学療法剤及び免疫チェックポイント阻害剤の有効性を予測するために、大域的ヒト内因性レトロウイルス(hERV)/レトロトランスポゾントランス活性化の配列分析によって生成された複合スコアと、腫瘍試料内の免疫細胞のデコンボリューションを使用して生成された細胞シグネチャとの組み合わせに基づく。腫瘍試料内の細胞シグネチャとの複合スコアの相関分析により、化学療法剤及び免疫チェックポイント阻害剤を受ける個体における生存分析が可能になる。
【特許請求の範囲】
【請求項1】
抗がん治療による、がんに罹患している個体の治療の結果を予測する方法であって、
がんを有する個体から採取された生検からRNA配列発現データを得ることと、
前記RNA配列発現データを分析して、前記生検における細胞型特異的マーカーの発現が閾値を超えるかどうかを決定することと、
前記RNA配列発現データを分析して、hERV/レトロトランスポゾン遺伝子発現が前記生検内に見られるかどうかを決定することと、
前記閾値、及び前記生検における前記hERV/レトロトランスポゾン遺伝子発現の存在に基づいて、前記個体のがんの予後を決定することと、
細胞型特異的マーカーの発現プロファイルとhERV/レトロトランスポゾントランス活性化抗原の発現プロファイルとを組み合わせて、抗がん治療の結果を予測することと、を含む、方法。
【請求項2】
前記がんが、腫瘍を含み、前記生検が、腫瘍生検である、請求項1に記載の方法。
【請求項3】
前記RNA配列発現データを分析することが、大域的ヒト内因性レトロウイルス(hERV)/レトロトランスポゾントランス活性化のトランスクリプトーム配列分析を実行することを含む、請求項1に記載の方法。
【請求項4】
RNA配列発現データを得ることが、前記細胞からトータルRNAを単離することと、RNA試料上で次世代配列決定を実行して、前記RNA配列発現データを得ることと、を含む、請求項1に記載の方法。
【請求項5】
前記RNA配列発現データを分析して、hERV/レトロトランスポゾン遺伝子発現が見られるかどうかを決定することが、第7染色体上に位置するhERV 2650遺伝子の発現を測定することを含む、請求項1に記載の方法。
【請求項6】
前記がんが、結腸直腸(CRC)、乳腺がん、膵腺がん、肺がん、前立腺がん、神経膠芽腫多形、ホルモン難治性前立腺がん、悪性固形腫瘍、例えば、結腸がん(colon carcinoma)、非小細胞肺がん(NSCLC)、退形成星細胞腫、膀胱がん(bladder carcinoma)、肉腫、卵巣がん、直腸血管周囲細胞腫、膵臓がん(pancreatic carcinoma)、進行がん、大腸、胃、膵臓、卵巣のがん、黒色腫、膵臓がん(pancreatic cancer)、結腸がん(colon cancer)、膀胱がん(bladder cancer)、血液悪性腫瘍、扁平上皮がん、乳がん、神経膠芽腫、脳腫瘍、毛様細胞性星細胞腫、びまん性星細胞腫、退形成星細胞腫、脳幹部グリオーマ、神経膠芽腫多形、髄膜腫、上衣腫、乏突起神経膠芽腫、混合性グリオーマ、下垂体腫瘍、頭蓋咽頭腫、胚細胞腫瘍、松果体部の腫瘍、髄芽腫、及び原発CNSリンパ腫からなる群から選択される、請求項1に記載の方法。
【請求項7】
前記抗がん治療が、手術、放射線療法、化学療法、免疫療法、標的療法、ホルモン療法、幹細胞移植、サイトカイン療法、遺伝子療法、細胞療法、光線療法、熱療法、及び音響療法からなる群から選択される、請求項1に記載の方法。
【請求項8】
前記抗がん治療が、シクロホスファミド、メトトレキサート、5-フルオロウラシル、ビノレルビン、ドキソルビシン、シクロホスファミド、ドセタキセル、ドキソルビシン、シクロホスファミド、ドキソルビシン、ブレオマイシン、ビンブラスチン、ダカルバジン、ムスチン、ビンクリスチン、プロカルバジン、プレドニゾロン、シクロホスファミド、ドキソルビシン、ビンクリスチン、プレドニゾロン、ブレオマイシン、エトポシド、シスプラチン、エピルビシン、シスプラチン、5-フルオロウラシル、エピルビシン、シスプラチン、カペシタビン、メトトレキサート、ビンクリスチン、ドキソルビシン、シスプラチン、シクロホスファミド、ドキソルビシン、ビンクリスチン、ビノレルビン、5-フルオロウラシル、フォリン酸、及びオキサリプラチンからなる群から選択される抗がん化学療法薬を含む、請求項1に記載の方法。
【請求項9】
前記細胞型特異的マーカーが、ヒト内因性レトロウイルス(HERV)遺伝子発現マーカー、腫瘍浸潤リンパ球(TIL)マーカー、マイクロサテライト不安定性(MSI)ステータスマーカー、及び腫瘍変異量(TMB)マーカーからなる群から選択される、請求項1に記載の方法。
【請求項10】
前記細胞型特異的マーカーが、CD8+T細胞、CD4+T細胞、及びCD19+B細胞のうちの1つ以上に関連するマーカーを含む、請求項1に記載の方法。
【請求項11】
hERV/レトロトランスポゾン遺伝子発現レベルが、hERV遺伝子発現の単変量分析を使用して計算される、請求項1に記載の方法。
【請求項12】
腫瘍に浸潤する細胞の細胞シグネチャを得る方法であって、
腫瘍を得ることと、
前記腫瘍の細胞を単離することと、
前記細胞からトータルRNAを単離することと、
RNAseqを実行して、RNA配列発現データを得ることと、
デコンボリューションアルゴリズムを使用して前記RNA配列発現データを分析して、細胞型特異的マーカーの発現プロファイルを得ることと、
前記RNA配列発現データにおける細胞型特異的マーカーの前記発現プロファイルに基づいて、細胞型の画分を決定することと、を含む、方法。
【請求項13】
細胞型特異的マーカーの前記発現プロファイル及び/又はhERV/レトロトランスポゾントランス活性化抗原の前記発現プロファイル及び/又は前記腫瘍中の1つ以上の免疫細胞型の前記画分を、所定の閾値と比較することと、患者から得られた前記腫瘍が前記所定の閾値を超える画分を示す場合、前記患者に免疫チェックポイント阻害剤療法を投与することと、を更に含む、請求項12に記載の方法。
【請求項14】
前記細胞型特異的マーカーが、CD8+T細胞、CD4+T細胞、及びCD19+B細胞のうちの1つ以上に関連するマーカーを含む、請求項12に記載の方法。
【請求項15】
前記免疫チェックポイント阻害剤療法が、ペンブロリズマブ(Keytruda)、ニボルマブ(Opdivo)、セミプリマブ(Libtayo)、アテゾリズマブ(Tecentriq)、アベルマブ(Bavencio)、デュルバルマブ(Imfinzi)、及びイピリムマブ(Yervoy)からなる群から選択されるチェックポイント阻害剤を含む、請求項13に記載の方法。
【請求項16】
大域的ヒト内因性レトロウイルス(hERV)/レトロトランスポゾントランス活性化の複合スコアを得る方法であって、
腫瘍を得ることと、
前記腫瘍の細胞を単離することと、
前記細胞からトータルRNAを単離することと、
RNAseqを実行して、RNA配列発現データを得ることと、
前記RNA配列表現データを分析して、hERV/レトロトランスポゾントランス活性化抗原の発現プロファイルを得ることと、を含む、方法。
【請求項17】
細胞型特異的マーカーの前記発現プロファイル及び/又はhERV/レトロトランスポゾントランス活性化抗原の前記発現プロファイル及び/又は前記腫瘍中の1つ以上の免疫細胞型の前記画分を、所定の閾値と比較することと、患者から得られた前記腫瘍が前記所定の閾値を超える画分を示す場合、前記患者に免疫チェックポイント阻害剤療法を投与することと、を更に含む、請求項16に記載の方法。
【請求項18】
前記免疫チェックポイント阻害剤療法が、ペンブロリズマブ(Keytruda)、ニボルマブ(Opdivo)、セミプリマブ(Libtayo)、アテゾリズマブ(Tecentriq)、アベルマブ(Bavencio)、デュルバルマブ(Imfinzi)、及びイピリムマブ(Yervoy)からなる群から選択されるチェックポイント阻害剤を含む、請求項17に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の優先権及び相互参照)
本出願は、2020年2月14日に出願された米国仮特許出願第62/977010号の利益を主張し、参照によりその全体が本明細書に組み込まれる。
【0002】
(発明の分野)
本開示は、がんに罹患している個体を層別化して、どの個体が疾患の重度の形態を有する可能性が高いかを決定するための予後バイオマーカーに関する。特に、実施形態は、個体における腫瘍の重症度を予測する複数のマーカーを分析する試験に関する。
【背景技術】
【0003】
医療専門家が個体におけるがんの重症度を理解するのを助けるための新しい診断及び予後試験が必要とされている。場合によっては、特定の腫瘍の効果が個体にどれだけ深刻であり得るかを決定する効果的な方法はない。更に、特定の治療がどの程度、個体に対して成功したかを決定するための堅牢な試験を開発する必要がある。
【発明の概要】
【0004】
いくつかの実施形態では、抗がん治療による、がんに罹患している個体の治療の結果を予測する方法が提供される。
【0005】
いくつかの実施形態では、予測する方法は、がんを有する個体から採取された生検からRNA配列発現データを得ることと、RNA配列発現データを分析して、生検中の細胞型特異的マーカーの発現が閾値を超えているかどうかを決定することと、RNA配列発現データを分析して、hERV/レトロトランスポゾン遺伝子発現が生検内で見られるかどうかを決定することと、閾値、及び生検内のhERV/レトロトランスポゾン遺伝子発現の存在に基づいて、個体のがんの予後を決定することと、細胞型特異的マーカーの発現プロファイルと、hERV/レトロトランスポゾントランス活性化抗原の発現プロファイルとを組み合わせて、抗がん治療の結果を予測することと、を含む。
【0006】
予測する方法のいくつかの実施形態では、がんは、腫瘍を含み、生検は、腫瘍生検である。
【0007】
予測する方法のいくつかの実施形態では、RNA配列発現データを分析することは、大域的ヒト内因性レトロウイルス(human endogenous retrovirus、hERV)/レトロトランスポゾントランス活性化のトランスクリプトーム配列分析を実行することを含む。
【0008】
予測する方法のいくつかの実施形態では、RNA配列発現データを得ることは、細胞からトータルRNAを単離することと、RNA試料上で次世代配列決定を実行して、RNA配列発現データを得ることと、を含む。
【0009】
予測する方法のいくつかの実施形態では、RNA配列発現データを分析して、hERV/レトロトランスポゾン遺伝子発現が見られるかどうかを決定することは、第7染色体上に位置するhERV 2650遺伝子の発現を測定することを含む。
【0010】
予測する方法のいくつかの実施形態では、がんは、結腸直腸(CRC)、乳腺がん、膵腺がん、肺がん、前立腺がん、神経膠芽腫多形、ホルモン難治性前立腺がん、悪性固形腫瘍、例えば、結腸がん(colon carcinoma)、非小細胞肺がん(non-small cell lung cancer、NSCLC)、退形成星細胞腫、膀胱がん(bladder carcinoma)、肉腫、卵巣がん、直腸血管周囲細胞腫、膵臓がん(pancreatic carcinoma)、進行がん、大腸、胃、膵臓、卵巣のがん、黒色腫、膵臓がん(pancreatic cancer)、結腸がん(colon cancer)、膀胱がん(bladder cancer)、血液悪性腫瘍、扁平上皮がん、乳がん、神経膠芽腫、脳腫瘍、毛様細胞性星細胞腫、びまん性星細胞腫、退形成星細胞腫、脳幹部グリオーマ、神経膠芽腫多形、髄膜腫、上衣腫、乏突起神経膠芽腫、混合性グリオーマ、下垂体腫瘍、頭蓋咽頭腫、胚細胞腫瘍、松果体部の腫瘍、髄芽腫、及び原発CNSリンパ腫からなる群から選択される。
【0011】
予測する方法のいくつかの実施形態では、抗がん治療は、手術、放射線療法、化学療法、免疫療法、標的療法、ホルモン療法、幹細胞移植、サイトカイン療法、遺伝子療法、細胞療法、光線療法、熱療法、及び音響療法からなる群から選択される。
【0012】
予測する方法のいくつかの実施形態では、抗がん治療は、シクロホスファミド、メトトレキサート、5-フルオロウラシル、ビノレルビン、ドキソルビシン、シクロホスファミド、ドセタキセル、ドキソルビシン、シクロホスファミド、ドキソルビシン、ブレオマイシン、ビンブラスチン、ダカルバジン、ムスチン、ビンクリスチン、プロカルバジン、プレドニゾロン、シクロホスファミド、ドキソルビシン、ビンクリスチン、プレドニゾロン、ブレオマイシン、エトポシド、シスプラチン、エピルビシン、シスプラチン、5-フルオロウラシル、エピルビシン、シスプラチン、カペシタビン、メトトレキサート、ビンクリスチン、ドキソルビシン、シスプラチン、シクロホスファミド、ドキソルビシン、ビンクリスチン、ビノレルビン、5-フルオロウラシル、フォリン酸、及びオキサリプラチンからなる群から選択される抗がん化学療法薬を含む。
【0013】
予測する方法のいくつかの実施形態では、細胞型特異的マーカーは、ヒト内因性レトロウイルス(HERV)遺伝子発現マーカー、腫瘍浸潤リンパ球(tumor infiltrating lymphocyte、TIL)マーカー、マイクロサテライト不安定性(microsatellite instability、MSI)ステータスマーカー、及び腫瘍変異量(tumor mutational burden、TMB)マーカーからなる群から選択される。
【0014】
予測する方法のいくつかの実施形態では、細胞型特異的マーカーは、CD8+T細胞、CD4+T細胞、及びCD19+B細胞のうちの1つ以上に関連するマーカーを含む。
【0015】
予測する方法のいくつかの実施形態では、hERV/レトロトランスポゾン遺伝子発現レベルは、hERV遺伝子発現の単変量分析を使用して計算される。
【0016】
いくつかの実施形態では、腫瘍に浸潤する細胞の細胞シグネチャを得る方法が提供される。
【0017】
いくつかの実施形態では、細胞シグネチャを得る方法は、腫瘍を得ることと、腫瘍の細胞を単離することと、細胞からトータルRNAを単離することと、RNAseqを実行して、RNA配列発現データを得ることと、デコンボリューションアルゴリズムを使用してRNA配列発現データを分析して、細胞型特異的マーカーの発現プロファイルを得ることと、RNA配列発現データの細胞型特異的マーカーの発現プロファイルに基づいて細胞型の画分を決定することと、を含む。
【0018】
いくつかの実施形態では、細胞シグネチャを得る方法は、細胞型特異的マーカーの発現プロファイル及び/又はhERV/レトロトランスポゾントランス活性化抗原の発現プロファイル及び/又は腫瘍中の1つ以上の免疫細胞型の画分を、所定の閾値と比較することと、患者から得られた腫瘍が所定の閾値を超える画分を示す場合、該患者に免疫チェックポイント阻害剤療法を投与することと、を更に含む。
【0019】
細胞シグネチャを得る方法のいくつかの実施形態では、細胞型特異的マーカーは、CD8+T細胞、CD4+T細胞、及びCD19+B細胞のうちの1つ以上に関連するマーカーを含む。
【0020】
細胞シグネチャを得る方法のいくつかの実施形態では、免疫チェックポイント阻害剤療法は、ペンブロリズマブ(Keytruda)、ニボルマブ(Opdivo)、セミプリマブ(Libtayo)アテゾリズマブ(Tecentriq)、アベルマブ(Bavencio)、デュルバルマブ(Imfinzi)、及びイピリムマブ(Yervoy)からなる群から選択されるチェックポイント阻害剤を含む。
【0021】
いくつかの実施形態では、大域的ヒト内因性レトロウイルス(hERV)/レトロトランスポゾントランス活性化の複合スコアを得る方法が提供される。
【0022】
いくつかの実施形態では、複合スコア方法を得る方法は、腫瘍を得ることと、腫瘍の細胞を単離することと、細胞からトータルRNAを単離することと、RNAseqを実行して、RNA配列発現データを得ることと、RNA配列発現データを分析して、hERV/レトロトランスポゾントランス活性化抗原の発現プロファイルを得ることと、を含む。
【0023】
いくつかの実施形態では、複合スコアを得る方法は、細胞型特異的マーカーの発現プロファイル及び/又はhERV/レトロトランスポゾントランス活性化抗原の発現プロファイル及び/又は腫瘍中の1つ以上の免疫細胞型の画分を、所定の閾値と比較することと、患者から得られた腫瘍が所定の閾値を超える画分を示す場合、該患者に免疫チェックポイント阻害剤療法を投与することと、を更に含む。
【0024】
複合スコアを得る方法のいくつかの実施形態では、免疫チェックポイント阻害剤療法は、ペンブロリズマブ(Keytruda)、ニボルマブ(Opdivo)、セミプリマブ(Libtayo)、アテゾリズマブ(Tecentriq)、アベルマブ(Bavencio)、デュルバルマブ(Imfinzi)、及びイピリムマブ(Yervoy)からなる群から選択されるチェックポイント阻害剤を含む。
【図面の簡単な説明】
【0025】
【
図1】CD19、CD4、及びCD8陽性免疫細胞の割合が腫瘍試料について決定される、腫瘍免疫細胞デコンボリューションプロセスの実施形態の模式図を示す。
【0026】
【
図2A】様々な免疫細胞からのRNAが腫瘍試料からRNAにスパイクされる滴定実験に基づく腫瘍免疫細胞デコンボリューションプロセスからのデータの線グラフを示す。
【0027】
【
図2B】腫瘍NGSにおける免疫細胞型の分別回収(Fractional Recovery of Immune Cell Types In Oncology NGS、FRICTION)の前(左)及び後(右)の精製された免疫細胞及びバックグラウンド試料の三次元主成分分析(PCA)の描写の実施形態を示す。
【0028】
【
図2C】5つの黒色腫試料のデコンボリューションの実施形態を示す。FACS選別からの「実際の濃度」は、FRICTIONアルゴリズムの「予測濃度」に対してプロットされる。R
2値は、各細胞型について報告される。
【0029】
【
図2D】メラノサイト細胞バックグラウンドに滴定された一次免疫細胞のデコンボリューションデータの実施形態を示す。パネルAは、百万当たりの転写物(transcripts per million、TPM)を示す。パネルBは、CDMiniのデータを示す。パネルCは、LM22のデータを示し、パネルDは、Xgbのデータを示す。LM22及びCDMineは、文献で利用可能な遺伝子の異なるセットである。Xgbは、免疫細胞をデコンボリューションする際に最も情報的に有益な遺伝子のサブセットを自動的に選択する機械学習アプローチを使用して得られる。
【0030】
【
図2E】総組織からRNAに滴定された、精製された免疫細胞からのRNAのデコンボリューションデータの実施形態を示す。パネルAは、百万当たりの転写物(TPM)を示す。パネルBは、CDMiniのデータを示す。パネルCは、LM22のデータを示し、パネルDは、Xgbのデータを示す。
【0031】
【
図2F】肝臓、肺、甲状腺、食道、及び膀胱を含む異なる細胞型についての滴定対スコアの例の追加の実施形態を示す。
【0032】
【
図2G】卵巣、膵臓、腎臓、及び直腸からの技術的複製による、滴定対スコアの例の追加の実施形態を示す。
【0033】
【
図3】ゲノムへのレトロウイルスDNA組み込みの概略図を示す。
【0034】
【
図4】腫瘍細胞におけるネオ抗原の発現の概略図を示す。
【0035】
【
図5】様々な腫瘍型における異なるウイルス抗原の有病率の模式図を示す。
【0036】
【
図6】全エクソームシークエンシング(Whole Exome Sequencing、WES)及び全トランスクリプトームシークエンシング(Whole Transcriptome Sequencing、WTS)の相関因子間の関連性のヒートマップを示す。
【0037】
【
図7】個体試料における異なるhERV値の頻度分布及びhERVの中央値頻度(点線)の棒グラフを示す。
【0038】
【
図8】腫瘍細胞集団における腫瘍浸潤CD8+T細胞の頻度分布及び腫瘍浸潤CD8+T細胞の中央値頻度(点線)の棒グラフを示す。
【0039】
【
図9】腫瘍細胞集団における腫瘍浸潤CD4+T細胞の頻度分布及び腫瘍浸潤CD4+T細胞の中央値頻度(点線)の棒グラフを示す。
【0040】
【
図10】腫瘍細胞集団における腫瘍浸潤CD19+T細胞の頻度分布及び腫瘍浸潤CD19+T細胞の中央値頻度(点線)の棒グラフを示す。
【0041】
【
図11】hERV頻度に基づく個体の集団の累積的な高又は低中央値の生存データの実施形態の線グラフを示す。線グラフの下には、各全生存期間時点から各群の個体の数が列挙されている。
【0042】
【
図12】hERV頻度に基づく累積的な高又は低中央値の生存データの実施形態の線グラフを示す。線グラフの下には、各全生存期間時点からの各群における個体の数が列挙されている。
【0043】
【
図13】第7染色体上に位置するhERV 2650の頻度に基づく累積的な高又は低中央値の生存データの実施形態のグラフを示す。底部の数字は、異なる時点での個体の数を示す。
【0044】
【
図14】第7染色体上に位置するhERV 2650の頻度に基づく累積的な高又は低中央値の生存データの実施形態のグラフを示す。底部の数字は、異なる時点での個体の数を示す。
【0045】
【
図15】hERVの種類のハザード比と頻度との間の相関関係のグラフを示す。
【0046】
【
図16】腫瘍のhERV及びCD8状態に基づく全生存期間データの実施形態の線グラフを示す。底部の数字は、異なる時点での個体の数を示す。
【0047】
【
図17】個体における腫瘍のhERV及びCD8状態に基づく個体の無再発生存期間データの実施形態の線グラフを示す。底部の数字は、異なる時点での個体の数を示す。
【0048】
【
図18】個体の臨床病理学的状態に基づく個体の全生存期間データの実施形態の線グラフを示す。底部の数字は、異なる時点での個体の数を示す。
【0049】
【
図19】個体の臨床病理学的状態に基づく個体の全生存期間データの実施形態の線グラフを示す。底部の数字は、異なる時点での個体の数を示す。
【0050】
【
図20】個体の臨床病理学的及びWTS状態に基づく個体の全生存期間データの実施形態のグラフを示す。底部の数字は、異なる時点での個体の数を示す。
【0051】
【
図21】臨床病理学的及びWTS状態に基づく個体の全生存期間データの実施形態のグラフを示す。底部の数字は、異なる時点での個体の数を示す。
【発明を実施するための形態】
【0052】
本開示の実施形態は、個人又は人々の将来の健康を予測するための予後システム及び方法に関する。実施形態は、腫瘍試料内の免疫細胞のデコンボリューションを使用して生成された細胞シグネチャと組み合わせた、大域的ヒト内因性レトロウイルス(hERV)/レトロトランスポゾントランス活性化のトランスクリプトーム配列分析から生成された複合スコアが、個体の健康を予測する前兆となり得るという発見に関する。更に、複合スコアは、個体の集団で使用される化学療法剤及び免疫チェックポイント阻害剤の有効性を予測するのに有用であり得る。いくつかの実施形態では、個体の腫瘍試料に見られるhERVウイルスDNA及び免疫細胞浸潤のレベルに基づく複合スコアに基づいて、化学療法剤及び免疫チェックポイント阻害剤を受けた個体における生存分析が本明細書で提供される。
【0053】
がんのための新しい診断及び予後バイオマーカーが必要とされている。例えば、結腸直腸がん(colorectal cancer、CRC)の個体は、予後が良くなく、CRC関連の死亡を回避し、過剰治療を回避するための新しい診断及び予後バイオマーカーが必要とされている。臨床病理学的特徴、例えば、腫瘍結節転移(tumor-node-metastasis、TNM)病期分類状態、リンパ節(lymph node、LN)転移(pN0-pN2)、年齢、側位などは、不良な予後の十分に確立されたバイオマーカーであるが、分子及び細胞マーカーの重要性は、臨床環境で十分に実証されている。
【0054】
本明細書のいくつかの実施形態は、個体を層別化して、治療の結果をよりよく予測するための方法に関する。いくつかの実施形態では、治療は、抗がん治療である。いくつかの実施形態では、抗がん治療は、抗がん化学療法薬及び/又はチェックポイント阻害剤に基づく。いくつかの実施形態では、抗がん治療は、チェックポイント阻害剤に基づく。いくつかの実施形態では、抗がん治療は、抗がん化学療法薬又はチェックポイント阻害剤に基づく。いくつかの実施形態では、抗がん治療は、抗がん化学療法薬及び/又はチェックポイント阻害剤に基づく。
【0055】
抗がん化学療法薬の非限定的な例としては、シクロホスファミド、メトトレキサート、5-フルオロウラシル、ビノレルビン、ドキソルビシン、シクロホスファミド、ドセタキセル、ドキソルビシン、シクロホスファミド、ドキソルビシン、ブレオマイシン、ビンブラスチン、ダカルバジン、ムスチン、ビンクリスチン、プロカルバジン、プレドニゾロン、シクロホスファミド、ドキソルビシン、ビンクリスチン、プレドニゾロン、ブレオマイシン、エトポシド、シスプラチン、エピルビシン、シスプラチン、5-フルオロウラシル、エピルビシン、シスプラチン、カペシタビン、メトトレキサート、ビンクリスチン、ドキソルビシン、シスプラチン、シクロホスファミド、ドキソルビシン、ビンクリスチン、ビノレルビン、5-フルオロウラシル、フォリン酸、及びオキサリプラチンが挙げられる。
【0056】
チェックポイント阻害剤の非限定的な例としては、ペンブロリズマブ(Keytruda)、ニボルマブ(Opdivo)、セミプリマブ(Libtayo)、アテゾリズマブ(Tecentriq)、アベルマブ(Bavencio)、デュルバルマブ(Imfinzi)、及びイピリムマブ(Yervoy)が挙げられる。
【0057】
いくつかの実施形態では、本明細書で提供されるシステム及び方法は、他の形態の抗がん療法を受けている個体を層別化するために使用することができる。非限定的な例としては、外科手術、放射線療法、化学療法、免疫療法、標的療法、ホルモン療法、幹細胞移植、サイトカイン療法、遺伝子療法、細胞療法、光線療法、熱療法、及び音響療法が挙げられる。
デコンボリューション分析
【0058】
いくつかの実施形態では、複合スコアを開発することは、腫瘍に浸潤する免疫細胞の細胞シグネチャを得る方法を含む。いくつかの実施形態では、方法は、個体の生検から腫瘍を得ることと、腫瘍の細胞を単離することと、細胞からトータルRNAを単離することと、RNA試料上で次世代シークエンシング(RNAseq)を実行して、腫瘍細胞のトランスクリプトームのためのRNA配列発現データを得ることと、を含む。次いで、この腫瘍トランスクリプトームをデコンボリューションアルゴリズムを使用して分析して、免疫細胞型特異的マーカーの発現プロファイルを取得し、次いで、RNA配列発現データにおける細胞型特異的マーカーの発現プロファイルに基づいて、腫瘍試料中の細胞の画分を決定する。デコンボリューション分析の非限定的な例は、実施例1に提供される。
【0059】
腫瘍微小環境を理解する際、腫瘍の進行及び免疫療法の有効性に対するその影響についての値が存在する。遺伝子発現データに基づく計算ツールは、腫瘍微小環境をデコンボリューションし、不均一腫瘍試料中に存在する免疫細胞の種類を報告するそれらの能力に関して有望であることが示されている。いくつかの実施形態では、方法は、腫瘍に浸潤する細胞のシグネチャを得ることに関する。いくつかの実施形態では、この情報は、腫瘍内の免疫細胞浸潤のレベルを決定するために使用される。いくつかの実施形態では、この情報は、腫瘍に浸潤した細胞の種類を決定するために使用される。いくつかの実施形態では、この情報は、腫瘍に浸潤した細胞の種類及び各種類の細胞の量を決定するために使用される。
【0060】
腫瘍/がんの非限定的な例としては、乳腺がん、膵腺がん、肺がん、前立腺がん、神経膠芽腫多形、ホルモン難治性前立腺がん、悪性固形腫瘍、例えば、結腸がん(colon carcinoma)、非小細胞肺がん(NSCLC)、退形成星細胞腫、膀胱がん(bladder carcinoma)、肉腫、卵巣がん、直腸血管周囲細胞腫、膵臓がん(pancreatic carcinoma)、進行がん、大腸、胃、膵臓、卵巣のがん、黒色腫、膵臓がん(pancreatic cancer)、結腸がん(colon cancer)、膀胱がん(bladder cancer)、血液悪性腫瘍、扁平上皮がん、乳がん、神経膠芽腫、又はこれらに限定されないが、星状細胞腫(例えば、毛様細胞性星細胞腫、びまん性星細胞腫、退形成星細胞腫、及び脳幹部グリオーマ)、神経膠芽腫(例えば、神経膠芽腫多形)、髄膜腫、他のグリオーマ(例えば、下垂体腫瘍、頭蓋咽頭腫、胚細胞腫瘍、松果体部の腫瘍、髄芽腫、及び原発CNSリンパ腫)を含む脳に関連する任意の新生物が挙げられる。いくつかの実施形態では、腫瘍/がんは、本明細書で提供される1つ以上の種類の腫瘍/がんに関する。
【0061】
がん治療における免疫療法の台頭は、腫瘍の免疫微小環境において関心の増加をもたらした。免疫微小環境をより良く理解すると、免疫療法がどのように、いつ有効であるかを解明することができる。
【0062】
免疫微小環境を再現するための一般的なアプローチは、細胞型デコンボリューションによるものであり、それは、バルク腫瘍試料中の細胞型の複雑な混合物を、一連の(特徴付けられた)原型的な細胞シグネチャの線形結合としてモデル化する。
【0063】
いかなる特定の理論によっても限定されるものではないが、CD8+T細胞とTregとPD1との間の高い関連性は、ほとんどの個体におけるCD8+T細胞の枯渇を示す。いくつかの実施形態では、腫瘍の純度及び免疫浸潤は、反相関する。
【0064】
いくつかの実施形態では、細胞型デコンボリューションに対する「FRICTION」と呼ばれるプロセスが提供される(実施例1、
図2A~
図2C)。多くの最先端のデコンボリューションアプローチは、相対的な画分又は統計的エンリッチメントを報告するが、これらの実施形態は、細胞型の絶対画分レベルをより良く検出するために遺伝子の慎重な選択及び正規化に焦点を当てている。これを可能にするために、遺伝子発現の統計的特性と、異なる細胞型を分類するその発現の能力との両方を組み合わせた新規な遺伝子選択方法を実行した。更に、多くの組織バックグラウンドにおける堅牢性を確保するために、10個以上の異なる対照組織からの発現レベルに対して正規化した。FRICTIONは、遺伝子選択及び正規化技術を、デコンボリューションに対するサポートベクトル回帰ベースのアプローチと組み合わせる。
【0065】
いくつかの実施形態では、FRICTIONは、CD8+T、CD4+T、及びCD19+B細胞の3つの細胞型を検出するように訓練された。いくつかの実施形態では、技術は、スパイクイン細胞滴定、ホルマリン固定されパラフィン包埋(formalin-fixed,paraffin-embedded、FFPE)された腫瘍試料の免疫組織化学(immunohistochemistry、IHC)染色、及びフローサイトメトリーを使用して検証された。滴定実験(例えば、腐食した免疫細胞からのRNAが腫瘍試料からRNAにスパイクされる
図2A)は、技術的及び生物学的複製の両方における高い再現性を伴って、様々な組織バックグラウンドにおける我々の方法の線形性を証明し(中央値R
2>0.97)、フローサイトメトリー実験は、この結果が腫瘍試料にまで及ぶことを実証する。
【0066】
いくつかの実施形態では、FRICTIONプロセスは、細胞型デコンボリューションに対する新規なアプローチを提供し、堅牢な正規化及びバックグラウンド補正に焦点を当てて、免疫細胞型の絶対濃度の推定値を生成する。いくつかの実施形態では、FRICTIONは、多くの異なる組織バックグラウンドに対して堅牢であるように開発され、そのシグネチャ免疫細胞型の各々の画分の推定値を生成する。免疫細胞浸潤を伴う腫瘍は、例えば、チェックポイント阻害剤を使用する抗がん化学療法の候補であり得る。いかなる特定の理論によっても限定されるものではないが、チェックポイント阻害剤は、免疫系を刺激して、腫瘍抗原に対する免疫応答を生成すると考えられている。いくつかの実施形態では、免疫細胞浸潤のレベルの増加は、チェックポイント阻害剤療法に対する患者応答の増加に関連しており、したがって、チェックポイント阻害剤療法の候補である患者を特定するためのバイオマーカーとして使用され得る。いくつかの実施形態では、閾値レベルを超える免疫細胞浸潤は、チェックポイント阻害剤療法に対する応答性の増加に関連している。
【0067】
最新版のFRICTIONは、3つの細胞型(CD8+T細胞、CD4+T細胞、及びCD19+B細胞)からのシグネチャを使用して訓練されているが、追加の細胞型からの遺伝子発現データにより、さらなるシグネチャが追加され得るように、大まかである。したがって、いくつかの実施形態では、RNA-seqデータからの細胞型デコンボリューションが可能である。他の細胞シグネチャの非限定的な例としては、B細胞、樹状細胞、顆粒球、ネート性リンパ球細胞、巨核球、単球/マクロファージ、骨髄由来抑制因子細胞、ナチュラルキラー細胞、血小板、赤血球、T細胞、及び胸腺細胞が挙げられる。他の進行中の作業は、追加のフローサイトメトリー実験によるアルゴリズムのさらなる検証を伴う。相関する細胞型及びデータ正規化に対処するためのさらなるアルゴリズムの改善は、性能性を増加させ続けるであろう。
【0068】
いくつかの実施形態では、デコンボリューション分析は、アクセス可能なDNAを切断し、開放クロマチンの周りのクラスタを読み取ることによって生成される、他の種類の配列データ、例えば、ATAC-seqデータに適用することができる。いくつかの実施形態では、ATAC-seqは、迅速かつ容易であり、RNAよりも直接的な細胞型の測定であり得る。
ヒト内因性レトロウイルス(hERV)分析
【0069】
いくつかの実施形態では、複合スコアは、大域的ヒト内因性レトロウイルス(hERV)/レトロトランスポゾントランス活性化のスコアを得る方法も含むことによって生成される。いくつかの実施形態では、方法は、ゲノム中のすべてのhERV配列のトランス活性化のスコアを得ることに関する。いくつかの実施形態では、方法は、腫瘍を得ることと、腫瘍の細胞を単離することと、細胞からトータルRNAを単離することと、RNAseqを実行して、RNA配列発現データを得ることと、RNA配列発現データを分析して、hERV/レトロトランスポゾントランス活性化抗原の発現プロファイルを得ることと、を含む。
【0070】
内因性レトロウイルス(hERV)及び/又はレトロトランスポゾンなどのウイルス配列は、ゲノムに埋め込まれている。通常、これらのウイルス配列は、メチル化によってサイレンシングされる。しかしながら、いくつかの腫瘍では、これらのサイレンシングされたウイルス配列は、再活性化される。活性化されたウイルス配列を有する腫瘍は、例えば、チェックポイント阻害剤を使用する抗がん化学療法の候補であり得る。いかなる特定の理論によっても限定されるものではないが、チェックポイント阻害剤は、免疫系を刺激して、これらのウイルス配列に対する免疫応答を生成すると考えられている。
図5は、様々な腫瘍型における異なるウイルス抗原配列の有病率及び頻度の模式図の実施形態を示す。hERVは、最も一般的であり、異なる腫瘍型にわたって最高頻度を有する。
【0071】
いくつかの実施形態では、抗がん治療が個体に対してどれほどよく作用し得るかを予測する方法が提供される。いくつかの実施形態では、方法は、がんを有する個体から採取された腫瘍生検からRNA配列発現データを得ることと、RNA配列発現データを分析して、腫瘍生検の免疫細胞マーカーの発現が閾値を超えているかどうかを決定することと、RNA配列発現データを分析して、hERV/レトロトランスポゾン遺伝子が腫瘍生検内で見られるかどうかを決定することと、閾値、及び生検内のhERV/レトロトランスポゾン遺伝子発現の存在に基づいて、個体のがんの予後を決定することと、を含む。
【0072】
本明細書で使用される場合、「閾値」の値は、パーセンタイルスコアに基づく。閾値は、方法の実施形態又は分析されるパラメータ(例えば、hERV対免疫細胞)に基づいて変化し得る。閾値はまた、方法の実施形態に含まれる追加のパラメータの数に応じて変化し得る。
【0073】
図7~
図10は、個体を、良好又は不良な予後を有するものに層別化するための閾値としての中央値頻度(点線)を示す。いくつかの実施形態では、すべてのhERV配列のトランス活性化のスコア(中央値hERV)が得られ、抗がん治療の結果及び全生存期間又は無再発生存期間を予測するために使用される。
図11及び
図12に示されるように、hERVの単変量分析は、個体を良好又は不良な予後を有するもののみに分類した。いくつかの実施形態では、高い中央値hERVは、全生存期間に関して(
図11)、同様に無再発生存期間に関して(
図12)、不良な予後と相関した。全生存期間(overall survival、OS)は、診断日からカットオフ日までの生存時間として定義される。カットオフ日は、死亡又は再発又は最後の試験経過観察に起因し得る試験終了点の日である。無再発生存期間(relapse free survival、RFS)は、手術日からカットオフ日までの生存時間として定義される。対照的に、いくつかの実施形態では、低い中央値hERVは、全生存期間に関して(
図11)、同様に無再発生存期間に関して(
図12)、良好な予後と相関した。
【0074】
予後は、「ハザード比」(hazard ratio、HR)を使用して定量化することができ、これは、頻度又はより多くのパラメータとの間の統計に基づく相関関係(例えば、hERVの種類と本明細書で提供されるような1つ以上の追加パラメータとの間)として決定される、集団への「ハザード」(例えば、疾患、衰弱、死亡、治療に対する無応答性など)の確率である。例えば、抗がん/腫瘍治療に対する応答性の予後の文脈において、より低いハザード比は、治療に対する応答の肯定的な予後を示し、より高いハザード比は、治療に対する応答の否定的な予後を示すであろう。
【0075】
いくつかの実施形態では、hERVの単変量分析に基づく個体の層別化は、がんの種類のみに依存しない。いくつかの実施形態では、中央値hERVに基づくHRは、普遍的に適用可能であった。
【0076】
いかなる特定の理論によっても限定されるものではないが、すべてのhERVが同じ予後力を有するわけではない。
図15は、hERVの予測力の範囲を示す。いくつかの実施形態では、染色体7上に位置する「hERV 2650」が、最も強い予測力を有した(HR=0.21、P<0.001)(
図13及び
図14)。いかなる特定の理論によっても限定されるものではないが、hERV 2650の位置は、染色体7に固定されず、ゲノム内で移動することができる。しかしながら、それは、予測力と相関するのは、hERV 2650の場所ではなく、hERV 2650自体である。
免疫細胞デコンボリューション及びhERV分析に基づく複合スコア
【0077】
本明細書のいくつかの実施形態は、病期II/IIIの結腸直腸がんにおける予後バイオマーカーとしてのヒト内因性レトロウイルス遺伝子発現及び免疫細胞浸潤に関する。
【0078】
いくつかの実施形態では、腫瘍浸潤リンパ球(TIL)は、hERVの免疫原性を実証するhERV発現に密接に関連している。CD8T細胞との相関関係は、HERVが免疫原性であり、非常に強力な抗原であることを示す。
【0079】
いくつかの実施形態は、細胞型特異的マーカーの発現プロファイルとhERV/レトロトランスポゾントランス活性化抗原の発現プロファイルとを組み合わせて、抗がん治療の結果及び全生存期間又は無再発生存期間を予測し得る複合スコアを開発することに関する。
【0080】
いくつかの実施形態では、組み合わされた分析は、予後指標として機能し、全生存期間に基づく集団の分離を可能にする(
図16)。いくつかの実施形態では、CD8/HERV状態は、状態であり、強い予後指標であった。いくつかの実施形態では、CD8-/hERV+状態は、最悪の全生存期間の強い予後指標であった(
図16)。同様に、いくつかの実施形態では、CD8-/hERV+状態は、最悪の無再発生存期間の強い予後指標であった(
図17)。いくつかの実施形態では、CD8+/hERV+ステータスは、転移と相関し、これらの個体の即時治療を必要とする転移のためのバイオマーカーとして機能する。
【0081】
図17に示されるように、CD8-/hERV+サブグループの中央値OS(RFS)は、他のサブグループについての37.5(32.8)と比較して、29.8(19.7)であった(HR=4.4、ログランクP<0.001)。いくつかの実施形態では、CD8+/hERVサブグループを有する個体は、最良の予後を有する。いくつかの実施形態では、CD8及びhERVのレベルは、生存に対する相乗効果を有する。いかなる特定の理論によっても限定されるものではないが、hERVは、c-Mycがん原遺伝子の発現を変更することによって、がん細胞の増殖及び生存を調節すると考えられている。
【0082】
いくつかの実施形態では、個体の年齢、性別、腫瘍の病期、がんの種類、個体の感染歴、がん治療レジメン、側位などの1つ以上の追加の有利及び不利な特質/パラメータを分析に含めて、臨床病理学的状態を得ることができ、全生存期間及び無再発生存期間とのその相関関係を決定することができる(
図18及び
図19)。いくつかの実施形態では、臨床病理学的陰性状態(すなわち、1つ以上の有利な特質の存在/1つ以上の不利な特質の非存在)は、全生存期間の不良な予後(すなわち、攻撃性が高いがんの存在及びより高い死亡率)と相関し、臨床病理学的陽性状態(すなわち、1つ以上の不利な特質の存在/1つ以上の有利な特質の非存在)は、全生存期間のより良好な予後(すなわち、攻撃性が低いがんの存在及びより低い死亡率)と相関している(
図18及び
図19)。
【0083】
いくつかの実施形態では、臨床病理学的陰性状態をCD8-/hERV+状態(WTS-状態)と組み合わせて、不良な臨床病理学的群を、異なる予後を有する2つの顕著に異なるサブグループ、すなわち、臨床病理学的陰性/WTS-群及び臨床病理学的陰性/WTS+群にデコンボリューションすることができる(
図20及び
図21)。臨床病理学的陰性/WTS-群は、臨床病理学的陰性/WTS+群と比較して、顕著に悪い予後を有した。
【0084】
いくつかの実施形態は、WES/WTS配列決定及び新規なバイオインフォマティクスのアルゴリズムによる、免疫細胞の正確なデコンボリューション、HERVの測定、同様に他のバイオマーカーの方法に関する。臨床病理学的因子との次世代シークエンシング(next-generation sequencing、NGS)ベースのバイオマーカーを組み合わせることにより、CRCにおける臨床病理学的バイオマーカーのみと比較して、個体の生存期間のより良好な予測が提供される。いくつかの予測バイオマーカーの中で、CD8-/HERV+は、個体のOS及びRFSを強く層別化し、再発、転移、及び死亡の高いリスクを有するCRC個体のこれまで知られていなかったサブセットを明らかにした。
【0085】
いくつかの実施形態では、予後は、いくつかのがんに関して、他のがんと比べてより良好である。例えば、以下の表1のデータによって示されるように、WES及びWTSの相関因子間の関連性に基づいて、右側CRCの予後は、左側CRCの予後よりも良好である。
【表1】
【0086】
いくつかの実施形態では、CRCは、右側にある。いくつかの実施形態では、CRCは、左側にある。右側CRCは、横行結腸、上行結腸、及び盲腸の近位3分の2の近位結腸直腸がんのがんを含む。左側CRCは、横行結腸、脾臓の屈曲、下行結腸、シグモイド結腸、及び直腸の遠位3分の1遠位結腸直腸がんのがんを含む。
【実施例】
【0087】
以下の実施例は、非限定的であり、当技術分野の範囲内の他の変形例も検討される。
実施例1-デコンボリューション分析
導入
【0088】
腫瘍NGSにおける免疫細胞型の分別回収(FRICTION)は、細胞型デコンボリューション分析を実行するための、検証された定量的免疫細胞型デコンボリューションツールである。それは、標識された細胞型シグネチャに基づいて、未知の混合物試料内のこれらのシグネチャの画分を予測する。そうするために、基本的なシグネチャのペナルティ化された線形結合として、混合物試料を本質的にモデル化する。これは、単純SVMベースのモデルを使用して行われる。計算は、線形結合の推定のサブセットで実行される。
デコンボリューションのためのRNAの調製
【0089】
RNA-seqデータを調製するために、Zippyパイプラインを使用した。それは、bcl2fastq、次いでSTAR、次いでRSEMのプロセスを実行し、いくつかの統計も生成する。Bcl2fastqを実行して、bcl形式での次世代シークエンシング出力を適切なFASTQファイルに分離する。次いで、リードの整列及び遺伝子発現定量化を、STAR(Dobin et al.,Bioinformatics.2013 Jan;29(1):15-21.)及びRSEM(Li,B.,Dewey,C.N.RSEM:accurate transcript quantification from RNA-Seq data with or without a reference genome.BMC Bioinformatics 12,323(2011))サードパーティソフトウェアパッケージを使用して実行する。FRICTIONは、.genes.resultsファイルをRSEMから入力として、又は2列(特徴、値)ファイルを取り入れることができる。
【0090】
パイプラインが実行されると、試料が試料マニフェストに追加され、mixture_files.tsvは、実行されたすべてのデコンボリューション試料の記録を含み、また、データを取り込むためにrun_deconvolution.pyによって使用される。各試料について、提供されたファイル名は、RSEMから生成された「.genes.results」ファイルであるべきである。mixture_files形式は、大部分は簡単であるが、試料に関する情報を含むメタデータ列を分析する価値がある。メタデータは、ブール又は分類であり得る。メタデータの一例は、「tissue:melanoma;id:ff5;total」であり得る。これは、試料が、メラノーマ由来であり、実行した新鮮な凍結試料の5番目のバッチにあり、トータル(精製された細胞型とは対照的に)RNAであることを説明する。run_deconvolution.pyインターフェースは、例えば、すべての黒色腫、すべてのトータルRNA、実験ff5からのすべての試料の試験を可能にする有用なツールを提供する。
デコンボリューション分析の実行
【0091】
デコンボリューションは、スクリプトrun_deconvolution.pyを使用して実行される。プロセスを容易にするための多くのヘルパー機能がこのスクリプト内にある。スクリプト内の主な機能は、run_idであり、これは、mixture_files.tsvスプレッドシートにおけるそのidに関連するすべての試料を実行するであろう。
【0092】
以下は、磁気ビーズ結合ベースを使用して、1つの実験のためにすべての試料を実行する例である。
run_id([’ff5’],’racle.csv’、fname=’racle_results_ff4_norm.csv’、normalize=True、plot=False、immune_pos_filters=[(’type’,’magnetic’)])
【0093】
特に注目すべきこと:run_idは、その結果を、fname引数に等しい名称を有するcsvファイルに加える。
【0094】
デコンボリューションの実行はまた、単一の試料をデコンボリューションするためのコマンドラインから実行することができる:python run_deconvolution.py(遺伝子リストファイル)(デコンボリューションする試料)。
デコンボルバーを実行する機能を作成する/未加工のデコンボルバーを実行する
【0095】
run_idの1つの代替手段は、別個の実行機能を構築することである。その機能は、このパターンに従うことができる。
dcf=デコンボリューティファイア(normalize=normalize)
load_immune_bases(dcf,basis_list=[’CD8’,’CD4’,’CD19’])
dcf.load_genelist(gene_list)
いくつかの基準に基づくロード混合物の数
試料=load_mixtures(dcf,positive_filters=filters)
dcf.filter_df(dcf.filter_genes)
結果=[試料中の混合物についてdcf.deconvolve(混合物、詳細=偽)]
遺伝子リスト
【0096】
run_idの第2の引数は、遺伝子リストファイルである。現在、使用される2つの遺伝子リストがある。racle遺伝子リストは、オンラインで見つけることができる。
【0097】
xgb_mad_v2遺伝子リストは、様々な経験則とともに使用することによって開発された。
ATAC-seqデータからのデコンボリューション
【0098】
Atac seqデータのデコンボリューションを以下のように実行した。
【0099】
ATAC seqデータを処理する。例atac zippy
json:/home/awise/sngs/workflow/old_run_jsons/atac9.json
【0100】
基準ファイルの場合、別のzippyを使用してそれらをマージした。
script:/home/awise/sngs/workflow/merge_and_macs_cd4.json
【0101】
ここで、ピークを有するMACSから出力されるファイルがある。ここで、デコンボリューションのためにmacsファイルを再フォーマットしたい。これは、/home/awise/atac/deconv/feature_select.pyで行われる。
【0102】
ここで、デコンボリューションを実行する準備が整う。しかしながら、多くのMACSピークがある。それらのうちの最良のものを選択する方法を見つけたい。これは、atac_feature_select.pyを用いて実行される。
【0103】
FRICTIONは、RNA-Seqデータから免疫細胞型デコンボリューションを実行するための新しい技術である。FRICTIONは、腫瘍試料から測定されたRNA-Seqを行い、一組の事前に構築された細胞型シグネチャを使用して、特定の免疫細胞成分の免疫含有量を予測する(
図1を参照)。
【0104】
FRICTIONは、相対細胞画分(すなわち、免疫細胞のパーセンテージ)又は統計的エンリッチメントに焦点を当てた他の方法とは対照的に、絶対細胞画分の検出(すなわち、総細胞のパーセンテージ)を促進する方法における遺伝子の選択及び正規化に焦点を当てている。
【0105】
FRICTIONは、2段階プロセスを通じて機能する。最初に、一組の遺伝子シグネチャが開発される。この実験では、様々な組織型からの、一組の精製された細胞、同様に一組の明示的なバックグラウンド試料を使用して、遺伝子シグネチャを作成した。次いで、3つの基準を使用してデコンボリューションのために遺伝子を選択した。
【0106】
・ クラス内対クラス間の分散比。大域的変動と比較して、細胞型内で一貫している遺伝子が選択される。
【0107】
・ 最大絶対偏差(MAD)。少なくとも1つの免疫細胞型とバックグラウンドとの間に大きな正の差異を有する遺伝子が選択される。
【0108】
・ 分類重要性。このプロセスに対して、極端な勾配増強分類器が、モデルに対するそれらの重要性によって、各免疫細胞型とすべてのバックグラウンド組織とランク遺伝子との間に構築された(Friedman,2001)。
【0109】
これら3つの測定値の組み合わせに対して良好にスコア付けされた遺伝子が、デコンボリューションを実行するために選択された。
【0110】
シグネチャが生成された後、FRICTIONは、任意のヒトRNA-Seq試料から実行することができる。デコンボリューションプロセスは、2015年にNewmanらによって記載されているものと同様の、引き起こされたサポートベクトル回帰ベースのシステムを使用して実行され得る。Newmanらとは対照的であるが、2017年のRacleらと同様に、我々は、絶対細胞画分のデコンボリューションに焦点を当てた。これは、我々の遺伝子選択手順、同様に細胞型シグネチャの各々を同じスケールに配置する特徴正規化によって可能になる。
【0111】
FRICTIONは、直交検証(IHC及びフローサイトメトリー)により、滴定研究及び配列決定された腫瘍を使用して広く評価されている。
【0112】
遺伝子選択は、6つのCD8+試料、5つのCD4+試料、及び4つのCD19+試料とともに、3つの細胞型(CD8+T細胞、CD4+T細胞、及びCD19+B細胞)からの一組の磁気ビーズの精製された免疫細胞試料を使用して実行した。10個の組織型(肺、肝臓、結腸、前立腺などを含む)からのバックグラウンド組織試料を対照として使用した。得られた遺伝子シグネチャは、細胞型間の良好な分離、同様に低次元PCA表現におけるバックグラウンド組織型の緊密なクラスタリングの両方を実証した(
図2B)。
【0113】
一連の滴定実験を使用してFRICTIONを評価した。これらの実験では、CD8+初代細胞、CD4+初代細胞、及びCD19+初代細胞の既知の濃度を、様々な複雑な組織バックグラウンド(原発性の個体の腫瘍)に滴定した。マーカー遺伝子と細胞画分との相関関係を単純に見ること、又は単純な手作業で精選された遺伝子のリストを使用することと比較して、FRICTIONは、線形相関に関して明らかに良好に機能し、中央値R
2値は0.97超である(表2)。IHC染色された肺及び結腸試料とのさらなる比較は、原発性腫瘍における高いCD4+T細胞含有量対低いCD4+T細胞含有量を区別するFRICTIONの能力を実証した(データは示さず)。
表2-滴定実験の結果。正規化されたTPM(百万あたりの転写物)と、8つのCD遺伝子の手作業で精選されたパネルと、FRICTIONの遺伝子シグネチャとの間の未加工の相関関係を使用して、デコンボリューションの3つの方法を比較する。「滴定%」の列は、スパイクイン実験のダイナミックレンジ(すなわち、滴定された各免疫細胞型の最大レベル)を表す。
【表2】
【0114】
FRICTIONは、フローサイトメトリーを使用して定量化された5つの原発性黒色腫腫瘍との比較においても評価されている(
図2C)。予測された出力と絶対細胞画分との間の一致は、予測された3つの免疫細胞型すべてについて高いことが見出された。
遺伝子セットの選択及び組織の性能を含む細胞デコンボリューション
【0115】
一次免疫細胞をメラノサイト細胞バックグラウンドに滴定した。
【0116】
トレーニングセット
【0117】
1:CD8+T細胞(6つの個体)
【0118】
2:CD4+T細胞(6つの個体)
【0119】
3:CD19+B細胞(3つの個体)
【0120】
メラノサイトバックグラウンド
【0121】
試料#1:メラノサイトのみ
【0122】
試料#2:+0.6%のCD4+細胞、CD8+細胞、及びCD19+細胞
【0123】
試料#3:+3.3%のCD4+細胞、CD8+細胞、及びCD19+細胞
【0124】
試料#4:11.8%のCD4+細胞、CD8+細胞、及びCD19+細胞
【0125】
滴定:血液からの精製された免疫細胞をメラノサイトへ
【0126】
免疫細胞の混合物(すべて同じレベル)
【0127】
ライブラリ調製物:RNAアクセス(40ngの入力)
【0128】
【0129】
精製された免疫細胞からのRNAを、総組織(子宮組織)からのRNAに滴定した。
【0130】
トレーニングセット
【0131】
1:CD8+T細胞(6つの個体)
【0132】
2:CD4+T細胞(6つの個体)
【0133】
3:CD19+B細胞(3つの個体)
【0134】
滴定:血液からの精製された免疫細胞のRNAをRNAへ
【0135】
血液からの精製された免疫細胞からのRNA
【0136】
ライブラリ調製物:RNAアクセス(40ngの入力)
【0137】
【0138】
図2Fは、滴定対スコアの例の追加の実施形態を示す。線形性は、0~5%から観察された。しかしながら、シグネチャスコアは、実験的スパイクインよりも低くなる傾向があり(例えば、CD8+T細胞の極端な実例として食道及び膀胱)、勾配は、すべてのスパイクインにわたって同じではない(例えば、肝臓CD8対CD4の勾配)。
【0139】
図2Gは、技術的複製による滴定対スコアの例の追加の実施形態を示す。結果は、一般に、線形であり、良好な技術的再現性を示した。しかしながら、再び、シグネチャスコアは、実験的スパイクインよりも低くなる傾向があり(例えば、極端な実例として直腸)、勾配は、すべてのスパイクインにわたって同じではない。
実施例2
【0140】
DNA及びRNAは、全生存期間(OS)、無再発生存期間(RFS)、性別、年齢、病期、側位、アジュバント治療、及び転移状態を含む臨床データとともに、1-1のMSH/MSS比(MSI-PCRによって測定)を用いて、病期II/IIIのCRCを有する114の個体の新鮮な凍結腫瘍及び一致した正常組織から抽出した。全エクソームシークエンシング(WES)及び全トランスクリプトームシークエンシング(WTS)ライブラリを、それぞれ、Illumina Nextera(商標)Flex for Enrichment及びTruSeq(商標)Stranded Total RNAライブラリ調製法を使用して生成し、NovaSeq(商標)6000システムで配列決定した。
図6は、WES及びWTSの相関因子間の関連性のヒートマップを示す。
【0141】
内部開発されたバイオインフォマティクスパイプラインを使用して、ヒト内因性レトロウイルス(HERV)遺伝子発現、腫瘍浸潤リンパ球(TIL)、マイクロサテライト不安定性(MSI)状態、腫瘍変異量(TMB)、免疫関連遺伝子発現などのバイオマーカーを分析し、これらのシグネチャの臨床的重要性を評価した。
実施例3
【0142】
臨床病理学的因子、年齢、治療、病期、及び転移状態の中には、結果の強い予測因子があった。WES及びWTS由来のバイオマーカーを用いると、MSI状態は、HERV発現、CD8+及びCD19+浸潤(新規な免疫細胞デコンボリューションベースの方法によって決定される)とともに、強い予億因子であった。興味深いことに、HERV発現及びCD8+細胞は、生存に対する相乗効果を有し、CD8-/HERV+サブグループの中央値OSは、他のサブグループについての37.5と比較して、29.8である(HR=4.4、ログランクP<0.001)。更に、CD8-/HERV+バイオマーカーは、臨床病理学的因子が単独ではカバーできなかったより攻撃的な種類のCRCを特定した。最後に、検出されたHERV転写物とTILとの大部分の間の高い相関関係が観察され、これらの新規な標的の免疫原性を証明し、CRC同様に他の腫瘍型における免疫チェックポイント阻害剤に対する応答の潜在的なバイオマーカーとしてHERV発現を示唆している。
実施例4-HERV定量化アルゴリズム
【0143】
本明細書では、HERV定量化プロセスが提供される。ヒト内因性及び外因性レトロウイルス遺伝子に属する約3000個のゲノム配列のリストが蓄積された。hg19ヒトゲノム参照ビルドに付加されたこのリストに基づいて、カスタムインデックスファイルを使用して、WTSで得られたリードの整列を実行した。STAR及びSALMON(Patro,et al.,Nat Methods.2017 Apr;14(4):417-419)のサードパーティの整列ソフトウェアを使用し、転写物の定量化方法を一組の最適化されたオプションを使用して採用した。これらの遺伝子の定量化後、ライブラリ正規化を実行し、試料に対してすべてのウイルス関連遺伝子の中央値正規化された発現を使用して中央値HERV値を計算した。
ハードウェアシステム
【0144】
いくつかの実施形態では、複合スコアを決定するための開示された方法は、汎用コンピュータプロセッサよりも高い効率により開示された方法を計算するように設計又はプログラムされた特定用途向けハードウェアにおいて実装される。例えば、プロセスは、汎用コンピュータを使用して実行されてもよいか、又は代替的に、フィールドプログラマブルゲートアレイ(field-programmable gate array、FPGA)又は特定用途向け集積回路(application-specific integrated circuit、ASIC)を使用して実行されてもよい。
【0145】
いくつかの実施形態では、1つ以上の特定用途向け集積回路(ASIC)をプログラムして、本明細書に記載のそれぞれの方法のうちの1つ以上の機能を実行することができる。ASICは、ASICのデジタル論理ゲートがVHDLなどのハードウェア記述言語を使用してプログラム可能であるという点で、本明細書で説明されるFPGAと同様の1つ以上のプログラム可能な論理回路を含む集積回路を含む。しかしながら、ASICは、ASICが1回だけプログラム可能であり、一度プログラムされると動的に再構成することができないという点でFPGAとは異なる。更に、本開示の態様は、FPGA又はASICを使用して複合スコアを決定することに限定されない。代わりに、方法を実行する任意のシステムの主な処理ユニットは、したがって、1つ以上の中央処理ユニット(central processing unit、CPU)、グラフィック処理ユニット(graphical processing unit、GPU)、又は任意の組み合わせを使用して実装され得る。
【0146】
いくつかの実装形態では、FPGA、ASIC、CPU、GPU、又はそれらの組み合わせなどの集積回路の使用は、単一のFPGA、単一のASIC、単一のCPU、単一のGPU、又はそれらの任意の組み合わせを含むことができる。代替的に、又は加えて、FPGA、ASIC、CPU、GPU、又はそれらの組み合わせなどの集積回路の使用は、複数のFPGA、複数のASIC、複数のCPU、若しくは複数のGPU、又はそれらの任意の組み合わせを含むことができる。複数のFPGAなどの追加の集積回路の使用は、追加の分析動作を実行するのにかかる時間を短縮することができる。
用語
【0147】
本明細書における実質的に任意の複数形及び/又は単数形の用語の使用について、当業者は、文脈及び/又は用途に適切なように、複数形から単数形に、及び/又は単数形から複数形に置き換えることができる。明確性のために、種々の単数形/複数形の順列が本明細書に明示的に記載されてもよい。
【0148】
全般的に、本明細書で使用される用語、特に添付の特許請求の範囲(例えば、添付の特許請求の範囲の本体)で使用される用語は、概して、「オープン」ターム(open terms)として意図される(例えば、用語「含む(including)」は、「~を含むがこれらに限定されない(including but not limited to)」と解釈されるべきであり、用語「有する(having)」は、「少なくとも有する(having at least)」と解釈されるべきであり、用語「含む(includes)」は、「~を含むがこれらに限定するものではない(includes but is not limited to)」と解釈されるべきであるなど)ことが、当業者によって理解されるであろう。導入された請求項記載の具体的な数が意図されている場合、このような意図が請求項に明示的に列挙され、このような記載がない場合、このような意図は存在しないことも、当業者には更に理解されるであろう。例えば、理解を助けるために、以下の添付の特許請求の範囲は、請求項の記載を導入するための導入句「少なくとも1つの(at least one)」及び「1つ以上の(one or more)」の使用を含んでもよい。しかしながら、このような語句の使用は、同じ請求項が、「1つ以上の」又は「少なくとも1つの」、及び「a」若しくは「an」などの不定冠詞を含む(例えば、「a」及び/又は「an」が、「少なくとも1つの」又は「1つ以上の」の意味に解釈されるべきである)場合であっても、不定冠詞「a」又は「an」による請求項記載の導入が、このような導入された請求項記載を含む任意の特定の請求項を、このような記載のうちの1つのみを含む実施形態に限定するものと解釈すべきではなく、請求項記載を導入するために使用される不定冠詞の使用についても同じく当てはまる。更に、導入された請求項記載の具体的な数が明示的に列挙されている場合であっても、このような記載が、少なくとも列挙された数の意味(例えば、「2つの記載」の無修飾の記載は、その他の修飾がないと、少なくとも2つの記載又は2つ以上の記載を意味する)で解釈されるべきであることを、当業者は認識するであろう。更に、「A、B、及びCなどのうちの少なくとも1つ」と類似した常套句が使用される場合には、全般的に、このような構造は、当業者がこの常套句を理解するであろう意味において意図される(例えば、「A、B、及びCのうちの少なくとも1つを有するシステム」としては、Aのみ、Bのみ、Cのみ、A及びBともに、A及びCともに、B及びCともに、並びに/又はA、B、及びCともに、などを有するシステムが挙げられるが、これらに限定されない)。「A、B、又はCなどのうちの少なくとも1つ」と類似した常套句が使用される場合には、全般的に、このような構造は、当業者がこの常套句を理解するであろう意味において意図される(例えば、「A、B、又はCのうちの少なくとも1つを有するシステム」としては、Aのみ、Bのみ、Cのみ、A及びBともに、A及びCともに、B及びCともに、並びに/又はA、B、及びCともに、などを有するシステムが挙げられるが、これらに限定されない)。本明細書、特許請求の範囲、又は図面にかかわらず、2つ以上の代替用語を提示する実質上任意の離接語及び/又は語句は、用語のうちの1つ、用語のいずれか、又は両方の用語を含む可能性を企図することが理解されるべきであると、当業者には更に理解されるであろう。例えば、語句「A又はB」は、「A」又は「B」又は「A及びB」の可能性を含むと理解されるであろう。
【0149】
加えて、本開示の特徴又は態様がマーカッシュ群の観点で記載されている場合、それによって、当業者は、本開示がまた、マーカッシュ群の構成要素の任意の個々の構成要素又はサブグループの観点でも記載されていることを認識するであろう。
【0150】
当業者には理解されるように、書面による説明を提供するという観点からなどの任意の及びすべての目的において、本明細書に開示されるすべての範囲はまた、任意の及びすべての可能なサブ範囲並びにそれらのサブ範囲の組み合わせも包含する。任意の列挙された範囲は、同じ範囲が、少なくとも等半分、3分の1、4分の1、5分の1、10分の1などに分解されることを十分に記載し可能にするものとして容易に認識することができる。非限定的実施例として、本明細書で説明される各範囲は、下部3分の1、中部3分の1、及び上部3分の1などに容易に分解することができる。また、当業者には理解されるように、「最大で(up to)」、「少なくとも(at least)」、「より大きい(greater than)」、「より小さい(less than)」などのすべての言語は、列挙された数を含み、続いて上述のように下位範囲に分解され得る範囲を指す。最後に、当業者には理解されるように、範囲は、各個々の構成要素を含む。したがって、例えば、1~3個の物品を有する群は、1個、2個、又は3個の物品を有する群を意味する。同様に、1~5個の物品を有する群は、1個、2個、3個、4個、又は5個の物品を有する群などを意味する。
【0151】
本明細書では様々な態様及び実施形態が開示されてきたが、他の態様及び実施形態は、当業者には明らかであろう。本明細書に開示される様々な態様及び実施形態は、説明のためのものであり、以下の特許請求の範囲によって示される真の範囲及び趣旨により、限定することを意図するものではない。
【国際調査報告】