(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-03-08
(54)【発明の名称】新生抗原をスクリーニングする方法、システム及びその用途
(51)【国際特許分類】
C12Q 1/6886 20180101AFI20230301BHJP
C07K 4/12 20060101ALI20230301BHJP
C07K 14/435 20060101ALI20230301BHJP
C12N 5/0784 20100101ALN20230301BHJP
C12N 5/0783 20100101ALN20230301BHJP
C12N 5/0786 20100101ALN20230301BHJP
【FI】
C12Q1/6886 Z
C07K4/12
C07K14/435
C12N5/0784 ZNA
C12N5/0783
C12N5/0786
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022542136
(86)(22)【出願日】2021-01-06
(85)【翻訳文提出日】2022-07-19
(86)【国際出願番号】 KR2021000116
(87)【国際公開番号】W WO2021141374
(87)【国際公開日】2021-07-15
(31)【優先権主張番号】10-2020-0002260
(32)【優先日】2020-01-07
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
(71)【出願人】
【識別番号】515162224
【氏名又は名称】コリア アドバンスド インスティテュート オブ サイエンス アンド テクノロジー
【氏名又は名称原語表記】KOREA ADVANCED INSTITUTE OF SCIENCE AND TECHNOLOGY
(71)【出願人】
【識別番号】522110164
【氏名又は名称】ペンタメディックス・カンパニー・リミテッド
【氏名又は名称原語表記】PENTAMEDIX CO., LTD.
【住所又は居所原語表記】517HO, 516, 42, CHANGEOP‐RO, SUJEONG‐GU, SEONGNAM‐SI GYEONGGI‐DO 13449, REPUBLIC OF KOREA
(74)【代理人】
【識別番号】110000671
【氏名又は名称】IBC一番町弁理士法人
(72)【発明者】
【氏名】チョイ,ジュン ギュン
(72)【発明者】
【氏名】バン,ヒョ ユン
(72)【発明者】
【氏名】パク,ジェ ソン
(72)【発明者】
【氏名】チョ,デ ヨン
【テーマコード(参考)】
4B063
4B065
4H045
【Fターム(参考)】
4B063QA13
4B063QA17
4B063QQ08
4B063QS39
4B063QX01
4B065AA93X
4B065AA94X
4B065CA46
4H045AA11
(57)【要約】
新生抗原をスクリーニングする方法、システム及びその用途に係り、さらに具体的には、その発現ががん細胞の生存に必須であり、かつ/あるいはがん組織内のあらゆる細胞で均一な遺伝子に由来する新生抗原を診断、及び/または治療標的としてスクリーニングする方法、システム及びその用途が開示される。
【特許請求の範囲】
【請求項1】
がん患者からエクソーム(exome)、トランスクリプトーム(transcriptome)、単一細胞トランスクリプトーム(single cell transcriptome)、ペプチドーム(peptidome)または全体ゲノムの配列分析データを得る段階と、
がん細胞生存依存性遺伝子を選別する段階と、
前記がん細胞生存依存性遺伝子から導き出された新生抗原を得る段階と、を含む、新生抗原をスクリーニングする方法。
【請求項2】
前記方法は、前記新生抗原と、抗原提示細胞のHLAとの結合親和力を判断する段階をさらに含む、請求項1に記載の方法。
【請求項3】
前記がん細胞生存依存性遺伝子を選別する段階は、細胞生存依存性予測モデルを利用し、がん細胞の生存に必須ながん細胞生存依存性遺伝子を選別することを含み、
前記細胞生存依存性予測モデルは、細胞の遺伝子発現と、細胞死との関係を学習させることによって生成され、遺伝子の発現量低減または除去により、がん細胞死をもたらす遺伝子を、がん細胞生存依存性遺伝子として選別する、請求項1に記載の方法。
【請求項4】
前記選別されたがん細胞生存依存性遺伝子は、その発現量低減時またはその除去時、がん細胞死をもたらすが、正常細胞の生存には影響を及ぼさない、請求項3に記載の方法。
【請求項5】
前記細胞の遺伝子発現と、細胞死との関係は、標的化された遺伝子発現低減またはその除去によるがん細胞株の死滅いかんに係わるインビトロデータまたはインシリコデータに基づく、請求項3に記載の方法。
【請求項6】
前記がん細胞生存依存性遺伝子を選別する段階は、前記細胞生存依存性予測モデルから選別されたがん細胞生存依存性遺伝子が、がん患者で得られた全てのがん細胞で均一に発現されるか否かということを判断する段階をさらに含む、請求項3に記載の方法。
【請求項7】
前記がん細胞生存依存性遺伝子から導き出された新生抗原を得る段階は、
がん患者から得られた配列分析データから、がん細胞からの配列と、正常細胞からの配列とを比較し、がん患者の新生抗原を得る段階と、
前記得られた新生抗原のうちから、前記がん細胞生存依存性遺伝子から導き出された新生抗原を収集する段階と、を含む、請求項1に記載の方法。
【請求項8】
前記新生抗原を収集する段階は、前記がん細胞生存依存性遺伝子の非同義(nonsynonymous)突然変異を選別する段階をさらに含む、請求項7に記載の方法。
【請求項9】
前記新生抗原は、がん患者特異的である、請求項1に記載の方法。
【請求項10】
前記新生抗原と、抗原提示細胞のHLAとの結合親和力を判断する段階は、
前記新生抗原の配列を、抗原ペプチドと、抗原提示細胞のHLAとの結合親和力を予測する新生抗原結合親和力予測モデルに入力し、結合親和力予測を得る段階を含み、
前記新生抗原結合親和力予測モデルは、ペプチドのアミノ酸と、HLAのアミノ酸との相互作用データでもって学習させて生成されたものである、請求項2に記載の方法。
【請求項11】
前記抗原提示細胞は、樹状細胞、大食細胞、B細胞、またはそれらの組み合わせである、請求項10に記載の方法。
【請求項12】
前記HLAは、MHCクラスIあるいはMHCクラスIIである、請求項10に記載の方法。
【請求項13】
前記新生抗原と、前記抗原提示細胞のHLAとのCNN-MHC数値が>0.5である場合、結合親和力があると判断する、請求項10に記載の方法。
【請求項14】
少なくとも1つのインストラクションを保存するためのメモリと、
前記メモリに保存された前記少なくとも1つのインストラクションを実行する少なくとも1つのプロセッサと、を含み、
前記プロセッサは、前記少なくとも1つのインストラクションを実行することにより、
細胞の遺伝子発現量と、細胞死との関係を学習させ、遺伝子発現に係わる細胞生存の依存性を予測する細胞生存依存性予測モデルを生成し、
がん患者の遺伝子発現プロファイルを、前記細胞生存依存性予測モデルに入力し、がん細胞生存依存性遺伝子を選別し、がん患者の遺伝子発現プロファイルから、前記がん細胞生存依存性遺伝子から導き出された新生抗原を得て、
ペプチドと抗原提示細胞とのアミノ酸相互作用に基づき、結合親和力を予測する新生抗原結合親和力予測モデルを生成し、
前記新生抗原結合親和力予測モデルを利用し、抗原提示細胞のHLAとの結合親和力がある新生抗原を選択する、新生抗原スクリーニング用システム。
【請求項15】
前記細胞生存依存性予測モデルは、細胞の遺伝子発現量と、細胞死との関係を学習させることによって生成され、遺伝子の発現量低減または除去により、がん細胞死をもたらす遺伝子を、がん細胞生存依存性遺伝子として選別する、請求項14に記載のシステム。
【請求項16】
前記プロセッサは、前記少なくとも1つのインストラクションを実行することにより、前記新生抗原と、前記抗原提示細胞のHLAとのCNN-MHC数値が>0.5である場合、結合親和力がある新生抗原として選択する、請求項14に記載のシステム。
【請求項17】
前記プロセッサは、前記少なくとも1つのインストラクションを実行することにより、それぞれ遺伝子の発現と、細胞死との関係、及び新生抗原と、抗原提示細胞のHLAとの結合親和力の関係を学習する、請求項14に記載のシステム。
【請求項18】
前記細胞の遺伝子発現と、細胞死との関係は、標的化された遺伝子発現低減またはその除去によるがん細胞株の死滅いかんに係わるインビトロデータまたはインシリコデータに基づく、請求項17に記載のシステム。
【請求項19】
前記新生抗原結合親和力予測モデルは、ペプチドのアミノ酸と、HLAのアミノ酸との相互作用データでもって学習させて生成されたものである、請求項14に記載のシステム。
【請求項20】
前記がん患者の遺伝子発現プロファイルは、エクソーム、トランスクリプトーム、単一細胞トランスクリプトーム、ペプチドームまたは全体ゲノムの配列分析データである、請求項14に記載のシステム。
【請求項21】
請求項1ないし13のうちいずれか1項に記載の方法によって新生抗原を得る段階と、
前記新生抗原を含む抗がんワクチンを製造する段階と、を含む、抗がんワクチンを製造する方法。
【請求項22】
前記新生抗原を含む、9個ないし30個のアミノ酸で構成されたペプチド配列を得る段階と、
前記ペプチド配列から親水性及び安定性を有するペプチド配列を選択する段階と、をさらに含む、請求項21に記載の方法。
【請求項23】
前記選択されたペプチド配列は、Kyte-Doolittle GRAVY<0であり、InstaIndex<40である、請求項22に記載の方法。
【請求項24】
請求項1ないし13のうちいずれか1項に記載の方法によって得られた新生抗原を含む、抗がんワクチン。
【請求項25】
請求項1ないし13のうちいずれか1項に記載の方法によって新生抗原を得る段階と、
がん患者の試料から前記新生抗原の量を測定する段階と、を含む、がん患者の治療予後を予測する情報を提供する方法。
【請求項26】
前記得られた新生抗原の量を、治療予後が確認されたがん患者からなる対照群から得られた前記新生抗原の量と比較する段階をさらに含む、請求項25に記載の方法。
【請求項27】
請求項1ないし13のうちいずれか1項に記載の方法によって得られた新生抗原を含む、がん患者の治療予後予測用組成物。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、新生抗原をスクリーニングする方法、システム及びその用途に係り、さらに具体的には、その発現ががん細胞の生存に必須であり、かつ/あるいはがん組織内の全ての細胞において、均一な遺伝子に由来する新生抗原を診断、及び/または治療標的としてスクリーニングする方法、システム及びその用途に関する。
【背景技術】
【0002】
免疫抗がん治療は、現在最も関心が寄せられている抗がん療法であり、反応する患者群においては、高い完治率を期待することができ、抗がん治療の新たなパラダイムを提示している。全世界的に、3,400件を超えるグローバル免疫抗がん剤臨床試験が施行されるというように、活発に研究されている。
【0003】
抗がんワクチンは、がん特異抗原を利用し、免疫体系を活性化させる免疫抗がん治療剤の一種であり、免疫チェックポイント阻害剤(checkpoint blockade)との併用療法を介する免疫抗がん治療の核心技術として注目されている。しかしながら、該免疫チェックポイント阻害剤、例えば、抗PD-1/抗PD-L1の実際成功率は、15~20%に過ぎず、全般的なT細胞の免疫調節機能を喪失させる過程が含まれており、自家免疫疾患のような副作用が示される心配が大きい。がん患者の反応率を向上させ、副作用を最小化させることができる治療剤への要求が依然として存在する。
【0004】
患者誂え向き抗がんワクチンは、患者特異的新生抗原(neoantigen)を標的にした最適のワクチンデザインが可能であり、がん患者の治療効果を高め、副作用は、最小化させることができる治療方法として開発されている。患者内免疫作用が、がん細胞特異的新生抗原に集中されるように誘導し、免疫抗がん治療の効果を高めることができ、そのためには、最適の新生抗原を選択する技術が核心である。
【0005】
がん細胞は、免疫編集(immunoediting)という過程を介し、抗がん免疫反応を回避することができる形態に進化する。そのように進化したがん細胞群が、免疫抗がん治療に対する抵抗性及びがん再発の原因になると見られている。そのような腫瘍の異質性と可塑性とによる免疫回避メカニズムを克服することができる新生抗原標的の開発が要求される。韓国特許出願公開第2018-0107102号は、個人化されたがんワクチンに対する新生抗原を同定及び選別する方法を開示するが、がん細胞の免疫回避はもとより、その克服必要性につき、全く開示も暗示もしていない。
【0006】
本発明者らは、抗がんワクチンとして有効な新生抗原発掘を困難にするがん細胞の免疫編集メカニズムを回避することができる戦略に係わる研究を行い、診断、及び/または治療標的として有効な新生抗原をスクリーニングする方法に関する発明を完成した。
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、がん細胞の免疫回避を克服する新生抗原をスクリーニングする方法を提供することを目的とする。
【0008】
本発明は、また、がん細胞の免疫回避を克服する新生抗原のスクリーニングのためのシステムを提供することを目的とする。
【0009】
本発明は、また、がん細胞の免疫回避を克服する新生抗原を含む抗がんワクチンを提供することを目的とする。
【0010】
本発明は、また、がん細胞の免疫回避を克服する新生抗原を含むがん患者の治療予後予測用組成物を提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明の一態様は、
がん患者から、エクソーム(exome)、トランスクリプトーム(transcriptome)、単一細胞トランスクリプトーム(single cell transcriptome)、ペプチドーム(peptidome)または全体ゲノムの配列分析データを得る段階と、
がん細胞生存依存性遺伝子を選別する段階と、
前記がん細胞生存依存性遺伝子から導き出された新生抗原を得る段階と、を含む、新生抗原をスクリーニングする方法を提供する。
【0012】
本発明の一具体例において、新生抗原をスクリーニングする方法は、前記新生抗原と、抗原提示細胞のHLA(human leukocyte antigen)との結合親和力を判断する段階をさらに含むものでもある。
【0013】
本発明の一具体例において、がん細胞生存依存性遺伝子は、その発現量低減時またはその除去時、さまざまな種類のがん細胞、または当該患者由来のがん細胞死をもたらすものでもある。
【0014】
本発明の一具体例において、がん細胞生存依存性遺伝子は、さまざまな種類のがんまたはがん細胞の生存に普遍的に必須な普遍的依存性遺伝子でもある。
【0015】
本発明の一具体例において、がん細胞生存依存性遺伝子は、前記がん患者に由来するがん細胞の生存に必須ながん患者特異的依存性遺伝子でもある。
【0016】
本発明の一具体例において、がん細胞生存依存性遺伝子は、普遍的依存性遺伝子またはがん患者特異的依存性遺伝子、または普遍的依存性遺伝子及びがん患者特異的依存性遺伝子を含むものでもある。
【0017】
本発明の一具体例において、がん細胞生存依存性遺伝子を選別する段階は、細胞生存依存性予測モデルを利用し、がん細胞の生存に必須ながん細胞生存依存性遺伝子を選別することを含み、前記細胞生存依存性予測モデルは、細胞の遺伝子発現様相と、細胞死との関係を学習させることによって生成され、遺伝子の発現量低減または除去により、がん細胞死をもたらす遺伝子を、がん細胞生存依存性遺伝子として選別することができる。
【0018】
本発明の一具体例において、前記細胞生存依存性予測モデルは、ディープラーニングを基とし、細胞の遺伝子発現と、細胞死との関係に係わる実験データから学習されるものでもある。
【0019】
本発明の一具体例において、前記遺伝子の発現と、細胞死との関係は、標的化された遺伝子発現低減または除去によるがん細胞株の死滅いかんに係わるインビトロスクリーニング実験データまたはインシリコデータに基づくものでもある。
【0020】
本発明の一具体例において、前記がん細胞生存依存性遺伝子を選別する段階は、前記細胞生存依存性予測モデルから選別されたがん細胞生存依存性遺伝子が、がん患者で得られた全てのがん細胞で均一に発現されるか否かということを判断する段階をさらに含むものでもある。
【0021】
本発明の一具体例において、前記がん細胞生存依存性遺伝子から導き出された新生抗原を得る段階は、がん患者から得られた配列分析データから、がん細胞からの配列と、正常細胞からの配列とを比較し、がん患者の新生抗原を得る段階と、前記得られた新生抗原のうちから、前記がん細胞生存依存性遺伝子から導き出された新生抗原を収集する段階と、を含むものでもある。
【0022】
本発明の一具体例において、前記がん細胞生存依存性遺伝子から導き出された新生抗原を得る段階は、がん患者から得られた配列分析データからの配列と、正常対照群から得られた配列分析データからの配列とを比較し、がん患者の新生抗原を得る段階と、前記得られた新生抗原のうちから、前記がん細胞生存依存性遺伝子から導き出された新生抗原を収集する段階と、を含むものでもある。
【0023】
本発明の一具体例において、前記新生抗原を収集する段階は、前記がん細胞生存依存性遺伝子の非同義(nonsynonymous)突然変異を選別する段階をさらに含むものでもある。
【0024】
本発明の一具体例において、前記新生抗原と、抗原提示細胞のHLAとの結合親和力を判断する段階は、前記新生抗原の配列を、抗原ペプチドと、抗原提示細胞のHLAとの結合親和力を予測する新生抗原結合親和力予測モデルに入力し、結合親和力予測を得る段階を含み、前記新生抗原結合親和力予測モデルは、ペプチドのアミノ酸と、HLAのアミノ酸との相互作用データでもって学習させて生成されたものでもある。
【0025】
本発明の一具体例において、前記抗原提示細胞は、樹状細胞、大食細胞、B細胞、またはそれらの組み合わせでもある。
【0026】
本発明の一具体例において、前記HLAはMHC(major histocompatibility class)クラスIあるいはMHCクラスIIでもある。
【0027】
本発明の一具体例において、前記新生抗原と、前記抗原提示細胞のHLAとのCNN-MHC数値が>0.5である場合、結合親和力があるとも判断される。
【0028】
本発明の一具体例において、前記がん細胞生存依存性遺伝子は、がん細胞の生存に係わる必須性により、複数個にも選別される。
【0029】
本発明の一具体例において、前記がん細胞生存依存性遺伝子は、がん細胞の生存に係わる必須性により、それぞれ上位及び下位の5個、10個、またはその以上にも選別される。
【0030】
本発明の一具体例において、前記新生抗原は、がん患者特異的新生抗原でもある。
【0031】
本発明の他の態様は、
メモリに保存された前記少なくとも1つのインストラクションを実行する少なくとも1つのプロセッサを含み、
前記プロセッサは、前記少なくとも1つのインストラクションを実行することにより、
細胞の遺伝子発現量と、細胞死との関係を学習させ、遺伝子発現に係わる細胞生存の依存性を予測する細胞生存依存性予測モデルを生成し、
がん患者の遺伝子発現プロファイルを、前記細胞生存依存性予測モデルに入力し、がん細胞生存依存性遺伝子を選別し、がん患者の遺伝子発現プロファイルから、前記がん細胞生存依存性遺伝子から導き出された新生抗原を得て、
ペプチドと抗原提示細胞とのアミノ酸相互作用に基づき、結合親和力を予測する新生抗原結合親和力予測モデルを生成し、
前記新生抗原結合親和力予測モデルを利用し、抗原提示細胞のHLAとの結合親和力がある新生抗原を選択するものである新生抗原スクリーニング用システムを提供する。
【0032】
本発明の一具体例において、前記システムは、本発明の一具体例による、新生抗原をスクリーニングする方法を実施するためにも使用される。
【0033】
本発明の一具体例において、前記細胞生存依存性予測モデルは、細胞生存依存性遺伝子を選別するか、あるいは新生抗原が導き出された遺伝子の細胞生存依存性を予測することができる。
【0034】
本発明の一具体例において、前記細胞生存依存性予測モデルは、細胞の遺伝子発現量と、細胞死との関係を学習させることによって生成され、遺伝子の発現量低減または除去により、がん細胞死をもたらす遺伝子を、がん細胞生存依存性遺伝子として選別するものでもある。
【0035】
本発明の一具体例において、がん細胞生存依存性遺伝子は、さまざまな種類のがんまたはがん細胞の生存に普遍的に必須な普遍的依存性遺伝子でもある。
【0036】
本発明の一具体例において、がん細胞生存依存性遺伝子は、特定のがん患者に由来するがん細胞の生存に必須ながん患者特異的依存性遺伝子でもある。
【0037】
本発明の一具体例において、がん細胞生存依存性遺伝子は、普遍的依存性遺伝子またはがん患者特異的依存性遺伝子、または普遍的依存性遺伝子及びがん患者特異的依存性遺伝子を含むものでもある。
【0038】
本発明の一具体例において、前記プロセッサは、前記少なくとも1つのインストラクションを実行することにより、前記新生抗原と、前記抗原提示細胞のHLAとのCNN-MHC数値が>0.5である場合、結合親和力がある新生抗原として選択するものでもある。
【0039】
本発明の一具体例において、前記プロセッサは、前記少なくとも1つのインストラクションを実行することにより、それぞれ遺伝子の発現と、細胞死との関係、及び新生抗原と、抗原提示細胞のHLAとの結合親和力の関係を学習するものでもある。
【0040】
本発明の一具体例において、前記学習は、ディープラーニングに基づいても遂行される。
【0041】
本発明の一具体例において、前記細胞の遺伝子発現と、細胞死との関係は、標的化された遺伝子発現低減または除去によるがん細胞株の死滅いかんに係わるインビトロデータまたはインシリコデータに基づくものでもある。
【0042】
本発明の一具体例において、前記新生抗原結合親和力予測モデルは、ペプチドのアミノ酸と、HLAのアミノ酸との相互作用データでもって学習させて生成されたものでもある。
【0043】
本発明の一具体例において、前記がん患者の遺伝子発現プロファイルは、エクソーム、トランスクリプトーム、単一細胞トランスクリプトーム、ペプチドームまたは全体ゲノムの配列分析データでもある。
【0044】
本発明の一具体例において、前記HLAは、MHCクラスIあるいはMHCクラスIIでもある。
【0045】
本発明の一具体例において、前記新生抗原と、前記抗原提示細胞のHLAとのCNN-MHC数値が>0.5である場合、結合親和力があるとも判断される。
【0046】
本発明の一具体例において、前記がん細胞生存依存性遺伝子は、がん細胞の生存に係わる必須性により、複数個にも選別される。
【0047】
本発明のさらに他の態様は、
前述の本発明の一態様によるスクリーニング方法により、新生抗原を得る段階と、
前記新生抗原を含む抗がんワクチンを製造する段階と、を含む、抗がんワクチンを製造する方法を提供する。
【0048】
本発明の一具体例において、前記抗がんワクチンを製造する方法は、前記新生抗原部位を含む、9個ないし30個のアミノ酸で構成されたペプチド配列を得る段階と、
前記ペプチド配列から親水性及び安定性を有するペプチド配列を選択する段階と、をさらに含むものでもある。
【0049】
本発明の一具体例において、前記選択されたペプチド配列は、Kyte-Doolittle GRAVY<0であり、InstaIndex<40でもある。
【0050】
本発明の一具体例において、前記ペプチド配列は、12個ないし30個、15個ないし30個、または15個ないし25個のアミノ酸によっても構成される。
【0051】
本発明のさらに他の態様は、前述の本発明の一態様によるスクリーニング方法によって得られた新生抗原を含む抗がんワクチンを提供する。
【0052】
該抗がんワクチンは、特異的細胞毒性T細胞反応及び/または特異的ヘルパーT細胞反応を誘発しうる。
【0053】
本発明の一具体例において、前記抗がんワクチンは、新生抗原を含むペプチドを含むものでもある。
【0054】
本発明の一具体例において、前記ペプチドは、15個ないし30個のアミノ酸で構成された長さを有し、抗原提示細胞のHLAに結合し、新生抗原に特異的なT細胞を活性化させることができる。
【0055】
本発明の一具体例において、前記抗がんワクチンは、2種以上の新生抗原を含むペプチドを含むものでもある。
【0056】
本発明の一具体例において、前記抗がんワクチンは、抗がん剤のようなさらなる有効成分、添加剤、賦形剤などをさらに含むものでもある。
【0057】
該抗がんワクチンは、抗原特異的免疫反応を誘発するに十分な量で投与される。該抗がんワクチンに含まれるペプチドの量や、抗がんワクチンの投与量は、過度な実験なしに、当業者によっても決定される。該抗がんワクチンは、静脈内注射、皮下注射、皮内注射、腹腔内注射または筋肉内注射によっても投与される。該抗がんワクチンにおいて、ペプチドの濃度は、広範囲に、約0.1重量%未満、約2重量%ないし約20重量、約50重量%以上などと、多様でもあり、投与方式などを考慮して決定されるのである。該抗がんワクチンの投与量は、新生抗原を含むペプチドの組成、投与方式、対象疾患の病期及び重症度、患者の体重・健康状態などを考慮し、臨床医によって決定されるが、一般的に、70kg患者の場合、約1.0μgないし約50,000μgペプチドの量で投与されうる。
【0058】
本発明のさらに他の態様は、前述の本発明の一態様によるスクリーニング方法によって新生抗原を得る段階と、
がん患者の試料から前記新生抗原の量を測定する段階と、を含む、がん患者の治療予後を予測する情報を提供する方法を提供する。
【0059】
本発明の一具体例において、前記がん患者の治療予後を予測する情報を提供する方法は、前記得られた新生抗原の量を、治療予後が確認されたがん患者からなる対照群から得られた前記新生抗原の量と比較する段階をさらに含むものでもある。
【0060】
本発明の一具体例において、前記対照群は、治療予後が良好であると確認されたがん患者からなるか、あるいは治療予後が良好ではないと確認されたがん患者からもなる。
【0061】
本発明の一具体例において、前記新生抗原の量は、新生抗原の個数でもある。
【0062】
本発明の一具体例において、がん患者の試料において、新生抗原の量または個数が、治療予後が良好ではないがん患者の対照群に比べて大きい場合、がん患者の治療予後は、良好であるとも予測される。
【0063】
本発明の一具体例において、がん患者の試料において、新生抗原の量または個数が、治療予後が良好であるがん患者の対照群に比べて小さい場合、がん患者の治療予後は、良好ではないとも予測される。
【0064】
本発明のさらに他の態様は、前述の本発明の一態様によるスクリーニング方法によって得られた新生抗原を含む、がん患者の治療予後予測用組成物を提供する。
【0065】
本発明の一態様によるがん患者の治療予後予測用組成物は、がん患者の治療予後を予測するために必要なさらなる成分をさらに含むものでもある。
【発明の効果】
【0066】
本発明の一具体例による方法は、がん細胞の生存に必須な普遍的依存性遺伝子あるいはがん患者特異的依存性遺伝子に由来する新生抗原を診断、及び/または治療標的としてスクリーニングすることができるようにし、がん細胞の免疫回避に対する心配なしに、がん細胞に対する免疫治療効果を極大化させることができる新生抗原基盤抗がんワクチンの開発、及びがん患者の治療予後予測に有用に利用されうる。
【図面の簡単な説明】
【0067】
【
図1】本発明の一具体例による、がん細胞生存依存性遺伝子予測をインシリコで行う方法の概略図である。
【
図2】本発明の一具体例による、新生抗原をスクリーニングする方法のフローチャートである。該新生抗原が導き出された遺伝子のがん細胞生存依存性判断と、新生抗原と抗原提示細胞との結合力判断は、必要により、遂行順序及び遂行回数が調整されうる。
【
図3】本発明の一具体例による、新生抗原スクリーニングのためのシステムのブロック図である。
【
図4】本発明の一具体例によるプロセッサのブロック図である。
【
図5】本発明の一具体例による、インビトロ依存性データを利用した新生抗原のスクリーニング方法によって得られた新生抗原の診断、及び/または治療標的としての有意性を示す。肺がん及び黒色腫について公開されたコホートのインビトロ依存性データ(denpendency)及び発現均一性データ(expression homogeneity)を利用し、本発明の一具体例による、がん細胞生存依存性基盤新生抗原のスクリーニング方法の有用性を検証した。灰色点線は、既存に使用される標準的な方法により、全遺伝子を対象に計算された新生抗原個数の差を示す。
【
図6】がん細胞の免疫回避メカニズムの模式図である。新生抗原が導き出される蛋白質ががん細胞の生存に必須であり、全ての細胞で均一に発現される恒時性(constitutive)新生抗原である場合、がん細胞が免疫治療に効果的に反応するが、新生抗原ががん細胞の生存に必須ではないか、あるいは全ての細胞で均一に発現されない可変性(facultative)新生抗原である場合(下端)、免疫治療に対する免疫回避メカニズムが起こることを示す。
【
図7】本発明の一具体例による、インビトロ依存性データ及び単一細胞遺伝子発現データに基づく新生抗原のスクリーニング方法によって得られた新生抗原の免疫治療に対する反応様相を示す。黒色腫免疫チェックポイント阻害剤(checkpoint blockade)処方コホート(Riaz)において、治療前後のクローン変化と遺伝子発現変化とを、新生抗原が由来する遺伝子機能のがん生存に係わる必須性(high dependency vs. low dependency)、及び遺伝子発現の均一性(homogenous vs. heterogenous expression)に分けて比較した結果を示す。CR/PRとSD/PDは、それぞれ肯定的予後と否定的予後とを意味する。肯定的予後を示す患者の場合、高い必須性遺伝子由来新生抗原が主に免疫攻撃を受け、クローン収縮(clonal contraction)を受け、免疫編集の結果として、遺伝子の発現(RNAexpression)が低減された一方、否定的予後を示す患者の場合、低い必須性遺伝子由来新生抗原が主に免疫攻撃を受け、クローン拡張と発現低下とが示されたことを確認することができる。
【
図8】本発明の一具体例による、インビトロ依存性データに基づく新生抗原のスクリーニング方法によって得られた新生抗原の診断/治療標的としての有意性を示す。
図5に提示されたところと類似した分析を、全種類のがん患者サンプルに係わるMSKCCパネル(遺伝子個数468個)結果、及び肺がんと黒色腫との免疫治療コホートにつき、生存分析を行ったものである。
図8の上端(MSK pan-cancer)は、突然変異由来遺伝子を、MSKCCパネル全体(all)、あるいはがん細胞生存に係わる必須性上位50%遺伝子(high fitness)または下位50%遺伝子(low fitness)によって分析した結果であり、中間(lung cancer)及び下端(melanoma)は、肺がんと黒色腫との公開された免疫治療コホートを、全遺伝子、またはがん細胞生存必須性上位500個(high fitness)遺伝子及び下位500個(low fitness)遺伝子について分析した結果である。各遺伝子グループにより、突然変異量(mutation burden)あるいは新生抗原個数(neoantigen load)が多い患者(high)と少ない患者(low)とに分け、治療後の生存率を比較し、HR(hazard ratio)値とp値とをそれぞれ示す。HRが低いほど、p値が低いほど、当該遺伝子グループの治療予後に係わる説明力が高いということを意味する。結果として、標準的な方法により、全遺伝子グループを使用するより、がん細胞生存依存性が高い少数の遺伝子グループを使用する方が、治療予後についてさらに良好に説明するということが分かる。
【
図9】本発明の一具体例によるがん患者特異的インシリコ依存性データに基づいて得られた新生抗原の診断/治療標的としての有意性を示す。TCGA(The Cancer Genome Atlas)で公開された肺がん患者及び乳がん患者に係わるトランスクリプトームデータ(https://portal.gdc.cancer.gov/)を基に、
図1に提示されたインシリコ依存性予測を行った。それらは、免疫抗がん治療を実際に受けた患者ではないので、免疫細胞浸透度が高いサンプル(high leukocyte fraction)と、免疫細胞浸透度が低いサンプル(low leukocyte fraction)とに分け、免疫治療と類似した効果が、免疫細胞浸透度が高いサンプルで示されると仮定した。
図5に提示されたように、新生抗原が由来する遺伝子の患者の生存に係わる説明力を測定し、免疫細胞浸透度が高いサンプルでのみ類似した結果を得た(R:responder;NR:nonresponder)。灰色点線は、既存に使用される標準的な方法により、全遺伝子を対象に計算された新生抗原個数の差を示す。がん患者特異的依存性データが、全般的に、普遍的依存性データに比べ、さらに高い説明力の差を示すということを確認することができた。
【
図10】本発明の一具体例による、新生抗原のスクリーニング方法に使用される新生抗原とMHCとの結合親和力を予測するモデルの模式図である。HLAと新生抗原ペプチドとの二次元マトリックスをアミノ酸類似度マトリックス(amino acid similarity matrix)情報を基に構築し、そこにCNN(convolutional neural network)を適用し、HLAと抗原ペプチドとの結合力を予測するモデルを示す。
【
図11】IEDB(Immune Epitope Database)公式提供テストデータセットを使用し、本発明の一具体例による、CNNとその他方法(NetMHCpan、NetMHCcon、ANN、SMMPMBEC)の性能(AUC、F1 score)比較結果を示す。
【
図12】本発明の一具体例によって予測された新生抗原のHLA結合能を確認した結果を示す。HLA-A02に結合すると予測された新生抗原を含むペプチドの80%が、実際にHLA-A02に結合すると確認された。
【
図13】本発明の一具体例によって選別された新生抗原によって誘導された免疫反応を確認した結果を示す。新生抗原に係わるCD8+T細胞反応確認につき、INFγ分泌に基づくエリスポット(ELISpot)分析は、反応性が予測された15個の候補新生抗原ペプチドのうち10個(66.7%)がT細胞によるINFγ分泌を誘発したということを確認した。
【発明を実施するための形態】
【0068】
本発明は、添付図面と共に、下記において詳細に記載される実施例を参照すれば、明確になるであろう。しかしながら、本発明は、実施例に限定されるものではなく、多様な形態に具現され、本実施例は、単に本発明の開示を完全なものにし、本発明が属する技術分野において当業者に発明の範疇を完全に知らせるために提供されるものであり、本発明は、請求項によって定義される。
【0069】
本明細書で使用される用語「エクソーム(exome)」は、細胞、細胞グループまたは個体に存在するエクソン(exon)の集合を意味する。
【0070】
本明細書で使用される用語「トランスクリプトーム(transcriptome)」は、細胞、細胞グループまたは個体に存在する発現されたRNAの集合を意味する。
【0071】
本明細書で使用される用語「遺伝子発現プロファイル(gene expression profile)」は、細胞のゲノムから発現または転写される遺伝子分析であり、1以上の遺伝子のmRNAレベルを含む遺伝子の発現レベルを示す値のセットを意味する。
【0072】
本明細書で使用される用語「依存性」は、細胞の増殖または生存に係わる必須性を意味し、「必須性」と互換的に使用される。
【0073】
本明細書で使用される用語「依存性遺伝子」は、細胞の増殖または生存に必須な遺伝子を意味する。さらに具体的には、依存性遺伝子は、その発現が低減されるか、あるいは除去されれば、細胞の増殖低減及び/または死滅をもたらす遺伝子であり、細胞がその生存のために依存する遺伝子を意味し、多様な種類及び/または出処のがんまたはがん細胞の生存に普遍的に必須であると把握された普遍的依存性遺伝子、及び/または個別がん患者に由来するがん細胞の生存に特異的に必須であると把握されたがん患者特異的依存性遺伝子を含むものでもある。該依存性遺伝子は、細胞で必須に恒時性でもって発現され、全ての個別細胞で均一に発現される遺伝子を意味しうる。
【0074】
本明細書で使用される用語「普遍的依存性遺伝子」は、公知されたがん細胞株のような、インビトロデータを介し、多数の多様ながん細胞の生存に必須であると把握された遺伝子を意味する。
【0075】
本明細書で使用される用語「がん患者特異的依存性遺伝子」は、個別がん患者に由来するがん細胞の生存に必須であると把握された遺伝子を意味する。
【0076】
本明細書で使用される用語「新生抗原(neoantigen)」は、免疫反応を起こすペプチドを意味する。すなわち、該新生抗原は、免疫原性ペプチドでもある。該新生抗原は、がん細胞特異的突然変異によって誘導され、がん細胞のエピトープとして示されうる。がん細胞における突然変異、またはがん細胞に特異的な翻訳後の変形を介し、相応する野生型、親(parental)抗原と区別されるようにする少なくとも1つの変更を有する抗原である。該新生抗原は、アミノ酸配列またはヌクレオチド配列を含むものでもある。該突然変異は、フレームシフト突然変異または非フレームシフト(non-frame shift)突然変異、インデル(indel)、置換(missense)または終結(nonsense)、スプライス部位変更、ゲノム再配列または遺伝子融合、あるいは新生ORFを引き起こす任意のゲノムまたは発現の変更を含むものでもある。
【0077】
普遍的依存性またはがん患者特異的依存性の遺伝子から導き出された新生抗原は、がん細胞の免疫編集による免疫回避によって消失しないために、がん患者において、高い免疫治療効果をもたらすことができるがん患者誂え向きがんワクチンのための有効な治療標的にもなり、免疫治療の予後に係わるマーカーとして有効な診断標的にもなる。
【0078】
本明細書で使用される用語「免疫治療」は、免疫反応を利用した治療療法を意味する。該免疫治療は、がん治療にも利用される。例えば、該免疫治療は、免疫チェックポイント阻害剤を利用した治療でもあり、免疫チェックポイント阻害剤は、抗CTLA4遮断剤または抗PD-1/PD-L1遮断剤でもあるが、それらに制限されるものではなく、多様な免疫治療でもある。
【0079】
本明細書で使用される用語「結合親和力」は、新生抗原ペプチドと、抗原提示細胞のMHCとの結合力を意味し、CNN-MHC数値によっても表現される。「CNN-MHC数値」は、新生抗原とMHCとの間の各アミノ酸間の結合強度をマトリックス形態に変換した実験値を基に、ディープラーニングモデルを構築して得た数値であり、シグモイド活性関数に変換された0と1との確率数値を意味する。具体的には、MHCクラスI蛋白質またはMHCクラスII蛋白質と結合可能な免疫原性ペプチドは、0.5以上であるMHC CNN-MHC数値を有しうる。また、CNN-MHC数値が1に近いほど、MHCクラスI蛋白質またはMHCクラスII蛋白質と免疫原性ペプチドは、強い結合力を有する。
【0080】
本明細書で使用される用語「抗原提示細胞」は、蛋白質抗原を受け入れて処理した後、抗原由来ペプチド切片を、MHCクラスIIと共に、T細胞に提示して活性化させる細胞を意味し、大食細胞、B細胞、樹状細胞などでもある。
【0081】
本明細書で使用される用語「細胞生存依存性予測モデル」は、個別遺伝子の発現低減または除去による細胞の生存または死滅に係わる確率を予測するモデルを意味する。具体的には、遺伝子のノックアウト/ノックダウンによる細胞生存に係わる効果を、マシンラーニングによって学習し、特定遺伝子の細胞生存に係わる効果を予測するモデルであり、該マシンラーニングは、RNAiまたはCRISPR/Cas9などを利用した遺伝子のノックアウト/ノックダウンのインビトロデータによっても行われる。細胞生存依存性予測モデルに、遺伝子発現プロファイルや配列を入力すれば、当該配列が由来する遺伝子の細胞生存依存性を予測することができる。
【0082】
本明細書で使用される用語「新生抗原結合親和力予測モデル」は、新生抗原と抗原提示細胞との結合親和力、具体的には、新生細胞と、抗原提示細胞のMHCとの結合親和力を予測するモデルを意味する。ペプチド配列と、HLA配列とのアミノ酸相互作用に基づく結合親和力を、マシンラーニングによって学習し、新生抗原のペプチド配列を入力すれば、それと、抗原提示細胞のHLAとの結合親和力を予測することができ、設定された結合親和力の尺度により、新生抗原を分類することができる。
【0083】
実施例1.がん細胞生存依存性遺伝子の選別
遺伝子の機能が、がんまたはがん細胞の生存に必須なのかいかんを判断するために、全遺伝子に係わるノックアウト/ノックダウンを行うことができるRNAiあるいはCRISPRライブラリーを利用し、HTS(high-throughput screening)を行うことができる。具体的には、がん細胞に、shRNAライブラリーまたはCRISPR sgRNAを形質感染させ、一定時間を経た次、ディープシーケシング(deep sequencing)を行い、初期状態のシーケシング結果と比較することにより、どの遺伝子が不活性化された細胞が死滅したかということを定量的にプロファイリングし、がん細胞の生存に必須な遺伝子をインビトロで選別することができる。
図1は、がん細胞の生存に必須な遺伝子を予測する方法を概略的に図示する。
【0084】
そのような方法により、がん細胞の生存に必須な遺伝子に係わるインビトロデータが、細胞株の個数を増やしながら、続けて生産されており、主要固形がん、例えば、肺がん、卵巣がん、大腸がん、胃がん、乳がんなどにつき、相当数のがん細胞株に係わる依存性データが確立されている((https://depmap.org/portal/及びhttps://depmap.sanger.ac.uk/)。そのようなデータを、本発明の一具体例により、普遍的依存性遺伝子に係わるデータとして使用するか、あるいはディープラーニングを基に、がん患者特異的依存性遺伝子をインシリコで予測する目的に使用した。
【0085】
がん細胞株に係わるインビトロデータは、普遍的依存性遺伝子を獲得するのに使用することができ、一方、がん患者のトランスクリプトームデータのようながん患者に由来するデータは、がん細胞株に係わるインビトロデータから学習された細胞生存依存性予測モデルに適用し、各患者サンプル別依存性(dependency)を予測し、がん患者特異的依存性遺伝子を選別するために使用することができる。
【0086】
また、単一細胞トランスクリプトームデータにつき、細胞生存依存性予測モデルを適用し、腫瘍異質性(tumor heterogeneity)により、互いに異なる細胞の依存性様相を把握することができ、さまざまな細胞において同一に依存性を示す遺伝子を、普遍的依存性遺伝子として選択することができる。がん細胞の生存に必須であり、個別細胞レベルで均一な発現を示す遺伝子が、有効な診断及び/または標的にもなる依存性遺伝子として選別される。
【0087】
該細胞生存依存性予測モデルは、入力階層、複数の隠匿階層、及び出力階層によって構成されたディープラーニング神経網に基づくモデルである。該神経網は、前述のインビトロデータが入力階層に入力されれば、複数の隠匿階層においては、細胞の遺伝子発現様相と、細胞死との関係が学習され、出力階層においては、所定の確率値が出力されるように構成される。このとき、所定の確率値には、細胞が死滅に至る確率を示す値、及び細胞が成長する確率を示す値が含まれる。
【0088】
がん患者に係わる単一細胞トランスクリプトームデータを利用することができる場合、細胞生存依存性モデルを介し、がん患者特異的依存性遺伝子を選別するのに使用され、そうではない場合、既公開の他のがん患者サンプルに係わるデータを使用し、普遍的依存性遺伝子選別を行うことができる。
【0089】
実施例2.普遍的依存性遺伝子から導き出された新生抗原の選別及び診断/治療標的としての有意性
新生抗原は、MHC蛋白質と結合し、がん細胞表面に導き出され、免疫細胞が抗原として認識する、正常細胞にはないが、がん特異的な突然変異によって生成される蛋白質切片であるペプチドを意味する。該新生抗原は、免疫抗がん治療の核心要素として、新生抗原の個数が多いほど、免疫抗がん治療に対する反応性が良好であると知られており、該新生抗原の量(neoantigen load)が診断マーカーとして活用されている。しかしながら、該新生抗原は、多様な遺伝子で導き出されており、それぞれ性質が異なるために、診断マーカーや治療標的としての有用性が異なるであろう。本実施例においては、実施例1に記載されたように、がん細胞生存依存性遺伝子に由来する新生抗原を、免疫抗がん治療の効果を極大化させうる有用な新生抗原として選別し、その免疫治療反応性を確認した。
【0090】
具体的には、表1に記載された免疫チェックポイント阻害剤処方コホートを利用し、免疫治療反応性を比較した。
【0091】
【0092】
2-1.プリセラピー(pre-therapy)コホート
プ リセラピー結果のみある肺がん及び黒色腫について公開されたコホートのインビトロ依存性データ及び発現均一性データを利用し、本発明の一具体例による、がん細胞生存依存性基盤新生抗原のスクリーニング方法の有用性を検証した。分析結果が、
図5に図示される。具体的には、新生抗原が由来する遺伝子のがん細胞生存に係わる必須性で整列した後、上位(high dependency)及び下位(low dependency)の500個ないし2,000個を選定し、免疫抗がん治療に係わる予後が良好である患者と、良好ではない患者との遺伝子別新生抗原個数の差(differential neoantigen load)を、数式
【0093】
【0094】
を利用して計算した。この差が大きいほど、治療予後に係わる説明力が良好であると見ることができる。灰色点線は、既存に使用される標準的な方法により、全遺伝子を対象に計算された新生抗原個数の差を示す。結果として、少数の高必須性遺伝子または均一発現遺伝子を使用した場合が、かえって全遺伝子を使用した場合より良好な説明力を示し、低必須性遺伝子または非均一発現遺伝子を使用した場合の説明力は、良好ではないということを見ることができる。同様に、発現均一性(expression homogeneity)と遺伝子発現レベル(expression level)とにより、新生抗原個数差を計算した。これを介し、遺伝子の発現レベル自体より、遺伝子の必須性と発現均一性とが治療予後に係わる説明力がさらにすぐれているということが分かる。具体的には、新生抗原が由来する遺伝子のがん細胞生存に係わる必須性で整列した後、上位(high dependency)及び下位(low dependency)の500個ないし2,000個を選定し、遺伝子別免疫抗がん治療に係わる予後が良好である患者と、良好ではない患者との新生抗原個数の差(differential neoantigen load)を計算した。この差が大きいほど、治療予後に係わる説明力が良好であると見ることができる。灰色点線は、既存に使用される標準的な方法により、全遺伝子を対象に計算された新生抗原個数の差を示す。結果として、少数の高必須性遺伝子あるいは均一発現遺伝子を使用した場合が、かえって全遺伝子を使用した場合より良好な説明力を示し、低必須性遺伝子あるいは非均一発現遺伝子を使用した場合の説明力は、良好ではないと見ることができる。同様に、発現均質性(expression homogeneity)と遺伝子発現レベル(expression level)により、新生抗原個数差を計算した。これを介し、遺伝子の発現値自体より、遺伝子の必須性と発現均一性とが治療予後に係わる説明力がさらにすぐれているということが分かる。
【0095】
そのような結果は、免疫反応が集中する新生抗原が由来する遺伝子の機能が、がんの増殖や生存に必須ではない場合、免疫回避メカニズムがさらに活発に起こりうるということを意味する。
図6は、がん細胞の免疫回避メカニズムの模式図を示す。
【0096】
2-2.プリセラピー及びオンセラピー(on-therapy)コホート
免疫チェックポイント阻害剤の治療前(プリセラピー)及び治療中(オンセラピー)のデータを有するRiazコホートのデータを利用し、新生抗原由来遺伝子の依存性と免疫治療反応性とを分析した。
図7に、その結果が図示される。
【0097】
具体的には、黒色腫免疫チェックポイント阻害剤処方コホート(Riaz)において、治療前後のクローン変化と遺伝子発現変化とにつき、新生抗原が由来する遺伝子機能のがん生存に係わる必須性(high dependency vs.low dependency)、及び遺伝子発現の均一性(homogenous vs. heterogenous expression)に分けて比較した結果を示す。CR/PRとSD/PDは、それぞれ肯定的予後と否定的予後とを意味する。
【0098】
治療反応が良好である患者群(CR(complete remission)/PR(partial remission))の場合、発現が均一な遺伝子と、がん細胞生存に必須な依存性遺伝子とに由来する新生抗原が、主に抗がん免疫反応の対象になり、クローン収縮(clonal contraction)が起こると共に、RNAレベルにおける発現量が落ちている一方、治療反応が良好ではない患者群(SD(stable disease)とPD(progressive disease))の場合、異質的な発現を示す遺伝子と、がん細胞生存に必須ではない遺伝子とに由来する新生抗原が、主な免疫攻撃の対象になり、免疫編集を介し、遺伝子発現が低減され、免疫回避に成功した結果、かえってクローン拡張(clonal expansion)が起きたことを確認した。
【0099】
2-3.MSK-IMPACT(integrated mutation profiling of actionable cancer targets)
新生抗原由来遺伝子の依存性と免疫治療反応性とを、さまざまながん腫について検証するために、MSK-IMPACTを利用した。
【0100】
既存研究においては、いわゆる、MSKCC(Memorial Sloan Kettering Cancer Center)パネルに属した468個の遺伝子に限り、免疫チェックポイント阻害剤治療を受けた多様ながん腫にわたる1,662名の突然変異量(新生抗原量と比例する)を測定し、その量が免疫治療反応性の重要決定因子であるという事実を明らかにした(Nat. Genet. 51: 202-206, 2019)。
【0101】
本実施例においては、MSKCCパネルに存在する468個の遺伝子のうち、がん細胞生存必須性が高い遺伝子(high dependency)上位50%を選別し、突然変異量を測定するとき、468個遺伝子いずれをも使用したときより、免疫チェックポイント阻害剤治療の反応性と、さらに高い関連性を有することを確認した。その結果が、
図8上端に図示される。MSKCCパネル全体(all)、がん細胞生存に係わる必須性上位50%遺伝子(high fitness)、または下位50%遺伝子(low fitness)によって生存分析を行った結果でもって、治療後の生存率を比較し、HR(hazard ratio)値とp値とをそれぞれ示す。HRが低いほど、p値が低いほど、当該遺伝子グループの治療予後に係わる説明力が高いということを意味する。がん細胞の生存と高い依存性を有する上位50%に属する226個の遺伝子の突然変異量(mutation load)が486個全体遺伝子の突然変異量より、免疫治療反応性とさらに高い関連性を示した。
【0102】
また、
図8の中間及び下端は、それぞれ肺がんと黒色腫との公開された免疫治療コホートを、全遺伝子、またはがん細胞生存必須性上位500個及びその下位500個遺伝子によって分析した結果である。各遺伝子グループにより、突然変異量(mutation burden)または新生抗原個数(neoantigen load)が多い患者と、少ない患者とに分け、治療後の生存率を比較し、HR値とp値とをそれぞれ示す。結果として、標準的な方法により、全遺伝子グループを使用するより、がん細胞生存依存性が高い少数の遺伝子グループを使用する方が、治療予後についてさらに良好に説明するということが分かる。
【0103】
そのような結果を総合するとき、抗原(新生抗原及び表面抗原を含む)が由来する遺伝子のがん細胞における必須性と、組織内個別細胞間の発現様相の均一性が、がんの免疫反応に非常に重要に作用するということを確認した。これは、治療側面においては、がん生存に係わる必須遺伝子、及び均一な発現を示す遺伝子に由来する新生抗原に集中するように誘導することががんの免疫回避を最小化させるのに必須であり、そのような新生抗原の量が、免疫治療予後を予測することができるマーカーにも利用されるということを示す。
【0104】
実施例3.がん患者特異的依存性遺伝子から導き出された新生抗原の選別及び診断/治療標的としての有意性
本実施例においては、特定のがん患者の試料から得られたデータを、細胞生存依存性予測モデルに適用して選別されたがん患者特異的依存性遺伝子に由来する新生抗原を得て、そのような新生抗原と、がん患者生存との関連性を確認した。
【0105】
実施例2は、普遍的依存性遺伝子から導き出された新生抗原の免疫治療患者生存との関連性を検討した。実施例2で使用された依存性データは、実施例1で説明されたインビトロがん細胞株実験に由来するものであり、与えられた患者の依存性ではなく、さまざまながん細胞株で普遍的に依存性を有する遺伝子を掘り出したものである。前述のように、インビトロ依存性データから、遺伝子の発現量パターンと、細胞死との関係を学習させ、遺伝子発現に対する細胞生存の依存性を予測する細胞生存依存性予測モデルを生成し、がん患者の遺伝子発現プロファイルを、前記予測モデルに入力し、がん患者特異的依存性遺伝子を選別することができる。そのようながん患者特異的インシリコ依存性データに基づいて得られた新生抗原の診断/治療標的としての有意性を確認するために、TCGA(The Cancer Genome Atlas)で公開された肺がん患者及び乳がん患者に係わるトランスクリプトームデータ(https://portal.gdc.cancer.gov/)を使用した。それらは、免疫抗がん治療を実際に受けた患者ではないので、免疫細胞浸透度が高いサンプル(high leukocyte fraction)と、免疫細胞浸透度が低いサンプル(low leukocyte fraction)とに分け、免疫治療と類似した効果が、免疫細胞浸透度が高いサンプルで示されると仮定した。
【0106】
その結果が
図9に図示される。がん細胞の増殖や生存に必須ながん患者特異的依存性遺伝子(high dependency)に由来する新生抗原の個数(
図9の黒色棒グラフ)が、新生抗原全体個数(
図9における水平線)や生存に役に立たない非依存性遺伝子(low dependency)に由来する新生抗原の個数(
図9の灰色棒グラフ)より説明力が高かった。特に、そのような結果は、免疫細胞浸透度が高いサンプルでのみ観察され、がん患者特異的依存性データが、全般的に、普遍的依存性データに比べ、さらに大きい説明力の違いを示すということを確認することができた。
【0107】
実施例4.新生抗原と抗原提示細胞との結合力予測モデル
新生抗原が免疫治療反応性を示すためには、抗原提示細胞によって加工され、細胞表面でHLAと結合しなければならない。
【0108】
新生抗原と抗原提示細胞との結合力予測モデルを構築して検証するために、先行研究で使用したIEDB(Immune Epitope Database)のベンチマークデータを利用し、IEDBに公開された既存機械学習アルゴリズムの予測力結果と比較した。
【0109】
新生抗原と抗原提示細胞との結合力予測モデルは、CNNモデルであり、複数のコンボリューション階層、全連結階層及び出力階層を含み、該コンボリューション階層の全ての出力値を予測に使用するために、プーリング階層は含まない。
【0110】
複数のコンボリューション階層は、入力データから相互作用特徴を抽出し、入力データは、ペプチドのアミノ酸と、HLAのアミノ酸との結合親和度を示すパラメータを含むマップ(map)データを意味する。複数のコンボリューション階層は、特定個数のカーネルまたは加重値マトリックスを利用し、コンボリューションを行う。該全連結階層は、コンボリューション階層の出力値を入力として受けて統合し、該出力階層は、シグモイド(sigmoid)関数を利用し、結合可能性に係わる情報を出力する。
図10は、本発明の一具体例による、新生抗原のスクリーニング方法に使用される新生抗原とMHCとの結合親和力を予測するモデル(CNN-MHC)の模式図である。
【0111】
構築されたモデルを、IEDBにある50,000個以上のペプチド-MHCインビトロ結合実験結果を使用して学習させ、IEDBで毎週新たに公開しているテストデータセット(test data set)で性能を評価した結果、70%以上のテストデータセットにつき、SMMPMBEC、ANN及びNetMHCconのような既存アルゴリズムだけではなく、特に、最も多く使用されているNetMHCpanを凌駕する性能を確認した。その結果が、
図11に図示される。
【0112】
4-1.新生抗原とHLAとの結合確認
本実施例のモデル(CNN-MHC)を利用して予測された新生抗原のHLA分子との実際結合を確認するために、新生抗原のHLAとの結合能をテストした。具体的には、HLA-A02と結合すると予測されたペプチドの結合能を、HLA-A02を発現するT2細胞株(ATCC CRL-1992)を利用して分析した。HLA-A02と結合すると予測されたペプチドが、表2(配列番号1ないし配列番号50)に表示される。表2において、CNN-MHC数値は、新生抗原とMHCとの各アミノ酸間の結合強度をマトリックス形態に変換した実験値を基に、ディープラーニングモデルを構築して得た数値であり、0と1との確率に変換された数値を意味し、NetMHC数値は、新生抗原の結合予測に一般的に使用されるNetMHCツールの最新バージョンであり、質量分析器データを基に学習されたモデルであるNetMHCPan-4.1で計算されたMHC蛋白質とペプチドとの結合予測数値を意味する。2つの数値は、いずれも高いほど、結合確率が高いという意味である。具体的には、培養されたT2細胞株(1x106/ml)に50μg/ml濃度のペプチドを24時間処理した後、APCが標識されたHLA-A2単クローン抗体で染色した。それを流細胞分析器で分析し、結合能を確認した。このとき、陰性対照群として、DMSOを使用し、陽性対照群として、Mart-1とNY-ESOとを使用した。
【0113】
【0114】
図12は、MHC結合分析の結果を示す。本実施例のモデル(CNN-MHC)によって予測されたペプチドの80%が、実際に、HLA-A02に結合すると確認された。広く使用されているNetMHCpan-4.1の予測値(http://www.cbs.dtu.dk/services/NetMHCpan-4.1/)と比較するとき、本実施例のモデルがさらに優秀な予測力を有している。
【0115】
一方、前述の実施例は、
図3でのようなシステムのメモリ110に保存された少なくとも1つのインストラクションを実行するプロセッサ120によっても遂行される。
図4を参照すれば、プロセッサ120は、エクソーム、トランスクリプトームまたは全体ゲノムの配列分析データを得るデータ獲得部121、細胞生存依存性予測モデル及び結合力予測モデルを生成する予測モデル生成部122、細胞生存依存性予測モデルを利用し、がん細胞生存依存性遺伝子を選別する遺伝子選別部123、並びにがん患者の遺伝子発現プロファイルから新生抗原を収集し、結合力予測モデルを利用し、抗原提示細胞のHLAとの結合親和力がある新生抗原を選別する新生抗原選別部124を含むものでもある。
【0116】
予測モデル生成部122がインストラクションを反復して行うことにより、細胞生存依存性予測モデル及び結合力予測モデルは、新たな入力データに基づいて更新されうる。予測モデル生成部を介し、生成及び更新される予測モデルは、メモリにも保存される。
【0117】
実施例5.新生抗原を含む抗がんワクチン
前述の実施例に記載されたように、がん細胞生存依存性遺伝子に由来する新生抗原を含む抗がんワクチンを製造することができる。
【0118】
がん細胞や組織が移植されたマウス細胞株に係わるエクソームシーケシングを行い、正常細胞にはない突然変異を掘り出し、それら突然変異を、抗原提示細胞との結合力予測モデルに適用し、新生抗原候補を選定することができる。細胞生存依存性モデルを利用し、当該がん腫に係わる依存性データから、新生抗原が導き出された遺伝子のがん細胞生存に係わる必須性を判断し、新生抗原を必須性によって整列し、上位5個及び下位5個を選定することができる。選定された新生抗原部位を含む9~30個のアミノ酸によって構成された可能な全てのペプチド配列を生成し、ペプチド合成に適する化学的特性、例えば、親水性が高く(Kyte-Doolittle GRAVY<0)、不安定指数が低い(InstaIndex<40)配列を選定してペプチドを合成し、新生抗原に対する抗がんワクチンを製造することができる。
【0119】
5-1.新生抗原の選定
実施例1ないし4に記載されたような細胞生存依存性予測モデル、及び新生抗原と抗原提示細胞との結合力予測モデルを利用し、がん細胞株のエクソーム及びトランスクリプトームの情報を分析し、細胞生存必須性が高い依存性遺伝子に由来し、HLA結合能を有する突然変異を選定した。
【0120】
5-2.新生抗原による免疫反応確認
新生抗原による免疫反応誘導いかんを確認するために、5-1で選定された新生抗原ペプチドを含み、HLA結合能が予測されるか、あるいは実験的に検証された新生抗原ペプチドを認識するT細胞の生成いかんをテストした。具体的には、特異性を示すT細胞プールを確認するために、マウスがん細胞株が移植されたマウスを使用した。該マウスモデルは、マウス肺がん細胞株であるLLC-1(ATCC CRL-1642) 1x106を、6週齢の体重20gである雄C57BL/6マウスわき腹に皮下注入して生成した。
【0121】
具体的には、がん細胞株のエクソーム及びトランスクリプトームの分析を介し、細胞生存必須性が高く、抗原提示細胞との結合力が高いように予測された突然変異15種を、HLA結合及びCD8+T細胞反応性を予想することができる新生抗原群として選定した。選定されたペプチド情報は、表3(配列番号51ないし65)に整理した。表3に記載されたCNN-MHC数値は、新生抗原とMHCとの各アミノ酸間の結合の強度をマトリックス形態に変換した実験値を基に、ディープラーニングモデルを構築して得た数値であり、0と1との確率に変換された数値であり、高いほど結合確率が高いということを示す。該突然変異配列に合成された9merまたは15merのペプチドでワクチン処理したマウスの脾臓から抽出した脾臓細胞を使用し、新生抗原に係わるCD8+T細胞反応を確認するために、IFNγ分泌に基づくエリスポット(ELISpot)分析を行った。反応性が予測された15個の候補新生抗原ペプチドのうち10個のペプチド(66.7%)によるT細胞のIFNγ分泌を確認した。その結果が
図13に図示される。それにより、本発明の一具体例による方法を利用して選別された新生抗原が、実際に、HLAに結合し、効果的に免疫反応を誘導することができるということを確認した。
【0122】
【0123】
実施例6.新生抗原を利用したがん患者の治療予後予測
前述の実施例に記載されたように、がん細胞生存依存性遺伝子に由来する新生抗原を利用し、がん患者の治療予後を予測することができる。
【0124】
患者の試料に係わるエクソームシーケシングを行い、正常細胞にはないが、がん細胞にだけ存在する突然変異を掘り出し、それら突然変異を、抗原提示細胞との結合力予測モデルに適用し、新生抗原候補を選定することができる。細胞生存依存性モデルを利用し、当該がん腫に係わる依存性データから、新生抗原が導き出された遺伝子のがん細胞生存に係わる必須性を判断し、新生抗原を生存に係わる必須性によって整列し、上位及び下位から、同一個数の遺伝子(例えば、500個)を選定することができる。免疫抗がん治療を受けた患者群から、免疫抗がん治療に対して反応した患者群と、反応していない患者群とを分類し、選定された必須性上位及び必須性下位の遺伝子から導き出された新生抗原の個数を比較し、必須性が高い上位遺伝子から導き出された新生抗原の個数が、患者の治療予後と関連性が高いか否かということを判断することができる。選定する遺伝子の個数を変更しながら、新生抗原の個数と、患者の治療予後との関連性判断を反復し、患者の治療予後を予測するのに必要な依存性遺伝子由来新生抗原を決定することができる。
【0125】
図8は、がん細胞生存に係わる必須性が高い遺伝子由来突然変異量や新生抗原個数が、治療予後に係わる説明力が高く、がん患者の治療予後を予測するためにも利用されるということを示す。
【0126】
前述の本発明の説明は、例示のためのものであり、本発明が属する技術分野の当業者であるならば、本発明の技術的思想や必須特徴を変更せずとも、他の具体的な形態に容易に変形が可能であるということを理解することができるであろう。従って、以上で記述された具体例は、全ての面において例示的なものであり、限定的ではないと理解されなければならない。例えば、単一なものであると説明されている各構成要素は、分散されても実施され、同様に、分散されていると説明されている構成要素も、結合された形態にも実施される。
【配列表】
【手続補正書】
【提出日】2022-07-19
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
がん患者からエクソーム(exome)、トランスクリプトーム(transcriptome)、単一細胞トランスクリプトーム(single cell transcriptome)、ペプチドーム(peptidome)または全体ゲノムの配列分析データを得る段階と、
がん細胞生存依存性遺伝子を選別する段階と、
前記がん細胞生存依存性遺伝子から導き出された新生抗原を得る段階と、を含
み、
前記がん細胞生存依存性遺伝子を選別する段階は、細胞生存依存性予測モデルを利用し、がん細胞の生存に必須ながん細胞生存依存性遺伝子を選別することを含み、
前記細胞生存依存性予測モデルは、細胞の遺伝子発現と、細胞死との関係を学習させることによって生成され、遺伝子の発現量低減または除去により、がん細胞死をもたらす遺伝子を、がん細胞生存依存性遺伝子として選別し、
前記がん細胞生存依存性遺伝子から導き出された新生抗原を得る段階は、
がん患者から得られた配列分析データから、がん細胞からの配列と、正常細胞からの配列とを比較し、がん患者の新生抗原を得る段階と、
前記得られた新生抗原のうちから、前記がん細胞生存依存性遺伝子から導き出された新生抗原を収集する段階と、を含む、新生抗原をスクリーニングする方法。
【請求項2】
前記方法は、前記新生抗原と、抗原提示細胞のHLAとの結合親和力を判断する段階をさらに含む、請求項1に記載の方法。
【請求項3】
前記選別されたがん細胞生存依存性遺伝子は、その発現量低減時またはその除去時、がん細胞死をもたらすが、正常細胞の生存には影響を及ぼさない、請求項
1に記載の方法。
【請求項4】
前記細胞の遺伝子発現と、細胞死との関係は、標的化された遺伝子発現低減またはその
除去によるがん細胞株の死滅いかんに係わるインビトロデータまたはインシリコデータに基づく、請求項
1に記載の方法。
【請求項5】
前記がん細胞生存依存性遺伝子を選別する段階は、前記細胞生存依存性予測モデルから選別されたがん細胞生存依存性遺伝子が、がん患者で得られた全てのがん細胞で均一に発現されるか否かということを判断する段階をさらに含む、請求項
1に記載の方法。
【請求項6】
前記新生抗原を収集する段階は、前記がん細胞生存依存性遺伝子の非同義(nonsynonymous)突然変異を選別する段階をさらに含む、請求項
1に記載の方法。
【請求項7】
前記新生抗原は、がん患者特異的である、請求項1に記載の方法。
【請求項8】
前記新生抗原と、抗原提示細胞のHLAとの結合親和力を判断する段階は、
前記新生抗原の配列を、抗原ペプチドと、抗原提示細胞のHLAとの結合親和力を予測する新生抗原結合親和力予測モデルに入力し、結合親和力予測を得る段階を含み、
前記新生抗原結合親和力予測モデルは、ペプチドのアミノ酸と、HLAのアミノ酸との相互作用データでもって学習させて生成されたものであ
り、
前記HLAは、MHCクラスIあるいはMHCクラスIIである、請求項2に記載の方法。
【請求項9】
前記抗原提示細胞は、樹状細胞、大食細胞、B細胞、またはそれらの組み合わせである、請求項
8に記載の方法。
【請求項10】
前記新生抗原と、前記抗原提示細胞のHLAとのCNN-MHC数値が>0.5である場合、結合親和力があると判断する、請求項
8に記載の方法。
【請求項11】
少なくとも1つのインストラクションを保存するためのメモリと、
前記メモリに保存された前記少なくとも1つのインストラクションを実行する少なくとも1つのプロセッサと、を含み、
前記プロセッサは、前記少なくとも1つのインストラクションを実行することにより、
細胞の遺伝子発現量と、細胞死との関係を学習させ、遺伝子発現に係わる細胞生存の依存性を予測する細胞生存依存性予測モデルを生成し、
前記細胞生存依存性予測モデルは、細胞の遺伝子発現量と、細胞死との関係を学習させることによって生成され、遺伝子の発現量低減または除去により、がん細胞死をもたらす遺伝子を、がん細胞生存依存性遺伝子として選別し、がん患者の遺伝子発現プロファイルと正常細胞または正常対照の遺伝子発現プロファイルとを比較し、新生抗原を得て、前記がん細胞生存依存性遺伝子から導き出された新生抗原を収集し、
がん患者の遺伝子発現プロファイルを、前記細胞生存依存性予測モデルに入力し、がん細胞生存依存性遺伝子を選別し
、前記がん細胞生存依存性遺伝子から導き出された新生抗原を得て、
ペプチドと抗原提示細胞とのアミノ酸相互作用に基づき、結合親和力を予測する新生抗原結合親和力予測モデルを生成し、
前記新生抗原結合親和力予測モデルを利用し、抗原提示細胞のHLAとの結合親和力がある新生抗原を選択する、新生抗原スクリーニング用システム。
【請求項12】
前記プロセッサは、前記少なくとも1つのインストラクションを実行することにより、前記新生抗原と、前記抗原提示細胞のHLAとのCNN-MHC数値が>0.5である場合、結合親和力がある新生抗原として選択する、請求項
11に記載のシステム。
【請求項13】
前記プロセッサは、前記少なくとも1つのインストラクションを実行することにより、
それぞれ遺伝子の発現と、細胞死との関係、及び新生抗原と、抗原提示細胞のHLAとの結合親和力の関係を学習する、請求項
11に記載のシステム。
【請求項14】
前記細胞の遺伝子発現と、細胞死との関係は、標的化された遺伝子発現低減またはその除去によるがん細胞株の死滅いかんに係わるインビトロデータまたはインシリコデータに基づく、請求項
11に記載のシステム。
【請求項15】
前記新生抗原結合親和力予測モデルは、ペプチドのアミノ酸と、HLAのアミノ酸との相互作用データでもって学習させて生成されたものである、請求項
11に記載のシステム。
【請求項16】
前
記遺伝子発現プロファイルは、エクソーム、トランスクリプトーム、単一細胞トランスクリプトーム、ペプチドームまたは全体ゲノムの配列分析データである、請求項
11に記載のシステム。
【請求項17】
請求項1
~10のいずれか1項に記載の方法によって新生抗原を得る段階と、
前記新生抗原を含む抗がんワクチンを製造する段階と、を含
み、
前記抗がんワクチンを製造する段階は、
前記新生抗原を含む、9個ないし30個のアミノ酸で構成されたペプチド配列を得る段階と、
前記ペプチド配列から親水性及び安定性を有するペプチド配列を選択する段階と、をさらに
含む、抗がんワクチンを製造する方法。
【請求項18】
前記選択されたペプチド配列は、Kyte-Doolittle GRAVY<0であり、InstaIndex<40である、請求項
17に記載の方法。
【請求項19】
請求項1
~10のいずれか1項に記載の方法によって新生抗原を得る段階と、
がん患者の試料から前記新生抗原の量を測定する段階と、を含む、がん患者の治療予後を予測する情報を提供する方法。
【請求項20】
前記得られた新生抗原の量を、治療予後が確認されたがん患者からなる対照群から得られた前記新生抗原の量と比較する段階をさらに含む、請求項
19に記載の方法。
【国際調査報告】