IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ノイスコム アーゲーの特許一覧

特許7477888個別化された癌ワクチンの作製のための癌変異の選択
<>
  • 特許-個別化された癌ワクチンの作製のための癌変異の選択 図1
  • 特許-個別化された癌ワクチンの作製のための癌変異の選択 図2A
  • 特許-個別化された癌ワクチンの作製のための癌変異の選択 図2B
  • 特許-個別化された癌ワクチンの作製のための癌変異の選択 図3
  • 特許-個別化された癌ワクチンの作製のための癌変異の選択 図4
  • 特許-個別化された癌ワクチンの作製のための癌変異の選択 図5
  • 特許-個別化された癌ワクチンの作製のための癌変異の選択 図6
  • 特許-個別化された癌ワクチンの作製のための癌変異の選択 図7A
  • 特許-個別化された癌ワクチンの作製のための癌変異の選択 図7B
  • 特許-個別化された癌ワクチンの作製のための癌変異の選択 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-23
(45)【発行日】2024-05-02
(54)【発明の名称】個別化された癌ワクチンの作製のための癌変異の選択
(51)【国際特許分類】
   C12N 15/12 20060101AFI20240424BHJP
   C12Q 1/6886 20180101ALI20240424BHJP
   C12Q 1/6869 20180101ALN20240424BHJP
   C12Q 1/6844 20180101ALN20240424BHJP
   C40B 40/06 20060101ALN20240424BHJP
【FI】
C12N15/12 ZNA
C12Q1/6886 Z
C12Q1/6869 Z
C12Q1/6844 Z
C40B40/06
【請求項の数】 9
(21)【出願番号】P 2021526506
(86)(22)【出願日】2019-11-15
(65)【公表番号】
(43)【公表日】2022-02-07
(86)【国際出願番号】 EP2019081428
(87)【国際公開番号】W WO2020099614
(87)【国際公開日】2020-05-22
【審査請求日】2022-07-19
(31)【優先権主張番号】18206599.5
(32)【優先日】2018-11-15
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】518435943
【氏名又は名称】ノイスコム アーゲー
(74)【代理人】
【識別番号】100088904
【弁理士】
【氏名又は名称】庄司 隆
(74)【代理人】
【識別番号】100124453
【弁理士】
【氏名又は名称】資延 由利子
(74)【代理人】
【識別番号】100135208
【弁理士】
【氏名又は名称】大杉 卓也
(74)【代理人】
【識別番号】100183656
【弁理士】
【氏名又は名称】庄司 晃
(74)【代理人】
【識別番号】100224786
【弁理士】
【氏名又は名称】大島 卓之
(74)【代理人】
【識別番号】100225015
【弁理士】
【氏名又は名称】中島 彩夏
(74)【代理人】
【識別番号】100231647
【弁理士】
【氏名又は名称】千種 美也子
(74)【代理人】
【識別番号】100163544
【弁理士】
【氏名又は名称】平田 緑
(72)【発明者】
【氏名】ニコシア,アルフレード
(72)【発明者】
【氏名】スカルセッリ,エリーザ
(72)【発明者】
【氏名】ラーム,アルミン
(72)【発明者】
【氏名】レオニ,グイド
【審査官】小金井 悟
(56)【参考文献】
【文献】特表2018-524008(JP,A)
【文献】特表2018-507686(JP,A)
【文献】国際公開第2017/106638(WO,A1)
【文献】Cancer Sci.,2017年02月,Vol.108, No.2,pp.170-177
【文献】J. Exp. Clin. Cancer Res.,2018年04月20日,Vol.37, No.86,pp.1-10
【文献】Nature,2017年07月13日,Vo.547, No.7662 (pp.217-221),pp.1-34
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
C12Q 1/00- 3/00
CAplus/MEDLINE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
以下の工程を含む、個別化されたワクチンにおける使用のための癌新生抗原を選択する方法:
(a)個体から得られた癌性細胞の試料中の新生抗原を決定する工程であって、ここで
各新生抗原が
コード配列内に含まれ、
前記個体の非癌性細胞の試料中に存在しない、コードされたアミノ酸配列の変化をもたらすコード配列における少なくとも1つの変異を含み、かつ
癌性細胞の試料中のコード配列の9個~40個、好ましくは19個~31個、より好ましくは23個~25個、最も好ましくは25個の連続するアミノ酸からなり、
(b)各新生抗原について、コード配列内の工程(a)の前記変異のそれぞれの変異誘発遺伝子頻度を決定する工程、
(c)(i)前記癌性細胞の試料において、前記変異の少なくとも1つを含む各コード配列の発現レベルを決定する工程、または
(ii)癌性細胞の試料と同じ癌タイプの発現データベースから、前記変異の少なくとも1つを含む各コード配列の発現レベルを決定する工程、
(d)新生抗原のMHCクラスI結合親和性を予測する工程であって、ここで
(I)HLAクラスI対立遺伝子は、前記個体の非癌性細胞の試料から決定され、
(II)(I)において決定された各HLAクラスI対立遺伝子について、新生抗原の8個~15個、好ましくは9個~10個、より好ましくは9個の連続するアミノ酸からなる各フラグメントのMHCクラスI結合親和性が予測され、ここで各フラグメントは、
工程(a)の変異によって引き起こされる少なくとも1つのアミノ酸変化を含み、かつ
(III)最も高いMHCクラスI結合親和性を有するフラグメントは、新生抗原のMHCクラスI結合親和性を決定し、
工程(d)に加えて、または工程(d)の代わりに、
(d’):
前記個体の非癌性細胞の試料中のHLAクラスII対立遺伝子を決定すること、
新生抗原のMHCクラスII結合親和性を予測することであって、ここで
決定された各HLAクラスII対立遺伝子について、新生抗原の11個~30個、好ましくは15個の連続するアミノ酸の各フラグメントに対するMHCクラスII結合親和性が予測され、ここで各フラグメントは、工程(a)の変異によって生成された少なくとも1つの変異アミノ酸を含んでおり、および
最も高いMHCクラスII結合親和性を有するフラグメントが新生抗原のMHCクラスII結合親和性を決定し;
(e)各新生抗原について工程(b)、(c)、(d)および/または(d’)において決定された値に従って新生抗原を最高値から最低値までランク付けし、ランクの第1、第2第3、および/または第4のリストを生成する工程、
(f)前記ランクの第1、第2第3、および/または第4のリストからランク合計を計算し、そしてランク合計を増加させることによって新生抗原を順序付けし、新生抗原のランク付けされたリストを生成する工程、
ここで、前記ランク合計は、重み付けされたランク合計であり、ここで
工程(d)のMHCクラスI結合親和性の予測が1000nMより高いIC50値をもたらしたランクの第3のリストにおいて、工程(a)において決定された新生抗原の数が、各新生抗原のランク値に加算され、および/もしくは
工程(d’)のMHCクラスII結合親和性の予測が1000nMより高いIC50値をもたらしたランクの第4のリストにおいて、工程(a)において決定された新生抗原の数が、各新生抗原のランク値に加算され、
ならびに/または
工程(c)(i)が超並列トランスクリプトーム配列決定によって実施される場合、工程(f)のランク合計は、重み係数(WF)によって乗算され、ここでWFは、
変異についてのマッピングされたトランスクリプトームリード数が>0である場合、1であり、
変異についてのマッピングされたトランスクリプトームリード数が0であり、かつ非変異配列についてのマッピングされたリード数が0であり、かつトランスクリプト/ミリオン(TPM)値が少なくとも0.5である場合、2であり、
変異についてのマッピングされたトランスクリプトームリード数が0であり、かつ非変異配列についてのマッピングされたリード数が>0であり、かつトランスクリプト/ミリオン(TPM)値が少なくとも0.5である場合、3であり、
変異についてのマッピングされたトランスクリプトームリード数が0であり、かつ非変異配列についてのマッピングされたリード数が0であり、かつトランスクリプト/ミリオン(TPM)値が<0.5である場合、4であり、または、
変異についてのマッピングされたトランスクリプトームリード数が0であり、かつ非変異配列についてのマッピングされたリード数が>0であり、かつトランスクリプト/ミリオン(TPM)値が<0.5である場合、5であり;
(g)(f)において得られた新生抗原のランク付けされたリストから、最も低いランクから開始して、30個~240個、好ましくは40個~80個、より好ましくは60個の新生抗原を選択する工程。
【請求項2】
工程(a)および(d)(I)が、試料の超並列DNA配列決定を使用して行われ、かつ同定された変異の染色体位置における変異を含むリード数が、
癌性細胞の試料において、少なくとも2個、好ましくは少なくとも3個であり、
非癌性細胞の試料において、2以下、好ましくは0である、請求項1に記載の方法。
【請求項3】
工程(a)の少なくとも1つの変異は、単一ヌクレオチド変異体(SNV)またはフレームシフトペプチド(FSP)を生じる挿入/欠失変異である、請求項1または2に記載の方法。
【請求項4】
変異がSNVであり、かつ新生抗原が工程(a)で定義された総サイズを有し、かつ、複数の隣接する連続するアミノ酸によって各側に隣接される、変異によって生じたアミノ酸からなる、請求項に記載の方法であって、ここでコード配列が両側に十分な数のアミノ酸を含まない限り、各側の数は1を超えて異ならず、ここで新生抗原は、工程(a)で定義された総サイズを有する、方法。
【請求項5】
変異は、FSPを生じ、かつ変異によって生じる各単一アミノ酸変化は、工程(a)で定義される総サイズを有し、かつ以下からなる新生抗原を生じ:
(i)変異によって生じる前記単一アミノ酸変化、および7個~14個、好ましくは8個のN末端に隣接する連続するアミノ酸、および
(ii)コード配列が両側に十分な数のアミノ酸を含まない限り、両側のアミノ酸の数は、1以下だけ異なる、両側で工程(i)のフラグメントに隣接する複数の連続するアミノ酸、
ここで工程(d)のMHCクラスI結合親和性および/または工程(d’)のMHCクラスII結合親和性は、工程(i)のフラグメントについて予測される、請求項に記載の方法。
【請求項6】
癌性細胞の試料中の工程(b)で決定される新生抗原の変異誘発遺伝子頻度が、少なくとも2%、好ましくは5%、より好ましくは少なくとも10%である、請求項1~のいずれか1項に記載の方法。
【請求項7】
工程(g)が、自己免疫疾患に関連する遺伝子から新生抗原を、および/または新生抗原の前記ランク付けされたリストから0.1より低いそれらのアミノ酸配列についてのシャノンエントロピー値を有する新生抗原を除去することをさらに含む、請求項1~のいずれか1項に記載の方法。
【請求項8】
工程(c)(i)における前記コード遺伝子の発現レベルが、超並列トランスクリプトーム配列決定によって決定され、かつ工程(c)(i)において決定される発現レベルが、以下の式に従って計算された補正されたトランスクリプト/キロベースミリオン(corrTPM)値を使用する、請求項1~のいずれか1項に記載の方法。
【数1】
(式中、Mは、変異を含む工程(a)の変異の位置に及ぶリードの数であり、かつWは、変異を含まない工程(a)の変異の位置に及ぶリードの数であり、かつTPMは、変異を含む遺伝子のトランスクリプト/キロベースミリオン値であり、かつcは、0より大きい定数であり、好ましくは0.1である。)
【請求項9】
工程(g)は、代替の選択プロセスを含み、ここで新生抗原が、全ての選択された新生抗原についてのアミノ酸の総計の全長における設定された最大サイズに達するまで、最低ランクで開始する新生抗原のランク付けされたリストから選択され、ここで最大サイズは、一価または多価ワクチンの各ベクターについて1200~1800アミノ酸、好ましくは1500アミノ酸であり;かつ任意選択で、ここで2個以上の新生抗原が、重複するアミノ酸配列セグメントを含む場合、1つの新しい新生抗原にマージされる、請求項1~のいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、個別化されたワクチンにおける使用のための癌新生抗原を選択する方法に関する。本発明は、個別化されたワクチンのための新生抗原を保有するベクターまたはベクターのコレクションを構築する方法にも関する。本発明はさらに、個別化されたワクチンを含むベクターおよびベクターのコレクション、ならびに癌治療における前記ベクターの使用に関する。
【背景技術】
【0002】
(発明の背景)
いくつかの腫瘍抗原が同定され、そして異なるカテゴリーに分類されている:癌-生殖細胞系、組織分化抗原および変異自己タンパク質に由来する新生抗原(非特許文献1)。自己抗原に対する免疫応答が腫瘍増殖に影響を及ぼすかどうかは、議論の問題である(非特許文献1において概説される)。対照的に、最近の有力な証拠は、発現遺伝子のコード配列における変異の結果として腫瘍内で生成される新生抗原が、癌に対するワクチン接種の有望な標的であるという考えを支持している(非特許文献2)。
【0003】
癌新生抗原は、腫瘍細胞にのみ存在し、正常細胞には存在しない抗原である。新生抗原は、腫瘍細胞におけるDNA変異によって生成され、そして主にCD8T細胞によるT細胞媒介免疫反応による腫瘍細胞の認識および殺傷において重要な役割を果たすことが示されている(非特許文献3)。一般に次世代シークエンシング(NGS)と呼ばれる超並列配列決定法の出現により、癌ゲノムの完全な配列を適時かつ安価に決定することが可能になり、ヒト腫瘍の変異スペクトルが発表された(非特許文献4)。最も頻度の高い変異のタイプは、単一ヌクレオチド変異体であり、そして腫瘍にみられる単一ヌクレオチド変異体数の中央値はその組織診によってかなり異なる。一般に患者間で共有される変異は非常に少ないため、新生抗原を生成する変異の同定には個別化されたアプローチが必要である。
【0004】
潜在的なエピトープが腫瘍細胞によってプロセシング/提示されないため、または免疫寛容が変異配列と反応するT細胞の排除をもたらすため、多くの変異は実際に免疫系では見られない。したがって、ワクチンによってコードされる最適な数、および最終的に免疫原性を最適化するための好ましいワクチンレイアウトを定義するために、すべての潜在的な新生抗原の中から、免疫原性である可能性が最も高いものを選択することが有益である。さらに、単一ヌクレオチド変異体の変異によって生じた新生抗原だけでなく、フレームシフトペプチドを生成する挿入/欠失変異によって生じた新生抗原も重要であり、後者は特に免疫原性であることが期待される。最近、RNAまたはペプチドに基づく2つの異なる個別化されたワクチン接種アプローチが第I相臨床試験で評価されている。得られたデータは、ワクチン接種が、実際に、既存の新生抗原特異的T細胞を増殖させ、そして癌患者において新しいT細胞特異性のより広いレパートリーを誘導し得ることを示す(非特許文献5)。両アプローチの主な制限は、ワクチン接種の標的となる新生抗原の最大数である。ペプチドベースのアプローチについての上限は、それらの公表されたデータに基づいて、20ペプチドであり、そしていくつかの場合にはペプチドは合成され得なかったので、全ての患者において到達されなかった。RNAベースのアプローチについて記載された上限は、各ワクチンにおいて10個の変異しか含まないので、さらに低い(非特許文献5)。
【0005】
癌を治癒させる上での癌ワクチンの課題は、癌細胞がT細胞応答を「逃れる」ことができ、かつ免疫応答によって認識されていない機会を減少させるために、一度にできるだけ多くの癌細胞を認識し、そして排除することができる多様な免疫T細胞集団を誘導することである。したがって、ワクチンは、多数の癌特異的抗原、すなわち新生抗原をコードすることが望ましい。これは、個体の癌特異的新生抗原に基づく個別化された遺伝的ワクチンアプローチに特に関連している。できるだけ多くの新生抗原が成功する確率を最適化するためには、ワクチンにより標的とされるべきである。さらに、実験データは、患者における有効な免疫原性新生抗原が、患者のMHC対立遺伝子に対する広範囲の予測される親和性をカバーするという考えを支持する(例えば、非特許文献6)。ほとんどの現在の優先順位付けの方法は、代わりに、親和性閾値、例えば、頻繁に使用される500nM制限を適用し、これは、免疫原性新生抗原の選択を制限し得る。
【先行技術文献】
【非特許文献】
【0006】
【文献】AndersenRS, Kvistborg P, Fr&oslash;sig TM, Pedersen NW, Lyngaa R, Bakker AH, Shu CJ, StratenPt, Schumacher TN, Hadrup SR. (2012). Parallel detection of antigen-specific Tcell responses by combinatorial encoding of MHC multimers. Nat Protoc, 7(5),891-902. doi:10.1038/nprot.2012.037
【文献】FritschEF, Rajasagi M, Ott PA, Brusic V, Hacohen N, Wu CJ. (2014). HLA-bindingproperties of tumor neoepitopes in humans. Cancer Immunol Res, 2(6), 522-529.doi:10.1158/2326-6066.CIR-13-0227
【文献】YarchoanM, Johnson BA3rd, Lutz ER, Laheru DA, Jaffee EM. (2017). Targeting neoantigens to augment antitumourimmunity. Nat Rev Cancer, 17(9), 569. doi:10.1038/nrc.2017.74
【文献】KandothC, McLellan MD, Vandin F, Ye K, Niu B, Lu C, Xie M, Zhang Q, McMichael JF,Wyczalkowski MA, Leiserson MDM, Miller CA, Welch JS, Walter MJ, Wendl MC, LeyTJ, Wilson RK, Raphael BJ, Ding L. (2013). Mutational landscape andsignificance across 12 major cancer types. Nature, 502(7471), 333-339.doi:10.1038/nature12634
【文献】SahinU, Derhovanessian E, Miller M, Kloke BP, Simon P, L&ouml;wer M, Bukur V, Tadmor AD,Luxemburger U, Schr&ouml;rs B, Omokoko T, Vormehr M, Albrecht C, Paruzynski A, KuhnAN, Buck J, Heesch S, Schreeb KH, M&uuml;ller F, Ortseifer I, Vogler I, Godehardt E,Attig S, Rae R, Breitkreuz A, Tolliver C, Suchan M, Martic G, Hohberger A, SornP, Diekmann J, Ciesla J, Waksmann O, Br&uuml;ck AK, Witt M, Zillgen M, Rothermel A,Kasemann B, Langer D, Bolte S, Diken M, Kreiter S, Nemecek R, Gebhardt C,Grabbe S, H&ouml;ller C, Utikal J, Huber C, Loquai C, T&uuml;reci &Ouml;. Personalized RNAmutanome vaccines mobilize poly-specific therapeutic immunity against cancer.Nature, 547(7662), 222-226. doi:10.1038/nature23003
【文献】GrosA, Parkhurst MR, Tran E, Pasetto A, Robbins PF, Ilyas S, Prickett TD, GartnerJJ, Crystal JS, Roberts IM, Trebska-McGowan K, Wunderlich JR, Yang JC1,Rosenberg SA. (2016). Prospective identification of neoantigen-specificlymphocytes in the peripheral blood of melanoma patients. Nat Med. 22(4):433-8. doi:10.1038/nm.4051.
【発明の概要】
【発明が解決しようとする課題】
【0007】
したがって、現在の方法の制限(例えば、低い予測親和性による排除)を回避する優先順位付け方法、および大規模で、したがってより広く、そしてより完全な新生抗原のセットを標的とする個別化されたワクチンを可能にするワクチン接種アプローチが必要とされている。
【課題を解決するための手段】
【0008】
(発明の概要)
第1の態様において、本発明は、以下の工程を含む、個別化されたワクチンにおける使用のための癌新生抗原を選択する方法を提供する:
(a)個体から得られた癌性細胞の試料中の新生抗原を決定する工程であって、ここで各新生抗原が
コード配列内に含まれ、
前記個体の非癌性細胞の試料中に存在しないコードされたアミノ酸配列の変化をもたらすコード配列における少なくとも1つの変異を含み、かつ
癌性細胞の試料中のコード配列の9個~40個、好ましくは19個~31個、より好ましくは23個~25個、最も好ましくは25個の連続したアミノ酸からなり、
(b)各新生抗原について、コード配列内の工程(a)の前記変異のそれぞれの変異誘発遺伝子頻度を決定する工程、
(c)(i)前記癌性細胞の試料において、前記変異の少なくとも1つを含む各コード配列の発現レベルを決定する工程、または
(ii)癌性細胞の試料と同じ癌タイプの発現データベースから、前記変異の少なくとも1つを含む各コード配列の発現レベルを決定する工程、
(d)新生抗原のMHCクラスI結合親和性を予測する工程であって、ここで
(I)HLAクラスI対立遺伝子は、前記個体の非癌性細胞の試料から決定され、
(II)(I)において決定された各HLAクラスI対立遺伝子について、新生抗原の8個~15個、好ましくは9個~10個、より好ましくは9個の連続するアミノ酸からなる各フラグメントのMHCクラスI結合親和性が予測され、ここで各フラグメントは、工程(a)の変異によって引き起こされる少なくとも1つのアミノ酸変化を含み、かつ
(III)最も高いMHCクラスI結合親和性を有するフラグメントは、新生抗原のMHCクラスI結合親和性を決定し、
(e)各新生抗原について工程(b)~(d)において決定された値に従って新生抗原を最高値から最低値までランク付けし、ランクの第1、第2および第3のリストを生成する工程、
(f)前記ランクの第1、第2および第3のリストからランク合計を計算し、そしてランク合計を増加させることによって新生抗原を順序付けし、新生抗原のランク付けされたリストを生成する工程、
(g)(f)において得られた新生抗原のランク付けされたリストから、最も低いランクから開始して、30個~240個、好ましくは40個~80個、より好ましくは60個の新生抗原を選択する工程。
【0009】
第2の態様において、本発明は、以下の工程を含む、ワクチンとしての使用のための本発明の第1の態様による新生抗原の組み合わせをコードする個別化されたベクターを構築する方法を提供する:
(i)少なくとも10^5~10^8、好ましくは10^6の異なる組み合わせで新生抗原のリストを順序付けする工程、
(ii)各接合セグメントが、接合の両側に15個の隣接する連続するアミノ酸を含む、各組み合わせについての新生抗原接合セグメントの全ての可能なペアを生成する工程、
(iii)ベクターが設計される個体中に存在するHLA対立遺伝子のみが試験される、接合セグメント中の全てのエピトープに対するMHCクラスIおよび/またはクラスII結合親和性を予測する工程、および
(iv)≦1500nMのIC50を有する最少数の接合エピトープを有する新生抗原の組み合わせを選択し、そしてここで複数の組み合わせが同じ最少数の接合エピトープを有する場合、最初に遭遇する組み合わせが選択される工程。
【0010】
第3の態様において、本発明は、本発明の第1の態様による新生抗原のリストまたは本発明の第2の態様による新生抗原の組み合わせをコードするベクターを提供する。
【0011】
第4の態様において、本発明は、本発明の第1の態様による新生抗原の異なるセットまたは本発明の第2の態様による新生抗原の組み合わせの各々をコードするベクターのコレクションを提供し、ここで該コレクションは、2~4個、好ましくは2個のベクターを含み、そして好ましくはここでリストの一部をコードするベクターインサートは、アミノ酸の数がほぼ等しいサイズである。
【0012】
第5の態様において、本発明は、癌ワクチン接種における使用のための、本発明の第3の態様によるベクターまたは本発明の第4の態様によるベクターのコレクションを提供する。
【0013】
(図面のリスト)
以下、本明細書に含まれる図面の内容が説明される。この文脈では、上記および/または以下の発明の詳細な説明も参照されたい。
【図面の簡単な説明】
【0014】
図1】SNVに由来する新生抗原の作製:(A)変異が中心にあり、かつ上流および下流に12 wt aaが隣接した25量体の新生抗原の作製、(B)複数の変異を含む25量体の新生抗原の作製、および(C)変異がタンパク質配列の末端または開始点に近い場合に25量体より短い新生抗原の作製。
図2A】フレームシフトペプチド(FSP)を生成するインデル由来の新生抗原の作製。当該プロセスは、FSPをより小さなフラグメント、好ましくは25量体に分割することを含む。
図2B】フレームシフトペプチド(FSP)を生成するインデル由来の新生抗原の作製。当該プロセスは、FSPをより小さなフラグメント、好ましくは25量体に分割することを含む。
図3】3つの個々のランクスコアからのRSUMランクリストの生成の概略図。
図4】FSPに由来する重複する新生抗原の長さを最適化するための手順の概略説明。
図5】K個(好ましくは60個)の新生抗原を、ほぼ等しい全長の2つのより小さなリストに分割するための手順の概略図。
図6】FSPフラグメントマージングの例:例1は、2ヌクレオチド欠失chr11:1758971_ACによって生成されたFSPを参照する。4個の新生抗原配列(FSPフラグメント)が1個の30アミノ酸長の新生抗原にマージされる。例2は、1ヌクレオチド挿入chr6:168310205_-_Tによって生成されたFSPを参照する。2個の新生抗原配列(FSPフラグメント)が1個の31アミノ酸長の新生抗原にマージされる。
図7A】優先順位付け方法の検証:14名の癌患者からの変異が、実施例1からの優先順位付け方法を適用してランク付けされた。当該図は、免疫応答を誘導することが実験的に示されている変異について、ランク付けされたリストの位置を報告する。ランクは、患者のNGS-RNAデータを含むRSUMランキングについて(A)、円(A)によって示される。
図7B】優先順位付け方法の検証:14名の癌患者からの変異が、実施例1からの優先順位付け方法を適用してランク付けされた。当該図は、免疫応答を誘導することが実験的に示されている変異について、ランク付けされたリストの位置を報告する。ランクは、患者のNGS-RNAデータを含まないRSUMランキングについて(B)、正方形(B)によって示される。
図8】62個の新生抗原をコードする単一のGAdベクターまたは2つのGAdベクターの免疫原性。単一の発現カセット中に全62個の新生抗原をコードする1つのGAdベクター(GAd-CT26-1-62)は、31個の新生抗原をそれぞれコードする2つの同時投与されるGAdベクター(GAd-CT26-1-31+GAd-CT26-32-62)または各31個の新生抗原の2つのカセットをコードする1つのGAdベクター(GAd-CT26 dual 1-31および32-62)と比較してより弱い免疫応答を誘導する。BalbCマウス(6匹/群)は、(A)5x10^8vpのGAd-CT26-1-62または2個のベクターGAd-CT26-1-31+GAd-CT26-32-62(各5x10^8vp)の同時投与および(B)5x10^8vpのGAd-CT26-1-62または5x10^8vpのデュアルカセットベクターGAd-CT26 dual 1-31および32-62で筋肉内免疫された。T細胞応答は、エクスビボIFNγ ELISpotにより応答のピーク(ワクチン接種後2週間)でワクチン接種したマウスの脾細胞で測定された。応答は、2つのペプチドプールを使用することによって評価され、それぞれワクチン構築物によってコードされる31ペプチドから構成される(プール1~31新生抗原1~31;プール32~62新生抗原32~62)。それぞれのポリ新生抗原ベクターは、組み立てられたポリ新生抗原のN末端に付加されたT細胞エンハンサー配列(TPA)と、発現をモニタリングするためのC末端のインフルエンザHAタグとを含む。
【発明を実施するための形態】
【0015】
(発明の詳細な説明)
本発明が以下に詳細に説明される前に、本発明は、本明細書に記載される特定の方法論、プロトコルおよび試薬に限定されず、これらは変化し得ることが理解されるべきである。本明細書で使用される用語は、特定の実施形態のみを説明する目的のためのものであり、添付の特許請求の範囲によってのみ限定される本発明の範囲を限定することを意図していないことも理解されたい。他に定義されない限り、本明細書で使用される全ての技術用語および科学用語は、当業者によって一般に理解されるものと同じ意味を有する。
【0016】
好ましくは、本願明細書で使用される用語は、「A multilingual glossary of biotechnological terms:(IUPAC Recommendations)」、Leuenberger,H.G.W、Nagel,B.およびKlbl,H.編(1995年)、Helvetica Chimica Acta、CH-4010 バーゼル、スイス)に記載されるように定義される。
【0017】
本明細書および後続の特許請求の範囲を通して、文脈上他の要求がない限り、「comprise」という語、および「comprises」および「comprising」などの変形は、記載された整数もしくは工程または整数もしくは工程の群を包含するが、他の整数もしくは工程または整数もしくは工程の群を排除しないことを意味すると理解されるであろう。以下の節において、本発明の異なる態様がより詳細に定義される。そのように定義された各態様は、明確に反対に示されない限り、任意の他の態様(複数の場合もある)と組み合わせられ得る。特に、任意選択の、好ましい、または有利であると示される任意の特徴は、任意選択の、好ましい、または有利であると示される任意の他の特徴(複数の場合もある)と組み合わせられ得る。
【0018】
本明細書の本文全体でいくつかの文献が引用される。本明細書中で引用される各文献(全ての特許、特許出願、科学刊行物、製造業者の仕様書、指示書などを含む)は、上記または下記のいずれも、その全体が参照により本明細書に組み込まれる。本願明細書中のいかなるものも、本願発明が先行発明のために開示より先行する権利がないと認めるものとして、解釈されるべきではない。本明細書に引用されるいくつかの文献は、「参照により組み込まれる」ものとして特徴付けられる。このような組み込まれた参照文献の定義または教示と、本明細書に列挙された定義または教示との間に矛盾がある場合、本明細書の本文が優先される。
【0019】
以下において、本発明の要素について説明する。これらの要素は、特定の実施形態と共に列挙されているが、追加の実施形態を作成するために、任意の方法および任意の数で組み合わせされ得ることが理解されるべきである。様々に記載された例および好ましい実施形態は、明示的に記載された実施形態のみに本発明を限定するように解釈されるべきではない。本記載は、明示的に記載された実施形態を、開示されたおよび/または好ましい要素の任意の数と組み合わせる実施形態をサポートおよび包含するものと理解されるべきである。さらに、本出願において記載される全ての要素の任意の並べ替えおよび組み合わせは、文脈が他に指示しない限り、本出願の記載によって開示されるとみなされるべきである。
【0020】
(定義)
以下において、本明細書で頻繁に使用される用語のいくつかの定義が提供される。これらの用語は、その使用の各事例において、本明細書の残りの部分において、それぞれ定義された意味および好ましい意味を有する。
【0021】
本明細書および添付のされた特許請求の範囲において使用されるように、単数形「a」、「an」、および「the」は、内容が他に明確に指示しない限り、複数の指示対象を含む。
用語「約」は、数値に関連して使用される場合、示された数値より5%小さい下限を有し、かつ示された数値より5%大きい上限を有する範囲内の数値を包含することを意味する。
【0022】
本明細書の文脈において、用語「主要組織適合性複合体」(MHC)は、細胞生物学および免疫学の分野において公知のその意味において使用され;それは、タンパク質の特定の画分(ペプチド)(エピトープとも呼ばれる)を提示する細胞表面分子を意味する。MHC分子の2つの主要なクラス:クラスIおよびクラスIIがある。MHCクラスIの2つのグループは、それらの多型に基づいて区別され得る:a)対応する多型性HLA-A、HLA-B、およびHLA-C遺伝子を有する古典的(MHC-Ia)、およびb)対応するより多型性の低いHLA-E、HLA-F、HLA-G、およびHLA-H遺伝子を有する非古典的(MHC-Ib)。
【0023】
MHCクラスI重鎖分子は、非MHC分子β2-ミクログロブリンのユニットに結合されたα鎖として生じる。α鎖は、N末端からC末端への方向に、シグナルペプチド、3つの細胞外ドメイン(α1~3、α1はN末端にある)、膜貫通領域およびC末端細胞質尾部を含む。提示される(displayed)または提示される(presented)ペプチドは、α1/α2ドメインの中央領域において、ペプチド結合溝によって保持される。
【0024】
用語「β2-ミクログロブリンドメイン」は、MHCクラスIヘテロ二量体分子の一部である非MHC分子を意味する。言い換えれば、それはMHCクラスIヘテロ二量体のβ鎖を構成する。
【0025】
古典的なMHC-Ia分子の主な機能は、適応免疫応答の一部としてペプチドを提示することである。MHC-Ia分子は、β2-ミクログロブリン(β2m)および自己タンパク質、ウイルスもしくは細菌に由来する小さなペプチドと非共有結合的に会合する3つの細胞外ドメイン(α1、α2およびα3)を有する膜結合重鎖を含む三量体構造である。α1およびα2ドメインは、高度に多型性であり、そしてペプチド結合溝を生じるプラットフォームを形成する。保存されたα3ドメインと並列しているのは、膜貫通ドメインとそれに続く細胞内細胞質尾部である。
【0026】
免疫応答を開始するために、古典的MHC-Ia分子は、CD8+細胞傷害性Tリンパ球(CTLs)上に存在するTCR(T細胞受容体)によって認識される特異的ペプチドを提示する一方、ナチュラルキラー細胞(NK)に存在するNK細胞受容体は、個々のペプチドではなくペプチドモチーフを認識する。
【0027】
通常の生理学的状態下では、MHC-Ia分子は、CD8およびNK細胞にペプチドを提示することを担当するヘテロ三量体複合体として存在するが、用語「ヒト白血球抗原」(HLA)は、細胞生物学および生化学の技術分野で知られているその意味で使用される;それは、ヒトMHCクラスIタンパク質をコードする遺伝子座を意味する。3つの主要な古典的MHC-Ia遺伝子は、HLA-A、HLA-BおよびHLA-Cであり、そしてこれらの遺伝子は全て様々な数の対立遺伝子を有する。密接に関連する対立遺伝子は、特定の対立遺伝子のサブグループにまとめられる。全ての公知のHLA遺伝子およびそれらのそれぞれの対立遺伝子の完全配列または部分配列は、IMGT/HLA(http://www.ebi.ac.uk/ipd/imgt/hla/)などの専門データベースにおいて当業者に利用可能である。
【0028】
ヒトは、古典的(MHC-Ia)HLA-A、HLA-B、およびHLA-Cと、非古典的(MHC-Ib)HLA-E、HLA-F、HLA-GおよびHLA-H分子とを含むMHCクラスI分子を有する。両カテゴリーは、ペプチド結合、提示、および誘導されたT細胞応答の機構が類似する。古典的MHC-Iaの最も顕著な特徴は、それらの高い多型性であるが、一方、非古典的MHC-Ibは、通常、非多型性であり、かつそれらのMHC-Ia対応物よりもより限定された発現パターンを示す傾向がある。
【0029】
HLAの命名法は、遺伝子座の特定の名称(例えば、HLA-A)とそれに続く対立遺伝子ファミリー血清学的抗原(例えば、HLA-A*02)と、DNA配列が決定された番号および順序で割り当てられた対立遺伝子サブタイプ(例えば、HLA-A*02:01)とによって、与えられる。コード配列内の同義ヌクレオチド置換(サイレントまたは非コード置換とも呼ばれる)によってのみ異なる対立遺伝子は、第3の桁のセット(例えば、HLA-A*02:01:01)の使用によって区別される。イントロンの配列多型により、またはエクソンおよびイントロンに隣接する5’もしくは3’非翻訳領域においてのみ異なる対立遺伝子は、第4の桁のセット(例:HLA-A*02:01:01:02L)の使用によって区別される。
【0030】
MHCクラスIおよびクラスII結合親和性予測;MHCクラスIまたはIIエピトープの予測およびMHCクラスIおよびII結合親和性の予測のための当技術分野で公知の方法の例は、Moutaftsiら、2006年;Lundegaardら、2008年;Hoofら、2009年;AndreattaおよびNielsen、2016年;Jurtzら、2017年である。好ましくは、AndreattaおよびNielsen、2016年に記載された方法が使用され、そしてこの方法が患者のMHC対立遺伝子の1つをカバーしない場合、Jurtzら、2017年により記載された代替方法が使用される。
【0031】
ヒト自己免疫反応および関連するMHC対立遺伝子に関連する遺伝子およびエピトープは、以下のクエリ基準を適用することによって、IEDBデータベース(https://www.iedb.org)において同定され得る:カテゴリーエピトープについては「線状エピトープ」、カテゴリー宿主については「ヒト」、およびカテゴリー疾患については「自己免疫疾患」。
【0032】
用語「T細胞エンハンサーエレメント」は、抗原配列またはペプチドに融合された場合に、遺伝子ワクチン接種の文脈において新生抗原に対するT細胞の誘導を増加させるポリペプチドまたはポリペプチド配列を意味する。T細胞エンハンサーの例は、不変鎖配列またはそのフラグメント;6個の追加の下流アミノ酸残基を任意選択で含む組織型プラスミノーゲンアクチベーターリーダー配列;PEST配列;サイクリン破壊ボックス;ユビキチン化シグナル;SUMO化シグナルである。T細胞エンハンサーエレメントの具体例は、配列番号173~182のものである。
【0033】
用語「コード配列」は、転写され、そしてタンパク質に翻訳されるヌクレオチド配列を意味する。タンパク質をコードする遺伝子は、コード配列の特定の例である。
【0034】
用語「対立遺伝子頻度」は、集団または細胞集団など、多数の要素内の特定の遺伝子座における特定の対立遺伝子の相対頻度を意味する。対立遺伝子頻度は、パーセンテージまたは比率で表される。例えば、コード配列における変異の対立遺伝子頻度は、変異の位置における変異リードと非変異リードの比によって決定されるであろう。変異の位置で2リードが変異した対立遺伝子に決定し、そして18リードが非変異対立遺伝子を示した変異誘発遺伝子頻度は、10%の変異誘発遺伝子頻度を定義することになる。フレームシフトペプチドから生成された新生抗原についての変異誘発遺伝子頻度は、フレームシフトペプチドを引き起こす挿入または欠失変異の変異誘発遺伝子頻度であり、すなわち、FSP内の全ての変異アミノ酸は、挿入/欠失変異を引き起こすフレームシフトの変異誘発遺伝子頻度と同じ変異誘発遺伝子頻度を有することになる。
【0035】
用語「新生抗原」は、正常な非癌性細胞には存在しない癌特異的抗原を意味する。
【0036】
用語「癌ワクチン」は、本発明の文脈において、癌細胞に対する免疫応答を誘導するように設計されているワクチンを意味する。
【0037】
用語「個別化されたワクチン」は、特定の個体に特異的である抗原配列を含むワクチンを意味する。このような個別化されたワクチンは、多くの新生抗原が個体の特定の癌細胞に特異的であるため、新生抗原を使用する癌ワクチンにとって特に興味深い。
【0038】
コード配列における用語「変異」は、本発明の文脈において、癌性細胞のヌクレオチド配列を非癌性細胞のヌクレオチド配列と比較した場合のコード配列のヌクレオチド配列における変化を意味する。コードされたペプチドのアミノ酸配列において変化をもたらさないヌクレオチド配列における変化、すなわち「サイレント」変異は、本発明の文脈において変異とみなされない。アミノ酸配列の変化をもたらすことができる変異のタイプは、コードするトリプレットの単一ヌクレオチドが変化し、翻訳された配列において異なるアミノ酸をもたらす、非同義単一ヌクレオチド変異体(SNV)に限定されない。アミノ酸配列の変化をもたらす変異のさらなる例は、1以上のヌクレオチドがコード配列に挿入されるか、またはコード配列から欠失されるかのいずれかである、挿入/欠失(インデル)変異である。特に関連深いのは、3で割り切れない複数のヌクレオチドが挿入または欠失される場合に起こるリーディングフレームのシフトをもたらすインデル変異である。このような変異は、フレームシフトペプチド(FSP)と呼ばれる変異の下流のアミノ酸配列に大きな変化を引き起こす。
【0039】
用語「シャノンエントロピー」は、分子、例えばタンパク質のコンフォーメーションの数に関連するエントロピーを意味する。シャノンエントロピーを計算するための当技術分野で公知の方法は、StraitおよびDewey、1996年およびShannon1996年である。ポリペプチドについて、シャノンエントロピー(SE)は、SE=(-Σp(aalog(p(aa)))/Nとして計算され得、式中p(aa)は、ポリペプチド中のアミノ酸iの頻度であり、かつ合計は、20個の異なる全てのアミノ酸にわたって計算され、かつNは、ポリペプチドの長さである。
【0040】
用語「発現カセット」は、本発明の文脈において、発現されるべき少なくとも1つの核酸配列(例えば、転写制御配列および翻訳制御配列に作動可能に連結された、本発明の新生抗原の選択物またはその一部をコードする核酸)を含む核酸分子をいうために使用される。好ましくは、発現カセットは、プロモーター、開始部位および/またはポリアデニル化部位など、所定の遺伝子の効率的な発現のためのシス調節エレメントを含む。好ましくは、発現カセットは、患者の細胞における核酸の発現に必要とされる全ての追加のエレメントを含む。したがって、典型的な発現カセットは、発現される核酸配列に動作可能に連結されたプロモーターおよび転写産物の効率的なポリアデニル化、リボソーム結合部位、および翻訳終結に必要なシグナルを含む。カセットのさらなるエレメントは、例えば、エンハンサーを含んでもよい。発現カセットは、好ましくは、効率的な終結を提供するために、構造遺伝子の下流に転写終結領域も含む。終結領域は、プロモーター配列と同じ遺伝子から得られてもよく、または異なる遺伝子から得られてもよい。
【0041】
「IC50」値は、物質の最大阻害濃度の半分を指すため、特定の生物学的機能または生化学的機能の阻害における物質の有効性の尺度である。当該値は、典型的には、モル濃度として表される。分子のIC50は、用量-応答曲線を作成し、そして異なる濃度で試験された分子の阻害効果を試験することによって、機能的アンタゴニストアッセイにおいて実験的に決定され得る。あるいは、IC50値を決定するために競合結合アッセイが行われてもよい。典型的には、本発明の新生抗原フラグメントは、1500nM~1pM、より好ましくは1000nM~10pM、およびさらにより好ましくは500nM~100pMの間のIC50値を示す。
【0042】
用語「超並列配列決定(Massively parallel sequencing)」は、核酸のためのハイスループット配列決定法を意味する。超並列配列決定法は、次世代シークエンシング(NGS)または第2世代シークエンシングとも呼ばれる。セットアップおよび使用される化学的性質が異なる多くの異なる超並列配列決定法が当技術分野で知られている。しかしながら、これら全ての方法は、配列決定の速度を増加させるために、並行して非常に多数のシークエンシング反応を行うという共通点を有する。
【0043】
用語「トランスクリプト/キロベースミリオン(Transcripts Per Kilobase Million)」(TPM)は、シークエンシングの深さおよび遺伝子の長さを正規化するRNA試料の超並列配列決定に用いられる遺伝子中心のメトリックを意味する。これは、リードカウントを各遺伝子の長さ(キロベース)で割ることによって計算され、キロベース当たりのリード(RPK)を算出する。試料中の全てのRPK値の数を1,000,000で割ると、「100万当たりのスケーリングファクター(per million scaling factor)」が得られる。RPK値を「100万当たりのスケーリングファクター」で割ると、各遺伝子についてTPMが得られる。
【0044】
変異を有する遺伝子の全体的な発現レベルは、TPMとして表される。好ましくは、「変異特異的」発現値(corrTPM)は、次いで、変異の位置における変異リードおよび非変異リードの数から決定される。
【0045】
補正された発現値corrTPMは、corrTPM=TPM*(M+c)/(M+W+c)として計算される。Mは、新生抗原を生成する変異の位置にまたがるリード数であり、かつWは、新生抗原を生成する変異の位置にまたがる変異を含まないリード数である。値cは、0より大きい定数であり、好ましくは0.1である。値cは、Mおよび/またはWが0である場合に特に重要である。
【0046】
(実施形態)
以下では、本発明の異なる態様がより詳細に定義される。そのように定義された各態様は、明確に反対に示されない限り、任意の他の態様(複数の場合もある)と組み合わせられ得る。特に、好ましい、または有利であると示される任意の特徴は、好ましい、または有利であると示される任意の他の特徴(複数の場合もある)と組み合わせられ得る。
【0047】
第1の態様において、本発明は、以下の工程を含む、個別化されたワクチンにおける使用のための癌新生抗原を選択する方法を提供する:
(a)個体から得られた癌性細胞の試料中の新生抗原を決定する工程であって、ここで各新生抗原が
コード配列内に含まれ、
前記個体の非癌性細胞の試料中に存在しないコードされたアミノ酸配列の変化をもたらすコード配列における少なくとも1つの変異を含み、かつ
癌性細胞の試料中のコード配列の9個~40個、好ましくは19個~31個、より好ましくは23個~25個、最も好ましくは25個の連続したアミノ酸からなり、
(b)各新生抗原について、コード配列内の工程(a)の前記変異のそれぞれの変異誘発遺伝子頻度を決定する工程、
(c)(i)前記癌性細胞の試料において、前記変異の少なくとも1つを含む各コード配列の発現レベルを決定する工程、または
(ii)癌性細胞の試料と同じ癌タイプの発現データベースから、前記変異の少なくとも1つを含む各コード配列の発現レベルを決定する工程、
(d)新生抗原のMHCクラスI結合親和性を予測する工程であって、ここで
(I)HLAクラスI対立遺伝子は、前記個体の非癌性細胞の試料から決定され、
(II)(I)において決定された各HLAクラスI対立遺伝子について、新生抗原の8個~15個、好ましくは9個~10個、より好ましくは9個の連続するアミノ酸からなる各フラグメントのMHCクラスI結合親和性が予測され、ここで各フラグメントは、工程(a)の変異によって引き起こされる少なくとも1つのアミノ酸変化を含み、かつ
(III)最も高いMHCクラスI結合親和性を有するフラグメントは、新生抗原のMHCクラスI結合親和性を決定し、
(e)各新生抗原について工程(b)~(d)において決定された値に従って新生抗原を最高値から最低値までランク付けし、ランクの第1、第2および第3のリストを生成する工程、
(f)前記ランクの第1、第2および第3のリストからランク合計を計算し、そしてランク合計を増加させることによって新生抗原を順序付けし、新生抗原のランク付けされたリストを生成する工程、
(g)(f)において得られた新生抗原のランク付けされたリストから、最も低いランクから開始して、30個~240個、好ましくは40個~80個、より好ましくは60個の新生抗原を選択する工程。
【0048】
多くの癌新生抗原は、潜在的なエピトープが腫瘍細胞によってプロセシング/提示されないか、または免疫寛容が変異配列と反応するT細胞の排除を導いたために、免疫系によって「見られ(seen)」ない。したがって、全ての潜在的な新生抗原の中から、免疫原性である可能性が最も高いものを選択することが有益である。理想的には、新生抗原は、多数の癌細胞中に存在し、十分な量で発現され、そして免疫細胞に効率的に提示されなければならないであろう。
【0049】
特定の変異誘発遺伝子頻度を有し、豊富に発現され、かつMHC分子に対する高い結合親和性を有すると予測される癌特異的変異を含む新生抗原を選択することにより、免疫応答が誘導される可能性が有意に増加される。本発明者らは、驚くべきことに、これらのパラメーターが、適切な新生抗原を選択するために最も効率的に使用され得、異なるパラメーターを考慮に入れる優先順位付け方法を使用して免疫応答の増加を誘発することを見出した。重要なことに、本発明の方法は、対立遺伝子頻度、発現レベルまたは予測されるMHC結合親和性が、観察された最も高いものの中にない新生抗原も考慮する。例えば、高い発現レベルおよび高い変異誘発遺伝子頻度を有するが、比較的低い予測MHC結合親和性を有する新生抗原は、選択された新生抗原のリストに依然として含められ得る。
【0050】
したがって、本発明の方法は、選択プロセスにおいて一般的に適用されるカットオフ基準を使用しないが、1つのパラメーターによる非常に高い予測適合性を有する新生抗原が、他のパラメーターにおける最適以下の適合性のために、単にリストから除外されないことを考慮に入れる。これは、特定のカットオフ基準をわずかに失うだけのパラメータを有する新生抗原に特に関連する。
【0051】
個体の癌細胞にのみ存在し、かつ同一個体の健康な細胞には存在しないコード配列(すなわち、転写され、かつ翻訳されているゲノム核酸配列)における任意の変異は、潜在的に免疫原性(すなわち、免疫応答を誘導することができる)新生抗原として興味深い。コード配列の変異は、翻訳されたアミノ酸配列の変化ももたらさなければならず、すなわち、核酸レベルにのみ存在し、かつアミノ酸配列を変化させないサイレント変異は、したがって適していない。本質的なことは、変異が、変異の厳密なタイプ(単一ヌクレオチドの変化、単一ヌクレオチドまたは複数ヌクレオチドの挿入または欠失など)にかかわらず、翻訳されたタンパク質のアミノ酸配列の変化をもたらすことである。変化したアミノ酸配列にのみ存在するが、非癌性細胞に存在するようなコード遺伝子から生じるアミノ酸配列には存在しない各アミノ酸は、本明細書の文脈において変異アミノ酸であるとみなされる。例えば、フレームシフトペプチドを生じる挿入または欠失変異などのコード配列の変異は、シフトしたリーディングフレームによってコードされる各アミノ酸が変異アミノ酸とみなされるペプチドを生じるであろう。
【0052】
コード配列の変異は、原則として、個体から得られた試料の任意のDNA配列決定の方法によって同定され得る。個体のコード配列における変異を同定するために必要なDNA配列を得るための好ましい方法は、超並列配列決定法である。
【0053】
コード配列中の変異の対立遺伝子頻度(すなわち、変異の位置における非変異配列対変異配列の比率)も、ワクチンに用いられる新生抗原にとって重要な因子である。対立遺伝子頻度の高い新生抗原は、相当な数の癌細胞に存在し、ワクチンの有望な標的であるこれらの変異を含む新生抗原をもたらす。
【0054】
同様に、癌細胞内で新生抗原がどれだけ豊富に発現されているかが重要である。癌細胞における新生抗原の発現が高ければ高いほど、新生抗原はより適しており、かつ当該細胞に対して十分な免疫応答の可能性がより高い。本発明は、新生抗原の発現レベルを評価する異なる方法で実施され得る。新生抗原の発現は、癌性細胞の試料中で直接評価され得る。発現は、好ましくはトランスクリプトーム全体を示す異なる方法によって測定され得、様々なそのような方法が当業者に知られている。好ましくは、トランスクリプトームを測定するための迅速で、信頼性があり、かつ費用効果の高い方法を提供する方法が使用される。1つのこのような好ましい方法は、超並列配列決定である。
【0055】
あるいは、例えば、技術的理由または経済的理由に起因し得る、直接的な測定が利用可能でない場合、発現データベースが使用され得る。当業者は、異なる癌タイプの遺伝子発現データを含む利用可能な発現データベースを知っている。このようなデータベースの典型的な非限定的な例は、TCGA(https://portal.gdc.cancer.gov/)である。ワクチンが設計される個体と同じタイプの腫瘍における方法の工程(a)において同定される変異を含む遺伝子の発現は、これらのデータベースにおいて検索され得、そして発現値を決定するために使用され得る。
【0056】
選択された新生抗原が、癌細胞上のMHC分子によって免疫細胞に効率的に提示されることは、さらに重要である。MHCクラスI(およびクラスII)分子に対するペプチドの結合親和性を予測するための当技術分野で知られている様々な方法がある(Moutaftsiら、2006年; Lundegaardら、2008年; Hoofら、2009年; AndreattaおよびNielsen、2016年; Jurtzら、2017年)。MHC分子は、個体間で有意な差異を有するタンパク質の高度に多型性のグループであるため、個体の細胞上に存在するMHC分子のタイプに対するMHC結合親和性を決定することが重要である。MHC分子は、高度に多型性のHLA遺伝子の群によってコードされている。したがって、当該方法は、工程(a)で利用されたDNA配列決定結果を使用して、コード配列における変異を同定し、個体に存在するHLA対立遺伝子を同定する。個体において同定されたHLA対立遺伝子に対応する各MHC分子について、新生抗原に対するMHC結合親和性が決定される。これらの末端に向かって、新生抗原のアミノ酸配列は、コード配列のインシリコ翻訳によって決定される。得られた新生抗原アミノ酸配列は、次いで、8~15個、好ましくは9~10個、より好ましくは9個の連続したアミノ酸からなるフラグメントに分割され、ここで該フラグメントは、新生抗原の変異アミノ酸の少なくとも1つを含まなければならない。フラグメントのサイズは、MHC分子が存在し得るペプチドのサイズによって制限される。各フラグメントについて、MHC結合親和性が予測される。MHC結合親和性は、通常、50%阻害濃度([nM]におけるIC50)として測定される。したがって、IC50値が低いほど、MHC分子に対するペプチドの結合親和性がより高くなる。MHC結合親和性が最も高いフラグメントは、該フラグメントが由来する新生抗原のMHC結合親和性を決定する。
【0057】
本発明の方法は、次いで、工程(b)~(d)において決定されたパラメーター、すなわち、新生抗原の変異誘発遺伝子頻度、発現レベルおよび予測MHCクラスI結合親和性を使用して、これらのパラメーターに優先順位付け方法を適用することによって、最も適切な新生抗原を選択する。したがって、パラメーターは、ランク付けされたリスト上でソートされる。変異誘発遺伝子頻度が最も高い新生抗原は、ランクの第1のリストにおいて第1のランク、すなわちランク1を割り当てられる。全ての同定された新生抗原がランクの第1のリスト上のランクに割り当てられるまで、変異誘発遺伝子頻度が2番目に高い新生抗原は、ランクの第1のリストにおいて第2のランク等に割り当てられる。
【0058】
同様に、各コード配列の発現レベルは、最高から最低までランク付けされ、全ての同定された新生抗原がランクの第2のリスト上のランクに割り当てられるまで、最高の発現値を有する新生抗原は、ランク1に割り当てられ、2番目に高いレベルを有する新生抗原は、ランク2等に割り当てられる。
【0059】
新生抗原のMHCクラスI結合親和性は、新生抗原との結合親和性が最も高いものから最も低いものまでランク付けされ、全ての新生抗原がランクの第3のリスト上のランクに割り当てられるまで、最も高いMHCクラスI結合親和性を有するものはランク1に割り当てられ、2番目に高い結合親和性を有する新生抗原はランク2等に割り当てられる。
【0060】
いずれかの新生抗原が、別の新生抗原と同一の変異誘発遺伝子頻度、発現レベルおよび/またはMHCクラスI結合親和性を有する場合、両抗原は、関連するランクのリスト上で同じランクに割り当てられる。
【0061】
当該方法は、次いで、ランクの3つのリストのランク合計を計算することによって、3つのランキング全てを考慮に入れる優先順位付け方法を使用する。例えば、ランクの第1のリスト上にランク3、ランクの第2のリスト上にランク13、およびランクの(正:of)第3のリスト上にランク2を有する新生抗原は、ランク合計18(3+13+2)を有する。ランク合計が各新生抗原について計算された後、ランク合計は、それらのランク合計に従ってランク付けされ、最低ランク合計は、ランク1等に割り当てられ、新生抗原のランク付けされたリストを生成する。同一のランク合計を有する新生抗原は、新生抗原のランク付けされたリスト上で同一のランクに割り当てられる。
【0062】
リスト中に存在する新生抗原の最終的な数は、各患者において検出される変異の数に依存する。ワクチンにおいて使用される新生抗原の数は、ワクチンを送達するために使用されるビヒクル(複数の場合もある)によって制限される。例えば、単一のウイルスベクターが、遺伝子ワクチンの場合のように、送達ビヒクルとして使用される場合、このベクターの最大インサートサイズは、各ベクターにおいて使用され得る新生抗原の数を制限するであろう。
【0063】
したがって、本発明の方法は、最低ランク(すなわち、最低ランク番号、ランク1)を有する新生抗原で開始するランク付けされた新生抗原のリストから、25個~250個、30個~240個、30個~150個、35個~80個、好ましくは55個~65個、より好ましくは60個の新生抗原を選択する。新生抗原が、1つのセット(例えば、一価ワクチンの単一ビヒクル)中に存在するように選択される場合、25個~80個、30個~70個、35個~70個、40個~70個、55個~65個、好ましくは60個の新生抗原が選択される。しかしながら、第1のセット中に含まれない新生抗原は、4つまでのウイルスベクターの同時投与に基づく多価ワクチン接種のための追加のウイルスベクターによってコードされ得る。
【0064】
本発明の第1の態様の好ましい実施形態において、工程(a)および(d)(I)は、試料の超並列DNA配列決定を使用して実施される。
【0065】
本発明の第1の態様の好ましい実施形態において、工程(a)および(d)(I)は、試料の超並列DNA配列決定を使用して実施され、そして同定された変異の染色体位置でのにおけるリードの数は、以下の通りである:
癌性細胞の試料では、少なくとも2つ、好ましくは少なくとも3、4、5、または6であり、
非癌性細胞の試料では、2以下、すなわち2、1、または0、好ましくは0である。
【0066】
本発明の第1の態様の好ましい代替の実施形態において、同定された変異の染色体位置におけるリードの数は、非癌性細胞の試料よりも癌性細胞の試料においてより多く、ここで試料間の差異は、統計的に有意である。2つのグループの間の統計的に有意な差は、当業者に知られている複数の統計的検定によって決定され得る。適切な統計的検定のその一例は、フィッシャーの直接検定である。本発明の目的のために、p値が0.05未満である場合、2つのグループは互いに異なるとみなされる。
【0067】
これらの基準は、新生抗原をさらに選択するために適用され、ここで同定された変異は、特に高い技術的信頼性で検出される。
【0068】
本発明の第1の態様の好ましい実施形態では、本方法は、工程(d)に加えて、または工程(d)の代わりに、工程(d’)を含み、ここで工程(d’)は以下を含む:
前記個体の非癌性細胞の試料中のHLAクラスII対立遺伝子を決定すること、
新生抗原のMHCクラスII結合親和性を予測すること、ここで
決定された各HLAクラスII対立遺伝子について、新生抗原の11個~30個、好ましくは15個の連続するアミノ酸の各フラグメントに対するMHCクラスII結合親和性が予測され、ここで各フラグメントは、工程(a)の変異によって生成された少なくとも1つの変異アミノ酸を含んでおり、および
最も高いMHCクラスII結合親和性を有するフラグメントが新生抗原のMHCクラスII結合親和性を決定し;
ここで、MHCクラスII結合親和性は、最も高いMHCクラスII結合親和性から最も低いMHCクラスII結合親和性までランク付けされ、工程(f)のランク合計に含まれるランクの第4のリストを生成する。
【0069】
この実施形態では、代替または追加の選択パラメーターが追加される。MHCクラス2分子によって提示されたペプチドは、MHCクラス1ペプチドよりもサイズが大きいため、MHCクラス2結合親和性は、わずかにより大きいフラグメントにおいて予測される。MHCクラスII結合親和性は、最も高い結合親和性から最も低い結合親和性までもランク付けされ、全ての新生抗原がランクの第4のリスト中のランクに割り当てられるまで、最も高いMHCクラスII結合親和性を有する新生抗原はランク1等に割り当てられる。
【0070】
MHCクラスII結合親和性が追加の選択パラメーターとして使用される場合、第4のリストは、ランク合計計算に更に含まれる。MHCクラスII結合親和性が、工程(d)のMHCクラスI結合親和性の代替として使用される場合、工程(f)におけるランク合計は、ランクの第1、第2および第4のリストのみについて計算される。
【0071】
本発明の第1の態様の好ましい実施形態において、工程(a)の少なくとも1つの変異は、単一ヌクレオチド変異体(SNV)またはフレームシフトペプチド(FSP)を生じる挿入/欠失変異である。
【0072】
本発明の第1の態様の好ましい実施形態において、ここで変異がSNVであり、かつ新生抗原が工程(a)で定義された総サイズを有し、かつ、複数の隣接する連続するアミノ酸によって各側に隣接される、変異によって生じたアミノ酸からなり、ここでコード配列が両側に十分な数のアミノ酸を含まない限り、各側の数は1を超えて異ならず、ここで新生抗原は、工程(a)で定義された総サイズを有する。好ましくは、SNVから生じる変異アミノ酸は、新生抗原の「中央」内に位置する(すなわち、等しい数のアミノ酸が両側に隣接する)。これは、エピトープの末端または始点に変異が存在する等しい機会を提供する。したがって、新生抗原は、変異アミノ酸の各側のコード配列から生じるほぼ同じ数の周囲のアミノ酸で選択される(すなわち、1以下だけ異なる)。
【0073】
本発明の第1の態様の好ましい実施形態において、ここで変異は、FSPを生じ、かつ変異によって生じる各単一アミノ酸変化は、工程(a)で定義される総サイズを有する新生抗原を生じ、かつ以下からなり:
(i)変異によって引き起こされる前記単一アミノ酸変化、および7個~14個、好ましくは8個のN末端に隣接する連続するアミノ酸、および
(ii)コード配列が両側に十分な数のアミノ酸を含まない限り、両側のアミノ酸の数は、1以下だけ異なる、両側で工程(i)のフラグメントに隣接する複数の連続するアミノ酸、
ここで工程(d)のMHCクラスI結合親和性および/または工程(d’)のMHCクラスII結合親和性は、工程(i)のフラグメントについて予測される。
【0074】
FSPの各変異アミノ酸は、1つの異なる新生抗原を定義する。各新生抗原は、変異アミノ酸と、該変異アミノ酸のN末端に位置する、MHCクラスI結合親和性を決定するために使用されるフラグメントのサイズ(すなわち、7~14)よりも1アミノ酸短い複数のアミノ酸とからなる。新生抗原はさらに、工程(i)の新生抗原フラグメントの配列と共にコード配列中の連続配列を形成するコード配列に由来する複数の連続するアミノ酸からなる。両側で工程(i)の新生抗原フラグメントを取り囲むアミノ酸の数は、1つだけ異なり、ここで、新生抗原の総サイズは、工程(a)で定義されるとおりである。工程(i)の新生抗原フラグメントは、MHCクラスIおよび/またはクラスII結合親和性を決定するために使用される。
【0075】
例えば、翻訳されたコード配列の相対位置20上の変異アミノ酸は、位置12~20の範囲の8個の連続するアミノ酸の連続するアミノ酸配列(すなわち、工程(i)のフラグメント)を含む新生抗原フラグメントを定義するであろう。工程(ii)による25アミノ酸の完全な新生抗原配列は、アミノ酸4個~28個からなるであろう。9アミノ酸からなる12位~20位の範囲の新生抗原フラグメントは、MHC結合親和性を決定するために使用されることになる。
【0076】
本発明の第1の態様の好ましい実施形態において、癌性細胞の試料中の工程(b)で決定される新生抗原の変異誘発遺伝子頻度は、少なくとも2%、好ましくは少なくとも5%、より好ましくは少なくとも10%である。
【0077】
本発明の第1の態様の好ましい実施形態において、工程(g)は、新生抗原のランク付けされたリストから、自己免疫疾患に関連する遺伝子から新生抗原を除去することをさらに含む。当業者は、公的データベースからの自己免疫疾患に関連する新生抗原を知っている。このようなデータベースの一例は、IEDBデータベース(www.iedb.org)である。新生抗原候補の除外は、変異を有する遺伝子がIEDBデータベースの自己免疫疾患に関連するそれらの遺伝子の1つに属する場合、またはよりストリンジェントではない方法において、患者が自己免疫に関与することが知られている遺伝子における変異を有するだけでなく、患者のMHC対立遺伝子の1つが、記載された自己免疫現象に関連してヒト自己免疫疾患エピトープについてIEDBデータベースに記載された対立遺伝子と同一でもある場合の、遺伝子レベルの両方で実施され得る。
【0078】
好ましい実施形態において、自己免疫疾患に関連する新生抗原は、データベースがこの関連について特定のMHCクラスI対立遺伝子を特定し、そして対応するHLA対立遺伝子が工程(d)(I)における個体において見出されなかった場合、新生抗原のランク付けされたリストから除去されない。
【0079】
本発明の第1の態様の好ましい実施形態において、工程(g)は、0.1より低いアミノ酸配列についてのシャノンエントロピー値を有する新生抗原を、新生抗原の前記ランク付けされたリストから除去することをさらに含む。
【0080】
本発明の第1の態様の好ましい実施形態において、工程(c)(i)における前記コード遺伝子の発現レベルは、超並列トランスクリプトーム配列決定によって決定される。
【0081】
本発明の第1の態様の好ましい実施形態において、工程(c)(i)において決定された発現レベルは、以下の式に従って計算された補正されたトランスクリプト/キロベースミリオン(corrTPM)値を使用する。
【0082】
【数1】
【0083】
式中、Mは、変異を含む工程(a)の変異の位置に及ぶリードの数であり、かつWは、変異を含まない工程(a)の変異の位置に及ぶリードの数であり、かつTPMは、変異を含む遺伝子のトランスクリプト/キロベースミリオン値であり、かつcは、0より大きい定数であり、好ましくはcは0.1である。
【0084】
本発明の第1の態様の好ましい実施形態において、工程(f)におけるランク合計は、重み付けされたランク合計であり、ここで
工程(d)のMHCクラスI結合親和性の予測が1000 nMより高いIC50値をもたらしたランクの第3のリストにおいて、工程(a)で決定された新生抗原の数は、各新生抗原のランク値に加算され、および/または
工程(d’)のMHCクラスII結合親和性の予測が1000nMより高いIC50値をもたらしたランクの第4のリストにおいて、工程(a)で決定された新生抗原の数は、各新生抗原のランク値に加算される。
【0085】
MHC結合親和性のこの重み付けは、ランクを加えることによって、非常に低いMHCクラスIおよび/またはクラスII結合親和性にペナルティを課す。
【0086】
本発明の第1の態様の好ましい実施形態において、工程(f)におけるランク合計は、重み付けされたランク合計であり、ここで工程(c)(i)が超並列トランスクリプトーム配列決定によって実施される場合、工程(f)のランク合計は、重み係数(WF)によって乗算され、ここでWFは、
変異についてのマッピングされたトランスクリプトームリード数が>0である場合、1であり、
変異についてのマッピングされたトランスクリプトームリード数が0であり、かつ非変異配列についてのマッピングされたリード数が0であり、かつトランスクリプト/ミリオン(TPM)値が少なくとも0.5である場合、2であり、
変異についてのマッピングされたトランスクリプトームリード数が0であり、かつ非変異配列についてのマッピングされたリード数が>0であり、かつトランスクリプト/ミリオン(TPM)値が少なくとも0.5である場合、3であり、
変異についてのマッピングされたトランスクリプトームリード数が0であり、かつ非変異配列についてのマッピングされたリード数が0であり、かつトランスクリプト/ミリオン(TPM)値が<0.5である場合、4であり、または、
変異についてのマッピングされたトランスクリプトームリード数が0であり、かつ非変異配列についてのマッピングされたリード数が>0であり、かつトランスクリプト/ミリオン(TPM)値が<0.5である場合、5である。
【0087】
重み付けマトリックス(weighing matrix)は、配列決定結果が不良な質(すなわち、マッピングされたリード数が少ない)であるか、および/または発現値(すなわち、TPM値)が特定の閾値未満であるかのいずれかである、特定の新生抗原にペナルティを課す。特定のパラメーターを重み付けする(すなわち、優先順位付けする)この様式は、単一のパラメーターについてのカットオフ値を使用するよりも良好な免疫原性を有する新生抗原を提供し、これは、他のパラメーターが新生抗原を適切であるとみなすとしても、1つのパラメーターにおける低い適合性のために、特定の新生抗原を排除するであろう。
【0088】
本発明の第1の態様の好ましい実施形態において、工程(g)は、代替の選択プロセスを含み、ここで新生抗原が、全ての選択された新生抗原についてのアミノ酸の総計の全長における設定された最大サイズに達するまで、最低ランクで開始する新生抗原のランク付けされたリストから選択され、ここで該最大サイズは、各ベクターについて1200~1800アミノ酸、好ましくは1500アミノ酸である。当該プロセスは、多価ワクチン接種アプローチにおいて反復され得、ここで上記に示される最大サイズは、多価アプローチにおいて使用される各ビヒクルに適用する。例えば、4個のベクターに基づく多価アプローチは、例えば、6000アミノ酸の総限界を可能にし得る。この実施形態は、特定の送達ビヒクルによって許容される新生抗原の最大サイズを考慮に入れる。したがって、ランク付けされたリストから選択された新生抗原の数は、新生抗原の数によって決定されるのではなく、新生抗原のサイズを考慮に入れる。抗原のランク付けされたリスト中の複数の小さな新生抗原は、選択された抗原のリスト内により多くの抗原を含むことを可能にするであろう。
【0089】
本発明の第1の態様の好ましい実施形態において、2つ以上の新生抗原は、それらが重複するアミノ酸配列セグメントを含む場合、1つの新しい新生抗原にマージされる。いくつかの場合において、新生抗原は、重複するアミノ酸配列を含み得る。これはFSP由来の新生抗原の場合に特によくみられる。余剰の重複配列を避けるために、新生抗原は、マージされた新生抗原の非余剰部分からなる単一の新しい新生抗原にマージされる。マージされた新しい新生抗原は、マージされた新生抗原の数および重複の程度に依存して、本発明の第1の態様の工程(a)において定義されるよりも大きいサイズを有し得る。
【0090】
本発明の第1の態様の好ましい実施形態において、個別化されたワクチンは、個別化遺伝子ワクチンである。用語「遺伝子ワクチン」は、「DNAワクチン」と同義に使用され、そしてワクチンとしての遺伝情報の使用を意味し、そしてワクチン接種された対象の細胞は、ワクチン接種の対象である抗原を産生する。
【0091】
本発明の第1の態様の好ましい実施形態において、個別化されたワクチンは、個別化された癌ワクチンである。
【0092】
第2の態様において、本発明は、以下の工程を含む、ワクチンとして使用するための、本発明の第1の態様に従って、新生抗原の組み合わせをコードする個別化されたベクターを構築する方法を提供する:
(i)少なくとも10^5~10^8、好ましくは10^6の異なる組み合わせで新生抗原のリストを順序付けする工程、
(ii)各接合セグメントが、接合の両側に15個の隣接する連続するアミノ酸を含む、各組み合わせについての新生抗原接合セグメントの全ての可能なペアを生成する工程、
(iii)ベクターが設計された個体中に存在するHLA対立遺伝子のみが試験される、接合セグメント中の全てのエピトープに対するMHCクラスIおよび/またはクラスII結合親和性を予測する工程、および
(iv)≦1500nMのIC50を有する最少数の接合エピトープを有する新生抗原の組み合わせを選択し、そして複数の組み合わせが同じ最少数の接合エピトープを有する場合、最初に遭遇する組み合わせが選択される工程。
【0093】
本発明の第1の態様による選択された新生抗原のリストは、単一の組み合わされた新生抗原に配列され得る。個体の新生抗原が結合される接合部は、癌性細胞上に存在するエピトープに関連しない望ましくないオフターゲット効果をもたらし得る新規なエピトープをもたらし得る。したがって、個体の新生抗原の接合部によって生成されるエピトープが低い免疫原性を有する場合に有利である。これらの末端に向かって、新生抗原は、異なる順序で配列され、異なる接合エピトープを生じ、そしてこれらの接合エピトープのMHCクラスIおよびクラスII結合親和性が予測される。≦1500nMのIC50値を有する接合エピトープの数が最も少ない組み合わせが選択される。選択された新生抗原の異なる組み合わせの数は、主に利用可能な計算能力によって制限される。使用される計算資源と必要とされる精度との間の妥協は、各新生抗原接合部の接合エピトープのMHCクラスIおよび/またはクラスII結合親和性が予測される、10^5~10^8、好ましくは10^6の異なる組み合わせの新生抗原が使用される場合である。
【0094】
代替の第2の態様において、本発明は、以下の工程を含む、ワクチンとして使用するための新生抗原の組み合わせをコードする個別化されたベクターを構築する方法を提供する:
(i)少なくとも10^5~10^8、好ましくは10^6の異なる組み合わせにおいて新生抗原のリストを順序付けする工程、
(ii)各接合セグメントが、接合の両側に15個の隣接する連続するアミノ酸を含む、各組み合わせについての新生抗原接合セグメントの全ての可能なペアを生成する工程、
(iii)ベクターが設計された個体中に存在するHLA対立遺伝子のみが試験される、接合セグメント中の全てのエピトープに対するMHCクラスIおよび/またはクラスII結合親和性を予測する工程、および
(iv)≦1500nMのIC50を有する最少数の接合エピトープを有する新生抗原の組み合わせを選択し、そして複数の組み合わせが同じ最少数の接合エピトープを有する場合、最初に遭遇した組み合わせが選択される工程。
【0095】
新生抗原のリストは、単一の組み合わされた新生抗原に配列され得る。個体の新生抗原が結合される接合部は、癌性細胞上に存在するエピトープに関連しない望ましくないオフターゲット効果をもたらし得る新規なエピトープをもたらし得る。したがって、個体の新生抗原の接合部によって生成されるエピトープが低い免疫原性を有する場合に有利である。これらの末端に向かって、新生抗原は、異なる順序で配列され、異なる接合エピトープを生じ、そしてそれらの接合エピトープのMHCクラスIおよびクラスII結合親和性が予測される。≦1500nMのIC50値を有する接合エピトープの数が最も少ない組み合わせが選択される。選択された新生抗原の異なる組み合わせの数は、主に利用可能な計算能力によって制限される。使用される計算資源と必要とされる精度との間の妥協は、各新生抗原接合部の接合エピトープのMHCクラスIおよび/またはクラスII結合親和性が予測される、10^5~10^8、好ましくは10^6の異なる組み合わせの新生抗原が使用される場合である。
【0096】
第3の態様において、本発明は、本発明の第1の態様による新生抗原のリストまたは本発明の第2の態様による新生抗原の組み合わせをコードするベクターを提供する。
【0097】
ベクターは、発現ベクターの免疫原性を増強する1つ以上のエレメントを含むことが好ましい。好ましくは、このようなエレメントは、新生抗原または新生抗原組み合わせポリペプチドへの融合体として発現されるか、またはベクター、好ましくは発現カセットに含まれる別の核酸によってコードされる。
【0098】
本発明の第3の態様の好ましい実施形態において、ベクターは、リスト中の最初の新生抗原のN末端に融合される、T細胞エンハンサーエレメント、好ましくは(配列番号173~182)、より好ましくは配列番号175をさらに含む。
【0099】
第3の態様のベクターまたは第4の態様のベクターのコレクションであって、ここでそれぞれの場合におけるベクターは、プラスミド;コスミド;リポソーム粒子、ウイルスベクターまたはウイルス様粒子からなる群から独立して選択され;好ましくは、アルファウイルスベクター、ベネズエラウマ脳炎(VEE)ウイルスベクター、シンドビス(SIN)ウイルスベクター、セムリキ森林ウイルス(SFV)ウイルスベクター、サルまたはヒトサイトメガロウイルス(CMV)ベクター、リンパ球脈絡髄膜炎ウイルス(LCMV)ベクター、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルスベクター、ポックスウイルスベクター、ワクシニアウイルスベクターまたは改変ワクシニアアンカラ(MVA)ベクター。ベクターのコレクションのであって、ここで該コレクションの各メンバーが異なる抗原またはそのフラグメントをコードするポリヌクレオチドを含み、そして、それはしたがって、典型的には同時に投与され、同じベクター型、例えばアデノウイルス由来ベクターを使用することが好ましい。
【0100】
最も好ましい発現ベクターは、アデノウイルスベクター、特に、ヒトまたは非ヒト大型類類人猿に由来するアデノウイルスベクターである。アデノウイルスが由来する好ましい大型の類人猿は、チンパンジー(Pan)、ゴリラ(Gorilla)およびオランウータン(Pongo)、好ましくはボノボ(Pan paniscus)および一般的なチンパンジー(Pan troglodytes)である。典型的には、天然に存在する非ヒト大型類人猿アデノウイルスは、それぞれの大型類人猿の糞便試料から単離される。最も好ましいベクターは、hAd5、hAd11、hAd26、hAd35、hAd49、ChAd3、ChAd4、ChAd5、ChAd6、ChAd7、ChAd8、ChAd9、ChAd10、ChAd11、ChAd16、ChAd17、ChAd19、ChAd20、ChAd22、ChAd24、ChAd26、ChAd30、ChAd31、ChAd37、ChAd38、ChAd44、ChAd55、ChAd63、ChAd73、ChAd82、ChAd83、ChAd146、ChAd147、PanAd1、PanAd2、およびPanAd3ベクターに基づく非複製性アデノウイルスベクターまたは複製能力のあるAd4およびAd7ベクターである。ヒトアデノウイルスhAd4、hAd5、hAd7、hAd11、hAd26、hAd35およびhAd49は、当技術分野でよく知られている。天然に存在するChAd3、ChAd4、ChAd5、ChAd6、ChAd7、ChAd8、ChAd9、ChAd10、ChAd11、ChAd16、ChAd17、ChAd19、ChAd20、ChAd22、ChAd24、ChAd26、ChAd30、ChAd31、ChAd37、ChAd38、ChAd44、ChAd63およびChAd82に基づくベクターは、WO2005/071093に詳細に記載されている。天然に存在するPanAd1、PanAd2、PanAd3、ChAd55、ChAd73、ChAd83、ChAd146、およびChAd147に基づくベクターは、WO2010/086189に詳細に記載されている。
【0101】
本発明の第3の態様の好ましい実施形態において、ベクターは、2つの独立した発現カセットを含み、ここで各発現カセットは、本発明の第1の態様による新生抗原のリストの一部または本発明の第2の態様による新生抗原の組み合わせをコードする。好ましくは、発現カセットによってコードされるリストの一部は、アミノ酸の数がほぼ等しいサイズである。
【0102】
本発明の第3の態様の好ましい実施形態において、ベクターは、本発明の第1の態様による新生抗原のランク付けされたリストの選択された新生抗原をコードする発現カセットを含み、ここで選択された新生抗原のリストは、ほぼ等しい長さの2つの部分に分割され、ここで、2つの部分は、内部リボソーム侵入部位(IRES)エレメントまたはウイルス2A領域(Lukeら、2008年)、例えば、リボソームスキップとして知られる翻訳効果によってポリタンパク質プロセシングを媒介するアフトウイルス口蹄疫ウイルス2A領域(配列番号184 APVKQTLNFDLLKLAGDVESNPGP)によって分離される(Donnellyら、J.Gen.Virology 2001年)。任意選択で、2つの部分の各々において、T細胞エンハンサーエレメント、好ましくは(配列番号173~182)、より好ましくは配列番号175が、リスト中の最初の新生抗原のN末端に融合される。
【0103】
第4の態様において、本発明は、本発明の第1の態様による新生抗原のリストの各々の一部または本発明の第2の態様による新生抗原の組み合わせをコードするベクターのコレクションを提供し、ここで、該コレクションは、2個~4個、好ましくは2個のベクターを含み、そして好ましくは、ここでリストの一部をコードするベクターインサートは、アミノ酸の数がほぼ等しいサイズである。
【0104】
第5の態様において、本発明は、癌ワクチン接種における使用のための、本発明の第3の態様によるベクターまたは本発明の第4の態様によるベクターのコレクションを提供する。
【0105】
癌ワクチン接種における使用のための本発明の第3の態様のベクターまたは本発明の第4の態様によるベクターのコレクションであって、ここで該癌が口唇、口腔、咽頭、消化器官、呼吸器官、胸腔内器官、骨、関節軟骨、皮膚、中皮組織、軟部組織、乳房、女性生殖器、男性生殖器、尿路、脳および中枢神経系の他の部分、甲状腺、内分泌腺、リンパ組織、および造血組織の悪性新生物からなる群から選択される。
【0106】
本発明の第5の態様の好ましい実施形態において、ワクチン接種レジメンは、2つの異なるウイルスベクターを用いた異種プライムブーストである。好ましい組合せは、プライミングのための大型類人猿由来アデノウイルスベクター、およびブーストのためのポックスウイルスベクター、ワクシニアウイルスベクターまたは改変ワクシニアアンカラ(MVA)ベクターである。好ましくは、これらは、少なくとも1週間、好ましくは6週間の間隔で連続的に投与される。
【実施例
【0107】
本発明は、免疫原性新生抗原を生じる可能性について腫瘍変異をスコア化する方法を説明する。このアプローチは、以下に記載されるように、腫瘍標本の次世代DNA配列決定(NGS-DNA)データ、および任意選択で、次世代RNA配列決定(NGS-RNA)データ、ならびに同じ患者から得られた正常試料のNGS-DNAデータを分析する。
【0108】
個別化されたアプローチは、癌患者から収集された試料を分析することによって得られたNGSデータに依拠する。各患者について、腫瘍中に確信的に存在し、かつタンパク質のアミノ酸配列の変化を生じさせる正常試料中に存在しない体細胞変異を同定するために、腫瘍DNAからのNGS-DNAエキソームデータは、正常DNAから得られたデータと比較される。
【0109】
正常なエキソームDNAはさらに分析され、患者のHLAクラスIおよびクラスII対立遺伝子を決定する。腫瘍試料からのNGS-RNAデータは、利用可能であれば、分析され、変異を有する遺伝子の発現を決定する。
【0110】
以下の実施例は、本発明の以下の態様を参照する。
実施例1:優先順位付け方法の説明
実施例2:既存の文献NGSデータセットへの優先順位付け方法の適用
実施例3:優先順位付け方法の検証
【0111】
優先順位付け方法の検証は、NGSデータおよび免疫原性新生抗原の両方が記載されているデータセット(公開された研究)に対してその性能を測定することによって行われた。本実施例において、優先順位付け方法aおよびbが使用される。この実施例は、上位60個の新生抗原を選択することによって、既知の免疫原性新生抗原の非常に高い部分が、(患者NGS-RNAを用いる)方法aまたは(患者NGS-RNAを用いない)方法bの両方を用いることによって、ワクチンに含まれることを示す。
【0112】
実施例4:遺伝的ワクチンベクターによって送達される新生抗原をコードする合成遺伝子のための新生抗原レイアウトの最適化。
【0113】
マウスモデルから得られた62個の選択された新生抗原を2つの合成遺伝子(合計31+31=62個の新生抗原)に分割すると、62個の新生抗原をコードする1つの合成遺伝子を用いる場合と比較して、免疫原性が改善されることの実証。
【0114】
実施例1:優先順位付け方法の説明
工程1:新生抗原を生成しうる変異の同定
腫瘍中に確信的に存在すると定義される変異は、理想的には以下の基準を満たすが、限定されるものではない:
腫瘍DNA試料中の変異誘発遺伝子頻度(MF)>=10%、
腫瘍DNA試料と対照DNA試料とのMFの比>=5、
腫瘍DNA中の体細胞変異体の染色体位置における変異したリードの数>2、
正常DNA中の体細胞変異体の染色体位置における変異したリードの数<2。
【0115】
2つの型の体細胞変異が、本発明の方法内で考慮される:得られるタンパク質において変異したアミノ酸を伴う非同義コドン変化を生じる単一ヌクレオチド変異体(SNV)、およびタンパク質をコードするmRNAの読み取り枠を変化させることによってフレームシフトペプチド(FSP)を生成する挿入/欠失(インデル)。
【0116】
工程2:各新生抗原の構造を生成する
工程2.1:
各変異について、新生抗原ペプチド配列は以下の方法で生成される:
a) SNV:
25アミノ酸長の配列は、中央に位置し、かつ両側に、好ましくはA=12の非変異アミノ酸が隣接する変異アミノを用いて生成される(図1)。変異がタンパク質のN末端またはC末端に近接して局在する場合には、A=12より少ない非変異アミノ酸が含まれる。最小数の8個の非変異アミノ酸が、変異の上流または下流のいずれかに付加される。これは、新生抗原が、少なくとも1個の変異アミノ酸を有する9量体ネオエピトープを含み得ることを確実にする。例えば、上流に4個の非変異アミノ酸および下流に2個付加することは不可能であり、これは非常に短いタンパク質に相当するであろう。
【0117】
時折、2つ(またはそれ以上)の変異、SNVsおよび/またはインデルが、タンパク質中に小さい距離(Aアミノ酸以下の距離)内に存在する。これらの場合、N末端またはC末端が付加されるA非変異アミノ酸のセグメントは、追加の変異(複数の場合もある)が存在するように改変されることになる。(図1)。
【0118】
次いで、各新生抗原について、NGS-DNAエキソームデータから同定された患者のHLA対立遺伝子を用いて、MHCクラスI 9量体エピトープ予測が行われる。新生抗原に関連するIC50値は、次いで、少なくとも1つの変異アミノ酸を含むすべての予測エピトープにわたって、および患者のクラスI対立遺伝子のすべてにわたって、最も低いIC50値を有するものとして選択される。
【0119】
b)フレームシフトペプチド(FSP):
FSPのため、最大N=12個の非変異アミノ酸がFSPのN末端に付加される(図2A);12個未満の非変異アミノ酸がFSPの上流に存在する場合、これらのみが付加される。変異アミノ酸をもたらすSNVが、付加された非変異セグメント内に存在する場合、該変異アミノ酸が含まれる。これは、伸長されたFSPペプチド配列を生成する。
【0120】
得られた伸長されたFSPペプチド配列は、次いで、9アミノ酸長フラグメントに分割され、そしてMHCクラスI 9量体エピトープ予測は、少なくとも1つの変異アミノ酸を含む全てのフラグメントについて(患者のHLA対立遺伝子を用いて)行われる。各フラグメントに関連するIC50値は、次いで、試験した全ての対立遺伝子にわたる最低予測IC50値として選択される。
【0121】
各9アミノ酸フラグメントは、次いで、フラグメントのN末端およびC末端にそれぞれ8個の上流アミノ酸および8個の下流アミノ酸を付加することによって、25アミノ酸長の新生抗原配列に伸長される(図2B)。伸長されたFSPのN末端またはC末端に近い9個のアミノ酸フラグメントについては、より少ないアミノ酸が付加される。
【0122】
それらの関連するIC50と共に得られた新生抗原配列は、次いで、SNVから得られた新生抗原配列のリストに加えられる。
【0123】
工程2.2 (任意選択)
次いで、自己免疫を誘導する潜在的な危険性を示す新生抗原を除去するために、任意の安全フィルターが、新生抗原のRSUMランク付けされたリスト上で実施される。フィルターは、新生抗原をコードする遺伝子が、自己免疫疾患に関連する既知のクラスIおよびクラスII MHCエピトープを含む遺伝子のブラックリスト(例えば、IEDBデータベースから検索される)の一部であるかどうかを試験する。利用可能であれば、該リストは該エピトープのHLA対立遺伝子も含む。
【0124】
新生抗原は、それらの起源となる変異がブラックリスト中の遺伝子の1つに由来し、かつ同時に患者のHLA対立遺伝子の1つが自己免疫疾患の遺伝子に関連するHLAに相当する場合に除去される。
【0125】
エピトープのHLA対立遺伝子に関する情報が利用可能でないブラックリスト中の遺伝子については、新生抗原は患者のHLA対立遺伝子から独立に除去される。
【0126】
工程2.3 (任意選択)
候補新生抗原のリストは、次いで、フィルター処理されて、複雑性の低いアミノ酸配列(1つ以上のアミノ酸(複数の場合もある)が複数回繰り返される配列中のセグメントの存在)を有するペプチドをコードする新生抗原を除去する。
【0127】
一度ヌクレオチド配列に変換されると、これらのセグメントは、GまたはCヌクレオチドの含有量が高い領域を表す可能性がある。したがって、これらの領域は、ワクチン発現カセットの最初の構築/合成の間に問題を生じ得、および/またはそれらはまた、コードされるポリペプチドの発現に負の影響を与え得る。
【0128】
複雑性の低いアミノ酸配列の同定は、新生抗原配列のシャノンエントロピーをそのアミノ酸の長さで割ったものを推定することによって行われる。シャノンエントロピーは、情報理論で一般に使用されるメトリックであり、そしてアルファベットサイズおよびシンボルの頻度に基づいてシンボルのストリングをコードするのに必要な平均最小ビット数を測定する。
【0129】
本発明の方法において、メトリックは、新生抗原配列中に存在するアミノ酸のストリングに適用された。0.10未満のシャノンエントロピー値を有する新生抗原は、リストから除去される。
【0130】
工程3:
患者の新生抗原の優先順位付けのプロセスの説明
優先順位付けを実行するために必要なデータは、
工程2からの(非同義SNVまたはフレームシフトインデルからの)M個の新生抗原のリスト、
工程1からの各新生抗原の変異誘発遺伝子頻度(mutant allele frequency)データ、
RNA配列決定データ(工程1)からの各新生抗原の発現データ、または代替方法(B)としての各新生抗原の発現データ(腫瘍試料からNGS-RNAデータが入手できない場合)、同一腫瘍タイプの一般的な遺伝子レベルの発現データベースからの各新生抗原の発現データ、
(工程3からの)各新生抗原に対する最良の変異9量体エピトープに対する予測されたMHCクラスI結合親和性である。
【0131】
優先順位付け戦略は、3つの別個の独立したランクスコア値(RFREQ、REXPR、RIC50)の組み合わせによって得られる全体的なスコアに基づく。3つのランクスコア値は、以下のパラメータのうちの1つに従ってM個の新生抗原のリストを独立して順序付けすることによって得られる(したがって、結果は新生抗原の3つの異なる順序付けられたリストであり、各リストはランクスコアを提供する)。
【0132】
工程3.1:対立遺伝子頻度ランクスコア(RFREQ)
各新生抗原は、新生抗原を生成する変異の観察された腫瘍対立遺伝子頻度と関連している。M個の新生抗原のリストは、最も高い対立遺伝子頻度から最も低い対立遺伝子頻度まで順序付けられる。対立遺伝子頻度が最も高い新生抗原は、ランクスコアRFREQが1に等しく、2番目に高いものはランクスコアRFREQ=2などである。同じ対立遺伝子頻度を有する新生抗原が存在する場合、それらは同じランクスコアRFREQを与えられ、すなわち、最も低いランクスコアはMよりも小さい可能性がある(表1)。
【0133】
表1 変異誘発遺伝子頻度が等しい新生抗原は同じランクスコアRFREQを得る
【0134】
【表1】
【0135】
工程3.2: RNA発現ランクスコア(REXPR)
各新生抗原の発現レベルは、全てのマッピングされたリードを考慮して、遺伝子中心トランスクリプト/キロベースミリオン(TPM)値(LiおよびDewey、2011年)を計算することによって、腫瘍NGS-RNAデータから決定される。TPM値は、次いで、NGS-RNAトランスクリプトームデータ中の変異の位置にわたる変異および野生型リードの数を考慮して改変される(corrTPM):
【0136】
【数2】
【0137】
変異の位置にリードが存在しない場合も含めるために、分子(numerator)および列挙子(enumerator)の両方に0.1の好ましい値が加えられる。
【0138】
患者の腫瘍からNGS-RNA配列決定データが入手できない場合、各新生抗原について、同一の腫瘍型からの発現データベース中に存在する対応する遺伝子のTPM中央値により、corrTPMが置換される。
【0139】
新生抗原は、次いで、corrTPM値によって決定される発現レベルに従って、ランク付けされる。順序付けは、最高の発現(スコアREXPが1に等しい)から最低の発現までである。同じcorrTPM値を有する新生抗原には、同じランクスコアREXPRが与えられる(表2)。
【0140】
表2:等しい発現値corrTPMを有する新生抗原は、同じランクスコアREXPRを得る
【0141】
【表2】
【0142】
工程3.3:HLAクラス-I結合予測(RIC50)
各SNVまたはFSP由来新生抗原ペプチドについて、MHCクラスI結合の可能性は、変異アミノ酸(複数の場合もある)を含むか、またはFSP由来の1つの変異アミノ酸を含む、すべての予測される9量体エピトープの中で最良の予測される(最低の)IC50値として定義される。予測は、正常なDNA試料の分析によって決定される患者中に存在するMHCクラスI対立遺伝子に対してのみ行われる。
【0143】
新生抗原のリストは、次いで、最も低い予測IC50値(1に等しいRIC50スコア)から最も高い予測IC50値まで順序付けされる。同じIC50値を有する新生抗原には、同じランクスコアRIC50が与えられる(表3)。
【0144】
表3:等しいIC50値を有する新生抗原は、同じランクスコアRIC50を得る
【0145】
【表3】
【0146】
工程3.4:
新生抗原の最終的な優先順位付け(ランキング)は、次いで、3個体のランクスコアの加重和(RSUM)を計算し、そして新生抗原を最低RSUM値から最高RSUM値までランク付けすることによって行われる(図3)。重み付けは、以下の方法において適用される:
式(I):
【0147】
【数3】
【0148】
式(I)において、kは、予測されるエピトープが1000 nMより高いIC50値を有する場合にRIC50値に加えられる定数値である(これは、高いRIC50スコア値を有する、すなわち高いIC50値を有する新生抗原にペナルティを課す)。
【0149】
kの値は、以下の方法において決定される。
【0150】
【数4】
【0151】
時折、NGS-RNAデータは、技術的な理由から、非変異アミノ酸についても、別の方法で発現された遺伝子中の変異アミノ酸についても、変異の位置における適用範囲を提供しない。WFは、NGS-RNAトランスクリプトームデータにおいて変異したリードが観察されなかった場合を考慮した、ダウンウェイト因子(結果として生じるRSUM値が増加し、そして新生抗原がリストにおいてさらに下位にランク付けされるため、ダウンウェイト)である。
【0152】
【数5】
【0153】
これは、新生抗原のRSUMランク付けリストを生成する。
【0154】
同じRSUMスコアを有する新生抗原は、それらのRIC50スコアに従ってさらに優先順位付けされる(図3)。RSUMスコアおよびRIC50スコアの両方が同一である場合、新生抗原は、それらのREXPRスコアに従ってさらに優先順位付けされる。RSUMスコア、RIC50スコアおよびREXPRスコアが同一である場合、新生抗原は、それらのRFREQスコアに従ってさらに優先順位付けされる。RSUMスコア、RIC50スコア、REXPRおよびRFREQスコアが同一である場合、新生抗原は、未補正遺伝子レベルTPM値に従ってさらに優先順位付けされる。
【0155】
工程4:
工程4.1:
M個のランク付けされた新生抗原の最終的なリストは、次いで、どのおよびいくつの新生抗原がワクチンベクター中に含まれ得るかを決定する方法によって分析される。
【0156】
当該方法は、反復手順で動作する。各反復において、L個のアミノ酸(好ましくは1500アミノ酸)の最大インサートサイズに到達するのに必要なN個の最良にランク付けされた新生抗原のリストが作成される。N個の新生抗原のリストが、同じFSPに由来する1より多い部分的に重複する新生抗原を含む場合、同じアミノ酸配列の冗長なストレッチの包含を回避するために、マージ工程が実施される。(図4)。マージ工程の後、含まれる新生抗原の全長が依然として最大の所望のインサートサイズに達しない場合、ランク付けされたリストから次の新生抗原を加えることによって、新たな反復が行われる。
【0157】
当該手順は、既に選択されたN個の新生抗原のリストに次の新生抗原を追加すると、最大の所望のインサートサイズLを超えることになる場合に停止する。
【0158】
したがって、Nの正確な値は、マージしたFSP由来の新生抗原(25量体より長い長さ)の存在によって減少し、またはタンパク質のN末端またはC末端に近い変異を含む新生抗原(これらの新生抗原は25量体よりも短いことになる)の存在によって増加する。
出力は、L=1500aa以下の全長を有するN個の新生抗原のリストである。
【0159】
工程4.2:
順序付けられたリストは、次いで、ほぼ等しい長さの2つの部分に分割される(図5)。当業者は、リストを2つの部分にどのように分割するかについて、複数の異なる方法が実行可能であることを知っている。
【0160】
工程4.3:
N個の選択された新生抗原配列のリストは、次いで、アセンブルされたポリ新生抗原ポリペプチド中の2つの隣接する新生抗原ペプチドの並置によって生成され得る予測される接合エピトープの形成を最小限にする方法に従って並べ替えられる。組み立てられたポリ新生抗原の100万のスクランブルされたレイアウトが、それぞれ異なる新生抗原の順序で生成される。各レイアウトは、次いで、分析されて、患者のHLA対立遺伝子の1つについてIC50<=1500nMを有する予測される接合エピトープの数を決定する。100万のレイアウト全体にわたってループする間に、その時点までに遭遇した最小数の予測される接合エピトープを有するレイアウトが記憶される。同じ最小数の予測される接合エピトープを有する第2のレイアウト上で後に見つかった場合、最初に遭遇したレイアウトが維持される。
【0161】
実施例2: 1 つの既存の文献データセットへの優先順位付け方法の適用
実施例1に記載の優先順位付け方法は、実験的に検証された免疫原性反応性が報告されている膵臓癌試料(Pat_3942;Tranら、2015年)からのNGSデータセットに適用された。腫瘍/正常エキソームおよび腫瘍トランスクリプトームNGS生データは、NCBI SRAデータベース[SRA ID:SRR2636946;SRR2636947;SRR4176783]からダウンロードされ、そして患者のムタノームを特徴付けるパイプラインで分析した。
【0162】
利用された変異検出パイプラインは、以下の8工程を含んだ。
a)リードの品質管理および最適化:
生の配列データの予備的な品質管理は、FastQC 0.11.5(Andrews、https://www.bioinformatics.babraham.ac.uk/projects/fastqc/)を用いて行われた。50塩基対未満の長さを有するペアになったリードはフィルター除去された。目視検査後、残りのリードは、Trimmomatic-0.33(Bolgerら、2014年)を使用して、5’および3’末端で任意選択で切り取られ、低品質の配列決定された塩基を除去され、そして参照ゲノムへのアラインメントに適したリード(QCフィルター処理されたリード)の品質を改善された。
【0163】
b)参照ゲノムに対するリードアラインメント:
QCフィルター処理されたDNAリードは、次いで、デフォルトパラメーターを有するBWA-memアルゴリズム(Li&Durbin、2009年)を使用することによってヒト参照ゲノムバージョンGRCh38/hg38に対して整列された。QCフィルター処理されたRNAリードは、全てのパラメータをデフォルトとして保持するHisat22.2.0.4(Kimら、2015年)ソフトウェアを使用して整列された。 1リードのみが整列されたリードペア、および同じマッピングスコアを有する1より多いゲノム遺伝子座に整列されたペアになったリードは、Samtools 1.4(Liら、2009年)を使用してフィルター除去された。
【0164】
c)アラインメント最適化:
DNAリードアラインメントは、小さな挿入または欠失(インデル)の周りの局所アラインメントを最適化し、重複したリードをマークし、そして再整列された領域における最終的な塩基品質スコアを再較正した手順によってさらに処理された。GATKソフトウェアバージョン3.7(McKennaら、2010年)からのツールRealignerTargetCreatorおよびIndelRealignerを使用して、インデル再アラインメントが行われた。重複したリードは、Picard version 2.12(http://broadinstitute.github.io/Picard)からのMarkDuplicatesを使用して、検出され、そしてマークされた。塩基品質スコアの再較正は、GATK version 3.7(McKennaら、2010)のBaseRecalibratorおよびPrintReadsを使用して行われた。ヒトdbSNP138放出において注釈された多型(https://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi?view+summary=view+summary&build_id=138)は、塩基再較正モデルを生成するために、既知の部位のリストとして使用された。
【0165】
d)HLAの決定:
患者特異的HLAクラスI型評価は、クラスIヒトハプロタイプをコードするhg38ゲノムの部分上の正常試料からのQCフィルター処理されたDNAリードをBWA-memと整列させることにより行われた(LiおよびDurbin、2009年)。1リードのみが整列されたリードペア、および同じマッピングスコアを有する1より多い遺伝子座に整列されリードペアは、Samtools 1.4(Liら、2009年)を使用して、フィルター除去された。最後に、患者の最も可能性の高いハプロタイプの決定は、optytipeソフトウェア(Szolekら、2014年)を用いて行われた。HLAクラスIIタイプ評価は、クラスIIヒトハプロタイプをコードするhg38ゲノムの部分上の正常試料からのQCフィルター処理されたDNAリードをBWA-memと整列させることにより行われた(Li&Durbin、2009年)。患者の最も可能性の高いクラスIIハプロタイプの決定は、HLAminerソフトウェア(Warrenら、2012年)を用いて行われた。
【0166】
e)変異体呼び出し:
単一ヌクレオチド変異体(SNV)および小さなインデルの体細胞変異体呼び出しは、GATK version 3.7[25]に含まれるmutect2(Cibulskisら、2012年)によって、およびVarscan2 2.3.9(Koboldtら、2012年)によって、腫瘍試料対正常対照試料を明示的に比較することによって、再較正されたDNAリードデータに対して実施される。すべてのパラメータは、デフォルトに保持された。デフォルトパラメータを有するSCALPEL(Fangら、2014年)は、インデルの変異体呼び出しのための追加ツールとして使用された。少なくとも1つのアルゴリズムによって検出された有意な体細胞変異体は、次いで、Annovarソフトウェア(Wangら、2010年)を使用してヒトRefseqトランスクリプトーム上にマッピングされ、そしてさらにフィルター処理された。タンパク質をコードする遺伝子のコード配列内の読み枠の変化(フレームシフトインデル)を生み出すコドンまたはインデルにおける非同義(ミスセンス)変化を生み出すSNVのみが保持された。中途での終止コドンを生み出すSNVは除外された。検出された各変異体について、DNAおよびRNA試料からの整列したNGSデータにおいて観察された変異およびwtリードの数は、次いで、Samtools 1.4(Liら、2009年)のmpileupを利用するカスタムツールを用いて決定された。
【0167】
f)新生抗原生成:
各体細胞変異体は、変異アミノ酸を含有するペプチドに翻訳された。SNVについては、新生抗原ペプチドは、変異アミノ酸の上流および下流に12個の野生型アミノ酸を付加することによって生成された。長さの例外は、変異アミノ酸がN末端からまたはC末端から12アミノ酸未満の距離にマッピングされた5つの変異について生じた。複数の25-量体ペプチドは、SNVが異なるタンパク質配列を有する複数の選択的スプライシングアイソフォームにおいてアミノ酸変化を誘導した3事例において生成された。FSPを生成するインデルでは、最初の新しいアミノ酸の上流に12個の野生型アミノ酸が付加された。少なくとも9アミノ酸の最終的な長さを有する改変FSPが保持された。
【0168】
g)新生抗原のHLA-I結合予測:
MHC-I結合の可能性は、変異アミノ酸(複数の場合もある)を含む全ての予測された9ー量体エピトープの中で最良の予測された(最低の)IC50値として決定された。予測は、IEDBソフトウェアのIEDB_推奨方法(Moutaftsiら、2006年)を使用して行われた。netMHCpan(Hoofら、2009年)方法は、MHC-IハプロタイプがIEDB_推奨方法(Moutaftsiら、2006年)によってカバーされていない場合に使用された。
【0169】
h)確信的な変異体の最終的な選択:
フレームシフトを引き起こすSNVおよびインデルの最初のリストは、次いで、以下の基準を満たす変異のみを選択することによってさらに減少された。
腫瘍DNA試料中の変異誘発遺伝子頻度(MF)>=10%
腫瘍DNA試料中および対照DNA試料中のMFの比>=5
腫瘍DNA中の体細胞変異体の染色体位置における変異リード>2
正常DNA中の体細胞変異体の染色体位置における変異リード<2
【0170】
患者Pat_3942において確信的に検出された変異をコードする129個の新生抗原の最終的なリストは、4個のフレームシフト生成インデルおよび125個のSNVを含んでいた。125個のSNVが128個の新生抗原を生じ、そのうち3個は複数の選択的スプライシングアイソフォーム上にマップされた変異に由来した。4個のフレームシフトインデルは、全長307アミノ酸および全260個の新生抗原配列を有する4個のFSPを生成する。SNVまたはフレームシフトインデルのいずれかに由来する全388個の新生抗原の全長は、3942アミノ酸であった。
【0171】
遺伝子ワクチン、例えばアデノウイルスベクターによって収容され得る最大インサートサイズ(発現制御エレメントを含む)は、制限されるため、コードされるポリ新生抗原に最大サイズのL個のアミノ酸を課す。アデノウイルスベクターについてのLの典型的な値は、1500アミノ酸のオーダーであり、全ての新生抗原についての3942アミノ酸の累積長より小さい。したがって、3942アミノ酸制限に適合するランク付けされた新生抗原の最適なサブセットを選択するために、実施例1に記載の優先順位付け戦略が適用された。
【0172】
表4は、1485 aaの累積長に達するように選択された60個の選択された新生抗原の全てを報告する。選択プロセスは、FSP chr11:1758971_AC_(2ヌクレオチド欠失)に由来する6個の新生抗原配列、FSP chr6:168310205_-_T(1ヌクレオチド挿入)に由来する2個の新生抗原配列、およびFSP chr16_3757295_GATAGCTGTAGTAGGCAGCATC_(22ヌクレオチド欠失;配列番号185)に由来する1個の新生抗原配列を含んだ。選択の間、いくつかの重複FSP由来新生抗原配列は、余剰の配列セグメントを除去するためにマージされた(表5)。マージされた新生抗原配列の詳細は図6に示される。
【0173】
Pat_3942において確信的に検出された129個の変異によって生成された全ての新生抗原配列は、3つのパラメータの関連値(変異誘発遺伝子頻度MFREQ、補正された発現値corrTPM、MHCクラスI 9量体エピトープMIC50に対する最良の予測されたIC50値)、得られた3つの独立したランクスコア(RFREQ、REXPR、RIC50)、重み付け因子WF、重み付けされたRSUM値および得られたRSUMランクを含む表6にリストされる。
【0174】
重要なことに、患者においてT細胞反応性を誘導すると報告された3つの新生抗原配列(Tranら、2015年)は、すべて、優先順位付け戦略によって上位60個の新生抗原の中から選択された。
【0175】
表4:Pat_3942について選択された60個の新生抗原のリスト。SNV由来の新生抗原における変異aaは太字で示される。FSP由来の新生抗原については、フレームシフトペプチドの一部であるアミノ酸も太字である。T細胞反応性を誘導することが実験的に確認された新生抗原配列は、「Final Rank(最終ランク)」の欄にTPと標識される。与えられたゲノム座標は、ヒトゲノムアセンブリGRch38/hg38に関するものである。
【0176】
【表4-1】
【0177】
【表4-2】
【0178】
【表4-3】
【0179】
【表4-4】
【0180】
【表4-5】
【0181】
表5:Pat_3492についてマージしたFSP由来の新生抗原。フレームシフトペプチドの一部であるアミノ酸(変異アミノ酸)は太字で示される。与えられたゲノム座標は、ヒトゲノムアセンブリGRch38/hg38に関するものである。
【0182】
【表5-1】
【0183】
【表5-2】
【0184】
表6:それらのRSUMランクによって順序付けられたPat_3492についての全388の新生抗原。FSP由来の新生抗原については、フレームシフトペプチドの一部であるアミノ酸も太字である。T細胞反応性を誘導することが実験的に確認された新生抗原配列は、「Final Rank(最終ランク)」の欄にTPと標識される。与えられたゲノム座標は、ヒトゲノムアセンブリGRch38/hg38に関するものである。
【0185】
【表6-1】
【0186】
【表6-2】
【0187】
【表6-3】
【0188】
【表6-4】
【0189】
【表6-5】
【0190】
【表6-6】
【0191】
【表6-7】
【0192】
【表6-8】
【0193】
【表6-9】
【0194】
【表6-10】
【0195】
実施例3:優先順位付け方法の検証 優先順位付け方法を検証するためにCD8T細胞反応性を有する全部で30の実験的に検証された免疫原性新生抗原を用いたデータセットが分析された(表7)。データセットは、NGS生データ(正常/腫瘍エキソームNGS-DNAおよび腫瘍NGS-RNAトランスクリプトーム)が利用可能な5つの異なる腫瘍タイプにわたる13人の癌患者からの生検を含む。
【0196】
NGSデータは、NCBI SRAウェブサイトからダウンロードされ、そして実施例1で適用されたものと同じNGS処理パイプラインで処理された。30の報告された実験的に検証された新生抗原のうちの28についての変異は、実施例2に開示されたNGS処理パイプラインを適用することによって同定された(2つの変異は、非常に少ない数の変異リードのために検出されなかった)。各患者試料について、1500アミノ酸の標的最大ポリペプチド(ポリ新生抗原)サイズを推測して、同定されたすべての新生抗原の全リストが、次いで、実施例1の工程3に記載される方法に従ってランク付けされた。
【0197】
表8は、9量体エピトープ予測のみについて、または8~11アミノ酸のエピトープを含む予測について、28個の新生抗原について予測されたMHCクラスI IC50値を示す。両方の場合において、最良の(最低の)IC50値が、新生抗原ワクチン候補の選択のために当該技術分野で頻繁に適用される500nM閾値よりも十分に上(より高い)であり、そして、その結果、個別化されたワクチンから除外されたものであろう、いくつかの新生抗原が存在する。
【0198】
図7Aは、28個の検出された実験的に検証された新生抗原についての優先順位付け方法によって得られたRSUMランクを示す。点線(図5A)は、約1500アミノ酸のインサート容量(発現制御エレメントを除く)を有するアデノウイルス個別化ワクチンベクターに収容され得る最大数の新生抗原25量体(60個)を示す。
30個の実験的に検証された新生抗原のうち27個(90%)は、上位60個の新生抗原の中に存在するため、個別化されたワクチンベクターに含まれていたことになる。次いで、患者の腫瘍からのNGS-RNA発現データが入手できなかったと仮定して、優先順位付けが繰り返された。各新生抗原についてのcorrTPM発現値は、その特定の腫瘍型についてのTCGA発現データ中の対応する遺伝子のTPM中央値として推定された[NCBI GEOアクセッション:GSE62944]。図7Bは、この場合にも、大部分(30個中25個=83%)の実験的に検証された新生抗原がワクチンベクターに含まれていたであろうことを示す。重要なことに、検討されたデータセットのそれぞれについて、個別化されたワクチンベクターに含まれていたであろうと検証された少なくとも1つの新生抗原があった。28個の検証された新生抗原についてのNGS-RNAデータの有無によるRSUMランキング結果を含むさらなる詳細は表7にリストされる。
【0199】
したがって、両結果から、優先順位付け方法は、患者の腫瘍からのトランスクリプトームデータの存在下でも非存在下でも、最も関連性のある新生抗原、すなわち、個別化されたワクチンベクターに含まれるべき実験的に検証された免疫原性を有する新生抗原を含む新生抗原のリストを選択できることが確認された。
【0200】
表7:ベンチマークとして使用された文献データセットおよび新生抗原のリスト。各データセットについて、実験的に検証されたT細胞反応性を有する新生抗原がリストされる。変異したアミノ酸は太字かつ下線で示される。2つの選択的スプライシングアイソフォームの存在による2つの異なる新生抗原を生じる変異については、より低いRSUMランクを有する新生抗原のみが報告される(aで示される)。与えられたゲノム座標は、ヒトゲノムアセンブリGRch38/hg38に関するものである。
【0201】
【表7-1】
【0202】
【表7-2】
【0203】
【表7-3】
【0204】
表8:28個の新生抗原についての予測されたMHCクラスI IC50値(nM)。与えられたゲノム座標は、ヒトゲノムアセンブリGRch38/hg38に関するものである。
【0205】
【表8-1】
【0206】
【表8-2】
【0207】
実施例4:遺伝的ワクチンベクターによって送達される新生抗原をコードする合成遺伝子のための新生抗原レイアウトの最適化
60個の新生抗原を含有するポリ新生抗原は、遺伝的ワクチンベクターに挿入された発現カセットによってコードされる必要がある約1500アミノ酸の全長を有する人工タンパク質を生じることになる。このような長い人工タンパク質の発現は最適以下であり得るため、コードされた新生抗原に対して誘導される免疫原性のレベルに影響を及ぼす。したがって、ポリ新生抗原を2つの断片に分割することは、より高いレベルの誘導された免疫原性を得るために役立ち得る。
【0208】
したがって、ネズミ腫瘍細胞株CT26に由来する62個の新生抗原(表9)からなるポリ新生抗原は、アデノウイルスベクターGAd20を使用して、異なるレイアウト(図8Aおよび8B)において、単一のポリ新生抗原(GAd20-CT26-62、配列番号170)によってコードされる全62個の新生抗原を有する単一のベクターレイアウトにおいて、62個の新生抗原の半分を各々コードする2つのベクターレイアウト(GAd-CT26-1-31+GAd-CT26-32-62、配列番号171、172)において、および単一のベクター中に存在する同じ2つの別個の発現カセットを有する第3のレイアウト(GAd-CT26 dual 1-31および32-62)において、インビボで免疫原性を誘導するその能力について、試験された。1つのTPA T細胞エンハンサーエレメント(配列番号173)は、62個の新生抗原を含むポリ新生抗原のN末端に存在し、そして1つのTPA T細胞エンハンサーエレメントは、2つの31個の新生抗原構築物のそれぞれのN末端に存在した。HAペプチド配列(配列番号183)は、発現をモニターする目的で組み立てられた新生抗原のC末端に付加された。
【0209】
免疫原性は、5×10^8ウイルス粒子(vp)の用量で筋肉内に1回、ナイーブBalbCマウスの群(n=6)を免疫することによってインビボで決定された。T細胞応答は、25量体の新生抗原を含むペプチドプールの認識のために、INFγ ELISpotにより脾細胞に対する免疫化の2週間後に測定された。
【0210】
長いポリ新生抗原を発現するGAd20-CT26-62は、同時投与された2つのベクターレイアウトGAd-CT26-1-31/GAd-CT26-32-62と比較した場合、新生抗原特異的T細胞応答の最適以下の誘導を示した(図8A)。したがって、長いポリ新生抗原を、ほぼ等しい長さの2つのより短いポリ新生抗原に分割することにより、有意に改善された免疫原性応答が提供された。重要なことに、デュアルカセットベクターGAd-CT26 dual 1-31および32-62(図8B)も、GAd-CT26-1-62よりも有意に高いレベルの免疫原性を誘導し、そして2つのアデノウイルスベクターGAd-CT26-1-31+GAd-CT26-31-62(図8AおよびB)の組み合わせについて観察されたレベルに匹敵した。
【0211】
したがって、長いポリ新生抗原を2つのほぼ等しいサイズのより小さいポリ新生抗原に分割することにより、優れた免疫原性を有するワクチンベクター組成物(1つのデュアルカセットベクターまたは2つの異なるベクター)が提供された。
【0212】
表9: 62 個のCT26 新生抗原のリスト。種々の構築物によってコードされるポリ新生抗原中の個々の新生抗原の順序が示される。
【0213】
【表9-1】
【0214】
【表9-2】
【0215】
【表9-3】
【0216】
(参考文献)
Andersen RS, KvistborgP, Fr&oslash;sig TM, Pedersen NW, Lyngaa R, Bakker AH, Shu CJ, Straten Pt, SchumacherTN, Hadrup SR. (2012). Parallel detection of antigen-specific T cell responsesby combinatorial encoding of MHC multimers. Nat Protoc, 7(5), 891-902.doi:10.1038/nprot.2012.037

Andreatta M &Nielsen M. (2016). Gapped sequence alignment using artificial neural networks:application to the MHC class I system. Bioinformatics, 32(4), 511-517.doi:10.1093/bioinformatics/btv639

Andrews, S. FastQC AQuality Control tool for High Throughput Sequence Data. Available online at:http://www.bioinformatics.babraham.ac.uk/projects/fastqc.

Bolger AM, Lohse M, UsadelB. (2014). Trimmomatic:a flexible trimmer for Illumina sequence data. Bioinformatics, 30(15),2114-2120. doi:10.1093/bioinformatics/btu170

Cibulskis K1, LawrenceMS, Carter SL, Sivachenko A, Jaffe D, Sougnez C, Gabriel S, Meyerson M, LanderES, Getz G. (2013). Sensitive detection of somatic point mutations in impureand heterogeneous cancer samples. Nat Biotechnol, 31(3), 213-219.doi:10.1038/nbt.2514

Donnelly ML, Hughes LE,Luke G, Mendoza H, ten Dam E, Gani D, Ryan MD.(2001) The 'cleavage' activitiesof foot-and-mouth disease virus 2A site-directed mutants and naturallyoccurring '2A-like' sequences. J Gen Virol. 2001 82(Pt 5):1027-41.

Fang H, Wu Y, Narzisi G,O'Rawe JA, Barr&oacute;n LT, Rosenbaum J, Ronemus M, Iossifov I, Schatz MC, Lyon GJ.(2014). Reducing INDEL calling errors in whole genome and exome sequencingdata. Genome Med, 6(10), 89. doi:10.1186/s13073-014-0089-z

Fritsch EF, Rajasagi M,Ott PA, Brusic V, Hacohen N, Wu CJ. (2014). HLA-binding properties of tumorneoepitopes in humans. Cancer Immunol Res, 2(6), 522-529.doi:10.1158/2326-6066.CIR-13-0227

Gros A, Parkhurst MR,Tran E, Pasetto A, Robbins PF, Ilyas S, Prickett TD, Gartner JJ, Crystal JS,Roberts IM, Trebska-McGowan K, Wunderlich JR, Yang JC1, Rosenberg SA. (2016).Prospective identification of neoantigen-specific lymphocytes in the peripheralblood of melanoma patients. Nat Med. 22(4):433-8. doi: 10.1038/nm.4051.

Hoof I, Peters B, SidneyJ, Pedersen LE, Sette A, Lund O, Buus S, Nielsen M. (2009). NetMHCpan, a methodfor MHC class I binding prediction beyond humans. Immunogenetics, 61(1), 1-13.doi:10.1007/s00251-008-0341-z

Jurtz V, Paul S,Andreatta M, Marcatili P, Peters B, Nielsen M. (2017). NetMHCpan-4.0: ImprovedPeptide-MHC Class I Interaction Predictions Integrating Eluted Ligand andPeptide Binding Affinity Data. J Immunol, 199(9), 3360-3368.doi:10.4049/jimmunol.1700893

Kandoth C, McLellan MD,Vandin F, Ye K, Niu B, Lu C, Xie M, Zhang Q, McMichael JF, Wyczalkowski MA,Leiserson MDM, Miller CA, Welch JS, Walter MJ, Wendl MC, Ley TJ, Wilson RK,Raphael BJ, Ding L. (2013). Mutational landscape and significance across 12major cancer types. Nature, 502(7471), 333-339. doi:10.1038/nature12634

Kim D, Langmead B, SalzbergSL. (2015).HISAT: a fast spliced aligner with low memory requirements. Nat Methods, 12(4),357-360. doi:10.1038/nmeth.3317

Koboldt DC, Zhang Q,Larson DE, Shen D, McLellan MD, Lin L, Miller CA, Mardis ER, Ding L, Wilson RK.(2012). VarScan 2: somatic mutation and copy number alteration discovery incancer by exome sequencing. Genome Res, 22(3), 568-576.doi:10.1101/gr.129684.111

Li B & Dewey CN.(2011). RSEM: accurate transcript quantification from RNA-Seq data with orwithout a reference genome. BMC Bioinformatics, 12, 323.doi:10.1186/1471-2105-12-323

Li H & Durbin R.(2009). Fast and accurate short read alignment with Burrows-Wheeler transform.Bioinformatics, 25(14), 1754-1760. doi:10.1093/bioinformatics/btp324

Li H, Handsaker B,Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R; 1000Genome Project Data Processing Subgroup. Genome Project Data Processing, S.(2009). The Sequence Alignment/Map format and SAMtools. Bioinformatics, 25(16),2078-2079. doi:10.1093/bioinformatics/btp352

Luke GA, de Felipe P,Lukashev A, Kallioinen SE, Bruno EA, Ryan MD. (2008) Occurrence, function andevolutionary origins of '2A-like' sequences in virus genomes.J Gen Virol. 200889(Pt 4):1036-42. doi: 10.1099/vir.0.83428-0.

Lundegaard C, LamberthK, Harndahl M, Buus S, Lund O, Nielsen M. (2008). NetMHC-3.0: accurate webaccessible predictions of human, mouse and monkey MHC class I affinities forpeptides of length 8-11. Nucleic Acids Res, 36(Web Server issue), W509-512.doi:10.1093/nar/gkn202

McKenna A, Hanna M,Banks E, Sivachenko A, Cibulskis K, Kernytsky A, Garimella K, Altshuler D,Gabriel S, Daly M, DePristo MA. (2010). The Genome Analysis Toolkit: aMapReduce framework for analyzing next-generation DNA sequencing data. GenomeRes, 20(9), 1297-1303. doi:10.1101/gr.107524.110

Moutaftsi M, Peters B,Pasquetto V, Tscharke DC, Sidney J, Bui HH, Grey H, Sette A. (2006). Aconsensus epitope prediction approach identifies the breadth of murineT(CD8+)-cell responses to vaccinia virus. Nat Biotechnol, 24(7), 817-819.doi:10.1038/nbt1215

Sahin U, DerhovanessianE, Miller M, Kloke BP, Simon P, L&ouml;wer M, Bukur V, Tadmor AD, Luxemburger U,Schr&ouml;rs B, Omokoko T, Vormehr M, Albrecht C, Paruzynski A, Kuhn AN, Buck J, HeeschS, Schreeb KH, M&uuml;ller F, Ortseifer I, Vogler I, Godehardt E, Attig S, Rae R,Breitkreuz A, Tolliver C, Suchan M, Martic G, Hohberger A, Sorn P, Diekmann J,Ciesla J, Waksmann O, Br&uuml;ck AK, Witt M, Zillgen M, Rothermel A, Kasemann B,Langer D, Bolte S, Diken M, Kreiter S, Nemecek R, Gebhardt C, Grabbe S, H&ouml;llerC, Utikal J, Huber C, Loquai C, T&uuml;reci &Ouml;. Personalized RNA mutanome vaccinesmobilize poly-specific therapeutic immunity against cancer. Nature, 547(7662),222-226. doi:10.1038/nature23003

Shannon, C. E. (1997).The mathematical theory of communication. 1963. MD Comput, 14(4), 306-317.

Strait & Dewey.(1996). The Shannon information entropy of protein sequences. Biophys. J. 1996 Biophys J.71(1),148-55.

Szolek A, Schubert B, MohrC, Sturm M, Feldhahn M, Kohlbacher O. (2014). OptiType: precision HLA typing fromnext-generation sequencing data. Bioinformatics, 30(23), 3310-3316.doi:10.1093/bioinformatics/btu548

Tran E, Ahmadzadeh M, LuYC, Gros A, Turcotte S, Robbins PF, Gartner JJ, Zheng Z, Li YF, Ray S,Wunderlich JR, Somerville RP, Rosenberg SA. (2015). Immunogenicity of somaticmutations in human gastrointestinal cancers. Science, 350(6266), 1387-1390.doi:10.1126/science.aad1253

Wang K, Li M,Hakonarson H. (2010). ANNOVAR:functional annotation of genetic variants from high-throughput sequencing data.Nucleic Acids Res, 38(16), e164. doi:10.1093/nar/gkq603

Warren RL, Choe G,Freeman DJ, Castellarin M, Munro S, Moore R, Holt RA. (2012). Derivation of HLAtypes from shotgun sequence datasets. Genome Med, 4(12), 95. doi:10.1186/gm396

YarchoanM, Johnson BA3rd, Lutz ER, Laheru DA, Jaffee EM. (2017). Targeting neoantigens toaugment antitumour immunity. Nat Rev Cancer, 17(9), 569.doi:10.1038/nrc.2017.74
【符号の説明】
【0217】
図1
protein sequence with mutated aa 変異アミノ酸を有するタンパク質配列
mutated aa 変異アミノ酸
Neoantigen 新生抗原
mer 量体
aa アミノ酸
protein sequence with two closeby mutated aa 2つの近傍の変異アミノ酸を有するタンパク質配列
protein sequence with mutated aa close to C-terminus C末端に近い変異アミノ酸を有するタンパク質配列

図2A
Add maximal 12 wt aa at N-terminus N末端に最大12wtアミノ酸を付加する
max 12 wt aa 最大12wtアミノ酸
If mutated aa is present include 変異アミノ酸が存在する場合に含む
Split into 9mer fragments 9量体フラグメントに分割する
mer 量体
Perform MHC class I predictions (9mer epitopes) MHCクラスI予測(9量体エピトープ)を行う
For each 9mer fragment select best IC50 value (lowest value) 各9量体フラグメントについて、最良のIC50値(最低値)を選択する

図2B
Expand 9mer fragments into longer neoantigens (max 25aa) 9量体フラグメントをより長い新生抗原(最大25アミノ酸)に伸長する
max 12 wt aa 最大12wtアミノ酸
aa アミノ酸
mer 量体
List of FSP-derived neoantigens with associated IC50 関連するIC50を有するFSP由来の新生抗原のリスト

図3
Rank neoantigens according to mutant allele Frequency 変異誘発遺伝子頻度により新生抗原をランク付けする
Rank neoantigens according to corrTPM corrTPMにより新生抗原をランク付けする
Rank neoantigens according to MHC I binding prediction (IC50) MHC I結合予測(IC50)により新生抗原をランク付けする
Rank neoantigens by weighted sum of ranks ランクの加重和により新生抗原をランク付けする
Final rank 最終的なランク

図4
Final ranked list of SNV and FSP neoantigens SNV新生抗原およびFSP新生抗原の最終的なランク付けされたリスト
Pos 位置
mer 量体
merge マージ
Updated final ranked list of SNV and FSP neoantigens SNV新生抗原およびFSP新生抗原の更新された最終的なランク付けされたリスト

図5
Updated final ranked list of SNV and FSP neoantigens SNV新生抗原およびFSP新生抗原の更新された最終的なランク付けされたリスト
Pos 位置
mer 量体
Step 工程
Group 群
Step 1: Select N neoantigens such that their total length in aa is smaller than the maximal insert size L of the vaccine vector 工程1:アミノ酸のそれらの全長がワクチンベクターの最大インサートサイズLよりも小さくなるように、N個の新生抗原を選択する
Step 2: Split the list of N neoantigens into two groups with approximately equal total length in aa. Add neoantigens to group 1 until the total length ofthe T neoantigens is larger than L/2. The remaining (N-T) neoantigens are put into group2. 工程2:N個の新生抗原のリストを、アミノ酸の全長がほぼ等しい2つの群に分ける。T新生抗原の全長がL/2より長くなるまで、群1に新生抗原を追加する。残りの(N-T)新生抗原は、群2に入れられる。

図6
Merged FSP example マージしたFSPの例
complete FSP 完全なFSP
merged FSP マージしたFSP
Pos 位置
Final Rank 最終ランク
SEQ ID NO 配列番号

図7A
RSUM ranking of experimentally validate neoantigens (with patient's RNAseq) (患者のRNA配列を用いて)実験的に検証された新生抗原のRSUMランキング
Position in ranked NeoAg list ランク付けされた新生抗原リスト中の位置
Validated neoantigens 検証された新生抗原
Melanoma 黒色腫
Ovarian 卵巣
Rectal 直腸
Colon 結腸
Breast 乳房

図7B
RSUM ranking of experimentally validate neoantigens (without patient's RNAseq) (患者のRNA配列なしで)実験的に検証された新生抗原のRSUMランキング
Position in ranked NeoAg list ランク付けされた新生抗原リスト中の位置
Validated neoantigens 検証された新生抗原
Melanoma 黒色腫
Ovarian 卵巣
Rectal 直腸
Colon 結腸
Breast 乳房

図8
splenocytes 脾細胞
Pool プール
図1
図2A
図2B
図3
図4
図5
図6
図7A
図7B
図8
【配列表】
0007477888000001.app