特許7477888 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ノイスコム　アーゲーの特許一覧

特許7477888個別化された癌ワクチンの作製のための癌変異の選択

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
3
4
5
6
7A
7B
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-04-23

(45)【発行日】2024-05-02

(54)【発明の名称】個別化された癌ワクチンの作製のための癌変異の選択

(51)【国際特許分類】

C12N 15/12 20060101AFI20240424BHJP

C12Q 1/6886 20180101ALI20240424BHJP

C12Q 1/6869 20180101ALN20240424BHJP

C12Q 1/6844 20180101ALN20240424BHJP

C40B 40/06 20060101ALN20240424BHJP

【ＦＩ】

C12N15/12 ZNA

C12Q1/6886 Z

C12Q1/6869 Z

C12Q1/6844 Z

C40B40/06

【請求項の数】 9

(21)【出願番号】P 2021526506

(86)(22)【出願日】2019-11-15

(65)【公表番号】

(43)【公表日】2022-02-07

(86)【国際出願番号】 EP2019081428

(87)【国際公開番号】W WO2020099614

(87)【国際公開日】2020-05-22

【審査請求日】2022-07-19

(31)【優先権主張番号】18206599.5

(32)【優先日】2018-11-15

(33)【優先権主張国・地域又は機関】EP

(73)【特許権者】

【識別番号】518435943

【氏名又は名称】ノイスコムアーゲー

(74)【代理人】

【識別番号】100088904

【弁理士】

【氏名又は名称】庄司隆

(74)【代理人】

【識別番号】100124453

【弁理士】

【氏名又は名称】資延由利子

(74)【代理人】

【識別番号】100135208

【弁理士】

【氏名又は名称】大杉卓也

(74)【代理人】

【識別番号】100183656

【弁理士】

【氏名又は名称】庄司晃

(74)【代理人】

【識別番号】100224786

【弁理士】

【氏名又は名称】大島卓之

(74)【代理人】

【識別番号】100225015

【弁理士】

【氏名又は名称】中島彩夏

(74)【代理人】

【識別番号】100231647

【弁理士】

【氏名又は名称】千種美也子

(74)【代理人】

【識別番号】100163544

【弁理士】

【氏名又は名称】平田緑

(72)【発明者】

【氏名】ニコシア，アルフレード

(72)【発明者】

【氏名】スカルセッリ，エリーザ

(72)【発明者】

【氏名】ラーム，アルミン

(72)【発明者】

【氏名】レオニ，グイド

【審査官】小金井悟

(56)【参考文献】

【文献】特表２０１８－５２４００８（ＪＰ，Ａ）

【文献】特表２０１８－５０７６８６（ＪＰ，Ａ）

【文献】国際公開第２０１７／１０６６３８（ＷＯ，Ａ１）

【文献】Cancer Sci.，2017年02月，Vol.108, No.2，pp.170-177

【文献】J. Exp. Clin. Cancer Res.，2018年04月20日，Vol.37, No.86，pp.1-10

【文献】Nature，2017年07月13日，Vo.547, No.7662 (pp.217-221)，pp.1-34

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｃ１２Ｎ１５／００－１５／９０

Ｃ１２Ｑ１／００－３／００

ＣＡｐｌｕｓ／ＭＥＤＬＩＮＥ／ＢＩＯＳＩＳ（ＳＴＮ）

(57)【特許請求の範囲】

【請求項1】

以下の工程を含む、個別化されたワクチンにおける使用のための癌新生抗原を選択する方法：
（ａ）個体から得られた癌性細胞の試料中の新生抗原を決定する工程であって、ここで
各新生抗原が
コード配列内に含まれ、
前記個体の非癌性細胞の試料中に存在しない、コードされたアミノ酸配列の変化をもたらすコード配列における少なくとも１つの変異を含み、かつ
癌性細胞の試料中のコード配列の９個～４０個、好ましくは１９個～３１個、より好ましくは２３個～２５個、最も好ましくは２５個の連続するアミノ酸からなり、
（ｂ）各新生抗原について、コード配列内の工程（ａ）の前記変異のそれぞれの変異誘発遺伝子頻度を決定する工程、
（ｃ）（ｉ）前記癌性細胞の試料において、前記変異の少なくとも１つを含む各コード配列の発現レベルを決定する工程、または
（ｉｉ）癌性細胞の試料と同じ癌タイプの発現データベースから、前記変異の少なくとも１つを含む各コード配列の発現レベルを決定する工程、
（ｄ）新生抗原のＭＨＣクラスＩ結合親和性を予測する工程であって、ここで
（Ｉ）ＨＬＡクラスＩ対立遺伝子は、前記個体の非癌性細胞の試料から決定され、
（ＩＩ）（Ｉ）において決定された各ＨＬＡクラスＩ対立遺伝子について、新生抗原の８個～１５個、好ましくは９個～１０個、より好ましくは９個の連続するアミノ酸からなる各フラグメントのＭＨＣクラスＩ結合親和性が予測され、ここで各フラグメントは、
工程（ａ）の変異によって引き起こされる少なくとも１つのアミノ酸変化を含み、かつ
(ＩＩＩ)最も高いＭＨＣクラスＩ結合親和性を有するフラグメントは、新生抗原のＭＨＣクラスＩ結合親和性を決定し、
工程（ｄ）に加えて、または工程（ｄ）の代わりに、
（ｄ’）：
前記個体の非癌性細胞の試料中のＨＬＡクラスＩＩ対立遺伝子を決定すること、
新生抗原のＭＨＣクラスＩＩ結合親和性を予測することであって、ここで
決定された各ＨＬＡクラスＩＩ対立遺伝子について、新生抗原の１１個～３０個、好ましくは１５個の連続するアミノ酸の各フラグメントに対するＭＨＣクラスＩＩ結合親和性が予測され、ここで各フラグメントは、工程（ａ）の変異によって生成された少なくとも１つの変異アミノ酸を含んでおり、および
最も高いＭＨＣクラスＩＩ結合親和性を有するフラグメントが新生抗原のＭＨＣクラスＩＩ結合親和性を決定し；
（ｅ）各新生抗原について工程（ｂ）、（ｃ）、（ｄ）および／または（ｄ’）において決定された値に従って新生抗原を最高値から最低値までランク付けし、ランクの第１、第２、第３、および／または第４のリストを生成する工程、
（ｆ）前記ランクの第１、第２、第３、および／または第４のリストからランク合計を計算し、そしてランク合計を増加させることによって新生抗原を順序付けし、新生抗原のランク付けされたリストを生成する工程、
ここで、前記ランク合計は、重み付けされたランク合計であり、ここで
工程（ｄ）のＭＨＣクラスＩ結合親和性の予測が１０００ｎＭより高いＩＣ５０値をもたらしたランクの第３のリストにおいて、工程（ａ）において決定された新生抗原の数が、各新生抗原のランク値に加算され、および／もしくは
工程（ｄ’）のＭＨＣクラスＩＩ結合親和性の予測が１０００ｎＭより高いＩＣ５０値をもたらしたランクの第４のリストにおいて、工程（ａ）において決定された新生抗原の数が、各新生抗原のランク値に加算され、
ならびに／または
工程（ｃ）（ｉ）が超並列トランスクリプトーム配列決定によって実施される場合、工程（ｆ）のランク合計は、重み係数（ＷＦ）によって乗算され、ここでＷＦは、
変異についてのマッピングされたトランスクリプトームリード数が＞０である場合、１であり、
変異についてのマッピングされたトランスクリプトームリード数が０であり、かつ非変異配列についてのマッピングされたリード数が０であり、かつトランスクリプト／ミリオン（ＴＰＭ）値が少なくとも０．５である場合、２であり、
変異についてのマッピングされたトランスクリプトームリード数が０であり、かつ非変異配列についてのマッピングされたリード数が＞０であり、かつトランスクリプト／ミリオン（ＴＰＭ）値が少なくとも０．５である場合、３であり、
変異についてのマッピングされたトランスクリプトームリード数が０であり、かつ非変異配列についてのマッピングされたリード数が０であり、かつトランスクリプト／ミリオン（ＴＰＭ）値が＜０．５である場合、４であり、または、
変異についてのマッピングされたトランスクリプトームリード数が０であり、かつ非変異配列についてのマッピングされたリード数が＞０であり、かつトランスクリプト／ミリオン（ＴＰＭ）値が＜０．５である場合、５であり；
（ｇ）（ｆ）において得られた新生抗原のランク付けされたリストから、最も低いランクから開始して、３０個～２４０個、好ましくは４０個～８０個、より好ましくは６０個の新生抗原を選択する工程。

【請求項2】

工程（ａ）および（ｄ）（Ｉ）が、試料の超並列ＤＮＡ配列決定を使用して行われ、かつ同定された変異の染色体位置における変異を含むリード数が、
癌性細胞の試料において、少なくとも２個、好ましくは少なくとも３個であり、
非癌性細胞の試料において、２以下、好ましくは０である、請求項１に記載の方法。

【請求項3】

工程（ａ）の少なくとも１つの変異は、単一ヌクレオチド変異体（ＳＮＶ）またはフレームシフトペプチド（ＦＳＰ）を生じる挿入／欠失変異である、請求項１または２に記載の方法。

【請求項4】

変異がＳＮＶであり、かつ新生抗原が工程（ａ）で定義された総サイズを有し、かつ、複数の隣接する連続するアミノ酸によって各側に隣接される、変異によって生じたアミノ酸からなる、請求項３に記載の方法であって、ここでコード配列が両側に十分な数のアミノ酸を含まない限り、各側の数は１を超えて異ならず、ここで新生抗原は、工程（ａ）で定義された総サイズを有する、方法。

【請求項5】

変異は、ＦＳＰを生じ、かつ変異によって生じる各単一アミノ酸変化は、工程（ａ）で定義される総サイズを有し、かつ以下からなる新生抗原を生じ：
（ｉ）変異によって生じる前記単一アミノ酸変化、および７個～１４個、好ましくは８個のＮ末端に隣接する連続するアミノ酸、および
（ｉｉ）コード配列が両側に十分な数のアミノ酸を含まない限り、両側のアミノ酸の数は、１以下だけ異なる、両側で工程（ｉ）のフラグメントに隣接する複数の連続するアミノ酸、
ここで工程（ｄ）のＭＨＣクラスＩ結合親和性および／または工程（ｄ’）のＭＨＣクラスＩＩ結合親和性は、工程（ｉ）のフラグメントについて予測される、請求項３に記載の方法。

【請求項6】

癌性細胞の試料中の工程（ｂ）で決定される新生抗原の変異誘発遺伝子頻度が、少なくとも２％、好ましくは５％、より好ましくは少なくとも１０％である、請求項１～５のいずれか１項に記載の方法。

【請求項7】

工程（ｇ）が、自己免疫疾患に関連する遺伝子から新生抗原を、および／または新生抗原の前記ランク付けされたリストから０．１より低いそれらのアミノ酸配列についてのシャノンエントロピー値を有する新生抗原を除去することをさらに含む、請求項１～６のいずれか１項に記載の方法。

【請求項8】

工程（ｃ）（ｉ）における前記コード遺伝子の発現レベルが、超並列トランスクリプトーム配列決定によって決定され、かつ工程（ｃ）（ｉ）において決定される発現レベルが、以下の式に従って計算された補正されたトランスクリプト／キロベースミリオン（ｃｏｒｒＴＰＭ）値を使用する、請求項１～７のいずれか１項に記載の方法。

【数1】

（式中、Ｍは、変異を含む工程（ａ）の変異の位置に及ぶリードの数であり、かつＷは、変異を含まない工程（ａ）の変異の位置に及ぶリードの数であり、かつＴＰＭは、変異を含む遺伝子のトランスクリプト／キロベースミリオン値であり、かつｃは、０より大きい定数であり、好ましくは０．１である。）

【請求項9】

工程（ｇ）は、代替の選択プロセスを含み、ここで新生抗原が、全ての選択された新生抗原についてのアミノ酸の総計の全長における設定された最大サイズに達するまで、最低ランクで開始する新生抗原のランク付けされたリストから選択され、ここで最大サイズは、一価または多価ワクチンの各ベクターについて１２００～１８００アミノ酸、好ましくは１５００アミノ酸であり；かつ任意選択で、ここで２個以上の新生抗原が、重複するアミノ酸配列セグメントを含む場合、１つの新しい新生抗原にマージされる、請求項１～８のいずれか１項に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、個別化されたワクチンにおける使用のための癌新生抗原を選択する方法に関する。本発明は、個別化されたワクチンのための新生抗原を保有するベクターまたはベクターのコレクションを構築する方法にも関する。本発明はさらに、個別化されたワクチンを含むベクターおよびベクターのコレクション、ならびに癌治療における前記ベクターの使用に関する。

【背景技術】

【0002】

（発明の背景）
いくつかの腫瘍抗原が同定され、そして異なるカテゴリーに分類されている：癌－生殖細胞系、組織分化抗原および変異自己タンパク質に由来する新生抗原（非特許文献１）。自己抗原に対する免疫応答が腫瘍増殖に影響を及ぼすかどうかは、議論の問題である（非特許文献１において概説される）。対照的に、最近の有力な証拠は、発現遺伝子のコード配列における変異の結果として腫瘍内で生成される新生抗原が、癌に対するワクチン接種の有望な標的であるという考えを支持している（非特許文献２）。

【0003】

癌新生抗原は、腫瘍細胞にのみ存在し、正常細胞には存在しない抗原である。新生抗原は、腫瘍細胞におけるＤＮＡ変異によって生成され、そして主にＣＤ８^＋Ｔ細胞によるＴ細胞媒介免疫反応による腫瘍細胞の認識および殺傷において重要な役割を果たすことが示されている（非特許文献３）。一般に次世代シークエンシング（ＮＧＳ）と呼ばれる超並列配列決定法の出現により、癌ゲノムの完全な配列を適時かつ安価に決定することが可能になり、ヒト腫瘍の変異スペクトルが発表された（非特許文献４）。最も頻度の高い変異のタイプは、単一ヌクレオチド変異体であり、そして腫瘍にみられる単一ヌクレオチド変異体数の中央値はその組織診によってかなり異なる。一般に患者間で共有される変異は非常に少ないため、新生抗原を生成する変異の同定には個別化されたアプローチが必要である。

【0004】

潜在的なエピトープが腫瘍細胞によってプロセシング／提示されないため、または免疫寛容が変異配列と反応するＴ細胞の排除をもたらすため、多くの変異は実際に免疫系では見られない。したがって、ワクチンによってコードされる最適な数、および最終的に免疫原性を最適化するための好ましいワクチンレイアウトを定義するために、すべての潜在的な新生抗原の中から、免疫原性である可能性が最も高いものを選択することが有益である。さらに、単一ヌクレオチド変異体の変異によって生じた新生抗原だけでなく、フレームシフトペプチドを生成する挿入／欠失変異によって生じた新生抗原も重要であり、後者は特に免疫原性であることが期待される。最近、ＲＮＡまたはペプチドに基づく２つの異なる個別化されたワクチン接種アプローチが第Ｉ相臨床試験で評価されている。得られたデータは、ワクチン接種が、実際に、既存の新生抗原特異的Ｔ細胞を増殖させ、そして癌患者において新しいＴ細胞特異性のより広いレパートリーを誘導し得ることを示す（非特許文献５）。両アプローチの主な制限は、ワクチン接種の標的となる新生抗原の最大数である。ペプチドベースのアプローチについての上限は、それらの公表されたデータに基づいて、２０ペプチドであり、そしていくつかの場合にはペプチドは合成され得なかったので、全ての患者において到達されなかった。ＲＮＡベースのアプローチについて記載された上限は、各ワクチンにおいて１０個の変異しか含まないので、さらに低い（非特許文献５）。

【0005】

癌を治癒させる上での癌ワクチンの課題は、癌細胞がＴ細胞応答を「逃れる」ことができ、かつ免疫応答によって認識されていない機会を減少させるために、一度にできるだけ多くの癌細胞を認識し、そして排除することができる多様な免疫Ｔ細胞集団を誘導することである。したがって、ワクチンは、多数の癌特異的抗原、すなわち新生抗原をコードすることが望ましい。これは、個体の癌特異的新生抗原に基づく個別化された遺伝的ワクチンアプローチに特に関連している。できるだけ多くの新生抗原が成功する確率を最適化するためには、ワクチンにより標的とされるべきである。さらに、実験データは、患者における有効な免疫原性新生抗原が、患者のＭＨＣ対立遺伝子に対する広範囲の予測される親和性をカバーするという考えを支持する（例えば、非特許文献６）。ほとんどの現在の優先順位付けの方法は、代わりに、親和性閾値、例えば、頻繁に使用される５００ｎＭ制限を適用し、これは、免疫原性新生抗原の選択を制限し得る。

【先行技術文献】

【非特許文献】

【0006】

【文献】AndersenRS, Kvistborg P, Frøsig TM, Pedersen NW, Lyngaa R, Bakker AH, Shu CJ, StratenPt, Schumacher TN, Hadrup SR. (2012). Parallel detection of antigen-specific Tcell responses by combinatorial encoding of MHC multimers. Nat Protoc, 7(5),891-902. doi:10.1038/nprot.2012.037

【文献】FritschEF, Rajasagi M, Ott PA, Brusic V, Hacohen N, Wu CJ. (2014). HLA-bindingproperties of tumor neoepitopes in humans. Cancer Immunol Res, 2(6), 522-529.doi:10.1158/2326-6066.CIR-13-0227

【文献】YarchoanM, Johnson BA3rd, Lutz ER, Laheru DA, Jaffee EM. (2017). Targeting neoantigens to augment antitumourimmunity. Nat Rev Cancer, 17(9), 569. doi:10.1038/nrc.2017.74

【文献】KandothC, McLellan MD, Vandin F, Ye K, Niu B, Lu C, Xie M, Zhang Q, McMichael JF,Wyczalkowski MA, Leiserson MDM, Miller CA, Welch JS, Walter MJ, Wendl MC, LeyTJ, Wilson RK, Raphael BJ, Ding L. (2013). Mutational landscape andsignificance across 12 major cancer types. Nature, 502(7471), 333-339.doi:10.1038/nature12634

【文献】SahinU, Derhovanessian E, Miller M, Kloke BP, Simon P, Löwer M, Bukur V, Tadmor AD,Luxemburger U, Schrörs B, Omokoko T, Vormehr M, Albrecht C, Paruzynski A, KuhnAN, Buck J, Heesch S, Schreeb KH, Müller F, Ortseifer I, Vogler I, Godehardt E,Attig S, Rae R, Breitkreuz A, Tolliver C, Suchan M, Martic G, Hohberger A, SornP, Diekmann J, Ciesla J, Waksmann O, Brück AK, Witt M, Zillgen M, Rothermel A,Kasemann B, Langer D, Bolte S, Diken M, Kreiter S, Nemecek R, Gebhardt C,Grabbe S, Höller C, Utikal J, Huber C, Loquai C, Türeci Ö. Personalized RNAmutanome vaccines mobilize poly-specific therapeutic immunity against cancer.Nature, 547(7662), 222-226. doi:10.1038/nature23003

【文献】GrosA, Parkhurst MR, Tran E, Pasetto A, Robbins PF, Ilyas S, Prickett TD, GartnerJJ, Crystal JS, Roberts IM, Trebska-McGowan K, Wunderlich JR, Yang JC1,Rosenberg SA. (2016). Prospective identification of neoantigen-specificlymphocytes in the peripheral blood of melanoma patients. Nat Med. 22(4):433-8. doi:10.1038/nm.4051.

【発明の概要】

【発明が解決しようとする課題】

【0007】

したがって、現在の方法の制限（例えば、低い予測親和性による排除）を回避する優先順位付け方法、および大規模で、したがってより広く、そしてより完全な新生抗原のセットを標的とする個別化されたワクチンを可能にするワクチン接種アプローチが必要とされている。

【課題を解決するための手段】

【0008】

（発明の概要）
第１の態様において、本発明は、以下の工程を含む、個別化されたワクチンにおける使用のための癌新生抗原を選択する方法を提供する：
（ａ）個体から得られた癌性細胞の試料中の新生抗原を決定する工程であって、ここで各新生抗原が
コード配列内に含まれ、
前記個体の非癌性細胞の試料中に存在しないコードされたアミノ酸配列の変化をもたらすコード配列における少なくとも１つの変異を含み、かつ
癌性細胞の試料中のコード配列の９個～４０個、好ましくは１９個～３１個、より好ましくは２３個～２５個、最も好ましくは２５個の連続したアミノ酸からなり、
（ｂ）各新生抗原について、コード配列内の工程（ａ）の前記変異のそれぞれの変異誘発遺伝子頻度を決定する工程、
（ｃ）（ｉ）前記癌性細胞の試料において、前記変異の少なくとも１つを含む各コード配列の発現レベルを決定する工程、または
（ｉｉ）癌性細胞の試料と同じ癌タイプの発現データベースから、前記変異の少なくとも１つを含む各コード配列の発現レベルを決定する工程、
（ｄ）新生抗原のＭＨＣクラスＩ結合親和性を予測する工程であって、ここで
（Ｉ）ＨＬＡクラスＩ対立遺伝子は、前記個体の非癌性細胞の試料から決定され、
（ＩＩ）（Ｉ）において決定された各ＨＬＡクラスＩ対立遺伝子について、新生抗原の８個～１５個、好ましくは９個～１０個、より好ましくは９個の連続するアミノ酸からなる各フラグメントのＭＨＣクラスＩ結合親和性が予測され、ここで各フラグメントは、工程（ａ）の変異によって引き起こされる少なくとも１つのアミノ酸変化を含み、かつ
(ＩＩＩ)最も高いＭＨＣクラスＩ結合親和性を有するフラグメントは、新生抗原のＭＨＣクラスＩ結合親和性を決定し、
（ｅ）各新生抗原について工程（ｂ）～（ｄ）において決定された値に従って新生抗原を最高値から最低値までランク付けし、ランクの第１、第２および第３のリストを生成する工程、
（ｆ）前記ランクの第１、第２および第３のリストからランク合計を計算し、そしてランク合計を増加させることによって新生抗原を順序付けし、新生抗原のランク付けされたリストを生成する工程、
（ｇ）（ｆ）において得られた新生抗原のランク付けされたリストから、最も低いランクから開始して、３０個～２４０個、好ましくは４０個～８０個、より好ましくは６０個の新生抗原を選択する工程。

【0009】

第２の態様において、本発明は、以下の工程を含む、ワクチンとしての使用のための本発明の第１の態様による新生抗原の組み合わせをコードする個別化されたベクターを構築する方法を提供する：
（ｉ）少なくとも１０＾５～１０＾８、好ましくは１０＾６の異なる組み合わせで新生抗原のリストを順序付けする工程、
（ｉｉ）各接合セグメントが、接合の両側に１５個の隣接する連続するアミノ酸を含む、各組み合わせについての新生抗原接合セグメントの全ての可能なペアを生成する工程、
(ｉｉｉ)ベクターが設計される個体中に存在するＨＬＡ対立遺伝子のみが試験される、接合セグメント中の全てのエピトープに対するＭＨＣクラスＩおよび／またはクラスＩＩ結合親和性を予測する工程、および
(ｉｖ)≦１５００ｎＭのＩＣ５０を有する最少数の接合エピトープを有する新生抗原の組み合わせを選択し、そしてここで複数の組み合わせが同じ最少数の接合エピトープを有する場合、最初に遭遇する組み合わせが選択される工程。

【0010】

第３の態様において、本発明は、本発明の第１の態様による新生抗原のリストまたは本発明の第２の態様による新生抗原の組み合わせをコードするベクターを提供する。

【0011】

第４の態様において、本発明は、本発明の第１の態様による新生抗原の異なるセットまたは本発明の第２の態様による新生抗原の組み合わせの各々をコードするベクターのコレクションを提供し、ここで該コレクションは、２～４個、好ましくは２個のベクターを含み、そして好ましくはここでリストの一部をコードするベクターインサートは、アミノ酸の数がほぼ等しいサイズである。

【0012】

第５の態様において、本発明は、癌ワクチン接種における使用のための、本発明の第３の態様によるベクターまたは本発明の第４の態様によるベクターのコレクションを提供する。

【0013】

（図面のリスト）
以下、本明細書に含まれる図面の内容が説明される。この文脈では、上記および／または以下の発明の詳細な説明も参照されたい。

【図面の簡単な説明】

【0014】

【図1】ＳＮＶに由来する新生抗原の作製：（Ａ）変異が中心にあり、かつ上流および下流に１２ｗｔａａが隣接した２５量体の新生抗原の作製、（Ｂ）複数の変異を含む２５量体の新生抗原の作製、および（Ｃ）変異がタンパク質配列の末端または開始点に近い場合に２５量体より短い新生抗原の作製。

【図2A】フレームシフトペプチド（ＦＳＰ）を生成するインデル由来の新生抗原の作製。当該プロセスは、ＦＳＰをより小さなフラグメント、好ましくは２５量体に分割することを含む。

【図2B】フレームシフトペプチド（ＦＳＰ）を生成するインデル由来の新生抗原の作製。当該プロセスは、ＦＳＰをより小さなフラグメント、好ましくは２５量体に分割することを含む。

【図3】３つの個々のランクスコアからのＲＳＵＭランクリストの生成の概略図。

【図4】ＦＳＰに由来する重複する新生抗原の長さを最適化するための手順の概略説明。

【図5】Ｋ個（好ましくは６０個）の新生抗原を、ほぼ等しい全長の２つのより小さなリストに分割するための手順の概略図。

【図6】ＦＳＰフラグメントマージングの例：例１は、２ヌクレオチド欠失ｃｈｒ１１：１７５８９７１＿ＡＣによって生成されたＦＳＰを参照する。４個の新生抗原配列（ＦＳＰフラグメント）が１個の３０アミノ酸長の新生抗原にマージされる。例２は、１ヌクレオチド挿入ｃｈｒ６：１６８３１０２０５＿－＿Ｔによって生成されたＦＳＰを参照する。２個の新生抗原配列（ＦＳＰフラグメント）が１個の３１アミノ酸長の新生抗原にマージされる。

【図7A】優先順位付け方法の検証：１４名の癌患者からの変異が、実施例１からの優先順位付け方法を適用してランク付けされた。当該図は、免疫応答を誘導することが実験的に示されている変異について、ランク付けされたリストの位置を報告する。ランクは、患者のＮＧＳ－ＲＮＡデータを含むＲＳＵＭランキングについて（Ａ）、円（Ａ）によって示される。

【図7B】優先順位付け方法の検証：１４名の癌患者からの変異が、実施例１からの優先順位付け方法を適用してランク付けされた。当該図は、免疫応答を誘導することが実験的に示されている変異について、ランク付けされたリストの位置を報告する。ランクは、患者のＮＧＳ－ＲＮＡデータを含まないＲＳＵＭランキングについて（Ｂ）、正方形（Ｂ）によって示される。

【図8】６２個の新生抗原をコードする単一のＧＡｄベクターまたは２つのＧＡｄベクターの免疫原性。単一の発現カセット中に全６２個の新生抗原をコードする１つのＧＡｄベクター（ＧＡｄ－ＣＴ２６－１－６２）は、３１個の新生抗原をそれぞれコードする２つの同時投与されるＧＡｄベクター（ＧＡｄ－ＣＴ２６－１－３１＋ＧＡｄ－ＣＴ２６－３２－６２）または各３１個の新生抗原の２つのカセットをコードする１つのＧＡｄベクター（ＧＡｄ－ＣＴ２６ｄｕａｌ１－３１および３２－６２）と比較してより弱い免疫応答を誘導する。ＢａｌｂＣマウス（６匹／群）は、（Ａ）５ｘ１０＾８ｖｐのＧＡｄ－ＣＴ２６－１－６２または２個のベクターＧＡｄ－ＣＴ２６－１－３１＋ＧＡｄ－ＣＴ２６－３２－６２（各５ｘ１０＾８ｖｐ）の同時投与および（Ｂ）５ｘ１０＾８ｖｐのＧＡｄ－ＣＴ２６－１－６２または５ｘ１０＾８ｖｐのデュアルカセットベクターＧＡｄ－ＣＴ２６ｄｕａｌ１－３１および３２－６２で筋肉内免疫された。Ｔ細胞応答は、エクスビボＩＦＮγ ＥＬＩＳｐｏｔにより応答のピーク（ワクチン接種後２週間）でワクチン接種したマウスの脾細胞で測定された。応答は、２つのペプチドプールを使用することによって評価され、それぞれワクチン構築物によってコードされる３１ペプチドから構成される（プール１～３１新生抗原１～３１；プール３２～６２新生抗原３２～６２）。それぞれのポリ新生抗原ベクターは、組み立てられたポリ新生抗原のＮ末端に付加されたＴ細胞エンハンサー配列（ＴＰＡ）と、発現をモニタリングするためのＣ末端のインフルエンザＨＡタグとを含む。

【発明を実施するための形態】

【0015】

（発明の詳細な説明）
本発明が以下に詳細に説明される前に、本発明は、本明細書に記載される特定の方法論、プロトコルおよび試薬に限定されず、これらは変化し得ることが理解されるべきである。本明細書で使用される用語は、特定の実施形態のみを説明する目的のためのものであり、添付の特許請求の範囲によってのみ限定される本発明の範囲を限定することを意図していないことも理解されたい。他に定義されない限り、本明細書で使用される全ての技術用語および科学用語は、当業者によって一般に理解されるものと同じ意味を有する。

【0016】

好ましくは、本願明細書で使用される用語は、「Ａｍｕｌｔｉｌｉｎｇｕａｌｇｌｏｓｓａｒｙｏｆｂｉｏｔｅｃｈｎｏｌｏｇｉｃａｌｔｅｒｍｓ：（ＩＵＰＡＣＲｅｃｏｍｍｅｎｄａｔｉｏｎｓ）」、Ｌｅｕｅｎｂｅｒｇｅｒ，Ｈ．Ｇ．Ｗ、Ｎａｇｅｌ，Ｂ．およびＫｌｂｌ，Ｈ．編（１９９５年）、ＨｅｌｖｅｔｉｃａＣｈｉｍｉｃａＡｃｔａ、ＣＨ－４０１０バーゼル、スイス）に記載されるように定義される。

【0017】

本明細書および後続の特許請求の範囲を通して、文脈上他の要求がない限り、「ｃｏｍｐｒｉｓｅ」という語、および「ｃｏｍｐｒｉｓｅｓ」および「ｃｏｍｐｒｉｓｉｎｇ」などの変形は、記載された整数もしくは工程または整数もしくは工程の群を包含するが、他の整数もしくは工程または整数もしくは工程の群を排除しないことを意味すると理解されるであろう。以下の節において、本発明の異なる態様がより詳細に定義される。そのように定義された各態様は、明確に反対に示されない限り、任意の他の態様（複数の場合もある）と組み合わせられ得る。特に、任意選択の、好ましい、または有利であると示される任意の特徴は、任意選択の、好ましい、または有利であると示される任意の他の特徴（複数の場合もある）と組み合わせられ得る。

【0018】

本明細書の本文全体でいくつかの文献が引用される。本明細書中で引用される各文献（全ての特許、特許出願、科学刊行物、製造業者の仕様書、指示書などを含む）は、上記または下記のいずれも、その全体が参照により本明細書に組み込まれる。本願明細書中のいかなるものも、本願発明が先行発明のために開示より先行する権利がないと認めるものとして、解釈されるべきではない。本明細書に引用されるいくつかの文献は、「参照により組み込まれる」ものとして特徴付けられる。このような組み込まれた参照文献の定義または教示と、本明細書に列挙された定義または教示との間に矛盾がある場合、本明細書の本文が優先される。

【0019】

以下において、本発明の要素について説明する。これらの要素は、特定の実施形態と共に列挙されているが、追加の実施形態を作成するために、任意の方法および任意の数で組み合わせされ得ることが理解されるべきである。様々に記載された例および好ましい実施形態は、明示的に記載された実施形態のみに本発明を限定するように解釈されるべきではない。本記載は、明示的に記載された実施形態を、開示されたおよび／または好ましい要素の任意の数と組み合わせる実施形態をサポートおよび包含するものと理解されるべきである。さらに、本出願において記載される全ての要素の任意の並べ替えおよび組み合わせは、文脈が他に指示しない限り、本出願の記載によって開示されるとみなされるべきである。

【0020】

（定義）
以下において、本明細書で頻繁に使用される用語のいくつかの定義が提供される。これらの用語は、その使用の各事例において、本明細書の残りの部分において、それぞれ定義された意味および好ましい意味を有する。

【0021】

本明細書および添付のされた特許請求の範囲において使用されるように、単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、内容が他に明確に指示しない限り、複数の指示対象を含む。
用語「約」は、数値に関連して使用される場合、示された数値より５％小さい下限を有し、かつ示された数値より５％大きい上限を有する範囲内の数値を包含することを意味する。

【0022】

本明細書の文脈において、用語「主要組織適合性複合体」（ＭＨＣ）は、細胞生物学および免疫学の分野において公知のその意味において使用され；それは、タンパク質の特定の画分（ペプチド）（エピトープとも呼ばれる）を提示する細胞表面分子を意味する。ＭＨＣ分子の２つの主要なクラス：クラスＩおよびクラスＩＩがある。ＭＨＣクラスＩの２つのグループは、それらの多型に基づいて区別され得る：ａ）対応する多型性ＨＬＡ－Ａ、ＨＬＡ－Ｂ、およびＨＬＡ－Ｃ遺伝子を有する古典的（ＭＨＣ－Ｉａ）、およびｂ）対応するより多型性の低いＨＬＡ－Ｅ、ＨＬＡ－Ｆ、ＨＬＡ－Ｇ、およびＨＬＡ－Ｈ遺伝子を有する非古典的（ＭＨＣ－Ｉｂ）。

【0023】

ＭＨＣクラスＩ重鎖分子は、非ＭＨＣ分子β２－ミクログロブリンのユニットに結合されたα鎖として生じる。α鎖は、Ｎ末端からＣ末端への方向に、シグナルペプチド、３つの細胞外ドメイン（α１～３、α１はＮ末端にある）、膜貫通領域およびＣ末端細胞質尾部を含む。提示される（ｄｉｓｐｌａｙｅｄ）または提示される（ｐｒｅｓｅｎｔｅｄ）ペプチドは、α１／α２ドメインの中央領域において、ペプチド結合溝によって保持される。

【0024】

用語「β２－ミクログロブリンドメイン」は、ＭＨＣクラスＩヘテロ二量体分子の一部である非ＭＨＣ分子を意味する。言い換えれば、それはＭＨＣクラスＩヘテロ二量体のβ鎖を構成する。

【0025】

古典的なＭＨＣ－Ｉａ分子の主な機能は、適応免疫応答の一部としてペプチドを提示することである。ＭＨＣ－Ｉａ分子は、β２－ミクログロブリン（β２ｍ）および自己タンパク質、ウイルスもしくは細菌に由来する小さなペプチドと非共有結合的に会合する３つの細胞外ドメイン（α１、α２およびα３）を有する膜結合重鎖を含む三量体構造である。α１およびα２ドメインは、高度に多型性であり、そしてペプチド結合溝を生じるプラットフォームを形成する。保存されたα３ドメインと並列しているのは、膜貫通ドメインとそれに続く細胞内細胞質尾部である。

【0026】

免疫応答を開始するために、古典的ＭＨＣ－Ｉａ分子は、ＣＤ８⁺細胞傷害性Ｔリンパ球（ＣＴＬｓ）上に存在するＴＣＲ（Ｔ細胞受容体）によって認識される特異的ペプチドを提示する一方、ナチュラルキラー細胞（ＮＫ）に存在するＮＫ細胞受容体は、個々のペプチドではなくペプチドモチーフを認識する。

【0027】

通常の生理学的状態下では、ＭＨＣ－Ｉａ分子は、ＣＤ８およびＮＫ細胞にペプチドを提示することを担当するヘテロ三量体複合体として存在するが、用語「ヒト白血球抗原」（ＨＬＡ）は、細胞生物学および生化学の技術分野で知られているその意味で使用される；それは、ヒトＭＨＣクラスＩタンパク質をコードする遺伝子座を意味する。３つの主要な古典的ＭＨＣ－Ｉａ遺伝子は、ＨＬＡ－Ａ、ＨＬＡ－ＢおよびＨＬＡ－Ｃであり、そしてこれらの遺伝子は全て様々な数の対立遺伝子を有する。密接に関連する対立遺伝子は、特定の対立遺伝子のサブグループにまとめられる。全ての公知のＨＬＡ遺伝子およびそれらのそれぞれの対立遺伝子の完全配列または部分配列は、ＩＭＧＴ／ＨＬＡ（ｈｔｔｐ://ｗｗｗ.ｅｂｉ.ａｃ.ｕｋ/ｉｐｄ/ｉｍｇｔ/ｈｌａ/）などの専門データベースにおいて当業者に利用可能である。

【0028】

ヒトは、古典的（ＭＨＣ－Ｉａ）ＨＬＡ－Ａ、ＨＬＡ－Ｂ、およびＨＬＡ－Ｃと、非古典的（ＭＨＣ－Ｉｂ）ＨＬＡ－Ｅ、ＨＬＡ－Ｆ、ＨＬＡ－ＧおよびＨＬＡ－Ｈ分子とを含むＭＨＣクラスＩ分子を有する。両カテゴリーは、ペプチド結合、提示、および誘導されたＴ細胞応答の機構が類似する。古典的ＭＨＣ－Ｉａの最も顕著な特徴は、それらの高い多型性であるが、一方、非古典的ＭＨＣ－Ｉｂは、通常、非多型性であり、かつそれらのＭＨＣ－Ｉａ対応物よりもより限定された発現パターンを示す傾向がある。

【0029】

ＨＬＡの命名法は、遺伝子座の特定の名称（例えば、ＨＬＡ－Ａ）とそれに続く対立遺伝子ファミリー血清学的抗原（例えば、ＨＬＡ－Ａ＊０２）と、ＤＮＡ配列が決定された番号および順序で割り当てられた対立遺伝子サブタイプ（例えば、ＨＬＡ－Ａ＊０２：０１）とによって、与えられる。コード配列内の同義ヌクレオチド置換（サイレントまたは非コード置換とも呼ばれる）によってのみ異なる対立遺伝子は、第３の桁のセット（例えば、ＨＬＡ－Ａ＊０２：０１：０１）の使用によって区別される。イントロンの配列多型により、またはエクソンおよびイントロンに隣接する５’もしくは３’非翻訳領域においてのみ異なる対立遺伝子は、第４の桁のセット（例：ＨＬＡ－Ａ＊０２：０１：０１：０２Ｌ）の使用によって区別される。

【0030】

ＭＨＣクラスＩおよびクラスＩＩ結合親和性予測；ＭＨＣクラスＩまたはＩＩエピトープの予測およびＭＨＣクラスＩおよびＩＩ結合親和性の予測のための当技術分野で公知の方法の例は、Ｍｏｕｔａｆｔｓｉら、２００６年；Ｌｕｎｄｅｇａａｒｄら、２００８年；Ｈｏｏｆら、２００９年；ＡｎｄｒｅａｔｔａおよびＮｉｅｌｓｅｎ、２０１６年；Ｊｕｒｔｚら、２０１７年である。好ましくは、ＡｎｄｒｅａｔｔａおよびＮｉｅｌｓｅｎ、２０１６年に記載された方法が使用され、そしてこの方法が患者のＭＨＣ対立遺伝子の１つをカバーしない場合、Ｊｕｒｔｚら、２０１７年により記載された代替方法が使用される。

【0031】

ヒト自己免疫反応および関連するＭＨＣ対立遺伝子に関連する遺伝子およびエピトープは、以下のクエリ基準を適用することによって、ＩＥＤＢデータベース（ｈｔｔｐｓ：／／ｗｗｗ.ｉｅｄｂ.ｏｒｇ）において同定され得る：カテゴリーエピトープについては「線状エピトープ」、カテゴリー宿主については「ヒト」、およびカテゴリー疾患については「自己免疫疾患」。

【0032】

用語「Ｔ細胞エンハンサーエレメント」は、抗原配列またはペプチドに融合された場合に、遺伝子ワクチン接種の文脈において新生抗原に対するＴ細胞の誘導を増加させるポリペプチドまたはポリペプチド配列を意味する。Ｔ細胞エンハンサーの例は、不変鎖配列またはそのフラグメント；６個の追加の下流アミノ酸残基を任意選択で含む組織型プラスミノーゲンアクチベーターリーダー配列；ＰＥＳＴ配列；サイクリン破壊ボックス；ユビキチン化シグナル；ＳＵＭＯ化シグナルである。Ｔ細胞エンハンサーエレメントの具体例は、配列番号１７３～１８２のものである。

【0033】

用語「コード配列」は、転写され、そしてタンパク質に翻訳されるヌクレオチド配列を意味する。タンパク質をコードする遺伝子は、コード配列の特定の例である。

【0034】

用語「対立遺伝子頻度」は、集団または細胞集団など、多数の要素内の特定の遺伝子座における特定の対立遺伝子の相対頻度を意味する。対立遺伝子頻度は、パーセンテージまたは比率で表される。例えば、コード配列における変異の対立遺伝子頻度は、変異の位置における変異リードと非変異リードの比によって決定されるであろう。変異の位置で２リードが変異した対立遺伝子に決定し、そして１８リードが非変異対立遺伝子を示した変異誘発遺伝子頻度は、１０％の変異誘発遺伝子頻度を定義することになる。フレームシフトペプチドから生成された新生抗原についての変異誘発遺伝子頻度は、フレームシフトペプチドを引き起こす挿入または欠失変異の変異誘発遺伝子頻度であり、すなわち、ＦＳＰ内の全ての変異アミノ酸は、挿入／欠失変異を引き起こすフレームシフトの変異誘発遺伝子頻度と同じ変異誘発遺伝子頻度を有することになる。

【0035】

用語「新生抗原」は、正常な非癌性細胞には存在しない癌特異的抗原を意味する。

【0036】

用語「癌ワクチン」は、本発明の文脈において、癌細胞に対する免疫応答を誘導するように設計されているワクチンを意味する。

【0037】

用語「個別化されたワクチン」は、特定の個体に特異的である抗原配列を含むワクチンを意味する。このような個別化されたワクチンは、多くの新生抗原が個体の特定の癌細胞に特異的であるため、新生抗原を使用する癌ワクチンにとって特に興味深い。

【0038】

コード配列における用語「変異」は、本発明の文脈において、癌性細胞のヌクレオチド配列を非癌性細胞のヌクレオチド配列と比較した場合のコード配列のヌクレオチド配列における変化を意味する。コードされたペプチドのアミノ酸配列において変化をもたらさないヌクレオチド配列における変化、すなわち「サイレント」変異は、本発明の文脈において変異とみなされない。アミノ酸配列の変化をもたらすことができる変異のタイプは、コードするトリプレットの単一ヌクレオチドが変化し、翻訳された配列において異なるアミノ酸をもたらす、非同義単一ヌクレオチド変異体（ＳＮＶ）に限定されない。アミノ酸配列の変化をもたらす変異のさらなる例は、１以上のヌクレオチドがコード配列に挿入されるか、またはコード配列から欠失されるかのいずれかである、挿入／欠失（インデル）変異である。特に関連深いのは、３で割り切れない複数のヌクレオチドが挿入または欠失される場合に起こるリーディングフレームのシフトをもたらすインデル変異である。このような変異は、フレームシフトペプチド（ＦＳＰ）と呼ばれる変異の下流のアミノ酸配列に大きな変化を引き起こす。

【0039】

用語「シャノンエントロピー」は、分子、例えばタンパク質のコンフォーメーションの数に関連するエントロピーを意味する。シャノンエントロピーを計算するための当技術分野で公知の方法は、ＳｔｒａｉｔおよびＤｅｗｅｙ、１９９６年およびＳｈａｎｎｏｎ１９９６年である。ポリペプチドについて、シャノンエントロピー（ＳＥ）は、ＳＥ＝（－Σｐ_ｃ（ａａ_ｉ）_＊ｌｏｇ（ｐ_ｃ（ａａ_ｉ）））／Ｎとして計算され得、式中ｐ_ｃ（ａａ_ｉ）は、ポリペプチド中のアミノ酸ｉの頻度であり、かつ合計は、２０個の異なる全てのアミノ酸にわたって計算され、かつＮは、ポリペプチドの長さである。

【0040】

用語「発現カセット」は、本発明の文脈において、発現されるべき少なくとも１つの核酸配列（例えば、転写制御配列および翻訳制御配列に作動可能に連結された、本発明の新生抗原の選択物またはその一部をコードする核酸）を含む核酸分子をいうために使用される。好ましくは、発現カセットは、プロモーター、開始部位および／またはポリアデニル化部位など、所定の遺伝子の効率的な発現のためのシス調節エレメントを含む。好ましくは、発現カセットは、患者の細胞における核酸の発現に必要とされる全ての追加のエレメントを含む。したがって、典型的な発現カセットは、発現される核酸配列に動作可能に連結されたプロモーターおよび転写産物の効率的なポリアデニル化、リボソーム結合部位、および翻訳終結に必要なシグナルを含む。カセットのさらなるエレメントは、例えば、エンハンサーを含んでもよい。発現カセットは、好ましくは、効率的な終結を提供するために、構造遺伝子の下流に転写終結領域も含む。終結領域は、プロモーター配列と同じ遺伝子から得られてもよく、または異なる遺伝子から得られてもよい。

【0041】

「ＩＣ５０」値は、物質の最大阻害濃度の半分を指すため、特定の生物学的機能または生化学的機能の阻害における物質の有効性の尺度である。当該値は、典型的には、モル濃度として表される。分子のＩＣ５０は、用量－応答曲線を作成し、そして異なる濃度で試験された分子の阻害効果を試験することによって、機能的アンタゴニストアッセイにおいて実験的に決定され得る。あるいは、ＩＣ５０値を決定するために競合結合アッセイが行われてもよい。典型的には、本発明の新生抗原フラグメントは、１５００ｎＭ～１ｐＭ、より好ましくは１０００ｎＭ～１０ｐＭ、およびさらにより好ましくは５００ｎＭ～１００ｐＭの間のＩＣ５０値を示す。

【0042】

用語「超並列配列決定（Ｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｓｅｑｕｅｎｃｉｎｇ）」は、核酸のためのハイスループット配列決定法を意味する。超並列配列決定法は、次世代シークエンシング（ＮＧＳ）または第２世代シークエンシングとも呼ばれる。セットアップおよび使用される化学的性質が異なる多くの異なる超並列配列決定法が当技術分野で知られている。しかしながら、これら全ての方法は、配列決定の速度を増加させるために、並行して非常に多数のシークエンシング反応を行うという共通点を有する。

【0043】

用語「トランスクリプト／キロベースミリオン（ＴｒａｎｓｃｒｉｐｔｓＰｅｒＫｉｌｏｂａｓｅＭｉｌｌｉｏｎ）」（ＴＰＭ）は、シークエンシングの深さおよび遺伝子の長さを正規化するＲＮＡ試料の超並列配列決定に用いられる遺伝子中心のメトリックを意味する。これは、リードカウントを各遺伝子の長さ（キロベース）で割ることによって計算され、キロベース当たりのリード（ＲＰＫ）を算出する。試料中の全てのＲＰＫ値の数を１，０００，０００で割ると、「１００万当たりのスケーリングファクター（ｐｅｒｍｉｌｌｉｏｎｓｃａｌｉｎｇｆａｃｔｏｒ）」が得られる。ＲＰＫ値を「１００万当たりのスケーリングファクター」で割ると、各遺伝子についてＴＰＭが得られる。

【0044】

変異を有する遺伝子の全体的な発現レベルは、ＴＰＭとして表される。好ましくは、「変異特異的」発現値（ｃｏｒｒＴＰＭ）は、次いで、変異の位置における変異リードおよび非変異リードの数から決定される。

【0045】

補正された発現値ｃｏｒｒＴＰＭは、ｃｏｒｒＴＰＭ＝ＴＰＭ＊（Ｍ＋ｃ）/（Ｍ＋Ｗ＋ｃ）として計算される。Ｍは、新生抗原を生成する変異の位置にまたがるリード数であり、かつＷは、新生抗原を生成する変異の位置にまたがる変異を含まないリード数である。値ｃは、０より大きい定数であり、好ましくは０．１である。値ｃは、Ｍおよび／またはＷが０である場合に特に重要である。

【0046】

（実施形態）
以下では、本発明の異なる態様がより詳細に定義される。そのように定義された各態様は、明確に反対に示されない限り、任意の他の態様（複数の場合もある）と組み合わせられ得る。特に、好ましい、または有利であると示される任意の特徴は、好ましい、または有利であると示される任意の他の特徴（複数の場合もある）と組み合わせられ得る。

【0047】

第１の態様において、本発明は、以下の工程を含む、個別化されたワクチンにおける使用のための癌新生抗原を選択する方法を提供する：
（ａ）個体から得られた癌性細胞の試料中の新生抗原を決定する工程であって、ここで各新生抗原が
コード配列内に含まれ、
前記個体の非癌性細胞の試料中に存在しないコードされたアミノ酸配列の変化をもたらすコード配列における少なくとも１つの変異を含み、かつ
癌性細胞の試料中のコード配列の９個～４０個、好ましくは１９個～３１個、より好ましくは２３個～２５個、最も好ましくは２５個の連続したアミノ酸からなり、
（ｂ）各新生抗原について、コード配列内の工程（ａ）の前記変異のそれぞれの変異誘発遺伝子頻度を決定する工程、
（ｃ）（ｉ）前記癌性細胞の試料において、前記変異の少なくとも１つを含む各コード配列の発現レベルを決定する工程、または
（ｉｉ）癌性細胞の試料と同じ癌タイプの発現データベースから、前記変異の少なくとも１つを含む各コード配列の発現レベルを決定する工程、
（ｄ）新生抗原のＭＨＣクラスＩ結合親和性を予測する工程であって、ここで
（Ｉ）ＨＬＡクラスＩ対立遺伝子は、前記個体の非癌性細胞の試料から決定され、
（ＩＩ）（Ｉ）において決定された各ＨＬＡクラスＩ対立遺伝子について、新生抗原の８個～１５個、好ましくは９個～１０個、より好ましくは９個の連続するアミノ酸からなる各フラグメントのＭＨＣクラスＩ結合親和性が予測され、ここで各フラグメントは、工程（ａ）の変異によって引き起こされる少なくとも１つのアミノ酸変化を含み、かつ
(ＩＩＩ)最も高いＭＨＣクラスＩ結合親和性を有するフラグメントは、新生抗原のＭＨＣクラスＩ結合親和性を決定し、
（ｅ）各新生抗原について工程（ｂ）～（ｄ）において決定された値に従って新生抗原を最高値から最低値までランク付けし、ランクの第１、第２および第３のリストを生成する工程、
（ｆ）前記ランクの第１、第２および第３のリストからランク合計を計算し、そしてランク合計を増加させることによって新生抗原を順序付けし、新生抗原のランク付けされたリストを生成する工程、
（ｇ）（ｆ）において得られた新生抗原のランク付けされたリストから、最も低いランクから開始して、３０個～２４０個、好ましくは４０個～８０個、より好ましくは６０個の新生抗原を選択する工程。

【0048】

多くの癌新生抗原は、潜在的なエピトープが腫瘍細胞によってプロセシング／提示されないか、または免疫寛容が変異配列と反応するＴ細胞の排除を導いたために、免疫系によって「見られ（ｓｅｅｎ）」ない。したがって、全ての潜在的な新生抗原の中から、免疫原性である可能性が最も高いものを選択することが有益である。理想的には、新生抗原は、多数の癌細胞中に存在し、十分な量で発現され、そして免疫細胞に効率的に提示されなければならないであろう。

【0049】

特定の変異誘発遺伝子頻度を有し、豊富に発現され、かつＭＨＣ分子に対する高い結合親和性を有すると予測される癌特異的変異を含む新生抗原を選択することにより、免疫応答が誘導される可能性が有意に増加される。本発明者らは、驚くべきことに、これらのパラメーターが、適切な新生抗原を選択するために最も効率的に使用され得、異なるパラメーターを考慮に入れる優先順位付け方法を使用して免疫応答の増加を誘発することを見出した。重要なことに、本発明の方法は、対立遺伝子頻度、発現レベルまたは予測されるＭＨＣ結合親和性が、観察された最も高いものの中にない新生抗原も考慮する。例えば、高い発現レベルおよび高い変異誘発遺伝子頻度を有するが、比較的低い予測ＭＨＣ結合親和性を有する新生抗原は、選択された新生抗原のリストに依然として含められ得る。

【0050】

したがって、本発明の方法は、選択プロセスにおいて一般的に適用されるカットオフ基準を使用しないが、１つのパラメーターによる非常に高い予測適合性を有する新生抗原が、他のパラメーターにおける最適以下の適合性のために、単にリストから除外されないことを考慮に入れる。これは、特定のカットオフ基準をわずかに失うだけのパラメータを有する新生抗原に特に関連する。

【0051】

個体の癌細胞にのみ存在し、かつ同一個体の健康な細胞には存在しないコード配列（すなわち、転写され、かつ翻訳されているゲノム核酸配列）における任意の変異は、潜在的に免疫原性（すなわち、免疫応答を誘導することができる）新生抗原として興味深い。コード配列の変異は、翻訳されたアミノ酸配列の変化ももたらさなければならず、すなわち、核酸レベルにのみ存在し、かつアミノ酸配列を変化させないサイレント変異は、したがって適していない。本質的なことは、変異が、変異の厳密なタイプ（単一ヌクレオチドの変化、単一ヌクレオチドまたは複数ヌクレオチドの挿入または欠失など）にかかわらず、翻訳されたタンパク質のアミノ酸配列の変化をもたらすことである。変化したアミノ酸配列にのみ存在するが、非癌性細胞に存在するようなコード遺伝子から生じるアミノ酸配列には存在しない各アミノ酸は、本明細書の文脈において変異アミノ酸であるとみなされる。例えば、フレームシフトペプチドを生じる挿入または欠失変異などのコード配列の変異は、シフトしたリーディングフレームによってコードされる各アミノ酸が変異アミノ酸とみなされるペプチドを生じるであろう。

【0052】

コード配列の変異は、原則として、個体から得られた試料の任意のＤＮＡ配列決定の方法によって同定され得る。個体のコード配列における変異を同定するために必要なＤＮＡ配列を得るための好ましい方法は、超並列配列決定法である。

【0053】

コード配列中の変異の対立遺伝子頻度（すなわち、変異の位置における非変異配列対変異配列の比率）も、ワクチンに用いられる新生抗原にとって重要な因子である。対立遺伝子頻度の高い新生抗原は、相当な数の癌細胞に存在し、ワクチンの有望な標的であるこれらの変異を含む新生抗原をもたらす。

【0054】

同様に、癌細胞内で新生抗原がどれだけ豊富に発現されているかが重要である。癌細胞における新生抗原の発現が高ければ高いほど、新生抗原はより適しており、かつ当該細胞に対して十分な免疫応答の可能性がより高い。本発明は、新生抗原の発現レベルを評価する異なる方法で実施され得る。新生抗原の発現は、癌性細胞の試料中で直接評価され得る。発現は、好ましくはトランスクリプトーム全体を示す異なる方法によって測定され得、様々なそのような方法が当業者に知られている。好ましくは、トランスクリプトームを測定するための迅速で、信頼性があり、かつ費用効果の高い方法を提供する方法が使用される。１つのこのような好ましい方法は、超並列配列決定である。

【0055】

あるいは、例えば、技術的理由または経済的理由に起因し得る、直接的な測定が利用可能でない場合、発現データベースが使用され得る。当業者は、異なる癌タイプの遺伝子発現データを含む利用可能な発現データベースを知っている。このようなデータベースの典型的な非限定的な例は、ＴＣＧＡ（ｈｔｔｐｓ：／／ｐｏｒｔａｌ．ｇｄｃ．ｃａｎｃｅｒ．ｇｏｖ／）である。ワクチンが設計される個体と同じタイプの腫瘍における方法の工程（ａ）において同定される変異を含む遺伝子の発現は、これらのデータベースにおいて検索され得、そして発現値を決定するために使用され得る。

【0056】

選択された新生抗原が、癌細胞上のＭＨＣ分子によって免疫細胞に効率的に提示されることは、さらに重要である。ＭＨＣクラスＩ（およびクラスＩＩ）分子に対するペプチドの結合親和性を予測するための当技術分野で知られている様々な方法がある（Ｍｏｕｔａｆｔｓｉら、２００６年；Ｌｕｎｄｅｇａａｒｄら、２００８年；Ｈｏｏｆら、２００９年；ＡｎｄｒｅａｔｔａおよびＮｉｅｌｓｅｎ、２０１６年；Ｊｕｒｔｚら、２０１７年）。ＭＨＣ分子は、個体間で有意な差異を有するタンパク質の高度に多型性のグループであるため、個体の細胞上に存在するＭＨＣ分子のタイプに対するＭＨＣ結合親和性を決定することが重要である。ＭＨＣ分子は、高度に多型性のＨＬＡ遺伝子の群によってコードされている。したがって、当該方法は、工程（ａ）で利用されたＤＮＡ配列決定結果を使用して、コード配列における変異を同定し、個体に存在するＨＬＡ対立遺伝子を同定する。個体において同定されたＨＬＡ対立遺伝子に対応する各ＭＨＣ分子について、新生抗原に対するＭＨＣ結合親和性が決定される。これらの末端に向かって、新生抗原のアミノ酸配列は、コード配列のインシリコ翻訳によって決定される。得られた新生抗原アミノ酸配列は、次いで、８～１５個、好ましくは９～１０個、より好ましくは９個の連続したアミノ酸からなるフラグメントに分割され、ここで該フラグメントは、新生抗原の変異アミノ酸の少なくとも１つを含まなければならない。フラグメントのサイズは、ＭＨＣ分子が存在し得るペプチドのサイズによって制限される。各フラグメントについて、ＭＨＣ結合親和性が予測される。ＭＨＣ結合親和性は、通常、５０％阻害濃度（［ｎＭ］におけるＩＣ５０）として測定される。したがって、ＩＣ５０値が低いほど、ＭＨＣ分子に対するペプチドの結合親和性がより高くなる。ＭＨＣ結合親和性が最も高いフラグメントは、該フラグメントが由来する新生抗原のＭＨＣ結合親和性を決定する。

【0057】

本発明の方法は、次いで、工程（ｂ）～（ｄ）において決定されたパラメーター、すなわち、新生抗原の変異誘発遺伝子頻度、発現レベルおよび予測ＭＨＣクラスＩ結合親和性を使用して、これらのパラメーターに優先順位付け方法を適用することによって、最も適切な新生抗原を選択する。したがって、パラメーターは、ランク付けされたリスト上でソートされる。変異誘発遺伝子頻度が最も高い新生抗原は、ランクの第１のリストにおいて第１のランク、すなわちランク１を割り当てられる。全ての同定された新生抗原がランクの第１のリスト上のランクに割り当てられるまで、変異誘発遺伝子頻度が２番目に高い新生抗原は、ランクの第１のリストにおいて第２のランク等に割り当てられる。

【0058】

同様に、各コード配列の発現レベルは、最高から最低までランク付けされ、全ての同定された新生抗原がランクの第２のリスト上のランクに割り当てられるまで、最高の発現値を有する新生抗原は、ランク１に割り当てられ、２番目に高いレベルを有する新生抗原は、ランク２等に割り当てられる。

【0059】

新生抗原のＭＨＣクラスＩ結合親和性は、新生抗原との結合親和性が最も高いものから最も低いものまでランク付けされ、全ての新生抗原がランクの第３のリスト上のランクに割り当てられるまで、最も高いＭＨＣクラスＩ結合親和性を有するものはランク１に割り当てられ、２番目に高い結合親和性を有する新生抗原はランク２等に割り当てられる。

【0060】

いずれかの新生抗原が、別の新生抗原と同一の変異誘発遺伝子頻度、発現レベルおよび／またはＭＨＣクラスＩ結合親和性を有する場合、両抗原は、関連するランクのリスト上で同じランクに割り当てられる。

【0061】

当該方法は、次いで、ランクの３つのリストのランク合計を計算することによって、３つのランキング全てを考慮に入れる優先順位付け方法を使用する。例えば、ランクの第１のリスト上にランク３、ランクの第２のリスト上にランク１３、およびランクの（正：ｏｆ）第３のリスト上にランク２を有する新生抗原は、ランク合計１８（３＋１３＋２）を有する。ランク合計が各新生抗原について計算された後、ランク合計は、それらのランク合計に従ってランク付けされ、最低ランク合計は、ランク１等に割り当てられ、新生抗原のランク付けされたリストを生成する。同一のランク合計を有する新生抗原は、新生抗原のランク付けされたリスト上で同一のランクに割り当てられる。

【0062】

リスト中に存在する新生抗原の最終的な数は、各患者において検出される変異の数に依存する。ワクチンにおいて使用される新生抗原の数は、ワクチンを送達するために使用されるビヒクル（複数の場合もある）によって制限される。例えば、単一のウイルスベクターが、遺伝子ワクチンの場合のように、送達ビヒクルとして使用される場合、このベクターの最大インサートサイズは、各ベクターにおいて使用され得る新生抗原の数を制限するであろう。

【0063】

したがって、本発明の方法は、最低ランク（すなわち、最低ランク番号、ランク１）を有する新生抗原で開始するランク付けされた新生抗原のリストから、２５個～２５０個、３０個～２４０個、３０個～１５０個、３５個～８０個、好ましくは５５個～６５個、より好ましくは６０個の新生抗原を選択する。新生抗原が、１つのセット（例えば、一価ワクチンの単一ビヒクル）中に存在するように選択される場合、２５個～８０個、３０個～７０個、３５個～７０個、４０個～７０個、５５個～６５個、好ましくは６０個の新生抗原が選択される。しかしながら、第１のセット中に含まれない新生抗原は、４つまでのウイルスベクターの同時投与に基づく多価ワクチン接種のための追加のウイルスベクターによってコードされ得る。

【0064】

本発明の第１の態様の好ましい実施形態において、工程（ａ）および（ｄ）（Ｉ）は、試料の超並列ＤＮＡ配列決定を使用して実施される。

【0065】

本発明の第１の態様の好ましい実施形態において、工程（ａ）および（ｄ）（Ｉ）は、試料の超並列ＤＮＡ配列決定を使用して実施され、そして同定された変異の染色体位置でのにおけるリードの数は、以下の通りである：
癌性細胞の試料では、少なくとも２つ、好ましくは少なくとも３、４、５、または６であり、
非癌性細胞の試料では、２以下、すなわち２、１、または０、好ましくは０である。

【0066】

本発明の第１の態様の好ましい代替の実施形態において、同定された変異の染色体位置におけるリードの数は、非癌性細胞の試料よりも癌性細胞の試料においてより多く、ここで試料間の差異は、統計的に有意である。２つのグループの間の統計的に有意な差は、当業者に知られている複数の統計的検定によって決定され得る。適切な統計的検定のその一例は、フィッシャーの直接検定である。本発明の目的のために、ｐ値が０．０５未満である場合、２つのグループは互いに異なるとみなされる。

【0067】

これらの基準は、新生抗原をさらに選択するために適用され、ここで同定された変異は、特に高い技術的信頼性で検出される。

【0068】

本発明の第１の態様の好ましい実施形態では、本方法は、工程（ｄ）に加えて、または工程（ｄ）の代わりに、工程（ｄ’）を含み、ここで工程（ｄ’）は以下を含む：
前記個体の非癌性細胞の試料中のＨＬＡクラスＩＩ対立遺伝子を決定すること、
新生抗原のＭＨＣクラスＩＩ結合親和性を予測すること、ここで
決定された各ＨＬＡクラスＩＩ対立遺伝子について、新生抗原の１１個～３０個、好ましくは１５個の連続するアミノ酸の各フラグメントに対するＭＨＣクラスＩＩ結合親和性が予測され、ここで各フラグメントは、工程（ａ）の変異によって生成された少なくとも１つの変異アミノ酸を含んでおり、および
最も高いＭＨＣクラスＩＩ結合親和性を有するフラグメントが新生抗原のＭＨＣクラスＩＩ結合親和性を決定し；
ここで、ＭＨＣクラスＩＩ結合親和性は、最も高いＭＨＣクラスＩＩ結合親和性から最も低いＭＨＣクラスＩＩ結合親和性までランク付けされ、工程（ｆ）のランク合計に含まれるランクの第４のリストを生成する。

【0069】

この実施形態では、代替または追加の選択パラメーターが追加される。ＭＨＣクラス2分子によって提示されたペプチドは、ＭＨＣクラス1ペプチドよりもサイズが大きいため、ＭＨＣクラス2結合親和性は、わずかにより大きいフラグメントにおいて予測される。ＭＨＣクラスＩＩ結合親和性は、最も高い結合親和性から最も低い結合親和性までもランク付けされ、全ての新生抗原がランクの第４のリスト中のランクに割り当てられるまで、最も高いＭＨＣクラスＩＩ結合親和性を有する新生抗原はランク１等に割り当てられる。

【0070】

ＭＨＣクラスＩＩ結合親和性が追加の選択パラメーターとして使用される場合、第４のリストは、ランク合計計算に更に含まれる。ＭＨＣクラスＩＩ結合親和性が、工程（ｄ）のＭＨＣクラスＩ結合親和性の代替として使用される場合、工程（ｆ）におけるランク合計は、ランクの第１、第２および第４のリストのみについて計算される。

【0071】

本発明の第１の態様の好ましい実施形態において、工程（ａ）の少なくとも１つの変異は、単一ヌクレオチド変異体（ＳＮＶ）またはフレームシフトペプチド（ＦＳＰ）を生じる挿入／欠失変異である。

【0072】

本発明の第１の態様の好ましい実施形態において、ここで変異がＳＮＶであり、かつ新生抗原が工程（ａ）で定義された総サイズを有し、かつ、複数の隣接する連続するアミノ酸によって各側に隣接される、変異によって生じたアミノ酸からなり、ここでコード配列が両側に十分な数のアミノ酸を含まない限り、各側の数は１を超えて異ならず、ここで新生抗原は、工程（ａ）で定義された総サイズを有する。好ましくは、ＳＮＶから生じる変異アミノ酸は、新生抗原の「中央」内に位置する（すなわち、等しい数のアミノ酸が両側に隣接する）。これは、エピトープの末端または始点に変異が存在する等しい機会を提供する。したがって、新生抗原は、変異アミノ酸の各側のコード配列から生じるほぼ同じ数の周囲のアミノ酸で選択される（すなわち、１以下だけ異なる）。

【0073】

本発明の第１の態様の好ましい実施形態において、ここで変異は、ＦＳＰを生じ、かつ変異によって生じる各単一アミノ酸変化は、工程（ａ）で定義される総サイズを有する新生抗原を生じ、かつ以下からなり：
（ｉ）変異によって引き起こされる前記単一アミノ酸変化、および７個～１４個、好ましくは８個のＮ末端に隣接する連続するアミノ酸、および
（ｉｉ）コード配列が両側に十分な数のアミノ酸を含まない限り、両側のアミノ酸の数は、１以下だけ異なる、両側で工程（ｉ）のフラグメントに隣接する複数の連続するアミノ酸、
ここで工程（ｄ）のＭＨＣクラスＩ結合親和性および／または工程（ｄ’）のＭＨＣクラスＩＩ結合親和性は、工程（ｉ）のフラグメントについて予測される。

【0074】

ＦＳＰの各変異アミノ酸は、１つの異なる新生抗原を定義する。各新生抗原は、変異アミノ酸と、該変異アミノ酸のＮ末端に位置する、ＭＨＣクラスＩ結合親和性を決定するために使用されるフラグメントのサイズ（すなわち、７～１４）よりも１アミノ酸短い複数のアミノ酸とからなる。新生抗原はさらに、工程（ｉ）の新生抗原フラグメントの配列と共にコード配列中の連続配列を形成するコード配列に由来する複数の連続するアミノ酸からなる。両側で工程（ｉ）の新生抗原フラグメントを取り囲むアミノ酸の数は、１つだけ異なり、ここで、新生抗原の総サイズは、工程（ａ）で定義されるとおりである。工程（ｉ）の新生抗原フラグメントは、ＭＨＣクラスＩおよび／またはクラスＩＩ結合親和性を決定するために使用される。

【0075】

例えば、翻訳されたコード配列の相対位置２０上の変異アミノ酸は、位置１２～２０の範囲の８個の連続するアミノ酸の連続するアミノ酸配列（すなわち、工程（ｉ）のフラグメント）を含む新生抗原フラグメントを定義するであろう。工程（ｉｉ）による２５アミノ酸の完全な新生抗原配列は、アミノ酸４個～２８個からなるであろう。９アミノ酸からなる１２位～２０位の範囲の新生抗原フラグメントは、ＭＨＣ結合親和性を決定するために使用されることになる。

【0076】

本発明の第１の態様の好ましい実施形態において、癌性細胞の試料中の工程（ｂ）で決定される新生抗原の変異誘発遺伝子頻度は、少なくとも２％、好ましくは少なくとも５％、より好ましくは少なくとも１０％である。

【0077】

本発明の第１の態様の好ましい実施形態において、工程（ｇ）は、新生抗原のランク付けされたリストから、自己免疫疾患に関連する遺伝子から新生抗原を除去することをさらに含む。当業者は、公的データベースからの自己免疫疾患に関連する新生抗原を知っている。このようなデータベースの一例は、ＩＥＤＢデータベース（ｗｗｗ．ｉｅｄｂ．ｏｒｇ）である。新生抗原候補の除外は、変異を有する遺伝子がＩＥＤＢデータベースの自己免疫疾患に関連するそれらの遺伝子の１つに属する場合、またはよりストリンジェントではない方法において、患者が自己免疫に関与することが知られている遺伝子における変異を有するだけでなく、患者のＭＨＣ対立遺伝子の１つが、記載された自己免疫現象に関連してヒト自己免疫疾患エピトープについてＩＥＤＢデータベースに記載された対立遺伝子と同一でもある場合の、遺伝子レベルの両方で実施され得る。

【0078】

好ましい実施形態において、自己免疫疾患に関連する新生抗原は、データベースがこの関連について特定のＭＨＣクラスＩ対立遺伝子を特定し、そして対応するＨＬＡ対立遺伝子が工程（ｄ）（Ｉ）における個体において見出されなかった場合、新生抗原のランク付けされたリストから除去されない。

【0079】

本発明の第１の態様の好ましい実施形態において、工程（ｇ）は、０．１より低いアミノ酸配列についてのシャノンエントロピー値を有する新生抗原を、新生抗原の前記ランク付けされたリストから除去することをさらに含む。

【0080】

本発明の第１の態様の好ましい実施形態において、工程（ｃ）（ｉ）における前記コード遺伝子の発現レベルは、超並列トランスクリプトーム配列決定によって決定される。

【0081】

本発明の第１の態様の好ましい実施形態において、工程（ｃ）（ｉ）において決定された発現レベルは、以下の式に従って計算された補正されたトランスクリプト／キロベースミリオン（ｃｏｒｒＴＰＭ）値を使用する。

【0082】

【数1】

【0083】

式中、Ｍは、変異を含む工程（ａ）の変異の位置に及ぶリードの数であり、かつＷは、変異を含まない工程（ａ）の変異の位置に及ぶリードの数であり、かつＴＰＭは、変異を含む遺伝子のトランスクリプト／キロベースミリオン値であり、かつｃは、０より大きい定数であり、好ましくはｃは０．１である。

【0084】

本発明の第１の態様の好ましい実施形態において、工程（ｆ）におけるランク合計は、重み付けされたランク合計であり、ここで
工程（ｄ）のＭＨＣクラスＩ結合親和性の予測が１０００ｎＭより高いＩＣ５０値をもたらしたランクの第３のリストにおいて、工程（ａ）で決定された新生抗原の数は、各新生抗原のランク値に加算され、および／または
工程（ｄ’）のＭＨＣクラスＩＩ結合親和性の予測が１０００ｎＭより高いＩＣ５０値をもたらしたランクの第４のリストにおいて、工程（ａ）で決定された新生抗原の数は、各新生抗原のランク値に加算される。

【0085】

ＭＨＣ結合親和性のこの重み付けは、ランクを加えることによって、非常に低いＭＨＣクラスＩおよび／またはクラスＩＩ結合親和性にペナルティを課す。

【0086】

本発明の第１の態様の好ましい実施形態において、工程（ｆ）におけるランク合計は、重み付けされたランク合計であり、ここで工程（ｃ）（ｉ）が超並列トランスクリプトーム配列決定によって実施される場合、工程（ｆ）のランク合計は、重み係数（ＷＦ）によって乗算され、ここでＷＦは、
変異についてのマッピングされたトランスクリプトームリード数が＞０である場合、１であり、
変異についてのマッピングされたトランスクリプトームリード数が０であり、かつ非変異配列についてのマッピングされたリード数が０であり、かつトランスクリプト／ミリオン（ＴＰＭ）値が少なくとも０．５である場合、２であり、
変異についてのマッピングされたトランスクリプトームリード数が０であり、かつ非変異配列についてのマッピングされたリード数が＞０であり、かつトランスクリプト／ミリオン（ＴＰＭ）値が少なくとも０．５である場合、３であり、
変異についてのマッピングされたトランスクリプトームリード数が０であり、かつ非変異配列についてのマッピングされたリード数が０であり、かつトランスクリプト／ミリオン（ＴＰＭ）値が＜０．５である場合、４であり、または、
変異についてのマッピングされたトランスクリプトームリード数が０であり、かつ非変異配列についてのマッピングされたリード数が＞０であり、かつトランスクリプト／ミリオン（ＴＰＭ）値が＜０．５である場合、５である。

【0087】

重み付けマトリックス（weighing matrix）は、配列決定結果が不良な質（すなわち、マッピングされたリード数が少ない）であるか、および／または発現値（すなわち、ＴＰＭ値）が特定の閾値未満であるかのいずれかである、特定の新生抗原にペナルティを課す。特定のパラメーターを重み付けする（すなわち、優先順位付けする）この様式は、単一のパラメーターについてのカットオフ値を使用するよりも良好な免疫原性を有する新生抗原を提供し、これは、他のパラメーターが新生抗原を適切であるとみなすとしても、１つのパラメーターにおける低い適合性のために、特定の新生抗原を排除するであろう。

【0088】

本発明の第１の態様の好ましい実施形態において、工程（ｇ）は、代替の選択プロセスを含み、ここで新生抗原が、全ての選択された新生抗原についてのアミノ酸の総計の全長における設定された最大サイズに達するまで、最低ランクで開始する新生抗原のランク付けされたリストから選択され、ここで該最大サイズは、各ベクターについて１２００～１８００アミノ酸、好ましくは１５００アミノ酸である。当該プロセスは、多価ワクチン接種アプローチにおいて反復され得、ここで上記に示される最大サイズは、多価アプローチにおいて使用される各ビヒクルに適用する。例えば、４個のベクターに基づく多価アプローチは、例えば、６０００アミノ酸の総限界を可能にし得る。この実施形態は、特定の送達ビヒクルによって許容される新生抗原の最大サイズを考慮に入れる。したがって、ランク付けされたリストから選択された新生抗原の数は、新生抗原の数によって決定されるのではなく、新生抗原のサイズを考慮に入れる。抗原のランク付けされたリスト中の複数の小さな新生抗原は、選択された抗原のリスト内により多くの抗原を含むことを可能にするであろう。

【0089】

本発明の第１の態様の好ましい実施形態において、２つ以上の新生抗原は、それらが重複するアミノ酸配列セグメントを含む場合、１つの新しい新生抗原にマージされる。いくつかの場合において、新生抗原は、重複するアミノ酸配列を含み得る。これはＦＳＰ由来の新生抗原の場合に特によくみられる。余剰の重複配列を避けるために、新生抗原は、マージされた新生抗原の非余剰部分からなる単一の新しい新生抗原にマージされる。マージされた新しい新生抗原は、マージされた新生抗原の数および重複の程度に依存して、本発明の第１の態様の工程（ａ）において定義されるよりも大きいサイズを有し得る。

【0090】

本発明の第１の態様の好ましい実施形態において、個別化されたワクチンは、個別化遺伝子ワクチンである。用語「遺伝子ワクチン」は、「ＤＮＡワクチン」と同義に使用され、そしてワクチンとしての遺伝情報の使用を意味し、そしてワクチン接種された対象の細胞は、ワクチン接種の対象である抗原を産生する。

【0091】

本発明の第１の態様の好ましい実施形態において、個別化されたワクチンは、個別化された癌ワクチンである。

【0092】

第２の態様において、本発明は、以下の工程を含む、ワクチンとして使用するための、本発明の第１の態様に従って、新生抗原の組み合わせをコードする個別化されたベクターを構築する方法を提供する：
（ｉ）少なくとも１０＾５～１０＾８、好ましくは１０＾６の異なる組み合わせで新生抗原のリストを順序付けする工程、
（ｉｉ）各接合セグメントが、接合の両側に１５個の隣接する連続するアミノ酸を含む、各組み合わせについての新生抗原接合セグメントの全ての可能なペアを生成する工程、
(ｉｉｉ)ベクターが設計された個体中に存在するＨＬＡ対立遺伝子のみが試験される、接合セグメント中の全てのエピトープに対するＭＨＣクラスＩおよび／またはクラスＩＩ結合親和性を予測する工程、および
(ｉｖ)≦１５００ｎＭのＩＣ５０を有する最少数の接合エピトープを有する新生抗原の組み合わせを選択し、そして複数の組み合わせが同じ最少数の接合エピトープを有する場合、最初に遭遇する組み合わせが選択される工程。

【0093】

本発明の第１の態様による選択された新生抗原のリストは、単一の組み合わされた新生抗原に配列され得る。個体の新生抗原が結合される接合部は、癌性細胞上に存在するエピトープに関連しない望ましくないオフターゲット効果をもたらし得る新規なエピトープをもたらし得る。したがって、個体の新生抗原の接合部によって生成されるエピトープが低い免疫原性を有する場合に有利である。これらの末端に向かって、新生抗原は、異なる順序で配列され、異なる接合エピトープを生じ、そしてこれらの接合エピトープのＭＨＣクラスＩおよびクラスＩＩ結合親和性が予測される。≦１５００ｎＭのＩＣ５０値を有する接合エピトープの数が最も少ない組み合わせが選択される。選択された新生抗原の異なる組み合わせの数は、主に利用可能な計算能力によって制限される。使用される計算資源と必要とされる精度との間の妥協は、各新生抗原接合部の接合エピトープのＭＨＣクラスＩおよび／またはクラスＩＩ結合親和性が予測される、１０＾５～１０＾８、好ましくは１０＾６の異なる組み合わせの新生抗原が使用される場合である。

【0094】

代替の第２の態様において、本発明は、以下の工程を含む、ワクチンとして使用するための新生抗原の組み合わせをコードする個別化されたベクターを構築する方法を提供する：
（ｉ）少なくとも１０＾５～１０＾８、好ましくは１０＾６の異なる組み合わせにおいて新生抗原のリストを順序付けする工程、
（ｉｉ）各接合セグメントが、接合の両側に１５個の隣接する連続するアミノ酸を含む、各組み合わせについての新生抗原接合セグメントの全ての可能なペアを生成する工程、
(ｉｉｉ)ベクターが設計された個体中に存在するＨＬＡ対立遺伝子のみが試験される、接合セグメント中の全てのエピトープに対するＭＨＣクラスＩおよび／またはクラスＩＩ結合親和性を予測する工程、および
(ｉｖ)≦１５００ｎＭのＩＣ５０を有する最少数の接合エピトープを有する新生抗原の組み合わせを選択し、そして複数の組み合わせが同じ最少数の接合エピトープを有する場合、最初に遭遇した組み合わせが選択される工程。

【0095】

新生抗原のリストは、単一の組み合わされた新生抗原に配列され得る。個体の新生抗原が結合される接合部は、癌性細胞上に存在するエピトープに関連しない望ましくないオフターゲット効果をもたらし得る新規なエピトープをもたらし得る。したがって、個体の新生抗原の接合部によって生成されるエピトープが低い免疫原性を有する場合に有利である。これらの末端に向かって、新生抗原は、異なる順序で配列され、異なる接合エピトープを生じ、そしてそれらの接合エピトープのＭＨＣクラスＩおよびクラスＩＩ結合親和性が予測される。≦１５００ｎＭのＩＣ５０値を有する接合エピトープの数が最も少ない組み合わせが選択される。選択された新生抗原の異なる組み合わせの数は、主に利用可能な計算能力によって制限される。使用される計算資源と必要とされる精度との間の妥協は、各新生抗原接合部の接合エピトープのＭＨＣクラスＩおよび／またはクラスＩＩ結合親和性が予測される、１０＾５～１０＾８、好ましくは１０＾６の異なる組み合わせの新生抗原が使用される場合である。

【0096】

【0097】

ベクターは、発現ベクターの免疫原性を増強する１つ以上のエレメントを含むことが好ましい。好ましくは、このようなエレメントは、新生抗原または新生抗原組み合わせポリペプチドへの融合体として発現されるか、またはベクター、好ましくは発現カセットに含まれる別の核酸によってコードされる。

【0098】

本発明の第３の態様の好ましい実施形態において、ベクターは、リスト中の最初の新生抗原のＮ末端に融合される、Ｔ細胞エンハンサーエレメント、好ましくは（配列番号１７３～１８２）、より好ましくは配列番号１７５をさらに含む。

【0099】

第３の態様のベクターまたは第４の態様のベクターのコレクションであって、ここでそれぞれの場合におけるベクターは、プラスミド；コスミド；リポソーム粒子、ウイルスベクターまたはウイルス様粒子からなる群から独立して選択され；好ましくは、アルファウイルスベクター、ベネズエラウマ脳炎（ＶＥＥ）ウイルスベクター、シンドビス（ＳＩＮ）ウイルスベクター、セムリキ森林ウイルス（ＳＦＶ）ウイルスベクター、サルまたはヒトサイトメガロウイルス（ＣＭＶ）ベクター、リンパ球脈絡髄膜炎ウイルス（ＬＣＭＶ）ベクター、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルスベクター、ポックスウイルスベクター、ワクシニアウイルスベクターまたは改変ワクシニアアンカラ（ＭＶＡ）ベクター。ベクターのコレクションのであって、ここで該コレクションの各メンバーが異なる抗原またはそのフラグメントをコードするポリヌクレオチドを含み、そして、それはしたがって、典型的には同時に投与され、同じベクター型、例えばアデノウイルス由来ベクターを使用することが好ましい。

【0100】

最も好ましい発現ベクターは、アデノウイルスベクター、特に、ヒトまたは非ヒト大型類類人猿に由来するアデノウイルスベクターである。アデノウイルスが由来する好ましい大型の類人猿は、チンパンジー（Ｐａｎ）、ゴリラ（Ｇｏｒｉｌｌａ）およびオランウータン（Ｐｏｎｇｏ）、好ましくはボノボ（Ｐａｎｐａｎｉｓｃｕｓ）および一般的なチンパンジー（Ｐａｎｔｒｏｇｌｏｄｙｔｅｓ）である。典型的には、天然に存在する非ヒト大型類人猿アデノウイルスは、それぞれの大型類人猿の糞便試料から単離される。最も好ましいベクターは、ｈＡｄ５、ｈＡｄ１１、ｈＡｄ２６、ｈＡｄ３５、ｈＡｄ４９、ＣｈＡｄ３、ＣｈＡｄ４、ＣｈＡｄ５、ＣｈＡｄ６、ＣｈＡｄ７、ＣｈＡｄ８、ＣｈＡｄ９、ＣｈＡｄ１０、ＣｈＡｄ１１、ＣｈＡｄ１６、ＣｈＡｄ１７、ＣｈＡｄ１９、ＣｈＡｄ２０、ＣｈＡｄ２２、ＣｈＡｄ２４、ＣｈＡｄ２６、ＣｈＡｄ３０、ＣｈＡｄ３１、ＣｈＡｄ３７、ＣｈＡｄ３８、ＣｈＡｄ４４、ＣｈＡｄ５５、ＣｈＡｄ６３、ＣｈＡｄ７３、ＣｈＡｄ８２、ＣｈＡｄ８３、ＣｈＡｄ１４６、ＣｈＡｄ１４７、ＰａｎＡｄ１、ＰａｎＡｄ２、およびＰａｎＡｄ３ベクターに基づく非複製性アデノウイルスベクターまたは複製能力のあるＡｄ４およびＡｄ７ベクターである。ヒトアデノウイルスｈＡｄ４、ｈＡｄ５、ｈＡｄ７、ｈＡｄ１１、ｈＡｄ２６、ｈＡｄ３５およびｈＡｄ４９は、当技術分野でよく知られている。天然に存在するＣｈＡｄ３、ＣｈＡｄ４、ＣｈＡｄ５、ＣｈＡｄ６、ＣｈＡｄ７、ＣｈＡｄ８、ＣｈＡｄ９、ＣｈＡｄ１０、ＣｈＡｄ１１、ＣｈＡｄ１６、ＣｈＡｄ１７、ＣｈＡｄ１９、ＣｈＡｄ２０、ＣｈＡｄ２２、ＣｈＡｄ２４、ＣｈＡｄ２６、ＣｈＡｄ３０、ＣｈＡｄ３１、ＣｈＡｄ３７、ＣｈＡｄ３８、ＣｈＡｄ４４、ＣｈＡｄ６３およびＣｈＡｄ８２に基づくベクターは、ＷＯ２００５／０７１０９３に詳細に記載されている。天然に存在するＰａｎＡｄ１、ＰａｎＡｄ２、ＰａｎＡｄ３、ＣｈＡｄ５５、ＣｈＡｄ７３、ＣｈＡｄ８３、ＣｈＡｄ１４６、およびＣｈＡｄ１４７に基づくベクターは、ＷＯ２０１０／０８６１８９に詳細に記載されている。

【0101】

本発明の第３の態様の好ましい実施形態において、ベクターは、２つの独立した発現カセットを含み、ここで各発現カセットは、本発明の第１の態様による新生抗原のリストの一部または本発明の第２の態様による新生抗原の組み合わせをコードする。好ましくは、発現カセットによってコードされるリストの一部は、アミノ酸の数がほぼ等しいサイズである。

【0102】

本発明の第３の態様の好ましい実施形態において、ベクターは、本発明の第１の態様による新生抗原のランク付けされたリストの選択された新生抗原をコードする発現カセットを含み、ここで選択された新生抗原のリストは、ほぼ等しい長さの２つの部分に分割され、ここで、２つの部分は、内部リボソーム侵入部位（ＩＲＥＳ）エレメントまたはウイルス２Ａ領域（Ｌｕｋｅら、２００８年）、例えば、リボソームスキップとして知られる翻訳効果によってポリタンパク質プロセシングを媒介するアフトウイルス口蹄疫ウイルス２Ａ領域（配列番号１８４ＡＰＶＫＱＴＬＮＦＤＬＬＫＬＡＧＤＶＥＳＮＰＧＰ）によって分離される（Ｄｏｎｎｅｌｌｙら、Ｊ．Ｇｅｎ．Ｖｉｒｏｌｏｇｙ２００１年）。任意選択で、２つの部分の各々において、Ｔ細胞エンハンサーエレメント、好ましくは（配列番号１７３～１８２）、より好ましくは配列番号１７５が、リスト中の最初の新生抗原のＮ末端に融合される。

【0103】

第４の態様において、本発明は、本発明の第１の態様による新生抗原のリストの各々の一部または本発明の第２の態様による新生抗原の組み合わせをコードするベクターのコレクションを提供し、ここで、該コレクションは、２個～４個、好ましくは２個のベクターを含み、そして好ましくは、ここでリストの一部をコードするベクターインサートは、アミノ酸の数がほぼ等しいサイズである。

【0104】

【0105】

癌ワクチン接種における使用のための本発明の第３の態様のベクターまたは本発明の第４の態様によるベクターのコレクションであって、ここで該癌が口唇、口腔、咽頭、消化器官、呼吸器官、胸腔内器官、骨、関節軟骨、皮膚、中皮組織、軟部組織、乳房、女性生殖器、男性生殖器、尿路、脳および中枢神経系の他の部分、甲状腺、内分泌腺、リンパ組織、および造血組織の悪性新生物からなる群から選択される。

【0106】

本発明の第５の態様の好ましい実施形態において、ワクチン接種レジメンは、２つの異なるウイルスベクターを用いた異種プライムブーストである。好ましい組合せは、プライミングのための大型類人猿由来アデノウイルスベクター、およびブーストのためのポックスウイルスベクター、ワクシニアウイルスベクターまたは改変ワクシニアアンカラ（ＭＶＡ）ベクターである。好ましくは、これらは、少なくとも１週間、好ましくは６週間の間隔で連続的に投与される。

【実施例】

【0107】

本発明は、免疫原性新生抗原を生じる可能性について腫瘍変異をスコア化する方法を説明する。このアプローチは、以下に記載されるように、腫瘍標本の次世代ＤＮＡ配列決定（ＮＧＳ－ＤＮＡ）データ、および任意選択で、次世代ＲＮＡ配列決定（ＮＧＳ－ＲＮＡ）データ、ならびに同じ患者から得られた正常試料のＮＧＳ－ＤＮＡデータを分析する。

【0108】

個別化されたアプローチは、癌患者から収集された試料を分析することによって得られたＮＧＳデータに依拠する。各患者について、腫瘍中に確信的に存在し、かつタンパク質のアミノ酸配列の変化を生じさせる正常試料中に存在しない体細胞変異を同定するために、腫瘍ＤＮＡからのＮＧＳ－ＤＮＡエキソームデータは、正常ＤＮＡから得られたデータと比較される。

【0109】

正常なエキソームＤＮＡはさらに分析され、患者のＨＬＡクラスＩおよびクラスＩＩ対立遺伝子を決定する。腫瘍試料からのＮＧＳ－ＲＮＡデータは、利用可能であれば、分析され、変異を有する遺伝子の発現を決定する。

【0110】

以下の実施例は、本発明の以下の態様を参照する。
実施例１：優先順位付け方法の説明
実施例２：既存の文献ＮＧＳデータセットへの優先順位付け方法の適用
実施例３：優先順位付け方法の検証

【0111】

優先順位付け方法の検証は、ＮＧＳデータおよび免疫原性新生抗原の両方が記載されているデータセット（公開された研究）に対してその性能を測定することによって行われた。本実施例において、優先順位付け方法ａおよびｂが使用される。この実施例は、上位６０個の新生抗原を選択することによって、既知の免疫原性新生抗原の非常に高い部分が、（患者ＮＧＳ－ＲＮＡを用いる）方法ａまたは（患者ＮＧＳ－ＲＮＡを用いない）方法ｂの両方を用いることによって、ワクチンに含まれることを示す。

【0112】

実施例４：遺伝的ワクチンベクターによって送達される新生抗原をコードする合成遺伝子のための新生抗原レイアウトの最適化。

【0113】

マウスモデルから得られた６２個の選択された新生抗原を２つの合成遺伝子（合計３１＋３１＝６２個の新生抗原）に分割すると、６２個の新生抗原をコードする１つの合成遺伝子を用いる場合と比較して、免疫原性が改善されることの実証。

【0114】

実施例１：優先順位付け方法の説明
工程１：新生抗原を生成しうる変異の同定
腫瘍中に確信的に存在すると定義される変異は、理想的には以下の基準を満たすが、限定されるものではない：
腫瘍ＤＮＡ試料中の変異誘発遺伝子頻度（ＭＦ）＞＝１０％、
腫瘍ＤＮＡ試料と対照ＤＮＡ試料とのＭＦの比＞＝５、
腫瘍ＤＮＡ中の体細胞変異体の染色体位置における変異したリードの数＞２、
正常ＤＮＡ中の体細胞変異体の染色体位置における変異したリードの数＜２。

【0115】

２つの型の体細胞変異が、本発明の方法内で考慮される：得られるタンパク質において変異したアミノ酸を伴う非同義コドン変化を生じる単一ヌクレオチド変異体（ＳＮＶ）、およびタンパク質をコードするｍＲＮＡの読み取り枠を変化させることによってフレームシフトペプチド（ＦＳＰ）を生成する挿入／欠失（インデル）。

【0116】

工程２：各新生抗原の構造を生成する
工程２．１：
各変異について、新生抗原ペプチド配列は以下の方法で生成される：
a) ＳＮＶ：
２５アミノ酸長の配列は、中央に位置し、かつ両側に、好ましくはＡ＝１２の非変異アミノ酸が隣接する変異アミノを用いて生成される（図１）。変異がタンパク質のＮ末端またはＣ末端に近接して局在する場合には、Ａ＝１２より少ない非変異アミノ酸が含まれる。最小数の８個の非変異アミノ酸が、変異の上流または下流のいずれかに付加される。これは、新生抗原が、少なくとも１個の変異アミノ酸を有する９量体ネオエピトープを含み得ることを確実にする。例えば、上流に４個の非変異アミノ酸および下流に２個付加することは不可能であり、これは非常に短いタンパク質に相当するであろう。

【0117】

時折、２つ（またはそれ以上）の変異、ＳＮＶｓおよび／またはインデルが、タンパク質中に小さい距離（Ａアミノ酸以下の距離）内に存在する。これらの場合、Ｎ末端またはＣ末端が付加されるＡ非変異アミノ酸のセグメントは、追加の変異（複数の場合もある）が存在するように改変されることになる。（図１）。

【0118】

次いで、各新生抗原について、ＮＧＳ－ＤＮＡエキソームデータから同定された患者のＨＬＡ対立遺伝子を用いて、ＭＨＣクラスＩ９量体エピトープ予測が行われる。新生抗原に関連するＩＣ５０値は、次いで、少なくとも１つの変異アミノ酸を含むすべての予測エピトープにわたって、および患者のクラスＩ対立遺伝子のすべてにわたって、最も低いＩＣ５０値を有するものとして選択される。

【0119】

ｂ）フレームシフトペプチド（ＦＳＰ）：
ＦＳＰのため、最大Ｎ＝１２個の非変異アミノ酸がＦＳＰのＮ末端に付加される（図２Ａ）；１２個未満の非変異アミノ酸がＦＳＰの上流に存在する場合、これらのみが付加される。変異アミノ酸をもたらすＳＮＶが、付加された非変異セグメント内に存在する場合、該変異アミノ酸が含まれる。これは、伸長されたＦＳＰペプチド配列を生成する。

【0120】

得られた伸長されたＦＳＰペプチド配列は、次いで、９アミノ酸長フラグメントに分割され、そしてＭＨＣクラスＩ９量体エピトープ予測は、少なくとも１つの変異アミノ酸を含む全てのフラグメントについて（患者のＨＬＡ対立遺伝子を用いて）行われる。各フラグメントに関連するＩＣ５０値は、次いで、試験した全ての対立遺伝子にわたる最低予測ＩＣ５０値として選択される。

【0121】

各９アミノ酸フラグメントは、次いで、フラグメントのＮ末端およびＣ末端にそれぞれ８個の上流アミノ酸および８個の下流アミノ酸を付加することによって、２５アミノ酸長の新生抗原配列に伸長される（図２Ｂ）。伸長されたＦＳＰのＮ末端またはＣ末端に近い９個のアミノ酸フラグメントについては、より少ないアミノ酸が付加される。

【0122】

それらの関連するＩＣ５０と共に得られた新生抗原配列は、次いで、ＳＮＶから得られた新生抗原配列のリストに加えられる。

【0123】

工程２．２（任意選択）
次いで、自己免疫を誘導する潜在的な危険性を示す新生抗原を除去するために、任意の安全フィルターが、新生抗原のＲＳＵＭランク付けされたリスト上で実施される。フィルターは、新生抗原をコードする遺伝子が、自己免疫疾患に関連する既知のクラスＩおよびクラスII MHCエピトープを含む遺伝子のブラックリスト（例えば、ＩＥＤＢデータベースから検索される）の一部であるかどうかを試験する。利用可能であれば、該リストは該エピトープのＨＬＡ対立遺伝子も含む。

【0124】

新生抗原は、それらの起源となる変異がブラックリスト中の遺伝子の１つに由来し、かつ同時に患者のＨＬＡ対立遺伝子の１つが自己免疫疾患の遺伝子に関連するＨＬＡに相当する場合に除去される。

【0125】

エピトープのＨＬＡ対立遺伝子に関する情報が利用可能でないブラックリスト中の遺伝子については、新生抗原は患者のＨＬＡ対立遺伝子から独立に除去される。

【0126】

工程２．３（任意選択）
候補新生抗原のリストは、次いで、フィルター処理されて、複雑性の低いアミノ酸配列（１つ以上のアミノ酸（複数の場合もある）が複数回繰り返される配列中のセグメントの存在）を有するペプチドをコードする新生抗原を除去する。

【0127】

一度ヌクレオチド配列に変換されると、これらのセグメントは、ＧまたはＣヌクレオチドの含有量が高い領域を表す可能性がある。したがって、これらの領域は、ワクチン発現カセットの最初の構築／合成の間に問題を生じ得、および／またはそれらはまた、コードされるポリペプチドの発現に負の影響を与え得る。

【0128】

複雑性の低いアミノ酸配列の同定は、新生抗原配列のシャノンエントロピーをそのアミノ酸の長さで割ったものを推定することによって行われる。シャノンエントロピーは、情報理論で一般に使用されるメトリックであり、そしてアルファベットサイズおよびシンボルの頻度に基づいてシンボルのストリングをコードするのに必要な平均最小ビット数を測定する。

【0129】

本発明の方法において、メトリックは、新生抗原配列中に存在するアミノ酸のストリングに適用された。０．１０未満のシャノンエントロピー値を有する新生抗原は、リストから除去される。

【0130】

工程３：
患者の新生抗原の優先順位付けのプロセスの説明
優先順位付けを実行するために必要なデータは、
工程２からの（非同義ＳＮＶまたはフレームシフトインデルからの）Ｍ個の新生抗原のリスト、
工程１からの各新生抗原の変異誘発遺伝子頻度（ｍｕｔａｎｔａｌｌｅｌｅｆｒｅｑｕｅｎｃｙ）データ、
ＲＮＡ配列決定データ（工程１）からの各新生抗原の発現データ、または代替方法（Ｂ）としての各新生抗原の発現データ（腫瘍試料からＮＧＳ－ＲＮＡデータが入手できない場合）、同一腫瘍タイプの一般的な遺伝子レベルの発現データベースからの各新生抗原の発現データ、
（工程３からの）各新生抗原に対する最良の変異９量体エピトープに対する予測されたＭＨＣクラスＩ結合親和性である。

【0131】

優先順位付け戦略は、３つの別個の独立したランクスコア値（ＲＦＲＥＱ、ＲＥＸＰＲ、ＲＩＣ５０）の組み合わせによって得られる全体的なスコアに基づく。３つのランクスコア値は、以下のパラメータのうちの１つに従ってＭ個の新生抗原のリストを独立して順序付けすることによって得られる（したがって、結果は新生抗原の３つの異なる順序付けられたリストであり、各リストはランクスコアを提供する）。

【0132】

工程３．１：対立遺伝子頻度ランクスコア（ＲＦＲＥＱ）
各新生抗原は、新生抗原を生成する変異の観察された腫瘍対立遺伝子頻度と関連している。Ｍ個の新生抗原のリストは、最も高い対立遺伝子頻度から最も低い対立遺伝子頻度まで順序付けられる。対立遺伝子頻度が最も高い新生抗原は、ランクスコアＲＦＲＥＱが１に等しく、２番目に高いものはランクスコアＲＦＲＥＱ＝２などである。同じ対立遺伝子頻度を有する新生抗原が存在する場合、それらは同じランクスコアＲＦＲＥＱを与えられ、すなわち、最も低いランクスコアはＭよりも小さい可能性がある（表１）。

【0133】

表１変異誘発遺伝子頻度が等しい新生抗原は同じランクスコアＲＦＲＥＱを得る

【0134】

【表1】

【0135】

工程３．２: RNA発現ランクスコア（ＲＥＸＰＲ）
各新生抗原の発現レベルは、全てのマッピングされたリードを考慮して、遺伝子中心トランスクリプト／キロベースミリオン（ＴＰＭ）値（ＬｉおよびＤｅｗｅｙ、２０１１年）を計算することによって、腫瘍ＮＧＳ－ＲＮＡデータから決定される。ＴＰＭ値は、次いで、ＮＧＳ－ＲＮＡトランスクリプトームデータ中の変異の位置にわたる変異および野生型リードの数を考慮して改変される（ｃｏｒｒＴＰＭ）：

【0136】

【数2】

【0137】

変異の位置にリードが存在しない場合も含めるために、分子（ｎｕｍｅｒａｔｏｒ）および列挙子（ｅｎｕｍｅｒａｔｏｒ）の両方に０．１の好ましい値が加えられる。

【0138】

患者の腫瘍からＮＧＳ－ＲＮＡ配列決定データが入手できない場合、各新生抗原について、同一の腫瘍型からの発現データベース中に存在する対応する遺伝子のＴＰＭ中央値により、ｃｏｒｒＴＰＭが置換される。

【0139】

新生抗原は、次いで、ｃｏｒｒＴＰＭ値によって決定される発現レベルに従って、ランク付けされる。順序付けは、最高の発現（スコアＲＥＸＰが１に等しい）から最低の発現までである。同じｃｏｒｒＴＰＭ値を有する新生抗原には、同じランクスコアＲＥＸＰＲが与えられる（表２）。

【0140】

表２：等しい発現値ｃｏｒｒＴＰＭを有する新生抗原は、同じランクスコアＲＥＸＰＲを得る

【0141】

【表2】

【0142】

工程３．３：ＨＬＡクラス－Ｉ結合予測（ＲＩＣ５０）
各ＳＮＶまたはＦＳＰ由来新生抗原ペプチドについて、ＭＨＣクラスＩ結合の可能性は、変異アミノ酸（複数の場合もある）を含むか、またはＦＳＰ由来の１つの変異アミノ酸を含む、すべての予測される９量体エピトープの中で最良の予測される（最低の)ＩＣ５０値として定義される。予測は、正常なＤＮＡ試料の分析によって決定される患者中に存在するＭＨＣクラスＩ対立遺伝子に対してのみ行われる。

【0143】

新生抗原のリストは、次いで、最も低い予測ＩＣ５０値（１に等しいＲＩＣ５０スコア）から最も高い予測ＩＣ５０値まで順序付けされる。同じＩＣ５０値を有する新生抗原には、同じランクスコアＲＩＣ５０が与えられる（表３）。

【0144】

表３：等しいＩＣ５０値を有する新生抗原は、同じランクスコアＲＩＣ５０を得る

【0145】

【表3】

【0146】

工程３．４：
新生抗原の最終的な優先順位付け（ランキング）は、次いで、３個体のランクスコアの加重和（ＲＳＵＭ）を計算し、そして新生抗原を最低ＲＳＵＭ値から最高ＲＳＵＭ値までランク付けすることによって行われる（図３）。重み付けは、以下の方法において適用される：
式（Ｉ）：

【0147】

【数3】

【0148】

式（Ｉ）において、ｋは、予測されるエピトープが１０００ｎＭより高いＩＣ５０値を有する場合にＲＩＣ５０値に加えられる定数値である（これは、高いＲＩＣ５０スコア値を有する、すなわち高いＩＣ５０値を有する新生抗原にペナルティを課す）。

【0149】

ｋの値は、以下の方法において決定される。

【0150】

【数4】

【0151】

時折、ＮＧＳ－ＲＮＡデータは、技術的な理由から、非変異アミノ酸についても、別の方法で発現された遺伝子中の変異アミノ酸についても、変異の位置における適用範囲を提供しない。ＷＦは、ＮＧＳ－ＲＮＡトランスクリプトームデータにおいて変異したリードが観察されなかった場合を考慮した、ダウンウェイト因子（結果として生じるＲＳＵＭ値が増加し、そして新生抗原がリストにおいてさらに下位にランク付けされるため、ダウンウェイト）である。

【0152】

【数5】

【0153】

これは、新生抗原のＲＳＵＭランク付けリストを生成する。

【0154】

同じＲＳＵＭスコアを有する新生抗原は、それらのＲＩＣ５０スコアに従ってさらに優先順位付けされる（図３）。ＲＳＵＭスコアおよびＲＩＣ５０スコアの両方が同一である場合、新生抗原は、それらのＲＥＸＰＲスコアに従ってさらに優先順位付けされる。ＲＳＵＭスコア、ＲＩＣ５０スコアおよびＲＥＸＰＲスコアが同一である場合、新生抗原は、それらのＲＦＲＥＱスコアに従ってさらに優先順位付けされる。ＲＳＵＭスコア、ＲＩＣ５０スコア、ＲＥＸＰＲおよびＲＦＲＥＱスコアが同一である場合、新生抗原は、未補正遺伝子レベルＴＰＭ値に従ってさらに優先順位付けされる。

【0155】

工程４：
工程４．１:
Ｍ個のランク付けされた新生抗原の最終的なリストは、次いで、どのおよびいくつの新生抗原がワクチンベクター中に含まれ得るかを決定する方法によって分析される。

【0156】

当該方法は、反復手順で動作する。各反復において、Ｌ個のアミノ酸（好ましくは１５００アミノ酸）の最大インサートサイズに到達するのに必要なＮ個の最良にランク付けされた新生抗原のリストが作成される。Ｎ個の新生抗原のリストが、同じＦＳＰに由来する１より多い部分的に重複する新生抗原を含む場合、同じアミノ酸配列の冗長なストレッチの包含を回避するために、マージ工程が実施される。（図４）。マージ工程の後、含まれる新生抗原の全長が依然として最大の所望のインサートサイズに達しない場合、ランク付けされたリストから次の新生抗原を加えることによって、新たな反復が行われる。

【0157】

当該手順は、既に選択されたＮ個の新生抗原のリストに次の新生抗原を追加すると、最大の所望のインサートサイズＬを超えることになる場合に停止する。

【0158】

したがって、Ｎの正確な値は、マージしたＦＳＰ由来の新生抗原（２５量体より長い長さ）の存在によって減少し、またはタンパク質のＮ末端またはＣ末端に近い変異を含む新生抗原（これらの新生抗原は２５量体よりも短いことになる）の存在によって増加する。
出力は、Ｌ＝１５００ａａ以下の全長を有するＮ個の新生抗原のリストである。

【0159】

工程４．２：
順序付けられたリストは、次いで、ほぼ等しい長さの２つの部分に分割される（図５）。当業者は、リストを２つの部分にどのように分割するかについて、複数の異なる方法が実行可能であることを知っている。

【0160】

工程４．３：
Ｎ個の選択された新生抗原配列のリストは、次いで、アセンブルされたポリ新生抗原ポリペプチド中の２つの隣接する新生抗原ペプチドの並置によって生成され得る予測される接合エピトープの形成を最小限にする方法に従って並べ替えられる。組み立てられたポリ新生抗原の１００万のスクランブルされたレイアウトが、それぞれ異なる新生抗原の順序で生成される。各レイアウトは、次いで、分析されて、患者のＨＬＡ対立遺伝子の１つについてＩＣ５０＜＝１５００ｎＭを有する予測される接合エピトープの数を決定する。１００万のレイアウト全体にわたってループする間に、その時点までに遭遇した最小数の予測される接合エピトープを有するレイアウトが記憶される。同じ最小数の予測される接合エピトープを有する第２のレイアウト上で後に見つかった場合、最初に遭遇したレイアウトが維持される。

【0161】

実施例２：１つの既存の文献データセットへの優先順位付け方法の適用
実施例１に記載の優先順位付け方法は、実験的に検証された免疫原性反応性が報告されている膵臓癌試料（Ｐａｔ＿３９４２；Ｔｒａｎら、２０１５年）からのＮＧＳデータセットに適用された。腫瘍／正常エキソームおよび腫瘍トランスクリプトームＮＧＳ生データは、ＮＣＢＩＳＲＡデータベース［ＳＲＡＩＤ：ＳＲＲ２６３６９４６；ＳＲＲ２６３６９４７；ＳＲＲ４１７６７８３］からダウンロードされ、そして患者のムタノームを特徴付けるパイプラインで分析した。

【0162】

利用された変異検出パイプラインは、以下の８工程を含んだ。
ａ）リードの品質管理および最適化：
生の配列データの予備的な品質管理は、ＦａｓｔＱＣ０．１１．５（Ａｎｄｒｅｗｓ、ｈｔｔｐｓ：／／ｗｗｗ．ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．ｂａｂｒａｈａｍ．ａｃ．ｕｋ／ｐｒｏｊｅｃｔｓ／ｆａｓｔｑｃ／）を用いて行われた。５０塩基対未満の長さを有するペアになったリードはフィルター除去された。目視検査後、残りのリードは、Ｔｒｉｍｍｏｍａｔｉｃ－０．３３（Ｂｏｌｇｅｒら、２０１４年）を使用して、５’および３’末端で任意選択で切り取られ、低品質の配列決定された塩基を除去され、そして参照ゲノムへのアラインメントに適したリード（ＱＣフィルター処理されたリード）の品質を改善された。

【0163】

ｂ）参照ゲノムに対するリードアラインメント：
ＱＣフィルター処理されたＤＮＡリードは、次いで、デフォルトパラメーターを有するＢＷＡ－ｍｅｍアルゴリズム（Ｌｉ＆Ｄｕｒｂｉｎ、２００９年）を使用することによってヒト参照ゲノムバージョンＧＲＣｈ３８／ｈｇ３８に対して整列された。ＱＣフィルター処理されたＲＮＡリードは、全てのパラメータをデフォルトとして保持するＨｉｓａｔ２２．２．０．４(Ｋｉｍら、２０１５年）ソフトウェアを使用して整列された。１リードのみが整列されたリードペア、および同じマッピングスコアを有する１より多いゲノム遺伝子座に整列されたペアになったリードは、Ｓａｍｔｏｏｌｓ１．４（Ｌｉら、２００９年）を使用してフィルター除去された。

【0164】

ｃ）アラインメント最適化：
ＤＮＡリードアラインメントは、小さな挿入または欠失（インデル）の周りの局所アラインメントを最適化し、重複したリードをマークし、そして再整列された領域における最終的な塩基品質スコアを再較正した手順によってさらに処理された。ＧＡＴＫソフトウェアバージョン３．７（ＭｃＫｅｎｎａら、２０１０年）からのツールＲｅａｌｉｇｎｅｒＴａｒｇｅｔＣｒｅａｔｏｒおよびＩｎｄｅｌＲｅａｌｉｇｎｅｒを使用して、インデル再アラインメントが行われた。重複したリードは、Ｐｉｃａｒｄｖｅｒｓｉｏｎ２．１２（ｈｔｔｐ：／／ｂｒｏａｄｉｎｓｔｉｔｕｔｅ．ｇｉｔｈｕｂ．ｉｏ/Ｐｉｃａｒｄ）からのＭａｒｋＤｕｐｌｉｃａｔｅｓを使用して、検出され、そしてマークされた。塩基品質スコアの再較正は、ＧＡＴＫｖｅｒｓｉｏｎ３．７（ＭｃＫｅｎｎａら、２０１０）のＢａｓｅＲｅｃａｌｉｂｒａｔｏｒおよびＰｒｉｎｔＲｅａｄｓを使用して行われた。ヒトｄｂＳＮＰ１３８放出において注釈された多型（ｈｔｔｐｓ://ｗｗｗ.ｎｃｂｉ.ｎｌｍ.ｎｉｈ.ｇｏｖ/ｐｒｏｊｅｃｔｓ/ＳＮＰ/ｓｎｐ_ｓｕｍｍａｒｙ.ｃｇｉ?ｖｉｅｗ+ｓｕｍｍａｒｙ=ｖｉｅｗ+ｓｕｍｍａｒｙ&ｂｕｉｌｄ_ｉｄ=１３８）は、塩基再較正モデルを生成するために、既知の部位のリストとして使用された。

【0165】

ｄ）ＨＬＡの決定：
患者特異的ＨＬＡクラスＩ型評価は、クラスＩヒトハプロタイプをコードするｈｇ３８ゲノムの部分上の正常試料からのＱＣフィルター処理されたＤＮＡリードをＢＷＡ－ｍｅｍと整列させることにより行われた（ＬｉおよびＤｕｒｂｉｎ、２００９年）。１リードのみが整列されたリードペア、および同じマッピングスコアを有する１より多い遺伝子座に整列されリードペアは、Ｓａｍｔｏｏｌｓ１．４（Ｌｉら、２００９年）を使用して、フィルター除去された。最後に、患者の最も可能性の高いハプロタイプの決定は、ｏｐｔｙｔｉｐｅソフトウェア（Ｓｚｏｌｅｋら、２０１４年）を用いて行われた。ＨＬＡクラスＩＩタイプ評価は、クラスＩＩヒトハプロタイプをコードするｈｇ３８ゲノムの部分上の正常試料からのＱＣフィルター処理されたＤＮＡリードをＢＷＡ－ｍｅｍと整列させることにより行われた（Ｌｉ＆Ｄｕｒｂｉｎ、２００９年）。患者の最も可能性の高いクラスＩＩハプロタイプの決定は、ＨＬＡｍｉｎｅｒソフトウェア（Ｗａｒｒｅｎら、２０１２年）を用いて行われた。

【0166】

ｅ）変異体呼び出し：
単一ヌクレオチド変異体（ＳＮＶ）および小さなインデルの体細胞変異体呼び出しは、ＧＡＴＫｖｅｒｓｉｏｎ３．７［２５］に含まれるｍｕｔｅｃｔ２（Ｃｉｂｕｌｓｋｉｓら、２０１２年）によって、およびＶａｒｓｃａｎ２２．３．９（Ｋｏｂｏｌｄｔら、２０１２年）によって、腫瘍試料対正常対照試料を明示的に比較することによって、再較正されたＤＮＡリードデータに対して実施される。すべてのパラメータは、デフォルトに保持された。デフォルトパラメータを有するＳＣＡＬＰＥＬ（Ｆａｎｇら、２０１４年）は、インデルの変異体呼び出しのための追加ツールとして使用された。少なくとも１つのアルゴリズムによって検出された有意な体細胞変異体は、次いで、Ａｎｎｏｖａｒソフトウェア（Ｗａｎｇら、２０１０年）を使用してヒトＲｅｆｓｅｑトランスクリプトーム上にマッピングされ、そしてさらにフィルター処理された。タンパク質をコードする遺伝子のコード配列内の読み枠の変化（フレームシフトインデル）を生み出すコドンまたはインデルにおける非同義（ミスセンス）変化を生み出すＳＮＶのみが保持された。中途での終止コドンを生み出すＳＮＶは除外された。検出された各変異体について、ＤＮＡおよびＲＮＡ試料からの整列したＮＧＳデータにおいて観察された変異およびｗｔリードの数は、次いで、Ｓａｍｔｏｏｌｓ１．４（Ｌｉら、２００９年）のｍｐｉｌｅｕｐを利用するカスタムツールを用いて決定された。

【0167】

ｆ）新生抗原生成：
各体細胞変異体は、変異アミノ酸を含有するペプチドに翻訳された。ＳＮＶについては、新生抗原ペプチドは、変異アミノ酸の上流および下流に１２個の野生型アミノ酸を付加することによって生成された。長さの例外は、変異アミノ酸がＮ末端からまたはＣ末端から１２アミノ酸未満の距離にマッピングされた５つの変異について生じた。複数の２５－量体ペプチドは、ＳＮＶが異なるタンパク質配列を有する複数の選択的スプライシングアイソフォームにおいてアミノ酸変化を誘導した３事例において生成された。ＦＳＰを生成するインデルでは、最初の新しいアミノ酸の上流に１２個の野生型アミノ酸が付加された。少なくとも９アミノ酸の最終的な長さを有する改変ＦＳＰが保持された。

【0168】

ｇ）新生抗原のＨＬＡ－Ｉ結合予測：
ＭＨＣ－Ｉ結合の可能性は、変異アミノ酸（複数の場合もある）を含む全ての予測された９ー量体エピトープの中で最良の予測された（最低の）ＩＣ５０値として決定された。予測は、ＩＥＤＢソフトウェアのＩＥＤＢ＿推奨方法（Ｍｏｕｔａｆｔｓｉら、２００６年）を使用して行われた。ｎｅｔＭＨＣｐａｎ（Ｈｏｏｆら、２００９年）方法は、ＭＨＣ－ＩハプロタイプがＩＥＤＢ＿推奨方法（Ｍｏｕｔａｆｔｓｉら、２００６年）によってカバーされていない場合に使用された。

【0169】

ｈ）確信的な変異体の最終的な選択：
フレームシフトを引き起こすＳＮＶおよびインデルの最初のリストは、次いで、以下の基準を満たす変異のみを選択することによってさらに減少された。
腫瘍ＤＮＡ試料中の変異誘発遺伝子頻度（ＭＦ）＞＝１０％
腫瘍ＤＮＡ試料中および対照ＤＮＡ試料中のＭＦの比＞＝５
腫瘍ＤＮＡ中の体細胞変異体の染色体位置における変異リード＞２
正常ＤＮＡ中の体細胞変異体の染色体位置における変異リード＜２

【0170】

患者Ｐａｔ＿３９４２において確信的に検出された変異をコードする１２９個の新生抗原の最終的なリストは、４個のフレームシフト生成インデルおよび１２５個のＳＮＶを含んでいた。１２５個のＳＮＶが１２８個の新生抗原を生じ、そのうち３個は複数の選択的スプライシングアイソフォーム上にマップされた変異に由来した。４個のフレームシフトインデルは、全長３０７アミノ酸および全２６０個の新生抗原配列を有する４個のＦＳＰを生成する。ＳＮＶまたはフレームシフトインデルのいずれかに由来する全３８８個の新生抗原の全長は、３９４２アミノ酸であった。

【0171】

遺伝子ワクチン、例えばアデノウイルスベクターによって収容され得る最大インサートサイズ（発現制御エレメントを含む）は、制限されるため、コードされるポリ新生抗原に最大サイズのＬ個のアミノ酸を課す。アデノウイルスベクターについてのＬの典型的な値は、１５００アミノ酸のオーダーであり、全ての新生抗原についての３９４２アミノ酸の累積長より小さい。したがって、３９４２アミノ酸制限に適合するランク付けされた新生抗原の最適なサブセットを選択するために、実施例１に記載の優先順位付け戦略が適用された。

【0172】

表４は、１４８５ａａの累積長に達するように選択された６０個の選択された新生抗原の全てを報告する。選択プロセスは、ＦＳＰｃｈｒ１１：１７５８９７１＿ＡＣ＿（２ヌクレオチド欠失）に由来する６個の新生抗原配列、ＦＳＰｃｈｒ６：１６８３１０２０５＿－＿Ｔ（１ヌクレオチド挿入）に由来する２個の新生抗原配列、およびＦＳＰｃｈｒ１６＿３７５７２９５＿ＧＡＴＡＧＣＴＧＴＡＧＴＡＧＧＣＡＧＣＡＴＣ＿（２２ヌクレオチド欠失；配列番号１８５）に由来する１個の新生抗原配列を含んだ。選択の間、いくつかの重複ＦＳＰ由来新生抗原配列は、余剰の配列セグメントを除去するためにマージされた（表５）。マージされた新生抗原配列の詳細は図６に示される。

【0173】

Ｐａｔ＿３９４２において確信的に検出された１２９個の変異によって生成された全ての新生抗原配列は、３つのパラメータの関連値（変異誘発遺伝子頻度ＭＦＲＥＱ、補正された発現値ｃｏｒｒＴＰＭ、ＭＨＣクラスＩ９量体エピトープＭＩＣ５０に対する最良の予測されたＩＣ５０値）、得られた３つの独立したランクスコア（ＲＦＲＥＱ、ＲＥＸＰＲ、ＲＩＣ５０）、重み付け因子ＷＦ、重み付けされたＲＳＵＭ値および得られたＲＳＵＭランクを含む表６にリストされる。

【0174】

重要なことに、患者においてＴ細胞反応性を誘導すると報告された３つの新生抗原配列（Ｔｒａｎら、２０１５年）は、すべて、優先順位付け戦略によって上位６０個の新生抗原の中から選択された。

【0175】

表４：Ｐａｔ＿３９４２について選択された６０個の新生抗原のリスト。ＳＮＶ由来の新生抗原における変異ａａは太字で示される。ＦＳＰ由来の新生抗原については、フレームシフトペプチドの一部であるアミノ酸も太字である。Ｔ細胞反応性を誘導することが実験的に確認された新生抗原配列は、「ＦｉｎａｌＲａｎｋ（最終ランク）」の欄にＴＰと標識される。与えられたゲノム座標は、ヒトゲノムアセンブリＧＲｃｈ３８／ｈｇ３８に関するものである。

【0176】

【表4-1】

【0177】

【表4-2】

【0178】

【表4-3】

【0179】

【表4-4】

【0180】

【表4-5】

【0181】

表５：Ｐａｔ＿３４９２についてマージしたＦＳＰ由来の新生抗原。フレームシフトペプチドの一部であるアミノ酸（変異アミノ酸）は太字で示される。与えられたゲノム座標は、ヒトゲノムアセンブリＧＲｃｈ３８／ｈｇ３８に関するものである。

【0182】

【表5-1】

【0183】

【表5-2】

【0184】

表６：それらのＲＳＵＭランクによって順序付けられたＰａｔ＿３４９２についての全３８８の新生抗原。ＦＳＰ由来の新生抗原については、フレームシフトペプチドの一部であるアミノ酸も太字である。Ｔ細胞反応性を誘導することが実験的に確認された新生抗原配列は、「ＦｉｎａｌＲａｎｋ（最終ランク）」の欄にＴＰと標識される。与えられたゲノム座標は、ヒトゲノムアセンブリＧＲｃｈ３８／ｈｇ３８に関するものである。

【0185】

【表6-1】

【0186】

【表6-2】

【0187】

【表6-3】

【0188】

【表6-4】

【0189】

【表6-5】

【0190】

【表6-6】

【0191】

【表6-7】

【0192】

【表6-8】

【0193】

【表6-9】

【0194】

【表6-10】

【0195】

実施例３：優先順位付け方法の検証優先順位付け方法を検証するためにＣＤ８^＋Ｔ細胞反応性を有する全部で３０の実験的に検証された免疫原性新生抗原を用いたデータセットが分析された（表７）。データセットは、ＮＧＳ生データ（正常／腫瘍エキソームＮＧＳ－ＤＮＡおよび腫瘍ＮＧＳ－ＲＮＡトランスクリプトーム）が利用可能な５つの異なる腫瘍タイプにわたる１３人の癌患者からの生検を含む。

【0196】

ＮＧＳデータは、NCBI SRAウェブサイトからダウンロードされ、そして実施例１で適用されたものと同じＮＧＳ処理パイプラインで処理された。３０の報告された実験的に検証された新生抗原のうちの２８についての変異は、実施例２に開示されたＮＧＳ処理パイプラインを適用することによって同定された（２つの変異は、非常に少ない数の変異リードのために検出されなかった）。各患者試料について、１５００アミノ酸の標的最大ポリペプチド（ポリ新生抗原）サイズを推測して、同定されたすべての新生抗原の全リストが、次いで、実施例１の工程３に記載される方法に従ってランク付けされた。

【0197】

表８は、９量体エピトープ予測のみについて、または８～１１アミノ酸のエピトープを含む予測について、２８個の新生抗原について予測されたＭＨＣクラスＩＩＣ５０値を示す。両方の場合において、最良の（最低の）ＩＣ５０値が、新生抗原ワクチン候補の選択のために当該技術分野で頻繁に適用される５００ｎＭ閾値よりも十分に上（より高い）であり、そして、その結果、個別化されたワクチンから除外されたものであろう、いくつかの新生抗原が存在する。

【0198】

図７Ａは、２８個の検出された実験的に検証された新生抗原についての優先順位付け方法によって得られたＲＳＵＭランクを示す。点線（図５Ａ）は、約１５００アミノ酸のインサート容量（発現制御エレメントを除く）を有するアデノウイルス個別化ワクチンベクターに収容され得る最大数の新生抗原２５量体（６０個）を示す。
３０個の実験的に検証された新生抗原のうち２７個（９０％）は、上位６０個の新生抗原の中に存在するため、個別化されたワクチンベクターに含まれていたことになる。次いで、患者の腫瘍からのＮＧＳ－ＲＮＡ発現データが入手できなかったと仮定して、優先順位付けが繰り返された。各新生抗原についてのｃｏｒｒＴＰＭ発現値は、その特定の腫瘍型についてのＴＣＧＡ発現データ中の対応する遺伝子のＴＰＭ中央値として推定された［ＮＣＢＩＧＥＯアクセッション：ＧＳＥ６２９４４］。図７Ｂは、この場合にも、大部分（３０個中２５個＝８３％）の実験的に検証された新生抗原がワクチンベクターに含まれていたであろうことを示す。重要なことに、検討されたデータセットのそれぞれについて、個別化されたワクチンベクターに含まれていたであろうと検証された少なくとも１つの新生抗原があった。２８個の検証された新生抗原についてのＮＧＳ－ＲＮＡデータの有無によるＲＳＵＭランキング結果を含むさらなる詳細は表７にリストされる。

【0199】

したがって、両結果から、優先順位付け方法は、患者の腫瘍からのトランスクリプトームデータの存在下でも非存在下でも、最も関連性のある新生抗原、すなわち、個別化されたワクチンベクターに含まれるべき実験的に検証された免疫原性を有する新生抗原を含む新生抗原のリストを選択できることが確認された。

【0200】

表７：ベンチマークとして使用された文献データセットおよび新生抗原のリスト。各データセットについて、実験的に検証されたＴ細胞反応性を有する新生抗原がリストされる。変異したアミノ酸は太字かつ下線で示される。２つの選択的スプライシングアイソフォームの存在による２つの異なる新生抗原を生じる変異については、より低いＲＳＵＭランクを有する新生抗原のみが報告される（ａ^＊で示される）。与えられたゲノム座標は、ヒトゲノムアセンブリＧＲｃｈ３８／ｈｇ３８に関するものである。

【0201】

【表7-1】

【0202】

【表7-2】

【0203】

【表7-3】

【0204】

表８：２８個の新生抗原についての予測されたＭＨＣクラスＩＩＣ５０値（ｎＭ）。与えられたゲノム座標は、ヒトゲノムアセンブリＧＲｃｈ３８／ｈｇ３８に関するものである。

【0205】

【表8-1】

【0206】

【表8-2】

【0207】

実施例４：遺伝的ワクチンベクターによって送達される新生抗原をコードする合成遺伝子のための新生抗原レイアウトの最適化
６０個の新生抗原を含有するポリ新生抗原は、遺伝的ワクチンベクターに挿入された発現カセットによってコードされる必要がある約１５００アミノ酸の全長を有する人工タンパク質を生じることになる。このような長い人工タンパク質の発現は最適以下であり得るため、コードされた新生抗原に対して誘導される免疫原性のレベルに影響を及ぼす。したがって、ポリ新生抗原を２つの断片に分割することは、より高いレベルの誘導された免疫原性を得るために役立ち得る。

【0208】

したがって、ネズミ腫瘍細胞株ＣＴ２６に由来する６２個の新生抗原（表９）からなるポリ新生抗原は、アデノウイルスベクターＧＡｄ２０を使用して、異なるレイアウト（図８Ａおよび８Ｂ）において、単一のポリ新生抗原（ＧＡｄ２０－ＣＴ２６－６２、配列番号１７０）によってコードされる全６２個の新生抗原を有する単一のベクターレイアウトにおいて、６２個の新生抗原の半分を各々コードする２つのベクターレイアウト（ＧＡｄ－ＣＴ２６－１－３１+ＧＡｄ－ＣＴ２６－３２－６２、配列番号１７１、１７２）において、および単一のベクター中に存在する同じ２つの別個の発現カセットを有する第３のレイアウト（ＧＡｄ－ＣＴ２６ｄｕａｌ１－３１および３２－６２）において、インビボで免疫原性を誘導するその能力について、試験された。１つのＴＰＡＴ細胞エンハンサーエレメント（配列番号１７３）は、６２個の新生抗原を含むポリ新生抗原のＮ末端に存在し、そして１つのＴＰＡＴ細胞エンハンサーエレメントは、２つの３１個の新生抗原構築物のそれぞれのＮ末端に存在した。ＨＡペプチド配列（配列番号１８３）は、発現をモニターする目的で組み立てられた新生抗原のＣ末端に付加された。

【0209】

免疫原性は、５×１０＾８ウイルス粒子（ｖｐ）の用量で筋肉内に１回、ナイーブＢａｌｂＣマウスの群（ｎ＝６）を免疫することによってインビボで決定された。Ｔ細胞応答は、２５量体の新生抗原を含むペプチドプールの認識のために、ＩＮＦγ ＥＬＩＳｐｏｔにより脾細胞に対する免疫化の２週間後に測定された。

【0210】

長いポリ新生抗原を発現するＧＡｄ２０－ＣＴ２６－６２は、同時投与された２つのベクターレイアウトＧＡｄ－ＣＴ２６－１－３１／ＧＡｄ－ＣＴ２６－３２－６２と比較した場合、新生抗原特異的Ｔ細胞応答の最適以下の誘導を示した（図８Ａ）。したがって、長いポリ新生抗原を、ほぼ等しい長さの２つのより短いポリ新生抗原に分割することにより、有意に改善された免疫原性応答が提供された。重要なことに、デュアルカセットベクターＧＡｄ－ＣＴ２６ｄｕａｌ１－３１および３２－６２（図８Ｂ）も、ＧＡｄ－ＣＴ２６－１－６２よりも有意に高いレベルの免疫原性を誘導し、そして２つのアデノウイルスベクターＧＡｄ－ＣＴ２６－１－３１＋ＧＡｄ－ＣＴ２６－３１－６２（図８ＡおよびＢ）の組み合わせについて観察されたレベルに匹敵した。

【0211】

したがって、長いポリ新生抗原を２つのほぼ等しいサイズのより小さいポリ新生抗原に分割することにより、優れた免疫原性を有するワクチンベクター組成物（１つのデュアルカセットベクターまたは２つの異なるベクター）が提供された。

【0212】

表９：６２個のＣＴ２６新生抗原のリスト。種々の構築物によってコードされるポリ新生抗原中の個々の新生抗原の順序が示される。

【0213】

【表9-1】

【0214】

【表9-2】

【0215】

【表9-3】

【0216】

（参考文献）
Andersen RS, KvistborgP, Frøsig TM, Pedersen NW, Lyngaa R, Bakker AH, Shu CJ, Straten Pt, SchumacherTN, Hadrup SR. (2012). Parallel detection of antigen-specific T cell responsesby combinatorial encoding of MHC multimers. Nat Protoc, 7(5), 891-902.doi:10.1038/nprot.2012.037

Andreatta M &Nielsen M. (2016). Gapped sequence alignment using artificial neural networks:application to the MHC class I system. Bioinformatics, 32(4), 511-517.doi:10.1093/bioinformatics/btv639

Andrews, S. FastQC AQuality Control tool for High Throughput Sequence Data. Available online at:http://www.bioinformatics.babraham.ac.uk/projects/fastqc.

Bolger AM, Lohse M, UsadelB. (2014). Trimmomatic:a flexible trimmer for Illumina sequence data. Bioinformatics, 30(15),2114-2120. doi:10.1093/bioinformatics/btu170

Cibulskis K1, LawrenceMS, Carter SL, Sivachenko A, Jaffe D, Sougnez C, Gabriel S, Meyerson M, LanderES, Getz G. (2013). Sensitive detection of somatic point mutations in impureand heterogeneous cancer samples. Nat Biotechnol, 31(3), 213-219.doi:10.1038/nbt.2514

Donnelly ML, Hughes LE,Luke G, Mendoza H, ten Dam E, Gani D, Ryan MD.(2001) The 'cleavage' activitiesof foot-and-mouth disease virus 2A site-directed mutants and naturallyoccurring '2A-like' sequences. J Gen Virol. 2001 82(Pt 5):1027-41.

Fang H, Wu Y, Narzisi G,O'Rawe JA, Barrón LT, Rosenbaum J, Ronemus M, Iossifov I, Schatz MC, Lyon GJ.(2014). Reducing INDEL calling errors in whole genome and exome sequencingdata. Genome Med, 6(10), 89. doi:10.1186/s13073-014-0089-z

Fritsch EF, Rajasagi M,Ott PA, Brusic V, Hacohen N, Wu CJ. (2014). HLA-binding properties of tumorneoepitopes in humans. Cancer Immunol Res, 2(6), 522-529.doi:10.1158/2326-6066.CIR-13-0227

Gros A, Parkhurst MR,Tran E, Pasetto A, Robbins PF, Ilyas S, Prickett TD, Gartner JJ, Crystal JS,Roberts IM, Trebska-McGowan K, Wunderlich JR, Yang JC1, Rosenberg SA. (2016).Prospective identification of neoantigen-specific lymphocytes in the peripheralblood of melanoma patients. Nat Med. 22(4):433-8. doi: 10.1038/nm.4051.

Hoof I, Peters B, SidneyJ, Pedersen LE, Sette A, Lund O, Buus S, Nielsen M. (2009). NetMHCpan, a methodfor MHC class I binding prediction beyond humans. Immunogenetics, 61(1), 1-13.doi:10.1007/s00251-008-0341-z

Jurtz V, Paul S,Andreatta M, Marcatili P, Peters B, Nielsen M. (2017). NetMHCpan-4.0: ImprovedPeptide-MHC Class I Interaction Predictions Integrating Eluted Ligand andPeptide Binding Affinity Data. J Immunol, 199(9), 3360-3368.doi:10.4049/jimmunol.1700893

Kandoth C, McLellan MD,Vandin F, Ye K, Niu B, Lu C, Xie M, Zhang Q, McMichael JF, Wyczalkowski MA,Leiserson MDM, Miller CA, Welch JS, Walter MJ, Wendl MC, Ley TJ, Wilson RK,Raphael BJ, Ding L. (2013). Mutational landscape and significance across 12major cancer types. Nature, 502(7471), 333-339. doi:10.1038/nature12634

Kim D, Langmead B, SalzbergSL. (2015).HISAT: a fast spliced aligner with low memory requirements. Nat Methods, 12(4),357-360. doi:10.1038/nmeth.3317

Koboldt DC, Zhang Q,Larson DE, Shen D, McLellan MD, Lin L, Miller CA, Mardis ER, Ding L, Wilson RK.(2012). VarScan 2: somatic mutation and copy number alteration discovery incancer by exome sequencing. Genome Res, 22(3), 568-576.doi:10.1101/gr.129684.111

Li B & Dewey CN.(2011). RSEM: accurate transcript quantification from RNA-Seq data with orwithout a reference genome. BMC Bioinformatics, 12, 323.doi:10.1186/1471-2105-12-323

Li H & Durbin R.(2009). Fast and accurate short read alignment with Burrows-Wheeler transform.Bioinformatics, 25(14), 1754-1760. doi:10.1093/bioinformatics/btp324

Li H, Handsaker B,Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R; 1000Genome Project Data Processing Subgroup. Genome Project Data Processing, S.(2009). The Sequence Alignment/Map format and SAMtools. Bioinformatics, 25(16),2078-2079. doi:10.1093/bioinformatics/btp352

Luke GA, de Felipe P,Lukashev A, Kallioinen SE, Bruno EA, Ryan MD. (2008) Occurrence, function andevolutionary origins of '2A-like' sequences in virus genomes.J Gen Virol. 200889(Pt 4):1036-42. doi: 10.1099/vir.0.83428-0.

Lundegaard C, LamberthK, Harndahl M, Buus S, Lund O, Nielsen M. (2008). NetMHC-3.0: accurate webaccessible predictions of human, mouse and monkey MHC class I affinities forpeptides of length 8-11. Nucleic Acids Res, 36(Web Server issue), W509-512.doi:10.1093/nar/gkn202

McKenna A, Hanna M,Banks E, Sivachenko A, Cibulskis K, Kernytsky A, Garimella K, Altshuler D,Gabriel S, Daly M, DePristo MA. (2010). The Genome Analysis Toolkit: aMapReduce framework for analyzing next-generation DNA sequencing data. GenomeRes, 20(9), 1297-1303. doi:10.1101/gr.107524.110

Moutaftsi M, Peters B,Pasquetto V, Tscharke DC, Sidney J, Bui HH, Grey H, Sette A. (2006). Aconsensus epitope prediction approach identifies the breadth of murineT(CD8+)-cell responses to vaccinia virus. Nat Biotechnol, 24(7), 817-819.doi:10.1038/nbt1215

Sahin U, DerhovanessianE, Miller M, Kloke BP, Simon P, Löwer M, Bukur V, Tadmor AD, Luxemburger U,Schrörs B, Omokoko T, Vormehr M, Albrecht C, Paruzynski A, Kuhn AN, Buck J, HeeschS, Schreeb KH, Müller F, Ortseifer I, Vogler I, Godehardt E, Attig S, Rae R,Breitkreuz A, Tolliver C, Suchan M, Martic G, Hohberger A, Sorn P, Diekmann J,Ciesla J, Waksmann O, Brück AK, Witt M, Zillgen M, Rothermel A, Kasemann B,Langer D, Bolte S, Diken M, Kreiter S, Nemecek R, Gebhardt C, Grabbe S, HöllerC, Utikal J, Huber C, Loquai C, Türeci Ö. Personalized RNA mutanome vaccinesmobilize poly-specific therapeutic immunity against cancer. Nature, 547(7662),222-226. doi:10.1038/nature23003

Shannon, C. E. (1997).The mathematical theory of communication. 1963. MD Comput, 14(4), 306-317.

Strait & Dewey.(1996). The Shannon information entropy of protein sequences. Biophys. J. 1996 Biophys J.71(1),148-55.

Szolek A, Schubert B, MohrC, Sturm M, Feldhahn M, Kohlbacher O. (2014). OptiType: precision HLA typing fromnext-generation sequencing data. Bioinformatics, 30(23), 3310-3316.doi:10.1093/bioinformatics/btu548

Tran E, Ahmadzadeh M, LuYC, Gros A, Turcotte S, Robbins PF, Gartner JJ, Zheng Z, Li YF, Ray S,Wunderlich JR, Somerville RP, Rosenberg SA. (2015). Immunogenicity of somaticmutations in human gastrointestinal cancers. Science, 350(6266), 1387-1390.doi:10.1126/science.aad1253

Wang K, Li M,Hakonarson H. (2010). ANNOVAR:functional annotation of genetic variants from high-throughput sequencing data.Nucleic Acids Res, 38(16), e164. doi:10.1093/nar/gkq603

Warren RL, Choe G,Freeman DJ, Castellarin M, Munro S, Moore R, Holt RA. (2012). Derivation of HLAtypes from shotgun sequence datasets. Genome Med, 4(12), 95. doi:10.1186/gm396

YarchoanM, Johnson BA3rd, Lutz ER, Laheru DA, Jaffee EM. (2017). Targeting neoantigens toaugment antitumour immunity. Nat Rev Cancer, 17(9), 569.doi:10.1038/nrc.2017.74

【符号の説明】

【0217】

図１
protein sequence with mutated aa 変異アミノ酸を有するタンパク質配列
mutated aa 変異アミノ酸
Neoantigen 新生抗原
mer 量体
aa アミノ酸
protein sequence with two closeby mutated aa ２つの近傍の変異アミノ酸を有するタンパク質配列
protein sequence with mutated aa close to C-terminus Ｃ末端に近い変異アミノ酸を有するタンパク質配列

図２Ａ
Add maximal 12 wt aa at N-terminus Ｎ末端に最大１２ｗｔアミノ酸を付加する
max 12 wt aa 最大１２ｗｔアミノ酸
If mutated aa is present include 変異アミノ酸が存在する場合に含む
Split into 9mer fragments ９量体フラグメントに分割する
mer 量体
Perform MHC class I predictions (9mer epitopes) ＭＨＣクラスＩ予測（９量体エピトープ）を行う
For each 9mer fragment select best IC50 value (lowest value) 各９量体フラグメントについて、最良のＩＣ５０値（最低値）を選択する

図２Ｂ
Expand 9mer fragments into longer neoantigens (max 25aa) ９量体フラグメントをより長い新生抗原（最大２５アミノ酸）に伸長する
max 12 wt aa 最大１２ｗｔアミノ酸
aa アミノ酸
mer 量体
List of FSP-derived neoantigens with associated IC50 関連するＩＣ５０を有するＦＳＰ由来の新生抗原のリスト

図３
Rank neoantigens according to mutant allele Frequency 変異誘発遺伝子頻度により新生抗原をランク付けする
Rank neoantigens according to corrTPM ｃｏｒｒＴＰＭにより新生抗原をランク付けする
Rank neoantigens according to MHC I binding prediction (IC50) ＭＨＣＩ結合予測（ＩＣ５０）により新生抗原をランク付けする
Rank neoantigens by weighted sum of ranks ランクの加重和により新生抗原をランク付けする
Final rank 最終的なランク

図４
Final ranked list of SNV and FSP neoantigens ＳＮＶ新生抗原およびＦＳＰ新生抗原の最終的なランク付けされたリスト
Pos 位置
mer 量体
merge マージ
Updated final ranked list of SNV and FSP neoantigens ＳＮＶ新生抗原およびＦＳＰ新生抗原の更新された最終的なランク付けされたリスト

図５
Updated final ranked list of SNV and FSP neoantigens ＳＮＶ新生抗原およびＦＳＰ新生抗原の更新された最終的なランク付けされたリスト
Pos 位置
mer 量体
Step 工程
Group 群
Step 1: Select N neoantigens such that their total length in aa is smaller than the maximal insert size L of the vaccine vector 工程１：アミノ酸のそれらの全長がワクチンベクターの最大インサートサイズＬよりも小さくなるように、Ｎ個の新生抗原を選択する
Step 2: Split the list of N neoantigens into two groups with approximately equal total length in aa. Add neoantigens to group 1 until the total length ofthe T neoantigens is larger than L/2. The remaining (N-T) neoantigens are put into group2. 工程２：Ｎ個の新生抗原のリストを、アミノ酸の全長がほぼ等しい２つの群に分ける。Ｔ新生抗原の全長がＬ／２より長くなるまで、群１に新生抗原を追加する。残りの（Ｎ－Ｔ）新生抗原は、群２に入れられる。

図６
Merged FSP example マージしたＦＳＰの例
complete FSP 完全なＦＳＰ
merged FSP マージしたＦＳＰ
Pos 位置
Final Rank 最終ランク
SEQ ID NO 配列番号

図７Ａ
RSUM ranking of experimentally validate neoantigens (with patient's RNAseq) （患者のＲＮＡ配列を用いて）実験的に検証された新生抗原のＲＳＵＭランキング
Position in ranked NeoAg list ランク付けされた新生抗原リスト中の位置
Validated neoantigens 検証された新生抗原
Melanoma 黒色腫
Ovarian 卵巣
Rectal 直腸
Colon 結腸
Breast 乳房

図７Ｂ
RSUM ranking of experimentally validate neoantigens (without patient's RNAseq) （患者のＲＮＡ配列なしで）実験的に検証された新生抗原のＲＳＵＭランキング
Position in ranked NeoAg list ランク付けされた新生抗原リスト中の位置
Validated neoantigens 検証された新生抗原
Melanoma 黒色腫
Ovarian 卵巣
Rectal 直腸
Colon 結腸
Breast 乳房

図８
splenocytes 脾細胞
Pool プール

【図1】