(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-09-27
(54)【発明の名称】ネオペプチトープ含有ワクチン剤の製造方法
(51)【国際特許分類】
G16B 20/20 20190101AFI20230920BHJP
A61K 39/00 20060101ALI20230920BHJP
A61P 35/00 20060101ALI20230920BHJP
A61P 37/04 20060101ALI20230920BHJP
A61K 39/39 20060101ALI20230920BHJP
A61K 45/00 20060101ALI20230920BHJP
A61P 37/02 20060101ALI20230920BHJP
A61K 48/00 20060101ALI20230920BHJP
A61P 43/00 20060101ALI20230920BHJP
G06N 20/00 20190101ALI20230920BHJP
G06N 3/02 20060101ALI20230920BHJP
G01N 33/53 20060101ALI20230920BHJP
G01N 33/574 20060101ALI20230920BHJP
G16B 30/10 20190101ALI20230920BHJP
G16B 40/20 20190101ALI20230920BHJP
C12P 21/00 20060101ALN20230920BHJP
【FI】
G16B20/20
A61K39/00 H
A61P35/00
A61P37/04
A61K39/39
A61K45/00
A61P37/02
A61K48/00
A61P43/00 121
G06N20/00
G06N3/02
G01N33/53 M
G01N33/574 Z
G01N33/574 A
G16B30/10
G16B40/20
C12P21/00 C
【審査請求】未請求
【予備審査請求】有
(21)【出願番号】P 2023506016
(86)(22)【出願日】2021-07-30
(85)【翻訳文提出日】2023-03-22
(86)【国際出願番号】 EP2021071380
(87)【国際公開番号】W WO2022023521
(87)【国際公開日】2022-02-03
(32)【優先日】2020-07-30
(33)【優先権主張国・地域又は機関】EP
(32)【優先日】2021-01-27
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】521293464
【氏名又は名称】エヴァクシオン・バイオテック・アクティエセルスカブ
(74)【代理人】
【識別番号】100145403
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100122301
【氏名又は名称】冨田 憲史
(74)【代理人】
【識別番号】100157956
【氏名又は名称】稲井 史生
(74)【代理人】
【識別番号】100170520
【氏名又は名称】笹倉 真奈美
(74)【代理人】
【識別番号】100221545
【氏名又は名称】白江 雄介
(72)【発明者】
【氏名】トロレ,トーマス
(72)【発明者】
【氏名】ガーゼ,クリスチャン
(72)【発明者】
【氏名】クラウセン,ミケール シュランツ
(72)【発明者】
【氏名】クリンゲルム,イェンス
【テーマコード(参考)】
4B064
4C084
4C085
【Fターム(参考)】
4B064AG31
4B064CA19
4B064CC24
4B064DA01
4C084AA13
4C084AA22
4C084MA02
4C084NA05
4C084NA14
4C084ZB07
4C084ZB09
4C084ZB26
4C084ZC75
4C085AA03
4C085BB01
4C085DD62
4C085DD90
4C085EE03
4C085EE06
4C085FF24
(57)【要約】
本発明は、悪性新生物を標的とする能動免疫療法に有用なネオエピトープを同定するための改良方法を示す。本方法は、発現産物の体細胞変異の同定を、かかるバリアントの1)MHCに結合する能力、2)免疫応答を誘導する能力、3)腫瘍組織におけるクローンカバレッジおよび4)免疫応答を回避する能力についてのバランスのとれた評価により構成される。また本方法は、正常細胞に対して望ましくない免疫応答を誘導する可能性のあるネオエピトープを意図的に選択から外す方法により補完される。また、免疫原性組成物の製造方法、がんの治療方法ならびにネオエピトープおよびネオペプチドを同定するためのコンピューターシステムも開示されている。
【特許請求の範囲】
【請求項1】
個体の悪性新生物から得られる1セットの固有のアミノ酸改変ヌクレオチド変異を同定する方法であって、
a) 個体の悪性新生物細胞および正常細胞由来の遺伝子配列情報を、少なくとも2つの固有の変異コーリングモデルに入力し、結果として、各配列情報から、1セットの同定されたヌクレオチド変異およびその同定されたヌクレオチド変異に関連する少なくとも1つの第1の特徴が作成され、所望により、該遺伝子情報から作成された少なくとも1つの第2の特徴を、各々同定されたヌクレオチド変異に追加する工程(ここで、各々少なくとも1つの第2の特徴を、必要に応じて値≧0および≦1に変換して、各々同定されたヌクレオチド変異についての値≧0および≦1を、検証された変異ヌクレオチド配列を用いて訓練された人工ニューラルネットワークなどの機械学習モデルに渡して、各々同定された変異ヌクレオチドについて、それが悪性新生物に特異的なヌクレオチド変異である確率が計算される);または
b) 個体の悪性新生物細胞および正常細胞由来の遺伝子配列情報を、人工ニューラルネットワークなどの機械学習モデルに入力する工程(ここで、該機械学習モデルは、検証された変異ヌクレオチド配列を用いて訓練され、この機械学習モデルが、各々同定された変異ヌクレオチドについて、それが悪性新生物に特異的なヌクレオチド変異である確率が計算される)
のいずれかの工程;ならびに
該機械学習モデルから、悪性新生物に特異的な固有のヌクレオチド変異のセットを出力する工程、
を含む、方法。
【請求項2】
該セット内の悪性新生物に特異的な出力された固有のヌクレオチド変異は、
-計算された確率に対して優先順位が付けられ;および/または
-それらの各々計算された確率と共にペアが形成され;および/または
-全てが、閾値(例えば、0.5(50%)の閾値)を超える計算された確率を有する、請求項1に記載の方法。
【請求項3】
少なくとも1つの第1および/または第2の特徴が、腫瘍バリアントカバレッジ、正常バリアントカバレッジ、腫瘍バリアントアレル頻度、正常バリアントアレル頻度、腫瘍リードマッピング品質、正常リードマッピング品質、腫瘍塩基品質および正常塩基品質からなる群から選択される、請求項1または2の方法。
【請求項4】
悪性新生物に特異的な固有のヌクレオチド変異のセットにおいて各ヌクレオチド変異が、クローン状態について評価される、請求項1~3のいずれか1項に記載の方法。
【請求項5】
クローン確率を利用して、悪性腫瘍細胞の大部分に存在する悪性新生物に特異的な固有のヌクレオチド変異を優位に含むように、リストの優先順位付けを行う、請求項4に記載の方法。
【請求項6】
推定免疫原性ネオペプチドを構成する少なくとも1つのアミノ酸配列を同定する方法であって、該方法は、請求項1~5のいずれか1項に記載の固有のアミノ酸改変ヌクレオチド変異のセットを同定する工程、その後、悪性新生物由来のタンパク質性発現産物の部分配列であって、該セットの少なくとも1つの固有のアミノ酸改変ヌクレオチド変異を含む核酸配列によりコードされている推定ネオペプチドアミノ酸配列を作成する工程、個体におけるMHCリガンドの存在について該推定ネオペプチドを分析する工程(ここで、該MHCリガンドは、該セットの少なくとも1つの固有のアミノ酸改変ヌクレオチド変異を含むヌクレオチドトリプレットによってコードされるアミノ酸残基を、それらの各アミノ酸配列に含んでいなければならない)、ならびに該MHCリガンドの存在について分析した結果が陽性であれば、各推定ネオペプチドを推定免疫原性ネオペプチドとして同定する工程、
を含む、方法。
【請求項7】
MHCリガンドの存在について分析することは、MHC結合の予測をタンパク質様発現産物の発現レベルスコアと統合することを含む、請求項6に記載の方法。
【請求項8】
発現レベルスコアが、RNA発現レベルから計算される、請求項7に記載の方法。
【請求項9】
RNA発現レベルが、アミノ酸改変ヌクレオチド変異のRNA発現レベルである、請求項8に記載の方法。
【請求項10】
発現レベルスコアが、ゲノム/トランスクリプトーム位置ごとに計算されるか、または発現レベルスコアが、VAF
RNA/VAF
DNA比(ここで、VAFは、該セットの固有のアミノ酸改変ヌクレオチド変異の少なくとも1つを含んでいる核酸配列を含むバリアントアレルの頻度を表す)を調整することにより修正される、請求項7~9のいずれか1項に記載の方法。
【請求項11】
推定免疫原性ネオペプチドの免疫原性を決定することをさらに含む、請求項6~9のいずれか1項に記載の方法。
【請求項12】
免疫原性の決定が、1つ以上の以下の評価:
-推定免疫原性ネオペプチドが、ペプチド-MHC複合体の一部である場合のT細胞受容体結合アミノ酸残基の存在の評価;
-MHCおよび推定免疫原性ネオペプチドとの複合体の安定性の評価;
-推定免疫原性ネオペプチドおよび個体の自己ペプチドの類似性の評価;
-MHCおよび推定免疫原性ネオペプチドの複合体とMHCおよび個体の自己ペプチドの複合体との間の類似性の評価;ならびに
-免疫原性に影響を与える別の配列の特徴をアンロックする畳み込みニューラルネットワークアーキテクチャによる評価、
を含む、請求項11に記載の方法。
【請求項13】
各推定免疫原性ネオペプチドが、免疫回避に対するそのレジリエンスについてさらに評価される、請求項6~12のいずれか1項に記載の方法。
【請求項14】
レジリエンスの評価は、推定免疫原性ネオペプチドが、発がん性ドライバー変異から生じるのかどうか、および/または推定免疫原性ネオペプチドが、細胞生存に必須の発現産物に存在するのかどうか、および/または推定免疫原性ネオペプチドが、腫瘍により消失または抑制されるHLAとだけに結合するのかどうかについての決定を含む、請求項13に記載の方法。
【請求項15】
患者に投与しても安全なネオエピトープ含有ペプチドを同定する方法であって、各ネオエピトープは、少なくとも1つのアミノ酸改変ヌクレオチド変異を含むヌクレオチド配列によってコードされており、該方法は、参照配列の任意のアミノ酸配列の存在について患者の正常細胞からの発現産物またはプロテオームを試験することを含んでおり、
-該アミノ酸配列は、患者由来のタンパク質発現産物中に存在し、かつネオエピトープを含んでおり;
-該アミノ酸配列は、少なくとも7個のアミノ酸残基の長さを有しており;
-該アミノ酸配列は、少なくとも7個のアミノ酸残基のうちの1つとして、少なくとも1つのアミノ酸改変ヌクレオチド変異によって変更されたアミノ酸を含んでおり;ならびに
-試験が陰性である場合に、ネオエピトープを投与しても安全であると同定する、
方法。
【請求項16】
ネオエピトープを含む免疫原性ネオペプチド組成物または該免疫原性ネオペプチドをコードする核酸組成物を決定する方法であって、該免疫原性ネオペプチドが悪性新生物から得られる場合、この方法は、1セットの推定免疫原性ネオペプチドの各々に、A、B、C、DおよびEの少なくとも2つの積として規定される確率スコアを割り当てることを特徴としており、各々A、B、C、DおよびEは、確率スコア≧0および≦1であって、
Aは、推定免疫原性ネオペプチドのアミノ酸配列が、請求項1~3のいずれか1項により規定された通りの悪性新生物に特異的な固有のアミノ酸改変ヌクレオチド変異を含むヌクレオチド配列によってコードされるアミノ酸を含む確率であり;
Bは、推定免疫原性ネオペプチドのアミノ酸配列が、請求項4または5において決定された通りの悪性新生物の全ての細胞に存在する固有のアミノ酸改変ヌクレオチド変異を含むヌクレオチド配列によってコードされるアミノ酸を含む確率であり;
Cは、推定免疫原性ネオペプチドが、請求項6~10のいずれか1項において決定された通りの悪性新生物が得られた個体においてMHCのリガンドを含む確率であり;
Dは、ネオペプチドが、請求項11~12のいずれか1項において決定された通りの悪性新生物が得られた個体において免疫原性である確率であり;および
Eは、ネオペプチドが、請求項13~14のいずれか1項において決定された通りの免疫回避に対してレジリエンスである確率であり、
該積が所定の閾値を超えない任意のネオペプチドまたは核酸を組成物から除外することにより(例えば、積が0.5を超えないペプチドを除外することにより)、その組成物を決定することを含む、方法。
【請求項17】
A、B、C、DおよびEの少なくとも2つの積が、以下:
AおよびB;
AおよびC;
AおよびD;
AおよびE;
BおよびC;
BおよびD;
BおよびE;
CおよびD;
CおよびE;
DおよびE;
AおよびBおよびC;
AおよびBおよびD;
AおよびBおよびE;
AおよびCおよびD;
AおよびCおよびE;
AおよびDおよびE;
BおよびCおよびD;
BおよびCおよびE;
BおよびDおよびE;
CおよびDおよびE;
AおよびBおよびCおよびD;
AおよびBおよびCおよびE;
AおよびBおよびDおよびE;
AおよびCおよびDおよびE;
BおよびCおよびDおよびE;ならびに
AおよびBおよびCおよびDおよびE
の積の群から選択される、請求項16に記載の方法。
【請求項18】
組成物中のネオペプチドは、以下:
-確率スコアが上位50位以内であるもの;および/または
-確率スコアが上位50%以内であるもの、
である、請求項16または17に記載の方法。
【請求項19】
請求項14に記載の方法によって投与しても安全であると同定されたペプチドのみが、組成物に含まれることをさらに特徴とする、請求項16~18のいずれか1項に記載の方法。
【請求項20】
悪性新生物の罹患患者に対して個別化した免疫原性組成物の製造方法であって、
患者の悪性細胞由来のDNAおよびRNAならびに正常細胞由来の少なくともDNAを配列決定して、該悪性細胞から得られたネオエピトープを含む1セットのネオペプチドを同定した後、医薬的に許容できる担体または希釈剤を、下記のもの:
1)該セットからのネオペプチドを含む少なくとも1つの融合タンパク質;但し、請求項15に記載の方法によって評価された場合に、投与しても安全ではないネオペプチドはセットから除外されている;
2)該セットからの複数のネオペプチド;但し、請求項15に記載の方法によって評価された場合に、投与しても安全ではないネオペプチドはセットから除外されている;または
3)1)の少なくとも1つの融合構築体または2)の複数のネオペプチドをコードする少なくとも1つの核酸、
と共に混合することにより免疫原性組成物を製造することを特徴とする、方法。
【請求項21】
悪性新生物の罹患患者に対して個別化した免疫原性組成物の製造方法であって、
患者の悪性細胞由来のDNAおよびRNAならびに正常細胞由来の少なくともDNAを配列決定して、該悪性細胞から得られたネオエピトープを含む1セットのネオペプチドを同定した後、医薬的に許容される担体または希釈剤を、以下のもの:
i)該セットからのネオペプチドを含む少なくとも1つの融合タンパク質;但し、請求項16~19のいずれか1項に記載の方法により決定された組成物の一部に存在しない該セットからのネオペプチドは除外されている;
ii)請求項16~19のいずれか1項に従って決定された組成物の一部に存在しない該セットからの複数のネオペプチド;または
iii)i)の少なくとも1つの融合構築体またはii)の複数のネオペプチドをコードする少なくとも1つの核酸、
と共に混合することにより免疫原性組成物を製造することを特徴とする、方法。
【請求項22】
免疫学的アジュバントまたは免疫調節剤と混合することをさらに含む、請求項21または21に記載の方法。
【請求項23】
悪性新生物疾患に罹患している患者を治療する方法であって、請求項20~22のいずれか1項に従って製造された免疫原性組成物の有効量を投与することを含む、方法。
【請求項24】
a)核酸配列を入力するための手段および核酸配列を保存するための手段;
b)aで入力された各核酸配列に対する修飾子を入力する手段および保存する手段であって、該修飾子は、入力された核酸配列が、悪性細胞または非悪性細胞のいずれを起源とするのかを示す;
c)aの手段により入力および保存され、悪性細胞起源を示す修飾子を有する核酸配列によりコードされる発現産物のアミノ酸配列を作成および保存するように適合された実行可能コード;
d)aの手段により入力および保存され、非悪性細胞起源を示す修飾子を有する核酸配列によりコードされる発現産物のアミノ酸配列を作成および保存するように適合された実行可能コード;
e)cの実行可能コードにより作成および保存された配列の一部であるか、またはその配列を構成するアミノ酸配列ならびにdの実行可能コードにより作成および保存された配列の一部ではないか、またはその配列を構成しないアミノ酸配列を同定するように適合された実行可能コード;
f)eの実行可能コードにより同定された各アミノ酸配列をタグ付けおよび/または保存するための実行可能コードであって、これはdの実行可能コードにより作成および保存された配列中に存在する最も類似するアミノ酸配列(複数可)と比較して、変更されたアミノ酸残基を同定する情報をタグ付けおよび/または保存することを含む;
g)fの実行可能コードによりタグ付けまたは保存された各アミノ酸配列について、cの実行可能コードによって入力および保存されたアミノ酸配列であって、
-全て同じ長さXを持ち、Xは整数≧7であり;
-fの実行可能コードによってタグ付けおよび/または保存されたアミノ酸配列と各々重複しており;および
-fに情報がタグ付けおよび/または保存された変更したアミノ酸残基を各々含むアミノ酸配列を、d)の実行可能コードによって入力および保存されたアミノ酸配列と網羅的に比較する実行可能コード;
h)fの実行可能コードによりタグ付けおよび/または保存されたアミノ酸配列を出力および/または保存するための実行可能コードであるが、一方でgの実行可能コードにより少なくとも1つの陽性の比較結果に至るアミノ酸配列は除外されることを含む実行可能コード、
を含む、コンピューターまたはコンピューターシステム。
【請求項25】
a)核酸配列を入力するための手段および核酸配列を保存するための手段;
b)aで入力された各核酸配列に対する修飾子を入力する手段および保存する手段であって、該修飾子は、入力された核酸配列が、悪性細胞または非悪性細胞のいずれを起源とするのかを示す;
c)aの手段により入力および保存され、悪性細胞起源を示す修飾子を有する核酸配列によりコードされる発現産物のアミノ酸配列を作成および保存するように適合された実行可能コード;
d)aの手段により入力および保存され、非悪性細胞起源を示す修飾子を有する核酸配列によりコードされる発現産物のアミノ酸配列を作成および保存するように適合された実行可能コード;
e)cの実行可能コードにより作成および保存された配列の一部であるか、またはその配列を構成するアミノ酸配列ならびにdの実行可能コードにより作成および保存された配列の一部ではないか、またはその配列を構成しないアミノ酸配列を同定するように適合された実行可能コード;
f)eの実行可能コードにより同定された各アミノ酸配列をタグ付けおよび/または保存するための実行可能コードであって、これはdの実行可能コードにより作成および保存された配列中に存在する最も類似するアミノ酸配列(複数可)と比較して、変更されたアミノ酸残基を同定する情報をタグ付けおよび/または保存することを含む;
g)fの実行可能コードによりタグ付けまたは保存された各アミノ酸配列について、cの実行可能コードによって入力および保存されたアミノ酸配列であって、
-全て同じ長さXを持ち、Xは整数≧7であり;
-fの実行可能コードによってタグ付けおよび/または保存されたアミノ酸配列と各々重複しており;および
-fに情報がタグ付けおよび/または保存された変更したアミノ酸残基を各々含むアミノ酸配列を、d)の実行可能コードによって入力および保存されたアミノ酸配列と網羅的に比較する実行可能コード;
h)fの実行可能コードによりタグ付けおよび/または保存されたアミノ酸配列を出力および/または保存するための実行可能コードであるが、一方でgの実行可能コードにより少なくとも1つの陽性の比較結果に至るアミノ酸配列が除外されることを含む実行可能コード、
を含む、コンピューターまたはコンピューターシステム。
【発明の詳細な説明】
【技術分野】
【0001】
(発明の技術分野)
本発明は、がん免疫療法の分野に関する。特に、本発明は、患者の悪性細胞からの発現産物であるネオエピトープを標的とする抗がんワクチンを設計および製造するための改良手段および方法に関する。
【背景技術】
【0002】
(発明の背景)
患者の悪性新生物の治療は、従来、手術、放射線治療および/または非悪性細胞の殺傷よりも悪性細胞を優先して殺傷することを目的とした投薬レジメンにおける細胞障害性薬剤を用いた化学療法によって悪性組織の根絶/除去に重点が置かれてきた。
【0003】
さらに最近のアプローチとしては、細胞障害性薬剤の使用に加えて、従来の化学療法による全身への副作用を軽減するために、がん細胞内の特異的な生物学的マーカーを標的とするアプローチに重点を置かれている。がん関連抗原を標的としたモノクローナル抗体療法は、多くの悪性腫瘍において、平均余命の延長に極めて有効であることが証明されている。成功した薬剤ではあるが、がん関連抗原を標的とするモノクローナル抗体は、その性質上、既知の発現産物であり、かつ複数の患者に見られる発現産物を標的とするようにしか開発することができない。つまり、多くのがん特異的抗原は、1人の患者の腫瘍にしか現れないため(下記を参照されたい)、がん特異的抗原の大多数はこの種の治療法では対処できないことを意味する。
【0004】
早くも1950年代後半には免疫監視説が提唱され、リンパ球は、抗原決定基が変異した自己細胞-がん細胞を含む-を認識して、排除することが示唆されており、現在では免疫系が、がんの発生を高度に阻害することが一般に認められている。しかし、免疫監視効果は100%有効ではなく、がん細胞を根絶する免疫系の能力を改善する/刺激するような、がん治療法を開発することは継続的な課題である。
【0005】
一つの方法としては、がん関連抗原に対する免疫を誘導することであり、この方法は発展性があるにもかかわらず、限られた数の抗原にしか対応できないという抗体療法と同様の欠点を負っている。
【0006】
全てでは無いが、多くの腫瘍は変異を発現している。これらの変異は、新しい標的抗原(ネオ抗原)を作り出す可能性があり、臨床的に適切な時間内にネオ抗原およびその抗原決定基(ネオエピトープ)を特定することができれば、ネオ抗原は、特異的なT細胞免疫療法において有効である可能性がある。現在の技術を用いれば、細胞のゲノムを完全に配列決定し、変更した発現産物または新しい発現産物の存在を解析することが可能であるため、ネオ抗原およびそのネオエピトープに基づいて個別化ワクチンを設計することが可能である。
【0007】
そのため、ネオエピトープを患者由来の配列データから予測/同定するための複数のバイオインフォマティックパイプラインが存在する(Hundal, J. et al. 2016; Bjerregaard, A. M. et al. 2017; Bais, P. et al. 2017; Rubinsteyn, A. et al. 2017; Schenck, R. O. et al. 2019を参照されたい)。各パイプラインは、ネオエピトープを選択または分類する場合に異なる特徴のセットを考慮するため、このネオエピトープの選択課題が依然として未解決であることを明示している。
【発明の詳細な説明】
【0008】
(発明の目的)
本発明の実施態様の目的は、能動免疫療法により標的とされ得るがん患者における免疫原性エピトープを選択するための改良方法よび手段を提供することである。
【0009】
(発明の概要)
本発明は、ネオエピトープの有効性について重要な特徴を同定するためには、細胞内の関連する基礎的なメカニズムを理解する必要があるという発明者らによる観察に基づくものである。
【0010】
細胞は、そのゲノムに体細胞変異を蓄積して、制御不能な増殖を引き起こすことによりがん化する。これらの変異は、腫瘍細胞に特異的であるため、特に免疫療法にとって魅力的な標的である。体細胞変異の正確な同定は、ネオエピトープの同定において重要な工程である。体細胞変異コーリングを誤ると、i)腫瘍細胞には存在しないペプチド配列が選択されるか、またはii)正常細胞にも存在するペプチド配列が選択される可能性がある。
【0011】
発現した遺伝子中の体細胞変異は、腫瘍特異抗原に転写および翻訳される。
【0012】
これらの抗原は、抗原提示経路によって処理され、腫瘍細胞表面上のMHC分子によってリガンドとして提示されるネオエピトープが作られる。細胞表面上のMHCによるネオエピトープの提示は、T細胞応答を誘起するための必須条件である。MHCの結合および提示は、抗原提示における最も制限的な工程の一つであるため、ネオエピトープの有効性にとって必須の特徴である。
【0013】
MHC提示は、免疫応答を惹起するために必要であるが、それ自体では十分でない。抗腫瘍効果を誘導するためには、ネオエピトープ由来のMHCリガンドは、免疫原性でなければならない(例えば、細胞傷害性CD8+T細胞によって認識されるなど)。
【0014】
腫瘍は、極めて不均一であって、かつクローン変異を示す。つまり、異なる腫瘍のサブセットのがん細胞は、必ずしも同じ体細胞遺伝子変異のセットを含んでいるとは限らないことを意味する。全ての腫瘍細胞に存在する体細胞変異は「クローン性」と定義され、それ以外の変異は「サブクローン性」である。この結果、サブクローンから生じるネオエピトープは、腫瘍細胞のサブセットにのみ存在することになる。クローン性のネオエピトープを標的とすることにより、腫瘍細胞の一部のみを標的とするのではなく、活性化したT細胞が腫瘍を完全に除去できるという臨床的利点がある。
【0015】
ネオエピトープ治療によって生じる免疫圧のために、腫瘍細胞は発現したネオエピトープを回避するように「学習」する正の選択がある。これに対抗するために、必須遺伝子または発がん性ドライバーのいずれかに見られるネオエピトープを優先させることができる。これにより、ネオエピトープを持つ遺伝子をダウンレギュレートしようとする腫瘍細胞は、生存できないか、悪性化しないことが確実となる。
【0016】
そこで、第1の態様において、本発明は、個体の悪性新生物から得られる1セットの固有のアミノ酸改変ヌクレオチド変異を同定する方法に関し、この方法は、
a) 個体の悪性新生物細胞および正常細胞由来の遺伝子配列情報を、少なくとも2つの固有の変異コーリングモデルに入力し、結果として、各配列情報から、1セットの同定されたヌクレオチド変異およびその同定されたヌクレオチド変異に関連する少なくとも1つの第1の特徴が作成され、所望により、前記遺伝子情報から作成された少なくとも1つの第2の特徴を、各々同定されたヌクレオチド変異に追加する工程(ここで、各々少なくとも1つの第2の特徴を、必要に応じて値≧0および≦1に変換して、各々同定されたヌクレオチド変異についての値≧0および≦1を、検証された変異ヌクレオチド配列を用いて訓練された人工ニューラルネットワークなどの機械学習モデルに渡して、各々同定された変異ヌクレオチドについて、それが悪性新生物に特異的なヌクレオチド変異である確率が計算される);または
b) 個体の悪性新生物細胞および正常細胞由来の遺伝子配列情報を、人工ニューラルネットワークなどの機械学習モデルに入力する工程(ここで、前記機械学習モデルは、検証された変異ヌクレオチド配列を用いて訓練され、この機械学習モデルが、各々同定された変異ヌクレオチドについて、それが悪性新生物に特異的なヌクレオチド変異である確率が計算される)
のいずれかの工程;ならびに
前記機械学習モデルから、悪性新生物に特異的な固有のヌクレオチド変異のセットを出力する工程、を含む。
【0017】
第2の態様において、本発明は、推定免疫原性ネオペプチドを構成する少なくとも1つのアミノ酸配列を同定する方法に関し、この方法は、第1の態様にしたがって、固有のアミノ酸改変ヌクレオチド変異のセットを同定すること、その後、悪性新生物由来のタンパク質様の発現産物の部分配列であって、前記セットの少なくとも1つの固有のアミノ酸改変ヌクレオチド変異を含む核酸配列によりコードされている推定ネオペプチドアミノ酸配列を作成すること、個体におけるMHCリガンドの存在について前記推定ネオペプチドを分析すること(前記MHCリガンドは、前記セットの少なくとも1つの固有のアミノ酸改変ヌクレオチド変異を含むヌクレオチドトリプレットによってコードされるアミノ酸残基を、それらの各アミノ酸配列に含んでいなければならない)、ならびに前記MHCリガンドの存在について分析した結果が陽性であれば、各推定ネオペプチドを推定免疫原性ネオペプチドとして同定することを含む。
【0018】
第3の態様において、本発明は、患者に投与しても安全なネオエピトープ含有ペプチドを同定する方法に関し、各ネオエピトープは、少なくとも1つのアミノ酸改変ヌクレオチド変異を含むヌクレオチド配列によってコードされており、前記方法は、参照配列の任意のアミノ酸配列の存在について、患者の正常細胞由来の発現産物またはプロテオームを試験することを含んでおり、
-前記アミノ酸配列は、患者由来のタンパク質様発現産物中に存在し、かつネオエピトープを含んでおり;
-前記アミノ酸配列は、少なくとも7個のアミノ酸残基の長さを有しており(実際の上限は、MHCクラスIの目的のためには11個のアミノ酸残基であり、クラスIIのための上限は約20個のアミノ酸である);
-前記アミノ酸配列は、少なくとも7個のアミノ酸残基のうちの1つとして、少なくとも1つのアミノ酸改変変異により変更されたアミノ酸を含んでおり;および
-試験が陰性である場合に、ネオエピトープを投与しても安全であると同定する。
【0019】
第4の態様において、本発明は、ネオエピトープを含む免疫原性ネオペプチド組成物または前記免疫原性ネオペプチドをコードする核酸組成物を決定する方法に関し、前記免疫原性ネオペプチドが悪性新生物から得られる場合、この方法は、1セットの推定免疫原性ネオペプチドの各々に、A、B、C、DおよびEの少なくとも2つの積として規定される確率スコアを割り当てることを特徴としており、各々A、B、C、DおよびEは、確率スコア≧0および≦1であって、
Aは、推定免疫原性ネオペプチドのアミノ酸配列が、本発明の第1の態様において同定された通りの悪性新生物に特異的な固有のアミノ酸改変ヌクレオチド変異を含むヌクレオチド配列によってコードされるアミノ酸を含む確率であり;
Bは、推定免疫原性ネオペプチドのアミノ酸配列が、第1の態様において決定された通りの悪性新生物の全ての細胞に存在する固有のアミノ酸改変ヌクレオチド変異を含むヌクレオチド配列によってコードされるアミノ酸を含む確率であり;
Cは、推定免疫原性ネオペプチドが、第2の態様において決定された通りの悪性新生物が得られた個体においてMHCのリガンドを含んでいる確率であり;
Dは、ネオペプチドが、第2の態様において決定された通りの悪性新生物が得られた個体において免疫原性である確率であり;および
Eは、ネオペプチドが、第2の態様において決定された通りの免疫回避に対してレジリエンスである確率であって、
前記積が所定の閾値を超えない任意のネオペプチドまたは核酸を組成物から除外することにより(例えば、積が0.5を超えないペプチドを除外することにより)、その組成物を決定する。
【0020】
第5の態様において、本発明は、悪性新生物の罹患患者に対して個別化した免疫原性組成物を製造する方法に関し、この方法は、患者の悪性細胞由来のDNAおよびRNAならびに正常細胞由来の少なくともDNAを配列決定して、悪性細胞から得られたネオエピトープを含む1セットのネオペプチドを同定した後、医薬的に許容できる担体または希釈剤を、下記のもの:
1) 前記セットからのネオペプチドを含む少なくとも1つの融合タンパク質;但し、第3の態様の方法によって評価された場合に、投与しても安全ではないネオペプチドは前記セットから除外されている;
2) 前記セットからの複数のネオペプチド;但し、第3の態様の方法によって評価された場合に、投与しても安全ではないネオペプチドは前記セットから除外されている;または
3) 1)の少なくとも1つの融合構築体または2)の複数のネオペプチドをコードしている少なくとも1つの核酸、
と共に混合することより免疫原性組成物を製造することを特徴とする、方法。
【0021】
第6の態様において、本発明は、悪性新生物の罹患患者に対して個別化した免疫原性組成物を製造する方法に関し、この方法は、患者の悪性細胞由来のDNAおよび/またはRNAならびに正常細胞由来の少なくともDNAを配列決定して、悪性細胞から得られたネオエピトープを含む1セットのネオペプチドを同定した後、医薬的に許容できる担体または希釈剤を、以下のもの:
i) 前記セットからのネオペプチドを含む少なくとも1つの融合タンパク質;但し、第5の態様に従って決定された組成物の一部ではないネオペプチドは前記セットから除外されている;
ii) 第5の態様に従って決定された組成物の一部ではない、前記セットからの複数のネオペプチド;または
iii) i)の少なくとも1つの融合構築体またはii)の複数のネオペプチドをコードしている少なくとも1つの核酸、
と共に混合することにより免疫原性組成物を製造することを特徴とする、方法。
【0022】
第7の態様において、本発明は、悪性新生物疾患に罹患している患者を治療するための方法に関し、この方法は、本発明の第6の態様の方法に従って製造された免疫原性組成物の有効量を投与することを特徴とする。
【0023】
第8の態様では、本発明は、
a) 核酸配列を入力するための手段および核酸配列を保存するための手段;
b) aで入力された各核酸配列に対する修飾子を入力する手段および保存するための手段であって、前記修飾子は、入力された核酸配列が悪性細胞または非悪性細胞のいずれを起源とするのかを示す;
c) aの手段により入力および保存され、悪性細胞由来であることを示す修飾子を有する核酸配列によってコードされる発現産物のアミノ酸配列を作成および保存するように適合された実行可能コード;
d) aの手段により入力および保存され、非悪性細胞由来であることを示す修飾子を有する核酸配列によってコードされる発現産物のアミノ酸配列を作成および保存するように適合された実行可能コード;
e) cの実行可能コードにより作成および保存された配列の一部であるか、またはその配列を構成するアミノ酸配列、ならびにdの実行可能コードにより作成および保存された配列の一部ではないか、またはその配列を構成しないアミノ酸配列を同定するように適合された実行可能コード;
f) eの実行可能コードにより同定された各アミノ酸配列をタグ付けおよび/または保存するための実行可能コード、これはdの実行可能コードにより作成および保存された配列中に存在する最も類似したアミノ酸配列(複数可)と比較して、変更されたアミノ酸残基を同定する情報をタグ付けおよび/または保存することを含む;
g) fの実行可能コードによりタグ付けまたは保存された各アミノ酸配列について、cの実行可能コードにより入力および保存されたアミノ酸配列であって、
-全て同じ長さXを持ち、Xは整数≧7であり;
-fの実行可能コードによってタグ付けおよび/または保存されたアミノ酸配列と各々重複しており;ならびに
-fに情報がタグ付けおよび/または保存された変更したアミノ酸残基を各々含んでいるアミノ酸配列を、
dの実行可能コードにより入力および保存されたアミノ酸配列と網羅的に比較する実行可能コード;
h) fの実行可能コードによりタグ付けまたは保存されたアミノ酸配列を出力および/または保存するが、gの実行可能コードにより少なくとも1つの陽性の比較結果に至るアミノ酸配列は除外されている実行可能コード、
含むコンピューターまたはコンピューターシステムに関する。
【図面の簡単な説明】
【0024】
【
図1】2つの最先端のバリアントコーラー(変異検出器)であるMutect2およびStrelkaによって検出される体細胞変異と本発明の体細胞変異コーリングモデルとの一致点を示すベン図である。データ出典:(Shi, W. et al. 2018). 左:ケース3 biorep A. 右:ケース5の biorep A.。
【
図2】リガンドスコアと確率の変換関数を示すグラフである。
【
図3】体細胞変異検出のフィルタリングの例を示すグラフである。
【
図4】特徴量確率変換への重みの付けの例を示すグラフである。
【
図5】HLAリガンド尤度および変異アイソフォームの発現量との変換を説明する図である。
【
図6】1)本発明に従って評価されたネオエピトープ品質および2)ワクチン接種された悪性黒色腫患者が示す臨床応答との関係を示す箱ひげ図である。X軸上の5つのグループは、確率A~Dの全て(体細胞変異の確率、クローン率、MHCリガンド率および免疫原性率)に基づいた複合的なネオエピトープ品質評価に加えて個々の確率A~Dに基づくネオエピトープ品質評価を表している。
【
図7】本発明により評価される高品質のネオエピトープの頻度およびワクチン接種された悪性黒色腫患者における臨床反応との関係を示す箱ひげ図である。
【0025】
定義
「がん特異的」抗原とは、個体の非腫瘍体細胞において発現産物として現れないが、個体のがん細胞においては発現産物として現れる抗原である。これは、「がん関連」抗原とは異なるものであって、「がん関連」抗原とは、正常な体細胞にも低濃度で現れるが、少なくとも一部の腫瘍細胞には高濃度で見られる抗原のことである。
【0026】
「アジュバント」という用語は、ワクチン技術におけるその通常の意味を有する、すなわち、1)それ自体ではワクチンの免疫原に対する特異的な免疫応答を起こすことはできないが、2)免疫原に対する免疫応答を増強することができる物質または物質の組成物である。言い換えると、アジュバント単体でのワクチン接種では免疫原に対する免疫応答を引き起こさず、免疫原によるワクチン接種は免疫原に対する免疫応答を亢進し得るか、または亢進し得ない場合もあるが、免疫原とアジュバントを併用したワクチン接種は、免疫原に対して免疫原単独で誘導されるよりも強い免疫応答を誘導する。
【0027】
「ネオエピトープ」とは、ネオエピトープをコードする遺伝子の欠失によって、個体における通常の体細胞由来の発現産物として存在しないが、同一個体の変異した細胞(例えば、がん細胞)においては発現産物として存在する、抗原決定基(典型的には、MHCクラスIまたはII拘束性エピトープ)である。その結果、ネオエピトープは免疫学的な観点からみて、自己起源にも関わらず実際には非自己であるため、ネオエピトープが発現産物を構成する個体において、ネオエピトープは、がん特異的抗原として特徴づけられ得る。非自己であるため、ネオエピトープは、個体において特異的な適応免疫応答を引き起こし得る可能性があり、その際、誘発される免疫応答はネオエピトープを有する抗原および細胞に対して特異的である。一方、ネオエピトープは、同じネオエピトープが別の個体で発現産物となる可能性が最小であるため、個体に対して特異的である。このように、ネオエピトープは、例えば、がん特異的抗原のエピトープとは異なるいくつかの特徴がある:後者は、通常、同じ種類の複数のがんに見られること(活性化されたがん遺伝子からの発現産物である可能性があるため)、および/または、がん細胞における関連遺伝子の過剰発現によって、わずかな量ではあるが、非悪性細胞においても存在し得ること。
【0028】
「ネオペプチド」とは、それ自体の配列内に本文中で定義されるネオエピトープを含むペプチド(即ち、約50個のアミノ酸残基までのポリアミノ酸)である。ネオペプチドは、通常は「天然」である、即ち、そのネオペプチドのアミノ酸配列全体は、個体から単離され得る発現産物のフラグメントを構成するが、一方でネオペプチドはまた「人工的」でも有り得る、つまりネオエピトープの配列および少なくとも1つが前記ネオエピトープの配列と天然に関連していない1つまたは2つの付加アミノ酸配列によって構成されることを意味する。後者の場合において、付加アミノ酸配列は、単にネオエピトープの担体として働くか、またはさらにネオエピトープの免疫原性を向上させ得る(例えば、ネオペプチドの生物学的な半減期を改善するか、または可溶性を変える事で、抗原提示細胞によるネオペプチドの処理を促進する)。
【0029】
「アミノ酸配列」という用語は、ペプチドおよびタンパク質においてペプチド結合によって連結したアミノ酸残基の順序である。配列は、慣習的にN末端からC末端の方向に記載される。
【0030】
「免疫原性の担体」とは、免疫原/ハプテンに対する免疫応答の誘発を増強するか、または可能にするために、免疫原またはハプテンと結合し得る分子または部分である。免疫原性の担体は、典型的には、自身の権能では免疫原性が不十分な免疫原/ハプテンに融合またはコンジュゲートし得る比較的大きな分子(例えば、破傷風トキソイド、KLH、ジフテリアトキソイドなど)であって、この免疫原性の担体は、免疫原と免疫原性の担体によって構成される複合物質に対して強力なTヘルパーリンパ球の応答を誘発し得る、よってこれはBリンパ球および細胞傷害性リンパ球による免疫原に対して改良された応答を提供する。より最近では、大きな担体分子は、いわゆる無差別(promiscuous)Tヘルパーエピトープ、即ち、集団のHLAハプロタイプの大部分に認識され、かつTヘルパーリンパ球の応答を誘起する比較的短いペプチドに、ある程度は代替されている。
【0031】
「Tヘルパーリンパ球応答」とは、ペプチドによって誘発される免疫応答であって、ペプチドは、抗原提示細胞におけるMHCクラスII分子(例えば、HLAクラスII分子)に結合する事ができ、前記ペプチドおよび前記ペプチドを提示するMHCクラスII分子の複合体をT細胞受容体が認識する結果として、動物種においてTヘルパーリンパ球を刺激する。
【0032】
「免疫原」は、宿主の免疫系が免疫原に直面している宿主において、適応免疫応答を誘導し得る物質である。このように、免疫原は、より大きな「抗原」族のサブセットであって、免疫系によって特異的に認識され得る(例えば、抗体に結合される場合、またはMHC分子に結合した抗原のフラグメントが、T細胞受容体に認識される場合)物質であるが、免疫応答を誘導できる必要はない、しかし抗原は常に免疫を誘発し得る、つまり抗原に対しての確立した免疫記憶を有する宿主は、前記抗原に対して特異的な免疫応答を起こすことになる。
【0033】
「ハプテン」とは、免疫応答を誘導および誘発できないが、免疫原性の担体とコンジュゲートすると、前記ハプテンを認識する抗体またはTCRが、免疫系とハプテン担体コンジュゲートとの接触によって誘導され得る小分子である。
【0034】
「適応免疫応答」とは、抗原または免疫原との接触に対応した免疫応答であって、免疫応答は、抗原/免疫原の抗原決定基に特異的である。適応免疫応答の例は、抗原特異的抗体生産の誘導またはTヘルパーリンパ球または細胞傷害性リンパ球の抗原特異的な誘導/活性化である。
【0035】
「防御的、適応免疫応答」とは、抗原による免疫(人工的または自然)への反応として対象内で誘導される抗原特異的免疫応答であって、前記免疫応答は、抗原または抗原を含む病理関連剤のその後のチャレンジから対象を防御することができる。典型的には、予防的ワクチン接種は、1つまたはいくつかの病原に対する防御的適応免疫応答を確立することを目的とする。
【0036】
「免疫系の刺激」とは、物質または物質の組成物が一般的で非特異的な免疫刺激作用を示すことを意味する。多くのアジュバントおよび推定アジュバント(例えば、特定のサイトカイン)は、免疫系を刺激する能力を共有する。免疫刺激剤を使用した結果として、免疫系の「覚醒度(alertness)」が高まり、免疫原を単独で使用した場合と比較して、同時またはその後の免疫原による免疫が、顕著に、より効果的な免疫応答を誘導する。
【0037】
「ポリペプチド」という用語は、本文の文脈において、2~50個のアミノ酸残基の短いペプチド、50~100個のアミノ酸残基のオリゴペプチドおよび100個以上のアミノ酸残基のポリぺプチドのいずれをも意味することを意図する。さらに、前記用語は、タンパク質、即ち、少なくとも1つのポリペプチドを含む機能性生体分子を含むことも意図しており、機能性生体分子が少なくとも2つのポリペプチドを含む場合には、これらは複合体を形成していても、共有結合をしていても、共有結合をしていなくてもよい。また、タンパク質中のポリペプチドは、グリコシル化されていても、および/または脂質化されていても、および/または補欠分子族を有していてもよい。
【0038】
(発明の特定の実施態様)
第1の態様
本発明の第1の態様の方法は、改良された「変異コーリング」、即ち、悪性組織/細胞と正常組織/細胞との間の遺伝的差異の同定を扱う際の改良方法を提供するものである。この態様の重要な点は、単に配列をネオペプチドまたはネオエピトープとして同定するバイナリ出力を提供する代わりに、アミノ酸配列と共に確率が出力されることである。これにより、同定された全てのペプチドを、同等の良好なワクチン候補として考えるのではなく、最も関連性の高いペプチドを選択するだけで出力に優先順位を付けることができる便利な手法をとることができる。
【0039】
選択肢aを実行する場合、第1および第2の特徴は、まだ変換されていない場合には確率値に変換される。選択肢bを実行する場合、機械学習モデルは、選択肢aにおいて使用される少なくとも第2の特徴に対応するデータを供給されてもよい。
【0040】
いずれにせよ、セット内の悪性新生物に特異的な出力された固有のヌクレオチド変異は、
-計算された確率に対して優先順位が付けられ;
-それらの各々計算された確率と共にペアが形成され;および/または
-全てが、閾値(例えば、0.5(50%)の閾値)を超える計算された確率を有していることが好ましい。
【0041】
後者の確率により、ワクチン剤としては実用上不適切とみなすべきペプチドが選別され、一方で残りのペプチド(優先順位が付けられ、および/または確率によりペアが形成されたもの)が、さらなる評価/選別に供される。
【0042】
少なくとも1つの第1および/または第2の特徴は、通常、腫瘍バリアントカバレッジ、正常バリアントカバレッジ、腫瘍バリアントアレル頻度、正常バリアントアレル頻度、腫瘍リードマッピング品質、正常リードマッピング品質、腫瘍塩基品質および正常塩基品質からなる群から選択されるが、アミノ酸配列が、がんに特異的なネオエピトープであるという事実認定に関するフィデリティ(忠実度)に影響を与え得るいずれの測定可能品質も原則として評価される情報の一部であり得る。
【0043】
ヌクレオチド変異を同定/選択するための重要な特性は、「クローン状態」、即ち、変異が、悪性腫瘍の全ての細胞に存在している程度、あるいは1つまたはいくつかのクローン株にのみ存在している程度である。言うまでもなく、限られた数の悪性腫瘍細胞にしか存在しない変異は、腫瘍内のすべての細胞に対する免疫応答を引き起こすことは不可能である。従って、がんを標的とするワクチン組成物は、がんの悪性細胞の全範囲を同時に標的とするヌクレオチド変異配列から得られる発現産物を含むことが望ましい。したがって、第1の態様は、好ましくは悪性新生物に特異的な固有のヌクレオチド変異のセットにおける各ヌクレオチド変異をクローン状態について評価することを必要とし、このことにより、全ての悪性細胞を標的とするワクチンの合理的な組成物が可能となる。従って、クローン状態を用いて、悪性腫瘍細胞の大部分に存在する悪性新生物に特異的な固有のヌクレオチド変異を優位に含むか、または少なくとも全体として悪性細胞集団の最大数のクローンを標的とするようにリストの優先順位付けを行う。
【0044】
第2の態様
MHCリガンドに対する存在を分析することは、好ましくは、非常に低い発現レベルのタンパク質の標的化を回避するために、MHC結合の予測をタンパク質様発現産物の発現レベルスコアと統合することを含む。典型的には、発現レベルスコアは、RNA発現レベルから計算され、最も実用的な実施形態では、RNA発現レベルとは、アミノ酸改変ヌクレオチド変異のRNA発現レベルである。
【0045】
ネオエピトープをコードする発現遺伝子の発現レベルを定量化する場合、ほとんどの遺伝子は、がん細胞内に少なくとも2つのコピー(対立遺伝子:アレル)で存在し、これらのアレルは必ずしも等量で発現するとは限らないことに留意することが重要である。殆どのネオエピトープは、がん細胞ゲノムのランダムな変異から生じる。従って、多くの(あるいは、殆どの)ネオエピトープでは、アレルの一部のみ(多くの場合、1つのみ)が、ネオエピトープを生じさせるアミノ酸改変体細胞変異を含んでいる。
【0046】
RSEMのようなRNA発現レベルを定量化するための標準的な最新ツールでは、同じ遺伝子の複数のアレルを区別することはできない。しかし、複数の方法で変異に特異的な発現レベルを計算することは可能である:
1)遺伝子毎または転写産物単位で発現レベルを計算する代わりに、ゲノム/転写産物の位置単位で発現レベルを計算して、
2)RNAシーケンスデータにおいて観測された体細胞変異に関するバリアントアレル頻度(VAF)を、DNAシーケンスデータにおいて観測されたVAFで正規化して、遺伝子/転写産物当たりの発現レベルを修正することが可能である:
【数1】
。
【0047】
これらのアプローチを使用して発現レベルを定量化することにより、発現レベルスコアが正確であることがさらに確実となるため、無関係なタンパク質が標的となるリスクを最小限とすることができる。
【0048】
従って、本発明の第2の態様では、発現レベルスコアは、ゲノム/トランスクリプトーム位置ごとに計算されるか、または発現レベルスコアは、VAFRNA/VAFDNA比(ここで、VAFは、バリアントアレル頻度を表す)を調整することによって修正され、本発明の第1の態様において議論されたセットの固有のアミノ酸改変ヌクレオチド変異の少なくとも1つを含む核酸配列を含んでいる。
【0049】
MHC結合に加えて、推定免疫原性ネオペプチドの免疫原性を決定/評価することもまた価値がある。実際には、これは、以下の手順のいずれか1つ以上によって行うことができる:推定免疫原性ネオペプチドが、ペプチド-MHC複合体の一部である場合のT細胞受容体結合アミノ酸残基の存在の評価;MHCおよび推定免疫原性ネオペプチドとの複合体の安定性の評価(この目的のためには、本出願人の現時点で未公開の欧州特許出願2015772.9および20180876.3に開示されている安定性判定方法を利用できる);推定免疫原性ネオペプチドおよび個体の自己ペプチドの類似性の評価(類似は避けるべきである;参照:本明細書の第3の態様);MHCおよび推定免疫原性ネオペプチドとの複合体とMHCおよび個体の自己ペプチドの複合体との間の類似性の評価;ならびに免疫原性に影響を与える別の配列の特徴をアンロックする畳み込みニューラルネットワークアーキテクチャによる評価。
【0050】
別の考慮すべき重要な特徴として、標的としての適合性が長く継続することが挙げられる。タンパク質から得られるペプチド免疫原は、「さらなる変異の可能性」があり、標的は、誘導された免疫応答から回避することができるため、ワクチンとして不適切となる可能性がある。したがって、各免疫原性ネオペプチドは、好ましくは、免疫回避に対するレジリエンスについても評価される。このレジリエンスの評価には、推定免疫原性ネオペプチドが、発がん性ドライバー変異から生じるか、および/または細胞生存に必須の発現産物に存在するか、および/または腫瘍によって消失または抑制されたHLAとだけに結合するかどうかの判定が含まれ得る―最初の2つのケースの場合、悪性細胞中の同じタンパク質にさらなる変異が生じると腫瘍に有害であり、そのようなタンパク質を標的とするネオペプチドが免疫原として適切であり続ける可能性はより高いと考えられることを意味している。後者の場合、その逆で、同定されたネオペプチドが優れた免疫原であるための基準を全て満たしていても、対応する標的に由来するペプチドがMHC分子において提示されないため、患者には有効ではない。したがって、ネオペプチドが、患者において実際にネオエピトープを含むことが確認されれば、悪性細胞のHLA型に高い適合性を持つことになる。
【0051】
第3の態様
本態様は、高い安全性を示すネオペプチドを提供することを具体的な目的としている。本態様は、単に、有害となる可能性のあるペプチドを避けるために最終的なワクチン候補ペプチド数を減らすことを目的としているため、第2の態様の方法と組み合わせることができる。
【0052】
ネオエピトープが同定された場合、最もシンプルなケースでは、正常細胞内の同じタンパク質から切り出されたペプチドと比較して、1つの単一アミノ酸の変更を含んでいることになる。8つのアミノ酸残基のネオエピトープの場合、そのペプチドは、以下のように記述することができる:
(ここで、全ての文字は、いくつかのアミノ酸を記号で表記したものであり、Xは変異アミノ酸である)。
【0053】
がん細胞において、そのようなペプチドは、より大きなタンパク質の一部、例えば、部分配列:
を有するペプチドである。
【0054】
ABDXEFGHIによって引き起こされる免疫応答によって正常細胞が標的となる可能性を確実に排除するために、正常細胞の発現産物/トランスクリプトームを、悪性腫瘍由来のXを含む8つのアミノ酸配列:KLMNABCX、LMNABCXE、MNABCXEF、NABCXEFG、ABCXEFGH、BCXEFGHI、CXEFGHISおよびXEFGHISTの全てと比較する。正常細胞においてこれらの配列が一つも見つからなかった場合にのみ、ペプチドABCXEFGHは安全であるとみなされる。
【0055】
少なくとも7個のアミノ酸は、エピトープの長さとタイプ(クラスIまたはII)に応じて、8、9、10、11、12、13、14、15あるいはそれ以上の数のアミノ酸とすることも可能である。しかし、安全性の観点からは、有害となる可能性があるワクチン剤を最も多く排除することができるので、アミノ酸の量は少ない方が好ましい。
【0056】
第4の態様
本態様は、ネオエピトープを含むワクチンを構成するための再現性のある方法を提供することを目的とし、態様1~3の方法を利用する。簡単に言えば、各候補ペプチドに対して考慮すべき関連性がある各特徴についての確率を一貫して利用することによって、患者に投与される最終生成物の選択が、各ペプチドの適合性に影響を及ぼし得る実質的に全ての利用可能な情報を統合することが達成される。
【0057】
好ましい一実施形態では、A~Eの全ての確率積を算出することを要するが、A、B、C、DおよびEの少なくとも2つの積は、一般的に、AおよびB、AおよびC、AおよびD、AおよびE、BおよびC、BおよびD、BおよびE、CおよびD、CおよびE、DおよびE、AおよびBおよびC、AおよびBおよびD、AおよびBおよびE、AおよびCおよびD、AおよびCおよびE、AおよびDおよびE、BおよびCおよびD、BおよびCおよびE、BおよびDおよびE、CおよびDおよびE、AおよびBおよびCおよびD、AおよびBおよびCおよびE、AおよびBおよびDおよびE、AおよびCおよびDおよびE、BおよびCおよびDおよびE、ならびにAおよびBおよびCおよびDおよびEの積から選択することができる。
【0058】
最終的にワクチン剤に含まれるペプチドの組成に到達するためには、組成物中のネオペプチドは、好ましくは、確率スコアが、上位50位以内(すなわち絶対数で、例えば、上位49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11または10)であるもの、ならびに/または上位50%以内、例えば、上位45%、上位40%、上位35%、上位30%、上位25%、上位20%、上位15%および上位10%などの確率スコアを有するものである。
【0059】
上記に伴い、第4の態様の方法を第3の態様の方法と組み合わせて、最終的な組成物または薬剤から有害な可能性のあるペプチドを除外することが好ましい。
【0060】
第5および第6の態様
これらの態様はいずれも、第3の態様を出発点として、または第4の態様の方法いずれかを用いて、ワクチン組成物を実際に製造することに関するものである。いずれの場合も、製造される免疫原性組成物は、当技術分野で周知のワクチンの標準的な成分から構成される。したがって、本発明に従って製造された組成物は、一般にアルミニウム系アジュバントまたは以下に記載する他のアジュバントの1つである免疫学的アジュバントを含む。
【0061】
免疫原性組成物の有効性を高めるためのアジュバントとしては、以下に限定されないが:(1)水酸化アルミニウム、リン酸アルミニウム、硫酸アルミニウムなどのアルミニウム塩(ミョウバン);(2)水中油型乳化剤(ムラミルペプチド(下記参照)または細菌細胞壁成分などのその他の特定の免疫刺激剤を含むものか、または含まないもの)、例えば(a)MF59(WO90/14837;ワクチンデザイン10章:サブユニットおよびアジュバントのアプローチ、Powell&Newman,Plenum Press 1995編)、これは5%のスクアレン、0.5%のTween 80および0.5%のSpan 85(必須ではないが任意に様々な量のMTP-PEを含む)を含んでおり、モデル110Yマイクロフルイダイザー(Microfluidics, Newton, MA)等のマイクロフルイダイザーでサブミクロン粒子に製剤されているもの、(b)SAF、10%のスクアラン、0.4%Tween 80、5%プルロニックブロック化ポリマーL121およびthr-MDPを含み、サブミクロンエマルジョンにマイクロ流体化されているか、またはボルテックスに供して、より大きな粒子サイズのエマルジョンを生成させたもの、ならびに(c)2%スクアレン、0.2% Tween 80およびモノホスホリルリピッドA(MPL)、トレハロースジミコレート(TDM)および細胞壁骨格(CWS)からなる群からの1つまたは複数の細菌細胞壁成分、好ましくはMPL+CWS(DetoxTM)を含む、Ribiアジュバンド系(RAS)(Ribi Immunochem,Hamilton,MT);(3)使用され得るサポニンアジュバント(例えば、Stimulon(登録商標)(Cambridge Bioscience,Worcester,MA)またはそこから生成された粒子(例えば、ISCOM(免疫刺激化複合体)など);(4)完全フロイントアジュバント(CFA)および不完全フロイントアジュバント(IFA);(5)サイトカイン類、例えばインターロイキン(例えば、IL-1、IL-2、IL-4、IL-5、IL-6、IL-7、IL-12など)、インターフェロン類(例えば、γインターフェロン)、マクロファージコロニー刺激因子(M-CSF)、腫瘍壊死因子(TNF)など;ならびに(6)組成物の効果を高めるために免疫刺激因子として機能する別の物質が挙げられる。
【0062】
上記のように、ムラミルペプチドとしては、N-アセチル-ムラミル-L-トレオニル-D-イソグルタミン(thr-MDP)、N-アセチルノルムラミル-L-アラニル-D-イソグルタミン(nor-MDP)、N-アセチルムラニル-L-アラニル-D-イソグルタミニル-L-アラニン-2''-2'-ジパルミトイル-sn-グリセロ-3-ヒドロキシホスホリロキシ)-エチルアミン(MTP-PE)等があるが、これらに限定されるものではない。
【0063】
免疫原性組成物(例えば、免疫化抗原または免疫原またはポリペプチドまたはタンパク質または核酸、医薬的に許容される担体(および/または希釈剤および/またはビヒクル)およびアジュバント)には、典型的には、希釈剤(例えば、水、生理食塩水、グリセロール、エタノールなど)が挙げられる。さらに、助剤、例えば、湿潤剤または乳化剤、pH緩衝物質などが、前記ビヒクル中に存在していてもよい。
【0064】
医薬組成物は、医薬的に許容できる担体を含み得る。「医薬的に許容できる担体」という用語は、治療剤(例えば、抗体またはポリペプチド、遺伝子)およびその他の治療剤を投与するための担体を指す。この用語は、それ自体が、組成物を投与される個体にとって有害な抗体の産生を誘導せず、過度な毒性が無く投与することができる、あらゆる医薬的担体を指す。適切な担体とは、例えば、タンパク質、多糖類、ポリ乳酸、ポリグリコール酸、高分子アミノ酸、アミノ酸共重合体および不活化ウイルス粒子などの、大きく、ゆっくりと代謝される高分子であり得る。かかる担体は、当業者にはよく知られている。
【0065】
医薬的に許容できる塩もまた、医薬組成物に使用され得るが、それらには、例えば、塩酸塩、臭化水素酸塩、リン酸塩、硫酸塩などの無機酸塩;および酢酸塩、プロピオン酸塩、マロン酸塩、安息香酸塩などの有機酸塩が挙げられる。医薬的に許容できる賦形剤の詳細な議論は、Remington's Pharmaceutical Sciences (Mack Pub. Co., N. J. 1991) に見出され得る。
【0066】
通常、免疫原性組成物は、液体溶液または懸濁液のいずれかの注射剤として製造される;注射前に、液体ビヒクルの溶液または懸濁液に適した固体形態もまた製造できる。この製剤はまた、上述したように医薬的に許容できる担体のもとで、アジュバント効果を高めるためにリポソームにおいて乳化またはカプセル化されてもよい。
【0067】
ワクチンとして使用される免疫原性組成物は、必要に応じて、適切な免疫原の免疫学的に有効な量、ならびに上記成分の内のその他別の成分を含んでなる。「免疫学的に有効な量」とは、その量を個体に、単回投与として、または一部連続投与として投与することが、治療または予防に有効であることを意味する。この量は、治療される個体の健康状態や身体状態、治療される個体の分類学的群(例えば、非ヒト霊長類、霊長類)、抗体を合成するか、または広く免疫応答を行う個体の免疫系の能力、所望の保護程度、ワクチンの処方、医療状況に対する治療医の判断ならびにその他の関連因子によって変化する。免疫原の量は、日常的な試験を通じて決定できる比較的広い範囲に収まることが予測される。しかし、タンパク質のワクチン接種の目的では、1回の免疫で投与される量は、通常、0.5μg~500mgの範囲(ただし、5,000μgを超えないことが多い)であり、10~200μgの範囲であることが極めて多い。
【0068】
免疫原性組成物は、従来的に、例えば、皮下、筋肉内または経皮/経皮のいずれかの注射によって非経口的に投与される(例えば、WO98/20734を参照)。その他の投与様式に適した追加の製剤には、経口、経肺および経鼻製剤、坐剤および経皮適用が含まれる。核酸ワクチンおよび抗体治療の場合、静脈内または動脈内経路も適用可能である。
【0069】
投与治療は、単回投与スケジュールであっても、複数回投与スケジュールであっても良く、例えば、プライムブースト投与レジメンであっても、バースト投与レジメンであってもよい。ワクチンは、便利であるか、または所望され得るように別の免疫調節剤と組み合わせて投与されてもよい。
【0070】
第7の態様
本態様もまた当分野において周知の標準法に従う:ワクチンの正確な組成物およびフォーマットが上記のように決定された場合、本発明は、一般に、免疫誘導および患者のフォローアップのために医師には周知の方法に従う。この方法には、ワクチンの投与(タンパク質/ペプチド系ワクチンの場合、典型的には1回の投与につき0.5μg~500μgの投与を行い、一般的には少なくともプライミング投与の後に、1回または数回のブースター免疫として提供される)も含まれる。
【0071】
第8の態様
本態様は、態様1~4に記載の方法を実行するコンピューターまたはコンピューターシステムに関するものである。
【0072】
核酸配列および/または修飾子を入力するための手段は、通常、コンピューターのメモリまたは記憶媒体にデータを入力するための任意のデバイスから選択される;原理的には、コンピューターに接続された単純なキーボードがこの目的を果たすことができるが、通常、核酸配列データは、接続されたディスクドライブまたはその他のデータキャリア(メモリースティック、メモリーカード、ネットワーク関連ストレージ)によるか、またはネットワークまたはインターネット接続およびファイル転送のための適切なプロトコル(FTP、FTPS、SFTP、CSP、HTTPまたはHTTPS、AS2、3-および-4またはPeSIT)を介して、外部のデータキャリアまたはデータソースから読み取られる。同様に、核酸配列を保存するための手段は、任意の便利なデータキャリアまたは記憶媒体(ハードドライブ、ソリッドステートハードドライブ、メモリースティック)であり得るが、コンピューターまたはコンピューターシステムのメモリ(RAM)内に直接保存することもできる。記憶形式は、関連するデータベース(行指向および列指向の両方)、オブジェクトデータベースにおける記録形態だけでなく、テキストファイルのエントリ(例えば、カンマ区切り値または適切なXML形式、または単純なファイルシステムまたはその他同様のルート-アンド-ツリー構造)としても任意の便利な形式であり得る。
【0073】
コンピューターまたはコンピューターシステム内の実行可能コード(複数可)は、アミノ酸配列のコード化、アミノ酸配列のソーティングおよび比較等の必要な操作を行うために連結された入力デバイスおよび記憶媒体ならびにコンピューター作業メモリにアクセスすることができる。
【0074】
(本発明に関連する更なる開示)
体細胞変異の同定
生殖細胞変異、腫瘍サンプル中の正常細胞の混入およびシークエンスマシンのノイズなどが、体細胞変異の同定を困難としている。それでも、体細胞変異や体細胞変異の同定は広く研究されている問題であり、体細胞変異をコールするためのツールがいくつか開発されている。数は少ないが、Mutect(Cibulskis, K. et al. 2013)、Mutect2(Cibulskis, K. et al. 2013)、Strelka(Kim, S. et al. 2018)、Varscan2(Koboldt, D. C. et al. 2012)、SomaticSniper(Larson, D. E. et al. 2012)、LoFreq*(Wilm, A. et al. 2012)、SNVSNiffer(Liu, Y. et al. 2016)およびShimmer(Hansen, N. F. et al. 2013)が挙げられる(Xu et al. 2018)。しかし、問題が複雑であるために、完全な解決策はまだ見つかっていない。
【0075】
本発明は、体細胞変異候補のリストに「真の体細胞変異」の確率を割り当てるために機械学習モデルを利用する体細胞変異コーリングモデルを提示する。このリストは、4つの既存のバリアントコーラーであるMutect2、Strelka、SNVSNifferおよびLoFreq*のうちの1つによってコールされた変異のコレクションとして作成される。しかし、体細胞変異コーリングモデルは、バリアントコーラーからの特徴を用いずにゲノム特徴のみで訓練されたモデルを含む任意のバリアントコーラーのセットと組み合わせて使用することができるので、本発明はこれらのバリアントコーラーの使用に限定されない。
【0076】
体細胞変異ごとに、ゲノムアライメントからの特徴が、体細胞変異コーラーからの特徴とともに抽出される。これらのゲノムアラインメントの特徴には、腫瘍バリアントカバレッジ(すなわち、バリアントを支持するリード数)、正常バリアントカバレッジ、腫瘍バリアントアレル頻度(VAF)、正常VAF、腫瘍リードマッピング品質、正常リードマッピング品質、腫瘍塩基品質および正常塩基品質などが挙げられるが、これらに限定されるものではない。別の特徴をセットに追加して、パフォーマンスを向上させることもできる。
【0077】
また、利用可能な場合には、バリアントコーラーに特異的な特徴も抽出される。異なるバリアントコーラーによって作成される情報は異なるが、通常は、各体細胞変異の確率またはスコア値だけでなく、フェイル/パス記述子も含まれる。
【0078】
各特徴は、値
>0および
<1に変換される。本発明の方法は、予め定義された最小値と最大値を用いた線形変換を使用するが、入力特徴を変換するために別の関数を使用することができる。パフォーマンスを最大化するために、変換の選択は、機械学習モデルの選択により変更する。
【数2】
【0079】
変換された特徴量のセットは、体細胞変異を検出する機械学習モデルに渡される。このモデルは、例えば、0から1の間の値を出力する人工ニューラルネットワークまたは勾配ブースティングマシンである。別のトレーニングセットを使用して、この出力値を、所定の変異が真の体細胞変異である確率を示す確率に変換するためにモデルを校正する(実施例1を参照)。
【0080】
現在の体細胞変異コーリングモデルを適用した場合の影響は、
図1で見ることができる。このモデルは、どのバリアントをコールするかに関して、より正確で特異的となるように調整されている。
図1は、Shi, W. et al. 2018から得られた全エクソームシーケンスデータ(ケース3および5)に、StrelkaおよびMutect2の変異コーリングルーチンを適用した2つの例を示している。「ケース3」のデータでは、Strelkaによって同定された361個の体細胞変異、Mutect2によって同定された842個の体細胞変異が得られ、169個の体細胞変異が重複していた。本発明の方法を適用すると、この169個の共通する体細胞変異のセットが、腫瘍に特徴的な真の体細胞変異とみなされる118個に減少し、さらにStrelkaによってのみコールされる真の体細胞変異1個とMutect2によってのみコールされる19個の合計138個の体細胞変異が同定された。
【0081】
同様に、「ケース5」のデータでは、Strelkaによって同定された398個の体細胞変異、Mutect2によって同定された617個の体細胞変異が得られ、両者によって同定された体細胞変異は154個重複していた。本発明の方法を適用すると、この154個に共通して同定されたバリアントのセットは、125個に減少した。Mutect2によって同定された18個の更なる体細胞変異とStrelkaによって同定された3個の体細胞変異も、本発明の方法によって同定されたため、腫瘍に特徴的な合計146個の真の体細胞変異が得られた。
【0082】
このように、このモデルによってコールされた体細胞変異は、多くの場合、その他の幾つかのバリアントコーラーによって同定された信頼度の高い体細胞変異のサブセットである。
【0083】
MHCによって提示されるリガンドの同定
最初に、VEP(McLaren, W. et al. 2016)またはSnpEff(Cingolani, P. et al. 2012)などのバリアントアノテーションツールを使用して、体細胞変異および生殖細胞バリアントのアノテーションを行い、アミノ酸の変更をもたらすものとしてアノテーションされたサブセット(つまり、非同義変異体)をフィルタリングする。アノテーション処理されたアミノ酸の変更は、対応する参照タンパク質配列に導入され、腫瘍特異的なタンパク質配列が得られる。最後に、体細胞変異によって引き起こされた各アミノ酸変更の前後27個のアミノ酸のネオペプチド配列を抽出する(両側に各々13個のアミノ酸)。これらのネオペプチド配列は、患者のHLAが提示するMHCリガンドをホスティングするための予測に供される。
【0084】
これは、ネオペプチド配列から適切なサイズのアミノ酸オリゴマーを作成し、各オリゴマーについて、それぞれのHLAに対する抗原提示の可能性を予測することによって行われる。適切なオリゴマーサイズは、関連するHLA分子長の選好によって規定され、MHCクラスIに属するHLA分子では8、9、10および11であり、MHCクラスIIに属するHLA分子では13~19であり得る。
【0085】
各MHCクラスに属するHLA分子のセットについて、最良の予測は、腫瘍細胞またはプロフェッショナル抗原提示細胞によってネオペプチドが提示される可能性を表している。この予測は、ネオペプチドのソースタンパク質の変異体アイソフォームのRNA配列由来の発現量と統合され、抗原提示の確率に変換される。所定ペプチドのHLAリガンド尤度を予測するためのニューラルネットワークモデルは、結合親和性データなどのペプチド-MHC相互作用データおよびイムノペプチドミクスによって発見されたMHCリガンドに基づいて開発されている。ニューラルネットワークモデルの入力としては、以下の通りである:
・ペプチド中の最初の3つのアミノ酸および最後の3つのアミノ酸として規定されたBLOSUMコード化プロセシングモチーフ;
・BLOSUMでコード化された9merのペプチド結合モチーフ;
o9個のアミノ酸よりも短いペプチドの場合、結合モチーフは、ペプチド中の各アミノ酸の後にワイルドカードのアミノ酸ストレッチを挿入することにより作成される;
o9個の長さのアミノ酸のペプチドの場合、結合モチーフはペプチド配列によって与えられる;
o9個のアミノ酸よりも長いペプチドの場合、結合モチーフはペプチドによりホスティングされた9-merとして規定されるか、または9-merモチーフはペプチド配列に欠失を導入する(即ち、ペプチド配列を9個のアミノ酸に減らすためにアミノ酸のストレッチを取り除く)ことにより規定される;
・ペプチド長は、Lと表記し、次のように変換される:
・MHCクラスIに属するHLA分子の場合、1/(1+e0.5×(L-9));
・MHCクラスIIに属するHLA分子の場合、1/(1+e0.5×(L-15));
・ペプチド中の9mer結合モチーフの開始位置と終了位置。
【0086】
その他の機械学習フレームワーク、例えば、畳み込みニューラルネットワーク、オートエンコーダ、再帰的ニューラルネットワークおよび確率的学習モデルの組み合わせを適用することも想定可能である。
【0087】
免疫原性ペプチドの選択
免疫原性ペプチドMHC複合体(以下、pMHC)および非免疫原性ペプチドMHC複合体の違いを説明する要因はいくつかある(Calis, J. J. A. et al. 2013)。第1には、pMHCがT細胞受容体によって認識されることである。第2には、pMHCは豊富に存在していなければならず、結合親和性、結合安定性ならびにMHCと前駆体タンパク質両方の発現レベルが高いほど、認識がおこる頻度が増加する。第3には、T細胞がpMHCを認識した後の免疫応答は、制御プロセスによってブロック/抑制される可能性がある。
【0088】
ペプチドリガンド単独またはpMHCが免疫原性であるかどうかを予測するモデル(例えば、ニューラルネットワーク)を、訓練させることができる。上記要因をこのモデルに組み込む方法として、以下のような方法が想定される:
・位置特異的ペプチド配列のコード化:ペプチド配列を、離散カテゴリーのアミノ酸が位置特異的な数値ベクトルとして示されるようにコード化または埋め込むことができる。ペプチド配列のコード化により、ペプチド鎖中の特定アミノ酸に結合するT細胞受容体のモデリングが導かれる(例えば、MHC複合体から突出した特定の中心部のアミノ酸に関する重要性);
・位置特異的MHC配列のコード化:MHC配列の全体または一部を、離散カテゴリーのアミノ酸が位置特異的な数値ベクトルとして示されるようにコード化または埋め込むことができる。MHC配列のコード化により、MHC鎖中の特定アミノ酸に結合するT細胞受容体のモデリングが導かれ(例えば、T細胞受容体に近接する特定鎖アミノ酸に対する重要性)、MHCアミノ酸およびペプチドアミノ酸とT細胞の結合との相互依存性の指針となる;
・測定または予測されたpMHCの安定性を前記モデルに入力し、pMHCの存在量を考慮した免疫原性のモデリングを導くのに役立つ;
・自己ペプチドまたは自己MHCとの類似性を表すメトリックをモデルに入力し、免疫原性に影響を与える調節プロセスのモデリングを導くのに役立ち得る。このようなメトリックは、野性型ネオ抗原、ヒト前駆体タンパク質の免疫ペプチドームまたは完全ヒトプロテオームなどの関連標的との類似性を記述する数値またはコード化されたカテゴリー変数であり得る;
・畳み込みニューラルネットワークアーキテクチャは、ペプチドまたはMHC配列の位置するアミノ酸として重要な抽象的な配列の特徴をアンロックし、免疫原性のモデリングを導き得る。
【0089】
免疫原性は、テトラマー/マルチマー染色、ELISPOT、ICSなどのアッセイで測定することができる。
【0090】
予測スコアの免疫原性確率への変換は、使用ケースを反映する適切な免疫原性データセットに、すなわち上記に規定されたアッセイから読み出したデータに予測因子をベンチマークすることによって規定される。予測はベンチマークデータセットに対して行われる。予測スコアをソートした後、予測スコアに沿ったムービング・ウィンドウで適合率(precision)が計算される。平滑単調増加関数を適合させて、予測スコアを免疫原性確率に校正するために適用できる。
【0091】
クローン性体細胞変異の選択
ショートリード型配列決定から得られるDNAまたはRNA配列の読み出しは、腫瘍生検に存在する染色体からランダムにサンプリングされた一連の推定配列を配列決定することにより構成されており、染色体は、腫瘍組織内に存在する健康な細胞を含む複数の異なる遺伝子型を持つ細胞から自然に構成されている。さらに複雑化させる要素は、腫瘍細胞が、高頻度で染色体の大部分をコピーまたは除去することにより染色体を再配列するという事実である。生検からの配列データには、推定ネオ抗原のクローン状態を計算するために適切な2つの出力が含まれる:
i) 各位置におけるシーケンス深度(カバレッジ);および
ii) データに存在する各バリアント(変異)についてのバリアントアレル頻度(VAF)。このデータから、各ネオ抗原の腫瘍純度(所定の生検における腫瘍細胞が存在する細胞の割合)およびクローン状態(クローンまたはサブクローン)を計算する必要がある。
【0092】
主にクローン性バリアントから構成され、高純度の腫瘍タイプでは、各染色体のコピーが平均して2つ存在するため、サンプルから計算される体細胞VAFは、腫瘍純度の約半分に分布する傾向がある。したがって、腫瘍の純度を検出する簡単な方法は、すべてのVAFの平均/中央値を取るか、全てのVAFの分布のピークを取って2を掛けることである。
【0093】
腫瘍が多数の染色体再配列または多数のサブクローナル変異を有する場合のより複雑なケースは、VAFおよび深度データに関数を適合させることによって解決され、その出力は腫瘍の純度およびゲノムセグメントのコピー数である。幾つかのアルゴリズムは、異なる関数および様々なフィッティング方法、例えば、FACETS(Shen, R., and V. E. Seshan 2016)、TPES(Locallo, A., D. et al. 2019)、hsegHMM(Choo-Wosoba, H. et al. 2018;)、Sequenza(Favero, F. et al. 2015)、ASCAT(Van Loo, P. et al. 2010)、ichorCNA(Adalsteinsson, V. A. et al. 2017)、TITAN(Ha, G. et al. 2014)、PureCN(Riester, M. et al. 2016)、PhyloWGS(Deshwar, A. G. et al. 2015)、PyClone (Roth, A. et al. 2014)など複数のものを利用している。
【0094】
免疫回避に耐性のあるネオエピトープの選択
腫瘍細胞による免疫回避に耐性のあるネオエピトープは、a) 発がん性ドライバー変異から生じるネオエピトープ;b) 細胞の生存に必須の遺伝子に位置するネオエピトープ;およびc) 腫瘍によって消失または抑制されているHLAにのみ結合するネオエピトープの3カテゴリーに大別される。
【0095】
発がん性ドライバー変異は、細胞の悪性化を促進させる重要な役割を果たすため、良い標的となる。腫瘍細胞が発がん性ドライバーを失った場合、その悪性度は低くなる可能性が高い。発がん性ドライバーの変異は、COSMIC (Tate, J. G. et al. 2019) などの様々なデータベースから特定できる。ここでは、有意に選択される変異が重要な役割を果たすと考えられるために、特定のDNA変異またはアミノ酸の変更が起こる頻度を、発がん性のサロゲートとして使用することができる。
【0096】
腫瘍細胞は、細胞にとって致死的でなければネオエピトープの遺伝子発現を下方調節することができないため、必須遺伝子のネオエピトープにも優先順位をつけることができる。必須遺伝子は、様々な実験によって同定することができる。1つのアプローチは、大規模なCRISPR-Cas9機能喪失スクリーニング (Wang, T. et al. 2015;Meyers, R. M. et al. 2017) を使用することであり、各遺伝子を系統的にノックアウトして、細胞増殖および生存への影響を評価することである。この種のスクリーニングは、異なるがん細胞株の大規模なカタログで使用されている。したがって、遺伝子の全体の必須性は、試験されたがん細胞株において必須である頻度に基づいて単純に計算することができる。
【0097】
HLA遺伝子の欠失またはHLA発現の抑制は、腫瘍回避のメカニズムとして報告されている (例えば、https://pubmed.ncbi.nlm.nih.gov/29107330/)。所定のHLAが腫瘍細胞で消失されるか、または単に抑制される場合、所定のHLAは、MHCリガンドの同定工程に進むHLAのセットから除外されるべきである。HLA消失の同定は、腫瘍/正常ペアのエクソーム配列を、所定のHLAに関連する推定配列の枯渇について調べることによって行われる。HLA発現の抑制は、腫瘍細胞のRNAシーケンスから定量できる可能性がある。
【実施例】
【0098】
(実施例1)
ネオエピトープのランク付けのための確率に基づいたモード
上記の各特徴について作成された予測値は、必ずしも同じような分布に従うとは限らないため、最終的なモデルに予測値を組み合わせることは重要である。そのため、一つの解決策として機械学習によりモデルを構築することが考えられるが、残念ながら利用可能なデータ数は極めて少なく、また一貫した方法で作成されたものではない。
【0099】
そこで我々は、各特徴の予測値を、その予測値が真実となる確率に変換する確率に基づいたモデルを提案する。これらの確率を掛け合わせることで、所定のネオエピトープが所定の患者において抗腫瘍効果をもたらす最終的な確率を得ることができる。
【数3】
【0100】
理想的なシナリオでは、特徴スコアを効果の確率に変換する連続関数が作成される。その例を
図2に示す。これは、様々な予測閾値で正確な適合率を計算できる高品質な評価データセットが作成できる特徴に対して可能である。
【0101】
一部の特徴によっては、連続的なスコアを出力するツールではなく、分類器を作成することが理にかなっている場合がある。例えば、体細胞変異コールでは、様々な特徴の異なるフィルタリングを追加した方が良い場合がある。この場合、各カテゴリー内の適合率はシンプルに計算され、直接使用される。一例を
図3に示す。これは、上記の例をより単純化したケースである。
【0102】
一部の特徴によっては、特徴が最終的な確率スコアに与える影響を制限することが望ましい場合がある。これは、使用する評価データセットが低品質である場合に、または反復スコアとの関連性について不確実性が高い場合に適切である。この場合、その特徴に対する重みを小さくすることが望ましい。例えば、下記のような式:
【数4】
を用いて行うこが考えられる。
【0103】
式中、Wは浮動小数点値≧0および≦1である。様々な重みが最終的な「確率」にどのように影響するかの例は、
図4に見ることができる。
【0104】
HLAリガンド尤度とバリアントアイソフォームの発現の変換は、同一のサンプルまたは一致した条件で培養された細胞から得られたRNA配列およびイムノペプチドミクスデータセットに基づいて開発されている。この変換は、1つの軸に沿ったニューラルネットワークの予測値および別の軸に沿ったバリアントアイソフォーム発現値によってスパンされるグリッド内の2Dビンにおいて、HLAリガンドとペプチドのランダムセットの識別適合率を計算することにより規定される。
図5にその例を示す。
【0105】
より具体的には、以下のように行われる。先ず、一致させたデータセットからニューラルネットワークの予測値と宿主転写産物の発現値を導き出す。次に、ニューラルネットワークの予測値と発現値を、個々にそれらをベンチマークすることにより、共通のスケールに置く。これは、スライディングウィンドウで適合率を計算し、2つの一変量変換スキームを構成する平滑単調増加関数を適合させることによって行われる(AおよびBを参照)。次に、これらの一変量変換をニューラルネットワークの予測値と発現値に適用し、共通のスケールにする。その後、2Dビンは、変換されたニューラルネットワークの予測値と発現値によってスパンされたグリッドにおいて規定される。適合率は、各ビンについて計算され(Cを参照)、最終的な結合確率の変換は、計算された適合率ランドスケープに平滑化関数を適合させることによって規定することができる(ここでは、線形スプライン補間を適用した)。
【0106】
(実施例2)
本発明の方法に対する臨床応答の評価
第4の態様において、上記A~Dで示される4つの特徴の関連性を、N,N-ジメチル-N,N-ジオクタデシルアンモニウム(臭化塩)[DDA]、モノミクロイルグリセロールアナログ1[MMG]およびポリイノシン酸(Statens Serum Institut製)のポリシチジル酸[poly(I:C)]からなるリポソームアジュバントであるCAF09bと組み合わせて試験的ペプチド系ネオエピトープ治療を受けた黒色腫患者9名のコーホートについてレトロスペクティブ試験を行った;Schmidt S. T. et al. 2020。この試験に登録された患者の細胞は、DNAおよびRNA配列が決定され、インシリコ法を用いてネオエピトープが同定された。各患者についての5~10個のネオエピトープの合成が成功し、これをネオエピトープ療法に含めた。患者は、各投与の間に2週間をあけて合計6回ネオエピトープが投与された。最初の3回の投薬は腹腔内投与とし、最後の3回は筋肉内投与とした。ベースライン時に3回接種後、6回接種後に各患者の腫瘍の画像診断(PET-CTまたはCTスキャン)を行い、その後12週間ごとに画像診断を行い、ワクチン接種の臨床効果を評価した。腫瘍はRECIST v1.1基準に従って評価された。9名の患者のうち、2名が完全奏効、4名が部分奏効、1名が安定、2名が進行であった。したがって、客観的奏効率は67%であり、奏効者6名、非奏効者3名であった。
【0107】
奏効者および非奏効者に投与されたネオエピトープの確率スコアA~D(本発明の第4の態様を参照)を比較した(
図6参照)。この図から明らかなように、確率スコアA~Dの各々は、奏功者に投与されたネオエピトープと、非奏功者に投与されたネオエピトープと区別することができ、いくつかの確率(BおよびC:即ち、ネオエピトープが全ての腫瘍細胞に存在するという確率およびネオエピトープがMHCリガンドであるという確率)は、その他の確率よりも優れていた。A-Dの複合的な確率計算により、奏功者のネオエピトープと非奏功者のネオエピトープを区別することも可能であった。
【0108】
各患者に投与された高品質のネオエピトープ頻度(高品質のネオエピトープを、全ての投与されたネオエピトープで割ったもの)も比較された。この場合、高品質ネオエピトープとは、確率スコアA~Dの各スコアが0.5以上であると規定される。ここでもまた、奏功者および非奏功者の間に差異があり、奏功者は非奏功者に比べて、治療にてより高い割合で高品質ネオエピトープを受容していることが示された。
図7を参照されたい。
【0109】
(引用文献)
1. Hundal, J. et al. 2016; Genome Med. 8: 11.
2. Bjerregaard, A. M. et al. 2017; Cancer Immunol. Immunother. 66: 1123-1130.
3. Bais, P. et al. 2017; Bioinformatics 33: 3110-3112.
4. Rubinsteyn, A., J. et al. 2017; Front. Immunol. 8: 1807.
5. Schenck, R. O. et al. 2019; BMC Bioinformatics 20: 264.
6. Cibulskis, K., M. et al. 2013; Nat. Biotechnol. 31: 213-219.
7. Kim, S. et al. 2018; Nat. Methods 15: 591-594.
8. Koboldt, D. C. et al. 2012; Genome Res. 22: 568-576.
9. Larson, D. E. et al. 2012; Bioinformatics 28: 311-317.
10. Hansen, N. F. et al. 2013; Bioinformatics 29: 1498-1503.
11. Xu, C. 2018; Comput. Struct. Biotechnol. J. 16: 15-24.
12. Shi, W. et al. 2018; Cell Rep. 25: 1446-1457.
13. McLaren, W. et al. 2016; Genome Biol. 17: 122.
14. Cingolani, P. et al. 2012; Fly (Austin). 6: 80-92.
15. Calis, J. J. A. et al. 2013; PLoS Comput. Biol. 9.
16. Shen, R., and V. E. Seshan 2016; Nucleic Acids Res. 44: e131.
17. Locallo, A., D. et al. 2019; Bioinformatics 35(21): 4433-4435.
18. Choo-Wosoba, H. et al. 2018; BMC Bioinformatics 19: 424.
19. Favero, F. et al. 2015; Ann. Oncol. Off. J. Eur. Soc. Med. Oncol. 26: 64-70.
20. Van Loo, P. et al. 2010; Proc. Natl. Acad. Sci. U. S. A. 107: 16910-5.
21. Adalsteinsson, V. A. et al. 2017; Nat. Commun. 8: 1324.
22. Ha, G. et al. 2014; Genome Res. 24: 1881-93.
23. Riester, M. et al. 2016; Source Code Biol. Med. 11: 13.
24. Deshwar, A. G. et al. 2015; Genome Biol. 16: 35.
25. Roth, A. et al. 2014; Nat. Methods 11: 396-8.
26. Tate, J. G. et al. 2019; Nucleic Acids Res. 47: D941-D947.
27. Wang, T. et al. 2015; Science 350: 1096-101.
28. Meyers, R. M. et al. 2017; Nat. Genet. 49: 1779-1784.
29. Wilm, A., et al. 2012; Nucleic Acids Res. 40(22): 11189-11201.
30. Liu, Y. et al. 2016; BMC Systems Biology 10: 47.
31. Schmidt S. T. et al. 2020; Pharmaceutics 2020 12(12): 1237
【国際調査報告】