(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-08-27
(54)【発明の名称】免疫療法のためのペプチド検索システム
(51)【国際特許分類】
G16B 30/00 20190101AFI20240820BHJP
G16B 40/00 20190101ALI20240820BHJP
G16B 35/00 20190101ALI20240820BHJP
【FI】
G16B30/00
G16B40/00
G16B35/00
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024508782
(86)(22)【出願日】2022-08-31
(85)【翻訳文提出日】2024-02-13
(86)【国際出願番号】 US2022042172
(87)【国際公開番号】W WO2023038834
(87)【国際公開日】2023-03-16
(32)【優先日】2021-09-13
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2022-08-30
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】504080663
【氏名又は名称】エヌイーシー ラボラトリーズ アメリカ インク
【氏名又は名称原語表記】NEC Laboratories America, Inc.
(74)【代理人】
【識別番号】100123788
【氏名又は名称】宮崎 昭夫
(74)【代理人】
【識別番号】100127454
【氏名又は名称】緒方 雅昭
(72)【発明者】
【氏名】ミン、 レンチャン
(72)【発明者】
【氏名】グラフ、 ハンス、 ペーター
(72)【発明者】
【氏名】チェン、 ジキ
(57)【要約】
免疫療法の結合ペプチド探索システムが提示される。深層ニューラルネットワークを採用して(101)、主要組織適合性複合体対立遺伝子配列とペプチド配列とからペプチド提示を予測し、変分オートエンコーダを訓練して(103)、ペプチド配列を連続埋め込みベクトルに変換してペプチドを再構築し、モンテカルロ木探索を実行して(105)、陽性ペプチドワクチン候補の第1セットを生成し、訓練されたVAEを用いたベイズ最適化探索とバックプロパゲーション探索とを実行して(105)、陽性ペプチドワクチン候補の第2セットを生成し、位置重み行列からサンプリングを使用して(107)、陽性ペプチドワクチン候補の第3セットを生成し、陽性ペプチドワクチン候補の第1、第2、第3セットをスクリーニングして結合し(109)、スクリーニングして結合された陽性ペプチドワクチン候補のセットから免疫療法の適格なペプチドを出力する(111)。
【選択図】
図1
【特許請求の範囲】
【請求項1】
免疫療法のための結合ペプチドを探索する方法であって、
深層ニューラルネットワークを採用して(101)、MHC対立遺伝子配列とペプチド配列とからペプチド提示を予測することと、
変分オートエンコーダ(VAE)を訓練して(103)、可変長の前記ペプチド配列を固定サイズの連続埋め込みベクトルに変換してペプチドを再構築することと、
モンテカルロ木探索(MCTS)を実行して(105)、陽性ペプチドワクチン候補の第1のセットを生成することと、
前記訓練されたVAEを用いたベイズ最適化探索(BO-VAE)と前記訓練されたVAEを用いたバックプロパゲーション探索(BP-VAE)とを実行して(105)、陽性ペプチドワクチン候補の第2のセットを生成することと、
位置重み行列(sPWM)からのサンプリングを使用して(107)、陽性ペプチドワクチン候補の第3のセットを生成することと、
陽性ペプチドワクチン候補の前記第1、前記第2および前記第3のセットをスクリーニングおよび結合すること(109)と、
前記スクリーニングされ、統合された陽性ペプチドワクチン候補の第1、第2および第3のセットから、免疫療法に適格なペプチドを出力すること(111)と、を含む方法。
【請求項2】
多層パーセプトロン(MLP)が、前記連続埋め込みベクトルから前記ペプチドの提示スコアを予測するように訓練される、請求項1に記載の方法。
【請求項3】
前記BO-VAEおよび前記BP-VAEが、前記連続埋め込みベクトルから前記ペプチドの前記提示スコアを最大化するために採用される、請求項2に記載の方法。
【請求項4】
前記BP-VAEが、前記深層ニューラルネットワークから提示スコアを学習し、前記連続埋め込みベクトルを勾配上昇で最適化することにより、陽性ペプチドワクチン候補の前記第1のセットの一部を生成するために採用される、請求項1に記載の方法。
【請求項5】
前記sPWMが、陽性ペプチドワクチン候補の前記第2のセットから計算されたすべてのl個の位置のアミノ酸分布からサンプリングすることにより、長さlを有する陽性ペプチドワクチン候補の前記第2のセットを生成する、請求項1に記載の方法。
【請求項6】
前記ペプチドが標的ウイルスまたは腫瘍細胞のペプチドのライブラリから抽出される、請求項1に記載の方法。
【請求項7】
ペプチドの前記抽出されたライブラリと、変異していないペプチドと配列類似性を有する対応する変異とが、前記MCTS、前記BO-VAE、前記BP-VAEおよび前記sPWMの開始点として採用される、請求項6に記載の方法。
【請求項8】
免疫療法における結合ペプチドのためのコンピュータ読み取り可能なプログラムを含む非一過性のコンピュータ可読記憶媒体であって、前記コンピュータ読み取り可能なプログラムは、コンピュータ上で実行されるとき、コンピュータに、
深層ニューラルネットワークを採用して(101)、MHC対立遺伝子配列とペプチド配列とからペプチド提示を予測するステップと、
変分オートエンコーダ(VAE)を訓練して(103)、可変長の前記ペプチド配列を固定サイズの連続埋め込みベクトルに変換してペプチドを再構築するステップと、
モンテカルロ木探索(MCTS)を実行して(105)、陽性ペプチドワクチン候補の第1のセットを生成するステップと、
前記訓練されたVAEを用いたベイズ最適化探索(BO-VAE)と前記訓練されたVAEを用いたバックプロパゲーション探索(BP-VAE)とを実行して(105)、陽性ペプチドワクチン候補の第2のセットを生成するステップと、
位置重み行列(sPWM)からのサンプリングを使用して(107)、陽性ペプチドワクチン候補の第3のセットを生成するステップと、
陽性ペプチドワクチン候補の前記第1、前記第2および前記第3のセットをスクリーニングおよび結合するステップ(109)と、
前記スクリーニングされ、統合された陽性ペプチドワクチン候補の第1、第2および第3のセットから、免疫療法に適格なペプチドを出力するステップ(111)と、を実行させる、非一過性のコンピュータ可読記憶媒体。
【請求項9】
多層パーセプトロン(MLP)が、前記連続埋め込みベクトルから前記ペプチドの提示スコアを予測するように訓練される、請求項8に記載の非一過性のコンピュータ可読記憶媒体。
【請求項10】
前記BO-VAEおよび前記BP-VAEが、前記連続埋め込みベクトルから前記ペプチドの前記提示スコアを最大化するために採用される、請求項9に記載の非一過性のコンピュータ可読記憶媒体。
【請求項11】
前記BP-VAEが、前記深層ニューラルネットワークから提示スコアを学習し、前記連続埋め込みベクトルを勾配上昇で最適化することにより、陽性ペプチドワクチン候補の前記第1のセットの一部を生成するために採用される、請求項8に記載の非一過性のコンピュータ可読記憶媒体。
【請求項12】
前記sPWMが、陽性ペプチドワクチン候補の前記第2のセットから計算されたすべてのl個の位置のアミノ酸分布からサンプリングすることにより、長さlを有する陽性ペプチドワクチン候補の前記第2のセットを生成する、請求項8に記載の非一過性のコンピュータ可読記憶媒体。
【請求項13】
前記ペプチドが標的ウイルスまたは腫瘍細胞のペプチドのライブラリから抽出される、請求項8に記載の非一過性のコンピュータ可読記憶媒体。
【請求項14】
ペプチドの前記抽出されたライブラリと、変異していないペプチドと配列類似性を有する対応する変異とが、前記MCTS、前記BO-VAE、前記BP-VAEおよび前記sPWMの開始点として採用される、請求項13記載の非一過性のコンピュータ可読記憶媒体。
【請求項15】
免疫療法における結合ペプチドのためのシステムであって、
メモリと、
前記メモリと通信する1つまたは複数のプロセッサとを有し、前記プロセッサは、
深層ニューラルネットワークを採用して(101)、MHC対立遺伝子配列とペプチド配列とからペプチド提示を予測し、
変分オートエンコーダ(VAE)を訓練して(103)、可変長の前記ペプチド配列を固定サイズの連続埋め込みベクトルに変換してペプチドを再構築し、
モンテカルロ木探索(MCTS)を実行して(105)、陽性ペプチドワクチン候補の第1のセットを生成し、
前記訓練されたVAEを用いたベイズ最適化探索(BO-VAE)と前記訓練されたVAEを用いたバックプロパゲーション探索(BP-VAE)とを実行して(105)、陽性ペプチドワクチン候補の第2のセットを生成し、
位置重み行列(sPWM)からのサンプリングを使用して(107)、陽性ペプチドワクチン候補の第3のセットを生成し、
陽性ペプチドワクチン候補の前記第1、前記第2および前記第3のセットをスクリーニングおよび結合し(109)、
前記スクリーニングされ、統合された陽性ペプチドワクチン候補の第1、第2および第3のセットから、免疫療法に適格なペプチドを出力する(111)ように構成された、システム。
【請求項16】
多層パーセプトロン(MLP)が、前記連続埋め込みベクトルから前記ペプチドの提示スコアを予測するように訓練される、請求項15に記載のシステム。
【請求項17】
前記BO-VAEおよび前記BP-VAEが、前記連続埋め込みベクトルから前記ペプチドの前記提示スコアを最大化するために採用される、請求項16に記載のシステム。
【請求項18】
前記BP-VAEが、前記深層ニューラルネットワークから提示スコアを学習し、前記連続埋め込みベクトルを勾配上昇で最適化することにより、陽性ペプチドワクチン候補の前記第1のセットの一部を生成するために採用される、請求項15に記載のシステム。
【請求項19】
前記sPWMが、陽性ペプチドワクチン候補の前記第2のセットから計算されたすべてのl個の位置のアミノ酸分布からサンプリングすることにより、長さlを有する陽性ペプチドワクチン候補の前記第2のセットを生成する、請求項15に記載のシステム。
【請求項20】
前記ペプチドが標的ウイルスまたは腫瘍細胞のペプチドのライブラリから抽出される、請求項15に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願情報
本出願は、2021年9月13日に出願された仮出願第63/243,404号および2022年8月30日に出願された米国特許出願第17/898,662号の優先権を主張するものであり、両出願はその全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
技術分野
本発明は、ペプチド生成に関し、より詳細には、免疫療法のためのいくつかの検索方法を有するペプチド検索システムに関する。
【0003】
関連技術の説明
主要組織適合性複合体(MHC)クラスIタンパク質に結合し、細胞表面に提示される外来ペプチドは、免疫療法において重要な役割を果たす。これらのペプチドはT細胞レセプターによって認識され、適応免疫反応を引き起こすことができる。
【発明の概要】
【0004】
結合ペプチドを探索するためのいくつかの方法からなるシステムが提示される。このシステムは、深層ニューラルネットワークを採用して、MHC対立遺伝子配列とペプチド配列とからペプチド提示を予測することと、変分オートエンコーダ(VAE)を訓練して、可変長の前記ペプチド配列を固定サイズの連続埋め込みベクトルに変換してペプチドを再構築することと、モンテカルロ木探索(MCTS)を実行して、陽性ペプチドワクチン候補の第1のセットを生成することと、前記訓練されたVAEを用いたベイズ最適化探索(BO-VAE)と前記訓練されたVAEを用いたバックプロパゲーション探索(BP-VAE)とを実行して、陽性ペプチドワクチン候補の第2のセットを生成することと、位置重み行列(sPWM)からのサンプリングを使用して、陽性ペプチドワクチン候補の第3のセットを生成することと、陽性ペプチドワクチン候補の前記第1、前記第2および前記第3のセットをスクリーニングおよび結合することと、前記スクリーニングされ、統合された陽性ペプチドワクチン候補の第1、第2および第3のセットから、免疫療法に適格なペプチドを出力することと、を含む。
【0005】
免疫療法における結合ペプチドを探索するためのコンピュータ読み取り可能なプログラムを含む非一過性のコンピュータ可読記憶媒体が提示される。このコンピュータ読み取り可能なプログラムは、コンピュータ上で実行されるとき、コンピュータに、深層ニューラルネットワークを採用して、MHC対立遺伝子配列とペプチド配列とからペプチド提示を予測するステップと、変分オートエンコーダ(VAE)を訓練して、可変長の前記ペプチド配列を固定サイズの連続埋め込みベクトルに変換してペプチドを再構築するステップと、モンテカルロ木探索(MCTS)を実行して、陽性ペプチドワクチン候補の第1のセットを生成するステップと、前記訓練されたVAEを用いたベイズ最適化探索(BO-VAE)と前記訓練されたVAEを用いたバックプロパゲーション探索(BP-VAE)とを実行して、陽性ペプチドワクチン候補の第2のセットを生成するステップと、位置重み行列(sPWM)からのサンプリングを使用して、陽性ペプチドワクチン候補の第3のセットを生成するステップと、陽性ペプチドワクチン候補の前記第1、前記第2および前記第3のセットをスクリーニングおよび結合するステップと、前記スクリーニングされ、統合された陽性ペプチドワクチン候補の第1、第2および第3のセットから、免疫療法に適格なペプチドを出力するステップと、を実行させる。
【0006】
結合ペプチドを探索するためのシステムが提示される。このシステムは、メモリと、前記メモリと通信する1つまたは複数のプロセッサとを有し、前記プロセッサは、深層ニューラルネットワークを採用して、MHC対立遺伝子配列とペプチド配列とからペプチド提示を予測し、変分オートエンコーダ(VAE)を訓練して、可変長の前記ペプチド配列を固定サイズの連続埋め込みベクトルに変換してペプチドを再構築し、モンテカルロ木探索(MCTS)を実行して、陽性ペプチドワクチン候補の第1のセットを生成し、前記訓練されたVAEを用いたベイズ最適化探索(BO-VAE)と前記訓練されたVAEを用いたバックプロパゲーション探索(BP-VAE)とを実行して、陽性ペプチドワクチン候補の第2のセットを生成し、位置重み行列(sPWM)からのサンプリングを使用して、陽性ペプチドワクチン候補の第3のセットを生成し、陽性ペプチドワクチン候補の前記第1、前記第2および前記第3のセットをスクリーニングおよび結合し、前記スクリーニングされ、統合された陽性ペプチドワクチン候補の第1、第2および第3のセットから、免疫療法に適格なペプチドを出力するように構成されている。
【0007】
これらおよび他の特徴および利点は、添付の図面と関連して読まれる、その例示的な実施形態の以下の詳細な説明から明らかになるであろう。
【図面の簡単な説明】
【0008】
本開示は、以下の図を参照して、好ましい実施形態の以下の説明において詳細を提供する。
【0009】
【
図1】本発明の実施形態による、免疫療法のためのペプチドワクチン設計および特定された適格ペプチドに基づくペプチド結合モチーフ計算のための探索のための例示的な方法のブロック/フロー図である。
【0010】
【
図2】本発明の実施形態による、ペプチドのライブラリを標的とするペプチドワクチン設計を検索するための例示的な方法のブロック/フロー図である。
【0011】
【
図3】本発明の実施形態による、免疫療法のための結合ペプチドを探索するための例示的な実用的アプリケーションである。
【0012】
【
図4】本発明の実施形態による、免疫療法のための結合ペプチドを探索するための例示的な処理システムである。
【発明を実施するための形態】
【0013】
免疫療法は、細胞内病原体(例えば、ウイルスや細菌)や腫瘍細胞に対する患者の免疫系を高めることを目的とするものであり、ヒトの疾患に対する基本的な治療法である。このような免疫反応の大部分は、細胞傷害性T細胞(CD8+T細胞とも呼ばれる)が、細胞表面の主要組織適合性複合体(MHC)クラスIタンパク質によって提示された外来ペプチドを認識したときに引き起こされる。これらの外来ペプチドは認識されるために、まずプロテアソーム内のタンパク質分解酵素によって細胞内抗原から分解され、次に小胞体に運ばれてMHCクラスIタンパク質と結合する。こうしてできたペプチド-MHC複合体は細胞表面に移動し、CD8+T細胞レセプターと相互作用する。
【0014】
ペプチド-MHC複合体によって引き起こされるこのような免疫反応を利用することで、最近、ヒトの疾病予防におけるペプチドベースのワクチンに大きな期待が寄せられている。ペプチドベースのワクチンは、大きなタンパク質に比べて安定性と合成性に優れ、副作用が少なく、望ましい免疫反応を引き起こす可能性がある。
【0015】
最近の成功にもかかわらず、ペプチドベースの免疫療法、つまり特定のMHCタンパク質の外来結合ペプチドと結合モチーフを効率的に特定する方法を開発することは依然として大きな課題に直面している。この課題に取り組むため、ペプチドとMHCクラスIタンパク質との結合親和性を予測する多くの計算ツールが開発されてきた。しかし、これらのツールを使っても、結合モチーフを計算するために、特定のMHCタンパク質が提示できる適格なペプチドを直接見つけることはまだ難しい。MHCタンパク質の中には、入手コストが高いために実験データがないか、限られているものもあるため、さらに困難となる。実際には、既存の計算ツールで結合モチーフ特定に適したペプチドをすべて見つけるには、可能性のあるペプチドをすべて網羅的にスクリーニングする必要があるかもしれない。このスクリーニングには時間とコストがかかる。
【0016】
このような課題に対処するために、例示的な実施形態は、外来ペプチド探索を標準的な探索問題として定式化し、適格なペプチドおよびペプチド結合モチーフを生成するためのいくつかの探索方法からなるシステムを提案する。
【0017】
その観点から、例示的な実施形態は、これらの適格なペプチドを生成するためのペプチド生成を伴う4つの探索方法を提示する。モンテカルロ木探索(MCTS)、変分オートエンコーダを用いたベイズ最適化(BO-VAE)、変分オートエンコーダを用いたバックプロパゲーション(BP-VAE)、位置重み行列からのサンプリング(sPWM)である。SARS-CoV-2のようなウイルスのゲノムから、あるいは患者の腫瘍サンプルの塩基配列決定から得られたペプチドの定義済みライブラリが提供されている場合、MCTS、BO-VAEおよびBP-VAEに基づく探索方法は、定義済みペプチドを出発ペプチド(シード)として免疫療法に適格なペプチドを生成するために使用することができる。
【0018】
ウイルスゲノムまたはいくつかの腫瘍細胞が与えられた場合、例示的な方法は、配列決定に続いて、ウイルスまたは腫瘍細胞を一意に特定することができるペプチドのライブラリを抽出するために、いくつかの市販のペプチド処理パイプラインを実行する。
【0019】
ペプチド生成のためのMCTS法は以下の通りであり、cpuctは0.5に設定される。
【0020】
MCTS法に関して、各状態はアミノ酸の配列である。ルート状態は空の配列である。
【0021】
各状態について、1つのアミノ酸を選択することができ、それをこの状態の配列に付加することによって次の状態を得ることができる。
【0022】
UCB1式で最大値を持つアミノ酸を選択する。
【0023】
【0024】
ここで、cpuctは搾取と探索とのトレードオフであり、N(s,a)は状態動作ペアの訪問回数であり、N(s)は状態sの訪問回数であり、riは状態動作ペアを通るi番目のロールアウトの最大表現スコアである。
【0025】
新たな状態が木に追加される。
【0026】
長さl≧8の配列を有する各状態sについて、例示的な方法は、例えば、MHCFlurry2.0を使用して、その配列p(s)の提示スコアを評価することができる。
【0027】
終端状態は長さl=15の配列を持つ。
【0028】
終端状態に達した後、例示的な方法は、提示スコア
【数2】
をバックプロパゲートする。その中で
【数3】
である。
【0029】
BO-VAEおよびBP-VAEの両方において、例示的な方法は、まず、データベース内のすべての可能なペプチドを再構築するために、変分オートエンコーダ(VAE)を訓練し、これにより、ペプチド配列は、連続埋め込みベクトルに変換される。次に多層パーセプトロン(MLP)を訓練し、各対立遺伝子のペプチド埋め込み入力からペプチドの提示スコアを予測する(MLP予測子は対立遺伝子特異的である)。その後、ベイズ最適化またはバックプロパゲーションが適用され、ペプチド埋め込みに対する提示スコアが最大化される。
【0030】
【0031】
BO-VAEでは、VAEモデルは、可変長のペプチド配列を固定サイズの連続潜在埋め込みに変換するように事前に訓練される。このVAEモデルによるペプチド配列の再構成精度は95%以上である。対立遺伝子が与えられた場合、Radial Basis Function(RBF)カーネルを用いたベイズ最適化アルゴリズムにより、最適化された潜在埋め込みから解読されるペプチド配列が高い提示スコアを持つように、最大tステップでランダムな潜在埋め込みを最適化する。各ステップにおいて、BO-VAEは生成されたペプチドの提示スコアを例えばMHCflurry2.0で評価し、提示スコアが閾値より大きければ最適化を停止し、ペプチドを出力する。
【0032】
BP-VAEの場合、例えばMHCFlurry2.0から提示スコアを学習するために、BO-VAEと同じ変分オートエンコーダを持つstudentモデルが採用される。訓練したstudentモデルを得た後、BP-VAEはstudentモデルから予測される提示スコアを最大化するために、勾配上昇を通してペプチドの潜在埋め込みを最適化することにより、ペプチドを生成することができる。tステップでデコードされたペプチド配列は、例えばMHCFlurry2.0で評価される。
【0033】
sPWMでは、各MHCタンパク質について、その対立遺伝子について陽性提示ペプチドから計算されたすべてのl位置のアミノ酸分布からサンプリングして、長さlのペプチドを生成する。生成されたペプチドの長さlを決定するために、例示的な方法では、長さ8を15%の確率で、長さ9-11を20%の確率で、長さ12を10%の確率で、長さ13-15を5%の確率で、それぞれサンプリングする。その確率は、長さが8から11までのペプチドの中で最も適格なものに従って決定される。
【0034】
結論として、例示的な実施形態は、所定のMHC対立遺伝子によって提示され得る適格なペプチドを生成するために、ペプチド生成を伴う4つの検索方法を導入する。SARS-CoV-2のようなウイルスのゲノムから、あるいは患者の腫瘍サンプルの塩基配列決定から得られたペプチドの定義済みライブラリが提供されている場合、MCTS、BO-VAEおよびBP-VAEに基づく検索方法は、定義済みペプチドを出発ペプチド(シード)として免疫療法に適格なペプチドを生成するために使用することができる。このシステムは、特定のタイプのウイルスや腫瘍を標的とする免疫療法用のペプチドを生成するために使用できる。
【0035】
図1は、本発明の実施形態による、免疫療法のためのペプチドワクチン設計を検索するための例示的な方法のブロック/フロー図である。
【0036】
ブロック101において、深層ニューラルネットワークを訓練するか、またはあらかじめ訓練されたモデルを採用して、MHC対立遺伝子配列とペプチド配列とからペプチド提示を予測する。
【0037】
ブロック103では、VAEを訓練して、ペプチド配列を連続埋め込みベクトルに変換してペプチドを再構築し、新たなペプチドを生成する。
【0038】
ブロック105において、MHCを標的とし、モンテカルロ木探索(MCTS)を実行して、いくつかの(第1のセットの)ペプチドワクチン候補を生成し、ベイズ最適化およびバックプロパゲーションを実行し、訓練されたVAEデコーダを使用して、いくつかの(第2のセットの)陽性ペプチドワクチン候補を生成する。
【0039】
ブロック107で、MHCを標的として、sPWMを使用して、いくつかの(第3のセットの)陽性ペプチドワクチン候補を生成する。
【0040】
ブロック109において、MHCFlurry2.0(または他の深層ニューラルネットワーク)を使用して、これらの結合された陽性ペプチドワクチン候補(第1、第2、および第3セット)をスクリーニングし、陽性ペプチドの最終セットを出力する。
【0041】
ブロック111において、スクリーニングされ、結合された陽性ペプチドワクチン候補セットから免疫療法のための適格ペプチドを出力し、適格ペプチドに基づいて標的MHCに対する結合モチーフを計算する。
【0042】
図2は、本発明の実施形態による、ペプチドのライブラリを標的とするペプチドワクチン設計を検索するための例示的な方法のブロック/フロー図である。
【0043】
ブロック201において、深層ニューラルネットワークを訓練するか、またはあらかじめ訓練されたモデルを採用して、MHC対立遺伝子配列とペプチド配列とからペプチド提示を予測する。
【0044】
ブロック203で、標的ウイルスまたは腫瘍細胞からペプチドのライブラリを抽出する。
【0045】
ブロック205で、VAEを訓練して、ペプチド配列を連続埋め込みベクトルに変換してペプチドを再構築し、新たなペプチドを生成する。
【0046】
ブロック207において、ペプチドの抽出されたライブラリと、変異していないものと高い配列類似性を有する対応する変異とを、開始点として使用し、モンテカルロ木探索を実行して、いくつかの(第1のセットの)ペプチドワクチン候補を生成し、ベイズ最適化およびバックプロパゲーションを実行し、訓練されたVAEデコーダを使用して、いくつかの(第2のセットの)陽性ペプチドワクチン候補を生成する。
【0047】
ブロック209で、MHCFlurry2.0(または他の深層ニューラルネットワーク)を使用して、これらの結合された陽性ペプチドワクチン候補をスクリーニングし、陽性ペプチドの最終セットを出力する。
【0048】
ブロック211では、スクリーニングされ統合された陽性ペプチドワクチン候補セットから、免疫療法に適格なペプチドを出力する。
【0049】
図3は、本発明の実施形態による、免疫療法のための結合ペプチドを検索するための例示的な実用的アプリケーション300である。
【0050】
1つの実用例300では、ペプチドが処理されて新たな適格なペプチド310が生成され、スクリーン312に表示され、ユーザ314によって分析される。本システムでは、MCTS560、BO-VAE562、BP-VAE564およびsPWM566の4つの探索手法を採用している。
【0051】
図4は、本発明の実施形態による、免疫療法のための結合ペプチドを検索するための例示的な処理システムである。
【0052】
処理システムは、システムバス502を介して他の構成要素に動作可能に結合された少なくとも1つのプロセッサ(CPU)504を含む。グラフィカルプロセッシングユニット(GPU)505、キャッシュ506、読み取り専用メモリ(ROM)508、ランダムアクセスメモリ(RAM)510、入出力(I/O)アダプタ520、ネットワークアダプタ530、ユーザインタフェースアダプタ540、およびディスプレイアダプタ550が、システムバス502に動作可能に結合されている。さらに、本システムは、MCTS560、BO-VAE562、BP-VAE564、およびsPWM566の4つの検索方法を採用している。
【0053】
記憶装置522は、I/Oアダプタ520によってシステムバス502に動作可能に結合される。記憶装置522は、ディスク記憶装置(例えば、磁気ディスク記憶装置や光ディスク記憶装置)、固体磁気装置などのいずれでもよい。
【0054】
トランシーバ532は、ネットワークアダプタ530によってシステムバス502に動作可能に結合される。
【0055】
ユーザ入力装置542は、ユーザインタフェースアダプタ540によってシステムバス502に動作可能に結合される。ユーザ入力装置542は、キーボード、マウス、キーパッド、画像捕捉装置、動作検知装置、マイク、先行する装置のうち少なくとも2つの機能を組み込んだ装置などのいずれかとすることができる。もちろん、本発明の精神を維持しつつ、他のタイプの入力装置を使用することも可能である。ユーザ入力装置542は、同じタイプのユーザ入力装置であっても、異なるタイプのユーザ入力装置であってもよい。ユーザ入力装置542は、処理システムとの間で情報の入出力を行うために使用される。
【0056】
表示装置552は、表示アダプタ550によってシステムバス502に動作可能に結合される。
【0057】
もちろん、処理システムは、当業者が容易に思いつくように、他の要素(図示せず)を含むこともでき、また、特定の要素を省略することもできる。例えば、当業者であれば容易に理解できるように、同じものの特定の実施に応じて、様々な他の入力装置および/または出力装置をシステムに含めることができる。例えば、様々なタイプの無線および/または有線の入力および/または出力装置を使用することができる。さらに、当業者であれば容易に理解できるように、様々な構成の追加のプロセッサ、コントローラ、メモリなども利用することができる。処理システムのこれらおよび他の変形は、本明細書に提供される本発明の教示を考慮すれば、当業者であれば容易に想到することができる。
【0058】
結論として、例示的な実施形態は、最初に、公開IEDBデータセット上で深層ニューラルネットワークを訓練するか、またはMHCFlurry2.0のようなあらかじめ訓練されたモデルを採用して、MHC対立遺伝子配列とペプチド配列とからペプチド提示スコア(ペプチド-MHC結合親和性と抗原処理スコアとの組み合わせ)を予測する。MHC対立遺伝子とペプチド配列とからペプチド提示スコアを予測するためのこの事前に訓練されたモデルに基づいて、例示的な実施形態は、MCTSおよびsPWMを適用して陽性ペプチドワクチン候補を生成し、例えば、MHCFlurry2.0を使用して、MCTSおよびsPWMの探索プロセス中に陽性ペプチドをスクリーニングする。VAEモデルは、可変長のペプチド配列を固定サイズの連続潜在埋め込みに変換するようにあらかじめ訓練される。MLPのようなstudentモデルは、ペプチドの埋め込みを入力としてMHCFlurry2.0の予測をシミュレートするために訓練される。例示的な実施形態は、ペプチド埋め込みにベイズ最適化またはバックプロパゲーションを適用して、提示スコアを最大化する。解が見つかった後、例示的な実施形態では、VAEを使用してそれを生成ペプチドにデコードし、例えばMHCFlurry2.0を使用して、生成ペプチドをスクリーニングする。次に、これらの生成された陽性ペプチドを結合して、最終的な陽性ペプチドセットを出力する。最後に、SARS-CoV-2のようなウイルスのゲノムから、あるいは患者の腫瘍サンプルの塩基配列決定から得られたペプチドのあらかじめ定義されたライブラリをターゲットにするために、MCTS、BO-VAEおよびBP-VAEに基づく探索方法を用いて、あらかじめ定義されたペプチドを出発ペプチド(シード)として、免疫療法のための適格なペプチドを生成することができる。
【0059】
本明細書で使用される場合、「データ」、「コンテンツ」、「情報」、および類似の用語は、様々な例示的な実施形態に従って、捕捉、送信、受信、表示、および/または記憶することができるデータを指すために互換的に使用することができる。したがって、このような用語の使用は、本開示の精神と範囲を制限するものと解釈すべきではない。さらに、演算装置が、別の演算装置からデータを受信するように本明細書で説明される場合、データは、別の演算装置から直接受信することができ、または、例えば、1つまたは複数のサーバ、リレー、ルータ、ネットワークアクセスポイント、基地局、および/またはそのようなもののような、1つまたは複数の仲介演算装置を介して間接的に受信することができる。
【0060】
当業者には理解されるように、本発明の態様は、システム、方法、またはコンピュータプログラム製品として具現化され得る。したがって、本発明の態様は、完全にハードウェア的な実施形態、完全にソフトウェア的な実施形態(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)、またはソフトウェアとハードウェアとの態様を組み合わせた実施形態の形態をとることができ、これらはすべて、本明細書では一般に「回路」、「モジュール」、「計算機」、「装置」、または「システム」と呼ぶことができる。さらに、本発明の態様は、その上に具現化されたコンピュータ可読プログラムコードを有する1つまたは複数のコンピュータ可読媒体に具現化されたコンピュータプログラム製品の形態をとることができる。
【0061】
1つまたは複数のコンピュータ可読媒体の任意の組み合わせを利用することができる。コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体とすることができる。コンピュータ可読記憶媒体は、例えば、電子式、磁気式、光学式、電磁式、赤外線式、半導体式のシステム、装置、デバイス、またはこれらの任意の適切な組み合わせであるが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例(非網羅的なリスト)としては、1本以上のワイヤを有する電気接続、ポータブルコンピュータディスケット、ハードディスク、RAM、ROM、消去可能プログラマブル読み出し専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバ、ポータブルCD-ROM、光データ記憶装置、磁気データ記憶装置、または前述の任意の適切な組み合わせが挙げられる。本明細書において、コンピュータ可読記憶媒体は、命令実行システム、装置、またはデバイスによって、またはそれらに関連して使用するためのプログラムを含むことができる、または格納することができる任意の有形媒体である。
【0062】
コンピュータ可読信号媒体は、例えば、ベースバンドまたは搬送波の一部として、その中にコンピュータ可読プログラムコードが具現化された伝搬データ信号を含むことができる。このような伝搬信号は、電磁気的、光学的、またはそれらの適切な組み合わせを含むがこれらに限定されない、様々な形態のいずれかを取ることができる。コンピュータ可読信号媒体は、コンピュータ可読記憶媒体ではなく、命令実行システム、装置、またはデバイスによって、またはそれらに関連して使用するためのプログラムを通信、伝搬、または伝送することができる任意のコンピュータ可読媒体であっても良い。
【0063】
コンピュータ可読媒体に具現化されたプログラムコードは、無線、有線、光ファイバーケーブル、RFなど、または前述の任意の適切な組み合わせを含むがこれらに限定されない、任意の適切な媒体を使用して伝送することができる。
【0064】
本発明の態様のための動作を実行するためのコンピュータプログラムコードは、Java、Smalltalk、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語などの従来の手続き型プログラミング言語、または同様のプログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組み合わせで記述することができる。プログラムコードは、完全にユーザのコンピュータ上で実行しても良いし、一部はユーザのコンピュータ上で実行しても良いし、スタンドアロンソフトウェアパッケージとして実行しても良いし、一部はユーザのコンピュータ上で実行し、一部はリモートコンピュータ上で実行してもよいし、完全にリモートコンピュータまたはサーバ上で実行しても良い。後者のシナリオでは、リモートコンピュータは、LANやWANを含むあらゆるタイプのネットワークを介してユーザのコンピュータに接続されても良いし、(例えば、インターネットサービスプロバイダーを使用してインターネットを介して)外部のコンピュータに接続されても良い。
【0065】
本発明の態様を、本発明の実施形態による方法、装置(システム)、およびコンピュータプログラム製品のフローチャート図および/またはブロック図を参照して本明細書で説明する。フローチャート図および/またはブロック図の各ブロック、ならびにフローチャート図および/またはブロック図のブロックの組み合わせは、コンピュータ可読プログラム命令によって実施できることが理解されよう。これらのコンピュータプログラム命令は、汎用コンピュータ、特殊用途コンピュータ、または他のプログラマブルデータ処理装置のプロセッサに提供され、コンピュータまたは他のプログラマブルデータ処理装置のプロセッサを介して実行される命令が、フローチャートおよび/またはブロック図ブロックまたはブロックまたはモジュールに指定された機能/動作を実施するための手段を作成するように、機械を生成することができる。
【0066】
これらのコンピュータプログラム命令は、コンピュータ可読媒体に記憶された命令が、フローチャートおよび/またはブロック図のブロックまたはモジュールで指定された機能/動作を実施する命令を含む製造品を生成するように、コンピュータ、他のプログラム可能なデータ処理装置、または他の装置に特定の方法で機能するように指示することができるコンピュータ可読媒体に記憶されても良い。
【0067】
コンピュータプログラム命令は、コンピュータ、他のプログラマブルなデータ処理装置、または他の装置にロードして、コンピュータ、他のプログラマブルな装置、または他の装置上で一連の動作ステップを実行させて、コンピュータまたは他のプログラマブルな装置上で実行される命令が、フローチャートおよび/またはブロック図ブロックまたはブロックまたはモジュールで指定された機能/動作を実施するためのプロセスを提供するような、コンピュータ実装プロセスを生成しても良い。
【0068】
本明細書で使用する「プロセッサ」という用語は、例えば、CPUおよび/または他の処理回路を含むものなど、任意の処理装置を含むことが意図されていることを理解されたい。また、「プロセッサ」という用語は複数の処理装置を指す場合があり、処理装置に関連する様々な要素が他の処理装置によって共有される場合があることも理解されたい。
【0069】
本明細書で使用する「メモリ」という用語は、例えば、RAM、ROM、固定メモリデバイス(例えば、ハードドライブ)、リムーバブルメモリデバイス(例えば、ディスケット)、フラッシュメモリなど、プロセッサまたはCPUに関連するメモリを含むことを意図している。このようなメモリは、コンピュータ読み取り可能な記憶媒体と考えても良い。
【0070】
さらに、本明細書で使用される「入力/出力デバイス」または「I/Oデバイス」という語句は、例えば、処理ユニットにデータを入力するための1つまたは複数の入力デバイス(例えば、キーボード、マウス、スキャナなど)、および/または処理ユニットに関連する結果を提示するための1つまたは複数の出力デバイス(例えば、スピーカ、ディスプレイ、プリンタなど)を含むことを意図している。
【0071】
上記は、あらゆる点で例示的かつ例示的であるが、制限的なものではないと理解され、ここに開示された発明の範囲は、詳細な説明からではなく、特許法によって許される全幅に従って解釈された請求項から決定されるものである。本明細書に示され説明された実施形態は、本発明の原理を例示に過ぎず、当業者は、本発明の範囲及び精神から逸脱することなく、様々な修正を実施することができることを理解されたい。当業者であれば、本発明の範囲と精神から逸脱することなく、様々な他の特徴の組み合わせを実施することができる。このように、特許法が要求する詳細さと特殊性をもって本発明の側面を説明したが、特許状によって請求され、保護されることを望むものは、添付の特許請求の範囲に記載されているとおりである。
【国際調査報告】