IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テラジェン バイオ カンパニー,リミテッドの特許一覧

特開2024-31787合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム
<>
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図1
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図2
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図3
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図4a
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図4b
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図5a
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図5b
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図5c
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図5d
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図6
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図7
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図8
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図9
  • 特開-合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024031787
(43)【公開日】2024-03-07
(54)【発明の名称】合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラム
(51)【国際特許分類】
   G16B 40/00 20190101AFI20240229BHJP
   G01N 33/50 20060101ALI20240229BHJP
   G01N 33/15 20060101ALI20240229BHJP
   A61K 39/00 20060101ALN20240229BHJP
【FI】
G16B40/00
G01N33/50 Z
G01N33/15 Z
A61K39/00 A
【審査請求】有
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2023071570
(22)【出願日】2023-04-25
(31)【優先権主張番号】10-2022-0105655
(32)【優先日】2022-08-23
(33)【優先権主張国・地域又は機関】KR
(71)【出願人】
【識別番号】522362903
【氏名又は名称】テラジェン バイオ カンパニー,リミテッド
(74)【代理人】
【識別番号】100091683
【弁理士】
【氏名又は名称】▲吉▼川 俊雄
(74)【代理人】
【識別番号】100179316
【弁理士】
【氏名又は名称】市川 寛奈
(72)【発明者】
【氏名】ファン,テ スン
(72)【発明者】
【氏名】ペク,スン ミョン
(72)【発明者】
【氏名】ホン,ソン ウィ
(72)【発明者】
【氏名】キム,ヘ スク
(72)【発明者】
【氏名】ノ,オン ジ
(72)【発明者】
【氏名】ジョン,ミン ホ
(72)【発明者】
【氏名】キム,ソン グァン
(72)【発明者】
【氏名】キム,イン ヨン
【テーマコード(参考)】
2G045
4C085
【Fターム(参考)】
2G045AA26
2G045AA40
2G045CB02
2G045DA36
4C085AA03
4C085BB01
4C085CC21
(57)【要約】      (修正有)
【課題】患者の対象細胞に適用する合成長ペプチドに対する切断予測情報及び合成長ペプチド内の新生抗原のHLA結合力やT細胞認識力などを予測するモデルを用いて癌ワクチンとして注入する合成長ペプチドの免疫原性に対する点数を算出する合成長ペプチドの免疫原性予測装置、方法及びコンピュータプログラムを提供する。
【解決手段】方法は、癌腫を治療する合成長ペプチドの情報を獲得する段階、合成長ペプチドをエンベディング処理、ワンホットエンコーディング処理又はBLOSUM処理で処理し、抗原特徴値を出力する段階、合成長ペプチドの位置別切断確率値ベクターを入力として切断特徴値を出力する段階、合成長ペプチド内の配列を入力として、新生抗原ペプチド配列に対する兔疫性及び結合力に関連した新生抗原特徴値を出力する段階及び抗原特徴値、切断特徴値及び新生抗原特徴値を考慮して新生抗原ペプチドの免疫原性点数を出力する段階を含む。
【選択図】図2
【特許請求の範囲】
【請求項1】
免疫原性予測装置が対象体の癌腫を治療するための合成長ペプチドについての情報を獲得する段階と、
前記免疫原性予測装置が、合成長ペプチドをエンベディング処理、ワンホットエンコーディング処理、及びBLOSUM処理のうちの一つの処理方法で処理し、処理したデータに基づいて一つ以上の抗原特徴値を出力する段階と、
前記免疫原性予測装置が、前記合成長ペプチドの位置別切断確率値ベクターを入力として一つ以上の切断特徴値を出力する段階と、
前記免疫原性予測装置が、合成長ペプチド内の新生抗原ペプチド配列、HLAクラスI配列、及びHLAクラスII配列を入力として、新生抗原ペプチド配列に対する兔疫性及び結合力に関連した一つ以上の新生抗原特徴値を出力する段階と、
前記免疫原性予測装置が、前記一つ以上の抗原特徴値、前記一つ以上の切断特徴値、及び前記一つ以上の新生抗原特徴値を考慮して前記新生抗原ペプチドの免疫原性点数を出力する段階と、を含む、免疫原性予測方法。
【請求項2】
前記新生抗原ペプチドの位置別切断確率値ベクターは、前記対象体に存在する切断酵素であるプロテオーム(Proteosome)またはカテプシン(Cathepsin)によって合成長ペプチドが切断される場合、位置別切断確率値ベクターである、請求項1に記載の免疫原性予測方法。
【請求項3】
前記兔疫性及び結合力に関連した新生抗原特徴値を出力する段階は、
T細胞活性データと、新生抗原ペプチドに対する兔疫性によって学習されたモデルを用いて兔疫性に関連した第1新生抗原特徴値を出力し、
新生抗原ペプチドとHLAクラスI及びIIに対する結合データを入力として学習されたモデルを用いて、合成長ペプチド内に存在する新生抗原ペプチドに対する結合性に対応する第2新生抗原特徴値を出力し、
前記第1新生抗原特徴値と第2新生抗原特徴値との積である第3新生抗原特徴値を出力する、請求項1に記載の免疫原性予測方法。
【請求項4】
前記一つ以上の抗原特徴値を出力する段階は、
前記合成長ペプチドの配列情報をエンベディング処理したデータによって学習されたモデルを用いて第1抗原特徴値を出力し、
前記合成長ペプチドの配列情報をワンホットエンコーディング処理したデータによって学習されたモデルを用いて第2抗原特徴値を出力し、
前記合成長ペプチドの配列情報をBLOSUM処理したデータによって学習されたモデルを用いて第3抗原特徴値を出力する、請求項1に記載の免疫原性予測方法。
【請求項5】
前記合成長ペプチドは40mer以下である、請求項1に記載の免疫原性予測方法。
【請求項6】
前記合成長ペプチドは、HLAクラスIに対応する新生抗原ペプチド配列が中央に位置する、請求項1に記載の免疫原性予測方法。
【請求項7】
複数の合成長ペプチドに対して、前記一つ以上の抗原特徴値を出力する段階、前記一つ以上の切断特徴値を出力する段階、前記一つ以上の新生抗原特徴値を出力する段階、及び前記免疫原性点数を出力する段階を繰り返し実行して、最高の免疫原性点数を有する合成長ペプチドを決定する段階をさらに含む、請求項1に記載の免疫原性予測方法。
【請求項8】
コンピュータを用いて、請求項1~7のいずれか一項に記載の方法を実行させるためにコンピュータ可読の保存媒体に保存された、コンピュータプログラム。
【請求項9】
対象体の癌腫を治療するための合成長ペプチドについての情報を獲得するデータ入力部と、
合成長ペプチドをエンベディング処理、ワンホットエンコーディング処理、及びBLOSUM処理のうちの一つの処理方法で処理し、処理したデータに基づいて一つ以上の抗原特徴値を出力する抗原特徴出力部と、
前記合成長ペプチドの位置別切断確率値ベクターを入力として一つ以上の切断特徴値を出力する切断特徴出力部と、
合成長ペプチド内に存在する新生抗原ペプチド配列、HLAクラスI配列、及びHLAクラスII配列を入力として新生抗原ペプチド配列に対する兔疫性及び結合力に関連した一つ以上の新生抗原特徴値を出力する兔疫性結合力出力部と、
前記一つ以上の抗原特徴値、前記一つ以上の切断特徴値、及び前記一つ以上の新生抗原特徴値を考慮して前記合成長ペプチドの免疫原性点数を出力する免疫原性点数出力部と、を含む、免疫原性予測装置。
【請求項10】
前記合成長ペプチドの位置別切断確率値ベクターは、前記対象体に存在する切断酵素であるプロテオーム(Proteosome)またはカテプシン(Cathepsin)によって合成長ペプチドが切断される場合、位置別切断確率値ベクターである、請求項9に記載の免疫原性予測装置。
【請求項11】
前記兔疫性結合力出力部は、
T細胞活性データと、新生抗原ペプチドに対する兔疫性によって学習されたモデルを用いて兔疫性に関連した第1新生抗原特徴値を出力し、
新生抗原ペプチドとHLAクラスI及びIIに対する結合データを入力として学習されたモデルを用いて、合成長ペプチド内に存在する新生抗原ペプチドに対する結合性に対応する第2新生抗原特徴値を出力し、
新生抗原ペプチドと第1特徴値と第2特徴値との積である第3新生抗原特徴値を出力する、請求項9に記載の免疫原性予測装置。
【請求項12】
前記抗原特徴出力部は、
前記合成長ペプチドの配列情報をエンベディング処理したデータによって学習されたモデルを用いて第1抗原特徴値を出力し、
前記合成長ペプチドの配列情報をワンホットエンコーディング処理したデータによって学習されたモデルを用いて第2抗原特徴値を出力し、
前記合成長ペプチド配列情報をBLOSUM処理したデータによって学習されたモデルを用いて第3抗原特徴値を出力する、請求項9に記載の免疫原性予測装置。
【請求項13】
前記新生抗原ペプチドは40mer以下である、請求項9に記載の免疫原性予測装置。
【請求項14】
前記合成長ペプチドは、HLAクラスIに対応する新生抗原ペプチド配列が中央に位置する、請求項9に記載の免疫原性予測装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施例は、癌ワクチンに使用される合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラムに関するものである。より具体的には、患者の対象細胞に適用する新生抗原のHLA結合力、T細胞認識力、切断予測情報などを予測するモデルを用いて、癌ワクチンとして注入する合成長ペプチド(SLP)の免疫原性に対する点数を算出することを特徴とする。
【背景技術】
【0002】
癌は全世界的に一番普遍的な死亡原因の一つである。約千万件の新しいケースが毎年発生し、全体死亡原因の約12%を占めて三番目で多くの死亡の原因になっている。ヒトの免疫体系は、胸腺から自己認識するT細胞を除去することで(thymic selection)正常細胞を攻撃しないように学習されていた。これを中枢性トレランス(central tolerance)と言う。癌は遺伝体に変異が蓄積しながら発生する疾病であり、胃癌、大膓癌、乳房癌などの固形癌細胞は平均60個程度の変異を有している一方で、発癌物質によって発生する肺癌や黒色腫はそれより多い150個程度の変異を有している。
【0003】
変異が発生すると、免疫体系が以前に見られなかった異常タンパク質を生成することになる。この場合、免疫体系は胸腺選択(thymic selection)過程で変異タンパク質と接したことがないので、変異が発生したタンパク質には免疫中枢性トレランスが作用しない。したがって、すべての変異タンパク質は潜在的に免疫原性(immunogenicity)を有していると思われる。しかし、大部分の変異は細胞内タンパク質を含む。タンパク質は腫瘍細胞の表面に接することができないから免疫細胞と直接接することができなく、変異はただ第1型主要組織適合性遺伝子複合体(class 1 Major Histocompatibility Complex;class 1 MHC、ヒトの場合はHuman Leukocyte Antigen(HLA)ともいう)を介して癌細胞の表面に8個~10個の長さの短ペプチド部分である抗原決定基(epitope)を提示する方法によってのみ兔疫細胞と接することができる。ここで、class 1 MHCに結合して腫瘍細胞の表面に提示される変異ペプチドを新抗原決定基(neoepitope)または新生抗原(neoantigen)と言い、新抗原決定基とMHC複合体をpMHC(または、ヒトの場合はpHLA)と言う。このような新抗原決定基はCD8細胞毒性T細胞(cytotoxic T cell)が癌細胞を外部攻撃者として認知することができるように手伝う一種の標識と言える。
【0004】
しかし、癌細胞が有する変異に対する免疫反応が活性化するためには、癌細胞ではない抗原提示細胞(antigen presenting cell;APC)、特に樹枝状細胞(dendritic cell)によって癌細胞由来新生抗原pMHCが樹枝状細胞(dendritic cell)にのみ発現する補助タンパク質とともにT兔疫細胞に交差提示(cross presentation)されなければならない。APCは、他の体細胞と違い、第2型MHCを介してより長いペプチドを新生抗原として提示し、これは補助細胞であるCD 4 Thelper cellを活性化させ、窮極的にclass 1 pMHC、class 2 pMHC、副刺激分子(co-stimulatory molecules)がすべて作用することで、新生抗原に対する強い兔疫性を有するCD8 cytotoxic T cellが生成される。
【0005】
このような過程によって活性化したT兔疫細胞は癌細胞を攻撃しようとするが、癌細胞は免疫チェックポイントという盾を発現して活性化したT細胞を麻痺させて免疫反応(T cell exhaustion)を抑制する。現在、臨床適用中の免疫治療剤は大部分が免疫チェックポイント阻害剤である。免疫チェックポイント阻害剤は既に活性化した後、麻痺されたT細胞が多く存在する一部の癌腫でのみ治療効果がある。しかし、多くの場合、新生抗原に対してT細胞が根本的に活性化しなかった免疫学的無視(immunological ignorance)の状態が発生するから、免疫反応が発生することができない。最近、新抗原標的癌ワクチン治療の際、免疫学的無視(immunological ignorance)があった新生抗原に対しても免疫反応が活性化する現象が発生するという事実が明かされた。すなわち、新抗原標的癌ワクチンは既存の免疫チェックポイント阻害剤の適用対象にならない癌腫に適用することができることに期待され、免疫チェックポイント阻害剤の適用対象群でも併合療法の際、より大きな治療効果を期待することができる。
【0006】
以前の癌ワクチンは「腫瘍関連抗原」を治療標的とした。これは、正常細胞よりは癌細胞で異常に多くの発現量を現す[正常]タンパク質を言う。このように、共通して現れる標的を用いれば、既製の(off-the-shelf)ワクチンを作ることができるが、中枢性トレランスによって低い抗原性(antigenicity)を有する欠点が存在し、いまだに確かな臨床効果が証明されたワクチンはない実情である。このような「腫瘍関連抗原」と違い、新生抗原には中枢性トレランスが作用しないので、理想的な癌ワクチンの標的になることができる。
【0007】
一方、MHCタンパク質を暗号化するHLA遺伝子は13,000個以上の最高の多型成(polymorphism)を有している。このような多型成は、MHCタンパク質のペプチド結合溝(peptide binding groove)配列に差を引き起こし、このために、MHCタンパク質はペプチドと多様な親和性(affinity)を有するようになる。したがって、同じ変異が発生したペプチドであっても、一部のMHCタンパク質との親和性が高い特定のHLAタイプの患者でのみ新生抗原として提示できる。このようなMHC制限(MHC restriction)のために変異が発生したペプチドのうち、ただ10%未満がMHCによって提示され、大部分の新生抗原が各患者で異なるように現れ、このような理由で癌ワクチンは各患者ごとに合わせて異に製作されなければならない。
【0008】
最近、多くの研究者が新生抗原を標的として癌ワクチンを開発して多様な臨床試験を実行している。癌ワクチンは、変異を含む合成長ペプチド(synthetic long peptide;SLP)、それをエンコーディングするmRNAまたはDNA、またはこれらを搭載した樹枝状細胞(dendritic cell)の形態としてデザイン可能である。その間、多くの研究によって8-10mer長さの最小抗原決定基(minimum epitope)を含む新生抗原ペプチドワクチンの場合、専門抗原提示細胞である樹枝状細胞(dendritic cell)だけではなく、B細胞など、非専門抗原提示細胞によって抗原が提示されるので、免疫反応を効果的に活性化させることができない反面、新生抗原を含む25mer長さのSLPは一旦樹枝状細胞に捕食され、その一部は8-10merのペプチドに分解した後、class 1 pMHCに補助タンパク質とともに提示され、一部はMHC class 2に結合して提示されて免疫反応をより効果的に活性化させるということが明かされた。したがって、SLP配列にclass 2 epitopeが含まれることが活性化にもっと効果があることを意味する。しかし、まだ新生抗原交差提示の機序に対しては分からない部分が多く、一部のSLPはclass 1 MHCに先に結合した後、ペプチダーゼ(peptidase)によって両端がトリミング(trimming)される可能性も存在する。したがって、現在まで進んだすべての前臨床及び臨床試験では新生抗原である確率が高い上位20個の変異を含むSLPまたはSLPをエンコーディングするtandem minigene mRNAまたはDNAをワクチンとして使用した。SLPやSLP mRNA/DNAの構造は新生抗原の生成を引き起こした変異を中間に配置することが通例である。ペプチドワクチンの場合には、真中に変異が位置する25mer SLP合成が難しい場合にのみ、やむを得ず変異の位置が変わるか長さが短くなるように合成したが、mRNAやDNAワクチンの場合、変異は常に真中に位置する。
【0009】
しかし、変異を真中に配置する理由に対する科学的または実験的根拠は提示されていなく、その間の研究では、SLP/mRNA/DNAシーケンスで変異の位置が免疫原性に及ぶ影響に対する質問は提示されたことがない。しかし、変異の位置が新生抗原の免疫原性に大きな影響を及ぼすというのは既に多くの研究によって明かされた事実である。したがって、本発明の発明者らは、SLPシーケンスでも変異の位置または新生抗原の位置が免疫原性に影響を与えることができると仮定した。mRNAワクチンで作られた25mer長さのペプチドのうちの一部がHLAクラスIIに結合して提示されると仮定すると、最小15個長さのペプチドが必要であるので、25merの構造で予測された9merの新生抗原を中間に配置することが変異を中間に配置することよりは有利であると仮定することができる。これを検証するために、抗原とHLAとの間の結合及び免疫原性に対する膨大な情報を収録しているImmune Epitope Database(IEDB)内の25mer長さのペプチドのうちHLAクラスIまたはIIに対する免疫原性を有する抗原を含むペプチドを対象としてHLAクラスI、IIに対応する抗原の位置を分析して特徴的な配置を見つけた。このような抗原の固有した配置を機械学習で学習して点数として算出した結果、高い点数であるほど段々高い免疫原性を表すことを証明した。これは、25merの長ペプチドが体内で分解してHLAクラスI、IIにそれぞれ結合及び免疫を引き起こして新生抗原交差提示が起こる確率を提示するものである。
【0010】
癌ワクチンは癌患者の癌予防及び癌治療に同時に使用される医薬品である。癌患者の癌組職から患者の免疫システムを活性化することができる新生抗原を掘り出し、これを合成長ペプチドでデザインしたワクチンを患者に注入して、癌再発防止、転移予防などを目的とする。効果的な癌ワクチンは、個人の固有した腫瘍類型に合う標的抗原を選択し、これに対する力強い免疫反応を導き出さなければならない。しかし、腫瘍にある抗原のうちごく一部のみがこのような特性を満たすことができ、免疫特異的で効果的な候補を識別して患者の治療に対して優先順位を指定することがとても難しいことが実情である。
【0011】
したがって、効果的な癌患者治療のために、合成長ペプチドの治療効果を予め予測する必要性が台頭しており、本発明は前述した方法論によってHLAクラスI、IIによる交差提示確率を提示することで、合成長ペプチドの免疫原性を予測することができる。
【0012】
前述した背景技術は発明者が本発明の導出するために保有していたかまたは本発明の導出過程で習得した技術情報であり、必ずしも本発明の出願前に一般公衆に公開された公知技術であるとは言えない。
【発明の概要】
【発明が解決しようとする課題】
【0013】
本明細書で開示する実施例は、患者の対象細胞に適用する合成長ペプチドに対する切断予測情報及び合成長ペプチド内の新生抗原のHLA結合力、T細胞認識力などを予測するモデルを用いて癌ワクチンとして注入する合成長ペプチドの免疫原性に対する点数を算出する合成長ペプチドの免疫原性予測装置、免疫原性予測方法及びコンピュータプログラムを提示することに目的がある。
【課題を解決するための手段】
【0014】
本発明の実施例による方法は、免疫原性予測装置が対象体の癌腫を治療するための合成長ペプチドについての情報を獲得する段階と、前記免疫原性予測装置が、合成長ペプチドをエンベディング処理、ワンホットエンコーディング処理、及びBLOSUM処理のうちの一つの処理方法で処理し、処理したデータに基づいて一つ以上の抗原特徴値を出力する段階と、前記免疫原性予測装置が、前記合成長ペプチドの位置別切断確率値ベクターを入力として一つ以上の切断特徴値を出力する段階と、前記免疫原性予測装置が、合成長ペプチド内の新生抗原ペプチド配列、HLAクラスI配列、及びHLAクラスII配列を入力として、新生抗原ペプチド配列に対する兔疫性及び結合力に関連した一つ以上の新生抗原特徴値を出力する段階と、前記免疫原性予測装置が、前記一つ以上の抗原特徴値、前記一つ以上の切断特徴値、及び前記一つ以上の新生抗原特徴値を考慮して前記新生抗原ペプチドの免疫原性点数を出力する段階とを含むことができる。
【0015】
前記一つ以上の抗原特徴値を出力する段階は、前記合成長ペプチドの配列情報をエンベディング処理したデータによって学習されたモデルを用いて第1抗原特徴値を出力し、前記合成長ペプチドの配列情報をワンホットエンコーディング処理したデータによって学習されたモデルを用いて第2抗原特徴値を出力し、前記合成長ペプチド配列情報をBLOSUM処理したデータによって学習されたモデルを用いて第3抗原特徴値を出力することができる。
【0016】
前記新生抗原ペプチドの位置別切断確率値ベクターは、前記対象体に存在する切断酵素であるプロテオーム(Proteosome)またはカテプシン(Cathepsin)によって合成長ペプチドが切断される場合、位置別切断確率値ベクターであり得る。
【0017】
前記合成長ペプチド内に存在する新生抗原の兔疫性及び結合力に関連した新生抗原特徴値を出力する段階は、T細胞活性データと、新生抗原ペプチドに対する兔疫性によって学習されたモデルを用いて兔疫性に関連した第1新生抗原特徴値を出力し、新生抗原ペプチドとHLAクラスI及びIIに対する結合データを入力として学習されたモデルを用いて、合成長ペプチド内に存在する新生抗原ペプチドに対する結合性に対応する第2新生抗原特徴値を出力し、前記第1新生抗原特徴値と第2新生抗原特徴値との積である第3新生抗原特徴値を出力することができる。
【0018】
前記合成長ペプチドは40mer以下であり得る。
【0019】
前記合成長ペプチドは、新生抗原ペプチド配列が中央に位置することができる。
【0020】
本発明の実施例によると、複数の新生抗原合成長ペプチドを含む合成長ペプチドに対して、前記一つ以上の抗原特徴値を出力する段階、前記一つ以上の切断特徴値を出力する段階、前記一つ以上の新生抗原特徴値を出力する段階、及び前記免疫原性点数を出力する段階を繰り返し実行して、最高の免疫原性点数を有する合成長ペプチドを決定する段階をさらに含むことができる。
【0021】
本発明の実施例よる装置は、対象体の癌腫を治療するための合成長ペプチドについての情報を獲得するデータ入力部と、合成長ペプチドをエンベディング処理、ワンホットエンコーディング処理、及びBLOSUM処理のうちの一つの処理方法で処理し、処理したデータに基づいて一つ以上の抗原特徴値を出力する抗原特徴出力部と、前記合成長ペプチドの位置別切断確率値ベクターを入力として一つ以上の切断特徴値を出力する切断特徴出力部と、合成長ペプチド内に存在する新生抗原ペプチド配列、HLAクラスI配列、及びHLAクラスII配列を入力として合成長ペプチド内に存在する新生抗原ペプチド配列に対する兔疫性及び結合力に関連した一つ以上の新生抗原特徴値を出力する新生抗原出力部と、前記一つ以上の抗原特徴値、前記一つ以上の切断特徴値、及び前記一つ以上の新生抗原特徴値を考慮して前記合成長ペプチドの免疫原性点数を出力する免疫原性点数出力部とを含むことができる。
【0022】
本発明の実施例によるコンピュータプログラムはコムピュトルを用いて本発明の実施例による方法のうちのいずれか一方法を実行させるために媒体に保存されることができる。
【0023】
その他にも、本発明を具現するための他の方法、他のシステム、及び前記方法を実行するためのコンピュータプログラムを記録するコンピュータ可読の記録媒体をさらに提供する。
【0024】
前述したもの以外の側面、特徴、利点は以下の図面、特許請求の範囲及び発明の詳細な説明から明らかになるであろう。
【発明の効果】
【0025】
前述した課題解決手段のいずれか一つによれば、患者の対象細胞に適用する合成長ペプチド内の新生抗原のHLA結合力、T細胞認識力、切断予測情報などを予測するモデルを用いて癌ワクチンとして注入する合成長ペプチド(SLP)の免疫原性に対する点数を算出することができる。
【図面の簡単な説明】
【0026】
図1】本発明の実施例による免疫原性予測装置(100)のブロック図である。
図2】本発明の実施例による免疫原性予測方法のフローチャートである。
図3】合成長ペプチドに対する免疫原性点数を出力するモデルの例示図である。
図4a】免疫原性予測装置(100)で用いるBLOSUM行列の例示図である。
図4b図4aのBLOSUM行列に基づいて合成長ペプチド配列に対するワンホットエンコーディング(V1)及びワンホットエンコーディングとBLOSUM行列との積(V2)でエンコーディングした例示図である。
図5a】既存のHLAクラスIまたはIIとの結合が知られた長ペプチド内のHLAクラスI及びIIに結合する新生抗原ペプチドの相対的位置に対する例示図である。
図5b】HLAクラスIに結合する新生抗原を中央に配置した合成長ペプチドに対して右側にHLAクラスIIに結合する新生抗原ペプチドの位置を予想した図である。
図5c】HLAクラスIに結合する新生抗原を中央に配置した合成長ペプチドに対して左側にHLAクラスIIに結合する新生抗原ペプチドの位置を予想した図である。
図5d】合成長ペプチドの中央に突然変異がある場合、HLAクラスIに結合する新生抗原内の突然変異の位置を一番目から五番目までと仮定した後、HLAクラスIIに結合する新生抗原の位置を予想した図である。
図6】免疫原性予測装置で捜した新生抗原ペプチドで癌成長を抑制した結果に対する図である。
図7】B16F10黒色腫マウスの皮膚癌の大きさ変化のグラフを示す例示図である。
図8】B16F10黒色腫マウスに注入された5種の合成長ペプチド(SLP)に対して、以前方法、すなわち、変異が中央に配置された方法(reference)に比べて、交差提示を勘案した方法、すなわち、HLAクラスIに対応する新生抗原を中央に配置した方法(target)に対する免疫原性予測点数を提示した図である。
図9】免疫原性予測装置(100)に入力されるベクターの例示図である。
図10】癌データベースであるTCGA(The Cancer Genome Atlas)内でよく観測される変異(recurrent variant)及び一度ずつのみ観測される変異(non-recurrent variant)関連の合成長ペプチドの免疫原性を本発明の免疫原性予測装置で予測した結果の例示図である。
【発明を実施するための形態】
【0027】
以下、添付図面に示す本発明の実施例に基づいて本発明の構成及び作用を詳細に説明する。
【0028】
本発明は多様な変換を加えることができ、さまざまな実施例を有することができるが、特定の実施例を図面に例示し、詳細な説明で詳細に説明しようとする。本発明の効果及び特徴、かつそれらを達成する方法は図面に基づいて詳細に後述する実施例を参照すると明らかになるであろう。しかし、本発明は以下で開示する実施例に限定されるものではなく、多様な形態に具現可能であろう。
【0029】
以下、添付図面に基づいて本発明の実施例を詳細に説明する。図面を参照して説明するに際して、対応する構成要素は同じ図面符号を付与し、これについての重複説明は省略する。
【0030】
本明細書で、「学習」、「ラーニング」などの用語はヒトの教育活動のような精神的作用を指称するように意図されたものではなく、手順によるコンピューティング(computing)によって機械学習(machine learning)を実行することを示す用語と解釈する。
【0031】
以下の実施例で、第1、第2などの用語は限定的な意味ではなく、一構成要素を他の構成要素と区別する目的で使用する。
【0032】
以下の実施例で、単数の表現は文脈上明白に他に指示しない限り、複数の表現を含む。
【0033】
以下の実施例で、含むまたは有するなどの用語は明細書上に記載された特徴または構成要素が存在することを意味するものであり、一つ以上の他の特徴または構成要素が付加される可能性を予め排除するものではない。
【0034】
図面では、説明の便宜のために、構成要素の大きさが誇張または縮小することがある。例えば、図面で現れた各構成の大きさ及び厚さは説明の便宜のために任意に示したものなので、本発明が必ずしも図示のものに限定されない。
【0035】
ある実施例が他に具現可能な場合、特定の工程順序では説明の順序とは異なるように実行されることもできる。例えば、連続して説明する二つの工程は実質的に同時に実行されることもでき、説明の順序と反対の順序に実行されることもできる。
【0036】
新生抗原は、突然変異、遺伝子間の異常融合(Gene Fusion)、異常スプライシング(aberrant Alternative Splicing)などによって算出されて免疫反応を引き起こすペプチドを意味する。すなわち、新生抗原は免疫原性ペプチドであり得る。新生抗原は患者の腫瘍でのみ選別的に発現するので、腫瘍に特定のT細胞の反応を誘導することができる。新生抗原は腫瘍細胞特異的突然変異によって誘導でき、腫瘍細胞の抗原決定基で示すことができる。以下では、説明の簡潔性のために、免疫原性ペプチドを新生抗原ペプチドと名付けて説明する。
【0037】
本明細書で、ワクチンに含まれる合成長ペプチド(SLP;Synthetic long peptide)は40mer以下の長さを有することができ、複数のペプチドに分解できる。分解されたペプチドはHLAクラスI及び/またはHLAクラスIIなどに結合できる。分解されたペプチドはHLAクラスI及び/またはHLAクラスIIなどに結合した後、T細胞によって免疫反応を引き起こすことができる。
【0038】
ここで、ペプチドは、アミノ酸配列が成すペプチドまたはポリペプチドを意味することができる。生命体内には、各種の遺伝情報に来由しない外部物質を除去するための免疫システムが存在し、特に、外部来由ペプチドのうち免疫反応を引き起こすことができる免疫原性ペプチドが存在する。癌発生過程で原本遺伝情報と異なるように発生する突然変異もこのような免疫原性ペプチドを生成し、このようなペプチドは一連の免疫システム内の過程を経てHLAクラスIまたはIIと結合することができる。さらに、前記免疫原性ペプチドは突然変異アミノ酸配列を有することができ、そのアミノ酸の長さは25個以下であり得るが、これに限定されず、多様な長さを有することができる。
【0039】
ここで、T細胞活性データとは、特定のHLAクラスIまたはII対立遺伝子に対して特定のペプチド配列が結合することによって刺激されたときに発生する免疫反応を測定したデータであり、multimer/tetramer、ELISPOTを含む免疫原性測定実験方法論によって検出された細胞内サイトカイン発現値及び兔疫細胞特異的活性マーカーの発現値などのデータとして獲得される。
【0040】
ここで、新生抗原ペプチドは40mer以下であり得る。合成長ペプチドは、HLAクラスIに結合する新生抗原配列が中央に位置することができる。
【0041】
図1は本発明の実施例による免疫原性予測装置100のブロック図である。
【0042】
データ入力部110は合成長ペプチドの配列を入力データとして入力することができる。モデルの学習のために患者に注入する合成長ペプチドと同じ長さを有する長ペプチド、特に長ペプチドが分解して生成されるペプチドのうちHLAクラスI及びIIに結合する新生抗原が存在する長ペプチドの配列を入力データとして入力することができる。
【0043】
データ入力部110は、患者の癌疾病を考慮して患者に適用可能な合成長ペプチドの候補を検索し、このような合成長ペプチドの候補に対して入力データを生成することができる。
【0044】
データ入力部110は免疫抗原決定基データベース(Immune Epitope Database)データに基づいてCD8+T細胞、CD4+T細胞を活性化させる、すなわちHLAクラスI、IIに結合するペプチドのうち癌ワクチンに使う合成長ペプチドと同じ長さの長ペプチドを獲得することができる。CD8+T細胞活性はHLAクラスIと結合情報が存在する抗原決定基を収集し、CD4+T細胞活性はHLAクラスIIと結合情報が存在する抗原決定基を収集することができる。ここで、このような免疫原性を有する長ペプチドは、Acidic-Aromatic-Basicのアミノ酸が順に配置される独特なパターンであり得る。
【0045】
抗原特徴出力部121は、新生抗原ペプチドの配列情報をエンベディング処理(embedding)、ワンホットエンコーディング処理(One-hot)、及びBLOSUM処理のうちの少なくとも一処理方法で処理し、処理したデータから抗原特徴値を抽出することができる。抗原特徴出力部121は、配列情報をエンベディング処理したデータによって学習されたモデル、配列情報をワンホットエンコーディング処理したデータによって学習されたモデル、及び配列情報をBLOSUM処理したデータによって学習されたモデルなどを含み、配列情報をそれぞれの方法で処理したデータを前記モデルのうちの一つに入力して抗原特徴値を出力することができる。
【0046】
エンベディング方法は、ペプチド配列に含まれたアミノ酸配列を対応値に変換することであり得る。ここで、実験的及び経験的にペプチド配列に含まれるすべてのアミノ酸配列と比較して対応値に変換することができる。
【0047】
ワンホットエンコーディング処理する方法は、ペプチド配列に含まれた一つ以上のアミノ酸配列を各位置別に0及び1に変換することであり得る。ペプチド配列に含まれた各アミノ酸配列が存在する位置は1に、各アミノ酸配列が存在しない位置は0に設定することでワンホットエンコーディングすることができる。
【0048】
BLOSUM処理する方法は、ワンホットエンコーディング行列とBLOSUM行列との間の内積を算出することを言える。
【0049】
抗原特徴出力部121は、合成長ペプチドの配列情報をエンベディング処理したデータによって学習されたモデルに入力して第1抗原特徴値を出力し、新生抗原ペプチドの配列情報をワンホット処理したデータによって学習されたモデルに入力して第2抗原特徴値を出力し、合成長ペプチドの配列情報をBLOSUM処理したデータによって学習されたモデルに入力して第3抗原特徴値を出力することができる。
【0050】
ここで、エンベディング処理したデータによって学習されたモデルは、複数の合成長ペプチドをエンベディング処理したデータを入力にとし、ペプチドの抗原特徴値を出力として学習されたモデルであり得る。このモデルを学習するのに用いられる合成長ペプチドの抗原特徴値は、データベースに保存された値、または実験によって獲得した値を用いることができる。
【0051】
ワンホット処理したデータによって学習されたモデルは、複数の合成長ペプチドをワンホット処理したデータを入力とし、合成長ペプチペプチドドの抗原特徴値を出力として学習されたモデルであり得る。このモデルを学習するのに用いられるペプチドの抗原特徴値は、データベースに保存された値、または実験によって獲得した値を用いることができる。
【0052】
BLOSUM処理したデータによって学習されたモデルは、複数の合成長ペプチドをBLOSUM処理したデータを入力とし、合成長ペプチドの抗原特徴値を出力として学習されたモデルであり得る。このモデルを学習するのに用いられる合成長ペプチドの抗原特徴値は、データベースに保存された値、または実験によって獲得した値を用いることができる。
【0053】
切断特徴出力部122は、合成長ペプチドの配列情報から切断確率値のベクターを生成することができる。切断特徴出力部122は、切断確率値のベクターを入力として学習された切断予測モデルを用いて切断特徴値を出力することができる。
【0054】
ここで、切断予測モデルは、合成長ペプチドの位置別切断確率値ベクター、合成長ペプチドを介して切断特徴値の学習データによって学習されたモデルであり得る。合成長ペプチドは、患者、動物などの身体内に注入されれば、身体内に存在する所定の物質によって切断されて分解される。ここで、合成長ペプチドを切断させる物質としては、プロテオーム(Proteasome)、カテプシン(Cathepsin)などがあり得る。
【0055】
合成長ペプチドは2個以上のペプチドに切断され、身体内のHLAクラスI及び/またはHLAクラスIIに結合して動作することができる。切断されたペプチドのうちの一部はHLAクラスIと結合し、切断されたペプチドのうちの一部はHLAクラスIIと結合することができる。
【0056】
兔疫性結合力出力部123は、合成長ペプチド内に存在する新生抗原ペプチド配列、HLAクラスI配列、及びHLAクラスII配列を入力とし、新生抗原ペプチド配列に対する兔疫性及び結合力に関連した新生抗原特徴値を出力することができる。ここで、兔疫性結合力出力部123は、T細胞活性データとして、ペプチドに対する兔疫性によって学習されたモデルを用いて、兔疫性に関連した第1特徴値を出力することができる。
【0057】
兔疫性結合力出力部123は、T細胞活性データと、合成長ペプチド内に存在するペプチド及びHLAクラスIまたはII対立遺伝子配列を入力とし、ペプチドに対する兔疫性に対応する第1新生抗原特徴値を出力することができる。兔疫性結合力出力部123はT細胞活性データと、ペプチドに対する兔疫性によって学習されたモデルを用いてペプチドに対する兔疫性に対応する第1新生抗原特徴値を出力することができる。
【0058】
兔疫性結合力出力部123は、合成長ペプチド内に存在するペプチドとHLAクラスIまたはIIに対する結合データを入力とし、ペプチドに対する結合性に対応する第2新生抗原特徴値を出力することができる。
【0059】
兔疫性結合力出力部123は、第1新生抗原特徴値と第2新生抗原特徴値との積によって算出される第3新生抗原特徴値を出力することができる。
【0060】
合成長ペプチドは、対象体内で切断及び分解された後、HLAクラスI及びHLAクラスIIに結合して治療効果を出すことができる。合成長ペプチド内に存在するペプチドがHLAクラスIまたはHLAクラスIIに結合する程度は結合性に関連した第2新生抗原特徴値として予測できる。合成長ペプチド内に存在するペプチドが対象体の兔疫性を高める程度は兔疫性に関連した第1新生抗原特徴値によって予測できる。
【0061】
免疫原性点数出力部130は、第1~第3抗原特徴値、切断特徴値、及び第1~第3新生抗原特徴値を考慮して、ペプチドに対する免疫原性点数を出力することができる。ペプチドに対する免疫原性点数は、第1~第3抗原特徴値、切断特徴値、及び第1~第3新生抗原特徴値を入力として出力される値であり得る。ここで、ペプチドに対する免疫原性点数は、第1~第3抗原特徴値、切断特徴値、及び第1~第3新生抗原特徴値によって学習されたモデルに対する返還値によって決定することができる。第1~第3抗原特徴値、切断特徴値、及び第1~第3新生抗原特徴値によって学習されたモデルは、機械学習法で学習され、教師あり学習、教師なし学習、強化学習などの方法で学習できる。
【0062】
図2は本発明の実施例による免疫原性予測方法のフローチャートである。
【0063】
S110では、免疫原性予測装置100は、対象体の癌腫を治療するための合成長ペプチドについての情報を獲得することができる。免疫原性予測装置100は、合成長ペプチド及び合成長ペプチドが分解して生成されたペプチド、ペプチドの結合位置についての情報を入力データとして入力することができる。合成長ペプチド及び合成長ペプチドが分解して生成されたペプチドについての情報、ペプチドが対象細胞内に結合する場合の結合位置についての情報は、外部のデータベースから学習したモデルから獲得することができる。
【0064】
免疫原性予測装置100は、患者の癌疾病を考慮して、患者に適用可能な合成長ペプチドの候補を検索し、このような合成長ペプチドの候補に対して、入力データを生成することができる。
【0065】
S120では、免疫原性予測装置100は、合成長ペプチドの配列情報をエンベディング処理(embedding)、ワンホットエンコーディング処理(One-hot)、及びBLOSUM処理うちの少なくとも一つの処理方法で処理し、処理したデータから抗原特徴値を抽出することができる。免疫原性予測装置100は、配列情報をエンベディング処理したデータによって学習されたモデル、配列情報をワンホットエンコーディング処理したデータによって学習されたモデル、配列情報をBLOSUM処理したデータによって学習されたモデルなどを含み、配列情報をそれぞれの方法で処理したデータを前記モデルのうちの一つに入力して抗原特徴値を出力することができる。
【0066】
エンベディング方法はペプチド配列に含まれたアミノ酸配列を対応値に変換することであり得る。ここで、実験的及び経験的にペプチド配列に含まれるすべてのアミノ酸配列と比較して対応値に変換することができる。
【0067】
ワンホットエンコーディング処理する方法は、ペプチド配列に含まれた一つ以上のアミノ酸配列を各位置別に0及び1に変換することであり得る。
【0068】
BLOSUM処理する方法は、ワンホットエンコーディング行列とBLOSUM行列との間の内積を算出することを言える。
【0069】
免疫原性予測装置100は、合成長ペプチドの配列情報をエンベディング処理したデータによって学習されたモデルに入力して第1抗原特徴値を出力し、新生抗原ペプチドの配列情報をワンホット処理したデータによって学習されたモデルに入力して第2抗原特徴値を出力し、新生抗原ペプチドの配列情報をBLOSUM処理したデータによって学習されたモデルに入力して第3抗原特徴値を出力することができる。
【0070】
ここで、エンベディング処理したデータによって学習されたモデルは、複数の合成長ペプチドをエンベディング処理したデータを入力とし、ペプチドの抗原特徴値を出力として学習されたモデルであり得る。このモデルを学習するのに用いられる合成長ペプチドの抗原特徴値は、データベースに保存された値、または実験によって獲得した値を用いることができる。
【0071】
ワンホット処理したデータによって学習されたモデルは、複数の合成長ペプチドをワンホット処理したデータを入力とし、ペプチドの抗原特徴値を出力として学習されたモデルであり得る。このモデルを学習するのに用いられる合成長ペプチドの抗原特徴値は、データベースに保存された値、または実験によって獲得した値を用いることができる。
【0072】
BLOSUM処理したデータによって学習されたモデルは、複数の合成長ペプチドをBLOSUM処理したデータを入力とし、ペプチドの抗原特徴値を出力として学習されたモデルであり得る。このモデルを学習するのに用いられる合成長ペプチドの抗原特徴値は、データベースに保存された値、または実験によって獲得した値を用いることができる。
【0073】
S130では、免疫原性予測装置100は、合成長ペプチドの配列情報から切断確率値のベクターを生成することができる。免疫原性予測装置100は、切断確率値のベクターを入力として学習された切断予測モデルを用いて切断特徴値を出力することができる。
【0074】
ここで、切断予測モデルは、合成長ペプチドの位置別切断確率値ベクター、合成長ペプチドを介して切断特徴値の学習データによって学習されたモデルであり得る。合成長ペプチドは、患者、動物などの身体内に注入されれば、身体内に存在する所定の物質によって切断されて分解できる。ここで、合成長ペプチドを切断させる物質としては、プロテオーム(Proteosome)、カテプシン(Cathepsin)などがあり得る。
【0075】
合成長ペプチドは2個以上のペプチドに切断され、人体内のHLAクラスI及び/またはHLAクラスIIと結合して動作することができる。切断されたペプチドのうちの一部はHLAクラスIと結合し、切断されたペプチドのうちの一部はHLAクラスIIと結合することができる。
【0076】
S140では、免疫原性予測装置100は、合成長ペプチド配列、HLAクラスI配列、及びHLAクラスII配列を入力として、合成長ペプチド内に存在する新生抗原ペプチド配列に対する兔疫性及び結合力に関連した特徴値を出力することができる。ここで、免疫原性予測装置100は、T細胞活性データとペプチドに対する兔疫性によって学習されたモデルを用いることができる。
【0077】
免疫原性予測装置100は、T細胞活性データとして、合成長ペプチド及びHLAクラスII対立遺伝子配列を入力とし、合成長ペプチド内に存在する新生抗原ペプチド配列に対する兔疫性に対応する第1新生抗原特徴値を出力することができる。免疫原性予測装置100は、T細胞活性データと、新生抗原ペプチドに対する兔疫性によって学習されたモデルを用いて新生抗原ペプチドに対する兔疫性に対応する第1新生抗原特徴値を出力することができる。
【0078】
免疫原性予測装置100は、合成長ペプチドとHLAクラスIまたはIIに対する結合データを入力とし、合成長ペプチド内に存在する新生抗原ペプチドに対する結合性に対応する第2新生抗原特徴値を出力することができる。
【0079】
免疫原性予測装置100は、第1新生抗原特徴値と第2新生抗原特徴値とを掛けた第3新生抗原特徴値を出力することができる。
【0080】
合成長ペプチドは、対象体内に存在するHLAクラスI及びクラスIIに結合して治療効果を出力することができる。合成長ペプチドがHLAクラスIまたはIIに結合する程度は結合性に関連した第2新生抗原特徴値、または第3新生抗原特徴値によって予測できる。ペプチドが対象体の兔疫性を高める程度は兔疫性に関連した第1新生抗原特徴値によって予測できる。
【0081】
S150では、免疫原性予測装置100は、第1~第3抗原特徴値、切断特徴値、第1~第3新生抗原特徴値を考慮して、ペプチドに対する免疫原性点数を出力することができる。ペプチドに対する免疫原性点数は、第1~第3抗原特徴値、切断特徴値、第1~第3新生抗原特徴値を入力として出力される値であり得る。ここで、ペプチドに対する免疫原性点数は、第1~第3抗原特徴値、切断特徴値、第1~第3新生抗原特徴値によって学習されたモデルに対する返還値によって決定できる。第1~第3抗原特徴値、切断特徴値、及び第1~第3新生抗原特徴値に学習されたモデルは、機械学習方法で学習され、教師あり学習、教師なし学習、強化学習などの方法で学習できる。
【0082】
図3は合成長新生抗原ペプチドに対する免疫原性点数を出力するモデルの例示図である。
【0083】
本発明の実施例による免疫原性予測装置100は、入力データを入力するデータ入力部Input、抗原特徴出力部M1、切断特徴出力部M2、兔疫性結合力予測部M3、予測点数出力部OMを含むことができる。
【0084】
データ入力部Inputは、合成長ペプチドについてのデータを入力することができる。合成長ペプチドについてのデータは、合成長ペプチド情報、合成長ペプチド内の新生抗原ペプチドの位置情報、合成長ペプチド内の切断位置情報、切断されたペプチドについてのデータを含むことができる。合成長ペプチドは25merのペプチド(Synthetic long peptide、SLP)であり得るが、これに限定されない。ここで、合成長ペプチドは、新生抗原の生成をもたらした変異を含むことができる。合成長ペプチドに含まれた変異の位置は、真中だけでなく、HLAクラスIまたはクラスIIのそれぞれに対応する新生抗原ペプチドが合成長ペプチド内で発見される主要位置を考慮して、新生抗原ペプチドの位置を真中に変更することができる。
【0085】
合成長ペプチドの免疫原性を学習するために使用するデータはデータベースから獲得することができる。ここで、データベースから獲得した癌ワクチンとして使用される合成長ペプチドと同じ長さの長ペプチドのうちHLAクラスIまたはIIに結合する情報を有する免疫原性ペプチドに対する訓練データによって学習できる。また、同じ長さの長ペプチドのうちHLAクラスIまたはIIに結合しない情報を有する非免疫原性ペプチドに対する訓練データによって学習できる。
【0086】
抗原特徴出力部M1は、合成長ペプチドをエンベディング、ワンホット、BLOSUMなどの処理法で処理し、処理されたペプチドに対して抗原特徴値を出力することができる。抗原特徴出力部M1は、エンベディング処理したペプチドのデータから第1抗原特徴値m11を出力する第1モデルCNN、GRU、ワンホット処理したペプチドのデータから第2抗原特徴値m12を出力する第2モデルCNN、GRU、及びBLOSUM処理したペプチドのデータから第3抗原特徴値m13を出力する第3モデルCNN、GRUを含むことができる。
【0087】
切断特徴出力部M2は、合成長ペプチドの位置別切断確率値のベクターを入力として切断特徴値を出力することができる。合成長ペプチドは注入される対象体内に存在するプロテオーム(Proteosome)またはカテプシン(Cathepsin)などの酵素によって切断でき、切断された位置によって分解された新生抗原ペプチドの免疫原性は変更できる。よって、合成長ペプチドの切断位置を考慮して免疫原性を予測することができる。
【0088】
切断特徴出力部M2は、対象体に存在する酵素、例えばカテプシン、プロテオーム、それぞれに対する位置別切断確率値ベクターに基づいて切断特徴値を出力することができる。より具体的には、切断特徴出力部M2は、カテプシンによって新生抗原ペプチドの位置別切断確率値ベクターを入力として学習されたモデルGRUを介して第1切断特徴値m21を出力することができる。切断特徴出力部M2は、プロテオームによって新生抗原ペプチドの位置別切断確率値ベクターを入力として学習されたモデルGRUを介して第2切断特徴値m22を出力することができる。カテプシン、プロテオームに対する位置別切断確率値ベクターを例示にしたが、これに限定されず、多様な物質に対する位置別切断確率値ベクターを入力とするモデルをさらに追加することができる。また、学習モデルとして、CNN、GRUなどを例示したが、これに限定されず、多様な学習モデルを適用することができる。
【0089】
兔疫性結合力出力部M3は、合成長ペプチド内の新生抗原ペプチド配列、HLAクラスI配列、及びHLAクラスII配列を入力として、新生抗原ペプチド配列に対する兔疫性及び結合性に関連した特徴値を出力することができる。一つ以上の結合力を予測するモデル、一つ以上の兔疫性を予測するモデルなどを用いて、合成長ペプチド内の新生抗原ペプチドがHLAクラスI及びHLAクラスIIに結合する程度、結合した後に作用する新生抗原ペプチドの兔疫性程度を出力することができる。
【0090】
より具体的には、兔疫性結合力出力部M3は、合成長ペプチド内の新生抗原ペプチドとHLA対立遺伝子との間の結合関係に対する結合データを入力として学習されたモデルCNN-GRUを用いて結合力に関連した第1特徴値m31を出力することができる。
【0091】
兔疫性結合力出力部M3は、合成長ペプチド内の新生抗原ペプチド配列に対するもの、及び/またはHLAクラスI、II対立遺伝子配列に対するT細胞活性データを入力として学習されたモデルを用いて新生抗原ペプチドの兔疫性に対応する第2特徴値m32を出力することができる。
【0092】
兔疫性結合力出力部M3は、第1新生抗原特徴値m31と第2新生抗原特徴値m32との積を取った第3新生抗原特徴値m33を出力することができる。
【0093】
免疫原性点数出力部OMは、M1から出力された値m11、m12、m13、M2から出力された値m21、m22、及びM3から出力された値m31、m32、m33を入力として合成長ペプチドに対する免疫原性点数を出力することができる。
【0094】
合成長ペプチド、合成長ペプチド内の変異位置、合成長ペプチドの位置別切断確率値に対応する値、合成長ペプチド内の新生抗原ペプチドの結合力程度、兔疫性程度などの値が入力されれば、これによる合成長ペプチドに対する免疫原性点数が出力されるように設計できる。免疫原性点数は、immunogenic、non-immunogenicの値として出力できる。免疫原性点数出力部OMに、M1から出力された値m11、m12、m13、M2から出力された値m21、m22、及びM3から出力された値m31、m32、m33が入力されれば、ヒドゥンレイヤーを介して出力される値の組合せとして、immunogenic、non-immunogenicの値が出力できる。
【0095】
前記モデルは、教師あり学習(supervised learning)、教師なし学習(unsupervised learning)、自己管理学習(self-supervised learning)、クラスタリング(clustering)、異常検出(anomaly detection)などの方法で学習されたモデルであり得る。
【0096】
図4aは免疫原性予測装置100で用いるBLOSUM行列の例示図である。
【0097】
図4bは図4aのBLOSUM行列に基づいて合成長ペプチド配列に対するワンホットエンコーディング(V1)及びワンホットエンコーディングとBLOSUM行列との間の積(V2)でエンコーディングした例示図である。
【0098】
前記方法により、合成長ペプチド配列に対するエンコーディングを一つ以上のCNNに入力して特徴値を抽出し、このような特徴値をGRUで学習させ、エンコーダーで導出することができる。
【0099】
図5aは、合成長ペプチド内に存在する新生抗原ペプチドのうち、HLAクラスI、IIのそれぞれに対応するペプチドの合成長ペプチド内の主要位置に対する例示図である。
【0100】
合成長ペプチドA11は、図面に示すように、25merの長さを有することができる。合成長ペプチドA11は、A12、A13のように切断されてHLAクラスIまたはIIなどに結合することができる。合成長ペプチド内の第1部分4~12、第2部分13~21には、HLAクラスIに対応する新生抗原ペプチドが主に発見される。合成長ペプチド内の第3部分6~20にはHLAクラスIIに対応する新生抗原ペプチドが主に発見される。対象体に注入された合成長ペプチドA11は対象体に存在する切断酵素によって、A12、A13のように切断された後、HLAクラスIまたはIIに結合して動作することができる。HLAクラスIに対応する新生抗原ペプチドが25merの中央に配置される場合、HLAクラスIIに対応する抗原決定基がよく保存されることが分かる。
【0101】
図5bは他の方法で配置された合成長ペプチド内のHLAクラスI及びIIに対応する新生抗原ペプチドの例示図である。
【0102】
A21に示すように、合成長ペプチド内に左側に配置されたHLAクラスIに対応する新生抗原ペプチドA21を中央に配置した25merの場合、クラスIIの抗原決定基が合成長ペプチドの長さ以内に配置でき、交差提示による免疫効果が増大することができる。
【0103】
図5cはさらに他の方法で配置された新生抗原ペプチドの例示図である。
【0104】
A31に示すように、合成長ペプチド内に右側に配置されたHLAクラスIに対応する新生抗原ペプチドA21を中央に配置した25merの場合、クラスIIの抗原決定基が合成長ペプチドの長さ以内に配置でき、交差提示による免疫効果が増大することができる。
【0105】
図5dはさらに他の方法で配置された新生抗原ペプチドの例示図である。
【0106】
合成長ペプチド内の変異配置情報はHLAクラスIに対応する新生抗原ペプチドの一番目~五番目またはそれ以上の位置に変更できる。
【0107】
合成長ペプチド内のHLAクラスIに対応する新生抗原ペプチドの変異が、新生抗原ペプチド内の一番目の位置である合成長ペプチドの真中にA41のように変更できる。この場合、HLAクラスIIに結合する抗原決定基は合成長ペプチドの長さ内に存在せずに切られるので、交差提示が起こらなくなる。
【0108】
合成長ペプチド内のHLAクラスIに対応する新生抗原ペプチドの変異が、新生抗原ペプチド内の二番目の位置及び合成長ペプチドの真中にA42のように変更できる。この場合、HLAクラスIIに結合する抗原決定基は合成長ペプチドの長さ内に存在せずに切られるので、交差提示が起こらなくなる。
【0109】
合成長ペプチド内のHLAクラスIに対応する新生抗原ペプチドの変異が、新生抗原ペプチド内の三番目の位置及び合成長ペプチドの真中にA43のように変更できる。この場合、HLAクラスIIに結合する抗原決定基は合成長ペプチドの長さ内に存在せずに切られるので、交差提示が起こらなくなる。
【0110】
合成長ペプチド内のHLAクラスIに対応する新生抗原ペプチドの変異が、新生抗原ペプチド内の四番目の位置及び合成長ペプチドの真中にA44のように変更できる。この場合、HLAクラスIIに結合する抗原決定基は合成長ペプチド長さ内に存在せずに切られるので、交差提示が起こらなくなる。
【0111】
合成長ペプチド内のHLAクラスIに対応する新生抗原ペプチドの変異が、新生抗原ペプチド内の5番目の位置及び合成長ペプチドの真中にA45のように変更できる。この場合、HLAクラスIIに結合する抗原決定基は合成長ペプチドの長さ内に存在し、以後に交差提示が可能になる。すなわち、合成長ペプチド内の変異位置は、真中ではない位置に配置され、HLAクラスIIに対応する抗原決定基が切られない位置のうちの一つに配置されるように設計できる。
【0112】
本発明の実施例による免疫原性予測装置100は、合成長ペプチド内のHLAクラスI及びIIに対応する新生抗原ペプチド及び変異による免疫原性を予測することができる。
【0113】
図6は、免疫原性予測装置で探した合成長ペプチドで黒色腫マウスモデルを処理して癌成長を抑制した結果に対する図である。
【0114】
同じ癌腫の対象体に、免疫原性予測装置100で最高の免疫原性点数を有する合成長ペプチドで治療した結果は、ターゲット(target)のように癌成長が抑制されることが分かる。同じ癌腫の対象体に、他の方法、すなわち変異を中央に配置した合成長ペプチドを処理した結果は、基準(reference)のように癌成長が抑制されるが、本発明の結果に比べて効率的ではないことが分かる。同じ癌腫の対象体に何らの治療も実施しなかった結果は、非処理(No treatment)のように癌細胞の大きさが増加し、癌成長が加速化する。図6に示すように、免疫原性予測装置100で決定された合成長ペプチドで治療した場合の癌成長抑制効果が、他の方法、すなわち変異を中央に配置した合成長ペプチドよりずっと高いことが分かる。
【0115】
図7は黒色腫B16F10マウスモデルの時間別の癌大きさ変化グラフを示す例示図である。
【0116】
図7に示すように、何らの治療も実施しなかった場合、黒色腫B16F10マウスモデルの癌の大きさは、20日目に500mmを有することに対して、本発明の実施例によって決定された合成長ペプチドで治療した場合には、20日目に100mmを有することが測定される。すなわち、本発明の実施例によって決定された合成長ペプチドで治療した場合には、腫瘍の大きさが他の比較対象よりずっと小さくて癌成長が大きく抑制されたことが分かる。
【0117】
図8はB16F10黒色腫マウスに注入された5種の合成長ペプチド(SLP)に対して、以前の方法、すなわち、変異が中央に配置された方法(reference)に比べて、交差提示を勘案した方法、すなわちHLAクラスIに対応する新生抗原を中央に配置した方法(target)に対する免疫原性予測点数を提示する図である。図8に示すように、黒色腫マウスに注入された5種の合成長ペプチドに対して、既存の方法、すなわち変異を中央に配置した合成長ペプチド(reference)に対する入力値を免疫原性予測装置のデータ入力部110に入力した後、免疫原性点数出力部130を介して免疫原性点数を予測することができる。また、同じ黒色腫マウスに対して、HLAクラスIに対応する新生抗原ペプチドを中央に配置した合成長ペプチド(target)に対する入力値を免疫原性予測装置のデータ入力部110に入力した後、免疫原性点数出力部130を介して免疫原性点数を予測することができる。互いに異なる方法で導出された予測された免疫原性点数を互いに比較した結果、癌成長抑制効果が大きかった新生抗原ペプチドを中央配置した合成長ペプチドに対する免疫原性点数がずっと大きいものであると予測されることが分かる。
【0118】
図9は免疫原性予測装置100に入力されるベクターの例示図である。
【0119】
免疫原性予測装置に入力されるベクターは、図9に示すようである。ここで、それぞれの値に対応する色で表示するイメージとして生成して免疫原性予測装置に入力できる。vvtで示すように、より濃い色はより高い確率値を示す。カテプシンによって切断される位置別確率値ベクター(VV1)及びプロテオームによって切断される位置別確率値ベクター(VV2)は切断特徴出力部122に入力されるデータであり得る。追加的に、合成長ペプチド内に存在する新生抗原ペプチドに対してHLAとの結合力の大きさを示すベクター(VV4)、T細胞活性に対する免疫原性の大きさを示すベクター(VV5)、及びVV4とVV5との積であるベクター(VV3)は兔疫性結合力出力部123を訓練するデータであり得るが、これに限定されず、多様なベクターで兔疫性結合力出力部123を訓練することができる。
【0120】
免疫原性予測装置に入力されるベクターは、図4bに示すようである。ここで、それぞれの値に対応する色で表示するイメージとして生成して免疫原性予測装置に入力できる。vvtで示すように、より濃い色はより高い確率値を示す。合成長ペプチド配列をワンホットエンコーディングした行列(VV1)、ワンホットエンコーディング行列とBLOSUM行列との積を取った行列(VV2)は抗原特徴出力部(121)を訓練するデータであり得る。
【0121】
図10は、癌データベースであるTCGA(The Cancer Genome Atlas)内に患者でよく観測される変異(recurrent variant)とまれに一度だけ観測される変異(non-recurrent variant)から導出される合成長ペプチドに対して本発明の免疫原性予測装置で予測した結果、よく観測される変異の免疫原性点数が一度だけ観測される変異の免疫原性点数に比べて格段に低いことを示す(p-value=1.17e-182)。すなわち、免疫原性の低い変位及びそれから導出される合成長ペプチドは患者の免疫システムから回避し易いので、変異がなくならず、残存してよく観測される免疫編集(Immuno-editing)現象が現れることを本発明で説明可能である。x軸は免疫原性点数を示し、y軸は各点数が発生する回数の密度(density)を示す。
【0122】
以上で説明した装置は、ハードウェア構成要素、ソフトウェア構成要素、及び/またはハードウェア構成要素及びソフトウェア構成要素の組合せによって具現できる。例えば、実施例で説明した装置及び構成要素は、例えば、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ(digital signal processor)、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令(instruction)を実行したり応答したりすることができる他の装置のように、一つ以上の汎用コンピュータまたは特殊目的のコンピュータを用いて具現できる。処理装置はオペレーティングシステム(OS)及び前記オペレーティングシステム上で実行される一つ以上のソフトウェアアプリケーションを実行することができる。また、処理装置は、ソフトウェアの実行に応答して、データを接近、保存、操作、処理及び生成することもできる。理解の便宜のために、処理装置は一つが使用されるものとして説明した場合もあるが、当該技術分野で通常の知識を有する者は、処理装置が複数の処理要素(processing element)及び/または複数類型の処理要素を含むことができることが分かる。例えば、処理装置は、複数のプロセッサまたは単一のプロセッサ及び単一のコントローラを含むことができる。また、並列プロセッサ(parallel processor)のような他の処理構成(processing configuration)も可能である。
【0123】
ソフトウェアは、コンピュータプログラム(computer program)、コード(code)、命令(instruction)、またはこれらのうちの一つ以上の組合せを含むことができ、所望の通りに動作するように処理装置を構成するか、または独立的にまたは集合的に(collectively)処理装置を命令することができる。ソフトウェア及び/またはデータは、処理装置よって解釈されるかまたは処理装置に命令またはデータを提供するために、ある類型の機械、構成要素(component)、物理的装置、仮想装置(virtual equipment)、コンピュータ保存媒体、または装置、または伝送される信号波(signal wave)によって永久的にまたは一時的に具体化(embody)することができる。ソフトウェアはネットワークを介して連結されたコンピュータシステム上に分散され、分散された方法によって保存されるかまたは実行されることもできる。ソフトウェア及びデータは一つ以上のコンピュータ可読の記録媒体に保存できる。
【0124】
実施例による方法は、多様なコンピュータ手段を介して実行できるプログラム命令の形態に具現されてコンピュータ可読の媒体に記録できる。前記コンピュータ可読の媒体は、プログラム命令、データファイル、データ構造などを単独でまたは組合せで含むことができる。前記媒体に記録されるプログラム命令は実施例のために特別に設計されて構成されたものであるか、またはコンピュータソフトウェア当業者に公知となって使用可能なものであり得る。コンピュータ判読可能記録媒体の例としては、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体(magnetic media)、CD-ROM、DVDのような光記録媒体(optical media)、フロプティカルディスク(floptical disk)のような磁気光媒体(magneto-optical media)、及びROM(Read Only Memory)、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令の例としては、コンパイラによって作られるもののような機械語コードだけではなく、インタープリターなどを介してコンピュータによって実行可能な高級言語コードを含む。上記したハードウェア装置は、実施例の動作を実行するために、一つ以上のソフトウェアモジュールとして作動するように構成されることができ、その逆も同様である。
【0125】
以上のように、実施例をたとえ限定された実施例及び図面に基づいて説明したが、当該技術分野で通常の知識を有する者であれば、前記記載から多様な修正及び変形が可能である。例えば、説明した記述を説明した方法と異なる手順に実行するか、及び/または説明したシステム、構造、装置、回路などの構成要素を説明した方法と異なる形態に結合または組合せするか、または他の構成要素または均等物に代替するか置換しても適切な結果を達成することができる。
【0126】
したがって、他の具現、他の実施例、及び特許請求の範囲と均等なものなども後述する特許請求の範囲の範囲に属する。
図1
図2
図3
図4a
図4b
図5a
図5b
図5c
図5d
図6
図7
図8
図9
図10