(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-21
(45)【発行日】2024-08-29
(54)【発明の名称】タンパク質結合部位情報取得装置、タンパク質結合部位情報取得装置の作動方法及びプログラム
(51)【国際特許分類】
C12M 1/00 20060101AFI20240822BHJP
C12M 1/34 20060101ALI20240822BHJP
G01N 33/53 20060101ALI20240822BHJP
G16B 30/00 20190101ALI20240822BHJP
C07K 16/00 20060101ALN20240822BHJP
【FI】
C12M1/00 A ZNA
C12M1/34 Z
G01N33/53 D
G16B30/00
C07K16/00
(21)【出願番号】P 2020048625
(22)【出願日】2020-03-19
【審査請求日】2023-03-08
(73)【特許権者】
【識別番号】519248656
【氏名又は名称】株式会社CUBICStars
(74)【代理人】
【識別番号】100095407
【氏名又は名称】木村 満
(74)【代理人】
【識別番号】100168114
【氏名又は名称】山中 生太
(74)【代理人】
【識別番号】100132883
【氏名又は名称】森川 泰司
(74)【代理人】
【識別番号】100111464
【氏名又は名称】齋藤 悦子
(72)【発明者】
【氏名】上田 泰己
(72)【発明者】
【氏名】松本 桂彦
(72)【発明者】
【氏名】原田 頌子
【審査官】林 康子
(56)【参考文献】
【文献】国際公開第2018/181656(WO,A1)
【文献】国際公開第2011/129379(WO,A1)
【文献】国際公開第2019/084249(WO,A1)
【文献】国際公開第2018/168999(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12M 1/00
C07K
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
抗原の部分配列と複数のランダムなアミノ酸配列との間の類似度の分布を示す第1の情報と、
ランダムな塩基配列を有するDNAライブラリに含まれるDNAから転写及び翻訳を介し
て前記
DNAに対応付けられて生成するペプチドを
前記抗原に結合する抗体に結合させて前記
DNAとともに回収することを繰り返して収束した、前記
抗体に結合するペプチドのアミノ酸配列と前記部分配列との間の類似度の分布を示す第2の情報と、の比較に基づいて、前記
抗原における前記
抗体の
エピトープのアミノ酸配列に関する情報を取得する取得部を備える、
タンパク質結合部位情報取得装置。
【請求項2】
前記取得部は、
前記第1の情報が示す前記類似度の分布と前記第2の情報が示す前記類似度の分布との距離を算出し、前記
エピトープに対する前記
抗体の結合の特異性を評価する、
請求項1に記載のタンパク質結合部位情報取得装置。
【請求項3】
前記取得部は、
前記第1の情報と、前記
抗体に結合するペプチドのアミノ酸配列と前記部分配列との間の類似度と、の比較によって選抜したペプチドのアミノ酸配列に基づいて前記
エピトープのアミノ酸配列を予測する、
請求項1又は2に記載のタンパク質結合部位情報取得装置。
【請求項4】
取得部を備えるタンパク質結合部位情報取得装置の作動方法であって、
前記取得部は、
抗原の部分配列と複数のランダムなアミノ酸配列との間の類似度の分布を示す第1の情報と、
ランダムな塩基配列を有するDNAライブラリに含まれるDNAから転写及び翻訳を介し
て前記
DNAに対応付けられて生成するペプチドを
前記抗原に結合する抗体に結合させて前記
DNAとともに回収することを繰り返して収束した、前記
抗体に結合するペプチドのアミノ酸配列と前記部分配列との間の類似度の分布を示す第2の情報と、の比較に基づいて、前記
抗原における前記
抗体の
エピトープのアミノ酸配列に関する情報を取得する、
タンパク質結合部位情報取得装置の作動方法。
【請求項5】
コンピュータを、
抗原の部分配列と複数のランダムなアミノ酸配列との間の類似度の分布を示す第1の情報
を参照する手段、
前記第1の情報と、ランダムな塩基配列を有するDNAライブラリに含まれるDNAから転写及び翻訳を介し
て前記
DNAに対応付けられて生成するペプチドを
前記抗原に結合する抗体に結合させて前記
DNAとともに回収することを繰り返して収束した、前記
抗体に結合するペプチドのアミノ酸配列と前記部分配列との間の類似度の分布を示す第2の情報と、
を比較
する手段、
前記比較に基づいて前記
抗原における前記
抗体の
エピトープのアミノ酸配列に関する情報を取得する
手段、として機能させる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、タンパク質結合部位情報取得装置、タンパク質結合部位情報取得装置の作動方法及びプログラムに関する。
【背景技術】
【0002】
抗体は、抗原に対する高い特異性と結合能を有するため、基礎研究において免疫染色法、ELISA法及びウェスタンブロット法等に利用される。抗体は、病理診断用組織染色抗体及び抗体医薬品として医療でも幅広く活用されている。抗体を使用する際、抗体の抗原認識能力を最大限に発揮するためには、抗原における抗体結合部位(エピトープ)のアミノ酸配列を把握したうえで、科学的な根拠に基づき最適な反応条件を決定することが重要である。
【0003】
エピトープ解析法としては、X線結晶構造解析及び水素重水素交換質量分析等がある。これらはタンパク構造を保持した十分量の抗原-抗体複合体を得なければならず、時間と費用とを要する。より簡便なエピトープ同定法として、ペプチドアレイを利用したエピトープマッピング解析がある。しかし、エピトープマッピング解析では、構築できるライブラリサイズが約100~1000種類程度と限られてしまうため、抗原タンパク質及びそのアミノ酸配列が既知でなければ採用し難い。
【0004】
400万個以上の市販の抗体が現存する中、上述のエピトープ解析法及びエピトープマッピング解析はこの規模に対応可能なスループットを持ち合わせていない。よって、現状ではほとんどの抗体のエピトープ情報が不明か、タンパク質全長配列又は数十~数百アミノ酸配列までの同定に留まっている。このため、科学的根拠に基づく抗原抗体反応プロトコルが統一化されておらず、同じ抗原に抗体を結合させても、研究室によって染色結果が異なるという問題が生じている。特に病理診断においてこの問題は致命的であり、患者の健康状態を正確に判断できないことが問題視されている。
【0005】
ペプチドアレイと比較してペプチドセレクション法は、108を超えるライブラリサイズを準備できるため、抗原タンパク質が未知でもエピトープの同定が可能である。ペプチドセレクションとは、ランダム配列を持つDNAライブラリを転写及び翻訳することで構築されたペプチドライブラリから、標的に結合するペプチドだけを獲得し、その配列を同定するシステムである。このシステムの重要な特徴として、獲得するペプチドの遺伝子情報が、細胞、ファージ、リボソーム又はピューロマイシンを介して保存されるという点がある。保存された遺伝情報の転写、翻訳及び標的への結合と回収という一連の流れが繰り返されることにより、標的に強く結合するペプチドの遺伝情報のみに収束する。
【0006】
エピトープ解析法への応用において、ペプチドセレクションは、抗原が完全に未知の場合でも抗体があればエピトープ解析が可能である点、またライブラリサイズの大きさゆえに、得られる結果が単なる配列情報のみならず、収束したアミノ酸配列の量比から、抗原認識にエピトープのどのアミノ酸残基が特に重要か(抗体の認識様式)を知ることができる点で有用である。例えば、非特許文献1には、リボソームディスプレイ法がエピトープのアミノ酸配列の決定に応用できることが記載されている。
【0007】
一方、特許文献1には、コンピュータを用いたエピトープ予測方法が開示されている。当該エピトープ予測方法では、学習対象タンパク質と当該学習対象タンパク質から検出されているエピトープとの関係を学習用データとして用いた学習モデルの出力結果に基づいて予測対象であるタンパク質におけるエピトープの候補を取得する。
【先行技術文献】
【特許文献】
【0008】
【非特許文献】
【0009】
【文献】LARRY C.MATTHEAKIS、外2名、「An in vitro polysome display system for identifying ligands from very large peptide libraries.」、Proc.Natl.Acad.Sci.USA、1994年、91、p.9022-9026
【発明の概要】
【発明が解決しようとする課題】
【0010】
上記の特許文献1に開示されたエピトープ予測方法では、学習モデルの構築に、抗原ペプチドに関する情報としてタンパク質内におけるペプチドの位置、ペプチドに含まれるアミノ酸配列、各アミノ酸の疎水性指標及びαへリックスに関する情報等のスコア、並びにエピトープであるか否かを示す情報が必要となる。上述のように、ほとんどの抗体のエピトープ情報が不明か、タンパク質全長配列又は数十~数百アミノ酸配列までの同定に留まっている現状に鑑みて、学習用データを十分に収集できず、学習モデルによる予測の精度が高いとは言えない。
【0011】
本発明は、上記実情に鑑みてなされたものであり、抗原における抗体のエピトープのアミノ酸配列に関する情報を高い精度で得ることができるタンパク質結合部位情報取得装置、タンパク質結合部位情報取得装置の作動方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0012】
本発明の第1の観点に係るタンパク質結合部位情報取得装置は、
抗原の部分配列と複数のランダムなアミノ酸配列との間の類似度の分布を示す第1の情報と、ランダムな塩基配列を有するDNAライブラリに含まれるDNAから転写及び翻訳を介して前記DNAに対応付けられて生成するペプチドを前記抗原に結合する抗体に結合させて前記DNAとともに回収することを繰り返して収束した、前記抗体に結合するペプチドのアミノ酸配列と前記部分配列との間の類似度の分布を示す第2の情報と、の比較に基づいて、前記抗原における前記抗体のエピトープのアミノ酸配列に関する情報を取得する取得部を備える。
【0013】
この場合、前記取得部は、
前記第1の情報が示す前記類似度の分布と前記第2の情報が示す前記類似度の分布との距離を算出し、前記エピトープに対する前記抗体の結合の特異性を評価する、
こととしてもよい。
【0014】
また、前記取得部は、
前記第1の情報と、前記抗体に結合するペプチドのアミノ酸配列と前記部分配列との間の類似度と、の比較によって選抜したペプチドのアミノ酸配列に基づいて前記エピトープのアミノ酸配列を予測する、
こととしてもよい。
【0016】
本発明の第2の観点に係るタンパク質結合部位情報取得装置の作動方法は、
取得部を備えるタンパク質結合部位情報取得装置の作動方法であって、
前記取得部は、
抗原の部分配列と複数のランダムなアミノ酸配列との間の類似度の分布を示す第1の情報と、ランダムな塩基配列を有するDNAライブラリに含まれるDNAから転写及び翻訳を介して前記DNAに対応付けられて生成するペプチドを前記抗原に結合する抗体に結合させて前記DNAとともに回収することを繰り返して収束した、前記抗体に結合するペプチドのアミノ酸配列と前記部分配列との間の類似度の分布を示す第2の情報と、の比較に基づいて、前記抗原における前記抗体のエピトープのアミノ酸配列に関する情報を取得する。
【0017】
本発明の第3の観点に係るプログラムは、
コンピュータを、
抗原の部分配列と複数のランダムなアミノ酸配列との間の類似度の分布を示す第1の情報を参照する手段、
前記第1の情報と、ランダムな塩基配列を有するDNAライブラリに含まれるDNAから転写及び翻訳を介して前記DNAに対応付けられて生成するペプチドを前記抗原に結合する抗体に結合させて前記DNAとともに回収することを繰り返して収束した、前記抗体に結合するペプチドのアミノ酸配列と前記部分配列との間の類似度の分布を示す第2の情報と、を比較する手段、
前記比較に基づいて前記抗原における前記抗体のエピトープのアミノ酸配列に関する情報を取得する手段、として機能させる。
【発明の効果】
【0018】
本発明によれば、抗原における抗体のエピトープのアミノ酸配列に関する情報を高い精度で得ることができる。
【図面の簡単な説明】
【0019】
【
図1】(A)は本発明の実施の形態に係るタンパク質結合部位情報取得装置のハードウエア構成を示すブロック図である。(B)はタンパク質結合部位情報取得装置の機能を示すブロック図である。
【
図2】タンパク質に含まれる部分配列と、複数のランダムなアミノ酸配列との間の類似度の算出を示す図である。
【
図3】部分配列に対するランダムなアミノ酸配列の類似度の確率の分布を示す図である。
【
図4】部分配列に対してランダムなアミノ酸配列が所定の類似度以上になる確率を示す図である。
【
図5】タンパク質に含まれるすべての部分配列と、ランダムなアミノ酸配列との間の類似度の算出を示す図である。
【
図6】
図4に示す部分配列に対してランダムなアミノ酸配列が所定の類似度以上になる確率の分布とともに、部分配列に対してペプチドセレクションで収束したアミノ酸配列が所定の類似度以上になる確率の分布を示した図である。
【
図7】確率の分布間の距離を算出するための式を例示する図である。
【
図8】アライメントされた部分配列におけるアミノ酸の位置ごとのアミノ酸の出現頻度を示す図である。
【
図9】
図1に示す実施の形態に係るタンパク質結合部位情報取得装置による情報取得処理のフローチャートを示す図である。
【
図10】(A)はc-fosのアミノ酸配列を示す図である。(B)は5種類の抗c-fos抗体に対して収束したペプチドから作成したモチーフを示す図である。
【
図11】(A)はNeuronal Nuclei(NeuN)のアミノ酸配列を示す図である。(B)は抗NeuN抗体に対して収束したペプチドから作成したモチーフを示す図である。
【
図12】(A)はチロシンヒドロキシラーゼ(TH)のアミノ酸配列を示す図である。(B)は抗TH抗体に対して収束したペプチドから作成したモチーフを示す図である。
【
図13】(A)はc-fosのアミノ酸配列を示す図である。(B)は抗c-fosポリクローナル抗体に対して収束したペプチドから作成したモチーフを示す図である。
【
図14】(A)はドパミントランスポーター(DAT)のアミノ酸配列を示す図である。(B)は抗DATポリクローナル抗体に対して収束したペプチドから作成したモチーフを示す図である。
【
図15】(A)はc-fosのアミノ酸配列を示す図である。(B)はエピトープ解析によって各抗体のクローンに関して得られたモチーフ及び変異体c-fosタンパク質において置換したアミノ酸の位置を示す図である。
【
図16】野生型及び変異体c-fosタンパク質と抗体との相互作用についてELISA(Enzyme-Linked ImmunoSorbent Assay)法で検討した結果を示す図である。
【
図17】変異体c-fosタンパク質において置換したアミノ酸の位置を示す図である。
【
図18】DECODE法で得た分子認識様式の妥当性をELISA法で検討した結果を示す図である。
【
図19】抗c-fos抗体に関して、類似度が高かった上位100種類のタンパク質の類似度を示す図である。
【
図20】自己免疫疾患を誘導したマウスの血漿中の抗体群をDECODE法で解析して得られたモチーフを示す図である。
【
図21】(A)は自己免疫疾患を誘導したマウスの血漿中の抗体群をDECODE法で解析して得られたアミノ酸配列から算出された部分配列のスコアの上位を示す図である。(B)は自己免疫疾患を誘導していないマウスの血漿中の抗体群をDECODE法で解析して得られたアミノ酸配列から算出された部分配列のスコアの上位を示す図である。
【発明を実施するための形態】
【0020】
本発明に係る実施の形態について説明する。なお、本発明は下記の実施の形態によって限定されるものではない。
【0021】
(実施の形態)
本実施の形態に係るタンパク質結合部位情報取得装置(以下、単に「情報取得装置」ともいう)100について説明する。情報取得装置100は、ペプチドセレクションで得られたデータを解析するための装置である。ペプチドセレクションとは、ランダムな塩基配列を有するDNAライブラリを転写及び翻訳することで構築されたペプチドライブラリから、被験物質に結合するペプチドを獲得し、獲得したペプチドのアミノ酸配列を同定するシステムである。ペプチドセレクションでは、獲得するペプチドの遺伝子情報が所定の手段で保存される。保存された遺伝情報の転写、翻訳、被験物質への結合及び回収という一連の流れが繰り返されることで、被験物質に結合するペプチドをコードする遺伝子情報を収束させることができる。
【0022】
情報取得装置100は、任意の公知のペプチドセレクションで得られたデータに適用可能である。ペプチドセレクションは、例えば、細胞表面提示法、ファージディスプレイ法、リボソームディスプレイ法及びmRNAディスプレイ法である。細胞表面提示法は、細胞を介して産生されたペプチドを細胞の表面に提示させることで細胞内部に遺伝情報を保存する。ファージディスプレイ法は、微生物を宿主とするファージの表面にペプチドを提示させてファージDNAに遺伝情報を保存する。無細胞タンパク質合成系を利用したリボソームディスプレイ法及びmRNAディスプレイ法では、それぞれリボソーム及びピューロマイシンを介して遺伝情報が保存される。
【0023】
情報取得装置100による解析に好ましいペプチドセレクションは、mRNAディスプレイ法である。mRNAディスプレイ法の中でも、DECODE法(国際公開第2018/168999号)が特に好ましい。DECODE法では、(i)DNAから転写反応によって、RNA分子を取得する。当該DNAは、プロモーター領域及びプロモーター領域の下流にペプチドをコードする領域を含み、かつアンチセンス鎖の5’末端側に少なくとも1個の2’-修飾ヌクレオシド誘導体を含む。続いて、(ii)RNAの3’末端に、スプリントポリヌクレオチドを用いて、ピューロマイシン等のペプチド受容分子を結合する。そして、(iii)ペプチド受容分子が結合しているRNAを翻訳することによって、RNAとRNAにコードされているペプチドとがペプチド受容分子を介して連結しているRNAとペプチドとの複合体を合成する。さらに、(iv)RNAとペプチドとの複合体から複合体を選抜する。
【0024】
工程(iv)では、ペプチドを介して被験物質に結合する複合体が選抜される。工程(i)~(iv)を繰り返すことで、被験物質に結合するペプチドをコードする遺伝子情報、すなわちDNAをDNAライブラリから濃縮できる。
【0025】
ペプチドセレクションで得られたDNAの塩基配列が変換されたアミノ酸配列が被験物質に結合するペプチドのアミノ酸配列である。次世代シーケンサー等によって、ペプチドセレクションで得られたDNAに関して、1万~数十億リード数、数百万~数億リード数、数十万~数千万リード数又は数十万~数百万リード数で塩基配列を決定することで、当該塩基配列がコードするアミノ酸配列が収集される。本実施の形態に係る情報取得装置100は、上述のようにペプチドセレクションで得られた多数のアミノ酸配列を解析する。
【0026】
図1(A)に示すように、情報取得装置100は、記憶部10、RAM(Random Access Memory)20、入力装置30、表示装置40及びCPU(Central Processing Unit)50が、バス60で接続された構成を有する。
【0027】
記憶部10は、ROM(Read Only Memory)、HDD(Hard Disk Drive)及びフラッシュメモリ等の不揮発性の記憶媒体を備える。記憶部10は、各種データ及びソフトウェアプログラムの他、基準データ11、タンパク質のアミノ酸配列データ12及び情報取得プログラム13を記憶している。各種データには、アミノ酸間の類似性の程度を示す値を定義したテーブルが含まれる。ソフトウェアプログラムには、マルチプルアライメント用ソフトウェア及びクラスタリング用ソフトウェアが含まれる。
【0028】
記憶部10が記憶しているデータには、タンパク質の部分配列と複数のランダムなアミノ酸配列との間の類似度の分布を示す基準データ(第1の情報)11が含まれる。タンパク質の部分配列とは、タンパク質のアミノ酸配列の一部である。タンパク質の部分配列は、タンパク質のアミノ酸配列が格納されたデータベース、例えばUniProt及びProtein Data Bank(PDB)等から取得できる。アミノ酸配列のデータベースは、各種生物のゲノムDNAの塩基配列をアミノ酸に変換することで取得してもよい。被験物質に結合するペプチドの探索空間を確保するために、より多くのタンパク質が網羅されているデータベースを用いるのが好ましい。
【0029】
タンパク質の部分配列は、2アミノ酸以上の任意の長さである。部分配列の長さを12アミノ酸とすると、例えば、部分配列は、タンパク質のN末端のアミノ酸から12個のアミノ酸からなる部分配列、タンパク質のN末端から2番目のアミノ酸から12個のアミノ酸からなる部分配列、のようにタンパク質のN末端からC末端側に1アミノ酸ずつ移動させて得られる部分配列である。100個のアミノ酸からなるタンパク質において、12個のアミノ酸からなる部分配列は89個となる。
【0030】
ランダムなアミノ酸配列は、無作為に選んだアミノ酸を含むアミノ酸配列である。被験物質が抗体の場合、エピトープのアミノ酸配列の長さは12アミノ酸程度である。よって、被験物質が抗体の場合には、ランダムなアミノ酸配列として、12個又は8個の任意のアミノ酸からなる複数のアミノ酸配列を用いるのが好ましい。アミノ酸配列の長さは12アミノ酸の場合、ランダムなアミノ酸配列のパターンは2012個である。
【0031】
ランダムなアミノ酸配列は無作為に選んだ塩基を並べたランダムな塩基配列を変換した複数のアミノ酸配列であってもよい。アミノ酸配列の長さが12アミノ酸の場合、上記の転写反応に供されるDNAにおけるペプチドをコードする領域は、3個の任意の塩基“N”で構成されるトリプレット“NNN”が12回繰り返されている。ランダムな塩基配列は、トリプレットのうち、1又は2個の塩基の選択肢を限定してもよい。この場合、DNAにおけるペプチドをコードする領域は、例えば、G(グアニン)及びT(チミン)から選ばれる塩基“K”としてトリプレット“NNK”が12回繰り返された塩基配列となる。
【0032】
アミノ酸配列間の類似度は、公知の任意の方法で評価できる。例えば、類似度は、アミノ酸間の類似性の程度を示す値を定義したBLOSUM、PAM及びWAC等のテーブルに基づいて算出される。テーブルを使用する場合、負の値を0として、進化におけるアミノ酸置換の生じにくさを考慮しなくてもよい。テーブルは、アミノ酸の性質等によって類似度を任意に定義したテーブルであってもよい。
【0033】
ランダムなアミノ酸配列の長さを12アミノ酸として、基準データの作成方法について例示する。
図2に示すように、タンパク質のデータベースのエントリであるタンパク質A(その一部のアミノ酸配列を配列番号1に示す)の一部である部分配列a1~a5・・・を含む部分配列aと、ランダムなアミノ酸配列r1~r5(配列番号2~6、なお、アミノ酸配列r2中のXaaはセレノシステイン(U)である)・・・を含むアミノ酸配列Rとの間の類似度を算出する。類似度の算出では、テーブルを参照し、アミノ酸配列r1を構成する12個のアミノ酸それぞれについて、当該アミノ酸に対応する位置にある部分配列a1のアミノ酸との類似性の値を求める。12個のアミノ酸に関する類似性の値の和を部分配列a1とアミノ酸配列r1の類似度とする。アミノ酸配列r1と同様に、部分配列a1に対するアミノ酸配列r2~r5の類似度を求める。
【0034】
部分配列a1に対するアミノ酸配列Rの類似度をヒストグラムとし、全体の和が1になるように規格化すると、
図3に示すように部分配列a1に対するランダムなアミノ酸配列Rの類似度の確率の分布が得られる。
図3に示す分布に基づいて所定の類似度以上になる確率を算出すると、
図4に示す分布が得られる。
【0035】
図5に示すように、タンパク質Aにおいて部分配列a1(配列番号7)からそのN末端がC末端側に1アミノ酸ずつ移動した部分配列a2(配列番号8)、a3(配列番号9)、a4(配列番号10)及びa5(配列番号11)に対しても同様にアミノ酸配列Rの類似度が所定の類似度以上になる確率を求める。タンパク質のデータベースに格納されたすべてのタンパク質に含まれるすべての部分配列aについて、ランダムなアミノ酸配列Rが所定の類似度以上になる確率が類似度の分布を示す基準データとなる。
【0036】
図1(A)に戻って、タンパク質のアミノ酸配列データ12は、上述のタンパク質のデータベースに格納されているタンパク質のアミノ酸配列を含むデータ又はゲノムDNA配列データベースの塩基配列を変換したアミノ酸配列を含むデータである。アミノ酸配列は、タンパク質ごとに全長で記憶されていてもよいし、所定のアミノ酸数、例えば12アミノ酸の長さの部分配列aとして記憶されていてもよい。アミノ酸配列データ12には、アミノ酸配列とともに当該アミノ酸配列に関連付けられたタンパク質の情報が含まれる。アミノ酸配列が部分配列aの場合、アミノ酸配列データ12は、部分配列aに関連付けられた当該部分配列aを含むタンパク質の情報及び当該タンパク質における部分配列aの位置に関する情報(例えば、タンパク質AのN末端からn番目のアミノ酸が部分配列aのN末端のアミノ酸に該当する場合のn)を含む。
【0037】
RAM20はCPU50のメインメモリとして機能し、CPU50による情報取得プログラム13の実行に際し、情報取得プログラム13がRAM20に展開される。RAM20には、入力装置30から入力されたデータが一時的に記憶される。
【0038】
入力装置30は、使用者が情報取得装置100にデータを入力するためのハードウエアである。入力装置30は、使用者によって入力された、ペプチドセレクションで得られたアミノ酸配列y1~y5・・・を含むアミノ酸配列YをCPU50に入力する。アミノ酸配列Yは、転写及び翻訳を介して核酸から核酸に対応付けられて生成するペプチドを被験物質に結合させて核酸とともに回収することを繰り返して収束した、被験物質に結合するペプチドのアミノ酸配列である。被験物質を抗体としたDECODE法の場合、約10万~20万のリード数で決定された塩基配列それぞれを変換したアミノ酸配列Yが得られる。同一のアミノ酸配列を除外すると、アミノ酸配列Yは、例えば約1万~数万種類となる。CPU50は、記憶部10にペプチドセレクションで得られたアミノ酸配列Yを記憶させる。
【0039】
表示装置40は、CPU50によるデータ解析の結果を出力するためのディスプレイである。CPU50は、記憶部10に記憶された情報取得プログラム13をRAM20に読み出して、情報取得プログラム13を実行することにより、以下に説明する機能を実現する。
【0040】
図1(B)は、CPU50が実現する機能を示すブロック図である。情報取得プログラム13は、CPU50に取得部1及び出力部2としての機能を実現させる。
【0041】
取得部1は、基準データと、アミノ酸配列Yとタンパク質の部分配列aとの間の類似度の分布を示す解析対象データ(第2の情報)と、の比較に基づいて、タンパク質における被験物質の結合部位に関する情報を取得する。
【0042】
取得部1は、上述の基準データと同様の方法で解析対象データを得る。取得部1は、
図2におけるアミノ酸配列r1~r5をアミノ酸配列y1~y5として、タンパク質Aに含まれる部分配列a1に対するアミノ酸配列y1~y5との間の類似度を算出し、部分配列a1に対するアミノ酸配列y1~y5の類似度が所定の類似度以上になる確率を算出する。取得部1は、部分配列a2、a3、a4及びa5に対しても同様にアミノ酸配列y1~y5の類似度が所定の類似度以上になる確率を求める。
【0043】
図6は、
図4に示す部分配列a1に対してランダムなアミノ酸配列Rが所定の類似度以上になる確率の分布に、部分配列a1に対してアミノ酸配列Yが所定の類似度以上になる確率の分布を重ねて表示した図である。タンパク質における被験物質の結合部位に対応する部分配列aでは、部分配列aと類似度の高いアミノ酸配列Yが多く得られるため、基準データよりも類似度の高い方にまで確率が分布する。取得部1は、基準データと解析対象データの分布間距離をスコアとして算出する。基準データとの距離が大きい、すなわちスコアが高い部分配列aほど、被験物質が結合しやすいと言える。当該スコアによって、結合部位に対する被験物質の結合の特異性が評価できる。
【0044】
分布間の距離は、公知の方法で算出できる。類似度をX、P(x)をアミノ酸配列Yが所定の類似度以上になる確率の分布、Q(x)をランダムなアミノ酸配列Rが所定の類似度以上になる確率の分布とすると、例えば
図7に列挙する式それぞれで、あるいはこれらを組み合わせてスコアを計算する。なお、ここでいう“距離”は必ずしも数学的な距離である必要はない。
【0045】
取得部1は、すべてのタンパク質に含まれるすべての部分配列aの基準データと解析対象データとを比較し、スコアの高い部分配列aを取得する。取得する部分配列aは、最もスコアが高い部分配列aであってもよいし、スコアの上位から複数個の部分配列aであってもよい。取得部1は、アミノ酸配列データ12を参照し、取得した部分配列aを含むタンパク質の情報及び当該タンパク質における部分配列aの位置に関する情報等を被験物質の結合部位に関する情報として取得する。
【0046】
被験物質がモノクローナル抗体の場合、取得部1は、最大のスコアであった部分配列aを有するタンパク質の情報を取得する。被験物質がポリクローナル抗体の場合、取得部1は、取得した部分配列aを含むタンパク質の情報とともに、当該タンパク質における複数の部分配列aの位置に関する情報を取得する。
【0047】
取得部1は、タンパク質における被験物質の結合部位に関する情報として結合部位のアミノ酸配列を予測する。例えば、取得部1は、スコアの上位から複数個の部分配列aをアミノ酸配列の類似性に基づいてクラスタリングし、クラスターごとにマルチプルアライメントを作成する。取得部1は、アライメントされた部分配列aの各位置において最も高い収束率を示したアミノ酸を当該位置のアミノ酸とする。
図8は、アライメントされた部分配列aにおけるアミノ酸の位置と当該位置におけるアミノ酸の出現頻度とが対応づけられたテーブルを示す。
図8に示すように、取得部1は、アライメントされた部分配列aの各位置におけるアミノ酸の出現頻度の高いアミノ酸を当該位置のアミノ酸としてアミノ酸配列を予測してもよい。なお、取得部1は、収束率が所定の値よりも低い位置をブランクとしてアミノ酸配列を予測してもよい。
【0048】
また、取得部1は、基準データと、アミノ酸配列Yとタンパク質の部分配列との間の類似度と、の比較によって抽出したペプチドのアミノ酸配列に基づいて結合部位のアミノ酸配列を予測する。この場合、基準データには、部分配列aに対するランダムなアミノ酸配列Rの類似度の確率の分布(
図4)において、確率が所定の値kより小さい類似度の範囲で最小の類似度Sが含まれる。記憶部10は、あらかじめ基準データ11として、タンパク質のデータベースに格納されたすべてのタンパク質に含まれるすべての部分配列aそれぞれに対応付けられた類似度Sを記憶している。
【0049】
取得部1は、アミノ酸配列Yとタンパク質の部分配列aとの間の類似度を算出する。取得部1は、記憶部10を参照し、当該部分配列aに対応付けられた類似度S以上のアミノ酸配列Yを記憶部10に記憶させる。取得部1は、類似度S以上のアミノ酸配列Yについてマルチプルアライメントを作成し、上述のようにアミノ酸配列を予測する。なお、マルチプルアライメントの前にアミノ酸配列Yをクラスタリングして、クラスターごとにマルチプルアライメントを作成してもよい。なお、取得部1は、マルチプルアライメントを行わず、特定の部分配列のみで類似度S以上又は確率がk以下のアミノ酸配列Yをクラスタリングしてもよい。
【0050】
取得部1は、被験物質の結合部位に関する情報を出力部2に入力する。出力部2は、被験物質の結合部位に関する情報を表示装置40に表示する。
【0051】
続いて、情報取得装置100による情報取得処理を
図9に示すフローチャートを参照して説明する。
【0052】
取得部1は、ユーザによって解析対象データが入力装置30を介して入力されるのを待つ(ステップS1;No)。解析対象データが入力されると(ステップS1;Yes)、取得部1は、記憶部10を参照し、解析対象データと基準データとを比較してスコアを算出し、スコアの高い部分配列aを取得する(ステップS2)。取得部1は、アミノ酸配列データ12を参照し、取得した部分配列aを含むタンパク質の情報及び当該タンパク質における部分配列aの位置に関する情報を含む被験物質の結合部位に関する情報を取得する(ステップS3)。出力部2は、被験物質の結合部位に関する情報を、表示装置40に表示する(ステップS4)。そして、取得部1は情報取得処理を終了する。
【0053】
以上詳細に説明したように、本実施の形態に係る情報取得装置100は、タンパク質の部分配列aと複数のランダムなアミノ酸配列Rとの間の類似度の分布を示す基準データと、ペプチドセレクションで収束した被験物質に結合するペプチドのアミノ酸配列Yと部分配列aとの間の類似度の分布と、の比較によってタンパク質における被験物質の結合部位に関する情報を取得する。これにより、結合部位に対する被験物質の結合の特異性を評価できるため、タンパク質における被験物質の結合部位に関する情報を高い精度で得ることができる。
【0054】
また、情報取得装置100は、被験物質に結合するペプチドのアミノ酸配列Yと部分配列aとの間の類似度を基準データと比較することで選抜したペプチドのアミノ酸配列に基づいて結合部位のアミノ酸配列を予測することとした。こうすることで、結合部位のアミノ酸配列の予測精度を高めることができる。情報取得装置100は、
図8に例示される、スコアの高い部分配列aの各位置のアミノ酸の出現頻度のテーブルを用いることで、被験物質の結合部位の特異性を予測することができる。
【0055】
本実施に形態では、タンパク質の部分配列aに対してランダムなアミノ酸配列Rが所定の類似度以上になる確率を類似度の分布として用いたが、類似度の分布はこれに限らない。タンパク質の部分配列aと複数のアミノ酸配列Rとの間の類似度の分布は、タンパク質の部分配列aに対してアミノ酸配列Rの類似度の平均値、最頻値又は中央値であってもよい。
【0056】
なお、結合部位に関する情報をより正確に得るために、ペプチドセレクションで収束した被験物質に結合するペプチドのアミノ酸配列Yと部分配列aとの間の類似度にノイズ除去処理を加えてもよい。ノイズ除去処理は、公知のものが適用でき、例えば平均フィルタ等である。
【0057】
また、上記の確率の値k及び類似度Sは、解析に応じて適宜設定される。アミノ酸配列間の類似度の算出に使用するテーブル、スコアによる部分配列aの順位の付け方等も、解析対象の生物種等に応じて設定される。タンパク質のデータベースは1つの生物種に限らず、複数の生物種のタンパク質のデータベースを用いてもよい。複数の生物種由来のタンパク質のデータベースを用いることで被験物質としての抗体の種間の交差性を予測することができる。
【0058】
また、情報取得装置100は、血清、血漿、血液、リンパ液及び髄液等のサンプルに含まれる抗体等の成分を被験物質として実施したペプチドセレクションで得られたペプチドのアミノ酸配列Yの解析にも適している。例えば、免疫を惹起したヒトの血清に含まれる抗体を被験物質とすることで血清中の複数種の抗体に対する抗原を同定し、さらに抗原における被験物質の結合部位に関する情報を網羅的に収集できる。なお、被験物質は、化合物、アプタマー、核酸、ペプチド及びタンパク質等、タンパク質に結合し得るものであれば特に限定されない。また、情報取得装置100は、血清、血漿、血液、リンパ液及び髄液等のサンプルに含まれるあらゆる成分を被験物質として実施したペプチドセレクションで得られたペプチドのアミノ酸配列Yを解析してもよい。
【0059】
なお、マルチプルアライメント用ソフトウェアとしては、累進法、反復改善法及び動的計画法等を利用した公知の種々のソフトウェアが使用できる。マルチプルアライメント用ソフトウェアは、例えば、Clustal X、Clustal W、MUSCLE、T-Coffee、Parallel PRRN、MultAlin、MSA、Match-Box、DIALIGN及びAliBee等である。クラスタリング用ソフトウェアについても最短距離法、最長距離法、群平均法、最小分散法、重心法、重み付き平均法、メジアン法及びK-means法等の公知の方法を使用したソフトウェアが使用できる。
【0060】
なお、上述の基準データ11、タンパク質のアミノ酸配列データ12、情報取得プログラム13及びその他のソフトウェアプログラムは、CD-ROM(Compact Disc Read Only Memory)、DVD(Digital Versatile Disc)、光磁気ディスク(Magneto-Optical Disc)、USB(Universal Serial Bus)メモリ、メモリカード及びHDD等のコンピュータ読み取り可能な記録媒体に格納して配布することが可能である。そして、情報取得プログラム13及びその他のソフトウェアプログラムを特定の又は汎用のコンピュータにインストールすることによって、当該コンピュータを情報取得装置100として機能させることが可能である。また、基準データ11、タンパク質のアミノ酸配列データ12、情報取得プログラム13及びその他のソフトウェアプログラムをインターネット上の他のサーバが有する記憶装置に格納しておき、当該サーバから基準データ11、タンパク質のアミノ酸配列データ12、情報取得プログラム13及びその他のソフトウェアプログラムがダウンロードされるようにしてもよい。
【実施例】
【0061】
以下の実施例により、本発明をさらに具体的に説明するが、本発明は当該実施例によって限定されるものではない。
【0062】
(実施例1:DECODE法によるエピトープのモチーフの予測)
(ライブラリの構築)
次のようにDECODE法を行った。抗体の抗原認識は、約5アミノ酸と言われており、直鎖のアミノ酸配列の場合、10アミノ酸程度に収まることが多いため、12アミノ酸がランダム化されるように、テンプレートDNAライブラリを作成した。なお、コドンをNNK(G/T)とランダム化し、DNAテンプレートではランダムシーケンス中にSTOPコドンがUAG(Amber)のみとなるよう設計した。セレクションの1ラウンド目におけるライブラリサイズが1.5×1013となるよう、500μLスケールのPCR mixture中に、0.05μMのテンプレートDNAライブラリが含まれるよう調整した。テンプレートDNAの塩基配列は、CCTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATG(NNK)nTGCGGCAGCGGCAGCGGCAGCTACTTTGATCCGCCGACCで、n=12とした。なお、NはA、T、G及びCのいずれかであって、KはT又はGである。n=1でKがTの場合のテンプレートDNAの塩基配列を配列番号12に示す。
【0063】
本セレクションシステムが安定し機能しているかどうかを検討するために、固定配列を用いてセレクションを行い、ペプチド回収効率を確認することが求められる。そこで、抗FLAG抗体特異的に結合する固定配列ペプチドmc1’をポジティブコントロールとして用い、本セレクションシステムが機能しているかどうかラウンドごとに確認した。DECODE法では抗FLAG抗体に対してmc1’をスクリーニングする場合、回収されたcDNA-ペプチド量をqPCRで測定すると、CT値は安定して約10となった。テンプレートmc1’の塩基配列は、CCTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGAAGTACTCCCCAACCGACTGCAAGAAGGACTACAAGGACGACGACGACAAGTGCGGCAGCGGCAGCGGCAGCTAGGACGGGGGGCGGAAA(配列番号13)である。
【0064】
(テンプレートDNAの増幅)
表1に示す500μLスケールのPCR mixtureを調製し、テンプレートDNAライブラリを増幅させた。調製したPCR mixtureをサーマルサイクラーにて95℃で3分間インキュベートした後、95℃(10秒間)、58℃(10秒間)、75℃(30秒間)の温度変化を4サイクル繰り返すことでテンプレートDNAを増幅した。なお、フォワードプライマー(P1)の塩基配列は、CCTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATG(配列番号14)である。リバースプライマー(P2(抗原)OMe)の塩基配列は、ggTCGGCGGATCAAAGTAG(配列番号15)である。
【0065】
【0066】
(テンプレートDNAライブラリの転写及びPu-DNAの連結)
500μLのTranscription mixture用バッファーと500μLのテンプレートDNAとを混合し、1000μLスケールのTranscription mixtureを調製し、増幅したDNAライブラリを50mU/uL T7 RNAポリメラーゼ(5μL)で転写した。Transcription mixture用バッファー(TC mix)の組成は、終濃度40mM HEPES-KOH(pH7.6)、20mM MgCl2、2mM Spermidine、5mM DTT、2.5mM NTPsである。Transcription mixtureを37℃で40分間、転写反応させた後、72℃で5分間放置し、T7 RNAポリメラーゼを失活させた。得られた転写産物を7M 尿素を含む10%アクリルアミドゲルで電気泳動(180V、40分間)し、mRNAライブラリが産生されたことを確認した。
【0067】
続いて、終濃度50mM Tris-HCl(pH7.5)、10mM MgCl2、10mM DTT及び1mM ATPのバッファー条件下で、Transcription productを5μM Pu-DNA(5’-[PHO]CTCCCGCCCCCCGTCC[SpC18]5CC[Puromycin]、5’末端からスペーサーまでの塩基配列を配列番号16に示す)、5μM スプリントDNA(5’-GGGCGGGAGGGTCGGCGGATCAA(配列番号17))と混合し、500μLスケールのLigation mixtureとした。Ligation mixtureを95℃で1分間温めた後、75℃で30秒間放置し、一定勾配1℃/15秒間で25℃まで温度を下げてmRNA、Pu-DNA 、Splint DNAの三者をアニーリングした。そこへ、35UのT4 DNA ligaseを加え、37℃で1時間、連結反応を促進させた後、4℃で放置した。得られた転写産物を7M 尿素を含む10%アクリルアミドゲルで電気泳動(180V、40分間)し、mRNAライブラリがPu-DNAと連結したことを確認した。得られたPu-DNA連結mRNAライブラリを、RNA精製試薬キットAgencourt AMPure(商標) XPで精製し、濃度を決定した。
【0068】
(カスタムPURE systemuによる無細胞翻訳)
Pu-DNA連結mRNAライブラリを無細胞翻訳系(PURE system)により翻訳し、ペプチドライブラリを獲得した。2.4μLの0.6μM ligated sample、0.5μLのSolution B、6μLのSolution A及び3μLのStock bufferを加えて11.9μLのPURE mixtureを調製した。PURE mixtureを37℃で1時間反応させた。
【0069】
Solution Bの組成を表2に示す。なお、Stock bufferの組成は、50mM HEPES-KOH(pH7.6)、100mM KCl、10mM MgCl及び30%グリセロールである。
【表2】
【0070】
factor mixの組成を表3に示す。
【表3】
【0071】
Solution Aの組成を表4に示す。
【表4】
【0072】
NTP cratine phosphate mixtureの組成を表5に示す。
【表5】
【0073】
PURE bufferの組成を表6に示す。
【表6】
【0074】
(Tag抗体固定化ビーズの調製)
Tag抗体はセレクションの1周目及び3周目はprotein Gビーズに、2周目はprotein Aビーズに固定化させた。これらのビーズは使用前に500μLのwash buffer(50mM Tris-HCl、pH8.0、500mM NaCl、1% Triton及び0.01% Tween 20)で洗浄した。ビーズ 2.5μLに対して、IgG抗体を1μL加え、30分間振とうしてビーズとIgG抗体とを結合させた。
【0075】
(Tag抗体固定化ビーズへのペプチドライブラリの結合反応)
Tag抗体固定化ビーズに対して、翻訳後産物11.9μLとbinding buffer(50mM Tris-HCl、pH8.0及び10mM EDTA)25μLを加え、30分間振とうして、ペプチドライブラリをTag抗体固定化ビーズに結合させた(ポジティブセレクション)。上清を除いてビーズを回収し、wash bufferで10回洗ってIgGに特異的に結合するペプチドライブラリを得た。
【0076】
(逆転写)
protein Gビーズ又はprotein Aビーズ上に存在するmRNAをProto ScriptII RTaseにより逆転写しcDNAとした。最終的に44.5μLスケールの逆転写反応となるように、ビーズに対し、40μLのRT mix、4.25μLのRT(-)(50mM tris-HCl(pH8.0)及び75mM KCl)及び0.25μLのProtoScript IIを混合し、37℃で40分間、逆転写反応をさせた。RT mixは、0.2mM dNTPs、10mM DTT及び0.2μM RT-Primer(P2_ver2、GGTCGGCGGATCAAAGTAGCTGCCGCTGCCGCTGCCGCA(配列番号18))を含むProtoScript bufferである。
【0077】
(溶出)
リン酸バッファー10μLにて、Tag抗体を95℃で3分間保持し、ペプチドライブラリを抽出した。溶出後上清を回収し、20μLのultrapure waterでビーズを洗って、その上清をさらに回収した。
【0078】
(qPCRによる回収されたcDNA量の定量)
回収されたペプチドに連結したcDNAを、qPCRで定量し、次のラウンドにおけるPCR増幅の最適なサイクルを決定した。表7に示すqPCR mixtureを384ウェルの各ウェルに7μL分注し、0.5μLのcDNAを各ウェルに添加した。プレートを95℃で3分間インキュベートした後、95℃で1分間の後、95℃(10秒間)及び60℃(30秒間)の2ステップを40サイクル繰り返して反応させ、cDNAを増幅した。リバースプライマー(P2(抗原))の塩基配列はGGTCGGCGGATCAAAGTAGCTGCCGCTGCCGCTGCCGCA(配列番号19)である。
【0079】
【0080】
(回収されたDNAのPCRによる増幅)
表8に示すPCR mixtureに増幅したテンプレートDNA20μLを添加し、Phusion DNA polymeraseによりcDNAライブラリを増幅させた。調整したPCR mixtureをサーマルサイクラーにおいて95℃で3分間インキュベートした後、95℃、58℃、75℃の温度変化をqPCRで決定したサイクル繰り返すことでテンプレートDNAを増幅した。1%アガロースゲルで泳動して増幅を確認することで、最適サイクル数(N)を決定した。決定したPCR条件で増幅したテンプレートDNAライブラリを1%アガロースゲルで泳動して確認した。十分な増幅を確認後、Agencourt AMPure(商標) XPで精製した。
【0081】
【0082】
(2ラウンド目の転写)
10μLスケールのTranscription mixtureを調製し、増幅したDNAライブラリ0.1μMを50mU/uL T7 RNA polymeraseで転写した。Transcription mixtureには5mM NTPs、5μM DTT、20μM MgCl2を加えた。Transcription mixtureを37℃で1時間、転写反応させた後、75℃で5分間放置し、T7 RNA polymeraseを失活させた。
【0083】
(2ラウンド目のmRNAとPu-DNA連結)
Transcription産物5μMに1mM ATPs、10μM Pu-DNA、10μM スプリントDNAを混合し、1×ligation buffer で8μLスケールのLigation mixtureを調製した。Ligation mixtureを95℃で1分間温めた後、一定勾配で15分間かけて25℃まで温度を下げ、mRNA、Pu-DNA及びSplit DNAをアニーリングした。T4 ligaseを加え、37℃で1時間反応させた。
【0084】
研究用抗体161種類(モノクローナル抗体が144種類、ポリクローナル抗体が17種類)それぞれを上記のビーズに固定化して、本実施例に係るDECODE法を実行した。DECODE法でスクリーニングしたペプチドのcDNAについて、次世代シーケンサーであるHiSeq3000(Illumina社製)で1抗体につき100万リードほど塩基配列を決定した。得られた塩基配列をアミノ酸に変換し、プログラミングソフトjavaを使用しアミノ酸配列についてクラスタリングを行った。置換スコア関数にはBLOSUM62マトリクスを用いた。ただし、本研究では進化的なアミノ酸置換の生じにくさを考慮しないため、負の値は0とした行列を使った。得られたクラスターについて、シーケンスアラインメント用ソフトウェアであるClustal Xでアラインメントを作製したのち、Weblogoでモチーフを作成した。
【0085】
(結果)
各ラウンドで回収したcDNA-ペプチド複合体量をqPCRで定量したところ、ほとんどの抗体で3ラウンド目に収束がみられた。
【0086】
図10(A)はc-fosのアミノ酸配列(配列番号20)を示す。モノクローナル抗体に関して、抗c-fos抗体5種類に対して収束したペプチドの中で、最も収束率の高かったモチーフを
図10(B)に示す。各抗c-fos抗体について得られたモチーフは、
図10(A)に示すようにc-fosの一部に一致していた。
【0087】
図11(A)はNeuNのアミノ酸配列(配列番号21)を示す。
図11(B)は抗NeuN抗体に対して収束したペプチドから作成したモチーフを示す。抗NeuN抗体について得られたモチーフは、
図11(A)に示すようにNeuNの一部に一致していた。
図12(A)はTHのアミノ酸配列(配列番号22)を示す図である。
図12(B)は抗TH抗体に対して収束したペプチドから作成したモチーフを示す。抗TH抗体について得られたモチーフは、
図12(A)に示すようにTHの一部に一致していた。
【0088】
上記のように本実施例で得られたいずれのモチーフも、標的タンパク質上の一部の配列と一致した。アミノ酸配列の量比から、抗体の抗原認識に、エピトープのどのアミノ酸残基が特に重要かを予測することができた。また、
図10(B)に示すように、c-fosを標的とする抗体の同一のクローンC1について独立のDECODE法で再現性良く同じモチーフを獲得することができた。
【0089】
ポリクローナル抗体に関して、抗c-fos抗体(シグマ社製)及び抗DAT抗体(シグマ社製)に対して収束したペプチドについて作成したモチーフをそれぞれ
図13及び
図14に示す。
図13(B)に示すように、得られたモチーフは主に4種類のクラスターに分類された。いずれのモチーフも、
図13(A)に示すc-fosタンパク質配列上の一部と一致した。また、2つの独立した解析において、同じ抗c-fos抗体について再現性良く同じモチーフが獲得された。
【0090】
図14(B)に示すように抗DAT抗体でも特異的なモチーフが得られた。得られたモチーフは主に2種類のクラスターに分類された。いずれのモチーフも、DATタンパク質配列(配列番号23)上の一部と一致した(
図14(A)参照)。抗DAT抗体においても2つの独立した解析において、同じ抗DAT抗体で再現性良く同じモチーフが獲得された。
【0091】
(実施例2:DECODE法の精度に関するELISA法による評価)
DECODE法で得たモチーフが、実際に抗体が認識するエピトープであるかを、ELISA法で実証した。以下ではc-Fosタンパク質を認識する、クローンが異なる5種類の抗c-fos抗体(モノクローナル抗体C1、C2、C4、C5及びポリクローナル抗体C7)を利用して抗原抗体反応を検証した。
【0092】
野生型c-fosタンパク質(全長)の遺伝子がクローニングされたpMU2プラスミドに、各種変異プライマーをPrimeStar maxで導入した。作製したc-fosタンパク質変異体及び野生型c-fosタンパク質のベクターを、HEK293Tへ形質転換して発現させた。発現後、細胞を破砕しライセートを回収した。
【0093】
各種変異体c-fosタンパク質及び野生型c-fosタンパク質を発現させたHEK293Tのライセートを384プレートに固定化した。12.5μL/wellで1時間振とうさせ、一晩4℃で保存した。次に、blocking oneを1/5希釈して120μL/wellで満たし、一時間室温で静置した。TPBS(0.1% Tween20 PBS)で3回洗ったのち、系列希釈した各抗c-fos抗体(C1、C2、C4、C5、C7)を1次抗体としてc-fosタンパク質に結合させた。室温で1時間振とうして結合反応を行い、TPBSで3回洗浄した。その後、1/1000希釈したHorse Radish Peroxidase(HRP)標識二次抗体(mouse、rabbit、goat)を加え、室温で1時間振とうして結合反応を行った。二次抗体との結合反応後、TPBSで12回洗浄した。ELISA POD 基質 TMB(3,3’,5,5’-テトラメチルベンジジン)発色基質溶液を25μL添加し、十分発色させ、0.1M H2SO4を50μL添加して反応を停止させた。マイクロプレートリーダーで吸光度(450nm)を測定した。
【0094】
HEK293Tのライセートごとc-fosタンパク質を固定化したため、c-fosタンパク質を発現させていないHEK293Tのライセートにおける吸光度をブランクとして差し引いた。プレートに固定化したHEK293Tのライセート中の各変異体及び野生型c-fosタンパク質の発現量の違いを補正するために、抗c-fos抗体(C2、C4、C5、C7)による抗原抗体反応の吸光度は抗c-fos抗体(C1)の飽和時の吸光度で、抗c-fos抗体(C1)の吸光度は抗c-fos抗体(C2)の飽和時の吸光度で割った値を正規化した吸光度とした。各抗体濃度に対する正規化した吸光度をプロットし、飽和曲線を作製した。下記のミカエリスメンテン式に対して、最小二乗法により測定値を近似し、正規化した吸光度の最大値(Abs.max)とKm値とを算出した。
正規化した吸光度=Abs.max×nM/(nM+Km)
【0095】
(結果)
図15(A)はc-fosのアミノ酸配列を示す。エピトープ解析によって各抗体のクローンに関して得られたモチーフ及び変異体c-fosタンパク質において置換したアミノ酸の位置を
図15(B)に示す。変異体c-fosタンパク質では、抗原認識に重要と予測されるアミノ酸を置換している。抗原抗体相互作用について、野生型と変異体とを比較したELISAの結果を
図16に示す。モノクローナル抗体C1、C2及びC4はそれぞれに対応する変異体への結合が野生型と比較して顕著に低下した。モノクローナル抗体C5及びポリクローナル抗体C7は野生型に対して弱く結合したものの、それぞれのエピトープ変異体に対してはまったく結合がみられなかった。これらの結果はDECODE法で得たペプチドが、実際の抗体認識部位であったことを示す。
【0096】
抗c-fos抗体(C1)に対してエピトープ解析で得た分子認識様式(抗体が認識する際のエピトープのアミノ酸の重要度)について、実際の抗原抗体反応が一致するかどうかをELISA法で検証した。c-fos抗体のエピトープとして同定された
図10(B)に示すエピトープ1について、変異体c-fosタンパク質において置換したアミノ酸の位置を
図17に示す。抗原抗体相互作用について、野生型と変異体とを比較したELISAの結果を
図18に示す。変異体D271A、F272A、L273A、F274Aは野生型と比較して抗c-fos抗体の結合が顕著に低下した。アミノ酸F272、F274を芳香族アミノ酸(Y、W)に置換した場合、抗c-fos抗体の結合が回復した。変異体P275A、A276G、R279A及びP280Aに関しては、野生型と比較して抗c-fos抗体の結合がやや低下したが、変異体S277A、S278A及びS281Aの結合に変化は見られなかった。これらの結果より、DECODE法で得た分子認識様式が、実際の抗原抗体反応と一致することが示された。
【0097】
(実施例3:抗c-fos抗体の交差反応性の評価)
クローンが異なる8種類の抗c-Fos抗体(モノクローナル抗体C1、C2、C4、C5及びC8、並びにポリクローナル抗体C3、C6及びC7に関して交差反応性を評価した。DECODE法において収束したペプチドのアミノ酸配列と、約20000種類のヒトタンパク質との間の類似度を算出した。類似度の算出には、負の値は0とした置換スコア関数BLOSUM62マトリクスを使用した。
【0098】
(結果)
図19は、各抗体について類似度が高かった上位100種類のタンパク質の類似度を示す。
図19における矢印は、標的タンパク質、すなわちc-fosを示す。モノクローナル抗体C1及びC2並びにポリクローナル抗体C3及びC7ではc-fosに対する類似度が最大であった。モノクローナル抗体C4、及びC5のc-fosに対する類似度が1位ではなく、特異性が低いことが予想された。モノクローナル抗体C8及びポリクローナル抗体C6のc-fosに対する類似度は100位以下であった。C1に関しては独立したエピトープ解析で再現性良くc-fosに対する類似度が最大となった。
【0099】
(実施例4:実験的自己免疫性脳脊髄炎(EAE)モデルマウスの血漿のDECODE解析)
10週齢のC57B6マウスに、Myelin-oligodendrocyte glycoprotein(MOG)の一部であるMOG35-55ペプチド(MEVGWYRSPFSRVVHLYRNGK(配列番号24))を、10週齢のC57B6マウスに完全フロイントアジュバントを用いて免疫した。免疫後20~22日に全血を回収し、等量のPBSと混和し、フィコールを用いて血漿成分を分離した。血漿100μLを100μLのProteinG磁気ビーズ(dynabeads)に4℃で1時間結合させた。これを500μLの洗浄バッファー(50mM Tris-HCl(pH7.5)、300mM NaCl及び0.1% TritonX-100)で5回洗浄し、EAEマウス抗体が固定化された磁気ビーズを得た。n=8とした上述のテンプレートDNAを含むテンプレートDNAライブラリに対して、当該磁気ビーズを用いて実施例1と同様にDECODE法を5ラウンド行い、HiSeq2500を用いてシングルリード80ベースでシーケンシングを行った。
【0100】
得られた塩基配列を変換したアミノ酸配列についてマルチプルアライメントを行った。また、マウスタンパク質の部分配列について、基準データと得られたアミノ酸配列群とを比較してスコアを算出した。
【0101】
(結果)
マルチプルアライメントの結果に基づいて、
図20に示すように、MOG35-55ペプチドの一部と相同性の高いモチーフが得られた。
図21(A)に示すように、規格化されたスコアの上位140位と399位にMOG35の部分配列が検出された。一方、
図21(B)に示すように、MOG35-55ペプチドを免疫していないマウス血漿からはMOGの部分配列は検出されなかった。
【0102】
本発明は、本発明の広義の精神と範囲を逸脱することなく、様々な実施の形態及び変形が可能とされるものである。また、上述した実施の形態は、本発明を説明するためのものであり、本発明の範囲を限定するものではない。すなわち、本発明の範囲は、実施の形態ではなく、特許請求の範囲によって示される。そして、特許請求の範囲内及びそれと同等な発明の意義の範囲内で施される様々な変形が、本発明の範囲内とみなされる。
【産業上の利用可能性】
【0103】
本発明は、タンパク質における被験物質の結合部位に関する情報、特に抗体のエピトープの予測に好適である。
【符号の説明】
【0104】
1 取得部、2 出力部、10 記憶部、11 基準データ、12 タンパク質のアミノ酸配列データ、13 情報取得プログラム、20 RAM、30 入力装置、40 表示装置、50 CPU、60 バス、100 タンパク質結合部位情報取得装置
【配列表】