(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-12-06
(54)【発明の名称】タンパク質及びその誘導体のコンフォメーション及びコンフォメーション変化を決定する方法及びツール
(51)【国際特許分類】
G01N 33/68 20060101AFI20241129BHJP
G01N 33/483 20060101ALI20241129BHJP
C07K 1/12 20060101ALI20241129BHJP
C07K 1/18 20060101ALI20241129BHJP
C07K 1/20 20060101ALI20241129BHJP
【FI】
G01N33/68
G01N33/483 E
C07K1/12
C07K1/18
C07K1/20
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024533240
(86)(22)【出願日】2022-11-25
(85)【翻訳文提出日】2024-07-30
(86)【国際出願番号】 EP2022083223
(87)【国際公開番号】W WO2023099341
(87)【国際公開日】2023-06-08
(32)【優先日】2021-12-03
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】524210068
【氏名又は名称】ビオグノシス アーゲー
(71)【出願人】
【識別番号】508092576
【氏名又は名称】エーテーハー チューリヒ
(74)【代理人】
【識別番号】110002354
【氏名又は名称】弁理士法人平和国際特許事務所
(72)【発明者】
【氏名】ピコッティ,パオラ
(72)【発明者】
【氏名】ヴィゾヴィセク,マテイ
(72)【発明者】
【氏名】ライナー,オリヴィエル
(72)【発明者】
【氏名】ライター,ルーカス
(72)【発明者】
【氏名】ビートン,ナイジェル
(72)【発明者】
【氏名】ブルーデラー,ローラント
(72)【発明者】
【氏名】サビーノ,ファビオ ミラ ロシャ
【テーマコード(参考)】
2G045
4H045
【Fターム(参考)】
2G045AA34
2G045BA04
2G045BB05
2G045BB11
2G045BB35
2G045FA36
2G045FB01
4H045AA50
4H045GA22
4H045GA23
4H045GA24
4H045GA25
(57)【要約】
タンパク質のコンフォメーション状態を検出する方法であって、上記タンパク質は、更なるタンパク質及びその他の生体分子の複雑な混合物中にあり、ここで、上記複雑な混合物中のタンパク質は、上記タンパク質において構造変化を誘導する条件に曝されており、以下の一連の工程:1.タンパク質が検出対象の当初のコンフォメーション状態にある条件下で抽出混合物のタンパク質限定分解を行うことにより、第1の断片試料を得る工程、その直後に、2.上記第1の断片試料から大きなペプチド及びタンパク質又はその他の生体分子を除去して、濃縮された断片試料を形成する工程、3.濃縮された断片試料の解析的分析を行い、工程1のタンパク質限定分解がもたらされた場合に特徴的であるだけでなく除去工程2の後に残っている断片を決定して、上記少なくとも1種のタンパク質のコンフォメーション状態を決定する工程を含む、上記方法。
【選択図】
図1
【特許請求の範囲】
【請求項1】
少なくとも1種のタンパク質のコンフォメーション状態を検出する方法であって、前記少なくとも1種のタンパク質は、更なるタンパク質及び/又はその他の生体分子の複雑な混合物、好ましくは複雑な細胞抽出物混合物中に含まれており、ここで、前記複雑な混合物中の前記少なくとも1種のタンパク質は、前記少なくとも1種のタンパク質において構造変化を誘導する条件に曝されており、必要に応じて抽出工程及び/又は溶解工程の後に、以下の一連の工程:
1.前記少なくとも1種のタンパク質が検出対象の当初のコンフォメーション状態にある条件下で前記複雑な混合物のタンパク質限定分解を行うことにより、第1の断片試料を得る工程、その直後に、
2.前記第1の断片試料から大きなペプチド及びタンパク質又はその他の生体分子を除去して、濃縮された断片試料を形成する工程、
3.前記濃縮された断片試料の解析的分析を行い、工程1の前記タンパク質限定分解がもたらされた場合に特徴的であるだけでなく前記除去工程2の後に残っている断片を決定して、前記少なくとも1種のタンパク質のコンフォメーション状態を決定する工程、
を含む、前記方法。
【請求項2】
前記コンフォメーション状態自体を検出するのに、工程1~工程3と並行して、前記少なくとも1種のタンパク質を含み、かつ構造変化を誘導する前記条件に曝されていない前記当初の複雑な混合物を工程1~工程3に供して、濃縮された断片コントロール試料を生成し、前記少なくとも1種のタンパク質のコンフォメーション状態の決定が、前記濃縮された断片試料の前記解析的分析と、前記濃縮された断片コントロール試料の前記解析的分析との定量的比較に基づくか、又は、
前記複雑な混合物中の異なる条件に依存する前記コンフォメーション状態の変化を検出するのに、第1の複雑な混合物及び第2の複雑な混合物を個別に工程1~工程3に供することによって、これらを前記少なくとも1種のタンパク質における構造変化を誘導する異なる条件に曝すことによって2つの複雑な混合物を生成し、前記少なくとも1種のタンパク質のコンフォメーション変化の決定が、前記第1の濃縮された断片試料の前記解析的分析と、前記第2の濃縮された断片試料の前記解析的分析との比較に基づく、請求項1に記載の方法。
【請求項3】
前記複雑な混合物中の前記少なくとも1種のタンパク質における構造変化を誘導する条件は、温度変化、圧力変化、イオン強度変化、pH変化、代謝賦活薬変化、薬物/小分子の添加、代謝産物の添加、タンパク質の添加、ペプチドの添加、脂質の添加、DNAの添加、RNAの添加を含むリガンドの添加、突然変異を含む疾患/健康の状態若しくは状況及び遺伝的変異、又はそれらの組合せ、カオトロープの添加、翻訳後修飾を含む化学修飾、特にリン酸化、ジスルフィド架橋形成、ADPリボシル化、ユビキチン化、SUMO化、アセチル化、メチル化、酸化、グリコシル化、又はそれらの組合せからなる群から選択される、請求項1又は2に記載の方法。
【請求項4】
工程2において、サイズ濾過を含む濾過工程、分離工程、若しくは別の濃縮工程、サイズ排除クロマトグラフィー、疎水性クロマトグラフィー、若しくは陰イオン交換クロマトグラフィーを含むクロマトグラフィー、相分離、吸収、沈殿を含む物理的除去、親水性特性/疎水性特性に基づく濾過、分離、若しくは濃縮、電場/磁場に基づく濾過、分離、若しくは濃縮、又はそれらの組合せにおいてペプチド及びタンパク質を除去する、請求項1~3のいずれか一項に記載の方法。
【請求項5】
工程2において、20kDaより大きい分子量、好ましくは15kDaより大きい分子量、最も好ましくは10kDaより大きい分子量を有するペプチド、タンパク質、及び/又はその他の生体分子を前記第1の断片試料から除去する、請求項1~4のいずれか一項に記載の方法。
【請求項6】
工程3は、実際の分析の前に、特に変性、C18クリーンアップ、又はそれらの組合せを含むプロテオミクスワークフローを含む、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記工程1において、プロテアーゼK、サーモリシン、サブチリシン、ペプシン、パパイン、α-キモトリプシン、エラスターゼ、及びそれらの混合物からなる群から選択されるタンパク質分解系を使用する、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記工程1において、前記タンパク質分解系を、前記試料中の総生体分子含有量に対して、酵素含有量対生体分子含有量の比率として示される重量基準で1/50~1/10000の範囲、好ましくは1/100~1/1000の範囲の濃度で使用する、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記工程1を、1分間~60分間、好ましくは2分間~30分間、又は2分間~10分間、又は2分間~5分間の期間にわたって、更に好ましくは20℃~40℃の温度で実施する、請求項1~8のいずれか一項に記載の方法。
【請求項10】
定量的決定を行うのに、工程1の前記タンパク質限定分解がもたらされた場合に特徴的であるだけでなく前記除去工程2の後に残っている重標識された断片を、前記当初の複雑な混合物及び/又は前記第1の断片試料及び/又は前記濃縮された断片試料へとスパイクする、請求項1~9のいずれか一項に記載の方法。
【請求項11】
工程3における前記解析的分析を行うのに、プロダクトイオンスペクトルの選択反応モニタリング(SRM)及び/又はデータ非依存的取得の形態の特定の定量的質量分析法に基づくアッセイを使用する、請求項1~10のいずれか一項に記載の方法。
【請求項12】
更なるタンパク質及び/又はその他の生体分子の前記複雑な混合物は、複雑な天然の生物学的マトリックスである、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記少なくとも1種のタンパク質は、タンパク質原性アミノ酸のみに基づくタンパク質であるか、又はタンパク質原性アミノ酸に基づき、かつ翻訳後修飾を有する、請求項1~12のいずれか一項に記載の方法。
【請求項14】
調査対象の複雑な混合物において誘導された摂動後にコンフォメーション変化を起こした前記少なくとも1種のタンパク質のコンフォメーション若しくは前記タンパク質の医学的に関連するコンフォメーションの仮説フリーな決定のための、タンパク質ベースの薬物の決定のための、薬物若しくはその他のリガンドのタンパク質への影響のための、又はタンパク質ベースの医薬製剤の品質管理のための、請求項1~13のいずれか一項に記載の方法の使用。
【請求項15】
前記工程1により生成されたペプチドのための、TAILS等のペプチド断片濃縮技術と組み合わせた、請求項1~13のいずれか一項に記載の方法の使用。
【請求項16】
バイオマーカーとしての、請求項1~13のいずれか一項に記載の方法の工程2において得られた前記濃縮された断片試料に含まれるコンフォメーションが変更されたペプチド/タンパク質の使用。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、タンパク質及びその誘導体のコンフォメーション及びコンフォメーション変化を、任意にそれらの天然の生物学的状況において、特にタンパク質限定分解と、例えば選択反応モニタリング、データ依存的取得(DDA)、全理論的フラグメントイオン質量スペクトルの逐次的ウィンドウ型取得(Sequential Windowed Acquisition of All Theoretical Fragment Ion Mass Spectra)(SWATH)法を含むデータ非依存的取得(DIA)等とを組み合わせて使用して決定する方法に関する。
【背景技術】
【0002】
タンパク質は、多岐にわたる細胞プロセスの極めて重要な効果因子及び制御因子である。摂動(perturbations)に応答して(例えば、疾患の場合)、タンパク質は、それらの細胞濃度、活性、位置、及びそれらの構造を変え得る。このような転移を捉えるのを可能にすることは、健康及び疾患における基本的な細胞プロセスの機能化を理解し、疾患の診断及び治療にとっての新しい選択肢を特定するのに生命科学において不可欠な課題である。摂動に応答した細胞タンパク質濃度の変化を、質量分析法(MS)に基づくプロテオーム技術によって定型的に調べることができる。細胞内のタンパク質の折り畳みを研究するのに適した手法が不足していることを主な理由として、細胞タンパク質コンフォメーションの切り替わりについては殆ど知られていない。コンフォメーション変化はタンパク質の活性、位置、及び安定性に強く影響し、こうして細胞の生理学に大いに影響を及ぼす可能性があるため、この切り替わりは生物学的応用及び臨床的応用にとっての大きな制限となる。
【0003】
タンパク質は、脂質、イオン、小分子、又は核酸への結合、他のタンパク質との相互作用、化学修飾(例えば、リン酸化)、又はpH、イオン強度、若しくは温度の変動等の環境変化によって、それらのコンフォメーションを変え得る。コンフォメーション変化の程度は、アロステリック/局所的再構成等の小さな局所的運動から、ドメイン運動等のより大規模な変動、更には折り畳まれた状態と折り畳まれていない状態との間又は単量体状態と多量体状態との間の劇的な切り替わりにまで及ぶ。特に、単量体タンパク質のより高次の凝集構造への転移は、生物学及び生物医学の両方において最近ますます注目を集めている。過去20年間にわたり、タンパク質凝集疾患と呼ばれる様々なヒト疾患(20種を超える様々な病状)が、特定の誤って折り畳まれたタンパク質の凝集体の細胞内蓄積又は細胞外蓄積に関連していることが明らかにされた。パーキンソン病又はアルツハイマー病等の、これまで病因が不明であった多くの神経変性疾患が、現在ではこのカテゴリーに分類されている。タンパク質の凝集体の主要なタンパク質成分に従って、様々な疾患を分類することさえ可能であり、それによって疾患の臨床症状も区別される。例えば、αシヌクレイン(αSyn)含有レビー小体が殆どのタイプのパーキンソン病(PD)に典型的である一方で、アミロイド-βペプチド封入体がアルツハイマー病において生成される(例えば、非特許文献1を参照)。生物標本におけるこのようなタンパク質コンフォメーション転移をモニタリングすることができれば、これらのタンパク質中心の病態の診断及び療法に新たな可能性が開かれ、それらの病因が解明されることとなる。
【0004】
タンパク質のコンフォメーション特徴をモニタリングするのに、核磁気共鳴(NMR)、X線結晶構造解析、赤外・ラマン分光法、円二色性、原子間力顕微鏡法、又は蛍光分光法等の多くの生物物理学的技術が適用されてきた。これらの技術は、複雑な生物学的背景を扱うことができないため、主として(精製された)タンパク質をin vitroで分析するのに使用される。これは実質的な制限である。それというのも、タンパク質が採るコンフォメーションは、環境要因、結合事象、又は翻訳後修飾等のその細胞の状況に特有の多数の同時発生する事象によって細胞内で制御されており、これらはin vitroの系によって再現することができないからである。フェルスター共鳴エネルギー移動(FRET)に基づく技術は、タンパク質のコンフォメーション変化がそれらの天然の細胞環境においてモニタリングされるという利点があるが、各標的タンパク質の適切な部位に蛍光プローブを導入する必要があり、大規模に又は臨床試料に対しては適用不可能である。
【0005】
上記の考慮事項に照らして、タンパク質コンフォメーション変化をそれらの生物学的環境において多重化された様式(一度に多数のタンパク質)で追跡する方法を利用可能とすることが緊急に求められている。理想的な方法の追加の特徴は、i)スケールアップに適していること(多数の試料の高速分析)、及びii)様々な用途(臨床用途若しくはバイオテクノロジー用途又は生物学の基礎研究)に簡単に適合可能であることである。
【0006】
Gupta、Lapadula、及びAbou-Doniaは、「β-ナフトフラボンで誘導された成鶏肝臓からのシトクロムP450アイソザイムの精製及び特性評価(Purification and Characterization of Cytochrome P450 Isozymes from β-Naphthoflavone-Induced Adult Hen Liver)」と題する論文(非特許文献2)において、純粋なシトクロムP450の精製及び特性評価について報告している。特性評価は、変性条件下でキモトリプシンを使用したプロテアーゼ処理によって行われる。
【0007】
Cohen、Ferre-D'Amare、Burley、及びChaitは、「タンパク質分解及び質量分析法の組合せによるDNA結合タンパク質Maxの溶液構造の調査(Probing the solution structure of the DNA-binding protein Max by a combination of proteolysis and mass spectrometry)」と題する論文(非特許文献3)において、酵素タンパク質分解とマトリックス支援レーザー脱離イオン化質量分析法とを組み合わせてDNA結合タンパク質の溶液構造を調査する簡単な生化学的方法を提案している。この方法は、溶媒のアクセス可能性及びタンパク質の柔軟性によって左右される、酵素タンパク質分解に対する保護の決定から構造情報を推論することに基づいている。
【0008】
特許文献1は、タンパク質限定分解(LiP)プロトコル、すなわち、更なるタンパク質及び/又はその他の生体分子の複雑な混合物、特に複雑な天然の生物学的マトリックスに含まれるタンパク質のコンフォメーション状態を検出する方法だけでなく、そのような方法用のアッセイも開示している。この方法は、必要に応じて抽出工程及び/又は溶解工程の後に、以下の工程、すなわち、1.タンパク質が検出されるべきコンフォメーション状態にある条件下で複雑な混合物のタンパク質限定分解を行って、第1の断片試料を得る工程、2.第1の断片試料を変性させて、変性された第1の断片試料とする工程、3.変性された第1の断片試料を消化工程において完全に断片化して、完全に断片化された試料とする工程、4.完全に断片化された試料の解析的分析を行い、工程1のタンパク質限定分解だけでなく消化工程3における完全な断片化の両方がもたらされた場合に特徴的な断片を決定して、コンフォメーション状態を決定する工程を含む。
【0009】
Schopperらは、「タンパク質限定分解に連結された質量分析法を使用したプロテオームワイド規模でのタンパク質構造変化の測定(Measuring protein structural changes on a proteome-wide scale using limited proteolysis-coupled mass spectrometry)」と題した論文(非特許文献4)において、タンパク質活性に大きな影響を与えるため細胞生理学を調節する外部摂動又は内部要因によって引き起こされるタンパク質構造変化について報告している。タンパク質限定分解に連結された質量分析法(LiP-MS)は、タンパク質構造変化をプロテオームワイド規模でそれらの複雑な生物学的状況において直接特定することを可能にする、最近開発されたプロテオミクス手法であると報告されている。対象の摂動の後、プロテオーム抽出物を、天然の条件下で非特異的プロテアーゼが適用される二重プロテアーゼ消化工程に供し、続いて、変性条件下で配列特異的プロテアーゼのトリプシンで完全に消化させる。この逐次処理により、ボトムアップMS分析に適した構造特異的なペプチドが生成される。次に、ショットガン又はターゲットMS及びラベルフリー定量化を含むプロテオミクスワークフローを適用して、プロテオーム抽出物中の構造依存的タンパク質分解パターンを直接測定する。LiP-MSの考えられる応用としては、摂動に誘導されたタンパク質構造変化の発見、薬物標的の特定、疾患関連タンパク質の構造状態の検出、及び生体試料中のタンパク質凝集体の直接分析が挙げられる。この手法により、構造転移に関与する又は結合事象によって影響を受ける特定のタンパク質領域を特定することも可能となる。
【0010】
Jafariらは、「細胞内の薬物標的相互作用を評価する細胞サーマルシフトアッセイ(The cellular thermal shift assay for evaluating drug target interactions in cells)」と題した論文(非特許文献5)において、リガンド結合時のタンパク質の熱安定化を研究するのに使用されるサーマルシフトアッセイについて報告している。このようなアッセイは、創薬産業及び学術界において精製されたタンパク質に対して相互作用を検出するのに使用されてきた。細胞形式でのサーマルシフトアッセイの実装を説明した原理実証研究が発表され、これらは細胞サーマルシフトアッセイ(CETSA)と呼ばれている。この方法により、ヒトキナーゼp38a及びERK1/2に関する実験データにより例示される、細胞の状況における薬物候補のターゲットエンゲージメントの研究が可能となる。このアッセイは、細胞を対象の化合物で処理し、加熱してタンパク質を変性及び沈殿させ、細胞を溶解し、可溶性タンパク質画分から細胞破片及び凝集体を分離することを含む。非結合タンパク質は高温で変性して沈殿するが、リガンドに結合したタンパク質は溶液中に残る。彼らは、試料の可溶性画分中の安定化タンパク質を検出する2つの手順について説明している。1つ目の手法は、定量的ウェスタンブロッティングを使用した試料の後処理及び検出を含むのに対し、2つ目の手法は、溶液中で直接実施され、可溶性タンパク質への結合時の2つの標的指向抗体の近接の誘導によるものである。後者のプロトコルは、潜在的な用途で多数の試料が必要とされるため、スループットの増加が可能となるように最適化されている。
【0011】
Cappellettiらは、「動的3Dプロテオームはタンパク質の機能的変化をin situで高分解能にて明らかにする(Dynamic 3D proteomes reveal protein functional alterations at high resolution in situ)」と題する論文(非特許文献6)において、栄養適応を受けている細菌及び急性ストレスに応答している酵母において、多くの機能的変化を同時にin situで検出するタンパク質限定分解-質量分析法(LiP-MS)に基づいて、全体的なタンパク質構造の読み出しが可能であることを報告している。構造バーコードとして視覚化された構造の読み出しにより、結合部位及び活性部位等の個々の制御された機能的部位の解明とともに、酵素活性の変化、リン酸化、タンパク質凝集、及び複合体形成が捉えられた。他のオミクスデータを含む既存の知識と比較することにより、LiP-MSは十分に研究された経路内の多くの既知の機能的変化を検出することが明らかとなった。これにより、明確な代謝産物-タンパク質相互作用が示唆され、E.コリ(E. coli)におけるフルクトース-1,6-ビスリン酸エステルに基づくグルコース取り込みの制御メカニズムの特定が可能となった。構造の読み出しにより、古典的なプロテオミクスのカバレッジが劇的に拡大し、メカニズムの仮説が立てられ、in situの構造系の生物学への道が開かれる。
【0012】
Savitzkiらは、「プロテオームの熱プロファイリングによる生細胞内の抗癌薬の追跡(Tracking cancer drugs in living cells by thermal profiling of the proteome)」と題する論文(非特許文献7)において、インタクトな細胞又は細胞抽出物を加熱することによってヒトK562細胞に対して熱プロテオームプロファイリング(TPP)を実施したところ、2つの設定間で融解特性に顕著な違いが見られるとともに、細胞抽出物におけるタンパク質安定性が増加する傾向にあることを報告している。細胞プロテオームの熱プロファイリングにより、タンパク質リガンドの結合及びその他のタンパク質修飾の示差的評価が可能となり、多数の標的に対する薬物標的の占有率の偏りのない測定値がもたらされ、薬物の効力及び毒性についてのマーカーの特定が容易になることが報告されている。
【0013】
特許文献1は、更なるタンパク質及び/又はその他の生体分子の複雑な混合物、特に複雑な天然の生物学的マトリックスに含まれるタンパク質のコンフォメーション状態を検出する方法だけでなく、そのような方法用のアッセイも開示している。この方法は、必要に応じて抽出工程及び/又は溶解工程の後に、次の工程、すなわち、1.タンパク質が検出されるべきコンフォメーション状態にある条件下で複雑な混合物のタンパク質限定分解を行って、第1の断片試料を得る工程、2.第1の断片試料を変性させて、変性された第1の断片試料とする工程、3.変性された第1の断片試料を消化工程において完全に断片化して、完全に断片化された試料とする工程、4.完全に断片化された試料の解析的分析を行い、工程1のタンパク質限定分解だけでなく消化工程3における完全な断片化の両方がもたらされた場合に特徴的な断片を決定して、コンフォメーション状態を決定する工程を含む。
【0014】
Schopperら著の「タンパク質限定分解に連結された質量分析法を使用したプロテオームワイド規模でのタンパク質構造変化の測定(Measuring protein structural changes on a proteomewide scale using limited proteolysis-coupled mass spectrometry)」(非特許文献4)は、外部摂動又は内部要因によって引き起こされるタンパク質構造変化、及びこれらがタンパク質活性に大きな影響を与えるため細胞生理学を調節し得ることについて報告している。タンパク質限定分解に連結された質量分析法(LiP-MS)は、タンパク質構造変化をプロテオームワイド規模でそれらの複雑な生物学的状況において直接特定することを可能にする手法として報告されている。対象の摂動の後、プロテオーム抽出物を、天然の条件下で非特異的プロテアーゼが適用される二重プロテアーゼ消化工程に供し、続いて、変性条件下で配列特異的プロテアーゼのトリプシンで完全に消化させる。この逐次処理により、ボトムアップMS分析に適した構造特異的なペプチドが生成される。次に、ショットガン又はターゲットMS及びラベルフリー定量化を含むプロテオミクスワークフローを適用して、プロテオーム抽出物中の構造依存的タンパク質分解パターンを直接測定する。LiP-MSの考えられる応用としては、摂動に誘導されたタンパク質構造変化の発見、薬物標的の特定、疾患関連タンパク質の構造状態の検出、及び生体試料中のタンパク質凝集体の直接分析が挙げられることが報告されている。この手法により、構造転移に関与する又は結合事象によって影響を受ける特定のタンパク質領域を特定することも可能となる。試料の調製におよそ2日かかり、続いて、分析される試料の数に応じて1日から数日間のMS及びデータ分析の時間がかかる。
【0015】
非特許文献8は、タンパク質限定分解法の質量分析法に基づくプロテオームワイドな適用において生成された半トリプシン消化性ペプチドを分離する、タンパク質分解手順用半トリプシン消化性ペプチド濃縮戦略(semitryptic peptide enrichment strategy for proteolysis procedures)(STEPP)と呼ばれる化学選択的濃縮戦略を記載している。この戦略は、リジン側鎖のεアミノ基及びタンパク質限定分解反応において生じた任意のN末端とアイソバリック質量タグとを反応させることを含む。引き続き試料をトリプシンで消化し、新たに露出したトリプシン消化性ペプチドのN末端とN-ヒドロキシスクシンイミド(NHS)活性化アガロース樹脂とを化学選択的に反応させることで、溶液からトリプシン消化性ペプチドが除去されることから、タンパク質限定分解反応において生じた1つの非トリプシン消化性切断部位を有する半トリプシン消化性ペプチドのみが残り、続いてLC-MS/MS分析が行われる。この研究の一環として、STEPP技術は、パルスタンパク質分解(PP)法及びタンパク質限定分解(LiP)法を含む2つの異なるタンパク質分解法と接続されている。STEPP-PPワークフローは、酵母細胞溶解物中のタンパク質並びに十分に研究されている2つの薬物、すなわちシクロスポリンA及びゲルダナマイシンを対象とした2つの原理実証実験において評価される。STEPP-LiPワークフローは、ヒト乳癌の2つの細胞培養モデルであるMCF-7細胞系統及びMCF-10A細胞系統におけるタンパク質を対象とした原理実証実験において評価される。STEPPプロトコルにより、LiP実験及びPP実験において検出された半トリプシン消化性ペプチドの数が5倍~10倍増加した。STEPPプロトコルにより、プロテオームのカバレッジが拡大するだけでなく、タンパク質限定分解実験から収集することができる構造情報の量も増加する。さらに、このプロトコルにより、リガンド結合親和性の定量的な決定も可能となる。
【0016】
非特許文献9は、1回の操作で数百のタンパク質複合体を定量化する統合実験及び計算技術を記載している。この方法は、天然のタンパク質複合体を分画するサイズ排除クロマトグラフィー(SEC)と、各SEC画分中のタンパク質を正確に定量化するSWATH/DIA質量分析法と、包括的なタンパク質相互作用マップからの事前情報を使用してエラー制御された複合体中心の分析によってタンパク質複合体を検出及び定量化する計算フレームワークCCprofilerとからなる。HEK293細胞系統プロテオームの解析により、2127個のタンパク質サブユニットから構成される462個の複合体が明らかにされた。この技術により、中心的制御複合体の新規の部分複合体及び集合中間体が特定される一方で、それら全体にわたる定量的なサブユニット分布が評定される。ツールセットCCprofilerが自由に利用可能となり、HEK293プロテオームのモジュール性をカスタム探索するWebプラットフォームSECexplorerが提供される。
【先行技術文献】
【特許文献】
【0017】
【非特許文献】
【0018】
【非特許文献1】A Aguzzi & T O'Connor, Nat Rev Drug Discov 9 (3), 237
【非特許文献2】Archives of Biochemistry and Biophysics, 282 (1) 170-182 (1990)
【非特許文献3】Protein Science (1995), 4:1088-1099
【非特許文献4】nature protocols, VOL.12 NO.11, 2017, 2391ff
【非特許文献5】nature protocols, VOL.9, NO.9, 2014, 2101ff
【非特許文献6】Cell 184, 545-559, January 21, 2021
【非特許文献7】sciencemag.org, 3 October 2014, VOL 346 ISSUE 6205
【非特許文献8】Ma R. et al, Chemo-selection strategy for limited proteolysis experiments on the proteomic scale, Anal. Chem., vol. 90, no. 23, 7 November 2018, pages 14039-14047
【非特許文献9】Heusel M. et al, Complex-centric proteome profiling by SEC-SWATHMS, Mol. Syst. Biol., vol. 15, no. 1, Article no. e8438, 14 January 2019, pages 1-22
【発明の概要】
【0019】
例えば特許文献1に開示される現行のLiP-MS手法(例えば、Schopperら又はCappellettiら)は、具体的には、天然のタンパク質に対する広範に非特異的な酵素消化に続いて変性プロテオームの完全なトリプシン消化を行う二重消化ワークフローによるものである。次いで、その後の分析は、トリプシン消化性ペプチド及び/又は半トリプシン消化性ペプチドに焦点が当てられる。一方、本明細書で提案される手法は、天然の非変性タンパク質からのみ生成され、大部分が非トリプシン消化性であるため典型的なLiP-MS実験においては殆ど存在しないペプチドに焦点を当てるように設計されている。標準的なLiP-MS実験の分析において完全に非トリプシン消化性のペプチドを利用しようとしたとしても、2つの理由から有用な情報は殆ど得られないことに注意することが重要である。第一に、LiP-MSプロトコルにおける標準である変性条件下で行われる完全なトリプシン消化の結果として、完全に非トリプシン消化性のペプチドは殆ど残らない。第二に、生成されたそのようなペプチドはいずれも、存在するトリプシン消化性ペプチド及び/又は半トリプシン消化性ペプチドの膨大な量及び体積によってそれらの信号が弱い及び/又はマスクされるため、質量分析法を介して正確に検出及び定量化することが困難である。典型的なLiP-MS実験の分析により、完全に非トリプシン消化性なのは総ペプチドの1%未満であり、ポジティブコントロール実験における標的の特定に寄与しないことが分かる。
【0020】
提案されたワークフローは、LC-MS、DIA(プロダクトイオンスペクトルのデータ非依存的取得)質量分析、及び非特異的データベース検索を使用して、複雑な生物標本又は臨床標本におけるタンパク質のユニークな構造状態/コンフォメーション状態及び/又は構造的/コンフォメーション的なタンパク質変化を、高い感度、カバレッジ、及びスループットでMSに基づいて特定することを可能にする技術である。
【0021】
提案された手法によってサンプリングされたタンパク質の構造状態/コンフォメーション状態は、用途に応じて、天然、非天然、又はその両方の混合であり得る。この技術の実装形態を使用して、標準条件下、薬物/小分子若しくは代謝産物へのタンパク質の結合中、他のタンパク質への結合時(タンパク質間相互作用、すなわちタンパク質複合体)、化学修飾(例えば、タンパク質リン酸化のようなPTM)の結果としての様々な他の分子(例えば、脂質又はDNA)への結合時、又は局所環境の変化(例えば、温度上昇、イオン強度の変化、又はカオトロープの存在)の際のタンパク質構造を調査することができる。提案された技術により、調査される系において摂動が誘発されたときに(例えば、免疫シグナル伝達又は疾患の惹起)、構造変化を起こすタンパク質を仮説フリーに検出及び特定することが可能となる。このようなユニークなタンパク質のコンフォメーション変化及び状態を特定することで、タンパク質の構造及び機能に関する有益な情報が得られ、対象の薬物又は代謝産物の標的を特定することが可能となり、摂動への応答に関与する生化学的経路及びシグナル伝達経路が特徴付けられ、疾患のメカニズムに関する情報が得られる。さらに、変化したタンパク質構造を、疾患検出用の代替指標(すなわち、構造バイオマーカー)として使用することができる。構造プロテオームの構造状態及びダイナミクスに関する洞察は、本発明者らの疾患の理解を促す上でも薬物の設計及び改良を支持する上でも大きな障害となり得る生理学的及び非生理学的の両方の作用メカニズムのより深い理解をもたらす。したがって、提案された技術により、基礎生物学からターゲットデコンボリューション及びバイオマーカーの発見に至る範囲に及ぶ様々な用途に構造プロテオミクスを活用することが可能となる。
【0022】
より具体的には、提案された技術は、前述の課題に対処することを目的とした既存の質量分析技術(例えば、Schopperら、Cappellettiら、Jafariら、及びSavitzkiらによる上述の手法)に固有の問題/不利点に対処する新規の手法を使用する。これらの技術は、トリプシン消化性及び/又は半トリプシン消化性の消化混合物(すなわち、ペプチド当たり1回のトリプシン消化性切断)の生成及び特定に頼ることによってプロテオーム発見の深さ(カバレッジ、感度)を最大化することに重点を置いている。これらのペプチドは、典型的には、そのサイズ及び特定可能性の点で質量分析に適している。しかしながら、これらの実験において、多くのペプチドは構造情報/コンフォメーション情報に関して情報を与えない一方で、試料の複雑さ、ダイナミックレンジ、及び雑音を大幅に増加させる。さらに、現行版のLiP-MSにおいては、トリプシン消化後、多くのペプチドは信頼性の高いMSベースの特定には短すぎるため、分析において失われる。提案された技術は、LiP-MS手法の新しい別形であり、これは、構造情報を必ずしも報告するわけではないペプチド(したがってタンパク質)の特定を犠牲にして、その代わりにタンパク質から構造情報/コンフォメーション情報を伝達するペプチドを特定する相対的な能力の増大に重点を置いている。構造的な情報を与えるペプチドの濃縮に重点を置くことにより、提案された技術では信号対雑音比が高まるため、タンパク質の構造変化の特定がより頑健なものとなる。
【0023】
提案された技術の主要な特徴は、試料に含まれるペプチドの総数に対して、真の情報を与えるペプチドの数及び存在量を増加させ、こうしてプロテオミクス試料に固有のダイナミックレンジの課題を大幅に軽減することである。
【0024】
この問題は、血漿等のヒト体液には非常に顕著であるが、単一(又は少数)のタンパク質標的を有する薬物の研究でよくあるような、対象のタンパク質(複数の場合もある)の存在量が低い試料においても見られる。この広いダイナミックレンジは、他の要因に加えて、タンパク質のサイズ/濃度分布と、質量分析計におけるペプチド応答の数及び分布との組合せに起因する。LiP-MS手法を含む古典的なプロテオーム手法においては、タンパク質が大きくなるほど、より多くのトリプシン消化性ペプチドが生成されることになる。したがって、タンパク質のサイズ及び/又は存在量と、そのようなタンパク質が質量分析計において強い応答を示す少なくとも幾つかのペプチドを生成する可能性との間には強い相関が見られる。対照的に、提案された技術手法では、主にその天然又は天然に近いコンフォメーション(すなわち、変性していない)にあるタンパク質のプロテアーゼアクセス可能領域からペプチドが生成される。これらのペプチドは、タンパク質の溶媒露出表面に存在する傾向がある。タンパク質の表面積と体積との間の関係は固定比率ではなく、平均的にはタンパク質のサイズが大きくなるにつれて減少するため、これにより大きなタンパク質に由来するペプチドの比例数が大幅に減少する。提案された技術は、この表面積対サイズ比の偏りを活用することによって、少なくとも部分的にはタンパク質の天然のサイズ分布に起因するプロテオミクス試料に固有のダイナミックレンジを縮小することを目的としている。さらに、提案された技術は、タンパク質構造及びタンパク質構造変化を報告する情報に富んだアクセス可能なペプチドに焦点を当てている。
【0025】
提案された技術は、2つの主要なプロセス、すなわち、限定消化と連結された短いMS適合性のペプチドの濃縮を活用している。この手順の全体的な目的は、コンフォメーション情報/構造情報(信号)を伝えるペプチドの数を増やす一方で、質量分析計への準備ができた試料において、そのような情報(雑音)を含まないペプチドの量を減らすことである。
【0026】
これは、特異的又は非特異的なプロテアーゼを使用して、非変性(すなわち、タンパク質構造を保持する)条件下で限定消化工程を使用することにより、驚くほど簡単かつ効率的な手法で実現される。酵素対基質比を変更するか、より低い温度で消化を実施するか、又は比較的短い時間規模で消化を実施することによって、限定消化を変化させることができる。次いで、得られたペプチド混合物を、LiP-MSプロトコルとは対照的に、完全に変性させず、完全に断片化させ、これを他の様式で(以下参照)濾過又は処理して、混合物の大部分に相当し、タンパク質の構造/コンフォメーション及び/又は構造変化/コンフォメーション変化に関する情報を殆ど含まない大きなペプチド/タンパク質断片を除去する。提案された技術は、質量分析法の前に消化物から大きなペプチド/タンパク質片を除去することによって、質量分析計でのペプチド特定の観点から下流のデータ分析中にも実験に人為結果及び/又は雑音をもたらす可能性のある情報を与えないペプチドの数も減少させる。この除去は、サイズ濾過(例えば、10kのMWCOの濾過装置を使用する)、クロマトグラフィー(例えば、サイズ排除、疎水性、又は陰イオン交換)、又は物理的プロセス(例えば、相分離、吸収、又は沈殿)を含む大きなペプチド/タンパク質片を分離して適切なペプチドを濃縮するプロセスによって達成され得る。古典的なLiP-MSと比較して、提案された技術では、タンパク質限定分解工程後の変性条件下での完全なトリプシン処理工程が省略される。
【0027】
限定消化工程に単一のプロテアーゼを使用するのに加えて、提案された技術を、プロテアーゼ混合物及び/又は感作因子(例えば、熱、尿素)の使用によって強化することができる。プロテアーゼ混合物の代わりに、2種の異なるプロテアーゼ(又はプロテアーゼのセット)を試料のアリコートに対して使用し、その後に試料をプールすることもできる。ペプチドを消化するか、又は試料の残部から分離した後にプールを行うことができる。プールするのではなく、試料を完全に別々にプロセシングして測定することもできる。提案された技術によれば、プロテアーゼ混合物及び感作因子が2つの様式で作用して、対象のタンパク質の特定が改善する。プロテアーゼ混合物には、様々なアミノ酸を切断の標的とするプロテアーゼが含まれているため、消化工程の間に、より多くてユニークなペプチドを非常に簡単に生成することが可能となる。感作因子は、タンパク質の天然の状態を僅かに破壊して、新規のプロテアーゼ切断(切断部位)を可能にすることによって機能する。感作因子は、特定の状態がタンパク質構造の変化について(例えば、薬物又は代謝産物の有無の両方で)調査されている場合に、提案された技術に特に役に立つ。このような場合、薬物の結合等の事象によって構造が変化する(すなわち、安定化又は不安定化する)と、対象のタンパク質が特定の感作因子に対して多かれ少なかれ感受性となるため、感作因子の効果は強まる。
【0028】
このように、提案された技術は、従来無視されてきたペプチド(すなわち、タンパク質の表面に位置する2つの非トリプシン消化性末端を有するペプチド)を活用することによって、特定のタンパク質のコンフォメーション又は構造を特定することができる。提案された技術ワークフローに含まれる大きなペプチド及びタンパク質を除去する工程(例えば、濾過)は、全体的なペプチド/タンパク質の特定数を変更するものの、構造的な情報を与えるペプチドの相対的な濃縮につながった。
【0029】
提案された技術ワークフローは、以下の工程を含む又はそれらからなる:
1.細胞、組織、又は体液からのタンパク質又はプロテオームを含む試料を、タンパク質の構造及び/又はコンフォメーション状態について調査する。これには、限定されるものではないが、コントロール(ビヒクル)試料を含む規定の濃度(処理混合物)でのリガンド(例えば、小分子、代謝産物等)とのインキュベーション、又は刺激されていない試料を含む、温度、代謝賦活薬等の構造状態の変化を誘導する条件に溶解物を曝すことが含まれる。どのような条件が利用されても、天然のタンパク質構造(一次構造、二次構造、三次構造、及び好ましくは/潜在的にはまた四次構造)は全体にわたって保存される。
2.各試料を、特異的プロテアーゼ又は非特異的プロテアーゼ(又はそれらの組合せ)を使用した限定消化工程に供する。この消化は比較的短く、典型的には1分間~5分間で、直ちにクエンチされるべきである。
3.この消化工程に続いて、例えば、濾過装置、分離装置、又は濃縮装置を介して、より大きなペプチド及びタンパク質断片を除去する(上記及び下記の方法を参照)。
4.次いで、残りのペプチドを、標準的なプロテオミクスワークフロー(例えば、変性、C18クリーンアップ等)を使用してプロセシングし、LC-MS/MSを介して分析し、こうしてペプチドを特定及び定量化することができる。
【0030】
この技術が構造変化/コンフォメーション変化の検出を支持する方法の一例である概略図を、リガンド結合事象の調査を一例として使用して
図1に示す。
【0031】
このように、提案された手法は、ユニークなペプチドのセットの生成及び分析に重点を置いているため、従来のLiP-MS実験から完全にユニークな情報をもたらすことができるLiP-MSに対する新規の補完的な手法である。提案された技術では、限られた時間にわたって天然のタンパク質のみを消化し、続いて濾過工程/濃縮工程を導入することによって、試料の調製、データの取得、及び分析中に問題となる情報の乏しいペプチド及び/又はタンパク質片の数が減少する。この信号対雑音比の向上は、データ品質の大幅な改善、ひいては生物学的洞察の改善に相当し得る。
【0032】
より一般的に言えば、本発明は、少なくとも1種のタンパク質のコンフォメーション状態を検出する方法であって、上記少なくとも1種のタンパク質が、更なるタンパク質及び/又はその他の生体分子の複雑な混合物中に含まれている(このような複雑な混合物は、例えば、複雑な細胞抽出物混合物、又は一般的には、組織に基づく体液(血漿、脳脊髄液、尿等)、環境試料(例えば、海水等)、例えば、公開されたLiPプロトコルに従って溶解された細胞によって得られる生体分泌物(上記参照)等の生物学的プローブ(biological probe)であり得て、タンパク質濃度をアッセイキットを使用して決定することができる)、上記方法に関する。上記複雑な(例えば、細胞抽出物)混合物中の上記少なくとも1種のタンパク質は、上記少なくとも1種のタンパク質において構造変化を誘導する条件に曝されている。本方法は、必要に応じて抽出工程及び/又は溶解工程の後に、以下の一連の工程:
1.少なくとも1種のタンパク質が検出対象の当初のコンフォメーション状態にある条件下で複雑な(例えば、細胞抽出物)混合物のタンパク質限定分解を行うことにより、第1の断片試料を得る工程、その直後に、
2.上記第1の断片試料から大きなペプチド及びタンパク質又はその他の生体分子を除去して、濃縮された断片試料を形成する工程、
3.濃縮された断片試料の解析的分析を行い、工程1のタンパク質限定分解がもたらされた場合に特徴的であるだけでなく除去工程2の後に残っている断片を決定して、上記少なくとも1種のタンパク質のコンフォメーション状態を決定する工程、
を含む。
【0033】
工程1の終了時に「直後に」と述べられている場合、これは更なる変性工程及び/又はタンパク質分解工程を除外するが、工程1のタンパク質限定分解の停止に関与する更なる工程、すなわち、対応する試薬(例えば、デオキシコール酸ナトリウム溶液)の添加、温度の上昇、洗浄、濾過、沈降、溶媒、イオン強度及び/又はpH調整、又はそれらの組合せ等によってタンパク質限定分解をクエンチする工程を除外するものではない。言い換えれば、タンパク質限定分解消化中には、ペプチド生成に寄与する他の工程(例えば、切断部位へのアクセスを増やす変性又は他のプロテアーゼの添加等)がないため、消化の観点からは工程1は「完了」している。しかしながら、工程2の前にデオキシコール酸塩を加え、温度を、例えば98℃までにすることができ、これを行うことで工程1からのプロテアーゼ活性を止めることができる。
【0034】
少なくとも1種のタンパク質の「コンフォメーション状態」という用語は、この分野で一般的に受け入れられるように広く理解されるべきであり、分子の全体的な形状を決定するタンパク質の構成原子の空間的な配置を意味する。言い換えれば、「コンフォメーション状態」という表現には、一次構造の情報、すなわちペプチド又はタンパク質におけるアミノ酸の線形配列及びその潜在的な化学修飾を超えるあらゆる種類の情報が含まれる。したがって、「コンフォメーション状態」という表現には、二次構造(タンパク質の局所セグメントの三次元配置、最も一般的な2つの二次構造要素はアルファヘリックス及びベータシートであるが、これにはベータターン及びオメガループも含まれる)、超二次構造(モチーフ、すなわちタンパク質ドメイン又はタンパク質サブユニットよりも小さい二次構造の幾つかの隣接要素のコンパクトな三次元タンパク質構造)、三次構造(ドメイン、すなわちタンパク質の三次元形状)、及び四次構造(それ自体が2つ以上のより小さなタンパク質鎖(サブユニットとも呼ばれる)から構成されているタンパク質の構造)が含まれる。
【0035】
提案された方法を使用して特定することができるタンパク質のコンフォメーション変化は、その本来備わる柔軟性によって可能となる。これらの変化は、比較的少ないエネルギー消費で起こり得る。分子構造レベルでは、単一のポリペプチドにおけるコンフォメーション変化は、主鎖のねじれ角及び側鎖の配向の変化の結果である。このような変化の全体的な効果は、少数の残基の再配向及び局所的な主鎖の小さなねじれ変化によって局所化される可能性がある。一方、重要な位置にある非常に少ない残基に局在化するねじれの変化でも、三次構造に大きな変化がもたらされる場合がある。後者のタイプのコンフォメーション変化はドメイン運動として説明される。Tobiらは、「タンパク質結合に関与する構造変化は、非結合状態のタンパク質の固有運動と相関している(Structural changes involved in protein binding correlate with intrinsic motions of proteins in the unbound state)」と題する論文(PNAS December 27, 2005vol. 102 no. 52)において、タンパク質間相互作用に関連するコンフォメーション変化が、側鎖の回転異性体状態の局所的変化から、集合的なドメイン運動等の構造の全体的な変化まで及ぶと報告している。
【0036】
提案された手法は構造プロテオミクス手法であり、ここでは、構造プロテオミクスは、プロテオミクス手法を使用して、個々のタンパク質又はプロテオームワイドでのタンパク質の構造的特徴/構造及びタンパク質の構造変化を決定することと定義される。
【0037】
提案された方法により、ターゲットデコンボリューションと呼ばれるものも可能となる。ターゲットデコンボリューションは、薬物/小分子又はタンパク質の直接的な相互作用相手を特定することである。ターゲットデコンボリューションは、アフィニティークロマトグラフィー、発現クローニング、タンパク質マイクロアレイ、「リバーストランスフェクション」細胞マイクロアレイ、及び生化学的抑制を含む数多くの方法によって実現され得る。
【0038】
好ましくは、工程3の分析は定量的質量分析法によって行われる。
【0039】
提案された方法は、タンパク質限定分解(LiP)と呼ばれる生化学的技術と、DIA(SWATH-MSを含む)又は選択反応モニタリング(SRM)等の他の質量分析手法、又は並列反応モニタリング(PRM)、データ依存的取得(DDA)、アイソバリック標識定量化を含むSRM様の手法を含む高度なターゲット質量分析ワークフローとを連結したものに基づいている。
【0040】
液体クロマトグラフィーと連結された質量分析法(LC-MS)は、複雑な試料混合物からのペプチド(したがってタンパク質)の特定及び定量化のためにプロテオーム業界で長年使用されてきた。最も一般的に使用される手法は、いわゆるLC-MS/MS又は「ショットガン」MS手法の別形であり、これは、プリカーサーイオンプロファイル(データ依存的分析、DDA)に基づいて自動的に選択されたプリカーサーイオンからのフラグメントイオンの生成に基づいている。最も成熟した技術は選択反応モニタリング(SRM)と呼ばれ、しばしば多重反応モニタリング(MRM)とも呼ばれる。MRM実験用のターゲットは合理的根拠に基づいて定義され、実験において検定される仮説によって異なる。これらのターゲットについて選択されたプリカーサーイオン及びフラグメントイオンの組合せ(いわゆるトランジション、1つのターゲットプリカーサーについてのトランジションのセットはMRMアッセイと呼ばれる)が質量分析計へとプログラムされ、その後、定義されたターゲットについてのみ測定データが生成される。ターゲットプロテオミクスの別形はデータ非依存的取得であり、より最近に発表された別形は一般的にSWATH-MS手法又はデータ非依存的取得(DIA)と呼ばれている。ここで、ターゲット型の態様はデータ分析レベルでのみ紹介されている。MRMとは対照的に、この手法では、試料注入前に予備的なペプチド特有の方法の設計は一切必要とされない。LC-MS取得は、試料の分析物の全内容を質量及び保持時間(RT)の範囲全体にわたって網羅するため、対象のあらゆるペプチド/前駆体について事後的にデータをマイニングすることができる。データは、試料の内容に関係なく完全な質量範囲(例えば、200トムソン~2000トムソン)においてクロマトグラフィー全体にわたって、データ非依存的な方式で取得される。これは一般的にペプチド前駆体選択ウィンドウを完全な質量範囲にわたって段階的に進めることによって実現される。事実上、このデータ取得方法により、試料中に存在する全ての分析物について完全なフラグメントイオンマップが作成され、フラグメントイオンスペクトルが、フラグメントイオンスペクトルが取得されたプリカーサーイオン選択ウィンドウに遡って関連付けられる。これは、プリカーサー分離ウィンドウを拡張し、こうして同時に溶出し、分析中に記録されたフラグメンテーションパターンに同時に関与する多数のプリカーサーを事前に考慮することによって実現される。このようなプリカーサーウィンドウはswathと呼ばれる。結果的に、多数のプリカーサーのフラグメンテーションから複雑なフラグメントイオンスペクトルが生じることから、より困難なデータ分析が必要となる。ショットガンプロテオミクスとは異なり、MRM技術及びSWATH技術又はDIA技術では、同じ分析物についてのスペクトルが高時間分解能(LC保持時間分解能)で繰り返し記録される。ショットガンプロテオミクスと比較した場合の(高)時間分解能とともに、MRMの場合の限定されたフラグメントイオン情報及びSWATH/DIAの場合の限定されたフラグメントイオンとプリカーサーイオンとの会合により、全く新しいタイプのデータ分析が必要かつ可能となる。限られた数の事前定義された分析物のみがモニタリングされるため、スペクトルを完全な理論的プロテオームと比較することによってショットガンプロテオミクスタイプのデータベース検索を行う必要はない。その代わりに、形状、トランジションの同時溶出、及びアッセイライブラリとの遷移強度の類似性等の信号特徴に基づいた多数のスコアが説明されている。全く新しいタイプのデータ分析は、ターゲット型(ペプチド中心)分析及び非ターゲット型データ(スペクトル中心)分析である。
【0041】
スペクトル中心の分析は次のように、すなわち、検索がスペクトル中心である、LC-MS/MS実験で取得されたDDAデータ又はDIAデータであり得るデータのデータ分析として定義され得る。これは、MS2ディメンションのスペクトルを、典型的には事前スペクトル情報を有しない又は限られた事前スペクトル情報を有するタンパク質データベースから導き出された全ての理論上のペプチド及びそれらの断片との考えられる一致についてスキャンすることを意味する。典型的には、MS2スペクトルについての親プリカーサーイオンは、検索空間内の全てのプリカーサーについての理論的なm/zに対する或る特定のm/z許容値と一致し、候補ペプチドのセットが得られる。次いで、理論上のフラグメントイオンの点でスペクトルを最も良く説明する候補ペプチドが、ペプチドスペクトルマッチ(PSM)と見なされる。断片に関する更なる事前情報は必要とされない。
【0042】
ペプチド中心の分析/ペプチド中心の検索は、次のように、すなわち、検索がプリカーサー中心である、LC-MS/MS実験で取得されたDDAデータ又はDIAデータであり得るデータのデータ分析として定義され得る。予測スペクトルライブラリ又は経験的スペクトルライブラリから導き出された考えられる予測ペプチド及びそれらの断片を、MS1ディメンション及びMS2ディメンションのスペクトルに対して照会する。この分析においては、ペプチドのスペクトル情報、特に保持時間、イオン移動度、及び相対フラグメント強度を有する観察される可能性のあるフラグメントイオンが必要とされる。この情報は、或る特定のm/z、iRT、又はIMの許容範囲内にあるスペクトルのみを照会し、一致のスコアリングを行うことによって、ペプチドの検索空間を絞り込むのに使用される。この追加情報があることで、より強力なスコアにつながることによって、分析の感度が大幅に改善される。
【0043】
さらに、古典的なショットガンプロテオミクスのように、偽発見率によるMRMにおける特定の信頼性推定を行うことはできない。したがって、存在しないペプチドについてのトランジション(デコイトランジション(decoy transition))を測定することによる新しい手法が開発された(Reiter L、Rinner O、Picotti P、Huttenhain R、Beck M、Brusniak MY、Hengartner MO、Aebersold R著の「mProphet:大規模SRM実験についての自動データプロセシング及び統計検証(mProphet: automated data processing and statistical validation for large-scale SRM experiments.)」 Nature methods 2011, 8(5):430-435)。これらのデコイトランジションからのデータを使用して、ショットガンプロテオミクスで行われるのと同様に、偽発見率を導き出すことができる。偽発見率によるこの信頼性推定は、データの有意性レベルを決定し、ユーザー定義によるデータの品質フィルタリングを可能にするのに必要である。SWATH/DIAデータはMRMデータとは異なる。MRMとは対照的に、完全なフラグメントイオンスペクトルはSWATH/DIA法を使用して記録される。時間分解能は通常、MRMと同様に選択される。SWATH/DIAとショットガンプロテオミクスとを比較すると、SWATH/DIAにおいては、プリカーサー選択についてのウィンドウが通常広く選択されるため(例えば、ショットガンプロテオミクスの場合のほぼ1Thではなく、最大25Th若しくは25Th程度又は最大32Th)、フラグメントイオンスペクトルがはるかに多数のプリカーサーから導き出されるという違いがある。フラグメントイオンスペクトルのこの高度な複雑さにより、データベース検索を使用するショットガンプロテオミクスでのようにデータを分析することは非現実的/非効率的となる。しかしながら、データをMRMデータと同様に分析することができることに加え、データの時間分解能が高いという利点もある。これは、MRMにおけるトランジションに対応するイオン電流を抽出することによって行うことができる。次いで、得られたデータを、MRMと非常に類似した方法で分析することができる。LCと連結された質量分析法の全ての別形においては、MRM実験用の試料中のタンパク質をより小さなペプチドへと消化した後に分析が行われる。得られたペプチド混合物は通常、試料の複雑さを減らすのにクロマトグラフィーにより分離される。クロマトグラフィー分離により、質量分析計の記録データに時間次元、すなわち保持時間(RT)が追加される。データ非依存的取得データを、スペクトル中心又は非ターゲット型の方式で分析することもできる。その際、データに基づいて、例えばデータ内のプリカーサーイオン(MS1)信号に基づいて、検索空間でクエリが実行される(SWATHとは異なる)。これは、DDAに典型的に使用されるのと同じ分析タイプである。さらに、TMT若しくはiTRAQ等のアイソバリック標識、又は細胞培養物におけるアミノ酸による安定同位体標識(SILAC)等の様々な定量化技術を使用することができ、或いは同位体により重標識されたペプチドを加えてペプチド及びタンパク質の絶対定量化を行うこともできる。また、MRMに類似しているが、高分解能の機器で実施され、分析における標的となる分析物(複数の場合もある)についての全範囲においてフラグメントイオンスキャン(MS2スキャン)が取得される並列反応モニタリング(PRM)を使用することもできる。
【0044】
SRMアッセイは、ウェスタンブロッティング用の抗体に似た対象のペプチド又はタンパク質に対する特異的な定量的質量分析ベースのアッセイであるが、多重化能力がより高く、進展時間がより短い(100種のペプチドについてのアッセイを1時間で進展することができる)。本発明者らは以前、SRMにより、細胞溶解物全体において細胞当たり50コピー未満までの広範囲の細胞存在量でタンパク質を定量化し(P Picotti et al., Cell 138 (4), 795 (2009)及びPicotti at al. Nature Methods, VOL.9 NO.6, JUNE 2012を参照、これらの参考文献は、本開示に具体的に含まれるSRM技術に関するものである)、高い(95%超)配列重複を有するタンパク質を分割し、多数の試料全体にわたって標的ペプチドを測定することが可能であることを実証した。したがって、この技術により、非常に複雑な試料中の特定のペプチドの定量的測定が可能となる。最近、SRM手法の更なる開発には、プロダクトイオンスペクトルのデータ非依存的取得及びそれらのターゲット型の分析に基づくSRM様の手法が含まれる(SWATH法、LC Gillet et al., Mol Cell Proteomics 11 (6), O111 016717 (2012)を参照、この開示は、SWATH法及びデータ抽出に関するものとして含まれる)。
【0045】
第1の好ましい実施形態によれば、コンフォメーション状態自体を検出するのに、工程1~工程3と並行して、上記少なくとも1種のタンパク質を含み、かつ構造変化を誘導する上記条件に曝されていない当初の複雑な混合物(細胞抽出物)を工程1~工程3に供して、濃縮された断片コントロール試料を生成し、少なくとも1種のタンパク質のコンフォメーション状態の決定が、濃縮された断片試料の解析的分析と、濃縮された断片コントロール試料の解析的分析との定量的比較に基づく。
【0046】
別の好ましい実施形態によれば、複雑な混合物中の異なる条件に依存するコンフォメーション状態の変化を検出するのに、第1の複雑な混合物及び第2の複雑な混合物を個別に工程1~工程3に供することによって、これらを上記少なくとも1種のタンパク質における構造変化を誘導する異なる条件に曝すことによって2つの複雑な混合物を生成し、少なくとも1種のタンパク質のコンフォメーション変化の決定が、第1の濃縮された断片試料の解析的分析と、第2の濃縮された断片試料の解析的分析との比較に基づく。
【0047】
通常、上記複雑な(細胞抽出物)混合物中の上記少なくとも1種のタンパク質における構造変化を誘導する条件は、好ましくは、温度変化、圧力変化、イオン強度変化、pH変化、代謝賦活薬変化、薬物/小分子の添加、代謝産物の添加、タンパク質の添加、ペプチドの添加、脂質の添加、DNAの添加、RNAの添加を含むリガンドの添加、疾患/健康の状態若しくは状況及び遺伝的変異(例えば、突然変異等)、又はそれらの組合せ、カオトロープの添加、翻訳後修飾を含む化学修飾、特にリン酸化、ジスルフィド架橋形成、ADPリボシル化、ユビキチン化、SUMO化、アセチル化、メチル化、酸化、グリコシル化、又はそれらの組合せからなる群から選択される。
【0048】
好ましくは、工程2において、ペプチド及びタンパク質を、濾過、分離、又は任意のその他の濃縮工程で除去する。
【0049】
本発明の目的のために、「濃縮」という用語は次のように定義される。すなわち、少なくとも1種のタンパク質が検出対象の当初のコンフォメーション状態にある条件下で複雑な(細胞抽出物)混合物のタンパク質限定分解を行うことにより、第1の断片試料を得る。上記第1の断片試料から、例えば濾過装置、分離装置、又は濃縮装置を介して対象ではない大きなペプチド及びタンパク質又はその他の生体分子を除去することが濃縮工程に対応し、こうして濃縮された断片試料が得られる。
【0050】
好ましい方法としては、サイズフィルタリング(例えば、10kのMWCOの濾過装置を使用する)、サイズ排除クロマトグラフィー、疎水性クロマトグラフィー、若しくは陰イオン交換クロマトグラフィーを含むクロマトグラフィー、相分離、吸収、沈殿を含む物理的除去、親水性特性/疎水性特性に基づく濾過、分離、若しくは濃縮、電場/磁場に基づく濾過、分離、若しくは濃縮、又はそれらの組合せが挙げられる。2つ以上のフィルターを用いて濾過を行うこともできるため、特定のペプチドサイズ範囲が濃縮される。すなわち、大きなペプチドが除去されるだけでなく、アミノ酸配列が非常に短いために十分に特異的でない又は質量分析に適していない非常に小さなペプチドも除去される。
【0051】
好ましくは、工程2において、20kDaより大きい分子量、好ましくは15kDaより大きい分子量、最も好ましくは10kDaより大きい分子量を有するペプチド、タンパク質、若しくはその他の生体分子又はその両方を第1の断片試料から除去すると、特に良好な結果を得ることができる。
【0052】
上記に従って、好ましくは、工程2において、0.1kDaより小さい分子量、又は0.2kDaより小さい分子量、又は0.4kDaより小さい分子量を有するペプチドを第1の断片試料から除去しても、また良好な結果を得ることができる。
【0053】
別の好ましい実施形態によれば、工程3は、実際の分析の前に、特に変性、C18クリーンアップ、又はそれらの組合せを含むプロテオミクスワークフローを含む。
【0054】
好ましいプロトコルによれば、タンパク質限定分解工程1において、プロテアーゼK、サーモリシン、サブチリシン、ペプシン、パパイン、α-キモトリプシン、エラスターゼ、及びそれらの混合物からなる群から選択されるタンパク質分解系を使用する。
【0055】
工程1において、タンパク質分解系を、好ましくは、試料中の総生体分子含有量に対して、酵素含有量対生体分子含有量の比率として示される重量基準で1/50~1/10000の範囲、好ましくは1/100~1/1000の範囲の濃度で使用する。
【0056】
工程1を、1分間~60分間、好ましくは2分間~30分間、又は2分間~10分間、又は2分間~5分間の期間にわたって、更に好ましくは20℃~40℃の温度で実施することができる。
【0057】
好ましくは、タンパク質限定分解工程1における温度は、20℃~40℃又は4℃~90℃の範囲である。温度範囲は通常、室温(20℃~25℃)付近又は37℃であるが、一方、サーモリシンは80℃まで活性であり、タンパク質分解反応を遅くするには4℃も適用可能である。
【0058】
使用される非特異的プロテアーゼの特性を以下の表にまとめる:
【0059】
【0060】
定量的決定を行うのに、工程1のタンパク質限定分解がもたらされた場合に特徴的であるだけでなく除去工程2の後に残っている重標識された断片を、当初の複雑な混合物及び/又は第1の断片試料及び/又は濃縮された断片試料へとスパイクすることができる。したがって、所望であれば、重標識された合成内部標準ペプチドを使用して絶対定量化を実現することができる。この手法を、未分画のプロテオーム抽出物に直接適用することも、又はプロテオーム実験において以前に使用されている様々な同位体標識及び試料分画技術(例えば、iTRAQ標識及びTMT標識、並びにTAILSワークフロー、O Kleifeld et al., Nature biotechnology 28 (3), 281 (2010))と連結することもできる。
【0061】
工程3における解析的分析を行うのに、好ましくは、プロダクトイオンスペクトルの選択反応モニタリング(SRM)及び/又はデータ非依存的取得(DIA)の形態の特定の定量的質量分析法に基づくアッセイを使用する。
【0062】
通常、更なるタンパク質及び/又はその他の生体分子の複雑な(例えば、細胞抽出物)混合物は、複雑な天然の生物学的マトリックスである。
【0063】
少なくとも1種のタンパク質は、通常、タンパク質原性アミノ酸のみに基づくタンパク質であるか、又はタンパク質原性アミノ酸に基づき、かつ翻訳後修飾を有する。
【0064】
さらに、本発明は、タンパク質の医学的に関連するコンフォメーションの決定、タンパク質ベースの薬物の決定、薬物若しくは他のリガンドのタンパク質への影響、又はタンパク質ベースの医薬製剤の品質管理のための、上記で詳述された方法の使用に関する。
【0065】
また、本発明は、工程1により生成されたペプチドのための、TAILS等のペプチド断片濃縮技術と組み合わせた上記で詳述された方法の使用に関する。
【0066】
提案された方法は、生物医学用途、バイオテクノロジー用途、及び製薬用途だけでなく、基礎研究及び生物学研究においても数多くの可能性を開くが、それらのほんの一部が紹介されるものとする。これは、現在MSによって測定されている従来のタンパク質存在量の変化又はタンパク質修飾の変化に加えて、タンパク質コンフォメーション変化を測定する新規のプラットフォームを提供する。
【0067】
本方法は、アルツハイマー病又はパーキンソン病等のタンパク質の誤折り畳み及び凝集によって引き起こされる疾患の検出及び治療(新薬の試験)に特に将来性がある。構造情報を有するペプチドは、臨床試料中の疾患関連タンパク質の構造を調べるのに使用することができ、疾患バイオマーカーとしての将来性がある。さらに、これらを使用して、薬物スクリーニングにおいて、細胞抽出物中の凝集プロセスに直接影響を与える化学調節因子(薬物)の能力を試験することができる。
【0068】
この技術を、製薬会社が薬物を製造するのに重要な品質管理工程であるタンパク質ベースの薬物の安定性及び適切なタンパク質の折り畳みをモニタリングするのに適用することもできる。
【0069】
タンパク質は薬物又は他のリガンドと結合するとコンフォメーションを変える可能性があるため、本方法を使用して、検出されたコンフォメーション変化に基づいて薬物又はリガンドの受容体を特定することもできる。
【0070】
本方法を使用して、直接細胞マトリックス内で対象のタンパク質受容体の構造を調べることができるため、それらのタンパク質受容体を標的とする分子の設計に役立つ。
【0071】
マーカーアッセイを、ヒト疾患の診断用のキット(疾患バイオマーカー)へと橋渡しすることができる。
【0072】
本方法を、薬物開発パイプラインにおいて、タンパク質ベースの医薬製剤の品質管理に使用することができる。
【0073】
本方法を、タンパク質コンフォメーション病用の新薬開発に使用することができる。
【0074】
本方法は、既存の薬物の受容体を特定して、それらの作用メカニズムを理解するのに役立ち得る。
【0075】
本発明の更なる実施形態は、従属請求項に規定されている。
【0076】
本発明の好ましい実施形態は、図面を参照して以下で述べられ、図面は、本発明の好ましい本実施形態を示すためのものであり、本発明を限定するためのものではない。
【図面の簡単な説明】
【0077】
【
図1】
図1は、提案された手法の概略図を示す図である。天然のタンパク質を、コントロール(ビヒクル)試料を含む規定の濃度のリガンドとともにインキュベートする。各試料を、短時間の急速にクエンチされる限定消化工程に供する。次に、より大きなペプチド及びタンパク質片を除去することで、限定消化中のタンパク質コンフォメーションに応じてユニークなペプチド集団が得られる。残りのペプチドを使用して、標準的なプロテオミクスワークフローを実装することができる。
【
図2】
図2は、薬物のラパマイシンを使用した、LiP-MSプロトコルと、提案されたDark-LiP方法論の2つの異なる別形との比較を示す図である。
【
図3】
図3は、LiP-MSによるFKBP1からのペプチドの特定及びDark-LiPとの比較を示す図である。
【
図4】
図4は、一般的なキナーゼ阻害剤のスタウロスポリンを使用した、LiP-MSプロトコルと、Dark-LiP方法論の2つの異なる別形との比較を示す図である。
【
図5A】
図5Aは、スタウロスポリンタンパク質標的の特定についてのLiP-MSプロトコルと、Dark-LiPプロトコルとの比較を示す図である。ここで、Aは、LiP-MS及びDark-LiPによって特定されたタンパク質及びペプチドの総数を示している。
【
図5B】
図5Bは、スタウロスポリンタンパク質標的の特定についてのLiP-MSプロトコルと、Dark-LiPプロトコルとの比較を示す図である。ここで、Bは、LiP-MS及びDark-LiPにおけるペプチド長の分布を示している。
【
図5C】
図5Cは、スタウロスポリンタンパク質標的の特定についてのLiP-MSプロトコルと、Dark-LiPプロトコルとの比較を示す図である。ここで、Cは、薬物標的候補として特定されたキナーゼの数(真陽性)を薬物標的候補の総数(真陽性+偽陽性)に対して示すグラフを示している。
【
図6】
図6は、Dark-LiPによりタンパク質構造の違いを特定する実験設計を説明する図である。
【
図7】
図7は、タウ単量体及びタウ線維のタンパク質限定分解の比較分析を示す図である。
【発明を実施するための形態】
【0078】
図1は、参照試料と変化した試料との間のコンフォメーションの違いを区別する条件がリガンドの添加である提案された手法の概略図を示している。天然のタンパク質100を、変化した試料中で規定の濃度のリガンド101aとともにインキュベートする(上の経路)のに対し、コントロール(ビヒクル)試料101bにはリガンドを添加しない(下の経路)。各試料を、典型的には非特異的プロテアーゼを用いる短時間(1分~5分)の急速にクエンチされる限定消化工程102に供する。次に、工程103において、より大きなペプチド及びタンパク質片を除去し(例えば、濾過を介して)、こうして、限定消化102中のタンパク質のコンフォメーションに応じたユニークなペプチド集団104a/bが得られる。その後、残りのペプチドを使用して標準的なプロテオミクスワークフローを実行することができる(例えば、変性、C18クリーンアップ、LC-MS、及び分析)。
【実施例】
【0079】
実施例1:LiP-MSと、提案された、いわゆるDark-LiP技術との比較
実施例1の結果は、薬物のラパマイシンを使用した、LiP-MSプロトコルと、提案された手法、すなわちDark-LiP方法論の2つの異なる別形との比較を示す
図2に示されている。(FA:ギ酸、TCEP:還元剤トリス(2-カルボキシエチル)ホスフィン、CAA:アルキル化剤クロロアセトアミド、DOC:デオキシコール酸塩、ABC:重炭酸アンモニウム、LysC:エンドプロテイナーゼLysC)。
【0080】
現行のLiP-MSプロトコルとDark-LiP構成とを比較するのに、300μgのHeLa溶解物の4つのアリコートを2μMのラパマイシンとともにインキュベートし、4つのアリコートを担体(DMSO)とともにインキュベートした。次に、各アリコートを1:100(質量/質量)のタンパク質比でプロテイナーゼKにより処理した。デオキシコール酸ナトリウム(DOC)で反応を停止し、沸騰させた後、試料を3つのアリコートに分割した。
【0081】
1つのアリコートを使用して、LiP-MSの下流プロセシング戦略を評価する。
【0082】
2つのアリコートを使用して、Dark-LiPの下流プロセシング戦略を評価する。
【0083】
LiP-MS手法では、50μgのタンパク質抽出物を還元し、アルキル化し、重炭酸アンモニウム緩衝液で希釈し、LysC及びトリプシンで消化した。最後に、生成されたペプチドをギ酸で酸性化し、C18樹脂でクリーニングした。
【0084】
Dark-LiP方法論では、PKで消化された細胞プロテオームを重炭酸アンモニウムで希釈し、ギ酸で酸性化し、それにより、試料の還元、アルキル化、及びLysC/トリプシンによる消化を省略した。
【0085】
Dark-LiPの第1の別形は、タンパク質限定分解の直後に、酸性化された試料を10MWCOのカットオフのスピンフィルターを通して濾過し、その後、C18でのペプチドのクリーンアップを行うことにあった。
【0086】
Dark-LiPの第2の別形では、タンパク質限定分解の直後に濾過工程を省略し、PKで生成されたペプチドを直接酸性化し、C18樹脂でクリーニングした。
【0087】
C18クリーンアップ後のLiP-MS及びDark-LiPの両方の方法論で、得られた精製ペプチドを質量分析法により分析した。
【0088】
LiP-MS及びDark-LiPによるFKBP1からのペプチドの特定
図3は、LiP-MS及びDark-LiPによるFKBP1からのペプチドの特定を示している。
【0089】
図3A.1は、LiP-MS及びDark-LiPによって特定されたタンパク質の総数を示している。Dark-LiPの2つの別形では同等の数のタンパク質が特定された。LiP-MSでは最も多数のタンパク質が特定された。
【0090】
図3A.2は、LiP-MS及びDark-LiPによって特定されたペプチドの総数を示している。Dark-LiPの2つの別形では同等の数のペプチドが特定された。LiP-MSでは最も多数のペプチドが特定された。
【0091】
Dark-LiPの第1の別形(タンパク質限定分解の直後に、酸性化された試料を10MWCOのカットオフのスピンフィルターを通して濾過し、その後、C18でのペプチドのクリーンアップを行うことにある)は、
図3A.1及び
図3A.2及び
図3Bにおいて「Dark-Lip 10K」とされる。
【0092】
Dark-LiPの第2の別形(タンパク質限定分解直後の濾過工程を省略し、PKで生成されたペプチドを直接酸性化し、C18樹脂でクリーニングすることにある)は、
図3A.1及び
図3A.2及び
図3Bにおいて「Dark-Lip C18」とされる。
【0093】
図3Bは、薬物標的候補として特定されたFKBP1ペプチドの数(真陽性)を、薬物標的候補の総数(真陽性+偽陽性)に対して示している。
【0094】
LiP-MSによる分析では、Dark-LiPよりも多数のペプチド及びタンパク質が特定された(
図3)。それというのも、これらの試料は大きなタンパク質及びペプチドを濾過しないと本来はより複雑であるからである。ペプチドはタンパク質の断片化後に得られるため、Dark-LiPにおいて大きなタンパク質の画分を除去すると、LiP-MSよりも少数のペプチドの特定がもたらされることも予想される。
【0095】
Dark-LiPの2つの別形によって特定されたタンパク質及びペプチドの数は、FKBP1ペプチドの数(真陽性)と同様に同等である。したがって、更なる実験には、「より単純な」Dark-LiP別形、すなわち10MWCOのカットオフのスピンフィルターを省略する別形を選択する。
【0096】
FKBPタンパク質(ラパマイシンの標的)を薬物標的候補として特定する際のDark-LiP及びLiP-MSの性能を試験するのに、機械学習パイプラインLiP-quantを使用して、幾つかの分析において特定されたペプチドをスコアリングし、LiPスコアによってランク付けされたペプチド薬物標的候補のリストを取得した。
【0097】
既知の記載されたラパマイシン標的(FKBPタンパク質)から導き出されたペプチドの数を、ペプチド候補の総数(真陽性+偽陽性)に対してプロットした(
図3)。したがって、より急勾配な線は、より平坦な線よりもFKBP由来のペプチドの数が多いことを意味する。これらの結果は、LiP-MSよりも高いスコアでより多くのFKBPペプチドを特定することによって、Dark-LiP方法論の両方の別形が標準的なLiP-MSを凌駕することを示している。
【0098】
LiP-Quantは、タンパク質限定分解と連結された質量分析法に基づく、ヒト細胞を含む種を越えて機能する薬物標的のデコンボリューションデータ分析パイプラインである。機械学習は、薬物結合を示す特徴を識別し、それらを単一のスコアに統合して、小分子のタンパク質標的を特定し、それらの結合部位を見積もるのに使用される。
【0099】
実施例2:一般的なキナーゼ阻害剤のスタウロスポリンを使用した、LiP-MSプロトコルとDark-LiP方法論の1つの別形(C18別形)との比較
図4は、薬物のスタウロスポリンを使用した、LiP-MSプロトコルと、DARK-LiP方法論の1つの別形(C18別形)との比較を示している。(FA:ギ酸、TCEP:還元剤、CAA:アルキル化剤、DOC:デオキシコール酸塩、ABC:重炭酸アンモニウム、LysC:エンドプロテイナーゼLysC)。
【0100】
一般的なキナーゼ阻害剤のスタウロスポリンをモデル系として使用して、薬物-用量応答実験構成においてLiP-MSとDark-LiPとの性能を比較した(
図4)。
【0101】
キナーゼは、他のタンパク質をリン酸化する、正常な細胞機能に不可欠な酵素の大きなファミリーである。キナーゼの数が多いため、薬物標的を特定する様々な方法論の効率を比較するのに、スタウロスポリンアッセイが一般的に使用される。
【0102】
175μgの天然のHeLaタンパク質溶解物を、7つの異なる濃度の薬物スタウロスポリン及びDMSOにより2連で処理し、上記のようにLiP-MSプロトコル又はDark-LiP方法論のC18別形に従って試料をプロセシングした。
【0103】
図5は、スタウロスポリンタンパク質標的の特定についてのLiP-MSとDark-LiPとの比較を示している。
【0104】
図5Aは、LiP-MS及びDark-LiPによって特定されたタンパク質及びペプチドの総数を示している。
【0105】
図5Bは、LiP-MS及びDark-LiPにおけるペプチド長の分布を示している。
【0106】
図5Cは、薬物標的候補として特定されたキナーゼの数(真陽性)を、薬物標的候補の総数(真陽性+偽陽性)に対して示している。
【0107】
ラパマイシン実験と同等に、LiP-MSによる分析ではDark-LiPよりも多数のペプチド及びタンパク質が特定されたのに対し、Dark-LiPではLiP-MSよりも多くの半トリプシン消化性ペプチドさえも特定された(
図5A)。さらに、Dark-LiPによって特定されたペプチドはまた、トリプシン/LysCによる第2の断片化工程がないため、長さがより長かった(
図5B)。
【0108】
LiP-quantを使用して、ペプチドの存在量と薬物濃度との間の相関関係に基づいて特定されたペプチドをスコアリングし、それにより、最も確からしいスタウロスポリン標的のリストを生成した。薬物標的としてキナーゼを特定するDark-LiP及びLiP-MSの性能を視覚的に比較するのに、標的候補として同定されたキナーゼの数を候補の総数に対してプロットした(
図5C)。上記のように、より急勾配の線は、上位の薬物標的候補として特定されたキナーゼがより多数であることを意味し、より効率的な方法であることを表している。これらの結果は、スタウロスポリンの標的としてより多くのキナーゼを特定することによって、Dark-LiPの方がLiP-MSよりも優れた性能を発揮したことを示している。
【0109】
実施例3:タンパク質のコンフォメーション変化の検出を可能にするDark-Lip技術
世界中で4500万人を超える人が認知症に苦しんでいると推定されており、認知症の中で最も一般的な形態はアルツハイマー病である。アルツハイマー病は、生理学的条件下で非常に柔軟なコンフォメーションを有する天然には落ち畳まれていないタンパク質である微小管関連タンパク質タウの異常な線維変化の蓄積を特徴とする。
【0110】
参考文献には、Dark-LiPによって判別することができる健康時及び罹患時のタウタンパク質の臨床的に関連するコンフォメーション変化が例示されている。
【0111】
Dark-LiP手順においては、タンパク質限定分解工程中に、プロテイナーゼKが溶液中のタウタンパク質を断片化する。タウの特定の領域の断片化の速度は、その領域のプロテイナーゼKへのアクセス可能性によって左右される。単量体タウは、高い柔軟性を有するタンパク質セグメントによって構成された非常に無秩序なタンパク質であると文献に記載されている。その結果、単量体タウの領域はプロテイナーゼKへのアクセス可能性が高く、これは断片化の高速な動態につながり、最終的に多量のペプチドにつながる。対照的に、線維性タウは、単量体タウの凝集した分子の大きな構造物として文献に記載されている。これは、線維性タウの幾つかの領域及び分子が、一緒に凝集したタウのその他の領域及び分子によってプロテイナーゼKから保護されることを意味する。全体的に、このより低いアクセス可能性はより遅い断片化速度につながり、結果としてより低い存在量のペプチドにつながる。
【0112】
これを実証するのに、100μLのLiP-MS緩衝液の3つのアリコートを使用して6μgの単量体タウを希釈し、100μLのLiP-MSの3つのアリコートを使用して6μgの線維性タウを希釈した。次に、各アリコートを1:50の分子比(各PK分子につき50分子のタウ)でプロテイナーゼKにより処理し、室温で2分間インキュベートした。デオキシコール酸ナトリウム(DOC)を加えて沸騰させることにより反応を停止させた。
【0113】
次に、PKで断片化されたタウ試料を重炭酸アンモニウムで希釈し、ギ酸で酸性化した(それにより、Dark-LiP方法論からの特徴として試料の還元、アルキル化、及びLysC/トリプシンによる消化を省略する)。酸性化後、PKで生成されたペプチドをC18樹脂でクリーニングした。この工程により、C18樹脂に保持されている大きなペプチド及びタンパク質が除去される。
【0114】
図6は、Dark-LiPによるタンパク質構造の違いを特定する実験設計を説明している。
【0115】
Dark-LiPワークフローでのプロセシング時に生成された断片化タウ試料を質量分析法によって分析し、両方の条件で特定されたペプチドを統計的スチューデントのt検定を使用して比較する。
【0116】
2つの試料についてのスチューデントのt検定を使用して、2つの標本群(2つの母集団)が、2つの群から抽出された2つの標本の比較に基づいて量的変数の点で異なるかどうかを検定する(式1)。言い換えれば、二標本のスチューデントのt検定は、2つの母集団の平均が等しいかどうかの帰無仮説を検定することができる(標本は量的連続変数に関して測定される)。スチューデントのt検定の場合、平均及び平均の標準誤差を使用して2つの標本を比較し、データの正規分布を想定する。
【0117】
式1に従って平均値の比較を行い、出力は値tである。このt値は、測定値のばらつきに対する2つの母集団の平均間の差の大きさの測定値である。tの値が大きいほど、2つの母集団間の差はより大きく、より有意になり、測定値間のばらつきはより小さくなる。次いで、特定のt値を、二標本t分布値を介して、そのt値を得る確率(p値)に変換することができる。t値とp値との間の関係は、定義された検定の特定の確率分布に対して既に確立されているため、p値を直接計算することができる(この場合、二標本t検定及び正規分布が想定される)。p値(pは確率を表す)は、統計的有意性の測定に頻繁に使用され、観察された平均値の差が偶然によって説明される可能性を説明している。p値は0%から100%までの確率を表すため、例えば、0.01のp値は1%の確率に相当する。したがって、p値が低いほど、観察値が偶然によって説明される確率がより低くなり、結果として統計的有意性がより高くなる(説明される例では、観察値は無作為な測定値の母集団の1%で偶然発生することとなる)。
【0118】
【0119】
式1:2つの独立した母集団間で統計的t検定を行う数式
t:測定値のばらつきに対する母集団間の差の大きさの尺度。t値は0(平均値に差なし)から無限大まで変動する。
x1:母集団1の測定値の平均
x2:母集団2の測定値の平均
s1:母集団1の測定値の標準偏差
s2:母集団2の測定値の標準偏差
n1:母集団1の測定値の数
n2:母集団2の測定値の数。
【0120】
タウタンパク質を用いた本発明者らの例において、t検定を使用して、単量体タウ及び線維性タウのDark-LiP断片化によって生成された特定のペプチドの存在量の差が統計的に有意であるかどうかを計算する。単量体タウについて行われた3つの測定値間の平均存在量の差が、線維性タウについて行われた3つの測定値間の平均存在量と異なる場合、断片化速度が異なり、その結果、その特定のペプチドのプロテイナーゼKへのアクセス可能性も2つのタウのアイソフォーム間で異なっていたと考えられる。したがって、存在量において統計的に有意な差を有するペプチドは、タウの構造的な違いに直接的につながる。統計分析の結果を全体的に視覚化するのに、(式1で得られたt値から導き出された)p値の対数の逆数を、各ペプチドについてのペプチド存在量の倍数変化(式1において説明されたx
1とx
2との間の比率)の対数に対してプロットした(
図7)。p値はペプチド間で大きく異なる可能性があるため、対数変換を使用して視覚化を改善する。そうでなければ、最低のp値を有するペプチドが、最高のp値を有するペプチドから遠く離れて位置してしまうこととなるため、データを効率的に視覚化することができなくなる。1より低い数の対数は負であるため、対数の逆数を使用してデータをより視覚化及び解釈しやすい正の値に変換する。倍数変化に対数変換を適用することによって、値が大きく変動する倍数変化を効率的に視覚化し、x
1がx
2よりも大きい場合のペプチド(正のAVG Log2比)とx
1がx
2よりも小さい場合のペプチド(負のAVG Log2比)とを判別することもできる。
【0121】
さらに、式1から、p値が2つの母集団間の存在量の差だけでなく、測定値の数及びそれらの測定値の標準偏差(反復間の観察のばらつきと相関する)にも依存することが観察される。したがって、p値が主に標本群の平均の大きな差(式1の分子x1-x2によって得られる倍数変化)から導き出されるか、又はp値が主に平均の低い標準誤差(測定値間の低いばらつき、式1の分母((s1/n1)2+(s2/n2)2)、n1=n2=3回の反復であるため)から導き出されるかを理解することも重要である。その結果、p値を倍数変化(x1とx2との間の比率)に対してプロットしたところ、2つの標本群の平均の差(倍数変化)及び測定値のばらつきの推定値が同時に視覚化された。
【0122】
プロテオミクス研究において、有意性についての1%の値及び2の倍数変化が業界では一般に受け入れられている。したがって、0.01より大きいp値を有するペプチド(6.64の-log2P値に等しく、水平の破線によって表される)及び2より低い倍数変化(-1より低い及び1より高いlog2比、垂直の破線によって表される)を、統計的に非有意であると見なした。これらの非有意のペプチドは小さな点によって表され、破線の下及びその間の領域に位置している。
【0123】
0.01より低いp値を有し、かつ2より高い倍数変化を有するペプチドを統計的に有意であると見なした。タウ由来の統計的に有意なペプチドは十字形として表され、一方、「Y」形はタウタンパク質の調製中に共精製された細菌タンパク質由来の統計的に有意なペプチドを表す。x1がx2より大きい場合、倍数変化(x1とx2との間の比率)は1より大きくなり、このペプチドはグラフの右側部分に表示される。x2がx1より大きい場合、倍数変化は1より低くなり、このペプチドはグラフの左側に表示される。全体的に、y軸において高い値を有するペプチドは低いp値を有するペプチドに対応し、その結果、高い統計的有意性に対応する(これは低い標準偏差と相関し、その結果、反復間の高い再現性と相関し得る)。x軸における高いモジュール値を有する記号は大きな存在量の差に対応しており、これは、より大きな構造変化と相関し得る。
【0124】
全体として、Dark-LiP方法論を使用した2つの異なる形態のタウのタンパク質限定分解により、存在量に有意差を有する412種のペプチドが生成された。
【0125】
上記の説明によれば、
図7における三角形の領域内に表されるペプチドは、y軸において高く、x軸において低いため、高い-LogP値及び低い倍数変化を有する。これは、これらのペプチドの存在量の差が単量体タウと線維性タウとの間で小さい(軽度の構造変化に関連し得る)が、同じ条件の3回の反復間で定量化が非常に再現的である(標準偏差が低い)ことを意味する。
【0126】
図7における円形内のペプチドは、x軸において高い値を有し、かつy軸において低い値(したがって、高い倍数変化及び比較的低い-LogP値)を有する。その結果、このペプチドは2つのタウの別形間で強い構造的差異と関連し得るが、ペプチドの存在量のばらつきは測定値間で大きかった(比較的低い統計的有意性につながる)。
【0127】
図7における矩形内のペプチドは、中程度のx値及びy値を有するため、中程度の倍数変化及び中程度の-LogP値を有する。反復測定間で再現的に測定することができ、存在量の差も比較的大きいため、これらのペプチドを使用して、タウの別形間の構造変化を頑健に特定することができる。
【0128】
本発明者らの分析では、単量体タウが式1における第1の変数x
1として考慮され、線維性タウが式1における第2の変数x
2として考慮された。
図7は、高い統計的有意性及び高い倍数変化を有するタウペプチドの大部分がx軸の正の領域に位置していることを示しているため、これは、x
1がx
2よりも大きく、結果としてペプチドの存在量が線維性タウよりも単量体タウの方が高いことを意味している。これは、予想通り(上記のように)、線維性タウよりも単量体タウの方がプロテイナーゼKによるタンパク質分解断片化を受けやすかったことを示している。
【0129】
全体として、実施例3は、Dark-LiP技術を使用して、単量体タウ及び線維性タウの幾つかの領域のタンパク質分解の受けやすさの違いを示すことができ、その結果、2つのタウの別形の異なる構造が強調されることを実証している。
【符号の説明】
【0130】
100 天然のタンパク質
101a リガンド
101b コントロール(ビヒクル)試料
102 限定消化工程
103 濾過
104a/b ユニークなペプチド集団
DDA データ依存的取得
DIA データ非依存的取得
LC 液体クロマトグラフィー
LC-MS 液体クロマトグラフィーと連結された質量分析法
LiP タンパク質限定分解
MRM 多重反応モニタリング
MS 質量分析法
RT 保持時間
SILAC 細胞培養物におけるアミノ酸による安定同位体標識
SRM 選択反応モニタリング
SWATH 全理論的フラグメントイオン質量スペクトルの逐次的ウィンドウ型取得
【国際調査報告】