IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヴェン バイオサイエンシーズ コーポレーションの特許一覧

特許7553126診断および治療モニタリングのためのバイオマーカーとしての糖ペプチドの同定および使用
<>
  • 特許-診断および治療モニタリングのためのバイオマーカーとしての糖ペプチドの同定および使用 図1
  • 特許-診断および治療モニタリングのためのバイオマーカーとしての糖ペプチドの同定および使用 図2
  • 特許-診断および治療モニタリングのためのバイオマーカーとしての糖ペプチドの同定および使用 図3
  • 特許-診断および治療モニタリングのためのバイオマーカーとしての糖ペプチドの同定および使用 図4
  • 特許-診断および治療モニタリングのためのバイオマーカーとしての糖ペプチドの同定および使用 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-09
(45)【発行日】2024-09-18
(54)【発明の名称】診断および治療モニタリングのためのバイオマーカーとしての糖ペプチドの同定および使用
(51)【国際特許分類】
   G01N 27/62 20210101AFI20240910BHJP
   G01N 33/68 20060101ALI20240910BHJP
【FI】
G01N27/62 V
G01N27/62 X
G01N33/68
【請求項の数】 24
【外国語出願】
(21)【出願番号】P 2022207662
(22)【出願日】2022-12-23
(62)【分割の表示】P 2020512809の分割
【原出願日】2018-08-31
(65)【公開番号】P2023152669
(43)【公開日】2023-10-17
【審査請求日】2023-01-23
(31)【優先権主張番号】62/553,676
(32)【優先日】2017-09-01
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】521339843
【氏名又は名称】ヴェン バイオサイエンシーズ コーポレーション
(74)【代理人】
【識別番号】110003797
【氏名又は名称】弁理士法人清原国際特許事務所
(72)【発明者】
【氏名】ダナン-レオン,リーザ マリエ アラウロ
(72)【発明者】
【氏名】カッラスコーソ,アルド マリオ エデュアルド シルヴァ
(72)【発明者】
【氏名】ベルトッツィ,キャロライン ルース
(72)【発明者】
【氏名】レブリッラ,カルリト バンゲルス
【審査官】伊藤 裕美
(56)【参考文献】
【文献】特表2011-521215(JP,A)
【文献】特表2012-517607(JP,A)
【文献】特表2016-533499(JP,A)
【文献】特表2008-541060(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 27/60 - G01N 27/70
G01N 33/48 - G01N 33/98
H01J 49/00 - H01J 49/48
G01N 30/00 - G01N 30/96
(57)【特許請求の範囲】
【請求項1】
病態に関連づけられる部位特異的グリコシル化プロファイルを同定する方法であって、前記方法は
a)複数の生体試料各々を、1つ以上のプロテアーゼにさらし、それぞれのプロテアーゼで処理された試料のセットを生成する、こと、ここで、
前記複数の生体試料各々は、病態が存在するか、病態が存在しないか基づいた分類を有するヒト対象からのものであり、及び
記複数の生体試料の各々は、病態が存在するヒト対象および病態が存在しないヒト対象からの試料を含み、
b)それぞれのプロテアーゼで処理された試料を、目的の種を選択的に標的化する液体クロマトグラフィー多重反応モニタリング質量分析(LC-MRM-MS)にかけること、ここで、
前記目的の種は、少なくとも50以上の糖タンパク質に関連づけられる複数の糖ペプチドおよび糖タンパク質のグリコフォームを含み、
)液体クロマトグラフィー多重反応モニタリング質量分析から得た情報を分析して、それぞれのプロテアーゼで処理された試料の定量結果を生成する、ことと、
d)それぞれのプロテアーゼで処理された試料の定量結果と関連する分類を機械学習法に適用し、病態に関連づけられる部位特異的グリコシル化プロファイルを同定することと、を含む、方法。
【請求項2】
態に関連づけられる部位特異的グリコシル化プロファイルを示す1つ以上の糖ペプチドおよび糖タンパク質のグリコフォームを同定することをさらに含む、請求項1に記載の方法。
【請求項3】
前記病態がんである、請求項1に記載の方法。
【請求項4】
前記がんが、乳がん、子宮頸がん、および卵巣がんから選択される、請求項3に記載の方法。
【請求項5】
前記がんが乳がんである、請求項3に記載の方法。
【請求項6】
前記病態が自己免疫疾患である、請求項1に記載の方法。
【請求項7】
前記自己免疫疾患が、HIV感染に関連する自己免疫疾患、原発性硬化性胆管炎、原発性胆汁性肝硬変、および乾癬から選択される、請求項6に記載の方法。
【請求項8】
前記自己免疫疾患が、原発性硬化性胆管炎または原発性胆汁性肝硬変である、請求項6に記載の方法。
【請求項9】
前記病態が存在しない前記ヒト対象は健常ドナーである、請求項1に記載の方法。
【請求項10】
前記複数の生体試料は、全血試料、血清試料、および血漿試料からなる群からそれぞれ選択される、請求項1に記載の方法。
【請求項11】
前記複数の生体試料が全血試料である、請求項10に記載の方法。
【請求項12】
前記複数の生体試料が血清試料である、請求項10に記載の方法。
【請求項13】
前記複数の生体試料が血漿試料である、請求項10に記載の方法。
【請求項14】
前記LC-MRM-MSは、三連四重極質量分析計上で行われる、請求項に記載の方法。
【請求項15】
前記LC-MRM-MSが、10ppm以上の質量精度を有する、請求項14に記載の方法。
【請求項16】
目的の標的化される種は、1つ以上のアルファ-1-酸性糖タンパク質、アルファ-1-アンチトリプシン、アルファ-1B-糖タンパク質、アルファ-2-HS-糖タンパク質、アルファ-2-マクログロブリン、アンチトロンビンIII、アポリポタンパク質B-100、アポリポタンパク質D、アポリポタンパク質F、ベータ-2-糖タンパク質1、セルロプラスミン、フェチュイン、フィブリノゲン、免疫グロブリン(Ig)G、IgA、IgM、ハプトグロビン、ヘモペキシン、ヒスチジンリッチ糖タンパク質、キニノゲン-1、セロトランスフェリン、トランスフェリン、ビトロネクチン、および亜鉛-アルファ-2-糖タンパク質の糖ペプチドおよびグリコフォームを含む、請求項に記載の方法。
【請求項17】
目的の標的化される種が、1つ以上IgG、IgA、およびIgMの糖ペプチドおよびグリコフォームを含む、請求項16に記載の方法。
【請求項18】
前記1つ以上のプロテアーゼ1つ以上のセリンプロテアーゼを含む、請求項1に記載の方法。
【請求項19】
前記セリンプロテアーゼが、トリプシン、キモトリプシン、エンドプロテイナーゼ、Arg-C、Glu-C、Lys-C、およびプロテイナーゼKからなる群から選択される、請求項18に記載の方法。
【請求項20】
前記機械学習法、深層学習、ニューラルネットワーク、線形判別分析、二次判別分析、サポートベクターマシン、ランダムフォレスト、最近傍、またはそれらの組み合わせを含む、請求項1に記載の方法。
【請求項21】
前記機械学習法が、深層学習、ニューラルネットワーク、またはそれらの組み合わせを含む、請求項20に記載の方法。
【請求項22】
各プロテアーゼ処理サンプルのIgG、IgA、およびIgMの糖ペプチドおよびグリコフォームからの情報を含む前記定量結果と前記関連する分類とを、組み合わせ判別分析を含む機械学習法に提供する、請求項16に記載の方法。
【請求項23】
前記複数の生体試料が、病態が存在する少なくとも20のヒト象および病態が存在しない少なくとも20のヒト対象からの試料を含む、請求項1に記載の方法。
【請求項24】
前記複数の生体試料が、病態が存在する少なくとも40のヒト象および病態が存在しない少なくとも40のヒト対象からの試料を含む、請求項1に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一般に、疾患診断および治療モニタリング用のバイオマーカーを同定するための、マルチオミクス、特に、グライコミクスおよびグリコプロテオミクス、高度計装ビッグデータ、機械学習、および人工知能の分野に関する。
【背景技術】
【0002】
タンパク質のグリコシル化および他の翻訳後修飾は、ヒトの成長と発達のあらゆる面で重要な構造的および機能的役割を果たす。不完全なタンパク質のグリコシル化は、いくつかの疾患を伴う。疾患の初期段階でグリコシル化の変化を特定することにより、影響を受ける対象の早期発見の機会、介入、より高い生存の可能性が提供される。現在、早期がんを検出し、特定の種類のがんを他の疾患と区別できるバイオマーカーを同定する方法がある。これらの方法には、質量分析法(MS)を使用したプロテオミクス、ペプチドミクス、メタボリクス(metabolics)、プロテオグライコミクス(proteoglycomics)、およびグライコミクスが含まれる。
【0003】
タンパク質のグリコシル化はがんおよびその他の疾患に関する有用な情報を提供するが、この方法の1つの欠点は、グリカンを、由来するタンパク質の部位までさかのぼることができないことである。がんの生物学およびがんの早期発見に関するより多くの知識を得るためには、グリカンだけでなく、タンパク質での結合部位も同定することが重要である。糖タンパク質分析は、いくつかの理由により一般的に困難である。例えば、ペプチド中の単一のグリカン組成物は、異なるグリコシド結合、分岐、および同じ質量を有する多くの単糖のために、多数の異性体構造を含む場合がある。さらに、同じペプチド骨格を共有する複数のグリカンが存在すると、MSシグナルが様々なグリコフォームに分割され、グリコシル化されていないペプチドと比較して個々の存在量が低下する。したがって、タンデムMSデータからグリカンとそのペプチドを同定できるアルゴリズムを開発することは困難であった。また、グリカンとペプチドの断片化効率が異なるため、グリカンとペプチドの両方について包括的な断片化を得ることも困難である。
【0004】
したがって、非疾患細胞と比較した、疾患細胞、組織または生体液のグリコシル化部位の不均一性に関する正確な定量的情報を提供するタンパク質グリコシル化パターンに関する重要かつ詳細な情報を得るための部位特異的糖タンパク質分析の方法を提供することの需要がある。そのような方法は、特にがんなどの疾患の疾患バイオマーカーの同定につながる。また、がんなどの疾患のためのグリカンベースの薬物標的などの新しい疾患標的を同定および検証するために、部位特異的な糖タンパク質分析データを深層学習および高度なLC/MS機器と組み合わせて、新しいバイオマーカーを同定する時間を短縮することへの需要もある。
【発明の概要】
【0005】
本開示は、様々な疾患のバイオマーカーを同定する方法に関する。これらのバイオマーカーは、生体試料からのグリコシル化タンパク質の断片化により得られたグリコシル化ペプチド断片である。バイオマーカーを同定する方法は、グリコシル化ペプチド断片の正確な質量測定と部位特異的グリコシル化分析を可能にする高度な質量分析技術の使用に依存する。本開示の質量分析法は、生体試料から一度に多数のグリコシル化タンパク質を分析するのに有利に役立つ。
【0006】
一実施形態では、本開示は、有望なバイオマーカーとしてグリコシル化ペプチド断片を同定する方法を提供し、本方法は、
対象から単離された複数の生物試料のそれぞれにおいて、1つ以上のプロテアーゼを用いてグリコシル化タンパク質を断片化することであって、グリコシル化ペプチド断片を生成する、ことと、
液体クロマトグラフィーおよび質量分析法(LC-MS)でグリコシル化ペプチド断片を定量することであって、定量結果を提供する、ことと、
分類の予測に役立つグリコシル化ペプチド断片を選択するために、機械学習法で対象の分類とともに定量結果を分析することと、
グリコシル化ペプチド断片の同一性を決定することと、を含む。
【0007】
別の実施形態では、本方法は、疾患または病態を有する対象と、疾患または病態を有しない対象とを含む。さらなる実施形態では、対象は、疾患または病態の治療を受けている対象と、疾患または病態を有するが治療を受けていない対象とを含む。
【0008】
別の実施形態では、本開示の方法は、対象の生体試料からのグリコシル化ペプチド断片を分析することにより検出され得るいずれかの疾患または病態に適用可能である。一実施形態では、疾患はがんである。別の実施形態では、疾患は自己免疫疾患である。別の実施形態では、本開示の方法は、O-グリコシル化またはN-グリコシル化されたグリコシル化ペプチド断片を提供する。別の実施形態では、本開示の方法は、5~50アミノ酸残基の平均長を有するグリコシル化ペプチド断片を提供する。
【0009】
別の実施形態では、本開示の方法は、アルファ-1-酸性糖タンパク質、アルファ-1-抗トリプシン、アルファ-1B-糖タンパク質、アルファ-2-HS-糖タンパク質、アルファ-2-マクログロブリン、アンチトロンビンIII、アポリポタンパク質B-100、アポリポタンパク質D、アポリポタンパク質F、ベータ2糖タンパク質1、セルロプラスミン、フェチュイン、フィブリノゲン、免疫グロブリン(Ig)A、IgG、IgM、ハプトグロビン、ヘモペキシン、ヒスチジンリッチ糖タンパク質、キニノゲン-1、セロトランスフェリン、トランスフェリン、ビトロネクチンおよび亜鉛-アルファ-2-糖タンパク質のうちの1つ以上であるグリコシル化タンパク質を使用する。
【0010】
別の実施形態では、本開示の方法は、少なくとも2つのプロテアーゼを使用するグリコシル化タンパク質の断片化を含む。別の実施形態では、本開示の方法は、多重反応モニタリング質量分析法(MRM-MS)を使用するLC-MS技術を使用する。
【0011】
別の実施形態では、本開示は、本明細書に記載の様々な疾患の有望なバイオマーカーとしてグリコシル化ペプチド断片を同定する方法を提供し、生体試料は、対象から得られた体組織、唾液、涙、喀痰、脊髄液、尿、滑液、全血、血清または血漿である。一実施形態では、対象は哺乳動物である。別の実施形態では、対象はヒトである。
【0012】
別の実施形態では、本開示は、有望なバイオマーカーとしてグリコシル化ペプチド断片を同定する方法を提供し、本方法は、
対象から単離された複数の生物試料のそれぞれにおいて、1つ以上のプロテアーゼを用いてグリコシル化タンパク質を断片化することであって、グリコシル化ペプチド断片を生成する、ことと、
液体クロマトグラフィーおよび質量分析法(LC-MS)でグリコシル化ペプチド断片を定量することであって、定量結果を提供する、ことと、
分類の予測に役立つグリコシル化ペプチド断片を選択するために、機械学習法で対象の分類とともに定量結果を分析することと、
グリコシル化ペプチド断片の同一性を決定することと、を含み、機械学習アプローチは、深層学習、ニューラルネットワーク、線形判別分析、二次判別分析、サポートベクターマシン、ランダムフォレスト、最近傍、またはそれらの組み合わせである。別の実施形態では、機械学習アプローチは、深層学習、ニューラルネットワーク、またはそれらの組み合わせである。
【0013】
別の実施形態では、本開示は、本明細書に記載の様々な疾患の有望なバイオマーカーとしてグリコシル化ペプチド断片を同定する方法を提供し、分析は、ゲノムデータ、プロテオミクス、メタボリクス、リピドミクスデータ、またはそれらの組み合わせをさらに含む。
【図面の簡単な説明】
【0014】
図1】グライコミクス、LC/MS、機械学習の統合を示す概略図であり、さらに プロテオミクス、ゲノム、リピドミクス、メタボリクスと組み合わせることができる 。
図2】乳がん患者と対照の血漿試料中の免疫グロブリンG(IgG)糖ペプチド比 の変化を示す。
図3】原発性硬化性胆管炎(PSC)および原発性胆汁性肝硬変(PBC)試料と 健常ドナーの血漿試料中のIgG糖ペプチド比の変化を示す。
図4】健常ドナーとPSCおよびPBC試料からの血漿試料中のIgG、IgAお よびIgM糖ペプチドの判別分析データを別々に示す。
図5】PSCおよびPBC患者と健常ドナーの血漿試料中のIgG、IgAおよび IgM糖ペプチドの複合判別分析データを示す。
【発明を実施するための形態】
【0015】
定義
本明細書で使用される場合、以下の単語および語句は、それらが使用される文脈がそうでないことを示す場合を除いて、一般に、以下に示される意味を有することを意図している。
【0016】
本明細書および特許請求の範囲で使用される単数形「a」、「an」および「the」は、文脈からそうでないことが明確に示されない限り、複数の指示対象を含むことに留意されたい。
【0017】
「生体試料」という用語は、任意の生体液、細胞、組織、器官、またはその一部を意味する。また、生検によって得られた組織切片、または組織培養した細胞、または組織培養に適合した細胞も含まれるが、これらに限定されない。さらに、唾液、涙、喀痰、汗、粘液、糞便、胃液、腹水(abdominal fluid)、羊水、嚢胞液、腹水(peritoneal fluid)、脊髄液、尿、滑液、全血、血清、血漿、膵液、母乳、肺洗浄液、骨髄などが含まれるが、これらに限定されない。
【0018】
「バイオマーカー」という用語は、プロセス、イベント、または病態の、特徴的な生物学的指標または生物学的由来の指標を指す。バイオマーカーは、疾患または病態の存在、または疾患または病態のリスクなど、特定の生物学的状態も示す。それには、生物学的分子、または生物学的分子の断片が含まれ、その変化または検出は、特定の物理的状態または条件と相関させることができる。バイオマーカーの例には、ヌクレオチド、アミノ酸、脂肪酸、ステロイド、抗体、ホルモン、ステロイド、ペプチド、タンパク質、炭水化物などを含む生体分子が含まれるが、これらに限定されない。さらなる例には、グリコシル化ペプチド断片、リポタンパク質などが含まれる。
【0019】
「含む(comprising)」という用語は、組成物および方法が列挙された方法を含むが、他の方法を排除しないことを意味することを意図している。
【0020】
「グリカン」という用語は、糖ペプチド、糖タンパク質、糖脂質またはプロテオグリカンなどの複合糖質の炭水化物部分を指す。
【0021】
「グリコフォーム」という用語は、特定の構造のグリカンが結合したタンパク質のユニークな一次、二次、三次、および四次構造を指す。
【0022】
「グリコシル化ペプチド断片」という用語は、グリコシル化タンパク質のアミノ酸配列の一部と同じではあるがすべてではないアミノ酸配列を有するグリコシル化ペプチド(または糖ペプチド)を指し、断片化(例えば1つ以上のプロテアーゼによる)によって、グリコシル化ペプチドが得られる。
【0023】
「多重反応モニタリング質量分析法(MRM-MS)」という用語は、生体試料中のタンパク質/ペプチドの標的化された定量化のための高感度で選択的な方法を指す。従来の質量分析法とは異なり、MRM-MSは高度に選択的(標的化)であるため、研究者は機器を微調整して、目的のペプチド/タンパク質断片を特に探すことができる。MRMにより、有望なバイオマーカーなど、目的のペプチド/タンパク質断片の感度、特異性、速度、および定量性が向上する。MRM-MSでは、三連四重極(QQQ)質量分析計または四重極飛行時間(qTOF)質量分析計を使用する。
【0024】
「プロテアーゼ」という用語は、タンパク質をより小さなポリペプチドまたはアミノ酸にタンパク質分解または分解する酵素を指す。プロテアーゼの例には、セリンプロテアーゼ、スレオニンプロテアーゼ、システインプロテアーゼ、アスパラギン酸プロテアーゼ、グルタミン酸プロテアーゼ、メタロプロテアーゼ、アスパラギンペプチドリアーゼおよびそれらの組み合わせが含まれる。
【0025】
「対象」という用語は、哺乳類を指す。哺乳動物の非限定的な例には、ヒト、非ヒト霊長類、マウス、ラット、イヌ、ネコ、ウマ、またはウシなどが含まれる。ヒト以外の哺乳類を、疾患、前疾患、または前疾患病態の動物モデルを表す対象として有利に使用できる。対象は雄でも雌でもよい。対象は、疾患または病態を有すると以前に同定された者であって、場合により、疾患または病態のための治療的介入をすでに受けているか、受けている者でよい。あるいは、対象は、疾患または病態を有すると以前に診断されていない対象でもよい。例えば、対象は、疾患または病態の1つ以上の危険因子を示す対象、または疾患の危険因子を示さない対象、または疾患または病態の無症状の対象でもよい。対象はまた、疾患または病態に罹患しているかまたは発症するリスクがある対象でもよい。
【0026】
「治療」または「治療する」という用語は、哺乳動物などの対象における疾患または病態の任意の治療を意味し、1)疾患または病態に対する予防または保護、すなわち、臨床症状を発症させないこと、2)疾患または病態の抑制、すなわち臨床症状の発症の阻止または抑制、および/または3)疾患または病態を緩和し、臨床症状の退行を引き起こすこと、を含む。
【0027】
方法
本開示は、いくつかの実施形態では、グリコプロテオミクス、高度なLC/MS機器を使用したバイオマーカー発見、標的発見、および検証のためのグリコプロテオミクスに関する。本開示は、機械学習法を利用して分子データを処理する。分析は、ゲノムデータ、プロテオミクス、メタボリクス、リピドミクスデータ、またはそれらの組み合わせを様々な疾患の新しいバイオマーカーを発見する際に利用することをさらに含む。本開示の方法の一般的な概略図を図1に示す。
【0028】
本開示は、より高い感度および特異性を有する新しいタイプのバイオマーカーの同定につながる部位特異的グリコシル化分析のための方法を提供する。この方法は、グリコシル化ペプチドの定量化を含み、したがって、異なる部位で特定のタンパク質に関連する異なるグリコフォームの示差分析を容易にする。この方法は、タンパク質の量と部位特異的グリコシル化プロファイルに関する情報を提供するため、グリコシル化プロファイルの変化がタンパク質のグリコシル化の変化によるものか、タンパク質濃度の変化によるものかについての洞察を提供する。機械学習法と組み合わせた部位特異的グリコシル化分析は、様々な疾患または病態の新しいバイオマーカーの同定を提供する。
【0029】
本開示の定量的グリコプロテオミクス方法は、様々な疾患のバイオマーカーを発見するために使用される。これらの方法は、いくつかの疾患において特定のグリコフォームが上昇し、他のものがダウンレギュレートされるという事実に基づいており、本開示のLC/MS方法は、有意なグリコシル化変化を分析することにより、疾患対疾患なしを区別する。一実施形態では、部位特異的グリコシル化分析は、目的の糖タンパク質、修飾部位、修飾が何かを特定し、次に各修飾の相対存在量を測定することを含む。いくつかの実施形態では、疾患はがんである。他の実施形態では、疾患は自己免疫疾患である。
【0030】
本開示の方法を使用して、数千人の対象からの生物学的試料がデジタル化され、膨大な量のデータが生成され、深層機械学習分析を受けて様々な疾患の新しい標的が発見される。具体的には、深層学習を使用して、既知および未知のペプチドのクラスター化と、疾患状態と対照状態のLC/MSで見られるグリコシル化シグネチャを比較する。グリコシル化ペプチドのこのような判別分析は、疾患バイオマーカーの同定につながる。
【0031】
バイオマーカーの同定およびそれらの発現レベルなどの対応する機能は、次いで疾患または病態の診断試験方法を開発するために使用される。この方法は、少なくとも部分的には、1つ以上の選択されたバイオマーカーを測定し、疾患または病態との関連の結果を分析することに依拠する。この方法はさらに、1つ以上の治療の選択、治療計画の決定、あるいは特定の疾患または病態の治療に対する反応の監視に使用することができる。したがって、本開示は、疾患または病態の予防、診断、治療、監視および予後診断のための方法を提供する。いくつかの実施形態では、方法は、疾患または病態を有する対象と健常な対象とを区別するのに有用である。いくつかの実施形態では、この方法は、がんを有する対象と健常な対象を区別するのに有用である。いくつかの実施形態では、この方法は、がんの診断を支援するか、がんを監視するのに有用である。
【0032】
標的化アプローチおよび非標的化アプローチ
本開示のバイオマーカー発見方法は、標的化アプローチおよび/または非標的化アプローチの両方を使用する。この方法は通常、3つの異なるフェーズ、つまり、発見フェーズ、事前検証フェーズ、および検証フェーズで構成される。
【0033】
発見フェーズ
標的化アプローチは、対象の生物学的試料中の既知のグリコフォームで既知の糖タンパク質を特定および監視することを含む。様々な疾患についてFDAが承認した糖タンパク質バイオマーカーが知られており、それらは本開示の方法を使用して監視され、対象の分類を特定する。通常、バイオマーカーのグリコシル化の変化は腫瘍特異的であり、疾患または疾患のステージの有望なリスクを特定するのに役立つ。標的化アプローチでは、データ収集が実行される前の研究の開始時に確立された生物学的重要性が化学的に特徴付けられ、生物学的に注釈が付けられている、既知の糖タンパク質とそのグリコフォームに焦点を合わせる。定量化は、内部標準および化学的標準標品を使用して実行される。
【0034】
具体的には、標的化アプローチでは、部位特異的グリコシル化分析は、疾患または病態を有する多数の対象と、疾患または病態を有しない等しい数の一致した対照対象の、症例対照研究からの生体試料において行われる。疾患関連の糖タンパク質または生物学的活性を有する糖タンパク質などの目的の糖タンパク質が、最初に生体試料において特定される。次に、LC/MSを使用して、修飾部位、修飾の性質、修飾の同一性、および各修飾の相対存在量を分析し、ペプチド断片の同定と定量を行う。このアプローチでは、三連四重極(QQQ)質量分析計を使用して、グリコシル化ペプチド断片の定量を行い、対象の分類に関して分析する。
【0035】
非標的化アプローチは、既知および未知のペプチド断片のグリコシル化パターンを学習し、対象の分類を特定するのに役立つグリコシル化パターンの変化に関する詳細情報を提供することを含む。非標的化アプローチは、糖タンパク質の「上方または下方制御」を提供する相対定量技術に基づく。具体的には、糖タンパク質の上方制御または下方制御は、対象の分類に関連して監視される。例えば、糖タンパク質断片は、疾患または病態を有する対象に対して、疾患または病態を有しない対象に対して監視される。このアプローチでは、データが取得される前の各糖タンパク質断片の化学的同一性が不明である。一実施形態では、非標的化アプローチでは、グリコシル化ペプチド断片の分析のために四重極飛行時間(qTOF)質量分析計を使用する。このアプローチでは、機器を使用して、試料中の成分の質量を、これらの成分が何であるかについての何らの先入観もなく、正確に測定する。
【0036】
グループ間(疾患対疾患なし)で異なって表現された候補は、重要な臨床的特徴と特徴選択技術による分類の予測を可能にする機械学習法を使用して、さらなる評価のために選択される。パフォーマンスは、機能を選択し、トレーニングセットを使用してモデルを構築する内部相互検証を使用して評価される。得られたモデルは、モデルの構築に使用されなかった試験セットで評価される。偽陽性率は、BenjaminおよびHochbergによって導入された偽発見率(FDR)アプローチを使用して制御される。
【0037】
事前検証フェーズ
次いで、このようにして発見段階で特定された候補バイオマーカーは、疾患または病態を有する多数の対象および疾患または病態を有しないそれらの適合対照から得られた生体試料の独立した試験セットで試験され、候補バイオマーカーの性能が決定される。選択されたバイオマーカー、そのランキング、および発見フェーズで開発されたモデルのパラメータ推定はすべてモデリングの一部であり、この独立した事前検証フェーズで試験される。候補バイオマーカーのシグナルによって、診断試験は生体試料を疾患のあるグループと疾患のないグループとの2つのグループに分類する。次いで、陽性適中率、陰性適中率、特異性および感度に基づいて、試験の有用性が評価される。また、診断性能は受信者動作特性(ROC)曲線を使用して評価され、どのバイオマーカーまたは複数のバイオマーカーの組み合わせが疾患または病態の統計的に優れた診断試験であるかを試験する。検証に成功した個々のバイオマーカーは、複合マーカーのパネルを形成するためにその後に組み込むために検査される。複合マーカーは、重み付き多変数ロジスティック回帰または他の分類アルゴリズムによって構築される。
【0038】
検証フェーズ
事前検証フェーズで保持された候補バイオマーカーは、その後、多数の対象からの独立した盲検化された生体試料を使用した独立した検証を通じて検証される。このフェーズの目的は、選択したバイオマーカーの診断精度を評価することである。
【0039】
一実施形態では、バイオマーカー発見方法は、がんを有する対象から得られた生体試料に適用される。いくつかの実施形態では、少なくとも20人、少なくとも40人、少なくとも60人、少なくとも80人または少なくとも100人の対象からの生体試料が各グループ(すなわち、がんを有するグループまたはがんを有しないグループ)で分析される。
【0040】
標的化アプローチおよび/または非標的化アプローチの両方が、本明細書に記載の機械学習方法とともに、様々な疾患の可能性のあるリスクおよび/または初期段階の検出を特定するための新しい診断方法を提供する。一実施形態では、本開示は、機械学習法と組み合わせた標的化アプローチおよび非標的化アプローチの収束に基づくバイオマーカーの同定方法を提供する。本開示の方法により同定されたバイオマーカーは、診断方法、予後評価の方法、治療結果のモニタリング、特定の治療に応答する可能性のある対象の同定、薬物スクリーニングなどにおいて有用である。
【0041】
一実施形態では、本開示は、有望なバイオマーカーとしてグリコシル化ペプチド断片を同定する方法を提供し、本方法は、
対象から単離された複数の生物試料のそれぞれにおいて、1つ以上のプロテアーゼを用いてグリコシル化タンパク質を断片化することであって、グリコシル化ペプチド断片を生成する、ことと、
液体クロマトグラフィーおよび質量分析法(LC-MS)でグリコシル化ペプチド断片を定量することであって、定量結果を提供する、ことと、
分類の予測に役立つグリコシル化ペプチド断片を選択するために、機械学習法で対象の分類とともに定量結果を分析することと、
グリコシル化ペプチド断片の同一性を決定することと、を含む。
【0042】
別の実施形態では、本開示は、本明細書に記載の方法を提供し、対象は、疾患または病態を有する対象と、疾患または病態を有しない対象とを含む。さらなる実施形態では、対象は、疾患の治療を受けている対象と、疾患を有するが疾患の治療を受けていない対象とを含む。
【0043】
本開示の方法は、対象の生体試料からのグリコシル化ペプチド断片を分析することにより検出され得るいずれかの疾患または病態に適用可能である。一実施形態では、疾患はがんである。別の実施形態では、がんは、乳がん、子宮頸がんまたは卵巣がんから選択される。別の実施形態では、疾患は自己免疫疾患である。別の実施形態では、自己免疫疾患は、HIV、原発性硬化性胆管炎、原発性胆汁性肝硬変または乾癬である。
【0044】
別の実施形態では、本開示は、本明細書に記載の方法を提供し、グリコシル化タンパク質は、アルファ-1-酸糖タンパク質、アルファ-1-アンチトリプシン、アルファ-1B-糖タンパク質、アルファ-2-HS-糖タンパク質、アルファ-2-マクログロブリン、アンチトロンビン-III、アポリポタンパク質B-100、アポリポタンパク質D、アポリポタンパク質F、ベータ-2-糖タンパク質1、セルロプラスミン、フェツイン、フィブリノゲン、免疫グロブリン(Ig)A、IgG、IgM、ハプトグロビン、ヘモペキシン、ヒスチジン-豊富な糖タンパク質、キニノゲン-1、セロトランスフェリン、トランスフェリン、ビトロネクチンおよび亜鉛-アルファ-2-糖タンパク質のうちの1つ以上である。別の実施形態では、グリコシル化タンパク質は、アルファ-1-酸糖タンパク質、免疫グロブリン(Ig)A、IgGまたはIgMのうちの1つ以上である。
【0045】
別の実施形態では、本開示は、本明細書に記載の方法を提供し、グリコシル化ペプチド断片がN-グリコシル化またはO-グリコシル化されている。
【0046】
別の実施形態では、本開示は、本明細書に記載の方法を提供し、グリコシル化ペプチド断片は、約5個~約50個のアミノ酸残基の平均長を有する。いくつかの実施形態では、グリコシル化ペプチド断片は、約5個~約45個、または約5個~約40個、または約5個~約35個、または約5個~約30個、または約5個~約25個、または約5個~約20個、または約5個~約15個、または約5個~約10個、または約10個~約50個、または約10個~約45個、または約10個~約40個、または約10個~約35個、または約10個~約30個、または約10個~約25個、または約10個~約20個、または約10個~約15個、または約15個~約45個、または約15個~約40個、または約15個~約35個、または約15個~約30個、または約15個~約25個または約15個~約20個のアミノ酸残基の平均長を有する。一実施形態では、グリコシル化ペプチド断片は、約15個のアミノ酸残基の平均長を有する。別の実施形態では、グリコシル化ペプチド断片は、約10個のアミノ酸残基の平均長を有する。別の実施形態では、グリコシル化ペプチド断片は、約5個のアミノ酸残基の平均長を有する。
【0047】
別の実施形態では、本開示は、本明細書に記載の方法を提供し、1つ以上のプロテアーゼは、タンパク質の断片化に使用される任意のプロテアーゼを含む。一実施形態では、プロテアーゼは、セリンプロテアーゼ、スレオニンプロテアーゼ、システインプロテアーゼ、アスパラギン酸プロテアーゼ、グルタミン酸プロテアーゼ、メタロプロテアーゼ、アスパラギンペプチドリアーゼまたはそれらの組み合わせである。プロテアーゼのいくつかの代表的な例には、トリプシン、キモトリプシン、エンドプロテイナーゼ、Asp-、Arg-C、Glu-C、Lys-C、ペプシン、サーモリシン、エラスターゼ、パパイン、プロテイナーゼK、スブチリシン、クロストリパイン、カルボキシペプチダーゼが含まれるが、これらに限定されない。別の実施形態では、本開示は、本明細書に記載の方法を提供し、1つ以上のプロテアーゼは、少なくとも2つのプロテアーゼを含む。
【0048】
本開示の方法には、いくつかのさらなる用途がある。例えば、1つ以上のバイオマーカーは、疾患前の状態と疾患の状態、または疾患の状態と正常な状態を区別するのに役立つ。非疾患固有のその他の健康状態も判断できる。例えば、バイオマーカーの変化は、様々な時点で分析できる。疾患のある対象では、疾患の進行を監視し、治療を受けている対象では、治療の効果を監視し、治療後の対象では、再発の可能性を監視する。また、特定量のバイオマーカーのレベルにより、疾患の治療コースを選択することもできる。例えば、生物学的試料は、疾患の治療計画を受けている対象から提供され得る。そのような治療レジメンには、運動レジメン、食事サプリメント、減量、外科的介入、デバイス移植、および疾患または病態と診断または同定された対象に使用される治療薬または予防薬による治療が含まれるが、これらに限定されない。
【0049】
さらに、複数の糖タンパク質の糖ペプチド比の変化は、特定の疾患状態または疾患の欠如に関連している可能性がある。例えば、生体試料中の複数の特定の糖ペプチドの存在は、疾患の非存在を示す場合がある一方、生体試料中の複数の他の特定の糖ペプチドの存在は、疾患の存在を示す場合がある。したがって、様々な糖ペプチドプロファイルまたは糖ペプチドバイオマーカーのパネルは、疾患の様々な状態と相関する可能性がある。
【0050】
実施例2は、対照に対する乳がん患者からの血漿試料中のIgG1、IgG0およびIgG2糖ペプチドの変化の定量結果を示す。図2は、糖ペプチドA1およびA2のレベルが対照と比較して上昇したのに対し、糖ペプチドA8、A9およびA10のレベルはこの実験で研究した乳がんのすべての段階で対照と比較して低下したことを示しており、糖ペプチドA1、A2、A8、A9およびA10が乳がんの有望なバイオマーカーであることを示す。
【0051】
実施例3は、PSCを有する患者およびPSCを有する患者からの血漿試料中のIgG、IgMおよびIgA糖ペプチドの変化の定量結果を示す。図3は、PBCおよびPSCを有する患者の血漿試料において、糖ペプチドAが健常ドナーと比較して上昇したのに対し、糖ペプチドH、IおよびJは、PBCおよびPSCを有する患者の血漿試料において健常ドナーと比較して減少したことを示す。したがって、糖ペプチドA、H、I、およびJは、PBCおよびPSCの有望なバイオマーカーである。さらに、図4および図5には、判別分析の個別分析結果と複合分析結果がそれぞれ示され、複合判別分析での、疾患状態を予測するための88%の精度が示唆される。
【0052】
いくつかの実施形態では、本開示は、検出および分析されるバイオマーカーの数が1、または2以上、例えば3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、30以上である方法を提供する。したがって、本開示はまた、疾患または病態の診断に有用なバイオマーカーのパネルを提供する。
【0053】
質量分析法
一実施形態では、本開示は、質量分析計を使用することによりグリコシル化ペプチド断片を定量化することを含む、本明細書に記載の方法を提供する。一実施形態では、本方法は、「多重反応モニタリング(MRM)」と呼ばれる技術を使用する。多くの場合、この手法は液体クロマトグラフィー(LC/MRM-MS)と組み合わされ、1回のLC/MRM-MS分析で数百のグリコシル化ペプチド断片(およびその親タンパク質)を定量できる。本開示の高度な質量分析技術は、効果的なイオン源、より高い分解能、より速い分離、およびより高いダイナミックレンジを備えた検出器を提供し、標的化測定の利点を保持する幅広い非標的化測定を可能にする。
【0054】
本開示の質量分析法は、一度にいくつかのグリコシル化タンパク質に適用可能である。例えば、少なくとも50超、または少なくとも60超、または少なくとも70超、または少なくとも80超、または少なくとも90超、または少なくとも100超、または少なくとも110超、または少なくとも120超のグリコシル化タンパク質を、質量分析計を使用して一度に分析できる。
【0055】
一実施形態では、本開示の質量分析法は、QQQまたはqTOF質量分析計を使用する。別の実施形態では、本開示の質量分析法は、5,000以上、または10,000以上、または25,000以上、または50,000以上、または100,000以上の分解能で、10ppm以上、または5ppm以上、または2ppm以上、または1ppm以上、または0.5ppm以上、0.2ppm以上、または0.1ppm以上の高い質量精度を備えたデータを提供する。
【0056】
生体試料
本開示は、生体試料からのグリコシル化ペプチド断片の定量に基づく方法を提供する。いくつかの実施形態では、生体試料は過去に収集された1つ以上の臨床試料であり、したがって、新しいバイオマーカーの同定に付さなければならないリソースおよび時間を削減する。いくつかの実施形態では、生物学的試料は、1~50年以上のスパンにわたって生じた1つ以上の過去の研究からのものである。いくつかの実施形態では、研究は、様々な他の臨床パラメータと、対象の年齢、身長、体重、民族性、病歴などの既知の情報を伴う。そのような追加情報は、対象を疾患または病態に関連付けるのに役立つ。いくつかの実施形態では、生体試料は、対象から前向きに収集された1つ以上の臨床試料である。
【0057】
一実施形態では、本開示は、本明細書に記載の方法を提供し、対象から単離された生体試料は、唾液、涙、喀痰、汗、粘液、糞便、胃液、腹膜液、羊水、嚢胞液、腹腔液、脊髄液、尿、滑液、全血、血清、血漿、膵液、母乳、肺洗浄液、骨髄の1つ以上である。別の実施形態では、対象から単離された生体試料は、体組織、唾液、涙、喀痰、脊髄液、尿、滑液、全血、血清または血漿である。別の実施形態では、対象から単離された生体試料は、全血、血清または血漿である。いくつかの実施形態では、対象は哺乳動物である。他の実施形態では、対象はヒトである。
【0058】
疾患
本開示の方法は、対象の生体試料からのグリコシル化ペプチド断片を分析することにより検出され得るいずれかの疾患または病態に適用可能である。いくつかの実施形態では、疾患または病態はがんである。他の実施形態では、がんは、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、副腎皮質がん、肛門がん、膀胱がん、血液がん、骨がん、脳腫瘍、乳がん、女性生殖器系のがん、がん男性生殖器系、中枢神経系リンパ腫、子宮頸がん、小児横紋筋肉腫、小児肉腫、慢性リンパ性白血病(CLL)、慢性骨髄性白血病(CML)、結腸および直腸がん、結腸がん、子宮内膜がん、子宮内膜肉腫、食道がん、眼がん、胆嚢がん、胃がん、消化管がん、有毛細胞白血病、頭頸部がん、肝細胞がん、ホジキン病、下咽頭がん、カポジ肉腫、腎臓がん、喉頭がん、白血病、肝臓がん、肺がん、悪性腫瘍線維性組織球腫、悪性胸腺腫、黒色腫、中皮腫、多発性骨髄腫、骨髄腫、鼻腔および副鼻腔がん、鼻咽頭がん、神経系がん、神経芽細胞腫、非ホジキンリンパ腫、口腔がん、口腔咽頭がん、骨肉腫、卵巣がん、膵臓がん、副甲状腺がん、陰茎がん、咽頭がん、下垂体腫瘍、形質細胞新生物、原発性CNSリンパ腫、前立腺がん、直腸がん、呼吸器系、網膜芽細胞腫、唾液腺がん、皮膚がん、小腸がん、軟部組織肉腫、胃がん、精巣がん、甲状腺がん、尿路がん、子宮肉腫、膣がん、血管系、ウォルデンストロムのマクログロブリン血症、ウィルムス腫瘍などである。別の実施形態では、がんは乳がん、子宮頸がんまたは卵巣がんである。
【0059】
別の実施形態では、疾患は自己免疫疾患である。別の実施形態では、自己免疫疾患は、急性播種性脳脊髄炎、アディソン病、無ガンマグロブリン血症、加齢黄斑変性、円形脱毛症、筋萎縮性側索硬化症、強直性脊椎炎、抗リン脂質症候群、抗シンセターゼ症候群、アトピー性アレルギー、アトピー性皮膚炎、自己免疫性貧血、自己免疫性心筋症、自己免疫性腸疾患、自己免疫性溶血性貧血、自己免疫性肝炎、自己免疫性内耳疾患、自己免疫性リンパ球増殖性症候群、自己免疫性末梢神経障害、自己免疫性膵炎、自己免疫性ポリ内分泌症候群、自己免疫性プロゲステロン皮膚炎、自己免疫性血小板減少性紫斑病、自己免疫性湿疹、自己免疫性ぶどう膜炎、バロー病/バロー同心円性硬化症、ベーチェット病、ベルガー病、ビッカースタッフ脳炎、ブラウ症候群、水疱性類天疱瘡、がん、キャッスルマン病、セリアック病、シャーガス病、慢性炎症性脱髄性多発神経障害、慢性再発性イフォカル骨髄炎、慢性閉塞性肺疾患、チャーグ・ストラウス症候群、瘢痕性類天疱瘡、コーガン症候群、寒冷凝集素病、補体2成分欠乏症、接触皮膚炎、頭蓋動脈炎、CREST症候群、クローン病、クッシング症候群、皮膚白血球破壊血管炎、デゴ病皮膚病、疱疹状皮膚炎、皮膚筋炎、1型糖尿病、びまん性皮膚全身性硬化症、ドレスラー症候群、薬物誘発性ループス、円板状エリテマトーデス、湿疹、子宮内膜症、腱炎関連関節炎、好酸球性筋膜炎、好酸球性胃腸炎、後天性表皮水疱症、結節性紅斑、胎児赤芽球症、本態性混合クリオグロブリン血症、エバン症候群、進行性線維性異形成症、線維化性肺胞炎、胃炎、胃腸類天疱瘡、糸球体腎炎、グッドパスチャー症候群、グレーブス病、ギランバレー症候群、橋本筋症、橋本病エノック・シェーンライン紫斑病、HIV、妊娠性類天疱瘡、化膿性汗腺炎、ヒューズ・ストビン症候群、低ガンマグロブリン血症、特発性炎症性脱髄疾患、特発性肺線維症、特発性血小板減少性紫斑病、IgA腎症、封入体筋炎、慢性炎症性脱髄性多発神経炎、間質性膀胱炎、若年性特発性関節炎、川崎病、ランバート・イートン筋無力症候群、白血球破砕性血管炎、扁平苔癬、硬化性苔癬、線状IgA疾患、紅斑性狼瘡、マジェード症候群、メニエール病、顕微鏡的多発血管炎、混合性結合組織病、斑状強皮症、ムッカハーベルマン病、多発性硬化症、重症筋無力症、筋炎、ナルコレプシー、視神経脊髄炎、神経ミオトニー、眼性瘢痕性類天疱瘡、眼球クローヌスミオクローヌス症候群、オード甲状腺炎、パリンドローム性リウマチ、連鎖球菌に関連する小児自己免疫神経精神疾患、傍腫瘍性小脳変性症、腫瘍随伴性発作性夜間血色素尿症、パリーロンベルグ症候群、パーソナージターナー症候群、パーズプラニチス、尋常性天疱瘡、悪性貧血、静脈性脳脊髄炎、POEMS症候群、結節性多発動脈炎、多発性筋痛リウマチ、多発性筋炎、原発性胆汁性肝硬変、原発性硬化性胆管炎、進行性炎症性神経障害、乾癬、乾癬性関節炎、壊疽性膿皮症、純粋な赤血球無形成、ラスムッセン脳炎、レイノー現象、再発性多発性軟骨炎、ライター症候群、下肢静止不能症候群、後腹膜線維症、関節リウマチ、リウマチ熱、サルコイドーシス、統合失調症、シュミット症候群、シュニッツラー症候群、強膜炎、皮膚硬化症、血清病、シェーグレン症候群、脊椎関節症、スティッフパーソン症候群、亜急性細菌性心内膜炎、ササック症候群、スウィート症候群、交感神経性眼炎、高安動脈炎、側頭動脈炎、血小板減少症、トロサハント症候群、横断性脊髄炎、潰瘍性大腸炎、無差別結合組織病、じん麻疹様血管炎、血管炎、白斑およびウェゲナー肉芽腫症などである。別の実施形態では、自己免疫疾患は、HIV、原発性硬化性胆管炎、原発性胆汁性肝硬変または乾癬である。
【0060】
機械学習
生体試料は、数千人の対象から取得される。これらの対象は、これまでに発見されていないマーカーのディープマイニングと検証を目的としたデジタル化に使用される。いくつかの実施形態では、生体試料は腫瘍試料または血液試料である。これらはLC/MS機器を使用してデジタル化され、膨大な量のデータが生成され、深層機械学習分析を受けて様々な疾患の新しい標的を発見する。いくつかの実施形態では、疾患はがんまたは自己免疫疾患である。
【0061】
一実施形態では、本開示は、有望なバイオマーカーとしてグリコシル化ペプチド断片を同定する方法を提供し、本方法は、
対象から単離された複数の生物試料のそれぞれにおいて、1つ以上のプロテアーゼを用いてグリコシル化タンパク質を断片化することであって、グリコシル化ペプチド断片を生成する、ことと、
液体クロマトグラフィーおよび質量分析法(LC-MS)でグリコシル化ペプチド断片を定量することであって、定量結果を提供する、ことと、
分類の予測に役立つグリコシル化ペプチド断片を選択するために、機械学習法で対象の分類とともに定量結果を分析することと、
グリコシル化ペプチド断片の同一性を決定することと、を含み、ここで、機械学習アプローチは、深層学習、ニューラルネットワーク、線形判別分析、二次判別分析、サポートベクターマシン、ランダムフォレスト、最近傍、またはそれらの組み合わせである。いくつかの実施形態では、機械学習アプローチは、深層学習、ニューラルネットワーク、またはそれらの組み合わせである。分析は、ゲノムデータ、プロテオミクス、メタボリクス、リピドミクスデータ、またはそれらの組み合わせをさらに含む。図1は、グライコミクス、LC/MS、および機械学習の統合を示す概略図であり、さらにプロテオミクス、ゲノム、リピドミクス、およびメタボリクスと組み合わせて、様々な疾患のバイオマーカーを同定する。
【実施例
【0062】
実施例1
バイオマーカー発見の一般的な方法
標的化アプローチでは、まず目的の糖タンパク質を生体試料で特定し、次にLC/MSを使用して修飾部位、修飾の性質、修飾のアイデンティティ、各修飾の相対存在量を分析して、ペプチド断片の同一性とペプチド断片の定量を行った。このアプローチでは、三連四重極(QQQ)質量分析計を使用して、グリコシル化されたペプチド断片を定量し、対象の分類との関係について分析する。
【0063】
非標的化アプローチでは、すべてのペプチド断片(既知および未知)のグリコシル化パターンが分析され、様々な対象のグリコシル化パターンの変化に関する情報が得られる。具体的には、糖タンパク質のアップレギュレーションまたはダウンレギュレーションは、対象の分類に関連して監視される。例えば、糖タンパク質断片は、疾患または病態を有する対象に対する、疾患または病態を有しない対象について、監視される。このアプローチでは、グリコシル化ペプチド断片の分析に四重極飛行時間(qTOF)質量分析計を使用する。
【0064】
実施例2
乳がんの有望なバイオマーカーとしてのIgG糖ペプチドの定量化
がんの様々な段階にある乳がん患者と、年齢が一致する対照の血漿試料を、IgG1、IgG0、およびIgG2糖ペプチドについて分析し、それらの比率の変化を比較した。具体的には、Tisステージの20の試料、EC1ステージの50の試料、EC2ステージの試料、EC3ステージの25の試料、EC4ステージの9の試料、および73の年齢が一致した対照試料を、QQQ質量分析計でMRM定量分析にかけた。図2の定量的結果からからわかるように、特定のIgG1糖ペプチドのレベルを対照と比較して評価したところ、特定のIgG1糖ペプチドのレベルはこの実験で研究された乳がんのすべての段階での対照と比較して減少した。例えば、A1~A11と名付けられたIgG1糖ペプチドをモニターしたところ、糖ペプチドA1およびA2のレベルは対照と比較して上昇し、一方、糖ペプチドA8、A9およびA10のレベルはこの実験で研究された乳がんのすべての段階での対照と比較して減少した。したがって、糖ペプチドA1、A2、A8、A9およびA10は、乳がんの有望なバイオマーカーである。
【0065】
実施例3
PSCおよびPBCの有望なバイオマーカーとしてのIgG糖ペプチドの定量化
原発性硬化性胆管炎(PSC)を有する患者、原発性胆汁性肝硬変(PBC)を有する患者からの血漿試料、および健常ドナーからの血漿試料をIgG1およびIgG2糖ペプチドについて分析し、グリコペピド比の変化を比較した。具体的には、100のPBC血漿試料、76のPSC血漿試料、49の健常ドナーからの血漿試料を、QQQ質量分析計でMRM定量分析にかけた。図3の定量結果からわかるように、特定のIgG1糖ペプチドは健常ドナーと比較して上昇したが、特定のIgG1糖ペプチドはPBCとPSCの患者の血漿試料の対照と比較して減少した。例えば、糖ペプチドAはPBCとPSCの患者の健常ドナーと比較して上昇したが、糖ペプチドH、IとJはPBCとPSCの患者の血漿試料の健常ドナーと比較して減少した。したがって、糖ペプチドA、H、I、およびJは、PBCおよびPSCの有望なバイオマーカーである。
【0066】
同様の分析が、PBCを有する患者の血漿試料およびPSCを有する患者の血漿試料中のIgAおよびIgM糖タンパク質に対して実施された。判別分析の結果を図4に示す。これは、IgG、IgM、およびIgAの個別のデータに基づいて予測できる精度がそれぞれ59%、69%、74%であることを示す。しかし、IgG、IgMおよびIgAのすべてについての結果を組み合わせると、図5に示すように判別分析により約88%の精度が得られる。
図1
図2
図3
図4
図5