(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-23
(54)【発明の名称】糖ペプチド濃度決定、正規化存在量決定、ならびにLC/MSラン試料調製のためのシステム及び方法
(51)【国際特許分類】
G01N 33/68 20060101AFI20241016BHJP
G01N 33/66 20060101ALI20241016BHJP
G01N 33/483 20060101ALI20241016BHJP
【FI】
G01N33/68
G01N33/66
G01N33/483 E
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024515132
(86)(22)【出願日】2022-09-30
(85)【翻訳文提出日】2024-03-07
(86)【国際出願番号】 US2022077354
(87)【国際公開番号】W WO2023056424
(87)【国際公開日】2023-04-06
(32)【優先日】2021-09-30
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-12-23
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】521339843
【氏名又は名称】ヴェン バイオサイエンシーズ コーポレーション
(74)【代理人】
【識別番号】100107456
【氏名又は名称】池田 成人
(74)【代理人】
【識別番号】100162352
【氏名又は名称】酒巻 順一郎
(74)【代理人】
【識別番号】100123995
【氏名又は名称】野田 雅一
(72)【発明者】
【氏名】セリー, ダニエル
(72)【発明者】
【氏名】シュー, ググ
【テーマコード(参考)】
2G045
【Fターム(参考)】
2G045AA13
2G045AA24
2G045AA25
2G045AA28
2G045CA02
2G045CA11
2G045CA25
2G045CA26
2G045CB01
2G045CB03
2G045CB07
2G045CB21
2G045DA44
2G045FA34
2G045FA36
2G045JA01
(57)【要約】
本明細書に説明される実施形態は、概して、質量分析試料を処理するためのシステム及び方法に関する。本開示の態様は、試料を処理するためのシステム及び方法を含む。追加的に、本開示の実施形態はまた、試料分析のためのシステム及び方法を含み得る。様々な実施形態は、試料及び試料ランにわたってデータを比較するためのデータ分析システム及び方法を含む。データ分析システムが、生の存在量質量分析データを正規化するための正規化方法を実行し得る。いくつかの態様では、正規化データは、予測モデルのための入力として使用され得る。
【選択図】なし
【特許請求の範囲】
【請求項1】
試料中の標的糖ペプチド分析物の濃度を決定する方法であって、前記方法が、
試料の非グリコシル化内因性ペプチド(NGEP)の存在量を測定することと、
外部標準を使用して、前記NGEPに対する補正されたNGEP存在量を決定することと、
既知の内部標準濃度を有する内部標準に対する内部標準存在量を測定することと、
前記補正されたNGEP存在量、前記既知の内部標準濃度、及び前記内部標準存在量の関数として、前記NGEPに対するNGEP濃度を決定することと、
前記試料の標的糖ペプチド分析物の正規化存在量を、前記標的糖ペプチド分析物の測定された存在量及び前記標的糖タンパク質分析物と同じタンパク質上の前記NGEPの前記測定された存在量の関数として、決定することと、
標的糖ペプチド分析物濃度を前記NGEP濃度及び前記正規化存在量の関数として決定することと、を含む、前記方法。
【請求項2】
対象に対する治療を生成するために、前記標的糖ペプチド分析物濃度を分析することをさらに含む、請求項1に記載の方法。
【請求項3】
対象に対する診断を生成するために、前記標的糖ペプチド分析物濃度を分析することをさらに含む、請求項1または2に記載の方法。
【請求項4】
前記NGEP濃度が、前記補正されたNGEP存在量と前記内部標準存在量との比率を含む、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記NGEP濃度が、前記比率と前記既知の内部標準濃度との積である、請求項4に記載の方法。
【請求項6】
前記正規化存在量が、前記タンパク質上の標的グリコシル化部位で1つまたは2つのグリカンが特定されるときに決定される、請求項1~5のいずれか1項に記載の方法。
【請求項7】
前記標的糖ペプチド分析物濃度が、前記NGEP濃度と前記正規化存在量との積である、請求項1~6のいずれか1項に記載の方法。
【請求項8】
前記正規化存在量が、第1の測定された存在量と第2の測定された存在量との商である、請求項1~7のいずれか1項に記載の方法。
【請求項9】
前記NGEPの前記存在量、前記内部標準存在量、及び前記標的糖ペプチドの前記測定された存在量が、質量分析を使用した試料ランにおいて測定される、請求項1~8のいずれか1項に記載の方法。
【請求項10】
液体クロマトグラフィー/質量分析(LC-MS)試料ランのための試料を調製し、複数の試料ランの存在量データを正規化するための方法であって、前記方法が、
LC-MS分析のための前記複数の試料ランのためのラン試料を調製することであって、前記調製することが、
第1のラン試料セットを生成することであって、前記第1のラン試料セットの各々が、外部標準を含む、前記生成することと、
第2のラン試料セットを生成することであって、前記第2のラン試料セットの各々が、少なくとも2つの標的糖ペプチド分析物、及び内部標準を含む、前記生成することと、を含む、前記調製することと、
プールされた標準を作成するために、前記第1のラン試料セットのうちの少なくとも2つのラン試料を組み合わせることと、
ラン順序に従って各ラン試料を分析することであって、前記ラン順序が、前記試料ランの前記ラン試料についての分析の相対順序を指定する、前記分析することと、
参照として各試料ランの前記プールされた標準を使用して、前記複数の試料ランの生の存在量データを正規化することと、を含む、前記方法。
【請求項11】
前記第1のラン試料セットのうちの第1のラン試料が、前記ラン順序において前記第2のラン試料セットのうちの第2のラン試料に隣接する位置を占める、請求項10に記載の方法。
【請求項12】
前記第1のラン試料セットのうちのラン試料が、前記ラン順序において前記第2のラン試料セットのうちのラン試料の全ての前の位置を占める、請求項10に記載の方法。
【請求項13】
前記第1のラン試料セットのうちのラン試料が、前記ラン順序において前記第2のラン試料セットのうちのラン試料の全ての後の位置を占める、請求項10に記載の方法。
【請求項14】
前記第1のラン試料セットのうちのラン試料が、前記ラン順序において少なくとも5つの位置ごとに1つの位置を占める、請求項10に記載の方法。
【請求項15】
前記第1のラン試料セットのうちのラン試料が、前記ラン順序において少なくとも10個の位置ごとに1つの位置を占める、請求項10に記載の方法。
【請求項16】
前記ラン順序が、前記ラン順序において少なくとも15個の位置ごとに位置付けられた前記第1のラン試料セットのうちの単一のラン試料を含む、請求項10に記載の方法。
【請求項17】
前記ラン順序が、前記第1のラン試料セットのうちの単一のラン試料に続いて、前記第2のラン試料セットのうちの2~29個の範囲のラン試料を含む、請求項10に記載の方法。
【請求項18】
前記ラン順序が、前記第1のラン試料セットのうちの単一のラン試料に続いて、前記第2のラン試料セットのうちの4~14個の範囲のラン試料を含む、請求項10に記載の方法。
【請求項19】
前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちの全ての前記ラン試料の前に、BSAを含む少なくとも1つのラン試料を位置付けることをさらに含む、請求項10~18のいずれか1項に記載の方法。
【請求項20】
前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちの全ての前記ラン試料の後に、BSAを含む少なくとも1つのラン試料を位置付けることをさらに含む、請求項10~19のいずれか1項に記載の方法。
【請求項21】
前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちのラン試料の前に、少なくとも1つのブランクラン試料を位置付けることをさらに含む、請求項10~20のいずれか1項に記載の方法。
【請求項22】
前記ラン順序において、前記第1のラン試料セットのうちのラン試料の1つ前の位置に、ブランクラン試料を位置付けることをさらに含む、請求項10~21のいずれか1項に記載の方法。
【請求項23】
調製するステップが、
前記ラン試料の糖タンパク質構造を酵素消化して、前記第1のラン試料セットの各ラン試料の前記外部標準、ならびに前記第2のラン試料セットの各ラン試料の前記内部標準及び前記少なくとも2つの標的糖ペプチド分析物を生成することをさらに含む、請求項10~22のいずれか1項に記載の方法。
【請求項24】
前記内部標準を使用して、前記第2のラン試料セットのうちの同じラン試料の前記少なくとも2つの標的糖ペプチド分析物の各々から生成された生の存在量データを正規化することをさらに含む、請求項23に記載の方法。
【請求項25】
前記外部標準が、非グリコシル化内因性ペプチド(NGEP)を含む、請求項10~24のいずれか1項に記載の方法。
【請求項26】
前記少なくとも2つの標的糖ペプチド分析物の各々が、参照のための対応する内部標準を有する、請求項10~25のいずれか1項に記載の方法。
【請求項27】
前記第2のラン試料セットのうちの少なくとも1つのラン試料の前記内部標準が、代理物である、請求項10~26のいずれか1項に記載の方法。
【請求項28】
前記外部標準の供給源が、血清を含む、請求項10~27のいずれか1項に記載の方法。
【請求項29】
前記第1のラン試料セットの外部標準は、前記第2のラン試料セットにおけるラン試料が患者血漿試料を含むときに、少なくとも1つのプールされた血漿消化物を含む、請求項10~28のいずれか1項に記載の方法。
【請求項30】
前記患者血漿試料が、標的分析物を含む、請求項29に記載の方法。
【請求項31】
前記外部標準の濃度が、分析前に未知である、請求項10~30のいずれか1項に記載の方法。
【請求項32】
前記プールされた標準の濃度が、分析前に未知である、請求項10~31のいずれか1項に記載の方法。
【請求項33】
液体クロマトグラフィー/質量分析(LC-MS)試料ランのための試料を調製し、複数の試料ランの存在量データを正規化するためのプロセスを実行するための試料処理システムであって、前記試料処理システムが、
プロセスを実施するための、流体機器を含む試料調製システムであって、前記プロセスが、
第1のラン試料セットを生成することであって、前記第1のセットの各々が、外部標準を含む、前記生成することと、
第2のラン試料セットを生成することであって、前記第2のセットの各々が、少なくとも2つの標的糖ペプチド分析物、及び内部標準を含む、前記生成することと、
プールされた標準を作成するために、前記第1のセットのうちの少なくとも2つのラン試料を組み合わせることと、を含む、前記試料調製システムと、
糖ペプチド分析物を分析するための、LC-MS機器を含む試料分析システムであって、前記プロセスが、ラン順序に従って各ラン試料を分析することを含み、前記ラン順序が、LC-MS機器と電子的に通信するデータストア上に記憶され、前記試料ランの前記ラン試料に対する分析の相対順序を指定する、前記試料分析システムと、
共通の参照として各試料ランの前記プールされた標準を使用して、前記複数の試料ランの生の存在量データを正規化するための、ペプチド構造分析器の正規化モジュールを含むデータ分析システムと、を備える、前記システム。
【請求項34】
前記第1のラン試料セットのうちの第1のラン試料が、前記ラン順序において前記第2のラン試料セットのうちの第2のラン試料に隣接する位置を占める、請求項33に記載のシステム。
【請求項35】
前記第1のラン試料セットのうちのラン試料が、前記ラン順序において前記第2のラン試料セットのうちのラン試料の全ての前の位置を占める、請求項33に記載のシステム。
【請求項36】
前記第1のラン試料セットのうちのラン試料が、前記ラン順序において前記第2のラン試料セットのうちのラン試料の全ての後の位置を占める、請求項33に記載のシステム。
【請求項37】
前記ラン順序が、前記ラン順序において少なくとも5つの位置ごとに位置付けられた前記第1のラン試料セットのうちの単一のラン試料を含む、請求項33に記載のシステム。
【請求項38】
前記ラン順序が、前記ラン順序において少なくとも10個の位置ごとに位置付けられた前記第1のラン試料セットのうちの単一のラン試料を含む、請求項33に記載のシステム。
【請求項39】
前記ラン順序が、前記ラン順序において少なくとも15個の位置ごとに位置付けられた前記第1のラン試料セットのうちの単一のラン試料を含む、請求項33に記載のシステム。
【請求項40】
前記ラン順序が、前記第1のラン試料セットのうちの単一のラン試料に続いて、前記第2のセットのうちの2~29個の範囲のラン試料を含む、請求項33に記載のシステム。
【請求項41】
前記ラン順序が、前記第1のラン試料セットのうちの単一のラン試料に続いて、前記第2のラン試料セットのうちの4~14個の範囲のラン試料を含む、請求項33に記載のシステム。
【請求項42】
BSAを含む少なくとも1つのラン試料が、前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちの全ての前記ラン試料の前に位置付けられる、請求項33~41のいずれか1項に記載のシステム。
【請求項43】
BSAを含む少なくとも1つのラン試料が、前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちの全ての前記ラン試料の後に位置付けられる、請求項33~42のいずれか1項に記載のシステム。
【請求項44】
少なくとも1つのブランクラン試料が、前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちのラン試料の前に位置付けられる、請求項33~43のいずれか1項に記載のシステム。
【請求項45】
ブランクラン試料が、前記ラン順序において、前記第1のラン試料セットのうちのラン試料の1つ前の位置に位置付けられる、請求項33~44のいずれか1項に記載のシステム。
【請求項46】
前記試料調製システムを使用して実施される前記プロセスが、前記ラン試料の糖タンパク質構造を酵素消化して、前記第1のラン試料セットの各ラン試料の前記外部標準、ならびに前記第2のランセットの各ラン試料の前記内部標準及び前記少なくとも2つの標的糖ペプチド分析物を生成することをさらに含む、請求項33~45のいずれか1項に記載のシステム。
【請求項47】
前記データ分析システムが、前記内部標準を使用して、同じラン試料の前記少なくとも2つの標的糖ペプチド分析物の各々から生成された前記生の存在量データを正規化するように構成されている、請求項33~46のいずれか1項に記載のシステム。
【請求項48】
前記外部標準が、非グリコシル化内因性ペプチド(NGEP)を含む、請求項33~47のいずれか1項に記載のシステム。
【請求項49】
前記少なくとも2つの標的糖ペプチド分析物の各々が、参照のための対応する内部標準を有する、請求項33~48のいずれか1項に記載のシステム。
【請求項50】
前記第2のラン試料セットのうちの少なくとも1つのラン試料の前記内部標準が、代理物である、請求項33~49のいずれか1項に記載のシステム。
【請求項51】
前記外部標準の供給源が、血清を含む、請求項33~50のいずれか1項に記載のシステム。
【請求項52】
前記第1のラン試料セットの外部標準は、前記第2のラン試料セットにおけるラン試料が患者血漿試料を含むときに、少なくとも1つのプールされた血漿消化物を含む、請求項33~51のいずれか1項に記載のシステム。
【請求項53】
前記患者血漿試料が、標的分析物を含む、請求項52に記載のシステム。
【請求項54】
前記外部標準の濃度が、分析前に未知である、請求項33~53のいずれか1項に記載のシステム。
【請求項55】
前記プールされた標準の濃度が、分析前に未知である、請求項33~54のいずれか1項に記載のシステム。
【請求項56】
請求項10~32のいずれか1項に記載の、LC-MS試料ランのための試料を調製し、複数の試料ランの存在量データを正規化するための方法をさらに含む、請求項1~9のいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2021年9月30日出願の米国仮特許出願第63/251,028号の優先権を主張し、かつ2021年12月23日出願の米国仮特許出願第63/293,506号の優先権も主張し、これらの出願の両方は、それらの全体が本明細書に組み込まれる。
【0002】
本説明は、概して、質量分析を使用して生成された生の存在量データを正規化するためのシステム及び方法を対象とする。
【背景技術】
【0003】
タンパク質グリコシル化及び他の翻訳後修飾は、ヒトの生理学の事実上全ての側面において重要な役割を果たす。当然のことながら、不完全なまたは変質したタンパク質グリコシル化は、様々な表現型(例えば、疾患状態)を伴うことが多い。異常なグリコシル化の特定は、罹患している対象の早期検出、介入、及び処置の機会を提供する。
【0004】
タンパク質グリコシル化データが、対象のタンパク質グリコシル化プロファイルに基づいて対象の表現型を特定するための予測モデルを訓練するために使用され得る。予測モデルは、大量の高品質データを使用して、より良好な予測を行うが、複数の実験間または試料間の比較は、質量分析の分野を含む、様々な分野で困難になる可能性がある。限定されるものではないが、実験間の試料調製及び試料収集ステップならびに試料のいくつかの変動を含む、様々な因子が比較を困難にする可能性がある。より具体的には、トリプシン消化の効率、イオン化効率、検出器効率、及び他の寄与因子は、高度の変動性につながる可能性があり、それによって、試料と実験との間のデータを正規化するための既存のシステム及び方法は、コストが高価であるか、または存在しないかのいずれかになる。
【0005】
上記に照らして、高品質の比較データが予測モデルを構築するために使用され得るように、改善されたデータ相対化及び正規化システム及び方法の必要性が存在する。本開示は、試料間及び複数の実験間でグリコシル化データを比較するためのシステム及び方法を提供することによって、この必要性及び他の必要性に対処する。より具体的には、本開示は、予測モデルをより良好に訓練するために、タンパク質グリコシル化データを相対化及び正規化するためのシステム及び方法を含む。
【0006】
また、既存のシステムにおけるデータ正規化を伴う現在の課題に対処する新しい試料調製及び処理方法及びシステムに対するさらなる必要性が存在する。具体的には、業界は、試料及び試料間の存在量を正規化するための効果的な標準を必要としている。本明細書に説明されるシステム及び方法は、それらの必要性及びそれ以上の必要性に対処する。
【発明の概要】
【0007】
様々な態様では、試料中の標的糖ペプチド分析物の濃度を決定する方法が説明される。様々な実施形態では、方法が、試料の非グリコシル化内因性ペプチド(NGEP)の存在量を測定することを含み得る。いくつかの実施形態では、方法が、外部標準を使用してNGEPに対する補正されたNGEP存在量を決定することを含み得る。いくつかの実施形態では、方法が、既知の内部標準濃度を有する内部標準に対する内部標準存在量を測定することを含み得る。いくつかの実施形態では、方法が、補正されたNGEP存在量、既知の内部標準濃度、及び内部標準存在量の関数として、NGEPに対するNGEP濃度を決定することを含み得る。いくつかの実施形態では、方法が、試料の標的糖ペプチド分析物の正規化存在量を、標的糖ペプチド分析物の測定された存在量及び標的糖タンパク質分析物と同じタンパク質上のNGEPの測定された存在量の関数として、決定することを含み得る。いくつかの実施形態では、方法が、標的糖ペプチド分析物濃度をNGEP濃度及び正規化存在量の関数として決定することを含み得る。
【0008】
いくつかの態様では、コンピュータによって実行されたとき、コンピュータに、試料中の試料の標的糖ペプチド分析物の濃度を決定するための方法を実施させる、コンピュータ命令を記憶する非一時的コンピュータ可読媒体が説明されている。様々な実施形態では、方法が、試料中の非グリコシル化内因性ペプチド(NGEP)の存在量を測定することを含み得る。様々な実施形態では、方法が、外部標準を使用してNGEPに対する補正されたNGEP存在量を決定することを含み得る。様々な実施形態では、方法が、既知の内部標準濃度を有する内部標準に対する内部標準存在量を測定することを含み得る。様々な実施形態では、方法が、補正されたNGEP存在量、既知の内部標準濃度、及び内部標準存在量の関数として、NGEP濃度を決定することを含み得る。様々な実施形態では、方法が、試料の標的糖ペプチド分析物の正規化存在量を、標的糖ペプチド分析物の測定された存在量及び標的糖タンパク質分析物と同じタンパク質上の非グリコシル化内因性ペプチド(NGEP)の測定された存在量の関数として、決定することを含み得る。様々な実施形態では、方法が、標的糖ペプチド分析物濃度をNGEP濃度及び正規化存在量の関数として決定することを含み得る。
【0009】
様々な態様では、試料中の標的糖ペプチド分析物の濃度を決定する方法が説明される。様々な実施形態では、方法が、試料のNGEPの存在量を測定することを含み得る。様々な実施形態では、方法が、外部標準を使用してNGEPに対する補正されたNGEP存在量を決定することを含み得る。様々な実施形態では、方法が、既知の内部標準濃度を有する内部標準に対する内部標準存在量を測定することを含み得る。様々な実施形態では、方法が、補正されたNGEP存在量、既知の内部標準濃度、及び内部標準存在量の関数として、NGEP濃度を決定することを含み得る。様々な実施形態では、方法は、所与の部位における標的糖ペプチド分析物の測定された標的存在量、及び同じ部位で定量化された全ての糖ペプチドの測定された総存在量の関数として、試料の標的糖ペプチド分析物の部位占有率を決定することを含み得る。様々な実施形態では、方法が、標的糖ペプチド分析物濃度をNGEP濃度及び正規化存在量の関数として決定することを含み得る。
【0010】
様々な態様では、コンピュータによって実行されたとき、コンピュータに、試料の標的糖ペプチド分析物の濃度を決定するための方法を実施させる、コンピュータ命令を記憶する非一時的コンピュータ可読媒体が説明されている。様々な実施形態では、方法が、試料の非グリコシル化内因性ペプチド(NGEP)の存在量を測定することを含み得る。様々な実施形態では、方法が、外部標準を使用してNGEPに対する補正されたNGEP存在量を決定することを含み得る。様々な実施形態では、方法が、既知の内部標準濃度を有する内部標準に対する内部標準存在量を測定することを含み得る。様々な実施形態では、方法が、補正されたNGEP存在量、既知の内部標準濃度、及び内部標準存在量の関数として、NGEP濃度を決定することを含み得る。様々な実施形態では、方法は、所与の部位における標的糖ペプチド分析物の測定された標的存在量、及び同じ部位における全ての糖ペプチドの測定された総存在量の関数として、試料の標的糖ペプチド分析物の部位占有率を決定することを含み得る。様々な実施形態では、方法が、標的糖ペプチド分析物濃度をNGEP濃度及び正規化存在量の関数として決定することを含み得る。
【0011】
いくつかの態様では、様々な実施形態による、液体クロマトグラフィー/質量分析(LC-MS)試料ランのための試料を調製し、複数の試料ランの存在量データを正規化するための方法が説明される。いくつかの実施形態では、方法が、LC-MS分析のための複数の試料ランのためのラン試料を調製することを含む。様々な実施形態では、調製するステップが、第1のラン試料セットを生成することを含む。様々な実施形態では、第1のラン試料セットの各々が、外部標準を含む。様々な実施形態では、調製するステップが、第2のラン試料セットを生成することを含む。様々な実施形態では、第2のラン試料セットの各々が、少なくとも2つの標的糖ペプチド分析物及び内部標準を含む。様々な実施形態では、方法が、プールされた標準を作成するために、第1のラン試料セットのうちの少なくとも2つのラン試料を組み合わせることを含む。様々な実施形態では、方法が、ラン順序に従って各ラン試料を分析することを含む。様々な実施形態では、ラン順序が、試料ランのラン試料に対する分析の相対順序を指定する。様々な実施形態では、方法が、参照として各試料ランのプールされた標準を使用して、複数の試料ランの生の存在量データを正規化することを含む。
【0012】
いくつかの態様では、様々な実施形態による、液体クロマトグラフィー/質量分析(LC-MS)試料ランのための試料を調製し、複数の試料ランの存在量データを正規化するためのプロセスを実行するための試料処理システムが説明される。様々な実施形態では、試料処理システムが、試料調製システムを含む。様々な実施形態では、試料調製システムが、プロセスを実施するための流体機器を含む。様々な実施形態では、プロセスが、第1のラン試料セットを生成することを含み得る。様々な実施形態では、第1のセットの各々が、外部標準を含む。様々な実施形態では、プロセスが、第2のラン試料セットを生成することを含み得る。様々な実施形態では、第2のセットの各々が、少なくとも2つの標的糖ペプチド分析物及び内部標準を含む。様々な実施形態では、プロセスが、プールされた標準を作成するために、第1のセットのうちの少なくとも2つのラン試料を組み合わせることを含み得る。様々な実施形態では、試料処理システムが、試料分析システムを含み得る。様々な実施形態では、試料分析システムが、糖ペプチド分析物を分析するためのLC-MS機器を含み得る。様々な実施形態では、試料分析システムが、ラン順序に従って各ラン試料を分析し得る。様々な実施形態では、ラン順序が、LC-MS機器と電子的に通信するデータストアに記憶され得、試料ランのラン試料に対する分析の相対順序を指定する。様々な実施形態では、試料処理システムが、共通の参照として各試料ランのプールされた標準を使用して、複数の試料ランの生の存在量データを正規化するための、ペプチド構造分析器の正規化モジュールを含むデータ分析システムを備える。
【0013】
本開示は、添付の図面と併せて説明される。
【図面の簡単な説明】
【0014】
【
図1】1つ以上の実施形態による、診断及び/または治療に使用するために疾患状態と関連付けられるペプチド構造を検出するための例示的なワークフロー100の概略図である。
【
図2A】1つ以上の実施形態による調製ワークフローの概略図である。
【
図2B】1つ以上の実施形態によるデータ取得の概略図である。
【
図3】1つ以上の実施形態による分析システムのブロック図である。
【
図4】様々な実施形態によるコンピュータシステムのブロック図である。
【
図5】様々な実施形態による、試料中の標的糖ペプチド分析物の濃度を決定するためのプロセスのフローチャートである。
【
図6】様々な実施形態による、試料中の標的糖ペプチド分析物の濃度を決定するためのプロセスのフローチャートである。
【
図7A】内部標準及び相対論的アプローチと組み合わせられた、組み合わせられた外部標準を用いない正規化の結果を示す実験データを例示する。各マーカーについて、上部水平線は、SS-JAR1.P2.R3であり、中央水平線は、SS-JAR1.P1.R1であり、下部水平線は、HVI-CRC.P4.R6である。
【
図7B】
図7Aの組み合わせられたアプローチに外部標準を介した存在量補正の追加のステップを追加することによって結果的に生じる正規化を示す実験データを例示する。各マーカーについて、上部水平線は、SS-JAR1.P2.R3であり、中央水平線は、SS-JAR1.P1.R1であり、下部水平線は、HVI-CRC.Ab.Testである。
【
図8A】様々な実施形態による、以下及び本明細書に説明される正規化方法を適用する前の3つの実験の仮定的な存在量値を例示する。
【
図8B】様々な実施形態による、以下及び本明細書に説明される正規化方法を適用した後の3つの実験の仮定的な存在量値を例示する。
【
図9】様々な実施形態によって説明される、試料中の標的糖ペプチド分析物の濃度を決定するためのプロセスのフローチャートである。
【
図10A】外部標準を使用してデータを正規化するプロセスが、内部標準及び部位占有存在量を使用してデータを正規化するプロセスの前に行われ、濃度決定プロセスが最後に行われた実験データを例示する。
【
図10B】外部標準を使用してデータを正規化するプロセスが行われていない
図10Aからの同じ実験データを例示する。
【
図11A】外部標準を使用してデータを正規化するプロセスが、内部標準及び相対存在量を使用してデータを正規化するプロセスの前に行われ、濃度決定プロセスが最後に行われた実験データを例示する。
【
図11B】外部標準を使用してデータを正規化するプロセスが行われていない
図11Aからの同じ実験データを例示する。
【
図12A】訓練された卵巣癌モデルを、独立した試験セットに適用することを結果的にもたらす混同行列を例示し、本明細書に説明され、かつ様々な実施形態による、システム及び方法を使用した予測精度の向上を実証する。
【
図12B】訓練された卵巣癌モデルを、独立した試験セットに適用することを結果的にもたらす混同行列を例示し、本明細書に説明され、かつ様々な実施形態による、システム及び方法を使用した予測精度の向上を実証する。
【
図13】LC-MS試料ランのための試料を調製し、複数の試料ランの存在量データを正規化するための例示的な方法のフローチャートを例示する。
【
図14】患者試料を正規化存在量に処理するための例示的な試料処理システムを例示する。
【
図15】プールされた複製物に対する変動係数を含むデータの実験結果を例示する。
【
図16】ラン試料セットの実験ラン順序を例示する。
【
図17】ラン試料パーティション場所を含む、96ウェルプレートのレイアウトを例示する。
【発明を実施するための形態】
【0015】
I.概要
本明細書に説明される実施形態は、グリコプロテオミクスが、様々な種類の疾患を有する対象の全体的な診断及び/または治療に使用することができる新興分野であることを認識する。グリコプロテオミクスは、所与の試料(例えば、血液試料、細胞、組織など)の中のグリカン及びグリコシル化タンパク質の位置、素性、及び量を決定することを目的とする。タンパク質グリコシル化は、翻訳後タンパク質修飾の最も一般的かつ最も複雑な形態のうちの1つであり、タンパク質の構造、配座、及び機能に影響を与え得る。例えば、糖タンパク質は、細胞シグナル伝達、宿主と病原体との相互作用、ならびに免疫応答及び疾患などの重要な生物学的過程において重要な役割を果たし得る。したがって、糖タンパク質は、異なる種類の疾患または疾患状態を診断するために重要であり得る。
【0016】
この新たな技術を最大限に使用する際に、予測モデルに大量の高品質の存在量データを提供することは、モデルの予測精度を改善し得る。しかしながら、生の糖ペプチド存在量データは、異なる実験またはさらには同じ実験内の試料にわたって比較することが困難であり得る。当業者は、改善された相対化及び正規化データシステム及び方法が、そのような変動を管理するやり方であり得ることを理解することができる。追加的に、データ分析を受けるために最適なデータを生成するためには、試料調製及び処理システム及び方法が必要である。
【0017】
したがって、本明細書に説明される実施形態は、様々な正規化システム及び方法を含む、様々な方法及びシステムの試料の調製及び処理を提供する。
【0018】
以下の説明は、データ処理のための本明細書に説明される方法及びシステムの例示的な実施態様を提供する。本明細書で使用される場合の様々な用語の説明及び例は、以下のセクションIIで提供される。
【0019】
II.用語の例示的な説明
本明細書で使用される場合、「存在量」は、質量分析を使用して生成された定量値を指してもよい。種々の実施形態では、定量的値は、特定のペプチド構造の量に関し得る。いくつかの実施形態では、定量値は、質量分析を使用して生成されたイオンの量を含んでもよい。いくつかの実施形態では、定量的値は、m/z値として表されてもよい。他の実施形態では、定量値は、原子質量単位で表されてもよい。
【0020】
「アルキル化」という用語は、本明細書で使用される場合、概して、ある分子から別の分子へのアルキル基の移動を指す。様々な実施形態では、アルキル化は、還元されたシステインと反応して、還元が行われた後のジスルフィド結合の再形成を防止するために使用される。
【0021】
「アミノ酸」という用語は、本明細書で使用される場合、概して、特定のアミノ酸に基づいて変動するアミノ基(例えば、-NH2)、カルボキシル基(-COOH)、及び側鎖基(R)を含む任意の有機化合物を指す。アミノ酸は、ペプチド結合を使用して連結され得る。
【0022】
本明細書で使用される場合、「人工ニューラルネットワーク」または「ニューラルネットワーク」(NN)は、計算に対するコネクショニズム的アプローチに基づいて情報を処理する人工ノードまたはニューロンの相互接続された群を模倣する数学的アルゴリズムまたは計算モデルを指してもよい。ニューラルネットワークは、ニューラルネットとも称され、非線形ユニットの1つ以上の層を用いて、受信した入力の出力を予測することができる。いくつかのニューラルネットワークは、出力層に加えて、1つ以上の隠れ層を含む。各隠れ層の出力は、ネットワークの次の層、すなわち、次の隠れ層または出力層への入力として使用される。ネットワークの各層は、パラメータのそれぞれのセットの現在の値に従って、受信された入力から出力を生成する。様々な実施形態では、「ニューラルネットワーク」への言及は、1つ以上のニューラルネットワークへの言及であってもよい。
【0023】
ニューラルネットワークは、情報を二様に処理することができる。つまり、それが訓練されているときには、訓練モードになり、それが学んだことを実践するときには、推論(または予測)モードになる。ニューラルネットワークは、出力が訓練データの出力と一致するように、ネットワークが中間の隠れ層内の個々のノードの重み係数を調整する(その挙動を修正する)ことを可能にするフィードバックプロセス(例えば、逆伝播)を通して学習する。言い換えれば、ニューラルネットワークは、訓練データ(学習例)を与えられることにより学習し、最終的に、新しい範囲または入力セットが提示された場合でも正しい出力に到達する方法を学ぶ。ニューラルネットワークは、例えば、非限定的に、フィードフォワードニューラルネットワーク(FNN)、リカレントニューラルネットワーク(RNN)、モジュラーニューラルネットワーク(MNN)、畳み込みニューラルネットワーク(CNN)、残差ニューラルネットワーク(ResNet)、常微分方程式ニューラルネットワーク(neural-ODE)、または別の種類のニューラルネットワークのうちの少なくとも1つを含んでもよい。
【0024】
本明細書で使用される場合、「のうちの少なくとも1つ」という語句は、アイテムのリストとともに使用されるとき、リストされたアイテムのうちの1つ以上の異なる組み合わせが使用されてもよく、リスト内のアイテムのうちの1つしか必要とされない場合があることを意味する。アイテムは、特定の物体、物、ステップ、操作、プロセス、またはカテゴリであってもよい。言い換えれば、「のうちの少なくとも1つ」は、アイテムの任意の組み合わせまたはアイテムの数がリストから使用されてもよいが、リスト内のアイテムの全てが必要とされ得るわけではないことを意味する。例えば、限定されないが、「アイテムA、アイテムB、またはアイテムCのうちの少なくとも1つ」は、アイテムA;アイテムA及びアイテムB;アイテムB;アイテムA、アイテムB、及びアイテムC;アイテムB及びアイテムC;またはアイテムA及びCを意味する。ある場合には、「アイテムA、アイテムB、またはアイテムCのうちの少なくとも1つ」は、アイテムAのうちの2つ、アイテムBのうちの1つ、及びアイテムCのうちの10個;アイテムBのうちの4つ及びアイテムCのうちの7つ;またはいくつかの他の好適な組み合わせを意味するが、これらに限定されない。
【0025】
「バイオマーカー」という用語は、本明細書で使用される場合、概して、対象から試料として採取される任意の測定可能な物質であって、それが存在することにより何らかの現象が示される、物質を指す。そのような現象の非限定的な例としては、疾患状態、病状、または化合物もしくは環境条件への曝露を挙げることができる。本明細書に説明される様々な実施形態では、バイオマーカーは、診断目的で使用され得る。バイオマーカーは、非限定的な例では、健常状態または疾患状態などの対象の状態を診断するために使用され得る。
【0026】
「変性」という用語は、本明細書で使用される場合、概して、天然状態においては存在する四次構造、三次構造、及び二次構造を喪失する任意の分子を指す。非限定的な例としては、酸、塩基、温度、圧力、放射線などの外部化合物または環境条件に曝露されているタンパク質または核酸が挙げられる。
【0027】
「変性タンパク質」という用語は、本明細書で使用される場合、概して、天然状態においては存在する四次構造、三次構造、及び二次構造を喪失するタンパク質を指す。
【0028】
「消化」または「酵素消化」という用語は、本明細書で使用される場合、概して、ポリマーを分解する(例えば、切断部位でポリペプチドを切断する)ことを指す。タンパク質は、トリプシン消化プロトコルを使用する質量分析に備えて消化されてもよい。アクセスが切断部位に限定されている場合、タンパク質は、質量分析に備えて他のプロテアーゼを使用して消化されてもよい。
【0029】
「疾患状態」という用語は、本明細書で使用される場合、概して、生物の構造または機能に影響を及ぼす状態を指す。疾患状態の原因の非限定的な例としては、病原体、免疫系の機能不全、老化によって引き起こされる細胞損傷、他の要因(例えば、外傷及びがん)によって引き起こされる細胞損傷を挙げることができる。疾患状態は、症候性であるか無症候性であるかにかかわらず、疾患の任意の状態を含み得る。病態は、疾患進行の病期を含み得る。疾患状態は、生物(例えば、対象)の構造または機能に軽度、中等度、または重度の乱れを引き起こし得る。
【0030】
本明細書で使用される場合、「外部標準」は、1つの試料ランから別の試料ランにデータを正規化するために使用される標準を指し得る。様々な実施形態では、外部標準は、NGEPを含み得る。ラン試料は、外部標準を含み得る。外部標準は、標的糖ペプチド分析物と同じまたは同様の構造を含み得る。外部標準供給源は、複数の外部標準を含み得る。外部標準は、患者試料とは独立して実行され得る。外部標準供給源は、試料処理及びデータ収集のためにラン試料に追加され得る。例えば、処理ステップは、1つ以上の外部標準または外部標準分析物を生成するために、酵素消化を使用した1つ以上の糖タンパク質の酵素消化を含み得る。試料ランは、外部標準を含む複数のラン試料を含み得る。外部標準から収集された存在量データは、ラン試料の標的糖ペプチド分析物に由来する生の存在量を正規化するために使用され得る。外部標準を含む複数のラン試料の一部分が、プールされて、プールされた標準を生成し得る。血清は、外部標準の供給源であり得、商業的サプライヤ(例えば、Sigma-Aldrich(商標))を通じて入手可能であり得る。プールされた標準は、試料ラン間のラン試料を比較するために使用され得る。
【0031】
本明細書で使用される場合、「グリカン」という用語は、概して、別の生物学的分子に共有結合されている炭水化物などの複合糖質を指す。炭水化物は、単糖、二糖、オリゴ糖、または多糖を含み得る。生体分子は、タンパク質またはポリペプチドのアミノ酸の残基を含み得る。グリカンは、糖ペプチドのアミノ酸残基の側鎖(すなわち、R基)に共有結合され得る。
【0032】
「糖ペプチド」または「糖ポリペプチド」という用語は、本明細書で使用される場合、概して、ペプチドまたはポリペプチドの1つ以上の残基に位置する少なくとも1つのグリカン残基を含むペプチドまたはポリペプチドを指す。
【0033】
「糖タンパク質」という用語は、本明細書で使用される場合、概して、少なくとも1つのグリカン残基が結合しているタンパク質を指す。いくつかの例では、糖タンパク質は、少なくとも1つのオリゴ糖鎖が共有結合しているタンパク質である。糖タンパク質の例としては、アポリポタンパク質C-III(APOC3)、アルファ-1-抗キモトリプシン(AACT)、アファミン(AFAM)、アルファ-1-酸性糖タンパク質1及び2(AGP12)、アポリポタンパク質B-100(APOB)、アポリポタンパク質D(APOD)、補体C1s副成分(C1S)、カルパイン-3(CAN3)、クラスタリン(CLUS)、補体成分C8A鎖(CO8A)、アルファ-2-HS糖タンパク質(FETUA)、ハプトグロビン(HPT)、免疫グロブリン重定常ガンマ1(IgG1)、免疫グロブリンJ鎖(IgJ)、血漿カリクレイン(KLKB1)、血清パラオキソナーゼ/アリールエステラーゼ1(PON1)、プロトロンビン(THRB)、セロトランスフェリン(TRFE)、タンパク質unc-13ホモログA(UN13A)、及び亜鉛-アルファ-2-糖タンパク質(ZA2G)が挙げられるが、これらに限定されない。糖ペプチドは、本明細書で使用される場合、別途逆の指定がない限り、糖タンパク質の断片を指す。
【0034】
本明細書で使用される場合、「内部標準」は、質量分析を受ける標的糖ペプチド分析物と同じ試料中に含有(例えば、追加またはスパイクイン)され得るものを指し得る。内部標準は、全ての患者試料にスパイクインされ得る。内部標準はまた、外部標準を含むラン試料にスパイクインされ得る。多くの内部標準は、ペプチドまたは糖ペプチドを含み得る。いくつかのペプチドは、グリコシル化部位を含み得る。様々な用途のために、内部標準として使用されるペプチドは、1つ以上のグリコシル化部位で非グリコシル化され得る。内部標準は、較正目的で使用され得る。内部標準は、正規化及び定量化のために使用され得る。本明細書のシステム及び方法は、非グリコシル化ペプチド及び/または非グリコシル化内因性ペプチドを使用し得る。正規化及び定量化される必要があり得るデータを収集するとき、各標的グリコシル化部位は、比較のための内部標準を有し得る。多くの場合、分析される糖タンパク質は、比較のために対応するアグリコシル化バージョンを含み得る。標的糖ペプチド分析物と同じ構造を有する内部標準の代わりに、代理物内部標準が、標的糖ペプチド分析物に使用され得、内部標準は、標的糖ペプチド分析物と同様のm/z比及び/または保持時間を含む。様々な実施形態では、内部標準は、質量分析調査を受ける糖ペプチド分析物を含む全てのラン試料にスパイクインされる。
【0035】
「連結部位」または「グリコシル化部位」という用語は、本明細書で使用される場合、概して、グリカンまたはグリカン構造の糖分子が、ペプチド、ポリペプチド、またはタンパク質のアミノ酸に直接結合(例えば、共有結合)する場所を指す。例えば、連結部位はアミノ酸残基であってもよく、グリカン構造はアミノ酸残基の原子を介して連結していてもよい。グリコシル化の種類の非限定的な例としては、N結合型グリコシル化、O結合型グリコシル化、C結合型グリコシル化、S結合型グリコシル化、及び糖化を挙げることができる。
【0036】
「液体クロマトグラフィー」という用語は、本明細書で使用される場合、概して、試料を細分化するために使用される技法を指す。液体クロマトグラフィーを使用して、成分を分離、特定、及び定量化することができる。
【0037】
本明細書で使用される場合、「機械学習」は、アルゴリズムを使用してデータを解析し、そこから学習し、次いで世界の物事について決定または予測を行う行為であってもよい。機械学習は、ルールベースのプログラミングに依存せずにデータから学習できるアルゴリズムを使用する。機械学習アルゴリズムには、パラメトリックモデル、非パラメトリックモデル、ディープラーニングモデル、ニューラルネットワーク、線形判別分析モデル、二次判別分析モデル、サポートベクターマシン、ランダムフォレストアルゴリズム、最近傍アルゴリズム、複合判別分析モデル、k平均クラスタ化アルゴリズム、教師ありモデル、教師なしモデル、ロジスティック回帰モデル、多変数回帰モデル、罰則付き多変数回帰モデル、または別の種類のモデルが含まれてもよい。
【0038】
「質量分析」という用語は、本明細書で使用される場合、概して、分子を特定するために使用される分析技法を指す。本明細書に説明される様々な実施形態では、質量分析は、タンパク質の特性評価及び配列決定に関与し得る。
【0039】
本明細書で使用される場合、「モデル」は、1つ以上のアルゴリズム、1つ以上の数学的技法、1つ以上の機械学習アルゴリズム、またはそれらの組み合わせを含んでもよい。
【0040】
「m/z」または「質量電荷比」という用語は、本明細書で使用される場合、概して、質量分析機器からの出力値を指す。様々な実施形態では、m/zは、所与のイオンの質量とそれが担持する素電荷の数との間の関係を表し得る。m/zの「m」は質量を表し、「z」はイオンの電荷数を表す。いくつかの実施形態では、m/zは、質量スペクトルのx軸上に表示され得る。
【0041】
本明細書で使用される場合、「非グリコシル化内因性ペプチド」(「NGEP」)は、1つ以上のアミノ酸の場所にグリコシル化部位を含むペプチド構造を指し得る。様々な実施形態では、1つ以上のグリコシル化部位は、所与のNGEPに対して非グリコシル化され得る(例えば、グリカン分子を含まない)。NGEP及び標的糖ペプチド分析物は、同じ対象から生じ得る。NGEP及び標的糖ペプチド分析物は、同じタンパク質から生じ得る。NGEP及び標的糖ペプチド分析物は、異なるタンパク質から生じ得る。NGEPを含むペプチド構造は、質量分析に備えて同位体で標識され得る。NGEPは、本明細書に説明されるシステム及び方法の内部標準として使用され得る。
【0042】
「1つ(ones)」という用語は、1つ超であることを意味する。
【0043】
「ペプチド」または「ポリペプチド」という用語は、本明細書で使用される場合、概して、ペプチド結合によって連結されるアミノ酸を指す。ペプチドは、10~50残基のアミノ酸鎖を含み得る。ペプチドは、オリゴペプチド、ジペプチド、トリペプチド、及びテトラペプチドを含む、10残基より短いアミノ酸鎖を含み得る。ペプチドは、50残基より長い鎖を含むことができ、「タンパク質」と称されてもよい。タンパク質は、トリプシン消化プロトコルを使用する質量分析に備えて消化されてもよい。プロトコルは、質量分析に備えてプロテアーゼを使用してタンパク質を消化することを含む。プロテアーゼは、切断部位へのアクセスが制限される場合に使用され得る。
【0044】
「ペプチド構造」という用語は、本明細書で使用される場合、概して、ペプチドもしくはその一部分、または糖ペプチドもしくはその一部分を指す。本明細書に説明される様々な実施形態では、ペプチド構造は、少なくとも2つのアミノ酸を配列に含む任意の分子を含み得る。
【0045】
本明細書で使用される場合、「複数」という用語は、2、3、4、5、6、7、8、9、10、またはそれより多くてもよい。
【0046】
本明細書で使用される「ペプチド構造データ」は、結果として生じる質量分析ランからのペプチドの任意のデータまたはペプチドに関連する任意のデータを指し得る。ペプチドデータセットは、試料及び/または1つ以上の標準を含むラン試料から取得されたデータを含み得る。ペプチド構造データは、外部標準、内部標準、及び/または標的糖ペプチド分析物の生の存在量及び/または存在量データを含み得る。いくつかの場合、標的糖ペプチド分析物は、患者試料から生じ得る。
【0047】
本明細書で使用される場合、「プールされた標準」は、複数のラン試料からの複数の外部標準消化物の一部分を組み合わせることによって作成された標準を指し得る。異なる試料ランから生じるプールされた標準からの存在量データが、試料ラン間の存在量データを正規化するために使用され得、それによって、異なる時点で及び/または異なる実験から収集された糖ペプチド分析物存在量データの比較を可能にする。
【0048】
多くの試料ランでは、1つ以上の個々の消化複製物が、複数のラン試料に追加され得、生成された存在量データは、試料ランにわたって糖ペプチド分析物データを正規化するために使用され得る。個々の消化複製物から生じるラン試料データは、プールされた血清消化物(例えば、組み合わせられた複数の個々の消化複製物)を含む1つ以上のランに使用され得る。多くの試料ランは、ラン順序の終了時に分析される1つ以上のプールされた血清消化物を含み得る。プールされた消化物からの存在量は、試料ランの生の存在量データを正規化するために、1つ以上の個々の消化複製物の存在量と比較され得る。
【0049】
「還元」という用語は、本明細書で使用される場合、概して、物質による電子の獲得を指す。本明細書に説明される様々な実施形態では、糖は、タンパク質に直接結合することができ、それによって、それが結合するアミノ酸を還元する。そのような還元反応は、グリコシル化において生じ得る。様々な実施形態では、還元は、2つのシステイン間のジスルフィド結合を破壊するために使用され得る。
【0050】
本明細書で使用される場合、「相対存在量」は、複数の存在量間の関係を指し得る。いくつかの場合、相対存在量は、あるペプチド構造と別のペプチド構造との割合の比較を含み得る。いくつかの場合、相対存在量は、実際の値を有することなく、ペプチド構造とペプチド構造の総数との割合を比較することを含み得る。いくつかの実施形態では、比較は、1つのペプチド糖型(例えば、1つ以上のグリカンが異なる2つの同一のペプチド)をペプチド糖型のセットと比較することを含み得る。いくつかの実施形態では、比較は、特定のm/z比を有するイオンの数を、検出されたイオンの総数により比較することを含んでもよい。様々な実施形態では、相対存在量は、比として表され得る。他の実施形態では、相対存在量は、パーセンテージとして表され得る。相対存在量は、質量スペクトルプロットのy軸上に提示され得る。
【0051】
「配列」という用語は、本明細書で使用される場合、概して、組み立てられてポリマーを生成することができる一次元モノマーを含む生物学的配列を指す。配列の非限定的な例としては、ヌクレオチド配列(例えば、ssDNA、dsDNA、及びRNA)、アミノ酸配列(例えば、タンパク質、ペプチド、及びポリペプチド)、ならびに炭水化物(例えば、Cm(H2O)nを含む化合物)が挙げられる。
【0052】
「試料」、「生体試料」、「生体標本」、または「生物検体」という用語は、本明細書で試料される場合、概して、典型的には対象から、標本の供給源を代表するようにサンプリングによって採取される標本を指す。試料は、生物全体、特定の組織、細胞型、または目的のカテゴリもしくはサブカテゴリを代表するものであり得る。試料は、血液を含み得る。試料の血液は、全血を含み得る。試料の血液は、血漿を含み得る。試料は、高分子を含み得る。試料は、小分子を含み得る。試料は、ウイルスを含み得る。試料は、細胞または細胞の誘導体を含み得る。試料は、細胞小器官を含み得る。試料は、細胞核を含み得る。試料は、細胞の集団からの希少な細胞を含み得る。試料は、単細胞生物に由来するか多細胞生物に由来するかにかかわらず、原核細胞、真核細胞、細菌、真菌、植物、哺乳動物、または他の動物細胞型、マイコプラズマ、健常組織細胞、腫瘍細胞、もしくは任意の他の細胞型を含むがこれらに限定されない、任意型の細胞を含み得る。試料は、細胞の構成成分を含み得る。試料は、ヌクレオチド(例えば、ssDNA、dsDNA、RNA)、細胞小器官、アミノ酸、ペプチド、タンパク質、炭水化物、糖タンパク質、またはそれらの任意の組み合わせを含み得る。試料は、細胞、または細胞(例えば、細胞ビーズ)からの1つ以上の構成成分、例えば、細胞からのDNA、RNA、細胞小器官、タンパク質、もしくはそれらの任意の組み合わせを含む、マトリックス(例えば、ゲルまたはポリマーマトリックス)を含み得る。試料は、対象の組織から得られてもよい。試料は、細胞を含み得る。そのような細胞は、細胞壁または細胞膜を含む場合も含まない場合もある。試料は、細胞の1つ以上の構成成分を含み得るが、細胞の他の構成成分を含まない場合がある。そのような構成成分の例としては、核または細胞小器官を挙げることができる。生体試料は、生細胞を含み得る。生細胞は、培養可能であり得る。
【0053】
試料は、別の試料に由来してもよい。試料は、生検、コア生検、針吸引物、または微細針吸引物などの組織試料を含み得る。試料は、流体試料、例えば、血液試料、尿試料、または唾液試料を含み得る。試料は、皮膚試料を含み得る。試料は、口腔スワブを含み得る。試料は、無細胞(cell-free)または無細胞(cell free)試料を含み得る。無細胞試料は、細胞外ポリヌクレオチドを含み得る。試料は、血液、血漿、血清、尿、唾液、粘膜排出物、痰、便、または涙液から生じてもよい。試料は、赤血球または白血球から生じてもよい。試料は、糞便、脊髄液、CNS液、胃液、羊水、嚢胞液、腹水、骨髄、胆汁、他の体液、生検から得られた組織、皮膚、または毛髪から生じてもよい。
【0054】
本明細書で使用される場合、「試料ラン」は、質量分析を受けるようにスケジュールされた1つ以上のラン試料のグループ化またはセットを指す。例えば、試料ランの開始時に、較正または機器保守のための材料(例えば、ウシ血清アルブミン(BSA)、標準、またはブランク)を含むラン試料が、分析のために質量分析機器によって処理及び/または分析され得る。ラン試料は、内部標準と組み合わせられた患者試料を含み得る。ラン試料は、外部標準を含み得る。ラン試料は、プレートのバイアルまたはパーティション(例えば、96ウェルプレートのパーティション)に保存され得る。いくつかの場合、ピペットロボットを含む自動化されたシステムは、ラン順序に従って試料ランのラン試料を処理するようにプログラムされ得る。
【0055】
本明細書で使用される場合、「のセット」という用語は、1つ以上であることを意味する。例えば、アイテムのセットは、1つ以上のアイテムを含む。
【0056】
「対象」という用語は、本明細書で使用される場合、概して、哺乳動物(例えば、ヒト)もしくは鳥類(例えば、トリ)などの動物、または植物などの他の生物を指す。例えば、対象は、脊椎動物、哺乳動物、齧歯類(例えば、マウス)、霊長類、サル、またはヒトを含み得る。動物としては、家畜、スポーツ用動物、及びペットを挙げることができるが、これらに限定されない。対象は、健常なもしくは無症候性の個体、疾患(例えば、がん)もしくは疾患の素因を有することが疑われたもしくは疑われる個体、及び/または療法を必要とするまたは療法を必要とすることが疑われる個体が含まれ得る。対象は、患者であり得る。対象には、微生物または菌類(例えば、細菌、真菌、古細菌、ウイルス)が含まれ得る。対象由来の試料またはその成分は、質量分析を受け、それによって、試料の1つ以上の糖ペプチドについてのペプチド構造データを生成し得る。
【0057】
本明細書で使用される場合、「標的糖ペプチド分析物」は、ペプチド構造(例えば、グリコシル化もしくはアグリコシル化/非グリコシル化)またはペプチド構造の画分を指し得る。標的分析物は、ペプチド構造のペプチド配列の1つ以上の残基と関連付けられたサブ構造(例えば、グリコシル化部位と関連付けられたグリカン)を含み得る。標的糖ペプチド分析物は、上記の構造及び/またはサブ構造のうちの1つ以上の生成物を含み得る。標的糖ペプチド分析物は、1つ以上の検出分子(例えば、シグナル分子、標識、またはタグ)を含むか、またはそれらと会合され得る。標的糖ペプチド分析物は、本明細書に説明される試料調製方法及びシステムを使用して調製され得る。標的糖ペプチド分析物は、本明細書に説明される方法及びシステムを使用して後で正規化され得る糖ペプチド分析物の生の存在量データを生成する質量分析システムで分析され得る。
【0058】
本明細書で使用される「訓練データ」という用語は、一般に、既存のデータを使用して予測を行うことができるモデル、統計モデル、アルゴリズム、及び任意のシステムまたはプロセスに入力され得るデータを指す。訓練データは、本明細書で説明されているシステム及び方法を使用して正規化され得る。
【0059】
本明細書で使用される場合、「遷移」は、ペプチド構造を指すものであっても、ペプチド構造を特定するものであってもよい。いくつかの実施形態では、遷移は、前駆体イオン及び産物または断片イオンと関連付けられるm/z値の特定の対を指し得る。
【0060】
III.例示的なワークフローの概要
図1は、1つ以上の実施形態による、診断及び/または治療に使用するために疾患状態と関連付けられるペプチド構造を検出するための例示的なワークフロー100の概略図である。ワークフロー100は、例えば、試料収集102、試料取り入れ104、試料調製及び処理106、データ分析108、及び出力生成110を含む、種々の動作を含んでもよい。
【0061】
試料収集102は、例えば、対象114などの1つ以上の対象の生体試料112を取得することを含んでもよい。生体試料112は、1つ以上のサンプリング方法を介して取得された標本の形態をとってもよい。生体試料112は、対象114全体、あるいは特定の組織、細胞型、または目的の他のカテゴリもしくはサブカテゴリを代表するものであってもよい。生体試料112は、ある数の異なる方法のうちのいずれかで取得することができる。様々な実施形態では、生体試料112は、採血を介して取得された全血試料116を含む。他の実施形態では、生体試料112は、例えば、血清試料、血漿試料、血液細胞(例えば、白血球(WBC)、赤血球(RBC)試料、別の種類の試料、またはそれらの組み合わせを含む、等分試料118のセットを含む。生体試料112は、ヌクレオチド(例えば、ssDNA、dsDNA、RNA)、細胞小器官、アミノ酸、ペプチド、タンパク質、炭水化物、糖タンパク質、またはそれらの任意の組み合わせを含んでもよい。
【0062】
様々な実施形態では、単一のランは、外部標準(例えば、NGEP)、内部標準、及び糖ペプチド分析物を含む試料を分析し得る。したがって、外部標準、内部標準、及び標的糖ペプチド分析物の存在量値(例えば、存在量または生の存在量)は、同じランにおいて質量分析によって決定され得る。
【0063】
様々な実施形態では、血清試料は、実験試料を分析する前に分析され得る。様々な実施形態では、血清試料は、実験試料間で独立して実行され得る。いくつかの実施形態では、血清試料は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、またはそれよりも多くの実験ごとの後に分析され得る。様々な実施形態では、血清試料データは、本明細書に説明される正規化システム及び方法の一部または全部に使用され得る。追加の実施形態では、カラムの汚れを防止するために、ブランク試料が処理され得る。
【0064】
試料取り入れ104は、例えば、等分、登録、処理、保管、解凍、及び/または他の種類の動作などの、1つ以上の様々な動作を含み得る。1つ以上の実施形態では、生体試料112が全血試料116を含む場合、試料取り入れ104には、全血試料116を等分して等分試料のセットを形成させることが含まれ、次にこのセットをさらに等分して、試料のセット120を形成させることができる。
【0065】
試料調製及び処理106は、例えば、ペプチド構造のセット122を形成するための1つ以上の動作を含み得る。様々な実施形態では、ペプチド構造のセット122は、消化を受け、分析の準備ができていてもよい折り畳まれていないタンパク質の様々な断片を含んでもよい。
【0066】
さらに、試料調製及び処理106は、例えば、ペプチド構造のセット122に基づくデータ検索124を含み得る。例えば、データ検索124には、例えば、非限定的に、液体クロマトグラフィー/質量分析(LC/MS)システムの使用が含まれてもよい。
【0067】
データ分析108は、例えば、ペプチド構造分析126を含み得る。いくつかの実施形態では、データ分析108には、出力生成110も含まれる。他の実施形態では、出力生成110は、データ分析108とは別個の動作とみなされてもよい。出力生成110には、例えば、ペプチド構造分析126の結果に基づいて最終出力128を生成することが含まれてもよい。最終出力128は、研究、診断、及び/または治療を決定するために使用され得る。
【0068】
様々な実施形態では、最終出力128は、1つ以上の出力で構成される。最終出力128は、様々な形態をとることができる。例えば、最終出力128は、例えば、診断出力、治療出力(例えば、治療設計出力、治療計画出力、またはそれらの組み合わせ)、分析されたデータ(例えば、相対化及び正規化されたもの)、またはそれらの組み合わせを含むレポートであってもよい。いくつかの実施形態では、レポートは、標的糖ペプチド分析物濃度をNGEP濃度値及び正規化存在量値の関数として含み得る。いくつかの実施形態では、最終出力128は、アラート(例えば、視覚的アラート、可聴アラートなど)であっても、通知(例えば、視覚的通知、可聴通知、電子メール通知など)であっても、電子メール出力であっても、それらの組み合わせであってもよい。いくつかの実施形態では、最終出力128は、処理のために遠隔システム130に送信されてもよい。遠隔システム130は、例えば、コンピュータシステム、サーバ、プロセッサ、クラウドコンピューティングプラットフォーム、クラウドストレージ、ラップトップ、タブレット、スマートフォン、何らかの他の種類のモバイルコンピューティングデバイス、またはそれらの組み合わせを含んでもよい。
【0069】
他の実施形態では、ワークフロー100は、任意選択で、本明細書に記載される動作のうちの1つ以上を除外してもよく、及び/または任意選択で、本明細書に記載されるもの以外の1つ以上の他のステップもしくは動作を(例えば、本明細書に記載されるものに加えて、及び/またはそれらの代わりに)含んでもよい。したがって、ワークフロー100は、病態の研究、診断、及び/または処置において使用するためのいくつかの異なる方法のうちのいずれで実行されてもよい。
【0070】
IV.ペプチド構造の検出及び定量
図2A及び2Bは、1つ以上の実施形態による、試料調製及び処理106のためのワークフローの概略図である。
図2A及び2Bは、
図1を引き続き参照して説明される。試料調製及び処理106には、例えば、
図2Aに示される調製ワークフロー200及び
図2Bに示されるデータ検索124が含まれてもよい。
【0071】
IV.A.試料調製及び処理
図2Aは、1つ以上の実施形態による調製ワークフロー200の概略図である。調製ワークフロー200は、データ検索124を介した分析のために、
図1の試料のセット120のうちの試料などの試料を調製するために使用されてもよい。例えば、この分析は、質量分析(例えば、LC-MS)を介して実施され得る。様々な実施形態では、調製ワークフロー200には、変性及び還元202、アルキル化204、及び消化206が含まれてもよい。調製ワークフローの全てのエリアは、異なる試料と異なる実験との間の不一致を引き起こし得、本明細書及び全体にわたって説明される改善された正規化システム及び方法を必要とする。
【0072】
概して、タンパク質などのポリマーは、その天然形態で、二次、三次、及び/または他の高次構造を含むように折り畳むことができる。そのような高次構造は、タンパク質を機能化し、対象におけるタスクを完了し(例えば、酵素活性が可能になり)得る。さらに、ポリマーのそのような高次構造は、ポリマー内のアミノ酸の側鎖間の様々な相互作用を介して維持されてもよい。そのような相互作用には、イオン結合、疎水性相互作用、水素結合、及びシステイン残基間のジスルフィド結合が含まれ得る。しかしながら、質量分析を含む分析システム及び方法を使用する場合、そのようなポリマー(例えば、ペプチド/タンパク質分子)の折り畳みを解除して配列情報を取得することが望ましい場合がある。いくつかの実施形態では、ポリマーの折り畳み解除には、ポリマーを変性させることが含まれてもよく、これには、例えば、ポリマーを直鎖状にすることが含まれてもよい。
【0073】
1つ以上の実施形態では、変性及び還元202を使用して、試料(例えば、
図1の試料のセット120のうちの1つ)中の1つ以上のタンパク質(例えば、ポリペプチド及びペプチド)の高次構造(例えば、二次、三次、四次など)を破壊することができる。変性及び還元202には、例えば、変性手順及び還元手順が含まれる。いくつかの実施形態では、変性手順は、例えば、熱を変性剤として使用する熱変性を使用して行われてもよい。熱変性は、イオン結合、疎水性相互作用、及び/または水素結合を破壊することができる。
【0074】
1つ以上の実施形態では、変性手順は、熱と組み合わせて1つ以上の変性剤を使用することを含んでもよい。これらの1つ以上の変性剤としては、例えば、任意の数のカオトロピック塩(例えば、尿素、グアニジン)、界面活性剤(例えば、ドデシル硫酸ナトリウム(SDS)、ベータオクチルグルコシド、Triton X-100)、またはこれらの組み合わせを挙げることができるが、これらに限定されない。ある場合には、そのような変性剤は、試料調製ワークフローに汚染除去手順がさらに含まれるときに、熱と併用されてもよい。
【0075】
得られた1つ以上の変性(例えば、折り畳まれていない、直鎖状になった)タンパク質は、次いで、分析に備えてさらなる処理を受けてもよい。例えば、1つ以上の還元剤が適用される還元手順が実施されてもよい。還元剤は、例えば、非限定的に、ジチオスレイトール(DTT)、トリス(2-カルボキシエチル)ホスフィン(TCEP)、または何らかの他の還元剤の形態をとってもよい。還元剤は、1つ以上の変性タンパク質のシステイン残基間のジスルフィド結合を還元(例えば、切断)して、1つ以上の還元タンパク質を形成させてもよい。
【0076】
様々な実施形態では、変性及び還元202から得られる1つ以上の還元タンパク質は、例えば、1つ以上の還元タンパク質のシステイン残基間のジスルフィド結合の再形成を防止するプロセスを受けてもよい。このプロセスは、1つ以上のアルキル化タンパク質を形成させるために、アルキル化204を使用して実践されてもよい。例えば、アルキル化204を使用して、各システイン残基上の硫黄にアセトアミド基を付加し、ジスルフィド結合の再形成を防止してもよい。様々な実施形態では、アセトアミド基は、1つ以上のアルキル化剤を還元タンパク質と反応させることによって付加することができる。1つ以上のアルキル化剤は、例えば、1つ以上のアセトアミド塩を含んでもよい。アルキル化剤は、例えば、ヨードアセトアミド(IAA)、2-クロロアセトアミド、何らかの他の種類のアセトアミド塩、または何らかの他の種類のアルキル化剤の形態をとってもよい。
【0077】
いくつかの実施形態では、アルキル化204は、クエンチ手順を含み得る。クエンチ手順は、1つ以上の還元剤(例えば、上記の還元剤のうちの1つ以上)を使用して実施されてもよい。
【0078】
様々な実施形態では、アルキル化204を介して形成される1つ以上のアルキル化されたものは、次いで、分析(例えば、質量分析)に備えて消化206を受け得る。タンパク質の消化206には、1つ以上の切断部位(例えば、1つ以上のアミノ酸残基であってもよい部位205)でまたはその周辺でタンパク質を切断することが含まれてもよい。例えば、非限定的に、アルキル化タンパク質は、リジンまたはアルギニン残基のカルボキシル側で切断されてもよい。この種類の切断は、タンパク質を、1つ以上のペプチド構造(例えば、グリコシル化または脱グリコシル化されたもの)を含む様々なセグメントに分割し得る。
【0079】
様々な実施形態では、消化206は、1つ以上のタンパク質分解触媒を使用して実施される。例えば、酵素を消化206に使用することができる。いくつかの実施形態では、酵素はトリプシンの形態をとる。他の実施形態では、トリプシンに加えて、またはトリプシンの代わりに、1つ以上の他の種類の酵素(例えば、プロテアーゼ)を使用してもよい。これらの1つ以上の他の酵素としては、LysC、LysN、AspN、GluC、及びArgCが挙げられるが、これらに限定されない。いくつかの実施形態では、消化206は、トシルフェニルアラニルクロロメチルケトン(TPCK)で処理されたトリプシン、トリプシンの1つ以上の操作形態、トリプシンの1つ以上の他の配合物、またはそれらの組み合わせを使用して実施されてもよい。いくつかの実施形態では、消化206は、複数のステップで実施されてもよく、各々が1つ以上の消化剤の使用を伴う。例えば、二次消化、三次消化などが実施されてもよい。1つ以上の実施形態では、トリプシンは、血清試料を消化するために使用される。1つ以上の実施形態では、トリプシン/LysCカクテルが、血漿試料を消化するために使用される。
【0080】
いくつかの実施形態では、消化206は、クエンチ手順をさらに含む。クエンチ手順は、試料を(例えば、pH3未満に)酸性化することによって実施してもよい。いくつかの実施形態では、ギ酸を使用して、この酸性化を実施してもよい。
【0081】
様々な実施形態では、調製ワークフロー200は、消化後手順207をさらに含む。消化後手順207には、例えば、汚染除去手順が含まれてもよい。汚染除去手順には、例えば、消化206から生じる試料中の不要な成分の除去が含まれてもよい。例えば、不要な成分としては、無機イオン、界面活性剤などを挙げることができるが、これらに限定されない。いくつかの実施形態では、消化後手順207には、重標識ペプチド内部標準を加えるための手順がさらに含まれる。
【0082】
調製ワークフロー200は、血液ベースの生体試料112(例えば、全血試料、血漿試料、血清試料など)から作製または採取した試料に関して説明されているが、試料調製ワークフロー200は、ペプチド構造122のセットを産生させるために、他の種類の試料(例えば、涙液、尿、組織、間質液、痰など)について同様に実施されてもよい。
【0083】
IV.B.ペプチド構造の特定及び定量
図2Bは、1つ以上の実施形態によるデータ取得124の概略図である。様々な実施形態では、データ取得124は、
図2Aに記載される試料調製200の後に開始し得る。様々な実施形態では、データ取得124は、定量化208、品質制御210、及びピーク積分及び正規化212を含み得る。
【0084】
様々な実施形態では、ペプチド及び糖ペプチドの標的定量化208は、液体クロマトグラフィー質量分析LC/MS機器の使用を組み込み得る。例えば、LC-MS/MS、またはタンデムMSを使用してもよい。概して、LC/MS(例えば、LC-MS/MS)は、液体クロマトグラフ(LC)の物理的分離能力を質量分析(MS)の質量分析能力と組み合わせることができる。本明細書に記載されるいくつかの実施形態によると、この技法により、LCカラムから界面を介してMSイオン源に供給される消化されたペプチドの分離が可能になる。
【0085】
様々な実施形態では、任意のLC/MSデバイスを本明細書に記載のワークフローに組み込むことができる。様々な実施形態では、トリプル四重極LC/MS(商標)は、特定及び標的定量化208に適した例示的な機器を含む。様々な実施形態では、標的化した定量化208は、多重反応モニタリング質量分析(MRM-MS)を使用して実施される。
【0086】
本明細書に説明される様々な実施形態では、特定のタンパク質またはペプチドの特定及び関連する量が評価され得る。本明細書に説明される様々な実施形態では、特定のグリカンの特定及び関連する量が評価され得る。本明細書に記載される様々な実施形態では、特定のグリカンをタンパク質またはペプチド上のグリコシル化部位に一致させ得、存在量値を測定する。
【0087】
いくつかの場合、標的化した定量化208は、適切な断片化に関連する特定の衝突エネルギーを使用して、豊富な生成物イオンを一貫して確認することを含む。糖ペプチド構造は、脱グリコシル化ペプチド構造よりも低い衝突エネルギーを有してもよい。糖ペプチド構造を含む試料を分析する場合、ソース電圧及びガス温度を、一般的なプロテオミクス分析と比較して低下させてもよい。
【0088】
様々な実施形態では、データ品質を最適化するために、品質制御210手順を導入することができる。様々な実施形態では、期待値の外側の許容範囲内の誤差のみを許す測定を導入することができる。様々な実施形態では、統計モデルを用いること(例えば、Westgardルールを使用すること)で、品質制御210を支援することができる。例えば、品質制御210には、例えば、全ての試料または各品質制御試料(例えば、プールされた血清消化物)のいずれかにおいて、代表的なペプチド構造(例えば、グリコシル化及び/または脱グリコシル化されたもの)及びスパイクインされた内部標準の保持時間及び存在量を評価することが含まれてもよい。
【0089】
ピーク積分及び正規化212が、生成されたデータを処理し、データを分析のためのフォーマットに変換するために実施され得る。例えば、ピーク積分及び正規化212には、選択されたペプチド構造について検出された様々な生成物イオンの存在量データを、そのペプチド構造についての単一の定量化メトリック(例えば、相対量、調整量、正規化量、相対濃度、調整濃度、正規化濃度など)に変換することが含まれてもよい。いくつかの実施形態では、ピーク積分及び正規化212は、開示全体が参照により本明細書に組み込まれる米国特許公開第2020/0372973A1号及び/または米国特許公開第2020/0240996A1号に記載される技法のうちの1つ以上を使用して実施されてもよい。
【0090】
V.ペプチド構造データ分析
V.A.ペプチド構造データ分析のための例示的なシステム
V.A.1.ペプチド構造データ分析のための分析システム
図3は、1つ以上の実施形態による分析システム300のブロック図である。分析システム300は、例えば、様々な疾患状態に関連付けられている様々なペプチド構造の検出及び分析の両方を行うために使用され得る。分析システム300は、
図1のデータ分析108を実施するために使用されてもよいシステムの実装の一例である。このため、分析システム300は、
図1、2A、及び/または2Bに記載されるワークフロー100を引き続き参照して説明される。
【0091】
分析システム300は、コンピューティングプラットフォーム302及びデータストア304を含んでもよい。いくつかの実施形態では、分析システム300は、ディスプレイシステム306も含む。コンピューティングプラットフォーム302は、様々な形態をとることができる。1つ以上の実施形態では、コンピューティングプラットフォーム302は、単一のコンピュータ(もしくはコンピュータシステム)または互いに通信する複数のコンピュータを含む。他の例では、コンピューティングプラットフォーム302は、クラウドコンピューティングプラットフォームの形態をとる。
【0092】
データストア304及びディスプレイシステム306は、各々、コンピューティングプラットフォーム302と通信してもよい。いくつかの例では、データストア304、ディスプレイシステム306、またはその両方は、コンピューティングプラットフォーム302の一部とみなされてもよく、または別様にコンピューティングプラットフォーム302と統合されてもよい。このため、いくつかの例では、コンピューティングプラットフォーム302、データストア304、及びディスプレイシステム306は、互いに通信する別個の構成要素であってもよいが、他の例では、これらの構成要素の何らかの組み合わせが一緒に統合されてもよい。これらの異なる構成要素間の通信は、任意の数の有線通信リンク、無線通信リンク、光通信リンク、またはそれらの組み合わせを使用して実装されてもよい。
【0093】
分析システム300は、例えば、ペプチド構造分析器308を含み、これは、ハードウェア、ソフトウェア、ファームウェア、またはそれらの組み合わせを使用して実装されてもよい。1つ以上の実施形態では、ペプチド構造分析器308は、コンピューティングプラットフォーム302を使用して実装される。
【0094】
ペプチド構造分析器308は、処理のためにペプチド構造データ310(例えば、遷移に対する存在量値)を受信する。ペプチド構造データ310は、例えば、
図1、2A、及び2Bの試料調製及び処理106から出力されるペプチド構造データであってもよい。ペプチド構造データ310は、生体試料112について特定されたペプチド構造のセット122に対応してもよく、したがって生体試料112に対応してもよい。いくつかの実施形態では、生体試料112は、対象から得られた生体試料を含み得る。いくつかの実施形態では、生体試料112は、内部標準を含み得る。いくつかの実施形態では、生体試料112は、外部標準を含み得る。
【0095】
ペプチド構造データ310は、複数のペプチド構造の各ペプチド構造についての定量化値のセットを含み得る。様々な実施形態では、定量化値は、質量分析機器から受信された生のデータを含み得る。生のデータは、ペプチド構造を特定する質量対電荷比と、分析物の生の存在量(例えば、ペプチド構造)と、を含み得る。様々な実施形態では、相対存在量は、生の存在量から決定され得る。ペプチド構造の定量化データは、相対量、調整量、及び正規化量のうちの1つからの分析前、分析中、及び分析後の以下のいずれかの形態をとる。このようにして、ペプチド構造データ310は、生体試料112に関する複数のペプチド構造についての存在量情報を提供してもよい。
【0096】
いくつかの実施形態では、ペプチド構造のセットのうちのペプチド構造は、ペプチド配列によって定義されるグリコシル化ペプチド構造または糖ペプチド構造と、ペプチド配列量の連結部位に結合したグリカン構造と、を含む。例えば、ペプチド構造は、糖ペプチドであっても糖ペプチドの一部分であってもよい。いくつかの実施形態では、ペプチド構造のセット318のうちのペプチド構造は、ペプチド配列によって定義される脱グリコシル化または非グリコシル化ペプチド構造を含む。例えば、ペプチド構造は、ペプチドであってもペプチドの一部分であってもよく、これは、定量化ペプチドと称されてもよい。
【0097】
ペプチド構造データ310は、ペプチド構造分析器308への入力として送信されることも、データストア304または何らかの他の種類のストレージ(例えば、クラウドストレージ)から検索されることも、クラウドストレージからアクセスされることも、何らかの他の様式で取得されることもできる。ある場合には、ペプチド構造データ310は、入力デバイスを介してユーザによって入力されたユーザ入力を受信することに応答して(例えば、それに直接的または間接的に基づいて)データストア304から検索されてもよい。
【0098】
ペプチド構造分析器308は、処理のためにペプチド構造データ310を受信し得る。ペプチド構造分析器308によって受信されたペプチド構造データ310は、ペプチド構造からの生の存在量データ(例えば、糖ペプチド分析物、糖ペプチド標的分析物の外部標準、及び/または内部標準の生の存在量データ)を含み得る。したがって、ペプチド構造分析器308は、例えば、正規化312を実施して、正規化ペプチド構造データを生成するための正規化モジュールを使用して、ペプチド構造データ310をさらに処理し得る。正規化312は、いくつかの異なる方法のうちのいずれかで実装されてもよく、いくつかのステップまたはステップの組み合わせを含み得る。モデル312は、任意の数のモデル、関数、方程式、アルゴリズム、及び/または他の数学的技法を使用して実装され得る。本開示は、個々の試料内及び実験全体でペプチド構造データ310を正規化するための新規のシステム及び方法を含む。
【0099】
1つ以上の実施形態では、正規化312は、例えば、外部標準362を使用してデータを正規化すること、内部標準364を使用してデータを正規化すること、相対論的正規化366、及び濃度決定368などの様々なステップを含む。正規化312の態様は、ペプチド構造データ310をペプチド構造分析器308に入力することによって実行され得る。ペプチド構造分析器308の正規化312は、ステップ362、364、及び366を使用してペプチド構造データを処理し得る。処理されたペプチド構造データは、濃度決定368のための入力として使用され得る。様々な実施形態では、濃度決定368は、最後のステップとして行われる。
【0100】
様々な態様では、正規化312におけるプロセスは、ペプチド構造データ310から正規化相対存在量ペプチド構造データ324を生成するために実行され得る。ペプチド構造分析器308は、正規化相対存在量ペプチド構造データ324に基づいて最終出力128を生成し得る。他の実施形態では、最終出力128は、正規化存在量データ、正規化相対存在量ペプチド構造データを含む出力であってもよく、及び/またはモデルデータ処理326を受けたデータを含んでもよい。他の実施形態では、最終出力128は、正規化312及びモデルデータ処理326によって生成された出力であってもよい。モデルデータ処理326は、モデルを訓練するために、及び/または疾患状態を診断するための訓練されたモデルを使用するために実施され得る。
【0101】
例えば、正規化相対存在量ペプチド構造データ324は、モデルデータ処理326に好適な形態で生成され得る。いくつかの実施形態では、正規化相対存在量ペプチド構造データ324は、複数の実験にわたる濃度に関して比較可能であり得るペプチド構造(例えば、標的糖ペプチド分析物濃度)の濃度値を含み得る。
【0102】
様々な実施形態では、モデルデータ処理326は、限定されるものではないが、パラメトリックモデル、非パラメトリックモデル、ディープラーニングモデル、ニューラルネットワーク、線形判別分析モデル、二次判別分析モデル、サポートベクターマシン、ランダムフォレストアルゴリズム、最近傍アルゴリズム(例えば、k最近傍アルゴリズム)、複合判別分析モデル、k平均クラスタ化アルゴリズム、教師なしモデル、多変数回帰モデル、罰則付き多変数回帰モデル、または別のタイプのモデルのうちの少なくとも1つを含み得る。
【0103】
上記の予測モデルなどの、予測モデルを訓練する態様は、大量の高品質の訓練データを入力することに大きく依存する可能性がある。大量のデータを使用するために、データは、最初にデータを同じ実験内及び異なる実験の両方の試料にわたって比較可能にされなければならない。これは、試料調製、分析、実験条件、及び実験ラン間の条件変さらにおける変動の要因の考慮を含み得る。データ比較を作製及び改善することは、本明細書及び全体を通して説明されているシステム及び方法を使用して行うことができる。
【0104】
V.A.2.コンピュータ実装システム
図4は、様々な実施形態によるコンピュータシステムのブロック図である。コンピュータシステム400は、
図3において上で説明したコンピューティングプラットフォーム302及び/または
図14の1つ以上のシステムのための1つの実装の例であり得る。
【0105】
1つ以上の例では、コンピュータシステム400は、情報を通信するためのバス402または他の通信機構と、情報を処理するためのバス402と結合したプロセッサ404と、を含み得る。様々な実施形態では、コンピュータシステム400はまた、プロセッサ404によって実行される命令を決定するためにバス402に結合した、ランダムアクセスメモリ(RAM)406または他の動的記憶デバイスであり得るメモリを含み得る。メモリはまた、プロセッサ404によって実行される命令の実行中に、テンポラリ変数または他の中間情報を記憶するために使用され得る。様々な実施形態では、コンピュータシステム400は、プロセッサ404のための静的情報及び命令を記憶するためにバス402に結合した読み取り専用メモリ(ROM)408または他の静的記憶デバイスをさらに含み得る。磁気ディスクまたは光ディスクなどの記憶デバイス410は、情報及び命令を記憶するために提供され、バス402に結合し得る。
【0106】
様々な実施形態では、コンピュータシステム400は、バス402を介して、コンピュータユーザに情報を表示するために、陰極線管(CRT)または液晶ディスプレイ(LCD)などのディスプレイ412に結合され得る。英数字及び他のキーを含む入力デバイス414は、情報及びコマンド選択をプロセッサ404に通信するために、バス402に結合され得る。別の種類のユーザ入力デバイスは、方向情報及びコマンド選択をプロセッサ404に通信するため、ならびにディスプレイ412上のカーソル移動を制御するための、マウス、ジョイスティック、トラックボール、ジェスチャー入力デバイス、視線ベースの入力デバイス、またはカーソル方向キーなどのカーソル制御416である。この入力デバイス414は、典型的には、第1の軸(例えば、x)及び第2の軸(例えば、y)の2つの軸において2つの自由度を有し、これにより、デバイスは、平面内の位置を指定することができる。しかしながら、三次元(例えば、x、y、及びz)のカーソル移動を可能にする入力デバイス414もまた、本明細書で企図されることを理解されたい。
【0107】
本教示のある特定の実装と一致して、プロセッサ404がRAM406に含まれる1つ以上の命令の1つ以上のシーケンスを実行することに応答して、コンピュータシステム400によって結果が提供され得る。そのような命令は、記憶デバイス410などの別のコンピュータ可読媒体またはコンピュータ可読記憶媒体からRAM406に読み込まれ得る。RAM406に含まれる命令のシーケンスを実施すると、プロセッサ404に本明細書に記載されるプロセスを実行させることができる。代替的に、配線回路をソフトウェア命令の代わりにまたはそれと組み合わせて使用して、本教示を実践することができる。このため、本教示の実践は、ハードウェア回路及びソフトウェアの任意の特定の組み合わせに限定されない。
【0108】
「コンピュータ可読媒体」(例えば、データストア、データストレージ、記憶デバイス、データ記憶デバイスなど)または「コンピュータ可読記憶媒体」という用語は、本明細書で使用される場合、実行のためにプロセッサ404に命令を提供することに関与する任意の媒体を指す。そのような媒体は、不揮発性媒体、揮発性媒体、及び伝送媒体を含むがこれらに限定されない、多くの形態をとることができる。不揮発性媒体の例としては、光ディスク、ソリッドステートディスク、磁気ディスク、例えば、記憶デバイス410を挙げることができるが、これらに限定されない。揮発性媒体の例としては、動的メモリ、例えば、RAM406を挙げることができるが、これに限定されない。伝送媒体の例としては、バス402を含むワイヤを含む、同軸ケーブル、銅線、及び光ファイバーを挙げることができるが、これらに限定されない。
【0109】
コンピュータ可読媒体の一般的な形態としては、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、または任意の他の磁気媒体、CD-ROM、任意の他の光学媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理的媒体、RAM、PROM、及びEPROM、FLASH-EPROM、任意の他のメモリチップもしくはカートリッジ、またはコンピュータが読み取ることができる任意の他の有形媒体が挙げられる。
【0110】
コンピュータ可読媒体に加えて、命令またはデータは、実行のためにコンピュータシステム400のプロセッサ404に1つ以上の命令のシーケンスを提供するために、通信装置またはシステムに含まれる伝送媒体上の信号として提供され得る。例えば、通信装置は、命令及びデータを示す信号を有するトランシーバーを含んでもよい。命令及びデータは、1つ以上のプロセッサに、ここで本開示に概説される機能を実装させるように構成される。データ通信伝送接続の代表的な例としては、電話モデム接続、広域ネットワーク(WAN)、ローカルエリアネットワーク(LAN)、赤外線データ接続、NFC接続、光通信接続などを挙げることができるが、これらに限定されない。
【0111】
本明細書に説明される方法論、フローチャート、図、及び付随する開示は、コンピュータシステム400をスタンドアロンデバイスとして使用して、またはクラウドコンピューティングネットワークなどの共有コンピュータ処理リソースの分散ネットワーク上で実装され得ることを理解されたい。
【0112】
本明細書に説明される方法論は、用途に応じて様々な手段によって実装され得る。例えば、これらの方法論は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの任意の組み合わせにおいて実装され得る。ハードウェア実装の場合、処理ユニットは、1つ以上の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラム可能論理回路(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書に記載される機能を実行するように設計された他の電子ユニット、またはそれらの組み合わせ内に実装されてもよい。
【0113】
様々な実施形態では、本教示の方法は、C、C++、Pythonなどの従来のプログラミング言語で書かれたファームウェア及び/またはソフトウェアプログラム及びアプリケーションとして実装されてもよい。ファームウェア及び/またはソフトウェアとして実装されている場合、本明細書に説明される実施形態は、コンピュータに上記に説明される方法を実施させるためのプログラムが記憶されている非一時的コンピュータ可読媒体上に実装されてもよい。本明細書に記載される様々なエンジンは、コンピュータシステム400などのコンピュータシステム上で提供され得、それによってプロセッサ404は、メモリ構成要素RAM406、ROM408、または記憶デバイス410のうちのいずれか1つまたはそれらの組み合わせ、及び入力デバイス414を介して提供されるユーザ入力によって提供される命令に従って、これらのエンジンによって提供される分析及び決定を実行することが理解されるべきである。
【0114】
VI.例示的な正規化アプローチ
データ収集の様々な態様では、標的化LC-MS実験における糖ペプチド存在量読み取り値は、消化効率、イオン化効率、検出器感度、ラン順序効果、及び他の問題に基づいて、ランからランまたは実験から実験まで、または同じ試料についてさえ変動する。以下及び全体を通しての正規化方法は、これらの問題及び他の問題を補正し得る。
【0115】
本開示の態様は、複数の試料及び実験にわたってデータを比較するためのシステム及び方法を含む。様々な実施形態では、最初のステップは、外部標準を使用して補正された存在量を決定することを含み得る。様々な実施形態では、別のステップは、内部標準を使用して非グリコシル化ペプチド濃度を決定することを含み得る。様々な実施形態では、別のステップは、糖ペプチド分析物の正規化/相対存在量を決定することを含み得る。様々な実施形態では、最終ステップは、正規化/相対存在量値に非グリコシル化内因性ペプチド濃度を乗算することによってペプチド分析物の濃度を決定することを含み得る。様々な実施形態では、決定濃縮ステップは、上記のステップの後に行われなければならない。
【0116】
VI.A.外部標準を使用してデータを正規化する
本開示の態様は、外部標準に対する単一点較正を使用して、個々の遷移(例えば、非グリコシル化内因性ペプチド[NGEP])の補正された存在量を決定することを含み得る。
【0117】
外部標準の非限定的な例は、プールされた血清試料消化物(例えば、分析されるべき生体試料が血清である場合、プールされた血清消化物、分析されるべき生体試料が血漿である場合、プールされた血漿消化物)を含み得る。
【0118】
様々な実施形態では、プールされた試料血清(例えば、Sigma Serum)を使用するとき、血清参照標準に存在することが知られ得るマーカーが選択され得、存在量の差は、個々のランにおいてそのマーカーの全ての存在量値を整列させるために使用され得る。様々な実施形態では、これは、任意の数の遷移について行われ得る。いくつかの実施形態では、バイオマーカーごとに1つの遷移があり得る。他の実施形態では、バイオマーカーごとに1つ以上の遷移があり得る。
【0119】
様々な実施形態では、2つの隣接するプールされた血清標準相対存在量が、所与のマーカー(例えば、糖ペプチド分析物)に使用され得る。
【0120】
図8Aを参照すると、様々な実施形態による、上記及び本明細書に説明される外部標準方法を使用して正規化データを適用する前の3つの実験に対する仮定的な存在量値がグラフで示されている。
図8Bを参照すると、様々な実施形態による、以下及び本明細書に説明される正規化方法を適用した後の3つの実験に対する仮定的な存在量値がグラフで示されている。例示されるように、実験データは、様々な実施形態による実験間のより良好な比較を可能にするように処理され得る。
【0121】
VI.B.内部標準を使用してデータを正規化する
様々な実施形態では、以下の決定が、内部標準の使用と併せて使用され得る。内部標準は、所与の試料に対する存在量値を正規化するのに有用であり得る。いくつかの実施形態では、内部標準は、指定された、既知の濃度及び体積で各試料に「スパイクイン」され得る。内部標準は、検出閾値を上回るのに十分な量が使用される場合に有効であり得る(例えば、それらが検出され得る)。非グリコシル化内因性ペプチド(NGEP)濃度=(補正された非グリコシル化内因性ペプチド存在量/測定された内部標準存在量)×既知の内部標準濃度。
【0122】
様々な実施形態では、NGEP濃度は、後で、糖ペプチド分析物の濃度を計算する際に使用され得る。様々な実施形態に従って、分析されるタンパク質ごとに少なくとも1つの内部標準が測定され得る。
【0123】
様々な実施形態では、内部標準は、所与のタンパク質に対応する既知の濃度の合成ペプチドを含み得る。いくつかの実施形態では、合成非グリコシル化ペプチド標準の使用は、グリコシル化標準が入手困難であり、高価である可能性があるため、コスト削減を生み出すことができる。様々な実施形態では、内部標準は、MRM-MSリストの糖ペプチド分析物標的の安定同位体標識ペプチドを含み得る。代替的に、内部標準は、非安定同位体標識標準を含み得る。
【0124】
いくつかの実施形態では、内部標準は、分析されているよりも少ないペプチドを含み得る。したがって、到達糖タンパク質の各ペプチドについて内部標準ペプチドが利用可能ではない場合、他の内部標準は、類似性に基づいて「代理物」内部標準として選択され得る。いくつかの実施形態では、類似性は、m/z比較を含む。他の実施形態では、類似性は、RT比較を含む。
【0125】
VI.C.相対論的正規化
本開示の態様は、様々な実施形態による、糖ペプチド分析物の存在量を測定すること、及び糖ペプチド分析物の頻度を決定することを対象とし得る。いくつかの実施形態では、頻度は、相対論的正規化値を含み得る。いくつかの実施形態では、相対論的正規化値は、糖ペプチド分析物(例えば、糖型)の測定された存在量を正規化因子(例えば、ペプチド存在量または部位占有合計)で除算した比率を含み得る。いくつかの実施形態では、決定は、糖ペプチド分析物の、同じタンパク質由来の非グリコシル化ペプチドとの比較を行うことに基づき得る(例えば、ペプチド存在量比較)。いくつかの実施形態では、決定は、同じグリコシル化部位における他の糖型の存在量(例えば、部位占有合計)に対する糖ペプチド分析物存在量の比較を行うことに基づき得る。
【0126】
様々な実施形態では、相対論的正規化に相対存在量アプローチ(例えば、糖ペプチド分析物の、同じタンパク質由来の非グリコシル化ペプチドとの比較)を使用することは、所与のグリコシル化部位に対して2つ以下の糖型が存在するときに使用され得る。様々な実施形態では、相対論的正規化に部位占有存在量アプローチ(例えば、糖ペプチド分析物存在量の、同じグリコシル化部位における他の糖型の存在量との比較)を使用することは、所与のグリコシル化部位に対して3つ以上の糖型が存在するときに使用され得る。
【0127】
様々な実施形態では、相対論的正規化は、所与のグリコシル化部位に対する全ての糖型の合計に対して、特定の糖型(例えば、糖ペプチド分析物)がどの程度の画分で発生するかに関する情報を含む値であるか、またはそれを生成し得る。いくつかの実施形態では、値は、パーセンテージを含み得る。いくつかの実施形態では、値は、画分を含み得る。いくつかの実施形態では、値は、ペプチドの全ての糖型の存在量値を考慮する糖ペプチド分析物の存在量値を含み得る。
【0128】
VI.C.1.相対存在量
本開示の態様は、ウェル間の変動、患者間、及びラン順序などの単一の実験内で生成される変動を考慮し、補正する。
【0129】
様々な態様では、糖ペプチド分析物の正規化相対存在量は、標的糖ペプチド分析物(例えば、糖型)の測定された存在量を、同じタンパク質の非グリコシル化ペプチドの測定された存在量で除算することによって決定され得る。上述のように、相対存在量は、様々な実施形態に対して対応する定量化ペプチド存在量で除算された糖型(例えば、糖ペプチドまたはマーカー)についての測定された存在量値として計算され得る。仮定的な例では、(糖ペプチド存在量3000)/(同じタンパク質の別の非グリコシル化ペプチドの定量化ペプチド存在量30000)=10%のグリコシル化。
【0130】
いくつかの実施形態では、相対存在量アプローチの利点は、所与の糖タンパク質またはペプチドについて、いくつのグリカン/グリカン部位が存在するか、または測定されているかにかかわらず、任意の種類の糖ペプチドを考慮することができることであり得る。
【0131】
VI.C.2.部位占有存在量
様々な実施形態では、部位占有アプローチが、相対論的存在量を決定する際に使用され得る。様々な実施形態では、部位占有アプローチは、その部位で観察される全てのグリカンにわたる部位あたりの糖ペプチド占有割合を決定することを含み得る。いくつかの実施形態では、そのようなアプローチは、2つ以上の糖型が部位に存在するとき、より効果的であり得る。いくつかの実施形態では、存在量値が各糖型について測定され、次いで合計され得る。次いで、相対論的存在量値は、単一の糖型に対する存在量値を、所与のグリコシル化部位の全ての糖型の総存在量で除算することによって決定され得る。仮説的な例では、(糖型1の存在量)が(糖型1の存在量+糖型2の存在量+糖型3の存在量)で除算され得る。
【0132】
様々な実施形態では、部位占有アプローチは、糖ペプチドにわたるイオン化効率を考慮し得る。
【0133】
様々な実施形態では、所与のタンパク質の部位占有率を使用する代わりに、所与の対象についての全ての定量化ペプチドの存在量の合計が使用され得る。
【0134】
VI.D.濃度決定
様々な実施形態では、最終ステップが完了して、糖ペプチド分析物のおおよその濃度を得ることができる。様々な実施形態では、糖ペプチド分析物のおおよその濃度は、上記で適切に得られるように、正規化(相対)存在量値または部位占有存在量値に、上記で得られる非グリコシル化内因性ペプチド濃度を乗算することによって決定され得る。
【0135】
様々な実施形態では、濃度決定のためのプロセスは、本明細書に説明される他のプロセスと組み合わせられたとき、正規化結果を改善し得る。X.実験結果及び
図7A及び7Bを参照されたい。
【0136】
VII.例示的な正規化方法
VII.A.正規化存在量方法
様々な実施形態では、本明細書に説明される方法のいずれかは、本方法の記載の個々のステップを実行することができる任意のシステム上で実施され得る。システムの非限定的な例は、本明細書に提供される関連付けられた説明とともに
図3に説明される。
【0137】
様々な実施形態では、以下のステップは、コンピュータによって実行されたとき、コンピュータに、標的糖ペプチド分析物の濃度を決定するための方法を実施させる、コンピュータ命令を含む非一時的コンピュータ可読媒体に記憶され得る。
【0138】
図5を参照すると、いくつかの実施形態による、試料中の標的糖ペプチド分析物の濃度を決定する方法が説明される。
【0139】
ステップ502は、様々な実施形態による、試料中のNGEPの非グリコシル化内因性ペプチド(NGEP)存在量値を測定することを含む。
【0140】
ステップ504は、様々な実施形態による、外部標準を使用して、遷移のための補正されたNGEP存在量値を決定することを含む。
【0141】
ステップ506は、様々な実施形態による、既知の内部標準濃度を有する内部標準に対する内部標準存在量を測定することを含む。
【0142】
ステップ508は、様々な実施形態による、補正されたNGEP存在量値、既知の内部標準濃度、及び内部標準存在量の関数として、NGEP濃度値を決定することを含む。
【0143】
ステップ510は、様々な実施形態による、標的糖ペプチド分析物の正規化存在量値を、標的糖ペプチド分析物の第1の測定された存在量及び標的糖タンパク質分析物と同じタンパク質上の非グリコシル化内因性ペプチドの第2の測定された存在量の関数として、決定することを含む。
【0144】
ステップ512は、様々な実施形態による、標的糖ペプチド分析物濃度を、NGEP濃度値及び正規化存在量値の関数として決定することを含む。
【0145】
様々な実施形態では、NGEP濃度値は、補正されたNGEP存在量値と内部標準存在量との比率を含む。様々な実施形態では、NGEP濃度値は、比率と既知の内部標準濃度との積であり得る。
【0146】
様々な実施形態では、正規化存在量値は、1つ以上のグリカンがタンパク質上の標的グリコシル化部位に存在するときに決定され得る。
【0147】
様々な実施形態では、標的糖ペプチド分析物濃度は、NGEP濃度値と正規化存在量値との積であり得る。
【0148】
様々な実施形態では、正規化存在量値は、第1の測定された存在量と第2の測定された存在量との商であり得る。
【0149】
様々な実施形態では、NGEPの存在量、内部標準存在量、及び標的糖ペプチドの測定された存在量は、質量分析を使用して試料ランで測定され得る。
【0150】
VII.B.部位占有率方法
様々な実施形態では、本明細書に説明される方法のいずれかは、本方法の記載の個々のステップを実行することができる任意のシステム上で実施され得る。システムの非限定的な例は、本明細書に提供される関連付けられた説明とともに
図3に説明される。
【0151】
様々な実施形態では、以下のステップは、コンピュータによって実行されたとき、コンピュータに、試料中の標的糖ペプチド分析物の濃度を決定するための方法を実施させる、コンピュータ命令を含む非一時的コンピュータ可読媒体に記憶され得る。
【0152】
図6を参照すると、様々な実施形態による、試料中の標的糖ペプチド分析物の濃度を決定する方法が説明される。
【0153】
ステップ602は、様々な実施形態による、試料中のNGEPの非グリコシル化内因性ペプチド(NGEP)存在量値を得ることを含む。
【0154】
ステップ604は、様々な実施形態による、外部標準を使用して、遷移のための補正されたNGEP存在量値を決定することを含む。
【0155】
ステップ606は、様々な実施形態による、既知の内部標準濃度を有する内部標準に対する内部標準存在量を測定することを含む。
【0156】
ステップ608は、様々な実施形態による、補正されたNGEP存在量値、既知の内部標準濃度、及び内部標準存在量の関数として、NGEP濃度値を決定することを含む。
【0157】
ステップ610は、様々な実施形態による、所与の部位における標的糖ペプチド分析物の測定された標的存在量、及び同じ部位における全ての糖ペプチドの測定された総存在量の関数として、標的糖ペプチド分析物の部位占有率値を決定することを含み得る。
【0158】
ステップ612は、様々な実施形態による、標的糖ペプチド分析物濃度を、NGEP濃度値及び正規化存在量値の関数として決定することを含む。
【0159】
様々な実施形態では、NGEP濃度値は、補正されたNGEP存在量値と内部標準存在量との比率を含む。様々な実施形態では、NGEP濃度値は、比率と既知の内部標準濃度との積であり得る。
【0160】
様々な実施形態では、正規化存在量値は、1つ以上のグリカンがタンパク質上の標的グリコシル化部位に存在するときに決定され得る。
【0161】
様々な実施形態では、標的糖ペプチド分析物濃度は、NGEP濃度値と正規化存在量値との積であり得る。
【0162】
様々な実施形態では、正規化存在量値は、第1の測定された存在量と第2の測定された存在量との商であり得る。
【0163】
様々な実施形態では、NGEPの存在量、内部標準存在量、及び標的糖ペプチドの測定された存在量は、質量分析を使用して試料ランで測定され得る。
【0164】
VII.C.糖ペプチド濃度を決定する例示的な方法
様々な実施形態では、本明細書に説明される方法のいずれかは、本方法の記載の個々のステップを実行することができる任意のシステム上で実施され得る。システムの非限定的な例は、本明細書に提供される関連付けられた説明とともに
図3に説明される。
【0165】
様々な実施形態では、以下のステップは、コンピュータによって実行されたとき、コンピュータに、試料中の標的糖ペプチド分析物の濃度を決定するための方法を実施させる、コンピュータ命令を含む非一時的コンピュータ可読媒体に記憶され得る。
【0166】
図9を参照すると、様々な実施形態による、試料中の標的糖ペプチド分析物の濃度を決定する方法が説明される。
【0167】
ステップ902は、質量分析システムから試料の生の存在量データを受信することを含み、生の存在量データは、試料中の外部標準に対する生の外部標準存在量、試料中の既知の濃度を有する内部標準に対する生の内部標準存在量、試料中の糖ペプチド構造に対する生の糖ペプチド存在量、試料中の非グリコシル化ペプチド構造に対する生の非グリコシル化ペプチド存在量を含み、非グリコシル化ペプチド構造は、糖ペプチド構造と同じ糖タンパク質に由来する。様々な実施形態では、単一のランは、外部標準、内部標準、及び糖ペプチド分析物を含む試料を分析し得る。したがって、外部標準、内部標準、及び標的糖ペプチド分析物の存在量値(例えば、存在量または生の存在量)は、同じランにおいて質量分析によって決定され得る。
【0168】
ステップ904は、生の外部標準存在量と外部標準に対する参照存在量との間の差を使用して、補正された存在量データを計算することを含む。いくつかの実施形態では、補正された存在量データを計算することは、非グリコシル化ペプチド構造の補正された存在量を計算することを含む。
【0169】
ステップ906は、補正された存在量データ、生の内部標準存在量、内部標準の既知の濃度、生の糖ペプチド存在量、及び生の非グリコシル化ペプチド存在量を使用して、試料の正規化濃度データを生成することを含む。いくつかの実施形態では、生成することは、補正された存在量及び生の内部標準存在量を使用して、非グリコシル化ペプチド濃度を計算することを含む。いくつかの実施形態では、生成することは、糖ペプチド構造の生の糖ペプチド存在量、及び非グリコシル化ペプチド構造の生の非グリコシル化ペプチド存在量を使用して、糖ペプチド構造の正規化存在量を計算することを含む。いくつかの実施形態では、生成することは、糖ペプチド構造の正規化存在量、及び非グリコシル化ペプチド構造の非グリコシル化ペプチド濃度を使用して、糖ペプチド構造の正規化濃度を計算することを含み、濃度データは、糖ペプチド構造の正規化濃度を含む。
【0170】
様々な実施形態では、正規化濃度データは、質量分析システム上で実行される複数の実験にわたる変動を考慮するために正規化され得る。
【0171】
様々な実施形態では、正規化濃度データは、異なる質量分析システム上で実行される複数の実験にわたる変動を考慮するために正規化され得る。
【0172】
様々な実施形態では、正規化濃度データは、異なる実験室で実行される複数の実験にわたる変動を考慮するために正規化され得る。
【0173】
様々な実施形態では、正規化濃度データは、複数の実験、複数の実験室、または複数の異なる質量分析システムのうちの少なくとも1つにわたって複数の試料を分析するときに、変動を考慮するために正規化され得る。
【0174】
ステップ908は、モデルシステムを使用して正規化濃度データを分析して、対象についての出力を生成することを含む。様々な実施形態では、出力は、治療出力を含む。様々な実施形態では、出力は、診断出力を含む。
【0175】
VIII.例示的な試料調製及びLC-MSラン順序方法
予測アルゴリズムの予測能力は、試料調製及びLC-MSラン順序方法によって影響され得る。本明細書に説明されるデータ正規化のための方法及びシステムは、ラン試料の個々の成分(例えば、患者試料及び1つ以上の標準)及びラン順序上のラン試料の位置によって影響され得る。
【0176】
図13は、LC-MS試料ランのための試料を調製し、複数の試料ラン1300の存在量データを正規化するための例示的な方法のフローチャートを例示する。
【0177】
ステップ1302は、LC-MS分析のための複数の試料ランのためのラン試料を調製することを含む。多くの方法では、ラン試料を調製することは、第1のラン試料セットを生成することを含み得る。多くの方法では、ラン試料を調製することは、第2のラン試料セットを生成することを含み得る。
【0178】
第1のラン試料セットの各々は、外部標準を含み得る。多くの実施形態では、外部標準は、外部標準供給源から生じ得る。いくつかの実施形態では、外部標準供給源は、血清を含み得る。様々な実施形態では、外部標準は、NGEPを含み得る。様々な実施形態では、外部標準の供給源は、生体試料の供給源と一致し得る。様々な実施形態では、供給源は、血漿を含む。いくつかの実施形態では、供給源は、全血を含む。いくつかの実施形態では、供給源は、組織を含む。非限定的な例としては、特性評価されるべき生体/患者試料が血漿試料を含むときに外部標準として使用されるプールされた血漿消化物が挙げられ得る。
【0179】
様々な実施形態では、本明細書に説明される正規化の方法で外部標準として使用される、血清供給源(例えば、シグマ血清またはプールされた血漿血清)から生じるプールされた標準は、既知の濃度を有していない。(例えば、LC/MSの前の成分分析物)。様々な実施形態では、外部標準の濃度は、LC-MS分析の前に未知であり得る。様々な実施形態では、プールされた標準の濃度は、LC-MS分析の前に未知であり得る。
【0180】
様々な実施形態では、外部標準のタイプは、生体試料のタイプと一致し得る。様々な実施形態では、タイプは、ペプチド構造またはペプチド構造の配列を含み得る(例えば、標準及び糖ペプチド分析物は、99%、95%、90%、または85%を超える配列類似性を有し得る)。様々な実施形態では、タイプは、グリコシル化部位を含むペプチド構造を含み得る。様々な実施形態では、タイプは、m/z比(例えば、80%、85%、90%、95%、または99%を超えるm/z比類似性を有する標準及び糖ペプチド分析物)を含み得る。様々な実施形態では、タイプは、存在量を含み得る(例えば、80%、85%、90%、95%、または99%を超える配列類似性を有する標準及び糖ペプチド分析物)。
【0181】
特定の実施形態では、外部標準に使用される生体試料のタイプは、患者試料中の特性評価されている生体試料の供給源またはタイプに一致され得、ペプチド構造から生成される存在量は、正規化される(例えば、血漿試料に対するプールされた血漿消化物、血清試料に対するプールされた血清消化物、全血試料に対するプールされた全血消化物)。
【0182】
第2のセットの各々が、少なくとも2つの標的糖ペプチド分析物及び内部標準を含み得る。
【0183】
調製するステップは、様々なラン試料の糖タンパク質構造を酵素消化して、ラン試料の外部標準、内部標準、及び少なくとも2つの標的糖ペプチド分析物を生成することをさらに含み得る。消化を含む例示的な処理プロトコルは、本説明を通して考察される。
【0184】
ステップ1304は、プールされた標準を作成するために、第1のセットの少なくとも2つのラン試料を組み合わせることを含む。
【0185】
ステップ1306は、ラン順序に従って各ラン試料を分析することを含み、ラン順序が、試料ランのラン試料についての分析の相対順序を指定する。プロトコルでは、第1のセットのうちのラン試料は、ラン順序において第2のセットのうちのラン試料に隣接する位置を占め得る。多くのプロトコルでは、第1のセットのうちのラン試料は、第2のセットのうちのラン試料の全ての前の位置を占め得る。追加及び他のプロトコルでは、第1のセットのうちのラン試料は、第2のセットのラン試料の全ての後の位置を占め得る。
【0186】
いくつかのプロトコルでは、ラン順序は、ラン順序において少なくとも5つの位置ごとに、第1のセットのうちの1つのラン試料を分析することを含む。他のプロトコルでは、ラン順序は、ラン順序において少なくとも10個の位置ごとに位置付けられた第1のセットのうちの1つのラン試料を分析することを含む。さらに他のプロトコルでは、ラン順序は、ラン順序において少なくとも15個の位置ごとに第1のセットのうちの1つのラン試料を分析することを含む。
【0187】
ほとんどのプロトコルについて、ラン順序は、第1のセットのうちの1つの試料を分析し、続いて、第2のセットのうちの2~29個の範囲のラン試料を分析することを含む。多くのプロトコルでは、ラン順序は、第1のセットのうちの1つの試料を分析し、続いて、第2のセットのうちの4~14個の範囲のラン試料を分析することを含む。
【0188】
追加的に、プロトコルは、第1及び第2のセットのうちの全てのラン試料が分析される前に、BSAを含む少なくとも1つのラン試料を分析することを指定するラン順序を含み得る。さらに他のプロトコルは、第1及び第2のセットのうちの全てのラン試料が分析された後に、BSAを含む少なくとも1つのラン試料を分析することを含み得る。
【0189】
プロトコルは、ラン順序で第1または第2のセットのラン試料を分析する前に、少なくとも1つのブランクラン試料を分析することを含み得る。ラン順序のプロトコルは、ラン順序において第1のセットのうちの試料を分析する1つ前の位置で、ブランクラン試料を分析することを含み得る。様々な実施形態では、ブランクラン試料は、水を含み得る。
【0190】
ステップ1308は、参照として各試料ランのプールされた標準を使用することによって、複数の試料ランの生の存在量データを正規化することを含む。
【0191】
いくつかのプロセスは、内部標準を使用して、同じラン試料の複数の標的糖ペプチド分析物の各々から生成された生の存在量データを正規化することを含む。内部標準は、非グリコシル化内因性ペプチド(NGEP)を含み得る。いくつかの実施形態では、各標的糖ペプチド分析物は、参照のための対応する内部標準を有し得る。いくつかの場合、内部標準は、代理物を含み得る。
【0192】
IX.例示的な試料処理システム
図14は、患者試料を正規化存在量に処理するための例示的な試料処理システム1400を例示している。試料処理システム1400は、試料調製システム1402、試料分析システム1404、及びデータ分析システム1406を含み得る。本明細書に説明される試料処理システムは、
図1、2A、2B、5、6、9、及び13に説明されるプロセスを実行するためのハードウェア及び命令を含み得る。
【0193】
試料調製システム1402は、本明細書に説明される様々な実施形態に従って、糖タンパク質を糖ペプチド分析物に処理するための流体機器を含み得る。流体機器は、1つ以上のピペットを含み得る。試料調製システム1402は、分析前にラン試料を保存するための、混合するための、及び他の試料捕食ステップ(例えば、消化)のためのパーティションを含み得る。パーティションの非限定的な例としては、バイアル及びウェル(例えば、96ウェルプレートのウェル)が挙げられ得る。
【0194】
試料調製システム1402は、第1のラン試料セットを生成することを含み、第1のセットの各々が、外部標準を含む。様々な実施形態では、外部標準は、NGEPを含み得る。様々な実施形態では、外部標準の供給源は、生体試料の供給源と一致し得る。様々な実施形態では、供給源は、血漿を含む。いくつかの実施形態では、供給源は、全血を含む。いくつかの実施形態では、供給源は、組織を含む。非限定的な例としては、特性評価されるべき生体/患者試料が血漿試料を含むときに外部標準として使用されるプールされた血漿消化物が挙げられ得る。様々な実施形態では、本明細書に説明される正規化の方法で外部標準として使用される、血清供給源(例えば、シグマ血清またはプールされた血漿血清)から生じるプールされた標準は、既知の濃度を有していない。(例えば、LC/MSの前の成分分析物)。様々な実施形態では、外部標準の濃度は、LC-MS分析の前に未知であり得る。様々な実施形態では、プールされた標準の濃度は、LC-MS分析の前に未知であり得る。
【0195】
様々な実施形態では、外部標準のタイプは、生体試料のタイプと一致し得る。様々な実施形態では、タイプは、ペプチド構造またはペプチド構造の配列を含み得る(例えば、標準及び糖ペプチド分析物は、99%、95%、90%、または85%を超える配列類似性を有し得る)。様々な実施形態では、タイプは、グリコシル化部位を含むペプチド構造を含み得る。様々な実施形態では、タイプは、m/z比(例えば、80%、85%、90%、95%、または99%を超えるm/z比類似性を有する標準及び糖ペプチド分析物)を含み得る。様々な実施形態では、タイプは、存在量を含み得る(例えば、80%、85%、90%、95%、または99%を超える配列類似性を有する標準及び糖ペプチド分析物)。
【0196】
特定の実施形態では、外部標準に使用される生体試料のタイプは、患者試料中の特性評価されている生体試料の供給源またはタイプに一致され得、ペプチド構造から生成される存在量は、正規化される(例えば、血漿試料に対するプールされた血漿消化物、血清試料に対するプールされた血清消化物、全血試料に対するプールされた全血消化物)。
【0197】
試料調製システム1402は、第2のラン試料セットを生成し得、第2のセットの各々は、少なくとも2つの標的糖ペプチド分析物及び内部標準物質を含み、試料調製システム1402は、プールされた標準を作成するために第1のセットのうちの少なくとも2つのラン試料を組み合わせ得る。組み合わせるステップは、いくつかの実施形態では、酵素消化後に行われ得る。他の実施形態では、組み合わせるステップは、酵素消化前に行われ得る。調製するステップは、ラン試料の糖タンパク質構造を酵素消化して、ラン試料の外部標準、内部標準、及び少なくとも2つの標的糖ペプチド分析物を生成することをさらに含み得る。試料調製システム1402上で実行され得る調製プロセスの非限定的な例は、
図2Aに例示され、セクションIV.Aに説明される。試料調製及び処理。
【0198】
試料分析システム1404が、糖ペプチド分析物を分析するためのLC-MS機器を含み得る。ラン順序に従って各ラン試料を分析することを含むプロセスが、LC-MS上で実行され得、ラン順序は、LC-MS機器と電子的に通信するデータストアに記憶され得、試料ランのラン試料に対する分析の相対順序を指定する。試料分析システム1404上で実行され得る試料分析の非限定的な例は、
図2Bに例示され、セクションIV.Bに説明される。ペプチド構造の特定及び処理。
【0199】
多くのプロセスでは、第1のセットのうちのラン試料は、ラン順序において第2のセットのうちのラン試料に隣接する位置を占める。多くのプロセスでは、第1のセットのうちのラン試料は、ラン順序において第2のセットのうちのラン試料の全ての前の位置を占める。多くのプロセスでは、第1のセットのうちのラン試料は、ラン順序において第2のセットのうちのラン試料の全ての後の位置を占める。いくつかのプロセスでは、ラン順序は、ラン順序において少なくとも5つの位置ごとに、第1のセットのうちの1つのラン試料を分析することを含む。より多くのプロセスでは、ラン順序は、ラン順序において少なくとも10個の位置ごとに、第1のセットのうちの1つのラン試料を分析することを含む。多くのプロセスでは、ラン順序は、ラン順序において少なくとも15個の位置ごとに第1のセットのうちの1つのラン試料を分析することを含む。ラン順序は、第1のセットのうちの1つの試料を分析し、続いて、第2のセットのうちの2~29個の範囲のラン試料を分析することを含み得る。ラン順序は、第1のセットのうちの1つの試料を分析し、続いて、第2のセットのうちの4~14個の範囲のラン試料を分析することを含み得る。いくつかのシステムでは、プロセスは、第1及び第2のセットのうちの全てのラン試料が分析される前に、BSAを含む少なくとも1つのラン試料を分析することを含み得る。システムのいくつかのプロセスは、第1及び第2のセットのうちの全てのラン試料が分析された後に、BSAを含む少なくとも1つのラン試料を分析することを含む。システムのいくつかのプロセスは、第1または第2のセットのうちのラン試料を分析する前に、少なくとも1つのブランクラン試料を分析することを含む。システムのいくつかのプロセスは、ラン順序において第1のセットのうちの試料を分析する1つ前の位置で、ブランクラン試料を分析することを含む。
【0200】
データ分析システム1406は、正規化モジュールをさらに含み得る。
図3に示される正規化312は、正規化モジュールの例であり得る。本明細書に説明される例示的な正規化方法は、データ正規化モジュールを使用したプロセスであり得る(セクションVII.例示的な正規化方法を参照されたい)。プロセスは、内部標準を使用して、同じラン試料の複数の標的糖ペプチド分析物の各々から生成された生の存在量データを正規化することをさらに含む。
【0201】
多くのシステムでは、外部標準は、非グリコシル化内因性ペプチド(NGEP)を含む。多くのシステムでは、各標的糖ペプチド分析物は、参照のための対応する内部標準を有し得る。内部標準のうちの少なくともいくつかは、代理物とすることができる。多くのシステムでは、血清は、外部標準を含み、外部標準供給源であり得る。
【0202】
X.実験結果
X.A.正規化方法
以下に説明される実験結果は、代替物と比較して、本明細書に説明されるシステム及び方法を使用して達成される精度差を実証する。
【0203】
図7Aを参照すると、6つのマーカーについて99%の信頼区間を有する平均濃度が提示される。6つのマーカーの平均濃度を、以下の方法を使用して決定した。
【0204】
平均濃度を決定する際に、
図7Aは、外部標準ベースの存在量補正を採用しないプロセスを使用し(VI.A.外部標準を使用してデータを正規化する、を参照されたい)、これは、HVI-CRCランとSS-JAR1ランとの間の差で観察されるように、3つの別々のランにわたるペプチド濃度の不完全な結果につながる。
【0205】
図7Bを参照すると、6つのマークに対する平均濃度は、
図7Aに示されるデータを生成する際に使用されるプロセスの前に、存在量補正ステップ(例えば、外部標準を使用してデータを正規化する)を完了するときに提示され、すなわち、新しいランごとに、マーカーごとに、存在量データを、新しいランのシグマ血清平均といくつかの参照との商を乗算することによって、イオン化及び消化効率の差について補正した。Corrected_Patient_Abundance=Patient_Abundance×(ReferenceRun_Mean-Sigma Serum_Abundance/NewRun_Mean_Sigma Serum_Abundance)。これは、結果的に、整列されたペプチド濃度をもたらし、整列されたおおよその糖ペプチド濃度を比較することを可能にする。
【0206】
図7Bと比較した
図7Aは、ステップの指定された順序(例えば、外部標準ステップを使用してデータを正規化することが最初に行われ、濃度決定が最後に行われる)なしで、ペプチドレベルデータが整列しないことを実証する。したがって、本明細書で説明される様々な実施形態は、外部標準ステップを使用してデータを正規化することを最初に、濃度決定を最後に順序付けすることにおいて有益である。
【0207】
図10A及び
図10Bは、バッチ1(「B1」)及びバッチ2(「B2」)における独立した卵巣癌及び良性コホートの比較を例示する。
図10Aは、部位占有率を介して計算された単一の糖ペプチド濃度を表し、外部標準を使用してデータを正規化するステップが最初に行われ、濃度決定が最後に行われ、結果的に、同様の疾患分布が得られる。
【0208】
図10Bは、外部標準ステップ(例えば、外部標準ステップを使用してデータを正規化するステップ)に対する存在量補正を使用せずに同じマーカー及び患者を表示し、結果的に、バッチ1と整列しないバッチ2の値をもたらす。したがって、
図10Bのデータは、効果的に比較することはできないが、それに対して、
図10Aのデータは、効果的に比較され、予測モデルと併せて使用され得る。
【0209】
図11A及び
図11Bは、バッチ1(「B1」)及びバッチ2(「B2」)における独立した卵巣癌及び良性コホートの比較を例示する。
図10Aは、相対存在量を介して計算された単一の糖ペプチド濃度を表し、外部標準を使用してデータを正規化するステップが最初に行われ、濃度決定が最後に行われ、結果的に、同様の疾患分布が得られる。
【0210】
図11Bは、外部標準ステップ(例えば、外部標準ステップを使用してデータを正規化するステップ)に対する存在量補正を使用せずに同じマーカー及び患者を表示し、結果的に、バッチ1と整列しないバッチ2の値をもたらす。したがって、
図11Bのデータは、効果的に比較することはできないが、それに対して、
図11Aのデータは、効果的に比較され、予測モデルと併せて使用され得る。
【0211】
図12A及び
図12Bは、訓練された卵巣癌モデルを、独立した試験セットに適用することを結果的にもたらす混同行列を例示する。
図12Aは、濃度が、外部標準ステップを使用してデータを正規化するステップを最初に、濃度決定を最後に使用して計算されたモデルを表す。
図12Bは、濃度が、外部標準ステップを使用してデータを正規化するステップを省略して計算されたモデルを表す。全体として、
図12Aに見られる予測精度は、0.884であると決定され、
図12Bに見られる予測精度は、0.71であると決定された。したがって、外部標準を使用してデータを正規化するステップを最初に完了し、続いて、内部標準を使用してデータを正規化するステップ及び相対論的正規化ステップを完了し、最後に濃度決定を完了することは、予測精度を0.174だけ増加させることを示した。
【0212】
X.B.試料調製及び処理
図15は、プールされた複製物に対する変動係数を含むデータの実験結果を例示する。データは、実験にあまりにも少ない外部標準(例えば、シグマ血清(SS)複製物)を含むことが、質量分析を受けるバイオマーカー(例えば、糖ペプチド分析物)の変動係数(CV)の正確な推定を可能にしない可能性があることを実証する。全てのバイオマーカーの中央値CVが、実験全体のn=2のSS(左の線)から、10個の患者試料ごとに1つのSS(右、n=319人の患者についてn=33のSS)まで、各可能性についてプロットされている。SS複製物の頻度が増加するにつれて、この中央値CVの周囲の変動は、推定値が真の中央値CV(0.124)に近づくにつれて、少ない量に減少する。
【0213】
図16は、ラン試料のセットの実験ラン順序を例示する。ラン試料は、ブランク、BSA、システム緩衝液、標的糖ペプチド分析物、内部標準、及び外部標準を含む。ラン順序において、プールされた標準、「SS-JAR1-SysSuit」は、10番目の位置ごとに実行され、ラン順序の直前の位置にブランクが実行される。試料位置座標系は、ロボット流体機器が媒介する試料調製に使用され得る。ラン順序を、ラン順序アルゴリズムを使用して生成した。アルゴリズムを、患者試料データに基づいてランシーケンスを自動的に生成するスクリプトに書き込んだ。アルゴリズムは、外部試料ID及び対応する内部試料IDを有する患者試料のリストを受け取り、次いで、試料を無作為化し、10個の無作為化された患者試料ごとの最初及び後にSS消化物を配置し、それらに#1から開始する試料調製番号を割り当て、次いで、試料を再度無作為化し、散在したブランク及びSSプールランを有する設計されたランシーケンスパターンに配置した。
【0214】
図17は、ラン試料パーティション場所を含む、96ウェルプレートのレイアウトを例示する。ラン試料の非限定的な成分は、ブランク、BSA、システム緩衝液、標的糖ペプチド分析物、内部標準、及び外部標準を含み得る。「ss」に続く数字は、外部標準の場所を識別し、「SS」は、プールされた標準を識別し、他のマーカーは、他のラン試料(例えば、標的糖ペプチド分析物及び/または内部標準を含むラン試料)を示す。
【0215】
XI.追加の考慮事項
本文書のセクション及びサブセクション間のいずれのヘッダー及び/またはサブヘッダーも、読みやすさを向上させることのみを目的として含まれ、セクション及びサブセクション間を越えて特徴を組み合わせることができないことを暗示するものではない。したがって、セクション及びサブセクションは、別個の実施形態を説明するものではない。
【0216】
本教示は様々な実施形態と併せて説明されるが、本教示がそのような実施形態に限定されることは意図されない。反対に、本教示は、当業者によって理解されるように、様々な代替、修正、及び等価物を包含する。本説明は、好ましい例示的な実施形態を提供するものであり、本開示の範囲、適用可能性、または構成を限定することは意図されない。むしろ、好ましい例示的な実施形態の本説明は、当業者に、様々な実施形態を実践するための有効な説明を提供する。
【0217】
添付の特許請求の範囲に示される趣旨及び範囲から逸脱することなく、要素の機能及び配置に様々な変更を行ってもよいことが理解される。このため、そのような修正及び変形は、添付の特許請求の範囲に示される範囲内であるとみなされる。さらに、用いられている用語及び表現は、説明の語として使用されるものであり、限定ではなく、そのような用語及び表現の使用には、示され説明される特徴またはその一部分のいずれの等価物も除外する意図はなく、特許請求される本発明の範囲内で様々な修正が可能であることが認識される。
【0218】
様々な実施形態を説明する際に、本明細書は、方法及び/またはプロセスを特定の一連のステップとして提示している場合がある。しかしながら、方法またはプロセスが本明細書に示されるステップの特定の順序に依存しない限り、本方法またはプロセスは、説明されたステップの特定の順序に限定されるべきではなく、当業者であれば、配列が変化し、それでも様々な実施形態の趣旨及び範囲内に留まり得ることが容易に理解することができる。
【0219】
本開示のいくつかの実施形態は、1つ以上のデータプロセッサを含むシステムを含む。いくつかの実施形態では、本システムは、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、本明細書に開示される1つ以上の方法の一部もしくは全部及び/または1つ以上のプロセスの一部もしくは全部を実施させる命令を含む非一時的コンピュータ可読記憶媒体を含む。本開示のいくつかの実施形態は、1つ以上のデータプロセッサに、本明細書に開示される1つ以上の方法の一部もしくは全部及び/または1つ以上のプロセスの一部または全部を実施させるように構成されている命令を含む、非一時的機械可読記憶媒体に有形的に統合されるコンピュータプログラム製品を含む。
【0220】
実施形態の理解を提供するために、本明細書に具体的な詳細が付与される。しかしながら、実施形態は、これらの具体的な詳細なしに実施されてもよいことが理解される。例えば、回路、システム、ネットワーク、プロセス、及び他の構成要素は、不必要な詳細で実施形態を不明瞭にしないように、ブロック図形式で構成要素として示され得る。他の場合には、実施形態を不明瞭にすることを避けるために、周知の回路、プロセス、アルゴリズム、構造、及び技法は、不必要な詳細なしに示され得る。
【0221】
XII.実施形態の記述
実施形態1:試料中の標的糖ペプチド分析物の濃度を測定する方法であって、前記方法が、試料の非グリコシル化内因性ペプチド(NGEP)の存在量を測定することと、外部標準を使用して、前記NGEPに対する補正されたNGEP存在量を決定することと、既知の内部標準濃度を有する内部標準に対する内部標準存在量を測定することと、前記補正されたNGEP存在量、前記既知の内部標準濃度、及び前記内部標準存在量の関数として、前記NGEPに対するNGEP濃度を決定することと、前記試料の標的糖ペプチド分析物の正規化存在量を、前記標的糖ペプチド分析物の測定された存在量及び前記標的糖タンパク質分析物と同じタンパク質上の前記NGEPの前記測定された存在量の関数として、決定することと、標的糖ペプチド分析物濃度を前記NGEP濃度及び前記正規化存在量の関数として決定することと、を含む、前記方法。
【0222】
実施形態2:対象に対する治療を生成するために、前記標的糖ペプチド分析物濃度を分析することをさらに含む、実施形態1に記載の方法。
【0223】
実施形態3:対象に対する診断を生成するために、前記標的糖ペプチド分析物濃度を分析することをさらに含む、実施形態1または2に記載の方法。
【0224】
実施形態4:前記NGEP濃度が、前記補正されたNGEP存在量と前記内部標準存在量との比率を含む、実施形態1~3のいずれか1つに記載の方法。
【0225】
実施形態5:前記NGEP濃度が、前記比率と前記既知の内部標準濃度との積である、実施形態4に記載の方法。
【0226】
実施形態6:前記正規化存在量が、前記タンパク質上の標的グリコシル化部位で1つまたは2つのグリカンが特定されるときに決定される、実施形態1~5のいずれか1つに記載の方法。
【0227】
実施形態7:前記標的糖ペプチド分析物濃度が、前記NGEP濃度と前記正規化存在量との積である、実施形態1~6のいずれか1つに記載の方法。
【0228】
実施形態8:前記正規化存在量が、第1の測定された存在量と第2の測定された存在量との商である、実施形態1~7のいずれか1つに記載の方法。
【0229】
実施形態9:前記NGEPの存在量、前記内部標準存在量、及び前記標的糖ペプチドの前記測定された存在量が、質量分析を使用した試料ランにおいて測定される、実施形態1~8のいずれか1つに記載の方法。
【0230】
実施形態10:コンピュータによって実行されたとき、コンピュータに、試料中の試料の標的糖ペプチド分析物の濃度を決定するための方法を実施させる、コンピュータ命令を記憶する非一時的コンピュータ可読媒体であって、前記方法が、試料の非グリコシル化内因性ペプチド(NGEP)の存在量を測定することと、外部標準を使用して、前記NGEPに対する補正されたNGEP存在量を決定することと、既知の内部標準濃度を有する内部標準に対する内部標準存在量を測定することと、前記補正されたNGEP存在量、前記既知の内部標準濃度、及び前記内部標準存在量の関数として、NGEP濃度を決定することと、前記試料の標的糖ペプチド分析物の正規化存在量を、前記標的糖ペプチド分析物の測定された存在量及び前記標的糖タンパク質分析物と同じタンパク質上の前記NGEPの前記測定された存在量の関数として、決定することと、標的糖ペプチド分析物濃度を前記NGEP濃度及び前記正規化存在量の関数として決定することと、を含む、前記非一時的コンピュータ可読媒体。
【0231】
実施形態11:対象に対する治療を生成するために、前記標的糖ペプチド分析物濃度を分析することをさらに含む、実施形態10に記載の方法。
【0232】
実施形態12:対象に対する診断を生成するために、前記標的糖ペプチド分析物濃度を分析することをさらに含む、実施形態10または11に記載の方法。
【0233】
実施形態13:前記NGEP濃度が、前記補正されたNGEP存在量と前記内部標準存在量との比率を含む、実施形態10~12のいずれか1つに記載の方法。
【0234】
実施形態14:前記NGEP濃度が、前記比率と前記既知の内部標準濃度との積である、実施形態13に記載の方法。
【0235】
実施形態15:前記正規化存在量が、前記タンパク質上の標的グリコシル化部位で1つまたは2つのグリカンが特定されるときに決定される、実施形態10~14のいずれか1つに記載の方法。
【0236】
実施形態16:前記標的糖ペプチド分析物濃度が、前記NGEP濃度と前記正規化存在量との積である、実施形態10~15のいずれか1つに記載の方法。
【0237】
実施形態17:前記正規化存在量が、第1の測定された存在量と第2の測定された存在量との商である、実施形態10~16のいずれか1つに記載の方法。
【0238】
実施形態18:前記NGEPの前記存在量、前記内部標準存在量、及び前記標的糖ペプチドの前記測定された存在量が、質量分析を使用した試料ランにおいて測定される、実施形態10~17のいずれか1つに記載の方法。
【0239】
実施形態19:試料中の標的糖ペプチド分析物の濃度を測定する方法であって、前記方法が、試料の非グリコシル化内因性ペプチド(NGEP)の存在量を測定することと、外部標準を使用して、前記NGEPに対する補正されたNGEP存在量を決定することと、既知の内部標準濃度を有する内部標準に対する内部標準存在量を測定することと、前記補正されたNGEP存在量、前記既知の内部標準濃度、及び前記内部標準存在量の関数として、NGEP濃度を決定することと、所与の部位における前記標的糖ペプチド分析物の測定された標的存在量、及び同じ部位で定量化された全ての糖ペプチドの測定された総存在量の関数として、前記試料の標的糖ペプチド分析物の部位占有率を決定することと、標的糖ペプチド分析物濃度を前記NGEP濃度及び前記正規化存在量の関数として決定することと、を含む、前記方法。
【0240】
実施形態20:対象に対する治療を生成するために、前記標的糖ペプチド分析物濃度を分析することをさらに含む、実施形態19に記載の方法。
【0241】
実施形態21:対象に対する診断を生成するために、前記標的糖ペプチド分析物濃度を分析することをさらに含む、実施形態19または20に記載の方法。
【0242】
実施形態22:前記NGEP濃度が、前記補正されたNGEP存在量と前記内部標準存在量との比率を含む、実施形態19~21のいずれか1つに記載の方法。
【0243】
実施形態23:前記NGEP濃度が、前記比率と前記既知の内部標準濃度との積である、実施形態22に記載の方法。
【0244】
実施形態24:前記部位占有率が、所与の部位で3つ以上のグリカンが特定されるときに決定される、実施形態19~23のいずれか1つに記載の方法。
【0245】
実施形態25:前記標的糖ペプチド分析物濃度が、前記NGEP濃度と前記正規化存在量との積である、実施形態19~24のいずれか1つに記載の方法。
【0246】
実施形態26:前記部位占有率が、前記測定された標的存在量と前記測定された総存在量との商である、実施形態19~25のいずれか1つに記載の方法。
【0247】
実施形態27:前記NGEPの前記存在量、前記内部標準存在量、及び前記標的糖ペプチドの前記測定された存在量が、質量分析を使用した試料ランにおいて測定される、実施形態19~26のいずれか1つに記載の方法。
【0248】
実施形態28:コンピュータによって実行されたとき、コンピュータに、試料中の試料の標的糖ペプチド分析物の濃度を決定するための方法を実施させる、コンピュータ命令を記憶する非一時的コンピュータ可読媒体であって、前記方法が、試料の非グリコシル化内因性ペプチド(NGEP)の存在量を測定することと、外部標準を使用して、前記NGEPに対する補正されたNGEP存在量を決定することと、既知の内部標準濃度を有する内部標準に対する内部標準存在量を測定することと、前記補正されたNGEP存在量、前記既知の内部標準濃度、及び前記内部標準存在量の関数として、NGEP濃度を決定することと、所与の部位における前記標的糖ペプチド分析物の測定された標的存在量、及び同じ部位における全ての糖ペプチドの測定された総存在量の関数として、前記試料の標的糖ペプチド分析物の部位占有率を決定することと、前記標的糖ペプチド分析物濃度を前記NGEP濃度及び前記正規化存在量の関数として決定することと、を含む、前記非一時的コンピュータ可読媒体。
【0249】
実施形態29:対象に対する治療を生成するために、前記標的糖ペプチド分析物濃度を分析することをさらに含む、実施形態28に記載の方法。
【0250】
実施形態30:対象に対する診断を生成するために、前記標的糖ペプチド分析物濃度を分析することをさらに含む、実施形態28または29に記載の方法。
【0251】
実施形態31:前記NGEP濃度が、前記補正されたNGEP存在量と前記内部標準存在量との比率を含む、実施形態28~30のいずれか1つに記載の方法。
【0252】
実施形態32:前記NGEP濃度が、前記比率と前記既知の内部標準濃度との積である、実施形態31に記載の方法。
【0253】
実施形態33:前記部位占有率が、所与の部位で3つ以上のグリカンが特定されるときに決定される、実施形態28~32のいずれか1つに記載の方法。
【0254】
実施形態34:前記標的糖ペプチド分析物濃度が、前記NGEP濃度と前記正規化存在量との積である、実施形態28~33のいずれか1つに記載の方法。
【0255】
実施形態35:前記部位占有率が、前記測定された標的存在量と前記測定された総存在量との商である、実施形態28~34のいずれか1つに記載の方法。
【0256】
実施形態36:前記NGEPの前記存在量、前記内部標準存在量、及び前記標的糖ペプチドの測定された存在量が、質量分析を使用した試料ランにおいて測定される、実施形態28~35のいずれか1つに記載の方法。
【0257】
実施形態37:液体クロマトグラフィー/質量分析(LC-MS)試料ランのための試料を調製し、複数の試料ランの存在量データを正規化するための方法であって、前記方法が、LC-MS分析のための複数の試料ランのためのラン試料を調製することであって、前記調製することが、第1のラン試料セットを生成することであって、第1のラン試料セットの各々が、外部標準を含む、前記生成することと、第2のラン試料セットを生成することであって、第2のラン試料セットの各々が、少なくとも2つの標的糖ペプチド分析物、及び内部標準を含む、前記生成することと、を含む、前記調整することと、プールされた標準を作成するために、前記第1のラン試料セットのうちの少なくとも2つのラン試料を組み合わせることと、ラン順序に従って各ラン試料を分析することであって、前記ラン順序が、前記試料ランの前記ラン試料についての分析の相対順序を指定する、前記分析することと、参照として各試料ランの前記プールされた標準を使用して、複数の試料ランの生の存在量データを正規化することと、を含む、前記方法。
【0258】
実施形態38:前記第1のラン試料セットのうちの第1のラン試料が、前記ラン順序において前記第2のラン試料セットのうちの第2のラン試料に隣接する位置を占める、実施形態37に記載の方法。
【0259】
実施形態39:前記第1のラン試料セットのうちのラン試料が、前記ラン順序において前記第2のラン試料セットのうちのラン試料の全ての前の位置を占める、実施形態37に記載の方法。
【0260】
実施形態40:前記第1のラン試料セットのうちのラン試料が、前記ラン順序において前記第2のラン試料セットのうちのラン試料の全ての後の位置を占める、実施形態37に記載の方法。
【0261】
実施形態41:前記第1のラン試料セットのうちのラン試料が、前記ラン順序において少なくとも5つの位置ごとに1つの位置を占める、実施形態37に記載の方法。
【0262】
実施形態42:前記第1のラン試料セットのうちのラン試料が、前記ラン順序において少なくとも10個の位置ごとに1つの位置を占める、実施形態37に記載の方法。
【0263】
実施形態43:前記ラン順序が、前記ラン順序において少なくとも15個の位置ごとに位置付けられた前記第1のラン試料セットのうちの単一のラン試料を含む、実施形態37に記載の方法。
【0264】
実施形態44:前記ラン順序が、前記第1のラン試料セットのうちの単一のラン試料に続いて、前記第2のラン試料セットのうちの2~29個の範囲のラン試料を含む、実施形態37に記載の方法。
【0265】
実施形態45:前記ラン順序が、前記第1のラン試料セットのうちの単一のラン試料に続いて、前記第2のラン試料セットのうちの4~14個の範囲のラン試料を含む、実施形態37に記載の方法。
【0266】
実施形態46:前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちの全ての前記ラン試料の前に、BSAを含む少なくとも1つのラン試料を位置付けることをさらに含む、実施形態37~45のいずれか1つに記載の方法。
【0267】
実施形態47:前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちの全ての前記ラン試料の後に、BSAを含む少なくとも1つのラン試料を位置付けることをさらに含む、実施形態37~46のいずれか1つに記載の方法。
【0268】
実施形態48:前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちのラン試料の前に、少なくとも1つのブランクラン試料を位置付けることをさらに含む、実施形態37~47のいずれか1つに記載の方法。
【0269】
実施形態49:前記ラン順序において、前記第1のラン試料セットのうちのラン試料の1つ前の位置に、ブランクラン試料を位置付けることをさらに含む、実施形態37~48のいずれか1つに記載の方法。
【0270】
実施形態50:調製するステップが、前記ラン試料の糖タンパク質構造を酵素消化して、前記第1のラン試料セットの各ラン試料の前記外部標準、ならびに前記第2のラン試料セットの各ラン試料の前記内部標準及び前記少なくとも2つの標的糖ペプチド分析物を生成することをさらに含む、実施形態37~49のいずれか1つに記載の方法。
【0271】
実施形態51:前記内部標準を使用して、前記第2のラン試料セットのうちの同じラン試料の前記少なくとも2つの標的糖ペプチド分析物の各々から生成された生の存在量データを正規化することをさらに含む、実施形態50に記載の方法。
【0272】
実施形態52:前記外部標準が、非グリコシル化内因性ペプチド(NGEP)を含む、実施形態37~51のいずれか1つに記載の方法。
【0273】
実施形態53:前記少なくとも2つの標的糖ペプチド分析物の各々が、参照のための対応する内部標準を有する、実施形態37~52のいずれか1つに記載の方法。
【0274】
実施形態54:前記第2のラン試料セットのうちの少なくとも1つのラン試料の前記内部標準が、代理物である、実施形態37~53のいずれか1つに記載の方法。
【0275】
実施形態55:前記外部標準の供給源が、血清を含む、実施形態37~54のいずれか1つに記載の方法。
【0276】
実施形態56:前記第1のラン試料セットの外部標準は、前記第2のラン試料セットにおけるラン試料が患者血漿試料を含むときに、少なくとも1つのプールされた血漿消化物を含む、実施形態37~55のいずれか1つに記載の方法。
【0277】
実施形態57:前記患者血漿試料が、標的分析物を含む、実施形態56に記載の方法。
【0278】
実施形態58:前記外部標準の濃度が、分析前に未知である、実施形態37~57のいずれか1つに記載の方法。
【0279】
実施形態59:前記プールされた標準の濃度が、分析前に未知である、実施形態37~58のいずれか1つに記載の方法。
【0280】
実施形態60:液体クロマトグラフィー/質量分析(LC-MS)試料ランのための試料を調製し、複数の試料ランの存在量データを正規化するためのプロセスを実行するための試料処理システムであって、前記試料処理システムが、プロセスを実施するための、流体機器を含む試料調製システムであって、前記プロセスが、第1のラン試料セットを生成することであって、前記第1のセットの各々が、外部標準を含む、前記生成することと、第2のラン試料セットを生成することであって、前記第2のセットの各々が、少なくとも2つの標的糖ペプチド分析物、及び内部標準を含む、前記生成することと、プールされた標準を作成するために、前記第1のセットのうちの少なくとも2つのラン試料を組み合わせることと、を含む、前記試料調製システムと、糖ペプチド分析物を分析するための、LC-MS機器を含む試料分析システムであって、前記プロセスが、前記ラン順序に従って各ラン試料を分析することを含み、前記ラン順序が、LC-MS機器と電子的に通信するデータストア上に記憶され、前記試料ランの前記ラン試料に対する分析の相対順序を指定する、前記試料分析システムと、共通の参照として各試料ランの前記プールされた標準を使用して、前記複数の試料ランの生の存在量データを正規化するための、ペプチド構造分析器の正規化モジュールを含むデータ分析システムと、を備える、前記システム。
【0281】
実施形態61:第1のラン試料セットのうちの第1のラン試料が、前記ラン順序において第2のラン試料セットのうちの第2のラン試料に隣接する位置を占める、実施形態60に記載のシステム。
【0282】
実施形態62:前記第1のラン試料セットのうちのラン試料が、前記ラン順序において前記第2のラン試料セットのうちのラン試料の全ての前の位置を占める、実施形態60に記載のシステム。
【0283】
実施形態63:前記第1のラン試料セットのうちのラン試料が、前記ラン順序において第2のラン試料セットのうちのラン試料の全ての後の位置を占める、実施形態60に記載のシステム。
【0284】
実施形態64:前記ラン順序が、前記ラン順序において少なくとも5つの位置ごとに位置付けられた前記第1のラン試料セットのうちの単一のラン試料を含む、実施形態60に記載のシステム。
【0285】
実施形態65:前記ラン順序が、前記ラン順序において少なくとも10個の位置ごとに位置付けられた前記第1のラン試料セットのうちの単一のラン試料を含む、実施形態60に記載のシステム。
【0286】
実施形態66:前記ラン順序が、前記ラン順序において少なくとも15個の位置ごとに位置付けられた前記第1のラン試料セットのうちの単一のラン試料を含む、実施形態60に記載のシステム。
【0287】
実施形態67:前記ラン順序が、前記第1のラン試料セットのうちの単一のラン試料に続いて、前記第2のセットのうちの2~29個の範囲のラン試料を含む、実施形態60に記載のシステム。
【0288】
実施形態68:前記ラン順序が、前記第1のラン試料セットのうちの単一のラン試料に続いて、前記第2のラン試料セットのうちの4~14個の範囲のラン試料を含む、実施形態60に記載のシステム。
【0289】
実施形態69:BSAを含む少なくとも1つのラン試料が、前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちの全ての前記ラン試料の前に位置付けられる、実施形態60~68のいずれか1つに記載のシステム。
【0290】
実施形態70:BSAを含む少なくとも1つのラン試料が、前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちの全ての前記ラン試料の後に位置付けられる、実施形態60~69のいずれか1つに記載のシステム。
【0291】
実施形態71:少なくとも1つのブランクラン試料が、前記ラン順序において、前記第1のラン試料セット及び前記第2のラン試料セットのうちのラン試料の前に位置付けられる、実施形態60~70のいずれか1つに記載のシステム。
【0292】
実施形態72:ブランクラン試料が、前記ラン順序において、前記第1のラン試料セットのうちのラン試料の1つ前の位置に位置付けられる、実施形態60~71のいずれか1つに記載のシステム。
【0293】
実施形態73:前記試料調製システムを使用して実施される前記プロセスが、前記ラン試料の糖タンパク質構造を酵素消化して、前記第1のラン試料セットの各ラン試料の前記外部標準、ならびに前記第2のランセットの各ラン試料の前記内部標準及び前記少なくとも2つの標的糖ペプチド分析物を生成することをさらに含む、実施形態60~72のいずれか1つに記載のシステム。
【0294】
実施形態74:前記データ分析システムが、前記内部標準を使用して、同じラン試料の前記少なくとも2つの標的糖ペプチド分析物の各々から生成された前記生の存在量データを正規化するように構成されている、実施形態60~73のいずれか1つに記載のシステム。
【0295】
実施形態75:前記外部標準が、非グリコシル化内因性ペプチド(NGEP)を含む、実施形態60~74のいずれか1つに記載のシステム。
【0296】
実施形態76:前記外部標準が、非グリコシル化内因性ペプチド(NGEP)を含む、実施形態60~75のいずれか1つに記載のシステム。
【0297】
実施形態77:少なくとも2つの標的糖ペプチド分析物の各々が、参照のための対応する内部標準を有する、実施形態60~76のいずれか1つに記載のシステム。
【0298】
実施形態78:前記第2のラン試料セットのうちの少なくとも1つのラン試料の前記内部標準が、代理物である、実施形態60~77のいずれか1つに記載のシステム。
【0299】
実施形態79:前記外部標準の供給源が、血清を含む、実施形態60~78のいずれか1つに記載のシステム。
【0300】
実施形態80:前記第1のラン試料セットの外部標準は、前記第2のラン試料セットにおけるラン試料が患者血漿試料を含むときに、少なくとも1つのプールされた血漿消化物を含む、実施形態60~79のいずれか1つに記載のシステム。
【0301】
実施形態81:前記患者血漿試料が、標的分析物を含む、実施形態80に記載のシステム。
【0302】
実施形態82:前記外部標準の濃度が、分析前に未知である、実施形態60~81のいずれか1つに記載のシステム。
【0303】
実施形態83:前記プールされた標準の濃度が、分析前に未知である、実施形態60~82のいずれか1つに記載のシステム。
【0304】
実施形態84:実施形態37~59のいずれか1つに記載の、LC-MS試料ランのための試料を調製し、複数の試料ランの存在量データを正規化するための方法をさらに含む、実施形態1~9及び19~27のいずれか1つに記載の方法。
【0305】
実施形態85:実施形態37~59のいずれか1つに記載の、LC-MS試料ランのための試料を調製し、複数の試料ランの存在量データを正規化するための方法をさらに含む、実施形態10~18及び28~36のいずれか1つに記載の方法。
【国際調査報告】