IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヴェン バイオサイエンスィズ コーポレイションの特許一覧

特表2023-554166非アルコール性脂肪性肝炎(NASH)または肝細胞癌(HCC)を診断するためのバイオマーカー
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-26
(54)【発明の名称】非アルコール性脂肪性肝炎(NASH)または肝細胞癌(HCC)を診断するためのバイオマーカー
(51)【国際特許分類】
   G16H 50/20 20180101AFI20231219BHJP
   G16B 40/20 20190101ALI20231219BHJP
   C07K 14/81 20060101ALN20231219BHJP
   C07K 14/47 20060101ALN20231219BHJP
   C07K 14/79 20060101ALN20231219BHJP
   C07K 14/78 20060101ALN20231219BHJP
   C12N 9/64 20060101ALN20231219BHJP
   C07K 16/00 20060101ALN20231219BHJP
【FI】
G16H50/20
G16B40/20
C07K14/81 ZNA
C07K14/47
C07K14/79
C07K14/78
C12N9/64 A
C07K16/00
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023555119
(86)(22)【出願日】2021-11-24
(85)【翻訳文提出日】2023-05-24
(86)【国際出願番号】 US2021060776
(87)【国際公開番号】W WO2022115574
(87)【国際公開日】2022-06-02
(31)【優先権主張番号】63/118,486
(32)【優先日】2020-11-25
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】63/251,021
(32)【優先日】2021-09-30
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TRITON
2.PYTHON
(71)【出願人】
【識別番号】523194798
【氏名又は名称】ヴェン バイオサイエンスィズ コーポレイション
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】ラマチャンドラン,プラサンナ
(72)【発明者】
【氏名】シュ,ゲーゲ
【テーマコード(参考)】
4H045
5L099
【Fターム(参考)】
4H045AA30
4H045CA40
4H045DA50
4H045DA56
4H045DA75
4H045DA89
4H045EA50
5L099AA04
(57)【要約】
本明細書に記載の実施形態は、概して、疾患進行過程を進んでいる疾患状態の診断及び/または治療のためにペプチド構造を分析するための技術に関する。本願に記載される技術に関連する方法の非限定的な例は、対象から得られる生体試料に対応するペプチド構造データを受信することと、ペプチド構造プロファイルを特定することと、疾患進行過程内の疾患状態を診断することと、を含んでもよい。本例は、疾患状態に関連する診断出力を生成することを更に含んでもよい。少なくともある場合には、ペプチド構造プロファイルは、グリコシル化ペプチド、脱グリコシル化ペプチド、またはその両方を含んでもよい。
【選択図】図3

【特許請求の範囲】
【請求項1】
脂肪肝疾患(FLD)進行と関連付けられる複数の状態に関して生体試料を分類する方法であって、
対象から得られた前記生体試料中の糖タンパク質のセットに対応するペプチド構造データを受信することと、
ペプチド構造のセットについての前記ペプチド構造データから特定された定量化データを機械学習モデルに入力することであって、前記ペプチド構造のセットが、表1の複数のペプチド構造から特定された少なくとも1つのペプチド構造を含む、前記入力することと、
前記機械学習モデルを使用して前記定量化データを分析し、疾患インジケータを生成することと、
前記生体試料を、前記FLD進行と関連付けられた前記複数の状態のうちの対応する状態を証明するものとして分類する前記疾患インジケータに基づいて、診断出力を生成することと、を含む、方法。
【請求項2】
前記疾患インジケータがスコアを含み、前記診断出力を生成することは、
前記スコアが前記複数の状態のうちの前記対応する状態と関連付けられた選択された範囲内に入ると決定することと、
前記スコアが対応する状態と関連付けられた前記選択された範囲内に入るという決定に応答して、前記生体試料が前記対応する状態を証明すると決定することと、を含む、請求項1に記載の方法。
【請求項3】
前記複数の状態が、非アルコール性脂肪性肝炎(NASH)状態及び肝細胞癌(HCC)状態を含む、請求項1に記載の方法。
【請求項4】
前記複数の状態が、健常状態、肝臓疾患のない状態、または良性肝腫瘤状態のうちの少なくとも1つを含む非NASH/HCC状態を含む、請求項1に記載の方法。
【請求項5】
前記少なくとも1つのペプチド構造が、表1で特定される、ペプチド配列によって定義される糖ペプチド構造と、前記ペプチド配列の連結部位で前記ペプチド配列に連結しているグリカン構造と、を含み、前記ペプチド配列が、表1で定義される配列番号23、24、25、29、30、31、33、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、または52のうちの1つである、請求項1に記載の方法。
【請求項6】
前記ペプチド構造のセットのうちのあるペプチド構造についての前記定量化データが、存在量、相対存在量、正規化存在量、相対量、調整量、正規化量、相対濃度、調整濃度、または正規化濃度のうちの少なくとも1つを含む、請求項1に記載の方法。
【請求項7】
前記ペプチド構造データが、多重反応モニタリング質量分析(MRM-MS)を使用して生成される、請求項1に記載の方法。
【請求項8】
脂肪肝疾患(FLD)進行と関連付けられる複数の状態のうちの1つを有する対象を診断するようにモデルを訓練する方法であって、
前記FLD進行と関連付けられる前記複数の状態と診断された複数の対象のペプチド構造のパネルについての定量化データを受信することであって、前記定量化データが、前記複数の対象の複数のペプチド構造プロファイルを含み、前記複数のペプチド構造プロファイルの各ペプチド構造プロファイルに対する前記複数の状態のうちの対応する状態を特定する、前記受信することと、
前記複数の状態のうちのどの状態に前記対象からの生体試料が対応するのかを決定するように、前記定量化データを使用して機械学習モデルを訓練することと、を含む、方法。
【請求項9】
前記機械学習モデルを訓練することが、
前記複数の状態のうちのどの状態に前記対象からの前記生体試料が対応するのかを決定するように、前記ペプチド構造のパネルのサブセットであるペプチド構造のセットに対応する前記定量化データの一部分を使用して前記機械学習モデルを訓練することを含む、請求項8に記載の方法。
【請求項10】
前記複数の対象の前記定量化データを使用して差次的発現分析を行うことを更に含む、請求項9に記載の方法。
【請求項11】
前記ペプチド構造のセットを、前記差次的発現分析の一部として計算された倍率変化、偽発見率、またはp値のうちの少なくとも1つに基づいて、前記複数の状態のうちのどの状態に前記対象からの前記生体試料が対応するかを決定することに関連性のある前記ペプチド構造のパネルの前記サブセットとして特定することを更に含む、請求項10に記載の方法。
【請求項12】
前記複数の状態が、非アルコール性脂肪性肝炎(NASH)状態、肝細胞癌(HCC)状態、または健常状態のうちの少なくとも1つを更に含む、請求項8に記載の方法。
【請求項13】
生体試料中の脂肪肝疾患(FLD)進行と関連付けられる複数の状態のうちの1つの存在を検出する方法であって、
対象から得られた前記生体試料中の糖タンパク質のセットに対応するペプチド構造データを受信することと、
教師あり機械学習モデルを使用して前記ペプチド構造データを分析し、表1で特定されるペプチド構造の群から選択される少なくとも3つのペプチド構造に基づいて疾患インジケータを生成することと、
前記疾患インジケータが、前記対応する状態と関連付けられる選択された範囲内に入るという決定に応答して、前記FLD進行と関連付けられる前記複数の状態のうちの対応する状態の存在を検出することと、を含む、方法。
【請求項14】
前記少なくとも3つのペプチド構造のうちのあるペプチド構造が、表1で特定される、ペプチド配列によって定義される糖ペプチド構造と、前記ペプチド配列の連結部位で前記ペプチド配列に連結しているグリカン構造と、を含み、前記ペプチド配列が、表1で定義される配列番号23、24、25、29、30、31、33、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、52、または52のうちの1つである、請求項13に記載の方法。
【請求項15】
前記教師あり機械学習モデルが、ロジスティック回帰モデルを含む、請求項13に記載の方法。
【請求項16】
前記教師あり機械学習モデルが、罰則付き多変量ロジスティック回帰モデルを含む、請求項13に記載の方法。
【請求項17】
前記ペプチド構造データが、定量化データを含み、前記ペプチド構造の群のうちのあるペプチド構造についての前記定量化データが、存在量、相対存在量、正規化存在量、相対量、調整量、正規化量、相対濃度、調整濃度、または正規化濃度のうちの少なくとも1つを含む、請求項13に記載の方法。
【請求項18】
前記疾患インジケータが確率スコアである、請求項13に記載の方法。
【請求項19】
前記対象について検出された前記対応する状態に基づいて、診断を含むレポートを生成することを更に含む、請求項13に記載の方法。
【請求項20】
前記複数の状態が、非アルコール性脂肪性肝炎(NASH)状態、肝細胞癌(HCC)状態、及び非NASH/HCC状態からなる群から選択される少なくとも2つを含む、請求項13に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年9月30日出願の米国仮特許出願第63/251,021号及び2020年11月25日出願の米国仮特許出願第63/118,486号の優先権を主張し、これらの各々は、その全体が参照により本明細書に組み込まれる。
【0002】
本開示は、概して、脂肪性肝疾患(FLD)進行の状態を診断及び/または治療するための方法及びシステムに関する。より具体的には、本開示は、疾患進行に関連する対象の疾患状態(例えば、健常、NASH、HCC)の診断評価、及び/または対象の治療に使用するために、対象から得られた生体試料中で検出されたペプチド構造のセットの定量化データを分析することに関する。
【背景技術】
【0003】
タンパク質グリコシル化及び他の翻訳後修飾は、ヒトの生理学の事実上全ての側面において重要な役割を果たす。当然のことながら、不完全なまたは変質したタンパク質グリコシル化は、様々な疾患状態を伴うことが多い。異常なグリコシル化の特定により、罹患対象の早期発見、介入、及び治療の機会が得られる。プロテオミクス及びゲノミクスの分野で開発されたものなどの現在のバイオマーカー特定方法を使用して、がんなどのある特定の疾患のインジケータを検出すること、及びある特定の種類のがんを他の非癌性疾患と区別することができる。しかしながら、グリコプロテオミクス分析の使用を用いた疾患過程の特定は、これまで成功していない。更に、グリコプロテオミクス分析を使用した疾患進行に関連する疾患状態の特定は、これまで成功していない。
【0004】
糖タンパク質分析は、いくつかのレベルで課題が多い。例えば、ペプチド中の単一グリカン組成は、異なるグリコシド結合、分岐パターン、及び/または同じ質量を有する複数の単糖に起因する多数の異性体構造を含み得る。加えて、同じペプチド骨格を共有する複数のグリカンの存在により、様々な糖型からのアッセイシグナルが生じ、脱グリコシル化ペプチドと比較してそれらの個々の存在量が低下し得る。したがって、ペプチド断片上のグリカン構造を特定することができるアルゴリズムの開発は依然として得難い。
【0005】
上記を踏まえて、タンパク質のグリコシル化パターンに関する情報(この情報により、今度は疾患過程を特定するために使用することができる定量的情報が得られる)を取得するための糖タンパク質の部位特異的分析を伴う改善された分析方法が必要とされている。本開示は、部位特異的糖タンパク質分析を機械学習及び高度な質量分析機器と組み合わせて、NASH及びHCCを含むがこれらに限定されない特定の疾患状態を示すペプチド構造を定量的に分析することによって、この必要及び他の必要に対処する。
【0006】
非アルコール性脂肪性肝臓疾患(NAFLDまたはFLD)は、肥満及び代謝症候群の世界的な流行の副産物である。FLDは脂肪蓄積及び炎症の段階を経てNASHに進行し、少数のNASH患者がHCCに進行する。患者のFLD病期を高精度で知ることで、医療従事者は治療を個々の患者に対してカスタマイズし、より良い転帰を得ることができるようになる。しかしながら、現在の診断技術は、FLDの病期(例えば、患者が単に脂肪蓄積、NASH、またはHCCを有するかどうか)を決定的に予測するのに必要な精度を有していない。このため、これらの状態と健常状態とを区別することができる方法及びシステムを有することが望ましい場合がある。
【発明の概要】
【0007】
1つ以上の実施形態において、脂肪肝疾患(FLD)進行と関連付けられる複数の状態に関して生体試料を分類するための方法が提供される。本方法は、対象から得られた生体試料中の糖タンパク質のセットに対応するペプチド構造データを受信することを含む。ペプチド構造のセットについてのペプチド構造データから特定された定量化データは、機械学習モデルに入力される。ペプチド構造のセットは、表1の複数のペプチド構造から特定された少なくとも1つのペプチド構造を含む。定量化データは、機械学習モデルを使用して分析され、疾患インジケータを生成する。生体試料を、FLD進行と関連付けられた複数の状態のうちの対応する状態を証明するものとして分類する疾患インジケータに基づいて、診断出力が生成される。
【0008】
1つ以上の実施形態において、モデルを訓練して、脂肪肝疾患(FLD)進行と関連付けられる複数の状態のうちの1つを有する対象を診断するための方法が提供される。本方法は、FLD進行と関連付けられる複数の状態と診断された複数の対象のペプチド構造のパネルについての定量化データを受信することを含む。定量化データは、複数の対象の複数のペプチド構造プロファイルを含み、複数のペプチド構造プロファイルの各ペプチド構造プロファイルに対する複数の状態のうちの対応する状態を特定する。機械学習モデルは、複数の状態のうちのどの状態に対象からの生体試料が対応するのかを決定するように、定量化データを使用して訓練される。
【0009】
1つ以上の実施形態において、生体試料中の脂肪肝疾患(FLD)進行と関連付けられる複数の状態のうちの1つの存在を検出するための方法が提供される。本方法は、対象から得られた生体試料中の糖タンパク質のセットに対応するペプチド構造データを受信することを含む。ペプチド構造データは、教師あり機械学習モデルを使用して分析され、表1で特定されるペプチド構造の群から選択される少なくとも3つのペプチド構造に基づいて疾患インジケータを生成する。疾患インジケータが、対応する状態と関連付けられる選択された範囲内に入るという決定に応答して、FLD進行と関連付けられる複数の状態のうちの対応する状態の存在が検出される。
【0010】
1つ以上の実施形態において、脂肪肝疾患(FLD)進行と関連付けられる複数の状態のうちの1つに対応するものとして生体試料を分類するための方法が提供される。本方法は、訓練データを使用して教師あり機械学習モデルを訓練することを含む。訓練データは、複数の訓練対象の複数のペプチド構造プロファイルを含み、複数のペプチド構造プロファイルの各ペプチド構造プロファイルに対する複数の状態のうちの一状態を特定する。対象から得られた生体試料中の糖タンパク質のセットに対応するペプチド構造データが受信される。ペプチド構造のセットについてのペプチド構造データから特定された定量化データは、訓練された教師あり機械学習モデルに入力される。ペプチド構造のセットは、表1で特定される少なくとも1つのペプチド構造を含む。定量化データは、教師あり機械学習モデルを使用して分析され、スコアを生成する。スコアが、FLD進行と関連付けられた複数の状態のうちの対応する状態と関連付けられた選択された範囲内に入るという決定がなされる。診断出力が生成され、この診断出力は、生体試料が対応する状態を証明することを示す。複数の状態は、非アルコール性脂肪性肝炎(NASH)状態、肝細胞癌(HCC)状態、及び非NASH/HCC状態を含む。
【0011】
1つ以上の実施形態において、患者における非アルコール性脂肪性肝炎(NASH)障害を治療して、NASH障害の肝細胞癌への進行の低減、失速、または逆転のうちの少なくとも1つを行う方法が提供される。本方法は、患者から生体試料を受け取ることを含む。生体試料中の表1で特定される各ペプチド構造の量は、多重反応モニタリング質量分析(MRM-MS)システムを使用して決定される。機械学習モデルを使用して各ペプチド構造の量を分析し、疾患インジケータを生成する。診断出力は、生体試料を、患者がNASH障害を有することを証明するものとして分類する疾患インジケータに基づいて生成される。オベチコール酸(OCA)またはその誘導体が患者に投与される。投与には、1日10~25mgの範囲の静脈内投与または経口投与の少なくとも一方が含まれる。
【0012】
1つ以上の実施形態において、患者における肝細胞癌(HCC)障害を治療するための方法が提供される。本方法は、患者から生体試料を受け取ることを含む。生体試料中の表1で特定される各ペプチド構造の量は、多重反応モニタリング質量分析(MRM-MS)システムを使用して決定される。機械学習モデルを使用して各ペプチド構造の量を分析し、疾患インジケータを生成する。診断出力は、生体試料を、患者がHCC障害を有することを証明するものとして分類する疾患インジケータに基づいて生成される。治療が施され、本治療には、患者へのソラフェニブまたはその誘導体(本投与には、毎日775~825mgの範囲の静脈内投与または経口投与の少なくとも一方が含まれる)、患者へのレンバチニブまたはその誘導体(本投与には、患者の体重が60kg未満であるときには7.5~8.5mg/日、患者の体重が60kg超であるときには11.5~12.5mg/日の範囲の静脈内投与または経口投与の少なくとも一方が含まれる)、患者へのニボルマブまたはその誘導体(本投与には、0.75~1.25mg/kgの範囲の静脈内投与または経口投与の少なくとも一方が含まれる)、患者へのレゴラフェニブまたはその誘導体(本投与には、150~170mg/日の範囲の経口投与が含まれる)、患者へのカボザンチニブまたはその誘導体(本投与には、50~70mg/日の範囲の静脈内投与または経口投与の少なくとも一方が含まれる)、あるいは患者へのラムシルマブまたはその誘導体(本投与には、8~12mg/kgの範囲の静脈内投与または経口投与の少なくとも一方が含まれる)のうちの少なくとも1つが含まれる。
【0013】
1つ以上の実施形態において、脂肪肝疾患(FLD)進行と関連付けられる疾患状態と診断された対象の治療を設計するための方法が提供される。本方法は、本明細書に開示される方法のうちのいずれか1つ以上の一部または全部を使用して、対象から得られる生体試料が疾患状態を証明すると決定することに応答して、対象を治療するための治療薬を設計することを含む。
【0014】
1つ以上の実施形態において、脂肪肝疾患(FLD)進行と関連付けられる疾患状態と診断された対象の治療を計画するための方法が提供され、本方法は、本明細書に開示される方法のうちのいずれか1つ以上の一部または全部を使用して、対象から得られる生体試料が疾患状態を証明すると決定することに応答して、対象を治療するための治療計画を生成することを含む。
【0015】
1つ以上の実施形態において、脂肪肝疾患(FLD)進行と関連付けられる疾患状態と診断された対象を治療するための方法が提供され、本方法は、本明細書に開示される方法のうちのいずれか1つ以上の一部または全部を使用して、対象から得られた生体試料が疾患状態を証明すると決定することに基づいて、対象を治療するための治療薬を対象に投与することを含む。
【0016】
1つ以上の実施形態において、脂肪肝疾患(FLD)進行と関連付けられる疾患状態と診断された対象を治療するための方法が提供され、本方法は、本明細書に開示される方法のうちのいずれか1つ以上の一部または全部を使用して、対象が治療薬に応答すると決定することに基づいて、対象を治療するために治療薬を選択することを含む。
【0017】
1つ以上の実施形態において、患者からの試料中のペプチド構造のセットを分析するための方法が提供される。本方法は、(a)患者から試料を得ることと、(b)試料を調製して、ペプチド構造のセットを含む調製された試料を形成することと、(c)液体クロマトグラフィーシステムを使用して、調製された試料をモニタリング質量分析システムに入力することと、(d)ペプチド構造のセットの各ペプチド構造と関連付けられる生成物イオンのセットを検出することと、(e)モニタリング質量分析システムを使用して、生成物イオンのセットの定量化データを生成することと、を含む。ペプチド構造のセットは、表4で特定されるペプチド構造PS-1~PS-53から選択される少なくとも1つのペプチド構造を含む。ペプチド構造のセットは、(i)質量電荷(m/z)比が、このペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±1.5以内である、前駆体イオンと、(ii)m/zが、このペプチド構造に対応するものとして表4で第1の生成物イオンについて列挙されるm/z比の±1.0以内である、生成物イオンと、を含む。
【0018】
1つ以上の実施形態において、組成物が提供され、本組成物は、表1で特定されるペプチド構造PS-1~PS-53のうちの少なくとも1つを含む。
【0019】
1つ以上の実施形態において、組成物が提供され、本組成物は、ペプチド構造または生成物イオンを含む。ペプチド構造または生成物イオンは、表1のペプチド構造PS-1~PS-53に対応する、配列番号23~52のうちのいずれか1つと少なくとも90%の配列同一性を有するアミノ酸配列を含む。生成物イオンは、特定されるm/z範囲内に入る生成物イオンを含む、表4で特定される生成物イオンからなる群から1つとして選択される。
【0020】
1つ以上の実施形態において、組成物が提供され、本組成物は、表4で特定されるペプチド構造PS-1~PS-53からなる群から1つとして選択される糖ペプチド構造を含む。糖ペプチド構造は、糖ペプチド構造に対応するものとして表5で特定されるアミノ酸ペプチド配列と、グリカン構造が表1で特定される対応する位置でアミノ酸ペプチド配列の残基に連結している糖ペプチド構造に対応するものとして表1で特定されるグリカン構造とを含む。グリカン構造は、グリカン組成を有する。
【0021】
1つ以上の実施形態において、組成物が提供され、本組成物は、表1で特定される複数のペプチド構造から1つとして選択されるペプチド構造を含む。ペプチド構造は、表1のペプチド構造に対応するものとして特定されるモノアイソトピック質量を有する。ペプチド構造は、ペプチド構造に対応するものとして表1で特定される配列番号23~52のアミノ酸配列を含む。
【0022】
1つ以上の実施形態では、キットが提供され、本キットは、本明細書に開示される方法のうちのいずれか1つ以上の一部または全部を実行するために、表1で特定される少なくとも1つのペプチド構造を定量化するための少なくとも1つの薬剤を含む。
【0023】
1つ以上の実施形態では、キットが提供され、本キットは、本明細書に開示される方法のうちのいずれか1つ以上を実行するために、糖ペプチド標準、緩衝液、またはペプチド配列のセットのうちの少なくとも1つを含む。ペプチド配列のセットのうちのあるペプチド配列は、表1で定義される配列番号23~52の対応するものによって特定される。
【0024】
1つ以上の実施形態では、システムは、1つ以上のデータプロセッサと、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、本明細書に開示される方法のうちのいずれか1つ以上の一部または全部を実施させる命令を含む非一時的コンピュータ可読記憶媒体とを含む。
【0025】
1つ以上の実施形態では、1つ以上のデータプロセッサに、本明細書に開示される方法のうちのいずれか1つ以上の一部または全部を実施させるように構成されている命令を含む、非一時的機械可読記憶媒体に有形的に統合されるコンピュータプログラム製品が提供される。
【0026】
本開示は、添付の図面と併せて説明される。
【図面の簡単な説明】
【0027】
図1】1つ以上の実施形態による、診断及び/または治療に使用するために疾患状態と関連付けられるペプチド構造を検出するための例示的なワークフローの概略図である。
図2A】1つ以上の実施形態による調製ワークフローの概略図である。
図2B】1つ以上の実施形態によるデータ取得の概略図である。
図3】1つ以上の実施形態による分析システムのブロック図である。
図4】様々な実施形態によるコンピュータシステムのブロック図である。
図5】1つ以上の実施形態による、FLD進行に関して対象から得られた生体試料を評価するためのプロセスのフローチャートである。
図6】1つ以上の実施形態による、FLD進行と関連付けられる疾患状態の存在を検出するためのプロセスのフローチャートである。
図7】様々な実施形態による、複数の状態のうちのどの状態に生体試料が対応するかを決定するように教師あり機械学習モデルを訓練するためのプロセスのフローチャートである。
図8】1つ以上の実施形態による、脂肪肝疾患(FLD)進行と関連付けられる複数の状態のうちの1つに対応するものとして生体試料を分類するためのプロセスのフローチャートである。
図9】1つ以上の実施形態による、NASHについて対象を治療するためのプロセスのフローチャートである。
図10】1つ以上の実施形態による、NASHについて対象を治療するためのプロセスのフローチャートである。
図11】1つ以上の実施形態による、実験に使用される試料集団の表である。
図12】1つ以上の実施形態による、検証に使用される試料集団の表である。
図13】1つ以上の実施形態による、示される質量分析を介して特定及び定量化された選択されたペプチド構造の平均正規化存在量のプロットの図解である。
図14】1つ以上の実施形態による、A2MGの選択されたペプチド構造の正規化存在量のプロットの図解である。
図15】1つ以上の実施形態による、AGP1の選択されたペプチド構造の正規化存在量のプロットの図解である。
図16】1つ以上の実施形態による、HPTの選択されたペプチド構造の正規化存在量のプロットの図解である。
図17】1つ以上の実施形態による、CFAHの選択されたペプチド構造の正規化存在量のプロットの図解である。
図18】1つ以上の実施形態による、A1ATの選択されたペプチド構造の正規化存在量のプロットの図解である。
図19】1つ以上の実施形態による、制御状態、NASH状態、及びHCC状態を区別する疾患インジケータの能力の検証を例解するプロット図である。
図20】1つ以上の実施形態による、訓練セットと試験セットとの両方についての、NASH状態とHCC状態とを区別するための受信者動作特性(ROC)曲線のプロット図である。
図21】1つ以上の実施形態による、対照(例えば、健常)状態対HCC、及び良性肝腫瘤対HCCに関する、これら10個のペプチド構造の正規化存在量のプロットである。
図22】1つ以上の実施形態による、訓練セットと試験セットとの両方についての、HCCと良性肝腫瘤とを区別するための受信者動作特性(ROC)曲線のプロットである。
【発明を実施するための形態】
【0028】
I.概要
本明細書に記載の実施形態は、グリコプロテオミクスが、様々な種類の疾患を有する対象の全体的な診断及び/または治療に使用することができる新興分野であることを認識する。グリコプロテオミクスは、所与の試料(例えば、血液試料、細胞、組織など)の中のグリカン及びグリコシル化タンパク質の位置、素性、及び量を決定することを目的とする。タンパク質グリコシル化は、翻訳後タンパク質修飾の最も一般的かつ最も複雑な形態のうちの1つであり、タンパク質の構造、配座、及び機能に影響を与え得る。例えば、糖タンパク質は、細胞シグナル伝達、宿主と病原体との相互作用、ならびに免疫応答及び疾患などの重要な生物学的過程において重要な役割を果たし得る。したがって、糖タンパク質は、異なる種類の疾患を診断するために重要であり得る。糖タンパク質は、疾患内の病期(例えば、FLDの病期)を区別するためにも重要であり得る。
【0029】
タンパク質グリコシル化により、がん、他の疾患、及び疾患分析の病期決定に関する有用な情報が得られるが、タンパク質グリコシル化は、典型的には、現在利用可能な方法論を用いては、グリカンを起源のタンパク質部位まで遡ることができないため、困難であり得る。糖タンパク質分析は、いくつかの理由で概して困難であり得る。例えば、ペプチド中の単一グリカン組成は、異なるグリコシド結合、分岐、及び同じ質量を有する多くの単糖を理由に、多数の異性体構造を含み得る。更に、同じペプチド配列を共有する複数のグリカンの存在により、質量分析(MS)シグナルが様々な糖型に分裂してもよく、グリコシル化されていないペプチド(脱グリコシル化ペプチド)と比較してそれらの個々の存在量が低下し得る。
【0030】
しかし、様々な疾患状態及び疾患進行を理解し、ある特定の疾患状態をより正確に診断するために、糖タンパク質の分析を実行し、タンパク質内のグリカンだけでなく、結合部位(例えば、結合点のアミノ酸残基)も特定することが重要であり得る。このため、疾患状態についての情報を提供できる可能性があるタンパク質グリコシル化パターンについての詳細な情報を得るために、部位特異的糖タンパク質分析のための方法を提供する必要がある。この情報は、疾患状態を他の状態と区別するため、対象がその疾患状態を有するか否かを診断するため、対象がその疾患状態を有する可能性を決定するため、またはそれらの組み合わせを行うために、使用することができる。そのような分析は、例えば、非限定的に、非アルコール性脂肪性肝炎(NASH)状態、肝細胞癌(HCC)状態、及び非NASH/HCC状態(非アルコール性FLD疾患状態、対照状態、健常状態、肝臓疾患のない状態、または良性肝腫瘤状態のうちの少なくとも1つを含んでもよい)のうちの2つ以上を区別することに有用であってもよい。
【0031】
したがって、本明細書に記載の実施形態は、対象におけるタンパク質、特に糖タンパク質を分析するための様々な方法及びシステムを提供する。1つ以上の実施形態において、機械学習モデルは、ペプチド構造データを分析し、1つ以上の疾患に関する情報を提供する疾患インジケータを生成するように訓練される。例えば、様々な実施形態において、ペプチド構造データは、ペプチド構造についての定量化メトリック(例えば、存在量または濃度データ)を含む。ペプチド構造は、脱グリコシル化ペプチド配列(例えば、より大きな親タンパク質のペプチドまたはペプチド断片)またはグリコシル化ペプチド配列によって定義されてもよい。グリコシル化ペプチド配列(糖ペプチド構造とも称される)は、例えば、アミノ酸残基の特定の原子を介して生じ得る、ペプチド配列の連結部位(例えば、アミノ酸残基)に結合されるグリカン構造を有するペプチド配列であってもよい。グリコシル化ペプチドの非限定的な例としては、N結合型糖ペプチド及びO結合型糖ペプチドが挙げられる。
【0032】
本明細書に記載の実施形態は、対象から得られた生体試料中の選択されたペプチド構造の存在量を使用して、その対象が特定の疾患状態(例えば、FLDの病期)を有する可能性を決定し得ることを認識する。
【0033】
生体試料中のペプチド配列及びグリコシル化ペプチド配列の存在量を分析することで、FLD内の進行の状態を区別するより正確な方法を得ることができる。この種類のペプチド構造分析は、質量分析によって分解するには大きすぎる糖タンパク質を分析することに焦点を当てた糖タンパク質分析と比較して、正確な診断を生成するのに役立ち得る。更に、糖タンパク質では、考慮すべき可能性のあるプロテオフォームが多すぎる場合がある。更に、本明細書の様々な実施形態によって説明される様式でペプチド構造データを分析することは、様々なグリカン構造がどのタンパク質及びどのアミノ酸残基部位に結合するかについての情報をほとんどまたはまったく提供しないグライコミクス分析と比較して、正確な診断を生成するのに役立ち得る。
【0034】
以下の説明は、FLDと関連付けられる疾患状態(例えば、NASH状態、HCC状態など)の研究、診断、及び/または治療(例えば、治療の設計、計画、及び/または製造)のための、本明細書に記載される方法及びシステムの例示的な実践を提供する。本明細書で使用される場合の様々な用語の説明及び例は、以下のセクションIIで提供される。
【0035】
II.用語の例示的な説明
「1つ(ones)」という用語は、1つ超であることを意味する。
【0036】
本明細書で使用される場合、「複数」という用語は、2、3、4、5、6、7、8、9、10、またはそれより多くてもよい。
【0037】
本明細書で使用される場合、「のセット」という用語は、1つ以上であることを意味する。例えば、アイテムのセットは、1つ以上のアイテムを含む。
【0038】
本明細書で使用される場合、「のうちの少なくとも1つ」という語句は、アイテムのリストとともに使用されるとき、リストされたアイテムのうちの1つ以上の異なる組み合わせが使用されてもよく、リスト内のアイテムのうちの1つしか必要とされない場合があることを意味する。アイテムは、特定の物体、物、ステップ、操作、プロセス、またはカテゴリであってもよい。言い換えれば、「のうちの少なくとも1つ」は、アイテムの任意の組み合わせまたはアイテムの数がリストから使用されてもよいが、リスト内のアイテムの全てが必要とされ得るわけではないことを意味する。例えば、限定されないが、「アイテムA、アイテムB、またはアイテムCのうちの少なくとも1つ」は、アイテムA;アイテムA及びアイテムB;アイテムB;アイテムA、アイテムB、及びアイテムC;アイテムB及びアイテムC;またはアイテムA及びCを意味する。ある場合には、「アイテムA、アイテムB、またはアイテムCのうちの少なくとも1つ」は、アイテムAのうちの2つ、アイテムBのうちの1つ、及びアイテムCのうちの10個;アイテムBのうちの4つ及びアイテムCのうちの7つ;またはいくつかの他の好適な組み合わせを意味するが、これらに限定されない。
【0039】
本明細書で使用される場合、「実質的に」は、意図された目的のために動作するのに十分であることを意味する。このため、「実質的に」という用語は、全体的な性能には明らかに影響しない、本分野の当業者が予想するような、絶対的または完全な状態、寸法、測定、結果などからのわずかな取るに足らない変動を許容する。数値またはパラメータまたは数値として表すことができる特性に関して使用されるとき、「実質的に」は、10%以内であることを意味する。
【0040】
「アミノ酸」という用語は、本明細書で使用される場合、概して、特定のアミノ酸に基づいて変動するアミノ基(例えば、-NH2)、カルボキシル基(-COOH)、及び側鎖基(R)を含む任意の有機化合物を指す。アミノ酸は、ペプチド結合を使用して連結し得る。
【0041】
「アルキル化」という用語は、本明細書で使用される場合、概して、ある分子から別の分子へのアルキル基の移動を指す。様々な実施形態において、アルキル化は、還元されたシステインと反応して、還元が行われた後のジスルフィド結合の再形成を防止するために使用される。
【0042】
「連結部位」または「グリコシル化部位」という用語は、本明細書で使用される場合、概して、グリカンまたはグリカン構造の糖分子が、ペプチド、ポリペプチド、またはタンパク質のアミノ酸に直接結合(例えば、共有結合)する場所を指す。例えば、連結部位はアミノ酸残基であってもよく、グリカン構造はアミノ酸残基の原子を介して連結していてもよい。グリコシル化の種類の非限定的な例としては、N結合型グリコシル化、O結合型グリコシル化、C結合型グリコシル化、S結合型グリコシル化、及び糖化を挙げることができる。
【0043】
「生体試料」、「生体標本」、または「生物検体」という用語は、本明細書で試料される場合、概して、典型的には対象から、標本の供給源を代表するようにサンプリングによって採取される標本を指す。生体試料は、生物全体、特定の組織、細胞型、または目的のカテゴリもしくはサブカテゴリを代表するものであり得る。生体試料は、高分子を含み得る。生体試料は、小分子を含み得る。生体試料は、ウイルスを含み得る。生体試料は、細胞または細胞の誘導体を含み得る。生体試料は、細胞小器官を含み得る。生体試料は、細胞核を含み得る。生体試料は、細胞の集団からの希少な細胞を含み得る。生体試料は、単細胞生物に由来するか多細胞生物に由来するかにかかわらず、原核細胞、真核細胞、細菌、真菌、植物、哺乳動物、または他の動物細胞型、マイコプラズマ、健常組織細胞、腫瘍細胞、もしくは任意の他の細胞型を含むがこれらに限定されない、任意型の細胞を含み得る。生体試料は、細胞の構成成分を含み得る。生体試料は、ヌクレオチド(例えば、ssDNA、dsDNA、RNA)、細胞小器官、アミノ酸、ペプチド、タンパク質、炭水化物、糖タンパク質、またはそれらの任意の組み合わせを含み得る。生体試料は、細胞、または細胞(例えば、細胞ビーズ)からの1つ以上の構成成分、例えば、細胞からのDNA、RNA、細胞小器官、タンパク質、もしくはそれらの任意の組み合わせを含む、マトリックス(例えば、ゲルまたはポリマーマトリックス)を含み得る。生体試料は、対象の組織から得られてもよい。生体試料は、硬化細胞を含み得る。そのような硬化細胞は、細胞壁または細胞膜を含む場合も含まない場合もある。生体試料は、細胞の1つ以上の構成成分を含み得るが、細胞の他の構成成分を含まない場合がある。そのような構成成分の例としては、核または細胞小器官を挙げることができる。生体試料は、生細胞を含まない場合がある。生細胞は、培養可能であり得る。
【0044】
「バイオマーカー」という用語は、本明細書で使用される場合、概して、対象から試料として採取される任意の測定可能な物質であって、それが存在することにより何らかの現象が示される、物質を指す。そのような現象の非限定的な例としては、疾患状態、病状、または化合物もしくは環境条件への曝露を挙げることができる。本明細書に記載の様々な実施形態において、バイオマーカーは、診断目的で(例えば、疾患状態、健康状態、無症候性状態、症候性状態などを診断するために)使用されてもよい。「バイオマーカー」という用語は、「マーカー」という用語と互換的に使用されてもよい。
【0045】
「変性」という用語は、本明細書で使用される場合、概して、天然状態においては存在する四次構造、三次構造、及び二次構造を喪失する任意の分子を指す。非限定的な例としては、酸、塩基、温度、圧力、放射線などの外部化合物または環境条件に曝露されているタンパク質または核酸が挙げられる。
【0046】
「変性タンパク質」という用語は、本明細書で使用される場合、概して、天然状態においては存在する四次構造、三次構造、及び二次構造を喪失するタンパク質を指す。
【0047】
「消化」または「酵素消化」という用語は、本明細書で使用される場合、概して、ポリマーを分解する(例えば、切断部位でポリペプチドを切断する)ことを指す。タンパク質は、トリプシン消化プロトコルを使用する質量分析に備えて消化されてもよい。アクセスが切断部位に限定されている場合、タンパク質は、質量分析に備えて他のプロテアーゼを使用して消化されてもよい。
【0048】
「免疫チェックポイント阻害剤治療薬」及び「免疫チェックポイント阻害剤薬」という用語は、本明細書で使用される場合、概して、免疫チェックポイント分子(例えば、免疫応答を開始するために活性化(または不活性化)される必要がある免疫細胞上の分子)を標的にすることができる薬物または治療薬を指す。免疫チェックポイント阻害剤治療薬の非限定的な例としては、ペムブロリズマブ、ニボルマブ、及びセミプリマブを挙げることができる。
【0049】
「疾患進行」という用語は、本明細書で使用される場合、疾患が、無疾患またはあまり進行していない(例えば、重度の)疾患形態からより進行した(例えば、重度の)疾患形態に進行することを指す。疾患進行は、疾患の任意の数の段階を含んでもよい。
【0050】
「疾患状態」という用語は、本明細書で使用される場合、概して、生物の構造または機能に影響を及ぼす状態を指す。疾患状態の原因の非限定的な例としては、病原体、免疫系の機能不全、老化によって引き起こされる細胞損傷、他の要因(例えば、外傷及びがん)によって引き起こされる細胞損傷を挙げることができる。疾患状態には、例えば、疾患進行の段階が含まれ得る。例えば、FLDの場合、進行は、健常な段階から、脂肪蓄積及び炎症(脂肪肝)、非アルコール性脂肪性肝炎(NASH)、線維症、ならびに肝硬変の段階へと進行し得る。ある場合には、進行は、NASHから肝細胞癌(HCC)に進行し得る。疾患状態は、症候性であるか無症候性であるかにかかわらず、疾患の任意の状態を含み得る。疾患状態は、対象の構造または機能に軽度、中等度、または重度の乱れを引き起こし得る。
【0051】
「グリカン」または「多糖類」という用語は、本明細書で使用される場合、両方とも、概して、複合糖質の炭水化物残基、例えば、糖ペプチド、糖タンパク質、糖脂質、またはプロテオグリカンの炭水化物部分を指す。グリカンは単糖類を含み得る。
【0052】
「糖ペプチド」または「糖ポリペプチド」という用語は、本明細書で使用される場合、概して、少なくとも1つのグリカン残基を含むペプチドまたはポリペプチドを指す。様々な実施形態において、糖ペプチドは、アミノ酸残基の側鎖(すなわち、R基)に共有結合した炭水化物部分(例えば、1つ以上のグリカン)を含む。
【0053】
「糖タンパク質」という用語は、本明細書で使用される場合、概して、少なくとも1つのグリカン残基が結合しているタンパク質を指す。いくつかの例では、糖タンパク質は、少なくとも1つのオリゴ糖鎖が共有結合しているタンパク質である。糖タンパク質の例としては、アポリポタンパク質C-III(APOC3)、アルファ-1-抗キモトリプシン(AACT)、アファミン(AFAM)、アルファ-1-酸性糖タンパク質1及び2(AGP12)、アポリポタンパク質B-100(APOB)、アポリポタンパク質D(APOD)、補体C1s副成分(C1S)、カルパイン-3(CAN3)、クラステリン(CLUS)、補体成分C8A鎖(CO8A)、アルファ-2-HS糖タンパク質(FETUA)、ハプトグロビン(HPT)、免疫グロブリン重定常ガンマ1(IgG1)、免疫グロブリンJ鎖(IgJ)、血漿カリクレイン(KLKB1)、血清パラオキソナーゼ/アリールエステラーゼ1(PON1)、プロトロンビン(THRB)、セロトランスフェリン(TRFE)、タンパク質unc-13ホモログA(UN13A)、及び亜鉛-アルファ-2-糖タンパク質(ZA2G)が挙げられるが、これらに限定されない。糖ペプチドは、本明細書で使用される場合、別途逆の指定がない限り、糖タンパク質の断片を指す。
【0054】
「液体クロマトグラフィー」という用語は、本明細書で使用される場合、概して、試料を細分化するために使用される技法を指す。液体クロマトグラフィーを使用して、成分を分離、特定、及び定量化することができる。
【0055】
「質量分析」という用語は、本明細書で使用される場合、概して、分子を特定するために使用される分析技法を指す。本明細書に記載される様々な実施形態において、質量分析は、タンパク質の特性評価及び配列決定に関与し得る。
【0056】
「m/z」または「質量電荷比」という用語は、本明細書で使用される場合、概して、質量分析機器からの出力値を指す。様々な実施形態において、m/zは、所与のイオンの質量とそれが担持する素電荷の数との間の関係を表し得る。m/zの「m」は質量を表し、「z」は電荷を表す。いくつかの実施形態では、m/zは、質量スペクトルのx軸上に表示され得る。
【0057】
「ペプチド」という用語は、本明細書で使用される場合、概して、ペプチド結合によって連結されるアミノ酸を指す。ペプチドは、10~50残基のアミノ酸鎖を含み得る。ペプチドは、オリゴペプチド、ジペプチド、トリペプチド、及びテトラペプチドを含む、10残基より短いアミノ酸鎖を含み得る。ペプチドは、50残基より長い鎖を含むことができ、「ポリペプチド」または「タンパク質」と称されてもよい。
【0058】
「タンパク質」または「ポリペプチド」または「ペプチド」という用語は、本明細書では互換的に使用されてもよく、概して、少なくとも3つのアミノ酸残基を含む分子を指す。タンパク質は、ペプチド結合によって一緒に連結されたアミノ酸配列で作られているポリマー鎖を含み得る。タンパク質は、トリプシン消化プロトコルを使用する質量分析に備えて消化されてもよい。アクセスが切断部位に限定されている場合、タンパク質は、質量分析に備えて他のプロテアーゼを使用して消化されてもよい。
【0059】
「ペプチド構造」という用語は、本明細書で使用される場合、概して、ペプチドもしくはその一部分、または糖ペプチドもしくはその一部分を指す。本明細書に記載される様々な実施形態において、ペプチド構造は、少なくとも2つのアミノ酸を配列に含む任意の分子を含み得る。
【0060】
「還元」という用語は、本明細書で使用される場合、概して、物質による電子の獲得を指す。本明細書に記載される様々な実施形態において、糖は、タンパク質に直接結合することができ、それにより、それが結合するアミノ酸を還元する。このような還元反応は、グリコシル化において生じ得る。様々な実施形態では、還元を使用して、2つのシステイン間のジスルフィド結合を破壊してもよい。
【0061】
「試料」という用語は、本明細書で使用される場合、概して、目的の対象からの試料を指し、対象の生体試料を含んでもよい。試料には、細胞試料が含まれてもよい。試料には、細胞株または細胞培養試料が含まれてもよい。試料には、1つ以上の細胞が含まれ得る。試料には、1つ以上の微生物が含まれ得る。試料には、核酸試料またはタンパク質試料が含まれてもよい。また試料には、炭水化物試料または脂質試料が含まれてもよい。試料は、別の試料に由来してもよい。試料には、生検、コア生検、針吸引物、または微細針吸引物などの組織試料が含まれてもよい。試料には、流体試料、例えば、血液試料、尿試料、または唾液試料が含まれてもよい。試料には、皮膚試料が含まれてもよい。試料には、口腔スワブが含まれてもよい。試料には、血漿または血清試料が含まれてもよい。試料には、無細胞(cell-free)または無細胞(cell free)試料が含まれてもよい。無細胞試料には、細胞外ポリヌクレオチドが含まれてもよい。試料は、血液、血漿、血清、尿、唾液、粘膜排出物、痰、便、または涙液から生じてもよい。試料は、赤血球または白血球から生じてもよい。試料は、糞便、脊髄液、CNS液、胃液、羊水、嚢胞液、腹水、骨髄、胆汁、他の体液、生検から得られた組織、皮膚、または毛髪から生じてもよい。
【0062】
「配列」という用語は、本明細書で使用される場合、概して、組み立てられてポリマーを生成することができる一次元モノマーを含む生物学的配列を指す。配列の非限定的な例としては、ヌクレオチド配列(例えば、ssDNA、dsDNA、及びRNA)、アミノ酸配列(例えば、タンパク質、ペプチド、及びポリペプチド)、及び炭水化物(例えば、C(HO)を含む化合物)が挙げられる。
【0063】
「対象」という用語は、本明細書で使用される場合、概して、哺乳動物(例えば、ヒト)もしくは鳥類(例えば、トリ)などの動物、または植物などの他の生物を指す。例えば、対象には、脊椎動物、哺乳動物、齧歯類(例えば、マウス)、霊長類、サル、またはヒトが含まれ得る。動物としては、家畜、スポーツ用動物、及びペットを挙げることができるが、これらに限定されない。対象には、健常なもしくは無症候性の個体、疾患(例えば、がん)もしくは疾患の素因を有することが疑われたもしくは疑われる個体、及び/または療法を必要とするまたは療法を必要とすることが疑われる個体が含まれ得る。対象は、患者であり得る。対象には、微生物または菌類(例えば、細菌、真菌、古細菌、ウイルス)が含まれ得る。
【0064】
本明細書で使用される場合、「モデル」は、1つ以上のアルゴリズム、1つ以上の数学的手法、1つ以上の機械学習アルゴリズム、またはそれらの組み合わせを含んでもよい。
【0065】
本明細書で使用される場合、「機械学習」は、アルゴリズムを使用してデータを解析し、そこから学習し、次いで世界の物事について決定または予測を行う行為であってもよい。機械学習は、ルールベースのプログラミングに依存せずにデータから学習できるアルゴリズムを使用する。機械学習アルゴリズムには、パラメトリックモデル、非パラメトリックモデル、ディープラーニングモデル、ニューラルネットワーク、線形判別分析モデル、二次判別分析モデル、サポートベクターマシン、ランダムフォレストアルゴリズム、最近傍アルゴリズム、複合判別分析モデル、k平均クラスタ化アルゴリズム、教師ありモデル、教師なしモデル、ロジスティック回帰モデル、多変数回帰モデル、罰則付き多変数回帰モデル、または別の種類のモデルが含まれてもよい。
【0066】
本明細書で使用される場合、「人工ニューラルネットワーク」または「ニューラルネットワーク」(NN)は、計算に対するコネクショニズム的アプローチに基づいて情報を処理する人工ノードまたはニューロンの相互接続された群を模倣する数学的アルゴリズムまたは計算モデルを指してもよい。ニューラルネットワークは、ニューラルネットとも称され、非線形ユニットの1つ以上の層を用いて、受信した入力の出力を予測することができる。いくつかのニューラルネットワークは、出力層に加えて、1つ以上の隠れ層を含む。各隠れ層の出力は、ネットワークの次の層、すなわち、次の隠れ層または出力層への入力として使用される。ネットワークの各層は、パラメータのそれぞれのセットの現在の値に従って、受信された入力から出力を生成する。様々な実施形態において、「ニューラルネットワーク」への言及は、1つ以上のニューラルネットワークへの言及であってもよい。
【0067】
ニューラルネットワークは、情報を二様に処理することができる。つまり、それが訓練されているときには、訓練モードになり、それが学んだことを実践するときには、推論(または予測)モードになる。ニューラルネットワークは、出力が訓練データの出力と一致するように、ネットワークが中間の隠れ層内の個々のノードの重み係数を調整する(その挙動を修正する)ことを可能にするフィードバックプロセス(例えば、逆伝播)をとおして学習する。言い換えれば、ニューラルネットワークは、訓練データ(学習例)を与えられることにより学習し、最終的に、新しい範囲または入力セットが提示された場合でも正しい出力に到達する方法を学ぶ。ニューラルネットワークは、例えば、非限定的に、フィードフォワードニューラルネットワーク(FNN)、リカレントニューラルネットワーク(RNN)、モジュラーニューラルネットワーク(MNN)、畳み込みニューラルネットワーク(CNN)、残差ニューラルネットワーク(ResNet)、常微分方程式ニューラルネットワーク(neural-ODE)、または別の種類のニューラルネットワークのうちの少なくとも1つを含んでもよい。
【0068】
本明細書で使用される場合、「標的糖ペプチド分析物」は、ペプチド構造(例えば、グリコシル化されたものまたは脱グリコシル化された/グリコシル化されていないもの)、ペプチド構造の一部分、ペプチド構造のサブ構造(例えば、グリカンまたはグリコシル化部位)、上で列挙した構造及びサブ構造のうちの1つ以上の産物、会合した検出分子(例えば、シグナル分子、標識、またはタグ)、または質量分析によって測定することができるアミノ酸配列を指してもよい。
【0069】
本明細書で使用される場合、「ペプチドデータセット」は、「ペプチド構造データ」と交換可能に使用されてもよく、結果として生じる質量分析ランからのペプチドのまたはペプチドに関連する任意のデータを指し得る。ペプチドデータセットは、質量分析を使用して試料または生体試料から得られたデータを含み得る。ペプチドデータセットは、NGEP外部標準に関するデータ、内部標準に関連するデータ、及び試料の標的糖ペプチド分析物に関するデータを含み得る。ペプチドデータセットは、単一のランから生じる分析から得ることができる。いくつかの実施形態では、ペプチドデータセットは、1つ以上のペプチドの生存在量及び質量電荷比を含み得る。
【0070】
本明細書で使用される場合、「非グリコシル化内因性ペプチド」(「NGEP」)は、脱グリコシル化ペプチドと称されてもよく、グリカン分子を含まないペプチド構造を指してもよい。様々な実施形態において、NGEP及び標的糖ペプチド分析物は、同じ対象から生じ得る。様々な実施形態において、NGEPは、質量分析に備えて同位体で標識され得る。
【0071】
本明細書で使用される場合、「遷移」は、ペプチド構造を指すものであっても、ペプチド構造を特定するものであってもよい。いくつかの実施形態では、遷移は、前駆体イオン及び産物または断片イオンと関連付けられるm/z値の特定の対を指し得る。
【0072】
本明細書で使用される場合、「非グリコシル化内因性ペプチド」(「NGEP」)は、グリカン分子を含まないペプチド構造を指してもよい。様々な実施形態において、NGEP及び標的糖ペプチド分析物は、同じタンパク質配列に由来してもよい。いくつかの実施形態では、NGEP及び標的糖ペプチド分析物は、同じペプチド配列に由来しても、それを含んでもよい。様々な実施形態において、NGEPは、質量分析に備えて同位体で標識され得る。
【0073】
本明細書で使用される場合、「存在量値」は、「存在量」または存在量と関連付けられる定量値を指してもよい。
【0074】
本明細書で使用される場合、「存在量」は、質量分析を使用して生成された定量値を指してもよい。様々な実施形態において、定量値は、生体試料中に存在する特定のペプチド構造(例えば、バイオマーカー)の量に関係してもよい。いくつかの実施形態では、量は、試料中に存在する他の構造に関するもの(例えば、相対存在量)であってもよい。いくつかの実施形態では、定量値は、質量分析を使用して生成されたイオンの量を含んでもよい。いくつかの実施形態では、定量値は、m/z値(例えば、x軸上の存在量及びy軸上のm/z)と関連付けられてもよい。他の実施形態では、定量値は、原子質量単位で表されてもよい。
【0075】
本明細書で使用される場合、「相対存在量」は、2つ以上の存在量の比較を指してもよい。様々な実施形態において、比較は、1つのペプチド構造を総数のペプチド構造と比較することを含んでもよい。いくつかの実施形態では、比較は、1つのペプチド糖型(例えば、1つ以上のグリカンが異なる2つの同一のペプチド)をペプチド糖型のセットと比較することを含んでもよい。いくつかの実施形態では、比較は、特定のm/z比を有するイオンの数を、検出されたイオンの総数により比較することを含んでもよい。様々な実施形態において、相対存在量は、比として表され得る。他の実施形態では、相対存在量は、パーセンテージとして表され得る。相対存在量は、質量スペクトルプロットのy軸上に提示され得る。
【0076】
本明細書で使用される場合、「内部標準」は、質量分析を受ける標的糖ペプチド分析物と同じ試料中に含有(例えば、スパイクイン)され得るものを指してもよい。内部標準は、較正目的で使用され得る。加えて、内部標準は、本明細書に記載されるシステム及び方法で使用され得る。いくつかの態様では、内部標準は、類似性m/z及びまたは保持時間に基づいて選択することができ、特定の標準があまりにも高価であるか、または利用できない場合、「代理物」であることができる。内部標準は、重標識されていても、重標識されていなくてもよい。
【0077】
III.例示的なワークフローの概要
図1は、1つ以上の実施形態による、診断及び/または治療に使用するために疾患状態と関連付けられるペプチド構造を検出するための例示的なワークフロー100の概略図である。ワークフロー100は、例えば、試料収集102、試料取り入れ104、試料調製及び処理106、データ分析108、及び出力生成110を含む、種々の動作を含んでもよい。
【0078】
試料収集102は、例えば、対象114などの1つ以上の対象の生体試料112を取得することを含んでもよい。生体試料112は、1つ以上のサンプリング方法を介して取得された標本の形態をとってもよい。生体試料112は、対象114全体、あるいは特定の組織、細胞型、または目的の他のカテゴリもしくはサブカテゴリを代表するものであってもよい。生体試料112は、ある数の異なる方法のうちのいずれかで取得することができる。様々な実施形態において、生体試料112は、採血を介して取得された全血試料116を含む。他の実施形態において、生体試料112は、例えば、血清試料、血漿試料、血液細胞(例えば、白血球(WBC)、赤血球(RBC)試料、別の種類の試料、またはそれらの組み合わせを含む、等分試料118のセットを含む。生体試料112は、ヌクレオチド(例えば、ssDNA、dsDNA、RNA)、細胞小器官、アミノ酸、ペプチド、タンパク質、炭水化物、糖タンパク質、またはそれらの任意の組み合わせを含んでもよい。
【0079】
様々な実施形態において、単一ランは、試料(例えば、ペプチド分析物を含む試料)、外部標準(例えば、血清試料のNGEP)、及び内部標準を分析することができる。よって、外部標準、内部標準、及び標的糖ペプチド分析物の存在量値(例えば、存在量または生存在量)は、同じランにおいて質量分析によって決定することができる。
【0080】
様々な実施形態において、外部標準は、試料を分析する前に分析されてもよい。様々な実施形態において、外部標準は、試料間で独立してランに供され得る。いくつかの実施形態では、外部標準は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、またはそれよりも多くの実験ごとの後に分析され得る。様々な実施形態において、外部標準データは、本明細書に記載される正規化システム及び方法の一部または全部に使用され得る。追加の実施形態では、カラムの汚れを防止するために、ブランク試料を処理してもよい。
【0081】
試料取り入れ104には、例えば、等分、登録、処理、保管、解凍、及び/または他の種類の動作など、1つ以上の様々な動作が含まれてもよい。1つ以上の実施形態では、生体試料112が全血試料116を含む場合、試料取り入れ104には、全血試料116を等分して等分試料のセットを形成させることが含まれ、次にこのセットを更に等分して、試料のセット120を形成させることができる。
【0082】
試料調製及び処理106には、例えば、ペプチド構造のセット122を形成させるための1つ以上の動作が含まれてもよい。様々な実施形態では、ペプチド構造のセット122は、消化を受け、分析の準備ができていてもよい折り畳まれていないタンパク質の様々な断片を含んでもよい。
【0083】
更に、試料調製及び処理106には、例えば、ペプチド構造のセット122に基づくデータ検索124が含まれてもよい。例えば、データ検索124には、例えば、非限定的に、液体クロマトグラフィー/質量分析(LC/MS)システムの使用が含まれてもよい。
【0084】
データ分析108には、例えば、ペプチド構造分析126が含まれてもよい。いくつかの実施形態では、データ分析108には、出力生成110も含まれる。他の実施形態では、出力生成110は、データ分析108とは別個の動作とみなされてもよい。出力生成110には、例えば、ペプチド構造分析126の結果に基づいて最終出力128を生成することが含まれてもよい。様々な実施形態において、最終出力128は、脂肪肝疾患と関連付けられる状態の研究、診断、及び/または治療を決定するために使用されてもよい。
【0085】
様々な実施形態において、最終出力128は、1つ以上の出力で構成される。最終出力128は、様々な形態をとることができる。例えば、最終出力128は、例えば、診断出力、治療出力(例えば、治療設計出力、治療計画出力、またはそれらの組み合わせ)、分析されたデータ(例えば、相対化及び正規化されたもの)、またはそれらの組み合わせを含むレポートであってもよい。いくつかの実施形態では、レポートは、標的糖ペプチド分析物濃度をNGEP濃度値及び正規化存在量値の関数として含み得る。いくつかの実施形態において、最終出力128は、アラート(例えば、視覚的アラート、可聴アラートなど)であっても、通知(例えば、視覚的通知、可聴通知、電子メール通知など)であっても、電子メール出力であっても、それらの組み合わせであってもよい。いくつかの実施形態では、最終出力128は、処理のために遠隔システム130に送信されてもよい。遠隔システム130は、例えば、コンピュータシステム、サーバ、プロセッサ、クラウドコンピューティングプラットフォーム、クラウドストレージ、ラップトップ、タブレット、スマートフォン、何らかの他の種類のモバイルコンピューティングデバイス、またはそれらの組み合わせを含んでもよい。
【0086】
他の実施形態では、ワークフロー100は、任意選択で、本明細書に記載される動作のうちの1つ以上を除外してもよく、かつ/または任意選択で、本明細書に記載されるもの以外の1つ以上の他のステップもしくは動作を(例えば、本明細書に記載されるものに加えて、及び/またはそれらの代わりに)含んでもよい。したがって、ワークフロー100は、例えばFLDの研究、診断、及び/または治療に使用するためのある数の異なる方法のうちのいずれかで実装され得る。
【0087】
IV.ペプチド構造の検出及び定量化
図2A及び2Bは、1つ以上の実施形態による、試料調製及び処理106のためのワークフローの概略図である。図2A及び図2Bは、図1を引き続き参照して説明される。試料調製及び処理106には、例えば、図2Aに示される調製ワークフロー200及び図2Bに示されるデータ検索124が含まれてもよい。
【0088】
IV.A.試料調製及び処理
図2Aは、1つ以上の実施形態による調製ワークフロー200の概略図である。調製ワークフロー200は、データ検索124を介した分析のために、図1の試料のセット120のうちの試料などの試料を調製するために使用されてもよい。例えば、この分析は、質量分析(例えば、LC-MS)を介して行われてもよい。様々な実施形態において、調製ワークフロー200には、変性及び還元202、アルキル化204、及び消化206が含まれてもよい。
【0089】
概して、タンパク質などのポリマーは、その天然形態で、二次、三次、及び/または他の高次構造を含むように折り畳むことができる。そのような高次構造により、タンパク質が機能化されて、対象におけるタスクが完了し(例えば、酵素活性が可能になり)得る。更に、ポリマーのそのような高次構造は、ポリマー内のアミノ酸の側鎖間の様々な相互作用を介して維持されてもよい。そのような相互作用には、イオン結合、疎水性相互作用、水素結合、及びシステイン残基間のジスルフィド結合が含まれ得る。しかしながら、質量分析を含む分析システム及び方法を使用する場合、そのようなポリマー(例えば、ペプチド/タンパク質分子)の折り畳みを解除して配列情報を取得することが望ましい場合がある。いくつかの実施形態では、ポリマーの折り畳み解除には、ポリマーを変性させることが含まれてもよく、これには、例えば、ポリマーを直鎖状にすることが含まれてもよい。
【0090】
1つ以上の実施形態では、変性及び還元202を使用して、試料(例えば、図1の試料のセット120のうちの1つ)中の1つ以上のタンパク質(例えば、ポリペプチド及びペプチド)の高次構造(例えば、二次、三次、四次など)を破壊することができる。変性及び還元202には、例えば、変性手順及び還元手順が含まれる。いくつかの実施形態では、変性手順は、例えば、熱を変性剤として使用する熱変性を使用して行われてもよい。熱変性は、イオン結合、疎水性相互作用、及び/または水素結合を破壊することができる。
【0091】
1つ以上の実施形態では、変性手順には、1つ以上の変性剤、温度(例えば、熱)、またはその両方を使用することが含まれてもよい。これらの1つ以上の変性剤としては、例えば、任意の数のカオトロピック塩(例えば、尿素、グアニジン)、界面活性剤(例えば、ドデシル硫酸ナトリウム(SDS)、ベータオクチルグルコシド、Triton X-100)、またはこれらの組み合わせを挙げることができるが、これらに限定されない。ある場合には、そのような変性剤は、試料調製ワークフローに汚染除去手順が更に含まれるときに、熱と併用されてもよい。
【0092】
得られた1つ以上の変性(例えば、折り畳まれていない、直鎖状になった)タンパク質は、次いで、分析に備えて更なる処理を受けてもよい。例えば、1つ以上の還元剤が適用される還元手順が行われてもよい。様々な実施形態において、還元剤は、アルカリ性pHを生じさせることができる。還元剤は、例えば、非限定的に、ジチオスレイトール(DTT)、トリス(2-カルボキシエチル)ホスフィン(TCEP)、または何らかの他の還元剤の形態をとってもよい。還元剤は、1つ以上の変性タンパク質のシステイン残基間のジスルフィド結合を還元(例えば、切断)して、1つ以上の還元タンパク質を形成させてもよい。
【0093】
様々な実施形態において、変性及び還元202から得られる1つ以上の還元タンパク質は、例えば、1つ以上の還元タンパク質のシステイン残基間のジスルフィド結合の再形成を防止するプロセスを受けてもよい。このプロセスは、1つ以上のアルキル化タンパク質を形成させるために、アルキル化204を使用して実践されてもよい。例えば、アルキル化204を使用して、各システイン残基上の硫黄にアセトアミド基を付加し、ジスルフィド結合の再形成を防止してもよい。様々な実施形態において、アセトアミド基は、1つ以上のアルキル化剤を還元タンパク質と反応させることによって付加することができる。1つ以上のアルキル化剤は、例えば、1つ以上のアセトアミド塩を含んでもよい。アルキル化剤は、例えば、ヨードアセトアミド(IAA)、2-クロロアセトアミド、何らかの他の種類のアセトアミド塩、または何らかの他の種類のアルキル化剤の形態をとってもよい。
【0094】
いくつかの実施形態では、アルキル化204には、クエンチ手順が含まれてもよい。クエンチ手順は、1つ以上の還元剤(例えば、上記の還元剤のうちの1つ以上)を使用して行われてもよい。
【0095】
様々な実施形態において、アルキル化204を介して形成される1つ以上のアルキル化タンパク質は、次いで、分析(例えば、質量分析)に備えて消化206を受け得る。タンパク質の消化206には、1つ以上の切断部位(例えば、1つ以上のアミノ酸残基であってもよい部位205)でまたはその周辺でタンパク質を切断することが含まれてもよい。例えば、非限定的に、アルキル化タンパク質は、リジンまたはアルギニン残基のカルボキシル側で切断されてもよい。この種類の切断は、タンパク質を、1つ以上のペプチド構造(例えば、グリコシル化または脱グリコシル化されたもの)を含む様々なセグメントに分割し得る。
【0096】
様々な実施形態において、消化206は、1つ以上のタンパク質分解触媒を使用して行われる。例えば、酵素を消化206に使用することができる。いくつかの実施形態では、酵素はトリプシンの形態をとる。他の実施形態では、トリプシンに加えて、またはトリプシンの代わりに、1つ以上の他の種類の酵素(例えば、プロテアーゼ)を使用してもよい。これらの1つ以上の他の酵素としては、LysC、LysN、AspN、GluC、及びArgCが挙げられるが、これらに限定されない。いくつかの実施形態では、消化206は、トシルフェニルアラニルクロロメチルケトン(TPCK)で処理されたトリプシン、トリプシンの1つ以上の操作形態、トリプシンの1つ以上の他の配合物、またはそれらの組み合わせを使用して行われてもよい。いくつかの実施形態では、消化206は、複数のステップで行われてもよく、各々が1つ以上の消化剤の使用を伴う。例えば、二次消化、三次消化などが行われてもよい。1つ以上の実施形態では、トリプシンは、血清試料を消化するために使用される。1つ以上の実施形態では、トリプシン/LysCカクテルが、血漿試料を消化するために使用される。
【0097】
いくつかの実施形態では、消化206には、クエンチ手順が更に含まれる。クエンチ手順は、試料を(例えば、pH3未満に)酸性化することによって行ってもよい。いくつかの実施形態では、ギ酸を使用して、この酸性化を行ってもよい。
【0098】
様々な実施形態において、調製ワークフロー200には、消化後手順207が更に含まれる。消化後手順207には、例えば、汚染除去手順が含まれてもよい。汚染除去手順には、例えば、消化206から生じる試料中の不要な成分の除去が含まれてもよい。例えば、不要な成分としては、無機イオン、界面活性剤などを挙げることができるが、これらに限定されない。いくつかの実施形態では、消化後手順207には、重標識ペプチド内部標準を加えるための手順が更に含まれる。
【0099】
調製ワークフロー200は、血液ベースの生体試料112(例えば、全血試料、血漿試料、血清試料など)から作製または採取した試料に関して説明されているが、試料調製ワークフロー200は、ペプチド構造122のセットを産生させるために、他の種類の試料(例えば、涙液、尿、組織、間質液、痰など)について同様に実施されてもよい。
【0100】
IV.B.ペプチド構造の特定及び定量化
図2Bは、1つ以上の実施形態によるデータ取得124の概略図である。様々な実施形態において、データ取得124は、図2Aに記載される試料調製200の後に開始し得る。様々な実施形態において、データ取得124は、定量化208、品質制御210、及びピーク積分及び正規化212を含み得る。
【0101】
様々な実施形態において、ペプチド及び糖ペプチドの標的定量化208は、液体クロマトグラフィー質量分析LC/MS機器の使用を組み込み得る。例えば、LC-MS/MS、またはタンデムMSを使用してもよい。概して、LC/MS(例えば、LC-MS/MS)は、液体クロマトグラフ(LC)の物理的分離能力を質量分析(MS)の質量分析能力と組み合わせることができる。本明細書に記載されるいくつかの実施形態によると、この技法により、LCカラムから界面を介してMSイオン源に供給される消化されたペプチドの分離が可能になる。
【0102】
様々な実施形態において、任意のLC/MSデバイスを本明細書に記載のワークフローに組み込むことができる。様々な実施形態において、特定及び標的化した定量化208に好適な機器または機器システムには、例えば、Triple Quadrupole LC/MS(商標)が含まれてもよい。様々な実施形態において、標的化した定量化208は、多重反応モニタリング質量分析(MRM-MS)を使用して行われる。
【0103】
本明細書に記載される様々な実施形態において、特定のタンパク質またはペプチドの特定及び関連する量が評価され得る。本明細書に記載される様々な実施形態において、特定のグリカンの特定及び関連する量が評価され得る。本明細書に記載される様々な実施形態において、特定のグリカンをタンパク質またはペプチド上のグリコシル化部位に一致させ得、存在量値を測定する。
【0104】
ある場合には、標的化した定量化208には、適切な断片化に関連する特定の衝突エネルギーを使用して、豊富な生成物イオンを一貫して確認することが含まれる。糖ペプチド構造は、脱グリコシル化ペプチド構造よりも低い衝突エネルギーを有してもよい。糖ペプチド構造を含む試料を分析する場合、ソース電圧及びガス温度を、一般的なプロテオミクス分析と比較して低下させてもよい。
【0105】
様々な実施形態において、データ品質を最適化するために、品質制御210手順を導入することができる。様々な実施形態において、期待値の外側の許容範囲内の誤差のみを許す測定を導入することができる。様々な実施形態において、統計モデルを用いること(例えば、Westgardルールを使用すること)で、品質制御210を支援することができる。例えば、品質制御210には、例えば、全ての試料または各品質制御試料(例えば、プールされた血清消化物)のいずれかにおいて、代表的なペプチド構造(例えば、グリコシル化及び/または脱グリコシル化されたもの)及びスパイクインされた内部標準の保持時間及び存在量を評価することが含まれてもよい。
【0106】
ピーク積分及び正規化212を行って、生成されたデータを処理し、データを分析のためのフォーマットに転換してもよい。例えば、ピーク積分及び正規化212には、選択されたペプチド構造について検出された様々な生成物イオンの存在量データを、そのペプチド構造についての単一の定量化メトリック(例えば、相対量、調整量、正規化量、相対濃度、調整濃度、正規化濃度など)に変換することが含まれてもよい。いくつかの実施形態において、ピーク積分及び正規化212は、開示全体が参照により本明細書に組み込まれる米国特許公開第2020/0372973A1号及び/または米国特許公開第2020/0240996A1号に記載される技法のうちの1つ以上を使用して行われてもよい。
【0107】
V.ペプチド構造データ分析のための例示的なシステム
V.A.ペプチド構造データ分析のための分析システム
図3は、1つ以上の実施形態による分析システム300のブロック図である。分析システム300を使用して、FLDの種々の状態と関連付けられている種々のペプチド構造を検出し、分析することができる。分析システム300は、図1のデータ分析108を行うために使用されてもよいシステムの実装の一例である。このため、分析システム300は、図1、2A、及び/または2Bに記載されるワークフロー100を引き続き参照して説明される。
【0108】
分析システム300は、コンピューティングプラットフォーム302及びデータストア304を含んでもよい。いくつかの実施形態では、分析システム300は、ディスプレイシステム306も含む。コンピューティングプラットフォーム302は、様々な形態をとることができる。1つ以上の実施形態では、コンピューティングプラットフォーム302は、単一のコンピュータ(またはコンピュータシステム)または互いに通信する複数のコンピュータを含む。他の例では、コンピューティングプラットフォーム302は、クラウドコンピューティングプラットフォームの形態をとる。
【0109】
データストア304及びディスプレイシステム306はそれぞれ、コンピューティングプラットフォーム302と通信してもよい。いくつかの例では、データストア304、ディスプレイシステム306、またはその両方は、コンピューティングプラットフォーム302の一部とみなされても、別様にコンピューティングプラットフォーム302と統合されてもよい。このため、いくつかの例では、コンピューティングプラットフォーム302、データストア304、及びディスプレイシステム306は、互いに通信する別個の構成要素であってもよいが、他の例では、これらの構成要素の何らかの組み合わせが一緒に統合されてもよい。これらの異なる構成要素間の通信は、任意の数の有線通信リンク、無線通信リンク、光通信リンク、またはそれらの組み合わせを使用して実装されてもよい。
【0110】
分析システム300は、例えば、ペプチド構造分析器308を含み、これは、ハードウェア、ソフトウェア、ファームウェア、またはそれらの組み合わせを使用して実装されてもよい。1つ以上の実施形態では、ペプチド構造分析器308は、コンピューティングプラットフォーム302を使用して実装される。
【0111】
ペプチド構造分析器308は、処理のためにペプチド構造データ310を受信する。ペプチド構造データ310は、例えば、図1、2A、及び2Bの試料調製及び処理106から出力されるペプチド構造データであってもよい。したがって、ペプチド構造データ310は、生体試料112について特定されたペプチド構造122のセットに対応してもよく、したがって生体試料112に対応してもよい。
【0112】
ペプチド構造データ310は、ペプチド構造分析器308への入力として送信されることも、データストア304または何らかの他の種類のストレージ(例えば、クラウドストレージ)から検索されることも、クラウドストレージからアクセスされることも、何らかの他の様式で取得されることもできる。ある場合には、ペプチド構造データ310は、入力デバイスを介してユーザによって入力されたユーザ入力を受信することに応答して(例えば、それに直接的または間接的に基づいて)データストア304から検索されてもよい。
【0113】
ペプチド構造データ310は、複数のペプチド構造の定量化データを含んでもよい。例えば、ペプチド構造データ310は、複数のペプチド構造の各ペプチド構造についての定量化メトリックのセットを含んでもよい。ペプチド構造についての定量化メトリックは、相対量、調整量、正規化量、相対存在量、調整存在量、及び正規化存在量のうちの1つとして選択されてもよい。ある場合には、ペプチド構造についての定量化メトリックは、相対濃度、調整濃度、及び正規化濃度のうちの1つから選択される。このようにして、ペプチド構造データ310は、生体試料112に関する複数のペプチド構造についての存在量情報を提供してもよい。
【0114】
いくつかの実施形態では、ペプチド構造のセット312のうちのペプチド構造は、ペプチド配列によって定義されるグリコシル化ペプチド構造または糖ペプチド構造と、ペプチド配列の連結部位に結合したグリカン構造とを含む。例えば、ペプチド構造は、糖ペプチドであっても糖ペプチドの一部分であってもよい。いくつかの実施形態では、ペプチド構造のセット312のうちのペプチド構造は、ペプチド配列によって定義される脱グリコシル化ペプチド構造を含む。例えば、ペプチド構造は、ペプチドであってもペプチドの一部分であってもよく、これは、定量化ペプチドと称されてもよい。
【0115】
ペプチド構造のセット312は、モデル314の訓練に基づいて、症候性疾患状態を最も予測するものまたはそれに最も関連するものとして特定され得る。1つ以上の実施形態では、ペプチド構造のセット312は、以下の表1で特定されるペプチド構造のうちの少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、少なくとも10個、少なくとも11個、少なくとも12個、少なくとも13個、少なくとも14個、少なくとも15個、少なくとも16個、少なくとも17個、少なくとも18個、少なくとも19個、少なくとも20個、少なくとも21個、少なくとも22個、少なくとも23個、少なくとも24個、少なくとも25個、少なくとも26個、少なくとも27個、少なくとも28個、少なくとも29個、少なくとも30個、少なくとも31個、少なくとも32個、少なくとも33個、少なくとも34個、少なくとも35個、少なくとも36個、少なくとも37個、少なくとも38個、少なくとも39個、少なくとも40個、少なくとも41個、少なくとも42個、少なくとも43個、少なくとも44個、少なくとも45個、少なくとも46個、少なくとも47個、少なくとも48個、少なくとも49個、少なくとも50個、少なくとも51個、少なくとも52個、または53個全てを含む。ペプチド構造のセット312に含めるために表1から選択されるペプチド構造の数は、例えば、所望の精度レベルに基づいてもよい。1つ以上の実施形態では、40個のペプチド構造が、ペプチド構造のセット312に含めるために表1から選択される。
【0116】
表1では、「PS-ID番号」は、ペプチド構造の標識またはインデックスを特定するものであり、「ペプチド構造(PS)名」は、ペプチド構造の名称を特定するものであり、「タンパク質配列番号」は、ペプチド構造(例えば、ペプチド構造が由来するもの)と関連付けられるタンパク質の配列IDを特定するものであり、「ペプチド配列番号は、ペプチド構造のペプチド配列についてのペプチド配列番号を特定するものであり、「モノアイソトピック質量」は、ダルトン(Da)単位でペプチド構造のモノアイソトピック質量を特定するものであり、「タンパク質配列中の連結部位の位置」は、対応するグリカン構造が連結する、タンパク質配列に関する部位の位置を特定するものであり、「ペプチド配列中の連結部位の位置」は、対応するグリカン構造が連結する、ペプチド配列に関する部位の位置を特定するものであり、「GL番号」は、対応するグリカン構造についての標識またはインデックスを特定するものである。糖ペプチド構造の場合、ペプチド構造の名称には、ペプチド構造と関連付けられるタンパク質の略記、タンパク質のタンパク質配列に関する連結部位の位置に対応する第1の番号、及びタンパク質に連結するグリカンを特定する第2の番号が含まれる。脱グリコシル化ペプチド構造の場合、ペプチド構造の名称は、ペプチド構造と関連付けられるタンパク質の略記及びペプチド構造の対応するペプチド配列を含む。
【表1-1】
【表1-2】
【表1-3】
【0117】
1つ以上の実施形態では、ペプチド構造のセット312は、アルファ-2-マクログロブリン(A2MG)から断片化されたペプチド構造のみ、故にA2MG糖型のみを含む。1つ以上の実施形態では、ペプチド構造のセット312は、アルファ-1-酸糖タンパク質1(AGP1)から断片化されたペプチド構造のみ、故にAGP1糖型のみを含む。1つ以上の実施形態では、ペプチド構造のセット312は、ハプトグロビン(HPT)から断片化されたペプチド構造のみ、故にHPT糖型のみを含む。1つ以上の実施形態では、ペプチド構造のセット312は、補体因子H(CFAH)から断片化されたペプチド構造のみ、故にCFAH糖型のみを含む。1つ以上の実施形態では、ペプチド構造のセット312は、アルファ-1-抗トリプシン(A1AT)から断片化されたペプチド構造のみ、故にA1AT糖型のみを含む。いくつかの実施形態では、ペプチド構造のセット312は、A2MG、AGP1、HPT、CFAH、またはA1ATのうちの少なくとも1つから断片化されたペプチド構造のみを含む。
【0118】
ペプチド構造分析器308は、処理のためにペプチド構造データ310を受信するように構成されているモデル314を含む。モデル314は、ある数の異なる方法のうちのいずれかで実装され得る。モデル314は、任意の数のモデル、関数、方程式、アルゴリズム、及び/または他の数学的手法を使用して実装され得る。
【0119】
1つ以上の実施形態において、モデル314は、機械学習モデル316を含み、これ自体が任意の数の機械学習モデル及び/またはアルゴリズムで構成されてもよい。例えば、機械学習モデル316には、限定されないが、パラメトリックモデル、非パラメトリックモデル、ディープラーニングモデル、ニューラルネットワーク、線形判別分析モデル、二次判別分析モデル、サポートベクターマシン、ランダムフォレストアルゴリズム、最近傍アルゴリズム(例えば、k最近傍アルゴリズム)、複合判別分析モデル、k平均クラスタ化アルゴリズム、教師なしモデル、ロジスティック回帰モデル、多変数回帰モデル、罰則付き多変数回帰モデル、または別の種類のモデルのうちの少なくとも1つが含まれてもよい。様々な実施形態において、モデル314は、上記のモデルまたはアルゴリズムの任意の数または組み合わせを含む機械学習モデル316を含む。
【0120】
様々な実施形態において、モデル314は、ペプチド構造のセット312に対応するペプチド構造データ310の一部分(例えば、いくつかまたは全て)を分析して、FLD進行と関連付けられる複数の状態320のうちの対応する状態を証明するものとして生体試料112を分類する疾患インジケータ318を生成する。疾患インジケータ318は、様々な形態をとることができる。1つ以上の実施形態では、疾患インジケータ318は、生体試料112についての対応する状態の分類を示すスコアである。例えば、状態320の各々は、スコアの値の異なる範囲と関連付けられてもよい。スコアが状態320のうちの特定の状態と関連付けられた選択された範囲内に入る場合には、スコアは、生体試料112がその特定の状態を証明することを示す。このため、スコアは、その特定の状態に対応するものとしての生体試料112の分類を提供する。
【0121】
他の実施形態では、疾患インジケータ318は、対象(例えば、図1の対象114)がFLD進行と関連付けられる状態320のうちの1つに入る確率を示すスコアを含む。例えば、疾患インジケータ318は、1つ以上のスコアを含んでもよく、それらの各々は、生体試料112がFLD進行と関連付けられる状態320のうちの対応する状態を証明するかどうかを示してもよい。いくつかの例では、疾患インジケータ318は、FLD進行と関連付けられる状態320の各々についてのスコアを含む。スコアがより高いと、生体試料112が対応する状態を証明する確率が高いことが示される。
【0122】
様々な実施形態において、機械学習モデル316は、回帰モデル320の形態をとる。回帰モデル320には、例えば、疾患インジケータ318を計算するように訓練される少なくとも1つのラッソ回帰モデル(またはラッソ正則化モデル)が含まれてもよい。回帰モデル320は、ペプチド構造のセット312のペプチド構造の重み係数を特定するように訓練されてもよい。
【0123】
ペプチド構造分析器308は、モデル314によって出力される疾患インジケータ318に基づいて最終出力128を生成してもよい。他の実施形態では、最終出力128は、モデル314によって生成された出力であってもよい。
【0124】
いくつかの実施形態では、最終出力128は、疾患インジケータ318を含む。他の実施形態では、最終出力128は、診断出力324及び/または治療出力326を含む。診断出力324は、例えば、疾患インジケータ318に基づく、状態320のうちのどの状態が生体試料112によって証明されたかの分類の特定を含んでもよい。治療出力326には、例えば、対象を治療するための治療薬の特定、治療薬の設計、または治療薬を投与するための治療計画のうちの少なくとも1つが含まれてもよい。いくつかの実施形態では、治療剤は免疫チェックポイント阻害剤である。
【0125】
いくつかの例では、最終出力128は、処理のためにリモートシステム130に送信されてもよい。他の実施形態では、最終出力128は、人間の操作者による視認のために、ディスプレイシステム306のグラフィカルユーザインタフェース328上に表示されてもよい。人間の操作者は、最終出力128により、対象が疾患(例えば、FLD)の疾患進行に従う状態(例えば、NASH、HCC)について陽性であることが示されるとき、最終出力128を使用して、対象を診断及び/または治療してもよい。
【0126】
V.B.コンピュータ実装システム
図4は、様々な実施形態によるコンピュータシステムのブロック図である。コンピュータシステム400は、図3において上で説明したコンピューティングプラットフォーム302のための1つの実装の例であり得る。
【0127】
1つ以上の例では、コンピュータシステム400は、情報を通信するためのバス402または他の通信機構と、情報を処理するためのバス402と結合したプロセッサ404とを含み得る。様々な実施形態では、コンピュータシステム400はまた、プロセッサ404によって実行される命令を決定するためにバス402に結合した、ランダムアクセスメモリ(RAM)406または他の動的記憶デバイスであり得るメモリを含み得る。メモリはまた、プロセッサ404によって実行される命令の実行中に、テンポラリ変数または他の中間情報を記憶するために使用することができる。様々な実施形態において、コンピュータシステム400は、プロセッサ404のための静的情報及び命令を記憶するためにバス402に結合した読み取り専用メモリ(ROM)408または他の静的記憶デバイスを更に含み得る。磁気ディスクまたは光ディスクなどの記憶デバイス410は、情報及び命令を記憶するために提供され、バス402に結合し得る。
【0128】
様々な実施形態において、コンピュータシステム400は、バス402を介して、コンピュータユーザに情報を表示するために、陰極線管(CRT)または液晶ディスプレイ(LCD)などのディスプレイ412に結合され得る。英数字及び他のキーを含む入力デバイス414は、情報及びコマンド選択をプロセッサ404に通信するために、バス402に結合され得る。別の種類のユーザ入力デバイスは、方向情報及びコマンド選択をプロセッサ404に通信するため、ならびにディスプレイ412上のカーソル移動を制御するための、マウス、ジョイスティック、トラックボール、ジェスチャー入力デバイス、視線ベースの入力デバイス、またはカーソル方向キーなどのカーソル制御416である。この入力デバイス414は、典型的には、第1の軸(例えば、x)及び第2の軸(例えば、y)の2つの軸において2つの自由度を有し、これにより、デバイスは、平面内の位置を指定することができる。しかしながら、3次元(例えば、x、y、及びz)のカーソル移動を可能にする入力デバイス414もまた、本明細書で企図されることを理解されたい。
【0129】
本教示のある特定の実践と一致して、プロセッサ404がRAM406に含まれる1つ以上の命令の1つ以上のシーケンスを実行することに応答して、コンピュータシステム400によって結果が提供され得る。そのような命令は、記憶デバイス410などの別のコンピュータ可読媒体またはコンピュータ可読記憶媒体からRAM406に読み込まれ得る。RAM406に含まれる命令のシーケンスを実施すると、プロセッサ404に本明細書に記載されるプロセスを実行させることができる。あるいは、配線回路をソフトウェア命令の代わりにまたはそれと組み合わせて使用して、本教示を実践することができる。このため、本教示の実践は、ハードウェア回路及びソフトウェアの任意の特定の組み合わせに限定されない。
【0130】
「コンピュータ可読媒体」(例えば、データストア、データストレージ、記憶デバイス、データ記憶デバイスなど)または「コンピュータ可読記憶媒体」という用語は、本明細書で使用される場合、実行のためにプロセッサ404に命令を提供することに関与する任意の媒体を指す。そのような媒体は、不揮発性媒体、揮発性媒体、及び伝送媒体を含むがこれらに限定されない、多くの形態をとることができる。不揮発性媒体の例としては、光ディスク、ソリッドステートディスク、磁気ディスク、例えば、記憶デバイス410を挙げることができるが、これらに限定されない。揮発性媒体の例としては、動的メモリ、例えば、RAM406を挙げることができるが、これに限定されない。伝送媒体の例としては、バス402を含むワイヤを含む、同軸ケーブル、銅線、及び光ファイバーを挙げることができるが、これらに限定されない。
【0131】
コンピュータ可読媒体の一般的な形態としては、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、または任意の他の磁気媒体、CD-ROM、任意の他の光学媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理的媒体、RAM、PROM、及びEPROM、FLASH-EPROM、任意の他のメモリチップもしくはカートリッジ、またはコンピュータが読み取ることができる任意の他の有形媒体が挙げられる。
【0132】
コンピュータ可読媒体に加えて、命令またはデータは、実行のためにコンピュータシステム400のプロセッサ404に1つ以上の命令のシーケンスを提供するために、通信装置またはシステムに含まれる伝送媒体上の信号として提供され得る。例えば、通信装置は、命令及びデータを示す信号を有するトランシーバーを含んでもよい。命令及びデータは、1つ以上のプロセッサに、ここで本開示に概説される機能を実装させるように構成される。データ通信伝送接続の代表的な例としては、電話モデム接続、広域ネットワーク(WAN)、ローカルエリアネットワーク(LAN)、赤外線データ接続、NFC接続、光通信接続などを挙げることができるが、これらに限定されない。
【0133】
本明細書に記載される方法論、フローチャート、図、及び付随する開示は、コンピュータシステム400をスタンドアロンデバイスとして使用して、またはクラウドコンピューティングネットワークなどの共有コンピュータ処理リソースの分散ネットワーク上で実装され得ることを理解されたい。
【0134】
本明細書に記載される方法論は、用途に応じて様々な手段によって実装され得る。例えば、これらの方法論は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの任意の組み合わせにおいて実装され得る。ハードウェア実装の場合、処理ユニットは、1つ以上の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラム可能論理回路(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書に記載される機能を実行するように設計された他の電子ユニット、またはそれらの組み合わせ内に実装されてもよい。
【0135】
様々な実施形態では、本教示の方法は、従来のプログラミング言語、例えば、C、C++、Pythonなどで書かれたファームウェアならびに/またはソフトウェアプログラム及びアプリケーションとして実装されてもよい。ファームウェア及び/またはソフトウェアとして実装される場合、本明細書に記載される実施形態は、コンピュータに上記の方法を実行させるためのプログラムが記憶される非一時的コンピュータ可読媒体で実装され得る。本明細書に記載される様々なエンジンは、コンピュータシステム400などのコンピュータシステム上で提供され得、それによってプロセッサ404は、メモリ構成要素RAM406、ROM408、または記憶デバイス410のうちのいずれか1つまたはそれらの組み合わせ、及び入力デバイス414を介して提供されるユーザ入力によって提供される命令に従って、これらのエンジンによって提供される分析及び決定を実行することが理解されるべきである。
【0136】
VI.ペプチド構造データ分析に基づく診断に関する例示的な方法論
VI.A.一般的な方法論
図5は、脂肪肝(FLD)進行と関連付けられる複数の状態に関して、対象から得られた生体試料を分類するためのプロセスのフローチャートである。プロセス500は、例えば、図1図2A、及び図2Bに記載されるワークフロー100、ならびに/または図3に記載される分析システム300の少なくとも一部分を使用して実践されてもよい。プロセス500を使用して、例えば、図3の診断出力324などの診断出力を生成してもよい。
【0137】
ステップ502は、対象から得られた生体試料中の糖タンパク質のセットに対応するペプチド構造データを受信することを含む。ペプチド構造データは、例えば、図3のペプチド構造データ310の実装の一例であり得る。ペプチド構造データは、複数のペプチド構造の各ペプチド構造についての定量化データを含んでもよい。ペプチド構造データは、例えば、非限定的に、多重反応モニタリング質量分析(MRM-MS)を使用して生成されたものであってもよい。1つ以上の実施形態では、ペプチド構造データは、複数のペプチド構造の定量化データを含む。ペプチド構造についてのこの定量化データは、例えば、非限定的に、ペプチド構造の存在量、相対存在量、正規化存在量、相対量、調整量、正規化量、相対濃度、調整濃度、または正規化濃度のうちの少なくとも1つを含んでもよい。1つ以上の実施形態では、定量化データは、ペプチド構造の正規化存在量を含む。
【0138】
1つ以上の実施形態では、ペプチド構造データは、生体試料から創出された試料について生成される。例えば、還元、アルキル化、及び酵素消化を使用して生体試料を調製し、調製された試料を形成させてもよい。調製された試料は、複数のペプチド構造を含み、これら複数のペプチド構造についてペプチド構造データが生成され、次にステップ502で受信される。
【0139】
ステップ504は、ペプチド構造のセットについてのペプチド構造データから特定された定量化データを機械学習モデルに入力することを含む。いくつかの実施形態では、ペプチド構造のセットは、上の表1の複数のペプチド構造から特定された少なくとも1つのペプチド構造を含む。様々な実施形態において、少なくとも1つのペプチド構造は、表1で特定される、ペプチド配列によって定義される糖ペプチド構造と、ペプチド配列の連結部位でペプチド配列に連結しているグリカン構造とを含む。
【0140】
定量化データは、例えば、複数のペプチド構造の各ペプチド構造についての1つ以上の定量化メトリックを含んでもよい。ペプチド構造についての定量化メトリックは、例えば、非限定的に、相対量、調整量、正規化量、相対濃度、調整濃度、または正規化濃度であってもよい。このようにして、所与のペプチド構造についての定量化データにより、生体試料中のペプチド構造の存在量が示される。1つ以上の実施形態では、定量化データは、ペプチド構造の正規化存在量を含む。機械学習モデルは、例えば、教師あり機械学習モデルであってもよい。
【0141】
ステップ506は、機械学習モデルを使用して定量化データを分析し、疾患インジケータを生成することを含む。様々な実施形態において、生成される疾患インジケータは、生体試料がFLD進行と関連付けられる状態を証明するかどうかの指標を含んでもよい。例えば、疾患インジケータは、生体試料がNASHもしくはHCCについて陽性である可能性が高いかどうか、または健常もしくは非NASH/HCC(例えば、良性肝腫瘤を示すものであってもよい)である可能性が高いかどうかを示してもよい。様々な実施形態において、疾患インジケータは、生体試料がNASH状態を証明する確率、または生体試料がHCC状態を証明する確率を含む。1つ以上の実施形態では、機械学習モデルは、NASH状態について陽性、HCC状態について陽性、または健常(または非NASH/HCC)状態について陽性であるものとして生体試料を分類する出力を生成してもよい。様々な実施形態において、疾患インジケータはスコアであり得る。
【0142】
ステップ508は、生体試料を、FLD進行と関連付けられた複数の状態のうちの対応する状態を証明するものとして分類する疾患インジケータに基づいて、診断出力を生成することを含む。様々な実施形態において、複数の状態は、NASH状態及び肝細胞癌(HCC)状態を含み得る。いくつかの実施形態では、複数の状態は、健常状態、良性肝腫瘤状態、肝臓疾患のない状態、または何らかの他の種類の非NASH/HCC状態のうちの少なくとも1つを含む非NASH/HCC状態を含み得る。
【0143】
疾患インジケータがスコアである場合、ステップ508は、スコアが複数の状態のうちの対応する状態と関連付けられた選択された範囲(例えば、非NASH/HCC状態の場合は0.0~0.05、NASH状態の場合は0.05~0.4、及びHCC状態の場合は0.4~1.0)内に入ると決定することを含んでもよい。いくつかの実施形態では、ステップ506は、スコアが対応する状態と関連付けられた選択された範囲内に入るという決定に基づいて、生体試料が対応する状態を証明すると決定することを含んでもよい。
【0144】
1つ以上の実施形態において、ステップ508において診断出力を生成することには、対応する状態を特定するレポートの一部として診断出力を生成することが含まれる。いくつかの実施形態では、ステップ508はまた、診断出力または疾患インジケータのうちの少なくとも一方に基づいて治療出力を生成することを含んでもよい。いくつかの実施形態では、治療出力には、対象を治療するための治療の特定、治療のための設計、治療のための製造計画、または治療を施すための治療計画のうちの少なくとも1つが含まれる。
【0145】
NASHと診断された対象の場合、治療には、例えば、オベチコール酸(OCA)、トロピフェキソール、エラフィブラノル、サログリタザール、アラムコール、セマグルチド、チルゼパチド、コタデュチド、NGM282、MSDC-0602K、レスメチロム、セニクリビロク、セロンセルチブ、エムリカサン、シムツズマブ、及びGR-MD-02のうちの少なくとも1つの治療用量が含まれてもよい。NASHと診断された対象の場合、治療には、例えば、アテゾリズマブ、ベバシズマブ、ソラフェニブ、レンバチニブ、ニボルマブ、レゴラフェニブ、カボザンチニブ、ペミガチニブ、ラムシルマブ、またはペムブロリズマブのうちの少なくとも1つの治療用量が含まれてもよい。
【0146】
図6は、生体試料中の脂肪肝疾患(FLD)進行と関連付けられる複数の状態のうちの1つの存在を検出するためのプロセスのフローチャートである。プロセス600は、例えば、図1図2A、及び図2Bに記載されるワークフロー100、ならびに/または図3に記載される分析システム300の少なくとも一部分を使用して実践されてもよい。
【0147】
ステップ602は、対象から得られた生体試料中の糖タンパク質のセットに対応するペプチド構造データを受信することを含む。ペプチド構造データは、例えば、多重反応モニタリング質量分析(MRM-MS)を使用して、調製された試料から生成されたものであってもよい。ペプチド構造データは、ペプチド構造のパネルの各ペプチド構造についての定量化データを含んでもよい。複数のペプチド構造のうちのあるペプチド構造についての定量化データは、相対量、調整量、正規化量、相対濃度、調整濃度、正規化濃度、または別の定量化メトリックのうちの少なくとも1つを含んでもよい。
【0148】
ステップ604は、教師あり機械学習モデルを使用してペプチド構造データを分析し、表1で特定されるペプチド構造の群から選択される少なくとも3つのペプチド構造に基づいて疾患インジケータを生成することを含む。1つ以上の実施形態において、教師あり機械学習モデルは、ロジスティック回帰モデルを含む。
【0149】
様々な実施形態において、少なくとも3つのペプチド構造は、表1で特定される、ペプチド配列によって定義される糖ペプチド構造と、ペプチド配列の連結部位でペプチド配列に連結しているグリカン構造とを含み、ペプチド配列は、表1で定義される配列番号23、24、25、29、30、31、33、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、または52のうちの1つである。
【0150】
1つ以上の実施形態において、少なくとも3つのペプチド構造は、アルファ-2-マクログロブリン(A2MG)から断片化されたペプチド構造のみを含む。1つ以上の実施形態において、少なくとも3つのペプチド構造は、アルファ-1-酸糖タンパク質1(AGP1)から断片化されたペプチド構造のみを含む。1つ以上の実施形態において、少なくとも3つのペプチド構造は、ハプトグロビン(HPT)から断片化されたペプチド構造のみを含む。1つ以上の実施形態において、少なくとも3つのペプチド構造は、補体因子H(CFAH)から断片化されたペプチド構造のみを含む。1つ以上の実施形態において、少なくとも3つのペプチド構造は、アルファ-1-抗トリプシン(A1AT)から断片化されたペプチド構造のみを含む。
【0151】
様々な実施形態において、ステップ604は、少なくとも3つのペプチド構造の各ペプチド構造の重み付け値を特定する生体試料のペプチド構造プロファイルを計算することを含んでもよい。いくつかの実施形態では、少なくとも3つのペプチド構造のうちのあるペプチド構造の重み付け値は、ペプチド構造データから特定されるペプチド構造の定量化メトリック及びペプチド構造の重み係数の積であり得る。少なくとも3つのペプチド構造のうちの対応するペプチド構造の重み係数は、疾患インジケータに対する対応するペプチド構造の相対的有意性を示してもよい。1つ以上の実施形態では、ペプチド構造データを分析することには、ペプチド構造プロファイルを使用して疾患インジケータを計算することが含まれる。疾患インジケータは、例えば、複数の状態のうちのどの状態が生体試料によって証明されるかを示すスコアであってもよい。
【0152】
1つ以上の実施形態において、教師あり機械学習モデルは、最終的な疾患インジケータを生成する際に3つの異なるモデルを用いる。これらの3つのモデルは、各々、例えば、特定の状態とその他の状態とについてのペプチド構造定量化データを分析するために使用される回帰モデルであり得る。例えば、これらの3つの回帰モデルの各々を使用して、複数の状態のうちの所与の状態と、複数の状態のうちのその他の状態とを区別してもよい。
【0153】
1つ以上の実施形態では、ステップ604の少なくとも3つのペプチド構造は、以下の表2で特定されるペプチド構造から選択されてもよく、表2には、表1で特定されたペプチド構造のサブセットが含まれる。表2は更に、NASH状態とその他の状態(例えば、HCC状態及び対照状態)、HCC状態と他の状態(例えば、NASH状態及び対照状態)、及び対照状態とその他の状態(例えば、NASH状態及びHCC状態)を区別することと関連付けられる重み係数を特定する。
【0154】
表2では、「PS-ID番号」は、ペプチド構造の標識またはインデックスを特定するものであり、「ペプチド構造(PS)名」は、ペプチド構造の名称を特定するものであり、「タンパク質配列番号」は、ペプチド構造(例えば、ペプチド構造が由来するもの)と関連付けられるタンパク質の配列IDを特定するものであり、「ペプチド配列番号は、ペプチド構造のペプチド配列についてのペプチド配列番号を特定するものであり、「係数(対照対残り)」は、対照状態とその他の状態との間の重み係数を特定するものであり、「係数(NASH対残り)」は、NASHとその他の状態との間の重み係数を特定するものであり、「係数(HCC対残り)」は、HCCとその他の状態との間の重み係数を特定するものである。

【表2-1】
【表2-2】
【0155】
ステップ606は、疾患インジケータが、対応する状態と関連付けられる選択された範囲内に入るという決定に応答して、FLD進行と関連付けられる複数の状態のうちの対応する状態の存在を検出することを含む。いくつかの実施形態では、複数の状態は、非アルコール性脂肪性肝炎(NASH)状態、肝細胞癌(HCC)状態、または非NASH/HCC状態(例えば、非アルコール性脂肪性肝疾患状態、対照状態、健常状態、良性肝腫瘍状態、肝臓疾患のない状態)からなる群から選択される少なくとも2つを含む。
【0156】
1つ以上の実施形態において、対応する状態は、非NASH/HCC状態であり、非NASH/HCC状態と関連付けられる疾患インジケータの選択された範囲は、0.00~約0.05である。いくつかの実施形態では、対応する状態は、NASH状態であり、NASH状態と関連付けられる疾患インジケータの選択された範囲は、0.05~0.4である。いくつかの実施形態では、対応する状態は、HCC状態であり、HCC状態と関連付けられる疾患インジケータの選択された範囲は、0.4~1.0である。
【0157】
1つ以上の実施形態において、プロセス600は、対象について検出された対応する状態に基づいて、診断を含むレポートを生成することを更に含んでもよい。レポートは、例えば、疾患インジケータを含んでもよい。
【0158】
VI.B.モデルの訓練
図7は、FLD進行と関連付けられた複数の状態のうちの1つに属するか、またはそれを証明するものとして生体試料の分類を生成するように、モデルを訓練するためのプロセスのフローチャートである。プロセス700は、例えば、図3に記載される分析システム300を使用して実装されてもよい。1つ以上の実施形態において、プロセス700は、図3のモデル314を訓練するために実行されてもよい。
【0159】
ステップ702は、FLD進行と関連付けられる複数の状態と診断された複数の対象のペプチド構造のパネルについての定量化データを受信することを含み、定量化データは、複数の対象の複数のペプチド構造プロファイルを含み、複数のペプチド構造プロファイルの各ペプチド構造プロファイルに対する複数の状態のうちの対応する状態を特定する。
【0160】
1つ以上の実施形態において、複数のペプチド構造プロファイルは、第1の数のペプチド構造についての正規化存在量データを含む。1つ以上の実施形態では、複数の状態と診断された複数の対象についてのペプチド構造のパネルの定量化データは、存在量、相対存在量、正規化存在量、相対量、調整量、正規化量、相対濃度、調整濃度、または正規化濃度のうちの少なくとも1つを含む。
【0161】
ステップ704は、複数の状態のうちのどの状態に対象からの生体試料が対応するのかを決定するように、定量化データを使用して教師あり機械学習モデルを訓練することを含む。様々な実施形態において、教師あり機械学習モデルは、ロジスティック回帰モデルを含む。1つ以上の実施形態において、ロジスティック回帰モデルは、ラッソ正則化モデルであってもよい。複数の状態は、例えば、NASH状態、HCC状態、または非NASH/HCC状態のうちの少なくとも1つを含んでもよい。
【0162】
1つ以上の実施形態において、ステップ704は、例えば、上記の表1または表2で特定されたペプチド構造のリストからの少なくとも3つのペプチド構造の定量化データに基づいて状態の決定を行うように、教師あり機械学習モデルを訓練することを含んでもよい。
【0163】
訓練のために選択されたペプチド構造は、例えば、NASHと診断された複数の対象の第1の部分、HCCと診断された複数の対象の第2の部分、及び非NASH/HCC状態(例えば、健常状態、良性肝腫瘤、肝臓疾患のない状態など)と診断された複数の対象の第3の部分のペプチド構造についての定量化データを比較するために、初期訓練データを使用して行われた差次的発現分析から特定されたペプチド構造であってもよい。
【0164】
例えば、比較は、NASHを有する対象の第1の部分と非NASH/HCC状態(例えば、対照状態)を有する対象の第3の部分との間でペプチド構造定量化データを比較するため、HCCを有する対象の第2の部分とNASHを有する対象の第1の部分とを比較するため、及び/またはNASHを有する対象の第1の部分とHCCを有する対象の第2の部分とを比較するために行われてもよい。いくつかの実施形態では、比較は正規化され、互いに比較されてもよい。
【0165】
以下の表3A~3Cは、そのような比較に基づいて計算された倍率変化(FC)、偽発見率(FDR)、及びp値を示す。

【表3-1】
【表3-2】
【表4-1】
【表4-2】
【表5-1】
【表5-2】
【0166】
VI.C.組み合わせた訓練及び診断
セクションVI.に記載の例示的な方法論を使用して、FLDに罹患している可能性のある対象を診断することができる。この診断を使用して、対象のための治療方法を決定することができる。本明細書に記載の実施形態により、NASH対HCCの状態のより速くより正確な診断が可能になり得る。FLD進行においてNASHからHCCに進行した対象(または患者)をより迅速かつ正確に診断できることで、対象をより迅速に治療することが可能になり得、これは対象にとってより望ましい治療転帰をもたらし得る。更に対象がいつNASHからHCCに進行したかをより迅速かつ正確に判断できることは、入院の必要を低減し、死亡を回避することに特に有用であり得る。
【0167】
図8は、1つ以上の実施形態による、脂肪肝疾患(FLD)進行と関連付けられる複数の状態のうちの1つに対応するものとして生体試料を分類するためのプロセスのフローチャートである。プロセス800は、図1図2A、及び/もしくは図2Bに記載されるワークフロー100、ならびに/または図3に記載される分析システム300の少なくとも一部分を使用して実践されてもよい。
【0168】
ステップ802は、訓練データを使用して教師あり機械学習モデルを訓練することを含む。1つ以上の実施形態において、訓練データは、複数の訓練対象の複数のペプチド構造プロファイルを含み、複数のペプチド構造プロファイルの各ペプチド構造プロファイルに対する複数の状態のうちの対応する状態を特定する。
【0169】
ステップ804は、対象から得られた生体試料中の糖タンパク質のセットに対応するペプチド構造データを受信することを含む。
【0170】
ステップ806は、ペプチド構造のセットについてのペプチド構造データから特定された定量化データを、訓練された教師あり機械学習モデルに入力することを含む。いくつかの実施形態において、ペプチド構造のセットは、表1で特定される少なくとも1つのペプチド構造を含む。
【0171】
ステップ808は、教師あり機械学習モデルを使用して定量化データを分析し、スコアを生成することを含む。
【0172】
ステップ810は、スコアが、FLD進行と関連付けられた複数の状態のうちの対応する状態と関連付けられた選択された範囲内に入ると決定することを含む。
【0173】
ステップ812は、生体試料が対応する状態を証明することを示す診断出力を生成することを含む。いくつかの実施形態では、複数の状態は、非アルコール性脂肪性肝炎(NASH)状態、肝細胞癌(HCC)状態、及び非NASH/HCC(例えば、対照または健常)状態を含む。
【0174】
VII.治療のための例示的な方法論
VII.A.NASHの治療
図9は、1つ以上の実施形態による、NASHについて対象を治療するためのプロセスのフローチャートである。プロセス900は、少なくとも部分的に、図1図2A、及び/もしくは図2Bに記載されるワークフロー100、ならびに/または図3に記載される分析システム300の少なくとも一部分を使用して実践されてもよい。
【0175】
ステップ902は、生体試料を受け取ることを含む。生体試料は、患者から得られたものであってもよい。
【0176】
ステップ904は、MRM-MSシステムを使用して、所定のリスト内で特定される各ペプチド構造の量を決定することを含む。所定のリストは、例えば、表1で特定されるリストまたは表2で特定されるリストであってもよい。
【0177】
ステップ906は、機械学習モデルを使用して各ペプチド構造の量を分析し、疾患インジケータを生成することを含む。
【0178】
ステップ908は、生体試料を、患者がNASH(またはNASH障害)を有することを証明するものとして分類する疾患インジケータに基づいて、診断出力を生成することを含む。
【0179】
ステップ910は、治療用量(複数可)での治療剤の静脈内投与または経口投与のうちの少なくとも一方を介して、患者にNASHの治療剤を投与することを含む。治療は、1つ以上の治療薬またはその誘導体で構成されてもよい。
【0180】
治療剤としては、例えば、オベチコール酸(OCA)、トロピフェキソール、エラフィブラノル、サログリタザール、アラムコール、セマグルチド、チルゼパチド、コタデュチド、NGM282、MSDC-0602K、レスメチロム、セニクリビロク、セロンセルチブ、エムリカサン、シムツズマブ、及びGR-MD-02からなる群から選択される少なくとも1つの化合物またはその誘導体を挙げることができるが、これらに限定されない。1つ以上の実施形態では、オベチコール酸(OCA)の治療用量は、1日10~25mgの範囲内の用量を含んでもよい。
【0181】
プロセス900は、1つ以上の追加のステップを含んでもよい。例えば、プロセス900は、対象から得られた生体試料がNASHを証明するという決定に応答して、対象を治療するための治療薬を設計することを更に含んでもよい。プロセス900は、対象から得られた生体試料がNASHを証明するという決定に応答して、対象を治療するための治療計画を生成することを含んでもよい。
【0182】
VII.B.HCCの治療
図10は、1つ以上の実施形態による、HCCについて対象を治療するためのプロセスのフローチャートである。プロセス1000は、少なくとも部分的に、図1図2A、及び/もしくは図2Bに記載されるワークフロー100、ならびに/または図3に記載される分析システム300の少なくとも一部分を使用して実践されてもよい。
【0183】
ステップ1002は、生体試料を受け取ることを含む。生体試料は、患者から得られたものであってもよい。
【0184】
ステップ1004は、MRM-MSシステムを使用して、所定のリスト内で特定される各ペプチド構造の量を決定することを含む。所定のリストは、例えば、表1で特定されるリストまたは表2で特定されるリストであってもよい。
【0185】
ステップ1006は、機械学習モデルを使用して各ペプチド構造の量を分析し、疾患インジケータを生成することを含む。
【0186】
ステップ1008は、生体試料を、患者がHCC障害を有することを証明するものとして分類する疾患インジケータに基づいて、診断出力を生成することを含む。
【0187】
ステップ1010は、治療用量(複数可)での治療剤の静脈内投与または経口投与のうちの少なくとも一方を介して、患者にHCCの治療剤を投与することを含む。治療は、1つ以上の治療薬またはその誘導体で構成されてもよい。
【0188】
治療剤としては、例えば、アテゾリズマブ、ベバシズマブ、ソラフェニブ(例えば、トシル酸ソラフェニブ)、レンバチニブ(例えば、メシル酸レンバチニブ)、ニボルマブ、レゴラフェニブ、カボザンチニブ(例えば、カボザンチニブ-S-リンゴ酸塩)、ペミガチニブ、ラムシルマブ、またはペムブロリズマブからなる群から選択される少なくとも1つの化合物またはその誘導体を挙げることができるが、これらに限定されない。1つ以上の実施形態では、ステップ1010は、ソラフェニブまたはその誘導体を、毎日775~825mgの範囲の静脈内投与または経口投与のうちの少なくとも一方を介して患者に投与することを含む。1つ以上の実施形態では、ステップ1010は、レンバチニブまたはその誘導体を、患者の体重が60kg未満であるときには7.5~8.5mg/日、患者の体重が60kg超であるときには11.5~12.5mg/日の範囲の静脈内投与または経口投与のうちの少なくとも一方を介して患者に投与することを含む。1つ以上の実施形態では、ステップ1010は、ニボルマブまたはその誘導体を、0.75~1.25mg/kgの範囲の静脈内投与または経口投与のうちの少なくとも一方を介して患者に投与することを含む。1つ以上の実施形態では、ステップ1010は、レゴラフェニブまたはその誘導体を、150~170mg/日の範囲の経口投与を介して患者に投与することを含む。1つ以上の実施形態では、ステップ1010は、カボザンチニブまたはその誘導体を、50~70mg/日の範囲の静脈内投与または経口投与のうちの少なくとも一方を介して患者に投与することを含む。1つ以上の実施形態では、ステップ1010は、ラムシルマブまたはその誘導体を、8~12mg/kgの範囲の静脈内投与または経口投与のうちの少なくとも一方を介して患者に投与することを含む。
【0189】
プロセス1000は、1つ以上の追加のステップを含んでもよい。例えば、プロセス1000は、対象から得られた生体試料がHCCを証明するという決定に応答して、対象を治療するための治療薬を設計することを更に含んでもよい。プロセス900は、対象から得られた生体試料がHCCを証明するという決定に応答して、対象を治療するための治療計画を生成することを含んでもよい。
【0190】
VIII.ペプチド構造及び生成物イオン組成物、キット、ならびに試薬
本開示の態様は、表1に列挙されるペプチド構造のうちの1つ以上を含む組成物を含む。いくつかの実施形態では、組成物は、表1に列挙される複数のペプチド構造を含む。いくつかの実施形態では、組成物は、表1に列挙されるペプチド構造のうちの1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、31個、32個、33個、34個、35個、36個、37個、38個、39個、40個、41個、42個、43個、44個、45個、46個、47個、48個、49個、50個、51個、52個、または53個全てを含む。いくつかの実施形態では、組成物は、表1に列挙される配列番号23~52のうちのいずれか1つと、少なくとも80%の配列同一性、例えば、少なくとも81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%などの配列同一性を伴うアミノ酸配列を有するペプチド構造を含む。
【0191】
本開示の態様は、以下の表4に列挙されるように、定義された電荷及び/または定義された質量電荷(m/z)比を有する1つ以上の前駆体イオンを含む組成物を含む。本開示の態様は、定義された質量電荷(m/z)比を有する1つ以上の生成物イオンを含む組成物を含み、この生成物イオンは、本明細書に記載のペプチド構造(例えば、表1に列挙されるペプチド構造)を質量分析システムにおいて気相イオンに変換することによって産生される。ペプチド構造の気相イオンへの変換は、マトリックス支援レーザー脱離イオン化(MALDI)、電子イオン化(EI)、エレクトロスプレーイオン化(ESI)、大気圧化学イオン化(APCI)、及び/または大気圧光イオン化(APPI)を含むがこれらに限定されない、様々な技法のうちのいずれかを使用して行われ得る。
【0192】
本開示の態様は、本明細書に記載のペプチド構造のうちの1つ以上(例えば、表1に列挙されるペプチド構造)から産生される1つ以上の生成物イオンを含む組成物を含む。いくつかの実施形態では、組成物は、表4の各ペプチド構造について提供されるリストから選択されるm/z比を有する、表4に列挙される生成物イオンのセットを含む。
【0193】
いくつかの実施形態では、組成物は、表1で特定されるペプチド構造PS-1~PS-53のうちの少なくとも1つを含む。
【0194】
いくつかの実施形態では、組成物は、ペプチド構造または生成物イオンを含む。ペプチド構造または生成物イオンは、表1のペプチド構造PS-1~PS-53に対応する、以下の表5で特定される配列番号23~52のうちのいずれか1つと少なくとも90%の配列同一性を有するアミノ酸配列を含む。
【0195】
いくつかの実施形態では、生成物イオンは、表4で特定される生成物イオンからなる群から1つとして選択され、これには、表4で特定されるm/z比の特定されるm/z範囲内に入り、表4で特定されるm/z比の特定されるm/z範囲内のm/z比を有する前駆体イオンを有することを特徴とする生成物イオンが含まれる。生成物イオンm/z比の第1の範囲は、±0.5であってもよい。生成物イオンm/z比の第2の範囲は、±0.8であってもよい。生成物イオンm/z比の第3の範囲は、±1.0であってもよい。前駆体イオンm/z比の第1の範囲は±1.0であってもよく、前駆体イオンm/z比の第2の範囲は(±1.5)であってもよい。このため、組成物は、表4で特定される生成物イオンm/z比の第1の範囲(±0.5)、第2の範囲(±0.8)、または第3の範囲のうちの少なくとも1つに入るm/z比を有する生成物イオンを含んでもよく、表4で特定される前駆体イオンm/z比の第1の範囲(±0.5)、第2の範囲(±1.0)、または第3の範囲(±1.0)のうちの少なくとも1つに入るm/z比を有する前駆体イオンを有することを特徴としてもよい。
【0196】
表4において、「PS-ID番号」は、ペプチド構造の標識またはインデックスを特定するものであり、「R;「RT(分)」は、最小保持時間を特定するものであり、「衝突エネルギー(Coll.Energy)」は、衝突エネルギーを特定するものであり、「前駆体m/z」は、前駆体イオンm/z比を特定するものであり、「前駆体電荷」は、前駆体イオン電荷を特定するものであり、「第1の生成物m/z」は、第1の生成物イオンm/z比を特定するものであり、「第1の生成物電荷」は、第1の生成物イオン電荷を特定するものであり、「第2の生成物イオンm/z」は、第2の生成物イオンm/z比を特定するものであり、「第2の生成物電荷」は、第2の生成物イオン電荷を特定するものである。

【表6-1】
【表6-2】
【表6-3】
【0197】
表5は、表1からの配列番号23~52についてのペプチド配列を定義する。表5は、各ペプチド配列についての対応するタンパク質配列番号を更に特定する。対応するタンパク質配列番号は、ペプチド配列が由来し得るタンパク質を特定する。
【表7】
【0198】
表6は、表1からの配列番号1~22のタンパク質を特定する。表6は、タンパク質配列番号1~22の各々についての対応するタンパク質略記及びタンパク質名を特定する。更に、表6は、タンパク質配列番号1~22の各々についての対応するUniprot IDを特定する。
【表8】
【0199】
表7は、表1に含まれるグリカン構造を特定し、定義する。表7は、特定のグリカンと関連付けられる1つ以上のグリカン構造の図表現、及び表1に含まれる各グリカン構造についての組成物の符号化表現を特定する。本明細書で使用される場合、4桁のGL番号は、ヘキソースの数、HexNAcの数、フコースの数、及びノイラミン酸の数を表す称号である。
【表9-1】
【表9-2】
【表9-3】
【表9-4】
【表9-5】
【表9-6】
【表9-7】
【表9-8】
【表10】
【0200】
本開示の態様は、1つ以上の組成物を含むキットを含み、各々が、アッセイ標準として使用することができる本開示の1つ以上のペプチド構造と、使用説明書とを含む。本明細書に記載の1つ以上の実施形態によるキットは、キットの内容物の意図された使用を示すラベルを含んでもよい。キットに関して本明細書で使用される「ラベル」という用語は、キット上でもしくはキットとともに供給される、または別様にキットに付随する任意の文書または記録物を含む。
【0201】
本明細書に記載されるように、ペプチド構造及びそれから産生される遷移物は、NASH及びHCCを含むがこれらに限定されない、FLD内の様々な疾患状態の診断及び治療に有用であってもよい。遷移物には、前駆体イオン及び少なくとも1つの生成物イオングループが含まれる。本明細書に記載されるように、表1のペプチド構造、ならびにそれらの対応する前駆体イオン及び生成物イオングループ(定義されたm/z比または本明細書で特定されるm/zの範囲内に入るm/z比を有するイオン)は、例えば、NASH及びHCCなどの疾患を診断し、その治療を促進するために、質量分析に基づく分析に使用することができる。
【0202】
本開示の態様は、本明細書に記載されるように、1つ以上のペプチド構造を分析するための方法を含む。いくつかの実施形態では、本方法は、例えば、液体クロマトグラフィーシステム(例えば、高速液体クロマトグラフィーシステム(HPLC))を使用して、質量分析システム(例えば、反応モニタリング質量分析システム)に入力され得る調製された試料を生成するために、患者からの試料を処理することを伴う。ある特定の実施形態では、試料を処理することには、変性手順、還元手順、アルキル化手順、及び消化手順のうちの1つ以上を行うことが含まれ得る。変性及び還元手順は、例えば、図2の変性及び還元202に類似した様式で実践されてもよい。アルキル化手順は、例えば、図2のアルキル化手順204に類似した様式で実践されてもよい。消化手順は、例えば、図2の消化手順206に類似した様式で実践されてもよい。
【0203】
いくつかの実施形態では、1つ以上のペプチド構造を分析するための方法は、質量分析システム(例えば、反応モニタリング質量分析システム)によって生成された生成物イオンのセットを検出することを伴い、これにおいて、1つ以上の生成物イオンは、質量分析システムに入力された1つ以上のペプチド構造の各々に対応してもよい。本明細書に記載されるように、各ペプチド構造は、表4に提供される定義されたm/z比、または表4に提供されるm/z比の特定された範囲内のm/z比を有する生成物イオンのセットに変換され得る。いくつかの実施形態では、本方法は、質量分析システムを使用して検出された1つ以上の生成物イオンの定量化(例えば、存在量)データを生成することを伴う。
【0204】
いくつかの実施形態では、本方法は、定量化データと、教師あり及び/または教師なし機械学習を使用して訓練されたモデルとを使用して、診断出力を生成することを更に含む。ある特定の実施形態では、反応モニタリング質量分析システムは、1つ以上の生成物イオンを検出し、定量化データを生成するために、複数の/選択された反応モニタリング質量分析(MRM/SRM-MS)を含んでもよい。
【0205】
IX.代表的な実験結果
IX.A.試料調製及び質量分析データ作成
図11は、1つ以上の実施形態による、実験に使用される試料集団の表である。実験結果を生成するために使用した試料には、生検で証明されたNASHの診断を受けた患者23人(男性10人、女性13人;Indivumed AG、Hamburg,Germany)、HCCの診断を受けた患者20人(男性16人、女性4人;ステージIが6人、ステージIIが8人、ステージIIIが6人、ステージIVが2人;Indivumed AG)、ならびにiSpecimen,Palleon Pharmaceuticals Inc.及びHuman Immune Monitoring Center(HIMC)of Stanfordから調達した肝臓疾患の病歴のない健常な対象56人(対照、男性26人、女性30人)からの血清試料が含まれた。NASH及びHCC患者の臨床診断は、針生検によりまたは手術時に得られた肝臓組織の病理組織学的特性評価に基づいた。
【0206】
図12は、1つ以上の実施形態による、検証に使用される試料集団の表である。検証試料集団は、良性肝腫瘤と診断された28人の対照対象(男性16人、女性12人)及びHCCと診断された28人の対象(男性20人、女性8人)からの血清試料からなり、全てIndivumed AGから得たものであった。患者の臨床診断は、針生検によりまたは手術時に得られた肝臓組織の病理組織学的特性評価に基づいた。
【0207】
分析に先立ち、血清試料をDTTで還元し、IAAでアルキル化した後、水浴中37℃で18時間、トリプシンで消化させた。消化をクエンチするために、インキュベーション後に各試料にギ酸を加え、最終濃度を1%にした。
【0208】
消化させた血清試料を、液体クロマトグラフィーシステム(例えば、高速液体クロマトグラフィー(HPLC)システム)を使用する三連四重極質量分析計(MS)に注入した。ペプチド構造(グリコシル化及び脱グリコシル化されたもの)の分離を、70分間の二値勾配を使用して行った。三連四重極MSを動的多重反応モニタリング(dMRM)モードで動作させた。試料を、基礎表現型について無作為化した様式で注入し、参照のプール血清消化物に、ラン全体で10番目の試料位置ごとに試験試料を散りばめて注入した。
【0209】
ペプチド構造に対してMRM分析を行うと、合計73個の高存在量血清糖タンパク質が示された。遷移リストは、各糖タンパク質からの糖ペプチド構造及び脱グリコシル化ペプチド構造からなった。Python library Scikit-learn(https://scikit-learn.org/stable/)を、統計分析及び機械学習モデルの構築に使用した。
【0210】
以下の式を使用して、ペプチド構造についての正規化存在量データを生成した。
正規化存在量=
(試料中のペプチド構造の生存在量/同じ糖タンパク質からの対応する脱グリコシル化ペプチドの生存在量)/隣接するプールされた参照血清試料中の同じ糖ペプチドまたはペプチドの平均相対存在量
【0211】
相対存在量は、あらゆる所与の糖ペプチドの生存在量と、全ての糖ペプチドの生存在量の合計との比として算出した。
【0212】
IX.B.ペプチド構造データ(例えば、存在量データ)の分析及びそれらの診断力の確認
図13は、1つ以上の実施形態による、示される質量分析を介して特定及び定量化された選択されたペプチド構造の平均正規化存在量のプロットの図解である。示されるように、ペプチド構造の平均正規化存在量の変化は、制御状態からNASH状態、そしてHCC状態への進行について、一方向に増加または減少した。この存在量データにより、そのようなペプチド構造を使用して、制御状態、NASH状態、及びHCC状態を区別できることが示される。
【0213】
図14は、1つ以上の実施形態による、A2MGの選択されたペプチド構造の正規化存在量のプロットの図解である。
【0214】
図15は、1つ以上の実施形態による、AGP1の選択されたペプチド構造の正規化存在量のプロットの図解である。
【0215】
図16は、1つ以上の実施形態による、HPTの選択されたペプチド構造の正規化存在量のプロットの図解である。
【0216】
図17は、1つ以上の実施形態による、CFAHの選択されたペプチド構造の正規化存在量のプロットの図解である。
【0217】
図18は、1つ以上の実施形態による、A1ATの選択されたペプチド構造の正規化存在量のプロットの図解である。
【0218】
図14~18は、単一の糖タンパク質(例えば、A2MG、AGP1、HPT、CFAH、A1AT)のペプチド構造、及びそのような糖タンパク質の組み合わせのペプチド構造が、対象が非NASH/HCC(例えば、健常状態)からNASHに進行したとき、またはNASHからHCCに進行したときの診断に有用であり得ることを示す。
【0219】
様々なペプチド構造(例えば、表2で特定されるペプチド構造)の正規化存在量を使用して、対象のための疾患インジケータを生成するように第1の回帰モデル(例えば、モデル1)を訓練した。疾患インジケータは、スコア(例えば、確率スコア)として生成され、ここでは、スコアが入る範囲により、非NASH/HCC状態(例えば、対照状態)、NASH状態、またはHCC状態としての診断または分類が可能になる。
【0220】
IX.C.検証
図19は、1つ以上の実施形態による、制御状態、NASH状態、及びHCC状態を区別する疾患インジケータの能力の検証を例解するプロット図である。示されるように、約0.0~約0.05の疾患インジケータは、対照状態として分類する際に概して正確であり、約0.05~約0.4の疾患インジケータは、NASH状態として分類する際に概して正確であり、約0.5~約1.00の疾患インジケータは、HCC状態として分類する際に概して正確であった。
【0221】
図20は、1つ以上の実施形態による、訓練セットと試験セットとの両方についての、NASH状態とHCC状態とを区別するための受信者動作特性(ROC)曲線のプロット図である。一つ抜き交差検証(leave one out cross validation(LOOCV))を、NASH患者とHCC患者との両方からの試料の正規化存在量に対して行った。(ラッソ)正規化を伴うロジスティック回帰モデルを、全ての試料で反復的に訓練したが、その反復で除外された1つの試料は除いた。次に、訓練されたモデルを使用して、除外された試料を予測した。図20に示されるように、訓練セットについてのROC曲線下面積(AUROC)は0.99であることが判明し、一方で試験セットについてのAUROCは0.89であることが判明した。
【0222】
IX.C.1.第2の試料集団を使用した検証
HCCと他の状態とを区別するペプチド構造の能力を検証するために、第2の回帰モデル(モデル2)を使用して、第2の試料集団(図12を参照)を分析した。モデル2は、HCCと良性肝腫瘤とを区別するために、より小さいペプチド構造セットを使用して訓練した。例えば、対照として使用した対象は、良性肝腫瘤の診断を受けた個体であった。これにより、HCCの差次的ペプチド構造存在量の判別力を直接評価することが可能になった。
【0223】
10個のペプチド構造(8個の糖ペプチド構造及び2個のペプチド構造)について分析を行った。10個のペプチド構造は、全てA2MGと関連付けられた。モデル2は、最小絶対収縮及び選択演算子(LASSO)正規化及びLOOCVを使用して構築した。
【0224】
図21は、1つ以上の実施形態による、対照(例えば、健常)状態対HCC、及び良性肝腫瘤対HCCに関する、これら10個のペプチド構造の正規化存在量のプロットである。
【0225】
図22は、1つ以上の実施形態による、訓練セットと試験セットとの両方についての、HCCと良性肝腫瘤とを区別するための受信者動作特性(ROC)曲線のプロットである。訓練セットについてのROC曲線下面積(AUROC)は0.85であることが判明し、一方で試験セットについてのAUROCは0.77であることが判明した。発見セット(例えば、モデル1に使用したセットと同じもの)についてのAUROCは、0.85であることが判明した。
【0226】
表8は、10個のペプチド構造の各々についての訓練されたモデル2及びAUCの重み付け係数を提供する。
【表11】
【0227】
IX.C.2.3人の代表的患者を使用した検証
3人の代表的患者を、HCCと1つ以上の他の状態とを区別するように訓練した訓練された回帰モデルを使用して試験した。表9は、様々なペプチド構造について各患者に対して決定された正規化存在量を提供する。表9の下部には、正規化存在量に基づいてこれらの患者について計算された疾患インジケータが提供される。疾患インジケータは、対象がHCCを有する可能性を示す確率スコアである。疾患インジケータを使用すると、患者3のみがHCCを有すると分類され、これは正しい診断であった。
【表12-1】
【表12-2】
【0228】
X.実施形態の記述
実施形態1.脂肪肝疾患(FLD)進行と関連付けられる複数の状態に関して生体試料を分類する方法であって、対象から得られた前記生体試料中の糖タンパク質のセットに対応するペプチド構造データを受信することと、ペプチド構造のセットについての前記ペプチド構造データから特定された定量化データを機械学習モデルに入力することであって、前記ペプチド構造のセットが、表1の複数のペプチド構造から特定された少なくとも1つのペプチド構造を含む、入力することと、前記機械学習モデルを使用して前記定量化データを分析し、疾患インジケータを生成することと、前記生体試料を、前記FLD進行と関連付けられた前記複数の状態のうちの対応する状態を証明するものとして分類する前記疾患インジケータに基づいて、診断出力を生成することと、を含む、前記方法。
【0229】
実施形態2.前記疾患インジケータがスコアを含み、前記診断出力を生成することは、前記スコアが前記複数の状態のうちの前記対応する状態と関連付けられた選択された範囲内に入ると決定することと、前記スコアが対応する状態と関連付けられた前記選択された範囲内に入るという決定に応答して、前記生体試料が前記対応する状態を証明すると決定することと、を含む、実施形態1に記載の方法。
【0230】
実施形態3.前記複数の状態が、非アルコール性脂肪性肝炎(NASH)状態及び肝細胞癌(HCC)状態を含む、実施形態1または実施形態2に記載の方法。
【0231】
実施形態4.前記複数の状態が、健常状態、肝臓疾患のない状態、または良性肝腫瘤状態のうちの少なくとも1つを含む非NASH/HCC状態を含む、実施形態1~3のいずれか1つに記載の方法。
【0232】
実施形態5.前記少なくとも1つのペプチド構造が、表1で特定される、ペプチド配列によって定義される糖ペプチド構造と、前記ペプチド配列の連結部位で前記ペプチド配列に連結しているグリカン構造と、を含み、前記ペプチド配列が、表1で定義される配列番号23、24、25、29、30、31、33、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、または52のうちの1つである、実施形態1~4のいずれか1つに記載の方法。
【0233】
実施形態6.訓練データを使用して前記機械学習モデルを訓練することを更に含み、前記訓練データが、複数の対象についての複数のペプチド構造プロファイルを含み、前記複数のペプチド構造プロファイルの各ペプチド構造プロファイルに対する前記複数の状態のうちの診断された状態を特定する、実施形態1~5のいずれか1つに記載の方法。
【0234】
実施形態7.(1)初期訓練データを使用して差次的発現分析を行い、NASHと診断された前記複数の対象の第1の部分とHCCと診断された前記複数の対象の第2の部分、NASHと診断された前記複数の対象の前記第1の部分と対照状態に割り当てられた前記複数の対象の第3の部分、またはHCCと診断された前記複数の対象の前記第2の部分と対照状態に割り当てられた前記複数の対象の第3の部分、のうちの少なくとも1つを比較することと、(2)前記FLD進行についての予後マーカーとして使用するために、前記差次的発現分析に基づいてペプチド構造の群を特定することであって、前記ペプチド構造の群が表1で特定される、特定することと、(3)特定された前記ペプチド構造の群に基づいて前記訓練データを形成させることと、を更に含む、実施形態6に記載の方法。
【0235】
実施形態8.前記対照状態が、健常状態、肝臓疾患のない状態、または良性肝腫瘤状態のうちの少なくとも1つを含む、実施形態7に記載の方法。
【0236】
実施形態9.前記機械学習モデルが、ロジスティック回帰モデルを含む、実施形態1~8のいずれか1つに記載の方法。
【0237】
実施形態10.前記ペプチド構造のセットのうちのあるペプチド構造についての前記定量化データが、存在量、相対存在量、正規化存在量、相対量、調整量、正規化量、相対濃度、調整濃度、または正規化濃度のうちの少なくとも1つを含む、実施形態1~9のいずれか1つに記載の方法。
【0238】
実施形態11.前記ペプチド構造のセットについての前記定量化データが、前記ペプチド構造のセットの各ペプチド構造の正規化存在量を含む、実施形態1~9のいずれか1つに記載の方法。
【0239】
実施形態12.前記ペプチド構造データが、多重反応モニタリング質量分析(MRM-MS)を使用して生成される、実施形態1~11のいずれか1つに記載の方法。
【0240】
実施形態13.前記ペプチド構造データが、液体クロマトグラフィー/質量分析(LC/MS)システムを使用して生成される、実施形態1~11のいずれか1つに記載の方法。
【0241】
実施形態14.前記生体試料から試料を創出することと、還元、アルキル化、及び酵素消化を使用して前記試料を調製し、前記ペプチド構造のセットを含む調製された試料を形成させることと、を更に含む、実施形態1~13のいずれか1つに記載の方法。
【0242】
実施形態15.前記ペプチド構造データを、多重反応モニタリング質量分析(MRM-MS)を使用して前記調製された試料から生成することを更に含む、実施形態14に記載の方法。
【0243】
実施形態16.前記生体試料が、血液、血清、または血漿のうちの少なくとも1つを含む、実施形態1~15のいずれか1つに記載の方法。
【0244】
実施形態17.前記診断出力を生成することが、前記対応する状態を特定するレポートを生成することを含む、実施形態1~16のいずれか1つに記載の方法。
【0245】
実施形態18.前記診断出力または前記疾患インジケータのうちの少なくとも一方に基づいて治療出力を生成することを更に含む、実施形態1~17のいずれか1つに記載の方法。
【0246】
実施形態19.前記治療出力が、前記対象を治療するための治療の特定、前記治療のための設計、前記治療のための製造計画、または前記治療を施すための治療計画のうちの少なくとも1つを含む、実施形態18に記載の方法。
【0247】
実施形態20.前記対応する状態がNASH状態であり、前記治療が、オベチコール酸(OCA)、トロピフェキソール、エラフィブラノル、サログリタザール、アラムコール、セマグルチド、チルゼパチド、コタデュチド、NGM282、MSDC-0602K、レスメチロム、セニクリビロク、セロンセルチブ、エムリカサン、シムツズマブ、またはGR-MD-02のうちの少なくとも1つを含む、実施形態19に記載の方法。
【0248】
実施形態21.前記対応する状態が、HCC状態であり、前記治療が、アテゾリズマブ、ベバシズマブ、ソラフェニブ、レンバチニブ、ニボルマブ、レゴラフェニブ、カボザンチニブ、ペミガチニブ、ラムシルマブ、またはペムブロリズマブのうちの少なくとも1つを含む、実施形態19に記載の方法。
【0249】
実施形態22.該対応する状態が、非アルコール性脂肪性肝炎(NASH)であり、前記対象のための治療計画を生成することを更に含み、前記治療計画が、ライフスタイル改善のセット、食生活改善のセット、コーヒー、ビタミンE、カロリー低減、塩分摂取の低減、糖分摂取の低減、またはコレステロール低減薬のセットのうちの少なくとも1つを特定する、実施形態1~18のいずれか1つに記載の方法。
【0250】
実施形態23.前記対応する状態がNASH状態であり、前記診断出力は、前記生体試料が前記対応する状態について陽性であることを特定し、更に、治療用量の治療薬を前記対象に投与することを含み、前記治療薬が、オベチコール酸(OCA)、トロピフェキソール、エラフィブラノル、サログリタザール、アラムコール、セマグルチド、チルゼパチド、コタデュチド、NGM282、MSDC-0602K、レスメチロム、セニクリビロク、セロンセルチブ、エムリカサン、シムツズマブ、及びGR-MD-02からなる群から選択される、実施形態1~18のいずれか1つに記載の方法。
【0251】
実施形態24.前記対応する状態がHCC状態であり、前記診断出力は、前記生体試料が前記対応する状態について陽性であることを特定し、更に、治療用量の治療薬を前記対象に投与することを含み、前記治療薬が、アテゾリズマブ、ベバシズマブ、ソラフェニブ、レンバチニブ、ニボルマブ、レゴラフェニブ、カボザンチニブ、ペミガチニブ、ラムシルマブ、またはペムブロリズマブからなる群から選択される、実施形態1~18のいずれか1つに記載の方法。
【0252】
実施形態25.脂肪肝疾患(FLD)進行と関連付けられる複数の状態のうちの1つと診断するように、モデルを訓練する方法であって、前記FLD進行と関連付けられる前記複数の状態と診断された複数の対象のペプチド構造のパネルについての定量化データを受信することであって、前記定量化データが、前記複数の対象の複数のペプチド構造プロファイルを含み、前記複数のペプチド構造プロファイルの各ペプチド構造プロファイルに対する前記複数の状態のうちの対応する状態を特定する、受信することと、前記複数の状態のうちのどの状態に前記対象からの生体試料が対応するかを決定するように、前記定量化データを使用して機械学習モデルを訓練することと、を含む、前記方法。
【0253】
実施形態26.前記機械学習モデルが、ロジスティック回帰モデルを含む、実施形態25に記載の方法。
【0254】
実施形態27.前記ロジスティック回帰モデルが、ラッソ回帰モデルを含む、実施形態26に記載の方法。
【0255】
実施形態28.前記機械学習モデルを訓練することが、前記複数の状態のうちのどの状態に前記対象からの前記生体試料が対応するのかを決定するように、前記ペプチド構造のパネルのサブセットであるペプチド構造のセットに対応する前記定量化データの一部分を使用して前記機械学習モデルを訓練することを含む、実施形態25~27のいずれか1つに記載の方法。
【0256】
実施形態29.前記複数の対象の前記定量化データを使用して差次的発現分析を行うことを更に含む、実施形態28に記載の方法。
【0257】
実施形態30.前記ペプチド構造のセットを、前記差次的発現分析の一部として計算された倍率変化、偽発見率、またはp値のうちの少なくとも1つに基づいて、前記複数の状態のうちのどの状態に前記対象からの前記生体試料が対応するかを決定することに関連性のある前記複数のペプチド構造の前記サブセットとして特定することを更に含む、実施形態29に記載の方法。
【0258】
実施形態31.前記複数の状態が、非アルコール性脂肪性肝炎(NASH)状態、肝細胞癌(HCC)状態、または健常状態のうちの少なくとも1つを更に含む、実施形態25~30のいずれか1つに記載の方法。
【0259】
実施形態32.前記複数の状態と診断された前記複数の対象についての前記ペプチド構造のパネルの前記定量化データが、存在量、相対存在量、正規化存在量、相対量、調整量、正規化量、相対濃度、調整濃度、または正規化濃度のうちの少なくとも1つを含む、実施形態25~31のいずれか1つに記載の方法。
【0260】
実施形態33.前記複数の状態と診断された前記複数の対象についての前記ペプチド構造のパネルの前記定量化データが、正規化存在量を含む、実施形態25~31のいずれか1つに記載の方法。
【0261】
実施形態34.前記生体試料が、血液、血清、または血漿のうちの少なくとも1つを含む、実施形態25~33のいずれか1つに記載の方法。
【0262】
実施形態35.前記定量化データが、液体クロマトグラフィー/質量分析(LC/MS)システムを使用して生成される、実施形態25~34のいずれか1つに記載の方法。
【0263】
実施形態36.前記定量化データが、多重反応モニタリング質量分析(MRM-MS)を使用して生成される、実施形態25~35のいずれか1つに記載の方法。
【0264】
実施形態37.生体試料中の脂肪肝疾患(FLD)進行と関連付けられる複数の状態のうちの1つの存在を検出する方法であって、対象から得られた前記生体試料中の糖タンパク質のセットに対応するペプチド構造データを受信することと、教師あり機械学習モデルを使用して前記ペプチド構造データを分析し、表1で特定されるペプチド構造の群から選択される少なくとも3つのペプチド構造に基づいて疾患インジケータを生成することと、前記疾患インジケータが、前記対応する状態と関連付けられる選択された範囲内に入るという決定に応答して、前記FLD進行と関連付けられる前記複数の状態のうちの前記対応する状態の存在を検出することと、を含む、前記方法。
【0265】
実施形態38.前記少なくとも3つのペプチド構造のうちのあるペプチド構造が、表1で特定される、ペプチド配列によって定義される糖ペプチド構造と、前記ペプチド配列の連結部位で前記ペプチド配列に連結しているグリカン構造と、を含み、前記ペプチド配列が、表1で定義される配列番号23、24、25、29、30、31、33、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、52、または52のうちの1つである、実施形態37に記載の方法。
【0266】
実施形態39.前記教師あり機械学習モデルが、ロジスティック回帰モデルを含む、実施形態37または実施形態38に記載の方法。
【0267】
実施形態40.前記教師あり機械学習モデルが、罰則付き多変数ロジスティック回帰モデルを含む、実施形態37~39のいずれか1つに記載の方法。
【0268】
実施形態41.前記ペプチド構造データが、定量化データを含む、実施形態37~40のいずれか1つに記載の方法。
【0269】
実施形態42.前記ペプチド構造の群のうちのあるペプチド構造についての前記定量化データが、存在量、相対存在量、正規化存在量、相対量、調整量、正規化量、相対濃度、調整濃度、または正規化濃度のうちの少なくとも1つを含む、実施形態41に記載の方法。
【0270】
実施形態43.前記定量化データが、正規化存在量を含む、実施形態41に記載の方法。
【0271】
実施形態44.前記疾患インジケータが確率スコアである、実施形態37~43のいずれか1つに記載の方法。
【0272】
実施形態45.前記対象について検出された前記対応する状態に基づいて、診断を含むレポートを生成することを更に含む、実施形態37~44のいずれか1つに記載の方法。
【0273】
実施形態46.前記複数の状態が、非アルコール性脂肪性肝炎(NASH)状態、肝細胞癌(HCC)状態、及び非NASH/HCC状態からなる群から選択される少なくとも2つを含む、実施形態37~45のいずれか1つに記載の方法。
【0274】
実施形態47.前記ペプチド構造データを分析することが、前記少なくとも3つのペプチド構造の各ペプチド構造と関連付けられた重み係数を使用して前記疾患インジケータを計算することを含み、前記少なくとも3つのペプチド構造のうちの対応するペプチド構造の前記重み係数が、前記疾患インジケータに対する前記対応するペプチド構造の相対的有意性を示すものである、実施形態37~46のいずれか1つに記載の方法。
【0275】
実施形態48.前記ペプチド構造を分析することが、前記少なくとも3つのペプチド構造の各ペプチド構造の重み付け値を特定する前記生体試料のペプチド構造プロファイルを計算することであって、前記少なくとも3つのペプチド構造の各ペプチド構造の重み付け値が、前記ペプチド構造データから特定される前記ペプチド構造の定量化メトリック及び前記ペプチド構造の重み係数の積である、計算することと、前記ペプチド構造プロファイルを使用して前記疾患インジケータを計算することと、を含む、実施形態37~46のいずれか1つに記載の方法。
【0276】
実施形態49.前記対応する状態が、非NASH/HCC状態であり、前記非NASH/HCC状態と関連付けられた前記選択された範囲が、0.00~0.05である、実施形態37~48のいずれか1つに記載の方法。
【0277】
実施形態50.前記対応する状態が、非アルコール性脂肪性肝炎(NASH)状態であり、前記NASH状態と関連付けられた前記選択された範囲が、0.05~0.4である、実施形態37~48のいずれか1つに記載の方法。
【0278】
実施形態51.前記対応する状態が、肝細胞癌(HCC)状態であり、前記HCC状態と関連付けられた前記選択された範囲が、0.4~1.0である、実施形態37~48のいずれか1つに記載の方法。
【0279】
実施形態52.前記生体試料から試料を創出することと、還元、アルキル化、及び酵素消化を使用して前記試料を調製し、ペプチド構造のセットを含む調製された試料を形成させることと、を更に含む、実施形態37~51のいずれか1つに記載の方法。
【0280】
実施形態53.前記ペプチド構造データを、多重反応モニタリング質量分析(MRM-MS)を使用して前記調製された試料から生成することを更に含む、実施形態52に記載の方法。
【0281】
実施形態54.前記ペプチド構造データが、液体クロマトグラフィー/質量分析(LC/MS)システムを使用して生成される、実施形態37~52のいずれか1つに記載の方法。
【0282】
実施形態55.前記ペプチド構造データが、多重反応モニタリング質量分析(MRM-MS)を使用して生成される、実施形態37~52のいずれか1つに記載の方法。
【0283】
実施形態56.前記生体試料が、血液、血清、または血漿のうちの少なくとも1つを含む、実施形態37~55のいずれか1つに記載の方法。
【0284】
実施形態57.前記疾患インジケータに基づいて治療出力を生成することを更に含む、実施形態37~56のいずれか1つに記載の方法。
【0285】
実施形態58.前記治療出力が、前記対象を治療するための治療の特定、前記治療のための設計、前記治療のための製造計画、または前記治療を施すための治療計画のうちの少なくとも1つを含む、実施形態57に記載の方法。
【0286】
実施形態59.前記対応する状態がNASH状態であり、前記治療が、オベチコール酸(OCA)、トロピフェキソール、エラフィブラノル、サログリタザール、アラムコール、セマグルチド、チルゼパチド、コタデュチド、NGM282、MSDC-0602K、レスメチロム、セニクリビロク、セロンセルチブ、エムリカサン、シムツズマブ、及びGR-MD-02のうちの少なくとも1つを含む、実施形態58に記載の方法。
【0287】
実施形態60.前記対応する状態が、HCC状態であり、前記治療が、アテゾリズマブ、ベバシズマブ、ソラフェニブ、レンバチニブ、ニボルマブ、レゴラフェニブ、カボザンチニブ、ペミガチニブ、ラムシルマブ、またはペムブロリズマブのうちの少なくとも1つを含む、実施形態58に記載の方法。
【0288】
実施形態61.前記対応する状態がNASH状態であり、更に、治療用量の治療薬を前記対象に投与することを含み、前記治療薬が、オベチコール酸(OCA)、トロピフェキソール、エラフィブラノル、サログリタザール、アラムコール、セマグルチド、チルゼパチド、コタデュチド、NGM282、MSDC-0602K、レスメチロム、セニクリビロク、セロンセルチブ、エムリカサン、シムツズマブ、及びGR-MD-02からなる群から選択される、実施形態37~57のいずれか1つに記載の方法。
【0289】
実施形態62.前記対応する状態がHCC状態であり、更に、治療用量の治療薬を前記対象に投与することを含み、前記治療薬が、アテゾリズマブ、ベバシズマブ、ソラフェニブ、レンバチニブ、ニボルマブ、レゴラフェニブ、カボザンチニブ、ペミガチニブ、ラムシルマブ、またはペムブロリズマブからなる群から選択される、実施形態37~57のいずれか1つに記載の方法。
【0290】
実施形態63.脂肪肝疾患(FLD)進行と関連付けられる複数の状態のうちの1つに対応するものとして生体試料を分類する方法であって、訓練データを使用して教師あり機械学習モデルを訓練することであって、前記訓練データが、複数の訓練対象の複数のペプチド構造プロファイルを含み、前記複数のペプチド構造プロファイルの各ペプチド構造プロファイルに対する前記複数の状態のうちの一状態を特定する、訓練することと、対象から得られた前記生体試料中の糖タンパク質のセットに対応するペプチド構造データを受信することと、ペプチド構造のセットについての前記ペプチド構造データから特定された定量化データを、訓練された前記教師あり機械学習モデルに入力することであって、前記ペプチド構造のセットが、表1で特定される少なくとも1つのペプチド構造を含む、入力することと、前記教師あり機械学習モデルを使用して前記定量化データを分析し、スコアを生成することと、前記スコアが、前記FLD進行と関連付けられる前記複数の状態のうちの対応する状態と関連付けられた選択された範囲内に入ると決定することと、前記生体試料が前記対応する状態を証明することを示す診断出力を生成することであって、前記複数の状態が、非アルコール性脂肪性肝炎(NASH)状態、肝細胞癌(HCC)状態、及び非NASH/HCC状態を含む、生成することと、を含む、前記方法。
【0291】
実施形態64.患者における非アルコール性脂肪性肝炎(NASH)障害を治療して、前記NASH障害の肝細胞癌への進行の低減、失速、または逆転のうちの少なくとも1つを行う方法であって、前記患者からの生体試料を受け取ることと、多重反応モニタリング質量分析(MRM-MS)システムを使用して、前記生体試料中の表1で特定される各ペプチド構造の量を決定することと、機械学習モデルを使用して各ペプチド構造の前記量を分析して、疾患インジケータを生成することと、前記患者が前記NASH障害を有することを証明するものとして前記生体試料を分類する前記疾患インジケータに基づいて、診断出力を生成することと、オベチコール酸(OCA)またはその誘導体を前記患者に投与することであって、前記投与することが、毎日10~25mgの範囲の静脈内投与または経口投与のうちの少なくとも一方を含む、投与することと、を含む、前記方法。
【0292】
実施形態65.前記生体試料を調製して、ペプチド構造のセットを含む調製された試料を形成させることと、前記調製された試料を、液体クロマトグラフィーシステムを使用する前記MRM-MSシステムに入力することと、を更に含む、実施形態64に記載の方法。
【0293】
実施形態66.患者における肝細胞癌(HCC)障害を治療する方法であって、前記患者からの前記生体試料を受け取ることと、多重反応モニタリング質量分析(MRM-MS)システムを使用して、前記生体試料中の表1で特定される各ペプチド構造の量を決定することと、機械学習モデルを使用して各ペプチド構造の前記量を分析して、疾患インジケータを生成することと、前記患者が前記HCC障害を有することを証明するものとして前記生体試料を分類する前記疾患インジケータに基づいて、診断出力を生成することと、
前記患者へのソラフェニブまたはその誘導体(前記投与には、毎日775~825mgの範囲の静脈内投与または経口投与のうちの少なくとも一方が含まれる)、
患者へのレンバチニブまたはその誘導体(前記投与には、前記患者の体重が60kg未満であるときには7.5~8.5mg/日、前記患者の体重が60kg超であるときには11.5~12.5mg/日の範囲の静脈内投与または経口投与のうちの少なくとも一方が含まれる)、
前記患者へのニボルマブまたはその誘導体(前記投与には、0.75~1.25mg/kgの範囲の静脈内投与または経口投与のうちの少なくとも一方が含まれる)、
前記患者へのレゴラフェニブまたはその誘導体)前記投与には、150~170mg/日の範囲の経口投与が含まれる)、
前記患者へのカボザンチニブまたはその誘導体(前記投与には、50~70mg/日の範囲の静脈内投与または経口投与のうちの少なくとも一方が含まれる)、
前記患者へのラムシルマブまたはその誘導体(前記投与には、8~12mg/kgの範囲の静脈内投与または経口投与のうちの少なくとも一方が含まれる)のうちの少なくとも1つを投与することと、を含む、前記方法。
【0294】
実施形態67.前記生体試料を調製して、ペプチド構造のセットを含む調製された試料を形成させることと、前記調製された試料を、液体クロマトグラフィーシステムを使用する分析のために前記MRM-MSシステムに入力することと、を更に含む、実施形態66に記載の方法。
【0295】
実施形態68.脂肪肝疾患(FLD)進行と関連付けられる疾患状態と診断された対象の治療を設計するための方法であって、実施形態1~63のいずれか1つに記載の方法の一部または全部を使用して、前記対象から得られる生体試料が疾患状態を証明すると決定することに応答して、前記対象を治療するための治療薬を設計することを含む、前記方法。
【0296】
実施形態69.脂肪肝疾患(FLD)進行と関連付けられる疾患状態と診断された対象の治療を計画するための方法であって、実施形態1~63のいずれか1つに記載の方法の一部または全部を使用して、前記対象から得られる生体試料が疾患状態を証明すると決定することに応答して、前記対象を治療するための治療計画を生成することを含む、前記方法。
【0297】
実施形態70.脂肪肝疾患(FLD)進行と関連付けられる疾患状態と診断された対象を治療する方法であって、実施形態1~63のいずれか1つに記載の方法の一部または全部を使用して、前記対象から得られる生体試料が疾患状態を証明すると決定することに基づいて、前記対象を治療するための治療薬を前記対象に投与することを含む、前記方法。
【0298】
実施形態71.脂肪肝疾患(FLD)進行と関連付けられる疾患状態と診断された対象を治療する方法であって、実施形態1~63のいずれか1つに記載の方法を使用して、前記対象が前記治療薬に応答すると決定することに基づいて、前記対象を治療するための治療薬を選択することを含む、前記方法。
【0299】
実施形態72.患者からの試料中のペプチド構造のセットを分析するための方法であって、前記方法が、
(a)前記患者から前記試料を得ることと、
(b)前記試料を調製して、前記ペプチド構造のセットを含む調製された試料を形成させることと、
(c)液体クロマトグラフィーシステムを使用して、前記調製した試料を質量分析システムに入力することと、
(d)前記質量分析システムを使用して、前記ペプチド構造のセットの各ペプチド構造と関連付けられる生成物イオンのセットを検出することであって、
前記ペプチド構造のセットが、表4で特定されるペプチド構造PS-1~PS-53から選択される少なくとも1つのペプチド構造を含み、
前記ペプチド構造のセットが、ペプチド構造であって、
(i)質量電荷(m/z)比が、前記ペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±1.5以内である、前駆体イオンと、
(ii)m/z比が、前記ペプチド構造に対応するものとして表4で第1の生成物イオンについて列挙されるm/z比の±1.0以内である、生成物イオンと、を有する、ペプチド構造を含む、検出することと、
(e)前記質量分析システムを使用して、前記生成物イオンのセットの定量化データを生成することと、を含む、前記方法。
【0300】
実施形態73.前記前駆体イオンの前記質量電荷(m/z)比が、前記ペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±1.0以内である、実施形態72に記載の方法。
【0301】
実施形態74.前記前駆体イオンの前記質量電荷(m/z)比が、前記ペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±0.5以内である、実施形態72に記載の方法。
【0302】
実施形態75.前記生成物イオンの前記質量電荷(m/z)比が、前記ペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±0.8以内である、実施形態72に記載の方法。
【0303】
実施形態76.前記生成物イオンの前記質量電荷(m/z)比が、前記ペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±0.5以内である、実施形態72に記載の方法。
【0304】
実施形態77.前記定量化データと、脂肪肝疾患(FLD)進行と関連付けられる疾患状態の存在を検出するように訓練された機械学習モデルとを使用して、診断出力を生成することを更に含む、実施形態72~76のいずれか1つに記載の方法。
【0305】
実施形態78.前記質量分析システムが、多重反応モニタリング質量分析(MRM-MS)、または選択反応モニタリング質量分析(SRM-MS)のうちの少なくとも一方を使用して、前記生成物イオンのセットを検出し、前記定量化データを生成する、反応モニタリング質量分析システムを含む、実施形態72~77のいずれか1つに記載の方法。
【0306】
実施形態79.前記液体クロマトグラフィーシステムが、高速液体クロマトグラフィーシステムである、実施形態72~78のいずれか1つに記載の方法。
【0307】
実施形態80.前記試料が、血漿試料を含む、実施形態72~79のいずれか1つに記載の方法。
【0308】
実施形態81.前記試料が、血清試料を含む、実施形態72~80のいずれか1つに記載の方法。
【0309】
実施形態82.前記試料が、血液試料を含む、実施形態72~81のいずれか1つに記載の方法。
【0310】
実施形態83.前記試料を調製することが、前記試料中の1つ以上のタンパク質を変性させて、1つ以上の変性タンパク質を形成させること、前記試料中の前記1つ以上の変性タンパク質を還元して、1つ以上の還元タンパク質を形成させること、アルキル化剤を使用して前記試料中の1つ以上のタンパク質をアルキル化して、前記1つ以上の還元タンパク質中のジスルフィド結合の再形成を防止し、1つ以上のアルキル化タンパク質を形成させること、またはタンパク質分解触媒を使用して前記試料中の前記1つ以上のアルキル化タンパク質を消化させて、前記ペプチド構造のセットを含む前記調製された試料を形成させること、のうちの少なくとも1つを含む、実施形態72~82のいずれか1つに記載の方法。
【0311】
実施形態84.表1で特定されるペプチド構造PS-1~PS-53のうちの少なくとも1つを含む、組成物。
【0312】
実施形態85.ペプチド構造または生成物イオンを含む組成物であって、前記ペプチド構造または生成物イオンが、表1のペプチド構造PS-1~PS-53に対応する、配列番号23~52のうちのいずれか1つと少なくとも90%の配列同一性を有するアミノ酸配列を含み、前記生成物イオンが、特定されるm/z範囲内に入る生成物イオンを含む、表4で特定される生成物イオンからなる群から1つとして選択される、前記組成物。
【0313】
実施形態86.表4で特定されるペプチド構造PS-1~PS-53からなる群から1つとして選択される糖ペプチド構造を含む組成物であって、前記糖ペプチド構造が、前記糖ペプチド構造に対応するものとして表5で特定されるアミノ酸ペプチド配列と、グリカン構造であって、前記グリカン構造が表1で特定される対応する位置でアミノ酸ペプチド配列の残基に連結している糖ペプチド構造に対応するものとして表1で特定されるグリカン構造と、を含み、前記グリカン構造が、グリカン組成を有する、前記組成物。
【0314】
実施形態87.前記グリカン組成が表7に特定される、実施形態86に記載の組成物。
【0315】
実施形態88.前記糖ペプチド構造は、電荷が前記糖ペプチド構造に対応するものとして表4で特定される前駆体イオンを有する、実施形態86または実施形態87に記載の組成物。
【0316】
実施形態89.前記糖ペプチド構造が、前駆体イオンを有し、前記前駆体イオンは、m/z比が、前記糖ペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±1.5以内である、実施形態86~88のいずれか1つに記載の組成物。
【0317】
実施形態90.前記糖ペプチド構造が、前駆体イオンを有し、前記前駆体イオンは、m/z比が、前記糖ペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±1.0以内である、実施形態86~88のいずれか1つに記載の組成物。
【0318】
実施形態91.前記糖ペプチド構造が、前駆体イオンを有し、前記前駆体イオンは、m/z比が、前記糖ペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±0.5以内である、実施形態86~88のいずれか1つに記載の組成物。
【0319】
実施形態92.前記糖ペプチド構造が、生成物イオンを有し、前記生成物イオンは、m/z比が、前記糖ペプチド構造に対応するものとして表4で第1の生成物イオンについて列挙されるm/z比の±1.0以内である、実施形態86~91のいずれか1つに記載の組成物。
【0320】
実施形態93.前記糖ペプチド構造が、生成物イオンを有し、前記生成物イオンは、m/z比が、前記糖ペプチド構造に対応するものとして表4で第1の生成物イオンについて列挙されるm/z比の±0.8以内である、実施形態86~91のいずれか1つに記載の組成物。
【0321】
実施形態94.前記糖ペプチド構造が、生成物イオンを有し、前記生成物イオンは、m/z比が、前記糖ペプチド構造に対応するものとして表4で第1の生成物イオンについて列挙されるm/z比の±0.5以内である、実施形態86~91のいずれか1つに記載の組成物。
【0322】
実施形態95.前記糖ペプチド構造が、前記糖ペプチド構造に対応するものとして表1で特定されるモノアイソトピック質量を有する、実施形態86~94のいずれか1つに記載の組成物。
【0323】
実施形態96.表1で特定される複数のペプチド構造から1つとして選択されるペプチド構造を含む組成物であって、前記ペプチド構造が、表1で前記ペプチド構造に対応するものとして特定されるモノアイソトピック質量を有し、前記ペプチド構造が、前記ペプチド構造に対応するものとして表1で特定される配列番号23~52のアミノ酸配列を含む、前記組成物。
【0324】
実施形態97.前記ペプチド構造は、電荷が前記ペプチド構造に対応するものとして表4で特定される前駆体イオンを有する、実施形態96に記載の組成物。
【0325】
実施形態98.前記ペプチド構造が、前駆体イオンを有し、前記前駆体イオンは、m/z比が、前記ペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±1.5以内である、実施形態96または実施形態97に記載の組成物。
【0326】
実施形態99.前記ペプチド構造が、前駆体イオンを有し、前記前駆体イオンは、m/z比が、前記ペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±1.0以内である、実施形態96または実施形態97に記載の組成物。
【0327】
実施形態100.前記ペプチド構造が、前駆体イオンを有し、前記前駆体イオンは、m/z比が、前記ペプチド構造に対応するものとして表4で前駆体イオンについて列挙されるm/z比の±0.5以内である、実施形態96または実施形態97に記載の組成物。
【0328】
実施形態101.前記ペプチド構造が、生成物イオンを有し、前記生成物イオンは、m/z比が、前記ペプチド構造に対応するものとして表4で第1の生成物イオンについて列挙されるm/z比の±1.0以内である、実施形態96~100のいずれか1つに記載の組成物。
【0329】
実施形態102.前記ペプチド構造が、生成物イオンを有し、前記生成物イオンは、m/z比が、前記ペプチド構造に対応するものとして表4で第1の生成物イオンについて列挙されるm/z比の±0.8以内である、実施形態96~100のいずれか1つに記載の組成物。
【0330】
実施形態103.前記ペプチド構造が、生成物イオンを有し、前記生成物イオンは、m/z比が、前記ペプチド構造に対応するものとして表4で第1の生成物イオンについて列挙されるm/z比の±0.5以内である、実施形態96~100のいずれか1つに記載の組成物。
【0331】
実施形態104.キットであって、実施形態1~83のいずれか1つに記載の方法の一部または全部を実行するために、表1で特定される少なくとも1つのペプチド構造を定量化するための少なくとも1つの薬剤を含む、前記キット。
【0332】
実施形態105.キットであって、実施形態1~83のいずれか1つに記載の方法の一部または全部を実行するために、糖ペプチド標準、緩衝液、またはペプチド配列のセットのうちの少なくとも1つを含み、前記ペプチド配列のセットのうちのあるペプチド配列が、表1で定義される配列番号23~52のうちの対応するものによって特定される、前記キット。
【0333】
実施形態106.システムであって、1つ以上のデータプロセッサと、前記1つ以上のデータプロセッサ上で実行されると、前記1つ以上のデータプロセッサに、実施形態1~83のいずれか1つに記載の一部または全部を実施させる命令を含む非一時的コンピュータ可読記憶媒体と、を含む、前記システム。
【0334】
実施形態107.コンピュータプログラム製品であって、1つ以上のデータプロセッサに、実施形態1~83のいずれか1つに記載の一部または全部を実施させるように構成されている命令を含む、非一時的機械可読記憶媒体に有形的に統合される、前記コンピュータプログラム製品。
【0335】
更に、実施形態は、上記の実施形態1~107のいずれか1つ以上の一部または全部を含んでもよい。例えば、実施形態は、任意の組み合わせで使用される実施形態1~107のうちのいずれか1つ以上からの1つ以上の特徴を含んでもよい。
【0336】
XI.追加の考慮事項
本文書のセクション及びサブセクション間のいずれのヘッダー及び/またはサブヘッダーも、読みやすさを向上させることのみを目的として含まれ、セクション及びサブセクション間を越えて特徴を組み合わせることができないことを暗示するものではない。したがって、セクション及びサブセクションは、別個の実施形態を説明するものではない。
【0337】
本教示は様々な実施形態と併せて説明されるが、本教示がそのような実施形態に限定されることは意図されない。反対に、本教示は、当業者によって理解されるように、様々な代替、修正、及び等価物を包含する。本説明は、好ましい例示的な実施形態を提供するものであり、本開示の範囲、適用可能性、または構成を限定することは意図されない。むしろ、好ましい例示的な実施形態の本説明は、当業者に、様々な実施形態を実践するための有効な説明を提供する。
【0338】
添付の特許請求の範囲に示される趣旨及び範囲から逸脱することなく、要素の機能及び配置に様々な変更を行ってもよいことが理解される。このため、そのような修正及び変形は、添付の特許請求の範囲に示される範囲内であるとみなされる。更に、用いられている用語及び表現は、説明の語として使用されるものであり、限定ではなく、そのような用語及び表現の使用には、示され説明される特徴またはその一部分のいずれの等価物も除外する意図はなく、特許請求される本発明の範囲内で様々な修正が可能であることが認識される。
【0339】
様々な実施形態を説明する際に、本明細書は、方法及び/またはプロセスを特定の一連のステップとして提示している場合がある。しかしながら、方法またはプロセスが本明細書に示されるステップの特定の順序に依存しない限り、本方法またはプロセスは、記載されたステップの特定の順序に限定されるべきではなく、当業者であれば、配列が変化し、それでも様々な実施形態の趣旨及び範囲内に留まり得ることが容易に理解することができる。
【0340】
本開示のいくつかの実施形態は、1つ以上のデータプロセッサを含むシステムを含む。いくつかの実施形態では、本システムは、1つ以上のデータプロセッサ上で実行されると、1つ以上のデータプロセッサに、本明細書に開示される1つ以上の方法の一部もしくは全部及び/または1つ以上のプロセスの一部もしくは全部を実施させる命令を含む非一時的コンピュータ可読記憶媒体を含む。本開示のいくつかの実施形態は、1つ以上のデータプロセッサに、本明細書に開示される1つ以上の方法の一部もしくは全部及び/または1つ以上のプロセスの一部または全部を実施させるように構成されている命令を含む、非一時的機械可読記憶媒体に有形的に統合されるコンピュータプログラム製品を含む。
【0341】
実施形態の理解を提供するために、本明細書に具体的な詳細が付与される。しかしながら、実施形態は、これらの具体的な詳細なしに実施されてもよいことが理解される。例えば、回路、システム、ネットワーク、プロセス、及び他の構成要素は、不必要な詳細で実施形態を不明瞭にしないように、ブロック図形式で構成要素として示され得る。他の場合には、実施形態を不明瞭にすることを避けるために、周知の回路、プロセス、アルゴリズム、構造、及び技法は、不必要な詳細なしに示され得る。
図1
図2A
図2B
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
【配列表】
2023554166000001.app
【国際調査報告】