(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2023-11-30
(45)【発行日】2023-12-08
(54)【発明の名称】サーバ、APIおよびコンピュータプログラム
(51)【国際特許分類】
G16C 20/40 20190101AFI20231201BHJP
G01N 27/62 20210101ALI20231201BHJP
G01N 30/72 20060101ALI20231201BHJP
G01N 30/86 20060101ALI20231201BHJP
G01N 33/68 20060101ALI20231201BHJP
G06N 20/00 20190101ALI20231201BHJP
G16C 20/70 20190101ALI20231201BHJP
【FI】
G16C20/40
G01N27/62 D
G01N27/62 V
G01N27/62 X
G01N30/72 C
G01N30/86 G
G01N33/68
G06N20/00
G16C20/70
(21)【出願番号】P 2022540627
(86)(22)【出願日】2022-06-28
(86)【国際出願番号】 JP2022025763
【審査請求日】2022-06-28
(73)【特許権者】
【識別番号】518352455
【氏名又は名称】株式会社メビウス
(73)【特許権者】
【識別番号】304027279
【氏名又は名称】国立大学法人 新潟大学
(74)【代理人】
【識別番号】110003063
【氏名又は名称】弁理士法人牛木国際特許事務所
(72)【発明者】
【氏名】星野 崚
(72)【発明者】
【氏名】大泉 佑太
(72)【発明者】
【氏名】長束 俊治
(72)【発明者】
【氏名】高橋 正幸
(72)【発明者】
【氏名】矢野 裕史
【審査官】橋沼 和樹
(56)【参考文献】
【文献】特開平06-249841(JP,A)
【文献】特開2014-169879(JP,A)
【文献】雲崎 翔太郎,機械学習を用いたマススペクトルデータからの糖鎖構造推定法の開発,電子情報通信学会技術研究報告 Vol.113 No.111,日本,一般社団法人電子情報通信学会,2013年06月20日,157-158頁
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00-99/00
G01N 30/86
G01N 27/62
G01N 30/72
G01N 33/68
(57)【特許請求の範囲】
【請求項1】
入力データから糖鎖構造を絞り込むアプリケーションプログラミングインターフェース(API)を備えたサーバであって、
前記APIが、
前記入力データを取得する入力データ取得ステップと、
前記入力データ取得ステップの後に前記入力データを処理して処理データを算出する入力情報処理ステップと、
前記
処理データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、
絞り込んだ前記糖鎖構造を出力する出力ステップと、
を
コンピュータに実行
させるように構成され
、
前記入力データが、LC解析結果、および、MS解析結果、および、MS/MS解析結果であり、
前記入力情報処理ステップにおいて、
前記LC解析結果から前記処理データとしてグルコースユニット値(GU値)および/または逆相スケール値を算出し、
前記MS解析結果から前記処理データとして質量を算出し、
前記MS/MS解析結果から前記処理データとして断片質量およびMS/MSスペクトルのピーク強度比を算出し、
前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された前記処理データを、前記処理データと前記処理データに対応する糖鎖構造とのデータベースであるマスタデータと照合することにより、前記処理データから糖鎖構造の絞込を行い、
前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された前記処理データと前記マスタデータとを照合し、前記マスタデータに一致する糖鎖構造がない場合に、機械学習モデルによる糖鎖構造の絞込を行い、
前記機械学習モデルが、
前記質量の値と、前記グルコースユニット値(GU値)および/または前記逆相スケール値とで構成される第1入力、および、前記第1入力に対応する既知の糖鎖構造である糖鎖構造データの組を教師データとして教師あり学習を行うことにより構築された、糖鎖構造の絞込を行うための第1学習モデル、ならびに、
前記断片質量の値と、前記MS/MSスペクトルのピーク強度比と、前記第1学習モデルを使用して絞り込まれた糖鎖構造の糖鎖構造データとで構成される第2入力、および、前記第2入力に対応する既知の糖鎖構造である糖鎖構造データの組を教師データとして教師あり学習を行うことにより構築された、糖鎖構造の絞込を行うための第2学習モデルである、サーバ。
【請求項2】
入力データから糖鎖構造を絞り込むアプリケーションプログラミングインターフェース(API)であって、
前記APIが、
前記入力データを取得する入力データ取得ステップと、
前記入力データ取得ステップの後に前記入力データを処理して処理データを算出する入力情報処理ステップと、
前記
処理データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、
絞り込んだ前記糖鎖構造を出力する出力ステップと、
を
コンピュータに実行
させるように構成され
、
前記入力データが、LC解析結果、および、MS解析結果、および、MS/MS解析結果であり、
前記入力情報処理ステップにおいて、
前記LC解析結果から前記処理データとしてグルコースユニット値(GU値)および/または逆相スケール値を算出し、
前記MS解析結果から前記処理データとして質量を算出し、
前記MS/MS解析結果から前記処理データとして断片質量およびMS/MSスペクトルのピーク強度比を算出し、
前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された前記処理データを、前記処理データと前記処理データに対応する糖鎖構造とのデータベースであるマスタデータと照合することにより、前記処理データから糖鎖構造の絞込を行い、
前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された前記処理データと前記マスタデータとを照合し、前記マスタデータに一致する糖鎖構造がない場合に、機械学習モデルによる糖鎖構造の絞込を行い、
前記機械学習モデルが、
前記質量の値と、前記グルコースユニット値(GU値)および/または前記逆相スケール値とで構成される第1入力、および、前記第1入力に対応する既知の糖鎖構造である糖鎖構造データの組を教師データとして教師あり学習を行うことにより構築された、糖鎖構造の絞込を行うための第1学習モデル、ならびに、
前記断片質量の値と、前記MS/MSスペクトルのピーク強度比と、前記第1学習モデルを使用して絞り込まれた糖鎖構造の糖鎖構造データとで構成される第2入力、および、前記第2入力に対応する既知の糖鎖構造である糖鎖構造データの組を教師データとして教師あり学習を行うことにより構築された、糖鎖構造の絞込を行うための第2学習モデルである、API。
【請求項3】
コンピュータに、請求項
2に記載のAPIを実行させるコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、入力データから絞り込んだ糖鎖構造を出力するサーバ、APIおよびコンピュータプログラムに関する。
【背景技術】
【0002】
従来、糖鎖にプラスチャージイオンを付加して飛行時間型質量分析装置による質量分析を行い、糖タンパク質等における糖鎖構造を解析する方法が提案されている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1の解析方法では、糖鎖シーケンスを求めることはできるが、糖鎖における分岐構造を自動的に決定することができず、また、絞り込まれた糖鎖構造を得る手段についても課題があった。
【0005】
本発明は、このような事情に鑑みてなされたものであり、入力データを入力するだけで絞り込まれた糖鎖構造の出力を得られるサーバ、APIおよびコンピュータプログラムを提供する。
【課題を解決するための手段】
【0006】
本発明はかかる課題を解決するため、入力データから糖鎖構造を絞り込むアプリケーションプログラミングインターフェース(API)を備えたサーバであって、前記APIが、前記入力データを取得する入力データ取得ステップと、前記入力データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、絞り込んだ前記糖鎖構造を出力する出力ステップと、を実行するように構成される、サーバを提供する。
【0007】
前記サーバでは、前記入力データが、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果である、としてもよい。
【0008】
前記サーバでは、前記APIが前記入力データ取得ステップの後に前記入力データを処理する入力情報処理ステップをさらに実行し、前記入力情報処理ステップにおいて、前記LC解析結果からグルコースユニット値(GU値)および/または逆相スケール値を算出し、前記MS解析結果から質量を算出し、前記MS/MS解析結果から断片質量およびMS/MSスペクトルのピーク強度比を算出する、としてもよい。
【0009】
前記サーバでは、前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データを、前記処理データと前記処理データに対応する糖鎖構造とのデータベースであるマスタデータと照合することにより、前記処理データから糖鎖構造の絞込を行う、としてもよい。
【0010】
前記サーバでは、前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データと前記マスタデータとを照合し、前記マスタデータに一致する糖鎖構造がない場合に、機械学習モデルによる糖鎖構造の絞込を行う、としてもよい。
【0011】
また本発明は、入力データから糖鎖構造を絞り込むアプリケーションプログラミングインターフェース(API)であって、前記APIが、前記入力データを取得する入力データ取得ステップと、前記入力データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、絞り込んだ前記糖鎖構造を出力する出力ステップと、を実行するように構成される、APIを提供する。
【0012】
前記APIでは、前記入力データが、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果である、としてもよい。
【0013】
前記APIでは、前記APIが前記入力データ取得ステップの後に前記入力データを処理する入力情報処理ステップをさらに実行し、前記入力情報処理ステップにおいて、前記LC解析結果からグルコースユニット値(GU値)および/または逆相スケール値を算出し、前記MS解析結果から質量を算出し、前記MS/MS解析結果から断片質量およびMS/MSスペクトルのピーク強度比を算出する、としてもよい。
【0014】
前記APIでは、前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データを、前記処理データと前記処理データに対応する糖鎖構造とのデータベースである前記マスタデータと照合することにより、前記処理データから糖鎖構造の絞込を行う、としてもよい。
【0015】
前記APIでは、前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データとマスタデータとを照合し、前記マスタデータに一致する糖鎖構造がない場合に、機械学習モデルによる糖鎖構造の絞込を行う、としてもよい。
【0016】
また本発明は、コンピュータに、前記APIを実行させるコンピュータプログラムを提供する。
【発明の効果】
【0017】
本発明のサーバ、APIおよびコンピュータプログラムによれば、入力データを入力するだけで、絞り込まれた糖鎖構造の出力を得ることができる。
【図面の簡単な説明】
【0018】
【
図1】本発明の好適な実施形態に係るサーバを含む全体構成を示すブロック図である。
【
図2】本発明の好適な実施形態に係るAPIの構成を示すブロック図である。
【
図3】本発明の好適な実施形態に係るマスタデータの構成の一例を示す図である。
【
図4】HPLC解析結果の一例を示すグラフ図である。
【
図6】MS/MS解析結果の一例を示すグラフ図である。
【
図7】ニューラルネットワークモデルにおけるニューラルネットワークの概略構成を示す説明図である。
【
図8】本発明の好適な実施形態に係るサーバによるAPIの実行の流れを示すフローチャートである。
【発明を実施するための形態】
【0019】
以下、図面を参照して、本発明のサーバ、APIおよびコンピュータプログラムの好適な実施形態について説明する。ただし、本発明は、以下の記載に限定されるものではなく、特許請求の範囲に記載され、または、発明を実施するための形態に開示された発明の要旨に基づき、当業者において様々な変形や変更が可能である。そのような変形や変更もまた、本発明の範囲に含まれる。
【0020】
<全体構成>
(サーバ)
図1は、本発明の好適な実施形態に係るサーバ1を含むシステムの全体構成を示すブロック図である。まず、サーバ1の構成について、
図2のアプリケーションプログラミングインターフェース(API)4の構成と併せて説明する。サーバ1は、入力データから糖鎖構造を絞り込むAPI4を備えたサーバであって、API4が、入力データ取得部41により入力データを取得する入力データ取得ステップと、入力情報処理部42により入力データを処理する入力情報処理ステップと、糖鎖構造絞込部43により入力データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、出力部44により絞り込んだ糖鎖構造を出力する出力ステップと、を実行するように構成される。API4への入力の前に入力データを処理する場合、入力情報処理ステップは省略することができる。
【0021】
サーバ1では、コンピュータプログラムをインストールして、コンピュータ11を本実施形態のサーバ1として機能させる。当該サーバ1は、例えばCPU(中央演算装置)12を有するコンピュータ11において、例えばHDD(ハードディスク駆動装置)からなる記憶部13に、コンピュータプログラム(ソフトウェア)14をインストールすることによって実現される。サーバ1の機能は、コンピュータ11のハードウェア資源とコンピュータプログラム14のソフトウェアとが協働して実現される。コンピュータプログラム14は、通信等の制御を行う他、糖鎖構造を絞り込む工程を実行するAPI4をコンピュータに実行させる。記憶部13は、絞り込まれた糖鎖構造21、後述するマスタデータ22および機械学習モデル23を保存する。
【0022】
コンピュータプログラム14のソースコードを、コンピュータ11で読み取り可能な記録媒体(図示せず)に記録する構成とすることもできる。これにより、本実施形態のAPI4を実行するためのコンピュータプログラムを記録した、持ち運び自在な記録媒体を提供することができる。記録媒体としては、例えば、磁気テープ、または、FDやHDD等の磁気ディスク、CD-ROMやMO、DVD等の光ディスク、USBメモリ等の半導体メモリを用いた記録媒体等が挙げられる。
【0023】
CPU12は、コンピュータプログラム14に基づき様々な演算処理を実行する。コンピュータプログラム14は、上記の可搬性の記録媒体から記憶部13に取り込まれてもよく、LAN(Local Area Network)やインターネット等の通信網3といったコンピュータネットワークから記憶部13に取り込まれてもよい。CPU12と記憶部13とは例えばバス15で相互に接続される。バス15には、さらに通信インターフェース16およびバッファ部17が接続される。
【0024】
通信インターフェース16は、有線または無線でインターネット等の通信網3と接続して端末装置2と通信を行うためのインターフェースである。
【0025】
バッファ部17は、例えばRAMにより構成され、コンピュータプログラム14の演算処理に必要なデータを一時的に格納する。例えば、バッファ部17には、端末装置2から受信した入力データや、入力情報処理を行った処理データを格納し、これらの入力データや処理データは、コンピュータプログラム14による演算処理に使用される。なお、入力データや処理データは、記憶部13に保存するようにしてもよい。
【0026】
(端末装置)
端末装置2は、例えば、デスクトップPCや、ノートPC、タブレット、スマートフォン等であり、インターネット等の通信網3を介してサーバ1と通信可能であってAPI4を呼び出すことができるものであれば、特に限定されない。ユーザは、端末装置2を使用してサーバ1にアクセスし、API4を呼び出して入力データを入力し、API4により絞り込まれた糖鎖構造の出力を得る。入力データの入力は、例えばキーボードやマウス、タッチパネル等の入力装置(図示せず)を用いて行うことができる。絞り込まれた糖鎖構造の出力は、例えばディスプレイ等の表示装置(図示せず)に表示させることができる。
【0027】
<質量分析>
質量分析法(Mass Spectrometry)には、試料をイオン化してそのまま分析する方法(MS)と、さらに特定の試料イオン(親イオン)を質量選択し、それを解離させて生成した解離イオンを質量分析するタンデム質量分析法(MS/MS)とがある。質量分析装置は、試料分子に電荷を付加してイオン化を行い、生成したイオンを電場または磁場により質量電荷比に分離し、その量を検出器にて電流値として計測する機器である。質量分析装置の前に液体クロマトグラフ(LC:Liquid Chromatograph)部を連結した液体クロマトグラフィー/質量分析法(LC/MS)は、混合物をLCで分離しながら、MSにより質量を測定する方法である。LC部には高速液体クロマトグラフ(HPLC:High Performance Liquid Chromatograph)が使用される。特定のイオンを選別して、開裂後さらに断片イオンの質量を測定するMS/MSや、その過程を繰り返す多段階MS(MSn)を行うと、さらに構造情報が得られる。
【0028】
MS/MSでは、分子イオンを質量分析装置に取り込み、特定質量電荷比の分子イオンを選択し、選択した分子イオンと中性分子との衝突を起こすことにより、分子イオンの一部の結合を破壊し、結合の切れたイオンを測定する。この中性分子と衝突させ分子イオンの結合を切る方法の一つに衝突誘起解離(CID:Collision Induced Dissociation)がある。イオン選択、衝突誘起解離の一連の操作の繰返し回数によってMS2やMS3等と呼ぶ。分子中の原子間の結合はその構造や結合の種類によって結合エネルギーが異なるため、結合エネルギーが低い箇所ほど衝突誘起解離によって切断されやすい傾向にある。分子イオンと中性分子との衝突時に、結合を切断するのに十分な運動エネルギーを分子イオンに与えることにより、特有のフラグメントイオンが優先して生成し、分子イオンの構造を知ることができる。さらに、イオンを選択して開裂することから、開裂後のイオンの質量電荷比領域におけるノイズが小さく、信号強度とノイズの比(S/N比)が向上する。MS/MSでは、イオン選択および衝突誘起解離を1回以上行った後、質量分離を行う。
【0029】
上記のMSで得られるMSスペクトルは、測定する試料の質量によって異なり、そのMSスペクトルから試料の成分や量の情報を得ることができる。MS/MSで得られるMS/MSスペクトルパターンは、糖鎖の分岐構造や結合様式により異なる場合が多い。
【0030】
<マスタデータ>
マスタデータ22は、糖鎖構造を絞り込む際に参照したり、糖鎖構造を絞り込むための機械学習の教師データに使用したりする糖鎖構造のデータベースである。
図3にマスタデータ22の構成の一例を示す。マスタデータ22は、少なくとも質量の値と、グルコースユニット値(GU値)および/または逆相スケール値と、組成情報と、構造情報とを含む。組成情報は、糖と置換基の種類および糖と置換基の数の情報を含むものである。構造情報は、糖と置換基の種類および糖と置換基の数の情報に、糖のアイソマー情報と、結合様式と、分岐構造の情報を加えたものである。糖鎖構造データは、組成情報および構造情報で構成される。
【0031】
図4は、HPLC解析結果の一例を示すグラフ図である。溶出時間に対して、複数のピークが見られる。
図5は、MS解析結果の一例を示すグラフ図である。
【0032】
(質量)
図5のMSスペクトルの大きいピーク中、最も左に位置するモノアイソトピック・ピークの質量電荷比を確認する。当該モノアイソトピック・ピークと、当該ピークに近接する同位体ピークとの差分から、イオン価数を算出する。質量電荷比と価数を掛け合わせた値から、付加イオンの質量を差し引くことで、質量が算出される。このように、MS解析結果から、質量を算出することができる。
【0033】
(GU値および逆相スケール値)
GU値は、グルコースユニット法によりLCにおける溶出時間の標準化行ったものであって、各ピークの検出時間とグルコースオリゴマーの検出時間とを比較することで得られる値である。GU値は、糖鎖構造によって固有の値であるため、データベースと照合することで糖鎖構造を推定することができる。GU値を算出する定量計算式の係数は測定ごとに若干変動するが、定量計算式は溶出時間の関数となる。このように、LC解析結果から、GU値を算出することができる。
【0034】
逆相スケール値は、逆相スケール法によりLCにおける溶出時間の標準化を行ったものであって、GU値と同様に糖鎖構造によって固有の値である。逆相スケール値は、GU値に比べて変動が少ないので、構造特定の精度が高い。
【0035】
HPLC解析結果において、糖鎖構造を推定するピークに対して、GU値および/または逆相スケール値を計算する。上記のMSスペクトルから算出する質量、および、GU値および/または逆相スケール値のそれぞれから糖鎖構造を絞り込むこともできるが、質量と、GU値および/または逆相スケール値とを組み合わせることで、より精度よく糖鎖構造を絞り込むことができる。例えば、算出した質量、ならびに、GU値および/または逆相スケール値をデータベースと照合することで、糖鎖構造が決定される。したがって、糖鎖構造を絞り込むための学習モデルを構築する際には、教師データとして、入力データに質量の値と、GU値および/または逆相スケール値、出力データに糖鎖構造データを用いることができる。
【0036】
算出した質量、ならびに、GU値および/または逆相スケール値をデータベースと照合して、該当する糖鎖構造がない場合には、酵素消化等の他の方法で分岐構造と結合様式を決定して、糖鎖構造を決定する。決定の際には、周知の糖鎖の生合成経路の知見を合わせるようにしてもよい。
【0037】
(断片質量)
マスタデータ22は、さらに断片質量を含んでもよい。断片質量は、MS/MS解析結果(
図6を参照)に基づいて、断片の元になった糖鎖構造と質量電荷比とから算出される。例えば断片質量が大きい場合、質量が大きい糖鎖構造が候補として選ばれやすくなる。
【0038】
(ピーク強度比)
マスタデータ22は、さらにMS/MSスペクトルのピーク強度比を含んでもよい。ピーク強度比は、ピークの傾向を定量化してピークの順位を決定するためのものであり、MS/MSスペクトルの各ピークに対し、ピーク強度をピーク全てのピーク強度の合算値で除算して算出される。すなわち、ピーク強度比は、MS/MS解析結果から、算出される。ピークの順位情報は、糖鎖構造が断片化する際の優先順位に依存するので、その情報から元の糖鎖構造を推定することができる。糖鎖構造内のある結合が弱いと、その結合が優先的に切れて断片化しやすいので、その断片のピーク強度は大きくなり、該当するピークの順位は高くなる。この関係により、逆説的に糖鎖構造の結合位置を推定する。例えばピーク強度比が小さい(ピーク強度が大きい)等の情報により、糖鎖構造の分岐構造をある程度推定することができる。
【0039】
上記の断片質量のみ、またはピーク強度比のみで糖鎖構造を推定するのではなく、断片質量とピーク強度比との組み合わせで糖鎖構造を推定すると、より精度よく糖鎖構造を絞り込むことができる。したがって、糖鎖構造を絞り込むための学習モデルを構築する際には、教師データとして、入力データに断片質量の値と、ピーク強度比と、機械学習モデルを使用して絞り込まれた糖鎖構造データ、出力データに糖鎖構造データを用いることができる。
【0040】
以上のことから、糖鎖構造絞込部43は、入力データとして、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果を用いることにより、入力情報処理部42により入力情報処理を行って、入力情報処理された処理データをマスタデータ22と照合することにより、糖鎖構造を絞り込むことができる。ここで処理データは、LC解析結果から算出されたGU値および/または逆相スケール値、および/または、MS解析結果から算出された質量、および/または、MS/MS解析結果から算出された断片質量およびピーク強度比である。これにより、ユーザは、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果を入力するだけで、絞り込んだ糖鎖構造の出力を得ることができる。なお、ユーザは、上記の処理データを入力するようにしてもよい。この場合、入力データが、LC解析結果から算出されたGU値および/または逆相スケール値、および/または、MS解析結果から算出された質量、および/または、MS/MS解析結果から算出された断片質量およびピーク強度比となる。
【0041】
<機械学習>
糖鎖構造絞込ステップにおいて、入力情報処理ステップで処理された処理データとマスタデータ22とを照合し、マスタデータ22に一致する糖鎖構造がない場合に、糖鎖構造絞込部43が機械学習モデル23による糖鎖構造の絞込を行うようにしてもよい。以下、機械学習モデル23について説明する。機械学習モデル23は、第1学習モデルおよび第2学習モデルの2つの学習モデルを用意することが好ましい。
【0042】
(第1学習モデル)
第1学習モデルは、糖鎖構造を例えば数十件程度に絞り込むための機械学習モデルである。第1学習モデルの構築において、入力データは、質量の値と、GU値および/または逆相スケール値である。上記のように、質量とGU値および/または逆相スケール値とから糖鎖構造を推定できるので、教師データの入力データとしての質量の値、ならびに、GU値および/または逆相スケール値と、教師データの出力データとしての糖鎖構造データとの相関関係を学習する。
【0043】
第1学習モデルを構築するための教師データの出力データとしての糖鎖構造データは、入力データを、入力データと入力データに対応する糖鎖構造とのデータベースであるマスタデータ22と照合することにより、入力データから絞り込まれた糖鎖構造とすることが好ましい。ここでの入力データは、質量の値と、GU値および/または逆相スケール値である。
【0044】
(第2学習モデル)
第2学習モデルは、第1学習モデルを使用して絞り込んだ複数の糖鎖構造の中から、さらに1~5件程度の糖鎖構造に絞り込むための機械学習モデルである。第2学習モデルの構築において、入力データは、断片質量の値と、MS/MSスペクトルのピーク強度比と、第1学習モデルで絞り込んだ糖鎖構造である。上記のように、断片質量の値と、MS/MSスペクトルのピーク強度比とから糖鎖構造を推定できるので、教師データの入力データとしての入力データである断片質量の値、MS/MSスペクトルのピーク強度比、および、第1学習モデルで絞り込んだ糖鎖構造と、教師データの出力データとしての糖鎖構造データ5との相関関係を学習する。
【0045】
第2学習モデルを構築するための教師データの出力データとしての糖鎖構造データは、入力データを、入力データと入力データに対応する糖鎖構造とのデータベースであるマスタデータ22と照合することにより、入力データから絞り込まれた糖鎖構造とすることが好ましい。ここでの入力データは、断片質量の値と、MS/MSスペクトルのピーク強度比と、第1学習モデルで絞り込んだ糖鎖構造である。
【0046】
(教師あり学習)
機械学習は、入力データと、出力データとして入力データに対応する糖鎖構造データを使用して、教師あり学習を行う。教師あり学習は、例えばニューラルネットワークモデルによる機械学習の他、周知の機械学習により行うことができる。教師あり学習の一例として、ニューラルネットワークモデルによる機械学習について、
図7を参照しながら説明する。
【0047】
図7に示すニューラルネットワークモデルにおけるニューラルネットワークは、入力層にあるn個のニューロン(X
00~X
0n)、第1~第n中間層にあるn×n個のニューロン(Y
00~Y
nn)、および、出力層にあるn個のニューロン(Z
00~Z
0n)から構成されている。第1~第n中間層は、隠れ層とも呼ばれており、ニューラルネットワークとしては、第1中間層のみを隠れ層とするものであってもよい。なお、
図7では、出力層が複数個となっているが、出力データとしての糖鎖構造が一義に決まる場合、1個のみとすることもできる。
【0048】
入力層と第1中間層との間、第1~第n中間層の各々、第n中間層と出力層との間には、層間のニューロンを接続するノードが張られており、それぞれのノードには、重みが対応付けられている。
【0049】
本実施形態のニューラルネットワークモデルにおけるニューラルネットワークでは、入力データが入力層のニューロンに対応付けられ、出力層にあるニューロンの値を、一般的なニューラルネットワークの出力値の算出方法で算出する。すなわち、当該ニューロンに接続される入力側のニューロンの値と、出力側のニューロンと入力側のニューロンとを接続するノードに対応付けられた重みとの乗算値の数列の和として算出することを、入力層にあるニューロン以外の全てのニューロンに対して行う方法を用いることで、出力側のニューロンの値を算出する。
【0050】
入力層にあるn個のニューロンX01~X0nの値と、算出された出力層にあるn個のニューロンZ01~Z0nの値、すなわち、本実施形態では入力データと教師データの糖鎖構造データの各々とを、それぞれ比較して誤差を求め、求められた誤差が小さくなるように、各ノードに対応付けられた重みを調整する(バックプロバケーション)ことを反復する。
【0051】
上述した一連の工程を所定回数反復実施すること、あるいは上記の誤差が許容値より小さくなること等の所定の条件が満たされた場合には、学習を終了して、そのニューラルネットワーク、すなわち、ノードのそれぞれに対応付けられた全ての重みを、学習モデルとする。
【0052】
<全体の流れ>
図8は、本発明の好適な実施形態に係るサーバ1によるAPI4の実行の流れを示すフローチャートである。
【0053】
まず、ステップS11で、ユーザは端末装置2の操作を行い、API4の呼び出しが行われる。
【0054】
次に、ステップS12で、入力データ取得部41が、入力データを取得する(入力データ取得ステップ)。ここでの入力データは、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果である。
【0055】
次に、ステップS13で、入力情報処理部42が、入力データの処理を行い、処理データを作成する(入力情報処理ステップ)。ここでの処理データは、LC解析結果から算出されたGU値および/または逆相スケール値、および/または、MS解析結果から算出された質量、および/または、MS/MS解析結果から算出された断片質量およびピーク強度比である。
【0056】
なお、ユーザは、上記の処理データをAPI4の指示にしたがって入力するようにしてもよく、この場合、ステップS13を省略することができる。この場合、入力データは、LC解析結果から算出されたGU値および/または逆相スケール値、および/または、MS解析結果から算出された質量、および/または、MS/MS解析結果から算出された断片質量およびピーク強度比となる。
【0057】
次に、ステップS14で、糖鎖構造絞込部43が、処理データに基づき、糖鎖構造の絞込を行う(糖鎖構造絞込ステップ)。糖鎖構造絞込部43は、まず、処理データを処理データと処理データに対応する糖鎖構造とのデータベースであるマスタデータ22と照合し、条件に一致する糖鎖構造がないか判定を行う。条件に一致する糖鎖構造がある場合、出力部44が、ステップS15で絞込結果を出力する(出力ステップ)。
【0058】
条件に一致する糖鎖構造がない場合、糖鎖構造絞込部43が、機械学習モデル23による糖鎖構造の絞込を行うようにしてもよい。絞込が完了したら、機械学習モデル23により得られた糖鎖構造を、出力部44が、ステップS15で出力する(出力ステップ)。
【0059】
最後に、ステップS16で、端末装置2は、サーバ1からAPI4により絞り込まれた糖鎖構造のデータを取得する。
【0060】
以上のようにして、ユーザは、端末装置2でAPI4を実行し、入力データを入力するだけで、絞り込まれた糖鎖構造の出力を得ることができる。
【符号の説明】
【0061】
1 サーバ
2 端末装置
3 通信網
14 コンピュータプログラム
21 糖鎖構造
22 マスタデータ
23 機械学習モデル
41 入力データ取得部
42 入力情報処理部
43 糖鎖構造絞込部
44 出力部
【要約】
入力データを入力するだけで絞り込まれた糖鎖構造の出力を得られるサーバ、APIおよびコンピュータプログラムを提供する。サーバ1は、入力データから糖鎖構造を絞り込むアプリケーションプログラミングインターフェース(API)を備えたサーバであって、APIが、入力データ取得部により入力データを取得する入力データ取得ステップと、糖鎖構造絞込部により入力データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、出力部により絞り込んだ糖鎖構造を出力する出力ステップと、を実行するように構成される。