IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社島津製作所の特許一覧

特開2023-128343学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム
<>
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図1
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図2
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図3
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図4
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図5
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図6
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図7
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図8
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図9
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図10
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図11
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図12
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図13
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図14
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図15
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図16
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図17
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図18
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図19
  • 特開-学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム 図20
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023128343
(43)【公開日】2023-09-14
(54)【発明の名称】学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラム
(51)【国際特許分類】
   G01N 30/86 20060101AFI20230907BHJP
【FI】
G01N30/86 E
G01N30/86 H
G01N30/86 Q
【審査請求】未請求
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2022032634
(22)【出願日】2022-03-03
(71)【出願人】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】金澤 慎司
(72)【発明者】
【氏名】知野見 健太
(72)【発明者】
【氏名】坂本 雄紀
(57)【要約】
【課題】精度が高くかつ説明性が高いピークピッキングの手法を提供する。
【解決手段】解析装置は、推定モデルの学習処理のための学習用データを作成する。より具体的には、解析装置は、所与の種類の装置の複数の参照波形を取得する(ステップSP1)。また、解析装置は、複数の参照波形のそれぞれに対して、一定の基準に従って、ピークに関する情報を特定する(ステップSP3)。そして、解析装置は、複数の参照波形のそれぞれに対して、特定されたピークに関する情報を付与する(ステップSP4)。
【選択図】図12
【特許請求の範囲】
【請求項1】
複数の参照波形に基づいて対象波形におけるピークに関する情報を出力するようにコンピュータを機能させる、推定モデルを作成するための学習用データを作成する方法であって、
前記複数の参照波形を取得するステップと、
前記複数の参照波形のそれぞれに対して、一定の基準に従ってピーク部分に関する情報を特定するステップと、
前記複数の参照波形のそれぞれに対して、特定された前記ピーク部分に関する情報を付与するステップと、を備える、学習用データの作成方法。
【請求項2】
前記一定の基準は、前記複数の参照波形のそれぞれにおけるピークを特定するためのピーク用基準、および、前記複数の参照波形のそれぞれにおけるベースラインを特定するためのベースライン用基準を含む、請求項1に記載の学習用データの作成方法。
【請求項3】
前記ピーク用基準は、各参照波形においてピーク候補をピークとして特定するために、当該ピーク候補のS/N比、当該ピーク候補の分離度、当該ピーク候補のシンメトリー係数、当該ピーク候補から想定されるピーク全体に対する参照波形内に存在するピーク候補の割合、当該ピーク候補におけるピークトップの高さ、および、当該ピーク候補の幅のうち少なくとも1つを規定する、請求項2に記載の学習用データの作成方法。
【請求項4】
前記ベースライン用基準は、ベースラインの傾きを、縦軸が信号強度であり横軸が時間であるグラフにおける水平にすること、および、隣接する複数のピークの中の1の開始点と1の終了点とを連結する線の傾きにすること、のうち少なくとも1つを規定し、
前記1の開始点は、前記隣接する複数のピークの中の最も早い時間に現れたピークの開始点であり、前記1の終了点は、前記隣接する複数のピークの中の最も遅い時間に現れたピークの終了点である、請求項2または請求項3に記載の学習用データの作成方法。
【請求項5】
前記複数の参照波形を取得するステップは、参照波形として擬似的に波形を作成することを含む、請求項1~請求項4のいずれか1項に記載の学習用データの作成方法。
【請求項6】
未解析の対象波形を取得する波形取得部と、
学習済の第1の推定モデルに対して前記対象波形を入力し、前記対象波形における第1のピークに関する情報を取得するピーク情報取得部と、を備え、
前記第1の推定モデルは、前記対象波形が入力された際に前記対象波形におけるピークに関する情報を出力するように、複数の参照波形のそれぞれが第1の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている、波形解析装置。
【請求項7】
前記第1のピークに関する情報と前記第1の一定の基準を出力する出力部をさらに備える、請求項6に記載の波形解析装置。
【請求項8】
前記第1の一定の基準は、前記複数の参照波形のそれぞれにおけるピークを特定するためのピーク用基準、および、前記複数の参照波形のそれぞれにおけるベースラインを特定するためのベースライン用基準を含む、請求項6または請求項7に記載の波形解析装置。
【請求項9】
前記ピーク用基準は、各参照波形においてピーク候補をピークとして特定するために、当該ピーク候補のS/N比、当該ピーク候補の分離度、当該ピーク候補のシンメトリー係数、当該ピーク候補から想定されるピーク全体に対する参照波形内に存在するピーク候補の割合、当該ピーク候補におけるピークトップの高さ、および、当該ピーク候補の幅のうち少なくとも1つを規定する、請求項6~請求項8のいずれか1項に記載の波形解析装置。
【請求項10】
前記ベースライン用基準は、ベースラインの傾きを、縦軸が信号強度であり横軸が時間であるグラフにおける水平にすること、および、隣接する複数のピークの中の1の開始点と1の終了点とを連結する線の傾きにすること、のうち少なくとも1つを規定し、
前記1の開始点は、前記隣接する複数のピークの中の最も早い時間に現れたピークの開始点であり、前記1の終了点は、前記隣接する複数のピークの中の最も遅い時間に現れたピークの終了点である、請求項8または請求項9に記載の波形解析装置。
【請求項11】
前記ピーク情報取得部は、学習済の第2の推定モデルに対して前記対象波形を入力し、前記対象波形における第2のピークに関する情報を取得し、
前記第2の推定モデルは、前記対象波形が入力された際に前記対象波形における第2のピークに関する情報を出力するように、複数の参照波形のそれぞれが前記第1の一定の基準とは異なる第2の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている、請求項6~請求項10のいずれか1項に記載の波形解析装置。
【請求項12】
前記ピーク情報取得部は、学習済の第2の推定モデルに対して前記対象波形を入力し、前記対象波形における第2のピークに関する情報を取得し、
前記第2の推定モデルは、前記対象波形が入力された際に前記対象波形における第2のピークに関する情報を出力するように、複数の参照波形のそれぞれが前記第1の一定の基準とは異なる第2の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されており、
前記出力部は前記第2のピークに関する情報と前記第2の一定の基準を出力する、請求項7に記載の波形解析装置。
【請求項13】
未解析の対象波形を取得するステップと、
学習済の第1の推定モデルに対して前記対象波形を入力し、前記対象波形における第1のピークに関する情報を取得するステップと、を備え、
前記第1の推定モデルは、前記対象波形が入力された際に前記対象波形における第1のピークに関する情報を出力するように、複数の参照波形のそれぞれが第1の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている、波形解析方法。
【請求項14】
前記第1のピークに関する情報と前記第1の一定の基準を出力するステップをさらに備える、請求項13に記載の波形解析方法。
【請求項15】
前記第1の一定の基準は、前記複数の参照波形のそれぞれにおけるピークを特定するためのピーク用基準、および、前記複数の参照波形のそれぞれにおけるベースラインを特定するためのベースライン用基準を含む、請求項13または請求項14に記載の波形解析方法。
【請求項16】
前記ピーク用基準は、各参照波形においてピーク候補をピークとして特定するために、当該ピーク候補のS/N比、当該ピーク候補の分離度、当該ピーク候補のシンメトリー係数、当該ピーク候補から想定されるピーク全体に対する参照波形内に存在するピーク候補の割合、当該ピーク候補におけるピークトップの高さ、および、当該ピーク候補の幅のうち少なくとも1つを規定する、請求項15に記載の波形解析方法。
【請求項17】
前記ベースライン用基準は、ベースラインの傾きを、縦軸が信号強度であり横軸が時間であるグラフにおける水平にすること、および、隣接する複数のピークの中の1の開始点と1の終了点とを連結する線の傾きにすること、のうち少なくとも1つを規定し、
前記1の開始点は、前記隣接する複数のピークの中の最も早い時間に現れたピークの開始点であり、前記1の終了点は、前記隣接する複数のピークの中の最も遅い時間に現れたピークの終了点である、請求項15または請求項16に記載の波形解析方法。
【請求項18】
学習済の第2の推定モデルに対して前記対象波形を入力し、前記対象波形における第2のピークに関する情報を取得するステップをさらに備え、
前記第2の推定モデルは、前記対象波形が入力された際に前記対象波形における第2のピークに関する情報を出力するように、複数の参照波形のそれぞれが前記第1の一定の基準とは異なる第2の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されており、
前記第2のピークに関する情報と前記第2の一定の基準を出力するステップをさらに備える、請求項14に記載の波形解析方法。
【請求項19】
前記第1の推定モデルに対して前記対象波形を入力し、前記対象波形における前記第1のピークに関する情報を取得するステップ、および、前記第2の推定モデルに対して前記対象波形を入力し、前記対象波形における前記第2のピークに関する情報を取得するステップのうち一方のみが実施される、請求項18に記載の波形解析方法。
【請求項20】
コンピュータの1以上のプロセッサによって実行されることにより、前記コンピュータに請求項13~請求項19のいずれか1項に記載の波形解析方法を実施させる、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、クロマトグラムおよびスペクトルの波形の解析のための、学習用データの作成方法、波形解析装置、波形解析方法、およびコンピュータプログラムに関する。
【背景技術】
【0002】
従来より、試料に含まれる成分を同定または定量するためにクロマトグラフが用いられている。クロマトグラフでは、試料中の成分をカラムで分離し、カラムから流出する成分を順に検出する。その後、横軸を時間および縦軸を検出強度とするクロマトグラムを作成する。
【0003】
クロマトグラムからピークの高さおよび面積を求めるためには、クロマトグラムのベースラインから立ち上がるピーク開始点および終了点を特定する必要がある。クロマトグラムのピーク開始点および終了点を特定する作業は、ピークピッキングと呼ばれる。ピーク開始点および終了点が特定されることによって、ピークの高さおよび面積が定まる。ピークの高さおよび面積から、ピークに対応する化合物の濃度などを計算することができる。
【0004】
近年、機械学習を用いてピークピッキングを自動化する試みが進められている。機械学習の中でもディープラーニングを用いたピークピッキングの手法として、物体検知の技術を利用する手法と、セマンティックセグメンテーションの技術を利用する手法とが知られている(特許文献1、非特許文献1、非特許文献2、および非特許文献3)。
【0005】
特に、特許文献1には、ピークピッキングの問題を画像認識分野の物体検知として定式化することで、SSD(Single Shot Multibox Detector)を用いたピークピッキング結果の確信度を表示する手法が開示されている。SSDは、ピークピッキングの結果と、その結果に対する確信度とを併せて出力する。非特許文献2には、ピークピッキングの問題をセマンティックセグメンテーションの問題として定式化することによってピークピッキングを実現する手法が開示されている。非特許文献3には、ニューラルネットワークを用いたピークピッキングの手法が開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】国際公開第2020/225864号
【非特許文献】
【0007】
【非特許文献1】「AIで開発したアルゴリズムによるデータ解析支援」、[online]、[2021年9月6日検索]、株式会社島津製作所、インターネット<URL:https://www.shimadzu.co.jp/news/press/jmsxjkglv6g0snf.html>
【非特許文献2】Kanazawa S、ほか10名、Fake metabolomics chromatogram generation for facilitating deep learning of peak-picking neural networks. J Biosci Bioeng. 2021 Feb;131(2):207-212. doi: 10.1016/j.jbiosc.、2020年9月13日、Epub 2020 Oct 10. PMID: 33051155.
【非特許文献3】Olaf Ronneberger、ほか2名、「U-Net: Convolutional Networks for Biomedical Image Segmentation」、[online]、(2015年5月18日提出)arXiv.org、インターネット<URL: https://arxiv.org/pdf/1505.04597.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0008】
上述のような機械学習を用いたピークピッキングは、従来の信号処理を用いた手法によるピークピッキングに対して、導出される結果の精度が高いことが報告されている。一方で、機械学習を用いたピークピッキングにおいて、導出された結果に対する説明性が求められている。
【0009】
本開示の目的は、精度が高くかつ説明性が高いピークピッキングの手法を提供することである。
【課題を解決するための手段】
【0010】
本開示のある局面に従う学習用データの作成方法は、複数の参照波形に基づいて対象波形におけるピークに関する情報を出力するようにコンピュータを機能させる、推定モデルを作成するための学習用データを作成する方法であって、複数の参照波形を取得するステップと、複数の参照波形のそれぞれに対して、一定の基準に従ってピーク部分に関する情報を特定するステップと、複数の参照波形のそれぞれに対して、特定されたピーク部分に関する情報を付与するステップと、を備える。
【0011】
本開示の他の局面に従う波形解析装置は、未解析の対象波形を取得する波形取得部と、学習済の第1の推定モデルに対して対象波形を入力し、対象波形における第1のピークに関する情報を取得するピーク情報取得部と、を備え、第1の推定モデルは、対象波形が入力された際に対象波形におけるピークに関する情報を出力するように、複数の参照波形のそれぞれが第1の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている。
【0012】
本開示のさらに他の局面に従う波形解析方法は、未解析の対象波形を取得するステップと、学習済の第1の推定モデルに対して対象波形を入力し、対象波形における第1のピークに関する情報を取得するステップと、を備え、第1の推定モデルは、対象波形が入力された際に対象波形における第1のピークに関する情報を出力するように、複数の参照波形のそれぞれが第1の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている。
【0013】
本開示のさらに他の局面に従うコンピュータプログラムは、コンピュータの1以上のプロセッサによって実行されることにより、当該コンピュータに上述の波形解析方法を実施させる。
【発明の効果】
【0014】
本開示によれば、精度が高くかつ説明性が高いピークピッキングの手法が提供される。
【図面の簡単な説明】
【0015】
図1】解析装置1の全体構成を示すブロック図である。
図2】クロマトグラムの一例を示す図である。
図3】クロマトグラムの他の例を示す図である。
図4】学習済みモデルを作成する手順を説明するためのブロック図である。
図5】クロマトグラムの他の例を示す図である。
図6図5のクロマトグラム400に対してユーザが選出したピーク領域の候補を模式的に示す図である。
図7図5のクロマトグラム400に対して2つの枠が付加された図である。
図8図7の枠F1内の要素の拡大図である。
図9図7の枠F1内の要素の拡大図である。
図10図7の枠F2内の要素の拡大図である。
図11】学習用データのデータ構成の具体例を模式的に示す図である。
図12】学習用データを作成する手順を説明するためのフローチャートである。
図13】学習済みモデルを作成する手順を説明するためのフローチャートである。
図14】学習済みモデル(学習済みの推定モデル300)を用いてクロマトグラムデータを判定する手順を説明するためのフローチャートである。
図15】学習済みモデルの判定結果の一例を示す図である。
図16】判定結果に基づいてラベル付け処理が行われたグラフの一例を示す図である。
図17】判定結果を表示する画像120の一例を示す図である。
図18】複数種類の学習用データを利用した複数種類の学習済みモデルの作成を説明するための図である。
図19図14のフローチャートの変形例のフローチャートである。
図20】解析装置1が学習済みモデルを利用することによって取得した判定結果と従来技術の判定結果の精度を比較するための情報を表す図である。
【発明を実施するための形態】
【0016】
以下、本開示の実施の形態について、図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰り返さない。
【0017】
[解析装置の構成]
図1は、解析装置1の全体構成を示すブロック図である。解析装置1は、制御部として機能するプロセッサ10と、記憶部として機能するメモリ20と、入出力ポート30とを備える。入出力ポート30には、マウス40、キーボード50、および表示装置60が接続される。入出力ポート30には、質量分析計などを接続してもよい。入出力ポート30には、インターネットあるいは構内ネットワークなどを通じて1または複数の端末装置を接続してもよい。
【0018】
解析装置1は、たとえば、パーソナルコンピュータをベースとして構成される。解析装置1は、インターネットなどのネットワークを通じて1または複数の端末装置からアクセスすることが可能なサーバによって構成されてもよい。
【0019】
入出力ポート30には、測定データ(クロマトグラムデータ)が入力される。測定データは、解析対象として利用される場合もあれば、推定モデルの学習用データの作成に利用される場合もある。測定データは、入出力ポート30に接続された質量分析計を通じて、解析装置1に入力されてもよい。質量分析計、質量分析計に接続されるガスクロマトグラフ、および解析装置1によって、ガスクロマトグラフ質量分析システムが構成されてもよい。なお、質量分析計、質量分析計に接続される液体クロマトグラフ、および解析装置1によって、液体クロマトグラフ質量分析システムが構成されてもよい。
【0020】
メモリ20には、学習用データ210と、測定データ213と、機械学習に用いられる推定モデル300と、解析処理および機械学習の処理を実行するための解析用プログラム200とが少なくとも格納される。測定データ213は、入出力ポート30に入力され得る。
【0021】
学習用データ210は、複数の学習用サンプルを含む。複数の学習用サンプルは、訓練用データ211および検証用データ212に分類される。一実現例では、複数の学習用サンプルのうち、80%が訓練用データ211に分類され、20%が検証用データ212に分類される。すなわち、この例では、14250個の学習用サンプル(1セットが475個のクロマトグラムより構成されるサンプルセットを30セット分)が準備された場合、11400個の学習用サンプルが訓練用データ211に分類され、2850個の学習用サンプルが検証用データ212に分類される。ただし、訓練用データ211と検証用データ212の割合は、これに限定されず、適宜設定され得る。
【0022】
訓練用データ211および検証用データ212は、各種の成分を含有する試料をクロマトグラフ質量分析装置で測定することにより得られたクロマトグラムの波形のデータを含む。クロマトグラムは、たとえば、ガスクロマトグラフで分離された成分を質量分析計でMSスキャン測定し、検出した全ての質量電荷比のイオンの合計強度の時間変化を表すトータルイオンクロマトグラムである。クロマトグラムは、SIM測定またはMRM測定し、特定の質量電荷比のイオンの強度の時間変化を表すマスクロマトグラムであってもよい。
【0023】
訓練用データ211および検証用データ212は、正解データとして、ピークに関する情報を含む。ピークに関する情報は、ピークピッキングにより特定される。ピークピッキングは、訓練用データ211および検証用データ212のそれぞれに含まれるクロマトグラムに対して実施される。ピークに関する情報は、ピークの位置の情報(ピーク開始点の位置、ピークトップの位置、および/または、ピーク終了点の位置)を含んでいてもよい。
【0024】
訓練用データ211および検証用データ212のそれぞれに含まれる波形のデータ(クロマトグラム)は、強度値の所定の範囲内(たとえば±1.0)となるように予め規格化されている。規格化により強度スケールが異なる複数のクロマトグラムを共通の強度スケールに統一しておくことで、学習済みモデルの精度を高めることができる。
【0025】
訓練用データ211および検証用データ212のそれぞれに含まれるクロマトグラムは、実際の試料の測定により得られたクロマトグラムであってもよいし、シミュレーション(たとえば、非特許文献2参照)により作成されたクロマトグラムであってもよい。シミュレーションにより作成されたクロマトグラムは、擬似的に作成されたクロマトグラムの一例である。
【0026】
クロマトグラムの波形は、時間軸方向に所定数の部分波形に分割されている。所定数は、たとえば512または1024などであり、各部分波形の幅(時間軸方向の長さ)が少なくともピーク幅よりも小さくなるように設定される。所定数は、たとえば、ピーク幅の大きさと1つのピークを構成するために必要なデータ点数とに基づいて定められる。
【0027】
各部分波形データには、部分波形のピークに関する情報(特性情報)が対応付けられている。部分波形に対応付けられる特性情報には、少なくとも、当該部分波形がピーク領域に属するものであるか非ピーク領域に属するものであるかを示す情報が含まれている。
【0028】
解析用プログラム200により、分割部201、モデル作成部202、ピーク情報取得部203、計算部204、画像処理部205、および出力部206が構成される。
【0029】
分割部201は、クロマトグラムの波形を予め決められた数の部分波形に分割する。モデル作成部202は、学習用データ210を用いて、推定モデル300の機械学習を進め、学習済みの推定モデル300を作成する。
【0030】
ピーク情報取得部203は、学習済みの推定モデル300を用いて、クロマトグラムのピークピッキングを行う。以下、学習済みの推定モデル300を「学習済みモデル」と称する場合がある。
【0031】
計算部204は、ピーク情報取得部203の判定結果の確信度を計算する。画像処理部205は、判定結果および確信度を含む画像データを作成する。出力部206は、画像データを含む表示信号を入出力ポート30から表示装置60へ出力する。なお、解析装置1が表示装置60を備えていてもよい。
【0032】
[クロマトグラムの一例]
図2は、クロマトグラムの一例を示す図である。ここでは、クロマトグラムから特定される各部の名称を簡単に説明する。クロマトグラムは、ベースラインの部分と、ピーク領域とに分類することができる。ベースラインからの立ち上がり部分は、ピーク開始点およびピーク終了点と称される。ピーク開始点とピーク終了点との間の領域は、ピーク領域と称される。ピーク領域のうち、検出強度が非常に強い部分(最も強い部分)は、ピークトップと称される。
【0033】
一実現例では、ピーク領域は、単体ピークと未分離ピークとに分けられる。図2には、単体ピークが示される。図3は、クロマトグラムの他の例を示す図である。図3の波形30では、領域31,32として示されるように、ピークトップを頂上とする山状波形が2つ連なっている。これらの2つの山状波形の間の谷に該当する部分の検出強度は、ベースラインに対応する強度まで落ちていない。領域31を含む山状波形および領域32を含む山状波形は、いずれも未分離ピークと称される。
【0034】
[学習済みモデルの作成]
次に、学習済みモデルを作成する手順について説明する。図4は、学習済みモデルを作成する手順を説明するためのブロック図である。
【0035】
図4に示されるように、解析装置1のモデル作成部202は、学習装置として機能する。モデル作成部202は、学習用データ210に基づいて、推定モデル300を学習させる。推定モデル300は、ニューラルネットワークを用いることで、ディープラーニングを行う。推定モデル300は、ニューラルネットワークによる計算に用いられる重み付け係数などのパラメータを含む。
【0036】
推定モデル300を学習させるため、たとえば、教師あり学習のアルゴリズムが用いられる。モデル作成部202は、学習用データ210を用いた教師あり学習によって、推定モデル300を学習させる。
【0037】
推定モデル300の学習には、セマンティックセグメンテーション(Semantic Segmentation)の技術が用いられる。セマンティックセグメンテーションは、一般に、二次元的に分布する画素データで構成された画像を解析するために用いられる。本実施の形態では、時間軸に沿って一次元的に並ぶデータで構成されるクロマトグラムの波形の解析にセマンティックセグメンテーションを適用する。セマンティックセグメンテーションを実行可能な推定モデルとして、たとえば、U-Net、SeGNet、PSPNetなどを用いることができる。本実施の形態では、U-Netを用いる。
【0038】
図4に示されるように、学習用データ210は、クロマトグラムデータと正解データとを含む。より具体的には、学習用データ210は学習用サンプルのセットであり、各学習用サンプルはクロマトグラムデータと正解データとを含む。さらに具体的には、本実施形態では、各学習用サンプルは、クロマトグラムデータの部分波形ごとに作成された正解データを含む。
【0039】
モデル作成部202には、クロマトグラムの部分波形と、それに対応する正解データとが入力される。正解データは、たとえば、既に特定されたピークピッキングの結果である。ピークピッキングの結果にピークトップを含めてもよい。
【0040】
本実施形態では、正解データは、一定の基準に従って作成される。正解データの作成については、図5および図6を参照して後述される。
【0041】
モデル作成部202は、推定モデル300に学習用データ210の中のクロマトグラムを適用することにより当該クロマトグラムに対するピークピッキングの結果を導出し、導出された結果と正解データとに基づいて推定モデル300を学習させる。具体的には、モデル作成部202は、推定モデル300によって導出された結果が正解データに近づくように推定モデル300内のパラメータを調整することにより、推定モデル300を学習させる。
【0042】
[正解データの作成]
図5および図6を参照して、正解データの作成について説明する。図5は、クロマトグラムの他の例を示す図である。図5のクロマトグラム400において、縦軸は検出強度を表し、横軸は保持時間を表し、波形41は保持時間に対する検出強度の変化を表す。図6は、図5のクロマトグラム400に対してユーザが選出したピーク領域の候補を模式的に示す図である。図6では、領域C1~C11が付記されている。領域C1~C11のそれぞれは、本実施形態において波形41に対してユーザにより選択された11個のピーク領域の候補のそれぞれの少なくとも一部を指し示す。本明細書では、「ピーク領域」を単に「ピーク」と称する場合があり、また、「ピーク領域の候補」を単に「ピーク候補」と称する場合もある。
【0043】
本実施形態では、上述の通り、正解データは、一定の基準に従って作成される。以下、「一定の基準」の具体例について説明する。
【0044】
(基準1)
上記基準の一例は、ピークを特定するためのピーク用基準の一例であって、ピーク候補のS/N比が一定の閾値以上であることである。一実現例では、ピーク候補は、そのS/N比が10以上である場合にピークとして特定され、その正解データを作成される。一方、ピーク候補は、そのS/N比が10未満である場合にはピークとして特定されず、当該ピーク候補に対する正解データは作成されない。S/N比は、ガスクロマトグラムに対して設定されたノイズの強度に対するピークトップの強度である。
【0045】
(基準2)
上記基準の他の例は、ピークを特定するためのピーク用基準の一例であって、ピーク候補の、隣接する他のピーク候補との分離度が所与の閾値以上であることである。分離度とは、あるピークが隣接する他のピークからどの程度分離しているかを示す指標である(「分離度のはなし_その1」、株式会社島津製作所、2022年1月12日検索、[online]、<URL:https://www.an.shimadzu.co.jp/hplc/support/lib/lctalk/81/81intro.htm>)。一実現例では、ピーク候補は、隣接する他のピーク候補との分離度が1.5以上である場合にピークとして特定され、その正解データを作成される。一方、ピーク候補は、隣接する他のピーク候補との分離度が1.5未満である場合にはピークとして特定されず、当該ピーク候補に対する正解データは作成されない。
【0046】
(基準3)
上記基準のさらに他の例は、ピークを特定するためのピーク用基準の一例であって、ピーク候補の、シンメトリー係数が所与の範囲にあることである。シンメトリー係数とは、ピークの対称性の度合いを示す係数である(「理論段数とシンメトリー係数のはなし」、株式会社島津製作所、2022年1月24日検索、[online]、<URL:https://www.an.shimadzu.co.jp/hplc/support/lib/lctalk/85/85intro.htm>)。
【0047】
シンメトリー係数は、たとえば、ピークのベースラインからピークトップまでの高さの1/20の高さにおけるピーク幅Wと、ピーク幅Wをピークトップから横軸に下ろした垂線で2分したときのピークの立ち上がり側の幅fとを用いて、次の式(1)のSとして算出される。
【0048】
S=W/2f …(1)
一実現例では、ピーク候補は、そのシンメトリー係数が0.8から1.8の範囲内にある場合にピークとして特定され、その正解データを作成される。一方、ピーク候補は、そのシンメトリー係数が0.8から1.8の範囲内にない場合にはピークとして特定されず、その正解データを作成されない。
【0049】
(基準4)
上記基準のさらに他の例は、ピークを特定するためのピーク用基準の一例であって、ピーク候補の全体が波形内に存在しないと想定される場合に、全体に対する波形内に存在する部分の割合が予め定められた閾値以上であることである。一実現例では、ピーク候補は、当該ピーク候補について算出された上記割合が予め定められた閾値以上であれば、ピークとして特定され、その正解データを作成される。一方、ピーク候補は、当該ピーク候補について算出された上記割合が予め定められた閾値未満であれば、ピークとして特定されず、その正解データを作成されない。この例については、図7および図8を参照して説明される。
【0050】
図7は、図5のクロマトグラム400に対して2つの枠が付加された図である。図7では、枠F1は波形41の一部分(図6において領域C11で示されたピーク候補を含む部分)を囲み、枠F2は波形41の他の部分(図6において領域C7で示されたピーク候補および領域C8で示されたピーク候補を含む部分)を囲んでいる。
【0051】
枠F1に囲まれた部分では、波形41に含まれるピーク候補のピーク終了点の到来を待たずにクロマトグラムが終了している。すなわち、枠F1に囲まれた部分では、ピークが途切れている。このような場合、ピークの終了点までの補助的な波形を想定することによりピークの全体像を想定し、想定された全体像の面積に対するクロマトグラムに含まれる部分の面積の割合を算出し、算出された割合が上述の「全体に対する波形内に存在する部分の割合」として取り扱われる。
【0052】
図8は、図7の枠F1内の要素の拡大図である。図8には、波形61とともに、クロマトグラムの縦軸Vおよび横軸Hが示されている。図8において、点P11は、ピーク候補に対して設定されたピーク開始点を表す。線B11は、ピーク候補に対して設定されたベースラインを表す。ピーク開始点およびベースラインは、たとえば、波形61に対してピークピッキングを実施するユーザによって特定される。
【0053】
図8に示されるように、波形61のうちピーク候補のピークトップより後方の部分L11を延長する仮想的な線X11が設定される。線X11は、たとえば、波形61に対してピークピッキングを実施するユーザによって特定される。そして、線X11と線B11の交点である点P12が、ピーク終了点として想定される点を表す。
【0054】
図8では、波形61と線B11と縦軸Vとによって囲まれた領域が、領域A11として示されている。また、線X11と線B11と縦軸Vとによって囲まれた領域が、領域A12として示されている。そして、上述の「割合」は、領域A11および領域A12の面積を足し合わせた面積に対する領域A11の面積の割合として算出される。
【0055】
(基準5)
上記基準のさらに他の例は、ピークを特定するためのピーク用基準の一例であって、ピーク候補におけるピークトップの検出強度の高さである。一実現例では、ピーク候補は、当該ピーク候補に含まれるピークトップの検出強度が予め定められた閾値より以上であれば、ピークとして特定され、その正解データを作成される。一方、ピーク候補は、当該ピーク候補に含まれるピークトップの検出強度が予め定められた閾値未満であれば、ピークとして特定されず、その正解データを作成されない。
【0056】
(基準6)
上記基準のさらに他の例は、ピークを特定するためのピーク用基準の一例であって、ピーク候補におけるピークの幅である。一実現例では、ピーク候補は、当該ピーク候補における所与の検出強度を有する2地点間の保持時間の差が予め定められた閾値以上であれば、ピークとして特定され、その正解データを作成される。一方、ピーク候補は、上記差が予め定められた閾値未満であれば、ピークとして特定されず、その正解データを作成されない。
【0057】
上述の「所与の検出強度」は、たとえば、ベースラインの検出強度とピークトップの検出強度の中間の検出強度である。ベースラインおよびピークトップの検出強度のそれぞれは、たとえば、波形61に対してピークピッキングを実施するユーザによって特定される。
【0058】
(基準7)
上記基準のさらに他の例は、ベースラインを特定するためのベースライン用基準の一例であって、ベースラインの傾きを水平にするというものである。この例については、図9を参照して説明される。
【0059】
図9は、図7の枠F1内の要素の拡大図である。図9において、点P21は、枠F1内のピーク候補に対して設定されたピーク開始点を表す。図9では、点P21を通る2種類のベースライン(線B21と線B22)が示されている。すなわち、図9の例では、ピーク候補に対して2種類のベースラインが設定され得る。線B21は、点P21とクロマトグラムにおける波形61の終点とを結ぶ線である。一方、線B22は、点P21を通る水平な線である。水平とは、横軸Hと平行であることを意味する。
【0060】
上記の基準は、ベースラインとして、線B21ではなく、線B22を特定するという基準である。ピークピッキングにおけるベースラインの基準によって、ピーク候補がピークとして特定された場合に、当該ピークの面積が変化し得る。この意味において、ピークに関する情報は、ベースラインを特定する情報を含んでいてもよいし、ピークの面積を特定する情報を含んでいてもよい。
【0061】
(基準8)
上記基準のさらに他の例は、ベースラインを特定するためのベースライン用基準の一例であって、ベースラインの傾きを、隣接する複数のピークの中の、最初のピークの開始点と最後のピークの終了点とを連結する線の傾きにするというものである。この例については、図10を参照して説明される。
【0062】
図10は、図7の枠F2内の要素の拡大図である。図10において、領域C7によって特定されるピーク候補と領域C8によって特定されるピーク候補とは隣接している。また、図10において、領域C7によって特定されるピーク候補は、最も早い時間に現れるピーク候補であり、領域C8によって特定されるピーク候補は、最も遅い時間に現れたピーク候補である。点P31は、領域C7によって特定されるピーク候補に対して特定されたピーク開始点を表す。点P32は、領域C8によって特定されるピーク候補に対して特定されたピーク終了点を表す。線L31は、点P31と点P32とを結ぶ線を表す。
【0063】
そして、上述のベースライン用基準の一例は、領域C7および領域C8のそれぞれのピーク候補がピークとして特定されたときに、双方のピークのベースラインとして、線L31を利用することである。
【0064】
[正解データの具体例]
図11は、学習用データのデータ構成の具体例を模式的に示す図である。図11には、学習用サンプルのデータ構成の一例が示される。図11の例は、1つの学習用サンプルのデータ構成を表す。図11に示された例では、1つのクロマトグラムに含まれる波形が複数の部分波形に分割され、各部分波形に特性情報(正解データ)が付加されている。なお、図11に示されたデータ構成は、単なる一例であって、本実施形態にかかる学習用データでは、1つのクロマトグラムの波形が部分波形に分割されている必要はない。
【0065】
図11に示されるように、各部分波形には、正解データとして、大分類の特性情報と小分類の特性情報とが付加されている。大分類の特性情報は、部分波形がピーク領域に属するか、非ピーク領域に属するかを表す。小分類の特性情報は、部分波形がピーク領域または非ピーク領域において有する属性を表す。たとえば、部分波形Aには、大分類の特性情報として「非ピーク領域に属する」が付加され、また、小分類の特性情報として「ベースライン」が付加されている。
【0066】
正解データに含まれる情報の種類は、図11に示されたような大分類および小分類の特性情報として示された情報の種類に限定されない。正解データは、ピークトップの検出強度などの、他の種類の情報を含んでいても良い。
【0067】
[処理の流れ(学習用データの作成)]
図12は、学習用データを作成する手順を説明するためのフローチャートである。当該フローチャートに従うと、学習用データを構成する1つの学習用サンプルが作成される。学習用データは、一実現例では、解析装置1は、プロセッサ10に解析用プログラム200を実行させることにより、本フローチャートの処理を実施する。
【0068】
ステップSP1にて、解析装置1は、クロマトグラムデータを読み出す。一実現例では、クロマトグラムデータは、入出力ポート30を介して入力されて、または、シミュレーションによって作成されて、メモリ20に格納される。プロセッサ10は、メモリ20からクロマトグラフデータを読み出す。ステップSP1において読み出されるクロマトグラムデータは、推定モデル300の学習処理のために利用されるデータであり、参照波形の一例である。
【0069】
ステップSP2にて、解析装置1は、クロマトグラムデータに含まれる波形に対してピークを特定する。一実現例では、ユーザは、波形に対してピーク候補を選択し、当該ピーク候補の中から上記基準に従ってピークを特定し、特定されたピークを解析装置1に入力する。解析装置1は、ユーザからの入力に従って、クロマトグラフデータに含まれる波形に対してピークを特定する。なお、解析装置1が、ユーザからの入力を必要とすることなく、クロマトグラムデータから上記基準に従ってピークを特定してもよい。
【0070】
ステップSP3にて、解析装置1は、ピークに関する情報を特定する。一実現例では、ユーザは、ピークに関する情報(たとえば、図11の特性情報)を特定し、解析装置1に入力する。解析装置1は、ユーザからの入力に従って、ピークに関する情報を特定する。ピークに関する情報の特定において、上記の基準に従って特定されたベースラインが利用されてもよい。
【0071】
ステップSP4にて、解析装置1は、ピークに関する情報をクロマトグラムデータに付加する。ステップSP1において読み出されたクロマトグラムデータにピークに関する情報が付加されることにより、1つの学習用サンプルが作成される。作成された学習用サンプルは、訓練用データ211または検証用データ212として、メモリ20に格納される。
【0072】
その後、解析装置1は、図12のフローチャートの処理を終了させる。解析装置1は、各学習用サンプルについて図12の処理を実施することにより、学習用データを作成する。
【0073】
[処理の流れ(学習済みモデルの作成)]
図13は、学習済みモデルを作成する手順を説明するためのフローチャートである。解析装置1は、プロセッサ10に解析用プログラム200を実行させることにより、本フローチャートの処理を実施する。
【0074】
まず、プロセッサ10は、推定モデル300の学習を開始させる操作を検出する(ステップS1)。たとえば、ユーザがマウス40およびキーボード50を用いて、推定モデル300の学習を開始させる操作をした場合、その操作がステップS1において検出される。
【0075】
次に、プロセッサ10は、メモリ20から学習用データ210(訓練用データ211および検証用データ212)を読み出す(ステップS2)。次に、プロセッサ10は、推定モデル300に訓練用データ211を入力する(ステップS3)。次に、推定モデル300において、ディープラーニングによる学習処理が実行される(ステップS4)。本実施の形態において推定モデル300の学習に用いるU-Netでは、部分波形から正しい特性情報が得られるように、ニューラルネットワークの重みづけが調整される。
【0076】
より具体的には、訓練用データ211の部分波形および部分波形に対応付けられた特性情報に基づいて、推定モデル300のパラメータが調整される。パラメータを調整する過程では、単体ピーク、未分離ピーク、ピーク開始点、ピーク終了点、およびベースラインなどを推定する処理と、推定結果と正解データとを照らし合わせる処理とが実行される。
【0077】
次に、プロセッサ10は、ステップS4の学習処理の結果に応じて作成された推定モデル300をメモリ20に格納する(ステップS5)。
【0078】
次に、プロセッサ10は、推定モデル300が検証用データ212の部分波形を解析して付与した特性情報の正答率を算出する(ステップS6)。
【0079】
次に、プロセッサ10は、予め定められた終了条件が成立しているか否かを判定する(ステップS7)。たとえば、訓練用データ211を用いて繰り返し実施する学習処理の回数が予め決められた回数に達している場合、プロセッサ10は、終了条件が成立していると判定する。終了条件が成立していない場合、プロセッサ10は、終了条件が成立するまで、ステップS3からステップS6の制御を繰り返す。
【0080】
プロセッサ10は、終了条件が成立した場合、図13の一連の処理を終了する。
[クロマトグラムの波形の解析]
次に、未解析のクロマトグラムの波形を解析する手順について、フローチャートを参照して説明する。図14は、学習済みモデル(学習済みの推定モデル300)を用いてクロマトグラムデータを判定する手順を説明するためのフローチャートである。解析装置1のプロセッサ10が解析用プログラム200の一部を実行することにより、本フローチャートの処理が実現される。
【0081】
はじめに、プロセッサ10は、クロマトグラムデータ(測定データ)を取得する(ステップS11)。クロマトグラムデータは、入出力ポート30に接続された質量分析計などの計測機器を通じて、または、入出力ポート30に接続された端末装置などを通じて、解析装置1に入力される。ステップS11において取得されるデータは、ピークに関する情報の推定対象のデータであり、対象波形の一例である。対象波形を取得するように機能するプロセッサ10により、波形取得部が構成される。
【0082】
次に、プロセッサ10は、取得されたクロマトグラムの波形を予め決められた数の部分波形に分割する(ステップS12)。クロマトグラム波形の分割数は、訓練用データ211および検証用データ212と同数であってもよく、異なる数であってもよい。
【0083】
ただし、各部分波形の幅(時間軸方向の長さ)が少なくとも、クロマトグラムに含まれることが予測されるピークの幅よりも小さくなるように、波形の長さ(クロマトグラフ質量分析の実行時間の長さ)に応じて分割数が決定される。たとえば、512または1024などに分割数を設定することが考えられる。
【0084】
次に、プロセッサ10は、学習済みの推定モデル300(学習済みモデル)に部分波形を入力する(ステップS13)。次に、プロセッサ10は、学習済みモデルとして、部分波形がピーク領域に属するものであるか否かを判定し、ラベル付け処理を実行する(ステップS14)。より具体的には、部分波形から、ピーク開始点および終了点、ベースライン、単体ピーク、未分離ピーク、ピークトップなどが判定される。また、それぞれの判定結果の重みが算出される。また、ステップS14では、各部分波形に特性情報(ピーク領域に属するものであるか否かの情報)が付加される。ステップS14において推定モデル300を利用して各部分波形の特性情報を作成するように機能するプロセッサ10により、ピーク情報取得部が構成される。
【0085】
次に、プロセッサ10は、判定結果を示すグラフを作成し、作成されたグラフを表示するための表示信号を表示装置60へ出力する(ステップS15)。これにより、表示装置60には、判定結果が表示される。たとえば、表示装置60の画面には、クロマトグラムの波形上に、ピーク開始点、およびピーク終了点が表示される。
【0086】
次に、プロセッサ10は、ピーク開始点および終了点の修正指示を検出したか否かを判定する(ステップS16)。本実施の形態では、表示装置60の画面上でユーザがピーク開始点および終了点を修正する操作を行うことが可能である。プロセッサ10は、修正指示が検出された場合、ステップS17へ制御を進め、修正指示が検出されない場合、ステップS18へ制御を進める。
【0087】
ユーザがマウス40およびキーボード50により、ピーク開始点および終了点を修正する操作をした場合、プロセッサ10は、修正指示に応じて画面上のデータを修正する(ステップS17)。このように、プロセッサ10は、ユーザの修正指示を受け付けて、ピーク開始点および終了点を修正する。
【0088】
プロセッサ10は、データを修正した後、データを確定させる操作を検出したか否かを判定する(ステップS18)。データを確定させる操作が検出されない場合、プロセッサ10は、ステップS16へ制御を戻す。プロセッサ10は、データを確定させる操作が検出された場合、判定結果(データが修正された場合には修正後の判定結果)をメモリ20に格納し(ステップS19)、本フローチャートに基づく処理を終える。
【0089】
[判定結果の一例]
図15は、学習済みモデルの判定結果の一例を示す図である。図15の上のグラフは、入力されたクロマトグラムの波形W0を示す。図15の下のグラフは、入力されたクロマトグラムに対する学習済みモデルの判定結果を表す。両グラフの横軸(インデックス)は、時間軸に対応する。図15の上のグラフの縦軸は検出強度を表す。図15の下のグラフの縦軸は学習済みモデルにより出力された重みを示す。重みは、0~1の範囲に正規化されている。
【0090】
学習済みモデルの判定結果として示される波形W1~W5は、それぞれ、ベースライン、単体ピーク、未分離ピーク、ピーク開始点、およびピーク終了点に対応する。クロマトグラムの波形W0と波形W1~W5とを対比することにより、たとえば、クロマトグラムの波形W0のうち、インデックスIsの位置において、ピーク開始点に対応する重みが最も高くなることがわかる。同様に、クロマトグラムの波形W0のうち、インデックスIeの位置において、ピーク終了点に対応する重みが最も高くなることがわかる。この場合、たとえば、解析装置1は、クロマトグラムの波形W0のうち、インデックスIsの位置をピーク開始点と判定し、インデックスIeの位置をピーク終了点と判定する。
【0091】
ここでは、判定対象として、ピーク開始点、ピーク終了点、単体ピーク、未分離ピーク、およびベースラインを例に挙げているが、ピークトップなど、他の要素を判定対象に加えることもできる。
【0092】
プロセッサ10は、図15に示されるように、学習済みモデルによって判定されたピーク開始点Isに対応する重みWsと、学習済みモデルによって判定されたピーク終了点Ieに対応する重みWeとの平均値を計算することにより、ピークの確信度を特定する。
【0093】
図16は、判定結果に基づいてラベル付け処理が行われたグラフの一例を示す図である。図16の上のグラフは、図15の下に示したグラフと同一である。図16の下のグラフは、入力されたクロマトグラムの波形W0(図15参照)を、波形W1~波形W5に基づいてラベル付けしたグラフである。ラベル0~4は、それぞれ、ベースライン、単体ピーク、未分離ピーク、ピーク開始点、およびピーク終了点に対応する。
【0094】
たとえば、ラベル付け処理は、次の手順で行われる。すなわち、波形W1~W5のうち、あるインデックスIxの位置で最も重みが大きい波形を選択し、その選択した波形でインデックスIxの値をラベル付けする。xをインデックスの初期値から最終値まで変化させて同じ処理を繰り返すことによって、ラベル付け処理が終了する。たとえば、図16には、インデックス0~Isまでの区間がベースラインにラベル付け(ラベル=0)されたグラフが示されている。
【0095】
[判定結果の表示]
図17は、判定結果を表示する画像120の一例を示す図である。画像120は、表示装置60によって表示される。画像120は、解析対象であるクロマトグラムの波形とともに、判定結果に対応するピーク開始点Isおよびピーク終了点Ieを含む欄121を含む。判定結果は、波形に対して取得されたピークに関する情報である。プロセッサ10は、欄121に、ピーク開始点Isおよびピーク終了点Ie以外の判定結果を含めてもよく、また、画像120に、上述のように算出された確信度を含めてもよい。
【0096】
画像120は、さらに、学習用データの作成において利用された基準を表す欄122を含む。一実現例では、欄122には、基準1~基準8として説明された基準の内容が表示される。すなわち、プロセッサ10がステップS15において作成し出力する表示信号によって含まれる画像に、欄122に対応する要素が含まれる。学習用データが作成される基準は、学習済みの推定モデルの特性に影響を与え得る。したがって、欄122内の内容は、ユーザに対する学習済みの推定モデルの説明性を高めることができる。
【0097】
プロセッサ10は、画像120の他、図15に示す態様の2つのグラフを含む画像と、図16に示す態様の2つのグラフを含む画像と、図15および図16に含まれる3つのグラフを縦方向に並べた画像とを選択的に表示装置60に表示することが可能である。いずれの画像にも、上述のように算出された確信度が併せて表示されてもよい。また、いずれの画像にも、ステップS6(図13)で算出されたモデルの正答率が表示されてもよい。ユーザは、マウス40およびキーボード50を用いて、いずれの画像を表示するかを示す指示を解析装置1に入力することができる。
【0098】
[複数の学習済みモデルの作成]
解析装置1は、複数種類の学習用データを作成し、複数種類の学習用データのそれぞれを利用して複数種類の学習済みモデルを作成してもよい。複数種類の学習済みモデルの作成について、図18を参照してより具体的に説明する。図18は、複数種類の学習用データを利用した複数種類の学習済みモデルの作成を説明するための図である。
【0099】
図18には、基準Aに従って作成された学習用データ210Aと、基準Bに従って作成された学習用データ210Bとが示されている。基準Aは、第1の「一定の基準」の一例である。基準Bは、第2の「一定の基準」の一例である。図18には、また、学習用データ210Aを利用されて学習処理を施された第1推定モデル300Aと、学習用データ210Bを利用されて学習処理を施された第2推定モデル300Bとが示されている。
【0100】
一つの側面において、第1推定モデル300Aは「第1の推定モデル」の一例であり、第2推定モデル300Bは「第2の推定モデル」の一例である。ピーク情報取得部203は、第1推定モデル300Aを用いて判定結果を取得することもできるし、第2推定モデル300Bを用いて判定結果を取得することもできる。
【0101】
第1推定モデル300Aを用いて取得された判定結果(ピークピッキングの結果)は、第1のピーク部分に関する情報の一例である。第2推定モデル300Bを用いて取得された判定結果(ピークピッキングの結果)は、第2のピーク部分に関する情報の一例である。
【0102】
学習用データ210Aは、基準Aに従った正解データがクロマトグラフデータに付加されることによって作成される。学習用データ210Bは、基準Bに従った正解データがクロマトグラフデータに付加されることによって作成される。
【0103】
一実現例では、基準Aと基準Bとは、上述の基準1~基準6で使用された閾値または範囲が互いに異なる。
【0104】
一例では、基準Aでは、閾値または範囲は検出限界に対応するように設定され、基準Bでは、閾値または範囲は定量下限に対応するように設定される。JIS_K_0211「分析化学用語(基礎部門)」によれば、検出限界とは、分析種を検出できる最小値を意味し、定量下限とは、ある分析方法で分析種の定量が可能な最小量または最小濃度を意味する。基準Aに従うと、定量が難しいほど少量の分析種に対応するピーク候補もピークとして特定されるのに対し、基準Bに従うと、定量が可能な程度の濃度を有する分析種に対応するピーク候補のみがピークとして特定される。これにより、推定モデル300Aが利用された場合、濃度の低い分析種に対応するピークを含むより多くの分析種に対応するピークがピークとして認識されることが期待される。また、推定モデル300Bが利用された場合、比較的濃度の高い分析種に対応するピークのみがピークとして認識されることが期待される。
【0105】
他の例として、基準Aでは、ピーク候補がピークとして特定されるためのS/N比の閾値が基準Bでの閾値よりも高い。たとえば、基準Aでは、ピーク候補がピークとして特定されるためのS/N比の閾値が10であり、基準Bでは、当該閾値が5である。基準Aに従うと、比較的大きいピークトップを有するピーク候補にのみがピークとして特定されるのに対し、基準Bに従うと、比較的小さいピークトップを有するピーク候補までピークとして特定される。これにより、推定モデル300Aが利用された場合、比較的大きいピークトップを有するピークのみがピークとして認識されることが期待される。また、推定モデル300Bが利用された場合、比較的大きいピークトップを有するピークだけでなく、比較的小さいピークトップを有するピークも、ピークとして認識されることが期待される。
【0106】
さらに他の例として、基準Aでは、ピーク候補がピークとして特定されるための分離度の閾値が基準Bでの閾値より高い。たとえば、基準Aでは、ピーク候補がピークとして特定されるための分離度の閾値が1.5であり、基準Bでは、当該閾値が0.8である。基準Aに従うと、隣接する他のピーク候補とは分離されたピーク候補のみがピークとして特定されるのに対し、基準Bに従うと、隣接する他のピーク候補とある程度重なりを持つピーク候補までピークとして特定される。これにより、推定モデル300Aが利用された場合、隣接する他のピークとは分離されたピークのみがピークとして認識されることが期待される。また、推定モデル300Bが利用された場合、隣接する他のピークとは分離されたピークだけでなく、隣接する他のピーク候補とある程度重なりを持つピークも、ピークとして認識されることが期待される。
【0107】
さらに他の例として、基準Aでは、ピーク候補がピークとして特定されるためのシンメトリー係数の範囲が基準Bでの範囲より広い。たとえば、基準Aでは、ピーク候補がピークとして特定されるためのシンメトリー係数の範囲が0.8~1.8であり、基準Bでは、0.9~1.5である。基準Bに従った場合では整った形状を有していないためピークとして特定されないピーク候補が、基準Aに従った場合にはピークとして特定される。これにより、推定モデル300Bが利用された場合では整った形状を有していないためピークとして特定されないピークが、推定モデル300Aが利用された場合にはピークとして認識されることが期待される。
【0108】
解析装置1は、上述のように複数種類の学習済みモデルが作成されている場合、解析対象の1種類のクロマトグラムデータに対して、複数種類の学習済みモデルのそれぞれを利用した複数種類の判定結果を出力してもよい。この場合、複数種類の判定結果のそれぞれの出力の際には、複数種類の学習済みモデルのそれぞれの作成に利用された学習用データに関する基準が判定結果とともに出力されてもよい。より具体的には、複数種類の判定結果のそれぞれには、図17において欄122として示されたような情報が表示されてもよい。すなわち、プロセッサ10は、複数種類の学習済みモデルのそれぞれについて、ステップS15として説明された出力のための制御を実施してもよい。
【0109】
解析装置1は、また、上述のように複数種類の学習済みモデルが作成されている場合、複数種類の学習済みモデルの中から1以上の種類の学習済みモデルの選択を受け付け、解析対象の1種類のクロマトグラムデータに対して、選択された1以上の種類の学習済みモデルのみを利用して、判定結果を出力してもよい。図19は、図14のフローチャートの変形例のフローチャートである。
【0110】
図19のフローチャートでは、図14のフローチャートにおけるステップS13の制御が、ステップS13AおよびステップS13Bの制御に置き換えられている。
【0111】
より具体的には、図19に示された手順では、プロセッサ10は、ステップS12においてクロマトグラムを部分波形に分割した後、ステップS13Aへ制御を進める。
【0112】
ステップS13Aにて、プロセッサ10は、ユーザから、複数種類の学習済みモデルの中から判定結果を得るために利用する学習済みモデルの選択を取得する。
【0113】
ステップS13Bにて、プロセッサ10は、ステップS13Aにおいて取得した選択において選択されている学習済みモデル(推定モデル)に、部分波形を入力する。
【0114】
その後、プロセッサ10は、部分波形を入力されたそれぞれの学習済みモデルについて、ステップS14以降の制御を実施する。
【0115】
[従来技術との対比]
図20は、解析装置1が学習済みモデルを利用することによって取得した判定結果と従来技術の判定結果の精度を比較するための情報を表す図である。図20には、2種類の解析対象のサンプルのそれぞれに対する、判定結果に対して修正が加えられた割合を表す。
【0116】
2種類の解析対象のサンプルは、「低濃度サンプル」および「高濃度サンプル」として表されている。「低濃度サンプル」は、50μLの食品を溶媒で希釈された所与の容量のサンプル溶液を表す。「高濃度サンプル」は、400μLの食品を溶媒で希釈された所与の容量のサンプル溶液を表す。
【0117】
図20において、「手法」は、判定結果を取得するために利用された手法を意味する。「推定モデル」は、本実施形態に示された推定モデル300を利用した手法を表す。すなわち、手法「推定モデル」を利用された判定結果は、ステップS14において推定モデル300を利用して得られたラベル付けの結果として得られた判定結果を意味する。一方、「従来」は、所与の基準で解析対象のデータを処理する手法を表し、このような手法は、たとえば、株式会社島津製作所製のクロマトパックを利用して実現される(「クロマトパック操作Q&A 波形処理」、株式会社島津製作所、2022年2月15日検索、[online]、<URL: https://www.an.shimadzu.co.jp/data-net/support/faq/pac/pac-faq1.htm#0101>)。
【0118】
より具体的には、手法「推定モデル」は、解析対象のサンプルのクロマトグラムデータを、上述の基準に従って作成された学習用データを利用して学習処理を施された学習済みモデルに入力することによって、判定結果を出力する手法を意味する。一方、手法「従来」は、解析対象のサンプルのクロマトグラムデータに、上述の基準を直接適用してピークピッキングをするアルゴリズムで、判定結果を出力する手法を意味する。
【0119】
図20において、「修正割合」は、判定結果であるピークピッキングの結果に対してユーザが修正を加えた割合である。たとえば、100のサンプルの判定結果があり、各判定結果がピークピッキングについて10の項目(ピーク開始点、ピーク終了店、等)を有している場合、合計1000項目の修正対象が存在する。この場合、修正割合は、1000項目の修正対象に対してユーザが修正を加えた割合が「修正割合」として導出される。たとえば、ユーザが10の判定結果に対して1項目ずつ修正を加えた場合、修正割合は、次の式(2)に従って1.0%として導出される。
【0120】
(10/1000)×100=1.0 …(2)
図20に示されるように、低濃度サンプルについては、手法「従来」の修正割合が36.6%であるのに対し、手法「推定モデル」の修正割合は10.8%である。すなわち、手法「推定モデル」の修正割合は、手法「従来」の修正割合に対して25.5%低い。
【0121】
また、高濃度サンプルについては、手法「従来」の修正割合が10.4%であるのに対し、手法「推定モデル」の修正割合は5.7%である。すなわち、手法「推定モデル」の修正割合は、手法「従来」の修正割合に対して4.7%低い。
【0122】
以上より、手法「推定モデル」は、低濃度サンプルおよび高濃度サンプルのいずれにおいても、手法「従来」より精度が高いと言える。
【0123】
以上説明された本実施の形態の解析装置1は、精度が高い判定結果を出力することができる。また、解析装置1は、一定の基準に従って作成された学習用データを利用して学習処理を施された学習済みモデルを利用して、判定結果を出力する。当該基準および学習済みモデルが当該基準に従って作成された学習用データを利用して学習処理を施されたことがユーザに報知されれば、学習済みモデルに対する説明性が向上し得る。
【0124】
本実施の形態は、いずれも一例であって、本開示の趣旨に沿って適宜に変更することが可能である。ここではクロマトグラフ質量分析により得られたクロマトグラムの波形を処理する場合を例に説明した。しかし、質量分析計以外の検出器(分光光度計)を有するクロマトグラフ、およびガスクロマトグラフで取得されたクロマトグラムも同様に解析装置1により解析することができる。さらに、解析の対象はクロマトグラムに限定されない。たとえば、分光光度計による測定で取得された分光スペクトル(波長または波数軸に対する検出強度の変化を表した波形)を解析対象としてもよい。LC、GC、LC-PDA、LC/MS、GC/MS、LC/MS/MS、GC/MS/MS、LC/MS-IT-TOFなどで得られたいずれの波形を解析対象としてもよい。
【0125】
[態様]
上記した実施の形態およびその変形例は、以下の態様の具体例であることが当業者により理解される。
【0126】
(第1項)一態様に係る学習用データの作成方法は、複数の参照波形に基づいて対象波形におけるピークに関する情報を出力するようにコンピュータを機能させる、推定モデルを作成するための学習用データを作成する方法であって、前記複数の参照波形を取得するステップと、前記複数の参照波形のそれぞれに対して、一定の基準に従ってピーク部分に関する情報を特定するステップと、前記複数の参照波形のそれぞれに対して、特定された前記ピーク部分に関する情報を付与するステップと、を備えていてもよい。
【0127】
第1項に記載の学習用データの作成方法によれば、精度が高くかつ説明性が高いピークピッキングの手法が提供される。
【0128】
(第2項)第1項に係る学習用データの作成方法において、前記一定の基準は、前記複数の参照波形のそれぞれにおけるピークを特定するためのピーク用基準、および、前記複数の参照波形のそれぞれにおけるベースラインを特定するためのベースライン用基準を含んていてもよい。
【0129】
第2項に記載の学習用データの作成方法によれば、ピークピッキングにおいて、ピークの特定およびベースラインの特定について、説明性が担保される。
【0130】
(第3項)第2項に係る学習用データの作成方法において、前記ピーク用基準は、各参照波形においてピーク候補をピークとして特定するために、当該ピーク候補のS/N比、当該ピーク候補の分離度、当該ピーク候補のシンメトリー係数、当該ピーク候補から想定されるピーク全体に対する参照波形内に存在するピーク候補の割合、当該ピーク候補におけるピークトップの高さ、および、当該ピーク候補の幅のうち少なくとも1つを規定してもよい。
【0131】
第3項に記載の学習用データの作成方法によれば、ピークピッキングにおいて、ピークの特定について、より詳細に説明性が担保される。
【0132】
(第4項)第2項または第3項に係る学習用データの作成方法において、前記ベースライン用基準は、ベースラインの傾きを、縦軸が信号強度であり横軸が時間であるグラフにおける水平にすること、および、隣接する複数のピークの中の1の開始点と1の終了点とを連結する線の傾きにすること、のうち少なくとも1つを規定し、前記1の開始点は、前記隣接する複数のピークの中の最も早い時間に現れたピークの開始点であり、前記1の終了点は、前記隣接する複数のピークの中の最も遅い時間に現れたピークの終了点であってもよい。
【0133】
第4項に記載の学習用データの作成方法によれば、ピークピッキングにおいて、ベースラインの特定について、より詳細に説明性が担保される。
【0134】
(第5項)第1項~第4項のいずれか1項に係る学習用データの作成方法において、前記複数の参照波形を取得するステップは、参照波形として擬似的に波形を作成することを含んでいてもよい。
【0135】
第5項に記載の学習用データの作成方法によれば、学習用データの準備が容易になる。
(第6項)一態様に係る波形解析装置は、未解析の対象波形を取得する波形取得部と、学習済の第1の推定モデルに対して前記対象波形を入力し、前記対象波形における第1のピークに関する情報を取得するピーク情報取得部と、を備え、前記第1の推定モデルは、前記対象波形が入力された際に前記対象波形におけるピークに関する情報を出力するように、複数の参照波形のそれぞれが第1の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されていてもよい。
【0136】
第6項に記載の波形解析装置によれば、精度が高くかつ説明性が高いピークピッキングの手法が提供される。
【0137】
(第7項)第6項に係る波形解析装置は、前記第1のピークに関する情報と前記第1の一定の基準を出力する出力部をさらに備えていてもよい。
【0138】
第7項に記載の波形解析装置によれば、ピークピッキングにおける説明性がより確実に担保される。
【0139】
(第8項)第6項または第7項に係る波形解析装置において、前記第1の一定の基準は、前記複数の参照波形のそれぞれにおけるピークを特定するためのピーク用基準、および、前記複数の参照波形のそれぞれにおけるベースラインを特定するためのベースライン用基準を含んでいてもよい。
【0140】
第8項に記載の波形解析装置によれば、ピークピッキングにおいて、ピークの特定およびベースラインの特定について、説明性が担保される。
【0141】
(第9項)第6項~第8項のいずれか1項に係る波形解析装置において、前記ピーク用基準は、各参照波形においてピーク候補をピークとして特定するために、当該ピーク候補のS/N比、当該ピーク候補の分離度、当該ピーク候補のシンメトリー係数、当該ピーク候補から想定されるピーク全体に対する参照波形内に存在するピーク候補の割合、当該ピーク候補におけるピークトップの高さ、および、当該ピーク候補の幅のうち少なくとも1つを規定してもよい。
【0142】
第9項に記載の波形解析装置によれば、ピークピッキングにおいて、ピークの特定について、より詳細に説明性が担保される。
【0143】
(第10項)第8項または第9項に係る波形解析装置において、前記ベースライン用基準は、ベースラインの傾きを、縦軸が信号強度であり横軸が時間であるグラフにおける水平にすること、および、隣接する複数のピークの中の1の開始点と1の終了点とを連結する線の傾きにすること、のうち少なくとも1つを規定し、前記1の開始点は、前記隣接する複数のピークの中の最も早い時間に現れたピークの開始点であり、前記1の終了点は、前記隣接する複数のピークの中の最も遅い時間に現れたピークの終了点であってもよい。
【0144】
第10項に記載の波形解析装置によれば、ピークピッキングにおいて、ベースラインの特定について、より詳細に説明性が担保される。
【0145】
(第11項)第6項~第10項のいずれか1項に係る波形解析装置において、前記ピーク情報取得部は、学習済の第2の推定モデルに対して前記対象波形を入力し、前記対象波形における第2のピークに関する情報を取得し、前記第2の推定モデルは、前記対象波形が入力された際に前記対象波形における第2のピークに関する情報を出力するように、複数の参照波形のそれぞれが前記第1の一定の基準とは異なる第2の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されていてもよい。
【0146】
第11項に記載の波形解析装置によれば、複数の側面のそれぞれに従って、ピークピッキングの結果が提供される。
【0147】
(第12項)第7項に係る波形解析装置において、前記ピーク情報取得部は、学習済の第2の推定モデルに対して前記対象波形を入力し、前記対象波形における第2のピークに関する情報を取得し、前記第2の推定モデルは、前記対象波形が入力された際に前記対象波形における第2のピークに関する情報を出力するように、複数の参照波形のそれぞれが前記第1の一定の基準とは異なる第2の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されており、前記出力部は前記第2のピークに関する情報と前記第2の一定の基準を出力してもよい。
【0148】
第12項に記載の波形解析装置によれば、複数の側面のそれぞれに従って、ピークピッキングの結果が提供される。
【0149】
(第13項)一態様に係る波形解析方法は、未解析の対象波形を取得するステップと、学習済の第1の推定モデルに対して前記対象波形を入力し、前記対象波形における第1のピークに関する情報を取得するステップと、を備え、前記第1の推定モデルは、前記対象波形が入力された際に前記対象波形における第1のピークに関する情報を出力するように、複数の参照波形のそれぞれが第1の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されていてもよい。
【0150】
第13項に記載の波形解析方法によれば、精度が高くかつ説明性が高いピークピッキングの手法が提供される。
【0151】
(第14項)第13項に係る波形解析方法において、前記第1のピークに関する情報と前記第1の一定の基準を出力するステップをさらに備えていてもよい。
【0152】
第14項に記載の波形解析方法によれば、ピークピッキングにおける説明性がより確実に担保される。
【0153】
(第15項)第13項または第14項に係る波形解析方法において、前記第1の一定の基準は、前記複数の参照波形のそれぞれにおけるピークを特定するためのピーク用基準、および、前記複数の参照波形のそれぞれにおけるベースラインを特定するためのベースライン用基準を含んでいてもよい。
【0154】
第15項に記載の波形解析方法によれば、ピークピッキングにおいて、ピークの特定について、より詳細に説明性が担保される。
【0155】
(第16項)第15項に係る波形解析方法において、前記ピーク用基準は、各参照波形においてピーク候補をピークとして特定するために、当該ピーク候補のS/N比、当該ピーク候補の分離度、当該ピーク候補のシンメトリー係数、当該ピーク候補から想定されるピーク全体に対する参照波形内に存在するピーク候補の割合、当該ピーク候補におけるピークトップの高さ、および、当該ピーク候補の幅のうち少なくとも1つを規定していてもよい。
【0156】
第16項に記載の波形解析方法によれば、ピークピッキングにおいて、ベースラインの特定について、より詳細に説明性が担保される。
【0157】
(第17項)第15項または第16項に係る波形解析方法において、前記ベースライン用基準は、ベースラインの傾きを、縦軸が信号強度であり横軸が時間であるグラフにおける水平にすること、および、隣接する複数のピークの中の1の開始点と1の終了点とを連結する線の傾きにすること、のうち少なくとも1つを規定し、前記1の開始点は、前記隣接する複数のピークの中の最も早い時間に現れたピークの開始点であり、前記1の終了点は、前記隣接する複数のピークの中の最も遅い時間に現れたピークの終了点であってもよい。
【0158】
第17項に記載の波形解析方法によれば、ピークピッキングにおいて、ベースラインの特定について、より詳細に説明性が担保される。
【0159】
(第18項)第14項に係る波形解析方法において、学習済の第2の推定モデルに対して前記対象波形を入力し、前記対象波形における第2のピークに関する情報を取得するステップをさらに備え、前記第2の推定モデルは、前記対象波形が入力された際に前記対象波形における第2のピークに関する情報を出力するように、複数の参照波形のそれぞれが前記第1の一定の基準とは異なる第2の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されており、前記第2のピークに関する情報と前記第2の一定の基準を出力するステップをさらに備えていてもよい。
【0160】
第18項に記載の波形解析方法によれば、複数の側面のそれぞれに従って、ピークピッキングの結果が提供される。
【0161】
(第19項)第18項に係る波形解析方法において、前記第1の推定モデルに対して前記対象波形を入力し、前記対象波形における前記第1のピークに関する情報を取得するステップ、および、前記第2の推定モデルに対して前記対象波形を入力し、前記対象波形における前記第2のピークに関する情報を取得するステップのうち一方のみが実施されてもよい。
【0162】
第19項に記載の波形解析方法によれば、複数の側面のうち一部の側面に従って、ピークピッキングの結果が提供される。
【0163】
(第20項)一態様に係るコンピュータプログラムは、コンピュータの1以上のプロセッサによって実行されることにより、前記コンピュータに第13項~第19項のいずれか1項に記載の波形解析方法を実施させてもよい。
【0164】
第20項に記載のコンピュータプログラムによれば、精度が高くかつ説明性が高いピークピッキングの手法が提供される。
【符号の説明】
【0165】
1 解析装置、10 プロセッサ、20 メモリ、30 入出力ポート、40 マウス、41 波形、50 キーボード、60 表示装置、61 画像、62 画像、65,66 アイコン、200 解析用プログラム、201 分割部、202 モデル作成部、203 判定部、204 ピーク情報取得部、205 画像処理部、206 出力部、210,210A,210B 学習用データ、211 訓練用データ、212 検証用データ、213 測定データ、300 推定モデル、300A 第1推定モデル、300B 第2推定モデル、400 クロマトグラム、C1~C11 領域。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
【手続補正書】
【提出日】2023-03-09
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
複数の参照波形に基づいて対象波形におけるピークに関する情報を出力するようにコンピュータを機能させる、推定モデルを作成するための学習用データを作成する方法であって、
前記複数の参照波形を取得するステップと、
前記複数の参照波形のそれぞれに対して、一定の基準に従ってピーク部分に関する情報を特定するステップと、
前記複数の参照波形のそれぞれに対して、特定された前記ピーク部分に関する情報を付与するステップと、を備える、学習用データの作成方法。
【請求項2】
前記一定の基準は、前記複数の参照波形のそれぞれにおけるピークを特定するためのピーク用基準、および、前記複数の参照波形のそれぞれにおけるベースラインを特定するためのベースライン用基準を含む、請求項1に記載の学習用データの作成方法。
【請求項3】
前記ピーク用基準は、各参照波形においてピーク候補をピークとして特定するために、当該ピーク候補のS/N比、当該ピーク候補の分離度、当該ピーク候補のシンメトリー係数、当該ピーク候補から想定されるピーク全体に対する参照波形内に存在するピーク候補の割合、当該ピーク候補におけるピークトップの高さ、および、当該ピーク候補の幅のうち少なくとも1つを規定する、請求項2に記載の学習用データの作成方法。
【請求項4】
前記ベースライン用基準は、ベースラインの傾きを、縦軸が信号強度であり横軸が時間であるグラフにおける水平にすること、および、隣接する複数のピークの中の1の開始点と1の終了点とを連結する線の傾きにすること、のうち少なくとも1つを規定し、
前記1の開始点は、前記隣接する複数のピークの中の最も早い時間に現れたピークの開始点であり、前記1の終了点は、前記隣接する複数のピークの中の最も遅い時間に現れたピークの終了点である、請求項2または請求項3に記載の学習用データの作成方法。
【請求項5】
前記複数の参照波形を取得するステップは、参照波形として擬似的に波形を作成することを含む、請求項1~請求項4のいずれか1項に記載の学習用データの作成方法。
【請求項6】
未解析の対象波形を取得する波形取得部と、
学習済の第1の推定モデルに対して前記対象波形を入力し、前記対象波形における第1のピークに関する情報を取得するピーク情報取得部と、を備え、
前記第1の推定モデルは、前記対象波形が入力された際に前記対象波形におけるピークに関する情報を出力するように、複数の参照波形のそれぞれが第1の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている、波形解析装置。
【請求項7】
前記第1のピークに関する情報と前記第1の一定の基準を出力する出力部をさらに備える、請求項6に記載の波形解析装置。
【請求項8】
前記第1の一定の基準は、前記複数の参照波形のそれぞれにおけるピークを特定するためのピーク用基準、および、前記複数の参照波形のそれぞれにおけるベースラインを特定するためのベースライン用基準を含む、請求項6または請求項7に記載の波形解析装置。
【請求項9】
前記ピーク用基準は、各参照波形においてピーク候補をピークとして特定するために、当該ピーク候補のS/N比、当該ピーク候補の分離度、当該ピーク候補のシンメトリー係数、当該ピーク候補から想定されるピーク全体に対する参照波形内に存在するピーク候補の割合、当該ピーク候補におけるピークトップの高さ、および、当該ピーク候補の幅のうち少なくとも1つを規定する、請求項に記載の波形解析装置。
【請求項10】
前記ベースライン用基準は、ベースラインの傾きを、縦軸が信号強度であり横軸が時間であるグラフにおける水平にすること、および、隣接する複数のピークの中の1の開始点と1の終了点とを連結する線の傾きにすること、のうち少なくとも1つを規定し、
前記1の開始点は、前記隣接する複数のピークの中の最も早い時間に現れたピークの開始点であり、前記1の終了点は、前記隣接する複数のピークの中の最も遅い時間に現れたピークの終了点である、請求項8または請求項9に記載の波形解析装置。
【請求項11】
前記ピーク情報取得部は、学習済の第2の推定モデルに対して前記対象波形を入力し、前記対象波形における第2のピークに関する情報を取得し、
前記第2の推定モデルは、前記対象波形が入力された際に前記対象波形における第2のピークに関する情報を出力するように、複数の参照波形のそれぞれが前記第1の一定の基準とは異なる第2の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている、請求項6~請求項10のいずれか1項に記載の波形解析装置。
【請求項12】
前記ピーク情報取得部は、学習済の第2の推定モデルに対して前記対象波形を入力し、前記対象波形における第2のピークに関する情報を取得し、
前記第2の推定モデルは、前記対象波形が入力された際に前記対象波形における第2のピークに関する情報を出力するように、複数の参照波形のそれぞれが前記第1の一定の基準とは異なる第2の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されており、
前記出力部は前記第2のピークに関する情報と前記第2の一定の基準を出力する、請求項7に記載の波形解析装置。
【請求項13】
未解析の対象波形を取得するステップと、
学習済の第1の推定モデルに対して前記対象波形を入力し、前記対象波形における第1のピークに関する情報を取得するステップと、を備え、
前記第1の推定モデルは、前記対象波形が入力された際に前記対象波形における第1のピークに関する情報を出力するように、複数の参照波形のそれぞれが第1の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されている、波形解析方法。
【請求項14】
前記第1のピークに関する情報と前記第1の一定の基準を出力するステップをさらに備える、請求項13に記載の波形解析方法。
【請求項15】
前記第1の一定の基準は、前記複数の参照波形のそれぞれにおけるピークを特定するためのピーク用基準、および、前記複数の参照波形のそれぞれにおけるベースラインを特定するためのベースライン用基準を含む、請求項13または請求項14に記載の波形解析方法。
【請求項16】
前記ピーク用基準は、各参照波形においてピーク候補をピークとして特定するために、当該ピーク候補のS/N比、当該ピーク候補の分離度、当該ピーク候補のシンメトリー係数、当該ピーク候補から想定されるピーク全体に対する参照波形内に存在するピーク候補の割合、当該ピーク候補におけるピークトップの高さ、および、当該ピーク候補の幅のうち少なくとも1つを規定する、請求項15に記載の波形解析方法。
【請求項17】
前記ベースライン用基準は、ベースラインの傾きを、縦軸が信号強度であり横軸が時間であるグラフにおける水平にすること、および、隣接する複数のピークの中の1の開始点と1の終了点とを連結する線の傾きにすること、のうち少なくとも1つを規定し、
前記1の開始点は、前記隣接する複数のピークの中の最も早い時間に現れたピークの開始点であり、前記1の終了点は、前記隣接する複数のピークの中の最も遅い時間に現れたピークの終了点である、請求項15または請求項16に記載の波形解析方法。
【請求項18】
学習済の第2の推定モデルに対して前記対象波形を入力し、前記対象波形における第2のピークに関する情報を取得するステップをさらに備え、
前記第2の推定モデルは、前記対象波形が入力された際に前記対象波形における第2のピークに関する情報を出力するように、複数の参照波形のそれぞれが前記第1の一定の基準とは異なる第2の一定の基準に従って特定されたピーク部分に関する情報を付与されることによって作成された学習用データを用いて学習処理を施されており、
前記第2のピークに関する情報と前記第2の一定の基準を出力するステップをさらに備える、請求項14に記載の波形解析方法。
【請求項19】
前記第1の推定モデルに対して前記対象波形を入力し、前記対象波形における前記第1のピークに関する情報を取得するステップ、および、前記第2の推定モデルに対して前記対象波形を入力し、前記対象波形における前記第2のピークに関する情報を取得するステップのうち一方のみが実施される、請求項18に記載の波形解析方法。
【請求項20】
コンピュータの1以上のプロセッサによって実行されることにより、前記コンピュータに請求項13~請求項19のいずれか1項に記載の波形解析方法を実施させる、コンピュータプログラム。