(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023159214
(43)【公開日】2023-10-31
(54)【発明の名称】波形解析方法及び波形解析装置
(51)【国際特許分類】
G01N 30/86 20060101AFI20231024BHJP
G01N 27/62 20210101ALI20231024BHJP
【FI】
G01N30/86 B
G01N30/86 G
G01N27/62 D
【審査請求】有
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023130412
(22)【出願日】2023-08-09
(62)【分割の表示】P 2021550866の分割
【原出願日】2019-10-02
(71)【出願人】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】110001069
【氏名又は名称】弁理士法人京都国際特許事務所
(72)【発明者】
【氏名】金澤 慎司
(57)【要約】 (修正有)
【課題】クロマトグラム又は分光スペクトルである対象波形を解析する波形解析装置を提供する。
【解決手段】波形解析装置4は、対象波形を複数の部分波形に分割する波形分割部54と、ピーク部分の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって作成された学習済みモデルを使用して、対象波形の複数の部分波形のそれぞれがピーク部分であるか否かを判定する判定部55と、判定部による判定結果に基づき、対象波形を、ピーク部分が連続するピーク領域と、それ以外の非ピーク領域とに分類する分類部56とを備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
一次元のデータ列である対象データ列から構成される対象波形を解析する波形解析方法であって、
ピーク部分の位置が既知である参照波形を構成する一次元のデータ列である参照データ列を複数用いた機械学習によって、入力されるデータ列から構成される波形においてピークを構成する部分をセマンティックセグメンテーションにより特定する学習済みモデルを作成し、
前記対象データ列を前記学習済みモデルに入力して前記対象波形においてピークを構成する部分を特定し、
前記対象波形を、前記ピークを構成する部分に対応するピーク領域と、それ以外の非ピーク領域とに分類する、波形解析方法。
【請求項2】
一次元のデータ列である対象データ列から構成される対象波形を解析する波形解析装置であって、
ピーク部分の位置が既知である参照波形を構成する一次元のデータ列である参照データ列を複数用いた機械学習によって作成され、入力されるデータ列から構成される波形においてピークを構成する部分をセマンティックセグメンテーションにより特定する学習済みモデルに前記対象データ列を入力して前記対象波形においてピークを構成する部分を特定し、該対象波形を、前記ピークを構成する部分に対応するピーク領域と、それ以外の非ピーク領域とに分類する分類部と
を備える波形解析装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、クロマトグラムや分光スペクトルの波形を解析する技術に関する。
【背景技術】
【0002】
試料に含まれる成分を同定したり定量したりするためにクロマトグラフが用いられている。クロマトグラフでは、試料中の成分をカラムで分離し、該カラムから流出する成分を順に検出する。その後、横軸を時間、縦軸を検出強度とするクロマトグラムを作成し、クロマトグラムのピークの面積や高さから、該ピークに対応する化合物の濃度や含有量を求める。
【0003】
クロマトグラムからピークの面積や高さを求めるためにはクロマトグラムのベースラインから立ち上がるピークの開始点と終了点を特定する必要がある。クロマトグラムのピークの開始点と終了点を特定する作業はピークピッキングと呼ばれる。クロマトグラムのベースラインやピークには多くの場合ノイズが含まれていることから、それらを考慮して適切にピーク開始点及び終了点を特定する必要がある。このようなノイズを考慮したピークピッキングのアルゴリズムには様々なものがあり、例えば、特許文献1には、クロマトグラムデータの時間的な変動の度合いに応じた帯域幅や遮蔽周波数を有するフィルタを用いたフィルタリング処理を施す等によりピークピッキングを行う技術が記載されている。クロマトグラム解析用ソフトウェアの中には複数のアルゴリズムを実行可能なものがあり、使用者がいずれかのアルゴリズムを選択し、必要なパラメータを設定してピークピッキングを行うことができるようになっている(例えば非特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【非特許文献】
【0005】
【非特許文献1】”インテリジェントな波形処理アルゴリズムで解析業務を効率化”, [online], [令和1年8月16日検索], 株式会社島津製作所, インターネット<URL:http://www.an.shimadzu.co.jp/hplc/support/faq/faq8/i-peakfinder_introduction.htm>
【非特許文献2】Olaf Ronneberger、ほか2名、”U-Net: Convolutional Networks for Biomedical Image Segmentation”, [online], [Submitted on 18 May 2015], arXiv.org, インターネット<URL: https://arxiv.org/pdf/1505.04597.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0006】
クロマトグラムのピークやベースラインの形状やノイズの態様は、試料や検出器の種類によって異なる。そのため、ピークピッキングを行う毎にクロマトグラムの対象となった試料や使用された検出器に適したアルゴリズムやパラメータを探索しなければならず煩雑であるという問題があった。また、パラメータの設定に分析者の主観が入りやすく、必ずしも高精度でピークピッキングを行うことができるとは限らないという問題があった。
【0007】
ここではクロマトグラフにより試料中の成分を分離し測定することにより得られるクロマトグラムのピークピッキングを行う場合を説明したが、分光測定装置により試料中の成分を測定することにより得られる分光スペクトルのピークピッキングを行う場合にも上記同様の問題があった。
【0008】
本発明が解決しようとする課題は、煩雑な操作をすることなく高精度でピークピッキングを行うことができる技術を提供することである。
【課題を解決するための手段】
【0009】
上記課題を解決するために成された本発明の一態様は、クロマトグラム又は分光スペクトルである対象波形を解析する波形解析方法であって、
ピーク部分の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって、入力される波形に含まれるピーク部分を特定する学習済みモデルを作成し、
前記対象波形を複数の部分波形に分割し、
前記学習済みモデルを使用して前記対象波形の複数の部分波形のそれぞれがピーク部分であるか否かを判定し、
前記判定の結果に基づき、前記対象波形を、前記ピーク部分が連続するピーク領域と、それ以外の非ピーク領域とに分類する
ものである。
【0010】
また、上記課題を解決するために成された本発明の別の一態様は、クロマトグラム又は分光スペクトルである対象波形を解析する波形解析装置であって、
前記対象波形を複数の部分波形に分割する波形分割部と、
ピーク部分の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって作成された学習済みモデルを使用して、前記対象波形の複数の部分波形のそれぞれがピーク部分であるか否かを判定する判定部と、
前記判定部による判定結果に基づき、前記対象波形を、前記ピーク部分が連続するピーク領域と、それ以外の非ピーク領域とに分類する分類部と
を備える。
【発明の効果】
【0011】
本発明に係る波形解析方法及び波形解析装置では、ピーク部分の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって、入力される波形がピーク部分であるか否かを判定する学習済みモデルを予め作成しておく。ここで、学習済みモデルの作成に使用する参照波形は、典型的には対象波形(クロマトグラム又は分光スペクトル)と同種の測定で得られた波形であるが、理論計算などにより作成されたものを用いることもできる。また、参照波形の複数の部分波形は、該参照波形に含まれるピークのピーク幅よりも狭い間隔で分割することにより作成される。こうして、ピークの一部を構成する部分波形についての様々な形状を学習した学習済みモデルが作成される。その後、参照波形の分割時と同様に、対象波形に含まれることが予想されるピークのピーク幅よりも狭い間隔で該対象波形を分割して部分波形を作成する。そして、上記の学習済みモデルを使用し、ピーク部分の位置が未知である対象波形を分割してなる複数の部分波形のそれぞれがピーク部分であるか否かを判定する。これにより、対象波形の複数の部分波形がピーク部分と非ピーク部分に分類され、これに基づいてピーク部分が連続する領域をピーク領域、非ピーク部分が連続する領域を非ピーク領域に分類する。本発明に係る波形解析方法及び波形解析装置では、複数の参照波形の特徴を学習した学習済みモデルを使用することにより対象波形をピーク領域と非ピーク領域に分類するため、煩雑な操作をすることなく高精度でピークピッキングを行うことができる。
【図面の簡単な説明】
【0012】
【
図1】本発明に係る波形解析装置の一実施例を含む液体クロマトグラフ質量分析システムの要部構成図。
【
図2】本発明に係る波形解析方法の一実施例において学習済みモデルを作成する手順を説明するフローチャート。
【
図3】本実施例の波形解析方法におけるクロマトグラムの解析手順を説明するフローチャート。
【
図4】本実施例の波形解析装置を用いた2クラス出力の学習済みモデルの作成について説明する図。
【
図5】本実施例の波形解析装置を用いてクロマトグラムを2クラス出力で解析した結果を説明する図。
【
図6】本実施例の波形解析装置を用いた5クラス出力の学習済みモデルの作成について説明する図。
【
図7】本実施例の波形解析装置を用いてクロマトグラムを5クラス出力で解析した結果を説明する図。
【発明を実施するための形態】
【0013】
本発明に係る波形解析装置及び波形解析方法の一実施例について、以下、図面を参照して説明する。本実施例の波形解析装置は、クロマトグラフ質量分析システムの一部として組み込まれている。なお、本実施例の波形解析装置は、必ずしもクロマトグラフ質量分析装置と一体的に構成する必要はなく、クロマトグラフ質量分析装置と別体で構成することもできる。
【0014】
図1に、本実施例の液体クロマトグラフ質量分析システムの要部構成を示す。本実施例の液体クロマトグラフ質量分析装置は、大別して、液体クロマトグラフ1、質量分析計2、及びそれらの動作を制御する制御・処理部4から構成されている。液体クロマトグラフ1は、移動相が貯留された移動相容器10と、移動相を吸引して一定流量(あるいは流速)で送給するポンプ11と、移動相中に所定量の試料液を注入するインジェクタ12と、試料液に含まれる成分を時間的に分離するカラム13とを備えている。カラム13から流出した試料液は質量分析計2のエレクトロスプレイイオン化用プローブ201に導入される。また、液体クロマトグラフ1には、インジェクタ12に複数の液体試料を1つずつ導入するオートサンプラ14が接続されている。
【0015】
質量分析計2は、略大気圧であるイオン化室20と真空ポンプ(図示なし)により真空排気された高真空の分析室23との間に、段階的に真空度が高められた第1中間真空室21と第2中間真空室22とを備えた多段差動排気系の構成を有している。イオン化室20には、液体クロマトグラフ1から供給される試料液に電荷を付与しながら噴霧するエレクトロスプレイイオン化プローブ(ESIプローブ)201が設置されている。イオン化室20と第1中間真空室21との間は細径の加熱キャピラリ202を介して連通している。第1中間真空室21と第2中間真空室22との間は頂部に小孔を有するスキマー212で隔てられ、第1中間真空室21と第2中間真空室22にはそれぞれ、イオンを収束させつつ後段へ輸送するためのイオンガイド211、221が設置されている。分析室23には、四重極マスフィルタ231とイオン検出器232が設置されている。
【0016】
質量分析計2では、選択イオンモニタリング(SIM)測定及びMSスキャン測定を行うことができる。SIM測定では四重極マスフィルタ231を通過させるイオンの質量電荷比を固定して、該質量電荷比のイオンのみを検出する。MSスキャン測定では四重極マスフィルタ231を通過させるイオンの質量電荷比を所定の質量電荷比範囲で走査しつつ、該所定の質量電荷比範囲のイオンを質量電荷比毎に検出する。
【0017】
制御・処理部4は、記憶部41の他に、機能ブロックとして、測定制御部51、学習済みモデル作成部52、解析モード選択部53、波形分割部54、判定部55、分類部56、ノイズ値算出部57、ノイズ除去部58、ピーク分離部59、及びベースライン推定部60を有している。記憶部41には、参照波形記憶部42、測定データ記憶部43、及び学習済みモデル記憶部44が設けられている。制御・処理部4の実体はパーソナルコンピュータであり、入力部6と表示部7が接続されている。また、制御・処理部4には予め波形解析プログラムがインストールされている。この波形解析プログラムを実行することにより、学習済みモデル作成部52、解析モード選択部53、波形分割部54、判定部55、分類部56、ノイズ値算出部57、ノイズ除去部58、ピーク分離部59、及びベースライン推定部60の機能が具現化される。
【0018】
参照波形記憶部42には訓練用データ421と検証用データ422が保存されている。訓練用データ421と検証用データ422はいずれも、各種の成分を含有する試料をクロマトグラフ質量分析装置で測定することにより得られたクロマトグラム(例えば、液体クロマトグラフ1で分離された成分を質量分析計2でMSスキャン測定し、検出した全ての質量電荷比のイオンの合計強度の時間変化を表すトータルイオンクロマトグラムや、SIM測定又はMRM測定し、特定の質量電荷比のイオンの強度の時間変化を表すマスクロマトグラム)の波形(元波形)のデータであり、予めピークピッキングによりピークの位置が特定されている。また、これらの元波形のデータは、強度値の所定の範囲内(例えば±1.0)となるように予め規格化されている。規格化により強度スケールが異なる複数のクロマトグラムを共通の強度スケールに統一しておくことで、後述する学習済みモデルの精度を高めることができる。ここでは訓練用データ421と検証用データ422として、実試料の測定により得られたクロマトグラムを用いるが、シミュレーションにより作成したクロマトグラムを用いてもよい。
【0019】
クロマトグラムの元波形は、時間軸方向に所定数の部分元波形に分割されている。この所定数は、例えば1,024や512であり、各部分元波形の幅(時間軸方向の長さ)が少なくともピーク幅よりも小さくなるように定められる。例えば、ピーク幅の大きさと1つのピークを構成するために必要なデータ点数に基づいて定められる。具体的な一例として、実際の測定により得られたクロマトグラムにおける最小のピーク幅が0.2min、最大のピーク幅が2.0minである場合を挙げて説明する。この測定データの取得時と、解析対象のデータ取得時では、分析条件や成分分離に用いるカラムの状態(劣化の程度)が異なる場合がある。そこで、これらの相違を考慮して、最小のピーク幅が0.1minまで狭くなり、また、最大のピーク幅が3.0minまで広くなっても対応可能となるように上記所定数を設定する。ピーク形状の再現性等を考慮した場合、1つのピークに少なくとも20点、より好ましくは30点が含まれる必要がある。これらを踏まえて、クロマトグラムを3.0minの範囲に区切り、また、想定される最小のピーク幅である0.1minの範囲内に30点を含めるように元波形を分割するには、上記所定数を900以上にする必要がある。後述する解析例では、ピーク幅が上記想定よりもさらに広い場合にも対応可能となるよう、クロマトグラムを5.0minの時間範囲で区切り、5.0min/0.1min×20点=1,000(≒1,024)点という計算に基づいて上記所定数を1,024とした。
【0020】
各部分波形データには、当該部分波形の特性に関する情報(特性情報)が対応づけられている。部分元波形に対応づけられる特性情報には、少なくとも、当該部分波形がピーク領域に属するものであるか非ピーク領域に属するものであるかについての情報が含まれている。これ以外の特性情報については後述する。
【0021】
測定データ記憶部43には、クロマトグラフ質量分析装置を用いた試料の測定に使用する各種の測定条件が保存されている。また、試料の測定により得られたクロマトグラムデータが保存される。学習済みモデル記憶部44には、クロマトグラムのピークピッキングを行うための学習済みモデルが保存されている。学習済みモデル記憶部44には、後述する解析モードのそれぞれに対応する学習済みモデルが保存されている。
【0022】
次に、本実施例のクロマトグラフ質量分析システムを用いたクロマトグラムの波形解析方法を説明する。本実施例のクロマトグラフ質量分析システムでは、波形解析プログラムを実行することにより、学習済みモデルの作成とクロマトグラムデータの解析のいずれかを選択することができる。
【0023】
はじめに、学習済みモデルを作成する手順について、
図2のフローチャートを参照して説明する。
【0024】
使用者が学習済みモデルの作成を選択すると、学習済みモデル作成部52は、未学習の学習モデルを準備する(ステップ1)。この学習モデルには、セマンティックセグメンテーションを実行可能な種々のものを用いることができる。セマンティックセグメンテーションは、一般に、二次元的に分布する画素データで構成された画像を解析するために用いられるが、本実施例では、時間軸に沿って一次元的に並ぶデータで構成されるクロマトグラムの波形の解析に適用する。セマンティックセグメンテーションを実行可能な学習モデルとして、例えば、U-Net(非特許文献2参照)、SeGNet、PSPNetなどを用いることができる。本実施例ではU-Netを用いる。
【0025】
続いて、参照波形記憶部42から訓練用データ421と検証用データ422を読み出す(ステップ2)。次に、学習済みモデル作成部52は、学習回数(epoch)iを1に設定し(ステップ3)、学習モデルに訓練用データ421を入力する(ステップ4)。訓練用データ421の部分元波形及び該部分元波形に対応付けられた特性情報に基づき、学習モデルの変数が調整される(ステップ5)。本実施例で学習モデルとして用いるU-Netでは、部分元波形から正しい特性情報が得られるようにニューラルネットワークの重みづけが調整される。訓練用データ421の入力及び学習モデルの変数の調整が終わると、学習回数(epoch)i=1回終了時の学習モデル(i)として記憶部41に保存する(ステップ6)。また、その学習モデル(i)に検証用データ422を入力し、学習モデル(i)が検証用データ422の部分元波形を解析して付与した特性情報の正答率を確認する(ステップ7)。
【0026】
検証用データ422の部分波形に対する正答率を確認した後、iが予め決められた値(例えば100)に達しているかを判定する(ステップ8)。この時点ではi=1であるため、所定値に達していないと判定し(ステップ8でNO)、iに1を足して(i←i+1)(ステップ9)、ステップ4に戻る。ステップ4に戻った後は、iが所定値に達するまで上記同様の処理を繰り返す。そして、iが予め決められた値に達すると(ステップ8でYES)、記憶部41に保存されている複数の学習モデルの中から適切なものを選択し、その学習モデル(i)を学習済みモデルとして学習済みモデル記憶部44に保存して(ステップ10)、一連の処理を終了する。学習済みモデルは、例えば検証データに対する正答率が最も高いことや、過学習が生じていないこと等を基準に選択される。また、上記の予め決められた値は、適切な学習済みモデルの構築が可能な回数よりも大きい値に設定される。そのような値は、例えば過去の学習済みモデルの構築時の例を参照したり、予備的に学習済みモデルを構築したりすることにより決めておくことができる。上記例では学習回毎に学習モデル(i)を記憶部41に保存するものとしたが、予め決められた回数ごとに学習モデル(i)を保存するようにしてもよい。
【0027】
次に、未解析のクロマトグラムの波形を解析する手順について、
図3のフローチャートを参照して説明する。
【0028】
使用者がオートサンプラ14に試料をセットし、測定開始を指示すると、測定制御部51は測定データ記憶部43に保存されている測定条件を読み出し表示部7の画面に表示する。使用者が表示された測定条件から使用するものを選択し(あるいは適宜に変更を加えて)測定開始を指示すると、測定制御部51は試料のクロマトグラフ質量分析を実行してクロマトグラムを取得する。測定制御部51による測定動作は従来同様であるため、詳細な説明を省略する。ここでは測定制御部51による試料の測定によりクロマトグラムを取得する例を説明したが、事前に取得されたクロマトグラムデータを読み込む等によりクロマトグラムデータを取得するようにしてもよい。
【0029】
試料の測定あるいは取得済みデータの読み出しによりクロマトグラムデータを取得した(ステップ11)あと、使用者がクロマトグラムデータの解析を指示すると、解析モード選択部53は、使用者にクロマトグラムデータの解析モードを問い合わせる画面を表示部7に表示する。この画面には、例えば「2クラス出力(ピーク領域/非ピーク領域の分類)」等の解析モードが表示され、使用者が所望のものを選択することにより解析モードが決定される。2クラス出力以外の解析モードについては後述する。
【0030】
使用者により解析モードが選択される(ステップ12)と、波形分割部54は、クロマトグラムの波形(元波形)を予め決められた数の部分波形(部分元波形)に分割する(ステップ13)。但し、各部分元波形の幅(時間軸方向の長さ)が少なくとも、当該クロマトグラムに含まれることが予測されるピークの幅よりも小さくなるように、波形の長さ(クロマトグラフ質量分析の実行時間の長さ)に応じて定める。この分割数は、訓練用データ421や検証用データ422と同数であってもよく、異なる数であってもよい。この分割数も上述した観点で適宜に決めればよく、例えば512や1,024とすることができる。
【0031】
続いて、判定部55は、学習済みモデル記憶部44から使用者に選択された解析モードに対応する学習済みモデルを読み出す(ステップ14)。そして、学習済みモデルに部分元波形を入力する(ステップ15)。学習済みモデルは、入力された部分元波形がピーク領域に属するものであるか否かを判定する(ステップ16)。こうして、各部分元波形に特性情報(ピーク領域に属するものであるか否かの情報)が付される。
【0032】
判定部55による各部分元波形の判定が終了すると、分類部56は、その結果に基づき、特性情報(ピーク領域に属するものであるか否かの情報)に基づいて、部分元波形を分類する(ステップ17)。
【0033】
部分元波形の分類後、ノイズ値算出部57は、非ピーク領域の波形に基づきノイズ値を算出する(ステップ18)。ノイズ値は、例えば非ピーク領域に属する部分元波形の強度の平均値とすることができる。ノイズ除去部58は、算出されたノイズ値を元波形から差し引いてノイズを除去し(ステップ19)、それを表示部7の画面に表示する。
【0034】
次に、実際のクロマトグラムデータを用いて学習済みモデルを作成し、またクロマトグラムの波形解析を行った例(2クラス出力の例)を説明する。この例では、生体からの一次代謝物を含む試料についてクロマトグラフ質量分析を実行することにより、13,359個のクロマトグラムデータを取得し、それらを手動でピークピッキングした。このうち、1,400個のクロマトグラムデータを検証用データに使用した。また、学習済みモデルの正答率を確認するために1,400個のクロマトグラムデータをテストデータとして使用した。それ以外のクロマトグラムデータは訓練用データとして使用した。さらに、学習済みモデルを作成する際の、訓練用データの入力及び検証用データによる正答率の確認回数(上記の予め決められた回数)は60回とし、学習回数が60回目の学習モデルを学習済みモデルとして選択した。
【0035】
図4は学習済みモデルの作成過程での正答率の推移を示すグラフである。
図4の”main/accuracy”は訓練用データ421の正答率、”validation/main/accuracy”は検証用データ422の正答率である。訓練用データ421、検証用データ422ともに、入力回数が増える毎に少しずつ正答率が向上していることが分かる。但し、訓練用データ421と検証用データ422の入力回数が多いほど正答率が向上するわけではなく、入力回数が多くなりすぎると過学習と呼ばれる現象が起こり、正答率が低下する。従って、訓練用データ421と検証用データ422の入力は、正答率の推移を確認しつつ、過学習が生じる前に終了することが好ましい。この学習済みモデルについて、テストデータを用いて2クラス出力の精度を検証したところ、正答率は98%であった。
【0036】
図5は、上記学習済みモデルを用いて元波形を解析した結果である。
図5では、2クラス出力の正解を-1.25(ピーク領域)と-1.5(非ピーク領域)で示し、上記学習済みモデルを用いた判定結果を-1.75(ピーク領域)と-2.0(非ピーク領域)で示している。また、これらを元波形とともに表示している。
図5に示すとおり、クロマトグラムの元波形のピーク領域と非ピーク領域が正しく分類されていることが分かる。
【0037】
上記の解析モード(2クラス出力)は最小数の分類例である。次に、より詳細なクロマトグラムの波形解析を可能とする、いくつかの好ましい付加的構成を説明する。以下に説明する構成は上記実施例と適宜に組み合わせることができる。また、相反する処理を行うものでない限りにおいて、複数の付加的構成を組み合わせることもできる。
【0038】
好ましい付加的構成の1つは、上記2クラス出力にピークの境界の分類を追加した3クラス出力である。この場合には、ピークの境界の位置が既知である訓練用データ421及び検証用データ422(以下、これらをまとめて「参照波形」と呼ぶ。)を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって学習済みモデルを作成しておく。そして、上記2クラス出力における特性情報の1つであるピーク領域を、ピーク境界部と非ピーク境界部(その他)の2つに分類する。
【0039】
クロマトグラフでは、試料に含まれる成分がカラムによって分離されるが、多数の成分を含んだ試料では必ずしも全ての成分を完全に分離することはできない。そのため、クロマトグラム上に複数のピークが重畳したピーク(重畳ピーク)が現れる場合がある。ピークの面積や高さから化合物の濃度や含有量を求める処理は、ピーク間に重なりがないことを前提としている。従って、複数のピークが重なり合っている場合にはピークを分割する処理が必要になる。こうした処理を行う際に、上記3クラス出力とすることにより、簡便にピークを分離することができる。
【0040】
また、上記3クラス出力の構成において、特性情報の1つであるピーク境界部を、ピーク開始点とピーク終了点の2つに分類した4クラス出力の構成を採ることもできる。この場合には、ピークの開始点と終了点の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって学習済みモデルを作成しておく。
【0041】
重畳ピークの分割には、従来、対象ピークの開始点から終了点までを1つのピークとし、そのピーク上にもう1つのピークを重ね合わせた形で2つのピークに分割するテーリング処理、対象ピークの開始点、極小点、及び終了点を順に結んで2つのピークに分離する完全分離、対象ピークの極小点を通る垂線により2つのピークを分離する垂直分割などの方法が用いられている。例えば、特許文献1には、分析者がテーリング処理、完全分離、及び垂直分割のいずれかを選択して所要のパラメータを入力すると自動的にピークピッキングを行うことができるソフトウェアが記載されている。その他、ガウス関数等のモデル関数を用いたフィッティングによりピークを分離する場合もある。
【0042】
上記テーリング処理では、2つのピークの開始点と終了点が、保持時間が短い側から、1つ目のピーク開始点と2つ目のピーク開始点が順に存在し、そのあとに1つ目及び2つ目のピーク終了点が存在する。一方、完全分離や垂直分割では、保持時間が短い側から、1つ目のピーク開始点と終了点が存在し、続いて2つ目のピーク開始点と終了点が存在する。上記4クラス出力の構成では、ピーク境界部がピーク開始点とピーク終了点に区別されるため、使用者がその並びを確認した上で、適切なピーク分割手法を検討することができる。
【0043】
さらに、特性情報の1つであるピーク領域を、重畳ピーク領域と単体ピーク領域に分類した構成を採ることもできる。この場合には、いずれも位置が既知である単体のピークと、複数のピークが重なり合った重畳ピークとを含む参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって学習済みモデルを作成しておけばよい。この構成を採ることにより、ピーク分離が必要な領域を使用者が簡便に判別することが可能となる。
【0044】
さらに、この構成において、重畳ピーク領域を、垂直分割、完全分離、あるいはテーリング処理の3つに分類した5クラス出力構成とすることもできる。この場合には、テーリング処理、完全分離、垂直分割のそれぞれによりピーク分離された重畳ピークを含む参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって学習済みモデルを作成しておけばよい。
【0045】
解析対象のクロマトグラムに含まれる重畳ピークの分割(分離)にどの手法が適しているかは、クロマトグラムに含まれるベースラインのドリフトの形状やピークの形状等によって異なり、使用者の主観が入り込みやすい。上記5クラス出力の構成では、学習済みモデルを用いて自動的に重畳ピークの分割に適した手法を決定することができるため、使用者の主観が入ることなく客観的かつ精度よくピークを分割することができる。
【0046】
図6は上記解析モード(5クラス出力)に使用する学習済みモデルを作成した例である。2クラス出力の例である
図4と同じく、
図6の”main/accuracy”は訓練用データ421の正答率、”validation/main/accuracy”は検証用データ422の正答率である。また、
図4と同様に、この例でも訓練用データ421、検証用データ422ともに、入力回数が増える毎に少しずつ正答率が向上している。この学習済みモデルについて、テストデータを用いて5クラス出力の精度を検証したところ、正答率は97%であった。
【0047】
図7は、上記学習済みモデルを用いてクロマトグラムの元波形を5クラス出力で解析した例である。
図7では、5クラス出力の正解を-1.1(ピーク終了点)、-1.2(ピーク開始点)、-1.3(垂直分割ピーク)、-1.4(単体ピーク)、-1.5(非ピーク領域)で示し、上記学習済みモデルによる出力を-1.6(ピーク終了点)、-1.7(ピーク開始点)、-1.8(垂直分割ピーク)、-1.9(単体ピーク)、-2.0(非ピーク領域)で示している。またこれらを元波形とともに表示している。
図7に示すとおり、クロマトグラムの部分波形が正しく分類されていること分かる。
【0048】
重畳ピークと単体ピークを分類する構成では、また、予め決められたモデル関数を用いたフィッティング(例えばガウスフィッティングや、EMG(Exponential Modified Gaussian)フィッティング)によりピークを分離するように構成することもできる。この場合には、予め使用するモデル関数を記憶部41に保存しておく。また、学習済みモデルによって重畳ピーク領域であると判定された部分について、予め決められたモデル関数によりフィッティングを行ってピークを分離するピーク分離部59を用いる。
【0049】
重畳ピークと単体ピークを分類する構成では、さらに、重畳ピークに含まれるピーク数に応じた分類を追加することができる。この場合には、異なる数のピークが重なり合った複数の重畳ピークを含む参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって学習済みモデルを作成しておけばよい。これにより、重畳ピークに含まれるピーク数を使用者が簡単に把握することができる。
【0050】
上記の好ましい形態は主としてピークの分離に関する分類を追加したものであるが、クロマトグラムに含まれるベースラインを推定する機能を追加しておくとよい。この場合には、非ピーク領域であると判定された部分波形に基づいてベースラインを推定するベースライン推定部60を用いる。ベースライン推定部60は、非ピーク領域の部分波形をモデル関数でフィッティングする等により対象波形全体のベースラインを推定する。これにより、例えば重畳ピークを分離する際に、垂直分割、完全分離、及びテーリング処理のいずれが適しているかの検討に役立てることができる。また、学習済みモデルにより重畳ピークを分類する構成では学習済みモデルによる分類結果の妥当性を使用者が容易に確認することができる。
【0051】
また、上記実施例のクロマトグラフ質量分析装置の制御・処理部4内の機能ブロックに、学習済みモデルによる元波形の分類後にピーク領域の面積を算出するピーク面積値算出部(あるいはピークの高さを算出するピーク高さ算出部)を追加しておくとよい。これにより、当該ピークに対応する成分の定量を簡便に行うことができる。
【0052】
上記実施例はいずれも一例であって、本発明の趣旨に沿って適宜に変更することができる。上記実施例ではクロマトグラフ質量分析システムの一部に組み込んだ構成としたが、クロマトグラフ質量分析装置と独立した波形解析装置として構成することができる。その場合には、クロマトグラフ質量分析装置で予め取得したクロマトグラムデータを読み込んで解析を行えばよい。また、上記実施例ではクロマトグラフ質量分析により得られたクロマトグラムの波形を処理する場合を例に説明したが、質量分析計以外の検出器(分光光度計)を有するクロマトグラフや、ガスクロマトグラフで取得されたクロマトグラムも同様に解析することができる。さらに、解析の対象はクロマトグラムに限定されず、例えば分光光度計による測定で取得された分光スペクトル(波長又は波数軸に対する検出強度の変化を表した波形)についても上記同様に解析することができる。
【0053】
[態様]
上述した複数の例示的な実施形態は、以下の態様の具体例であることが当業者により理解される。
【0054】
(第1項)
本発明の一態様に係る波形解析方法は、
クロマトグラム又は分光スペクトルである対象波形を解析する波形解析方法であって、
ピーク部分の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって、入力される波形に含まれるピーク部分を特定する学習済みモデルを作成し、
前記対象波形を複数の部分波形に分割し、
前記学習済みモデルを使用して前記対象波形の複数の部分波形のそれぞれがピーク部分であるか否かを判定し、
前記判定の結果に基づき、前記対象波形を、前記ピーク部分が連続するピーク領域と、それ以外の非ピーク領域とに分類する
ものである。
【0055】
(第10項)
本発明の別の一態様に係る波形解析装置は、
クロマトグラム又は分光スペクトルである対象波形を解析する波形解析装置であって、
前記対象波形を複数の部分波形に分割する波形分割部と、
ピーク部分の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって作成された学習済みモデルを使用して、前記対象波形の複数の部分波形のそれぞれがピーク部分であるか否かを判定する判定部と、
前記判定部による判定結果に基づき、前記対象波形を、前記ピーク部分が連続するピーク領域と、それ以外の非ピーク領域とに分類する分類部と
を備える。
【0056】
第1項に記載の波形解析方法及び第10項に記載の波形解析装置では、ピーク部分の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって、入力される波形がピーク部分であるか否かを判定する学習済みモデルを予め作成しておく。ここで、学習済みモデルの作成に使用する参照波形は、典型的には対象波形(クロマトグラム又は分光スペクトル)と同種の測定で得られた波形であるが、理論計算などにより作成されたものを用いることもできる。また、参照波形の複数の部分波形は、該参照波形に含まれるピークのピーク幅よりも狭い間隔で分割することにより作成される。こうして、ピークの一部を構成する部分波形についての様々な形状を学習した学習済みモデルが作成される。その後、参照波形の分割時と同様に、対象波形に含まれることが予想されるピークのピーク幅よりも狭い間隔で該対象波形を分割して部分波形を作成する。そして、上記の学習済みモデルを使用し、ピーク部分の位置が未知である対象波形を分割してなる複数の部分波形のそれぞれがピーク部分であるか否かを判定する。これにより、対象波形の複数の部分波形がピーク部分と非ピーク部分に分類され、これに基づいてピーク部分が連続する領域をピーク領域、非ピーク部分が連続する領域を非ピーク領域に分類する。本発明に係る波形解析方法及び波形解析装置では、複数の参照波形の特徴を学習した学習済みモデルを使用することにより対象波形がピーク領域と非ピーク領域に分類するため、煩雑な操作をすることなく高精度でピークピッキングを行うことができる。
【0057】
(第2項)
第1項に記載の波形解析方法において、
前記学習済みモデルが、ピークの境界の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって作成されており、
前記ピーク部分であると判定した部分波形に含まれるピークの境界を特定し、
前記ピーク領域をピーク境界部と非ピーク境界部に分類する。
【0058】
(第11項)
第10項に記載の波形解析装置において、
前記学習済みモデルが、ピークの境界の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって作成されており、
前記判定部が、前記ピーク部分であると判定した部分波形に含まれるピークの境界を特定し、
前記分類部が、前記ピーク領域を、さらに、ピーク境界部と非ピーク境界部に分類する。
【0059】
第2項に記載の波形解析方法及び第11項に記載の波形解析装置では、試料成分の定量等を行う際に、簡便に重畳ピークを分離することができる。
【0060】
(第3項)
第2項に記載の波形解析方法において、
前記学習済みモデルが、ピークの開始点と終了点の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって作成されており、
前記ピークの境界がピークの開始点であるかピークの終了点であるかを判定し、
前記ピーク境界部を、さらに、ピーク開始点とピーク終了点に分類する。
【0061】
(第12項)
第11項に記載の波形解析装置において、
前記学習済みモデルが、ピークの開始点と終了点の位置が既知である参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって作成されており、
前記判定部が、前記ピークの境界がピークの開始点であるかピークの終了点であるかを判定し、
前記分類部が、前記ピークの境界を、さらに、ピーク開始点とピーク終了点に分類する。
【0062】
第3項に記載の波形解析方法及び第12項に記載の波形解析装置では、ピーク境界部がピーク開始点とピーク終了点に区別されるため、使用者がその並びを確認した上で、適切なピーク分割手法を検討することができる。
【0063】
(第4項)
第1項から第3項のいずれかに記載の波形解析方法において、
前記学習済みモデルが、いずれも位置が既知である単体のピークと、複数のピークが重なり合った重畳ピークとを含む参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって作成されており、
前記ピーク部分が連続する領域であるピーク領域に含まれるピークが単体のピークであるか重畳ピークであるかを判定し、
前記ピーク領域を、さらに、単体ピーク領域と重畳ピーク領域に分類する。
【0064】
(第13項)
第10項から第12項のいずれかに記載の波形解析装置において、
前記学習済みモデルが、いずれも位置が既知である単体のピークと、複数のピークが重なり合った重畳ピークとを含む参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって作成されており、
前記判定部が、前記ピーク部分が連続する領域であるピーク領域に含まれるピークが単体のピークであるか重畳ピークであるかを判定し、
前記分類部が、前記ピーク領域を、さらに、単体ピーク領域と重畳ピーク領域に分類する。
【0065】
第4項に記載の波形解析方法及び第13項に記載の波形解析装置では、ピーク分離が必要な領域を使用者が簡便に判別することが可能となる。
【0066】
(第5項)
第4項に記載の波形解析方法において、
前記学習済みモデルが、重畳ピークの開始点から終了点までを1つのピークの領域として該ピークの上に別のピークを重ね合わせた形状に分離するテーリング処理、重畳ピークの開始点、極小点、及び終了点を順に結んだ線によりピークを分離する完全分離、重畳ピークの極小点を通る垂線により2つのピークを分離する垂直分割のそれぞれによりピーク分離された重畳ピークを含む参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって作成されており、
前記重畳ピーク領域に含まれる前記複数のピークの分離に適したものを判定する。
【0067】
(第14項)
第13項に記載の波形解析装置において、
前記学習済みモデルが、重畳ピークの開始点から終了点までを1つのピークの領域として該ピークの上に別のピークを重ね合わせた形状に分離するテーリング処理、重畳ピークの開始点、極小点、及び終了点を順に結んだ線によりピークを分離する完全分離、重畳ピークの極小点を通る垂線により2つのピークを分離する垂直分割のそれぞれによりピーク分離された重畳ピークを含む参照波形を分割することにより作成された複数の部分波形からなる組を複数組用いた機械学習によって作成されており、
前記判定部が、前記重畳ピーク領域に含まれる前記複数のピークの分離に適したものを判定する。
【0068】
第5項に記載の波形解析方法及び第14項に記載の波形解析装置では、学習済みモデルを用いて自動的に重畳ピークの分割に適した手法を決定することができるため、使用者の主観が入ることなく客観的かつ精度よくピークを分割することができる。
【0069】
(第6項)
第4項に記載の波形解析方法において、
予め決められたモデル関数を用いて前記重畳ピーク領域に含まれる前記複数のピークを分離する。
【0070】
(第7項)
第6項に記載の波形解析方法において、
前記重畳ピーク領域に含まれる複数のピークを、ガウスフィッティング又はExponential Modified Gaussianフィッティングにより分離する。
【0071】
(第15項)
第13項に記載の波形解析装置において、さらに、
予め決められたモデル関数を用いて前記重畳ピーク領域に含まれる前記複数のピークを分離するピーク分離部
を備える。
【0072】
(第16項)
第15項に記載の波形解析装置において、
前記ピーク分離部が、ガウスフィッティング又はExponential Modified Gaussianフィッティングによりピークを分離する。
【0073】
第6項又は第7項に記載の波形解析方法及び第15項又は第16項に記載の波形解析装置では、モデル関数により自動的に重畳ピークを分離することができる。
【0074】
(第8項)
第1項から第7項のいずれかに記載の波形解析方法において、
前記非ピーク領域に分類された対象波形に基づいてノイズ値を求める。
【0075】
(第17項)
第10項から第16項のいずれかに記載の波形解析装置において、さらに、
前記非ピーク領域に分類された対象波形に基づいてノイズ値を求めるノイズ値算出部
を備える。
【0076】
第8項に記載の波形解析方法及び第17項に記載の波形解析装置では、対象波形に含まれるノイズ値を自動的に算出することができる。
【0077】
(第9項)
第1項から第8項のいずれかに記載の波形解析方法において、
前記非ピーク領域に分類された対象波形に基づいてベースラインを推定する。
【0078】
(第18項)
第10項から第17項のいずれかに記載の波形解析装置において、さらに、
前記非ピーク領域に分類された対象波形に基づいてベースラインを推定するベースライン推定部
を備える。
【0079】
第9項に記載の波形解析方法及び第18項に記載の波形解析装置では、例えば重畳ピークを分離する際に、垂直分割、完全分離、及びテーリング処理のいずれが適しているかの検討に役立てることができる。また、学習済みモデルにより重畳ピーク領域を分類する構成では学習済みモデルによる分類結果の妥当性を使用者が容易に確認することができる。
【符号の説明】
【0080】
1…液体クロマトグラフ
2…質量分析計
4…制御・処理部
41…記憶部
42…参照波形記憶部
421…訓練用データ
422…検証用データ
43…測定データ記憶部
44…モデル記憶部
51…測定制御部
52…モデル作成部
53…解析モード選択部
54…波形分割部
55…判定部
56…分類部
57…ノイズ値算出部
58…ノイズ除去部
59…ピーク分離部
60…ベースライン推定部
6…入力部
7…表示部
【手続補正書】
【提出日】2023-09-08
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
一次元のデータ列である対象データ列から構成される対象波形を解析する波形解析方法であって、
ピーク部分の位置が既知である参照波形を構成する一次元のデータ列である参照データ列を複数用いた機械学習によって、入力されるデータ列から構成される波形においてピークを構成する部分をセマンティックセグメンテーションにより特定する学習済みモデルを作成し、
前記対象データ列を前記学習済みモデルに入力して前記対象波形においてピークを構成する部分を特定し、
前記対象波形を、前記ピークを構成する部分に対応するピーク領域と、それ以外の非ピーク領域とに分類する、波形解析方法。
【請求項2】
前記学習済みモデルは、前記入力されるデータ列を構成する複数のデータのそれぞれを、前記ピークを構成する部分に属するものと、それ以外のものに分類することにより、該入力されるデータ列から構成される波形においてピークを構成する部分を特定する
ものである、請求項1に記載の波形解析方法。
【請求項3】
前記学習済みモデルは、
前記入力されるデータ列に対する畳み込み処理を行うことにより該入力されるデータ列よりもデータ数を圧縮した第1特徴データ列を生成する第1ダウンサンプリング処理を実行し、
前記第1特徴データ列に対する畳み込み処理を行うことにより該第1特徴データ列よりもデータ数を圧縮した第2特徴データ列を生成する第2ダウンサンプリング処理を実行し、
前記第2特徴データ列に対する転置畳み込み処理を行うことにより前記第1特徴データ列と同じサイズである第1復元データ列を生成する第1アップサンプリング処理を実行し、
前記第1復元データ列に対する転置畳み込み処理を行うことにより前記対象データ列と同じデータサイズである最終復元データ列を生成する第2アップサンプリング処理を実行し、
前記第1アップサンプリング処理では、前記第2特徴データ列を構成する各データを、該第2特徴データ列に圧縮される前の前記第1特徴データ列における位置に対応する前記第1復元データ列の位置に復元し、
前記第2アップサンプリング処理では、前記第1復元データ列を構成する各データを、前記第1特徴データ列に圧縮される前の前記対象データ列における位置に対応する前記最終復元データ列の位置に復元する
ことにより前記入力されるデータ列から構成される波形においてピークを構成する部分を特定する
ものである、請求項1に記載の波形処理方法。
【請求項4】
前記学習モデルは、
前記第1アップサンプリング処理では、前記第1特徴データ列において、前記復元されたデータ以外のデータを0とし、
前記第2アップサンプリング処理では、前記第2特徴データ列において、前記復元されたデータ以外のデータを0とする
ものである、請求項3に記載の波形処理方法。
【請求項5】
前記学習モデルは、U-Net、SeGnet、及びPSPNetのいずれかで構成されている、請求項1に記載の波形処理方法。
【請求項6】
一次元のデータ列である対象データ列から構成される対象波形を解析する波形解析装置であって、
ピーク部分の位置が既知である参照波形を構成する一次元のデータ列である参照データ列を複数用いた機械学習によって作成され、入力されるデータ列から構成される波形においてピークを構成する部分をセマンティックセグメンテーションにより特定する学習済みモデルに前記対象データ列を入力して前記対象波形においてピークを構成する部分を特定し、該対象波形を、前記ピークを構成する部分に対応するピーク領域と、それ以外の非ピーク領域とに分類する分類部と
を備える波形解析装置。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0018
【補正方法】変更
【補正の内容】
【0018】
参照波形記憶部42には訓練用データ421と検証用データ422が保存されている。訓練用データ421と検証用データ422はいずれも、各種の成分を含有する試料をクロマトグラフ質量分析装置で測定することにより得られたクロマトグラム(例えば、液体クロマトグラフ1で分離された成分を質量分析計2でMSスキャン測定し、検出した全ての質量電荷比のイオンの合計強度の時間変化を表すトータルイオンクロマトグラムや、SIM測定又はMRM測定し、特定の質量電荷比のイオンの強度の時間変化を表すマスクロマトグラム)の波形(元波形)のデータであり、予めピークピッキングによりピークの位置が特定されている。また、これらの元波形のデータは、強度値が所定の範囲内(例えば±1.0)となるように予め規格化されている。規格化により強度スケールが異なる複数のクロマトグラムを共通の強度スケールに統一しておくことで、後述する学習済みモデルの精度を高めることができる。ここでは訓練用データ421と検証用データ422として、実試料の測定により得られたクロマトグラムを用いるが、シミュレーションにより作成したクロマトグラムを用いてもよい。