(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024112717
(43)【公開日】2024-08-21
(54)【発明の名称】波形形状学習装置、方法およびプログラム、並びに、モデル関数推定装置
(51)【国際特許分類】
G01N 30/86 20060101AFI20240814BHJP
【FI】
G01N30/86 B
G01N30/86 Q
G01N30/86 G
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023017965
(22)【出願日】2023-02-08
(71)【出願人】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】100108523
【弁理士】
【氏名又は名称】中川 雅博
(74)【代理人】
【識別番号】100125704
【弁理士】
【氏名又は名称】坂根 剛
(74)【代理人】
【識別番号】100187931
【弁理士】
【氏名又は名称】澤村 英幸
(72)【発明者】
【氏名】野田 陽
(57)【要約】
【課題】測定データの精度のよい学習により波形データの生成モデルを構築することを課題とする。
【解決手段】分析装置において得られた試料の測定データMDを用いて、試料の波形を学習する波形形状学習装置1,1A,1Bであって、記憶装置16に保存された測定データMDを読み出し、測定データMDから入力データYを抽出する抽出部22と、入力データYを入力とし、入力データYを特徴づける潜在変数Zを出力する潜在変数生成部23と、潜在変数Zを入力として波形データWDを出力し、波形データWDを記憶装置16に保存する波形データ生成部24と、記憶装置16に保存された入力データYおよび波形データWDを損失関数により比較する比較部25と、損失関数の出力を最小化させるように、潜在変数生成部23および波形データ生成部24を最適化する学習部26とを備える。
【選択図】
図2
【特許請求の範囲】
【請求項1】
分析装置において得られた試料の測定データを用いて、前記試料の波形を学習する波形形状学習装置であって、
記憶装置に保存された前記測定データを読み出し、前記測定データから入力データを抽出する抽出部と、
前記入力データを入力とし、前記入力データを特徴づける潜在変数を出力する潜在変数生成部と、
前記潜在変数を入力として波形データを出力し、前記波形データを前記記憶装置に保存する波形データ生成部と、
前記記憶装置に保存された前記入力データおよび前記波形データを損失関数により比較する比較部と、
前記損失関数の出力を最小化させるように、前記潜在変数生成部および前記波形データ生成部を最適化する学習部と、
を備える、波形形状学習装置。
【請求項2】
前記潜在変数生成部および前記波形データ生成部は、ニューラルネットワークを含む、請求項1に記載の波形形状学習装置。
【請求項3】
前記波形データ生成部に前記波形データの次元数を指定する時間ステップ数が与えられ、前記波形データ生成部は、前記潜在変数および前記時間ステップ数を入力として、前記波形データを出力する、請求項1または請求項2に記載の波形形状学習装置。
【請求項4】
前記潜在変数生成部は、前記潜在変数が特定の分布となるよう制約を与える、請求項1または請求項2に記載の波形形状学習装置。
【請求項5】
前記波形データ生成部は、前記波形データの波形に単峰性制限を与える、請求項1または請求項2に記載の波形形状学習装置。
【請求項6】
前記潜在変数生成部は、前記入力データとして、前記測定データから抽出した時系列データおよび/または前記時系列データの特徴量を入力し、前記比較部は、前記時系列データおよび/または前記時系列データの特徴量と、前記波形データおよび/または前記波形データの特徴量とを比較する、請求項1または請求項2に記載の波形形状学習装置。
【請求項7】
前記潜在変数生成部は、前記入力データとして、前記測定データから取得したピーク特徴量または前記ピーク特徴量の元となるモーメントを入力する、請求項1または請求項2に記載の波形形状学習装置。
【請求項8】
請求項1または請求項2に記載の波形形状学習装置において学習された前記波形データ生成部を用いて、推定対象の測定データのモデル関数を推定するモデル関数推定装置であって、
前記波形データ生成部は、事前分布として与えられた前記潜在変数に基づいて前記波形データを出力し、
前記潜在変数を最適化させることにより、前記波形データを前記推定対象の測定データにフィッティングさせる、モデル関数推定装置。
【請求項9】
分析装置において得られた試料の測定データを用いて、前記試料の波形を学習する方法であって、
記憶装置に保存された前記測定データを読み出し、前記測定データから入力データを抽出する工程と、
前記入力データを入力とし、前記入力データを特徴づける潜在変数を出力する潜在変数生成工程と、
前記潜在変数を入力として波形データを出力し、前記波形データを前記記憶装置に保存する波形データ生成工程と、
前記記憶装置に保存された前記入力データおよび前記波形データを損失関数により比較する工程と、
前記損失関数の出力を最小化させるように、前記潜在変数生成工程および前記波形データ生成工程を最適化する工程と、
を含む、波形形状学習方法。
【請求項10】
分析装置において得られた試料の測定データを用いて、前記試料の波形を学習するプログラムであって、
前記プログラムは、コンピュータに、
記憶装置に保存された前記測定データを読み出し、前記測定データから入力データを抽出する処理、
前記入力データを入力とし、前記入力データを特徴づける潜在変数を出力する潜在変数生成処理、
前記潜在変数を入力として波形データを出力し、前記波形データを前記記憶装置に保存する波形データ生成処理、
前記記憶装置に保存された前記入力データおよび前記波形データを損失関数により比較する処理、
前記損失関数の出力を最小化させるように、前記潜在変数生成処理および前記波形データ生成処理を最適化する処理、
を実行させる、波形形状学習プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分析装置で取得された測定データの波形を学習する技術、および、その学習された装置を用いて測定データにフィッティングさせるモデル関数を推定する技術に関する。
【背景技術】
【0002】
液体クロマトグラフ、ガスクロマトグラフ、質量分析装置などの分析装置から得られた測定データには、試料のピークが観測される。例えば、下記特許文献1においては、測定データに含まれる波形にモデル関数をフィッティングすることで、試料のピーク位置、ピーク面積などが求められる。また、下記特許文献2においては、敵対的生成モデルを用いることにより、ピーク波形を示すモデル関数を生成可能としている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】国際公開2016/035167号公報
【特許文献2】国際公開2021/210228号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献2に開示された手法により、実測された測定データを利用した機械学習が行われ、波形データの生成モデルを構築可能である。さらに、精度よく測定データを学習する手法が実現されることにより、より利便性の高い生成モデルの構築が可能となることが期待される。
【0005】
本発明の目的は、測定データを適正に学習することにより利便性の高い波形データの生成モデルを構築することを課題とする。
【課題を解決するための手段】
【0006】
本発明の一局面に従う波形形状学習装置は、分析装置において得られた試料の測定データを用いて、試料の波形を学習する波形形状学習装置であって、記憶装置に保存された測定データを読み出し、測定データから入力データを抽出する抽出部と、入力データを入力とし、入力データを特徴づける潜在変数を出力する潜在変数生成部と、潜在変数を入力として波形データを出力し、波形データを記憶装置に保存する波形データ生成部と、記憶装置に保存された入力データおよび波形データを損失関数により比較する比較部と、損失関数の出力を最小化させるように、潜在変数生成部および波形データ生成部を最適化する学習部とを備える。
【0007】
本発明の他の局面に従うモデル関数推定装置は、波形形状学習装置において学習された波形データ生成部を用いて、推定対象の測定データのモデル関数を推定するモデル関数推定装置であって、波形データ生成部は、事前分布として与えられた潜在変数に基づいて波形データを出力し、潜在変数を最適化させることにより、波形データを推定対象の測定データにフィッティングさせる。
【0008】
本発明は、また、波形形状学習方法および波形形状学習プログラムに向けられている。
【発明の効果】
【0009】
本発明によれば、測定データを適正に学習することにより利便性の高い波形データの生成モデルを構築することができる。
【図面の簡単な説明】
【0010】
【
図1】本実施の形態に係る波形形状学習装置(モデル関数推定装置)の構成図である。
【
図2】実施の形態に係る波形形状学習装置の機能ブロック図である。
【
図3】第1の実施の形態に係る波形形状学習装置の処理の流れを示すブロック図である。
【
図4】第2の実施の形態に係る波形形状学習装置の処理の流れを示すブロック図である。
【
図5】第3の実施の形態に係る波形形状学習装置の処理の流れを示すブロック図である。
【
図6】第1の実施の形態に係る波形形状学習方法を示すフローチャートである。
【
図7】第2の実施の形態に係る波形形状学習方法を示すフローチャートである。
【
図8】第3の実施の形態に係る波形形状学習方法を示すフローチャートである。
【
図9】ピーク形状を含む学習用の測定データを示す図である。
【
図10】GANにより学習された生成モデルを用いて生成された波形データを示す図である。
【
図11】GANにより学習されたモード崩壊を起こした生成モデルを用いて生成された波形データを示す図である。
【発明を実施するための形態】
【0011】
次に、添付の図面を参照しながら本発明の実施の形態に係る波形形状学習装置、波形形状学習方法、波形形状学習プログラムおよびモデル関数推定装置について説明する。
【0012】
{1.波形形状学習装置の構成}
図1は、実施の形態に係る波形形状学習装置1の構成図である。本実施の形態の波形形状学習装置1は、モデル関数推定装置としても機能する。
図1は、第1~第3の実施の形態に共通の構成である。波形形状学習装置1は、液体クロマトグラフ、ガスクロマトグラフまたは質量分析装置などの分析装置3(
図2参照)において得られた試料の測定データMDを取得する。
【0013】
本実施の形態の波形形状学習装置1は、パーソナルコンピュータなどのコンピュータにより構成されている。波形形状学習装置1は、
図1に示すように、CPU(Central Processing Unit)11、RAM(Random Access Memory)12、ROM(Read Only Memory)13、操作部14、ディスプレイ15、記憶装置16、通信インタフェース(I/F)17、デバイスインタフェース(I/F)18を備える。
【0014】
CPU11は、波形形状学習装置1の全体制御を行う。RAM12は、CPU11がプログラムを実行するときにワークエリアとして使用される。ROM13には、各種データ、プログラムなどが記憶される。操作部14は、ユーザによる入力操作を受け付ける。操作部14は、キーボードおよびマウスなどを含む。ディスプレイ15は、波形形状など各種の情報を表示する。記憶装置16は、ハードディスクなどの記憶媒体である。記憶装置16には、プログラムP1、測定データMD、入力データY、潜在変数Z、時間ステップ数Tおよび波形データWDが記憶される。
【0015】
通信インタフェース17は、他のコンピュータとの間で有線または無線による通信を行うインタフェースである。デバイスインタフェース18は、CD、DVD、半導体メモリなどの記憶媒体19にアクセスするインタフェースである。
【0016】
{2.装置の機能構成}
図2は、実施の形態に係る波形形状学習装置1の機能構成を示すブロック図である。
図2は、第1~第3の実施の形態に共通の構成である。
図2において、制御部20は、CPU11がRAM12をワークエリアとして使用しつつ、プログラムP1を実行することにより実現される機能部である。制御部20は、取得部21、抽出部22、潜在変数生成部23、波形データ生成部24、比較部25および学習部26を備える。つまり、取得部21、抽出部22、潜在変数生成部23、波形データ生成部(デコーダ)24、比較部25および学習部26は、プログラムP1の実行により実現される機能部である。言い換えると、各機能部21~26は、CPU11が備える機能部とも言える。
【0017】
取得部21は、分析装置3において試料を測定することにより取得された測定データMDを取得する。取得部21は、例えば、通信インタフェース17を介して液体クロマトグラフ、ガスクロマトグラフ、質量分析装置などの分析装置3や、他のコンピュータから測定データMDを入力する。あるいは、取得部21は、デバイスインタフェース18を介して、記憶媒体19に保存された測定データMDを取得する。取得部21は、取得した測定データMDを記憶装置16に保存する。
【0018】
抽出部22は、測定データMDから入力データYを抽出する。入力データYは、学習対象となるデータである。入力データYは、測定データMDからピーク部分の波形を抽出した時系列データである。学習に使用する入力データYとしては、SN比が極端に低いピークや分離が不充分であるピークを除去し、波形形状が良好であるピークを抽出することが好ましい。
【0019】
潜在変数生成部23は、エンコーダ231およびサンプリング部232を備える。潜在変数生成部23は、入力データYを入力し、潜在変数Zを出力する。エンコーダ231は、機械学習により学習されるニューラルネットワークとして構成される。エンコーダ231は、潜在空間上の特徴量として分布情報を出力する。分布情報は、例えば、エンコーダ231の出力を正規分布として特徴付ける平均値、分散である。この場合、エンコーダ231は、平均値と分散の2次元のデータを出力するニューラルネットワークである。
【0020】
サンプリング部232は、エンコーダ231の出力である潜在空間上の特徴量から潜在変数Zをサンプリングする。潜在空間が正規分布として特徴付けられる場合、サンプリング部232は、正規分布に基づく確率で乱数としての潜在変数Zを出力する。潜在変数Zは、通常、入力データYよりも低次元のデータとされる。例えば、200次元の時系列データである入力データYが、4次元などの低次元の潜在変数Zに次元削減される。
【0021】
波形データ生成部24は、潜在変数Zを入力し、波形データWDを出力する。波形データ生成部24は、入力データYに似たデータを生成する目的で構築されるニューラルネットワークである。波形データWDは、入力データYと同次元数の時系列データである。例えば、入力データYが200次元の時系列データである場合、波形データWDも200次元の時系列データとして出力される。
【0022】
比較部25は、入力データYと波形データWDとを比較する。比較部25は、損失関数(ロス関数)を用いて、入力データYと波形データWDの誤差を出力する。比較部25は、例えば、損失関数により入力データYと波形データWDの平均二乗誤差を求める。学習部26は、比較部25から出力された損失関数の値に基づき、誤差逆伝搬法、確率的勾配降下法などの手法により、エンコーダ231および波形データ生成部24を学習する。つまり、損失関数の値を最小化するように、ニューラルネットワークとして構成されるエンコーダ231および波形データ生成部24のパラメータ(重み)が更新される。
【0023】
プログラムP1は、記憶装置16に保存されている場合を例として説明する。他の実施の形態として、プログラムP1は、記憶媒体19に保存されて提供されてもよい。CPU11は、デバイスインタフェース18を介して記憶媒体19にアクセスし、記憶媒体19に保存されたプログラムP1を、記憶装置16またはROM13に保存するようにしてもよい。あるいは、CPU11は、デバイスインタフェース18を介して記憶媒体19にアクセスし、記憶媒体19に保存されたプログラムP1を実行するようにしてもよい。あるいは、CPU11は、通信インタフェース17を介してネットワーク上のサーバに保存されたプログラムP1をダウンロードしてもよい。あるいは、CPU11は、通信インタフェース17を介してネットワーク上のサーバに保存されたプログラムP1を実行してもよい。
【0024】
{3.第1の実施の形態}
次に、
図3および
図6を参照しながら、第1の実施の形態に係る波形形状学習装置1について説明する。
図3は、第1の実施の形態に係る波形形状学習装置1の処理の流れを示す図である。
図6は、第1の実施の形態に係る波形形状学習方法を示すフローチャートである。
図6のフローチャートで示される処理は、
図1に示したCPU11により実行される処理である。つまり、これらの処理は、CPU11がRAM12などのハードウェア資源を利用しつつプログラムP1を動作させることにより、
図2に示す各機能部21~26によって実行される処理である。
【0025】
図6のフローチャートを参照する。ステップS11において、抽出部22は、記憶装置16に保存された測定データMDを読み出し、測定データMDから入力データYを抽出する。抽出部22は、入力データYを記憶装置16に保存する。
【0026】
次に、ステップS12において、潜在変数生成部23は、入力データYを入力とし、入力データYを特徴づける潜在変数Zを出力する。具体的には、エンコーダ231が、入力データYから、潜在空間の分布情報を出力し、サンプリング部232が、潜在空間の分布情報から潜在変数Zをサンプリングする。
【0027】
次に、ステップS13において、波形データ生成部24は、潜在変数Zを入力として波形データWDを出力する。波形データ生成部24は、生成した波形データWDを記憶装置16に保存する。
【0028】
次に、ステップS14において、比較部25は、記憶装置16に保存された入力データYおよび波形データWDを損失関数を用いて比較する。比較部25は、損失関数により、同じ次元数の時系列データである入力データYと波形データWDとの間の誤差を求める。
【0029】
次に、ステップS15において、学習部26は、比較部25から出力された損失関数の出力を最小化させるように、潜在変数生成部23および波形データ生成部24を最適化する。学習部26は、例えば、誤差伝搬法を用いることにより、ニューラルネットワークとして構成されるエンコーダ231および波形データ生成部24のパラメータを調整する。以上の処理により、波形形状学習装置1における学習処理が完了する。
【0030】
{4.第2の実施の形態}
次に、
図4および
図7を参照しながら、第2の実施の形態に係る波形形状学習装置1Aについて説明する。
図4は、第2の実施の形態に係る波形形状学習装置1Aの処理の流れを示す図である。
図7は、第2の実施の形態に係る波形形状学習方法を示すフローチャートである。
図4に示すように、波形データ生成部24には、潜在変数Zと合わせて時間ステップ数Tが入力される。時間ステップ数Tは、入力データYと波形データWDの次元数を揃えるための値である。
【0031】
図7のフローチャートを参照する。ステップS21およびステップS22の処理は、
図6におけるステップS11およびステップS12と同様であるので、説明を省略する。
【0032】
次に、ステップS23において、波形データ生成部24は、潜在変数Zおよび時間ステップ数Tを入力として波形データWDを出力する。時間ステップ数Tの指定により、波形データ生成部24は、次元数Tの時系列データとして波形データWDを出力する。波形データ生成部24は、時間ステップ数Tにより、出力する波形データWDの次元数を可変とすることができる。波形データ生成部24は、生成した波形データWDを記憶装置16に保存する。
【0033】
ステップS24およびステップS25の処理は、
図6におけるステップS14およびステップS15と同様であるので、説明を省略する。以上の処理により、波形形状学習装置1Aにおける学習処理が完了する。第2の実施の形態における波形形状学習装置1Aにおいて学習された波形データ生成部24は、時間ステップ数Tの設定により、任意の次元数の時系列データとして、波形データWDを出力可能である。
【0034】
{5.第3の実施の形態}
次に、
図5および
図8を参照しながら、第3の実施の形態に係る波形形状学習装置1Bについて説明する。
図5は、第3の実施の形態に係る波形形状学習装置1Bの処理の流れを示す図である。
図8は、第3の実施の形態に係る波形形状学習方法を示すフローチャートである。
図5に示すように、波形データ生成部24は、パラメータ生成部241、時間歪み関数生成部242およびピーク関数生成部243を備える。時間歪み関数生成部242には、パラメータA,θと合わせて時間ステップ数Tが入力される。時間ステップ数Tは、入力データYと波形データWDの次元数を揃えるための値である。
【0035】
パラメータ生成部241は、潜在変数Zを入力し、パラメータA,θを出力するニューラルネットワークである。パラメータA(Z),θ(Z)は、時間歪み関数を定義するためのパラメータである。パラメータ生成部241は、パラメータA(Z)として、N個のパラメータA(Z)_1,A(Z)_2・・・A(Z)_Nを、パラメータθ(Z)として、N個のパラメータθ(Z)_1,θ(Z)_2・・・θ(Z)_Nを出力する。
【0036】
時間歪み関数生成部242は、パラメータA(Z)、θ(Z)および時間ステップ数Tを入力し、時間歪み関数D(t,Z)を出力する演算部である。時間歪み関数生成部242は、時間歪み関数D(t,Z)を、以下の式1により算出する。
【0037】
D(t,Z)=ΣA_i(Z)*f_i(t,θ_i(Z)) ・・・ (式1)
【0038】
式1において、i=1,2,・・・,Nであり、iは、時間歪み関数D(t,Z)を構成するシグモイド関数のインデックスである。f_i(*)は、シグモイド関数を示す。f_i(t,θ_i(Z))におけるtは、時間ステップ数Tにおいて決定される次元数に対応する時間である。例えば、時間ステップ数Tとして200次元が指定された場合、t=0,1,・・・,199であり、f_i(t,θ_i(Z))は、200次元の時系列データとなる。式1で求まる時間歪み関数D(t,Z)は、N個のシグモイド関数が加算された関数であり、個々のシグモイド関数f_i(*)は、パラメータA_i(Z),θ_i(Z)により、その形状が特徴付けられる。時間歪み関数D(t,Z)は、単調増加関数である。
【0039】
ピーク関数生成部243は、時間歪み関数生成部242において算出された時間歪み関数D(t,Z)に基づいて、以下の式2を演算することにより、波形データWDを示す関数F(t,Z)を求める。
【0040】
F(t,Z)=A(Z)*exp(-D(t,Z)2) ・・・ (式2)
【0041】
式2において、A(Z)は、ピーク高さを示す。D(t,Z)は単調増加関数であるので、exp(-D(t,Z)2)は、ピーク波形を表す。つまり、関数F(t,Z)には、単峰性制限が与えられる。
【0042】
図8のフローチャートを参照する。ステップS31およびステップS32の処理は、
図6におけるステップS11およびステップS12と同様であるので、説明を省略する。
【0043】
次に、ステップS33において、波形データ生成部24は、潜在変数Zおよび時間ステップ数Tを入力とし、単峰性制限が与えられた波形データWDを出力する。時間ステップ数Tの指定により、波形データWDのデータの次元数はTとなる。波形データ生成部24は、時間ステップ数Tにより、出力する波形データWDの次元数を可変とすることができる。波形データ生成部24は、生成した波形データWDを記憶装置16に保存する。
【0044】
ステップS34およびステップS35の処理は、
図6におけるステップS14およびステップS15と同様であるので、説明を省略する。以上の処理により、波形形状学習装置1Bにおける学習処理が完了する。第3の実施の形態における波形形状学習装置1Bにおいて学習された波形データ生成部24は、時間ステップ数Tの設定により、任意の次元数の時系列データとして、波形データWDを出力可能である。第3の実施の形態における波形形状学習装置1Bは、波形データWDに単峰正制限を与えることができる。
【0045】
{6.モデル関数推定装置}
次に、本実施の形態に係るモデル関数推定装置について説明する。モデル関数推定装置は、上述した各実施の形態の波形形状学習装置1,1A,1Bにおいて学習された波形データ生成部24を備えて構成される。波形形状学習装置1,1A,1Bを、モデル関数推定装置として利用することもできる。この場合、波形形状学習装置1,1A,1Bは、モデル関数推定装置として機能するために、ベイズ推定などを実行する推定部をさらに備える。モデル関数推定装置において、波形データ生成部24に適当な潜在変数Zを与えることで、波形データWDを生成することが可能である。
【0046】
例えば、分析装置3から別途取得された推定対象の測定データMDにモデル関数をフィッティングさせる方法について説明する。まず、波形データ生成部24に適当な潜在変数Zを与え、波形データWDを生成する。モデル関数推定装置は、ベイズ推定や最小二乗法を利用することで、推定対象の測定データMDに波形データ生成部24から出力された波形データWDをフィッティングさせる。ベイズ推定を用いる場合、波形データ生成部24に与える潜在変数Zを事前分布とすることができる。
【0047】
上述したように、第2および第3の実施の形態においては、波形データ生成部24は、時間ステップ数Tの設定により、任意の次元数の時系列データとして、波形データWDを出力可能である。これにより、第2および第3の実施の形態により学習された波形データ生成部24は、任意の次元数の時系列データである波形データWDを生成することができるので、ピークフィッティングする上で利便性が高い。
【0048】
GAN(敵対的生成ネットワーク)を利用した生成モデルによっても、任意の潜在変数を与えることで、波形データを生成することが可能である。しかし、GANを利用したモデルは、学習過程においてモード崩壊を起こすという問題がある。例えば、
図9で示すような学習用の測定データを用いる場合を例に挙げる。
図9で示す学習データは、テーリングの度合いの異なる16個のピーク波形からなる。
図10は、GANによる学習が比較的良好に実行された生成モデルにより生成された波形データを示す。
図10で示す波形データは、学習された生成モデルに対して、潜在変数として、正規分布でサンプリングした100個のデータを与えることで、生成されたデータである。これに対して、
図11は、モード崩壊を起こしたGANにより学習された生成モデルにより生成された波形データを示す。
図11で示す波形データも、同様に、学習された生成モデルに対して、潜在変数として、正規分布でサンプリングした100個のデータを与えることで、生成されたデータである。
図11では、モード崩壊により偏った学習がされているため、生成された波形データが学習データの一部だけに追従している。これに対して、本実施の形態の波形形状学習装置1,1A,1Bによれば、GANのようなモード崩壊を起こさないため、学習データを正しく反映した生成モデルを構築可能である。
【0049】
{7.実施の形態の変形例}
波形形状学習装置1,1A,1Bがモデル関数推定装置として機能する場合を例に説明した。それ以外の実施例として、学習済みの波形形状学習装置1,1A,1Bから波形データ生成部24を抽出することで、モデル関数推定装置を、別の装置として構成してもよい。この場合、モデル関数推定装置は、波形データ生成部24に加えて、ベイズ推定などを実行する推定部を備えていればよい。
【0050】
上記の各実施の形態においては、潜在変数生成部23が入力する入力データYとして、測定データMDからピーク部分を抽出したデータを利用した。つまり、入力データYとして、波形を表す時系列データを用いた。その他の実施の形態として、入力データYとして、波形を表す時系列データから算出される各種の特徴量を利用してもよい。この場合、比較部25は、潜在変数生成部23に入力された時系列データの特徴量と、波形データ生成部24から出力される波形データWDの特徴量とを比較する。あるいは、潜在変数生成部23に、波形を表す時系列データに加えて、時系列データの特徴量を入力するようにしてもよい。
【0051】
望ましくは、入力データYに、サビツキーゴーレイフィルタにより求めた平滑化微分または平滑化2次微分などの拡張された特徴量を含めることで、より安定した学習が見込まれる。また、ピーク形状の幅、尖度、歪度などを算出できる特徴量としてモーメントを算出し、入力データYに、それらの特徴量を含めるようにしてもよい。特にモーメントのように時間方向に積分する特徴量を用いる場合は、入力データYおよび波形データWDのデータ点数(ベクトル次元数)に異存しないネットワークを構築可能であるという利点がある。同様に、エンコーダ231に関しても、時系列データ(波形)から直接的に潜在変数Zの分布を作成するのではなく、モーメントなどのピーク特徴量から潜在変数分布を作成してもよい。
【0052】
第2、第3の実施の形態においては、波形データWDの次元数を指定するための時間ステップ数Tを波形データ生成部24に与えた。直接的に次元数を指定する値を示す以外にも、波形データWDの次元を決定できるような時間ステップ数Tに相当するような情報を与えるようにしてもよい。
【0053】
上記の各実施の形態においては、単峰性制限を与えるために、シグモイド関数を加算することにより時間歪み関数D(t,Z)を生成した。他の例として、シグモイド関数以外にも単調性のある関数を利用可能である。あるいは、時間歪み関数D(t,Z)の各時刻における傾きを正の値として出力する微分時間歪み関数dD(t,Z)を生成したのちに、数値積分を行うことでD(t,Z)を算出してもよい。あるいは、時間歪み関数D(t,Z)の傾きβと、各時刻における正値の傾き変化率dd(t,Z)を利用してもよい。
【0054】
エンコーダ231および波形データ生成部(デコーダ)24については、比較部25における比較処理のために、時間軸方向の点数を揃えておけば、一般的なニューラルネット全般が利用可能である。また、Deep Set等を用いて任意の長さの波形に対応させてもよい。
【0055】
本実施の形態の波形形状学習装置1,1A,1Bは、VAE(Variational Autoencoder)に似た構造を有している。学習に際してVAEでは一般にはZの分布をKL距離等を用いて制御する。上記の実施の形態において、より好ましくはZが多次元正規分布になるよう設定する。これにより波形データ生成部24は正規分布を波形分布に変換する関数として利用でき、ピークフィッティングをベイズ推論で解く際のピーク形状事前分布として用いることができる。また、通常のVAEの損失関数では、入力データと、直接対応する変換後の波形データとを比較するが、実際の学習においてはバッチごとの学習を行っており、平均的な勾配に対して学習を行う。そこで、上記の実施の形態において、入力データYの各特徴量の分布が波形データWDの分布と一致するようにそのバッチ毎の統計的特徴量を一致させるような損失関数を定めても良い。また、VAEによる分布生成は、Zを特定分布形状にする際のKL距離の計算上のテクニックとして活用されるほか、Zの変化と損失関数の出力値との変化の関係が滑らかに繋がることも意図している。したがって本実施の形態の装置を潜在変数生成部23を持たないオートエンコーダとして実装し、別途Zと損失関数の関係を滑らかにする制約を持たせる実装も考えられる。
【0056】
上記の実施の形態においては、プログラムP1は、波形形状学習方法およびモデル関数推定方法を実行可能である場合を例に説明した。つまり、プログラムP1は、波形形状学習プログラムおよびモデル関数推定プログラムを含む場合を例に説明した。別の実施の形態として、モデル関数推定方法を実行するプログラムを波形形状学習プログラムとは別のプログラムとしてもよい。
【0057】
{8.態様}
上述した複数の例示的な実施の形態は、以下の態様の具体例であることが当業者により理解される。
【0058】
(第1項)
一態様に係る波形形状学習装置は、
分析装置において得られた試料の測定データを用いて、前記試料の波形を学習する波形形状学習装置であって、
記憶装置に保存された前記測定データを読み出し、前記測定データから入力データを抽出する抽出部と、
前記入力データを入力とし、前記入力データを特徴づける潜在変数を出力する潜在変数生成部と、
前記潜在変数を入力として波形データを出力し、前記波形データを前記記憶装置に保存する波形データ生成部と、
前記記憶装置に保存された前記入力データおよび前記波形データを損失関数により比較する比較部と、
前記損失関数の出力を最小化させるように、前記潜在変数生成部および前記波形データ生成部を最適化する学習部と、
を備える。
【0059】
測定データを適正に学習することにより利便性の高い波形データの生成モデルを構築することができる。
【0060】
(第2項)
第1項に記載の波形形状学習装置において、
前記潜在変数生成部および前記波形データ生成部は、ニューラルネットワークを含んでもよい。
【0061】
ニューラルネットワークが最適化されることにより、生成モデルが構築可能である。
【0062】
(第3項)
第1項または第2項に記載の波形形状学習装置において、
前記波形データ生成部に前記波形データの次元数を指定する時間ステップ数が与えられ、前記波形データ生成部は、前記潜在変数および前記時間ステップ数を入力として、前記波形データを出力してもよい。
【0063】
波形データ生成部により生成する波形データの次元数を指定可能である。
【0064】
(第4項)
第1項または第2項に記載の波形形状学習装置において、
前記潜在変数生成部は、前記潜在変数が特定の分布となるよう制約を与えてもよい。
【0065】
波形データを入力データの近傍とすることができる。
【0066】
(第5項)
第1項または第2項に記載の波形形状学習装置において、
前記波形データ生成部は、前記波形データの波形に単峰性制限を与えてもよい。
【0067】
波形データとしてピーク波形を生成可能である。
【0068】
(第6項)
第1項または第2項に記載の波形形状学習装置において、
前記潜在変数生成部は、前記入力データとして、前記測定データから抽出した時系列データおよび/または前記時系列データの特徴量を入力し、前記比較部は、前記時系列データおよび/または前記時系列データの特徴量と、前記波形データおよび/または前記波形データの特徴量とを比較してもよい。
【0069】
学習の効果を向上させることができる。
【0070】
(第7項)
第1項または第2項に記載の波形形状学習装置において、
前記潜在変数生成部は、前記入力データとして、前記測定データから取得したピーク特徴量または前記ピーク特徴量の元となるモーメントを入力してもよい。
【0071】
学習の効果を向上させることができる。
【0072】
(第8項)
第1項または第2項に記載の波形形状学習装置において学習された前記波形データ生成部を用いて、推定対象の測定データのモデル関数を推定するモデル関数推定装置であって、
前記波形データ生成部は、事前分布として与えられた前記潜在変数に基づいて前記波形データを出力し、
前記潜在変数を最適化させることにより、前記波形データを前記推定対象の測定データにフィッティングさせてもよい。
【0073】
測定データにフィッティングさせる波形データを生成可能である。
【0074】
(第9項)
他の態様に係る波形形状学習方法は、
分析装置において得られた試料の測定データを用いて、前記試料の波形を学習する方法であって、
記憶装置に保存された前記測定データを読み出し、前記測定データから入力データを抽出する工程と、
前記入力データを入力とし、前記入力データを特徴づける潜在変数を出力する潜在変数生成工程と、
前記潜在変数を入力として波形データを出力し、前記波形データを前記記憶装置に保存する波形データ生成工程と、
前記記憶装置に保存された前記入力データおよび前記波形データを損失関数により比較する工程と、
前記損失関数の出力を最小化させるように、前記潜在変数生成工程および前記波形データ生成工程を最適化する工程と、
を含む。
【0075】
測定データを適正に学習することにより利便性の高い波形データの生成モデルを構築することができる。
【0076】
(第10項)
他の態様に係る波形形状学習プログラムは、
分析装置において得られた試料の測定データを用いて、前記試料の波形を学習するプログラムであって、
前記プログラムは、コンピュータに、
記憶装置に保存された前記測定データを読み出し、前記測定データから入力データを抽出する処理、
前記入力データを入力とし、前記入力データを特徴づける潜在変数を出力する潜在変数生成処理、
前記潜在変数を入力として波形データを出力し、前記波形データを前記記憶装置に保存する波形データ生成処理、
前記記憶装置に保存された前記入力データおよび前記波形データを損失関数により比較する処理、
前記損失関数の出力を最小化させるように、前記潜在変数生成処理および前記波形データ生成処理を最適化する処理、
を実行させる。
【0077】
測定データを適正に学習することにより利便性の高い波形データの生成モデルを構築することができる。
【符号の説明】
【0078】
1…装置、11…CPU、12…RAM、13…ROM、14…操作部、15…ディスプレイ、16…記憶装置、21…取得部、22…抽出部、23…潜在変数生成部、24…波形データ生成部、25…比較部、26…学習部、P1…プログラム、MD…測定データ、Y…入力データ、Z…潜在変数、T…時間ステップ数、WD…波形データ