IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立ハイテクサイエンスの特許一覧

特許7581158クロマトグラフのデータ処理装置、およびクロマトグラフ
<>
  • 特許-クロマトグラフのデータ処理装置、およびクロマトグラフ 図1
  • 特許-クロマトグラフのデータ処理装置、およびクロマトグラフ 図2
  • 特許-クロマトグラフのデータ処理装置、およびクロマトグラフ 図3
  • 特許-クロマトグラフのデータ処理装置、およびクロマトグラフ 図4
  • 特許-クロマトグラフのデータ処理装置、およびクロマトグラフ 図5
  • 特許-クロマトグラフのデータ処理装置、およびクロマトグラフ 図6
  • 特許-クロマトグラフのデータ処理装置、およびクロマトグラフ 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-01
(45)【発行日】2024-11-12
(54)【発明の名称】クロマトグラフのデータ処理装置、およびクロマトグラフ
(51)【国際特許分類】
   G01N 30/86 20060101AFI20241105BHJP
【FI】
G01N30/86 B
【請求項の数】 4
(21)【出願番号】P 2021139365
(22)【出願日】2021-08-27
(65)【公開番号】P2023032970
(43)【公開日】2023-03-09
【審査請求日】2024-05-17
(73)【特許権者】
【識別番号】503460323
【氏名又は名称】株式会社日立ハイテクサイエンス
(74)【代理人】
【識別番号】110001427
【氏名又は名称】弁理士法人前田特許事務所
(72)【発明者】
【氏名】伊藤 正人
(72)【発明者】
【氏名】宝泉 雄介
(72)【発明者】
【氏名】福田 真人
【審査官】黒田 浩一
(56)【参考文献】
【文献】特開平4-268451(JP,A)
【文献】特開2006-177980(JP,A)
【文献】国際公開第2016/185552(WO,A1)
【文献】特開2014-134385(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 30/86
G01N 21/00-21/61
G01N 23/00-23/2276
(57)【特許請求の範囲】
【請求項1】
測定対象試料がカラムによって分離され、分離された成分を検出して得られるクロマトグラムのデータ処理を行い、上記分離された成分の量に対応するピーク面積を求めるクロマトグラフのデータ処理装置であって、
得られるピーク面積の正確さ、および再現性の優先程度に応じた指示を受け付け、上記指示に対応する波形処理法を選択する波形処理法選択部と、
選択された波形処理法によって、与えられたクロマトグラムのデータ処理を行い、上記分離された成分についてのピーク面積を求めるピーク面積算出部と、
を有することを特徴とするクロマトグラフのデータ処理装置。
【請求項2】
請求項1のクロマトグラフのデータ処理装置であって、
上記波形処理法は、谷渡り積分法、切り取り法、およびカーブフィッティング法の少なくとも1つを含むことを特徴とするクロマトグラフのデータ処理装置。
【請求項3】
請求項1のクロマトグラフのデータ処理装置と、
試料に含まれる成分を分離して計測するクロマトグラフユニットと、
を備えたクロマトグラフであって、
上記データ処理装置は、ピーク面積の真値が既知の複数のクロマトグラムに基づいて、複数の波形処理方法によってそれぞれ求められたピーク面積の真値からの誤差に応じて、上記波形処理法の選択をすることを特徴とするクロマトグラフ。
【請求項4】
請求項1のクロマトグラフのデータ処理装置と、
試料に含まれる成分を分離して計測するクロマトグラフユニットと、
を備えたクロマトグラフであって、
上記データ処理装置は、上記クロマトグラフユニットにより、同一の試料について得られた複数のクロマトグラムに基づいて、複数の波形処理方法によってそれぞれ求められたピーク面積のばらつきに応じて、上記波形処理法の選択をすることを特徴とするクロマトグラフ。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、液体クロマトグラフなどのクロマトグラフィー技術に関し、特にクロマトグラフのデータ処理装置、およびクロマトグラフに関するものである。
【背景技術】
【0002】
高速液体クロマトグラフィー(HPLC)の分野では、クロマトグラムの解析方法がひとつの開発テーマである。なぜならば、クロマトグラフィー・データ・システム(CDS)は、ピーク面積を時間積分により計算するわけだが、その結果の正確性や安定性に課題があるからである。従来法は、クロマトグラムの時間微分係数に基づき、ピークの特徴点を見出す。それは、例えば、頂点、始点、終点、谷のバレー点、肩状の変曲点などである。これらの微分特徴点から特徴点へ、クロマトグラムからピーク波形をちょうど鋏で直線的に切り取るように面積を求める(例えば、特許文献1参照。)。あるいは、実測クロマトグラムに対し、正規分布関数(Gaussian)などに類するピーク様波形をカーフフィッティング法により当てはめる方法が採用されている(例えば、特許文献2参照。)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2020-153864号公報
【文献】特開2006-177980号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
素朴には、より正しい波形処理を目指したり、より安定性の高い波形処理を考案したりするわけだが、本発明の課題は少し狙いが異なっている。本願発明者は、ピーク面積を正確に求めることに優れている波形処理法と、再現性良くピーク面積を計算する波形処理法がそれぞれ存在しうることに気が付いた。その観点に立てば、それぞれの最適化を検討することができるはずである。
【0005】
即ち、目的に合った波形処理法を選択することに観点を移す。ここで言う目的とは、(1)ピーク面積の正確さの向上、(2)ピーク面積の再現性の向上である。また(1)の一環とも考えられるが(3)正しい重なりピークの分解などがある。発明の課題は、ピーク面積を正確に計算する方法をユーザに提供することであり、あるいは、ユーザに再現性の良好な波形処理方法を提供することである。そして、この2つの選択肢をそれぞれユーザに提供することができる。このため、本発明が高次(超)の観点に立つ波形処理法であるとしてメタ波形処理と呼ぶこともできる。
【課題を解決するための手段】
【0006】
上記の目的を達成するため、本発明は、
測定対象試料がカラムによって分離され、分離された成分を検出して得られるクロマトグラムのデータ処理を行い、上記分離された成分の量に対応するピーク面積を求めるクロマトグラフのデータ処理装置であって、
得られるピーク面積の正確さ、および再現性の優先程度に応じた指示を受け付け、上記指示に対応する波形処理法を選択する波形処理法選択部と、
選択された波形処理法によって、与えられたクロマトグラムのデータ処理を行い、上記分離された成分についてのピーク面積を求めるピーク面積算出部と、
を有することを特徴とする。
【0007】
これにより、ユーザが、ピーク面積を正確に求めること重視するか、または再現性良くピーク面積を計算することを重視するかや、正確さと再現性との兼ね合いなどの優先程度に応じた指示をすることによって、波形処理法を直接的に選択しなくても、適切な波形処理法が選択されてピーク面積が求められる。
【0008】
なお、ピーク面積は成分の量に対応するものであり、ピーク面積としてピーク高さを使用することも含む。
【発明の効果】
【0009】
本発明によれば、正確性に優れた波形処理法や再現性が良好な波形処理法を選択することなどが容易にできる。
【図面の簡単な説明】
【0010】
図1】クロマトグラフの概略構成を示すブロック図である。
図2】波形処理法の例を示す説明図である。
図3】波形処理法の例を示す説明図である。
図4】波形処理法の例を示す説明図である。
図5】クロマトグラムの表示例を示す説明図である。
図6】処理結果の表示例を示す表である。
図7】他のクロマトグラフの概略構成を示すブロック図である。
【発明を実施するための形態】
【0011】
(クロマトグラフ100の概略構成)
クロマトグラフ100は、図1に示すように、試料中の成分をカラムにより分離させて、クロマトグラムデータを生成するクロマトグラフユニット110と、生成されたクロマトグラムデータを波形処理して、分離された成分の量に対応するピーク面積を求めるデータ処理装置120とを備えている。
【0012】
上記データ処理装置120には、後述するように、所定のサンプル試料についてクロマトグラフユニット110により得られたクロマトグラムデータや、クロマトグラムデータ入力、生成部130により外部から入力されたり所定のデータ処理によって生成されたりしたクロマトグラムデータに対して、複数種類の波形処理法によりそれぞれ得られるピーク面積の正確さや再現性の評価指標を求めて記憶するとともに、クロマトグラフ100のユーザによる指示に応じて波形処理法を選択する波形処理法学習、選択部121が設けられている。上記複数種類の波形処理法としては、例えば、ピーク谷からの垂直分割法(図2)や、変曲点等からの接線分割法(図3)、ガウシアンなどカーブフィッティングによる重なりピークの分解法を利用した処理法(図4)などが例示される。
【0013】
データ処理装置120には、また、実際の試料についてクロマトグラフユニット110により得られた、例えば図5に示すようなクロマトグラムデータに対して、上記波形処理法学習、選択部121によって選択された波形処理法による波形処理を行い、分離された成分の量に対応するピーク面積を求めるピーク面積算出部122が設けられている。求められたピーク面積は、例えば図5に示すようなクロマトグラムの波形などと共に、図6に示すような表形式などで表示部123に表示されるようになっている。ここで、特に限定されないが、クロマトグラムが表示される際には、図5に示すように、適用された波形処理法や信頼度スコアなどが併せて表示されるなどしてもよい。上記信頼度スコアは、選択した波形処理法Xi、および成分によって異なるが、未知試料の各実測データにおいては全て共通のスコアを示す。例えば、図5図6の信頼度スコアは、算出されたピーク面積から95%信頼区間の両端までの差異の大きい方を百分率で表した指標である。他に危険率やzスコアなど数理統計学上の指標を表示することもできる。
【0014】
上記のようなクロマトグラフ100によれば、以下に詳述するように、ユーザが、ピーク面積を正確に求めること重視するか、または再現性良くピーク面積を計算することを重視するかを指示することによって、波形処理法を直接的に選択しなくても、適切な波形処理法が選択されてピーク面積が求められる。
【0015】
(本実施形態の要点)
以下、本実施形態の要点となる事項について羅列的に説明する。
【0016】
(1)ユーザは、波形処理法を選択する基準として、上記のようにピーク面積の正確さ、または再現性を基準として指定することが可能である。より具体的には、ユーザインターフェースとして、(a)ピーク面積再現性の向上、または(b)ピーク面積の正確さの向上のような選択をできる。
【0017】
(2)複数の波形処理法に対し、ピーク面積の正確さ、または再現性の評価基準に基づきスコアづけされて、適切な波形処理法が選択される。
【0018】
(3)ユーザによって、ピーク面積の正確さ、または再現性の一方だけが指定された場合、上記スコアにより最適な波形処理法が選択される。
【0019】
(4)ユーザによって、ピーク面積の正確さ、および再現性の両方が指定された場合には、総合スコアにより最適な波形処理法が選択される。
【0020】
(5)ピーク面積の正確性についてのスコア付けがされる場合には、多様なクロマトグラムが波形処理法学習、選択部121に入力される。実データもシミュレーションデータも適用可能であるが、その正確性は既知でなければならない。Gaussian様ピーク形状を用いるカーブフィッティング法を利用するなど、重なりピークのピーク面積比率を評価したピーク面積の算出についても同様である。
【0021】
(6)ピーク面積の再現性についてのスコア付けがされる場合には、ほぼ同一の複数のクロマトグラムが入力される。実データもシミュレーションデータも適用可能である。
【0022】
(7)なお、データ処理装置120の具体的な形態としては、スタンドアローンのクロマトグラフ100(CDS)への機能搭載、またはサーバーPCに処理を依頼するネットワークサービスであってもよい。
【0023】
(8)上記のような処理はAIやビッグデータ活用に好適だが、手動でも実施可能である。
【0024】
(波形処理法学習、選択部121に入力されるクロマトグラムデータと波形処理法の評価(学習)について)
波形処理法学習、選択部121に入力される複数のクロマトグラムには一般的な例と個別の特殊例がある。
【0025】
(1)再現性評価用には、実測した繰返し注入データ(複数)
(2)実測の複数サイズのピークを合算合成したデータ(対象:一成分)
(3)複数分析種の既知サイズのピークを重ね描きしたデータ(対象:複数成分)
(4)乱数を用いて生成した上記3種類のシュミレーションデータ(モンテカルロ法)
これらは、いずれも意図的に合成等しているため、真値が既知であり、正確性評価ができる(教師データになる)。
【0026】
上記のようなクロマトグラムデータについて、種々の波形処理法、例えば、谷渡り積分法や、2階微分係数まで考慮する切取り法、Gaussian様ピーク形状を用いるカーブフィッティング法を利用したピーク面積の算出など、によって、ピーク面積を求め、それぞれの波形処理法でのばらつきや真値からの誤差などを求めることにより、スコア付けがされる。
【0027】
上記のような探索結果として得られる最適解の例としては、例えば次の波形処理法が選択される。
【0028】
(1)正確性が高い波形処理法としては、例えば波形処理法(図2)の2階微分係数まで考慮する切取り法(鋏と天秤のインテグレーション)、またはGaussian様ピーク形状を用いるカーブフィッティング法(図3)を利用したピーク面積の算出
(2)再現性が高い波形処理法としては、例えば波形処理(図4)の谷渡り積分法
上記のようにして、得られるピーク面積の正確さ、および再現性の何れを優先させるかの指示に対応する波形処理法が求められることにより、ユーザが優先させたい目標を指示することによって適切な波形処理方法による処理が行われる。
【0029】
(各波形処理法と処理パラメータについて)
波形処理法の正確さや再現性を評価(学習)する波形処理法学習、選択部121の処理工程と処理パラメータについて説明する。
【0030】
(1)波形処理法学習、選択部121がクロマトグラフユニット110やクロマトグラムデータ入力、生成部130からクロマトグラムデータを複数枚取り込む。
【0031】
(2)波形処理法学習、選択部121が各波形処理法のスコアを求め、最良スコアを得るものを選択する。その際の処理パラメータとしては、例えば暫定自動パラメータやデフォルトなどのパラメータを用いる。各成分の微分係数に関するパラメータにはノイズ閾値、スロープ閾値、2階微分係数に基づくショルダー閾値、SN比、ピーク・バレー比などがある。カーブフィッティング法に基づく各成分ピークのパラメータには、保持時間の初期値、ピーク幅に関する標準偏差、テーリングピークの非対称性に関する時定数などがある。
【0032】
(3)最良スコアの波形処理法について、パラメータを逐次変化させて同様にスコアを求め、評価基準に則り、最良スコアを得る最適なパラメータを逐次設定する。
【0033】
(4)波形処理法学習、選択部121は、その最適化パラメータを決定し、記憶する。
【0034】
(5)ここで、上記スコアの算出には、複数のクロマトグラムデータと、それぞれの既知の真値が用いられる。
【0035】
上記のようにして最適化パラメータが決定されると、以降、ユーザは未知試料に対し、上記最適化済みパラメータを設定した当該波形処理法を指定することができる。
【0036】
なお、上記のように暫定自動パラメータなどによって最適な波形処理法を決定した後に処理パラメータの最適化をするのに限らず、各波形処理法と複数種類のパラメータとの組み合わせについて、それぞれスコアを求めて、最適な波形処理法とパラメータとの組み合わせを直接求めるようにしてもよい。
【0037】
(「ピーク面積の再現性を高くする基準」および「ピーク面積を正確に測定する基準」についてのより詳しい説明)
複数の波形処理法から最適なものを選択するために、次のような基準を用いてスコア評価することができる。「ピーク面積の再現性を高くする基準」および「ピーク面積を正確に測定する基準」を事例として挙げる。
【0038】
1. ピーク面積の再現性を高くする基準
1.1. 分析法のバリデーションとして、定量値またはピーク面積の相対標準偏差RSD(%)により繰返し再現性を計算する。すなわち、同一の試料について得られた複数のクロマトグラムに基づいて、各波形処理方法で求められたピーク面積のばらつきに応じて、再現性が高い波形処理方が選択される。RSDが小さなほうが望ましい訳だが、同じクロマトグラムを統計処理しても波形処理法により、また、その設定パラメータにより結果が異なることをしばしば経験する。ユーザはパラメータを調節して再現性を高くする場合もある。
【0039】
なお、複数成分の場合、夫々の成分a,b,c…に1つずつRSDが計算され、例えば各RSDの平方和が全成分の総合的なスコアになる。あるいは、RSDの中から最大のRSD、関数max(各RSD)を選び出し、総合的なRSDにすることもできる。また、目的によっては逆の関数min(RSDa,RSDb,RSDc,…)もあり得る。
【0040】
1.2. 本発明は、この評価指標のRSDを、波形処理法を選択する基準にしようとするものである。前述の取り、RSDはパラメータにも依存する訳だから、波形処理法A,B,Cのパラメータを変化させたものをそれぞれA1,A2,…,B1,B2などと呼び分ける。波形処理法XとパラメータiのセットXiからそれぞれのRSDを算出し、最小のRSDを得るセットを選択できる。
【0041】
1.3. 例えばB2が選ばれた場合、さらにそのパラメータの近傍でパラメータをチューニングすることもできる。
【0042】
1.4. このRSDの変動要因を推定すれば、各波形処理法がSN比に依存していることが考えられる。この場合のSN比とは、ピーク高さとベースラインノイズの比率を意味する。例えば1mgのピーク場合はSN比が十分大きく、波形処理法の差異は大きくないが、1μgの場合は、SN比の影響を受け、波形処理法の応答性能に差異が生ずることが想定される。一例であるが、SN比の大きい場合と小さい場合、2つの群のクロマトグラムデータを複数枚準備して、RSDをそれぞれ算出する。SN比の程度に影響されない波形処理法を選択する。即ち前者にほぼ優劣がなければ、後者の難しい題材でも良好なRSDを出力する波形処理法を選択する。この準備は、実際の試料を注入してクロマトグラムを準備してもよいが、一般にシミュレーションでノイズをいろいろ異ならせて複数のクロマトグラムを作るなどして用いるほうが簡便である。
【0043】
1.5. 他のRSDの変動要因としては、ピークが孤立していないケースが想定される。孤立していれば、波形処理法の優劣はさほど付かないと考えられる。孤立ピークでない場合は、ピークのスタート点、エンド点が見出しがたく、RSDへの影響度が波形処理法により左右される。ベースラインが水平直線でない場合も、別の事象として難しい。これらの難しいクロマトグラムを複数枚入力にして、波形処理法の耐久性をRSDにより評価する方法は本発明にとって有効な手段である。
【0044】
2. ピーク面積を正確に測定する基準
2.1. 前述の通り、SN比が十分大きく、孤立ピークで、ベースラインが水平直線であれば、ピーク面積を正確に算出することに関しても波形処理法にさほどの優劣がない。課題は、それらの何れかがそうでない場合、即ちSN比が小さいか、隣接するピークが存在するか、またはベースラインが傾いていたり曲線であったりする場合にも、より正確にピーク面積が得られる波形処理法はどれかである。
【0045】
2.2. この場合は、真値が既知のクロマトグラムデータを用いて評価する。すなわち、各波形処理法が、ピーク面積既知のクロマトグラムを波形処理して、ピーク面積を算出する。真値と算出結果が近いほうが優位な波形処理法として選択される。前述の通り、各波形処理法はパラメータとセットのXiと呼び分ける。
【0046】
2.3. 例えば、ピーク面積の真値をAtとし、算出されたピーク面積をAcとして、│Ac-At│/Atの絶対値(%)をスコアとして小さい方を良好と判断する評価基準である。これは比率の比較であるが、ピーク面積の絶対値│Ac-At│ (V・s)を比較するほうがAtの大小に影響を受けないため、正確さの評価には望ましい場合も考えられる。すなわち後者の絶対値比較は、比較的小さなピークで│Ac-At│の乖離が一定程度あっても、大きなピークでひとつでも乖離が大きいと、良好でないと判定される評価法になる。
【0047】
また、例えば、ある波形処理法Xがあって、複数枚のクロマトグラムi=1,2,…を入力することにより、ある成分aに関して、ピーク面積の誤差a1,a2,a3…が積み上がる。一般的には平方和が用いられる。
【0048】
単純に成分aのみならず、b,c,…と総合的に評価する場合は、例えばa群の誤差の平方和とb群の誤差の平方和とが次々と合算されると大きいピークの方が相対的に強調されて評価される。そのような場合、小さいピークから大きいピークまでより公平に正確性を評価したい場合には、例えば各誤差を真値で除した誤差率のような指標で評価することが好ましい。その場合、a1,a2,a3…b1,b2,b3…c1,c2,c3…の誤差率の平方和をもって評価することになる。
【0049】
2.4. ピーク面積の真値が既知である入力用重なりピークのクロマトグラムは、次のようないくつかの方法により入手できる。
【0050】
2.4.1. 濃度既知の複数成分を各所定量で混合して得た実測クロマトグラム
2.4.2. 濃度既知の単一成分のクロマトグラムをそれぞれ実測し、数値データ化する。次に、各成分をそれぞれ任意の量に縦軸方向の伸縮で換算し、各クロマトグラムを合成することにより、1枚のクロマトグラムを生成する。同様の操作を繰り返し、複数枚の合成クロマトグラムを入手する。ピーク面積の真値は合成過程から既知である。本法は半実測の合成クロマトグラムと呼べる。
【0051】
2.4.3. 乱数を用いてシミュレーションで生成するモンテカルロ法もある。まず成分a,b,…の単一ピークのクロマトグラムをガウシアンにより生成する。1.0μgなど単位量に相当するEMG(Exponentially Modified Gaussian)を用いてもよい。次に乱数により決定した配合量を縦軸方向に換算し、最終的に1枚のクロマトグラムに合成する。ノイズやドリフト成分も乱数的に加算できる。本モンテカルロ型クロマトグラムも合成過程が既知なので、ピーク面積の真値がわかっている。モンテカルロ型クロマトグラムだけは、横軸の時間軸方向にも乱数が効かせられる特徴がある。即ち、保持時間も乱数的に変化させられて、それでもピーク面積の真値が既知である。但し、ある一定時間よりは2成分を近接させないとか、ピーク面積比は100:1以上にするなど生成時のルール化は設けることが一般に好ましい。
【0052】
2.5. 100枚、1,000枚と多くのクロマトグラムデータを入力する場合には、いちいち実測するのは困難なことも考えられるので、その点では、半実測の合成クロマトグラムか、モンテカルロ型クロマトグラムは有利である。
【0053】
2.6. 波形処理法学習、選択部121は、次の通り動作する。
【0054】
2.6.1. 各波形処理法は、暫定的に自動設定されたパラメータを用い、これを自動パラメータ0と表記する。波形処理法学習、選択部121が入力クロマトグラムデータを複数枚取り込み、A0,B0,…の中で乖離スコアが最小になるものを選択する。この複数枚のクロマトグラムとそのピーク面積の真値を用いる探索法が、波形処理法の1次スクリーニングである。
【0055】
2.6.2. 次に選ばれた波形処理法、例えば、B法のパラメータをB0,B1, B2…と逐次変化させる。波形処理法学習、選択部121は、さらに乖離スコアが最小になる波形処理法を実験計画法の手法を用いてBnを探索する。これが2次スクリーニングである。
【0056】
2.6.3. その最適化パラメータ法Bnを用いて、以降、波形処理法学習、選択部121は、ユーザによってピーク面積の正確さを優先させる指示がなされた場合には、未知試料の解析はBn法で処理するようにピーク面積算出部122に指示する。
【0057】
(その他の事項)
なお、得られるピーク面積の正確さ、および再現性の優先程度に応じた指示に対応する波形処理法としては、最高スコアの波形処理法が決定されるのに限らず、正確さのスコアおよび/または再現性のスコアが所定の関係を満たす範囲で決定されるなどしてもよい。具体的には、例えば正確さが所定の閾値以上の波形処理法のうちで再現性が最も高い波形処理法が決定されたり、逆に例えば再現性が所定の閾値以上の波形処理法のうちで正確さが最も高い波形処理法が決定されたりするようにしてもよい。また、正確さや再現性が所定の閾位置以上の波形処理法が複数ある場合に、それらを候補としてユーザに提示して、その中からユーザが選択できるようにしてもよい。
【0058】
また、上記のように波形処理法を用いてピーク面積を求めるのに代えて、機械学習によって、クロマトグラムデータから直接的にピーク面積やピーク面積比率を得られるようにしてもよい。すなわち、例えば図7に示すように、例えばニューラルネットワーク等を用いたピーク面積算出モデル140に、クロマトグラムデータと、既知のピーク面積とを入力して、その対応関係をいわゆる教師あり学習として機械学習させておけば、その機械学習結果と、実際に計測されたクロマトグラムデータに基づいてピーク面積を求めることができる。
【0059】
教師あり学習の簡単な事例として、2つの重なりピークのピーク面積比率を求める問題を示す。入力層に複数枚のクロマトグラムを入力して、出力層にその前方のピークの正解の面積比率を教師データとして示す。本入力データは2次元の画像データではなく、一筆描きの時系列データ(時刻ごとの信号強度を示す数値データ)である。予め、前方に後方のピーク面積比率を加算すれば1となるように定義しておく。入力層に提示する多様なクロマトグラムは前述の通りシミュレーションで形成したものでよく、1万枚以上が望ましい。シミュレーションで形成しているため、当然、正解の面積比率も既知である。所謂、ディープラーニングでは、ニューラルネットワークに著しく多層の中間層を設定する。複数のクロマトグラムとそれに対応する教師データを何枚も割り当てることにより、ニューラルネットワーク中の重み係数をチューニングする。このチューニングにはバックプロパゲーションの技術が使用される。また、必要に応じて、畳み込みニューラルネットワークの技術も前処理に使用可能である。一旦、手に入れたこの重み係数群を用いて、未知の重なりピークのクロマトグラムを入力し、ピーク面積比率を出力することができる。この処理が正に重なりピークの分解である。厳密に言えば、この面積比率を獲得する機能は、ピーク面積自体を求めている訳ではない。あくまで比率である。このため、ピーク面積に換算するためには、トータルのピーク面積を必要とする。即ち、2つのピークをまとめてベースラインを引き、その合計としてのトータルのピーク面積は、別に計算しておくことに本例のアイデアがある。また、このニューラルネットワークを用いる手法では、2つのピークがどのように重なっているかについては全く答えられない場合があることも特徴である。この点でカーブフィッティング法と大きく異なる。
【0060】
本発明を2つのピークを3つ、4つとピークの数を増やすことも考えられるが、適用性は徐々に難しくなる。そもそも隠れたピークの本数が不明な場合があり、人間は試行錯誤で本数を推定することになる。ディープラーニングに本数の推定まで学習させることも可能だが、新たな課題でもある。また、ピーク面積比率を求めるばかりではなく、シミュレーションクロマトグラムを用いて、ピーク面積を直接求める教師あり学習もありえる。教師あり学習により高い正確性が得られることが期待できる。
【0061】
一方、高い再現性を得るために強化学習を含む機械学習の利用が期待される。例えば、ある鋏と天秤のインテグレーション法の最適なパラメータを探索する課題で、ピーク面積の相対標準偏差RSDを評価指標にして、RSDを最小化するように最適なパラメータを探索していく方法である。この場合の入力は、実測された複数枚の未知のクロマトグラムでよい。通常は、予め決定されたパラメータで鋏と天秤のインテグレーションを実行するわけだが、本例では評価指標たるRSDを最小化するようにパラメータを探索するアイデアである。このように得られた最適化パラメータを用いて、ピーク面積を計算することになる。
【符号の説明】
【0062】
100 クロマトグラフ
110 クロマトグラフユニット
120 データ処理装置
121 波形処理法学習、選択部
122 ピーク面積算出部
123 表示部
130 クロマトグラムデータ入力、生成部
140 ピーク面積算出モデル
図1
図2
図3
図4
図5
図6
図7