(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025021597
(43)【公開日】2025-02-14
(54)【発明の名称】データ解析システム及びコンピュータプログラム
(51)【国際特許分類】
G01N 30/86 20060101AFI20250206BHJP
G01N 30/34 20060101ALI20250206BHJP
【FI】
G01N30/86 G
G01N30/86 D
G01N30/34 Z
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023125407
(22)【出願日】2023-08-01
(71)【出願人】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】110003993
【氏名又は名称】弁理士法人野口新生特許事務所
(74)【代理人】
【識別番号】100205981
【弁理士】
【氏名又は名称】野口 大輔
(72)【発明者】
【氏名】川瀬 智裕
(72)【発明者】
【氏名】河井 遥範
(57)【要約】 (修正有)
【課題】分析条件の予測式の信頼性を判断するための材料を提供する。
【解決手段】複数の分析結果の実測値をそれぞれ対応するグラジエント条件と関連付けて分析データとして記憶する分析データ記憶部2、分析条件から分析結果の予測値を算出するための予測式の基礎となるモデル式を記憶するモデル式記憶部4、分析データ、及びモデル式を用いて演算処理を行なうデータ処理部6を備える。データ処理部6は、分析データ記憶部2に記憶されている分析結果の実測値を、モデル式記憶部4に記憶されているモデル式に適用することにより試料についての予測式を生成するように構成された予測式生成部10を備える。さらに、予測式生成部10により生成された予測式を用いて算出される2以上の分析条件それぞれの分析結果の予測値と分析結果の実測値との相関関係を示す相関データを生成するように構成された相関データ生成部12を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
複数の分析条件をそれぞれ使用して実行して得られた複数の分析結果の実測値をそれぞれ対応する前記分析条件と関連付けて分析データとして記憶する分析データ記憶部と、
分析条件を変数として含み、分析条件から分析結果の予測値を算出するための予測式の基礎となるモデル式を記憶するモデル式記憶部と、
前記分析データ記憶部に記憶されている前記分析データ、及び前記モデル式記憶部に記憶されている前記モデル式を用いて演算処理を行なうデータ処理部と、を備え、
前記データ処理部は、
前記分析データ記憶部に記憶されている前記複数の分析結果の実測値をそれぞれ対応する前記分析条件とともに前記モデル式記憶部に記憶されている前記モデル式に適用することにより前記試料についての前記予測式を生成するように構成された予測式生成部と、
前記予測式生成部により生成された前記予測式を用いて算出される2以上の分析条件のそれぞれの前記分析結果の予測値と前記分析結果の実測値との相関関係を示す相関データを生成するように構成された相関データ生成部と、を備えている、データ解析システム。
【請求項2】
前記相関データは、互いに交差する2つの軸の一方を前記分析条件ごとの前記分析結果の実測値の軸、他方を前記分析条件ごとの前記分析結果の予測値の軸とする2次元グラフを含む、請求項1に記載のデータ解析システム。
【請求項3】
前記相関データは、前記複数の分析条件についての前記分析結果の実測値と前記分析結果の予測値との乖離度を加味した前記予測式の信頼性情報を含む、請求項1に記載のデータ解析システム。
【請求項4】
前記分析結果は、前記試料に含まれる各成分の保持時間を含む、請求項1に記載のデータ解析システム。
【請求項5】
前記分析結果は、前記試料に含まれる各成分のピーク幅を含む、請求項1に記載のデータ解析システム。
【請求項6】
ディスプレイをさらに備え、
前記データ処理部は、前記相関データ生成部により生成された前記相関データを前記ディスプレイに表示するように構成されている、請求項1に記載のデータ解析システム。
【請求項7】
前記2以上の分析条件は前記複数の分析条件以外の分析条件を含む、請求項1に記載のデータ解析システム。
【請求項8】
コンピュータに導入することにより請求項1から7のいずれか一項に記載のデータ解析システムを構築するように構成されたコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、試料についての最適なグラジエント分析の探索等に使用されるデータ解析システム及びコンピュータプログラムに関するものである。
【背景技術】
【0002】
ある試料について液体クロマトグラフィ分析の分析メソッド(移動相流量、カラム温度、グラジエント条件等の分析条件のセット)を開発する場合、ユーザ自身が、グラジエント条件などの分析条件が互いに異なる複数の分析メソッドを作成し、各分析メソッドを使用して試料の分析を実行して得られたクロマトグラムのうち各ピークが最も分離しかつ各ピーク成分の溶出が早い分析メソッドを探索するという作業を行なうことが一般的である。
【0003】
一方で、対象試料の分析に最適な分析条件の探索を補助するためのソフトウェアも存在する。そのようなソフトウェアは、複数の分析条件で対象試料の分析を行なって取得したクロマトグラムから、分析条件と分析結果(保持時間及びピーク幅))との相関関係を示す予測式を対象試料中の成分ごとに作成し、作成した成分ごとの予測式に基づいて対象試料の分析に最適な分析条件を予測してユーザに提示するという機能を有する。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】Weiqiang Hao, et.al.,Computer aided optimization of multilinear gradient elution in liquid chromatography,Journal of Chromatography A,Volume 1635,2021,461754,ISSN 0021-9673,
【非特許文献2】P.J. Schoenmakers, et.al., Gradient selection in reversed-phase liquid chromatography J. Chromatogr., 149 (C) (1978), pp. 519-537
【非特許文献3】M.A. Quarry, et.al., Prediction of precise isocratic retention data from two or more gradient elution runs. Analysis of some associated errors Anal. Chem., 58 (4) (1986), pp. 907-917
【非特許文献4】S.R. Gallant, et.al., Modeling gradient elution of proteins in ion-exchange chromatography AIChE J, 42 (9) (1996), pp. 2511-2520
【非特許文献5】J.J. Baeza-Baeza, et.al., Approaches to model the retention and peak profile in linear gradient reversed-phase liquid chromatography J. Chromatogr. A, 1284 (2013), pp. 28-35
【非特許文献6】U.D. Neue, et.al., Peak compression in reversed-phase gradient elution J. Chromatogr. A, 1111 (2006), pp. 32-39
【非特許文献7】Weiqiang Hao, et.al., Influence of the pre-elution of solute in initial mobile phase on retention time and peak compression under linear gradient elution, Journal of Chromatography A,Volume 1618,2020,460858,ISSN 0021-9673,
【非特許文献8】H. Poppe, et.al., Peak width in solvent-programmed chromatography I. General description of peak broadening in solvent-programmed elution J. Chromatogr., 204 (1981), pp. 77-84
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記のソフトウェアによる最適な分析条件の予測において、予測式の作成に使用される分析条件と分析結果によっては、信頼性の高い予測式が作成される場合もあれば信頼性の低い予測式が作成される場合もある。信頼性の低い不正確な予測式に基づいて対象試料の分析に最適な分析条件の予測を行なうと、実際には適当でない分析条件が最適な分析条件として予測される可能性があり、予測された分析条件で分析を行なってもユーザの期待したクロマトグラムが得られる可能性も低い。逆に、信頼性の高い正確な予測式に基づいて対象試料の分析に最適な分析条件の予測を行えば、予測された分析条件が実際に最適である可能性が高く、予測された分析条件で分析を行なえばユーザの期待したクロマトグラムが得られる可能性も高い。
【0006】
しかし、作成された予測式が信頼性の高いものであるのか低いものであるのかを判断する材料がなく、対象試料の分析に最適であると予測された分析条件が実際に最適であるのか否かをユーザが判断することは困難であった。
【0007】
本発明は、上記問題に鑑みてなされたものであり、予測式の信頼性を判断するための材料をユーザに提供できるようにすることを目的とする。
【課題を解決するための手段】
【0008】
本発明に係るデータ解析システムは、
複数の分析条件をそれぞれ使用して実行して得られた複数の分析結果の実測値をそれぞれ対応する前記分析条件と関連付けて分析データとして記憶する分析データ記憶部と、
分析条件を変数として含み、分析条件から分析結果の予測値を算出するための予測式の基礎となるモデル式を記憶するモデル式記憶部と、
前記分析データ記憶部に記憶されている前記分析データ、及び前記モデル式記憶部に記憶されている前記モデル式を用いて演算処理を行なうデータ処理部と、を備え、
前記データ処理部は、
前記分析データ記憶部に記憶されている前記複数の分析結果の実測値をそれぞれ対応する前記分析条件とともに前記モデル式記憶部に記憶されている前記モデル式に適用することにより前記試料についての前記予測式を生成するように構成された予測式生成部と、
前記予測式生成部により生成された前記予測式を用いて算出される2以上の分析条件それぞれの前記分析結果の予測値と前記分析結果の実測値との相関関係を示す相関データを生成するように構成された相関データ生成部と、を備えている。
【発明の効果】
【0009】
本発明に係るデータ解析システムによれば、予測式を用いて算出される分析条件ごとの分析結果の予測値と分析結果の実測値との相関関係を示す相関データが生成されるので、生成された相関データを予測式の信頼性を判断するための材料とすることができる。これにより、予測式の信頼性を判断するための材料をユーザに提供できる。
【図面の簡単な説明】
【0010】
【
図1】データ解析システムの構成の一実施例を示すブロック図である。
【
図2】信頼性情報を表示する画面の一例を示す図である。
【
図3】同実施例において実施されるデータ解析処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、図面を参照しながらデータ解析システムの一実施例について説明する。
【0012】
データ解析システム1は、コンピュータプログラムがコンピュータ装置に導入されることによって構築されたものであって、分析データ記憶部2、モデル式記憶部4、データ処理部6、及びディスプレイ8を備えている。
【0013】
分析データ記憶部2は、分析装置100で互いに異なる複数のグラジエント条件を使用して試料を分析することによって得られた複数の分析結果とグラジエント条件とを互いに関連付けて分析データとして記憶するための記憶領域である。分析結果には、試料中の各成分の保持時間、及び各成分のピークのピーク幅に関するクロマトグラム情報が含まれる。グラジエント条件とは、移動相を組成する溶媒の比率をどのように時間変化させるかの条件である。なお、この実施例では、分析条件としてグラジエント条件を例に説明するが、本発明はグラジエント条件に限定されるものではない。
【0014】
モデル式記憶部4は、試料中の各成分についての、グラジエント条件と保持時間との関係性を示す保持時間予測式の基礎となるモデル式、及び、グラジエント条件とピーク幅との関係性を示すピーク幅予測式の基礎となるモデル式を記憶している。
【0015】
分析データ記憶部2及びモデル式記憶部4は、ハードディスクドライブなどの情報記憶デバイスの一部の領域によって実現される。分析装置100は、例えば、液体クロマトグラフである。
【0016】
データ処理部6は、予測式生成部10及び相関データ生成部12を備えている。データ処理部6はCPU(中央演算装置)を備えたコンピュータ回路によって実現され、予測式生成部10及び相関データ生成部12はデータ処理部6においてコンピュータプログラムが実行されることによって得られる機能である。
【0017】
予測式生成部10は、モデル式記憶部4から読み出したモデル式に分析データ記憶部2から読み出した試料のクロマトグラム情報を適用して統計解析(フィッティング)を実行することにより、試料中の各成分についての保持時間予測式及びピーク幅予測式を生成するように構成されている。統計解析のアルゴリズムとしては、ベイズ推定等を使用することができる。
【0018】
ここで、モデル式について説明する。
【0019】
まず、保持係数予測式の基礎となるモデル式の一例について説明する。
【0020】
化合物の移動速度は保持係数の逆数で表現することができ、保持時間(t
R)と各時刻における保持係数k(t)の関係は次の[式1]で表現することができる(非特許文献1参照)。
[式1]
ここで、t
pはDwell Time(データ取込時間)、t
0はホールドアップタイム(試料導入時からカラムに保持されない成分のピークの頂点が現れるまでの時間)である。k(0)は時刻0以前の移動相組成における保持係数を示している。ここでは、分析を開始するまでは移動相組成が固定されており、保持係数が変化していないと仮定している。
【0021】
また、液体クロマトグラフにおける逆相分析の際の有機溶媒濃度と保持係数との関係は次の[式2]で表現可能であることが知られている(非特許文献1-5参照)。
[式2]
ここで、k(t)は各時刻の保持係数、φ(t)は各時刻の移動相の有機溶媒比率、k
0は有機溶媒比率が0の場合の保持係数である。S
1、S
2は係数であり、溶質、固定相及び移動相によって変化する値である。
【0022】
予測式生成部10は、上記のモデル式[式1]、[式2]に試料のクロマトグラム情報及びグラジエント情報を適用してフィッティングを行なうことにより、試料中の成分ごとのk0、S1、S2を求めることで、試料中の各成分の保持時間予測式を生成することができる。
【0023】
次に、ピーク幅予測式の基礎となるモデル式の一例について説明する。
【0024】
逆相グラジエント分析では、保持時間の大きさに対してピーク幅が減少する傾向があり、この現象はピーク圧縮と呼ばれる。ピーク圧縮は、圧縮係数Gを用いて次の[式3]によって表すことができる(非特許文献6参照)。
[式3]
ここで、Wはピーク幅、t
0はホールドアップタイム、k(t
R)は溶出時の保持係数、Nはカラムの理論段数である。
【0025】
保持係数k(t)は保持係数予測式の生成と同様のアルゴリズムで求めることが可能である。しかし、ピーク幅については保持時間に比べてばらつきが大きく、ノイズに過剰適合する場合がある。そのため、予測式生成部10は、上記[式2]の二次項を無視した次の[式4]にクロマトグラム情報及びグラジエント情報を適用してフィッティングを行なうことによりk
0、S1を求め、試料中の各成分のピーク幅予測式を求めることができる。
[式4]
【0026】
なお、圧縮係数Gは、保持係数を使用した次の式[5]で計算することができる(非特許文献7-8参照)。
[式5]
【0027】
相関データ生成部12は、上述のモデル式を基に生成される保持時間予測式及びピーク幅予測式を用いて保持時間の予測値、ピーク幅の予測値を、試料中の各成分についてのグラジエント条件ごとに算出し、算出した予測値のそれぞれと対応するグラジエント条件での実測値(分析データ中の保持時間の値及びピーク幅の値)との相関関係を示す相関データを生成するように構成されている。
【0028】
データ処理部6にはディスプレイ8が接続されており、例えばユーザが所望した際に、相関データ生成部12によって生成された相関データがディスプレイ8に表示される。
【0029】
図2にディスプレイ8に表示される相関データの一例を示す。
【0030】
図2に示されている相関データは、ユーザによって指定された1つの成分(化合物)についてのものである。相関データには、試料中の成分ごとの保持時間(RT:Retention Time)予測式情報及びピーク幅予測式情報が含まれる。
【0031】
保持時間予測式情報、ピーク幅予測式情報のそれぞれには、互いに直交する2つの軸のうちの一方の軸をグラジエント条件ごとの実測値の軸、他方の軸をグラジエント条件ごとの予測値の軸とする2次元グラフと、グラジエント条件ごとの予測値と実測値を示す表と、各予測式についての決定係数と、が含まれる。
【0032】
2次元グラフ上の各プロットは、各グラジエント条件での予測値および実測値の交点を示している。予測式がすべてのグラジエント条件で適合する(予測値が実測値に近い値をとる=妥当である)場合、2次元グラフにおいて傾きが1であるx=yの直線上に実測値のプロットが位置することになる。一方で、予測式が当てはまらない(妥当でない)グラジエント条件が存在する場合、2次元グラフにおいてx=yの直線上から外れる実測値のプロットが存在することになる。このように、2次元グラフを見れば、予測式がどのグラジエント条件では信頼性が高く、どのグラジエント条件では信頼性が低いかが一目瞭然であり、ユーザが予測式に対する信頼性を認識しやすい。さらに、グラジエント条件ごとの予測値と実測値の表が同時に示されていることで、予測値がどの程度実測値から外れているのかをユーザが容易に確認することができる。
【0033】
また、保持時間予測式情報、ピーク幅予測式情報のそれぞれに示されている「決定係数」とは、予測式が妥当であるかどうかを評価するための統計量である。このような統計量としてRhat統計量が知られている。Rhat統計量は予測式の推定が妥当であるならばおおよそ1となる。Rhat統計量が1.1を超えると推定は行われたものの、妥当な推定となっていないと一般的には評価する。Rhatは、予測式の生成に使用されるフィッティングの統計解析アルゴリズムとしてベイズ推定を用いた場合に得られる値である。この統計量は実測値の変動が、予測式により求まった予測値により完全に説明できていれば1となり、説明できていない変動が多ければ多いほど(予測式の予測性能が悪ければ悪いほど)1より小さい値となる。このような数値を参照することによっても、ユーザは各予測式の信頼性を確認することができる。
【0034】
次に、データ処理部6により実行されるデータ解析処理について
図3のフローチャートを用いて説明する。
【0035】
データ処理部6の予測式生成部10は、分析データ記憶部2から解析対象となる試料の分析データを読み出し(ステップ101)、さらに予測式の生成に使用するモデル式をモデル式記憶部4から読み出す(ステップ102)。その後、データ処理部6は、モデル式に分析データを適用して所定の統計解析アルゴリズムを使用したフィッティングを行なうことによってモデル式の各係数を決定し、保持時間予測式及びピーク幅予測式を生成する(ステップ103)。
【0036】
保持時間予測式及びピーク幅予測式が生成されると、生成された各予測式を用いてグラジエント条件ごとの保持時間及びピーク幅の予測値を算出し、算出した予測値と実測値とを使用して
図2に示されるような相関データを生成する(ステップ104)。ここで生成された相関データは、例えばユーザが所望した際に、ディスプレイ8に表示される。
【0037】
なお、以上において説明した実施例は、本発明の実施形態の一例に過ぎない。分析条件について、グラジエント条件ごとの相関データについて説明したが、本発明はそれに限らず、そのほかの分析条件(カラムオーブン温度や流速など)についても同様に適用することができる。本発明に係るデータ解析システム及びコンピュータプログラムの実施形態は以下の通りである。
【0038】
本発明に係るデータ解析システムの一実施形態では、複数の分析条件をそれぞれ使用して実行して得られた複数の分析結果の実測値をそれぞれ対応する前記分析条件と関連付けて分析データとして記憶する分析データ記憶部と、
分析条件を変数として含み、分析条件から分析結果の予測値を算出するための予測式の基礎となるモデル式を記憶するモデル式記憶部と、
前記分析データ記憶部に記憶されている前記分析データ、及び前記モデル式記憶部に記憶されている前記モデル式を用いて演算処理を行なうデータ処理部と、を備え、
前記データ処理部は、
前記分析データ記憶部に記憶されている前記複数の分析結果の実測値をそれぞれ対応する前記分析条件とともに前記モデル式記憶部に記憶されている前記モデル式に適用することにより前記試料についての前記予測式を生成するように構成された予測式生成部と、
前記予測式生成部により生成された前記予測式を用いて算出される2以上の分析条件のそれぞれの前記分析結果の予測値と前記分析結果の実測値との相関関係を示す相関データを生成するように構成された相関データ生成部と、を備えている。
【0039】
上記一実施形態の態様[1]では、前記相関データは、互いに交差する2つの軸の一方を前記分析条件ごとの前記分析結果の実測値の軸、他方を前記分析条件ごとの前記分析結果の予測値の軸とする2次元グラフを含む。
【0040】
上記一実施形態の態様[2]では、前記相関データは、前記複数の分析条件についての前記分析結果の実測値と前記分析結果の予測値との乖離度を加味した前記予測式の信頼性情報を含む。この態様[2]は、上記態様[1]と組み合わせることができる。
【0041】
上記一実施形態の態様[3]では、前記分析結果は、前記試料に含まれる各成分の保持時間を含む。この態様[3]は、上記態様[1]、及び/又は[2]と組み合わせることができる。
【0042】
上記一実施形態の態様[4]では、前記分析結果は、前記試料に含まれる各成分のピーク幅を含む。この態様[4]は、上記態様[1]、[2]、及び/又は[3]と組み合わせることができる。
【0043】
上記一実施形態の態様[5]では、ディスプレイ(8)をさらに備え、前記データ処理部(6)は、前記相関データ生成部(12)により生成された前記相関データを前記ディスプレイ(8)に表示するように構成されている。この態様[5]は、上記態様[1]、[2]、[3]、及び/又は[4]と組み合わせることができる。
【0044】
上記一実施形態の態様[6]では、前記2以上の分析条件は前記複数の分析条件以外の分析条件を含むことができる。このような態様により、予測式の生成に使用した分析条件以外の分析条件での分析結果の予測が適切か否かを確認することができる。この態様[6]は、上記態様[1]、[2]、[3]、[4]、及び/又は[5]と組み合わせることができる。
【0045】
本発明に係るコンピュータプログラムの一実施形態では、コンピュータに導入することにより上述のデータ解析システムを構築するように構成されている。
【符号の説明】
【0046】
1 データ解析システム
2 データ記憶部
4 データ処理部
6 情報入力装置
8 ディスプレイ
【手続補正書】
【提出日】2023-08-16
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0020
【補正方法】変更
【補正の内容】
【0020】
化合物の移動速度は保持係数の逆数で表現することができ、保持時間(t
R)と各時刻における保持係数k(t)の関係は次の[式1]で表現することができる(非特許文献1参照)。
[式1]
ここで、t
DはDwell Time(グラジエント分析における移動相の溶媒比率を変化させたときの時定数)、t
0はホールドアップタイム(試料導入時からカラムに保持されない成分のピークの頂点が現れるまでの時間)である。k(0)は時刻0以前の移動相組成における保持係数を示している。ここでは、分析を開始するまでは移動相組成が固定されており、保持係数が変化していないと仮定している。