IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電子株式会社の特許一覧

<>
  • 特開-試料分析装置及び方法 図1
  • 特開-試料分析装置及び方法 図2
  • 特開-試料分析装置及び方法 図3
  • 特開-試料分析装置及び方法 図4
  • 特開-試料分析装置及び方法 図5
  • 特開-試料分析装置及び方法 図6
  • 特開-試料分析装置及び方法 図7
  • 特開-試料分析装置及び方法 図8
  • 特開-試料分析装置及び方法 図9
  • 特開-試料分析装置及び方法 図10
  • 特開-試料分析装置及び方法 図11
  • 特開-試料分析装置及び方法 図12
  • 特開-試料分析装置及び方法 図13
  • 特開-試料分析装置及び方法 図14
  • 特開-試料分析装置及び方法 図15
  • 特開-試料分析装置及び方法 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024017837
(43)【公開日】2024-02-08
(54)【発明の名称】試料分析装置及び方法
(51)【国際特許分類】
   G01N 27/62 20210101AFI20240201BHJP
【FI】
G01N27/62 D
【審査請求】有
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2022120745
(22)【出願日】2022-07-28
(71)【出願人】
【識別番号】000004271
【氏名又は名称】日本電子株式会社
(74)【代理人】
【識別番号】110001210
【氏名又は名称】弁理士法人YKI国際特許事務所
(72)【発明者】
【氏名】久保 歩
(72)【発明者】
【氏名】生方 正章
(72)【発明者】
【氏名】長友 健治
【テーマコード(参考)】
2G041
【Fターム(参考)】
2G041CA01
2G041DA13
2G041GA03
2G041GA06
(57)【要約】
【課題】マススペクトルマッチングによる構造式の推定において、推定対象となる化合物の範囲を拡大する。
【解決手段】第1検索部46は、試料マススペクトルに基づいて、一次ライブラリ48に対する一次検索を実行する。一次ライブラリ48には複数の標準マススペクトルが含まれる。判定部50が検索範囲の拡大を判定した場合、第2検索部52は、試料マススペクトルに基づいて二次ライブラリ54に対する二次検索を実行する。二次ライブラリ54には複数の構造式から生成された複数の予測マススペクトルが含まれる。
【選択図】図1
【特許請求の範囲】
【請求項1】
第1化合物集合を構成する複数の化合物から得られた複数の標準マススペクトルと、前記複数の標準マススペクトルに対応する複数の構造式と、を有する一次ライブラリを記憶した第1記憶部と、
第2化合物集合を構成する複数の化合物に対応する複数の予測マススペクトルと、前記複数の予測マススペクトルに対応する複数の構造式と、を有する二次ライブラリを記憶した第2記憶部と、
試料から得られた試料マススペクトルに基づいて前記一次ライブラリに対する一次検索を実行する一次検索部と、
前記一次検索の結果に基づいて検索範囲の拡大を判定する判定部と、
前記検索範囲の拡大が判定された場合に、前記試料マススペクトルに基づいて前記二次ライブラリに対する二次検索を実行し、これにより前記試料の構造式を推定する二次検索部と、
を含むことを特徴とする試料分析装置。
【請求項2】
請求項1記載の試料分析装置において、
前記複数の予測マススペクトルは、前記第2化合物集合を構成する複数の化合物に対応する前記複数の構造式から予測された複数のマススペクトルである、
ことを特徴とする試料分析装置。
【請求項3】
請求項1記載の試料分析装置において、
前記第1化合物集合と前記第2化合物集合は互いに異なる、
ことを特徴とする試料分析装置。
【請求項4】
請求項1記載の試料分析装置において、
前記判定部は、前記試料マススペクトルと前記複数の標準マススペクトルとの間で演算される複数の類似度に基づいて、前記検索範囲の拡大を判定する、
ことを特徴とする試料分析装置。
【請求項5】
請求項1記載の試料分析装置において、
前記二次検索の結果の表示に際して、前記試料マススペクトルと共に、前記二次検索でヒットした予測マススペクトルが表示される、
ことを特徴とする試料分析装置。
【請求項6】
請求項1記載の試料分析装置において、
前記二次検索部は、前記試料の質量分析により得られた試料分子情報により前記二次検索の結果が絞り込まれるように、前記二次検索を実行する、
を含むことを特徴とする試料分析装置。
【請求項7】
請求項6記載の試料分析装置において、
前記試料分子情報は、分子量、精密質量及び組成式の内の少なくとも1つである、
ことを特徴とする試料分析装置。
【請求項8】
請求項6記載の試料分析装置において、
前記二次ライブラリは、前記第2化合物集合を構成する複数の化合物に対応する複数の化合物分子情報を有し、
前記二次検索部は、前記試料分子情報及び前記試料マススペクトルに基づいて前記二次ライブラリに対する前記二次検索を実行する、
ことを特徴とする試料分析装置。
【請求項9】
請求項6記載の試料分析装置において、
前記試料から得られた他の試料マススペクトルに含まれる分子イオンピークに基づいて、前記試料分子情報が特定される、
ことを特徴とする試料分析装置。
【請求項10】
請求項9記載の試料分析装置において、
前記試料マススペクトルは、ハードイオン化法の適用により取得されたマススペクトルであり、
前記他の試料マススペクトルは、ソフトイオン化法の適用により取得されたマススペクトルである、
ことを特徴とする試料分析装置。
【請求項11】
請求項6記載の試料分析装置において、
前記試料分子情報に基づいて複数の予測マススペクトルを生成する予測部を含み、
前記二次ライブラリ内の前記複数の予測マススペクトルは、前記予測部により生成された前記複数の予測マススペクトルである、
ことを特徴とする試料分析装置。
【請求項12】
試料から得られた試料マススペクトルに基づいて、第1化合物集合を構成する複数の化合物から得られた複数の標準マススペクトルと前記複数の標準マススペクトルに対応する複数の構造式とを有する一次ライブラリに対する一次検索を実行する工程と、
前記一次検索の結果に基づいて検索範囲の拡大を判定する工程と、
前記検索範囲の拡大が判定された場合に、前記試料マススペクトルに基づいて、第2化合物集合を構成する複数の化合物に対応する複数の予測マススペクトルと前記複数の予測マススペクトルに対応する複数の構造式とを有する二次ライブラリに対する二次検索を実行し、これにより前記試料の構造式を推定する工程と、
を含むことを特徴とする試料分析方法。
【請求項13】
情報処理装置において試料分析方法を実行するためのプログラムであって、
試料から得られた試料マススペクトルに基づいて、第1化合物集合を構成する複数の化合物から得られた複数の標準マススペクトルと前記複数の標準マススペクトルに対応する複数の構造式とを有する一次ライブラリに対する一次検索を実行する機能と、
前記一次検索の結果に基づいて検索範囲の拡大を判定する機能と、
前記検索範囲の拡大が判定された場合に、前記試料マススペクトルに基づいて、第2化合物集合を構成する複数の化合物に対応する複数の予測マススペクトルと前記複数の予測マススペクトルに対応する複数の構造式とを有する二次ライブラリに対する二次検索を実行し、これにより前記試料の構造式を推定する機能と、
を含むことを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、試料分析装置及び方法に関し、特に、試料を構成する化合物の構造式を決定又は推定する技術に関する。
【背景技術】
【0002】
化合物の同定(つまり化合物の構造式の決定)に際して、EIマススペクトルライブラリが用いられる。例えば、米国国立標準技術研究所(NIST)が提供するEIマススペクトルライブラリには、30万個以上の化合物の質量分析により得られたEIマススペクトルが含まれている。
【0003】
EIマススペクトルは、電子イオン化(EI)法の適用の下で化合物の質量分析を行うことにより得られるマススペクトルである。それには、通常、比較的多くのフラグメントイオンピークが含まれる。試料の質量分析により得られたEIマススペクトルが、EIマススペクトルライブラリ中の複数のEIマススペクトルと比較される。その比較結果に基づいて、試料を構成する化合物の構造式を決定し得る。
【0004】
化合物の同定に際しては、一般的な化合物データベースも利用される。例えば、代表的な化合物データベースであるPubChemには、1億個を上回る化合物が登録されている。その化合物データベースを利用すれば、試料を構成する化合物の分子量、精密質量又は組成式から、試料を構成する化合物の構造式を絞り込める。もっとも、一般的な化合物データベースには、EIマススペクトルは登録されていない。
【0005】
EIマススペクトルライブラリにおける化合物登録数は、化合物データベースにおける化合物登録数よりもかなり少ない。EIマススペクトルライブラリを用いた化合物同定において、EIマススペクトルライブラリ中に、試料から得られたEIマススペクトルに適合するEIマススペクトルが存在しない、という事態が度々生じる。
【0006】
特許文献1には、ハードイオン化法の下で取得された第1マススペクトル及びソフトイオン化法の下で取得された第2マススペクトルを処理する技術が開示されている。特許文献1には、予測マススペクトルについては記載されていない。
【0007】
非特許文献1には、EIマススペクトルライブラリが開示されている。EIマススペクトルライブラリは、複数の実測EIマススペクトルと複数の予測EIマススペクトルとにより構成されている。各化合物の構造式から定義される分子フィンガプリント(Molecular Fingerprint)が予測モデルに入力され、その予測モデルにより予測EIマススペクトルが生成されている。非特許文献1には、実測EIマススペクトルライブラリ及び予測EIマススペクトルライブラリの段階的な利用は、記載されていない。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特許6994921号公報
【非特許文献】
【0009】
【非特許文献1】Jennifer N. Wei et al., Rapid Prediction of Electron-Ionization Mass Spectrometry Using Neural Networks, ACS Publications, 2019, pp. 700-708.
【発明の概要】
【発明が解決しようとする課題】
【0010】
本発明の目的は、マススペクトルマッチングによる構造式の推定において、推定対象となる化合物の範囲を拡大することにある。あるいは、本発明の目的は、異なる性質又は性能を有する複数種類のマススペクトルライブラリを使い分けることにある。あるいは、本発明の目的は、予測マススペクトルライブラリを利用した構造式推定において推定精度を高めることにある。
【課題を解決するための手段】
【0011】
本発明に係る試料分析装置は、第1化合物集合を構成する複数の化合物から得られた複数の標準マススペクトルと、前記複数の標準マススペクトルに対応する複数の構造式と、を有する一次ライブラリを記憶した第1記憶部と、第2化合物集合を構成する複数の化合物に対応する複数の予測マススペクトルと、前記複数の予測マススペクトルに対応する複数の構造式と、を有する二次ライブラリを記憶した第2記憶部と、試料から得られた試料マススペクトルに基づいて前記一次ライブラリに対する一次検索を実行する一次検索部と、前記一次検索の結果に基づいて検索範囲の拡大を判定する判定部と、前記検索範囲の拡大が判定された場合に、前記試料マススペクトルに基づいて前記二次ライブラリに対する二次検索を実行し、これにより前記試料の構造式を推定する二次検索部と、を含むことを特徴とする。
【0012】
本発明に係る試料分析方法は、試料から得られた試料マススペクトルに基づいて、第1化合物集合を構成する複数の化合物から得られた複数の標準マススペクトルと前記複数の標準マススペクトルに対応する複数の構造式とを有する一次ライブラリに対する一次検索を実行する工程と、前記一次検索の結果に基づいて検索範囲の拡大を判定する工程と、前記検索範囲の拡大が判定された場合に、前記試料マススペクトルに基づいて、第2化合物集合を構成する複数の化合物に対応する複数の予測マススペクトルと前記複数の予測マススペクトルに対応する複数の構造式とを有する二次ライブラリに対する二次検索を実行し、これにより前記試料の構造式を推定する工程と、を含むことを特徴とする。
【発明の効果】
【0013】
本発明によれば、マススペクトルマッチングによる構造式の推定において、推定対象となる化合物の範囲を拡大できる。あるいは、本発明によれば、異なる性質又は性能を有する複数種類のマススペクトルライブラリを使い分けることができる。あるいは、本発明によれば、予測マススペクトルライブラリを利用した構造式推定において推定精度を高められる。
【図面の簡単な説明】
【0014】
図1】実施形態に係る試料分析装置の構成を示すブロック図である。
図2】モデル生成方法を示す図である。
図3】複数の構造式の例を示す図である。
図4】一次ライブラリの例を示す図である。
図5】スペクトル予測方法を示す図である。
図6】二次ライブラリの例を示す図である。
図7】実施形態に係る試料分析装置の動作を示す図である。
図8】一次検索の例を示す図である。
図9】二次検索の例を示す図である。
図10】対応付けを説明するための図である。
図11】EIマススペクトル及びFIマススペクトルを示す図である。
図12】二次検索結果を示す画像の例を示す図である。
図13】実施形態に係る試料分析方法を示すフローチャートである。
図14】第1変形例を示すブロック図である。
図15】第2変形例を示すブロック図である。
図16】第3変形例を示すブロック図である。
【発明を実施するための形態】
【0015】
以下、実施形態を図面に基づいて説明する。
【0016】
(1)実施形態の概要
実施形態に係る試料分析装置は、第1記憶部、第2記憶部、一次検索部、判定部、及び、二次検索部を有する。第1記憶部に一次ライブラリが記憶される。一次ライブラリは、第1化合物集合を構成する複数の化合物から得られた複数の標準マススペクトルと、複数の標準マススペクトルに対応する複数の構造式と、を有する。第2記憶部に二次ライブラリが格納される。二次ライブラリは、第2化合物集合を構成する複数の化合物に対応する複数の予測マススペクトルと、複数の予測マススペクトルに対応する複数の構造式と、を有する。一次検索部は、試料から得られた試料マススペクトルに基づいて一次ライブラリに対する一次検索を実行する。判定部は、一次検索の結果に基づいて検索範囲の拡大を判定する。二次検索部は、検索範囲の拡大が判定された場合に、試料マススペクトルに基づいて二次ライブラリに対する二次検索を実行し、これにより試料の構造式を推定する。
【0017】
上記構成においては、一次検索の結果の良否に応じて二次検索の実行の要否が決まる。一次検索の結果が優良なものであれば、試料を構成する化合物が一次ライブラリに登録されている可能性が高いので、二次検索の実行が見送られる。その場合、検索時間を短縮化できる。一方、一次検索の結果が優良なものでなければ、二次検索が実行される。つまり、検索範囲が拡大される。これにより、試料を構成する化合物を特定できる可能性を高められる。
【0018】
実施形態において、標準マススペクトルは、化合物の質量分析により得られた実測EIマススペクトルである。予測マススペクトルは、化合物の構造式から予測された人工的EIマススペクトルである。一般に、標準マススペクトルの方が予測マススペクトルよりも信頼できる。よって、最初に一次ライブラリを用いた一次検索が実行され、次に二次ライブラリを用いた二次検索が実行される。上記構成は、2つのライブラリの長短所に鑑み、2つのライブラリを使い分けるものである。なお、本願明細書において、試料は、分析対象となる化合物である。ガスクロマトグラフ等において元試料から複数の成分が抽出され、各成分が質量分析される場合、各成分が分析対象となる化合物つまり試料である。
【0019】
二次ライブラリが事前に作成されてもよいし、後述するように試料分子情報が特定された時点で二次ライブラリが作成されてもよい。一次ライブラリ及び二次ライブラリはそれぞれデータベースに相当する。ネットワーク上の記憶装置に格納された一次ライブラリ及び二次ライブラリが利用されてもよい。単一の記憶部を第1記憶部及び第2記憶部として機能させてもよい。
【0020】
実施形態において、複数の予測マススペクトルは、第2化合物集合を構成する複数の化合物に対応する複数の構造式から予測された複数のマススペクトルである。学習済みの予測モデル(機械学習モデル)により、構造式から予測マススペクトルが生成されてもよい。
【0021】
実施形態において、第1化合物集合と第2化合物集合は互いに異なる。第1化合物集合を構成する各化合物は、実測マススペクトルが得られている化合物である。第2化合物集合を構成する各化合物は、実測マススペクトルが得られていない化合物である。既存のEIマススペクトルライブラリが一次ライブラリとして用いられてもよいし、既存のEIマススペクトルライブラリから抽出された情報により一次ライブラリが作成されてもよい。既存の化合物データベースから抽出された複数の構造式とそれらの構造式から生成された複数の予測マススペクトルとにより二次ライブラリが構成されてもよい。
【0022】
実施形態において、判定部は、試料マススペクトルと複数の標準マススペクトルとの間で演算される複数の類似度に基づいて、検索範囲の拡大を判定する。例えば、演算された複数の類似度の中に所定の条件を満たすものが存在しない場合、試料を構成する化合物が一次ライブラリに登録されていない可能性が高い。そのような場合に検索範囲の拡大が判定される。
【0023】
実施形態においては、二次検索の結果の表示に際して、試料マススペクトルと共に、二次検索でヒットした予測マススペクトルが表示される。この構成によれば、試料マススペクトルと予測マススペクトルの視覚的対比により、二次検索が正しく実行されたことを確認でき、あるいは、二次検索結果の信頼性を評価できる。表示される予測マススペクトルは、例えば、最高の類似度を生じさせた予測マススペクトルである。
【0024】
実施形態において、二次検索部は、試料の質量分析により得られた試料分子情報により二次検索の結果が絞り込まれるように、二次検索を実行する。この構成によれば、分子情報マッチング及びマススペクトルマッチングを併用することにより、構造式の推定精度を高められる。それらのマッチングが同時に実行されてもよいし、それらのマッチングが段階的に実行されてもよい。実施形態において、試料分子情報は、試料を構成する化合物の分子量、精密質量及び組成式の内の少なくとも1つである。
【0025】
実施形態において、二次ライブラリは、第2化合物集合を構成する複数の化合物に対応する複数の化合物分子情報を有する。二次検索部は、試料分子情報及び試料マススペクトルに基づいて二次ライブラリに対する二次検索を実行する。マススペクトルマッチングに加えて分子情報マッチングを実施することにより、マススペクトルマッチングのみを実施する場合に比べて、二次検索の結果を効果的に絞り込める。
【0026】
実施形態においては、同一の試料から得られた他の試料マススペクトルに含まれる分子イオンピークに基づいて、試料分子情報が特定される。例えば、試料マススペクトルは、ハードイオン化法の適用により取得されたマススペクトルである。他の試料マススペクトルは、ソフトイオン化法の適用により取得されたマススペクトルである。ハードイオン化法は、ソフトイオン化法に比べて、フラグメントイオンが生じ易いイオン化法である。ソフトイオン化法は、ハードイオン化法に比べて、分子イオンが生じ易いイオン化法である。
【0027】
実施形態に係る試料分析装置は、試料分子情報に基づいて複数の予測マススペクトルを生成する予測部を含む。二次ライブラリ内の複数の予測マススペクトルは、予測部により生成された複数の予測マススペクトルである。この構成によれば、二次ライブラリの規模を縮小でき、また検索時間を短縮化できる。なお、複数の予測マススペクトルの生成にかなりの時間を要する場合、事前に作成された二次ライブラリが利用される。
【0028】
実施形態に係る試料分析方法は、一次検索工程、判定工程、及び、二次検索工程を有する。一次検索工程では、試料から得られた試料マススペクトルに基づいて、一次ライブラリに対する一次検索が実行される。一次ライブラリは、第1化合物集合を構成する複数の化合物から得られた複数の標準マススペクトルと、複数の標準マススペクトルに対応する複数の構造式と、を有する。判定工程では、一次検索の結果に基づいて検索範囲の拡大が判定される。二次検索工程では、検索範囲の拡大が判定された場合に、試料マススペクトルに基づいて、二次ライブラリに対する二次検索が実行され、これにより試料の構造式が推定される。二次ライブラリは、第2化合物集合を構成する複数の化合物に対応する複数の予測マススペクトルと、複数の予測マススペクトルに対応する複数の構造式と、を有する。
【0029】
上記の試料分析方法は、ハードウエアの機能として又はソフトウエアの機能として実現される。後者の場合、上記の試料分析方法を実行するプログラムが、ネットワーク又は可搬型記憶媒体を介して、情報処理装置へインストールされる。情報処理装置の概念には、コンピュータ、試料分析装置、質量分析装置、等が含まれる。情報処理装置は、上記プログラムを非一時的に格納する記憶媒体を有する。以下においては、場合により、「マススペクトル」を単に「スペクトル」と表現する。
【0030】
(2)実施形態の詳細
図1には、実施形態に係る試料分析システムが示されている。試料分析システムは、情報処理装置10及び試料分析装置12により構成される。試料分析装置12は、具体的には質量分析装置であり、それは測定部14及び情報処理部16により構成される。
【0031】
最初に、情報処理装置10について説明する。情報処理装置10は、例えば、プロセッサ及びメモリを有するコンピュータにより構成される。プロセッサは、具体的には、プログラムを実行するCPUである。図1には、プロセッサにより発揮される複数の機能が複数のブロックにより表現されている。情報処理装置10は、モデル生成部18、一次ライブラリ生成部24、スペクトル予測部26、及び、二次ライブラリ生成部32を有する。
【0032】
モデル生成部18は、化合物の構造式からEIマススペクトルを予測する予測モデル22Aを生成するものである。モデル生成部18は、具体的には、機械学習器により構成される。機械学習過程において、EIマススペクトルライブラリ20から取得された教師データセットがモデル生成部18へ与えられる。これにより生成された予測モデル22Aがスペクトル予測部26へ与えられる(符号28を参照)。モデル生成部18とスペクトル予測部26とを一体化してもよい。
【0033】
一次ライブラリ生成部24は、EIマススペクトルライブラリ20から取得された情報に基づいて一次ライブラリを生成する。一次ライブラリは、後に説明する一次検索で利用されるデータベースである。一次ライブラリには、第1化合物集合を構成する複数の第1化合物に対応する複数のレコードが含まれる。各レコードには、標準マススペクトル(実測EIマススペクトル)、構造式、等が含まれる。
【0034】
スペクトル予測部26は、構造式から予測マススペクトルを生成するものであり、それは学習済み予測モデル(機械学習モデル)22Bを有する。化合物データベース30から複数の構造式がスペクトル予測部26へ順次与えられている。これにより複数の予測マススペクトル(予測EIマススペクトル)が順次生成される。生成された複数の予測マススペクトル及びそれらに対応する複数の構造式が二次ライブラリ生成部32へ与えられている。
【0035】
二次ライブラリ生成部32は、化合物データベース30から取得された情報、及び、生成された複数の予測マススペクトルに基づいて、二次ライブラリを生成するものである。二次ライブラリは、後に説明する二次検索で利用されるデータベースである。二次ライブラリには、複数の第2化合物に対応する複数のレコードが含まれる。各レコードには、予測マススペクトル(予測EIマススペクトル)、化合物分子情報(分子量、精密質量、組成式)、構造式、等が含まれる。
【0036】
図1に示されているように、生成された一次ライブラリ及び二次ライブラリが試料分析装置12へ転送(コピー)されている(符号49及び符号55を参照)。
【0037】
上記のEIマススペクトルライブラリ20は、例えば、NISTが提供するEIマススペクトルライブラリである。他のEIマススペクトルライブラリが用いられてもよい。上記の化合物データベース30は、例えば、上記のPubChemである。他の化合物データベースが用いられてもよい。
【0038】
実施形態において、第1化合物集合は、EIマススペクトルライブラリに登録された複数の化合物により構成される。第2化合物集合は、化合物データベースに登録され且つEIマススペクトルライブラリに登録されていない複数の化合物により構成される。つまり、第1化合物集合と第2化合物集合は、互いに重複せず、互いに異なっている。もっとも、必要に応じて、2つの化合物集合を部分的に重複させてもよい。
【0039】
次に、試料分析装置12について説明する。上述したように、試料分析装置12は、測定部14及び情報処理部16により構成される。情報処理部64は、プロセッサ及びメモリを有する。プロセッサは、具体的には、プログラムを実行するCPUである。図1においては、プロセッサが発揮する複数の機能が複数のブロックで表現されている。
【0040】
測定部14は、ガスクロマトグラフ(GC)34及び質量分析計36により構成される。GC34内において、元試料から時間的に分離された複数の成分が生じる。複数の成分が質量分析計36へ順次導入される。質量分析計36から見て、各成分は分析対象としての化合物つまり試料である。
【0041】
質量分析計36は、イオン源38、質量分析部40及び検出器42を有する。実施形態において、イオン源38は、EI法(電子イオン化法)に従うEIイオン源として機能し、及び、FI法(電界イオン化法)に従うFIイオン源として機能する。EI法は、代表的なハードイオン化法である。FI法は、代表的なソフトイオン化法である。他のソフトイオン化法として、CI法(化学イオン化法)等が挙げられる。ハードイオン化法は、ソフトイオン化法よりもフラグメントイオンが生じ易いイオン化法である。ソフトイオン化法は、ハードイオン化法よりも分子イオンが検出され易いイオン化法である。
【0042】
質量分析部40は、イオン源からのイオンに対して質量分析を適用するものである。質量分析部40は、例えば、飛行時間型質量分析部、又は、四重極型質量分析部により構成される。質量分析部40が他の質量分析部により構成されてもよい。検出器42は、質量分析部40を通過してきたイオンを検出する。検出器42からの検出信号が図示されていない電子回路を通じて情報処理部64へ送られている。
【0043】
実施形態においては、最初に、EI法が選択され、EI法の下で、GC34から順次導入される複数の成分に対して質量分析が順次実施される。これにより第1マススペクトル列が得られる。次に、FI法が選択され、FI法の下で、GCから順次導入される複数の成分(基本的に先の複数の成分と同じもの)に対して質量分析が順次実施される。これにより第2マススペクトル列が得られる。もっとも、後述する二次検索が実行されない場合、第2マススペクトル列の取得が省略され得る。
【0044】
情報処理部64は、図示の構成例において、スペクトル作成部44、第1検索部46、判定部50、第2検索部52、精密質量特定部56、組成式推定部58、表示処理部60、等を有する。第1検索部46は、一次ライブラリ48を用いて一次検索を実行するものである。第1検索部46により一次ライブラリ48が管理される。第2検索部52は、二次ライブラリ54を用いて二次検索を実行するものである。第2検索部52により二次ライブラリ54が管理される。一次ライブラリ48及び二次ライブラリ54は、実際には、図示されていないメモリ内に格納されている。
【0045】
表示器62には、一次検索結果を示す画像又は二次検索結果を示す画像が表示される。表示器62は例えばLCDにより構成される。情報処理部64に対して入力器が接続されているが、その図示が省略されている。
【0046】
情報処理部64について更に詳しく説明する。スペクトル作成部44は、測定部14からの検出信号に基づいてマススペクトルを生成するものである。具体的には、スペクトル作成部44は、EI法の下で得られた検出信号に基づいて第1マススペクトル列を生成し、FI法の下で得られた検出信号に基づいて第2マススペクトル列を生成する。通常、最初にEI法が実施され、次にFI法が実施される。つまり、最初に第1マススペクトル列が生成され、次に第2マススペクトル列が生成される。測定部14内にスペクトル作成部44が設けられてもよい。
【0047】
スペクトル作成部44は、スペクトル処理部としても機能する。すなわち、スペクトル作成部44は、第1マススペクトル列と第2マススペクトル列の間において対応付けを行う機能や、マススペクトル列に基づいて成分ごとに積算マススペクトルを作成する機能を有する。それらの機能については後に説明する。
【0048】
以下においては、ある未知の成分(ある未知の化合物)から得られた第1マススペクトル及び第2マススペクトルの処理を中心に説明を行う。第1マススペクトルは積算EIマススペクトルであり、第2マススペクトルは積算FIマススペクトルである。それらはいずれも試料マススペクトルである。
【0049】
最初に、第1検索部46が機能する。第1検索部46は、第1マススペクトルに基づいて一次ライブラリ48に対する一次検索を実行する。具体的には、第1マススペクトルが一次ライブラリ48内の複数の標準マススペクトルと比較され、これにより複数の類似度が演算される。第1検索部46において、マススペクトルマッチングに加えて、組成式マッチングを行ってもよい。そのような構成を採用すれば、化合物の特定の精度を高められる。
【0050】
判定部50は、演算された複数の類似度に基づいて、検索範囲の拡大を判定する。具体的には、判定部50は、演算された複数の類似度の中に、所定の条件を満たすものが含まれない場合に、換言すれば、一次ライブラリ48に登録されている第1化合物群の中に測定対象となった化合物が含まれている可能性が低い場合に、検索範囲の拡大つまり二次検索の実行を判定する。一方、判定部50は、演算された複数の類似度の中に、所定の条件を満たすものが含まれている場合に、換言すれば、第1化合物群の中に測定対象となった化合物が含まれている可能性が高い場合に、二次検索の実行の見送りを判定する。第1検索部46においてスペクトルマッチングに加えて組成式マッチングが実施される場合、判定部50が、スペクトルマッチングの結果及び組成式マッチングの結果に基づいて検索範囲の拡大を判定してもよい。
【0051】
二次検索が見送られる場合、一次検索の結果が採用され、その結果が表示処理部60へ送られる。一次検索の結果は、類似度の大きさ順で並ぶ複数の情報により構成される。各情報には、類似度、構造式、標準マススペクトル、等が含まれる。
【0052】
上記の所定の条件として任意の条件を定め得る。例えば、類似度が1~1000まで変動する場合において(1000が最良類似度)、上記の所定の条件として、演算された複数の類似度の中に750以上の類似度が含まれること、を求めてもよい。
【0053】
精密質量特定部56は、二次検索に先立て、第2マススペクトルに含まれる分子イオンピークを特定し、その分子イオンピークに対応する精密質量を特定する。その場合において、分子イオンピークがユーザーにより指定されてもよいし、分子イオンピークが自動的に判定されてもよい。
【0054】
組成式推定部58は、二次検索に先立って、特定された精密質量から1つの又は複数の組成式(1つの又は複数の組成式候補)を特定するものである。1つの又は複数の組成式により組成式リストが構成される。例えば、精密質量に対して誤差を考慮した範囲が指定され、その範囲に基づいて多数の組成式が特定される。組成式推定部58が、精密質量、及び、同位体パターンマッチングの結果(一致度)に基づいて、1つの又は複数の組成式を特定してもよい。組成式の特定に際しては、二次ライブラリ54が参照される。その際、化合物データベースが参照されてもよい。個々の組成式は、試料分子情報と言い得る。他の試料分子情報として、分子量及び精密質量が挙げられる。これについては後に説明する。
【0055】
第2検索部52は、推定された1つの又は複数の組成式、及び、第1マススペクトルに基づいて、二次ライブラリ54に対する二次検索を実行するものである。このように、実施形態においては、マススペクトルマッチングに加えて組成式マッチングを併用されている。これにより二次検索結果が絞り込まれている。二次ライブラリ54に含まれる複数の予測マススペクトルについての予測精度が低い場合でも、二次検索において試料分子情報を利用することにより、二次検索の精度を高められる。二次検索の結果が表示処理部60へ送られている。二次検索の結果は、類似度の大きさ順で並ぶ複数の情報により構成される。各情報には、類似度、構造式、予測マススペクトル、等が含まれる。
【0056】
表示処理部60は、一次検索結果を表す画像、及び、二次検索結果を表す画像を生成する機能を有する。表示器62には、一次検索結果を表す画像、又は、二次検索結果を表す画像が表示される。判定部50の判定結果が表示器62に表示されてもよい。
【0057】
以下、以上説明した各構成について具体的に説明する。図2には、予測モデルの生成が示されている。図2は、モデル生成部18の動作を示すものである。
【0058】
EIマススペクトルライブラリ20から教師データセット66が抽出される。教師データセット66は、複数の第1化合物に対応する複数の教師データ68により構成される。各教師データ68は、構造式70及びEIマススペクトル72により構成される。複数の教師データ68が予測モデル(学習器)22Aに順次与えられる。但し、実施形態においては、個々の構造式70がグラフ構造を有するデータ74に変換された上で、そのデータ74が予測モデル22Aに与えられている。なお、構造式の表記方法として各種の方法が知られている。例えば、MOL・SDFファイルフォーマットや、SMILES、SMARTSといった線形表記方法、等が知られている。
【0059】
機械学習の進行に伴って、予測モデル22Aの予測性能が徐々に優良化される。予測モデル22Aは、実施形態において、Graph Convolutional Networksにより構成される。他の機械学習モデルにより予測モデル22Aが構成されてもよい。生成された予測モデル22Aがスペクトル予測部へ与えられる。なお、試料分析装置内において予測マススペクトルの生成を行う場合、生成された予測モデル22Aが試料分析装置へ送られる。これについては後に図16を用いて説明する。
【0060】
一次ライブラリ生成部24により、EIマススペクトルライブラリから抽出された情報に基づいて、一次ライブラリ48が生成される。生成された一次ライブラリ48が試料分析装置へ転送される。
【0061】
図3には、一次ライブラリ48の一例が示されている。一次ライブラリ48は、図示の構成例において、複数のレコード78により構成される。各レコード78には、化合物ID80、分子量82、精密質量84、組成式86、構造式88、標準スペクトル90、等が含まれる。構造式88及び標準スペクトル90以外の情報が除外されてもよい。
【0062】
図4には、マススペクトルの予測が示されている。図4は、スペクトル予測部26の動作を示すものである。
【0063】
化合物データベース30から複数の構造式92が抽出され、それらが学習済み予測モデル22Bに順次与えられる。これにより複数の予測マススペクトル100Aが順次生成される。実施形態においては、各構造式92がグラフ構造を有するデータ96に変換された上で、そのデータ96が予測モデル22Bに入力されている。図5には、化合物データベースから抽出された複数の構造式の一部76が例示されている。
【0064】
図4において、構造式作出部102において、複数の構造式を人工的に作出し、それらを予測モデル22Bに与えるようにしてもよい。その場合においても、作出された各構造式がグラフ構造を有するデータ96に変換された上で、そのデータ96が予測モデル22Bに与えられる。
【0065】
二次ライブラリ生成部32は、予測モデル22Bに入力された複数の構造式92A、及び、予測モデル22Bから出力された複数の予測マススペクトル100Aに基づいて、二次ライブラリ54を生成する。
【0066】
図6には、二次ライブラリ54の一例が示されている。二次ライブラリ54は、図示の構成例において、複数のレコード104により構成される。各レコード104には、化合物ID106、分子量108、精密質量110、組成式112、構造式114、予測スペクトル116、等が含まれる。二次検索に当たって、分子量108を使用しない場合、分子量を除外してよい。いずれにしても、二次検索の実行に際して必要となる情報が二次ライブラリ54に登録される。
【0067】
図7には、実施形態に係る試料分析装置の動作が示されている。符号46Aは、一次検索を示している。符号52Aは、二次検索を示している。
【0068】
第1マススペクトル(試料EIマススペクトル)120に基づいて一次ライブラリ48が検索される。具体的には、第1マススペクトル120と複数の標準マススペクトル122とが比較され、これにより複数の類似度126が演算される。判定50Aは、複数の類似度126に基づく検索範囲の拡大の判定である。検索範囲の拡大が判定されなかった場合には、一次検索の結果が表示処理60Aに送られる。
【0069】
第2マススペクトル(試料FIマススペクトル)128に含まれる分子イオンピーク130が特定される。分子イオンピーク130に基づいて精密質量56Aが特定される。精密質量56Aに基づいて組成式リスト58Aが生成される。その際には、必要に応じて、二次ライブラリ54が参照される(符号132を参照)。
【0070】
二次検索52Aにおいては、例えば、二次ライブラリ54内の複数の組成式138の中で、組成式リスト58Aを構成するいずれかの組成式に一致する組成式138Aが特定される。これにより、第1マススペクトル120に基づく検索の対象が二次ライブラリ54内の一部142に絞り込まれる。これは試料分子情報に基づく絞り込みである。第1マススペクトル120に基づいて、二次ライブラリ54内の一部142に対して二次検索が実行される。具体的には、第1マススペクトル120と一部142内の複数の予測マススペクトル140Aとの間で、複数の類似度144が演算される。二次検索の結果が表示処理60Aに送られる。例えば、二次検索でヒットした複数のレコードが表示処理60Aへ送られる。
【0071】
類似度の演算に際しては、例えば、以下の計算式が用いられる。
【数1】
【0072】
上記計算式において、Sは類似度を示している。mはi番目の質量を示している。Aは第1マススペクトルにおけるi番目の強度を示しており、Pは予測マススペクトルにおけるi番目の強度を示している。
【0073】
上記以外の計算式により類似度が演算されてもよい。一次検索において類似度を計算する場合においても上記計算式等を利用し得る。
【0074】
先に第1マススペクトルに基づく検索を実行した上で、それにより特定された中間検索結果が組成式リスト58Aに基づいて絞り込まれてもよい。組成式リスト58Aに基づくマッチング及び第1マススペクトルに基づくマッチングが同時に実行されてもよい。いずれにしても、二次検索においてマススペクトル以外の試料情報を利用することにより、その結果として、二次検索結果を適切に絞り込むことが可能となる。
【0075】
図8には、一次検索の具体例が示されている。一次ライブラリ48には、複数の化合物に対応した複数の標準マススペクトル122及び複数の構造式146が含まれる。第1マススペクトル120と複数の標準マススペクトル122の間で複数の類似度(スコア、Score)148が演算される。複数の類似度148が所定の条件を満たさない場合に検索範囲の拡大つまり二次検索の実行が判定される。
【0076】
図9には、二次検索の具体例が示されている。二次ライブラリ54には、複数の化合物に対応した複数の予測マススペクトル140及び複数の構造式156が含まれる。第2マススペクトル128に含まれる分子イオンピークに基づいて精密質量152が特定され、その精密質量に基づいて組成式リストが生成される。
【0077】
第1マススペクトル120と複数の予測マススペクトルの間で複数の類似度158が演算される。但し、実施形態においては、二次検索に際して、符号154で示すように、組成式リストによって二次検索の対象が絞り込まれる。
【0078】
以上説明した一連の処理が元試料から抽出された成分(化合物)ごとに実施される。成分ごとに分析結果が表示される。なお、以上説明した処理は、質量分析計の前段にGCが設けられていない場合においても適用することが可能である。
【0079】
図10には、第1マススペクトル列及び第2マススペクトル列に対する処理が示されている。上段には、第1マススペクトル列に基づいて生成された第1のTICC(トータルイオンカレントクロマトグラム)160が示されており、下段には、第2マススペクトル列に基づいて生成された第2のTICC162が示されている。横軸は保持時間(RT)を示しており、縦軸はTIC(トータルイオンカレント)を示している。
【0080】
第1のTICC160は、第1マススペクトル列を構成する各マススペクトルを積算することにより生成される。これと同様に、第2のTICC162は、第2マススペクトル列を構成する各マススペクトルを積算することにより生成される。第1のTICC160は、抽出された複数の成分に対応する複数の第1ピーク164を有する。第2のTICC162も、抽出された複数の成分に対応する複数の第2ピーク168を有する。ピーク検出技術を用いて個々のピークが特定される。つまり、個々の成分(化合物)情報が特定される。
【0081】
続いて、複数の第1ピーク164と複数の第2ピーク168の間で対応付け(ペアリング)が実施される。その際には、例えば、第1ピーク164ごとに、それを基準として範囲166が設定され、その範囲166内に属する第2ピークがペアリング対象として特定される。個々の第2ピークが基準とされてもよい。
【0082】
成分ごとに、保持時間軸上で並ぶ複数の第1マススペクトルが積算され、これにより第1積算マススペクトルが生成される。これと同様に、成分ごとに、保持時間軸上で並ぶ複数の第2マススペクトルが積算され、これにより第2積算マススペクトルが生成される。第1積算マススペクトル及び第2積算マススペクトルからなるスペクトルペアごとに、上記の一連の処理が適用される。
【0083】
図11には、ペアリングされた第1積算マススペクトル172及び第2積算マススペクトル174が示されている。第1積算マススペクトル172及び第2積算マススペクトル174の比較を通じて、第2積算マススペクトル174に含まれる分子イオンピーク178が特定される。図示の例では、第1積算マススペクトル172には、明確な分子イオンピークは含まれていない(符号176を参照)。分子イオンピーク178が生じているm/zに基づいて精密質量180が特定され、精密質量に基づいて組成式が推定される(符号182を参照)。
【0084】
図12には、第2検索結果を示す画像184が示されている。画像184には、二次検索により特定された複数の構造式からなる構造式リスト186が含まれる。複数の構造式は、類似度の大きさ順で並んでいる。各構造式188には類似度を示すスコア189が付加されている。現在、先頭の構造式188Aが選択された状態にある。
【0085】
画像184には、選択された構造式の拡大像190が含まれる。欄198には、選択された構造式に対して付与されたスコアが表示されている。欄200には、選択された構造式の順位が表示されている。欄196には、選択された構造式に対応する組成式が表示されている。画像184には、試料から得られた第1マススペクトル192及びそれに適合した予測マススペクトル194が含まれる。
【0086】
図13には、実施形態に係る試料分析方法が示されている。S10において、第1マススペクトル列が取得される。一方、S12において、第2マススペクトル列が取得される。S14では、第1マススペクトル列から生成された第1のTICCと第2マススペクトル列から生成された第2のTICCに基づいてピークペアリング(対応付け)が実行される。なお、この対応付けが他のタイミングで実施されてもよい。
【0087】
S16では、成分ごとに、複数の第1マススペクトルが積算されて第1積算マススペクトルが生成される。S18では、成分ごとに、複数の第2マススペクトルが積算されて第2積算マススペクトルが生成される。以下、第1積算マススペクトルを単に第1マススペクトルと称し、第2積算マススペクトルを単に第2マススペクトルと称する。符号204で示すように、S18及びS22以降の各工程は成分ごとに実行される。
【0088】
S18では、第1マススペクトルに対してピーク検出が実行され、これにより第1ピークリストが生成される。S22では、第2マススペクトルに対してピーク検出が実行され、これにより第2ピークリストが生成される。
【0089】
S26では、第2ピークリストに基づいて分子イオンピークが特定される。S26において分子イオンピークを特定できる限りにおいて、S22を省略してもよい。S28では、分子イオンピークに基づいて分子情報、具体的には複数の組成式が特定される。分子情報として、分子量又は精密質量が特定されてもよい。
【0090】
S30では、第1マススペクトル(具体的には第1ピークリスト)に基づいて第1ライブラリに対する一次検索が実行される。一次検索に際して、S28で特定された分子情報が利用されてもよい。すなわち、分子情報及び第1マススペクトルに基づいて第1ライブラリに対する一次検索が実行されてもよい。一次検索において分子情報を利用することにより、一次検索の精度を高められ、また、判定部の判定精度を高められる。
【0091】
S32では、一次検索結果が評価される。具体的には、二次検索の要否が判定される。S32において、二次検索が不要と判定された場合、S34を経由してS38が実行され、一次検索結果が表示される。
【0092】
一方、S32において、二次検索が必要と判定された場合、つまり検索範囲の拡大が判定された場合、S34を経由してS36が実行される。S36では、分子情報及び第1マススペクトルに基づいて二次ライブラリに対する二次検索が実行される。その後、S38において、二次検索結果が表示される。なお、二次検索により演算された複数の類似度が所定の条件を満たさない場合に、未登録を判定し、それをユーザーに報知してもよい。
【0093】
図14には、第1変形例に係る情報処理部16Aが示されている。図14において、図1に示した要素と同じ要素には同一の符号を付してある。このことは、後に説明する図15及び図16においても同様である。
【0094】
図14に示す第1変形例では、第2スペクトルに含まれる分子イオンピークに基づいて分子量(整数質量)を特定する分子量特定部202が設けられている。第2検索部52において、分子量及び第1スペクトルに基づいて二次ライブラリ54に対する二次検索が実行されている。この第1変形例では、分子量が二次検索に際して試料分子情報として利用されている。分子量に代えて精密質量が試料分子情報として利用されてもよい。
【0095】
図15には、第2変形例が示されている。質量分析計36に含まれるイオン源38AはEI法に従うイオン源であり、そのイオン源38Aはソフトイオン化法には対応していない。スペクトル作成部44Aでは、EIマススペクトルとしての第1マススペクトルだけが生成されている。第2検索部52では、第1マススペクトルに基づいて二次ライブラリ54に対する二次検索が実行されている。
【0096】
以上のように、分子情報を用いずに二次検索を行うことも可能である。第2変形例によれば、試料分析装置の構成を簡素化でき、特に二次ライブラリ54の内容を簡素化できる。その一方、第2変形例によると、二次検索に際して分子情報による絞り込みを行えない。高い推定精度を求める場合には、図1に示した構成を採用した方がよい。
【0097】
図16には、第3変形例が示されている。情報処理部16Cには、スペクトル予測部26Aが含まれる。スペクトル予測部26Aは、図1に示したスペクトル予測部26と同様の機能を発揮するものである。
【0098】
具体的には、スペクトル作成部44において作成された第2マススペクトル中の分子イオンピークに基づいて、精密質量特定部56が分子イオンピークに対応する精密質量を特定する。構造式推定部59が精密質量に基づいて複数の構造式を推定する。その際には、化合物データベース30が参照され、あるいは、二次ライブラリ54Aが参照される。
【0099】
スペクトル予測部26Aが有する予測モデル22Bに対して、複数の構造式を与えることにより、複数の予測マススペクトルが生成される。生成された複数の予測マススペクトルが二次ライブラリ54A内に登録される。その際には、複数の予測マススペクトルに対応する複数の構造式も二次ライブラリ54A内に登録される。化合物データベース30を参照することにより、複数の構造式の登録を省略してもよい。二次ライブラリ54Aは、例えば、図6に示した構造を有する。第2検索部52は、第1マススペクトルに基づいて二次ライブラリ54Aに対する二次検索を実行する。
【0100】
第3変形例によれば、二次検索に先立って、精密質量に基づいて二次検索結果の絞り込みを行える。すなわち、該当可能性のある複数の予測マススペクトルだけを検索対象にできる。これにより、二次検索結果の信頼性を高められる。精密質量に代えて分子量を用いてもよい。但し、分子量を用いる場合には、精密質量を用いる場合に比べて、生成される予測マススペクトルの個数が増大する。複数の予測スペクトルの生成に係る時間又は負担を無視し得ない場合には、事前に二次ライブラリを作成することが望まれる。すなわち、図1に示した構成を採用することが望まれる。
【符号の説明】
【0101】
10 情報処理装置、12 試料分析装置、14 測定部、16 情報処理部、18 モデル生成部、24 一次ライブラリ生成部、26 スペクトル生成部、32 二次ライブラリ生成部、36 質量分析計、38 イオン源、44 スペクトル作成部、46 第1検索部、48 一次ライブラリ、50 判定部、52 第2検索部、54 二次ライブラリ、56 精密質量特定部、58 組成式推定部。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16