IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 学校法人沖縄科学技術大学院大学学園の特許一覧

特許7562140化合物の構造を同定するための方法およびシステム
<>
  • 特許-化合物の構造を同定するための方法およびシステム 図1
  • 特許-化合物の構造を同定するための方法およびシステム 図2
  • 特許-化合物の構造を同定するための方法およびシステム 図3
  • 特許-化合物の構造を同定するための方法およびシステム 図4
  • 特許-化合物の構造を同定するための方法およびシステム 図5
  • 特許-化合物の構造を同定するための方法およびシステム 図6
  • 特許-化合物の構造を同定するための方法およびシステム 図7
  • 特許-化合物の構造を同定するための方法およびシステム 図8
  • 特許-化合物の構造を同定するための方法およびシステム 図9
  • 特許-化合物の構造を同定するための方法およびシステム 図10
  • 特許-化合物の構造を同定するための方法およびシステム 図11
  • 特許-化合物の構造を同定するための方法およびシステム 図12
  • 特許-化合物の構造を同定するための方法およびシステム 図13
  • 特許-化合物の構造を同定するための方法およびシステム 図14
  • 特許-化合物の構造を同定するための方法およびシステム 図15
  • 特許-化合物の構造を同定するための方法およびシステム 図16
  • 特許-化合物の構造を同定するための方法およびシステム 図17
  • 特許-化合物の構造を同定するための方法およびシステム 図18
  • 特許-化合物の構造を同定するための方法およびシステム 図19
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-27
(45)【発行日】2024-10-07
(54)【発明の名称】化合物の構造を同定するための方法およびシステム
(51)【国際特許分類】
   G01N 27/62 20210101AFI20240930BHJP
   G16Y 40/20 20200101ALI20240930BHJP
【FI】
G01N27/62 V
G01N27/62 D
G16Y40/20
【請求項の数】 5
(21)【出願番号】P 2020525704
(86)(22)【出願日】2019-06-14
(86)【国際出願番号】 JP2019023780
(87)【国際公開番号】W WO2019240289
(87)【国際公開日】2019-12-19
【審査請求日】2022-05-17
(31)【優先権主張番号】P 2018114216
(32)【優先日】2018-06-15
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】512155478
【氏名又は名称】学校法人沖縄科学技術大学院大学学園
(74)【代理人】
【識別番号】110001508
【氏名又は名称】弁理士法人 津国
(72)【発明者】
【氏名】早川 英介
【審査官】田中 洋介
(56)【参考文献】
【文献】国際公開第2017/036545(WO,A1)
【文献】特開2007-287531(JP,A)
【文献】国際公開第2012/095948(WO,A1)
【文献】米国特許出願公開第2018/0088094(US,A1)
【文献】米国特許出願公開第2015/0160231(US,A1)
【文献】特表2012-519859(JP,A)
【文献】米国特許出願公開第2017/0076927(US,A1)
【文献】米国特許出願公開第2013/0218478(US,A1)
【文献】津川裕司 他,メタボロミクスにおける化合物同定-生体内低分子代謝物の構造推定ガイド-,J.Mass Spectrom.Soc.Jpn.,2017年,pp.203-209
【文献】PAGLIA, Giuseppe et al.,Ion Mobility Derived Collision Cross Sections to Support Metabolomics Applications,analytical chemistry,2014年,Vol.86,pp.3985-3993
【文献】PEIRONCELY, Julio E,OMG: Open Molecule Generator,Journal of Cheminformatics,2012年,Vol.4 No.21,pp.1-13
(58)【調査した分野】(Int.Cl.,DB名)
G01N 27/62-27/70
G01N 33/48-33/98
(57)【特許請求の範囲】
【請求項1】
化合物の構造を分析する方法であって、
分析対象の化合物のフラグメントイオンおよび/または前駆体イオンの質量電荷比(m/z)から分析対象の化合物の質量および/または元素組成を推定する工程と、
推定された分析対象の化合物の質量および/または元素組成に基づいて、化学構造データベースに含まれる化学構造の中から検索、または元素組成に基づいて理論的に存在する構造を生成することで候補構造を取得する工程と、
候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程と、
推定フラグメントイオンの衝突断面積(CCS)若しくはCCSに対応するドリフトタイムを、標準物質のフラグメントイオンの構造、質量電荷比とCCS若しくはCCSに対応するドリフトタイムとを組み合わせたリファレンススペクトルデータベースおよび/またはフラグメントイオンの構造と理論的に計算されたCCS若しくはCCSに対応するドリフトタイムを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程と、
分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCS若しくはCCSに対応するドリフトタイムを、候補構造の推定フラグメントイオンの取得されたm/zおよびCCS若しくはCCSに対応するドリフトタイムとマッチさせ、分析対象の化合物の部分構造を推定する工程と、
部分構造に基づき、分析対象の化合物の構造を推定または同定する工程とを含む、
方法。
【請求項2】
候補構造取得工程において、化学構造データベースに含まれる化学構造の中から候補構造を取得するのに代えて、または、同取得に加えて、分析対象の化合物の推定される元素組成に基づいて理論的にとり得る構造を生成するための分子構造生成のアルゴリズムにより生成された化学構造の中から候補構造を取得する、請求項1記載の方法。
【請求項3】
化合物の構造を推定または同定するための方法であって、
分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)および衝突断面積(CCS)若しくはドリフトタイムを、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積若しくはドリフトタイムとを組み合わせたリファレンススペクトルデータベースおよび/またはフラグメントイオンの構造と理論的に計算されたCCS若しくはドリフトタイムを含む理論スペクトルデータベースにマッチさせる工程と、
所定の許容度でマッチしたフラグメントイオンの登録された構造を、分析対象の化合物のとり得る部分構造として取得する工程と、
部分構造を有する化学構造を化学構造データベースにおいて検索することにより、分析対象の化合物の候補構造を取得する工程と、
候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程と、
推定フラグメントイオンのCCS若しくはドリフトタイムを、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積若しくはドリフトタイムとを組み合わせたリファレンススペクトルデータベースおよび/または、フラグメントイオンの構造と理論的に計算されたCCS若しくはドリフトタイムを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程と、
分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCS若しくはドリフトタイムを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCS若しくはドリフトタイムとマッチさせる工程とを含む、
方法。
【請求項4】
候補構造取得工程において、部分構造を有する化学構造を化学構造データベースにおいて検索することにより候補構造を取得するのに代えて、観測されたフラグメントイオンの質量電荷比および衝突断面積若しくはドリフトタイムを、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積若しくはドリフトタイムとを組み合わせたリファレンススペクトルデータベースおよび/または、フラグメントイオンの構造と理論的に計算されたCCS若しくはドリフトタイムを含む理論スペクトルデータベースにマッチさせることで、候補部分構造を取得し、この部分構造と分析対象の化合物の推定される元素組成に基づいて理論的にとり得る構造を生成するための分子構造生成のアルゴリズムにより生成された化学構造の中から候補構造を取得する、請求項3記載の方法。
【請求項5】
化合物の構造を分析するシステムであって、
分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)若しくはCCSに対応するドリフトタイムとを組み合わせたスペクトルデータを生成するスペクトルデータ生成手段と、
分析対象の化合物のフラグメントイオンおよび/または前駆体イオンの質量電荷比(m/z)から分析対象の化合物の質量および/または元素組成を推定する質量・元素組成推定手段と、
化学構造データベースと、
推定された分析対象の化合物の質量および/または元素組成に基づいて、化学構造データベースに含まれる化学構造の中から候補構造を取得する候補構造取得手段と、
候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する推定フラグメントイオン構造取得手段と、
フラグメントイオンの構造と理論的に計算されたCCS若しくはCCSに対応するドリフトタイムを含む理論スペクトルデータベースと、
推定フラグメントイオンのCS若しくはCCSに対応するドリフトタイムを、理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する推定フラグメントイオンCCS若しくはCCSに対応するドリフトタイム取得手段と、
分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCS若しくはCCSに対応するドリフトタイムを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCS若しくはCCSに対応するドリフトタイムとマッチさせ、分析対象の化合物の部分構造を推定する部分構造推定手段と、
部分構造に基づき、分析対象の化合物の構造を推定または同定する、化合物推定/同定手段と、
化合物推定/同定手段による結果を出力する出力手段とを含み、
スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、質量・元素組成推定手段、化学構造データベース、候補構造取得手段、推定フラグメントイオン構造取得手段、理論スペクトルデータベース、推定フラグメントイオンCCS若しくはCCSに対応するドリフトタイム取得手段、部分構造推定手段、および化合物推定/同定手段と接続されている、
システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、化合物の構造を同定するための方法およびシステムに関する。
【背景技術】
【0002】
化合物、例えば、低分子化合物:代謝産物、天然物、薬物、汚染物質等の構造を同定することは、各種の分野、例えば、生理学、医学、食品、環境等の分野において重要である。このような化合物の構造の同定により、例えば、有用な天然物の同定、汚染物質の特定、バイオマーカー開発等が可能となる。
【0003】
化合物の構造を同定するための技術としては、例えば、質量分析法が挙げられる。質量分析法は、分析化学、生物医薬、環境調査/工業の分野において、化合物の構造同定に使用されている。質量分析法では、例えば、まず、液体クロマトグラフィーにより、試料中に含まれる化合物を分離し、分離された化合物をイオン化し、質量スペクトルを取得する。
【0004】
質量分析においては分析対象の化合物の前駆体イオンおよびこれを開裂させることにより生じるフラグメントイオンの質量電荷比情報を取得し、これを化合物の構造の推定に利用することがあるが、特に低分子化合物の場合観測されるフラグメントイオン数が少ないことが多く、また構造中の開裂部位を推定することが困難であり、さらに、考慮しなければならない候補構造が膨大であるため、質量分析のみの情報で化合物の構造を同定するのは困難であった。
【0005】
近年では、質量分析とイオンモビリティスペクトロメトリーとが統合された分析装置が存在し、そのような装置で測定された分析対象の化合物の前駆体イオンの衝突断面積についての情報を、あらかじめ標準物質を測定して得た質量電荷比および衝突断面積の値をデータベース化した情報にマッチングさせる例もある(特許文献1)が、この方法では、構造決定できる化合物は標準物質に依存してしまう問題がある。
【先行技術文献】
【特許文献】
【0006】
【文献】特表2018-517905号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
そこで、本発明は、多様な化合物の構造を同定することができる、構造同定の方法およびシステムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の化合物の構造を同定するための第1の方法は、
分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを、標準物質のフラグメントイオンの構造情報と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータベース内のスペクトルデータとマッチさせる工程を含む。
【0009】
本発明の化合物の構造を同定するための第2の方法は、
分析対象の化合物のフラグメントイオンおよび前駆体イオンの質量電荷比(m/z)から分析対象の化合物の質量および/または元素組成を推定する工程と、
推定された分析対象の化合物の質量および/または元素組成に基づいて、化学構造データベースに含まれる化学構造の中から検索、もしくは元素組成に基づいて理論的に存在する構造を生成することで候補構造を取得する工程と、
候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程と、
推定フラグメントイオンの衝突断面積(CCS)を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよびフラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程と、
分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンの取得されたm/zおよびCCSとマッチさせる工程とを含む。
【0010】
本発明の化合物の構造を同定するための第3の方法は、
分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)および衝突断面積(CCS)を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよびフラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースにマッチさせる工程と、
所定の許容度でマッチしたフラグメントイオンの登録された構造を、分析対象の化合物のとり得る部分構造として取得する工程と、
部分構造を有する化学構造を化学構造データベースにおいて検索することにより、分析対象の化合物の候補構造を取得する工程と、
候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程と、
推定フラグメントイオンのCCSを、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよび、フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程と、
分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせる工程とを含む。
【0011】
本発明の化合物の構造を同定するためのシステムは、
分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成するスペクトルデータ生成手段と、
標準物質のフラグメントイオンの構造と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータを含むリファレンススペクトルデータベースと、
フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースと、
スペクトルデータを、リファレンススペクトルデータベースおよび理論スペクトルデータベース内のデータとマッチさせるマッチング手段と、
リファレンススペクトルデータベースおよび理論スペクトルデータベース内の構造情報から候補構造を生成する候補情報生成手段と、
マッチング手段による結果を出力する出力手段とを含み、
スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、リファレンススペクトルデータベース、理論スペクトルデータベース、候補情報生成手段およびマッチング手段と接続されている。
【発明の効果】
【0012】
本発明によれば、多様な化合物の構造を同定することができる、化合物の構造を同定するための方法およびシステムを提供することができる。
【図面の簡単な説明】
【0013】
図1図1は、分析対象の化合物の質量分析とイオンモビリティスペクトロメトリーとによる分析手順の一例を示すフロー図である。
図2図2は、フラグメントイオンのスペクトルデータの一例を示す写真である。
図3図3は、複数の化合物を含有する分析試料を分析する場合の、分析手順の一例を示すフロー図である。
図4図4は、リファレンススペクトルデータベースを構築する手順の一例を示す図である。
図5図5は、本発明の方法の一例(実施態様1)の概要を示す図である。
図6図6は、理論スペクトルデータベースを構築する手順の一例を示す図である。
図7図7は、本発明の方法の他の例(実施態様2)の概要を示す図である。
図8図8は、機械学習モデルにより衝突断面積を予測する手順の一例を示す図である。
図9図9は、本発明の方法の一例(実施態様3)の概要を示す図である。
図10図10は、実施態様3の他の例の概要を示す図である。
図11図11は、実施態様3のさらに他の例の概要を示す図である。
図12図12は、本発明のシステムの一例(実施態様4)を示すブロック図である。
図13図13は、本発明の装置の一例(実施態様5)を示すブロック図である。
図14図14は、本発明の方法(実施態様1)の他の例を示す図である。
図15図15は、リファレンススペクトルデータベースの別の例を示す。
図16図16は、実施態様2の他の例を示す図である。
図17図17は、実施態様2のより具体的な例を示す図である。
図18図18は、実施態様3の他の例を示す図である。
図19図19は、実施態様3のより具体的な例を示す図である。
【発明を実施するための形態】
【0014】
項1.化合物の構造を同定するための方法であって、
分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを、標準物質のフラグメントイオンの構造情報と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータベース内のスペクトルデータとマッチさせる工程(マッチング工程)を含む、
方法。
項2.さらに、標準物質のフラグメントイオンの構造情報と質量電荷比および衝突断面積のデータを含むデータベースを構築する工程を含む、項1記載の方法。
項3.さらに、分析対象の化合物のフラグメントイオンを質量分析およびイオンモビリティ分析して、スペクトルデータを生成する工程(スペクトルデータ生成工程)を含む、項1または2記載の方法。
項4.さらに、分析対象の化合物の前駆体イオンの測定されたm/zとCCSとを組み合わせた化合物スペクトルデータを、標準物質の前駆体イオンの構造と同前駆体イオンのm/zおよびCCSとを組み合わせた前駆体イオンリファレンススペクトルデータとマッチさせる工程を含む、項1~3のいずれか一項記載の方法。
項5.さらに、分析対象の化合物の前駆体イオンを質量分析およびイオンモビリティ分析して、前駆体イオンスペクトルデータを生成する工程を含む、項4記載の方法。
項6.マッチング工程において、標準物質のフラグメントイオンの中から、分析対象の化合物のフラグメントイオンの観察された質量電荷比にマッチする質量を有するものを、候補としてリファレンススペクトルデータ内から検索し、各候補について、分析対象の化合物のスペクトルデータおよびリファレンススペクトルデータベースにおける質量電荷比および衝突断面積の両方を所定の許容差でマッチさせて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と決定する、項1~5のいずれか一項記載の方法。
項7.化合物の構造を同定するための方法であって、
分析対象の化合物のフラグメントイオンおよび前駆体イオンの質量電荷比(m/z)から分析対象の化合物の質量および/または元素組成を推定する工程(質量・元素組成推定工程)と、
推定された分析対象の化合物の質量および/または元素組成に基づいて、化学構造データベースに含まれる化学構造の中から検索、もしくは元素組成に基づいて理論的に存在する構造を生成することで候補構造を取得する工程(候補構造取得工程)と、
候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程(推定フラグメントイオン構造取得工程)と、
推定フラグメントイオンの衝突断面積(CCS)を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよびフラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程(推定フラグメントイオン衝突断面積取得工程)と、
分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンの取得されたm/zおよびCCSとマッチさせる工程(マッチング工程)とを含む、
方法。
項8.候補構造取得工程において、化学構造データベースに含まれる化学構造の中から候補構造を取得するのに代えて、または、同取得に加えて、分析対象の化合物の推定される元素組成に基づいて理論的にとり得る構造を生成するための分子構造生成のアルゴリズムにより生成された化学構造の中から候補構造を取得する、項7記載の方法。
項9.マッチング工程において、分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせ、各候補構造に対して、質量電荷比と衝突断面積とのマッチペアの数とフラグメントイオンのピーク強度とに基づいて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と決定する、項7または8記載の方法。
項10.化合物の構造を同定するための方法であって、
分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)および衝突断面積(CCS)を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよびフラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースにマッチさせる工程(第1のマッチング工程)と、
所定の許容度でマッチしたフラグメントイオンの登録された構造を、分析対象の化合物のとり得る部分構造として取得する工程(部分構造取得工程)と、
部分構造を有する化学構造を化学構造データベースにおいて検索することにより、分析対象の化合物の候補構造を取得する工程(候補構造取得工程)と、
部分構造と元素組成をもとに理論的に存在し得る候補構造を生成する工程(候補構造生成工程)と、
候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程(推定フラグメントイオン構造取得工程)と、
推定フラグメントイオンのCCSを、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよび、フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程(推定フラグメントイオン衝突断面積取得工程)と、
分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせる工程(第2のマッチング工程)とを含む、
方法。
項11.候補構造取得工程において、部分構造を有する化学構造を化学構造データベースにおいて検索することにより候補構造を取得するのに代えて、観測されたフラグメントイオンの質量電荷比および衝突断面積を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよび、フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースにマッチさせることで、候補部分構造を取得し、この部分構造と分析対象の化合物の推定される元素組成に基づいて理論的にとり得る構造を生成するための分子構造生成のアルゴリズムにより生成された化学構造の中から候補構造を取得する、項10記載の方法。
項12.第1のマッチング工程において、標準物質のフラグメントイオンの中から、分析対象の化合物のフラグメントイオンの観察された質量電荷比にマッチする質量を有するものを、候補としてリファレンススペクトルデータ内から検索し、各候補について、分析対象の化合物のスペクトルデータおよびリファレンススペクトルデータベースにおける質量電荷比および衝突断面積の両方を所定の許容差でマッチさせて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と決定し、
第2のマッチング工程において、分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせ、各候補構造に対して、質量電荷比と衝突断面積とのマッチペアの数とフラグメントイオンのピーク強度とに基づいて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と決定する、項10または11記載の方法。
項13.化合物の構造を同定するためのシステムであって、
分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成するスペクトルデータ生成手段と、
標準物質のフラグメントイオンの構造と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータを含むリファレンススペクトルデータベースと、
フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースと、
スペクトルデータを、リファレンススペクトルデータベースおよび理論スペクトルデータベース内のデータとマッチさせるマッチング手段と、
リファレンススペクトルデータベースおよび理論スペクトルデータベース内の構造情報から候補構造を生成する手段と、
マッチング手段による結果を出力する出力手段とを含み、
スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、リファレンススペクトルデータベース、理論スペクトルデータベース、候補情報生成手段およびマッチング手段と接続されている、
システム。
項14.マッチング手段が、標準物質のフラグメントイオンの中から、分析対象の化合物のフラグメントイオンの観察された質量電荷比にマッチする質量を有するものを、候補としてリファレンススペクトルデータ内から検索し、各候補について、分析対象の化合物のスペクトルデータおよびリファレンススペクトルデータベースにおける質量電荷比および衝突断面積の両方を所定の許容差でマッチさせて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と判定する、項13記載のシステム。
項15.化合物の構造を同定するためのシステムであって、
分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成するスペクトルデータ生成手段と、
分析対象の化合物のフラグメントイオンおよび前駆体イオンの質量電荷比(m/z)から分析対象の化合物の質量および/または元素組成を推定する質量・元素組成推定手段と、
化学構造データベースと、
推定された分析対象の化合物の質量および/または元素組成に基づいて、化学構造データベースに含まれる化学構造の中から候補構造を取得する候補構造取得手段と、
候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する推定フラグメントイオン構造取得手段と、
フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースと、
推定フラグメントイオンの衝突断面積(CCS)を、理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する推定フラグメントイオン衝突断面積取得手段と、
分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせるマッチング手段と、
マッチング手段による結果を出力する出力手段とを含み、
スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、質量・元素組成推定手段、化学構造データベース、候補構造取得手段、推定フラグメントイオン構造取得手段、理論スペクトルデータベース、推定フラグメントイオン衝突断面積取得手段およびマッチング手段と接続されている、
システム。
項16.マッチング手段が、分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせ、各候補構造に対して、質量電荷比と衝突断面積とのマッチペアの数とフラグメントイオンのピーク強度とに基づいて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と判定する、項15記載のシステム。
項17.化合物の構造を同定するためのシステムであって、
分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成するスペクトルデータ生成手段と、
分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)および衝突断面積(CCS)を、標準物質のフラグメントイオンの質量電荷比および衝突断面積とマッチさせる第1のマッチング手段と、
所定の許容度でマッチした標準物質のフラグメントイオンの登録された構造を、分析対象の化合物のとり得る部分構造として取得する部分構造取得手段と、
化学構造データベースと、
部分構造を有する化学構造を化学構造データベースにおいて検索することにより、分析対象の化合物の候補構造を取得する候補構造取得手段と、
候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する推定フラグメントイオン構造取得手段と、
フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースと、
推定フラグメントイオンのCCSを、理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する推定フラグメントイオン衝突断面積取得手段と、
分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせる第2のマッチング手段と、
第2のマッチング手段による結果を出力する出力手段とを含み、
スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、第1のマッチング手段、部分構造取得手段、化学構造データベース、候補構造取得手段、推定フラグメントイオン構造取得手段、理論スペクトルデータベース、推定フラグメントイオン衝突断面積取得手段および第2のマッチング手段と接続されている、
システム。
項18.第1のマッチング手段が、標準物質のフラグメントイオンの中から、分析対象の化合物のフラグメントイオンの観察された質量電荷比にマッチする質量を有するものを、候補としてリファレンススペクトルデータ内から検索し、各候補について、分析対象の化合物のスペクトルデータおよびリファレンススペクトルデータベースにおける質量電荷比および衝突断面積の両方を所定の許容差でマッチさせて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と判定し、
第2のマッチングが、分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせ、各候補構造に対して、質量電荷比と衝突断面積とのマッチペアの数とフラグメントイオンのピーク強度とに基づいて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と判定する、項17記載のシステム。
項19.化合物の構造を同定するための装置であって、
分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成する手段と、
標準物質のフラグメントイオンの構造と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータを含むリファレンススペクトルデータベースと、
スペクトルデータを、リファレンススペクトルデータとマッチさせる手段と、
マッチさせた結果を出力する手段とを含む、
装置。
項20.化合物の構造を同定するための方法であって、
分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成する工程と、
スペクトルデータを、標準物質のフラグメントイオンの構造と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータを含むデータベース中に含まれるリファレンススペクトルデータとマッチさせる工程とを含む、
方法。
【0015】
つぎに、本発明の実施態様について説明する。なお、本発明は、下記実施態様により何ら限定および制限されない。図1~19において、「DB」という略称が使用されている場合があり、これは、「データベース」の略称である。
【0016】
(第1の実施態様)
本発明の第1の実施態様は、前述の化合物の構造を同定するための方法であり、同方法の主体は、人である。本実施態様において、人が行う手順のうち、コンピュータ上で実行されていると解釈することもできる手順は、例えば、人がコンピュータに該当する手順を実行させていると解釈することもできる。本実施態様は、前述の、標準物質由来のリファレンススペクトルデータおよび既知の化合物構造から理論的に生成するリファレンススペクトルデータ生成工程と、フラグメント構造からの質量電荷比および衝突断面積の計算とマッチング工程とを含む。
【0017】
1.化合物のスペクトルデータ生成工程
1-1.質量電荷比および衝突断面積の測定
本工程において、イオン化した化合物の前駆体イオンおよびフラグメントイオンを質量分析法およびイオンモビリティ―スペクトロメトリーにより測定し、スペクトルデータを生成する。同データを生成するために、まず、分析対象の化合物のフラグメントイオンの質量電荷比および衝突断面積を測定する。具体的には、例えば、分析対象の化合物を、質量分析とイオンモビリティスペクトロメトリーとにより分析する(図1および2)。この場合、通常、フラグメントイオンの質量電荷比および衝突断面積の測定と併せて、前駆体イオンの質量電荷比および衝突断面積の測定も行う。具体的には、例えば、図1の左側(化合物の前駆体イオン)および右側(フラグメントイオン)に示されたように、質量分析とイオンモビリティスペクトロメトリーとを行う。まず、分析対象の化合物を、質量分析装置上のイオン源によりイオン化する。イオン源としては、例えば、エレクトロスプレーイオン化、大気圧光イオン化、電子衝撃イオン化、脱着エレクトロスプレーイオン化、マトリックス支援レーザー脱着イオン化および他の関連する方法を挙げることができるが、これらに限定されない。質量電荷比を、質量分析装置、例えば、フーリエ変換イオンサイクロトロン共鳴、飛行時間、オービトラップまたは他の分析器により測定する。衝突断面積を、イオンモビリティスペクトロメトリー測定装置、例えば、ドリフトチューブ、トラベリングウェーブ、高フィールド非対称波形装置によって化合物の前駆体イオンを分離することでドリフトタイムを測定することにより取得する。衝突断面積を、衝突断面積が既知である標準化合物の検量線のドリフトタイムを用いてキャリブレーションすることにより取得する。図2に、フラグメントイオンのスペクトルデータの一例を示す。
【0018】
分析対象の化合物のフラグメントイオン情報を、以下のように取得する。まず、質量フィルタ、例えば、質量分析装置に備わった四重極またはイオントラップ装置を適用することにより、分析対象の化合物の前駆体イオンを単離する。ついで、フラグメント化装置、例えば、衝突誘起解離、高エネルギー衝突誘起解離、電子捕捉解離または電子移動解離等を使用することにより、分析対象の化合物の前駆体イオンのフラグメント化を引き起こす。また、分析対象の化合物をガスクロマトグラフィーにより測定する場合、電子移動解離が生じるため、フラグメントイオンを取得することができる。
【0019】
複数の化合物を含有する試料について分析を行う場合、まず、これらの化合物を、クロマトグラフィー法、例えば、液体クロマトグラフィー、キャピラリー電気泳動または超臨界流体クロマトグラフィーにより分離する(図3左側)。ついで、各スキャンにおいて検出された化合物の前駆体イオンを、上記のように測定する。分析試料を、ガスクロマトグラフィーを使用して分離する場合、各化合物由来のフラグメントイオンの質量電荷比および衝突断面積は、フラグメントイオンのデコンボリューションにより生成する。
【0020】
あるいは、質量分析装置を化合物分離機器、例えば、液体クロマトグラフィー、キャピラリー電気泳動または超臨界流体クロマトグラフィーに連結することにより分析を行う場合、分析対象の化合物のフラグメントイオンを、SWATHのようなデータ非依存取得法により取得する(図3右側)。データ非依存取得法では、狭い質量ウィンドウ内の分析対象の化合物の前駆体イオンを分離し、これをフラグメンテーションに供する。この一連のプロセスを、全質量範囲にわたって繰り返し、段階的に進める。前駆体化合物に由来するフラグメントイオンを、フラグメントイオンデータ非依存取得データのデコンボリューションにより取得することができる(Tsugawa et al.,Nat Methods.12:523-6(2015))。
【0021】
2.マッチング工程
本工程において、分析対象の化合物のフラグメントイオンの測定された質量電荷比と衝突断面積とを組み合わせたスペクトルデータを、標準物質を測定することで得られたフラグメントイオンの質量電荷比および衝突断面積の値とフラグメントイオンの推定構造を記載したリファレンススペクトルデータとマッチさせる。マッチングの方法については、後述する。
【0022】
2-1.リファレンススペクトルデータベース
前述の標準物質のスペクトルデータ(リファレンススペクトルデータ)は、例えば、リファレンススペクトルデータベースに含まれる。このデータベースを、分析対象の化合物の構造同定に使用する。このデータベースは、例えば、各ユーザのクライアント端末の補助記憶装置に記憶されていてもよいし、サーバ上に記憶されていてもよい。本発明において、ユーザは、例えば、予め構築されているリファレンススペクトルデータベースを利用してもよいし、リファレンススペクトルデータベースを構築し、利用してもよいし、先に生成された分析対象の化合物のスペクトルデータをリファレンススペクトルデータベースに含ませて、リファレンススペクトルデータベースを更新してもよい。
【0023】
2-2.リファレンススペクトルデータベースの構築
前述のように、例えば、構造が既知の標準物質のリファレンススペクトルデータを含むリファレンススペクトルデータベースを構築することができる。例えば、リファレンススペクトルデータベースを、標準物質のフラグメントイオンの質量電荷比および衝突断面積を前述の分析対象の化合物の質量電荷比および衝突断面積の測定と同様に測定し、標準物質のフラグメントイオンの構造と組み合わせてリファレンススペクトルデータを生成することにより構築することができる(図4)。標準物質としては、例えば、化学的に合成された標準化合物が挙げられ、また、標準試料(例えば、動物および植物組織抽出物、環境および医療試料)から単離された化合物であって、その存在および構造が既に文献に記載されている化合物も挙げられる。また、本発明において、先にスペクトルデータが生成され、構造が同定された化合物も、標準物質として利用可能である。
【0024】
まず、標準物質または標準試料について、それらの化合物の前駆体イオンの質量電荷比および衝突断面積を測定し、これらの値を、それらの化合物の構造と共にデータベースに記憶させる。ついで、前述の化合物の前駆体イオンをフラグメント化し、フラグメントイオンの質量電荷比および衝突断面積を測定し、これらの値をデータベースに記憶させる。
【0025】
標準物質の測定されたフラグメントイオンの構造を、下記のように推定する。具体的には、例えば、理論的および可能性のあるフラグメントイオンの構造を、標準物質(化合物の前駆体イオン)の構造中の共有結合を系統的に切断することにより計算し、この計算された構造から、この構造についての質量電荷比を計算する。計算された質量電荷比が観察されたフラグメントイオンの値と一致する場合、一致したフラグメントイオンの構造を、測定された質量電荷比および衝突断面積と共に、フラグメントイオンの可能性のある構造として登録する。
【0026】
あるいは、標準物質の観察されたフラグメントイオンの構造を推定するために、例えば、フラグメント化のモデルおよびそれに伴う構造の再編成を、標準物質の分子構造に適用する。この構造推定は、例えば、入力としてフラグメント化スペクトルデータおよび分子構造により訓練された機械学習モデルであるフラグメント化予測ツールCFM-predict(Allen et al.,Nucleic Acids Re.s 42:W94-9(2014))等の、フラグメント予測により達成され得る。また、フラグメントイオンの構造を予測するために、公開された文献から収集されたフラグメント化規則およびメカニズムを、標準物質(化合物の前駆体イオン)の化学構造に適用する。この予測は、例えば、部分構造ライブラリRDKitを使用するSMARTSパターンマッチングによって部分構造をスキャンすることにより達成され得る。また、MassFrontier(Thermo Fisher Science)等のフラグメントルールを適用することによりフラグメント構造を予測するツールも、フラグメント化規則を適用し、フラグメント化構造を生成するのに使用される。測定されたフラグメントスペクトルのピークに一致する質量電荷比を有するフラグメント化構造を、観測された質量電荷比および衝突断面積と共に化合物のエントリに加える。
【0027】
以下に、前述のマッチング工程を詳述する。本工程では、リファレンススペクトルデータベースに含まれるリファレンススペクトルデータを利用するため、本方法を、リファレンススペクトルデータベース依存法ということがある。なお、以下で詳述する方式は例示であり、本発明を何ら限定するものではない。
【0028】
分析対象の化合物のスペクトルデータを、リファレンススペクトルデータと比較することにより、本工程を達成する。図5に、本実施態様の一例を示す。まず、標準物質のフラグメントイオンのうち、観察された質量電荷比にマッチする質量を有するものを、候補としてリファレンススペクトルデータ内から検索し、化合物エントリとする。各候補について、分析対象の化合物のスペクトルデータおよびリファレンススペクトルデータベースにおける質量およびイオンモビリティピークの比較を、質量電荷比および衝突断面積の両方を所定の許容差でマッチさせることにより行う。候補を評価するために、下記のようなスコア関数を利用する。
【数1】

式中、mは、候補化合物のリファレンススペクトルデータ中のフラグメントイオン数である。リファレンススペクトルデータ中のフラグメントイオンの質量電荷比および衝突断面積が分析対象の化合物の測定されたフラグメントイオンの質量電荷比および衝突断面積とマッチする場合、P=1である。リファレンススペクトルデータ中のフラグメントイオンの質量電荷比および衝突断面積が分析対象の化合物の測定されたフラグメントイオンの質量電荷比または衝突断面積とマッチしない場合、P=0である。Iは、測定されたスペクトルにおけるピーク強度である。得られたスコアを使用して、候補を比較し、トップスコアを示す候補を、分析対象の化合物の実際の構造と決定する。なお、候補の評価には、厳密に上記関数を利用するのみではなく、同様なマッチしたフラグメントイオンの数とそのシグナル強度を考慮した関数を利用することもできる。
【0029】
以上のように、分析対象の化合物のスペクトルデータを、リファレンススペクトルデータベースとマッチングさせることにより、本実施態様の方法によれば、多様な化合物の構造を同定することができる。
【0030】
従来技術では、化合物自体(前駆体イオン)のイオンモビリティのみを利用しており、フラグメントイオンのイオンモビリティを利用していない。したがって、構造同定が可能であるのはすでに同一の化合物での実測データがある化合物に限定される。そして、現在のイオンモビリティ分析装置では前駆体イオンの衝突断面積情報は、化合物を同定するのに十分な解像能を有さないうえに、複数の化合物が同一の衝突断面積を有するケースも存在しうるため、膨大な候補構造の中から構造同定を行うことは事実上不可能である。一方、本実施態様の方法によれば、化合物由来の複数のフラグメントイオンの固有の構造を反映した衝突断面積を用いるため、候補構造が膨大であっても、またイオンモビリティ分析装置の解像度が十分でなくとも高精度で構造同定が可能である。
【0031】
図14に、本実施形態の方法の他の例を示す。図14では、リファレンススペクトルデータについて具体的な化合物が例示されているが、本発明は、これには限定されず、多種多様な化合物のリファレンススペクトルデータをリファレンススペクトルデータベースの構築に利用できる。また、図15に、リファレンススペクトルデータベースの別の例を示す。この図では、標準物質のフラグメントイオン(部分構造)の質量(質量電荷比)およびイオンモビリティの詳細なデータを示す。本発明では、分析対象の化合物のフラグメントイオンのスペクトルデータを、この図に示されたようなリファレンススペクトルデータとマッチングさせることにより、すなわち、質量(質量電荷比)およびイオンモビリティのマッチングにより、分析対象の化合物の同定が可能となる。なお、この図において、リファレンススペクトルデータについて具体的な化合物が例示されているが、本発明は、これには限定されず、多種多様な化合物のリファレンススペクトルデータをリファレンススペクトルデータベースの構築に利用できる。
【0032】
(第2の実施態様)
本発明の第2の実施態様は、前述の分析対象の化合物の構造を同定するための方法であり、同方法の主体は、人である。本実施態様において、人が行う手順のうち、コンピュータ上で実行されていると解釈することもできる手順は、例えば、人がコンピュータに該当する手順を実行させていると解釈することもできる。本実施態様は、分析対象の化合物が前述の標準物質によるリファレンススペクトルデータベースに登録されていない場合において、その化学構造を同定するための方法である。本実施態様は、前述の、質量・元素組成推定工程と、候補構造取得工程と、推定フラグメントイオン構造取得工程と、推定フラグメントイオン衝突断面積取得工程と、マッチング工程とを含む。図7に、本実施形態の一例の概要を示す。
【0033】
1.質量・元素組成推定工程
本工程において、まず、前述の実施態様1の「1-1.質量電荷比(m/z)および衝突断面積(CCS)の測定」に記載されたように、分析対象の化合物の前駆体イオンおよびフラグメントイオンの質量電荷比および衝突断面積を測定する。この測定結果から、分析対象の化合物の質量および/または元素組成を推定する。分析対象の化合物の元素組成を、イオン化付加体の種類および測定誤差を考慮して推定し、ついで、原子価規則および元素比でフィルタリングする。候補元素組成に基づき候補分子構造を推定し、分析対象の化合物のフラグメントイオンに同じプロセスを適用することによりさらに選択する。
【0034】
2.候補構造取得工程
本実施態様では、本工程を化学構造データベース依存法および非依存法の両方により行う。なお、本工程は、必ずしも化学構造データベース依存法および非依存法の両方により行う必要はなく、例えば、化学構造データベース依存法のみで行ってもよいし、化学構造データベース非依存法のみにより行ってもよい。本実施態様では、化学構造データベース依存法により下記のように候補構造を検索し、化学構造データベース非依存法により候補構造を生成する。
【0035】
2-1.化学構造データベース依存法
化学構造データベースとしては、例えば、PubChemおよびChEBIが挙げられるが、これらに限定されない。化学構造データベースにおける候補化学構造のリストの中から真の構造を検索することにより構造決定を行う場合、分析対象の化合物の測定された質量電荷比に基づいて分析対象の化合物の質量をマッチさせることにより検索し、候補構造を選択する(図7における「化学構造DB依存」)。分析対象の化合物を陽イオンモードで測定した場合、[M+H]+および[M+Na]+等の陽イオン付加体タイプを考慮し、候補構造の質量にマッチさせる。分析対象の化合物を陰イオンモードで測定した場合、[M-H]-等の陰イオン付加体タイプを考慮し、候補構造の質量にマッチさせる。
【0036】
2-2.化学構造データベース非依存法
候補情報、例えば、化学構造データベースを何ら使用せずに候補構造決定を行う場合、候補構造を、分子構造生成アルゴリズムにより生成する。具体的には、例えば、理論的分子構造生成ツール、例えば、Open Molecular Generator(Peironcely et al.,J.Cehmoinfo.(2012)4:21)またはMOLGEN等を使用して、分析対象の化合物の推定された元素組成に基づいて理論的に存在し得る候補構造を生成する。
【0037】
3.推定(仮想)フラグメントイオン構造取得工程
上記化学構造データベース依存法により候補構造を検索・選択し、上記化学構造データベース非依存法により候補構造を生成した後に、これらの分析対象の化合物の候補構造から、前述の実施態様1の「2-2.リファレンススペクトルデータベースの構築」において記載されたのと同様に、系統的切断ならびに/またはフラグメント化モデルおよびフラグメント化による構造の再編成を考慮し、分析対象の化合物の候補構造の推定(仮想)フラグメントイオンを生成(予測)する。
【0038】
4.推定(仮想)フラグメントイオン衝突断面積取得工程
仮想フラグメントイオンの衝突断面積を、前述のリファレンススペクトルデータベースおよび後述の理論フラグメントデータベースを検索することにより取得する。なお、本工程において、必ずしも、リファレンススペクトルデータベースを検索する必要はなく、理論スペクトルデータベースのみを検索してもよい。この検索の結果、仮想フラグメントイオンと同一の構造を有するフラグメントイオンが見出された場合、そのフラグメントイオンについて登録された衝突断面積を検索する。仮想フラグメントイオンと同一の構造を有するフラグメントイオンが見出されなかった場合、これらの仮想フラグメントの衝突断面積を、後述の方法により仮想フラグメントの構造に基づいて計算する。例えば、この計算により求められた仮想フラグメントの衝突断面積を、同仮想フラグメントの構造と共に、理論データベースに登録することができる。これにより、理論データベースのカバーするフラグメント構造がより豊富になる。
【0039】
4-1.理論スペクトルデータベース
前述の理論スペクトルデータベースは、フラグメントイオンの質量電荷比と理論的に計算された衝突断面積を含む。このようなデータベースを、以下のように構築することができる。すなわち、まず、化合物の二次元構造を、化学構造のリソース、例えば、化学構造データベース、例えば、InChIやSMILESのようなテキスト化学構造識別子またはファイル、例えば、SDFとして取得する。ついで、これらの識別子またはファイルを、ケモインフォマティクスライブラリ、例えば、RDKitを使用することにより2D構造に変換し、化合物のフラグメントイオンの構造を、前述の第1の実施態様の「2-2.リファレンススペクトルデータベースの構築」に記載されているように、フラグメント化モデルおよび規則を適用することにより推定する。ついで、生成されたフラグメント構造を使用して、それらの質量電荷比および衝突断面積を計算する。衝突断面積の計算は、以下に詳述する。フラグメントイオンの構造を、その計算された質量電荷比および衝突断面積と共に理論スペクトルデータベースに登録し、計算方法とタグ付けする(図6)。
【0040】
4-2.理論衝突断面積の計算
理論衝突断面積を、下記のように計算する。すなわち、まず、化学識別子、例えば、InChIもしくはSMILESまたはファイル、例えば、SDFとして記載される化合物の2D構造を、化学構造データベース、例えば、PubChemから取得する。ほとんどの酸性または塩基性アミノ酸については、プロトン化、脱プロトン化および他の付加部位を予測するために、pKa計算ツール、例えば、Marvin pKaプラグイン(ChemAxon)またはケモインフォマティクスライブラリ等を使用して推定する。化合物のイオン形態を、プロトンまたはナトリウム等の付加物を最も塩基性の原子に付着させることにより生成する。陰イオンの場合、最も酸性の原子に結合している水素を除去して、陰イオン構造を生成する。
【0041】
例えば、化合物の前駆体イオンについての100個のコンフォーマを生成し、それらの構造を、ケモインフォマティクスツールキット、例えば、RDKitを使用してMMFF94分子力場を適用することにより最適化する。最低エネルギーを有するコンフォーメーションを選択し、計算化学ツール、例えば、Gaussianを使用して、B3LYP交換相関関数および6-31g基底集合による密度関数理論により電子分布を計算する。衝突断面積を、イオンモビリティ解析に使用される緩衝気体(例えば、NおよびCO)用に修正された、MOBCALソフトウェアを使用するTrajectory法またはExact Hard Sphere法により計算する。
【0042】
4-3.機械学習モデルによる衝突断面積の予測
このアプローチでは、化合物の前駆体イオンおよびフラグメントイオンの衝突断面積を、統計学的および機械学習アプローチにより予測する(図8)。
【0043】
リファレンススペクトルデータベースにおける各フラグメントイオンの推定構造について、分子記述子およびフィンガープリントを、下記のように計算する。分子記述子生成器、例えば、PaDEL-Descriptorを使用して、分子記述子(構成的、WHIM、トポロジー的、フィンガープリント)を生成する。円形ECFPフィンガープリントを、ケモインフォマティックスツールキット、例えば、RDKitにより生成する。3Dコンフォーマフィンガープリントおよび記述子について、まず、コンフォーマ候補を、本実施態様の「4-2.理論衝突断面積の計算」に記載されているように、各化合物前駆体イオンおよびそのフラグメントイオン構造について生成する。球面拡張3Dフィンガープリント(E3FP)を、E3FPアルゴリズムにより生成する。体積、分子表面積等の3Dコンフォーマ関連値を、本実施態様の「4-2.理論衝突断面積の計算」に記載されている最適化された3Dコンフォーマから計算する。
【0044】
観測された分子記述子およびフィンガープリントを、訓練データセットとして使用し、機械学習ライブラリ、例えば、Scikit-learnを使用して、衝突断面積を予測するサポートベクトル回帰モデルを構築する。2つのパラメータ:制約違反のコストおよびガンマの組み合わせを、交差検証試験により訓練データを使用して評価する。予測のための最良の最小平均二乗誤差を与えるパラメータペアを、予測モデルのために選択する。
【0045】
5.マッチング工程
本工程において、分析対象の化合物の各候補構造に関する予測されたフラグメントイオンの各構造について、リファレンススペクトルデータベースおよび理論スペクトルデータベースに対して同一の構造を検索することにより、候補フラグメント(仮想フラグメントイオン)構造の質量電荷比および衝突断面積を得る。候補フラグメント構造がこれらデータベースに見出されなかった場合は、上記4-2および4-3により衝突断面積の計算および予測を行う。なお、この際、計算されたフラグメントイオンの衝突断面積を理論スペクトルデータベースに登録されることでデータベースを拡充することができる。マッチングを、例えば、以下のように行う。すなわち、まず、これらの標準物質由来もしくは仮想のフラグメントイオンの質量電荷比および衝突断面積を、分析対象の化合物のフラグメントイオンのスペクトルデータにおける質量電荷比および衝突断面積とマッチさせる。このようにして、各化合物候補に対して、質量電荷比と衝突断面積とのマッチペアの数とフラグメントイオンのピーク強度とに基づいて、以下に示されるスコアリング関数により評価する。
【数2】

式中、mは、測定された分析対象の化合物のスペクトルデータ中のフラグメントイオン数である。仮想フラグメントイオンの質量電荷比および衝突断面積が測定されたフラグメントイオンの質量電荷比および衝突断面積とマッチする場合、P=1である。仮想フラグメントイオンの質量電荷比および衝突断面積が測定されたフラグメントイオンの質量電荷比および衝突断面積とマッチしない場合、P=0である。Iは、測定されたフラグメントイオンのピーク強度である。Wは、重み係数である。衝突断面積をリファレンススペクトルデータベースから取得する場合、W=1である。衝突断面積を、「4-2.理論衝突断面積の計算」または「4-3.機械学習モデルによる衝突断面積の予測」により導出する場合、それぞれW=0.8と0.6である。得られたスコアを使用して、候補を比較し、トップスコアを示す候補を、分析対象の化合物の実際の構造と決定する。なお、候補の評価には、厳密に上記関数を利用するのみではなく、同様なマッチしたフラグメントイオンの数とそのシグナル強度を考慮した関数を利用することもできる。
【0046】
以上のようにマッチングさせることにより、本実施態様の方法によれば、標準物質または標準試料のリファレンススペクトルデータベース中に該当するものが登録されていない化合物についても、その化合物の構造を同定することができる。
【0047】
図16に、本実施形態の方法の他の例を示す。図16では、化学構造データベースおよび分子構造生成について具体的な化合物が例示されているが、本発明は、これには限定されず、多種多様な化合物の化学構造データベースおよび分子構造生成に利用できる。
【0048】
図17に、本実施形態の方法のより具体的な例を示す。なお、図17には、具体的な化合物が例示されているが、本発明は、これには限定されず、本発明によれば、多種多様な化合物の構造を同定することができる。
【0049】
(第3の実施態様)
本発明の第1の実施態様は、前述の分析対象の化合物の構造を同定するための方法であり、同方法の主体は、人である。本実施態様において、人が行う手順のうち、コンピュータ上で実行されていると解釈することもできる手順は、例えば、人がコンピュータに該当する手順を実行させていると解釈することもできる。本実施態様は、前述の、第1のマッチング工程と、部分構造取得工程と、候補構造取得工程と、推定フラグメントイオン構造取得工程と、推定(仮想)フラグメントイオン衝突断面積取得工程と、第2のマッチング工程とを含む。本実施態様の方法を、スペクトル類似度法ということがある。図9~11に、本実施態様の方法の例を示す。
【0050】
1.第1のマッチング工程
本工程を、前述の実施態様1の「2.マッチング工程」と同様に行うことができる。すなわち、分析対象の化合物のフラグメントイオンの測定されたスペクトルデータを、リファレンススペクトルデータベースに対して検索する(図9~11)。
【0051】
2.部分構造取得工程
分析対象の化合物のフラグメントイオンが、このリファレンススペクトルデータにおいて質量電荷比および衝突断面積が所定の許容度でマッチすることが見出された複数のフラグメントイオンを有する場合、それらのフラグメントイオンの登録された構造を取得する。ここで、これらのフラグメントイオンの構造を、分析対象の化合物の部分構造の候補と見なすことができる。これらのフラグメントイオンは、質量電荷比と衝突断面積との同じ固有の組み合わせを有するためである。すなわち、このような標準物質と分析対象の化合物とは、共通の部分構造としてそれらのフラグメントイオンを有する可能性が高いとみなすことができる。
【0052】
分析対象の化合物の候補構造の検索を、例えば、前述の実施態様2の「2-1.化学構造データベース依存法」により行うことができる。ついで、検索された候補構造について、リファレンススペクトルデータベースから検索された部分構造を有するか、さらに検査する(図9および11)。
【0053】
候補構造決定を予め選ばれた構造候補なし(すなわち、化学構造データベースを何ら使用せず)に達成する場合、それらの候補構造を、例えば、前述の実施態様2の「2-2.化学構造データベース非依存法」に記載されたように、分子構造生成のアルゴリズムにより生成する(図10)。また、リファレンススペクトルデータベースから得られたフラグメントイオンの構造または構造群を出発点として、そこから、観測された分析対象の化合物の組成式を満たす、理論的にとり得る構造を全て生成して候補構造とすることも行う。このような候補構造生成を、例えば、Open Molecular Generator(Peironcely et al.,J.Cheminfo.(2012)4:21)のような理論化学構造生成アルゴリズムまたはRetroPath2(Delepine et al.Metabolic Engineering(2018),45:158-170.)のような仮想化学反応ツールで行うことができる。
【0054】
3.推定フラグメントイオン構造取得工程
本工程を、前述の実施態様2の「3.推定(仮想)フラグメントイオン構造取得工程」と同様に行うことができる(図9~11)。
【0055】
4.推定(仮想)フラグメントイオン衝突断面積取得工程
本工程を、前述の実施態様2の「4.推定(仮想)フラグメントイオン衝突断面積取得工程」と同様に行うことができる(図9~11)。
【0056】
5.第2のマッチング工程
本工程を、前述の実施態様2の「5.マッチング工程」と同様に行うことができる(図9~11)。
【0057】
以上のようにマッチングさせることにより、種々のデータベースおよび理論を組み合わせることにより、さらに多様な化合物の構造を同定することができる。
【0058】
図18に、本実施形態の方法の他の例を示す。この図に示されたように、本実施形態の他の例では、分析対象の化合物のスペクトルデータとリファレンススペクトルデータベースとの間でスペクトル類似度を評価する。そして、両スペクトルデータの「質量(質量電荷比)およびイオンモビリティ」のマッチングにより、共通の部分構造を明確に検出し、その結果として、候補構造を生成することができる。なお、図18では、リファレンススペクトルデータについて具体的な化合物が例示されているが、本発明は、これには限定されず、多種多様な化合物のリファレンススペクトルデータをリファレンススペクトルデータベースの構築に利用できる。
【0059】
図19に、本実施形態の方法のより具体的な例を示す。なお、図19には、具体的な化合物が例示されているが、本発明は、これには限定されず、本発明によれば、多種多様な化合物の構造を同定することができる。
【0060】
(第4の実施態様)
本発明の第4の実施態様は、化合物の構造を同定するためのシステムであって、前述のように、スペクトルデータ生成手段と、リファレンススペクトルデータベースと、マッチング手段と、出力手段とを含み、スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、リファレンススペクトルデータベースおよびマッチング手段と接続されている。図12に、本実施態様のシステムの一例の構成を示す。図12に示されたとおり、このシステム100は、スペクトルデータ生成手段110と、出力手段130と、通信インターフェース150と、サーバ170とを備える。スペクトルデータ生成手段110および出力手段130は、通信インターフェース150に電気的に接続されている。そして、通信インターフェース150とサーバ170とが、回線網160を介して接続されている。スペクトルデータ生成手段110は、具体的には、例えば、質量分析装置111に接続されているクライアント端末112のCPUである。
【0061】
このシステムでは、サーバ170側に、マッチング手段を有し、サーバ170にリファレンススペクトルデータベースが記憶されている。例えば、スペクトルデータ生成手段110により生成されたスペクトルデータを、サーバ170に送信し、サーバ170側で、前述のように、スペクトルデータを、リファレンススペクトルデータとマッチさせる。また、マッチング結果を、出力手段130により出力する。
【0062】
本実施態様によれば、サーバがマッチング手段を有しているため、マッチングに必要となる高度な演算処理をサーバで行うことができ、その結果として、例えば、より高速に化合物の構造を同定することができる。また、リファレンススペクトルデータベースがサーバに記憶されているため、リファレンススペクトルデータベースが個々のクライアント端末に記憶されている場合と比較して、データベースの更新頻度を高めることができ、その結果として、例えば、より多様な化合物の構造の同定が可能になる。
【0063】
本実施態様のシステムは、例えば、前述の実施態様1~3のいずれかに対応するシステムでもよく、前述の実施態様1~3で説明された各工程を実行することができる。例えば、サーバは、前述の化学構造データベースおよび理論スペクトルデータベース等の各種データベースを含んでもよい。また、本実施形態のシステムでは、スペクトルデータ生成手段は、クライアント端末のCPUであるが、本発明は、これには限定されず、例えば、サーバが、スペクトルデータ生成手段を有していてもよい。このような態様であれば、例えば、スペクトルデータの生成も、サーバ側で行うことができるため、例えば、更に高速に化合物の構造を同定することができる。
【0064】
(第5の実施態様)
本発明の第5の実施態様は、化合物の構造を同定するための装置であって、前述のように、スペクトルデータ生成手段と、リファレンススペクトルデータベースと、マッチング手段とを含む。図13に、本実施態様の装置の一例の構成を示す。図13に示されたとおり、この装置200は、スペクトルデータ生成手段110と、出力手段130と、マッチング手段140と、リファレンススペクトルデータベース180とを備える。スペクトルデータ生成手段110は、出力手段130およびマッチング手段140に電気的に接続されている。マッチング手段140は、出力手段130およびリファレンススペクトルデータベース180に電気的に接続されている。スペクトルデータ生成手段110およびマッチング手段140は、例えば、CPUである。出力手段130は、例えば、ディスプレイ、例えば、液晶ディスプレイである。出力手段130は、マッチング手段140によるマッチング結果を出力し、また、例えば、スペクトルデータ生成手段110により生成されたスペクトルデータを出力することができる。リファレンススペクトルデータベース180は、例えば、補助記憶装置であり、リファレンススペクトルデータは、同補助記憶装置に記憶されているデータである。スペクトルデータ生成手段110は、例えば、質量分析装置に接続されている。
【0065】
本実施態様によれば、例えば、通信環境下に無い場合でも、単独の装置において分析対象の化合物の構造を同定することができる。また、例えば、リファレンススペクトルデータベースを、通信環境下で更新してもよい。
【0066】
本実施態様の装置は、例えば、前述の実施態様1~3のいずれかに対応する装置でもよく、前述の実施態様1~3で説明された各工程を実行することができる。例えば、本装置は、前述の化学構造データベースおよび理論スペクトルデータベース等の各種データベースを含んでもよい。これらのデータベースも、例えば、通信環境下で更新してもよい。
【0067】
(第6の実施態様)
本発明の第6の実施態様は、化合物の構造を同定するための方法であり、同方法の各工程は、コンピュータにより実行される。本実施態様は、前述の、と、マッチング工程とを含む。本実施態様の方法は、例えば、前述の実施態様4に記載されたシステムまたは前述の実施態様5に記載された装置により実行されてもよく、前述の実施態様1~3で説明された各工程のうちコンピュータが実行する部分を実行することができる。
【0068】
(第7の実施態様)
本発明の第7の実施態様は、前述の化合物同定方法を、コンピュータ上で実行可能なプログラムである。本実施態様は、例えば、記録媒体に記録されていてもよい。記録媒体としては、例えば、ランダムアクセスメモリ(RAM)、読出し専用メモリ(ROM)、ハードディスク(HD)、USBメモリ、光ディスク、フロッピー(登録商標)ディスク(FD)等が挙げられる。
【0069】
以上、実施態様を参照して本発明を説明したが、本発明は、上記実施態様に限定されるものではない。本発明の構成および詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【産業上の利用可能性】
【0070】
以上のように、本発明によれば、多様な化合物の構造を同定することができる、化合物の構造を同定するための方法およびシステムを提供することができる。このため、本発明は、各種の分野、例えば、生理学、医学、食品、環境等の分野等の広い分野に適用することができる。
【符号の説明】
【0071】
100 システム(実施態様4)
110 スペクトルデータ生成手段
111 質量分析装置
112 クライアント端末
130 出力手段
140 マッチング手段
150 通信インターフェース
160 回線網
170 サーバ
180 リファレンススペクトルデータベース
200 装置(実施態様5)
【0072】
(削除)
【0073】
(削除)
【0074】
(削除)
【0075】
(削除)
【0076】
(削除)
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19