【解決手段】液相クロマトグラフィータンデム高分解能質量スペクトルによる検出後のサンプル質量スペクトルデータが、データ前処理ソフトウェアによって処理され、分子二次スペクトル類似処理プラットフォームに導入されて類似性処理が実行され、処理されたデータが分子ネットワーク可視化ソフトウェアに導入されてネットワークマップを可視化し、親化合物と既知製品の位置に応じて、可能な変換生成物の質量スペクトルピークが判断され、対応する二次質量スペクトルからその構造式を推定・確認する。
【背景技術】
【0002】
近年、人々が人間の健康にますます注意を払うにつれて、環境媒体中の微量有機汚染物質
は、それらの負の生態学的影響のために研究の焦点となっている。環境媒体では、微量有
機汚染物質は一般に化学的および生物学的変換を受けてさまざまな変換生成物を生成し、
これらの生成物は親化合物よりも毒性が高い可能性があり、関連する研究はほとんどない
。これは主に、環境媒体の複雑なマトリックス中の微量有機汚染物質の変換生成物の同定
技術の欠点によって制限される。
【0003】
環境媒体中の微量有機汚染物質の変換生成物の同定は、一般に采用高分解能質量スペクト
ル分析で検出し質量スペクトルマップを分析してその構造を確認する。ただし、環境サン
プルは一般的にマトリックスが複雑であり、固相抽出濃縮集中や膜処理浄化どの前処理手
段を使用しても、高分解能質量スペクトルで得られたフルスキャンピークは依然として「
無秩序」であるため、マススペクトルの多くのピーク(通常は1,000を超える)の中
から生成物のピークを見つけることが非常に困難になる。従来、質量スペクトルピークの
ピーク高さまたは対照組の質量スペクトルピークデータとの比較により生成物の質量スペ
クトルピークを推定しているが、この方法は対象が不明で、時間と手間がかかり、NSA
IDsの変換生成物を完全に同定できない。非標的スクリーニングに基づく同定技術は、
変換に関連する情報の欠如下で新しい未知の生成物を同定することができ、分子ネットワ
ークに基づく非標的スクリーニングにより構造が類似の質量スペクトルピークを同定する
ことができる。したがって、分子ネットワークに基づく非標的微量有機汚染物質の変換生
成物の同定方法の確立は、環境媒体中の微量有機汚染物質の変換生成物の生態学的リスク
評価にとって非常に重要である。
【発明の概要】
【0004】
上記の技術的問題に対して、本発明は、環境媒体中の微量有機汚染物質の変換生成物を同
定するための包括的かつ特定の非標的同定方法を提供し、複雑なマトリックス中の質量ス
ペクトル生成物のピーク同定が不完全で、時間と労力がかかるなどの問題を効果的に解決
することができる。
【0005】
本発明の技術的解決策は以下の通りである。
環境媒体中の微量有機汚染物質の変換生成物の非標的同定方法、包括以下ステップ:
(1)サンプルローディング検出
HLB固相抽出カートリッジを使用して、活性化、サンプルローディング、リンス、溶出
の4つのステップでサンプルを前処理し、0.22μmフィルタメンブレンで濾過処理し
、2mLのクロマトグラフィーボルト内に入れ、液相クロマトグラフィータンデム高分解
能質量スペクトル装置を使用して検出し、液相はグラジエント溶出方法を採用し、質量ス
ペクトルは一次および二次同時走査の検出方法を採用し、サンプルの質量スペクトルで走
査された元のデータを取得する、
(2)データフォーマットの変換
サンプルの質量スペクトルで走査された元のデータをMSConvertソフトウェアに
導入して変換し、元の質量スペクトルファイルをmzXMLファイルに変換して後処理に
供する、
(3)データ前処理
ステップ(2)で得られたサンプルの質量スペクトルデータmzXMLファイルをMZm
ine2ソフトウェアに導入してデータを前処理し、前記前処理には、主に、クロマトグ
ラフィーピーク抽出、クロマトグラフィーピークデコンボリューション、同位体ピーク分
類、質量スペクトル特徴ピーク分類、同位体濾過が含まれる、
(4)分子ネットワーク構築
前処理されたデータをGNPS分子ネットワーク処理プラットフォームに導入し、二次ス
ペクトルのクラスタリングと計算を実行し、得られたデータをCytoscape2.8
.3ソフトウェアに導入して分子ネットワークを可視化し、標的化合物の変換生成物の可
視化ネットワークマップを取得する、
(5)変換生成物のピーク同定と構造式の推定・確認
分子ネットワークのノードに表示される親イオンのm/z値に従って、標的化合物と既知
の変換生成物のm/zの領域を見つけ、この領域に接続され連結線が太いm/z(二次ス
ペクトルの類似性が大きいもの)がこの標的化合物の変換生成物の質量スペクトルピーク
と見なされ、この変換生成物の質量スペクトルピークと隣接する親化合物の質量スペクト
ルピークまたは隣接する既知構造の生成物の質量スペクトルピーク間の差のm/z値に応
じてこの生成物の構造式を推定し、二次スペクトルから推定された構造式が正確かどうか
を確認する。
【0006】
さらに、上記の技術的解決策では、前記環境媒体は、水環境、大気環境、土壌環境を含む
。この3つの環境媒体は、基本的に環境学分野のすべての環境媒体をカバーする。
【0007】
さらに、上記の技術的解決策では、前記の微量有機汚染物質は、薬物、パーソナルケア製
品、ポリ塩化ビフェニル、多環芳香族炭化水素、有機農薬またはペルフルオロ化合物を含
む。
【0008】
さらに、上記の技術的解決策では、前記質量スペクトル一次および二次同時走査の検出方
法は、DDA走査及DIA(例えばSwath)データ収集方法を含む。DDAとDIA
の収集時、一次MSの選択範囲が標的化合物の分子量に応じて決定され、50(50以下
では過剰なノイズデータが発生する)からこの標的化合物の分子量より500以上のMS
まで走査することができる。二次MSの収集範囲が50から一次MS走査範囲の上限より
200以上の値(合計された二次質量スペクトルピークを確実に収集できるようにする)
。DDA収集過程中に、二次質量スペクトル分析は存在度が最も高い10質量スペクトル
ピークのスペクトルフラグメントを収集し、動的除外設定を有効にして、可能な限り多く
の二次MS情報を取得することができ、変換生成物の包括的な同定の基礎を提供する。
さらに、上記の技術的解決策では、前記GNPS分子ネットワーク処理プラットフォーム
がデータ処理を実行する時、可能な限り多くの一次MSデータが分子ネットワークマップ
で表示されるようにする同時に、対応するパラメータ値が低すぎて分子ネットワークマッ
プ中のノイズデータが多すぎると後のさらなる同定が困難になり、対応するパラメータ値
が以下のように設定すればよく、分子クラスタリングの時一次MS偏差を50ppmとし
、二次MS/MS偏差を20ppmとし、コサイン類似性を0.6とし、一致するピーク
の最小数を4に設定する。
【0009】
さらに、上記の技術的解決策では、前記Cytoscape2.8.3ソフトウェアが分
子ネットワークを可視化する時、m/zをノード名称にマッピングし、二次スペクトルの
類似性を連結線の太さにマッピングし、m/zの相対存在量をノードの大きさにマッピン
グする。このようにして得られた可視化マップでは、ノードの大きさからこのm/zで表
される化合物のサンプル中の相対存在量を判断し、連結線の太さから隣接するm/zで表
される化合物間の構造の類似性を判断することができる。これは、隣接するm/zに基づ
いて生成物構造の推定に役立つ。
【0010】
さらに、上記の技術的解決策では、前記変換生成物の構造式を決定する方法は以下の通り
である:標準生成物のマップと試験サンプルの変換生成物の二次スペクトルとをマッチン
グし、標準生成物の変換生成物を購入することができないと、二次スペクトルソフトウェ
アで予測された二次スペクトルとサンプルスペクトルとをマッチングして、変換生成物の
構造式を決定する。
【0011】
さらに、上記の技術的解決策では、前記二次スペクトルソフトウェアはCFM-IDであ
り、他のソフトウェア、例えばMetFrag、MetFusion、ISIS、Fin
gerID、SIRIUSを選択してもよい。その内に、CFM-IDソフトウェアは、
予測精度が比較的に高く、操作の複雑性が低いため好ましい。
【0012】
従来技術と比較すると、本発明は以下の有益な効果を有する。
(1)本発明で使用される分子ネットワークの非標的同定により、標的化合物の変換生成
物の質量スペクトルピークを同定することができるため、環境媒体中の微量有機汚染物質
の変換生成物を包括的な同定することができる。
(2)本発明で使用される分子ネットワークの非標的同定により、隣接するノードのm/
zが類似構造を有し変換生成物の構造式の予備推定に役たち、CFM-ID二次スペクト
ル予測ソフトウェアにより標準生成物を持たない変換生成物の二次スペクトルを提供して
、この変換生成物の構造式の確認に役立つ。
【発明を実施するための形態】
【0014】
実施例1
本実施例では、好気性活性汚泥(水環境)におけるジクロフェナク(薬物およびパーソナ
ルケア製品)の変換生成物を同定し、具体的なローディングおよび生成物の同定過程が以
下の通りである:
(1)サンプルローディング検出
クロマトグラフィー条件が表1に示される。
表1:実施例1のクロマトグラフィー条件
【0016】
質量スペクトル条件は以下の通りである:一次質量スペクトルの走査範囲を50〜100
0Daとし、二次質量スペクトルの走査範囲を50〜1200Daとし、カーテンガスを
35psiとし、Gas1を55psiとし、Gas2を35psiとし、温度を550
℃とし、DPを−80とし、CEを30±15とする。得られた質量スペクトル分析検出
の全イオン電流図が
図4に示される。
(2)データフォーマット変換
サンプルの質量スペクトルで走査された元のデータ(.willフォーマットファイル)
をMSConvertソフトウェアに導入して変換し、元の質量スペクトルファイルをm
zXMLファイル(.mzMLフォーマットファイル)に変換して後処理に供する。
(3)データ前処理
上記のサンプルの質量スペクトルデータmzXMLファイルをMZmine2ソフトウェ
アに導入してデータを前処理し、これらの前処理には、主にクロマトグラフィーピーク抽
出、クロマトグラフィーピークデコンボリューション、同位体ピーク分類、質量スペクト
ル特徴ピーク分類、同位体濾過などが含まれる。
具体的なパラメータ値は次の通りであり、質量検出(ノイズレベル:0、クロマトグラフ
ィーピーク確立:0.05min、最小高さ:5000、m/z無視値:0.006)で
ある。デコンボリューションアルゴリズム(クロマトグラフィーしきい値:1%、最小滞
留時間範囲:0.3min、最小相対ピーク高さ:1%、最小絶対ピーク高さ:5000
、ピーク高さとピーク幅の最小比:2、ピーク幅:0.1〜2min)である。同位体除
去(m/z無視値:0.006、滞留時間無視値:0.5min)である。ピークアライ
メント(RANSACアライメント方法、m/z無視値:0.006、滞留時間絶対無視
値:1.5min、滞留時間絶対補正値:0.5min、しきい値:1)である。
(4)分子ネットワーク構築
処理後、そのデータをGNPS分子ネットワーク処理プラットフォームに導入して類似二
次スペクトルのクラスタリングと計算を実行し、得られたデータをCytoscape2
.8.3ソフトウェアに導入して分子ネットワークを可視化し、標的化合物の変換生成物
の可視化ネットワークマップを取得する。具体的なパラメータ値は、質量クラスタリング
(親イオン質量無視値:0.1Da、二次フラグメントイオン質量無視値:0.5Da)
である。ネットワーク構築(コサイン値:0.6、少なくとも6つのピークマッチング)
である。
(5)変換生成物のピーク同定および構造式の推定・確認
分子ネットワークのノードに表示される親イオンm/zの値に従って、標的化合物および
既知の変換生成物のm/zの領域を見つけ、この領域に接続され連結線が太い(二次スペ
クトルの類似性が大きい)m/zはこの標的化合物の変換生成物の質量スペクトルピーク
と見なされる。この変換生成物の質量スペクトルピークと隣接する親化合物の質量スペク
トルピークまたは隣接する既知構造の生成物の質量スペクトルピーク間の差分m/z値か
らこの生成物の構造式を推定し、二次スペクトルから推定された構造式が正確であるかど
うかを確認する。
【0017】
実施例2
実施例1と異なり、本実施例の環境媒体は室内空気中(ガス環境)におけるジクロフェナ
ク(薬物およびパーソナルケア製品)の変換生成物であり、他の操作過程は実施例1と同
じであり、具体的なローディングおよび生成物同定過程は以下の通りである。
(1)サンプルローディング検出
クロマトグラフィー条件は表2に示される。
表2:実施例2のクロマトグラフィー条件
【0019】
質量スペクトル条件:一次質量スペクトルの走査範囲を50〜1000Daとし、二次質
量スペクトルの走査範囲を50〜1200Daとし、カーテンガスを35psiとし、G
as1を55psiとし、Gas2を35psiとし、温度を550℃とし、DPを−8
0とし、CEを30±15とする。得られた質量スペクトル分析で検出された全イオン電
流図が
図5に示される。
(2)データフォーマット変換
サンプルの質量スペクトルで走査された元のデータをMSConvertソフトウェアに
導入して変換を実行し、元の質量スペクトルファイルをmzXMLファイルに変換して後
処理に供する。
(3)データ前処理
上記サンプルの質量スペクトルデータmzXMLファイルをMZmine2ソフトウェア
に導入してデータを前処理し、これらの前処理には、主にクロマトグラフィーピーク抽出
、クロマトグラフィーピークデコンボリューション、同位体ピーク分類、質量スペクトル
特徴ピーク分類、同位体濾過などが含まれる。
具体的なパラメータ値は次の通りであり、質量検出(ノイズレベル:0、クロマトグラフ
ィーピーク確立:0.05min、最小高さ:5000、m/z無視値:0.006)で
ある。デコンボリューションアルゴリズム(クロマトグラフィーしきい値:1%、最小滞
留時間範囲:0.3min、最小相対ピーク高さ:1%、最小絶対ピーク高さ:5000
、ピーク高さとピーク幅の最小比:2、ピーク幅:0.1〜2min)である。同位体除
去(m/z無視値:0.006、滞留時間無視値:0.5min)である。ピークアライ
メント(RANSACアライメント方法、m/z無視値:0.006、滞留時間絶対無視
値:1.5min、滞留時間絶対補正値:0.5min、しきい値:1)である。
(4)分子ネットワーク構築
処理後、そのデータをGNPS分子ネットワーク処理プラットフォームに導入して類似二
次スペクトルのクラスタリングと計算を実行し、得られたデータをCytoscape2
.8.3ソフトウェアに導入して分子ネットワークを可視化し、標的化合物の変換生成物
の可視化ネットワークマップを取得する。具体的なパラメータ値は、質量クラスタリング
(親イオン質量無視値:0.1Da、二次フラグメントイオン質量無視値:0.5Da)
である。ネットワーク構築(コサイン値:0.6、少なくとも6つのピークマッチング)
である。
(5)変換生成物のピーク同定および構造式の推定・確認
分子ネットワークのノードに表示される親イオンm/zの値に従って、標的化合物および
既知の変換生成物のm/zの領域を見つけ、この領域に接続され連結線が太い(二次スペ
クトル類似性が大きい)m/zは、この標的化合物の変換生成物の質量スペクトルピーク
と見なされる。この変換生成物の質量スペクトルピークと隣接する親化合物の質量スペク
トルピークまたは隣接する既知構造の生成物の質量スペクトルピーク間の差のm/z値か
らこの生成物の構造式を推定し、二次スペクトルから推定された構造式が正確であるかど
うかを確認する。
【0020】
実施例3
本例では微量有機汚染物質の同定対象が実施例1と異なり、具体的には、有機農薬化合物
であるメタラキシルを同定し、他の操作過程は実施例1と同じであり、具体的な同定過程
は以下の通りである。
(1)サンプルローディング検出
クロマトグラフィー条件は表3に示される。
表3:実施例3のクロマトグラフィー条件
【0022】
質量スペクトル条件:一次質量スペクトルの走査範囲を50〜1000Daとし、二次質
量スペクトルの走査範囲を50〜1200Daとし、カーテンガスを35psiとし、G
as1を55psiとし、Gas2を35psiとし、温度を550℃とし、DPを−8
0とし、CEを30±15とする。得られた質量スペクトル分析で検出された全イオン電
流図が
図6に示される。
(2)データフォーマット変換
サンプルの質量スペクトルで走査された元のデータをMSConvertソフトウェアに
導入し変換して、元の質量スペクトルファイルをmzXMLファイルに変換して後処理に
供する。
(3)データ前処理
上記サンプルの質量スペクトルデータmzXMLファイルをMZmine2ソフトウェア
に導入してデータを前処理し、これらの前処理には、主にクロマトグラフィーピーク抽出
、クロマトグラフィーピークデコンボリューション、同位体ピーク分類、質量スペクトル
特徴ピーク分類、同位体濾過などが含まれる。
具体的なパラメータ値は次の通りであり、質量検出(ノイズレベル:0、クロマトグラフ
ィーピーク確立:0.05min、最小高さ:5000、m/z無視値:0.006)で
ある。デコンボリューションアルゴリズム(クロマトグラフィーしきい値:1%、最小滞
留時間範囲:0.3min、最小相対ピーク高さ:1%、最小絶対ピーク高さ:5000
、ピーク高さとピーク幅の最小比:2、ピーク幅:0.1〜2min)である。同位体除
去(m/z無視値:0.006、滞留時間無視値:0.5min)である。ピークアライ
メント(RANSACアライメント方法、m/z無視値:0.006、滞留時間絶対無視
値:1.5min、滞留時間絶対補正値:0.5min、しきい値:1)である。
(4)分子ネットワーク構築
処理後、そのデータをGNPS分子ネットワーク処理プラットフォームに導入して類似二
次スペクトルのクラスタリングと計算を実行し、得られたデータをCytoscape2
.8.3ソフトウェアに導入して分子ネットワークを可視化し、標的化合物の変換生成物
の可視化ネットワークマップを取得する。具体的なパラメータ値は、質量クラスタリング
(親イオン質量無視値:0.1Daとし、二次フラグメントイオン質量無視値:0.5D
a)である。ネットワーク構築(コサイン値:0.6、少なくとも6つのピークマッチン
グ)である。
(5)変換生成物のピーク同定および構造式の推定・確認
分子ネットワークのノードに表示される親イオンm/zの値に従って、標的化合物および
既知の変換生成物のm/zの領域を見つけ、この領域に接続され連結線が太い(二次スペ
クトル類似性が大きい)m/zはこの標的化合物の変換生成物の質量スペクトルピークと
見なされる。この変換生成物の質量スペクトルピークと隣接する親化合物の質量スペクト
ルピークまたは隣接する既知構造の生成物の質量スペクトルピーク間の差分m/z値から
この生成物の構造式を推定し、二次スペクトルから推定された構造式が正確であるかどう
かを確認する。
【0023】
実施例4
本例では、好気性活性汚泥中のジクロフェナク(非ステロイド性抗炎症薬)の変換生成物
を同定し、実施例1および2と異なり、本例では使用される質量スペクトルデータ収集方
法はSwathのDIA収集方法であり、他の操作過程は実施例1と同じであり、具体的
な同定過程は以下の通りである。
具体的なローディングおよび生成物同定過程は以下の通りである。
(1)サンプルローディング検出
クロマトグラフィー条件は表4に示される。
表4:実施例4のクロマトグラフィー条件
【0025】
質量スペクトル条件:一次質量スペクトルの走査範囲を50〜1000Daとし、二次質
量スペクトルの走査範囲を50〜1200Daとし、カーテンガスを35psiとし、G
as1を55psiとし、Gas2を35psiとし、温度を550℃とし、DPを−8
0、CEを30±15とする。DDAによって収集されたデータに従って、Swath可
変ウィンドウ計算機に入力し、最適な可変ウィンドウサイズを計算し、最適なウィンドウ
値として装置に導入する。得られた質量スペクトル分析で検出された全イオン電流図が図
7に示される。
(2)データフォーマット変換
サンプルの質量スペクトルで走査された元のデータをMSConvertソフトウェアに
導入して変換し、元の質量スペクトルファイルをmzXMLファイルに変換して後処理に
供する。
(3)データ前処理
上記サンプルの質量スペクトルデータmzXMLファイルをMZmine2ソフトウェア
に導入してデータを前処理し、これらの前処理には、主にクロマトグラフィーピーク抽出
、クロマトグラフィーピークデコンボリューション、同位体ピーク分類、質量スペクトル
特徴ピーク分類、同位体濾過などが含まれる。
具体的なパラメータ値は以下の通りであり、質量検出(ノイズレベル:0、クロマトグラ
フィーピーク確立:0.05min、最小高さ:5000、m/z無視値:0.006)
である。デコンボリューションアルゴリズム(クロマトグラフィーしきい値:1%、最小
滞留時間範囲:0.3min、最小相対ピーク高さ:1%、最小絶対ピーク高さ:500
0、ピーク高さとピーク幅の最小比:2、ピーク幅:0.1〜2min)である。同位体
除去(m/z無視値:0.006、滞留時間無視値:0.5min)である。ピークアラ
イメント(RANSACアライメント方法、m/z無視値:0.006、滞留時間絶対無
視値:1.5min、滞留時間絶対補正値:0.5min、しきい値:1)である。
(4)分子ネットワーク構築
処理後、そのデータをGNPS分子ネットワーク処理プラットフォームに導入して類似二
次スペクトルのクラスタリングと計算を実行し、得られたデータをCytoscape2
.8.3ソフトウェアに導入して分子ネットワークを可視化し、標的化合物の変換生成物
の可視化ネットワークマップを取得する。具体的なパラメータ値は、質量クラスタリング
(親イオン質量無視値:0.1Daとし、二次フラグメントイオン質量無視値:0.5D
a)である。ネットワーク構築(コサイン値:0.6、少なくとも6つのピークマッチン
グ)である。
(5)変換生成物のピーク同定および構造式の推定・確認
分子ネットワークのノードに表示される親イオンm/zの値に従って、標的化合物および
既知の変換生成物のm/zの領域を見つけ、この領域に接続され連結線が太い(二次スペ
クトル類似性が大きい)m/zはこの標的化合物の変換生成物の質量スペクトルピークと
見なされる。この変換生成物の質量スペクトルピークと隣接する親化合物の質量スペクト
ルピークまたは隣接する既知構造の生成物の質量スペクトルピーク間の差分m/z値から
この生成物の構造式を推定し、二次スペクトルから推定された構造式が正確であるかどう
かを確認する。