(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024162552
(43)【公開日】2024-11-21
(54)【発明の名称】情報処理装置
(51)【国際特許分類】
G01N 27/62 20210101AFI20241114BHJP
【FI】
G01N27/62 D
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023078157
(22)【出願日】2023-05-10
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.PYTHON
(71)【出願人】
【識別番号】000000033
【氏名又は名称】旭化成株式会社
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】半村 和基
(72)【発明者】
【氏名】小谷 結華
【テーマコード(参考)】
2G041
【Fターム(参考)】
2G041CA01
2G041LA06
2G041LA07
(57)【要約】
【課題】あるサンプルに含まれる化合物と文献中に記載された化合物とを容易に照合することのできる情報処理装置、情報処理方法、及びプログラムを提供することを目的とする。
【解決手段】 文献に含まれる化合物の質量に関する情報を取得する取得部と、サンプルの質量分析結果と、前記化合物の質量に関する情報とに基づいて、前記サンプルに前記化合物が含まれるか否かを照合する照合部と、を備える、情報処理装置。
【選択図】なし
【特許請求の範囲】
【請求項1】
文献に含まれる化合物の質量に関する情報を取得する取得部と、
サンプルの質量分析結果と、前記化合物の質量に関する情報とに基づいて、前記サンプルに前記化合物が含まれるか否かを照合する照合部と、を備える、
情報処理装置。
【請求項2】
前記取得部は、前記文献から前記化合物を表す表現を抽出し、抽出した該化合物を表す表現に基づいて、前記化合物の質量に関する情報を取得する、
請求項1に記載の情報処理装置。
【請求項3】
前記取得部は、文献に含まれる前記化合物を表す表現を、化合物の構造を表す文字列表現情報に変換し、該化合物の構造を表す文字列表現情報に基づいて、前記化合物の質量に関する情報を取得する、
請求項1に記載の情報処理装置。
【請求項4】
前記取得部は、前記化合物の質量に関する情報として、前記化合物のモノアイソトピック質量に関する情報、付加イオンを含む前記化合物の質量に関する情報、及び価数の違いによる前記化合物の質量に関する情報の少なくとも一つを取得する、
請求項1に記載の情報処理装置。
【請求項5】
前記照合部は、前記質量分析結果に含まれるピークと前記化合物の質量に関する情報との類似度に基づいて、前記化合物が含まれるか否かを照合する、
請求項1に記載の情報処理装置。
【請求項6】
情報処理装置が、
文献に含まれる化合物の質量に関する情報を取得するステップと、
サンプルの質量分析結果と、前記化合物の質量に関する情報とに基づいて、前記サンプルに前記化合物が含まれるか否かを照合するステップと、を実行する、
情報処理方法。
【請求項7】
情報処理装置に、
文献に含まれる化合物の質量に関する情報を取得するステップと、
サンプルの質量分析結果と、前記化合物の質量に関する情報とに基づいて、前記サンプルに前記化合物が含まれるか否かを照合するステップと、を実行させる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、類似語を含む文献の検索時間を短縮し、検索精度を向上できる文献検索方法および文献検索システムを提供することを目的として、化学式等を含むクエリから文献を検索するシステムが開示されている。このように、従来より、多数の文献の中から所望の文献を検索する方法は広く検討されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、あるサンプルに含まれる化合物が文献に記載された化合物と一致するか否かを特定しようとするときには、まずはサンプルから得られる様々な情報を測定することで化合物を同定するための情報(以下、「同定情報」ともいう。)を取得し、次いでその情報を有する化合物を文献の中から探索することが考えられる。
【0005】
しかしながら、サンプルに含まれる化合物の同定情報の取得は容易ではない。例えば、サンプルが複数の化合物を含む場合には、サンプルから得られた情報は目的とする化合物の同定情報とそれ以外の化合物の同定情報の両方が混在した情報となる。そのため、一つの化合物の同定情報を単離して取得することは容易ではない。
【0006】
また、仮にサンプルからある化合物に関する同定情報が取得できたとしても、その情報を有する化合物を文献の中から探索することは難しい。例えば、文献が特許文献や論文などである場合、それら文献においてサンプルに含まれる化合物の名称が記載されているとしても、分析して得られた化合物の同定情報そのものがそれら文献に記載されているとは限らない。そのため、分析して得られた化合物の同定情報に基づいて、ある文献に目的とする化合物が記載されているかどうかを直ちに判断することは困難である。
【0007】
さらに、一つのサンプルに含まれる化合物が一つの文献に記載された化合物と一致するか否かの判断だけでも上記困難が伴うため、一つのサンプルに含まれる化合物が膨大な複数の文献に記載された化合物と一致するか否かを判断することはさらに困難となる。
【0008】
本発明は、上記問題点に鑑みてなされたものであり、あるサンプルに含まれる化合物と文献中に記載された化合物とを容易に照合することのできる情報処理装置、情報処理方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
すなわち、本発明は以下のとおりである。
〔1〕
文献に含まれる化合物の質量に関する情報を取得する取得部と、
サンプルの質量分析結果と、前記化合物の質量に関する情報とに基づいて、前記サンプルに前記化合物が含まれるか否かを照合する照合部と、を備える、
情報処理装置。
〔2〕
前記取得部は、前記文献から前記化合物を表す表現を抽出し、抽出した該化合物を表す表現に基づいて、前記化合物の質量に関する情報を取得する、
〔1〕に記載の情報処理装置。
〔3〕
前記取得部は、文献に含まれる前記化合物を表す表現を、化合物の構造を表す文字列表現情報に変換し、該化合物の構造を表す文字列表現情報に基づいて、前記化合物の質量に関する情報を取得する、
〔1〕又は〔2〕に記載の情報処理装置。
〔4〕
前記取得部は、前記化合物の質量に関する情報として、前記化合物のモノアイソトピック質量に関する情報、付加イオンを含む前記化合物の質量に関する情報、及び価数の違いによる前記化合物の質量に関する情報の少なくとも一つを取得する、
〔1〕~〔3〕のいずれか一項に記載の情報処理装置。
〔5〕
前記照合部は、前記質量分析結果に含まれるピークと前記化合物の質量に関する情報との類似度に基づいて、前記化合物が含まれるか否かを照合する、
〔1〕~〔4〕のいずれか一項に記載の情報処理装置。
〔6〕
情報処理装置が、
文献に含まれる化合物の質量に関する情報を取得するステップと、
サンプルの質量分析結果と、前記化合物の質量に関する情報とに基づいて、前記サンプルに前記化合物が含まれるか否かを照合するステップと、を実行する、
情報処理方法。
〔7〕
情報処理装置に、
文献に含まれる化合物の質量に関する情報を取得するステップと、
サンプルの質量分析結果と、前記化合物の質量に関する情報とに基づいて、前記サンプルに前記化合物が含まれるか否かを照合するステップと、を実行させる、
プログラム。
【発明の効果】
【0010】
本発明によれば、あるサンプルに含まれる化合物と文献中に記載された化合物とを容易に照合することのできる情報処理装置、情報処理方法、及びプログラムを提供することを目的とする。
【図面の簡単な説明】
【0011】
【
図1】本実施形態のシステムの概略構成の一例を示す図である。
【
図2A】本実施形態の情報処理装置の概略構成の一例を示す図である。
【
図2B】照合用データの概略構成の一例を示す図である。
【
図2C】サンプル化合物情報を取得する流れを示す概略図である。
【
図2D】文献化合物情報を取得する流れを示す概略図である。
【
図3】本実施形態の情報処理方法の一例を示すフローチャート図である。
【発明を実施するための形態】
【0012】
以下、本発明の好適な実施の形態について図面を用いて詳細に説明する。なお、以下に説明する実施の形態は、請求の範囲に記載された本発明の内容を不当に限定するものではない。また、以下に説明されている構成の全てが本発明の必須構成要件であるとは限らない。
【0013】
1.システム
図1は、本実施形態のスマート照合システムを示す概略図である。
図1に示すように、本実施形態のスマート照合システムの一例では、照合処理をするサーバ100、ユーザが使用する端末200、サンプルの情報を分析する装置300、文献情報を蓄積したサーバ400がネットワークNを介して接続される。
【0014】
照合処理をするサーバ100は、端末200からの照合処理の要求に基づいて、装置300から取得したサンプルに関する情報と、サーバ400から取得した文献に関する情報とを照合する処理を実行してもよい。照合処理については後述する。
【0015】
端末200は、ユーザが走査する端末であり、サーバ100に対して照合処理の要求を送信する。照合処理の要求には、装置300が取得したサンプルに関する情報のうち、一部を照合処理に使用することなど、照合処理において使用するサンプルに関する情報を特定する情報が含まれてもよい。また、照合処理の要求には、2020年代の文献を対象としたり、特定の発行者の文献を対象とするなど、照合処理において対象とする文献の範囲を特定する情報が含まれてもよい。そして、端末200は、サーバ100から照合処理の結果に関する情報を受信し、その結果を出力装置に表示制御してもよい。
【0016】
装置300は、公知の分析装置が備えるコンピュータであってもよいし、これら分析装置と接続された、独立したコンピュータであってもよい。装置300は、分析装置からサンプルの分析結果を取得し、要求に応じて、サーバ100や端末200に対して送信してもよい。
【0017】
本実施形態において、サンプルは、化合物、剤、組成物であってもよい。一例として、市場で流通している、化学製品をサンプルとしてもよい。
【0018】
分析装置としては、特に限定されないが、例えば、全自動元素分析装置(EA)、エネルギー分散型蛍光X線分析装置(EDX-XRF)、誘導結合プラズマ質量分析装置(ICP-MS)等の元素分析装置;透過型電子顕微鏡(TEM)、走査透過型電子顕微鏡(STEM(EDX,EELS))、蛍光X線分析顕微鏡等の形態観察分析装置;紫外可視・近赤外分光分析計(UV-VIS)、紫外可視・近赤外分光分析計(UV-VIS)、核磁気共鳴分析装置(NMR)、X線回析装置(XRD)、マトリックス支援レーザー脱離イオン化-飛行時間型質量分析計(MALDI-TOFMS)等の化学構造分析装置;ガスクロマトグラフ質量分析装置(GC/MS)、液体クロマトグラフ質量分析装置(LC-MS)などのクロマトグラフ分析装置;熱重量示差熱分析装置(TG-DTA)等の熱分析装置などが挙げられる。
【0019】
本実施形態においては、以降において質量分析装置を例に説明を進めるが、本実施形態のシステムは質量分析装置を用いたものに限定されず、照合処理において文献とサンプルから得られた物理パラメータが一致するようであれば、上記で例示したような従来公知の分析装置においても適用することができる。
【0020】
サーバ400は、特許文献や技術論文などに関する情報を蓄積したサーバであってもよい。具体的には、サーバ400は、各国特許庁の文献サーバや特許文献検索サービスを提供する企業のサーバ、又は、国内外の学会が運営する論文検索サービスのサーバなどであってもよい。サーバ400は、要求に応じて、特許文献や技術論文などに関する情報をサーバ100や端末200に対して送信してもよい。
【0021】
以下、本実施形態の情報処理装置がサーバ100であるものとして、各構成について詳説する。しかしながら、これに限定されることなく、ユーザが走査する端末200が、サーバ100が実行する照合処理を実行してもよい。
【0022】
1.1.サーバ100
本実施形態の情報処理装置(サーバ100)は、文献に含まれる化合物の質量に関する情報(以下、「文献化合物情報」ともいう。)を取得する取得部と、サンプルの質量分析結果(以下、「サンプル化合物情報」ともいう。)と、前記化合物の質量に関する情報とに基づいて、前記サンプルに前記化合物が含まれるか否かを照合する照合部と、を備える。
【0023】
図2Aに、サーバ100の概略構成図を示す。
図2Aに示すように、情報処理装置(サーバ100)は、例えば、プロセッサ110、通信インターフェース120、入出力インターフェース130、メモリ140、ストレージ150、及びこれらの構成要素を相互接続するための1つ又は複数のバス160を含む。
【0024】
プロセッサ110は、限定でなく例として、1又は複数の中央処理装置(CPU)、
マイクロプロセッサ(MPU、画像処理装置(GPU)、プロセッサコア、マルチプロ
セッサ、特定用途向け集積回路(ASIC)、特定用途向け集積回路(FPGA)等を
含み、集積回路(IC)チップ、LS)や専用回路によって各実施形態に開示されるそ
れぞれの、処理、機能、又は、方法を実現してもよい。
【0025】
通信インターフェース120は、ネットワークを介して他の装置と各種データの送受信を行う。当該通信は、有線、無線のいずれで実行されてもよく、互いの通信が実行できるのであれば、どのような通信プロトコルを用いてもよい。例えば、通信インターフェース120は、ネットワークアダプタ等のハードウェア、各種の通信用ソフトウェア、又はこれらの組み合わせとして実装される。
【0026】
入出力インターフェース130は、各種操作を入力する入力装置、及び、処理結果などを出力する出力装置を含む。例えば、入出力インターフェース130は、キーボード、マウス、及びタッチパネル等の情報入力装置、及び表示装置131などの情報出力装置を含んでもよい。なお、サーバ100は、外付けの入出力インターフェース130を接続することで、所定の入力を受け付けてもよいし、所定の出力を実行してもよい。
【0027】
メモリ140は、ストレージ150からロードしたプログラムを一時的に記憶し、プ
ロセッサ110に対して作業領域を提供する。メモリ140には、プロセッサ110が
プログラムを実行している間に生成される各種データも一時的に格納される。メモリ1
40は、例えば、DRAM、SRAM、DDR RAM又は他のランダムアクセス固体
記憶装置などの高速ランダムアクセスメモリであってよく、これらが組み合わせられて
もよい。
【0028】
ストレージ150は、プログラム、各機能部、及び各種データを記憶する。ストレージ150は、例えば、照合用データ151を格納してもよい。照合用データ151は、
図2Bに示すように、照合処理毎に付される照合IDと、照合に用いるサンプル化合物情報及び文献化合物情報と、照合結果とを含んでいてもよい。
【0029】
また、ストレージ150は、例えば、1つ又は複数の磁気ディスク記憶装置、光ディスク記憶装置、フラッシュメモリデバイス、又は他の不揮発性固体記憶装置などの不揮発性メモリ等であってよく、これらが組み合わせられてもよい。ストレージ150の他の例としては、プロセッサ110から遠隔に設置される1つ又は複数の記憶装置を挙げることができる。
【0030】
プロセッサ110は、ストレージ150に記憶されるプログラムに含まれるコード、又は、命令によって実現する処理、機能、又は、方法を実行する。
図2Aに示すように、本実施形態のプロセッサ110は、送受信部111、取得部112、照合部113、及び出力部114として機能してもよい。以下、各機能部について説明する。
【0031】
送受信部111は、例えば、通信インターフェース120とネットワークNを介して、端末200、装置300、サーバ400等の他の装置に各種情報を送信する送信部、又は端末200、装置300、サーバ400等の他の装置から各種情報を受信する受信部として機能してもよい。
【0032】
例えば、送受信部111は、端末200からの操業処理の要求を受信してもよいし、装置300からサンプル化合物情報を受信してもよいし、サーバ400から文献化合物情報を受信してもよい。また、送受信部111は、端末200に対して照合処理の結果を送信してもよい。
【0033】
取得部112は、サンプルの情報を分析する装置300から、サンプル化合物情報を取得してもよい。
図2Cに、サンプルを分析することにより質量分析結果を取得し、照合用データ151に記録する流れを示す。
図2Cに示す例では、複数の化合物(Unkown Chem1,2,3,・・・)を含むサンプルを質量分析することで、サンプルに含まれる各化合物の質量に応じたピークを質量分析結果として得ることが示されている。
図2Cでは、装置300が、m/z:…,120.09,136.15,…,184.07,…の複数のピークを有するマススペクトルデータの例が示されている。ここで、それぞれのピークはサンプルに含まれる各化合物に対応する。
【0034】
取得部112は、装置300から複数の化合物に関する質量分析結果を取得し、照合用データ151に記録する(ステップS01)。この際、取得部112は、サンプル化合物情報として、ローパスフィルタ等により所定質量以下のピークを除外して照合用データ151に記録してもよいし、ハイパスフィルタ等により所定質量以上のピークを除外して照合用データ151に記録してもよい。または、取得部112は、ローパスフィルタ等によりIntensityが所定値以下のピークを除外して、サンプル化合物情報として、照合用データ151に記録してもよい。
【0035】
その他、ユーザが端末200を用いて指定した質量範囲のピーク、又は、ユーザが端末200を用いて指定した具体的な一又は複数のピークの質量分析結果を、サンプル化合物情報として、照合用データ151に記録してもよい。
【0036】
照合用データ151に記録された質量分析結果は、後述する照合処理に使用される。そのため、このようにノイズである可能性の高いピークを上記フィルタ処理で除いたり、或いはユーザの操作によって特定することにより、無駄な照合処理を省くことができる。
【0037】
取得部112は、化合物の質量に関する情報として、化合物のモノアイソトピック質量に関する情報、付加イオンを含む化合物の質量に関する情報、及び価数の違いによる化合物の質量に関する情報の少なくとも一つを取得してもよい。これにより、これら情報を考慮してサンプル化合物情報と文献化合物情報との照合処理を実行することができる。
【0038】
取得部112は、文献情報を蓄積したサーバ400から、文献に含まれる化合物の質量に関する情報を取得してもよい。
図2Dに、サーバ400に蓄積された文献から文献に含まれる化合物を特定し、その質量に関する情報を取得する流れを示す。
図2Dに示す例では、サーバ400には、複数の文献のデータ(D1,D2,…Dn,…)が格納されており、各文献のデータごとにその文献に含まれる複数の化合物(Chem 1,Chem 2,…Chem m,…)が開示されている例を示す。
【0039】
取得部112は、サーバ400から一又は複数の文献データを取得し、テキストマイニング等の処理により、文献に含まれる化合物を表す表現を抽出する(ステップS02)。これにより、文献内において記載された化合物を表す表現を抽出し、リスト化することができる。化合物を表す表現の抽出の際には、取得部112は、テキストデータから化合物を表す表現を抽出するpythonライブラリなど、公知のライブラリを使用してもよい。そのような従来公知のライブラリとしては、特に限定されないが、例えば、pythonライブラリのChemDataExtractorが挙げられる。また、テキストデータから化合物を表す表現を抽出することが可能であればChemDataExtractorに限定されることなく、その他の公知のライブラリを使用してもよい。
【0040】
なお、非英語圏の文献データについては、ChemDataExtractorなどのpythonライブラリを使用するにあたり、文献データを英語テキストデータに変換してもよい。英語テキストデータへの変換は、公知の機械翻訳により実行してもよい。
【0041】
次いで、取得部112は、上記のようにして取得した文献内に記載された化合物を表す表現を、化合物の構造を示す文字列表現情報へ変換してもよい(ステップS03)。そのような文字列表現情報としては、特に限定されないが、例えば、SMILES(simplified molecular input line entry system)が挙げられる。なお、化合物の構造を示すことが可能であればSMILESに限定されることなく、その他の表記方法を用いてもよい。
【0042】
そして、取得部112は、上記のようにして取得した文字列表現情報に基づいて、化合物の質量に関する情報へ変換してもよい(ステップS04)。この際、取得部112は、化合物のデータベースを有する外部サーバ(不図示)から、文字列表現情報に対応する質量に関する情報を取得してもよい。
【0043】
このように、ステップS03において化合物を表す表現を化合物の構造を示す文字列表現情報へ変換することで、続くステップS04において化合物を表す表現を構造に基づく他の情報へ変換することが可能となる。本実施形態では、「構造に基づく他の情報」として質量に関する情報を例示するが、化合物を表す表現を質量に関する情報に変換することにより、装置300から取得した質量分析結果との照合が可能となる。
【0044】
なお、一つの化合物でも複数の化合物を表す表現で呼称されることがあるため、化合物を一意に定義できる文字列表現情報に変換する例を上記で述べたが、変形例として、化合物を表す表現と質量を対応付けたテーブルなどを用いて、化合物を表す表現からその化合物の質量に関する情報を取得可能である場合には、ステップS03において化合物を表す表現を化合物の構造を示す文字列表現情報へ変換しなくてもよい。
【0045】
以上のようにして、取得部112は、サーバ400に記録された文献データから、その文献に含まれる化合物を表す表現を抽出し、その化合物の質量に関する情報を照合用データ151に記録することができる(ステップS02~S04)。
【0046】
なお、サーバ400に記録された全ての文献に対してこの処理を行ったのでは、照合処理に長時間を要するため、ステップS02~S04に記載の処理の対象とする文献はユーザが選択してもよい。例えば、端末200からの照合処理の要求において、処理の対象とする文献を、2020年代の文献としたり、特定の特許出願人の特許文献としたり、特定の文献番号で特定される文献としたりするなど、指定してもよい。この際は、サーバ100の取得部112は、このようなユーザの指定する範囲の文献データをサーバ400から取得し、ステップS02~S04を実行してもよい。
【0047】
照合部113は、サンプル化合物情報と、文献化合物情報とに基づいて、サンプル中に文献に記載の化合物が含まれるか否かを照合する。この際に、照合部113は、前記質量分析結果に含まれるピークと前記化合物の質量に関する情報との類似度に基づいて、前記化合物が含まれるか否かを照合してもよい。類似度は、予め定めておいてもよいし、ユーザが規定してもよい。類似度は、特に限定されないが、例えば、ある値に対する±α等の値域によって表現される誤差許容範囲δであってもよい。このような類似度を考慮することにより、質量分析計によりピークの精密質量の測定精度にばらつきが生じる場合でも、ピーク群への分類処理を適切に行うことができる。
【0048】
図2Eに、照合処理を実行し、照合結果を照合用データ151に記録する流れを示す。照合処理は、特に限定されないが、例えば、照合用データ151に記録されたサンプル化合物情報に含まれる各化合物の質量に関する情報(m/z:…,120.09,136.15,…,184.07,…)と、文献化合物情報に含まれる各化合物の質量に関する情報(D1: Chem 1: 118.05,Chem 2: 136.15,…Chem m,…;Dn: Chem 1: 136.15,Chem 2: …,…Chem m:184.07,…;…)とをそれぞれ照合し、一致する質量があるか否かを確認する。なお、m/zの有効数字は説明を容易にするための例示であり、小数点以下二桁には限定されない。
【0049】
本実施形態の方法によれば、m/z 0.002未満の差で化合物の一致性を判断することができる。
図2Eに記載の例では、照合部113は、サンプルに含まれる化合物A(m/z 136.15)が、D1のchem 2及びDnのChem 1として開示されたものと一致しており、化合物B(m/z 184.07)がDnのChem mとして開示されたものと一致するという照合結果を照合用データ151に記録してもよい。
【0050】
従来は、サンプル中に含まれる化合物の質量分析データとしてm/z 136.15を得たとしても、m/z 136.15という値のみからこのm/zを満たす具体的な化合物を推定することは困難であった。しかしながら、本実施形態のように、サンプル中に含まれる化合物を文献に開示される具体的な化合物と対応付けることにより、サンプル中に含まれる化合物を同定することが可能となる。
【0051】
なお、本実施形態における同定には、組成式の一致の判断が含まれてもよく、構造異性体や立体異性体などの異性体の一致の判断が含まれてもよい。本実施形態によれば、例えば、m/z 136.15という値で表される組成式が明らかとなるため、当該組成式に含まれる異性体についても、文献に開示される具体的な化合物と対応付けることで、より同定しやすくなる。なお、組成式が同定されている前提でさらにサンプル中に含まれる化合物(異性体)の構造解析をしようとする場合には、特に限定されないが、例えば、核磁気共鳴分析(NMR)、円二色性分散計(CD)、その他分光計などを組み合わせてサンプル中に含まれる化合物についての分析をしてもよい。
【0052】
出力部114は、このようにして得られた照合結果を様々な態様で出力することができる。例えば、出力部114は、サンプルが特定の化合物を含む確度を出力してもよい。
図2Eに記載の例では、化合物Aが含まれる確度を90%以上と出力している。確度の算出方法は特に限定されないが、一例として、D1のchem 2とDnのChem 1のように複数の文献でm/z 136.15の化合物が開示されており、かつ、D1のchem 2とDnのChem 1で表される化合物を表す表現が表現上の揺らぎがあったとしても実質同一である場合には、確度を高く出力してもよい。
【0053】
また、出力部114は、サンプルに含まれる化合物を開示する文献を出力してもよい。さらに、出力部114は、サンプルに含まれる化合物を同定することに加えて、サンプルと文献との関連度についても出力してもよい。この際、出力部114は、サンプルに含まれる複数の化合物と、一つの文献が開示する化合物との一致性が高いほど、サンプルとの関連度が高いものとして、文献に関する情報を出力してもよい。例えば、サンプルに含まれる複数の化合物を全て開示する特許文献Xがみつかったとすると、サンプルはその特許文献Xに開示される発明の実施品である蓋然性が高いといえる。また、全てではないにせよサンプルに含まれる多くの化合物について一つの文献内で開示している文献が見つかったとすると、その文献とサンプルとの関連性は高いといえる。サンプルに含まれる化合物を同定することに加えて、サンプルと文献との関連性についても有用な情報となる。
【0054】
1.2.動作処理
次に、
図3を参照し、本実施形態のシステム1の動作処理について説明する。
図3は、サーバ100を用いて行われる照合処理を示すフローチャートの一例を示す。なお、以下で説明する処理手順は一例に過ぎず、各処理は、本開示の技術思想の範囲内において可能な限り変更されてよく、また、適宜、ステップの省略、置換、および追加が可能である。
【0055】
ステップS01において、サーバ100の取得部112は、サンプルの質量分析結果を取得する。このとき取得する質量分析結果は、フィルタ処理後のものであってもよいし、化合物のモノアイソトピック質量に関する情報、付加イオンを含む化合物の質量に関する情報、及び価数の違いによる化合物の質量に関する情報等であってもよい。
【0056】
ステップS02~S04において、サーバ100の取得部112は、文献から化合物を表す表現を抽出し、抽出した該化合物を表す表現に基づいて、化合物の質量に関する情報を取得する。より具体的には、サーバ100の取得部112は、文献に含まれる前記化合物を表す表現を、化合物の構造を表す文字列表現情報に変換し、該化合物の構造を表す文字列表現情報に基づいて、前記化合物の質量に関する情報を取得する。
【0057】
ステップS05において、サーバ100の照合部113は、サンプルの質量分析結果と、前記化合物の質量に関する情報とに基づいて、前記サンプルに前記化合物が含まれるか否かを照合する。その後、サーバ100の出力部114は、照合結果を出力し、端末200に送信してもよい。
【0058】
2.情報処理方法
本実施形態の情報処理方法は、情報処理装置が、文献に含まれる化合物の質量に関する情報を取得するステップと、サンプルの質量分析結果と、前記化合物の質量に関する情報とに基づいて、前記サンプルに前記化合物が含まれるか否かを照合するステップと、を実行する。
【0059】
なお、本実施形態の方法の具体的態様については、上記動作処理で述べているため、ここでは詳細な説明は省略する。
【0060】
3.プログラム
本実施形態のプログラムは、情報処理装置に、文献に含まれる化合物の質量に関する情報を取得するステップと、サンプルの質量分析結果と、前記化合物の質量に関する情報とに基づいて、前記サンプルに前記化合物が含まれるか否かを照合するステップと、を実行させる。
【0061】
プログラムは、読み取り可能な記録媒体に記録された物であってもよい。なお、本実施形態のプログラムが実行する処理の具体的態様については、上記動作処理で述べているため、ここでは詳細な説明は省略する。
【産業上の利用可能性】
【0062】
本発明は、化学製品の分析において産業上の利用可能性を有する。
【符号の説明】
【0063】
1…システム、100…サーバ、110…プロセッサ、111…送受信部、112…取得部、113…照合部、114…出力部、120…通信インターフェース、130…入出力インターフェース、131…表示装置、140…メモリ、150…ストレージ、151…照合用データ、160…バス、200…端末、300…装置、400…サーバ。