(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-19
(54)【発明の名称】化学化合物のラマンスペクトルに基づく同定のための方法およびシステム
(51)【国際特許分類】
G01N 21/65 20060101AFI20240312BHJP
【FI】
G01N21/65
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023553298
(86)(22)【出願日】2022-03-03
(85)【翻訳文提出日】2023-10-25
(86)【国際出願番号】 US2022070949
(87)【国際公開番号】W WO2022187843
(87)【国際公開日】2022-09-09
(32)【優先日】2021-03-04
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】509012625
【氏名又は名称】ジェネンテック, インコーポレイテッド
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】マイヤー, アンドリュー ジェームズ
(72)【発明者】
【氏名】フィッシュ, ラファエル
(72)【発明者】
【氏名】ファン, ブレンダン リード
【テーマコード(参考)】
2G043
【Fターム(参考)】
2G043AA04
2G043EA03
2G043FA06
2G043MA01
2G043NA01
2G043NA02
(57)【要約】
ラマン分光測定およびインシリコ模擬ラマンスペクトルに基づいて化学化合物を同定するための方法およびシステムが開示される。様々な実施形態では、未知の化学化合物のラマンバーコードは、未知の化学化合物に対してラマン分光測定を行うことによって取得されたラマンスペクトルから生成され得る。次いで、ラマンバーコードは、既知の化学化合物の参照インシリコ模擬ラマンバーコードのライブラリと比較され、当該比較に基づいて未知の化学化合物の同一性が判定され得る。
【選択図】
図1
【特許請求の範囲】
【請求項1】
未知の化学化合物のラマン分光測定から抽出された、前記未知の化学化合物のラマンスペクトルを取得することと、
前記取得されたラマンスペクトルを、模擬ラマンスペクトルライブラリに含まれる複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルと比較することであって、各模擬ラマンスペクトルが、既知の化学化合物の量子力学的計算によって生成される、前記取得されたラマンスペクトルを参照模擬ラマンスペクトルと比較することと、
前記取得されたラマンスペクトルと前記参照模擬ラマンスペクトルとの比較に基づいて、前記未知の化学化合物の同一性を同定することと
を含む、方法。
【請求項2】
前記模擬ラマンスペクトルライブラリが、ラマン分光測定を化学化合物に対して行うことによって取得される実験的ラマンスペクトルを除外する、請求項1に記載の方法。
【請求項3】
前記ラマンスペクトルのピークの強度レベルに少なくとも部分的に基づいて、前記ラマンスペクトルのピークに対応するラマンバーコードを生成することをさらに含む、請求項1に記載の方法。
【請求項4】
前記比較することが、前記生成されたラマンバーコードを、前記複数の模擬ラマンスペクトルの前記参照模擬ラマンスペクトルに対応する参照模擬ラマンバーコードと比較することを含む、請求項3に記載の方法。
【請求項5】
前記比較することが、前記取得されたラマンスペクトルおよび/または前記参照模擬ラマンスペクトルにスケーリングアルゴリズムを適用して、前記取得されたラマンスペクトルおよび/または前記参照模擬ラマンスペクトルの間の波数オフセットを補正することを含む、請求項1に記載の方法。
【請求項6】
前記同定することが、前記生成されたラマンバーコードと前記参照模擬ラマンバーコードとの間のバーコード重複レベルがバーコード重複閾値を超えたときに、前記未知の化学化合物が、前記参照模擬ラマンスペクトルが計算される化学化合物と一致すると判定することを含む、請求項4に記載の方法。
【請求項7】
前記バーコード重複レベルが、前記生成されたラマンバーコードの第1の波数位置および前記参照模擬ラマンバーコードの第2の波数位置に位置するバーの数を示し、前記第1の波数位置および前記第2の波数位置が互いに少なくとも実質的に等しい、請求項6に記載の方法。
【請求項8】
前記量子力学的計算が密度汎関数理論(DFT)に基づく、請求項1に記載の方法。
【請求項9】
前記生成することが、前記ピークの強度レベルがピーク強度閾値を超えたときに、前記ピークのうちの1つのピークに対応するバーを前記ラマンバーコードに含めることを含む、請求項3に記載の方法。
【請求項10】
前記ピーク強度閾値が、前記ピークの強度レベルの平均である、請求項9に記載の方法。
【請求項11】
前記生成することが、前記ラマンスペクトルの前記ピークの波数位置に少なくとも部分的に基づいて、前記ラマンスペクトルの前記ピークに対応する前記ラマンバーコードを生成することを含む、請求項3に記載の方法。
【請求項12】
命令を記憶する非一時的メモリと、
前記非一時的メモリに結合され、前記システムに動作を実行させるために前記非一時的メモリから前記命令を読み取るように構成された1つまたは複数のハードウェアプロセッサであって、前記動作が、
未知の化学化合物のラマン分光測定から抽出された、前記未知の化学化合物のラマンスペクトルを取得することと、
前記取得されたラマンスペクトルを、模擬ラマンスペクトルライブラリに含まれる複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルと比較することであって、各模擬ラマンスペクトルが、既知の化学化合物の量子力学的計算によって生成される、前記取得されたラマンスペクトルを参照模擬ラマンスペクトルと比較することと、
前記取得されたラマンスペクトルと前記参照模擬ラマンスペクトルとの比較に基づいて、前記未知の化学化合物の同一性を同定することと
を含む、1つまたは複数のハードウェアプロセッサと
を備える、システム。
【請求項13】
前記模擬ラマンスペクトルライブラリが、ラマン分光測定を化学化合物に対して行うことによって取得される実験的ラマンスペクトルを除外する、請求項12に記載のシステム。
【請求項14】
前記動作が、前記ラマンスペクトルのピークの強度レベルに少なくとも部分的に基づいて、前記ラマンスペクトルのピークに対応するラマンバーコードを生成することをさらに含む、請求項12に記載のシステム。
【請求項15】
前記比較することが、前記生成されたラマンバーコードを、前記複数の模擬ラマンスペクトルの前記参照模擬ラマンスペクトルに対応する参照模擬ラマンバーコードと比較することを含む、請求項14に記載のシステム。
【請求項16】
前記比較することが、前記取得されたラマンスペクトルおよび/または前記参照模擬ラマンスペクトルにスケーリングアルゴリズムを適用して、前記取得されたラマンスペクトルおよび/または前記参照模擬ラマンスペクトルの間の波数オフセットを補正することを含む、請求項12に記載のシステム。
【請求項17】
前記同定することが、前記生成されたラマンバーコードと前記参照模擬ラマンバーコードとの間のバーコード重複レベルがバーコード重複閾値を超えたときに、前記未知の化学化合物が、前記参照模擬ラマンスペクトルが計算される化学化合物と一致すると判定することを含む、請求項15に記載のシステム。
【請求項18】
前記バーコード重複レベルが、前記生成されたラマンバーコードの第1の波数位置および前記参照模擬ラマンバーコードの第2の波数位置に位置するバーの数を示し、前記第1の波数位置および前記第2の波数位置が互いに少なくとも実質的に等しい、請求項17に記載のシステム。
【請求項19】
前記量子力学的計算が密度汎関数理論(DFT)に基づく、請求項12に記載のシステム。
【請求項20】
前記生成することが、前記ピークの強度レベルがピーク強度閾値を超えたときに、前記ピークのうちの1つのピークに対応するバーを前記バーコードに含めることを含む、請求項14に記載のシステム。
【請求項21】
前記ピーク強度閾値が、前記ピークの強度レベルの平均である、請求項20に記載のシステム。
【請求項22】
前記生成することが、前記ラマンスペクトルの前記ピークの波数位置に少なくとも部分的に基づいて、前記ラマンスペクトルの前記ピークに対応する前記ラマンバーコードを生成することを含む、請求項14に記載のシステム。
【請求項23】
動作の実行を引き起こすように実行可能なコンピュータ可読命令を記憶した非一時的コンピュータ可読媒体(CRM)であって、前記動作が、
未知の化学化合物のラマン分光測定から抽出された、前記未知の化学化合物のラマンスペクトルを取得することと、
前記取得されたラマンスペクトルを、模擬ラマンスペクトルライブラリに含まれる複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルと比較することであって、各模擬ラマンスペクトルが、既知の化学化合物の量子力学的計算によって生成される、前記取得されたラマンスペクトルを参照模擬ラマンスペクトルと比較することと、
前記取得されたラマンスペクトルと前記参照模擬ラマンスペクトルとの比較に基づいて、前記未知の化学化合物の同一性を同定することと
を含む、非一時的コンピュータ可読媒体(CRM)。
【請求項24】
前記模擬ラマンスペクトルライブラリが、ラマン分光測定を化学化合物に対して行うことによって取得される実験的ラマンスペクトルを除外する、請求項23に記載の非一時的CRM。
【請求項25】
前記動作が、前記ラマンスペクトルのピークの強度レベルに少なくとも部分的に基づいて、前記ラマンスペクトルのピークに対応するラマンバーコードを生成することをさらに含む、請求項23に記載の非一時的CRM。
【請求項26】
前記比較することが、前記生成されたラマンバーコードを、前記複数の模擬ラマンスペクトルの前記参照模擬ラマンスペクトルに対応する参照模擬ラマンバーコードと比較することを含む、請求項25に記載の非一時的CRM。
【請求項27】
前記比較することが、前記取得されたラマンスペクトルおよび/または前記参照模擬ラマンスペクトルにスケーリングアルゴリズムを適用して、前記取得されたラマンスペクトルおよび/または前記参照模擬ラマンスペクトルの間の波数オフセットを補正することを含む、請求項23に記載の非一時的CRM。
【請求項28】
前記同定することが、前記生成されたラマンバーコードと前記参照模擬ラマンバーコードとの間のバーコード重複レベルがバーコード重複閾値を超えたときに、前記未知の化学化合物が、前記参照模擬ラマンスペクトルが計算される化学化合物と一致すると判定することを含む、請求項26に記載の非一時的CRM。
【請求項29】
前記バーコード重複レベルが、前記生成されたラマンバーコードの第1の波数位置および前記参照模擬ラマンバーコードの第2の波数位置に位置するバーの数を示し、前記第1の波数位置および前記第2の波数位置が互いに少なくとも実質的に等しい、請求項28に記載の非一時的CRM。
【請求項30】
前記量子力学的計算が密度汎関数理論(DFT)に基づく、請求項23に記載の非一時的CRM。
【請求項31】
前記生成することが、前記ピークの強度レベルがピーク強度閾値を超えたときに、前記ピークのうちの1つのピークに対応するバーを前記バーコードに含めることを含む、請求項25に記載の非一時的CRM。
【請求項32】
前記ピーク強度閾値が、前記ピークの強度レベルの平均である、請求項31に記載の非一時的CRM。
【請求項33】
前記生成することが、前記ラマンスペクトルの前記ピークの波数位置に少なくとも部分的に基づいて、前記ラマンスペクトルの前記ピークに対応する前記ラマンバーコードを生成することを含む、請求項25に記載の非一時的CRM。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年3月4日に出願された米国仮特許出願第63/156,846号の優先権の利益を主張し、その全体が参照により本明細書に組み込まれる。
【0002】
分野
本出願は、化学化合物のラマンスペクトルを使用した、より詳細には、化学化合物の測定されたラマンスペクトルをインシリコ模擬ラマンスペクトルの参照ライブラリと比較することによる、化学化合物の分類および同定に関する。
【背景技術】
【0003】
序論
ラマン分光法は、試料に入射した光を非弾性散乱させる、すなわち散乱光の周波数と入射光の周波数とが異なる分光計測技術である。周波数の変化、または同等にエネルギーの変化は、試料の化学結合の低エネルギーモードとの光の相互作用に起因する。試料のラマンスペクトルは、散乱光から求められ得、試料の同定や分類に使用され得る。
【発明の概要】
【0004】
概要
以下は、論じられた技術の基本的な理解を提供するために、本開示の様々な実施形態を要約する。この概要は、本開示の全ての企図される特徴の広範な概要ではなく、本開示の全ての実施形態の重要なまたは重大な要素を識別することも、本開示のいずれかまたは全ての実施形態の範囲を描写することも意図されていない。その唯一の目的は、後に提示されるより詳細な説明の前置きとして、本開示の1つまたは複数の実施形態のいくつかの概念を要約形式で提示することである。
【0005】
本開示の様々な実施形態は、未知の化学化合物のラマン分光測定から抽出された未知の化学化合物のラマンスペクトルを取得することを含む方法を開示する。様々な実施形態では、本方法は、取得されたラマンスペクトルを、模擬ラマンスペクトルライブラリに含まれる複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルと比較することをさらに含む。様々な実施形態では、各模擬ラマンスペクトルは、既知の化学化合物の量子力学的計算によって生成される。本方法は、取得されたラマンスペクトルと参照模擬ラマンスペクトルとの比較に基づいて未知の化学化合物の同一性を同定することをさらに含む。
【0006】
本開示の様々な実施形態は、命令を記憶する非一時的メモリと、非一時的メモリに結合され、システムに動作を実行させるために非一時的メモリから命令を読み取るように構成された1つまたは複数のハードウェアプロセッサとを備えるシステムを開示する。様々な実施形態では、動作は、未知の化学化合物のラマン分光測定から抽出された未知の化学化合物のラマンスペクトルを取得することを含む。様々な実施形態では、動作は、取得されたラマンスペクトルを、模擬ラマンスペクトルライブラリに含まれる複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルと比較することをさらに含む。様々な実施形態では、各模擬ラマンスペクトルは、既知の化学化合物の量子力学的計算によって生成される。この動作は、取得されたラマンスペクトルと参照模擬ラマンスペクトルとの比較に基づいて未知の化学化合物の同一性を同定することをさらに含む。
【0007】
本開示の様々な態様は、動作の実行を引き起こすように実行可能なコンピュータ可読命令を記憶した非一時的コンピュータ可読媒体(CRM)を開示する。様々な実施形態では、動作は、未知の化学化合物のラマン分光測定から抽出された未知の化学化合物のラマンスペクトルを取得することを含む。様々な実施形態では、動作は、取得されたラマンスペクトルを、模擬ラマンスペクトルライブラリに含まれる複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルと比較することをさらに含む。様々な実施形態では、各模擬ラマンスペクトルは、既知の化学化合物の量子力学的計算によって生成される。この動作は、取得されたラマンスペクトルと参照模擬ラマンスペクトルとの比較に基づいて未知の化学化合物の同一性を同定することをさらに含む。
【0008】
本開示の他の態様、特徴、および実施形態は、本開示の特定の例示的な実施形態の以下の説明を添付の図面と併せて検討することにより、当業者にとって明らかになるであろう。本開示の特徴は、以下の特定の実施形態および図に関して説明され得るが、本開示の全ての実施形態は、本明細書で説明される有利な特徴の1つまたは複数を含むことができる。換言すれば、1つまたは複数の実施形態は、特定の有利な特徴を有するものとして説明され得るが、そのような特徴の1つまたは複数は、本明細書で説明される本開示の様々な実施形態にしたがって使用され得る。同様に、例示的な実施形態は、装置、システム、媒体、または方法の実施形態として以下に説明され得るが、そのような例示的な実施形態は、様々な装置、システム、媒体、および方法において、これを実装することができることを理解されたい。
【図面の簡単な説明】
【0009】
本明細書で開示された原理およびこの利点をさらに詳しく理解してもらうために、ここで、添付の図面と併せて以下の説明を参照されたい。
【0010】
【
図1】様々な実施形態にかかる、ラマンスペクトルに基づく化学化合物分類システムのブロック図である。
【0011】
【
図2】様々な実施形態にかかる、化学化合物の測定された模擬ラマンスペクトルおよびインシリコ模擬ラマンスペクトルの比較に基づく化学化合物の同定の例示的な説明図を示している。
【0012】
【
図3】様々な実施形態にかかる、化学化合物のインシリコ模擬ラマンバーコードの比較に基づく化学化合物の同定の例示的な説明図を示している。
【0013】
【
図4】様々な実施形態にかかる、化学化合物の測定されたラマンバーコードと、化学化合物の参照インシリコ模擬ラマンバーコードのライブラリとの比較に基づく、化学化合物の同定の例示的な説明図を示している。
【0014】
【
図5】様々な実施形態にかかる、測定された化学化合物のラマンバーコードと、化学化合物の参照インシリコ模擬ラマンバーコードのライブラリとの比較に基づく、化学化合物の類似性の判定を示す例示的なグリッドを示している。
【0015】
【
図6】様々な実施形態にかかる、化学化合物の測定されたラマンバーコードと、化学化合物の参照インシリコ模擬ラマンバーコードのライブラリとの比較に基づいて未知の化学化合物を同定するための方法のフローチャートである。
【0016】
【
図7】様々な実施形態にかかる、コンピュータシステムのブロック図である。
【0017】
図は必ずしも一定の縮尺で描かれているわけではなく、図内の物体は必ずしも互いに一定の縮尺で描かれているわけではないことを理解されたい。図は、本明細書に開示された装置、システム、および方法の様々な実施形態に明確さおよび理解をもたらすことを意図した描写である。可能な限り、同じまたは同様の部分を指すために図面全体を通して同じ参照符号が使用される。さらに、図面は、本教示の範囲を決して限定するものではないことを理解されたい。
【発明を実施するための形態】
【0018】
詳細な説明
未知の化学化合物は、それらのラマンスペクトルに基づいて、これを同定および分類することができ、ラマンスペクトルは、未知の化学化合物から散乱された光を分析してラマンスペクトルを抽出するラマン分光法の技術を使用して測定され得る。未知の化学化合物を同定/分類するために、ラマン分光測定によって取得された未知の化学化合物のラマンスペクトルは、様々な化学化合物の測定されたラマンスペクトルを含む参照ラマンスペクトルのライブラリと比較され得、比較が一致する場合、(例えば、分類アルゴリズムを使用して)未知の化学化合物が同定/分類され得る。例えば、未知の化学化合物の測定されたラマンスペクトルのピークは、参照ラマンスペクトルのライブラリに記憶されている候補化学化合物の測定されたラマンスペクトルのピークと比較され得、測定されたラマンスペクトルのピークの少なくとも所定の部分が候補化学化合物のラマンスペクトルのピークと同じまたは実質的に同じ波数に位置する場合、未知の化学化合物は、候補化学化合物と同じ化学化合物であると同定され得る。「測定されたラマンスペクトル」という用語は、ラマン分光計などの分光機器を使用して実験的に取得されたラマンスペクトルを指すと理解される。
【0019】
しかしながら、化学化合物の参照ラマンスペクトルの堅牢なライブラリ(すなわち、参照スペクトルとして使用され得る測定されたラマンスペクトルのライブラリ)を開発することは、技術的に困難であり得る。例えば、分光計などの機器を使用して参照ラマンスペクトルのライブラリを構築するための実験的測定は、これらに限定されないが、機器検出器ノイズ、機器間変動、機器構成(例えば、レーザ出力、レーザ周波数など)、試料容器干渉などの要因の影響を受ける可能性があり、これらの要因は、スペクトル品質および特徴の外観の変動を引き起こし、信頼性が高く堅牢なライブラリを構築する努力を複雑にする可能性がある。さらに、これらの要因は、追加の分子または化学化合物のスペクトルを既存のライブラリに追加すること、および分類方法またはアルゴリズムを1つの機器または分光計から別の機器または分光計に変換することを困難にする可能性がある。さらに、測定されたラマンスペクトルに適用されるベースライン除去技術はまた、使用可能な情報の喪失をもたらす真の信号を除去することがある。例えば、ノイズまたはバックグラウンドを平滑化するために測定されたラマンスペクトルに適用される技術はまた、複数であるが近接したピークを単一のピークに平滑化することがあり、これは、貴重な信号情報の喪失をもたらす。さらに、毒性または有害な分子または化学化合物のラマンスペクトル測定はまた、とりわけ実験上の保護手段を必要とするため、費用がかかり、困難である可能性がある。したがって、このようなライブラリを使用して未知の化学化合物を同定および分類する場合に、参照(測定された)ラマンスペクトルのライブラリの前述の欠点に対処するために使用することができる堅牢なラマンスペクトルライブラリの開発を容易にする方法およびシステムが必要とされている。
【0020】
本開示の様々な実施形態は、インシリコで生成される化学化合物の参照ラマンスペクトル、すなわち、(例えば、測定されたラマンスペクトルとは対照的に)模擬または計算されたラマンスペクトルのライブラリを開示する。例えば、未知の化学化合物または分子を同定するためのそのようなインシリコ模擬ラマンスペクトルの使用は、いくつかの利点を有し得る。例えば、インシリコ模擬ラマンスペクトルは、試料または機器/分光計の変動性に悩まされない。例えば、インシリコ模擬ラマンスペクトルは、試料の混入に起因して測定されたラマンスペクトルに現れる偽のピークを含まない。すなわち、ラマンスペクトルを計算するために同じ計算方法が使用されるならば、インシリコ模擬ラマンスペクトルは、同じ化学化合物について同じである(例えば、したがって、同じ化学化合物に対する複数のラマンスペクトルの複製を含む測定されたラマンスペクトルのライブラリとは対照的に、ライブラリが所与の化学化合物に対する単一のラマンスペクトルのみを含んでいれば十分である)。さらに、インシリコ模擬ラマンスペクトルを生成する場合、毒性物質のラマンスペクトルの測定に関連する動作上の課題およびコストは存在しない。
【0021】
図1は、様々な実施形態にかかる、ラマンスペクトルに基づく化学化合物分類システム100のブロック図である。様々な実施形態では、ラマン分光計102などの機器が使用されて、化学化合物のラマンスペクトル測定値104を取得し得る。様々な事例では、ラマン分光計102は、試料(例えば、分子、化学化合物など)に向かって光を放射し、試料の低エネルギー振動、回転などのモードと相互作用した後に散乱される光を検出し得る。試料のラマンスペクトルは、散乱光の強度を、散乱光の周波数と入射光の周波数との差の関数として示す。強度および周波数の変化は、試料の化学成分に依存する可能性があるため、様々な場合において、異なる分子、化学化合物などのラマンスペクトル測定値104は、互いに異なることがあり、したがって、分子、化学化合物などを同定および分類するために使用され得る。
【0022】
様々な実施形態では、ラマンスペクトルに基づく化学化合物分類システム100はまた、とりわけ、その材料および/または化学構造に基づいて、分子、化学化合物などの模擬ラマンスペクトル108を計算またはシミュレートするように構成されたラマンスペクトル計算部106を含み得る。すなわち、ラマンスペクトル計算部106は、化学化合物の材料および/または化学構造が与えられれば、化学化合物のインシリコ模擬ラマンスペクトルを生成するように構成され得る。様々な事例では、ラマンスペクトル計算部106は、コンピューティングノードの動作を制御するように構成されたプロセッサに結合されたメモリを含むコンピューティングノードを含み得る。様々な場合において、プロセッサは、1つまたは複数の中央処理装置、マルチコアプロセッサ、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、グラフィックス処理装置(GPU)などとすることができるか、またはそれらを含むことができる。コンピューティングノードは、スタンドアロンサブシステムとして、コンピューティング装置に追加されたボードとして、および/または仮想マシンとして実装されてもよい。
【0023】
様々な実施形態では、ラマンスペクトル計算部106は、上記のように、とりわけ、その材料および/または化学構造に基づいて、分子、化学化合物などの模擬ラマンスペクトル108を計算またはシミュレートするように設計または構成されたモジュールを含み得る。様々な事例では、そのようなモジュールは、これらに限定されないが、シミュレートされた、すなわちインシリコラマンスペクトル108を計算するための密度汎関数理論(DFT)計算などの量子力学的計算を実行する能力を有し得る。例えば、そのようなモジュールは、Gaussian,Inc.による一連のGaussianソフトウェア(例えば、Gaussian09、Gaussian16など)のいずれかとすることができるか、またはそれらを含むことができる。様々な事例では、Gaussianソフトウェアは、入力として化学化合物の3D構造を取り、DFT計算(例えば、6-31G(d)基底集合を有するB3LYPの密度汎関数法)を実行してインシリコ模擬ラマンスペクトル108を生成し得る。様々な場合において、3D構造を含む入力ファイルは、化学物質の3D構造を取り込み、Gaussian09の入力として使用され得る入力ファイルを出力するAvogardo化学モデリングソフトウェアのGaussianソフトウェア拡張子によって生成され得る。
【0024】
様々な実施形態では、ラマンスペクトルに基づく化学化合物分類システム100はまた、ラマンスペクトル測定値104を受信してスペクトル測定値のラマンバーコードを生成するように構成されたラマンバーコード生成部110を含み得る。様々な事例では、ラマンバーコード生成部110は、ラマン分光計102からラマンスペクトル測定値104を受信し、ラマンスペクトル測定値104を前処理して、(例えば、高周波ノイズを除去するために)スペクトルの平滑化、ガウシアンノイズの除去、蛍光バックグラウンド、コスミックスパイク、実験的アーチファクトなどを含むがこれらに限定されないベースライン補正を実行するように構成されたスペクトル測定プリプロセッサ112を含み得る。
【0025】
様々な実施形態では、ラマンバーコード生成部110は、(例えば、それぞれのラマンスペクトルのラマンバーコードを生成する前に)ラマンスペクトル測定値104を模擬ラマンスペクトル108と比較するように構成され得る。例えば、ラマンバーコード生成部110は、スペクトル測定プリプロセッサ112からの前処理されたラマンスペクトル測定値、およびラマンスペクトル計算部106からのインシリコ模擬ラマンスペクトル108を受信して、(例えば、測定されたラマンスペクトル(例えば、104から)および模擬ラマンスペクトル108に対応する化学化合物が一致するかどうかを判定するために)それらのピークを比較するように構成された、任意のスペクトル比較モジュール114を含み得る。様々な場合において、前処理されたラマンスペクトル測定値のピークとインシリコ模擬ラマンスペクトル108のピークとを比較することは、一方のスペクトルの少なくともかなりの数のピークが、同じまたは実質的に同様の波数位置(例えば、もしあれば、スペクトル間の波数オフセットが補正された後)にある他のスペクトルにも存在するかどうかを判定するためにチェックすることを含み得る。換言すれば、前処理されたラマンスペクトル測定値のピークおよびインシリコ模擬ラマンスペクトル108のピークを比較することは、(例えば、もしあれば、スペクトル間の波数オフセットが補正された後)前処理されたラマンスペクトル測定値およびインシリコ模擬ラマンスペクトル108の少なくともかなりの数のピークの波数位置が位置合わせされているかどうかを判定するためにチェックすることを含み得る。様々な事例では、前記ピークは、閾値強度レベルを超える強度を有するピークであり得る。様々な場合において、前処理されたラマンスペクトル測定値のピークとインシリコ模擬ラマンスペクトル108のピークとを比較することは、位置合わせされたピーク(すなわち、同じまたは実質的に同様の波数位置に配置または位置合わせされた、前処理されたラマンスペクトル測定値からのピークおよびインシリコ模擬ラマンスペクトル108からのピーク)が少なくとも実質的に同じ強度を有するかどうかを判定するためにチェックすることを含み得る。様々な場合において、ピークは、それらの間の値および部分範囲を含めて、(例えば、もしあれば、スペクトル間の波数オフセットが補正された後)ピークが互いに約5%、約1%、約3%、約5%、約10%以内に位置する場合、互いに「位置合わせされる」または「同じまたは実質的に同じ」波数位置に位置すると理解され得る。
【0026】
様々な事例では、上述したように測定されたスペクトルのピークおよび模擬スペクトルのピークを比較する前に、スペクトル比較モジュール114は、一方または双方のスペクトルにスケーリングアルゴリズムを適用して、それらの間の波数オフセットを補正し得る。様々な場合において、スケーリングアルゴリズムは、前処理されたラマンスペクトル測定および/またはインシリコ模擬ラマンスペクトル108に適用され得る。スケーリングアルゴリズムは、何らかの他の参照化学化合物に対して行われた測定に基づいて導出されたアルゴリズムとすることができる。例えば、スケーリングアルゴリズムは、化合物インデンに対して実行された測定から導出された線形スケーリング方程式を含み得るか、または線形スケーリング方程式であり得る。そのような線形スケーリング方程式の例は、νmeas/νcalc=0-00002520νcalcを読み取り得て、ここで、νmeasおよびνcalcは、測定および計算された波数である。様々な事例では、スケーリングアルゴリズムはまた、スケーリングアルゴリズムまたはスケーリング方程式のより適合したパラメータを導出するための最適化関数または技術(例えば、Nedler-Mead法、パターンサーチ、シミュレーテッドアニーリングなど)を含み得る。
【0027】
測定されたラマンスペクトルとインシリコ模擬スペクトルとの比較の例示的な説明図をシクロヘキサン(C
6H
12)の測定されたスペクトルおよびインシリコ模擬スペクトルの例を含む
図2に示す。
図2は、様々な実施形態にかかる、化学化合物の測定されたラマンスペクトルおよびインシリコ模擬ラマンスペクトルの比較に基づく、未知の化学化合物、この場合はシクロヘキサンの同定を示す例示的なプロット200を示している。様々な事例では、未知の化学化合物のラマンスペクトルが測定および処理されて、その未知の化学化合物の前処理された測定されたラマンスペクトル210を取得することができる。次いで、前処理された測定されたラマンスペクトル210は、(例えば、様々な化学化合物のインシリコ模擬ラマンスペクトルのライブラリからの)1つまたは複数のインシリコ模擬ラマンスペクトルと比較して、一致するインシリコ模擬ラマンスペクトル220を同定し得る。例えば、
図2を参照すると、前処理された測定されたラマンスペクトル210は、インシリコ模擬ラマンスペクトルのライブラリに記憶されたシクロヘキサンのインシリコ模擬ラマンスペクトル220と一致すると判定されるまで、前処理された測定されたラマンスペクトル210をインシリコ模擬ラマンスペクトルのライブラリと比較され得、その後、測定されたラマンスペクトルに対応する未知の化学化合物がシクロヘキサンとして同定され得る。様々な事例では、前処理された測定されたラマンスペクトル210およびインシリコ模擬ラマンスペクトル220の一致の判定は、同じまたは実質的に同じ波数位置に存在するかまたは位置合わせされている2つのスペクトルのピークに基づき得る。例えば、2つのスペクトル210、220は、(例えば、もしあれば、スペクトル間の波数オフセットが上述したように補正された後)スペクトルの少なくとも所定数のピークが同じまたは実質的に同じ波数位置に位置するときに一致すると判定され得る。様々な場合において、これらのピークは、閾値強度レベルを超える強度を有するピークであり得る。
【0028】
様々な事例では、多変量データ分析(MVDA)技術を使用して、分類目的のために前処理された測定されたラマンスペクトル210およびインシリコ模擬ラマンスペクトル220を比較し、例えば後者に関して前者を分類し得る。MDVA技術の例は、多数の変数および多数の試料を有するデータの分析を実行するために使用されるPCA(主成分分析)およびPLSD(部分最小二乗判別)技術を含む。様々な事例では、PCA、PLSDなどのMDVA技術は、測定されたラマンスペクトルに沿った多数のデータ点(例えば、約3,000、約1,000から約5,000の範囲などであり、それらの間の値および部分範囲を含む)に適用されて、多数のデータ点の初期データセットの次元よりも少ない次元空間にデータ点を投影し得る。そのような場合、ラマンスペクトルは、次に、より少ない次元を有する次元空間内の投影されたデータ点のグループ化に基づいて分類され得る。
【0029】
様々な実施形態では、前処理された測定されたラマンスペクトル210は、前処理された測定されたラマンスペクトル210およびインシリコ模擬ラマンスペクトルの生スペクトルベクトルの類似性を比較することによって、インシリコ模擬ラマンスペクトルのライブラリにおけるインシリコ模擬スペクトルと比較され得る。例えば、類似性は、距離メトリックを使用して測定され、ベクトル空間内のベクトル間の「距離」を計算し得る。そのようなメトリックの例は、ユークリッドメトリックであり、前処理された測定されたラマンスペクトル210およびインシリコ模擬スペクトルの生スペクトルベクトルのユークリッド距離および/または共分散が計算されて、前者と後者との間の類似性のレベルを定量化し得る。
【0030】
様々な実施形態では、ラマンバーコード生成部110は、スペクトル測定プリプロセッサ112によって前処理されたラマンスペクトル測定値およびラマンスペクトル計算部106からのインシリコ模擬ラマンスペクトル108の一方または双方のピークを変換して、前記スペクトルのピークをラマンバーコードに変換するように構成され得る。例えば、ラマンバーコード生成部110は、ラマンスペクトルを受信し、ラマンスペクトルのピークを同定し、次いで、ピークを表すかまたはピークに対応し、同じまたは実質的に同じ波数位置に位置するバーを有するラマンバーコードを生成するように構成されたピークツーバーコード変換部モジュール116を含み得る。様々な事例では、ラマンバーコード生成部110は、ラマンスペクトルにおけるピークの存在を検出し、波数位置を同定するために、限定されないが、Eigenvector Research,Incによるアルゴリズムpeakfindなどのピーク検出アルゴリズムを含み得る。次いで、ラマンバーコード生成部110は、ラマンバーコードを生成し、ピークに対応する(例えば、およびバーコードのピークを表す)ラマンバーコード内の波数位置にバーを配置し得る。様々な場合において、ピークの波数位置は、ピークの先端の波数位置、すなわちピークの最高強度に対応する波数位置、またはピークがより丸みを帯びた先端を有する場合、ピークの丸みを帯びた先端部分の中心を指すと理解され得る。様々な事例では、ラマンバーコード生成部110は、参照によりその全体が本明細書に組み込まれる、2012年8月3日のF.Scholkmannらによる「An Efficient Algorithm for Automatic Peak Detection in Noisy Periodic and Quasi-Periodic Signals」と題する文書で論じられているような追加のピーク検出アルゴリズムを含み得る。
【0031】
様々な実施形態では、(例えば、ピーク検出アルゴリズムによって)ラマンスペクトルにおいてそのように同定されたピークは、そのピークの強度が所定のピーク強度閾値を超えた場合(例えば、場合によっては、その場合のみ)、ラマンバーコードに含まれ得る、すなわち、ラマンバーコード内のバーによって表され得る。様々な場合において、ピーク強度閾値は、ラマンスペクトルの1つまたは複数のピークの強度に関連し得る。例えば、ピーク強度閾値は、ラマンスペクトルの最も高いピークの一部であってもよく、ラマンスペクトルにおいてピーク検出アルゴリズムによって検出されたピークの一部または全部の平均であってもよい。
【0032】
図3は、様々な実施形態における、ラマンスペクトルにおけるピークの同定および同定されたピークに基づくラマンバーコードの生成の例示的な
図300を示している。ピークの同定およびラマンバーコードの生成に関する本明細書における議論は、シクロヘキサンのインシリコ模擬ラマンスペクトル310に言及しているが、様々な場合において、この議論は、測定されたラマンスペクトルにも等しく当てはまる。様々な事例では、ラマンスペクトルは、計算またはシミュレートされ(例えば、または測定および前処理され)得て、ラマンスペクトル310は、ピーク検出アルゴリズムによって検出された複数のピークを有し得る。次いで、いくつかのピーク(例えば、ピーク強度閾値を超える強度を有するピーク)または全てのピークの波数位置が同定され得て、同定された波数位置にバーが位置するラマンバーコード320が生成され得る330。上述したように、ピークの波数位置は、先端の波数位置またはピークの最高強度値、あるいはピークの先端が丸みを帯びている場合、ピークの丸みを帯びた先端部分の中心に対応するか、または同じであってもよい。
【0033】
様々な実施形態では、ラマンスペクトルを比較して、(例えば、測定されたラマンスペクトルおよびインシリコ模擬ラマンスペクトルに関して
図2に示すように)ラマンスペクトルに対応する化学化合物の同一性を同定する代わりに、またはそれに加えて、ラマンスペクトルのラマンバーコードは、同定目的のために、または化学化合物間の類似性のレベルを判定するために比較され得る。
図3は、シクロヘキサン320およびイソプロピルアルコール(IPA)350のインシリコ模擬ラマンバーコードの比較の例示的な図を示しており、これらは、(例えば、ラマンバーコード生成部110のピークツーバーコード変換部モジュール116を使用して)上記のようにそれぞれのインシリコ模擬ラマンスペクトル310および340から変換される。様々な事例では、比較は、2つのラマンバーコード320、350の間のバーコード重複レベル360を判定することを含み得る。様々な場合において、2つのラマンバーコード(例えば、320および350など)を比較するとき、バーコード重複レベル360は、双方のラマンバーコード320、350内の同じまたは実質的に同じ波数位置に存在するバーの数に関連し得る(例えば、バーコード重複レベル360は、その数を双方のラマンバーコード320、350におけるバーの総数で割ることによって計算され得る)。様々な事例では、第1のラマンバーコード内の第1のバーおよび第2のラマンバーコード内の第2のバーは、第1および第2のバーが、それらの間の値および部分範囲を含めて、互いに約5%、約1%、約3%、約5%、約10%以内に位置する(例えば、波数軸上)とき、「同じまたは実質的に同じ波数位置」にあると理解される。様々な場合において、2つのラマンバーコードのバーコード重複レベルは、ラマンバーコードに対応する化学化合物間の類似性の尺度と見なされ得る。例えば、バーコード重複レベルがバーコード重複閾値を超えたとき、2つの化学化合物が一致すると見なされるか、または判定され得る。様々な実施形態では、
図1に戻ると、バーコード重複レベル360などの結果は、ラマンスペクトルに基づく化学化合物分類システム100のディスプレイ122に提示されるように、ラマンバーコード生成部110によって出力124として提供され得る。
【0034】
様々な実施形態では、インシリコ模擬ラマンスペクトルおよび/またはそれから変換されたラマンバーコードは、模擬ラマンスペクトルライブラリに記憶され得る。例えば、ラマンスペクトルに基づく化学化合物分類システム100は、模擬ラマンスペクトル108および/またはインシリコ模擬ラマンスペクトル(例えば、
図3に示されるシクロヘキサン320およびイソプロピルアルコール(IPA)350のインシリコ模擬ラマンバーコードなど)を記憶するように構成されたデータベース118を含み得る。すなわち、様々な事例では、様々な化学化合物(例えば、量子力学的DFT計算を実行することによって)のラマンスペクトルを計算し、これらのラマンスペクトルをラマンバーコードに変換し、インシリコ模擬ラマンバーコード120を模擬ラマンスペクトルライブラリとしてデータベース118に記憶することによって、インシリコ模擬ラマンスペクトルライブラリが構築され得る。様々な場合において、インシリコ模擬ラマンスペクトルライブラリはまた、計算されたラマンスペクトルも含み得る。様々な事例では、
図4に関して以下により詳細に説明するように、ラマンスペクトルを測定し、測定されたラマンスペクトルをラマンバーコードに変換し、測定されたラマンスペクトルのこれらのラマンバーコードをインシリコ模擬ラマンスペクトルライブラリまたはデータベース118と比較することによって未知の化学化合物を同定するとき、模擬ラマンスペクトルライブラリまたはデータベース118は、参照ライブラリとして使用され得る。様々な実施形態では、模擬ラマンスペクトルライブラリまたはデータベース118は、測定されたラマンスペクトルまたは測定されたラマンスペクトルに対応するラマンバーコードを含まなくてもよい。換言すれば、インシリコ模擬ラマンスペクトルライブラリまたはデータベース118は、ラマンスペクトルおよび/またはラマンバーコードを計算またはシミュレーションし、それをライブラリに記憶することによって生成され得る、すなわち、ライブラリは、インシリコ模擬ラマンスペクトルまたはバーコードのみを含み得る。
【0035】
図4は、様々な実施形態にかかる、未知の化学化合物の測定されたラマンバーコードと、化学化合物の参照インシリコ模擬ラマンバーコードのライブラリとの比較に基づく未知の化学化合物の同定の例示的な
図400を示している。様々な実施形態では、ラマン分光法を使用して未知の化学化合物の同一性を判定するために、未知の化学化合物のラマンスペクトルは、最初にラマン分光計を使用して測定され得る。さらに、測定されたスペクトルが前処理されて、様々なノイズ、バックグラウンド、実験上のアーチファクトなどを除去し、平滑化または前処理されたラマンスペクトル410を取得し得る。様々な事例では、測定されたラマンスペクトル410は、次いで、
図3を参照して上述したように、(例えば、
図1のラマンバーコード生成部110のピークツーバーコード変換部モジュール116を使用して)測定されたラマンバーコードに変換され得る。
【0036】
測定されたラマンバーコードを取得すると、様々な事例では、測定されたラマンバーコードは、模擬ラマンスペクトルライブラリに記憶されている(例えば、
図1のデータベース118に記憶されている)1つまたは複数のインシリコ模擬ラマンバーコードと比較され得る。例えば、データベース118の記憶されたインシリコ模擬ラマンバーコードを反復的に検索し、各インシリコ模擬ラマンバーコードについて、そのインシリコまたは模擬ラマンバーコードと測定されたラマンバーコードとの間のバーコード重複レベル430を計算し得る。様々な場合において、複数の化学化合物のバーコード重複460の計算されたレベルは、バーコード重複閾値450よりも低くてもよく、そのような場合、未知の化学化合物は、複数の化学化合物のいずれとも一致しない(すなわち、化学構造などが同じではない、または同様でさえない)と判定され得る。
【0037】
しかしながら、様々な場合において、未知の化学化合物の測定されたラマンバーコードと(既知のまたは参照)化学化合物のインシリコ模擬ラマンバーコードとの間のバーコード重複レベル440は、バーコード重複閾値450を超えることがあり、そのような場合、未知の化学化合物は、一致、すなわち、インシリコ模擬ラマンバーコードの既知の化学化合物と同じ(例えば、または少なくとも以下と同様である)であると見なされるかまたは判定され得る。様々な事例では、測定されたラマンバーコードとバーコード重複閾値450を超えるバーコード重複のレベルを有する複数のインシリコ模擬ラマンバーコードが存在し得る。そのような場合、未知の化学化合物は、最も高いバーコード重複レベル(例えば、それは、2つまたはそれ以上のインシリコ模擬ラマンバーコードの残りに対応する化学化合物に類似していると見なされ得る)に対応する化学化合物と一致すると判定されるかまたは見なされ得る。
【0038】
様々な実施形態では、2つのラマンバーコードのバーコード重複レベルは、ラマンバーコードに対応する化学化合物間の類似性の尺度と見なされ得る(例えば、双方の化学化合物が以前に既知である場合)。
図5は、様々な実施形態にかかる、試験化学化合物510の測定されたラマンバーコードと参照化学化合物520の参照インシリコ模擬ラマンバーコードのライブラリとの、上述し、バーコード重複レベル530によって定量化された比較に基づく、「試験」化学化合物510と参照化合物520との類似性の判定を示す例示的なグリッド500を示している。様々な事例では、グリッド500は、試験化学化合物510の測定されたラマンバーコードと参照化学化合物520のインシリコ模擬ラマンバーコードとの間のバーコード重複のレベルのヒートマップを示し、試験化合物と参照化合物との各対の間の一致のレベルを示す。試験化合物510の測定されたラマンバーコードは、まず、試験化合物510のラマン分光測定を行って試験化合物510のラマンスペクトルを取得し、次いで、取得されたまたは測定された実験ラマンスペクトルをラマンバーコードに変換することによって生成され、一方、参照化合物520のインシリコ模擬ラマンバーコードは、参照化合物520のインシリコ模擬ラマンスペクトルを量子力学的DFT計算を用いて計算することによって生成され、その後、ラマンバーコードに変換される。非限定的な例として2-(N-モルホリノ)エタンスルホン酸(MES)に対応するカラムに注目すると、グリッドまたはヒートマップ500は、試験化合物MESと参照化合物3-(N-モルホリノ)プロパンスルホン酸(MOPS)との間のバーコード重複レベルについて高い強度(>75%)を示し、2つの化学化合物間の高いレベルの類似性を示し、一方、バーコード重複レベルは、MESおよびIPAのバーコード重複レベルについては低く、2つの化学化合物が実質的に異なることを示している。様々な実施形態では、グリッドまたはヒートマップ500が使用されて、バーコード重複閾値を較正してもよく、それを超えたとき、2つの化学化合物が同じであると見なされるかまたは判定され得る(例えば、未知の化学化合物のラマンバーコードを既知の化学化合物の参照ラマンバーコードと比較する場合)。例えば、2つの異なる化学化合物MESおよびMOPSは、>75%のバーコード重複レベルを有することができ、2つの化学化合物が同じであるかどうかを判定するためのバーコード重複閾値は、>75%よりも高く設定され得る。
【0039】
図6は、様々な実施形態にかかる、化学化合物の測定されたラマンバーコードと、化学化合物の参照インシリコ模擬ラマンバーコードのライブラリとの比較に基づいて未知の化学化合物を同定するための方法のフローチャートである。様々な実施形態では、プロセス600は、
図1に記載のラマンスペクトルに基づく化学化合物分類システム100を使用して実装され得る。
【0040】
ステップ610は、未知の化学化合物のラマン分光測定から抽出された未知の化学化合物のラマンスペクトルを取得することを含む。
【0041】
ステップ620は、取得されたラマンスペクトルを、模擬ラマンスペクトルライブラリに含まれる複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルと比較することを含む。様々な事例では、各模擬ラマンスペクトルは、既知の化学化合物の量子力学的計算によって生成され得る。
【0042】
ステップ630は、取得されたラマンスペクトルと参照模擬ラマンスペクトルとの比較に基づいて未知の化学化合物の同一性を同定することを含む。
【0043】
様々な実施形態では、プロセス600は、ラマンスペクトルのピークの強度レベルに少なくとも部分的に基づいて、ラマンスペクトルのピークに対応するラマンバーコードを生成することをさらに含む。様々な実施形態では、比較することは、生成されたラマンバーコードを、複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルに対応する参照模擬ラマンバーコードと比較することを含む。
【0044】
様々な実施形態では、模擬ラマンスペクトルライブラリは、ラマン分光測定を化学化合物に対して行うことによって取得される実験的ラマンスペクトルを除外する。様々な実施形態では、比較することは、生成されたラマンバーコードおよび/または参照ラマンバーコードにスケーリングアルゴリズムを適用して、生成されたラマンバーコードおよび/または参照ラマンバーコード間の波数オフセットを補正することを含む。
【0045】
様々な実施形態では、同定することは、生成されたラマンバーコードと参照模擬ラマンバーコードとの間のバーコード重複レベルがバーコード重複閾値を超えたとき、未知の化学化合物が、参照模擬ラマンスペクトルが計算される化学化合物と一致すると判定することを含む。様々な実施形態では、バーコード重複レベルは、生成されたラマンバーコードの第1の波数位置および参照模擬ラマンバーコードの第2の波数位置に位置するバーの数を示し、第1の波数位置および第2の波数位置は、互いに少なくとも実質的に等しい。
【0046】
様々な実施形態では、量子力学的計算は、密度汎関数理論(DFT)に基づいている。様々な実施形態では、生成することは、ピークの強度レベルのうちの1つのピークの強度レベルがピーク強度閾値を超えたとき、ピークのうちの1つピークに対応するバーコード内にバーを含めることを含む。様々な実施形態では、ピーク強度閾値は、ピークの強度レベルの平均である。様々な実施形態では、生成することは、ラマンスペクトルのピークの波数位置に少なくとも部分的に基づいて、ラマンスペクトルのピークに対応するラマンバーコードを生成することを含む。
【0047】
図7は、様々な実施形態にかかる、コンピュータシステムのブロック図である。コンピュータシステム700は、
図1において上述したラマンスペクトルに基づく化学化合物分類システム100の一実装の例であり得る。1つまたは複数の例では、コンピュータシステム700は、情報を通信するためのバス702または他の通信機構と、情報を処理するための、バス702と結合されたプロセッサ704とを含むことができる。様々な実施形態では、コンピュータシステム700は、プロセッサ704によって実行される命令を判定するためにバス702に結合された、ランダムアクセスメモリ(RAM)706または他の動的記憶装置とすることができるメモリも含むことができる。メモリはまた、プロセッサ704によって実行される命令の実行中にテンポラリ変数または他の中間情報を記憶するために使用可能である。様々な実施形態では、コンピュータシステム700は、プロセッサ704のための静的情報および命令を記憶するためにバス702に結合された読み出し専用メモリ(ROM)708または他の静的記憶装置をさらに含むことができる。磁気ディスクまたは光ディスクなどの記憶装置710が設けられ、情報および命令を記憶するためにバス702に結合され得る。
【0048】
様々な実施形態では、コンピュータシステム700は、バス702を介して、コンピュータユーザに情報を表示するために、陰極線管(CRT)または液晶ディスプレイ(LCD)などのディスプレイ712に結合され得る。英数字および他のキーを含む入力装置714は、情報およびコマンド選択をプロセッサ704に通信するためにバス702に結合され得る。別のタイプのユーザ入力装置は、プロセッサ704に方向情報およびコマンド選択を通信し、ディスプレイ712上のカーソル移動を制御するための、マウス、ジョイスティック、トラックボール、ジェスチャ入力装置、視線ベースの入力装置、またはカーソル方向キーなどのカーソル制御装置716である。この入力装置714は、典型的には、装置が平面内の位置を指定することを可能にする第1の軸(例えば、x)および第2の軸(例えば、y)の二軸の二自由度を有する。しかしながら、3次元(例えば、x、yおよびz)カーソル移動を可能にする入力装置714も本明細書で企図されることを理解されたい。
【0049】
本教示のある特定の実装形態と一致するように、プロセッサ704が、RAM706に含有される1つまたは複数の命令の1つまたは複数のシーケンスを実行することに応答して、結果がコンピュータシステム700によって提供可能である。そのような命令は、記憶装置710など、別のコンピュータ可読媒体またはコンピュータ可読記憶媒体からRAM706に読み込み可能である。RAM706に含まれている命令のシーケンスの実行は、プロセッサ704に、本明細書で説明されるプロセスを実行させることができる。あるいは、本教示を実装するために、ソフトウェア命令の代わりに、またはソフトウェア命令と組み合わせて、ハードワイヤード回路が使用され得る。したがって、本教示の実装は、ハードウェア回路とソフトウェアとの特定の組み合わせに限定されない。
【0050】
本明細書で使用される「コンピュータ可読媒体」(例えば、データストア、データストレージ、記憶装置、データ記憶装置など)、または「コンピュータ可読記憶媒体」という用語は、実行のためにプロセッサ704に命令を提供することに関与する任意の媒体を指す。そのような媒体は、不揮発性媒体、揮発性媒体、および伝送媒体を含むがこれらに限定されない多くの形態をとることができる。不揮発性媒体の例は、これらに限定されないが、記憶装置710などの光学、固体、磁気ディスクを含むことができる。揮発性媒体の例は、限定されないが、RAM706などの動的メモリを含むことができる。伝送媒体の例は、これらに限定されないが、バス702を備えるワイヤを含む、同軸ケーブル、銅線、および光ファイバを含むことができる。
【0051】
コンピュータ可読媒体の一般的な形態は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、または他の任意の磁気媒体、CD-ROM、他の任意の光学媒体、パンチカード、紙テープ、孔のパターンを有する他の任意の物理媒体、RAM、PROM、およびEPROM、フラッシュEPROM、他の任意のメモリチップまたはカートリッジ、またはコンピュータが読み出すことができる他の任意の有形媒体を含む。
【0052】
コンピュータ可読媒体に加えて、命令またはデータは、実行のためにコンピュータシステム700のプロセッサ704に1つまたは複数の命令のシーケンスを提供するために、通信装置またはシステムに含まれる伝送媒体上の信号として提供され得る。例えば、通信装置は、命令およびデータを示す信号を有するトランシーバを含み得る。命令およびデータは、1つまたは複数のプロセッサに、本明細書における開示に概説される機能を実装させるように構成されている。データ通信伝送接続の代表的な例は、これらに限定されないが、電話モデム接続、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、赤外線データ接続、NFC接続、光通信接続などを含むことができる。
【0053】
本明細書に記載の方法論、フローチャート、図、および付随する開示は、コンピュータシステム700をスタンドアロン装置として使用して、またはクラウドコンピューティングネットワークなどの共有コンピュータ処理リソースの分散ネットワーク上で実装され得ることを理解されたい。
【0054】
本明細書に記載の方法論は、用途に応じて様々な手段によって実装され得る。例えば、これらの方法論は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの任意の組み合わせで実装されてもよい。ハードウェア実装形態の場合、処理ユニットは、1つまたは複数の特定用途向け集積回路(ASIC)、デジタルシグナルプロセッサ(DSP)、デジタル信号処理装置(DSPD)、プログラマブル論理デバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子装置、本明細書において説明される機能を実施するように設計された他の電子ユニット、またはそれらの組み合わせ内に実装され得る。
【0055】
様々な実施形態では、本教示の方法は、C、C++、Pythonなどのような従来のプログラミング言語で書かれたファームウェアおよび/またはソフトウェアプログラムおよびアプリケーションとして実装されてもよい。ファームウェアおよび/またはソフトウェアとして実装される場合、本明細書に記載される実施形態は、コンピュータに上述した方法を実行させるためのプログラムが記憶された非一時的コンピュータ可読媒体上に実装され得る。本明細書において説明される様々なエンジンは、コンピュータシステム700など、コンピュータシステムに提供され得、それによって、プロセッサ704は、メモリ構成要素であるRAM706、ROM708、または記憶装置710のうちの任意の1つ、あるいはそれらの組み合わせによって提供された命令、および入力装置714を介して提供されたユーザ入力を受けて、これらのエンジンによって提供される分析および判定を実行することを理解されたい。
【0056】
本教示は、様々な実施形態に関連して説明されているが、本教示がそのような実施形態に限定されることは意図されていない。逆に、本教示は、当業者によって理解されるように、様々な代替、変更、および均等物を包含する。
【0057】
例えば、上述したフローチャートおよびブロック図は、様々な方法およびシステム実施形態の可能な実装のアーキテクチャ、機能、および/または動作を示している。フローチャートまたはブロック図の各ブロックは、モジュール、セグメント、機能、動作もしくはステップの一部、またはそれらの組み合わせを表し得る。様々な実施形態のいくつかの代替実装では、ブロックに記載された1つまたは複数の機能は、図に記載された順序とは異なる順序で行われてもよい。例えば、様々な場合では、連続して示される2つのブロックが実質的に同時に実行されてもよい。その他の場合には、ブロックは、逆の順序で実行されてもよい。さらに、様々な場合では、フローチャートまたはブロック図における1つまたは複数の他のブロックを置き換えるまたは補足するために1つまたは複数のブロックが追加されてよい。
【0058】
したがって、様々な実施形態を説明する際に、本明細書は、特定の一連のステップとして方法および/またはプロセスを提示している場合がある。しかしながら、方法またはプロセスが本明細書に記載される特定の順序のステップに依存していない範囲で、方法またはプロセスは、説明した特定の順序のステップに限定されるべきではなく、当業者が容易に理解することができるように、順序は変えられる場合があり、且つ依然として、様々な実施形態の趣旨および範囲内にとどまる場合がある。
【0059】
さらに、要素のリスト(例えば、要素a、b、c)が参照される場合、そのような参照は、リスト化された要素のいずれか1つそれ自体、リスト化された要素の全てより少ないものからなる任意の組み合わせ、および/または、リスト化された要素の全ての組み合わせを含むことが意図されている。本明細書におけるセクションの区分は、単に検討を容易にするためのものであり、説明された要素の任意の組み合わせを限定するものではない。
【0060】
特に定義されない限り、本明細書に記載される本教示に関連して使用される科学用語および技術用語は、当業者によって一般的に理解される意味を有するものとする。さらに、文脈が特に必要としない限り、単数形の用語は、複数形を含み、複数形の用語は、単数形を含むものとする。一般に、化学、生化学、分子生物学、薬理学および毒物学に関連して利用される命名法およびその技術は、本明細書に記載されており、当該技術分野において周知であり、一般的に使用されるものである。
【0061】
本明細書で使用される場合、「実質的に」は、意図された目的のために機能するのに十分であることを意味する。したがって、「実質的に」という用語は、当業者によって予想されるが、全体的な性能にそれほど影響しないような、絶対的または完全な状態、寸法、測定値、結果などからの微細な、僅かな変動を許容する。数値もしくはパラメータまたは数値として表現され得る特性に関して使用されるとき、「実質的に」は、10パーセント以内を意味する。
【0062】
本明細書で使用される、数値、またはパラメータ、または数値として表され得る特性に関して使用される「約(about)」という用語は、数値の10パーセント以内を意味する。例えば、「約50」は、包含的である、45から55までの範囲内の値を意味する。
【0063】
用語「1つ(ones)」は、1つよりも多いことを意味する。
【0064】
本明細書で使用される場合、「複数」という用語は、2、3、4、5、6、7、8、9、10以上とすることができる。
【0065】
本明細書で使用される場合、「のセット」という用語は、1つまたは複数を意味する。例えば、項目のセットは、1つまたは複数の項目を含む。
【0066】
本明細書で使用される場合、「のうちの少なくとも1つ」という語句は、項目のリストとともに使用される場合、列挙された項目のうちの1つまたは複数の異なる組み合わせが使用されてもよく、リスト内の項目のうちの1つのみが必要とされてもよいことを意味する。項目は、特定の物体、物、ステップ、動作、プロセス、またはカテゴリであり得る。換言すれば、「のうちの少なくとも1つ」は、リストから項目の任意の組み合わせまたは任意の数の項目が使用され得るが、リスト内の項目の全てが必要とされるわけではないことを意味する。例えば、限定されないが、「項目A、項目B、または項目Cのうちの少なくとも1つ」は、項目A、項目Aおよび項目B、項目B、項目A、項目B、および項目C、項目Bおよび項目C、または項目AおよびCを意味する。様々な場合では、「項目A、項目B、または項目Cのうちの少なくとも1つ」は、限定されないが、項目Aのうちの2つ、項目Bのうちの1つ、および項目Cのうちの10個、項目Bのうちの4個と項目Cのうちの7個、またはいくつかの他の適切な組み合わせを意味する。
実施形態の記載
【0067】
実施形態1:未知の化学化合物のラマン分光測定から抽出された未知の化学化合物のラマンスペクトルを取得することと、取得されたラマンスペクトルを、模擬ラマンスペクトルライブラリに含まれる複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルと比較することであって、各模擬ラマンスペクトルが、既知の化学化合物の量子力学的計算によって生成される、取得されたラマンスペクトルを参照模擬ラマンスペクトルと比較することと、取得されたラマンスペクトルと参照模擬ラマンスペクトルとの比較に基づいて未知の化学化合物の同一性を同定することと、を含む、方法。
【0068】
実施形態2:模擬ラマンスペクトルライブラリが、ラマン分光測定を化学化合物に対して行うことによって取得される実験的ラマンスペクトルを除外する、実施形態1に記載の方法。
【0069】
実施形態3:ラマンスペクトルのピークの強度レベルに少なくとも部分的に基づいて、ラマンスペクトルのピークに対応するラマンバーコードを生成することをさらに含む、実施形態1または2に記載の方法。
【0070】
実施形態4:比較することが、生成されたラマンバーコードを、複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルに対応する参照模擬ラマンバーコードと比較することを含む、実施形態3に記載の方法。
【0071】
実施形態5:比較することが、取得されたラマンスペクトルおよび/または参照模擬ラマンスペクトルにスケーリングアルゴリズムを適用して、取得されたラマンスペクトルおよび/または参照模擬ラマンスペクトルの間の波数オフセットを補正することを含む、実施形態1から4のいずれか一項に記載の方法。
【0072】
実施形態6:同定することが、生成されたラマンバーコードと参照模擬ラマンバーコードとの間のバーコード重複レベルがバーコード重複閾値を超えたときに、未知の化学化合物が、参照模擬ラマンスペクトルが計算される化学化合物と一致すると判定することを含む、実施形態4に記載の方法。
【0073】
実施形態7:バーコード重複レベルが、生成されたラマンバーコードの第1の波数位置および参照模擬ラマンバーコードの第2の波数位置に位置するバーの数を示し、第1の波数位置および第2の波数位置が互いに少なくとも実質的に等しい、実施形態6に記載の方法。
【0074】
実施形態8:量子力学的計算が密度汎関数理論(DFT)に基づく、実施形態1から7のいずれか一項に記載の方法。
【0075】
実施形態9:生成することが、ピークの強度レベルがピーク強度閾値を超えたときに、ピークのうちの1つのピークに対応するバーをラマンバーコードに含めることを含む、実施形態3に記載の方法。
【0076】
実施形態10:ピーク強度閾値が、ピークの強度レベルの平均である、実施形態9に記載の方法。
【0077】
実施形態11:生成することが、ラマンスペクトルのピークの波数位置に少なくとも部分的に基づいて、ラマンスペクトルのピークに対応するラマンバーコードを生成することを含む、実施形態3に記載の方法。
【0078】
実施形態12:システムであって、命令を記憶する非一時的メモリと、非一時的メモリに結合され、システムに動作を実行させるために非一時的メモリから前記命令を読み取るように構成された1つまたは複数のハードウェアプロセッサであって、動作が、未知の化学化合物のラマン分光測定から抽出された未知の化学化合物のラマンスペクトルを取得することと、取得されたラマンスペクトルを、模擬ラマンスペクトルライブラリに含まれる複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルと比較することであって、各模擬ラマンスペクトルが、既知の化学化合物の量子力学的計算によって生成される、前記取得されたラマンスペクトルを参照模擬ラマンスペクトルと比較することと、取得されたラマンスペクトルと参照模擬ラマンスペクトルとの比較に基づいて未知の化学化合物の同一性を同定することと、を含む、1つまたは複数のハードウェアプロセッサと、を備える、システム。
【0079】
実施形態13:模擬ラマンスペクトルライブラリが、ラマン分光測定を化学化合物に対して行うことによって取得される実験的ラマンスペクトルを除外する、実施形態12に記載のシステム。
【0080】
実施形態14:動作が、ラマンスペクトルのピークの強度レベルに少なくとも部分的に基づいて、ラマンスペクトルのピークに対応するラマンバーコードを生成することをさらに含む、実施形態12または13に記載のシステム。
【0081】
実施形態15:比較することが、生成されたラマンバーコードを、複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルに対応する参照模擬ラマンバーコードと比較することを含む、実施形態14に記載のシステム。
【0082】
実施形態16:比較することが、取得されたラマンスペクトルおよび/または参照模擬ラマンスペクトルにスケーリングアルゴリズムを適用して、取得されたラマンスペクトルおよび/または参照模擬ラマンスペクトルの間の波数オフセットを補正することを含む、実施形態12から15のいずれか一項に記載のシステム。
【0083】
実施形態17:同定することが、生成されたラマンバーコードと参照模擬ラマンバーコードとの間のバーコード重複レベルがバーコード重複閾値を超えたときに、未知の化学化合物が、参照模擬ラマンスペクトルが計算される化学化合物と一致すると判定することを含む、実施形態15に記載のシステム。
【0084】
実施形態18:バーコード重複レベルが、生成されたラマンバーコードの第1の波数位置および参照模擬ラマンバーコードの第2の波数位置に位置するバーの数を示し、第1の波数位置および第2の波数位置が互いに少なくとも実質的に等しい、実施形態17に記載のシステム。
【0085】
実施形態19:量子力学的計算が密度汎関数理論(DFT)に基づく、実施形態12から18のいずれか一項に記載のシステム。
【0086】
実施形態20:生成することが、ピークの強度レベルがピーク強度閾値を超えたときに、ピークのうちの1つのピークに対応するバーをバーコードに含めることを含む、実施形態14に記載のシステム。
【0087】
実施形態21:ピーク強度閾値が、ピークの強度レベルの平均である、実施形態20に記載のシステム。
【0088】
実施形態22:生成することが、ラマンスペクトルのピークの波数位置に少なくとも部分的に基づいて、ラマンスペクトルのピークに対応するラマンバーコードを生成することを含む、実施形態14に記載のシステム。
【0089】
実施形態23:動作の実行を引き起こすように実行可能なコンピュータ可読命令を記憶した非一時的コンピュータ可読媒体(CRM)であって、動作が、未知の化学化合物のラマン分光測定から抽出された未知の化学化合物のラマンスペクトルを取得することと、取得されたラマンスペクトルを、模擬ラマンスペクトルライブラリに含まれる複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルと比較することであって、各模擬ラマンスペクトルが、既知の化学化合物の量子力学的計算によって生成される、前記取得されたラマンスペクトルを参照模擬ラマンスペクトルと比較することと、取得されたラマンスペクトルと参照模擬ラマンスペクトルとの比較に基づいて未知の化学化合物の同一性を同定することと、を含む、非一時的コンピュータ可読媒体(CRM)。
【0090】
実施形態24:模擬ラマンスペクトルライブラリが、ラマン分光測定を化学化合物に対して行うことによって取得される実験的ラマンスペクトルを除外する、実施形態23に記載の非一時的CRM。
【0091】
実施形態25:動作が、ラマンスペクトルのピークの強度レベルに少なくとも部分的に基づいて、ラマンスペクトルのピークに対応するラマンバーコードを生成することをさらに含む、実施形態23または24に記載の非一時的CRM。
【0092】
実施形態26:比較することが、生成されたラマンバーコードを、複数の模擬ラマンスペクトルの参照模擬ラマンスペクトルに対応する参照模擬ラマンバーコードと比較することを含む、実施形態25に記載の非一時的CRM。
【0093】
実施形態27:比較することが、取得されたラマンスペクトルおよび/または参照模擬ラマンスペクトルにスケーリングアルゴリズムを適用して、取得されたラマンスペクトルおよび/または参照模擬ラマンスペクトルの間の波数オフセットを補正することを含む、実施形態23から26のいずれか一項に記載の非一時的CRM。
【0094】
実施形態28:同定することが、生成されたラマンバーコードと参照模擬ラマンバーコードとの間のバーコード重複レベルがバーコード重複閾値を超えたときに、未知の化学化合物が、参照模擬ラマンスペクトルが計算される化学化合物と一致すると判定することを含む、実施形態26に記載の非一時的CRM。
【0095】
実施形態29:バーコード重複レベルが、生成されたラマンバーコードの第1の波数位置および参照模擬ラマンバーコードの第2の波数位置に位置するバーの数を示し、第1の波数位置および第2の波数位置が互いに少なくとも実質的に等しい、実施形態28に記載の非一時的CRM。
【0096】
実施形態30:量子力学的計算が密度汎関数理論(DFT)に基づく、実施形態23から29のいずれか一項に記載の非一時的CRM。
【0097】
実施形態31:生成することが、ピークの強度レベルがピーク強度閾値を超えたときに、ピークのうちの1つのピークに対応するバーをバーコードに含めることを含む、実施形態25に記載の非一時的CRM。
【0098】
実施形態33:ピーク強度閾値が、ピークの強度レベルの平均である、実施形態31に記載の非一時的CRM。
【0099】
実施形態33:生成することが、ラマンスペクトルのピークの波数位置に少なくとも部分的に基づいて、ラマンスペクトルのピークに対応するラマンバーコードを生成することを含む、実施形態25に記載の非一時的CRM。
【国際調査報告】