IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ グリーントロピズムの特許一覧

特表2023-525494生物学的液体中の病原体の存在を検出する方法
<>
  • 特表-生物学的液体中の病原体の存在を検出する方法 図1
  • 特表-生物学的液体中の病原体の存在を検出する方法 図2
  • 特表-生物学的液体中の病原体の存在を検出する方法 図3
  • 特表-生物学的液体中の病原体の存在を検出する方法 図4
  • 特表-生物学的液体中の病原体の存在を検出する方法 図5
  • 特表-生物学的液体中の病原体の存在を検出する方法 図6
  • 特表-生物学的液体中の病原体の存在を検出する方法 図7
  • 特表-生物学的液体中の病原体の存在を検出する方法 図8
  • 特表-生物学的液体中の病原体の存在を検出する方法 図9
  • 特表-生物学的液体中の病原体の存在を検出する方法 図10
  • 特表-生物学的液体中の病原体の存在を検出する方法 図11
  • 特表-生物学的液体中の病原体の存在を検出する方法 図12
  • 特表-生物学的液体中の病原体の存在を検出する方法 図13
  • 特表-生物学的液体中の病原体の存在を検出する方法 図14
  • 特表-生物学的液体中の病原体の存在を検出する方法 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-06-16
(54)【発明の名称】生物学的液体中の病原体の存在を検出する方法
(51)【国際特許分類】
   G01N 21/65 20060101AFI20230609BHJP
   G01N 33/483 20060101ALI20230609BHJP
   C12M 1/34 20060101ALI20230609BHJP
【FI】
G01N21/65
G01N33/483 C
C12M1/34 B
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022566013
(86)(22)【出願日】2021-04-30
(85)【翻訳文提出日】2022-12-09
(86)【国際出願番号】 FR2021050751
(87)【国際公開番号】W WO2021219969
(87)【国際公開日】2021-11-04
(31)【優先権主張番号】2004334
(32)【優先日】2020-04-30
(33)【優先権主張国・地域又は機関】FR
(31)【優先権主張番号】2011030
(32)【優先日】2020-10-28
(33)【優先権主張国・地域又は機関】FR
(81)【指定国・地域】
(71)【出願人】
【識別番号】518113199
【氏名又は名称】グリーントロピズム
(74)【代理人】
【識別番号】100114775
【弁理士】
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【弁理士】
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【弁理士】
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100208580
【弁理士】
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100191086
【弁理士】
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】ブランジェ,アンソニー フランソワ ミシェル クロード デュドネ
(72)【発明者】
【氏名】カストラン,サンドリーヌ
(72)【発明者】
【氏名】ルフラン,サンドリーヌ ゴデリーヴ アニエス
(72)【発明者】
【氏名】ガウェイン,ピエール ミシェル ルネ
(72)【発明者】
【氏名】ペレス,フローレント ジュール アドリアン
(72)【発明者】
【氏名】エル,メサウーディ サナア
(72)【発明者】
【氏名】バノン,アレクサンドル アントワーヌ ベンジャミン マリー
(72)【発明者】
【氏名】ガルスオールト,デルフィン ステファニー ジャニーヌ マリー-テレーズ
(72)【発明者】
【氏名】ゲーデ,ティファニー
(72)【発明者】
【氏名】シュミット-ブランジェ,マリオン
【テーマコード(参考)】
2G043
2G045
4B029
【Fターム(参考)】
2G043AA01
2G043BA16
2G043BA17
2G043CA03
2G043EA03
2G043GA01
2G043HA01
2G043HA02
2G043HA09
2G043JA02
2G043LA01
2G043NA01
2G045CB30
2G045FA12
2G045FA28
2G045GC11
4B029AA07
4B029BB01
4B029BB02
4B029BB06
4B029BB07
4B029BB13
4B029CC01
4B029FA01
(57)【要約】
表面増強ラマン分光法(SERS)による病原体、特にSARS-CoV-2の検出のためのキット、システムおよび方法。キットは、非磁性天然金属ナノ粒子と、前記試料中の前記病原体の存在を検出するように設計されたソフトウェアと、を含む。


【特許請求の範囲】
【請求項1】
非磁性天然金属ナノ粒子と接触させた試料から得られた少なくとも1つの表面増強ラマン分光(SERS)信号において病原体を検出するための方法であって、コンピュータによって実施され、
-前記非磁性天然金属ナノ粒子と接触させた前記試料から得られた各表面増強ラマン分光(SERS)信号の受信と、
-受信した各表面増強ラマン分光信号を、前記試料中の前記病原体の有無を表す少なくとも1つのクラスと関連付けるように構成された分類モデルの実施と、
を含む、方法。
【請求項2】
前記分類モデルが、ニューラルネットワーク、ランダムフォレスト、サポートベクターマシン、関連性ベクトルマシン、PLSDA、および/またはベイジアンモデルの中の少なくとも1つ、好ましくはニューラルネットワークおよび/またはランダムフォレスト、を含む、請求項1に記載の方法。
【請求項3】
前記受信と前記分類モデルの実施との間に、各表面増強ラマン分光信号の前処理ステップを含み、前記前処理ステップが、好ましくは、以下の前処理:平均の減少、標準法線変動、最大値による正規化、極値による正規化、平滑化、好ましくはSavitzky-Golayアルゴリズムによる平滑化、ベースラインの減少または補正、導出、好ましくは次数1または2の導出のうちの少なくとも1つの前記実施を含む、請求項1または2に記載の方法。
【請求項4】
前記受信と前記分類モデルの実施との間に、
-試料採取の形態、または
-各表面増強ラマン分光信号を送達する分光計モデル、または
-前記試料を採取した対象に関するデータ、または
-試料輸送媒体、または
-検出される病原体、に基づいて、いくつかの事前定義された分類モデルから使用される前記分類モデルの自動選定を含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記病原体が、ウイルス、プリオン、寄生虫、真菌、酵母および細菌を含む群の要素のうちの1つであり、好ましくはSARS-CoV-2である、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記病原体がSARS-CoV-2であり、受信した各表面増強ラマン分光信号を、前記試料中の前記病原体の有無を表す各対応するクラスと関連付けるために、前記分類モデルが、以下のうちの前記表面増強ラマン分光信号における少なくとも3つのピークに関する少なくとも1つの処理を適用するように構成される、請求項1~5のいずれか一項に記載の方法:
-419cm-1~459cm-1、好ましくは434cm-1~444cm-1のラマンオフセットにおけるピーク、または
-566cm-1~606cm-1、好ましくは581cm-1~591cm-1のラマンオフセットにおけるピーク、または
-646cm-1~686cm-1、好ましくは661cm-1~671cm-1のラマンオフセットにおけるピーク、または
-719cm-1~759cm-1、好ましくは734cm-1~744cm-1のラマンオフセットにおけるピーク、または
-839cm-1~879cm-1、好ましくは854cm-1~864cm-1のラマンオフセットにおけるピーク、または
-962cm-1~1002cm-1、好ましくは977cm-1~987cm-1のラマンオフセットにおけるピーク、または
-1006cm-1~1046cm-1、好ましくは1021cm-1~1031cm-1のラマンオフセットにおけるピーク、または
-1121cm-1~1161cm-1、好ましくは1136cm-1~1146cm-1のラマンオフセットにおけるピーク、または
-1190cm-1~1230cm-1、好ましくは1205cm-1~1215cm-1のラマンオフセットにおけるピーク、または
-1339cm-1~1379cm-1、好ましくは1354cm-1~1364cm-1のラマンオフセットにおけるピーク、または
-1529cm-1~1569cm-1、好ましくは1544cm-1~1554cm-1のラマンオフセットにおけるピーク、または
-1591cm-1~1631cm-1、好ましくは1606cm-1~1616cm-1のラマンオフセットにおけるピーク、または
-1662cm-1~1702cm-1、好ましくは1677cm-1~1687cm-1のラマンオフセットにおけるピーク、または
-1722cm-1~1762cm-1、好ましくは1737cm-1~1747cm-1のラマンオフセットにおけるピーク、または
-1796cm-1~1836cm-1、好ましくは1811cm-1~1821cm-1のラマンオフセットにおけるピーク、または
-2058cm-1~2098cm-1、好ましくは2073cm-1~2083cm-1のラマンオフセットにおけるピーク、または
-2110cm-1~2150cm-1、好ましくは2125cm-1~2135cm-1のラマンオフセットにおけるピーク、または
-2322cm-1~2362cm-1、好ましくは2337cm-1~2347cm-1のラマンオフセットにおけるピーク、または
-2460cm-1~2500cm-1、好ましくは2475cm-1~2485cm-1のラマンオフセットにおけるピーク。
【請求項7】
各表面増強ラマン分光信号の前記受信が、
a)溶液または懸濁液を得るための前記試料と非磁性天然金属ナノ粒子との接触と、
b)媒体上の前記溶液または懸濁液の堆積と、
c)前記堆積によって放射された各表面増強ラマン分光信号の検出と、を含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記試料が、前記非磁性天然金属ナノ粒子を含む遠心分離ペレットと接触させる前に溶解される、請求項7に記載の方法。
【請求項9】
前記非磁性天然金属ナノ粒子が、50~200nm、好ましくは100~200nm、さらにより好ましくは100~150nmの直径を有する、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記非磁性天然金属ナノ粒子が、第1の金属の非磁性ナノ粒子および第2の金属の非磁性ナノ粒子を含み、前記第1の金属の前記ナノ粒子が、前記第2の金属の前記ナノ粒子とは異なる、請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記第1の金属の前記非磁性金属ナノ粒子が、金粒子であり、前記第2の金属の前記非磁性金属ナノ粒子が、銀ナノ粒子である、請求項10に記載の方法。
【請求項12】
各表面増強ラマン分光信号の前記受信が、
-好ましくは750~800nmの波長の励起光放射であって、前記励起光が前記試料に到達する、励起光放射と、
-前記励起光が前記試料に到達する間の、前記試料による反射光、透過光、散乱光または後方散乱光の、センサまたは分光計による捕捉と、を含む、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記励起光が、前記試料に到達し、前記試料が、前記非磁性天然金属ナノ粒子と接触している間に、前記分光計またはセンサが、前記捕捉ステップを実施する、請求項12に記載の方法。
【請求項14】
コンピュータプログラム製品であって、コンピュータによって実行されると、請求項1~6のいずれか一項に記載の方法を実施するプログラムコード命令を含む、コンピュータプログラム製品。
【請求項15】
表面増強ラマン分光法(SERS)によって試料中の病原体の存在を検出するためのキットであって、前記キットが、非磁性天然金属ナノ粒子と、請求項1~6のいずれか一項に記載の方法を実施することによって前記試料中の前記病原体の存在を検出するように構成されたソフトウェアおよび/またはソフトウェア媒体と、を備える、キット。
【請求項16】
前記非磁性天然金属ナノ粒子が、第1の金属の非磁性ナノ粒子および第2の金属の非磁性ナノ粒子を含み、前記第1の金属の前記ナノ粒子が、前記第2の金属の前記ナノ粒子とは異なる、請求項15に記載のキット。
【請求項17】
前記第1の金属の前記非磁性金属ナノ粒子が、金ナノ粒子であり、前記第2の金属の前記非磁性金属ナノ粒子が、銀ナノ粒子である、請求項16に記載のキット。
【請求項18】
溶解緩衝液をさらに含む、請求項15~17のいずれか一項に記載のキット。
【請求項19】
検出可能な前記病原体が、ウイルス、プリオン、寄生虫、真菌、酵母および細菌を含む群の要素のうちの1つであり、特にSARS-CoV-2である、請求項15~18のいずれか一項に記載のキット。
【請求項20】
前記非磁性天然金属ナノ粒子が、50~200nm、好ましくは100~200nm、さらにより好ましくは100~150nmの平均直径を有する、請求項15~19のいずれか一項に記載のキット。
【請求項21】
前記非磁性天然金属ナノ粒子が、金、銀、銅、白金またはこれらの金属のうちの1つをベースとする合金の粒子である、請求項15~20のいずれか一項に記載のキット。
【請求項22】
表面増強ラマン分光法(SERS)によって試料中の病原体の存在を検出するための、請求項15~21のいずれか一項に記載のキットの使用。
【請求項23】
前記ソフトウェアが、前記病原体の存在に関連する疾患の診断をさらに提供する、請求項22に記載の使用。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、表面増強ラマン分光法(SERS)によって病原体の存在を検出するためのキット、前記キットの使用、およびSERSによって病原体の存在を検出するための方法に関する。この速くて再現性のある方法は、高い感度および特異性を有する。本発明の分野は、より具体的には、生物学的試料中の病原体の存在を検出する分野である。
【背景技術】
【0002】
ウイルスを含む様々な病原体は、毎年、上気道感染症(鼻炎、咽頭炎)、インフルエンザ、胃腸感染症、または水痘、麻疹および流行性耳下腺炎などの小児初期ウイルス感染症などの多くの一般的なヒト疾患の原因である。いくつかのウイルス性疾患は、出血熱(EBOLAウイルス、黄熱)、ウイルス性脳炎(狂犬病ウイルス、デングウイルス、単純ヘルペスウイルス、ポリオウイルス)、および後天性免疫不全症候群(AIDS)などの有意な罹患力または死亡力を有する。麻疹およびサイトメガロウイルスは、重篤な異常または胎児の死亡を引き起こす可能性がある。推定1,000~1,500種類のウイルスのうち、約250種類がヒトにおいて疾患を引き起こす。エプスタイン・バーウイルス、パピローマウイルス、ならびにB型およびC型肝炎ウイルスなどのいくつかのヒトウイルスも、癌の発生に関連している。
【0003】
COVID-19病は、2019年末に中国で発症し、コロナウイルス科に属するウイルスであるSARS-CoV-2によって引き起こされる重度の急性呼吸器症候群である。後者は、非常に一般的であるが、下部気道型肺炎の単純な風邪または呼吸器感染症を引き起こし、重症急性呼吸器症候群(2003年のSARS-CoV)、中東呼吸器症候群(2012年のMERS-CoV)、および現在のCOVID-19(SARS-CoV-2)などの致命的な流行を引き起こす可能性がある。
【0004】
現在のウイルス診断方法は、
(i)ウイルス粒子またはその成分のうちの1つ(ウイルス抗原、ウイルスゲノムもしくはウイルスタンパク質の酵素特性)のいずれかの探索であって、直接診断に対応し、この探索が抗原の迅速検出試験またはゲノムの分子生物学技術(DNAもしくはRNAゲノムの性質に応じてPCRもしくはRT-PCR)を使用する、探索
(ii)または、求められるウイルスに特異的な抗体の検出に対応する、ウイルスに対する宿主の応答の探索、を伴う。この探索は、主に、ELISA(「酵素結合免疫吸着測定法」などの最も頻繁に自動化された免疫化学技術によって行われる。
【0005】
しかしながら、広く展開されている高感度で特異的な技術であるウイルスゲノムの探索は、重く高価な機器を必要とし、しばしば時間がかかる。
【0006】
現在、SARS-CoV-2では、鼻咽頭スワブに対するRT-PCRによる分子生物学試験のみがSARS-CoV-2感染を確認することができる。
【0007】
多くの抗原または血清学的試験が展開され、検証されている。これらの試験は、ウイルスのスパイク表面タンパク質を標的とするか、またはキットに応じてIgGおよび/もしくはIgM免疫グロブリンの有無を強調することを可能にする。
【0008】
ラマン分光法は、非侵襲的な化学分析方法である。それは、材料の化学組成、その環境またはその酸化度の同時の特徴付けを提供する赤外(IR)分光法のような振動分光法である。それは、初期低感度技術であるが、その低感度は、表面増強ラマン分光法(SERS)の導入によって補償されている。この方法論は、ナノ構造基板または金属ナノ粒子の形態の使用に基づく。金属の自由電子は、表面プラズモンの共鳴(局所表面プラズモン共鳴、すなわちLSPR)でこれらのナノ構造体において振動し、近くの化合物のラマン信号の強い局所増幅を最大1012個まで引き起こし、単一分子の検出まで可能にする。
【0009】
技術の特異性を高めるために、使用される基質を官能化することが可能である。これらの官能化ナノ粒子は、試料中に存在するかどうかを決定するために調査されている病原体由来の生物学的分子(タンパク質および核酸など)に特異的に結合することを意図している。この場合、試料から得られたSERSスペクトルにおけるピークの存在は、探索された病原体の存在を反映する。逆に、目的の病原体に由来しない分子は、それらのラマン信号が増幅されておらず、SERS信号にごくわずかしか寄与しない。言い換えれば、試料中に病原体が存在する場合、前記試料に基づいて得られるSERS分光測定信号は、前記病原体からの分子の寄与のみをほとんど含む。
【0010】
このようにして、解釈を非常に困難にするであろうSERSスペクトルの過度の複雑さが回避される。実際、金属ナノ粒子の官能化がなければ、試料中に存在する全ての化合物が同程度の割合でラマンスペクトルに寄与する可能性が高い:これは、複雑さが解釈を非常に困難にするラマンスペクトルをもたらす。
【0011】
しかしながら、そのような検出プロセスは、完全に満足できるものではない。
【0012】
実際、上記の官能化のために、最新技術の検出方法は、金属ナノ粒子が特異的である単一の病原体のみを、それらの官能化のために検出する可能性が高い。したがって、新しい病原体の検出には、この新しい病原体に特異的な異なる金属ナノ粒子の使用が必要である。その結果、実施するのが面倒な汎用性のない検出プロセスとなる。
【0013】
加えて、先行技術の検出プロセスは、変異体および突然変異体の影響を受けやすい:換言すれば、突然変異体が官能化金属ナノ粒子が結合すると予想される部位に影響を及ぼす場合、所与の病原体の変異体または突然変異体を検出しない場合がある。
【0014】
したがって、病原体、例えばSARS-Cov-2を含むウイルスを検出するための信頼性が高く迅速な検出方法を提供する必要がある。
【発明の概要】
【0015】
したがって、本発明の目的は、従来技術の方法よりも速く、より再現性があり、より高感度であり、および/またはより特異的であるが、より汎用性があり(すなわち、ユニバーサル)、実施がより容易であり、病原体の変異体および突然変異体に対する感度がより低い検出方法を提供することである。
【0016】
本発明の目的はまた、上記の問題を解決する可能性が高い
-コンピュータプログラム製品、
-表面増強ラマン分光法(SERS)による病原体の検出のためのキット、および/または
-表面増強ラマン分光法(SERS)による病原体の検出のためのその使用、を提供することである。
【0017】
発明の開示
したがって、本発明は、非磁性金属ナノ粒子と接触させた試料から得られた少なくとも1つの表面増強ラマン分光信号において病原体を検出するための方法であって、コンピュータによって実施され、
-非磁性金属ナノ粒子、好ましくは非磁性天然金属ナノ粒子と接触させた試料から得られた各表面増強ラマン分光信号の受信と、
-受信した各表面増強ラマン分光信号を、前記試料中の病原体の有無を表す少なくとも1つのクラスと関連付けるように構成された分類モデルの実施と、を含む、方法に関する。
【0018】
実際、天然金属ナノ粒子の使用は、所与の病原体に対して特異的に官能化された金属ナノ粒子のバッチを必要とせずに、任意の病原体の有無を表すSERS信号をもたらす。
【0019】
本発明による方法によって得られるSERS分光信号は、非常に複雑である(したがって、オペレータによるその分析を妨げる)が、分類モデルの使用は、取得されたSERS信号から特徴を確実に抽出して、試料中の所与の病原体の有無を結論付けることを可能にする。
【0020】
「天然金属ナノ粒子」とは、本発明の意味の範囲内で、非官能化金属ナノ粒子、すなわち裸の金属ナノ粒子を意味する。
【0021】
別の態様によれば、本発明は、少なくとも1つの表面増強ラマン分光信号において病原体を検出するための方法であって、
-試料と非磁性金属ナノ粒子、好ましくは天然金属ナノ粒子との接触と、
-非磁性金属ナノ粒子と接触させた試料から得られた少なくとも1つの表面増強ラマン分光信号の取得と、
-取得された各表面増強ラマン分光信号を、試料中の病原体の有無を表す少なくとも1つのクラスと関連付けるように構成された分類モデルのコンピュータによる実施と、を含む、方法に関する。
【0022】
本発明はまた、表面増強ラマン分光法(SERS)によって試料中の病原体の存在を検出するためのキットであって、溶解緩衝液(任意選択)と、非磁性金属ナノ粒子(好ましくは天然)と、前記試料中の前記病原体の存在を検出するように設計および/または配置および/またはプログラムされたソフトウェアおよび/またはソフトウェア媒体と、を備える、キットに関する。
【0023】
本発明者らは、懸濁液中の非磁性金属ナノ粒子が、解釈が容易で再現性のあるSERSデータを容易かつ急速に得ることができることを示した。
【0024】
非常に有利には、記載された全ての例において、および考慮される全ての変形例において、非磁性金属ナノ粒子は、非磁性天然金属ナノ粒子である。
【0025】
非磁性金属ナノ粒子は、好ましくは、第1の金属の金属非磁性ナノ粒子と第2の金属の非磁性ナノ粒子との混合物を含み、第1の金属のナノ粒子は、第2の金属のナノ粒子とは異なる。これは、異なる金属で作製されたナノ粒子が異なるスペクトル範囲でラマン散乱光子を増幅する可能性が高いため、有利である。これは、より豊富なSERSスペクトルをもたらし、所望の病原体の検出を容易にする可能性が高い。
【0026】
本発明によれば、任意選択である溶解緩衝液は、ウイルスのカプシド、真菌、酵母、細菌またはウイルスの膜タンパク質またはエンベロープなどの病原体のタンパク質を可溶化し、試料からRNAまたはDNAを放出することができる当業者に公知の任意の緩衝液であり得る。この緩衝液は、SERS技術と互換性がなければならない。例には、トリス(トリス(ヒドロキシメチル)アミノメタンとも呼ばれる)、EDTA(エチレンジアミン四酢酸とも呼ばれる)、HEPES(4-(2-ヒドロキシエチル)-1-ピペラジンエタンスルホン酸とも呼ばれる)またはSDS(ドデシル硫酸ナトリウムとも呼ばれる)に基づく溶解緩衝液が含まれる。
【0027】
本発明によれば、試料は、血液、血漿、唾液、涙、鼻咽頭液、汗、尿、リンパ液、脳脊髄液、ヒトもしくは動物の組織またはヒトもしくは動物の細胞から選択され得る。試料はまた、水道水もしくは河川水などの任意の液体であり得るか、または汚染され得る表面をすすぐために使用され得る。
【0028】
本発明の有利な実施形態では、検出される病原体は、ウイルス、プリオン、細菌、寄生生物、真菌、酵母およびこれら全ての病原体の断片を含む群から選択される。病原体は、特にSARS-CoV-2である。
【0029】
本発明のおかげで検出することができるウイルスの中には、以下のリンク:https://talk.ictvonline.org/ictv-reports/ictv_online_report/で見られる、国際ウイルス分類委員会(ICTV)によって定義されるような、一本鎖または一本鎖RNAウイルス、二本鎖または二本鎖RNAウイルス、レトロウイルス、一本鎖DNAウイルス、二本鎖DNAウイルスの例が含まれる。
【0030】
本発明のおかげで検出することができるプリオンの中には、例えば、様々な形態のクロイツフェルト・ヤコブ病、致死性家族性不眠症(FFI)、ゲルストマン・シュトロイスラー・シャインカー症候群(GSSS)ならびにヒトおよび動物におけるクールー病、ヒツジおよびヤギにおけるスクレイピー、ならびにウシ海綿状脳症などの伝染性海綿状脳症(TSE)が含まれる。
【0031】
本発明のおかげで検出することができる寄生生物の中には、例えば、パルディズムまたはマラリアの原因となるプラスモジウム属の寄生生物、サルコシスト、トキソプラズマ症の原因となるトキソプラズマゴンディ(Toxoplasma gondii)などの原虫が含まれる。
【0032】
本発明のおかげで検出することができる細菌の中には、例えば、ジフテリアのジフテリア菌、結核を引き起こす結核菌、ハンセン病の原因となるらい菌などの偏性病原性細菌;破傷風の原因となる破傷風菌およびコレラを引き起こすコレラ菌などの偶発的病原性細菌;緑膿菌または皮膚細菌叢のブドウ球菌などの日和見病原性細菌が含まれる。
【0033】
本発明のおかげで検出することができる真菌の中には、例えば、アスペルギルス症の原因となるアスペルギルス・フミガツス(Aspergillus fumigatus)などの院内感染を引き起こす病原性真菌;コクシジオイデス症の原因となるコクシジオイデス・イミティス(Coccidioides immitis)、ブラストミセス症の原因となるブラストミセス・デルマティディス(Blastomyces dermatidis)、ヒストプラスマ症の原因となるヒストプラズマ・カプスラタム(Histoplasma capsulatum)、クリプトコッカス症の原因となるクリプトコッカス・ネオフォルマンス(Cryptococcus neoformans)またはクリプトコッカス・ガティイ(Cryptococcus gattii)などの日和見病原性真菌;などが含まれる。
【0034】
本発明のおかげで検出することができる酵母の中には、例えば、カンジダ症の原因となるカンジダ・アルビカンス(Candida albicans)などのカンジダ種の酵母などの日和見病原性酵母などが含まれる。
【0035】
本発明の有利な実施形態では、非磁性金属ナノ粒子は、50~200nm(特に50、60、70、80、90、100および/または200nm)、好ましくは100~200nm(特に100、150nmおよび/または200nm)、さらにより有利には100~150nm(特に110、115、120、125、130、135、140、145nmおよび/または150nm)の平均直径を有する。そのような平均直径は、例えば、表面プラズモン共鳴(もしくはSPR)、透過型電子顕微鏡(TEM)、動的光散乱(DLS)またはキャピラリーゾーン電気泳動(CZE)によって測定される。
【0036】
本発明の別の有利な実施形態では、非磁性金属ナノ粒子は、金、銀、銅、白金、またはこれらの金属のうちの1つをベースとする合金のナノ粒子である。ナノ粒子の混合物の場合、第1の金属の非磁性金属ナノ粒子は、好ましくは金ナノ粒子であり、第2の金属の非磁性金属ナノ粒子は、好ましくは銀ナノ粒子である。
【0037】
本発明によれば、ナノ粒子は、好ましくは実質的に単一の金属を含むが、金属合金、例えば二元合金も含み得る。
【0038】
これらのナノ粒子は、溶液またはコロイド懸濁液として市販されている。
【0039】
混合物の場合の本発明によれば、2種類のナノ粒子間の比は、好ましくは5/95~95/5、好ましくは40/60~60/40、特に50/50である。したがって、ナノ粒子の総質量に対して質量で表される5%の金粒子および95%の銀ナノ粒子と、ナノ粒子の質量に対して質量で表される95%の金粒子および5%の銀ナノ粒子との混合物中に存在し得る。本発明の有利な実施形態では、混合物は、ナノ粒子の総質量に対して質量で表される50質量%の金ナノ粒子および50質量%の銀ナノ粒子を含有する。
【0040】
本発明によるキットでは、非磁性金属ナノ粒子を含む溶液または懸濁液は、例えば、閉鎖系を備えた試験管、または閉鎖系を備えたバイアル、またはエッペンドルフ(登録商標)型チューブなどの閉鎖系を備えたコニカルチューブであってもよい容器中にあり得る。
【0041】
本発明はまた、非磁性金属ナノ粒子と、表面増強ラマン分光法(SERS)によって試料中の病原体の存在を検出するように設計されたソフトウェアと、を備える本発明によるキットの使用に関する。
【0042】
任意選択で、ソフトウェアは、前記病原体の存在に関する疾患の診断をさらに提供することができる。
【0043】
本出願はまた、表面増強ラマン分光(SERS)データ(すなわち、そのようなデータに基づく)および/または表面増強ラマン分光法(SERS)によって病原体を含有し得る試料における病原体の存在を検出するための方法に関する。
【0044】
本発明による検出方法の第1の態様によれば、前記方法は、
-試料から得られた表面増強ラマン分光(SERS)信号の受信と、
-試料中の病原体の有無を示す信号としての、高められたラマン分光信号の分類モデルによる認識と、を含み得る。
【0045】
分類モデルは、機械学習または人工知能を使用するソフトウェア媒体を含み得る。
【0046】
分類モデルは、ニューラルネットワーク、ランダムフォレスト、サポートベクターマシン、関連性ベクトルマシン、PLSDA、および/またはベイジアンモデルのうちの少なくとも1つを含み得る。
【0047】
分類モデルは、ニューラルネットワークおよび/またはランダムフォレストのうちの少なくとも1つを含み得る。
【0048】
本発明による方法は、受信と認識との間に、好ましくは以下の前処理のうちの少なくとも1つを含む表面増強ラマン分光信号の前処理ステップを含み得る:平均の減少、標準法線変動、最大値による正規化、極値による正規化、好ましくはSavitzky-Golayアルゴリズムによる平滑化、ベースラインの減少または補正、次数1または2の導出、主成分分析(PCA)。
【0049】
本発明による方法は、試料採取の形態の選択および/または分光計モデルの選択に基づいて、受信と認識との間に、いくつかの分類モデルの中で使用される分類モデルの決定を含み得る。
【0050】
検出される病原体は、ウイルス、プリオン、寄生虫、真菌、酵母および細菌を含む群から選択され得、好ましくはSARS-CoV-2である。
【0051】
病原体は、SARS-CoV-2であり得る。この場合、受信した各表面増強ラマン分光信号を、試料中の病原体の有無を表す各クラスと関連付けるために、分類モデルは、以下のうちの表面が高められたラマン分光信号における少なくとも3つのピークに関する(すなわち、考慮する)少なくとも1つの処理を適用するように構成される:
-419cm-1~459cm-1、好ましくは434cm-1~444cm-1のラマンオフセットにおけるピーク、または
-566cm-1~606cm-1、好ましくは581cm-1~591cm-1のラマンオフセットにおけるピーク、または
-646cm-1~686cm-1、好ましくは661cm-1~671cm-1のラマンオフセットにおけるピーク、または
-719cm-1~759cm-1、好ましくは734cm-1~744cm-1のラマンオフセットにおけるピーク、または
-839cm-1~879cm-1、好ましくは854cm-1~864cm-1のラマンオフセットにおけるピーク、または
-962cm-1~1002cm-1、好ましくは977cm-1~987cm-1のラマンオフセットにおけるピーク、または
-1006cm-1~1046cm-1、好ましくは1021cm-1~1031cm-1のラマンオフセットにおけるピーク、または
-1121cm-1~1161cm-1、好ましくは1136cm-1~1146cm-1のラマンオフセットにおけるピーク、または
-1190cm-1~1230cm-1、好ましくは1205cm-1~1215cm-1のラマンオフセットにおけるピーク、または
-1339cm-1~1379cm-1、好ましくは1354cm-1~1364cm-1のラマンオフセットにおけるピーク、または
-1529cm-1~1569cm-1、好ましくは1544cm-1~1554cm-1のラマンオフセットにおけるピーク、または
-1591cm-1~1631cm-1、好ましくは1606cm-1~1616cm-1のラマンオフセットにおけるピーク、または
-1662cm-1~1702cm-1、好ましくは1677cm-1~1687cm-1のラマンオフセットにおけるピーク、または
-1722cm-1~1762cm-1、好ましくは1737cm-1~1747cm-1のラマンオフセットにおけるピーク、または
-1796cm-1~1836cm-1、好ましくは1811cm-1~1821cm-1のラマンオフセットにおけるピーク、または
-2058cm-1~2098cm-1、好ましくは2073cm-1~2083cm-1のラマンオフセットにおけるピーク、または
-2110cm-1~2150cm-1、好ましくは2125cm-1~2135cm-1のラマンオフセットにおけるピーク、または
-2322cm-1~2362cm-1、好ましくは2337cm-1~2347cm-1のラマンオフセットにおけるピーク、または
-2460cm-1~2500cm-1、好ましくは2475cm-1~2485cm-1のラマンオフセットにおけるピーク。
【0052】
病原体は、SARS-CoV-2であり得る。例えば、試料を溶解緩衝液と接触させた場合、受信した各表面増強ラマン分光信号を、試料中の病原体の有無を表す各クラスと関連付けるために、分類モデルは、以下のうちの表面が高められたラマン分光信号における少なくとも3つのピークに関する(すなわち、考慮する)少なくとも1つの処理を適用するように構成される:
-456cm-1~556cm-1、より好ましくは501cm-1~511cm-1のラマンオフセットにおけるピーク、または
-550cm-1~760cm-1、好ましくは560cm-1~760cm-1、より好ましくは722cm-1~732cm-1のラマンオフセットにおけるピーク、または
-600cm-1~970cm-1、好ましくは706cm-1~806cm-1、より好ましくは751cm-1~761cm-1のラマンオフセットにおけるピーク、または
-750cm-1~1160cm-1、好ましくは903cm-1~1003cm-1、より好ましくは945cm-1~960cm-1のラマンオフセットにおけるピーク、または
-840cm-1~1340cm-1、好ましくは964cm-1~1064cm-1、より好ましくは1007cm-1~1020cm-1のラマンオフセットにおけるピーク、または
-840cm-1~1340cm-1、好ましくは1071cm-1~1171cm-1、より好ましくは1116cm-1~1126cm-1のラマンオフセットにおけるピーク、または
-1000cm-1~1380cm-1、好ましくは1104cm-1~1204cm-1、より好ましくは1149cm-1~1159cm-1のラマンオフセットにおける1つのピーク、または
-1200cm-1~1300cm-1、好ましくは1240cm-1~1270cm-1、より好ましくは1245cm-1~1255cm-1のラマンオフセットにおけるピーク、または
-1250cm-1~1500cm-1、好ましくは1324cm-1~1424cm-1、より好ましくは1368cm-1~1380cm-1のラマンオフセットにおけるピーク、または
-1370cm-1~1570cm-1、好ましくは1398cm-1~1498cm-1、より好ましくは1441cm-1~1454cm-1のラマンオフセットにおけるピーク、または
-1440cm-1~1710cm-1、好ましくは1509cm-1~1609cm-1、より好ましくは1553cm-1~1564cm-1のラマンオフセットにおけるピーク、または
-1680cm-1~2170cm-1、好ましくは2062cm-1~2162cm-1、より好ましくは2107cm-1~2117cm-1のラマンオフセットにおけるピーク。
【0053】
本発明による検出方法の第2の態様によれば、第1の態様では独立しているが組み合わせることができ、表面増強ラマン分光法(SERS)によって、含有し得る試料中の病原体の存在を検出するための前記方法は、
a)溶液または懸濁液を得るための前記試料と非磁性金属ナノ粒子との接触と、
b)媒体上への前記溶液または懸濁液の堆積と、
)前記堆積によって放射されたSERS信号の検出と、を含み得る。
【0054】
ステップa)~c)は、全て室温で行われる。
【0055】
この検出方法は、病原体による感染の存在を検出し、集団において病気の個体(病原体の保有者であり、陽性個体と呼ばれる)と健康な個体(病原体の保有者ではなく、陰性個体と呼ばれる)とを区別することを可能にする。個体が感染症を有するが疾患の症状を有しない場合、病原体の存在の検出は、疾患を発症するリスクを予測する。
【0056】
本発明による方法は、公知の抗病原体薬物もしくはワクチンの有効性を評価するために、または潜在的な新規薬物もしくは抗病原体ワクチンの有効性を試験するために使用することができる。病原体の量の減少またはこの量の増加は、治療が有効であるか否かを示す。
【0057】
一実施形態では、試料を前記非磁性金属ナノ粒子と接触させ得る。本発明による方法の第1の実施形態では、非磁性金属ナノ粒子または第1の金属の非磁性ナノ粒子と第2の金属の非磁性ナノ粒子との混合物を含有する溶液または懸濁液の約10~200マイクロリットル~約10~2000マイクロリットルの試験される試料体積が添加され、第1の金属のナノ粒子は、第2の金属のナノ粒子とは異なる。連続的なピペッティング(ボルテックスする必要がない)による撹拌による均質化の後、アルミニウム支持体またはアルミニウム箔で覆われた材料上に堆積物が作製される。媒体は、SERSに一般的に使用される任意の種類の媒体であり得る。
【0058】
この実施形態では、任意選択で、上記の均質化および堆積の前に、試料を前記非磁性金属ナノ粒子および溶解緩衝液と同時に接触させる。
【0059】
別の実施形態では、試料は、前記非磁性金属ナノ粒子を含有する遠心分離ペレット(以下、ナノ粒子ペレットとも呼ばれる)と接触する前に、「輸送媒体」と呼ばれる液体に溶解され得る。
【0060】
例えば、試験する試料を輸送媒体に溶解し、次いで、上で定義したような非磁性金属ナノ粒子のコロイド懸濁液の遠心分離によって得られたナノ粒子ペレットと混合する。撹拌による均質化の後、アルミニウム支持体上またはアルミニウム箔で覆われた材料上に堆積物が作製される。媒体は、SERSに一般的に使用される任意の種類の媒体であり得る。
【0061】
この実施形態では、任意選択で、輸送媒体は、溶解緩衝液である。
【0062】
ナノ粒子のペレットを得るために、上で定義したような非磁性金属ナノ粒子の懸濁液を、当業者に公知の条件下で、例えば1~50分の遠心時間の間に700~18,000gの遠心分離速度で遠心分離する。
【0063】
好ましくは、ナノ粒子のペレットを得るために、非磁性金属ナノ粒子の懸濁液を5000g未満、好ましくは2500g未満、例えば1000g以下の速度で遠心分離する。一例では、非磁性金属ナノ粒子の懸濁液を800gに等しい速度で遠心分離した。
【0064】
これは、5000g未満、典型的には1500g未満の速度での遠心分離がSERS信号の振幅の増加をもたらすことが観察されているので有利である。これは、非磁性金属ナノ粒子に対するより低い機械的応力に起因する可能性が高く、これはその後、遠心分離中にあまり劣化しない。
【0065】
もちろん、遠心分離ペレット中の非磁性金属ナノ粒子の予想濃度を得るために、遠心分離時間は、遠心分離速度に応じて適合される。より正確には、同じ遠心分離懸濁液について、および遠心分離ペレット中の非磁性金属ナノ粒子の所与の予想濃度について、遠心分離速度が低下するにつれて遠心分離時間は、一般に増加する。
【0066】
例えば、遠心分離ペレット中の非磁性金属ナノ粒子の所望の濃度は、5g/L~30g/Lである。
【0067】
非磁性金属ナノ粒子の懸濁液を5000g未満、好ましくは2500g未満、例えば1000g以下の速度で遠心分離する場合、遠心時間は、例えば1時間未満である。
【0068】
一例では、非磁性金属ナノ粒子の懸濁液を800gに等しい速度で45分間遠心分離した。
【0069】
上記の2つの実施形態における本発明によれば、堆積物は、当業者に公知の従来の条件下で乾燥することができる。
【0070】
非磁性金属ナノ粒子は、50~200nm、好ましくは100~200nm、さらにより好ましくは100~150nmの直径を有し得る。
【0071】
第1の金属の非磁性金属ナノ粒子は、金粒子であり得、第2の金属の非磁性金属ナノ粒子は、銀ナノ粒子であり得る。
【0072】
表面増強ラマン分光信号の受信は、
-好ましくは750nm~800nmの波長の励起光放射であって、前記励起光が試料に到達する、励起光放射と、
-前記励起光が試料に到達する間の、試料による反射光、透過光、散乱光または後方散乱光の、センサまたは分光計による捕捉と、を含み得る。
【0073】
励起光は、試料に到達することができ、分光計および/またはセンサは、試料がナノ粒子と接触している間に捕捉ステップを実施することができる。
【0074】
検出される病原体は、ウイルス、プリオン、寄生虫、真菌、酵母および細菌を含む群から選択され得、好ましくはSARS-CoV-2である。
【0075】
本発明によれば、この技術において公知であり、市販されている任意の好適なラマン分光計システムが使用され得る。
【0076】
本発明による方法を実施するために、光検出器、放射線源およびコンピュータシステム、マイクロプロセッサならびにコンピュータソフトウェアおよびアルゴリズムなどの検出装置が、任意の組み合わせで使用され得る。したがって、いくつかの実施形態では、ソフトウェアまたは他のコンピュータ可読命令を使用して、出力データを解釈、分析、コンパイル、または他の方法で分析し得る。ソフトウェアまたは他のコンピュータシステムを使用して、デジタル形式であろうと他の形式であろうと、出力データを1人以上のユーザに表示、記憶、または送信し得る。
【0077】
所与の病原体について、波長の選択は、当業者に公知であるかまたは文献に記載されている任意の技術によって、特に、Marois M.et al.,またはChen Y.et al.,またはLuke G.P.et al.によって記載されているアルゴリズムによって行われる。
【0078】
この方法は、異なる病原体のSERSスペクトルを測定することを可能にする。各病原体は、他の病原体のSERSスペクトルとは有意に異なり、したがって区別可能な固有のSERSスペクトルを有するので、検出することができる。したがって、病原体、特にウイルスは、目的の生体分子または特定の生体分子の組み合わせを他の生体分子または基本培地と区別する固有のSERS「署名」を有する。
【0079】
典型的には、不活性化された病原体の存在下または病原体の非存在下で、第1の表面が高められたラマン分光シグネチャが得られ、病原体が存在する場合、第1の表面とは異なる表面の第2の高められたラマン分光シグネチャが得られる。
【0080】
本発明はまた、本発明による方法(好ましくは、本発明による方法の第1の態様)を実施するように設計および/または配置および/またはプログラムされたソフトウェア媒体に関する。
【0081】
本発明はまた、本発明による方法(好ましくは、本発明による方法の第1および/または第2の態様)を実施するように設計および/または配置および/またはプログラムされたシステムに関する。
【0082】
本発明者らは、金ナノ粒子の試料中のSARS-CoV-2の存在が、560cm-1~760cm-1のピーク(典型的には660または727cm-1、好ましくは660cm-1)、1250~1500cm-1のピーク(典型的には1374cm-1)および2062cm-1~2162cm-1のピーク(典型的には2100または2112cm-1、好ましくは2100cm-1)の存在によって特徴付けられることを発見した。試料を採取した患者は、SARS-CoV-2陽性と言われる。一方、試料中にウイルスが存在しない場合、1100~1250nmのピークのみが見える。その後、患者は、SARS-CoV-2陰性と判定される。
【0083】
本発明はまた、ソフトウェアが前記病原体の存在に関する疾患の診断をさらに提供する、本発明によるキットの使用に関する。
【0084】
本発明の他の利点および特徴は、決して限定的ではない実施および実施形態の詳細な説明、ならびに以下の添付図面を読むと明らかになるであろう。
【図面の簡単な説明】
【0085】
図1】各試料について3つの試料を用いて20人の異なる人々の鼻咽頭スワブで得られた結果を示す図である。実験条件は、本発明の実施例1のものである。
図2】COVID-19の存在が検出された陽性患者(黒色)およびCOVID-19の存在が検出されなかった陰性患者(灰色)について実施例1の条件下で得られたスペクトルを示す図である。
図3】本発明による金ナノ粒子を使用した場合の陽性患者(+)および陰性患者(x)におけるピークの存在を示す図である。
図4】本発明によるシステム10の第1の実施形態の概略図である。
図5】患者に対してSTRam分光計を用いて実行された一連の測定値(表面増強ラマン分光(SERS)信号)を示す図である。
図6】SNV(SNVによる前処理の前(A)および後(B)の測定シリーズ、STRam分光計によって測定されたデータ)で前処理する前後の一連の測定値(表面増強ラマン分光(SERS)信号)を示す図である。
図7】本発明の文脈で使用されるスペクトルの分類のための、意図的に小さく残された決定木の例を示す図である。
図8】本発明の文脈で使用されるニューラルネットワークを概略的に示す図である。
図9】前処理後のMIRASAスペクトルの外観を示す図である。
図10】完全な前処理後のSTRamスペクトルの外観を示す図である。
図11】STRamモデルの検証で得られた交絡行列を示す図である。
図12】検証におけるSTRamモデルの患者予測のための交絡行列を示す図である。
図13】MIRASAモデルの検証で得られた交絡行列を示す図である。
図14】検証におけるMIRASAモデルの患者予測のための交絡行列を示す図である。
図15】2196個のSARS-Cov-2陽性試料のラマンシフトピークの分布を示す図である。
【発明を実施するための形態】
【0086】
図2図3図5図6図9および図10の全てのスペクトルについて:
-横軸は、ラマンシフト(cm-1)であり、
-縦軸は、任意単位の強度である。
【0087】
これらの実施形態は、決して限定的ではなく、特徴のこの選択が技術的利点を与えるか、または本発明を従来技術と区別するのに十分である場合、(この選択がこれらの他の特徴を含む文内で分離される場合であっても)記載または図示された他の特徴から後に分離された記載または図示された特徴の選択のみを含む本発明の特定の変形例を考慮し得る。この選択は、構造的詳細なしで、および/または構造的詳細の一部のみが技術的利点を与えるか、または本発明を従来技術と区別するのに十分である場合、構造的詳細の一部のみを含む少なくとも1つの機能的選好特徴を含む。
【0088】
限定されない第1の実施形態では、表面増強ラマン分光法(SERS)によって試料中の病原体の存在を検出するための本発明によるキットは、非磁性金属ナノ粒子と、前記試料中の前記病原体の存在を検出するように設計および/または配置および/またはプログラムされたソフトウェアおよび/またはソフトウェア媒体と、を備える。
【0089】
非常に有利には、記載された全ての例において、および考慮される全ての変形例において、非磁性金属ナノ粒子は、非磁性天然金属ナノ粒子である。
【0090】
任意選択で、本発明によるキットは、溶解緩衝液も含む。
【0091】
このソフトウェアまたはこれらのソフトウェア媒体の技術的機能については、以下でより詳細に説明する。
【0092】
検出される病原体は、ウイルス、プリオン、寄生虫、真菌、酵母および細菌を含む群から選択され、特にSARS-CoV-2である。
【0093】
好ましくは、非磁性金属ナノ粒子は、50~200nm、好ましくは100~200nm、さらにより好ましくは100~150nmの平均直径を有する。
【0094】
好ましくは、非磁性金属ナノ粒子は、金、銀、銅、白金またはこれらの金属のうちの1つをベースとする合金の粒子である。特に、金、銀および/または白金は、これらの金属が生物学的試料を変化させないので使用される。
【0095】
例えば、非磁性金属ナノ粒子は、第1の金属の非磁性ナノ粒子と第2の金属の非磁性ナノ粒子との混合物を含み、第1の金属のナノ粒子は、第2の金属のナノ粒子とは異なる。
【0096】
この場合、好ましくは、第1の金属の非磁性金属ナノ粒子は、金ナノ粒子であり、第2の金属の非磁性金属ナノ粒子は、銀ナノ粒子である。
【0097】
このキットは、非磁性金属ナノ粒子と、表面増強ラマン分光法(SERS)によって試料中の病原体の存在を検出するように設計されたソフトウェアと、を含む。上述のように、キットは、任意選択で溶解緩衝液を含む。
【0098】
キットのソフトウェアまたはソフトウェア媒体はまた、任意選択で、前記病原体の存在に関する疾患の診断を提供し得る。
【0099】
本発明によるシステム10の第1の実施形態は、
図4に示す光学装置であって、
o試料ホルダ4、
o励起光を放射するための光源1(典型的にはレーザ)であって、前記光が、少なくとも750nm~800nmの波長(例えば785nmの波長)を含み、前記光源1が、前記励起光が前記試料ホルダ上の試料に到達するように配置される、光源1、
o前記励起光が試料に到達する間に、試料による反射光、透過光、散乱光または後方散乱光を捕捉するように配置されたセンサまたは分光計2(典型的には、ラマン分光光度計)であって、要素2が、典型的には、試料によって反射、透過、散乱または後方散乱された光を回折するように配置された回折格子およびそのように回折された光を検出するように配置された検出器を備える、センサまたは分光計2、を備える、光学装置と、
-キットのソフトウェアまたはソフトウェア媒体と、
-少なくとも1つのコンピュータ、中央もしくはコンピューティングユニット、アナログ電子回路(好ましくは専用)、デジタル電子回路(好ましくは専用)、および/またはマイクロプロセッサ(好ましくは専用)を備え、キットのソフトウェアまたはソフトウェア媒体を実装するように配置および/またはプログラムされた分析ユニット3と、を備える。
【0100】
光源1がレーザである場合、前記光源1は、例えば、100mW~1W、例えば500mWの出力を有するレーザビームを送出するように構成される。後者の場合、堆積物は、数秒間、典型的には0.1秒~20秒、例えば1秒~7秒の間照明される。
【0101】
ここで、システム10において実施される、表面増強ラマン分光(SERS)データにおいてキットを使用するおよび/または病原体を検出する方法の第1の実施形態について説明する。
【0102】
本発明による方法のこの第1の実施形態では、ユニット3は、以下のように生成された表面増強ラマン分光信号を受信する:
a)試料(典型的には、好ましくは人間または動物からの唾液または鼻咽頭試料などの生物学的試料)を非磁性金属ナノ粒子と接触させて、溶液または懸濁液を得、次いで
b)前記溶液または懸濁液を支持体上、より正確には試料ホルダ4上に堆積させ、
c)前記病原体によって放射されたSERS信号を検出し、信号は、好ましくは、
-好ましくは750~800nmの波長の励起光の(光源1による)放射であって、前記励起光が試料に到達し、前記励起光が、試料がナノ粒子と接触している間に試料に到達する、放射と、
-前記励起光が試料に到達する間の、試料による反射光、透過光、散乱光または後方散乱光の、センサまたは分光計2による捕捉と、によって前記病原体の存在を示す。分光計またはセンサ2は、試料がナノ粒子と接触している間に捕捉ステップを実施する。
【0103】
前述のように、非磁性金属ナノ粒子は、例えば、第1の金属の非磁性ナノ粒子と第2の金属の非磁性ナノ粒子との混合物を含み、第1の金属のナノ粒子は、第2の金属のナノ粒子とは異なる。この場合、第1の金属の非磁性金属ナノ粒子は、例えば、金粒子であり、第2の金属の非磁性金属ナノ粒子は、例えば、銀ナノ粒子である。
【0104】
好ましくは、非磁性金属ナノ粒子は、50~200nm、好ましくは100~200nm、さらにより好ましくは100~150nmの直径を有する。
【0105】
考慮される変形例に応じて:
-前記非磁性金属ナノ粒子を含有する遠心分離ペレットと接触させる前に、試料を輸送媒体に溶解するか、または
-試料を前記非磁性金属ナノ粒子と同時に接触させる。
【0106】
各変形例では、非磁性金属ナノ粒子は、特にコロイド懸濁液中、例えばクエン酸ナトリウム中にある。
【0107】
交互に:
-試料を遠心分離ペレットと接触させる前に溶解緩衝液に溶解するか、または
-試料を溶解緩衝液および非磁性金属ナノ粒子と同時に接触させる。
【0108】
次いで、ユニット3は、以下のステップを実行する:
-ユニット3による、センサ2または分光計2からの、および試料から得られた表面増強ラマン分光(SERS)信号の受信、
-分類モデル(キットのソフトウェアまたはソフトウェア媒体の一部)によって、試料中の病原体の有無を示す信号としての、高められたラマン分光信号の認識。
【0109】
本明細書では、「表面増強ラマン分光(SERS)信号」または「表面増強ラマン分光(SERS)データ」という用語は、互換的に使用される。
【0110】
表面増強ラマン分光(SERS)信号は、少なくとも1000cm-1~1500cm-1、好ましくは少なくとも750cm-1~2000cm-1、さらにより好ましくは少なくとも500cm-1~2300cm-1のラマンシフトデータを含む。
【0111】
分光計2は、例えば、
-499.46~2801.89cm-1のラマンオフセットデータを提供するSTRam分光計、または
-499~2300cm-1のラマンシフトデータを提供するMIRA分光計、である。
【0112】
分類モデルは、機械学習(もしくは人工知能)または人工知能によるソフトウェア媒体であるキットのソフトウェア媒体を含む。
【0113】
分類モデルは、ニューラルネットワーク、ランダムフォレスト、サポートベクターマシン、関連性ベクトルマシン、PLS-DA(部分的最小二乗判別分析)、および/またはベイジアンモデルのうちの少なくとも1つを含む。好ましくは、分類モデルは、ニューラルネットワークおよび/またはランダムフォレストのうちの少なくとも1つを含む。
【0114】
任意選択で、この方法は、受信と認識との間に、好ましくは以下の前処理:平均の減少、標準法線変動(SNV)、最大値による正規化、極値による正規化、好ましくはSavitzky-Golayアルゴリズムによる平滑化、ベースラインの減少または補正、次数2の優先度導出、主成分分析(PCA)のうちの少なくとも1つを含む、高められたラマン分光法の信号を前処理するステップを含む。
【0115】
この方法は、受信と認識との間に、
-試料採取の形態(典型的には、ユーザは、ユニット3のキーボードもしくはタッチスクリーンに、試験される試料の形態、典型的には鼻咽頭または唾液を入力する)、ならびに/または
-分光計モデル2(典型的には、デフォルト選定がプログラムされ、および/もしくはユーザがユニット3のキーボードもしくはタッチスクリーンに、システム10で使用される分光計モデル2(典型的にはSTRamもしくはMIRA)を入力する)、ならびに/または
-試料輸送媒体、ならびに/または
-症候学、追加検査の結果(例えば、医療撮像結果)、年齢、性別などの試料を採取した対象に関するデータ、ならびに/または
-検出される病原体、に基づいていくつかの所定の分類モデルの中で使用される分類モデルの決定を含む。
【0116】
そのような選定は、好ましくは自動的に行われる。
【0117】
検出が求められている病原体は、ウイルス、プリオン、寄生虫、真菌、酵母および細菌を含む群の要素のうちの1つであり、好ましくはSARS-CoV-2(重症急性呼吸器症候群コロナウイルス2)である。
【0118】
この場合、受信した各表面増強ラマン分光信号を、試料中の病原体の有無を表す各クラスと関連付けるために、分類モデルは、以下のうちの表面が高められたラマン分光信号における少なくとも3つのピークに関する(すなわち、考慮する)少なくとも1つの処理を適用するように構成される:
-419cm-1~459cm-1、好ましくは434cm-1~444cm-1のラマンオフセットにおけるピーク、または
-566cm-1~606cm-1、好ましくは581cm-1~591cm-1のラマンオフセットにおけるピーク、または
-646cm-1~686cm-1、好ましくは661cm-1~671cm-1のラマンオフセットにおけるピーク、または
-719cm-1~759cm-1、好ましくは734cm-1~744cm-1のラマンオフセットにおけるピーク、または
-839cm-1~879cm-1、好ましくは854cm-1~864cm-1のラマンオフセットにおけるピーク、または
-962cm-1~1002cm-1、好ましくは977cm-1~987cm-1のラマンオフセットにおけるピーク、または
-1006cm-1~1046cm-1、好ましくは1021cm-1~1031cm-1のラマンオフセットにおけるピーク、または
-1121cm-1~1161cm-1、好ましくは1136cm-1~1146cm-1のラマンオフセットにおけるピーク、または
-1190cm-1~1230cm-1、好ましくは1205cm-1~1215cm-1のラマンオフセットにおけるピーク、または
-1339cm-1~1379cm-1、好ましくは1354cm-1~1364cm-1のラマンオフセットにおけるピーク、または
-1529cm-1~1569cm-1、好ましくは1544cm-1~1554cm-1のラマンオフセットにおけるピーク、または
-1591cm-1~1631cm-1、好ましくは1606cm-1~1616cm-1のラマンオフセットにおけるピーク、または
-1662cm-1~1702cm-1、好ましくは1677cm-1~1687cm-1のラマンオフセットにおけるピーク、または
-1722cm-1~1762cm-1、好ましくは1737cm-1~1747cm-1のラマンオフセットにおけるピーク、または
-1796cm-1~1836cm-1、好ましくは1811cm-1~1821cm-1のラマンオフセットにおけるピーク、または
-2058cm-1~2098cm-1、好ましくは2073cm-1~2083cm-1のラマンオフセットにおけるピーク、または
-2110cm-1~2150cm-1、好ましくは2125cm-1~2135cm-1のラマンオフセットにおけるピーク、または
-2322cm-1~2362cm-1、好ましくは2337cm-1~2347cm-1のラマンオフセットにおけるピーク、または
-2460cm-1~2500cm-1、好ましくは2475cm-1~2485cm-1のラマンオフセットにおけるピーク。
【0119】
実際、本発明者らは、439、586、666、739、859、982、1026、1141、1210、1359、1549、1611、1682、1742、1816、2078、2130、2342および/または2480cm-1のピークが試料中のSARS-CoV-2の検出を特に区別することを見出した。
【0120】
病原体がSARS-CoV-2であり、試料が溶解緩衝液の存在下に置かれる場合、受信した各表面増強ラマン分光信号を、試料中の病原体の有無を表す各クラスと関連付けるために、分類モデルは、以下のうちの高められたラマン分光の信号における少なくとも3つのピーク(好ましくは少なくとも5つのピーク、より優先的には少なくとも8つのピーク)に関する(すなわち、考慮する)少なくとも1つの処理を適用するように構成される:
-456cm-1~556cm-1、より好ましくは501cm-1~511cm-1のラマンオフセットにおけるピーク(101)、または
-550cm-1~760cm-1、好ましくは560cm-1~760cm-1、より好ましくは722cm-1~732cm-1のラマンオフセットにおけるピーク(102)、または
-600cm-1~970cm-1、好ましくは706cm-1~806cm-1、より好ましくは751cm-1~761cm-1のラマンオフセットにおけるピーク(103)、または
-750cm-1~1160cm-1、好ましくは903cm-1~1003cm-1、より好ましくは945cm-1~960cm-1のラマンオフセットにおけるピーク(104)、または
-840cm-1~1340cm-1、好ましくは964cm-1~1064cm-1、より好ましくは1007cm-1~1020cm-1のラマンオフセットにおけるピーク(105)、または
-840cm-1~1340cm-1、好ましくは1071cm-1~1171cm-1、より好ましくは1116cm-1~1126cm-1のラマンオフセットにおけるピーク(106)、または
-1000cm-1~1380cm-1、好ましくは1104cm-1~1204cm-1、より好ましくは1149cm-1~1159cm-1のラマンオフセットにおける一方の(107)ピーク、または
-1200cm-1~1300cm-1、好ましくは1240cm-1~1270cm-1、より好ましくは1245cm-1~1255cm-1のラマンオフセットにおけるピーク、または
-1250cm-1~1500cm-1、好ましくは1324cm-1~1424cm-1、より好ましくは1368cm-1~1380cm-1のラマンオフセットにおけるピーク(109)、または
-1370cm-1~1570cm-1、好ましくは1398cm-1~1498cm-1、より好ましくは1441cm-1~1454cm-1のラマンオフセットにおけるピーク(110)、または
-1440cm-1~1710cm-1、好ましくは1509cm-1~1609cm-1、より好ましくは1553cm-1~1564cm-1のラマンオフセットにおけるピーク(111)、または
-1680cm-1~2170cm-1、好ましくは2062cm-1~2162cm-1、より好ましくは2107cm-1~2117cm-1のラマンオフセットにおけるピーク(112)。
【0121】
データベース
分類モデルによる機械学習は、データベース上に構築された。
【0122】
例えば、鼻咽頭スワブの形態に特異的な分類モデルの場合、データベースは、110検体(すなわち、患者)からなり、55検体は、COVID-19陽性(POS)患者由来の鼻咽頭スワブであり、55検体は、COVID-19陰性(NEG)患者由来の鼻咽頭スワブである。SARS-CoV-2ウイルスのスクリーニング試験は、RT-PCR(逆転写ポリメラーゼ連鎖反応)法を使用して実行した。試料および試験は、アミアンの大学病院で行った。
【0123】
各試料は、前述のようにナノ粒子を用いて調製した。次いで、この調製物を3枚の別々のスライド上に置く(後に堆積物と呼ばれる)。各堆積物は、システム10でのラマン分光法によって3回分析され、試料あたり合計9つのスペクトルが得られる。患者に関する一連のスペクトルを系列と呼ぶ。加えて、ラマン測定に対する実験条件の起こり得る影響を制御するために、8人の陽性患者および8人の陰性患者を別の分析日に繰り返し測定した。これらのデータは、データベースに含まれ、「POS」とラベル付けされた合計567個のスペクトルおよび「NEG」とラベル付けされた合計567個のスペクトルが得られた。
【0124】
これらは、実験プロトコルからのデータであるため、実験的要因がスペクトルに影響を及ぼす可能性がある(例えば、調製または堆積が不十分に実行され、堆積物の縁部のスペクトル分析、分光計の参照が不十分である...)。これらの危険は、予想されるスペクトルペースとは異なるスペクトルペースを生成する可能性があり、その場合、「外れ値」スペクトル、すなわち「異常」スペクトルについて述べることになる。これらのスペクトルを扱うためにいくつかの方法を使用することができる:それらは、最初に識別され、次いで破棄されるべきである。本発明者らは、次いで、非外れ値スペクトルのみでモデルを訓練するか、それらを識別する予測モデルを訓練するためにそれらをデータベースに統合することを選定することができる(本発明者らは、次いで、測定が不適切に実行され、それが考慮されないことを指定するソフトウェアアラートを想像することができる)。最終結果は、スペクトルの形状に直接影響されるクラスに属する確率を伴うので、外れ値は、データベースから削除される。図5は、外れ値スペクトルが存在する患者771181に対してSTRam分光計で行われた一連の測定を示す。
【0125】
これらのスペクトルには、2つの現象がある。第1に、2つのスペクトルは、測定系列の残りの部分とは根本的に異なるように見える。これらは、強度が低い2つのスペクトルであり、したがって、スライド上に作製された堆積物を適切に標的としない取得を反映している。したがって、これらの2つのスペクトルは、データベースから削除されている。第2に、範囲の始まりに信号飽和の現象がある。データベースの大部分で発生するこの現象は、以下に説明する前処理の特定の選定を生み出した。
【0126】
図5の例は、特定の試料(患者771181)の外れ値の特定の事例を示し、110人の患者に対して行われた分析は、STRamおよびMIRA分光計のフィルタリング後にベースに存在するスペクトルの数を示す表1に詳述されているデータベースの結果としてのフィルタリングをもたらした。
【表1】
【0127】
これらのフィルタリングされたデータベースは、次の部分で説明するユニット3の予測分類モデルの訓練および検証ゲームとして機能したデータベースである。
【0128】
図15は、2196個のSARS-Cov-2陽性試料のラマンオフセットピークの分布を示す。その存在がSARS-CoV-2の存在を示すピーク101~107および109~112が、図15に見られる。
ユニット3の分類モデル
【0129】
バイナリ分類器を扱う場合、予測性能を分析するための基本ツールは、混同行列である。これは、表2に示すように、予測ラベルと実際のラベルとを比較する2×2のダブルエントリテーブルである。
【表2】
【0130】
この種類の行列は、分類器の長所および短所を直接強調している。実際、本発明者らは、正しい予測に対応する真陰性(TN)および真陽性(TP)の数を最大化する一方で、誤差に対応する偽陰性(FN)および偽陽性(FP)の数を最小化しようとしている。本発明者らは、これらの量から直接メトリクスを算出することもできる:
【数1】
【0131】
これらの3つのメトリックは、バイナリ分類器の性能を定量化しようとするときに重要な量である。精度は、正しく予測された項目の割合である。感度は、疾患が実際に存在する場合に分類器が「POS」を返す確率である。同様に、特異度は、分類器が非疾患患者について「NEG」を返す確率である。バイナリ分類器を扱う場合、0.5に近い精度、感度または特異度の値は、1.0に近づくと良好な予測力を示す一方で、ランダムな選定と同程度に良好な予測を行うことを意味する。
【0132】
精度を最大化することは、必ず良いことである。実際、1.0に近いほど、正しく分類されたスペクトルの割合が高くなる。しかしながら、疾患スクリーニング検査は、(可能な限り高い感度を維持しながら)モデルの特異性を最大化することにそれ自体を限定することが多い。実際、本発明者らは、例えば試験を繰り返すことによって「POS」を宣言する試験を確認できる一方で、「NEG」を宣言する試験が間違っていないことを確実にすることを好む。SARS-CoV-2などのパンデミックの状況では、アプローチは、異なっていなければならない。実際に、患者が疾患を有するかどうかを適切に検出することは、患者が他の人に感染するのを防ぎ、患者が許容可能なリスクとみなされ得ない場合に患者を陽性と宣言するために重大である。これを念頭に置いて、最良のモデルの選定は、主に感度の基準に基づく。
【0133】
予測モデルの最適化は、データの数およびサイズの両方に依存して、計算資源集約的である。事前に最適化されなければならないいくつかのモデルの性能を比較する必要があるため、データのサイズを縮小することは、計算時間を大幅に改善することができる前処理である。このため、MIRA2分光計およびSTRamからのデータを主成分分析(PCA)によって変換した。この方法は、データセットの共分散行列を対角化して固有ベクトルを抽出する。主成分とも呼ばれるこれらのベクトルは、データを投影するための新しい基礎として機能する。PCAは、初期セットに存在する情報の関連部分を保持しながら、データのサイズを大幅に縮小する。例えば、STRamから出てくる951個のスペクトルは、1959点を有するが、ACPは、12個の成分を使用することによって、データの内部変動の99.9%超を保持することを可能にする。本発明者らは、次いで、ほとんど全ての情報を保ちながら、サイズ951x1959の行列からサイズ951x12の行列に進む。データの次元に高感度ないくつかのモデルは、そうすることによって100倍少ない時間で最適化される。
【0134】
データのサイズを縮小する前に、スペクトルをSNV(Standard Normal Variate)によって前処理した。これは、各スペクトルからその平均(センタリング)を減算し、それをその標準偏差で除算することからなる、化学量論コミュニティにおける一般的な前処理である。SNVで前処理した後、スペクトルは、ゼロ平均および単位標準偏差を有する。図6は、SNV(SNVによる前処理の前(A)および後(B)の測定系列、STRamによって測定されたデータ)による前処理の前後の一連の測定値を示す。そのような前処理は、任意選択である。
【0135】
スペクトルについて取得される強度は、測定中に光が取る光路に依存し、これは試料の性質に依存する。したがって、走査される行列に応じて、完全に再現可能な測定条件を有することは困難な可能性がある。SNVは、図6のパネルAとパネルBとのスペクトル間に見られるように、スペクトルの一般的な強度の変動を非常に強く低減し、測定系列の強化を可能にする。
【0136】
多種多様な分類モデルが存在する。本発明の実施形態のフレームワーク内で、Pythonでプログラムされたいくつかの分類器:ニューラルネットワーク、ランダムフォレスト、サポートベクターマシン、関連性ベクターマシン、PLSDAおよびベイジアンモデルが訓練されている。
【0137】
異なるモデルの性能を測定するために、交差検証(CV)の原理が使用される。この方法は、K倍交差検証と呼ばれるK個の部分(または「群」)に訓練データベースを分割する。本明細書に記載の実施形態では、本発明者らは、K=10を選定した。データベースの10個の部分の各々は、元のデータベースと実質的に同じ陽性および陰性スペクトルの分布を含有するので、これは層別交差検証と称される。加えて、これらの群は、ランダムに切断されていない。実際、患者の9つのスペクトルは、性能のあらゆる偏りを回避するために、必然的に同じ群に存在する。
【0138】
データベースが10個の部分に分割されると、モデルは、それらのうちの9つで連続的に訓練され、最後のもので試験する。最後に、モデルを10回訓練し、基部の全ての異なる部分、すなわち基部の異なる部分で試験する。得られた10個のモデル性能、すなわちデータベースの10個の部分の各々のモデル性能を使用することによって、本発明者らは、交差検証におけるモデルの性能を得る。この場合、各モデルについて、対応する性能は、そのモデルによって得られた精度(上記で定義された)である。
【0139】
機械学習では、本発明者らは、モデルのパラメータが訓練中ではなくユーザによって調整されるときのハイパーパラメータについて言及する。他のパラメータは、「予測パラメータ」と呼ばれる。
【0140】
ほとんど全てのモデルがハイパーパラメータを有する。例えば、ランダムフォレストに基づく分類器は、最大17を有する。一部は、他のものよりも興味深いものではないが、可能な限り最良のモデリングを得るためにこれらのハイパーパラメータを正しく調整する必要がある。これを念頭に置いて、「GridSearch」と呼ばれる網羅的分析を使用して、試験された全てのモデルのハイパーパラメータを選択した。この手法は、推定器(例えば、ランダムフォレスト)および試験される必要がある超パラメータ空間を使用する。次いで、提供されたハイパーパラメータの空間中の全ての可能な組み合わせが試験され、交差検証スコアと関連付けられる。
【0141】
モデルが、本発明者らが最適化しようとする多数のハイパーパラメータを有する場合、GridSearchは、最適化するために多数の推定器(すなわち、予測パラメータ)を急速に生成することができる。実際、モデルが多数のハイパーパラメータを有する場合、最適なパラメータは、ハイパーパラメータ空間ごとに異なる可能性がある。この場合、全てのハイパーパラメータ空間が試験され、モデルは、パラメータの全ての可能な組み合わせで構築され、最後に、最高の性能を有するモデル(したがって、このモデルに関連付けられる予測パラメータおよびハイパーパラメータ)が保持される。
【0142】
表3は、ランダムフォレストについて考慮することができるハイパーパラメータ空間のうちの1つを提示する(これらのパラメータは、後でより詳細に説明する):
【表3】
【0143】
そのようなハイパーパラメータ空間は、パラメータの840個の異なる組み合わせを生成する。加えて、各モデルは、K=10でK倍交差検証で訓練され、これにより合計8400個のモデルが訓練され、数時間の算出を表すことができる。次いで、本発明者らは、8400個の算出されたスコアの中で最も高い交差検証スコアを選択し、したがって最も最適化されたパラメータ化を見つけることができる。
【0144】
各種類のモデルについて、本発明者らは、最良のパラメータ化および関連する交差検証スコアを有する。次いで、STRamデータおよびMIRASAデータ(MIRASAデータは、MIRA分光計によって得られたデータである)について最良の結果を与えるモデルを選択することが可能である。STRamデータについて得られた最良のモデリングは、ランダムフォレストであり、MIRASAデータについて得られたものは、ニューラルネットワーク(多層パーセプトロン)である。
【0145】
ランダムフォレスト
ランダムフォレストがどのように作用するかを説明する前に、決定木が何であるかを理解することが重要である。決定木は、分類および回帰の両方で使用できる予測モデルである。これは、ここで本発明者らが関心を持つこれらの事例のうちの最初のものである。
【0146】
決定木は、異なる予測パラメータの値を試験し、それが実行する試験に従ってグラフを進めるフローチャートに対応する。
【0147】
そのようなモデルの訓練は、訓練ベースのデータおよびラベル(すなわち、実際のラベル)から、「ノード」と呼ばれる、このツリーが実行しなければならない予測変数に対する異なる試験を見つけることにある。全てのノードが交差したとき、本発明者らは、「シート」と呼ばれる最終決定(本発明者らの場合はラベル「POS」または「NEG」の属性)に到達する。
【0148】
固定ノードに対して実行されるべき試験は、ツリーに使用される基準に従って識別される。分類木の場合、この基準は、シャノンエントロピーまたはジニダイバーシティ指数とすることができる。本発明者らのモデリングでは、両方の基準を試験したが、最良の結果を与えたために保持されたのはジニ指数であった。この指標は、データの分布から算出され、データセット(すなわち、この場合、各ラマンシフトのスペクトル値、またはPCAが実装される場合は各主成分の値)内の各説明変数について算出することができる。所与のノードについて、この指標が0に近いほど、このノードは、「純粋」である、すなわち、良好な識別を可能にする基準を提示すると言われる。加えて、各ノード内の全ての説明変数を試験することによって、本発明者らは、通常、現在のツリーのブランチ内の残りの説明変数の間の最良の区別を与えるために、各ステップの説明変数を見つける。したがって、決定木の最適化は、最良の全体的な分類を可能にするために可能な限り低いジニ指数を与える一連のノードを見つけることにある。
【0149】
とは、N番目のラマンシフトを意味する。これは、Ncm-1における値ではなく、ユニット3に格納されているラマンスペクトルのデータリストのN番目の値である。
【0150】
図7は、本発明者らの研究のスペクトルの分類のための、意図的に小さく残された決定木の例を示す。
【0151】
実際、これらの種類のツリーは、急速に非常に大きくなる可能性がある。この表現では、本発明者らは、ツリーの最大深度(モデルのハイパーパラメータである)を5に設定して、理解できるようにする。各ノードについて、本発明者らは、どの変数(例えば、X1877<-0.398)および関連するジニ指数に対してどの試験が行われるかが分かる。「試料」ラインは、このノードに到達した訓練試料の数を宣言し、「値」ラインは、これがそれぞれ表すNEGおよびPOS患者の数を示す。
【0152】
これらのモデルが理解されると、いくつかのモデルを一緒に検討することができる。これは、ランダムフォレストと呼ばれる。本発明者らは、モデリングに300本の異なるツリーを使用する場合、300本のツリーのランダムフォレストについて述べる。これらのフォレストが「ランダム」という名前を有する場合、それを構成するツリーの各々が同じデータベースで訓練されていないため、異なるモデルを使用する目的がなくなる。実際、本発明者らは、元のデータベースにおいて、本発明者らのフォレストにツリーを統合したい数のデータセットのランダムドローを作製する。したがって、本発明者らは、最終決定に対する多数決を達成する異なる予測モデルを訓練する。ランダムフォレストは当然、使用するツリーの数またはブートストラップをすることができるかどうかを含む決定木よりもハイパーパラメータが多い。
【0153】
STRamデータ分類に使用されるランダムフォレストは、以下のハイパーパラメータを使用する:
-ブートストラップ:はい
-基準:ジニ
-ツリーの数:350
-最大深度:11
-最大特徴数:自動
-分離のための群における試料の最小数:1
-ランダム状態(データベースからランダムに取り出したデータセットが各ランダムフォレストに再利用されるように値が設定されたパラメータである。ランダム状態が同一である場合、任意のランダム結果が同一に繰り返される):5000(パラメータランダム状態は、モデル最適化の再現性のために使用され、最適化される必要があるパラメータではない)
【0154】
ニューラルネットワーク
ニューラルネットワークには、いくつかの種類がある。本発明者らが説明した本発明の実施形態に使用したものは、多層パーセプトロン(MLP)と呼ばれ、誤差の逆伝播の原理に基づいている。
【0155】
MLPは、異なる層で確立されたニューロンと呼ばれる一連の基本単位である。最初の層は、データセット内の説明変数と同数のニューロンを含有し(ここでは、寸法縮小後に1959または20)、最後の層は、可能なラベルと同数のニューロンを含む(ここでは、2)。中間層(隠れ層とも呼ばれる)の数およびこれらの層のニューロンの数は、モデルのハイパーパラメータである。1つの層の全てのニューロンは、次の層の全てのニューロンに接続される。古典的には、図8に示すようなニューラルネットワークを表す。
【0156】
したがって、ニューロンは、活性化関数と呼ばれる以下の形式の数学関数fとして見ることができる:
【数2】
【0157】
加えて、全てのニューロンの出力は、重みと呼ばれ、訓練中に最適化されたパラメータのうちの1つである各接続に固有の係数によって重み付けされる。「ソルバ」または「溶液提供者」と呼ばれる重みを最適化するためのいくつかの方法がある。最も一般的なのは勾配降下法であるが、この方法の選定もモデルのハイパーパラメータである。
【0158】
関数fは、異なる隠れ層の全てのニューロンについて同じ種類であり、モデルのハイパーパラメータのうちの1つを表す。この関数は、入力層と出力層とで異なり、これら2つの場合の各々において、モデルのハイパーパラメータも表す。
【0159】
最後に、ニューラルネットワーク専門家によって古典的に公知の「アルファ」パラメータ(ペナルティ項)および学習率は、モデルによってコミットされた誤差が誤差の逆伝播中にネットワークの異なる重みの最適化にどのように影響を与えなければならないかに関するハイパーパラメータである。
【0160】
GridSearchCVを使用した最適化フェーズから生じるMIRASAデータの分類のために最適化されたMLPは、以下のハイパーパラメータを使用する:
-活性化関数:シグモイド
-アルファ:10-5
-隠れ層の数:1
-隠れ層のニューロン数:100
-初期学習率:10-2
-学習率:一定
-ソルバ:勾配の確率的降下
-ランダム状態:5000
【0161】
前処理
モデリングのための最良のスペクトル前処理を選択するために、本発明の枠組み内で、表面増強ラマン分光(SERS)データのスペクトルに使用するための多種多様な前処理が開発された。これらの任意選択の前処理には、以下が含まれる:
-平均減少、および/または
-SNV、および/または
-最大値による正規化、および/または
-極値による標準化、および/または
-Savitzky-Golayアルゴリズムによる平滑化、および/または
-Savitzky-Golayアルゴリズムによる次数1および2の導出、および/または
-ベースラインの減少。
【0162】
これらの前処理を組み合わせることができ、例えば、ベースライン減少を実行し、次いでスペクトルを導出することができる。しかしながら、いくつかの前処理は、組み合わせる価値がない。例えば、SNVの使用は、平均減少を達成することを含意する。したがって、これら2つの前処理を組み合わせることは重要ではない。この意味で、ユニット3のソフトウェア媒体は、整数Nを入力として取り、データベースに存在する前処理から、N個の可能な前処理の全ての「コヒーレント」シリーズ、すなわち、同様の操作を行う2つ(以上)の前処理を含まないシリーズ、または一方の実施が他方の実施に有害である2つの前処理を含まないシリーズを生成する。この前処理のリストが生成されると、本発明者らは、多くのモデルを訓練し、それらの性能を比較することができる。
【0163】
モデル性能を検証によって測定したが、これは、データベースデータが、初期陽性および陰性データの80%を表す訓練セットおよび残りの20%を含有する検証セットに分類されたことを意味する。ここでも、同じ患者からのスペクトルが全て同じ訓練または検証群にあることを保証することが重要である。
【0164】
検証の方法は、試験方法とは異なる。試験は、モデルを訓練し、独立したデータセットでその性能を試験することからなる。ここでは、本発明者らは、検証セットが独立していると事前に仮定することができるが、いくつかのモデルを訓練し、この検証セットで最良の結果を与えるものを保つ。
【0165】
ユニット3のソフトウェア媒体によって生成された様々な前処理を研究した後、MIRASAデータのための最良の前処理は、平滑化、ベースライン補正、続いて次数2の導出であることが得られた。前処理後のMIRASAスペクトルの外観を図9に示す。
【0166】
STRamスペクトルでは、上記のように、飽和現象が範囲の始まりに一部の患者で観察される。これらの飽和は、データの望ましくない変動をもたらし、500cm-1の前のスペクトル範囲の一部を除去するように選定された。この選定の後、STRamデータ用のユニット3のソフトウェア媒体を使用して得られる最良の前処理は、平滑化、ベースライン補正、および極値による正規化に対応する。図10は、完全な前処理後のSTRamスペクトルの外観を示す。
【0167】
予測
STRamスペクトルは、ランダムフォレスト内の350本のツリーの各々を通過する前に、最初に上述のように前処理される。訓練フェーズ中に識別されたジニ基準を最小化する異なるノードがスペクトルに適用され、予測ラベルが各ツリーに取得される。次いで、350個の予測の間に多数決があり、STRamモデルによって予測された最終ラベルがスペクトルについて得られる。
【0168】
先に述べたように、データセットの一部は、検証における前処理を最適化するために確保されている。これらは、10人の陽性患者および10人の陰性患者であり、STRamの場合、NEGと標識された合計90個のスペクトルおよびPOSと標識された94個のスペクトルに対応する。いくつかのスペクトルが同じ患者に属することを考慮せずに、これらのスペクトルの全てにモデルを適用すると、図11に示す混同行列が得られる。
【0169】
これらの結果は、69%の全体的な精度、54%の感度および84%の特異度に関連付けられる。これらの値は、POS患者を正しく識別することが困難であることを示している。しかしながら、本発明者らは、患者ごとにいくつかのスペクトル(最大9個)を有する。したがって、同じ患者に対して行われた予測の多数決を実行することによって、図12の混同行列が得られる。
【0170】
患者ごとにいくつかのスペクトルを使用すると、75%の全体的な精度、60%の感度および90%の特異度が得られるので、より良好な予測を得ることが可能である。
【0171】
STRamに関しては、ユニット3のソフトウェア媒体によって識別された前処理を使用して、MIRASAスペクトルが最初に前処理される。ここで、モデルは、多層パーセプトロンである。したがって、データは、出力層に到達する前にニューラルネットワークの異なる層を連続的に通過する。多層パーセプトロンの最終層が、分類において、予測すべきクラスと同数のニューロンを含有する場合、これは、これらのニューロンの各々が訓練ベースに存在するラベルのうちの1つと関連付けられているためである。MLPによって予測されるクラスは、出力値が最大のニューロンに関連付けられたクラスに対応する。
【0172】
MIRASAデータの検証セットは、126個のNEG標識スペクトルおよび89個のPOS標識スペクトルからなる。したがって、検証で得られた混同行列を図13に示す。
【0173】
今回、本発明者らは、感度79%および特異度72%で総合精度75%を得た。STRamデータと同様に、各患者が複数のスペクトルに関連付けられているという事実を使用して、図14に与えられた交絡行列によって記述されるMIRASAモデルの全体的な予測を得ることができる。
【0174】
このようにして、感度および特異度に等しい総合精度80%が得られる。
【0175】
SARS-CoV-2ウイルスの存在(またはそうでない)の検出へのこれらのモデルの適用の一部として、本発明者らは、いくつかのスペクトルの使用がモデルの堅牢性を高めることを観察することができた。このため、最終的な予測にはいくつかのスペクトルを使用することを決定した。現時点では、4つのスペクトルの数が停止している。
【0176】
加えて、各スペクトルを予測するとき、モデルを構築することによって、その予測におけるモデルの確実性の割合を計算することが可能である。したがって、本発明によれば、同点につながり得る4つのスペクトルの多数決を実行するのではなく、同じ患者の全てのスペクトルに属する確率を平均し、次いで最大確率に対応するラベルを選定することが好ましい。これにより、最終予測を、予測ラベルに対してモデルが算出する平均確率に等しい信頼度指標と一致させることが可能になる。次いで、60%未満の信頼度を有する答えが、予測が不確実であったスペクトルから導出され、ユニット3のソフトウェアが、この結果に頼るよりもこの測定を繰り返す方がよいことを知らせることを可能にする。60%を超えると、予測ラベルが偽ではなく正しい可能性が2倍になる。この60%の障壁は、現時点で設定されているが、変更しなければならない場合がある。
【実施例
【0177】
実施例1:SARS-CoV-2の存在の検出
1.1.材料および方法
第1の実施例によれば、鼻咽頭スワブは、人々から採取される。
【0178】
試料を溶解緩衝液で処理し、シリカマトリックスへの吸着および洗浄によってRNAを単離する。
【0179】
平均直径150nmの天然金粒子を0.15mg/mlの濃度で含有する溶液(Metrohm AUNP-COL)を18,000gで1分間遠心分離する。
【0180】
精製RNAを含有する試料30マイクロリットルをナノ粒子ペレットと接触させ、次いで、全体を撹拌して均一な培地を得る。
【0181】
アルミニウム箔で覆われたブレード上に10マイクロリットルの堆積物を作製し、785nmの波長で約500mWの出力を有するMetrohm製のST-Ramセンサを用いてスペクトルを作製する。それは、その出力の10~100%、好ましくはその出力の50~100%で使用される。測定の積分時間は、15~60秒である。
【0182】
その結果が以下に提示される第2の例は、鼻咽頭スワブが個体から採取され、輸送環境でアンロードされることである。
【0183】
平均直径100nmの天然金粒子を0.15mg/mLの濃度で含有する溶液(AUNP-COL Metrohm)を45分間で800gまで遠心分離する。
【0184】
鼻咽頭検体を含有する20マイクロリットルの輸送媒体を10μLのナノ粒子ペレットと接触させ、次いで全体を撹拌して均一な媒体を得る。
【0185】
アルミニウムスライド上に10マイクロリットルの堆積物を作製し、785nmの波長で約500mWの出力を有するMetrohm製のSTRamセンサを用いてスペクトルを作製する。それは、その出力の10%~100%、好ましくはその出力の50%~100%で使用される。測定の積分時間は、1~30秒である。
【0186】
1.2.結果:
結果を図1に示す。
【0187】
本発明による方法は、患者の良好な分類を可能にし(図1の表の感度欄を参照)、偽陽性患者をほとんどもたらさないため、高感度であり、それは特異的であるので(図1の表の特異性欄を参照)、陰性患者を区別することが可能である。ユーデン指数が非常に高い。この指標は、下記式(感度+特異度)-1に従って算出される。
【0188】
SARS-CoV-2の特定のピークを図2および図3に示す。
【0189】
金ナノ粒子の試料中のSARS-CoV-2の存在は、560cm-1~760cm-1(典型的には660または727cm-1)のピーク、1250~1500cm-1(典型的には1374cm-1)のピークおよび2062cm-1~2162cm-1(典型的には2100または2112cm-1)のピークの存在を特徴とする。試料を採取した患者は、SARS-CoV-2陽性と言われる。一方、試料中にウイルスが存在しない場合、1100~1250cm-1のピークのみが見える。その後、患者は、SARS-CoV-2陰性と判定される。
【0190】
もちろん、本発明は、今説明した例に限定されず、本発明の範囲を逸脱することなくこれらの例に対して多くの調整を行うことができる。
【0191】
当然のことながら、本発明の異なる特徴、形状、変形例および実施形態は、それらが互いに適合しないかまたは排他的でない限り、様々な組み合わせで互いに関連付けられてもよい。特に、上述の全ての変形例および実施形態は、互いに組み合わせることができる。

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
【手続補正書】
【提出日】2022-12-28
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
非磁性天然金属ナノ粒子と接触させた試料から得られた少なくとも1つの表面増強ラマン分光(SERS)信号において病原体を検出するための方法であって、コンピュータによって実施され、
記非磁性天然金属ナノ粒子と接触させた前記試料から得られた各表面増強ラマン分光(SERS)信号の受信と、
信した各表面増強ラマン分光信号を、前記試料中の前記病原体の有無を表す少なくとも1つのクラスと関連付けるように構成された分類モデルの実施と、
を含む、方法。
【請求項2】
前記分類モデルが、ニューラルネットワーク、ランダムフォレスト、サポートベクターマシン、関連性ベクトルマシン、PLSDA、および/またはベイジアンモデルの中の少なくとも1つを含む、請求項1に記載の方法。
【請求項3】
前記受信と前記分類モデルの実施との間に、各表面増強ラマン分光信号の前処理ステップを含み、前記前処理ステップが、以下の前処理:平均の減少、標準法線変動、最大値による正規化、極値による正規化、平滑化、ベースラインの減少または補正、導出のうちの少なくとも1つの実施を含む、請求項1または2に記載の方法。
【請求項4】
前記受信と前記分類モデルの実施との間に、
-試料採取の形態、または
-各表面増強ラマン分光信号を送達する分光計モデル、または
-前記試料を採取した対象に関するデータ、または
-試料輸送媒体、または
-検出される病原体、に基づいて、いくつかの事前定義された分類モデルから使用される前記分類モデルの自動選定を含む、請求項1または2に記載の方法。
【請求項5】
前記病原体が、ウイルス、プリオン、寄生虫、真菌、酵母および細菌を含む群の要素のうちの1つである、請求項1または2に記載の方法。
【請求項6】
前記病原体がSARS-CoV-2であり、受信した各表面増強ラマン分光信号を、前記試料中の前記病原体の有無を表す各対応するクラスと関連付けるために、前記分類モデルが、以下のうちの前記表面増強ラマン分光信号における少なくとも3つのピークに関する少なくとも1つの処理を適用するように構成される、請求項1または2に記載の方法:
-419cm-1~459cm ラマンオフセットにおけるピーク、または
-566cm-1~606cm ラマンオフセットにおけるピーク、または
-646cm-1~686cm ラマンオフセットにおけるピーク、または
-719cm-1~759cm ラマンオフセットにおけるピーク、または
-839cm-1~879cm ラマンオフセットにおけるピーク、または
-962cm-1~1002cm ラマンオフセットにおけるピーク、または
-1006cm-1~1046cm ラマンオフセットにおけるピーク、または
-1121cm-1~1161cm ラマンオフセットにおけるピーク、または
-1190cm-1~1230cm ラマンオフセットにおけるピーク、または
-1339cm-1~1379cm ラマンオフセットにおけるピーク、または
-1529cm-1~1569cm ラマンオフセットにおけるピーク、または
-1591cm-1~1631cm ラマンオフセットにおけるピーク、または
-1662cm-1~1702cm ラマンオフセットにおけるピーク、または
-1722cm-1~1762cm ラマンオフセットにおけるピーク、または
-1796cm-1~1836cm ラマンオフセットにおけるピーク、または
-2058cm-1~2098cm ラマンオフセットにおけるピーク、または
-2110cm-1~2150cm ラマンオフセットにおけるピーク、または
-2322cm-1~2362cm ラマンオフセットにおけるピーク、または
-2460cm-1~2500cm ラマンオフセットにおけるピーク。
【請求項7】
各表面増強ラマン分光信号の前記受信が、
a)溶液または懸濁液を得るための前記試料と非磁性天然金属ナノ粒子との接触と、
b)媒体上の前記溶液または懸濁液の堆積と、
c)前記堆積によって放射された各表面増強ラマン分光信号の検出と、
を含む、請求項1または2に記載の方法。
【請求項8】
前記試料が、前記非磁性天然金属ナノ粒子を含む遠心分離ペレットと接触させる前に溶解される、請求項7に記載の方法。
【請求項9】
前記非磁性天然金属ナノ粒子が、50~200nmの直径を有する、請求項1または2に記載の方法。
【請求項10】
前記非磁性天然金属ナノ粒子が、第1の金属の非磁性ナノ粒子および第2の金属の非磁性ナノ粒子を含み、前記第1の金属の前記ナノ粒子が、前記第2の金属の前記ナノ粒子とは異なる、請求項1または2に記載の方法。
【請求項11】
前記第1の金属の前記非磁性金属ナノ粒子が、金粒子であり、前記第2の金属の前記非磁性金属ナノ粒子が、銀ナノ粒子である、請求項10に記載の方法。
【請求項12】
各表面増強ラマン分光信号の前記受信が、
起光放射であって、前記励起光が前記試料に到達する、励起光放射と、
記励起光が前記試料に到達する間の、前記試料による反射光、透過光、散乱光または後方散乱光の、センサまたは分光計による捕捉と、
を含む、請求項1または2に記載の方法。
【請求項13】
前記励起光が、前記試料に到達し、前記試料が、前記非磁性天然金属ナノ粒子と接触している間に、前記分光計またはセンサが、前記捕捉ステップを実施する、請求項12に記載の方法。
【請求項14】
コンピュータプログラム製品であって、コンピュータによって実行されると、請求項1または2に記載の方法を実施するプログラムコード命令を含む、コンピュータプログラム製品。
【請求項15】
表面増強ラマン分光法(SERS)によって試料中の病原体の存在を検出するためのキットであって、前記キットが、非磁性天然金属ナノ粒子と、請求項1または2に記載の方法を実施することによって前記試料中の前記病原体の存在を検出するように構成されたソフトウェアおよび/またはソフトウェア媒体と、を備える、キット。
【請求項16】
前記非磁性天然金属ナノ粒子が、第1の金属の非磁性ナノ粒子および第2の金属の非磁性ナノ粒子を含み、前記第1の金属の前記ナノ粒子が、前記第2の金属の前記ナノ粒子とは異なる、請求項15に記載のキット。
【請求項17】
前記第1の金属の前記非磁性金属ナノ粒子が、金ナノ粒子であり、前記第2の金属の前記非磁性金属ナノ粒子が、銀ナノ粒子である、請求項16に記載のキット。
【請求項18】
溶解緩衝液をさらに含む、請求項15に記載のキット。
【請求項19】
検出可能な前記病原体が、ウイルス、プリオン、寄生虫、真菌、酵母および細菌を含む群の要素のうちの1つであり、特にSARS-CoV-2である、請求項15に記載のキット。
【請求項20】
前記非磁性天然金属ナノ粒子が、50~200nmの平均直径を有する、請求項15に記載のキット。
【請求項21】
前記非磁性天然金属ナノ粒子が、金、銀、銅、白金またはこれらの金属のうちの1つをベースとする合金の粒子である、請求項15に記載のキット。
【請求項22】
表面増強ラマン分光法(SERS)によって試料中の病原体の存在を検出するための、請求項15に記載のキットの使用。
【請求項23】
前記ソフトウェアが、前記病原体の存在に関連する疾患の診断をさらに提供する、請求項22に記載の使用。
【国際調査報告】