(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025011780
(43)【公開日】2025-01-24
(54)【発明の名称】検体成分含有量予測装置、検体成分含有量予測方法、及び、プログラム
(51)【国際特許分類】
G01N 21/3581 20140101AFI20250117BHJP
【FI】
G01N21/3581
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023114099
(22)【出願日】2023-07-11
(71)【出願人】
【識別番号】000141897
【氏名又は名称】アークレイ株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】内山 誠
(72)【発明者】
【氏名】佐永田 恵
(72)【発明者】
【氏名】八木 理
(72)【発明者】
【氏名】内田 裕久
【テーマコード(参考)】
2G059
【Fターム(参考)】
2G059BB04
2G059BB12
2G059CC16
2G059EE01
2G059EE02
2G059EE12
2G059GG01
2G059GG02
2G059HH05
2G059JJ12
2G059MM10
(57)【要約】
【課題】測定対象の試料のスペクトルデータから、試料における特定の成分の濃度を高精度に推定することが可能な検体成分含有量予測装置、検体成分含有量予測方法、及び、プログラムを提供する。
【解決手段】測定対象の試料に対する電磁波による分光計測により取得されたスペクトルデータを取得する取得部と、試料における特定の成分の濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを教師データとして学習された機械学習モデルに対して、取得部により取得された測定対象の試料のスペクトルデータの特徴量を入力することにより、測定対象の試料における特定の成分の濃度を推定する濃度推定部と、を備える。
【選択図】
図2
【特許請求の範囲】
【請求項1】
測定対象の試料に対する電磁波による分光計測により取得されたスペクトルデータを取得する取得部と、
試料における特定の成分の濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを教師データとして学習された機械学習モデルに対して、前記取得部により取得された前記測定対象の試料のスペクトルデータの特徴量を入力することにより、前記測定対象の試料における前記特定の成分の濃度を推定する濃度推定部と、
を備える検体成分含有量予測装置。
【請求項2】
前記電磁波は、テラヘルツ波である
請求項1に記載の検体成分含有量予測装置。
【請求項3】
励起光源から発生させた電磁波を波長変換することにより前記テラヘルツ波を発生させる場合、
前記テラヘルツ波は、前記励起光源から発生させた電磁波が有する波長成分又はパルス幅によって発生可能なスペクトル幅を有する
請求項2に記載の検体成分含有量予測装置。
【請求項4】
前記テラヘルツ波は、0.5THzから7THzまでのスペクトル幅を有する
請求項2に記載の検体成分含有量予測装置。
【請求項5】
スペクトルデータの特徴量は、0.1THz以下の等間隔な周波数毎の信号強度である
請求項1に記載の検体成分含有量予測装置。
【請求項6】
前記スペクトルデータの特徴量は、0.1THz以下の等間隔な周波数毎に各々の区間において取得された複数の信号強度の中央値のデータである
請求項5に記載の検体成分含有量予測装置。
【請求項7】
前記特定の成分は、グルコースである
請求項1に記載の検体成分含有量予測装置。
【請求項8】
測定対象の試料に対する電磁波による分光計測により取得されたスペクトルデータを取得するステップと、
試料における特定の成分の濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを教師データとして学習された機械学習モデルに対して、取得された前記測定対象の試料のスペクトルデータの特徴量を入力することにより、前記測定対象の試料における前記特定の成分の濃度を推定するステップと、
を備える検体成分含有量予測方法。
【請求項9】
測定対象の試料に対する電磁波による分光計測により取得されたスペクトルデータを取得するステップと、
試料における特定の成分の濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを教師データとして学習された機械学習モデルに対して、取得された前記測定対象の試料のスペクトルデータの特徴量を入力することにより、前記測定対象の試料における前記特定の成分の濃度を推定するステップと、
をコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、検体成分含有量予測装置、検体成分含有量予測方法、及び、プログラムに関する。
【背景技術】
【0002】
特許文献1には、miRNA(micro RiboNucleic Acid)の発現量のデータを用いてニューラルネットワークで学習させることで疾患の罹患判定を行い、かつ、疾患について特徴的なバイオマーカーとなるmiRNAをニューラルネットワークによって抽出するための技術が記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示の目的は、測定対象の試料のスペクトルデータから、試料における特定の成分の濃度を高精度に推定することが可能な検体成分含有量予測装置、検体成分含有量予測方法、及び、プログラムを提供するものである。
【課題を解決するための手段】
【0005】
本開示の検体成分含有量予測装置は、測定対象の試料に対する電磁波による分光計測により取得されたスペクトルデータを取得する取得部と、試料における特定の成分の濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを教師データとして学習された機械学習モデルに対して、前記取得部により取得された前記測定対象の試料のスペクトルデータの特徴量を入力することにより、前記測定対象の試料における前記特定の成分の濃度を推定する濃度推定部と、を備える。
【0006】
本開示の検体成分含有量予測方法は、測定対象の試料に対する電磁波による分光計測により取得されたスペクトルデータを取得するステップと、試料における特定の成分の濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを教師データとして学習された機械学習モデルに対して、取得された前記測定対象の試料のスペクトルデータの特徴量を入力することにより、前記測定対象の試料における前記特定の成分の濃度を推定するステップと、を備える。
【0007】
本開示のプログラムは、測定対象の試料に対する電磁波による分光計測により取得されたスペクトルデータを取得するステップと、試料における特定の成分の濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを教師データとして学習された機械学習モデルに対して、取得された前記測定対象の試料のスペクトルデータの特徴量を入力することにより、前記測定対象の試料における前記特定の成分の濃度を推定するステップと、をコンピュータに実行させる。
【発明の効果】
【0008】
本開示の検体成分含有量予測装置、検体成分含有量予測方法、及び、プログラムによれば、測定対象の試料のスペクトルデータから、試料における特定の成分の濃度を高精度に推定することができる。
【図面の簡単な説明】
【0009】
【
図1】実施形態の分光計測システムの概略構成図である。
【
図3】AIモデルにおける処理の流れを説明するためのフローチャートである。
【
図4】スペクトルデータの一例を示すグラフである。
【
図5】スペクトルデータのサンプリング処理を説明するためのグラフである。
【
図7】AIモデルにおける予測精度を示すグラフである。
【発明を実施するための形態】
【0010】
以下、本開示の一実施形態について図面を参照しつつ説明する。
図1は、本実施形態の分光計測システム1の概略構成図である。
【0011】
図1に示すように、分光計測システム1は、コンピュータ10と、発光部20と、光学系21と、プリズム22と、光学系23と、受光部24と、検出部25と、を備える。
【0012】
コンピュータ10は、分光計測システム1において、発光部20、受光部24、及び、検出部25を制御する制御部として機能する。また、コンピュータ10は、本開示の技術における検体成分含有量予測装置としても機能する。コンピュータ10については、後段で詳細に説明する。
【0013】
発光部20は、例えばレーザダイオードから構成され、測定用電磁波を出射する。
【0014】
光学系21は、発光部20から出射した測定用電磁波をプリズム22に入射させるための光学系であり、1枚又は複数枚のレンズにより構成される。
【0015】
プリズム22は、例えば、測定用電磁波を透過するシリコンにより形成されており、上面において測定対象の試料30を保持する。
【0016】
光学系23は、プリズム22から出射した測定用電磁波を受光部24に入射させるための光学系であり、1枚又は複数枚のレンズにより構成される。
【0017】
受光部24は、例えばフォトディテクタ等から構成され、光学系23により入射された測定用電磁波を受光する。
【0018】
検出部25は、例えばロックインアンプ等から構成され、受光部24において受光した測定用電磁波の光量を検出する。
【0019】
プリズム22と試料30との界面に測定用電磁波が照射されると、試料30の特性に応じた光エネルギーの減衰(吸収スペクトル)が生じる。
【0020】
分光計測システム1においては、発光部20から出射した測定用電磁波をプリズム22に入射させ、プリズム22の上面における試料30との界面で全反射した測定用電磁波を受光部24で受光し、受光光量を検出部25で検出する。このような分光計測により取得された検出部25の検出結果はコンピュータ10に入力され、コンピュータ10において受光した測定用電磁波のスペクトルデータに基づき、試料30中の特定の成分の濃度を計測する。分光計測システム1の動作は、コンピュータ10によって制御される。
【0021】
分光計測システム1の制御部及び検体成分含有量予測装置として機能するコンピュータ10は、制御部11と、記憶部12と、表示部13と、操作部14と、通信部15と、接続部16と、を備えている。制御部11、記憶部12、表示部13、操作部14、通信部15、及び、接続部16は、バス17を介して相互に接続されている。
【0022】
制御部11は、CPU(Central Processing Unit)11Aと、ROM(Read Only Memory)11Bと、RAM(Randam Access Memory)11Cと、を備える。制御部11は、コンピュータ10の各部を制御する機能と、コンピュータ10の接続部16に接続されている外部機器を制御する機能と、を有する。
【0023】
記憶部12としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等が用いられる。記憶部12には、後ほど説明する検体成分含有量予測処理等を行うためのプログラム12Aが記憶される。なお、このプログラム12Aは、ROM12に記憶されていてもよい。なお、記憶部12は、メモリが外付けされたり、後から増設されたりしてもよい。
【0024】
プログラム12Aは、例えば、コンピュータ10に予めインストールされていてもよい。プログラム12Aは、不揮発性の非一時的記憶媒体に記憶して、又はネットワーク回線を介して配布して、コンピュータ10に適宜インストールしたり、アップグレードしたりすることで実現してもよい。なお、不揮発性の非一時的記憶媒体の例としては、CD-ROM(Compact Disc Read Only Memory)、光磁気ディスク、HDD、DVD-ROM(Digital Versatile Disc Read Only Memory)、フラッシュメモリ、メモリカード等が想定される。
【0025】
表示部13には、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)又は有機EL(Electro Luminescence)ディスプレイ等が用いられる。表示部13は、タッチパネルを一体的に有していてもよい。
【0026】
操作部14には、例えば、キーボードやマウス等の操作入力用のデバイスが設けられている。ユーザは、操作部14の操作を通じてコンピュータ10にユーザの指示を伝える。表示部13は、ユーザから受け付けた指示に応じて実行された処理の結果や、処理に対する通知等の各種の情報を表示する。
【0027】
通信部15は、インターネット、LAN(Local Area Network)、及び/又は、WAN(Wide Area Network)等のネットワーク回線に接続され、ネットワーク回線を介して外部機器との間で通信が可能とされる。
【0028】
接続部16は、例えば、分光計測システム1の発光部20、受光部24、及び、検出部25等の外部機器が接続され入出力ポートである。発光部20、受光部24、及び、検出部25は、上記の制御部11によって制御される。
【0029】
本実施形態のコンピュータ10は、AI(Artificial Intelligence)を用いた検体成分含有量予測装置として機能する。このコンピュータ10の制御部11は、測定対象の試料に対する測定用電磁波による分光計測により取得されたスペクトルデータを取得する取得部としての機能と、試料における特定の成分の濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを教師データとして学習された機械学習モデルに対して、取得部により取得された測定対象の試料のスペクトルデータの特徴量を入力することにより、測定対象の試料における特定の成分の濃度を推定する濃度推定部としての機能と、を備える。
【0030】
本実施形態では、測定用電磁波の一例として、テラヘルツ波を用いる。テラヘルツ波とは、1THz(波長300μm)前後の周波数の電磁波であって、100GHz(波長3mm)以上30THz(波長10μm)以下の周波数の電磁波である。また、本実施形態において測定用電磁波は、0.5THzから7THzまでのスペクトル幅を有する。ここでスペクトル幅は、測定用電磁波のスペクトルにおける半値全幅を意味する。
【0031】
なお、測定用電磁波の周波数は、テラヘルツ波の発生原理にも依存し、例えば、励起光源から発生させた電磁波を波長変換することによりテラヘルツ波を発生させる場合には、励起光源から発生させた電磁波が有する波長成分又はパルス幅によってテラヘルツ波の周波数特性が定まる。本実施形態において、一例として50フェムト秒から100フェムト秒のパルス波を有するレーザー光源を励起光減として使用したため、テラヘルツ波は、この励起光減により発生可能な0.5THzから7THzまでのスペクトル幅を有するが、これに限定はされない。
【0032】
なお、「0.5THzから7THzまでのスペクトル幅」とは、一例として50フェムト秒から100フェムト秒のパルス波を有するレーザー光源を励起光減として使用した場合のテラヘルツ波のスペクトル幅であり、厳密に0.5THzから7THzまでのスペクトル幅に限らず、誤差を考慮して、少なくとも0.5THzから7THzまでの区間の90%以上を含み、かつ、全体の幅が6.5THzの110%の数値である7.15THz以下のものを含む。
【0033】
また、本実施形態では、試料における特定の成分の濃度の一例として、培地血清中のグルコースの濃度を推定する。
【0034】
ここで、
図2を参照して、本実施形態のコンピュータ10のAIモデルについて説明する。
【0035】
図2に示すように、コンピュータ10のAIモデルは、先ず、学習パートでは、入力層において、試料におけるグルコースの濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを入力し、学習層において、入力層で入力されたデータを教師データとして学習された機械学習モデルを生成する。
【0036】
コンピュータ10のAIモデルは、次に、予測パートでは、入力層において、測定対象の試料のスペクトルデータの特徴量を入力し、演算層において、学習パートで生成した学習モデルを用いてグルコースの含有量を予測し、出力層において、グルコースの含有量の予測結果として測定対象の試料におけるグルコースの濃度を出力する。
【0037】
次に、
図3に示すフローチャートを参照して、本実施形態のコンピュータ10のAIモデルにおける具体的な処理の流れを説明する。
【0038】
先ず、AIモデルにおける学習パートの処理について説明する。コンピュータ10の制御部11は、ステップS11において、グルコースの濃度が既知の試料に対して、テラヘルツ波を用いた分光計測を行い、スペクトルデータを取得する。
【0039】
次に、制御部11は、ステップS12において、ステップS11で取得したスペクトルデータに対して前処理を行う。
【0040】
図4はスペクトルデータの一例を示すグラフであり、横軸は周波数(THz)、縦軸は信号強度(単位無し)を示している。また、灰色の実線はスペクトルデータの生データを示しており、灰色の実線上の灰色の丸印はスペクトルデータの生データを0.01THz毎にサンプリングしたものである。また、黒色の丸印は0.1THz毎に各々の区間において取得された複数の信号強度の中央値を示したものであり、黒色の実線は0.1THz毎の中央値同士を結んだ線である。
【0041】
教師データを用いて学習された機械学習モデルを生成する場合、教師データのデータが細分化されている程、予測精度を高めることができる。一方で、教師データのデータが細分化されている程、処理に負荷が掛かり、学習モデルの生成、及び、学習モデルを用いた予測に時間が掛かることになる。
【0042】
本実施形態では、測定用電磁波として0.5THzから7THzまでのスペクトル幅を有するテラヘルツ波を用いており、この場合において予測精度の向上と処理負荷の軽減とを両立させるために、スペクトルデータから0.1THz毎に信号強度を取得する。ただし、この信号強度の取得幅は、計算機の性能によるところが大きく影響しているため、計算機の性能が許す場合には、0.1THz以下の等間隔な周波数において、なるべく低い周波数毎に取得することが望ましい。
【0043】
また、スペクトルデータの生データには、ノイズが重畳しているため、ノイズの影響を抑えるために、制御部11は、
図5に一部拡大して示すように、スペクトルデータに対する前処理として、スペクトルデータの生データを0.01THz毎にサンプリングし、さらに0.1THz毎に各々の区間において取得された複数の信号強度の代表値として中央値をサンプリングする。
【0044】
スペクトルデータの生データには、ノイズが重畳しているため、真の測定値よりも値が高くなるデータが存在することになる。そのため、スペクトルデータの生データを0.01THz毎にサンプリングし、さらに0.1THz毎に各々の区間において取得された複数の信号強度の代表値として「平均値」をサンプリングすると、全てのデータの内容が反映されてしまうため、真の測定値よりも高めの値になってしまうおそれがある。
【0045】
これに対して、本実施形態のように、0.1THz毎に各々の区間において取得された複数の信号強度の代表値として「中央値」をサンプリングすると、ノイズが大きく重畳したデータの内容が反映されず、0.1THz毎に各々の区間において取得された複数の信号強度の中央値を取得するため、真の測定値に近い値を取得することができる。
【0046】
次に、制御部11は、ステップS13において、ステップS12で前処理を行ったスペクトルデータから、0.1THz毎の信号強度のデータを特徴量として抽出する。
【0047】
次に、制御部11は、ステップS14において、
図6に一例として示すように、試料における既知のグルコースの濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量(周波数毎の信号強度)とを教師データとして学習層に入力し、学習モデルを作成する。
【0048】
また、制御部11は、既知のグルコースの濃度を変化させた複数の試料に対して、ステップS11からステップS14の処理を繰り返し、複数の教師データを用いて学習モデルを作成する。
【0049】
次に、AIモデルにおける予測パートの処理について説明する。コンピュータ10の制御部11は、ステップS15において、測定対象の試料のスペクトルデータの特徴量を入力層に入力することにより、測定対象の試料におけるグルコースの濃度を推定(予測)する。
【0050】
ここでは、学習パートにおいて教師データを取得する際に用いた試料(グルコースの濃度が既知の試料)を、予測パートにおいて分光測定し、測定した試料のスペクトルデータの特徴量を入力層に入力した場合のグルコースの濃度の推定結果を検証する。
【0051】
図7は、上記AIモデルを用いて得られた解析結果のうち、平均二乗偏差によりランク付けしたモデルの中で最も精度が高かった結果を示したグラフである。横軸は予測値(単位なし)を示しており、縦軸は実測値(単位なし)を示している。
【0052】
本実施形態における結果では、傾きが1.0217、決定係数(二乗値)が0.8521であり、非常に高い精度でグルコース濃度を推定することができた。
【0053】
[変形例]
【0054】
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【0055】
例えば、分光計測に用いる測定用電磁波は、テラヘルツ波に限らず、他の電磁波を用いてもよい。
【0056】
また、試料において推定する特定の成分の濃度は、培地血清中のグルコースの濃度に限らず、母乳中の各成分の濃度、又は、果汁中の果糖の濃度(糖度)等、どのような態様としてもよい。
【0057】
[付記]
以下に、本開示の好ましい形態について付記する。
【0058】
[付記1]
測定対象の試料に対する電磁波による分光計測により取得されたスペクトルデータを取得する取得部と、
試料における特定の成分の濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを教師データとして学習された機械学習モデルに対して、前記取得部により取得された前記測定対象の試料のスペクトルデータの特徴量を入力することにより、前記測定対象の試料における前記特定の成分の濃度を推定する濃度推定部と、
を備える検体成分含有量予測装置。
【0059】
[付記2]
前記電磁波は、テラヘルツ波である
付記1に記載の検体成分含有量予測装置。
【0060】
[付記3]
励起光源から発生させた電磁波を波長変換することにより前記テラヘルツ波を発生させる場合、
前記テラヘルツ波は、前記励起光源から発生させた電磁波が有する波長成分又はパルス幅によって発生可能なスペクトル幅を有する
付記2に記載の検体成分含有量予測装置。
【0061】
[付記4]
前記テラヘルツ波は、0.5THzから7THzまでのスペクトル幅を有する
付記2又は3に記載の検体成分含有量予測装置。
【0062】
[付記5]
スペクトルデータの特徴量は、0.1THz以下の等間隔な周波数毎の信号強度である
付記1から4のいずれか1項に記載の検体成分含有量予測装置。
【0063】
[付記6]
【0064】
前記スペクトルデータの特徴量は、0.1THz以下の等間隔な周波数毎に各々の区間において取得された複数の信号強度の中央値のデータである
付記5に記載の検体成分含有量予測装置。
【0065】
[付記7]
前記特定の成分は、グルコースである
付記1から6のいずれか1項に記載の検体成分含有量予測装置。
【0066】
[付記8]
測定対象の試料に対する電磁波による分光計測により取得されたスペクトルデータを取得するステップと、
試料における特定の成分の濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを教師データとして学習された機械学習モデルに対して、前記取得部により取得された前記測定対象の試料のスペクトルデータの特徴量を入力することにより、前記測定対象の試料における前記特定の成分の濃度を推定するステップと、
を備える検体成分含有量予測方法。
【0067】
[付記9]
測定対象の試料に対する電磁波による分光計測により取得されたスペクトルデータを取得するステップと、
試料における特定の成分の濃度と、当該試料に対する分光計測により取得されたスペクトルデータの特徴量とを教師データとして学習された機械学習モデルに対して、前記取得部により取得された前記測定対象の試料のスペクトルデータの特徴量を入力することにより、前記測定対象の試料における前記特定の成分の濃度を推定するステップと、
をコンピュータに実行させるためのプログラム。
【符号の説明】
【0068】
1 分光計測システム
10 コンピュータ
11 制御部
11A CPU
11B ROM
11C RAM
12 記憶部
12A プログラム
13 表示部
14 操作部
15 通信部
16 接続部
17 バス
20 発光部
21 光学系
22 プリズム
23 光学系
24 受光部
25 検出部
30 試料