(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023074746
(43)【公開日】2023-05-30
(54)【発明の名称】データ生成方法、学習モデル生成方法、コンピュータプログラム、情報処理装置及び分析装置
(51)【国際特許分類】
G01N 21/65 20060101AFI20230523BHJP
G06N 3/02 20060101ALI20230523BHJP
G06N 20/00 20190101ALI20230523BHJP
【FI】
G01N21/65
G06N3/02
G06N20/00
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2021187854
(22)【出願日】2021-11-18
(71)【出願人】
【識別番号】000155023
【氏名又は名称】株式会社堀場製作所
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】安藤 嘉健
【テーマコード(参考)】
2G043
【Fターム(参考)】
2G043AA01
2G043BA16
2G043DA06
2G043EA03
2G043EA11
2G043HA01
2G043HA09
2G043HA15
2G043KA09
2G043LA01
2G043MA01
2G043NA01
2G043NA02
2G043NA06
(57)【要約】
【課題】少数のスペクトルから多数のスペクトルを生成することにより、多数のスペクトルを含む訓練データを生成するデータ生成方法、コンピュータプログラム、情報処理装置及び分析装置を提供する。
【解決手段】試料から得られたスペクトルを入力した場合に前記試料の分析結果を出力する学習モデルを学習させるための訓練データを生成するデータ生成方法であって、試料から得られるスペクトルである原スペクトルを取得し、前記原スペクトルと、前記原スペクトルに含まれる前記試料の分析の根拠となる分析用スペクトルとは異なる非分析用スペクトルとを用いて、前記原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルを含み前記原スペクトルと形状が異なる複数の仮想スペクトルを生成し、夫々に前記仮想スペクトルと前記試料の分析結果とを関連付けた複数のデータセットを含む訓練データを生成する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
試料から得られたスペクトルを入力した場合に前記試料の分析結果を出力する学習モデルを学習させるための訓練データを生成するデータ生成方法であって、
試料から得られるスペクトルである原スペクトルを取得し、
前記原スペクトルと、前記原スペクトルに含まれる前記試料の分析の根拠となる分析用スペクトルとは異なる非分析用スペクトルとを用いて、前記原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルを含み前記原スペクトルと形状が異なる複数の仮想スペクトルを生成し、
夫々に前記仮想スペクトルと前記試料の分析結果とを関連付けた複数のデータセットを含む訓練データを生成する
ことを特徴とするデータ生成方法。
【請求項2】
前記原スペクトルから非分析用スペクトルを分離し、
前記原スペクトルから非分析用スペクトルを分離した後のスペクトルに、前記原スペクトルから分離した非分析用スペクトルとは異なる非分析用スペクトルを加算することにより、前記仮想スペクトルを生成する
ことを特徴とする請求項1に記載のデータ生成方法。
【請求項3】
前記原スペクトルから分離した非分析用スペクトルに対して、所定値の加算、波数のシフト、又は非分析用スペクトルに含まれる特定の値を中心とした値の反転を行うことにより、非分析用スペクトルを加工し、
前記原スペクトルから非分析用スペクトルを分離した後のスペクトルに、加工された非分析用スペクトルを加算することにより、前記仮想スペクトルを生成する
ことを特徴とする請求項2に記載のデータ生成方法。
【請求項4】
複数の原スペクトルを取得し、
一の原スペクトルから非分析用スペクトルを分離した後のスペクトルに、他の原スペクトルから分離した非分析用スペクトルを加算することにより、前記仮想スペクトルを生成する
ことを特徴とする請求項2に記載のデータ生成方法。
【請求項5】
複数の原スペクトルを取得し、
前記複数の原スペクトルから分離した複数の非分析用スペクトルを互いに加算することにより、非分析用スペクトルを加工し、
前記原スペクトルから非分析用スペクトルを分離した後のスペクトルに、加工された非分析用スペクトルを加算することにより、前記仮想スペクトルを生成する
ことを特徴とする請求項2に記載のデータ生成方法。
【請求項6】
複数の原スペクトルを取得し、
前記複数の原スペクトルから分離した複数の非分析用スペクトルを、複数の波数範囲に含まれる複数の分割スペクトルに分割し、複数の非分析用スペクトルの間で互いに前記分割スペクトルを組み合わせることによって、非分析用スペクトルを加工し、
前記原スペクトルから非分析用スペクトルを分離した後のスペクトルに、加工された非分析用スペクトルを加算することにより、前記仮想スペクトルを生成する
ことを特徴とする請求項2に記載のデータ生成方法。
【請求項7】
前記原スペクトルから特定の周波数帯域を有する成分を分離することにより、前記原スペクトルから非分析用スペクトルを分離する
ことを特徴とする請求項2乃至6のいずれか一つに記載のデータ生成方法。
【請求項8】
前記原スペクトルはラマンスペクトルであり、前記分析用スペクトルは、ラマンスペクトルに含まれるラマン散乱光に起因する成分であり、前記非分析用スペクトルは、ラマンスペクトルに含まれる蛍光スペクトルである
ことを特徴とする請求項1乃至7のいずれか一つに記載のデータ生成方法。
【請求項9】
前記原スペクトルに前記非分析用スペクトルを加算したスペクトルに対して、ノイズスペクトルを加算することによって、前記仮想スペクトルを生成する
ことを特徴とする請求項1乃至8のいずれか一つに記載のデータ生成方法。
【請求項10】
特定の周波数帯域を有するノイズスペクトルを前記原スペクトルから分離し、
前記原スペクトルから前記ノイズスペクトルを分離し前記非分析用スペクトルを加算したスペクトルに対して、前記特定の周波数帯域を有し、前記原スペクトルから分離したノイズスペクトルとは異なるノイズスペクトルを加算することによって、前記仮想スペクトルを生成する
ことを特徴とする請求項8に記載のデータ生成方法。
【請求項11】
請求項1乃至10のいずれか一つに記載のデータ生成方法により生成した訓練データを取得し、
前記訓練データを用いた学習により、試料から得られたスペクトルを入力した場合に前記試料の分析結果を出力する学習モデルを生成する
ことを特徴とする学習モデル生成方法。
【請求項12】
試料から得られたスペクトルを入力した場合に前記試料の分析結果を出力する学習モデルを学習させるための訓練データを生成する処理を、コンピュータに実行させるコンピュータプログラムであって、
試料から得られるスペクトルである原スペクトルを取得し、
前記原スペクトルと、前記原スペクトルに含まれる前記試料の分析の根拠となる分析用スペクトルとは異なる非分析用スペクトルとを用いて、前記原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルを含み前記原スペクトルと形状が異なる複数の仮想スペクトルを生成し、
夫々に前記仮想スペクトルと前記試料の分析結果とを関連付けた複数のデータセットを含む訓練データを生成する
処理をコンピュータに実行させることを特徴とするコンピュータプログラム。
【請求項13】
試料から得られたスペクトルを入力した場合に前記試料の分析結果を出力する学習モデルを学習させるための訓練データを生成する処理を行う情報処理装置であって、
試料から得られるスペクトルである原スペクトルを取得するスペクトル取得部と、
前記原スペクトルと、前記原スペクトルに含まれる前記試料の分析の根拠となる分析用スペクトルとは異なる非分析用スペクトルとを用いて、前記原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルを含み前記原スペクトルと形状が異なる複数の仮想スペクトルを生成する仮想スペクトル生成部と、
夫々に前記仮想スペクトルと前記試料の分析結果とを関連付けた複数のデータセットを含む訓練データを生成するデータ生成部とを備える
ことを特徴とする情報処理装置。
【請求項14】
試料の分析を行う分析装置において、
試料で発生した物理現象を測定し、測定した物理現象の特徴を表すスペクトルを生成する測定装置と、
情報処理装置とを備え、
前記情報処理装置は、
前記測定装置が生成した原スペクトルと、前記原スペクトルに含まれる前記試料の分析の根拠となる分析用スペクトルとは異なる非分析用スペクトルとを用いて、前記原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルを含み前記原スペクトルと形状が異なる複数の仮想スペクトルを生成する仮想スペクトル生成部と、
夫々に前記仮想スペクトルと前記試料の分析結果とを関連付けた複数のデータセットを含む訓練データを生成するデータ生成部と
を有することを特徴とする分析装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習のためにスペクトルを含む訓練データを生成するデータ生成方法、学習モデル生成方法、コンピュータプログラム、情報処理装置及び分析装置に関する。
【背景技術】
【0002】
試料からもたらされた信号のスペクトルを取得し、取得したスペクトルに基づいて試料を分析することが行われている。例えば、蛍光X線スペクトルに基づいて、試料に含まれる成分を同定することが行われる。例えば、細胞等の試料からのラマン散乱光を測定し、ラマンスペクトルに基づいて試料の種類を判定することが行われる。スペクトルに基づいて試料の分析結果を得る方法として、スペクトルを入力した場合に分析結果を出力するように学習された学習モデルを用いる方法がある。学習された学習モデルを得るためには、スペクトルと正しい分析結果とを含む訓練データを用いて、機械学習を行う必要がある。機械学習を行うためには、スペクトルと分析結果との組み合わせを多数含んだ訓練データが必要である。しかし、実際に測定を行うことにより多数のスペクトルを取得することは困難である。特許文献1には、乱数を利用して発生させたランダムノイズをスペクトルに重畳させることにより、訓練データに含まれる複数のスペクトルを少数のスペクトルから生成することが記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
信頼性の高い分析結果を出力する学習モデルを生成するためには、スペクトルと分析結果との組み合わせをできるだけ多く含んだ訓練データが必要となる。ランダムノイズをスペクトルに重畳させるだけでは、生成されるスペクトルの数は不十分である。訓練データを生成するために、より多くのスペクトルを少数のスペクトルから生成する技術が求められている。
【0005】
本発明は、斯かる事情に鑑みてなされたものであって、その目的とするところは、少数のスペクトルから多数のスペクトルを生成することにより、多数のスペクトルを含む訓練データを生成するデータ生成方法、学習モデル生成方法、コンピュータプログラム、情報処理装置及び分析装置を提供することにある。
【課題を解決するための手段】
【0006】
本発明の一形態に係るデータ生成方法は、試料から得られたスペクトルを入力した場合に前記試料の分析結果を出力する学習モデルを学習させるための訓練データを生成するデータ生成方法であって、試料から得られるスペクトルである原スペクトルを取得し、前記原スペクトルと、前記原スペクトルに含まれる前記試料の分析の根拠となる分析用スペクトルとは異なる非分析用スペクトルとを用いて、前記原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルを含み前記原スペクトルと形状が異なる複数の仮想スペクトルを生成し、夫々に前記仮想スペクトルと前記試料の分析結果とを関連付けた複数のデータセットを含む訓練データを生成することを特徴とする。
【0007】
本発明の一形態においては、原スペクトルと、試料の分析の根拠となる分析用スペクトルとは異なる非分析用スペクトルとを用いて、仮想スペクトルを生成し、仮想スペクトルを含む訓練データを生成する。仮想スペクトルは、原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルを含んでおり、原スペクトルとは形状が異なるスペクトルである。原スペクトルに非分析用スペクトルを加算する等、互いに異なる複数の非分析用スペクトルを利用した処理により、少数の原スペクトルから多数の仮想スペクトルを生成することができる。非分析用スペクトルは分析結果にほぼ影響しないので、仮想スペクトルと試料の分析結果とを関連付けることができ、多数のスペクトルを含んだ訓練データを生成することができる。
【0008】
本発明の一形態に係るデータ生成方法は、前記原スペクトルから非分析用スペクトルを分離し、前記原スペクトルから非分析用スペクトルを分離した後のスペクトルに、前記原スペクトルから分離した非分析用スペクトルとは異なる非分析用スペクトルを加算することにより、前記仮想スペクトルを生成することを特徴とする。
【0009】
本発明の一形態においては、原スペクトルから非分析用スペクトルを分離し、他の非分析用スペクトルを加算することにより、仮想スペクトルを生成する。仮想スペクトルに含まれる非分析用スペクトルは、原スペクトルに含まれる非分析用スペクトルと異なるので、仮想スペクトルは原スペクトルとは異なるスペクトルとなる。
【0010】
本発明の一形態に係るデータ生成方法は、前記原スペクトルから分離した非分析用スペクトルに対して、所定値の加算、波数のシフト、又は非分析用スペクトルに含まれる特定の値を中心とした値の反転を行うことにより、非分析用スペクトルを加工し、前記原スペクトルから非分析用スペクトルを分離した後のスペクトルに、加工された非分析用スペクトルを加算することにより、前記仮想スペクトルを生成することを特徴とする。
【0011】
本発明の一形態においては、非分析用スペクトルに加工を行い、原スペクトルから非分析用スペクトルを分離した後のスペクトルに、加工された非分析用スペクトルを加算することにより、仮想スペクトルを生成する。所定値の加算、波数のシフト、又は値の反転等の加工を行うことにより、少数の非分析用スペクトルから互いに異なる多数の加工された非分析用スペクトルを生成することができる。このため、多数の加工された非分析用スペクトルを用いて、原スペクトルとは異なる多数の仮想スペクトルを生成することができる。
【0012】
本発明の一形態に係るデータ生成方法は、複数の原スペクトルを取得し、一の原スペクトルから非分析用スペクトルを分離した後のスペクトルに、他の原スペクトルから分離した非分析用スペクトルを加算することにより、前記仮想スペクトルを生成することを特徴とする。
【0013】
本発明の一形態においては、一の原スペクトルから非分析用スペクトルを分離した後のスペクトルに、他の原スペクトルから分離した非分析用スペクトルを加算することにより、仮想スペクトルを生成する。実際の測定により得られる非分析用スペクトルを用いることにより、現実のスペクトルに近い仮想スペクトルが得られる。現実のスペクトルを含んだ訓練データに近い訓練データが得られ、現実のスペクトルに応じて精度の良い出力を行う学習モデルを機械学習により生成することが可能となる。
【0014】
本発明の一形態に係るデータ生成方法は、複数の原スペクトルを取得し、前記複数の原スペクトルから分離した複数の非分析用スペクトルを互いに加算することにより、非分析用スペクトルを加工し、前記原スペクトルから非分析用スペクトルを分離した後のスペクトルに、加工された非分析用スペクトルを加算することにより、前記仮想スペクトルを生成することを特徴とする。
【0015】
本発明の一形態においては、複数の非分析用スペクトルを互いに加算することにより、非分析用スペクトルに加工を行う。実際の測定により得られる複数の非分析用スペクトルを用いることにより、現実のスペクトルに近い仮想スペクトルが得られる。また、複数の非分析用スペクトルを加算する方法を変更することにより、多数の加工された非分析用スペクトルを生成し、多数の仮想スペクトルを生成することができる。
【0016】
本発明の一形態に係るデータ生成方法は、複数の原スペクトルを取得し、前記複数の原スペクトルから分離した複数の非分析用スペクトルを、複数の波数範囲に含まれる複数の分割スペクトルに分割し、複数の非分析用スペクトルの間で互いに前記分割スペクトルを組み合わせることによって、非分析用スペクトルを加工し、前記原スペクトルから非分析用スペクトルを分離した後のスペクトルに、加工された非分析用スペクトルを加算することにより、前記仮想スペクトルを生成することを特徴とする。
【0017】
本発明の一形態においては、非分析用スペクトルを複数の波数範囲に含まれる複数の分割スペクトルに分割し、複数の非分析用スペクトルの間で分割スペクトルを互いに組み合わせることにより、非分析用スペクトルに加工を行う。複数の分割スペクトルを種々の方法で組み合わせることによって、多数の加工された非分析用スペクトルを生成し、多数の仮想スペクトルを生成することができる。
【0018】
本発明の一形態に係るデータ生成方法は、前記原スペクトルから特定の周波数帯域を有する成分を分離することにより、前記原スペクトルから非分析用スペクトルを分離することを特徴とする。
【0019】
本発明の一形態においては、周波数分離によって、原スペクトルから非分析用スペクトルを分離する。試料の分析結果の根拠になる分析用スペクトルとは周波数帯域が異なる非分析用スペクトルを、容易に分離することができる。
【0020】
本発明の一形態に係るデータ生成方法は、前記原スペクトルはラマンスペクトルであり、前記分析用スペクトルは、ラマンスペクトルに含まれるラマン散乱光に起因する成分であり、前記非分析用スペクトルは、ラマンスペクトルに含まれる蛍光スペクトルであることを特徴とする。
【0021】
本発明の一形態においては、原スペクトルはラマンスペクトルであり、分析用スペクトルはラマンスペクトル中のラマン散乱光に起因する成分であり、非分析用スペクトルは蛍光スペクトルである。実際の測定により得られる蛍光スペクトルを非分析用スペクトルとすることにより、現実のスペクトルに近い仮想スペクトルが得られる。学習モデルを利用して、ラマンスペクトルに基づいた試料の分析結果を容易に得ることが可能となる。
【0022】
本発明の一形態に係るデータ生成方法は、前記原スペクトルに前記非分析用スペクトルを加算したスペクトルに対して、ノイズスペクトルを加算することによって、前記仮想スペクトルを生成することを特徴とする。
【0023】
本発明の一形態においては、原スペクトルに非分析用スペクトルを加算したスペクトルにノイズスペクトルを加算することにより、仮想スペクトルを生成する。ノイズスペクトルを加算することによって、より多数の仮想スペクトルを生成することができる。
【0024】
本発明の一形態に係るデータ生成方法は、特定の周波数帯域を有するノイズスペクトルを前記原スペクトルから分離し、前記原スペクトルから前記ノイズスペクトルを分離し前記非分析用スペクトルを加算したスペクトルに対して、前記特定の周波数帯域を有し、前記原スペクトルから分離したノイズスペクトルとは異なるノイズスペクトルを加算することによって、前記仮想スペクトルを生成することを特徴とする。
【0025】
本発明の一形態においては、原スペクトルから特定の周波数帯域を有するノイズスペクトルを分離し、仮想スペクトルを生成する際に、同一の周波数帯域を有するノイズスペクトルの加算を行う。ノイズスペクトルの周波数帯域が変わらないので、分析結果に影響を及ぼさずに、多数の仮想スペクトルを生成することができる。
【0026】
本発明の一形態に係る学習モデル生成法は、本発明に係るデータ生成方法により生成した訓練データを取得し、前記訓練データを用いた学習により、試料から得られたスペクトルを入力した場合に前記試料の分析結果を出力する学習モデルを生成することを特徴とする。
【0027】
本発明の一形態においては、訓練データを用いた学習により、スペクトルを入力した場合に試料の分析結果を出力する学習モデルを生成する。訓練データには、スペクトルと試料の分析結果との組み合わせが多数含まれているので、機械学習によって、スペクトルに応じて精度の良い分析結果を出力する学習モデルを生成することができる。
【0028】
本発明の一形態に係るコンピュータプログラムは、試料から得られたスペクトルを入力した場合に前記試料の分析結果を出力する学習モデルを学習させるための訓練データを生成する処理を、コンピュータに実行させるコンピュータプログラムであって、試料から得られるスペクトルである原スペクトルを取得し、前記原スペクトルと、前記原スペクトルに含まれる前記試料の分析の根拠となる分析用スペクトルとは異なる非分析用スペクトルとを用いて、前記原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルを含み前記原スペクトルと形状が異なる複数の仮想スペクトルを生成し、夫々に前記仮想スペクトルと前記試料の分析結果とを関連付けた複数のデータセットを含む訓練データを生成する処理をコンピュータに実行させることを特徴とする。
【0029】
本発明の一形態に係る情報処理装置は、試料から得られたスペクトルを入力した場合に前記試料の分析結果を出力する学習モデルを学習させるための訓練データを生成する処理を行う情報処理装置であって、試料から得られるスペクトルである原スペクトルを取得するスペクトル取得部と、前記原スペクトルと、前記原スペクトルに含まれる前記試料の分析の根拠となる分析用スペクトルとは異なる非分析用スペクトルとを用いて、前記原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルを含み前記原スペクトルと形状が異なる複数の仮想スペクトルを生成する仮想スペクトル生成部と、夫々に前記仮想スペクトルと前記試料の分析結果とを関連付けた複数のデータセットを含む訓練データを生成するデータ生成部とを備えることを特徴とする。
【0030】
本発明の一形態においては、情報処理装置(コンピュータ)によって、原スペクトルと、非分析用スペクトルとを用いて、仮想スペクトルを生成し、仮想スペクトルを含む訓練データを生成する。原スペクトルに非分析用スペクトルを加算する等、複数の非分析用スペクトルを利用した処理により、多数の仮想スペクトルを生成することができる。仮想スペクトルと試料の分析結果とを関連付けることができ、多数のスペクトルを含んだ訓練データを生成することができる。
【0031】
本発明の一形態に係る分析装置は、試料の分析を行う分析装置において、試料で発生した物理現象を測定し、測定した物理現象の特徴を表すスペクトルを生成する測定装置と、情報処理装置とを備え、前記情報処理装置は、前記測定装置が生成した原スペクトルと、前記原スペクトルに含まれる前記試料の分析の根拠となる分析用スペクトルとは異なる非分析用スペクトルとを用いて、前記原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルを含み前記原スペクトルと形状が異なる複数の仮想スペクトルを生成する仮想スペクトル生成部と、夫々に前記仮想スペクトルと前記試料の分析結果とを関連付けた複数のデータセットを含む訓練データを生成するデータ生成部とを有することを特徴とする。
【0032】
本発明の一形態においては、分析装置は測定装置と分析装置とを備える。測定装置は原スペクトルを生成し、情報処理装置は、原スペクトルから仮想スペクトルを生成し、訓練データを生成する。測定装置が生成した原スペクトから、多数の仮想スペクトルを生成することができる。測定装置で生成できる限られた数の原スペクトルから、多数のスペクトルを含んだ訓練データを生成することができる。
【発明の効果】
【0033】
本発明にあっては、多数のスペクトルを含んだ訓練データを生成することができる。このため、訓練データを用いた機械学習により、スペクトルを入力した場合に分析結果を出力するように学習された学習モデルを生成することができる等、本発明は優れた効果を奏する。
【図面の簡単な説明】
【0034】
【
図1】分析装置の構成例を示し、測定装置の構成例を示すブロック図である。
【
図2】情報処理装置の機能構成例を示すブロック図である。
【
図4】訓練データを生成する処理の手順の例を示すフローチャートである。
【
図5】原スペクトルから分析用スペクトル、非分析用スペクトル及びノイズスペクトルを分離する方法の例を示す概念図である。
【
図6】分析用スペクトルに加算するための複数の非分析用スペクトルを生成した例を示す概念図である。
【
図7】原スペクトルから複数の仮想スペクトルを生成した例を示す概念図である。
【
図8】学習モデルを生成する処理の手順を示すフローチャートである。
【
図9】学習モデルを用いて試料3の分析を行う処理の手順を示すフローチャートである。
【発明を実施するための形態】
【0035】
以下本発明をその実施の形態を示す図面に基づき具体的に説明する。
本実施形態においては、試料から得られたスペクトルに応じた分析結果を出力する学習モデルを機械学習によって生成するために、訓練データを生成する。
図1は、分析装置100の構成例を示し、測定装置2の構成例を示すブロック図である。分析装置100は、試料の分析を行う装置であり、訓練データを生成するための処理を行う。分析装置100は、情報処理装置1及び測定装置2を備えている。測定装置2は、試料に対して光の照射等の何らかの刺激を与え、刺激に応答して試料で発生する物理現象を測定し、測定した物理現象の特徴を表すスペクトルを生成する装置である。例えば、測定装置2は、試料3から発せられた蛍光X線又はラマン散乱光を測定し、蛍光X線スペクトル又はラマンスペクトルを生成する。
図1には、測定装置2がラマン散乱光測定装置である例を示している。情報処理装置1は、訓練データを生成するデータ生成方法を実行する。情報処理装置1は、測定装置2に接続されている。
【0036】
本実施形態では、主に、測定装置2がラマン散乱光測定装置である例を示す。測定装置2は、試料3を保持する試料保持部25と、レーザー光を照射する照射部21と、ビームスプリッタ242と、レンズ243とを備えている。例えば、試料3は細胞等の生体試料である。試料保持部25は、例えば、試料3が載置される試料台である。試料保持部25は試料台以外の形態であってもよい。照射部21はレーザー光源を含んでいる。照射部21が照射するレーザー光は、ビームスプリッタ242で反射し、レンズ243を通り、試料3へ照射される。
【0037】
測定装置2は、更に、マスク241と、分光器23と、光を検出する検出部22と、制御部26とを備えている。マスク241はスリットを有する。試料3中のレーザー光が照射された部分では、ラマン散乱光が発生する。発生したラマン散乱光は、レンズ243で集光され、ビームスプリッタ242を透過し、マスク241のスリットを通過することによって細い光束に絞られ、分光器23へ入射する。
図1中では、レーザー光及びラマン散乱光を実線矢印で示している。分光器23は、入射されたラマン散乱光を分光する。検出部22は、分光器23が分光した夫々の波長の光を検出する。測定装置2は、レーザー光及びラマン散乱光の導光、集光及び分離のためにミラー、レンズ及びフィルタ等の多数の光学部品からなる光学系を備えている。
図1では、マスク241、ビームスプリッタ242及びレンズ243以外の光学系を省略している。なお、測定装置2は、照射部21からのレーザー光がビームスプリッタ242を透過し、ラマン散乱光がビームスプリッタ242で反射する構成であってもよい。光学系は、マスク241、ビームスプリッタ242又はレンズ243を含んでいなくてもよい。
【0038】
照射部21、検出部22及び分光器23は、制御部26に接続されている。制御部26は、情報処理装置1に接続されている。制御部26は、測定装置2の各部を制御するための演算を実行する演算部と、メモリとを含み、情報処理装置1とデータの送受信を行う通信部を含んでいる。
【0039】
制御部26は、測定装置2の各部を制御する。照射部21は、オンとオフとを制御部26に制御される。分光器23は、分光して検出部22に検出させる光の波長を制御部26に制御される。検出部22は、検出された夫々の波長の光の強度に応じた信号を制御部26へ出力する。制御部26は、検出部22が出力した信号を入力され、分光器23に分光させた光の波数と入力された信号が示す光の強度とに基づいてラマンスペクトルを生成する。ラマンスペクトルは、光の波数と検出された光の強度とが関連付けられたデータである。光の強度は、波数ではなく、光の波長又はエネルギーに関連付けられていてもよい。
【0040】
制御部26は、ラマン散乱光を測定する際の測定条件を調整することができる。測定条件は、例えば、試料3へ照射されるレーザー光の強度、照射時間、ラマン散乱光の強度の積算回数、レーザー光が通過するスリットの幅、レーザー光の波長、又は焦点距離を含む。例えば、制御部26は、照射部21が含むレーザー光源の出力を変更することにより、レーザー光の強度を調整する。例えば、制御部26は、レーザー光源へ注入するエネルギーを調整することにより、レーザー光源の出力を変更する。レーザー光を減衰させるフィルタを用いてレーザー光の強度を調整してもよい。例えば、制御部26は、分光器23に分光させる光の波長を変更しながら検出部22が検出した各波長のラマン散乱光の強度を計測し、各波長について検出を繰り返し、計測したラマン散乱光の強度を積算する回数を調整する。
【0041】
例えば、マスク241は幅の異なる複数のスリットを有しており、制御部26は、レーザー光が通過するスリットを変更することにより、スリットの幅を調整する。例えば、照射部21は波長の異なる複数のレーザー光源を含んでおり、制御部26は、使用するレーザー光源を変更することにより、レーザー光の波長を調整する。例えば、測定装置2は焦点距離の異なる複数のレンズ243を備えており、制御部26は、使用するレンズ243を変更することにより、焦点距離を調整する。測定装置2は、焦点距離を調整する際に、光学系を構成する各部品の位置の変更、又は試料保持部25の位置の変更を行う形態であってもよい。
【0042】
図2は、情報処理装置1の機能構成例を示すブロック図である。情報処理装置1は、パーソナルコンピュータ又はサーバ装置等のコンピュータを用いて構成されている。情報処理装置1は、演算部11と、メモリ12と、ドライブ部13と、記憶部14と、操作部15と、表示部16と、通信部17とを備えている。演算部11は、例えばCPU(Central Processing Unit )、GPU(Graphics Processing Unit)、又はマルチコアCPUを用いて構成されている。演算部11は、量子コンピュータを用いて構成されていてもよい。メモリ12は、演算に伴って発生する一時的なデータを記憶する。メモリ12は、例えばRAM(Random Access Memory)である。ドライブ部13は、光ディスク又は可搬型メモリ等の記録媒体10から情報を読み取る。記憶部14は、不揮発性であり、例えばハードディスク又は不揮発性半導体メモリである。
【0043】
演算部11は、記録媒体10に記録されたコンピュータプログラム141をドライブ部13に読み取らせ、読み取ったコンピュータプログラム141を記憶部14に記憶させる。演算部11は、コンピュータプログラム141に従って、情報処理装置1に必要な処理を実行する。コンピュータプログラム141はコンピュータプログラム製品であってもよい。コンピュータプログラム141は、情報処理装置1の外部からダウンロードされてもよい。又は、コンピュータプログラム141は、情報処理装置1に予め記憶されていてもよい。これらの場合は、情報処理装置1はドライブ部13を備えていなくてもよい。
【0044】
操作部15は、使用者からの操作を受け付けることにより、テキスト等の情報の入力を受け付ける。操作部15は、例えばタッチパネル、ペンタブレット、キーボード又はポインティングデバイスである。表示部16は、画像を表示する。表示部16は、例えば液晶ディスプレイ又はELディスプレイ(Electroluminescent Display)である。操作部15及び表示部16は、一体になっていてもよい。通信部17は、測定装置2と接続されている。通信部17は、インターネット又はLAN等の通信ネットワークを介して測定装置2と接続されていてもよい。通信部17は、測定装置2との間でデータの送受信を行う。
【0045】
情報処理装置1は、複数のコンピュータにより構成され、データが複数のコンピュータによって分散して記憶されていてもよく、処理が複数のコンピュータによって分散して実行されてもよい。情報処理装置1は、クラウドコンピューティングを利用して実現されてもよく、一台のコンピュータ内に設けられた複数の仮想マシンによって実現されてもよい。
【0046】
情報処理装置1は、学習モデル142を備えている。学習モデル142は、コンピュータプログラム141に従って演算部11が情報処理を実行することにより実現される。例えば、記憶部14は、学習モデル142のパラメータを記録したデータを記憶し、演算部11は、パラメータを用いて、コンピュータプログラム141に従った情報処理を実行することにより、学習モデル142を実現する。学習モデル142は、ハードウェアにより構成されていてもよい。学習モデル142は、量子コンピュータを用いて実現されてもよい。或は、学習モデル142は情報処理装置1の外部に設けられており、情報処理装置1は、外部の学習モデル142を利用して処理を実行する形態であってもよい。
【0047】
図3は、学習モデル142の機能を示す概念図である。学習モデル142は、試料3から得られたスペクトルが入力された場合に試料3の分析結果を出力するように、学習される。本実施形態の例では、学習モデル142へ入力されるスペクトルは、ラマンスペクトルである。試料3の分析結果は、例えば、生体試料である試料3に含まれる細胞の種類である。例えば、試料3の分析結果は、試料3に含まれる元素又は化合物の種類である。例えば、学習モデル142は、ニューラルネットワーク又はサポートベクターマシンを用いて構成されている。
【0048】
測定装置2は、試料3から発生したラマン散乱光を検出し、ラマンスペクトルを生成する。制御部26は、生成したラマンスペクトルを情報処理装置1へ入力する。情報処理装置1は、通信部17で入力されたラマンスペクトルを受け付け、演算部11は、受け付けたラマンスペクトルを記憶部14に記憶する。測定装置2は、測定条件を変更し、夫々の測定条件の下でラマンスペクトルを生成する。例えば、測定装置2は、測定条件として、レーザー光の強度、照射時間、積算回数、スリットの幅、レーザー光の波長、又は焦点距離を変更する。測定装置2は、夫々の測定条件の下で生成したラマンスペクトルを情報処理装置1へ入力し、情報処理装置1は、夫々のラマンスペクトルを記憶部14に記憶する。また、試料3が変更され、測定装置2は、複数の試料3に係る複数のラマンスペクトルを生成し、情報処理装置1は、複数のラマンスペクトルを記憶部14に記憶する。
【0049】
情報処理装置1は、ラマンスペクトルに基づいて、試料3に含まれる細胞の種類の判定等、試料3の分析を行う。情報処理装置1は、試料3の分析結果をラマンスペクトルに関連付けて記憶部14に記憶する。又は、情報処理装置1は、操作部15を使用者が操作することにより、ラマンスペクトルに基づいた試料3の分析結果を受け付ける。情報処理装置1は、受け付けた試料3の分析結果をラマンスペクトルに関連付けて記憶部14に記憶する。
【0050】
情報処理装置1は、学習モデル142の学習を行うために必要な訓練データを生成する処理を行う。
図4は、訓練データを生成する処理の手順の例を示すフローチャートである。以下、ステップをSと略す。情報処理装置1の演算部11は、コンピュータプログラム141に従って処理を実行する。
【0051】
情報処理装置1は、測定装置2によって生成されたスペクトルである原スペクトルを取得する(S11)。前述したように、測定装置2は、ラマン散乱光を測定し、ラマンスペクトルを情報処理装置1へ入力する。S11では、情報処理装置1は、ラマンスペクトルを通信部17で受け付け、演算部11は、受け付けたラマンスペクトルを記憶部14に記憶することにより、原スペクトルを取得する。本実施形態の例では、原スペクトルは、測定装置2が生成したラマンスペクトルである。また、原スペクトルに関連付けて、試料3の分析結果が記憶部14に記憶される。
【0052】
情報処理装置1には、複数の測定装置2が接続されていてもよい。情報処理装置1は、複数の測定装置2から原スペクトルを取得してもよい。情報処理装置1は、接続された測定装置2が生成した原スペクトル以外の原スペクトルを取得してもよい。例えば、接続された測定装置2以外の測定装置で原スペクトルが生成され、情報処理装置1へ入力されてもよい。S11では、情報処理装置1は、複数の原スペクトルを取得し、記憶部14に記憶する。S11の処理は、スペクトル取得部に対応する。
【0053】
情報処理装置1は、次に、複数の原スペクトルを正規化する(S12)。S12では、演算部11は、特定の波数での光の強度が同一になるように、正規化を行う。例えば、演算部11は、特定の波数での光の強度で、他の波数での光の強度を除算することにより、正規化を行う。
【0054】
情報処理装置1は、正規化後の原スペクトルから、分析用スペクトル、非分析用スペクトル及びノイズスペクトルを分離する(S13)。測定装置2が測定する光には、ラマン散乱光以外の光も含まれており、原スペクトルには、ラマン散乱光以外の光に起因する成分が含まれている。分析用スペクトルは、試料3の分析結果の根拠になるスペクトルであり、原スペクトルに含まれている成分の中でラマン散乱光に起因する成分である。非分析用スペクトルは、分析用スペクトルとは異なるスペクトルであり、原スペクトルに含まれている成分の中でラマン散乱光以外の光に起因する成分である。例えば、測定装置2が測定する光には蛍光が含まれ、ラマンスペクトルには蛍光スペクトルが含まれており、非分析用スペクトルは蛍光スペクトルである。非分析用スペクトルは、試料3の分析結果にはほぼ影響しない。
【0055】
図5は、原スペクトルから分析用スペクトル、非分析用スペクトル及びノイズスペクトルを分離する方法の例を示す概念図である。S13では、情報処理装置1は、原スペクトルから特定の周波数帯域を有する成分を分離する周波数分離を行う。
図5に示すスペクトルの横軸は波数を示し、縦軸は信号の強度を示す。周波数分離によって、分析用スペクトルとは周波数帯域が異なる非分析用スペクトルを、容易に分離することができる。
【0056】
演算部11は、第1閾値以下の周波数の成分を原スペクトルから分離する第1の周波数分離を行うことにより、第1閾値以下の周波数の成分からなる非分析用スペクトルを原スペクトルから分離する。第1の周波数分離では、第1閾値未満の周波数の成分を分離してもよい。第1閾値は、分析用スペクトルの周波数帯域よりも低い周波数の値に予め定められている。第1閾値は、記憶部14に予め記憶されているか、又はコンピュータプログラム141に含まれている。蛍光スペクトルは、ラマン散乱光に起因する成分に比べて、低い周波数帯域を有する成分であり、第1の周波数分離によって原スペクトルから分離できる。
【0057】
更に、演算部11は、非分析用スペクトルを分離した後のスペクトルから、第2閾値以下の周波数の成分を分離する第2の周波数分離を行うことにより、分析用スペクトル及びノイズスペクトルを分離する。第2閾値は、第1閾値を超過し、分析用スペクトルの周波数帯域よりも高い周波数の値に予め定められている。第2閾値は、記憶部14に予め記憶されているか、又はコンピュータプログラム141に含まれている。分離された第2閾値以下の周波数の成分は、分析用スペクトルである。即ち、分析用スペクトルは、第1閾値から第2閾値までの範囲の周波数成分からなる。第2閾値を超過する周波数の成分は、ノイズスペクトルである。第2の周波数分離では、第2閾値未満の周波数の成分を分離してもよい。
【0058】
例えば、演算部11は、FFT(fast Fourier transform)及び逆FFTを実行して、第1の周波数分離及び第2の周波数分離を行う。演算部11は、原スペクトルから分離した分析用スペクトル、非分析用スペクトル及びノイズスペクトルを記憶部14に記憶する。なお、情報処理装置1は、カットオフ周波数を第1閾値とした第1のLPF(Low-pass filter )と、カットオフ周波数を第2閾値とした第2のLPFとを備えていてもよい。この形態では、情報処理装置1は、第1のLPFを用いて第1の周波数分離を実行し、第2のLPFを用いて第2の周波数分離を実行する。訓練データを生成する処理では、分析用スペクトルに非分析用スペクトルを加算することによって、訓練データに含まれるスペクトルを生成する。
【0059】
情報処理装置1は、次に、分析用スペクトルに加算するための複数の非分析用スペクトルを生成する(S14)。S14では、例えば、演算部11は、一の原スペクトルから分離した分析用スペクトルに加算するための非分析用スペクトルとして、他の原スペクトルから分離した非分析用スペクトルを用いる。
【0060】
又は、演算部11は、非分析用スペクトルを加工し、加工された非分析用スペクトルを、分析用スペクトルに加算するための非分析用スペクトルとする。例えば、演算部11は、複数の原スペクトルから分離した複数の非分析用スペクトルを互いに加算することにより、非分析用スペクトルを加工する。このとき、演算部11は、加算する非分析用スペクトルの一方又は両方に正又は負の特定値を乗じた上で加算を行う。このように、加算には、正又は負の値を乗じた上で加算することも含まれる。演算部11は、三個以上の非分析用スペクトルを加算することにより、非分析用スペクトルを加工してもよい。演算部11は、原スペクトルから分離した非分析用スペクトルに、他の方法で得られた非分析用スペクトルを加算してもよい。例えば、蛍光を測定する測定装置により生成された蛍光スペクトルが加算される。例えば、理論的に生成された蛍光スペクトルが加算される。複数の非分析用スペクトルを加算する方法を変更することにより、多数の加工された非分析用スペクトルを生成することができる。
【0061】
例えば、演算部11は、非分析用スペクトルに正又は負の所定値を加算することにより、非分析用スペクトルを加工する。例えば、演算部11は、波数のシフトを行うことにより、非分析用スペクトルを加工する。波数のシフトでは、非分析用スペクトルに含まれる光の強度が関連付けられる波数を、元の波数から所定量シフトした他の波数へ変更する。例えば、演算部11は、非分析用スペクトルに含まれる特定の値を中心とした横軸方向又は縦軸方向の反転を行うことにより、非分析用スペクトルを加工する。横軸方向の反転では、特定の波数との差の絶対値が等しい二つの波数に関連付けられた光の強度の値を入れ替える。縦軸方向の反転では、夫々の波数に関連付けられた光の強度に、当該強度の値を特定の強度の値から減算して得られた値の二倍の値を加算する。少数の非分析用スペクトルから、互いに異なる多数のスペクトルを生成することができる。
【0062】
例えば、演算部11は、非分析用スペクトルを横軸方向に複数の分割スペクトルに分割し、複数の非分析用スペクトルの間で互いに分割スペクトルを組み合わせることによって、非分析用スペクトルを加工する。即ち、演算部11は、非分析用スペクトル全体の波数を複数の波数範囲に分割し、夫々の波数範囲に含まれる分割スペクトルに非分析用スペクトルを分割する。例えば、演算部11は、非分析用スペクトルに含まれる一部の分割スペクトルを、他の非分析用スペクトルに含まれる分割スペクトルと交換する。例えば、演算部11は、複数の非分析用スペクトルから抽出した複数の分割スペクトルをランダムに組み合わせる。複数の分割スペクトルを種々の方法で組み合わせることによって、多数の加工された非分析用スペクトルを生成することができる。原スペクトルの横軸が、波長又はエネルギー等の波数以外の物理量で表されている場合であっても、演算部11は、同様にして、非分析用スペクトルを加工する。
【0063】
S14では、演算部11は、他の方法で得られた非分析用スペクトルを、分析用スペクトルに加算するための非分析用スペクトルとしてもよい。例えば、演算部11は、蛍光を測定する測定装置により生成された蛍光スペクトルを、分析用スペクトルに加算するための非分析用スペクトルとしてもよい。例えば、演算部11は、理論的に生成された蛍光スペクトルを、分析用スペクトルに加算するための非分析用スペクトルとしてもよい。
【0064】
図6は、分析用スペクトルに加算するための複数の非分析用スペクトルを生成した例を示す概念図である。原スペクトルから分離した非分析用スペクトル41に対して、分析用スペクトルに加算するための複数の非分析用スペクトル42が生成される。他の原スペクトルから分離した非分析用スペクトル42、非分析用スペクトル41に所定値を加算した非分析用スペクトル42、複数の非分析用スペクトル41を加算した非分析用スペクトル42、非分析用スペクトル41をシフトした非分析用スペクトル42、及び非分析用スペクトル41を反転した非分析用スペクトル42等、互いに異なる多数の非分析用スペクトル41が生成される。
【0065】
情報処理装置1は、次に、分析用スペクトルに加算するための複数のノイズスペクトルを生成する(S15)。S15では、例えば、演算部11は、一の原スペクトルから分離した分析用スペクトルに加算するためのノイズスペクトルとして、他の原スペクトルから分離したノイズスペクトルを用いる。これにより、分析用スペクトルに加算するためのノイズスペクトルは、原スペクトルから分離したノイズスペクトルと同じ周波数帯域を有する。又は、演算部11は、原スペクトルから分離したノイズスペクトルと同じ周波数帯域を有するノイズスペクトルを生成し、生成したノイズスペクトルを、分析用スペクトルに加算するためのノイズスペクトルとする。
【0066】
情報処理装置1は、次に、分析用スペクトルに、生成された非分析用スペクトル及びノイズスペクトルを加算することにより、複数の仮想スペクトルを生成する(S16)。仮想スペクトルは、原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルを含んでおり、原スペクトルとは形状が異なるスペクトルである。S16では、演算部11は、分析用スペクトルに、生成した複数の非分析用スペクトルの何れかを加算し、生成した複数のノイズスペクトルのいずれかを加算することにより、仮想スペクトルを生成する。演算部11は、分析用スペクトル、非分析用スペクトル及びノイズスペクトルの組み合わせを変更して加算を繰り返すことにより、複数の仮想スペクトルを生成する。分析用スペクトルには、複数の非分析用スペクトル又は複数のノイズスペクトルが加算されてもよい。演算部11は、ノイズスペクトルの分離又は加算を行わずに仮想スペクトルを生成してもよい。
【0067】
図7は、原スペクトルから複数の仮想スペクトルを生成した例を示す概念図である。S12~S16の処理により、当初の少数の原スペクトル43から、多数の仮想スペクトル44が生成される。原スペクトル43に対して多数の非分析用スペクトル及びノイズスペクトルの何れかが加算されることにより、多数の仮想スペクトル44が生成される。
【0068】
S12~S16の処理では、原スペクトルから非分析用スペクトルが分離され、異なる非分析用スペクトルが加算されることにより、仮想スペクトルが生成される。原スペクトルから非分析用スペクトルを分離することは、負の値を乗じた非分析用スペクトルを原スペクトルに加算することである。即ち、S12~S16の処理では、原スペクトルに非分析用スペクトルを加算することによって仮想スペクトルが生成される。
【0069】
また、ノイズスペクトルの加算を行うことによって、より多数の仮想スペクトルを生成することができる。原スペクトルからノイズスペクトルを分離し、他のノイズスペクトルの加算を行うことにより、スペクトルに含まれるノイズが変更され、多数の仮想スペクトルを生成することができる。又は、原スペクトルから分離したノイズスペクトルと同一の周波数帯域を有するノイズスペクトルの加算を行うことにより、ノイズスペクトルの周波数帯域を変えずに、多数の仮想スペクトルを生成することができる。加算するノイズスペクトルの周波数帯域が原スペクトルに含まれるノイズスペクトルの周波数帯域と同一であるので、加算するノイズスペクトルは分析結果にほぼ影響を及ぼさない。
【0070】
仮想スペクトルは、原スペクトルであるラマンスペクトルから生成された仮想的なラマンスペクトルである。仮想スペクトルに含まれる非分析用スペクトル又はノイズスペクトルは、原スペクトルに含まれる非分析用スペクトル又はノイズスペクトルと異なっているので、仮想スペクトルと原スペクトルとは形状が異なり、仮想スペクトルは原スペクトルとは異なったスペクトルである。複数の仮想スペクトルは、含まれる非分析用スペクトル又はノイズスペクトルが互いに少しずつ異なっている。複数の仮想スペクトルは、含まれる分析用スペクトルが同一であっても、含まれる非分析用スペクトル又はノイズスペクトルが異なるので、異なったスペクトルとなる。仮想スペクトルには原スペクトルに含まれる分析用スペクトルと同一の分析用スペクトルが含まれ、非分析用スペクトル及びノイズスペクトルは分析結果にほぼ影響しないので、仮想スペクトルに応じた分析結果は、原スペクトルに応じた分析結果と同一である。複数の仮想スペクトルに含まれる分析用スペクトルが同一である場合は、複数の仮想スペクトルに応じた分析結果は同一である。このため、仮想スペクトルと試料3の分析結果とを関連付けることができる。
【0071】
S12~S16の処理は、仮想スペクトル生成部に対応する。情報処理装置1は、S12~S16では、原スペクトルから非分析用スペクトルを分離して他の非分析用スペクトル又はノイズスペクトルを加算する方法以外の方法で、仮想スペクトルを生成してもよい。例えば、演算部11は、原スペクトルから非分析用スペクトルを分離せずに、原スペクトルに他の非分析用スペクトル又はノイズスペクトルを加算することにより、仮想スペクトルを生成してもよい。例えば、演算部11は、分析用スペクトル又は原スペクトルの横軸方向に非分析用スペクトルを繋げることにより、仮想スペクトルを生成してもよい。例えば、演算部11は、原スペクトル又は分析用スペクトルと非分析用スペクトルとを二次元配列にまとめることによって、仮想スペクトルを生成してもよい。
【0072】
情報処理装置1は、次に、夫々に仮想スペクトルと試料3の分析結果とを関連付けた複数のデータセットを含む訓練データを生成する(S17)。S17では、演算部11は、原スペクトルから生成された仮想スペクトルと、当該原スペクトルに関連付けられた試料3の分析結果とを関連付けたデータセットを生成する。演算部11は、複数のデータセットを生成し、複数のデータセットを含む訓練データを生成し、訓練データを記憶部14に記憶する。多数の仮想スペクトルが得られているので、多数のデータセットを含んだ訓練データが得られる。S17の処理は、データ生成部に対応する。S17が終了した後は、情報処理装置1は、訓練データを生成する処理を終了する。
【0073】
以上のS11~S17の処理についての説明では、複数の原スペクトルから多数の仮想スペクトルを生成する例を示したが、S11~S17の処理では、単一の原スペクトルから多数の仮想スペクトルが生成されてもよい。なお、S11~S17の処理は、測定装置2に接続されていない情報処理装置によって実行されてもよい。この形態では、情報処理装置は、原スペクトルと試料3の分析結果とを入力され、入力されたデータを利用してS11~S17の処理を実行する。
【0074】
S11~S17の処理により、当初の少数の原スペクトルから、多数の仮想スペクトルを含んだ訓練データが生成される。生成された訓練データには、多数の仮想スペクトルが含まれており、訓練データを用いて学習モデル142の学習を行うことが可能となる。
【0075】
S11~S17の処理では、仮想スペクトルを生成するために分析用スペクトルに加算する非分析用スペクトルとして、原スペクトルから分離された、実際の測定により得られる非分析用スペクトルを用いることにより、現実のスペクトルに近い仮想スペクトルが得られる。分析用スペクトルに加算する非分析用スペクトルとして、実際の測定により得られる複数の非分析用スペクトルを互いに加算したスペクトルを用いることにより、現実のスペクトルに近い仮想スペクトルが得られる。本実施形態の例では、非分析用スペクトルは、ラマンスペクトルに含まれる蛍光スペクトルである。非分析用スペクトルとして、実際の測定により得られる蛍光スペクトルを用いることにより、現実のラマンスペクトルに近い仮想スペクトルが得られる。
【0076】
現実のスペクトルに近い仮想スペクトルを含んだ訓練データを生成することにより、現実のスペクトルを含んだ訓練データに近い訓練データが生成される。現実のスペクトルを含んだ訓練データに近い訓練データを利用することによって、現実のスペクトルに応じて精度の良い出力を行う学習モデルを機械学習により生成することが可能となる。
【0077】
情報処理装置1は、学習モデル生成方法を実行する。即ち、情報処理装置1は、訓練データを用いた学習により、ラマンスペクトルが入力された場合に試料3の分析結果を出力するように学習された学習モデル142を生成する処理を行う。
図8は、学習モデル142を生成する処理の手順を示すフローチャートである。情報処理装置1は、訓練データを取得する(S21)。S21では、演算部11は、記憶部14に記憶している訓練データを読み出すことにより、訓練データを取得する。又は、情報処理装置1へ訓練データが入力されることにより、情報処理装置1は訓練データを取得する。
【0078】
情報処理装置1は、次に、訓練データを利用して、ラマンスペクトルが入力された場合に試料3の分析結果を出力するように学習された学習モデル142を生成する(S22)。S22では、演算部11は、訓練データに含まれる仮想スペクトルを学習モデル142へ入力し、学習モデル142の学習を行う。
【0079】
学習モデル142は、仮想スペクトルの入力に応じて、演算を行い、試料3の分析結果を出力する。試料3の分析結果は、例えば、試料3に含まれる細胞の種類である。例えば、分析結果として、試料3に含まれる細胞の種類が複数の種類の夫々である確率が出力される。演算部11は、学習モデル142が出力した分析結果と、訓練データにおいて入力された仮想スペクトルに関連付けられた分析結果との誤差が小さくなるように、学習モデル142の演算のパラメータを調整する。即ち、仮想スペクトルに関連付けられた分析結果とほぼ同一の分析結果が出力されるように、パラメータが調整される。演算部11は、訓練データに含まれる複数のデータセットを用いて処理を繰り返して、学習モデル142のパラメータを調整することにより、学習モデル142の機械学習を行う。
【0080】
演算部11は、調整された最終的なパラメータを記録した学習済みデータを記憶部14に記憶する。このようにして、ラマンスペクトルが入力された場合に試料3の分析結果を出力するように学習された学習モデル142が生成される。S22が終了した後、情報処理装置1は、学習モデル142を生成する処理を終了する。なお、S21~S22の処理は、S11~S17の処理を実行した情報処理装置1とは異なる情報処理装置によって実行されてもよい。この形態では、情報処理装置は、訓練データを入力され、入力された訓練データを用いてS21~S22の処理を実行する。
【0081】
分析装置100は、学習された学習モデル142を用いて試料3の分析を行う。
図9は、学習モデル142を用いて試料3の分析を行う処理の手順を示すフローチャートである。測定装置2は、試料3からのラマン散乱光を測定し、ラマンスペクトルを生成し、ラマン散乱光を情報処理装置1へ入力する。情報処理装置1は、ラマンスペクトルを取得する(S31)。S31では、情報処理装置1は、測定装置2から入力されたラマンスペクトルを通信部17で受け付けることにより、ラマンスペクトルを取得し、演算部11は、ラマンスペクトルを記憶部14に記憶する。
【0082】
情報処理装置1は、ラマンスペクトルを学習モデル142へ入力する(S32)。S32では、演算部11は、ラマンスペクトルを学習モデル142へ入力し、学習モデル142に処理を実行させる。学習モデル142は、ラマンスペクトルが入力されたことに応じて、試料3の分析結果を出力する。情報処理装置1は、学習モデル142が出力した試料3の分析結果を取得する(S33)。
【0083】
情報処理装置1は、次に、試料3の分析結果を出力する(S34)。例えば、S34では、演算部11は、ラマンスペクトルと試料3の分析結果とを表示部16に表示する。S34が終了した後は、情報処理装置1は、試料3の分析を行う処理を終了する。
【0084】
S31~S34の処理により、試料3の分析結果が得られる。学習モデル142を利用することにより、容易に試料3の分析結果が得られる。例えば、試料3に含まれる細胞の種類を容易に判定することができる。なお、S31~S34の処理は、S11~S17又はS21~S22の処理を実行した情報処理装置1とは異なる情報処理装置によって実行されてもよい。
【0085】
以上詳述した如く、本実施形態においては、試料3から得られた原スペクトルに非分析用スペクトルを加算する等、原スペクトルと非分析用スペクトルとを用いた処理により仮想スペクトルを生成し、仮想スペクトルを含む訓練データを生成する。互いに異なる複数の非分析用スペクトルを利用することにより、少数の原スペクトルから多数の仮想スペクトルを生成することができる。非分析用スペクトルは分析結果にほぼ影響しないので、仮想スペクトルに応じた分析結果は、原スペクトルに応じた分析結果と同一である。このため、仮想スペクトルと試料3の分析結果とを関連付けることができ、仮想スペクトルと試料3の分析結果とを関連付けたデータセットを多数含んだ訓練データを生成することができる。
【0086】
生成された訓練データには、ラマンスペクトルと試料3の分析結果との組み合わせが多数含まれているので、訓練データを用いた機械学習により、ラマンスペクトルに応じて精度の良い分析結果を出力する学習モデル142を生成することができる。生成された学習モデル142を利用することにより、ラマンスペクトルに基づいた試料3の分析結果を容易に得ることができる。例えば、試料3に含まれる細胞の種類を容易に判定することができる。
【0087】
本実施形態においては、スペクトルがラマンスペクトルである形態を主に示したが、スペクトルはラマンスペクトル以外のスペクトルであってもよい。例えば、スペクトルは蛍光X線スペクトルであってもよい。スペクトルは光又は放射線のスペクトル以外のスペクトルであってもよい。
【0088】
本発明は上述した実施の形態の内容に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。即ち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態も本発明の技術的範囲に含まれる。
【符号の説明】
【0089】
100 分析装置
1 情報処理装置
10 記録媒体
141 コンピュータプログラム
142 学習モデル
2 測定装置
3 試料
41、42 非分析用スペクトル
43 原スペクトル
44 仮想スペクトル