(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023092883
(43)【公開日】2023-07-04
(54)【発明の名称】スペクトル解析方法、装置およびシステム
(51)【国際特許分類】
G01N 21/64 20060101AFI20230627BHJP
【FI】
G01N21/64 Z
【審査請求】未請求
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2021208165
(22)【出願日】2021-12-22
(71)【出願人】
【識別番号】501387839
【氏名又は名称】株式会社日立ハイテク
(74)【代理人】
【識別番号】110002365
【氏名又は名称】弁理士法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】林田 純弥
(72)【発明者】
【氏名】服部 英春
(72)【発明者】
【氏名】柿下 容弓
【テーマコード(参考)】
2G043
【Fターム(参考)】
2G043AA01
2G043AA04
2G043EA01
2G043JA01
2G043KA02
2G043KA03
(57)【要約】
【課題】3次元スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した高精度な定量/識別、および、励起波長または検出波長単位での有効波長帯の探索による測定時間短縮を実現するスペクトル解析装置、方法およびシステムを提供する。
【解決手段】3次元スペクトルデータを入力として受け付ける入力部と、前記3次元スペクトルデータから各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量の抽出を行う波長単位特徴量抽出部と、前記波長単位特徴量抽出部により生成された特徴量に基づいて定量/識別を行う推定部と、励起波長または検出波長単位で前記定量/識別に用いる波長帯(有効波長帯)を探索する有効波長帯探索部と、前記定量/識別結果および前記有効波長帯を出力する出力部とを備える。
【選択図】
図6
【特許請求の範囲】
【請求項1】
試料のスペクトルデータを入力として受け付ける入力部と、
前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出部と、
前記特徴量に基づき、前記試料の特性の推定を行う推定部と、
前記推定部によって得られた推定結果を出力する出力部と、
を備え、
前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、
前記波長単位特徴量抽出部は、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、
前記推定部は、前記試料の特性を定量および/または識別する推定処理を行うことを特徴とするスペクトル解析装置。
【請求項2】
請求項1に記載のスペクトル解析装置であって、
前記入力部は、前記スペクトルデータと、スペクトルデータに対応する教師情報の組を1組以上受け付け、
前記推定部は、前記波長単位特徴量抽出部が前記スペクトルデータから抽出した特徴量と前記教師情報とに基づいて前記定量および/または識別のモデルを構築することを特徴とするスペクトル解析装置。
【請求項3】
請求項1もしくは2に記載のスペクトル解析装置であって、
前記推定部によって得られた、前記定量および/または識別のモデルのパラメタに基づいて、前記定量および/または識別に使用する特徴量に対応する波長帯である有効波長帯を探索する有効波長帯探索部を更に有し、
前記有効波長帯探索部は、前記波長単位特徴量抽出部において、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合は励起波長単位で、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合は検出波長単位で有効波長帯を探索し、
前記出力部は、前記推定結果に加えて、前記有効波長帯探索部が探索した前記有効波長帯を出力することを特徴とするスペクトル解析装置。
【請求項4】
請求項1、2もしくは3に記載のスペクトル解析装置であって、
前記波長単位特徴量抽出部は、複数の訓練データセットを解析あるいは学習することで、複数の定量および/または識別に共通して使用可能な特徴量を抽出することを特徴とするスペクトル解析装置。
【請求項5】
請求項3に記載のスペクトル解析装置であって、
前記有効波長帯探索部は、前記波長単位特徴量抽出部において、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合と、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合の、定量および/または識別精度と有効波長帯数を評価情報として取得し、前記評価情報に基づいて有効波長帯を自動決定、あるいは、前記評価情報をユーザーに提示することでユーザーによる有効波長帯決定を支援することを特徴とするスペクトル解析装置。
【請求項6】
請求項3に記載のスペクトル解析装置であって、
前記有効波長帯探索部は、前記推定部における定量および/または識別精度と有効波長帯数に影響を及ぼすハイパーパラメタを変化させた場合の、定量および/または識別精度と有効波長帯数の関係を評価情報として取得し、前記評価情報に基づいて前記ハイパーパラメタの値を自動決定、あるいは、前記評価情報をユーザーに提示し、ユーザーによる前記ハイパーパラメタの値の決定を支援することを特徴とするスペクトル解析装置。
【請求項7】
請求項3に記載のスペクトル解析装置であって、
前記入力部は、前記有効波長帯探索部が出力した前記有効波長帯を受け付け、入力として受け付けたスペクトルデータの内、前記有効波長帯に対応するスペクトルのみを前記波長単位特徴量抽出部に出力することを特徴とするスペクトル解析装置。
【請求項8】
試料のスペクトルデータを入力として受け付ける入力ステップと、
前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出ステップと、
前記特徴量に基づき、前記試料の特性の推定を行う推定ステップと、
前記推定ステップによって得られた推定結果を出力する出力ステップと、
を含み、
前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、
前記波長単位特徴量抽出ステップは、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、
前記推定ステップは、前記試料の特性を定量および/または識別する推定処理を行うことを特徴とするスペクトル解析方法。
【請求項9】
請求項8に記載のスペクトル解析方法であって、
前記入力ステップは、前記スペクトルデータと、スペクトルデータに対応する教師情報の組を1組以上受け付け、
前記推定ステップは、前記波長単位特徴量抽出ステップが前記スペクトルデータから抽出した特徴量と前記教師情報とに基づいて前記定量および/または識別のモデルを構築することを特徴とするスペクトル解析方法。
【請求項10】
請求項8もしくは9に記載のスペクトル解析方法であって、
前記推定ステップによって得られた、前記定量および/または識別のモデルのパラメタに基づいて、前記定量および/または識別に使用する特徴量に対応する波長帯である有効波長帯を探索する有効波長帯探索ステップを更に有し、
前記有効波長帯探索ステップは、前記波長単位特徴量抽出ステップにおいて、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合は励起波長単位で、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合は検出波長単位で有効波長帯を探索し、
前記出力ステップは、前記推定結果に加えて、前記有効波長帯探索ステップが探索した前記有効波長帯を出力することを特徴とするスペクトル解析方法。
【請求項11】
請求項8、9もしくは10に記載のスペクトル解析方法であって、
前記波長単位特徴量抽出ステップは、複数の訓練データセットを解析あるいは学習することで、複数の定量および/または識別に共通して使用可能な特徴量を抽出することを特徴とする。
【請求項12】
請求項10に記載のスペクトル解析方法であって、
前記有効波長帯探索ステップは、前記波長単位特徴量抽出ステップにおいて、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合と、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合の、定量および/または識別精度と有効波長帯数を評価情報として取得し、前記評価情報に基づいて有効波長帯を自動決定、あるいは、前記評価情報をユーザーに提示することでユーザーによる有効波長帯決定を支援することを特徴とするスペクトル解析方法。
【請求項13】
請求項10に記載のスペクトル解析方法であって、
前記有効波長帯探索ステップは、前記推定ステップにおける定量および/または識別精度と有効波長帯数に影響を及ぼすハイパーパラメタを変化させた場合の、定量および/または識別精度と有効波長帯数の関係を評価情報として取得し、前記評価情報に基づいて前記ハイパーパラメタの値を自動決定、あるいは、前記評価情報をユーザーに提示し、ユーザーによる前記ハイパーパラメタの値の決定を支援することを特徴とするスペクトル解析方法。
【請求項14】
試料に照射する励起光の波長帯と、検出光の波長帯を設定する制御装置と、
前記試料に対して、前記制御装置において設定した波長帯に対応するスペクトルデータを測定するスペクトル測定装置と、
前記スペクトル測定装置により測定されたスペクトルデータを解析するスペクトル解析装置と、
前記スペクトル解析装置で得られた推定結果を表示する表示装置と、
を有し、
前記スペクトル解析装置は、
試料のスペクトルデータを入力として受け付ける入力部と、
前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出部と、
前記特徴量に基づき、前記試料の特性の推定を行う推定部と、
前記推定部によって得られた推定結果を出力する出力部と、
を備え、
前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、
前記波長単位特徴量抽出部は、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、
前記推定部は、前記試料の特性を定量および/または識別する推定処理を行うことを特徴とするスペクトル解析システム。
【請求項15】
請求項14に記載のスペクトル解析システムであって、
前記スペクトル解析装置は、
前記推定部によって得られた、前記定量および/または識別モデルのパラメタに基づいて、前記定量および/または識別に使用する特徴量に対応する波長帯である有効波長帯を探索する有効波長帯探索部を更に有し、
前記有効波長帯探索部は、前記波長単位特徴量抽出部において、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合は励起波長単位で、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合は検出波長単位で有効波長帯を探索し、
前記出力部は、前記推定結果に加えて、前記有効波長帯探索部が探索した前記有効波長帯を出力し、
前記制御装置は、前記スペクトル解析装置が出力した前記有効波長帯を受け付け、前記有効波長帯を、前記試料に照射する励起光の波長帯、あるいは検出する検出光の波長帯として設定することを特徴とするスペクトル解析システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、スペクトル解析方法、装置およびシステムに関する。
【背景技術】
【0002】
スペクトル解析装置では、試料に励起光を照射し、試料から検出される光を測定することでスペクトルを得る。スペクトル解析装置の中には励起波長、検出波長、検出強度の3つの軸から構成される3次元スペクトルを得る装置がある。例えば、分光蛍光光度計では蛍光指紋と呼ばれる3次元蛍光スペクトルを測定する。特定波長の励起光を試料に照射すると、励起された試料が様々な波長の蛍光を発する。これを蛍光スペクトルと呼び、各蛍光波長における蛍光の強さを蛍光強度と呼ぶ。試料は励起光の波長を変化させることで異なる蛍光スペクトルを発する。そこで、励起光の波長を順次変えながら蛍光スペクトルを測定することで励起波長、蛍光波長、蛍光強度の3つの軸を持つ3次元スペクトルを得る。前述の検出波長が蛍光波長、検出強度が蛍光強度に相当する。得られた3次元スペクトルの形状を解析することで、試料に含まれる成分の定量や、種類の識別が可能となる。
【0003】
従来のスペクトルデータの解析方法としては、例えば、3次元スペクトル内のピーク値のみを用いて回帰分析を行う手法がある。
また、特許文献1では、蛍光指紋を対象に、矩形の測定窓を設け、測定窓内の蛍光強度の積分値を用いて多変量解析を行う手法が開示されている。
また、特許文献2では、2次元スペクトルデータを対象として、複数の励起波長のそれぞれにおける光吸収特性値(検出強度)を説明変数としたスパース推定を行うことで、推定に用いる励起波長を限定しながら、対象物質の含有量を推定する手法が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2015-180895公報
【特許文献2】特開2018-013418公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ピーク値のみを用いた線形回帰では、ピークが出現する波長帯が判明した後、その波長帯のみを測定し、解析することで、短時間の計測・解析をめざしている。しかし、ピークの情報のみを利用するためピークの幅やピーク間の距離といった空間的な情報を利用した定量/識別が難しい、点状ノイズの影響を受けやすいなどの課題がある。以降、スペクトル解析において、定量および/または識別に用いる波長帯を有効波長帯と呼称する。
【0006】
また、特許文献1に記載の技術は、上記の課題を鑑み、矩形の測定窓を設け、測定窓内の蛍光強度の積分値を用いて多変量解析を行う。これにより測定波長帯を限定しつつ、ノイズの影響を低減することをめざしている。しかし、前記測定窓は手動で設計するか、あるいはランダムに設定した測定窓内の蛍光強度から回帰式を構築し、定量結果に基づいて測定窓を再設定する処理を繰り返し行うことで探索する必要がある。分析対象物の定量/識別に有効な波長帯を目視で判別することは難しく、また、ランダムに試行した場合、測定窓が大きくなり、十分に有効波長帯を限定することが難しい場合がある。よって、短時間での高精度な定量/識別モデルの構築や、効率的な計測を実現する有効波長帯の限定が難しい場合がある。
【0007】
特許文献2に記載の技術は、2次元スペクトルデータ内の全ての検出強度を説明変数としたスパース推定を行うことで、定量/識別に有効な波長帯を自動的に選択する。しかし、選択される波長帯は領域ではなく点であるため、ピーク情報のみを利用した場合と同様に、空間的な情報を抽出しにくい、点状ノイズの影響を受けやすいという課題がある。
【0008】
本発明は上記の課題を鑑みて、3次元スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した高精度な定量および/または識別を実現するスペクトル解析装置、方法およびシステムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために本発明で開示されるスペクトル解析装置は、試料のスペクトルデータを入力として受け付ける入力部と、前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出部と、前記特徴量に基づき、前記試料の特性の推定を行う推定部と、前記推定部によって得られた推定結果を出力する出力部と、を備え、前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、前記波長単位特徴量抽出部は、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、前記推定部は、前記試料の特性を定量および/または識別する推定処理を行うことを特徴とする。
また、本発明で開示されるスペクトル解析方法は、試料のスペクトルデータを入力として受け付ける入力ステップと、前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出ステップと、前記特徴量に基づき、前記試料の特性の推定を行う推定ステップと、前記推定ステップによって得られた推定結果を出力する出力ステップと、を含み、前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、前記波長単位特徴量抽出ステップは、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、前記推定ステップは、前記試料の特性を定量および/または識別する推定処理を行うことを特徴とする。
【発明の効果】
【0010】
本発明によれば、3次元スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した高精度な定量および/または識別を実現し、定量および/または識別に使用する波長帯の励起波長または検出波長単位での限定が可能なスペクトル解析装置、方法およびシステムを提供可能となる。上記した以外の課題、構成および効果は以下の実施の形態の説明により明らかにされる。
【図面の簡単な説明】
【0011】
【
図1】実施例1に係るスペクトル解析装置のハードウェア構成の一例を示す図である。
【
図2】実施例1に係るスペクトル解析装置の機能ブロック図の一例を示す図である。
【
図3】3次元スペクトルデータの一例を示す図である。
【
図4】波長単位特徴量抽出部への入力方法の一例を示す図である。
【
図5】実施例1に係るスペクトル解析方法の処理フローの一例を示す図である。
【
図6】実施例3に係るスペクトル解析装置の機能ブロック図の一例を示す図である。
【
図7】定量/識別精度と有効波長帯数の関係性の表示例を示す図である。
【
図9】実施例3に係るスペクトル解析方法の処理フローの一例を示す図である。
【
図10】実施例4に係るスペクトル解析システムのハードウェア構成の一例を示す図である。
【
図11】実施例2に係るスペクトル解析装置の機能ブロック図の一例を示す図である。
【
図12】実施例2に係るスペクトル解析方法の処理フローの一例を示す図である。
【発明を実施するための形態】
【0012】
以下、添付図面に従って本発明に係るスペクトル解析方法、装置およびシステムの実施例について説明する。なお、以下の説明および添付図面において、同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【実施例0013】
<スペクトル解析装置のハードウェア構成>
実施例1では、3次元スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した定量/識別、および、定量/識別に使用する波長帯(有効波長帯)の励起波長または検出波長単位での限定が可能なスペクトル解析装置について述べる。
なお、本実施例で3次元スペクトルデータとは、複数の励起波長と分光スペクトル(検出波長と検出強度で構成されるスペクトル)を含み、所定の波長幅で離散化されたデータである。
また、定量/識別とは、定量および/または識別をいい、定量/識別モデルとは、定量と識別の少なくとも一方に用いられるデータ推定用のモデルである。
【0014】
図1を用いて実施例1に係るスペクトル解析装置のハードウェア構成について説明する。スペクトル解析装置100は、インターフェース部110と、演算部111と、メモリ112と、バス113と、を備え、インターフェース部110と、演算部111と、メモリ112は、バス113を介して情報の送受信を行う。
【0015】
スペクトル解析装置100の各部について説明する。
インターフェース部110は、スペクトル解析装置100の外部にある装置と信号の送受信を行う通信機器である。インターフェース部110と送受信を行う装置としては、スペクトル測定装置121の制御を行う制御装置120、3次元スペクトルデータを測定するスペクトル測定装置121、スペクトル解析装置100の処理結果を表示するモニタやプリンタ等の表示装置122がある。
【0016】
演算部111は、スペクトル解析装置100内での各種の処理を実行する装置であり、例えばCPU(Central Processing Unit)やFPGA(Field-Programmable Gate Array)等である。演算部111によって実行される機能については、後述する。
【0017】
メモリ112は、演算部111が実行するプログラムや、定量/識別モデルのパラメタ、処理結果等を保存する装置であり、HDD、SSD、RAM、ROM、フラッシュメモリ等である。
【0018】
<スペクトル解析装置100の機能構成>
図2はスペクトル解析装置100の実施例に係る機能ブロック図の一例である。これらの各機能部は、演算部111上で動作するソフトウェアで実現しても良いし、専用のハードウェアで実現しても良い。
【0019】
スペクトル解析装置100は、機能部として、入力部201と、波長単位特徴量抽出部202と、推定部203と、出力部204と、を含む。以下、各機能部について説明する。
入力部201は、インターフェース部110から入力される、離散化された3次元スペクトルデータを1つ以上受け付ける。
波長単位特徴量抽出部202は、前記3次元スペクトルデータから、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出する。
【0020】
推定部203は、メモリ112に保存された定量/識別モデルの1つを読み込み、前記特徴量に基づいて、定量/識別を行う。
出力部204は、前記定量/識別結果を出力する。定量の場合は、推定した各サンプルの定量結果に加えて、決定係数、RMSE(Root Mean Squared Error)のような定量モデルの評価値を出力しても良いし、検量線等のグラフデータを出力しても良い。識別の場合は、推定した各サンプルの識別結果に加えて、識別率や適合率、再現率等の識別モデルの評価値を出力しても良い。これらの出力はインターフェース部110を介して表示装置122で表示する。
【0021】
尚、上記の各機能は、
図2の機能部の通りに構成される必要はなく、各機能ブロックの動作に相当する処理が実現できればよい。
図5に実施例1に係る処理フロー図の一例を示す。各ステップは
図2に示した機能ブロック図の各要素と対応している。
入力ステップ501は、インターフェース部110から入力される、離散化された3次元スペクトルデータを1つ以上を受け付ける。
波長単位特徴量抽出ステップ502は、前記3次元スペクトルデータから、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出する。
【0022】
推定ステップ503は、メモリ112に保存された定量/識別モデルの1つを読み込み、前記特徴量に基づいて、定量/識別を行う。
出力ステップ504は、前記定量/識別結果を出力する。定量の場合は、推定した各サンプルの定量結果に加えて、決定係数、RMSE(Root Mean Squared Error)のような定量モデルの評価値を出力しても良いし、検量線等のグラフデータを出力しても良い。識別の場合は、推定した各サンプルの識別結果に加えて、識別率や適合率、再現率等の識別モデルの評価値を出力しても良い。
以降、各機能部を主語として詳細な動作について説明するが、各機能部に対応する各ステップを主語として読み替えても差し支えない。
【0023】
<各部の構成と動作>
以下、機能部の内、入力部201、波長単位特徴量抽出部202、推定部203の動作について詳しく説明する。
入力部201は、インターフェース部110を介して離散化された3次元スペクトルデータを受け付け、メモリ112に保存する。
【0024】
図3に蛍光指紋データの一例を示す。離散化蛍光指紋データ300は、離散化して格納された蛍光指紋データの例である。蛍光指紋データ可視化例301は、縦軸に励起光波長、横軸に検出波長を取り、各励起および検出波長の組合せにおける検出強度を等高線状データとして表示した例である。離散化蛍光指紋データ300に示す通り、蛍光指紋データは離散化して測定および記録される。離散化蛍光指紋データ300は励起光/検出光に対して200nmから700nmを5nm間隔で測定した例を示しており、例えば離散化蛍光指紋データ300の1行1列目には励起光200nmに対する検出光200nmの検出強度が、1行2列目には励起光200nmに対する検出光205nmの検出強度が、2行1列目には励起光205nmに対する検出光200nmの検出強度が、それぞれ記録されている。また、離散化蛍光指紋データ300の列数と行数は500nmを5nm間隔で記録しているため100x100となる。
【0025】
蛍光指紋データ可視化例301は離散化蛍光指紋データ300を等高線状データとして二次元画像化した例であり、人間が蛍光指紋データを観察する際は蛍光指紋データ可視化例301のような表示で確認することが多い。尚、等高線状データの他、検出強度を輝度値や色に割当てたグレイ画像やヒートマップ画像、鳥瞰図等で表示する場合もある。蛍光指紋の形状は測定対象となる試料の性質に応じて異なり、この形状の差異に基づいて試料の識別や、特定成分の定量等を行う。
【0026】
波長単位特徴量抽出部202は、前記3次元スペクトルデータから、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出する。これにより検出波長方向あるいは励起波長方向の空間的な特徴量を抽出しつつ、識別や定量に有効な波長を励起あるいは検出波長単位で選択、限定することが可能となる。
【0027】
この本実施例に開示の方法の利点について、2つの参考手法と比較して説明する。第1の参考手法は、各検出強度、すなわち離散化蛍光指紋データ300の各マスの値を説明変数とした回帰を行う手法である。第1の参考手法では、検出強度の内、識別や定量に有効な励起波長と検出波長の組合せにおける検出強度に対して大きな重みを付与することで、回帰式を構築する。回帰式構築以降の識別や定量においては大きな重みを付与された説明変数、すなわち、励起/検出波長の組合せのみを測定することで測定時間が短縮される。しかし、ピーク成分の幅等の空間的な特徴量を抽出することは困難であり、更に点状ノイズが直接的に識別や定量に影響するといった課題がある。
【0028】
第2の参考手法は、CNN(Convolutional Neural Network)を用いて、空間的な特徴量を抽出する手法である。CNNは画像処理の分野で頻繁に利用される、機械学習手法の一つであり、複数のフィルタを自動学習することで特徴量を抽出する。CNNを用いることで空間的な特徴量を抽出でき、点状ノイズに対する頑健性も向上する。しかし、一般的にCNNは2次元データ全体、すなわち離散化蛍光指紋データ300の全マスの値から総合的に特徴量を算出するため、特徴量を算出するために広範囲の波長帯の検出強度が必要となる傾向があり、有効波長帯を限定することが難しい場合がある。
【0029】
これらの参考手法に対し、本実施例に開示の方法では、励起波長、すなわち離散化蛍光指紋データ300の各行、あるいは、検出波長、すなわち離散化蛍光指紋データ300の各列から独立して特徴量抽出を行う。これにより、検出波長方向あるいは励起波長方向の空間的な情報を有し、かつ、点状ノイズに頑健な特徴量を抽出可能となり、更に、励起あるいは検出波長単位で有効波長帯を選択、限定することが可能となる。
【0030】
図4は特徴量抽出範囲の一例を説明する図である。
図4(a)は各励起波長帯において全検出波長帯から特徴量を抽出する例、
図4(b)は各検出波長帯において全励起波長帯から特徴量を抽出する例、
図4(c)は各励起波長帯において一部の検出波長帯から特徴量を抽出する例、
図4(d)は各検出波長帯において一部の励起波長帯から特徴量を抽出する例を示している。
図4(a)(b)(c)(d)の3次元スペクトルデータ内に描かれた矩形は、特徴量を抽出するための特徴量抽出モデルへの入力単位を表す。波長単位特徴量抽出部202は
図4(a)(c)に示すように、励起波長帯毎、あるいは、
図4(b)(d)に示すように、検出波長帯毎に独立に特徴量を抽出する。この時、
図4(a)(b)に示すように検出または励起波長帯全体から特徴量を抽出しても良いし、
図4(c)(d)に示すように検出または励起波長帯の一部のみから特徴量を抽出しても良い。
【0031】
また
図4(a)(c)では各励起波長に対して全て同じ検出波長から特徴量を抽出するように図示しているが、励起波長に応じて特徴量を抽出する検出波長帯を変えても良い。例えば蛍光指紋においては、励起波長と検出波長が等しくなる領域を中心に散乱光と呼ばれるノイズが測定されるが、この散乱光の領域を避けるように励起波長に応じて特徴量抽出する領域を変化させてもよい。尚、検出波長と励起波長を入れ替えた場合も同様である。
【0032】
特徴量抽出方式としては例えば1DCNN(1 Dimensional Convolutional Neural Network)等を使用する。1DCNNは1次元データに対するCNNであり、励起波長毎あるいは検出波長毎に複数の特徴量を抽出する。特徴量の学習方法は、例えば特徴量を抽出するための1つ以上の1DCNNと、1DCNNの出力を入力として定量や識別を行う全結合層等を連結し、定量や識別問題毎に作成したデータセットを用いて、機械学習法により1DCNNと全結合層を更新することで特徴量を学習する方法等がある。特徴量の学習方法はこれに限らず、複数のタスクを同時に学習することで共通的な特徴量を学習する方法でも良いし、Auto Encoder等の教師無し学習法を用いて学習しても良い。また、HoG(Histograms of Oriented Gradients)やhaar-like特徴量のようなハンドクラフトの特徴量を用いても良いし、主成分分析や、PLS(Partial Least Squares)のような統計的解析手法を用いても良い。
【0033】
波長単位特徴量抽出部202は、
図4のように領域(2つ以上の波長で測定された検出強度)の情報を抽出することで、後述する推定部203において、空間的な情報を活用しつつ、ノイズへの頑健性を向上した定量/識別モデルを提供可能となる。また、
図4のように励起波長毎あるいは検出波長毎に独立に特徴量を抽出し、推定部203において、各特徴量を定量/識別の入力とすることで、有効波長帯の限定が可能な定量/識別モデルを提供可能となる。
【0034】
推定部203は、メモリ112に保存された任意の定量/識別モデルを読み込み、波長単位特徴量抽出部202で得られた前記特徴量を定量/識別モデルに入力することで、定量/識別を行う。
【0035】
定量/識別モデルには、Lasso回帰やElastic Net、Group Lassoのようなスパース推定モデルを用いても良いし、Neural Network、ランダムフォレスト、Support Vector Machine等の機械学習モデルを用いても良い。ここではLasso回帰を用いた例を説明する。
【0036】
Lasso回帰では数式1のような回帰式に基づいて推定を行う。ここでx
ijは波長単位特徴量抽出部202が出力する波長帯単位の特徴量であり、iは励起あるいは検出波長のインデックス、jは特徴量のインデックスを表す。尚、励起あるいは検出波長の数(すなわち離散化蛍光指紋データ300における行数あるいは列数)はN個、各波長から抽出される特徴量はM個であるとする。w
ijは各特徴量に対する重み、bはバイアス値、y^は回帰モデルの出力を表す。
【数1】
上記w
ijの最適化を行うために、1組以上の訓練用特徴量と教師信号の組を用いて、数式2aのような回帰式を構成する。ここでx
s,ijは波長単位特徴量抽出部202が出力する特徴量であり、sはサンプルのインデックス、i、jは数式1と同様に励起あるいは検出波長のインデックスと、特徴量のインデックスを表す。また、y
sはサンプルsの教師信号を表す。尚、訓練用特徴量と教師信号の組の数はS個であるとする。数式2bは数式2aの行列ベクトルの表記を省略した式である。
【数2a】
【数2b】
数式2bの回帰式に対し、下記の数式3に基づいてwの最適化を行う。ここでαは正則化強度を表す。数式3の第1項は回帰モデルの出力を教師信号yに近づける効果がある。第2項はL1正則化項であり、重みw内の多くの要素を0に近づける効果がある。その効果の強さは正則化強度αによって決定される。
【数3】
上記のようにLasso解析により回帰式を構築することで、一部の特徴量に係る重みwが0になる。波長帯iに対する全ての特徴量に対応する重みw
i1,・・・w
iMが0になった場合、波長帯iから得た特徴量は回帰の中で使われないことを意味するため、波長帯iを測定する必要がなくなる。このように回帰の中で使われる特徴量を波長帯単位で限定することで測定時間を短縮することが可能となる。
【0037】
上記の手法により構築した重みwをメモリ112に予め保存しておき、推定部203がスペクトル解析装置100起動時や、重みwの更新時等に重みwを読み込んで、定量/識別処理を実行する。
【0038】
以上のように、波長単位特徴量抽出部202で、各励起波長における2つ以上の検出波長の検出強度、あるいは、各検出波長における2つ以上の励起波長の検出強度から特徴量を抽出し、推定部203で前記特徴量を説明変数とした定量/識別を行うことで、スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した高精度な定量/識別、および、定量/識別に使用する波長帯の励起波長または検出波長単位での限定が可能なスペクトル解析装置、方法を提供可能となる。
実施例2では実施例1に記載のスペクトル解析装置に、定量/識別モデルの生成機能を追加することで、ユーザーが独自に設定した定量/識別問題に対して高精度な識別と有効波長帯の選択を可能とするスペクトル解析装置について説明する。
推定部1103はある一定の条件を満たした場合に、メモリ112に保存された複数の3次元スペクトルデータと教師情報の組を使用して、定量/識別モデルを生成する。定量/識別モデルの生成を開始する条件は、メモリ112内に新たに保存された3次元スペクトルデータの教師情報の組が予め定めた数を超えた場合や、インターフェース部110を介してユーザーから要求があった場合、あるいは予め定めた時間が経過する度に定量/識別モデルを更新する等でも良い。
実施例1で説明した通り、定量/識別モデルとしてはLasso回帰やElastic Net、Group Lassoのようなスパース推定モデルを用いても良いし、Neural Network、ランダムフォレスト、Support Vector Machine等の機械学習モデルを用いても良い。ここでは例としてLasso回帰を用いた例について説明する。
実施例1で説明した通り、Lasso回帰は数式2bに示す回帰式を構築し、数式3に示す制約に基づいて重みwを導出する。ここで前述した複数の3次元スペクトルデータと教師情報の組の内、3次元スペクトルデータ群をX、それに対応する教師情報群をyとして、数式3を満たす重みwを導出する。重みの導出にはLasso回帰の解法の一つであるISTA(Iterative Shrinkage Thresholding Algorithm)等を用いる。これによりユーザーが独自に収集したデータセットを用いて、定量/識別モデルを構築することが可能となる。また、他のスパース推定モデルや回帰モデルを用いた場合でも同様の方法により定量/識別モデルを構築することが可能である。また、機械学習モデルを用いた場合には、3次元スペクトルデータ群とそれに対応する教師情報群を用いて、各機械学習アルゴリズムに則って、定量/識別モデルを学習する。
尚、定量/識別モデルの重みの初期値は、固定値やランダムな値を設定しても良いし、正規分布等の確率分布に従って設定しても良いし、メモリ112に保存された定量/識別モデルの重みを設定しても良い。
尚、波長単位特徴量抽出部202において、特徴量抽出モデルとしてNeural Network等の機械学習手法や、主成分分析、PLS等の統計的解析手法を用いている場合には、定量/識別モデルだけでなく、特徴量抽出モデルを前述の複数の3次元スペクトルデータ、あるいは複数の3次元スペクトルデータと教師情報の組を用いて更新しても良い。
例えば機械学習手法の一種であるAuto Encoderや、統計的解析手法の一種である主成分分析を用いる場合、特徴量抽出モデルの更新には教師情報は不要である。よって、複数の3次元スペクトルデータのみを使用して教師無し学習、あるいは統計分析することで特徴量を更新する。また、例えば実施例1で説明した機械学習手法の一種である1DCNNや、統計的解析手法の一種であるPLSを用いる場合、複数の3次元スペクトルデータと教師信号の組を使用して教師有り学習、あるいは、教師情報を応答変数とした統計分析を実行することで特徴量抽出モデルを更新する。
上記によりユーザーが独自に収集したデータセットを用いて、定量/識別モデルを構築することが可能となり、ユーザーが独自に設定した定量/識別問題に対して高精度な識別と有効波長帯の選択が可能なスペクトル解析装置および方法を提供可能となる。