IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立ハイテクノロジーズの特許一覧

特開2023-92883スペクトル解析方法、装置およびシステム
<>
  • 特開-スペクトル解析方法、装置およびシステム 図1
  • 特開-スペクトル解析方法、装置およびシステム 図2
  • 特開-スペクトル解析方法、装置およびシステム 図3
  • 特開-スペクトル解析方法、装置およびシステム 図4
  • 特開-スペクトル解析方法、装置およびシステム 図5
  • 特開-スペクトル解析方法、装置およびシステム 図6
  • 特開-スペクトル解析方法、装置およびシステム 図7
  • 特開-スペクトル解析方法、装置およびシステム 図8
  • 特開-スペクトル解析方法、装置およびシステム 図9
  • 特開-スペクトル解析方法、装置およびシステム 図10
  • 特開-スペクトル解析方法、装置およびシステム 図11
  • 特開-スペクトル解析方法、装置およびシステム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023092883
(43)【公開日】2023-07-04
(54)【発明の名称】スペクトル解析方法、装置およびシステム
(51)【国際特許分類】
   G01N 21/64 20060101AFI20230627BHJP
【FI】
G01N21/64 Z
【審査請求】未請求
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2021208165
(22)【出願日】2021-12-22
(71)【出願人】
【識別番号】501387839
【氏名又は名称】株式会社日立ハイテク
(74)【代理人】
【識別番号】110002365
【氏名又は名称】弁理士法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】林田 純弥
(72)【発明者】
【氏名】服部 英春
(72)【発明者】
【氏名】柿下 容弓
【テーマコード(参考)】
2G043
【Fターム(参考)】
2G043AA01
2G043AA04
2G043EA01
2G043JA01
2G043KA02
2G043KA03
(57)【要約】
【課題】3次元スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した高精度な定量/識別、および、励起波長または検出波長単位での有効波長帯の探索による測定時間短縮を実現するスペクトル解析装置、方法およびシステムを提供する。
【解決手段】3次元スペクトルデータを入力として受け付ける入力部と、前記3次元スペクトルデータから各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量の抽出を行う波長単位特徴量抽出部と、前記波長単位特徴量抽出部により生成された特徴量に基づいて定量/識別を行う推定部と、励起波長または検出波長単位で前記定量/識別に用いる波長帯(有効波長帯)を探索する有効波長帯探索部と、前記定量/識別結果および前記有効波長帯を出力する出力部とを備える。
【選択図】図6
【特許請求の範囲】
【請求項1】
試料のスペクトルデータを入力として受け付ける入力部と、
前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出部と、
前記特徴量に基づき、前記試料の特性の推定を行う推定部と、
前記推定部によって得られた推定結果を出力する出力部と、
を備え、
前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、
前記波長単位特徴量抽出部は、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、
前記推定部は、前記試料の特性を定量および/または識別する推定処理を行うことを特徴とするスペクトル解析装置。
【請求項2】
請求項1に記載のスペクトル解析装置であって、
前記入力部は、前記スペクトルデータと、スペクトルデータに対応する教師情報の組を1組以上受け付け、
前記推定部は、前記波長単位特徴量抽出部が前記スペクトルデータから抽出した特徴量と前記教師情報とに基づいて前記定量および/または識別のモデルを構築することを特徴とするスペクトル解析装置。
【請求項3】
請求項1もしくは2に記載のスペクトル解析装置であって、
前記推定部によって得られた、前記定量および/または識別のモデルのパラメタに基づいて、前記定量および/または識別に使用する特徴量に対応する波長帯である有効波長帯を探索する有効波長帯探索部を更に有し、
前記有効波長帯探索部は、前記波長単位特徴量抽出部において、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合は励起波長単位で、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合は検出波長単位で有効波長帯を探索し、
前記出力部は、前記推定結果に加えて、前記有効波長帯探索部が探索した前記有効波長帯を出力することを特徴とするスペクトル解析装置。
【請求項4】
請求項1、2もしくは3に記載のスペクトル解析装置であって、
前記波長単位特徴量抽出部は、複数の訓練データセットを解析あるいは学習することで、複数の定量および/または識別に共通して使用可能な特徴量を抽出することを特徴とするスペクトル解析装置。
【請求項5】
請求項3に記載のスペクトル解析装置であって、
前記有効波長帯探索部は、前記波長単位特徴量抽出部において、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合と、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合の、定量および/または識別精度と有効波長帯数を評価情報として取得し、前記評価情報に基づいて有効波長帯を自動決定、あるいは、前記評価情報をユーザーに提示することでユーザーによる有効波長帯決定を支援することを特徴とするスペクトル解析装置。
【請求項6】
請求項3に記載のスペクトル解析装置であって、
前記有効波長帯探索部は、前記推定部における定量および/または識別精度と有効波長帯数に影響を及ぼすハイパーパラメタを変化させた場合の、定量および/または識別精度と有効波長帯数の関係を評価情報として取得し、前記評価情報に基づいて前記ハイパーパラメタの値を自動決定、あるいは、前記評価情報をユーザーに提示し、ユーザーによる前記ハイパーパラメタの値の決定を支援することを特徴とするスペクトル解析装置。
【請求項7】
請求項3に記載のスペクトル解析装置であって、
前記入力部は、前記有効波長帯探索部が出力した前記有効波長帯を受け付け、入力として受け付けたスペクトルデータの内、前記有効波長帯に対応するスペクトルのみを前記波長単位特徴量抽出部に出力することを特徴とするスペクトル解析装置。
【請求項8】
試料のスペクトルデータを入力として受け付ける入力ステップと、
前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出ステップと、
前記特徴量に基づき、前記試料の特性の推定を行う推定ステップと、
前記推定ステップによって得られた推定結果を出力する出力ステップと、
を含み、
前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、
前記波長単位特徴量抽出ステップは、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、
前記推定ステップは、前記試料の特性を定量および/または識別する推定処理を行うことを特徴とするスペクトル解析方法。
【請求項9】
請求項8に記載のスペクトル解析方法であって、
前記入力ステップは、前記スペクトルデータと、スペクトルデータに対応する教師情報の組を1組以上受け付け、
前記推定ステップは、前記波長単位特徴量抽出ステップが前記スペクトルデータから抽出した特徴量と前記教師情報とに基づいて前記定量および/または識別のモデルを構築することを特徴とするスペクトル解析方法。
【請求項10】
請求項8もしくは9に記載のスペクトル解析方法であって、
前記推定ステップによって得られた、前記定量および/または識別のモデルのパラメタに基づいて、前記定量および/または識別に使用する特徴量に対応する波長帯である有効波長帯を探索する有効波長帯探索ステップを更に有し、
前記有効波長帯探索ステップは、前記波長単位特徴量抽出ステップにおいて、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合は励起波長単位で、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合は検出波長単位で有効波長帯を探索し、
前記出力ステップは、前記推定結果に加えて、前記有効波長帯探索ステップが探索した前記有効波長帯を出力することを特徴とするスペクトル解析方法。
【請求項11】
請求項8、9もしくは10に記載のスペクトル解析方法であって、
前記波長単位特徴量抽出ステップは、複数の訓練データセットを解析あるいは学習することで、複数の定量および/または識別に共通して使用可能な特徴量を抽出することを特徴とする。
【請求項12】
請求項10に記載のスペクトル解析方法であって、
前記有効波長帯探索ステップは、前記波長単位特徴量抽出ステップにおいて、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合と、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合の、定量および/または識別精度と有効波長帯数を評価情報として取得し、前記評価情報に基づいて有効波長帯を自動決定、あるいは、前記評価情報をユーザーに提示することでユーザーによる有効波長帯決定を支援することを特徴とするスペクトル解析方法。
【請求項13】
請求項10に記載のスペクトル解析方法であって、
前記有効波長帯探索ステップは、前記推定ステップにおける定量および/または識別精度と有効波長帯数に影響を及ぼすハイパーパラメタを変化させた場合の、定量および/または識別精度と有効波長帯数の関係を評価情報として取得し、前記評価情報に基づいて前記ハイパーパラメタの値を自動決定、あるいは、前記評価情報をユーザーに提示し、ユーザーによる前記ハイパーパラメタの値の決定を支援することを特徴とするスペクトル解析方法。
【請求項14】
試料に照射する励起光の波長帯と、検出光の波長帯を設定する制御装置と、
前記試料に対して、前記制御装置において設定した波長帯に対応するスペクトルデータを測定するスペクトル測定装置と、
前記スペクトル測定装置により測定されたスペクトルデータを解析するスペクトル解析装置と、
前記スペクトル解析装置で得られた推定結果を表示する表示装置と、
を有し、
前記スペクトル解析装置は、
試料のスペクトルデータを入力として受け付ける入力部と、
前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出部と、
前記特徴量に基づき、前記試料の特性の推定を行う推定部と、
前記推定部によって得られた推定結果を出力する出力部と、
を備え、
前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、
前記波長単位特徴量抽出部は、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、
前記推定部は、前記試料の特性を定量および/または識別する推定処理を行うことを特徴とするスペクトル解析システム。
【請求項15】
請求項14に記載のスペクトル解析システムであって、
前記スペクトル解析装置は、
前記推定部によって得られた、前記定量および/または識別モデルのパラメタに基づいて、前記定量および/または識別に使用する特徴量に対応する波長帯である有効波長帯を探索する有効波長帯探索部を更に有し、
前記有効波長帯探索部は、前記波長単位特徴量抽出部において、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合は励起波長単位で、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合は検出波長単位で有効波長帯を探索し、
前記出力部は、前記推定結果に加えて、前記有効波長帯探索部が探索した前記有効波長帯を出力し、
前記制御装置は、前記スペクトル解析装置が出力した前記有効波長帯を受け付け、前記有効波長帯を、前記試料に照射する励起光の波長帯、あるいは検出する検出光の波長帯として設定することを特徴とするスペクトル解析システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、スペクトル解析方法、装置およびシステムに関する。
【背景技術】
【0002】
スペクトル解析装置では、試料に励起光を照射し、試料から検出される光を測定することでスペクトルを得る。スペクトル解析装置の中には励起波長、検出波長、検出強度の3つの軸から構成される3次元スペクトルを得る装置がある。例えば、分光蛍光光度計では蛍光指紋と呼ばれる3次元蛍光スペクトルを測定する。特定波長の励起光を試料に照射すると、励起された試料が様々な波長の蛍光を発する。これを蛍光スペクトルと呼び、各蛍光波長における蛍光の強さを蛍光強度と呼ぶ。試料は励起光の波長を変化させることで異なる蛍光スペクトルを発する。そこで、励起光の波長を順次変えながら蛍光スペクトルを測定することで励起波長、蛍光波長、蛍光強度の3つの軸を持つ3次元スペクトルを得る。前述の検出波長が蛍光波長、検出強度が蛍光強度に相当する。得られた3次元スペクトルの形状を解析することで、試料に含まれる成分の定量や、種類の識別が可能となる。
【0003】
従来のスペクトルデータの解析方法としては、例えば、3次元スペクトル内のピーク値のみを用いて回帰分析を行う手法がある。
また、特許文献1では、蛍光指紋を対象に、矩形の測定窓を設け、測定窓内の蛍光強度の積分値を用いて多変量解析を行う手法が開示されている。
また、特許文献2では、2次元スペクトルデータを対象として、複数の励起波長のそれぞれにおける光吸収特性値(検出強度)を説明変数としたスパース推定を行うことで、推定に用いる励起波長を限定しながら、対象物質の含有量を推定する手法が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2015-180895公報
【特許文献2】特開2018-013418公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ピーク値のみを用いた線形回帰では、ピークが出現する波長帯が判明した後、その波長帯のみを測定し、解析することで、短時間の計測・解析をめざしている。しかし、ピークの情報のみを利用するためピークの幅やピーク間の距離といった空間的な情報を利用した定量/識別が難しい、点状ノイズの影響を受けやすいなどの課題がある。以降、スペクトル解析において、定量および/または識別に用いる波長帯を有効波長帯と呼称する。
【0006】
また、特許文献1に記載の技術は、上記の課題を鑑み、矩形の測定窓を設け、測定窓内の蛍光強度の積分値を用いて多変量解析を行う。これにより測定波長帯を限定しつつ、ノイズの影響を低減することをめざしている。しかし、前記測定窓は手動で設計するか、あるいはランダムに設定した測定窓内の蛍光強度から回帰式を構築し、定量結果に基づいて測定窓を再設定する処理を繰り返し行うことで探索する必要がある。分析対象物の定量/識別に有効な波長帯を目視で判別することは難しく、また、ランダムに試行した場合、測定窓が大きくなり、十分に有効波長帯を限定することが難しい場合がある。よって、短時間での高精度な定量/識別モデルの構築や、効率的な計測を実現する有効波長帯の限定が難しい場合がある。
【0007】
特許文献2に記載の技術は、2次元スペクトルデータ内の全ての検出強度を説明変数としたスパース推定を行うことで、定量/識別に有効な波長帯を自動的に選択する。しかし、選択される波長帯は領域ではなく点であるため、ピーク情報のみを利用した場合と同様に、空間的な情報を抽出しにくい、点状ノイズの影響を受けやすいという課題がある。
【0008】
本発明は上記の課題を鑑みて、3次元スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した高精度な定量および/または識別を実現するスペクトル解析装置、方法およびシステムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために本発明で開示されるスペクトル解析装置は、試料のスペクトルデータを入力として受け付ける入力部と、前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出部と、前記特徴量に基づき、前記試料の特性の推定を行う推定部と、前記推定部によって得られた推定結果を出力する出力部と、を備え、前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、前記波長単位特徴量抽出部は、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、前記推定部は、前記試料の特性を定量および/または識別する推定処理を行うことを特徴とする。
また、本発明で開示されるスペクトル解析方法は、試料のスペクトルデータを入力として受け付ける入力ステップと、前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出ステップと、前記特徴量に基づき、前記試料の特性の推定を行う推定ステップと、前記推定ステップによって得られた推定結果を出力する出力ステップと、を含み、前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、前記波長単位特徴量抽出ステップは、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、前記推定ステップは、前記試料の特性を定量および/または識別する推定処理を行うことを特徴とする。
【発明の効果】
【0010】
本発明によれば、3次元スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した高精度な定量および/または識別を実現し、定量および/または識別に使用する波長帯の励起波長または検出波長単位での限定が可能なスペクトル解析装置、方法およびシステムを提供可能となる。上記した以外の課題、構成および効果は以下の実施の形態の説明により明らかにされる。
【図面の簡単な説明】
【0011】
図1】実施例1に係るスペクトル解析装置のハードウェア構成の一例を示す図である。
図2】実施例1に係るスペクトル解析装置の機能ブロック図の一例を示す図である。
図3】3次元スペクトルデータの一例を示す図である。
図4】波長単位特徴量抽出部への入力方法の一例を示す図である。
図5】実施例1に係るスペクトル解析方法の処理フローの一例を示す図である。
図6】実施例3に係るスペクトル解析装置の機能ブロック図の一例を示す図である。
図7】定量/識別精度と有効波長帯数の関係性の表示例を示す図である。
図8】有効波長帯の表示例を示す図である。
図9】実施例3に係るスペクトル解析方法の処理フローの一例を示す図である。
図10】実施例4に係るスペクトル解析システムのハードウェア構成の一例を示す図である。
図11】実施例2に係るスペクトル解析装置の機能ブロック図の一例を示す図である。
図12】実施例2に係るスペクトル解析方法の処理フローの一例を示す図である。
【発明を実施するための形態】
【0012】
以下、添付図面に従って本発明に係るスペクトル解析方法、装置およびシステムの実施例について説明する。なお、以下の説明および添付図面において、同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【実施例0013】
<スペクトル解析装置のハードウェア構成>
実施例1では、3次元スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した定量/識別、および、定量/識別に使用する波長帯(有効波長帯)の励起波長または検出波長単位での限定が可能なスペクトル解析装置について述べる。
なお、本実施例で3次元スペクトルデータとは、複数の励起波長と分光スペクトル(検出波長と検出強度で構成されるスペクトル)を含み、所定の波長幅で離散化されたデータである。
また、定量/識別とは、定量および/または識別をいい、定量/識別モデルとは、定量と識別の少なくとも一方に用いられるデータ推定用のモデルである。
【0014】
図1を用いて実施例1に係るスペクトル解析装置のハードウェア構成について説明する。スペクトル解析装置100は、インターフェース部110と、演算部111と、メモリ112と、バス113と、を備え、インターフェース部110と、演算部111と、メモリ112は、バス113を介して情報の送受信を行う。
【0015】
スペクトル解析装置100の各部について説明する。
インターフェース部110は、スペクトル解析装置100の外部にある装置と信号の送受信を行う通信機器である。インターフェース部110と送受信を行う装置としては、スペクトル測定装置121の制御を行う制御装置120、3次元スペクトルデータを測定するスペクトル測定装置121、スペクトル解析装置100の処理結果を表示するモニタやプリンタ等の表示装置122がある。
【0016】
演算部111は、スペクトル解析装置100内での各種の処理を実行する装置であり、例えばCPU(Central Processing Unit)やFPGA(Field-Programmable Gate Array)等である。演算部111によって実行される機能については、後述する。
【0017】
メモリ112は、演算部111が実行するプログラムや、定量/識別モデルのパラメタ、処理結果等を保存する装置であり、HDD、SSD、RAM、ROM、フラッシュメモリ等である。
【0018】
<スペクトル解析装置100の機能構成>
図2はスペクトル解析装置100の実施例に係る機能ブロック図の一例である。これらの各機能部は、演算部111上で動作するソフトウェアで実現しても良いし、専用のハードウェアで実現しても良い。
【0019】
スペクトル解析装置100は、機能部として、入力部201と、波長単位特徴量抽出部202と、推定部203と、出力部204と、を含む。以下、各機能部について説明する。
入力部201は、インターフェース部110から入力される、離散化された3次元スペクトルデータを1つ以上受け付ける。
波長単位特徴量抽出部202は、前記3次元スペクトルデータから、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出する。
【0020】
推定部203は、メモリ112に保存された定量/識別モデルの1つを読み込み、前記特徴量に基づいて、定量/識別を行う。
出力部204は、前記定量/識別結果を出力する。定量の場合は、推定した各サンプルの定量結果に加えて、決定係数、RMSE(Root Mean Squared Error)のような定量モデルの評価値を出力しても良いし、検量線等のグラフデータを出力しても良い。識別の場合は、推定した各サンプルの識別結果に加えて、識別率や適合率、再現率等の識別モデルの評価値を出力しても良い。これらの出力はインターフェース部110を介して表示装置122で表示する。
【0021】
尚、上記の各機能は、図2の機能部の通りに構成される必要はなく、各機能ブロックの動作に相当する処理が実現できればよい。図5に実施例1に係る処理フロー図の一例を示す。各ステップは図2に示した機能ブロック図の各要素と対応している。
入力ステップ501は、インターフェース部110から入力される、離散化された3次元スペクトルデータを1つ以上を受け付ける。
波長単位特徴量抽出ステップ502は、前記3次元スペクトルデータから、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出する。
【0022】
推定ステップ503は、メモリ112に保存された定量/識別モデルの1つを読み込み、前記特徴量に基づいて、定量/識別を行う。
出力ステップ504は、前記定量/識別結果を出力する。定量の場合は、推定した各サンプルの定量結果に加えて、決定係数、RMSE(Root Mean Squared Error)のような定量モデルの評価値を出力しても良いし、検量線等のグラフデータを出力しても良い。識別の場合は、推定した各サンプルの識別結果に加えて、識別率や適合率、再現率等の識別モデルの評価値を出力しても良い。
以降、各機能部を主語として詳細な動作について説明するが、各機能部に対応する各ステップを主語として読み替えても差し支えない。
【0023】
<各部の構成と動作>
以下、機能部の内、入力部201、波長単位特徴量抽出部202、推定部203の動作について詳しく説明する。
入力部201は、インターフェース部110を介して離散化された3次元スペクトルデータを受け付け、メモリ112に保存する。
【0024】
図3に蛍光指紋データの一例を示す。離散化蛍光指紋データ300は、離散化して格納された蛍光指紋データの例である。蛍光指紋データ可視化例301は、縦軸に励起光波長、横軸に検出波長を取り、各励起および検出波長の組合せにおける検出強度を等高線状データとして表示した例である。離散化蛍光指紋データ300に示す通り、蛍光指紋データは離散化して測定および記録される。離散化蛍光指紋データ300は励起光/検出光に対して200nmから700nmを5nm間隔で測定した例を示しており、例えば離散化蛍光指紋データ300の1行1列目には励起光200nmに対する検出光200nmの検出強度が、1行2列目には励起光200nmに対する検出光205nmの検出強度が、2行1列目には励起光205nmに対する検出光200nmの検出強度が、それぞれ記録されている。また、離散化蛍光指紋データ300の列数と行数は500nmを5nm間隔で記録しているため100x100となる。
【0025】
蛍光指紋データ可視化例301は離散化蛍光指紋データ300を等高線状データとして二次元画像化した例であり、人間が蛍光指紋データを観察する際は蛍光指紋データ可視化例301のような表示で確認することが多い。尚、等高線状データの他、検出強度を輝度値や色に割当てたグレイ画像やヒートマップ画像、鳥瞰図等で表示する場合もある。蛍光指紋の形状は測定対象となる試料の性質に応じて異なり、この形状の差異に基づいて試料の識別や、特定成分の定量等を行う。
【0026】
波長単位特徴量抽出部202は、前記3次元スペクトルデータから、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出する。これにより検出波長方向あるいは励起波長方向の空間的な特徴量を抽出しつつ、識別や定量に有効な波長を励起あるいは検出波長単位で選択、限定することが可能となる。
【0027】
この本実施例に開示の方法の利点について、2つの参考手法と比較して説明する。第1の参考手法は、各検出強度、すなわち離散化蛍光指紋データ300の各マスの値を説明変数とした回帰を行う手法である。第1の参考手法では、検出強度の内、識別や定量に有効な励起波長と検出波長の組合せにおける検出強度に対して大きな重みを付与することで、回帰式を構築する。回帰式構築以降の識別や定量においては大きな重みを付与された説明変数、すなわち、励起/検出波長の組合せのみを測定することで測定時間が短縮される。しかし、ピーク成分の幅等の空間的な特徴量を抽出することは困難であり、更に点状ノイズが直接的に識別や定量に影響するといった課題がある。
【0028】
第2の参考手法は、CNN(Convolutional Neural Network)を用いて、空間的な特徴量を抽出する手法である。CNNは画像処理の分野で頻繁に利用される、機械学習手法の一つであり、複数のフィルタを自動学習することで特徴量を抽出する。CNNを用いることで空間的な特徴量を抽出でき、点状ノイズに対する頑健性も向上する。しかし、一般的にCNNは2次元データ全体、すなわち離散化蛍光指紋データ300の全マスの値から総合的に特徴量を算出するため、特徴量を算出するために広範囲の波長帯の検出強度が必要となる傾向があり、有効波長帯を限定することが難しい場合がある。
【0029】
これらの参考手法に対し、本実施例に開示の方法では、励起波長、すなわち離散化蛍光指紋データ300の各行、あるいは、検出波長、すなわち離散化蛍光指紋データ300の各列から独立して特徴量抽出を行う。これにより、検出波長方向あるいは励起波長方向の空間的な情報を有し、かつ、点状ノイズに頑健な特徴量を抽出可能となり、更に、励起あるいは検出波長単位で有効波長帯を選択、限定することが可能となる。
【0030】
図4は特徴量抽出範囲の一例を説明する図である。図4(a)は各励起波長帯において全検出波長帯から特徴量を抽出する例、図4(b)は各検出波長帯において全励起波長帯から特徴量を抽出する例、図4(c)は各励起波長帯において一部の検出波長帯から特徴量を抽出する例、図4(d)は各検出波長帯において一部の励起波長帯から特徴量を抽出する例を示している。図4(a)(b)(c)(d)の3次元スペクトルデータ内に描かれた矩形は、特徴量を抽出するための特徴量抽出モデルへの入力単位を表す。波長単位特徴量抽出部202は図4(a)(c)に示すように、励起波長帯毎、あるいは、図4(b)(d)に示すように、検出波長帯毎に独立に特徴量を抽出する。この時、図4(a)(b)に示すように検出または励起波長帯全体から特徴量を抽出しても良いし、図4(c)(d)に示すように検出または励起波長帯の一部のみから特徴量を抽出しても良い。
【0031】
また図4(a)(c)では各励起波長に対して全て同じ検出波長から特徴量を抽出するように図示しているが、励起波長に応じて特徴量を抽出する検出波長帯を変えても良い。例えば蛍光指紋においては、励起波長と検出波長が等しくなる領域を中心に散乱光と呼ばれるノイズが測定されるが、この散乱光の領域を避けるように励起波長に応じて特徴量抽出する領域を変化させてもよい。尚、検出波長と励起波長を入れ替えた場合も同様である。
【0032】
特徴量抽出方式としては例えば1DCNN(1 Dimensional Convolutional Neural Network)等を使用する。1DCNNは1次元データに対するCNNであり、励起波長毎あるいは検出波長毎に複数の特徴量を抽出する。特徴量の学習方法は、例えば特徴量を抽出するための1つ以上の1DCNNと、1DCNNの出力を入力として定量や識別を行う全結合層等を連結し、定量や識別問題毎に作成したデータセットを用いて、機械学習法により1DCNNと全結合層を更新することで特徴量を学習する方法等がある。特徴量の学習方法はこれに限らず、複数のタスクを同時に学習することで共通的な特徴量を学習する方法でも良いし、Auto Encoder等の教師無し学習法を用いて学習しても良い。また、HoG(Histograms of Oriented Gradients)やhaar-like特徴量のようなハンドクラフトの特徴量を用いても良いし、主成分分析や、PLS(Partial Least Squares)のような統計的解析手法を用いても良い。
【0033】
波長単位特徴量抽出部202は、図4のように領域(2つ以上の波長で測定された検出強度)の情報を抽出することで、後述する推定部203において、空間的な情報を活用しつつ、ノイズへの頑健性を向上した定量/識別モデルを提供可能となる。また、図4のように励起波長毎あるいは検出波長毎に独立に特徴量を抽出し、推定部203において、各特徴量を定量/識別の入力とすることで、有効波長帯の限定が可能な定量/識別モデルを提供可能となる。
【0034】
推定部203は、メモリ112に保存された任意の定量/識別モデルを読み込み、波長単位特徴量抽出部202で得られた前記特徴量を定量/識別モデルに入力することで、定量/識別を行う。
【0035】
定量/識別モデルには、Lasso回帰やElastic Net、Group Lassoのようなスパース推定モデルを用いても良いし、Neural Network、ランダムフォレスト、Support Vector Machine等の機械学習モデルを用いても良い。ここではLasso回帰を用いた例を説明する。
【0036】
Lasso回帰では数式1のような回帰式に基づいて推定を行う。ここでxijは波長単位特徴量抽出部202が出力する波長帯単位の特徴量であり、iは励起あるいは検出波長のインデックス、jは特徴量のインデックスを表す。尚、励起あるいは検出波長の数(すなわち離散化蛍光指紋データ300における行数あるいは列数)はN個、各波長から抽出される特徴量はM個であるとする。wijは各特徴量に対する重み、bはバイアス値、y^は回帰モデルの出力を表す。
【数1】
上記wijの最適化を行うために、1組以上の訓練用特徴量と教師信号の組を用いて、数式2aのような回帰式を構成する。ここでxs,ijは波長単位特徴量抽出部202が出力する特徴量であり、sはサンプルのインデックス、i、jは数式1と同様に励起あるいは検出波長のインデックスと、特徴量のインデックスを表す。また、yはサンプルsの教師信号を表す。尚、訓練用特徴量と教師信号の組の数はS個であるとする。数式2bは数式2aの行列ベクトルの表記を省略した式である。
【数2a】
【数2b】
数式2bの回帰式に対し、下記の数式3に基づいてwの最適化を行う。ここでαは正則化強度を表す。数式3の第1項は回帰モデルの出力を教師信号yに近づける効果がある。第2項はL1正則化項であり、重みw内の多くの要素を0に近づける効果がある。その効果の強さは正則化強度αによって決定される。
【数3】
上記のようにLasso解析により回帰式を構築することで、一部の特徴量に係る重みwが0になる。波長帯iに対する全ての特徴量に対応する重みwi1,・・・wiMが0になった場合、波長帯iから得た特徴量は回帰の中で使われないことを意味するため、波長帯iを測定する必要がなくなる。このように回帰の中で使われる特徴量を波長帯単位で限定することで測定時間を短縮することが可能となる。
【0037】
上記の手法により構築した重みwをメモリ112に予め保存しておき、推定部203がスペクトル解析装置100起動時や、重みwの更新時等に重みwを読み込んで、定量/識別処理を実行する。
【0038】
以上のように、波長単位特徴量抽出部202で、各励起波長における2つ以上の検出波長の検出強度、あるいは、各検出波長における2つ以上の励起波長の検出強度から特徴量を抽出し、推定部203で前記特徴量を説明変数とした定量/識別を行うことで、スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した高精度な定量/識別、および、定量/識別に使用する波長帯の励起波長または検出波長単位での限定が可能なスペクトル解析装置、方法を提供可能となる。
【実施例0039】
実施例2では実施例1に記載のスペクトル解析装置に、定量/識別モデルの生成機能を追加することで、ユーザーが独自に設定した定量/識別問題に対して高精度な識別と有効波長帯の選択を可能とするスペクトル解析装置について説明する。
【0040】
<スペクトル解析装置のハードウェア構成>
実施例2に係るスペクトル解析装置のハードウェア構成は、図1に示した実施例1に係るスペクトル解析装置のハードウェア構成と同様の構成であるため、説明を省略する。
【0041】
<スペクトル解析装置の機能構成>
図11は実施例2に係るスペクトル解析装置の機能ブロック図の一例である。
スペクトル解析装置1100は、機能部として、入力部1101と、波長単位特徴量抽出部202と、推定部1103と、出力部204と、を含む。波長単位特徴量抽出部202と、出力部204は実施例1と同様であるため説明を省略する。以下、入力部1101と、推定部1103について説明する。
入力部1101は、インターフェース部110を介して3次元スペクトルデータ単体、または3次元スペクトルデータと教師情報の組を受け付ける。
推定部1103は、メモリ112に保存された複数の3次元スペクトルデータと教師情報の組を使用して、定量/識別モデルを生成する。
【0042】
尚、上記の各機能は、図11の機能部の通りに構成される必要はなく、各機能ブロックの動作を実現する処理が実現できればよい。図12に実施例2に係る処理フロー図の一例を示す。各ステップは図11に示した機能ブロック図の各要素と対応している。
図12の波長単位特徴量抽出ステップ502、出力ステップ504は、実施例1に記載のステップと同様のため、説明を省略する。
入力ステップ1201は、インターフェース部110を介して3次元スペクトルデータ単体、または3次元スペクトルデータと教師情報の組を受け付ける。
推定ステップ1203は、メモリ112に保存された複数の3次元スペクトルデータと教師情報の組を使用して、定量/識別モデルを生成する。
以降、各機能部を主語として詳細な動作について説明するが、各機能部に対応する各ステップを主語として読み替えても差し支えない。
【0043】
<各部の構成と動作>
入力部1101と推定部1103の動作について詳細に説明する。
入力部1101は、インターフェース部110を介して3次元スペクトルデータ単体、または3次元スペクトルデータと教師情報の組を受け付ける。3次元スペクトルデータ単体を受け付けた場合には、入力部1101は実施例1に記載の入力部201と同様の処理を行う。3次元スペクトルデータと教師情報の組を受け付けた場合には、入力部1101は受け付けた3次元スペクトルデータと教師情報の組をメモリ112に保存する。
【0044】
推定部1103はある一定の条件を満たした場合に、メモリ112に保存された複数の3次元スペクトルデータと教師情報の組を使用して、定量/識別モデルを生成する。定量/識別モデルの生成を開始する条件は、メモリ112内に新たに保存された3次元スペクトルデータの教師情報の組が予め定めた数を超えた場合や、インターフェース部110を介してユーザーから要求があった場合、あるいは予め定めた時間が経過する度に定量/識別モデルを更新する等でも良い。
【0045】
実施例1で説明した通り、定量/識別モデルとしてはLasso回帰やElastic Net、Group Lassoのようなスパース推定モデルを用いても良いし、Neural Network、ランダムフォレスト、Support Vector Machine等の機械学習モデルを用いても良い。ここでは例としてLasso回帰を用いた例について説明する。
【0046】
実施例1で説明した通り、Lasso回帰は数式2bに示す回帰式を構築し、数式3に示す制約に基づいて重みwを導出する。ここで前述した複数の3次元スペクトルデータと教師情報の組の内、3次元スペクトルデータ群をX、それに対応する教師情報群をyとして、数式3を満たす重みwを導出する。重みの導出にはLasso回帰の解法の一つであるISTA(Iterative Shrinkage Thresholding Algorithm)等を用いる。これによりユーザーが独自に収集したデータセットを用いて、定量/識別モデルを構築することが可能となる。また、他のスパース推定モデルや回帰モデルを用いた場合でも同様の方法により定量/識別モデルを構築することが可能である。また、機械学習モデルを用いた場合には、3次元スペクトルデータ群とそれに対応する教師情報群を用いて、各機械学習アルゴリズムに則って、定量/識別モデルを学習する。
尚、定量/識別モデルの重みの初期値は、固定値やランダムな値を設定しても良いし、正規分布等の確率分布に従って設定しても良いし、メモリ112に保存された定量/識別モデルの重みを設定しても良い。
【0047】
尚、波長単位特徴量抽出部202において、特徴量抽出モデルとしてNeural Network等の機械学習手法や、主成分分析、PLS等の統計的解析手法を用いている場合には、定量/識別モデルだけでなく、特徴量抽出モデルを前述の複数の3次元スペクトルデータ、あるいは複数の3次元スペクトルデータと教師情報の組を用いて更新しても良い。
【0048】
例えば機械学習手法の一種であるAuto Encoderや、統計的解析手法の一種である主成分分析を用いる場合、特徴量抽出モデルの更新には教師情報は不要である。よって、複数の3次元スペクトルデータのみを使用して教師無し学習、あるいは統計分析することで特徴量を更新する。また、例えば実施例1で説明した機械学習手法の一種である1DCNNや、統計的解析手法の一種であるPLSを用いる場合、複数の3次元スペクトルデータと教師信号の組を使用して教師有り学習、あるいは、教師情報を応答変数とした統計分析を実行することで特徴量抽出モデルを更新する。
【0049】
上記によりユーザーが独自に収集したデータセットを用いて、定量/識別モデルを構築することが可能となり、ユーザーが独自に設定した定量/識別問題に対して高精度な識別と有効波長帯の選択が可能なスペクトル解析装置および方法を提供可能となる。
【実施例0050】
実施例3では実施例2に記載のスペクトル解析装置100に、有効波長帯を自動決定あるいはユーザーによる有効波長帯の決定支援機能を追加したスペクトル解析装置について説明する。
【0051】
<スペクトル解析装置のハードウェア構成>
実施例3に係るスペクトル解析装置のハードウェア構成は、図1に示した実施例1に係るスペクトル解析装置のハードウェア構成と同様の構成であるため、説明を省略する。
【0052】
<スペクトル解析装置の機能構成>
図6は実施例3に係るスペクトル解析装置の機能ブロック図の一例である。
スペクトル解析装置600は、機能部として、入力部601と、波長単位特徴量抽出部202と、推定部1103と、出力部604と、有効波長帯探索部605と、を含む。波長単位特徴量抽出部202は実施例1と同様であり、推定部1103は実施例2と同様であるため説明を省略する。以下、入力部601と、有効波長帯探索部605と、出力部604について説明する。
【0053】
入力部601は、実施例2に記載の入力部1101と同様に、インターフェース部110を介して3次元スペクトルデータ単体、または3次元スペクトルデータと教師情報の組を受け付ける。また、必要に応じて、後述の有効波長帯探索部605から有効波長帯を受け付け、波長単位特徴量抽出部202に対して出力するスペクトルデータを加工する。
有効波長帯探索部605は、前記推定部1103で構築した定量/識別モデルの重みに基づいて、有効波長帯を自動決定、あるいは、ユーザーによる有効波長帯の決定支援を行う。
出力部604は、定量/識別結果と共に前記有効波長帯探索部605で決定した有効波長帯を表示し、必要に応じて、ユーザーによる有効波長帯の決定支援のための情報の出力を行う。
【0054】
尚、上記の各機能は、図6の機能部の通りに構成される必要はなく、各機能ブロックの動作を実現する処理が実現できればよい。図9に実施例3に係る処理フロー図の一例を示す。各ステップは図6に示した機能ブロック図の各要素と対応している。
【0055】
図9に記載の波長単位特徴量抽出ステップ502は実施例1と同様であり、推定ステップ1203は実施例2と同様であるため説明を省略する。
入力ステップ901は、実施例2に記載の入力ステップ1201と同様に、インターフェース部110を介して3次元スペクトルデータ単体、または3次元スペクトルデータと教師情報の組を受け付ける。また、必要に応じて、後述の有効波長帯探索ステップ905から有効波長帯を受け付け、波長単位特徴量抽出ステップ502に対して出力するスペクトルデータを加工する。
有効波長帯探索ステップ905は、前記推定ステップ1203で構築した定量/識別モデルの重みに基づいて、有効波長帯を自動決定、あるいは、ユーザーによる有効波長帯の決定支援を行う。
出力ステップ904は、定量/識別結果と共に前記有効波長帯探索ステップ905で決定した有効波長帯を表示し、必要に応じて、ユーザーによる有効波長帯の決定支援のための情報の出力を行う。
以降、各機能部を主語として詳細な動作について説明するが、各機能部に対応する各ステップを主語として読み替えても差し支えない。
【0056】
<各部の構成と動作>
入力部601は、インターフェース部110を介して3次元スペクトルデータ単体、または3次元スペクトルデータと教師情報の組を受け付け、実施例2に記載の入力部1101と同様の処理を行う。また、有効波長帯探索部605が出力する有効波長帯情報を受け付け、3次元スペクトルデータから、有効波長帯に対応するスペクトルデータのみを波長単位特徴量抽出部202に入力することで、特徴量抽出時間の短縮を行っても良い。
【0057】
有効波長帯探索部605は、推定部1103が構築した定量/識別モデルの重みに基づいて、励起波長あるいは検出波長単位の有効波長帯の自動決定を行い、有効波長帯を出力するか、あるいはユーザーによる有効波長帯の決定を支援する情報を出力部604およびインターフェース部110を介して表示装置122に表示する。
【0058】
まず、有効波長帯の自動決定方法について説明する。推定部1103においては実施例2で説明した通り、Lasso回帰やElastic Net、Group Lasso等のスパース推定モデルや、Neural Network、ランダムフォレスト、Support Vector Machine等の機械学習モデルを使用して定量/識別モデルを構築する。例えばLasso回帰やElastic Net、Group Lassoのようなスパース推定手法を用いた場合、複数の説明変数(特徴量)に乗じられる係数の値が0となる特徴を持つため、0でない係数に対応する特徴量が抽出された励起あるいは検出波長帯が定量/識別に使用される波長帯となる。そこで、有効波長帯探索部605は推定部1103が構築した定量/識別モデルの重みの値を受け付け、重みの値に基づいて有効波長帯を決定する。例えば定量/識別モデルとしてLasso回帰を用いた場合、数式1におけるw11,w12・・・wnmの値を受け付け、波長iから抽出した特徴量に対応する重みwi0,・・・wimが一つでも0以外の値を持つ場合は波長iを有効波長帯とし、重みwi0,・・・wimが全て0である場合、波長iを有効波長帯から除外する。また、ランダムフォレストや勾配ブースティングのような決定木を用いた場合、重要度が高い順に任意の数の説明変数を選択し、その説明変数に対応する波長を有効波長帯として選択する。
【0059】
また、スパースネスを制御するためのハイパーパラメタ等を自動決定する方法についても説明する。例えばLasso回帰では、前述の正則化強度αの値によって0となる特徴量の数が変化する。αが大きな値になるほど0になる特徴量の数が多くなるため、有効波長帯数をより少なくできるが、識別に使用される特徴量の数が減少するため、αが大きな値になるほど定量/識別精度が低下する傾向がある。αの強度を決定するために、例えばユーザーからキャリブレーション用に複数の3次元スペクトルデータと教師情報の組を受け付け、メモリ112に格納しておく。αを変化させながらキャリブレーション用データで評価を行い、キャリブレーション用データに対して、予め定めた、あるいはユーザーが指定した閾値以上の精度を維持しつつ、有効波長帯が最も少ない数となるαを採用する、あるいは、閾値以下の有効波長帯、かつ、識別精度が最も高くなるαを採用する等の方法により、αを自動決定する。Lasso回帰に限らず、キャリブレーション用データに対する定量/識別精度に基づいてハイパーパラメタを自動決定することが可能である。
【0060】
また、Neural Networkの一種であるFully Connected layerやSupport Vector Machineを用いた場合の有効波長帯決定方法について説明する。Fully Connected layerやSupport Vector Machineは、重みの最適化方法こそLasso回帰等とは異なるが、定量/識別結果が数式1に則して算出される点は同様である。そこで、有効波長帯探索部605は、例えば定量/識別モデルの重みを、重みの絶対値が大きい順にソートし、上位の重みが対応する特徴量および波長帯を抽出することで有効波長帯を決定する。例えば、有効波長帯として採用される波長帯を決定するための閾値THを設け、閾値THを超える絶対値を有する重みに対応する波長帯を有効波長帯として採用する。また、有効波長帯の決定方法はこれに限らず、例えば絶対値に関するソート結果の順位に対する閾値THを設けて、絶対値のソート結果の上位1番目からTH番目までの重みに対応する波長帯を有効波長帯として採用してもよいし、絶対値のソート結果の割合に対する閾値THを設けて、上位TH%までの重みに対応する波長帯を採用する等してもよい。また、前記閾値TH、TH、TH等は前述のスパースネスを制御するためのハイパーパラメタに相当しているため、前述のハイパーパラメタ自動決定方法が閾値TH、TH、TH等にも適用可能である。尚、採用した有効波長帯に対応するスペクトルデータのみを用いて、定量/識別モデルを再更新しても良い。
【0061】
以上の方法により定量/識別モデルの重みに基づいて有効波長帯を自動決定することが可能となる。
また、有効波長帯探索部605は励起波長毎または検出波長毎のどちらから特徴量を抽出すべきかを自動決定しても良い。決定方法としては、上述したキャリブレーションデータを用いる方法がある。複数の3次元スペクトルデータと教師情報の組から構成されるキャリブレーションデータを用いて、励起波長毎に特徴量を抽出する方式と検出波長毎に特徴量を抽出する方式の、定量/識別精度と有効波長帯数をそれぞれ得る。両者の定量/識別精度と有効波長帯数に基づいてどちらの方式を採用するかを自動決定する。自動決定方法としては単純に定量/識別精度が高い方式を採用しても良いし、予め定めた、あるいはユーザーが指定した閾値以上の定量/識別精度、かつ、最も有効波長帯数が少ない方式を採用しても良いし、予め定めた、あるいはユーザーが指定した有効波長帯数以下で最も定量/識別精度が高い方式を採用する等でも良い。
【0062】
次にユーザーによる有効波長帯の決定を支援する方法について説明する。前述の通り、定量/識別モデル構築のためには、例えばスパースネスを制御するためのハイパーパラメタや、特徴量抽出方式を決定する必要がある。例えばLasso回帰ではハイパーパラメタとして正則化強度αを決定する必要がある。前述の通り、αが大きな値になるほど有効波長帯数は減少するが、定量/識別精度も低下する傾向がある。ユーザーが適切なαを決定するために、必要な情報を提示する。例えば前述のキャリブレーションデータを用いて、αの値を変化させた際の有効波長帯数と定量/識別精度をプロットし、図7に示すような有効波長帯数と定量/識別精度の関係を示すグラフを生成し、後述の出力部604を介してユーザーに提示する。図7の例はLasso回帰における有効波長帯と定量/識別精度の関係を表したグラフであり、ユーザーがインターフェース部110を介して、マウス等によりグラフから一つの定量/識別モデルを選択することを想定している。選択した定量/識別モデルにおける正則化強度α、定量/識別精度、有効波長帯数を、“α”、“Accuracy”、“Wavelength”に表示している。これによりユーザーは要求される測定時間と定量/識別精度を加味してハイパーパラメタの値を選択することが可能となる。また、励起波長毎に特徴量を抽出した場合と、検出波長毎に特徴量を抽出した場合の両方の有効波長帯数と定量/識別精度の関係を示すグラフを提示することで、ユーザーが励起波長毎または検出波長毎のどちらから特徴量を抽出すべきかを選択することを支援可能となる。また、正則強度αのようなハイパーパラメタを持たない定量/識別モデルを採用する場合、励起波長毎に特徴量を抽出した場合と、検出波長毎に特徴量を抽出した場合の定量/識別精度をユーザーに提示し、どちらの特徴量抽出方式を採用するかをユーザーに決定させる形態でもよい。
【0063】
出力部604は、インターフェース部110を介して表示装置122に、定量/識別精度や、有効波長帯の数、具体的な波長帯等を表示する。図8に有効波長帯表示例を示す。図8の例では励起波長200nm、220nm、290nm、315nmが有効波長帯として選択されたことを表している。また、上述の通り、有効波長帯決定支援のために図7のような有効波長帯と定量/識別精度の関係を示すGUIをユーザーに提示しても良い。
【実施例0064】
実施例4では実施例3に記載のスペクトル解析装置600を用いることで3次元スペクトルデータの高精度な定量/識別を実現しつつ、励起波長または検出波長単位での有効波長帯の探索により測定時間の短縮を実現するスペクトル解析システムについて説明する。実施例4に記載のスペクトル解析システムは、ユーザーから与えられた訓練用データセットを用いて定量/識別モデルを構築し、有効波長帯を探索する訓練フェーズと、評価用試料に対して訓練フェーズで特定した有効波長帯のスペクトルのみを測定し、訓練フェーズで構築した定量/識別モデルを用いて、定量/識別を行う評価フェーズの2つのフェーズを有する。以下、ハードウェア構成について説明した後に、各フェーズに分けて詳細を説明する。
【0065】
<スペクトル解析システム1000のハードウェア構成>
実施例4に係るハードウェア構成図を図10に示す。実施例4に係るスペクトル解析システム1000は、制御装置120と、スペクトル測定装置121と、スペクトル解析装置600と、表示装置122から構成される。
【0066】
制御装置120は、後述するスペクトル測定装置121において、試料に照射する励起光の波長帯および、試料が反射・透過・吸収する光の検出波長帯を設定する。
スペクトル測定装置121は、訓練用試料および評価用試料に対し、制御装置120で設定された波長に対応するスペクトルを測定し、離散化した3次元スペクトルデータをスペクトル解析装置600に入力する。
スペクトル解析装置600は、実施例3に記載のスペクトル解析装置であり、訓練フェーズではスペクトル測定装置121が出力する訓練用試料の3次元スペクトルデータとユーザーから入力される教師情報の組から訓練用データを構築し、訓練用データセットを用いて定量/識別モデルの生成および有効波長帯の探索を行う。また、評価フェーズでは訓練フェーズで生成した定量/識別モデルを用いて、スペクトル測定装置121が出力する評価用試料の3次元スペクトルデータ(評価用データ)を入力とした定量/識別を行う。
表示装置122は、スペクトル解析装置600が出力した有効波長帯および定量/識別結果をユーザーに提示する。
【0067】
各装置は、訓練用試料を元に定量/識別モデルの構築および有効波長帯の決定を行う訓練フェーズと、評価用試料の定量/識別を行う推定フェーズで動作が異なる。そのため、訓練フェーズと推定フェーズに分けて各装置の動作を説明する。
【0068】
<各装置の動作(訓練フェーズ)>
制御装置120は、スペクトル解析装置600において、訓練用試料に照射する励起光の波長帯および試料から検出する反射光・透過光・吸収光等の検出波長帯を設定する。訓練フェーズにおいては、有効波長帯の候補となりうる励起波長帯および検出波長帯全体を測定波長帯として設定する。
【0069】
スペクトル測定装置121は、訓練用データを取得するための訓練用試料に対してスペクトルを測定し、離散化した3次元スペクトルデータを取得し、スペクトル解析装置600に入力する。
スペクトル解析装置600は、スペクトル測定装置121で測定された訓練用試料の3次元スペクトルデータおよび3次元スペクトルデータに対する教師情報を受け付け、訓練用データセットとしてスペクトル解析装置600内のメモリ112に格納する。メモリ112に格納した訓練用データセットを用いて実施例2に記載の方法で、定量/識別モデルを構築する。また、実施例3に記載の方法により、有効波長帯を自動決定する、あるいは表示装置122を介してユーザーに情報を提示して、有効波長帯決定を支援する。決定した有効波長帯を制御装置120に送信し、評価フェーズにおいて測定する励起波長帯あるいは検出波長帯として設定する。
【0070】
表示装置122は、スペクトル解析装置600が出力する訓練用データセットに対する定量/識別精度や、図8に示したような有効波長帯の数、具体的な波長帯等をユーザーに提示するためのGUIを表示する。また、実施例3にて説明した通り、図7のような有効波長帯決定支援のためのGUIをユーザーに提示しても良い。
【0071】
<各装置の動作(評価フェーズ)>
制御装置120は、評価用試料に照射する励起光の波長帯および試料から検出する反射光・透過光・吸収光等の波長帯として訓練フェーズにおいてスペクトル解析装置600が出力した有効波長帯を設定する。
スペクトル測定装置121は、評価用試料に対し、制御装置120で設定された波長に対応するスペクトルを測定し、訓練フェーズと同様の方法で離散化した3次元スペクトルデータを取得し、スペクトル解析装置600に入力する。
【0072】
スペクトル解析装置600は、スペクトル測定装置121で測定された評価用試料の3次元スペクトルデータを受け取り、訓練フェーズにて構築した定量/識別モデルを用いて実施例1に記載の方法で、定量/識別を行う。
表示装置122は、スペクトル解析装置600が出力した評価用試料の定量/識別結果をユーザーに提示する。また、必要に応じて取得したスペクトルを可視化して表示する等してもよい。
【0073】
<変形例>
各実施例において、入力部201(601、1101)は、離散化された3次元スペクトルデータを受け付けた後、前記3次元スペクトルデータに対し、任意の前処理を行っても良い。例えば、複数のスペクトルデータの波長帯毎の平均や標準偏差等の統計量に基づく中心化や標準化処理、High-Pass FilterやLow-Pass Filter、Band-Pass Filter等の周波数フィルタリング、線形/非線形関数を適用しても良いし、前述の散乱光のような特定領域の検出強度や一定以上の値の検出強度を固定値に置換しても良い。また、このような前処理を波長単位特徴量抽出部202にて実施しても良い。
【0074】
実施例2において、ユーザーの独自データを用いた定量/識別モデルの生成方法について説明したが、ユーザーにより提供された訓練データセットに対して、任意のデータ拡充方式を用いて、訓練用データセットの水増しを行っても良い。データ拡充方式としては例えば、ランダムノイズの付与、複数のスペクトルデータの重み付き線形和、値域の変動等がある。拡充データを訓練用データセットに追加して定量/識別モデルを作成しても良いし、拡充データだけを用いて定量/識別モデルを作成しても良い。また、拡充データをキャリブレーションデータとして利用する、あるいは、キャリブレーションデータを拡充することで、より詳細な評価を行っても良い。
【0075】
各実施例において、波長単位特徴量抽出部202は、励起波長あるいは検出波長単位で入力される2つ以上の検出強度と別の情報を組合わせて特徴量を抽出しても良い。例えばスペクトルデータの微分値、各検出強度の座標情報(励起波長と検出波長の組の情報)、光吸収特性、実験条件、実験環境等を組合わせても良い。
【0076】
実施例2において、ユーザーが独自に設定した定量/識別問題に対して新たな定量/識別モデルを生成する方法について説明したが、訓練データとは別にキャリブレーションデータを用意して、新たに生成したモデルと、メモリ112内に既に保存されているモデルを評価し、その評価結果に基づいて、どのモデルを採用するかを決定しても良い。前記評価結果は定量/識別結果だけでなく、有効波長帯数等を含んでも良く、例えば予め定めた定量/識別精度以上かつ最も有効波長帯数が低いモデルや、予め定めた有効波長帯数以下かつ最も定量/識別精度が高いモデルを選択する方法でも良いし、定量/識別精度と有効波長帯数から算出される何らかの指標に基づいて選択する方法でも良い。また、評価結果をユーザーに提示して、どのモデルを採用するかを決定させても良い。
【0077】
実施例3では、推定部1103が新たな定量/識別モデルを構築した際に、有効波長帯を探索する方法について説明したが、メモリ112内に予め保存した定量/識別モデルを用いて有効波長帯を探索し、図8で示すように有効波長帯をユーザーに提示する等してもよい。
【0078】
実施例4において、訓練用データとしてスペクトル測定装置121が測定した3次元スペクトルデータを使用する方法を説明したが、事前に準備した3次元スペクトルデータをメモリ112に保存しておき、訓練用データの一部として用いても良い。
【0079】
各実施例において、入力部201(601、1101)は、離散化された3次元スペクトルデータを受け付けた後、最近傍補間法や線形補間法による拡大・縮小処理を施しても良い。例えば、実施例4において、1nm間隔で測定した離散化蛍光指紋データ300を訓練用データセットとして定量/識別モデルを構築した後で、5nm間隔で測定した評価用データに対して定量/識別を行う必要が発生した場合、入力部201は、評価用データの離散化蛍光指紋データ300に対し、高さ(励起波長帯数)、幅(検出波長帯数)が5倍となるように、拡大処理を行うことで訓練用データセットで生成した定量/識別モデルを適用しても良い。縮小処理を行う場合も同様である。尚、前記拡大・縮小処理を推定部203(1103)で行っても良い。例えば、上記離散化蛍光指紋データ300の例において、推定部203(1103)は、波長単位特徴量抽出部202によって得られた、前記離散化蛍光指紋データ300の励起波長あるいは検出波長単位の特徴量を、波長帯方向あるいは検出波長帯方向のサイズが5倍となるように拡大処理を行うことで訓練用データセットで生成した定量/識別モデルを適用しても良い。縮小処理を行う場合も同様である。
【0080】
上述してきたように、開示のスペクトル解析装置は、試料のスペクトルデータを入力として受け付ける入力部201と、前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出部202と、前記特徴量に基づき、前記試料の特性の推定を行う推定部203と、前記推定部203によって得られた推定結果を出力する出力部204と、を備える。前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、前記波長単位特徴量抽出部202は、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、前記推定部203は、前記試料の特性を定量および/または識別する推定処理を行うことを特徴とする。
かかる構成および動作により、3次元スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した高精度な定量および/または識別を実現し、定量および/または識別に使用する波長帯の励起波長または検出波長単位での限定が可能となる。
【0081】
また、実施例2に開示したように、入力部1101は、前記スペクトルデータと、スペクトルデータに対応する教師情報の組を1組以上受け付け、前記推定部1103は、前記波長単位特徴量抽出部202が前記スペクトルデータから抽出した特徴量と前記教師情報とに基づいて前記定量および/または識別のモデルを構築することができる。
かかる構成によれば、定量や識別に用いるモデルを適宜構築可能である。
【0082】
また、実施例3に開示したように、推定部1103によって得られた、前記定量および/または識別モデルのパラメタに基づいて、前記定量および/または識別に使用する特徴量に対応する波長帯である有効波長帯を探索する有効波長帯探索部605を更に有してもよい。前記有効波長帯探索部605は、前記波長単位特徴量抽出部202において、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合は励起波長単位で、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合は検出波長単位で有効波長帯を探索し、前記出力部604は、前記推定結果に加えて、前記有効波長帯探索部605が探索した前記有効波長帯を出力する。
かかる構成および動作によれば、定量や識別の結果に加え、定量や識別に有効な波長帯の情報を得ることができる。
【0083】
また、前記波長単位特徴量抽出部202は、複数の訓練データセットを解析あるいは学習することで、複数の定量および/または識別に共通して使用可能な特徴量を抽出してもよい。
かかる動作によれば、各種の推定に共用可能な特徴量を得ることができ、各種の推定を効率的に行うことができる。
【0084】
また、有効波長帯探索部605は、前記波長単位特徴量抽出部202において、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合と、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合の、定量および/または識別精度と有効波長帯数を評価情報として取得し、前記評価情報に基づいて有効波長帯を自動決定、あるいは、前記評価情報をユーザーに提示することでユーザーによる有効波長帯決定を支援する。
このため、所望の識別精度に応じた適正な数の有効波長帯を用いて、効率的に定量や識別を行うことができる。
【0085】
また、前記有効波長帯探索部605は、前記推定部1103における定量および/または識別精度と有効波長帯数に影響を及ぼすハイパーパラメタを変化させた場合の、定量および/または識別精度と有効波長帯数の関係を評価情報として取得し、前記評価情報に基づいて前記ハイパーパラメタの値を自動決定、あるいは、前記評価情報をユーザーに提示し、ユーザーによる前記ハイパーパラメタの値の決定を支援する。
このため、所望の識別精度に応じたハイパーパラメタを適正に設定し、効率的に定量や識別を行うことができる。
【0086】
また、前記入力部601は、前記有効波長帯探索部605が出力した前記有効波長帯を受け付け、入力として受け付けたスペクトルデータの内、前記有効波長帯に対応するスペクトルのみを前記波長単位特徴量抽出部202に出力する。
このため、有効波長帯を以降の特徴量抽出処理および推定処理に適用し、特徴量抽出処理および推定処理の効率化を実現できる。
【0087】
また、開示のシステムは、試料に照射する励起光の波長帯と、検出光の波長帯を設定する制御装置120と、前記試料に対して、前記制御装置において設定した波長帯に対応するスペクトルデータを測定するスペクトル測定装置121と、前記スペクトル測定装置121により測定されたスペクトルデータを解析するスペクトル解析装置600と、前記スペクトル解析装置で得られた推定結果を表示する表示装置122と、を有する。前記スペクトル解析装置600は、試料のスペクトルデータを入力として受け付ける入力部601と、前記スペクトルデータから、前記試料の特徴量を抽出する波長単位特徴量抽出部202と、前記特徴量に基づき、前記試料の特性の推定を行う推定部1103と、前記推定部1103によって得られた推定結果を出力する出力部604と、を備える。前記スペクトルデータは、複数の励起波長と当該励起波長に対する検出波長および検出強度を示す分光スペクトルとを含み、所定の波長幅で離散化されたデータであり、前記波長単位特徴量抽出部202は、各励起波長帯における2つ以上の検出波長帯の検出強度、あるいは、各検出波長帯における2つ以上の励起波長帯の検出強度から特徴量を抽出し、前記推定部1103は、前記試料の特性を定量および/または識別する推定処理を行う。
このように、スペクトル解析装置を有するシステムは、3次元スペクトルデータ内の空間的な情報を活用しつつ、ノイズの影響を低減した高精度な定量および/または識別を実現し、定量および/または識別に使用する波長帯の励起波長または検出波長単位での限定が可能となる。
【0088】
また、前記スペクトル解析装置600は、前記推定部1103によって得られた、前記定量および/または識別モデルのパラメタに基づいて、前記定量および/または識別に使用する特徴量に対応する波長帯である有効波長帯を探索する有効波長帯探索部605を更に有し、前記有効波長帯探索部605は、前記波長単位特徴量抽出部202において、各励起波長帯における2つ以上の検出波長帯の検出強度毎に特徴量を抽出した場合は励起波長単位で、各検出波長帯における2つ以上の励起波長帯の検出強度毎に特徴量を抽出した場合は検出波長単位で有効波長帯を探索し、前記出力部604は、前記推定結果に加えて、前記有効波長帯探索部605が探索した前記有効波長帯を出力する。前記制御装置120は、前記スペクトル解析装置600が出力した前記有効波長帯を受け付け、前記有効波長帯を、前記試料に照射する励起光の波長帯、あるいは検出する検出光の波長帯として設定する。
かかる構成および動作によれば、スペクトル測定装置121がスペクトルデータの取得に要する時間を短縮することができる。
【0089】
なお、本発明は上記の実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、かかる構成の削除に限らず、構成の置き換えや追加も可能である。
【符号の説明】
【0090】
100:スペクトル解析装置、110:インターフェース部、111:演算部、112:メモリ、113:バス、120:制御装置、121:スペクトル測定装置、122:表示装置、201:入力部、202:波長単位特徴量抽出部、203:推定部、204:出力部、300:離散化蛍光指紋データ、301:蛍光指紋データ可視化例、500:スペクトル解析方法、501:入力ステップ、502:波長単位特徴量抽出ステップ、503:推定ステップ、504:出力ステップ、600:スペクトル解析装置、601:入力部、604:出力部、605:有効波長帯探索部、900:スペクトル解析方法、901:入力ステップ、904:出力ステップ、905:有効波長帯探索ステップ、1000:スペクトル解析システム、1100:スペクトル解析装置、1101:入力部、1103:推定部、1200:スペクトル解析方法、1201:入力ステップ、1203:推定ステップ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12