IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人福島大学の特許一覧 ▶ 独立行政法人日本原子力研究開発機構の特許一覧 ▶ 株式会社化研の特許一覧

<>
  • 特開-化合物同定方法及び化合物同定装置 図1
  • 特開-化合物同定方法及び化合物同定装置 図2
  • 特開-化合物同定方法及び化合物同定装置 図3
  • 特開-化合物同定方法及び化合物同定装置 図4
  • 特開-化合物同定方法及び化合物同定装置 図5
  • 特開-化合物同定方法及び化合物同定装置 図6
  • 特開-化合物同定方法及び化合物同定装置 図7
  • 特開-化合物同定方法及び化合物同定装置 図8
  • 特開-化合物同定方法及び化合物同定装置 図9
  • 特開-化合物同定方法及び化合物同定装置 図10
  • 特開-化合物同定方法及び化合物同定装置 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023149303
(43)【公開日】2023-10-13
(54)【発明の名称】化合物同定方法及び化合物同定装置
(51)【国際特許分類】
   G01N 21/71 20060101AFI20231005BHJP
【FI】
G01N21/71
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022057807
(22)【出願日】2022-03-31
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 第7回次世代イニシアティブ廃炉技術カンファレンス(NDEC-7) 2022年3月11日開催
(71)【出願人】
【識別番号】505089614
【氏名又は名称】国立大学法人福島大学
(71)【出願人】
【識別番号】505374783
【氏名又は名称】国立研究開発法人日本原子力研究開発機構
(71)【出願人】
【識別番号】000140627
【氏名又は名称】株式会社化研
(74)【代理人】
【識別番号】110001922
【氏名又は名称】弁理士法人日峯国際特許事務所
(72)【発明者】
【氏名】藤本 勝成
(72)【発明者】
【氏名】横田 裕海
(72)【発明者】
【氏名】阿部 雄太
(72)【発明者】
【氏名】川上 智彦
【テーマコード(参考)】
2G043
【Fターム(参考)】
2G043AA01
2G043HA01
2G043JA01
2G043KA01
2G043KA02
2G043KA03
2G043KA08
2G043KA09
(57)【要約】
【課題】未知試料に含まれる金属元素や化合物を分類・推定する方法を提供する。
【解決手段】本発明である化合物同定方法は、想定される化合物種の標準試料についてスペクトルデータを因子分解して因子及び前記因子の影響度を表す因子スコアを導出し、前記化合物種を決定木において前記因子スコアで分類するためのスコア閾値及び前記因子スコアを前記決定木にかける因子適用順を予め学習・設定しておき、未知試料のスペクトルデータに対して前記標準試料の因子を用いて前記未知試料における因子スコアを算出し、前記因子適用順にしたがって前記決定木で前記未知試料の因子スコアを前記スコア閾値によって分類していくことにより、前記未知試料に含まれる化合物種を同定する、ことを特徴とする。
【選択図】図1
【特許請求の範囲】
【請求項1】
想定される化合物種の標準試料についてスペクトルデータを因子分解して因子及び前記因子の影響度を表す因子スコアを導出し、前記化合物種を決定木において前記因子スコアで分類するためのスコア閾値及び前記因子スコアを前記決定木にかける因子適用順を予め学習・設定しておき、
未知試料のスペクトルデータに対して前記標準試料の因子を用いて前記未知試料における因子スコアを算出し、前記因子適用順にしたがって前記決定木で前記未知試料の因子スコアを前記スコア閾値によって分類していくことにより、前記未知試料に含まれる化合物種を同定する、
ことを特徴とする化合物同定方法。
【請求項2】
前記スペクトルデータは、測定値が推定値を上回ったときより下回ったときに誤差が厳しく評価されるように罰則項付き非対称最小二乗法で近似させたベースラインに補正される、
ことを特徴とする請求項1に記載の化合物同定方法。
【請求項3】
前記因子分解は、前記スペクトルデータの波長次元Kと試料数NからなるK行N列の行列を、指定されたM個の非負値基底ベクトルで分解して得られた前記因子の影響度を前記因子スコアとして導出する、
ことを特徴とする請求項1又は2に記載の化合物同定方法。
【請求項4】
前記決定木は、前記化合物種を分類するときに、不純度を用いたコスト関数が最小値となるような因子とスコア閾値を導出しておく、
ことを特徴とする請求項1乃至3の何れか一に記載の化合物同定方法。
【請求項5】
請求項1乃至4の何れか一に記載の化合物同定方法を実行する、
ことを特徴とする化合物同定装置。
【請求項6】
前記試料にレーザーを照射する照射装置と、
前記レーザーが照射された前記試料から放出された光を分解する分光器と、
前記分光器で生成されたスペクトルデータを取得する検出器と、を有し、
前記検出器から入力されたスペクトルデータを用いて前記試料に含まれる化合物を同定する、
ことを特徴とする請求項5に記載の化合物同定装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、未知試料に含まれる金属元素や化合物を分類・推定する方法に関する。
【背景技術】
【0002】
原子力発電所の廃炉に向けて、汚染水対策、使用済燃料プールからの燃料取出し、燃料デブリ取出し、廃棄物対策などが必要である。炉心溶融した原子炉では、溶解した燃料、制御棒などが混ざり合って燃料デブリとして固化していると考えられる。制御材に炭化ホウ素(BC)を用いている原子炉では、酸化物の約2倍の硬度を持つホウ化物が生成されているため、金属、酸化物及びホウ化物を判別しながら燃料デブリを取り出すのが効率的である。なお、ホウ化物には、含有されているホウ素濃度と硬度に相関があることも確認されている。燃料デブリ取出方法の検討のため、未知試料の材料特定、材料硬度特定が必要である。また、未知試料内の材料分布、硬度分布の作成も検討されている。
【0003】
試料中の元素の定性・定量分析を行う方法として、誘導結合プラズマ発光分析(ICP-AES)や、レーザーアブレーション誘導結合プラズマ質量分析(LA-ICP-MS)がある。試料に外部から何らかのエネルギーを与えると、試料に含まれる元素は、元素固有の波長の光を放出するので、放出された光の波長と量を測定することで元素分析する。ICP-AESでは、干渉により正確に分析できないことがある。なお、特許文献1に記載されているように、試料に含まれる異物を正確かつ容易に解析することができる異物解析装置の発明も開示されている。
【0004】
また、固体、液体、気体等の状態に関わらず元素分析をする方法として、レーザー誘起ブレークダウン分光法(LIBS)がある。LIBSは、高エネルギーのパルスレーザーを励起源とする原子発光分析法であり、複雑な前処理の工程を経ずに短時間で分析可能で、軽元素(ホウ素、酸素)から重元素(金属)まで同時計測が可能であることから、高レベル廃棄物の元素情報取得、硬度計測、ホウ素分布情報を基にした臨界管理等に応用が期待されている。なお、特許文献2に記載されているように、金属を主成分とする材料中の酸素やホウ素の組成や材料の硬度を算出する方法の発明も開示されている。
【0005】
LIBSでは、ナノ秒以下のパルス幅を持つピークパワーの高いレーザーを測定対象に照射すると数万℃のプラズマが瞬時形成される。この際、測定対象物はプラズマ化により原子化・励起され、プラズマ消失と共に励起された原子は基底状態へ緩和され、元素固有の蛍光発光を伴う。これを計測し、測定対象元素の同定と定量を行う。レーザー出力の変動や測定対象を構成する元素により生成されるプラズマが、時間・空間的に微小に変動を伴うため、結果として測定値にも変動が生じてしまう。
【0006】
LIBSであれば、プラズマ状態(時間・空間等)によるバックグラウンド、エネルギー弁別処理であれば、放射線と物質との相互作用により生じる散乱成分等が、計測値に大きく影響を与える。レーザー、X線や中性子等の放射線をプローブとして用いる分光計測においては、その各種要因や影響の大小はあるものの、それらをキャンセル又は補正する機能が、精度の高い計測をするために望まれている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特許第6507757号公報
【特許文献2】特開2020-067337号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、未知の固体試料を分析する際に、多くの元素を含む合金や溶融物では、多くの発光波長を有するスペクトルデータが得られ、元素や化合物を判別することが困難な場合がある。例えば、鉄(Fe)やジルコニウム(Zr)の発光線は、非常に多く重なり合うと定量分析に支障をきたすことがある。
【0009】
また、レーザーのみならず、X線や中性子等の分光器を用いた計測では、分光器を閉止した条件で暗電流の計測を行い、その影響を除去している。測定環境(空気環境下や不活性環境下等)を除去するために、ブランクデータ(サンプルの無い状態での計測)を基に、その影響を除去しているものもある。しかし、これらの影響は装置機能に付加されていなかったり、類似したサンプルが存在しなかったりする場合などには適用できない。
【0010】
加えて、レーザーを用いた発光分析法(LIBSやLA-ICP-MS)や自己遮蔽を持つ中性子等では、試料固有の誤差を評価する必要があるが、中性子やプラズマ発光に関しては、照射エネルギーがコントロールできない場合が多い。
【0011】
特に、LIBS測定では、雰囲気ガスによりスペクトルのベースライン(バックグラウンドと思われる点を繋いでいき、それを連続したラインとして示したもの)が変動することがある。例えば、アルゴン(Ar)雰囲気では発光感度が高く、ベースラインが広範囲の波長域でブロードになるホワイトノイズが発生する場合がある。また、190nmから900nmまでの波長の光を検出するため、複数の検出器を用いることになるが、光学系の特性で検出できる波長域が変わるため、検出器が切り替わる波長でベースラインにズレが生じてしまう。
【0012】
このように、分光分析、放射線分析等のスペクトル分析におけるバックグラウンドノイズ成分(分光器の暗電流等の変動誤差)の軽減、各種分析における被測定対象物に対する光や放射線によるプローブ条件の適正化(被測定物に対するプローブによる損傷の緩和)、各種化合物(金属やセラミックス等を含む)の同定などが求められている。
【0013】
そこで、本発明は、未知試料に含まれる金属元素や化合物を分類・推定する方法を提供することを目的とする。また、金属元素や化合物を分類・推定するに際して、試料固有の誤差を評価し、予め補正しておくことを別の目的とする。
【課題を解決するための手段】
【0014】
上記の課題を解決するために、本発明である化合物同定方法は、想定される化合物種の標準試料についてスペクトルデータを因子分解して因子及び前記因子の影響度を表す因子スコアを導出し、前記化合物種を決定木において前記因子スコアで分類するためのスコア閾値及び前記因子スコアを前記決定木にかける因子適用順を予め学習・設定しておき、未知試料のスペクトルデータに対して前記標準試料の因子を用いて前記未知試料における因子スコアを算出し、前記因子適用順にしたがって前記決定木で前記未知試料の因子スコアを前記スコア閾値によって分類していくことにより、前記未知試料に含まれる化合物種を同定する、ことを特徴とする。
【0015】
前記化合物同定方法において、前記スペクトルデータは、測定値が推定値を上回ったときより下回ったときに誤差が厳しく評価されるように罰則項付き非対称最小二乗法で近似させたベースラインに補正される、ことを特徴とする。
【0016】
前記化合物同定方法において、前記因子分解は、前記スペクトルデータの波長の標本数(波長次元)Kと試料数NからなるK行N列の行列Yを、指定されたM個の非負値基底ベクトルで分解して得られた前記因子の影響度を前記因子スコアとして導出する、ことを特徴とする。
【0017】
前記化合物同定方法において、前記決定木は、前記化合物種を分類するときに、不純度を用いたコスト関数が最小値となるような因子とスコア閾値を導出しておく、ことを特徴とする。
【0018】
前記化合物同定方法において、前記因子スコアをマッピングし、前記未知試料の成分や組成比を推定する、ことを特徴とする。
【0019】
また、本発明である化合物同定装置は、前記試料にレーザーを照射する照射装置と、前記レーザーが照射された前記試料から放出された光を分解する分光器と、前記分光器で生成されたスペクトルデータを所定の範囲の波長ごとに分けて取得する複数の検出器と、を有し、前記検出器から入力されたスペクトルデータを用いて前記試料に含まれる化合物を同定する、ことを特徴とする。
【発明の効果】
【0020】
本発明によれば、未知試料に含まれる金属元素や化合物を分類・推定することができる。事前に既知物質のスペクトルデータを複数の因子に分解し、決定木により元素や化合物の分類方法を学習させておくことで、未知試料の成分の分類に利用することができる。
【0021】
また、試料固有の誤差を評価し、予め補正しておくことで、金属元素や化合物を精度良く分類・推定することができる。なお、後付けで補正することが可能で、ホワイトノイズも含め誤差を除去することができる。
【図面の簡単な説明】
【0022】
図1】本発明である化合物同定方法における測定装置の概観図である。
図2】本発明である化合物同定方法の前処理段階および学習段階の流れを示すフローチャートである。
図3】本発明である化合物同定方法におけるスペクトルデータの補正を説明する図である。
図4】本発明である化合物同定方法におけるスペクトルデータの補正を説明する図である。
図5】本発明である化合物同定方法におけるスペクトルデータの因子分解を説明する図である。
図6】本発明である化合物同定方法におけるスペクトルデータの因子分解を説明する図である。
図7】本発明である化合物同定方法における決定木による分類を説明する図である。
図8】本発明である化合物同定方法における決定木による分類を説明する図である。
図9】本発明である化合物同定方法における決定木による分類を説明する図である。
図10】本発明である化合物同定方法の運用段階の流れを示すフローチャート図である。
図11】本発明である化合物同定方法で分類した結果を示す図である。
【発明を実施するための形態】
【0023】
以下に、本発明の実施形態について図面を参照して詳細に説明する。なお、同一機能を有するものは同一符号を付け、その繰り返しの説明は省略する場合がある。
【0024】
本発明は、可視光-赤外光やX線・ガンマ線・中性子等の放射線等を用いる分光分析の計測系に関して、計測系の安定性に起因するバックグラウンド変動の低減処理、計測対象のスペクトル同定処理の2つの処理を対象としたアルゴリズムに関するものである。本アルゴリズムは、計測データ(予測データを含む)を学習データとする機械学習方法およびその結果がもたらすデータ処理系の構成からなり、実施により計測精度やロバスト性の向上が期待される。また、ソフトウェア処理として実施可能なため、既存の分光分析装置に具備される解析プログラムへの実装性が高い。
【0025】
LIBS(レーザー誘起ブレークダウン分光法)による元素の同定及び定量化の分析精度を高度化するために、元素発光スペクトルに加えてプラズマ状態(時間・空間等)を特徴付けるパラメータ(参照パラメータ)を同時に計測し、双方の相関性を補正処理に用いる。具体的には、測定対象とする原子発光スペクトルの強度や形状と強く相関している参照パラメータを設定する。従来は、習熟経験が高い測定者が変動成分や特性を把握した上で設定していた。高い分析精度を得るためには、スペクトルの変動メカニズムを理解した評価が必要である。
【0026】
参照パラメータの設定には、機械学習を使う。従来手法では、測定対象のスペクトルを一定の幅を有するピークとしてサーチするのに対し、本発明では、人間では取扱いが困難なビッグデータ(各種分析装置等から得られた波長-カウント値(光強度値)がセットとなった全スペクトル成分)に機械学習手法(NMF:非負値行列因子分解)を適用し、参照パラメータを構築する。シグナルピークではなく、全スペクトル成分を用いることで、未知試料の同定の際に、スペクトルの強度や形状等も含む評価が可能である。
【0027】
本発明は、オーケストラの中からバイオリンやビオラ等の特定音を抽出する手法や、雑踏の中から特定の個人を抽出する手法に着想を得て、測定装置に展開したものである。本発明のアルゴリズムとしては、前処理段階(プレプロセッシングフェーズ)で加工した標準試料のスペクトルデータを、学習段階(トレーニングフェーズ)でNMF及び決定木を用いて学習させ、運用段階(運用フェーズ)で未知試料に適用している。
【実施例0028】
図1は、本発明である化合物同定方法における測定装置の概観図である。測定装置100は、チャンバー200、照射装置300、分光器400、検出器410、及び制御装置220などを備え、LIBS測定を行う。
【0029】
チャンバー200は、真空容器などであり、真空ポンプ210を用いて減圧された内部に試料110が載置される。試料110としては、主に、学習段階においては、標準試料110aなどの既知試料が使用され、運用段階においては、測定・分析対象の未知試料110bが使用される。標準試料110aは、金属元素や化合物など予め組成が判明しているもの、未知試料110bは、原子力発電所から運び込まれた燃料デブリなど組成が不明なものである。
【0030】
照射装置300は、レーザー発振器を備えたレーザーヘッド等であり、チャンバー200内の試料110にパルスレーザー等の照射光310を照射する。照射光310としては、YAG(イットリウム、アルミニウム、ガーネット)にNd(ネオジム)を添加した結晶を媒体として用いた波長1064nmのNd:YAGレーザー等を使用する。
【0031】
照射光310を照射することにより試料110の表面をプラズマ化し、それが基底状態に戻る際に放出された放出光320を検出する。放出光320をコリメーター等で平行にした上で分光器400に入射させる。分光器400は、プリズムや回折格子などであり、光を波長ごとに分解し、強度分布を表したスペクトルデータ420を複数の検出器410を並置して所定の範囲の波長ごとに分けて取得させ、制御装置220に送る。
【0032】
制御装置220は、コンピュータ等であり、各装置を制御するとともに、取得したスペクトルデータ420から試料110の分類・分析を行う。その他、必要に応じて、シーケンサ230、電動のステージ240、冷却水循環設備などを備えても良い。
【0033】
例えば、試料110を載せたステージ240をシーケンサ230の制御で移動させて多地点を走査させる。ステージ240の位置情報(X-Y-Z軸の座標情報)からレーザーの照射位置を取得するとともに、変位計で試料110の形状情報(高さ情報)を取得し、制御装置220で座標をマッピングして立体的に形状と強度情報を可視化する。
【0034】
図2は、化合物同定方法の前処理段階および学習段階の流れを示すフローチャートである。前処理段階として、標準試料準備(標準試料の化合物種の設定)L1、スペクトルデータ取得(ベースライン推定)L2、学習段階として、NMF実行(標準試料の因子と因子スコアの取得)L3、及び決定木ルール生成(スコア閾値と因子適用順の設定)L4のステップを有する。
【0035】
前処理段階及び学習段階においては、想定される化合物種を設定して標準試料110aを準備し、取得した標準試料110aのスペクトルデータ420を因子分解して標準試料110aの因子及び因子スコアを導出し、化合物種を決定木において因子スコアで分類するためのスコア閾値と、因子を決定木にかける因子適用順を、決定木のルールとして学習し、予め設定しておく。
【0036】
前処理段階に係る工程は、図2の標準試料準備L1、スペクトルデータ取得L2からなる。標準試料準備L1ステップでは、測定対象の未知試料110bの成分として想定される金属元素や化合物などの化合物種を設定しておき、その金属元素や化合物を標準試料110aとして準備する。標準試料110aは、未知試料110bに含まれる化合物種を同定する際に、どの因子がどの程度の影響を及ぼしているかを見るために予め用意しておくデータとなる。
【0037】
スペクトルデータ取得L2ステップでは、検出器410から送られてきたスペクトルデータ420(事前に記憶装置等に保存していたものを含む)を制御装置220に入力する。スペクトルデータ420にはノイズ等が含まれ、ベースライン430(基線)が乱れているので、制御装置220においてベースライン推定を行う。ベースライン推定では、ベースライン430が平滑となるようにスペクトルデータ420を補正する。
【0038】
次に、上述した前処理段階に係る工程について、LIBS測定を行って得た実例を図3から図4を参照して説明する。図3及び図4は、化合物同定方法におけるスペクトルデータの補正を説明する図である。
【0039】
図3(a)は、LIBS測定系において複数の測定波長範囲を分割し、各々に感度が高い分光器を用い広帯域化(190nmから900nm)を図り、取得したスペクトルである。図3(a)に示すように、検出器410の波長範囲の境界でベースライン430にズレを生じていることが分かる。ズレを生じることで、検出器410の感度や暗電流に起因するベースライン430に不連続性が発生することになる。
【0040】
不連続性が発生した波長域では、計測結果に不確かな要因を多く含み、結果の信頼性が得られない。また、不連続部分にスペクトルがある対象の場合、正確な面積を算出することができず、場合によってはスペクトルの判別ができなくなる。
【0041】
また、図3(b)は、図3(a)のスペクトルデータ420の一部を拡大したスペクトルである。図3(b)に示すように、ディテクタの分解能に対して最適なスムージングを適用しない限り、必要以上に調整されたベースラインになってしまう。
【0042】
そこで、発明者らは、図3(c)に示す、非対称重みペナルティ最小二乗スムージング(罰則項付き非対称最小二乗法)により、複数の検出器410の波長範囲の境界におけるベースライン430のズレ(不連続性)を補正することを考案した。罰則項付き非対称最小二乗法は、測定値yに対するベースライン430の推定値zの好ましさ(良さ)を、測定値と推定値の差が最小とするだけでなく、平滑となるように評価関数を最小化することにより、好ましいベースライン430を導出するものである。
【0043】
評価の観点としては、まず、二乗誤差Σ(y-zの観点から、y≦zの際には誤差を非常に厳しくし、y>zの際には誤差を非常に甘くする非対称な評価を行い、さらに、zの変動の観点から、変動の変化に対して厳しい評価を行う。wは、非対称重みであり、y>zならばpとなり、y≦zならば(1-p)となる。p(p∈[0,1]:pは非常に小さい値)は、測定値が推定値を上回ったかどうかでwを変える役割を持つ。μは、正則化パラメータであり、推定値の変動(非平滑度)Σ(Δが罰則項となる。なお、Δは2階微分演算子を表し、w、μは設計者が経験的に定めるハイパーパラメータである。パラメータを変化させ、最適解を探っていけば良い。
【0044】
これにより、スペクトルデータ420は、測定値が推定値を上回ったときよりも、測定値が推定値を下回ったときに誤差が厳しく評価されるように罰則項付き非対称最小二乗法で近似させたベースライン430に補正される。
【0045】
図4は、図3(c)の補正により、図3のスペクトルデータ420を補正したスペクトルである。なお、図4(a)は、図3(a)のスペクトルデータ420を補正したスペクトルであり、図4(b)は、図4(a)のスペクトルデータ420の一部を拡大したスペクトルである。
【0046】
図4(a)に示すように、補正後の平滑化されたベースライン430により、図3(a)のスペクトルの不連続性が解消され、バックグラウンド除去によりスペクトルデータ420の形状や強度を識別することが容易になることが分かる。これにより、元素同定及び定量性の観点で分析精度が向上し、今まで困難であったスペクトル評価が可能となる。なお、本実施例であるLIBS測定に限られず、分光器400を使う全ての測定装置に適用可能である。
【0047】
また、非対称重みペナルティ最小二乗スムージングだけでなく、サンプルが無い条件でのベースライン430からパターン認識による除去等を適用することで、各種分析装置固有の性能向上やサンプル依存性の低減を図る。ラマン分光法やLA-ICP-MS等のレーザー光源を用いた分析手法のみならず、分光器400を使う全ての測定装置100に適用可能である。
【0048】
パターン認識による除去の例としては、試料が無い条件(空打ち)で測定環境のみを測定した際に得られたスペクトルをパターン認識させ、ベースラインで削除するものがある。一般的には、試料が無い条件を単純に差し引くことで行っているが、パターン認識を駆使すると測定毎に上下するベースラインに合わせた補正が可能である。
【0049】
図5及び図6は、化合物同定方法におけるスペクトルデータの因子分解を説明する図である。NMF実行L3ステップでは、制御装置220において、補正後のスペクトルデータ420に対して、非負値行列因子分解(NMF)を行う。
【0050】
NMFでは、機械学習により重なり合った発光スペクトルデータ全体を指定した因子数の因子に分解し、因子スコアと物質名のペアで表現されているサンプルデータ群に対して、決定木でどの因子に注目してどんな閾値によって峻別していけば、正しく物質の分類ができるのかを探し出すアルゴリズムを使用し、関連する因子に分けることで未知試料110bから元素や化合物を分類する。
【0051】
事前に既知物質のスペクトルデータ420を次元削減手法により、低次元の因子スコアベクトルにスペクトルを変換し、決定木により元素や化合物などを分類するアルゴリズムを学習させておくことで、未知試料110bの中の成分を推定する。
【0052】
学習段階では、図5(a)に示すスペクトルデータ420(K次元のベクトル群)を一纏めにし、NMFを使ってM個の因子440に分けて、決定木で扱いやすいように低次元化する。NMFは、スペクトルデータが0と正の値の行列表現ができれば、データの種類によらず適用可能である。
【0053】
図5(b)に示すように、N個の測定データY(y~y)を近似的に因子Hと因子スコアUに分解する。測定データyは、K次元(例えば、K=11562種類の波長)のベクトルデータ(強度)であり、K×N(K行N列)の行列で表される。因子Hは、K次元のベクトルデータに共通する何らかの因子を、M個(例えば、M=3個の因子)の基底ベクトルとして表したものであり、K×M(K行M列)の行列で表される。因子スコアUは、N個の測定データYとM個の因子Hに関する結合係数であり、M×N(M行N列)の行列で表される。なお、Mはハイパーパラメータである。
【0054】
標準試料110aの場合、スペクトルデータ420の波長の標本数(波長次元)と試料数からなる行列を非負値で因子分解し、得られた因子(例えば、第1因子~第3因子)をそれぞれ標準試料110aの因子440とし、標準試料110aにおける各因子440の影響度を表す係数がそれぞれ因子スコア450として導出される。因子スコア450は、測定データがどの因子440の影響を大きく受けているかを示すものである。
【0055】
LIBSを用いた例として、ホウ化物を中心に4種類の化合物種を設定し、標準試料110aとしてそれぞれ37個(N=37×4)のスペクトルデータ420を抽出し、高次元(各スペクトルの波長次元数k=11562)のサンプルとした。それをNMFにより低次元化(参照パラメータとして特徴量の異なる3つの因子440と因子スコア450)した結果を示す。図6に示すように、各因子440に因子スコア450の影響を考慮した上で、3つの因子の線形和により、測定したスペクトルデータ(図5(a))を表現可能である。
【0056】
なお、因子440は、波長ごとの強度のスケールを揃えるために、平均値と標準偏差でスペクトルデータ420を標準化しても良い。標準化しない場合は、そのステップを省略しても良い。なお、レーザー照射によるサンプルの壊れやすさや放射線計測におけるサンプル特有の自己遮へいがあるので、標準化することでこれらを緩和することができる。
【0057】
図7図9は、化合物同定方法における決定木による分類を説明する図である。決定木ルール生成L4ステップでは、制御装置220において、標準試料110aの因子スコア450を特徴量として決定木500を作成し、標準試料110aの因子440を適用するときに因子スコア450によって分類するためのスコア閾値460と、標準試料110aのどの因子440から適用して決定木500で分類していくか因子適用順を設定する。
【0058】
決定木500は、NMFで得た参照パラメータを元に「True」又は「False」を判断する分類方法であり、学習データに対して、着目した因子440(参照パラメータ)とその判断に用いる因子スコア450のスコア閾値460を用いて、物質を正しく分類する探索アルゴリズムである。
【0059】
学習段階にあるNMFと決定木500の組合せは、動的光散乱や誘導結合プラズマ質量分析装置(ICP-MS)等のスペクトルデータ420がある解析手法はもちろん、「0」と「正の値」の行列表現記載ができれば、データの種類によらず適用することができる。TEM(透過電子顕微鏡)やSEM(走査電子顕微鏡)及びそれに付随したEDX(エネルギー分散型X線分析)等の画像データ等にも展開が期待できる。
【0060】
図7(a)に示すように、決定木500で条件分岐させるために、標準試料110aの因子スコア450について不純度を計算するコスト関数Jを使用し、コスト関数Jが最小となるようなスコア閾値t(1≦k≦m)を導出する。なお、コスト関数Jはジニ不純度などを用いて算出しており、kは因子番号、mは因子440の数、mleftは一方に分ける因子(左サブセット)の数、mrightは他方に分ける因子(右サブセット)の数、Gleftは左サブセットの不純度、Grightは右サブセットの不純度である。
【0061】
なお、サブセット中に存在する化合物が1種類だけであれば、純粋なサブセット、複数種類の化合物が混合されていれば、不純なサブセットとなる。このとき、サブセットの不純度は、サブセット中に含まれる各化合物の比率に基づく、ジニ不純度や交差エントロピーによって表される。
【0062】
図7(b)に示すように、化合物種(雰囲気)がArとNの場合に、横軸側の因子440について因子スコア450のスコア閾値460(例えば、114.155)が導出され、決定木500において、因子スコア450がスコア閾値460より小さければ因子440は左サブセット(Nと推定)に分類され、因子スコア450がスコア閾値460より大きければ因子440は右サブセット(Arと推定)に分類される。
【0063】
図8(a)は、LIBSで測定したホウ化物スペクトル(CrB系、FeB系、NiB系、ZrB系の4つの化合物種)に対して、因子440に分解し、特徴量(因子スコア450)を抽出して決定木500を作成する例を示す。因子440の因子適用順は、第2因子、第3因子、第1因子の順になったとする。
【0064】
決定木500のノードN1では、第2因子における因子スコア450のスコア閾値460が108.615と導出され、図8(b)に示すように、スコア閾値460より大きいものがCrとBを含む化合物として分類され、それ以外はノードN2で分類される。
【0065】
決定木500のノードN2では、第3因子における因子スコア450のスコア閾値460が65.837と導出され、図9(a)に示すように、スコア閾値460より大きいものがNiとBを含む化合物として分類され、それ以外はノードN3で分類される。
【0066】
決定木500のノードN3では、第1因子における因子スコア450のスコア閾値460が117.886と導出され、図9(b)に示すように、スコア閾値460より大きいものがZrとBを含む化合物として分類され、それ以外はFeとBを含む化合物として分類される。
【0067】
比較的スペクトルの多いジルコニウム(Zr)や鉄(Fe)よりもクロム(Cr)が決定木500の始めに分類されており、決定木500では人間の予想とは異なり、より正確に分類されている。これは、ZrやFeが干渉の影響を伴うピークを多数含むことも影響していると考えられる(従来手法のように、単純に干渉の無いシグナルピークによる分類だけだと正答率は低下する)。
【0068】
制御装置220において、標準試料110aから得られた因子440と因子スコア450、さらに決定木500のルールとして因子スコア450のスコア閾値と因子440の因子適用順をデータベース等の記憶装置に蓄積し、化合物同定指標を作成する。学習段階では、どのような標準試料110aからのデータか、因子スコア450がそれぞれの因子440でどのようになっているかを把握し、運用段階において、未知試料110bを分類する際の化合物同定指標として利用する。
【0069】
図10は、化合物同定方法の運用段階の流れを示すフローチャート図である。運用段階として、未知試料測定S1、スペクトルデータ補正S2、因子分解処理S3、決定木分類処理S4のステップを有する。標準試料110aの各因子440とその因子スコア450が予め化合物同定指標として用意されており、未知試料110bの各因子440についての因子スコア450で振り分けることにより、未知試料110bをクラス分けする。
【0070】
運用段階においては、未知試料110bのスペクトルデータ420に対して、標準試料110aの因子440を用いて未知試料110bにおける因子スコア450を算出し、因子440の因子適用順にしたがって決定木500で未知試料110bの因子スコア450をスコア閾値460によって分けていき、未知試料110bのクラスを推定することで、未知試料110bに含まれる化合物種を同定する。
【0071】
未知試料測定S1ステップでは、測定装置100において未知試料110bにレーザーを照射し、検出器410から送られてきたスペクトルデータ420を制御装置220に入力する。
【0072】
スペクトルデータ補正S2ステップでは、制御装置220において、未知試料110bのスペクトルデータ420に対しても、スペクトルデータ取得L2ステップと同様にベースライン補正を行う。
【0073】
因子分解処理S3ステップでは、制御装置220において、未知試料110bの補正済みのスペクトルデータ420に対して、標準試料110aの因子440を用いてNMFによる因子分解を行い、未知試料110bの因子スコア450を算出する。なお、必要に応じて標準化処理を施しても良い。
【0074】
決定木分類処理S4ステップでは、制御装置220において、未知試料110bの因子スコア450を決定木500のルール(学習させたアルゴリズム)に基づき因子440をクラス分けする。決定木500において、因子440の因子適用順にしたがって未知試料110bの因子スコア450をスコア閾値460によってクラス分けし、未知試料が属するクラスを推定していくことにより、未知試料110bに含まれる化合物種を同定する。
【0075】
決定木500に掛けることにより、因子スコア450と化合物種が対応付けられる。標準試料群の全てのスペクトルデータ420から、その共通する因子440(第1因子~第m因子)が導出され、各因子を通して各スペクトルデータ420は因子スコア450に変換される。そして、決定木500を通して化合物種にクラス分けされる。
【0076】
実際に、未知試料110bとして、ステンレス鋼(SUS)と炭化ホウ素(BC)の共晶化合物等を対象として測定したところ、テストデータ4種類×8個で正答率は100%の結果を得た。
【0077】
図11は、化合物同定方法で分類した結果を示す図である。因子スコア450をマッピングし、未知試料110bの成分や組成比を推定しても良い。図11(a)に示すように、模擬試料がある化合物に含まれる要素を含んでいるか成分を推定することもできる。また、図11(b)に示すように、CrBが多く含まれているか否か組成比を推定することもできる。
【0078】
X軸とY軸の2軸座標の制御と、変位計によりステージと変位計の間に載せた試料の距離を計測することで、高さZ軸の情報を取得し、試料形状を把握する。座標の制御は、電動ステージを用いると容易である。X-Y-Z軸を既知とした試料の位置をピンポイントでLIBS計測することにより、LIBS測定結果が得られる。LIBS測定結果から特徴的な元素の発光スペクトルの範囲を選択し、面積値や高さを算出する。二次元上元素のマッピング情報を表示するには、X座標とY座標情報を2軸に設定し、選択した元素発光スペクトルの強度をカラーで示すことで選択した元素をマッピングすれば良い。
【0079】
本発明によれば、未知試料に含まれる金属元素や化合物を分類・推定することができる。事前に既知物質のスペクトルデータを複数の因子に分解し、決定木により元素や化合物の分類方法を学習させておくことで、未知試料の成分の分類に利用することができる。
【0080】
また、試料固有の誤差を評価し、予め補正しておくことで、金属元素や化合物を精度良く分類・推定することができる。なお、後付けで補正することが可能で、ホワイトノイズも含め誤差を除去することができる。
【0081】
本発明では、プラズマ状態(時間・空間等)を特徴付ける参照パラメータにより測定対象とする原子発光スペクトルの採用・棄却を決める。また、参照パラメータの設定に機械学習を使っている。従来手法では、測定対象のスペクトルを一定の幅を有するピークとしてサーチするのに対し、本発明では、人間では取り扱うのが困難なビッグデータ(各種分析装置等から得られた全スペクトル成分)をNMFにより機械学習させ、参照パラメータを構築する。これにより、従来方法で行っていたシグナルピークによる処理ではなく、全スペクトル成分を対象に処理することで、評価に用いるデータ量が10まで増大し、その結果、今まで難しかったスペクトルの強度や形状等も含む評価ができるようになり、高い分析精度を確立する見通しも得られた。
【0082】
前処理で用いているベースライン補正は、その種類によって、非対称重みペナルティ最小二乗スムージング法のような関数や、パターン認識のような機械学習を行うことで、スペクトル毎に適用できる。学習データとして公的研究機関等のデータベースや既知試料の計測ができる環境があれば、後付けで既に所有している各種分析装置固有の性能向上(ラマン散乱やLA-ICP-MS等のレーザー光源を用いた分析手法のみならず、分光器を使う全ての測定器)やサンプル依存性の低減が可能である。
【0083】
学習データとして公的研究機関等のデータベース(分光や放射線スペクトル情報)や材料組成が既知である標準試料の計測をすれば良く、装置の解析ソフトウェアに実装するなどハードウェア改修することなく、簡便に各種分析装置固有の性能向上やサンプル依存性の低減が可能である。レーザー、X線や中性子等の光源をプローブに用いる分光計測のみならず、分光機能としてエネルギー分散型X線分析(EDX)が付加された電子顕微鏡(透過電子顕微鏡:TEM-EDX、走査電子顕微鏡:SEM-EDX)、電子プローブマイクロアナライザー(EPMA)等で分光データを面情報として画像化するものまで多種多様な応用が期待される。
【0084】
以上、本発明の実施例を述べたが、これらに限定されるものではない。例えば、NMFは、オーケストラの音からバイオリンやビオラ等の因子に分ける機械学習に使われる手法で、バイオリンやビオラの特徴音(参照パラメータ)を作成し分類することができる。このように、様々なビッグデータに対し、本発明を応用することができる。
【0085】
また、未知試料内の材料分布や硬度分布を作成しても良いし、多変量解析に応用しても良い。
【符号の説明】
【0086】
100:測定装置
110:試料
110a:標準試料
110b:未知試料
200:チャンバー
210:真空ポンプ
220:制御装置
230:シーケンサ
240:ステージ
300:照射装置
310:照射光
320:放出光
400:分光器
410:検出器
420:スペクトルデータ
430:ベースライン
440:因子
450:因子スコア
460:スコア閾値
500:決定木
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11