(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-06-16
(45)【発行日】2023-06-26
(54)【発明の名称】スペクトル汎化システム及び方法、並びに物質同定システム及び方法
(51)【国際特許分類】
G01N 21/27 20060101AFI20230619BHJP
G01N 23/2055 20180101ALI20230619BHJP
G06N 3/08 20230101ALI20230619BHJP
G06T 7/00 20170101ALI20230619BHJP
【FI】
G01N21/27 Z
G01N23/2055 320
G06N3/08
G06T7/00 350C
(21)【出願番号】P 2022504357
(86)(22)【出願日】2021-03-01
(86)【国際出願番号】 JP2021007737
(87)【国際公開番号】W WO2021177240
(87)【国際公開日】2021-09-10
【審査請求日】2022-04-14
(31)【優先権主張番号】P 2020037799
(32)【優先日】2020-03-05
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】301023238
【氏名又は名称】国立研究開発法人物質・材料研究機構
(72)【発明者】
【氏名】石井 真史
【審査官】井上 徹
(56)【参考文献】
【文献】国際公開第2019/039313(WO,A1)
【文献】国際公開第2018/025361(WO,A1)
【文献】特開2018-18354(JP,A)
【文献】特開平9-305567(JP,A)
【文献】特開平6-288913(JP,A)
【文献】米国特許出願公開第2020/0003682(US,A1)
【文献】米国特許出願公開第2020/0003678(US,A1)
【文献】米国特許出願公開第2019/0272449(US,A1)
【文献】中国特許第109253985(CN,B)
【文献】米国特許出願公開第2021/0398276(US,A1)
【文献】特開2016-209201(JP,A)
【文献】石井 真史ら,計測インフォマティクスとデータベースの統合による客観・高速結晶構造解析,日本結晶学会誌,2020年,Vol. 62,No. 1,PP.35-42
【文献】Abdulkadir CANATAR et al.,Spectral bias and task-model alignment explain generalization in kernel regression and infinitely wide neural networks,Nature Communications,2021年05月,Vol. 12,2914
(58)【調査した分野】(Int.Cl.,DB名)
G01N 21/00-G01N 21/01
G01N 21/17-G01N 21/61
G01N 21/84-G01N 21/958
G01N 23/00-G01N 23/2276
G06T 7/00-G06T 9/40
G06N 3/08
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
デジタル画像化された典型的スペクトルを小フレームで走査し、前記典型的スペクトルの画像からピーク周辺の小フレームを切り出す局所ピーク切り出し装置と、
前記局所ピーク切り出し装置で切り出された小フレームを保存する局所ピークストレージと、
前記局所ピーク切り出し装置で切り出された小フレーム内のピークに対応する、ピークを意味する正解のアイコンを与えるn×1アイコン生成装置と、
前記n×1アイコン生成装置で与えられた前記正解のアイコンを格納する正解データストレージと、
前記局所ピークストレージに保存された小フレームに対して、前記正解データストレージに保存された前記正解のアイコンを回答するようにニューラルネットワークのパラメータが最適化される局所ピーク学習用ニューラルネットワークと、
前記正解データストレージに格納された前記正解のアイコンと前記局所ピーク学習用ニューラルネットワークの出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を前記局所ピーク学習用ニューラルネットワークに出力する学習用比較機と、
を備え
、前記局所ピーク学習用ニューラルネットワークに、様々な形の小フレームに対して、同じ形状のn×1のアイコンを回答させることで、ピークの概念を教えてスペクトルを汎化すると共に、前記n×1アイコンはnを自然数とし、[n個の画素]×[1個の画素]から構成されるn×1アイコンであることを特徴とする、スペクトル汎化システム。
【請求項2】
前記n×1アイコン生成装置は、ピーク形状類型の判別パターンに応じた類型別のn×1アイコンを与えることを特徴とする請求項1に記載のスペクトル汎化システム。
【請求項3】
前記ピーク形状類型の判別パターンは、前記ピークの尖度、歪度、及び尖度と歪度の少なくとも一種類に応じた類型別のn×1アイコンであることを特徴とする請求項2に記載のスペクトル汎化システム。
【請求項4】
前記n×1アイコン生成装置は、前記正解のアイコンの位置をデジタル画像化された前記典型的スペクトルのピーク位置座標に合わせて画像表示させる情報を含むことを特徴とする請求項1乃至3の何れかに記載のスペクトル汎化システム。
【請求項5】
前記局所ピーク切り出し装置は、デジタル画像化された前記典型的スペクトルを1画素ごとに走査し、ピーク周辺の小フレームを切り出すことを特徴とする請求項1乃至4の何れかに記載のスペクトル汎化システム。
【請求項6】
前記局所ピーク切り出し装置が切り出す小フレームは、前記典型的スペクトルのピーク形状を的確に表現できる解像度が得られる画素数を有することを特徴とする請求項5に記載のスペクトル汎化システム。
【請求項7】
さらに、前記典型的スペクトルをデジタル画像化する数値マトリクス-画像変換装置を有することを特徴とする請求項1乃至6の何れかに記載のスペクトル汎化システム。
【請求項8】
前記数値マトリクス-画像変換装置は、前記典型的スペクトルをデジタル画像化するにあたり、ピークを有する前記典型的スペクトルに対応する数値マトリクスを、二次元デジタル画像に変換することを特徴とする請求項7に記載のスペクトル汎化システム。
【請求項9】
前記二次元デジタル画像は前記典型的スペクトルのピーク形状を的確に表現できる解像度が得られる画素数を有することを特徴とする請求項8に記載のスペクトル汎化システム。
【請求項10】
デジタル画像化された典型的スペクトルを1画素ごとに、又は前記典型的スペクトルに沿って小フレームで走査し、前記典型的スペクトルの画像からピーク周辺の小フレームを切り出し、
前記切り出された小フレームを局所ピークストレージに保存し、
前記切り出された小フレーム内のピークに対して、ピークを意味する正解のアイコンを与え、
与えられた前記正解のアイコンを正解データストレージに格納し、
前記正解データストレージに格納された前記正解のアイコンと局所ピーク学習用ニューラルネットワークの出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を前記局所ピーク学習用ニューラルネットワークに出力し、
前記調整量によって、前記局所ピークストレージに保存された小フレームに対して、前記正解データストレージに保存された前記正解のアイコンを回答するように前記局所ピーク学習用ニューラルネットワークのパラメータが最適化される、
工程をコンピュータに実行させて、前記
局所ピーク学習用ニューラルネットワークに、様々な形の小フレームに対して、同じ形状のn×1のアイコンを回答させることで、ピークの概念を教えてスペクトルを汎化すると共に、前記n×1アイコンはnを自然数とし、[n個の画素]×[1個の画素]から構成されるn×1アイコンであることを特徴とするスペクトル汎化方法。
【請求項11】
標準スペクトルデータベースに格納されている標準スペクトルの画像を対象として、小フレームの中心をトレースさせる第1のスペクトルトレーサと、
請求項1乃至9の何れかに記載のスペクトル汎化システムで学習した局所ピーク学習済みニューラルネットワークであって、前記標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する第1の局所ピーク学習済みニューラルネットワークと、
前記第1の局所ピーク学習済みニューラルネットワークによって出力されたデータを結合して第1のフィンガープリントを作成する第1のハッシュ結合装置と、
前記第1のハッシュ結合装置で作成された第1のフィンガープリントが格納される標準フィンガープリントストレージと、
前記標準スペクトルデータベースに格納されている標準スペクトルの各々に対して作成された前記第1のフィンガープリントについて、類型化して、各類型化された個別の第1のフィンガープリントを識別して、個別の第1のフィンガープリント毎に前記標準フィンガープリントストレージに格納する標準フィンガープリント格納管理部と、
小フレームの中心を今回の同定対象となる計測スペクトルの画像についてトレースさせる第2のスペクトルトレーサと、
請求項1乃至9の何れかに記載のスペクトル汎化システムで学習した局所ピーク学習済みニューラルネットワークであって、前記計測スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する第2の局所ピーク学習済みニューラルネットワークと、
前記第2の局所ピーク学習済みニューラルネットワークによって出力されたデータを結合して第2のフィンガープリントを作成する第2のハッシュ結合装置と、
前記第1のハッシュ結合装置で作成された前記第1のフィンガープリントと、前記第2のハッシュ結合装置で作成された前記第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する比較機と、
を備えることを特徴とする物質同定システム。
【請求項12】
前記比較機の比較アルゴリズムは、分類を行う機械学習を含むアルゴリズムであることを特徴とする請求項11に記載の物質同定システム。
【請求項13】
さらに、前記標準スペクトルデータベースに格納されている標準スペクトルを画像化する第1の数値マトリクス―画像変換装置を有することを特徴とする請求項11又は12に記載の物質同定システム。
【請求項14】
さらに、前記今回の同定対象となる計測スペクトルは、前記計測スペクトルを画像化する第2の数値マトリクス―画像変換装置により与えられることを特徴とする請求項11又は12に記載の物質同定システム。
【請求項15】
請求項11乃至14の何れかに記載の物質同定システムにおいて、さらに、
計測スペクトルが得られた場合は、非負線形回帰処理を用いて、前記標準フィンガープリントストレージに格納された複数の前記第1のフィンガープリントの中から候補となる成分を絞り込む非負線形回帰装置を備え、
前記比較機は、前記第1のハッシュ結合装置で作成された前記第1のフィンガープリントに代えて、前記非負線形回帰装置で選定された候補に対応するフィンガープリントを前記標準フィンガープリントストレージから呼び出して、前記第2のハッシュ結合装置で作成された前記第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力することを特徴とする請求項11に記載の物質同定システム。
【請求項16】
標準スペクトルデータベースに格納されている標準スペクトルの画像を対象として、小フレームの中心のトレースを行い、
請求項10に記載のスペクトル汎化方法を用いて学習した第1の局所ピーク学習済みニューラルネットワークによって、前記標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力し、
第1のハッシュ結合装置により、前記第1の局所ピーク学習済みニューラルネットワークによって出力されたデータを結合して、第1のフィンガープリントを作成し、
前記第1のハッシュ結合装置で作成された前記第1のフィンガープリントを標準フィンガープリントストレージに格納し、
標準フィンガープリント格納管理部により、前記標準スペクトルデータベースに格納されている標準スペクトルの各々に対して作成された前記第1のフィンガープリントについて類型化して、各類型化された個別の第1のフィンガープリントを識別して、個別の第1のフィンガープリント毎に前記標準フィンガープリントストレージに格納し、
今回の同定対象となる計測スペクトルの画像について、小フレームの中心のトレースを行い、
請求項10に記載のスペクトル汎化方法を用いて学習した第2の局所ピーク学習済みニューラルネットワークによって、前記計測スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力し、
第2のハッシュ結合装置により、前記第2の局所ピーク学習済みニューラルネットワークによって出力されたデータを結合して、第2のフィンガープリントを作成し、
前記第1のハッシュ結合装置で作成された前記第1のフィンガープリントと、前記第2のハッシュ結合装置で作成された前記第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する、
工程をコンピュータに実行させることを特徴とする物質同定方法。
【請求項17】
請求項16に記載の物質同定方法において、
さらに、計測スペクトルが得られた場合は、非負線形回帰処理を用いて、前記標準フィンガープリントストレージに格納された複数の前記第1のフィンガープリントの中から候補となる成分を絞り込み、
前記第1のハッシュ結合装置で作成された前記第1のフィンガープリントに代えて、前記非負線形回帰処理で選定された候補に対応するフィンガープリントと、前記第2のハッシュ結合装置で作成された前記第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力することを特徴とする物質同定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、探査用ビームに対する吸収、散乱、反射、回折などのスペクトルから特徴量を抽出する装置及び方法に用いて好適な、スペクトル汎化システム及び方法、並びに物質同定システム及び方法に関する。
【背景技術】
【0002】
計測・分析分野において、中性子、X線、紫外線、可視光線、赤外線、マイクロ波、超音波など様々な探査用ビームに対する吸収、散乱、反射、回折の強弱を図示するスペクトルから、測定対象の物質を同定し、あるいは特性を決定することが、物理、化学、医学、天文・地学、材料科学、電子工学など幅広い分野で様々な対象に対して行われている。計測スペクトルは、通常それ単体で議論をするよりも、過去の計測で得られ、ライブラリ化・データベース化されている他の標準スペクトルとの比較から議論されることが多い。
【0003】
しかしながら、スペクトル測定は、計測において不可避な外的攪乱要素を伴う。例えば、バックグラウンドノイズによるスペクトルのうねり、検出器の測定性能に依存するスペクトルの広がりは、どのような測定法であっても、少なからず存在する。したがって、測定により得られたスペクトルと標準スペクトルは完全に一致することはなく、機械的に一致・不一致の判定をすることは困難である。多くの場合、専門家がスペクトルの位置、強度比、広がりなどの様々な要因を総合的に比較し、経験と勘で一致・不一致の判断を下す。この状況を翻って考えると、外的攪乱要素によらないスペクトルの本質的な量(特徴量という)は、経験と勘を使えば見出せるものであり、機械可読化は容易ではないもののスペクトルに内在するといえる。
【0004】
一般に試料が特徴的であればあるほど先行事例は少なく、従って外的攪乱要素によらないスペクトルの特徴量抽出(フィンガープリント化)が、測定結果とライブラリ・データベースを対等に比較する上で重要となる。またその照合は、実用に耐える速さで行う必要があり、プレスクリーニングなど特徴量抽出処理に工夫を要する。
このような特徴量抽出として、例えば特許文献1~3に開示された深層学習用ニューラルネットワークが用いられる。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2019-087221号公報
【文献】特開2019-020598号公報
【文献】特表2019-526851号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、各種計測により得られるスペクトルデータは、同種の材料であっても、試料の作成条件や測定条件の揺らぎによってバックグラウンドなどの擾乱要素が含まれるためスペクトルデータの分布形状が異なる。この外的攪乱要素に阻まれ、スペクトルから機械的に物質を同定することは著しく困難であった。
【0007】
本発明は上述する課題を解決するもので、様々な外的攪乱要素を持つ計測スペクトルから、その試料の素性を表すスペクトルの本質量(特徴量)を抽出するフィンガープリント化処理の開発と、その成分同定への適用法を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明者は、人工知能にスペクトルの局所形状(尖度)を学習させ、その学習済み人工知能を使うことで、攪乱要素に依存しないスペクトルの特徴量(本質量)を抽出するスペクトル汎化システム及び方法、並びに物質同定システム及び方法が得られると考えて、本発明を想到するに至った。
【0009】
人工知能は学習した内容については統計的に確からしい答えを返す。例えばある材料のスペクトルを与えてその材料を当てるという課題は、事前にその材料とスペクトルを学習していれば実現可能である。本発明は、学習していないスペクトルに対しても正解の材料を与える、人工知能を使った新たな方法である。本発明は、画像化したスペクトルから特徴量を抽出し、当該特徴量を使って既知のスペクトル群からもっと確からしいものを推論する構成であるが、通常の類似度解析と異なり、人工知能がピーク形状の一般的特徴を学習することで、独自の「ピーク判断基準」を作り、それをもとに、あらゆる材料のスペクトルを規格化し、プロセスや計測条件にロバストな判断ができるようになる。
【0010】
[1]本発明のスペクトル汎化システムは、例えば
図1に示すように、デジタル画像化された典型的スペクトル12を小フレームで走査し、典型的スペクトル12の画像からピーク周辺の小フレームを切り出す局所ピーク切り出し装置20と、局所ピーク切り出し装置20で切り出された小フレームを保存する局所ピークストレージ30と、局所ピーク切り出し装置20で切り出された小フレーム内のピークに対応する、ピークを意味する正解のアイコンを与えるn×1アイコン生成装置40と、n×1アイコン生成装置40で与えられた前記正解のアイコンを格納する正解データストレージ50と、局所ピークストレージ30に保存された小フレームに対して、正解データストレージ50に保存された前記正解のアイコンを回答するようにニューラルネットワークのパラメータが最適化される局所ピーク学習用ニューラルネットワーク60と、正解データストレージ50に格納された正解のアイコンと局所ピーク学習用ニューラルネットワーク60の出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を局所ピーク学習用ニューラルネットワーク60に出力する学習用比較機70と、を備える。
【0011】
[2]本発明のスペクトル汎化システムにおいて、好ましくは、n×1アイコン生成装置40は、ピーク形状類型の判別パターンに応じた類型別のn×1アイコンを与えるとよい。
[3]本発明のスペクトル汎化システムにおいて、好ましくは、ピーク形状類型の判別パターンは、前記ピークに含まれる尖度、歪度、及び尖度と歪度の少なくとも一種類のパラメータに応じた類型別のn×1アイコンであるとよい。類型別のn×1アイコンは、前記ピークのパラメータを人工知能の一種であるスペクトル汎化システムで用いるパラメータに変換したものである。
[4]本発明のスペクトル汎化システムにおいて、好ましくは、n×1アイコン生成装置40は、前記正解のアイコンの位置をデジタル画像化された典型的スペクトル12のピーク位置座標に合わせて画像表示させる情報を含むとよい。
[5]本発明のスペクトル汎化システムにおいて、好ましくは、局所ピーク切り出し装置20は、デジタル画像化された典型的スペクトル12を1画素ごと走査し、ピーク周辺の小フレームを切り出す構成とするとよい。学習の場合は、小フレームの中および外周を含む様々な場所に満遍なくなくピークがある画像を使うのが、ピークと傾斜の違いを教える学習法として好ましいからである。
[6]本発明のスペクトル汎化システムにおいて、好ましくは、局所ピーク切り出し装置20が切り出す小フレームは、例えば典型的スペクトル12のピーク形状を的確に表現できる解像度が得られる画素数を有するとよい。
[7]本発明のスペクトル汎化システムにおいて、好ましくは、さらに、典型的スペクトル12をデジタル画像化する数値マトリクス-画像変換装置10を有するとよい。
[8]本発明のスペクトル汎化システムにおいて、好ましくは、数値マトリクス-画像変換装置10は、典型的スペクトル12をデジタル画像化するにあたり、ピークを有するスペクトルに対応する数値マトリクスを、二次元デジタル画像に変換するとよい。
[9]本発明のスペクトル汎化システムにおいて、好ましくは、前記二次元デジタル画像は、典型的スペクトル12のピーク形状を的確に表現できる解像度が得られる画素数を有するとよい。
【0012】
[10]本発明のスペクトル汎化方法は、例えば
図2に示すように、デジタル画像化された典型的スペクトル12を1画素ごとに、又は典型的スペクトル12の曲線に沿って小フレームで走査し、典型的スペクトル12の画像からピーク周辺の小フレームを切り出し(S110)、切り出された小フレームを局所ピークストレージに保存し(S120)、切り出された小フレーム内のピークに対して、ピークを意味する正解のアイコンを与え(S130)、与えられた前記正解のアイコンを正解データストレージ50に格納し(S140)、正解データストレージ50に格納された前記正解のアイコンと局所ピーク学習用ニューラルネットワーク60の出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を局所ピーク学習用ニューラルネットワーク60に出力し(S150)、前記調整量によって、局所ピークストレージ30に保存された小フレームに対して、正解データストレージ50に保存された前記正解のアイコンを回答するようにニューラルネットワークのパラメータが最適化される(S160)、工程をコンピュータに実行させるものである。
【0013】
[11]本発明の物質同定システムは、例えば
図6に示すように、標準スペクトルデータベース110に格納されている標準スペクトルの画像を対象として、小フレームの中心をトレースさせる第1のスペクトルトレーサ130と、[1]~[9]の何れかのスペクトル汎化システムで学習した局所ピーク学習済みニューラルネットワーク140であって、前記標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する第1の局所ピーク学習済みニューラルネットワーク140と、第1の局所ピーク学習済みニューラルネットワーク140によって出力されたデータを結合して第1のフィンガープリントを作成する第1のハッシュ結合装置150と、第1のハッシュ結合装置150で作成された第1のフィンガープリントが格納される標準フィンガープリントストレージ160と、
標準スペクトルデータベース110に格納されている標準スペクトルの各々に対して作成された前記第1のフィンガープリントについて、類型化して、各類型化された個別の第1のフィンガープリントを識別して、個別の第1のフィンガープリント毎に標準フィンガープリントストレージ160に格納する標準フィンガープリント格納管理部170と、
小フレームの中心を今回の同定対象となる計測スペクトル210の画像についてトレースさせる第2のスペクトルトレーサ230と、[1]~[9]の何れかのスペクトル汎化システムで学習した局所ピーク学習済みニューラルネットワーク240であって、計測スペクトル210の逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する第2の局所ピーク学習済みニューラルネットワーク240と、第2の局所ピーク学習済みニューラルネットワーク240によって出力されたデータを結合して第2のフィンガープリントを作成する第2のハッシュ結合装置250と、第1のハッシュ結合装置150で作成された第1のフィンガープリントと、第2のハッシュ結合装置250で作成された第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する比較機260とを備えることを特徴とする。
【0014】
[12]本発明の物質同定システムにおいて、好ましくは、比較機260の比較アルゴリズムは、分類を行う機械学習を含むアルゴリズムであるとよい。分類を行う機械学習を含むアルゴリズムとしては、位置の一致、コサイン類似度、サポートベクターマシーン、ランダムフォレスト等、各種のものがある。
[13]本発明の物質同定システムにおいて、好ましくは、さらに、標準スペクトルデータベース110に格納されている標準スペクトルを画像化する第1の数値マトリクス―画像変換装置120を有するとよい。
[14]本発明の物質同定システムにおいて、好ましくは、さらに、前記今回の同定対象となる計測スペクトル210は、計測スペクトル210を画像化する第2の数値マトリクス―画像変換装置220により与えられるとよい。
[15]本発明の物質同定システムにおいて、例えば
図11に示すように、好ましくは、さらに、計測スペクトル210が得られた場合は、非負線形回帰処理を用いて、標準フィンガープリントストレージ160に格納された複数の第1のフィンガープリントの中から候補となる成分を絞り込む非負線形回帰装置180を備え、比較機260は、第1のハッシュ結合装置150で作成された第1のフィンガープリントに代えて、非負線形回帰装置180で選定された候補に対応するフィンガープリントを標準フィンガープリントストレージ160から呼び出して、第2のハッシュ結合装置250で作成された第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する構成とするとよい。
【0015】
[16]本発明の物質同定方法は、例えば
図7に示すように、標準スペクトルデータベース110に格納されている標準スペクトルの画像を対象として、小フレームの中心のトレースを行い(S210)、[10]のスペクトル汎化方法を用いて学習した第1の局所ピーク学習済みニューラルネットワーク140によって、前記標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力し(S220)、第1のハッシュ結合装置150により、第1の局所ピーク学習済みニューラルネットワーク140によって出力されたデータを結合して、第1のフィンガープリントを作成し(S230)、第1のハッシュ結合装置150で作成された第1のフィンガープリントを標準フィンガープリントストレージ160に格納し(S240)、標準フィンガープリント格納管理部170により、標準スペクトルデータベース110に格納されている標準スペクトルの各々に対して作成された第1のフィンガープリントについて類型化し(S250)、各類型化された個別の第1のフィンガープリントを識別して、個別の第1のフィンガープリント毎に標準フィンガープリントストレージ160に格納する(S260)。
さらに、本発明の物質同定方法は、例えば
図8に示すように、今回の同定対象となる計測スペクトルの画像について、小フレームの中心のトレースを行い(S310)、[10]のスペクトル汎化方法を用いて学習した第2の局所ピーク学習済みニューラルネットワーク240によって、前記計測スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力し(S320)、第2のハッシュ結合装置250により、第2の局所ピーク学習済みニューラルネットワーク240によって出力されたデータを結合して、第2のフィンガープリントを作成し(S330)、第1のハッシュ結合装置150で作成された第1のフィンガープリントと、第2のハッシュ結合装置250で作成された第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する(S340)、工程をコンピュータに実行させることを特徴とする。
[17]本発明の物質同定方法は、例えば
図12に示すように、[16]の物質同定方法において、さらに、計測スペクトル210が得られた場合は、非負線形回帰処理を用いて、標準フィンガープリントストレージ160に格納された複数の第1のフィンガープリントの中から候補となる成分を絞り込み(S360)、第1のハッシュ結合装置150で作成された第1のフィンガープリントに代えて、前記非負線形回帰処理で選定された候補に対応するフィンガープリントと、第2のハッシュ結合装置250で作成された前記第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する(S370)ことを特徴とする。
【発明の効果】
【0016】
本発明のスペクトル汎化システム及び方法、並びに物質同定システム及び方法によれば、測定者、測定装置、測定条件、試料の調製法など外的攪乱要素によらず、スペクトルに内在する特徴量を抽出することにより、試料の成分同定に必要な標準スペクトルとの一致・不一致の判定がコンピュータによってできるようになる。従来熟練者の経験と勘に頼っていた成分同定が機械化され、未修練者から熟練者まで、分析の人依存性がなくなり客観解析が可能になる。
【図面の簡単な説明】
【0017】
【
図1】本発明の一実施例を示すスペクトル汎化システムの構成ブロック図である。
【
図2】本発明の一実施例を示すスペクトル汎化方法のフローチャートである。
【
図3】本発明の一実施例を示すスペクトル数値列データの二次元デジタル画像変換による、形状情報を含んだ入力信号形成処理の説明図で、(A)は数値列データを通常のプロット、(B)は変換後の二次元デジタル画像を示している。
【
図4】本発明の一実施例を示す、小フレームを用いることによる外的攪乱要素の最小化処理の説明図である。
【
図5】尖部の有限ビット表示による機械が理解可能な尖度の概念的説明図で、(A)はある小フレームで切り出したスペクトル、(B)は有限ビット長による尖度の機械可読な概念化の説明図である。
【
図6】本発明の一実施例を示す物質同定システムの構成ブロック図である。
【
図7】本発明の一実施例を示す物質同定方法のフローチャートである。
【
図8】本発明の一実施例を示す物質同定方法のフローチャートで、
図7の続きである。
【
図9】(A)は本発明の一実施例を示す小フレームで切り出したスペクトル、(B)はその尖部の予測結果(ビット表示)人工知能が学習データから構築した尖度概念に基づく予測である。
【
図10】
図6に示す本発明の他の一実施例を、スペクトル測定と標準スペクトルを用いた信号処理の観点から説明した構成ブロック図である。
【
図11】本発明の他の実施例を示す物質同定システムの構成ブロック図である。
【
図13】
図11に示す本発明の他の一実施例を、スペクトル測定と標準スペクトルを用いた信号処理の観点から説明した構成ブロック図で、セレクタによるプレスクリーニングとの組み合わせを示している。
【
図14】
図11に示す本発明の他の一実施例を、スペクトル測定と標準スペクトルを用いた信号処理の観点から説明した構成ブロック図で、非負線形回帰(NNLS)によるプレスクリーニングとの組み合わせを示している。
【
図15】本発明の他の実施例を示すもので、スペクトルの形状をトレースすることにより予測を効率的に行う処理過程の説明図である。
【
図16】本発明で用いられる非負線形回帰演算(NNLS)でライブラリデータを使ってX線回折の結果を回帰した例である
【発明を実施するための形態】
【0018】
以下、図面を用いて本発明を説明する。
図1は本発明の一実施例を示すスペクトル汎化システムの構成ブロック図である。図において、スペクトル汎化システムは、数値マトリクス-画像変換装置10、典型的スペクトル12、局所ピーク切り出し装置20、局所ピークストレージ30、n×1アイコン生成装置40、正解データストレージ50、局所ピーク学習用ニューラルネットワーク60及び学習用比較機70を備えている。
【0019】
数値マトリクス-画像変換装置10は、典型的スペクトル12の数値マトリクスをデジタル画像化する。実施例では、数値マトリクスは周波数又は波数と信号強度であり、デジタル画像化は、例えば1201×1201画素のデジタル画像に変換するものである。なお、デジタル画像化の画素数は典型的スペクトル12のピーク形状を的確に表現できる解像度が得られればよく、他方で計算負荷を低減する立場からは、過度にデジタル画像化の画素数を増やすのは良くない。例えば、500×500画素でもよく、また2000×2000画素でもよい。
図3は、数値マトリクス-画像変換装置10で用いられる、本発明の一実施例を示すスペクトル数値列データの二次元デジタル画像変換による、形状情報を含んだ入力信号形成処理の説明図で、(A)は数値列データを通常のプロット、(B)は変換後の二次元デジタル画像を示している。例えば、
図3(A)に示すf(x)について、
図3(B)の小フレームで切り出した情報を局所ピーク切り出し装置20に対する入力信号とすることで、局所ピーク切り出し装置20によるf(x)周辺の情報を含んだ形状認識が可能となる。
【0020】
局所ピーク切り出し装置20は、数値マトリクス-画像変換装置10で画像化された典型的スペクトル12を1画素ごとに小フレームで走査し、ピーク周辺の小フレームを切り出す構成とする。学習の場合は、小フレームの中の様々な場所に満遍なくなくピークがある画像を使うのが、ピークと傾斜の違いを教える学習法として好ましいからである。小フレームを用いることによって、典型的スペクトル12に含まれる外的攪乱要素の影響が最小化される。小フレームの画素数は典型的スペクトル12のピーク形状を的確に表現できる解像度が得られればよく、他方で計算負荷を低減する立場からは、過度に画素数を増やすのは良くない。例えば、16×16画素でもよく、また64×64画素でもよい。
局所ピークストレージ30には、局所ピーク切り出し装置20で切り出された小フレームをすべて保存する。
図4は、本発明の一実施例を示す、小フレームを用いることによる外的攪乱要素の最小化処理の説明図である。局所的なスペクトルの尖度をスペクトルの概念とすることで、大きなスペクトル範囲のうねりの影響などを小さくすることができる。
【0021】
n×1アイコン生成装置40は、局所ピーク切り出し装置20で切り出された小フレーム内のピークに、ピークを意味する正解のアイコンを与えるものである。本明細書におけるアイコンとは、マーク等を広く含む概念とする。アイコンはピーク形状類型の判別パターンに応じた類型別のn×1アイコンであるとよい。ピーク形状類型の判別パターンは、前記ピークに含まれる尖度、歪度、及び尖度と歪度の少なくとも一種類のパラメータに応じた類型別のn×1アイコンであるとよい。類型別のn×1アイコンは、前記ピークのパラメータを人工知能の一種であるスペクトル汎化システムで用いるパラメータに変換したものである。n×1アイコン生成装置40は、アイコンの位置をデジタル画像化された典型的スペクトルのピーク位置座標に合わせて画像表示させる情報を含むとよい。ここで、nは自然数であって、例えば4以上20以下の画素が好ましく、さらに好ましくは5以上15以下の画素がよい。また、ピークを意味する正解のアイコンは、縦長の[n個の画素]x[1個の画素]に限定されるものではなく、[n個の画素]x[m個の画素]であってもよい。ここで、mは自然数であって、例えば1以上5以下の画素が好ましく、さらに好ましくは1以上2以下の画素がよい。計算負荷を低減する立場からは、ピークを意味する正解のアイコンの画素数は少ないほどよい。他方で、ピーク形状を特徴量で表す場合の表現の自由度を高める立場からは、画素数が大きくてもよい。
図5は、尖部の有限ビット表示による機械が理解可能な尖度の概念的説明図で、(A)はある小フレームで切り出したスペクトル、(B)は有限ビット長による尖度の機械可読な概念化の説明図である。
図5(B)に示す有限ビット長による尖度の機械可読な概念化は、
図5(A)に示すスペクトル画像に対するセマンティックセグメンテーションの正解データに相当する。
【0022】
正解データストレージ50には、n×1アイコン生成装置40の正解のアイコンが格納される。このアイコンは、今回解析の対象となったピークに含まれるパラメータを人工知能の一種であるスペクトル汎化システムや物質同定システムで用いるパラメータに変換したものである。
局所ピーク学習用ニューラルネットワーク60は、局所ピークストレージ30に保存された小フレームに対して、正解データストレージ50に保存された正解のアイコンを回答するようにニューラルネットワークのパラメータが最適化されるべく学習するものである。局所ピーク学習用ニューラルネットワーク60が学習途上の段階では、学習用比較機70からパラメータ最適化に必要な調整量が局所ピーク学習用ニューラルネットワーク60に帰還される。
学習用比較機70は、正解データストレージ50に格納された正解のアイコンと局所ピーク学習用ニューラルネットワーク60の出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を局所ピーク学習用ニューラルネットワーク60に出力する。
【0023】
次に、このように構成された装置の動作について説明する。
図2は、本発明の一実施例を示すスペクトル汎化方法のフローチャートである。
数値マトリクス-画像変換装置10は、典型的スペクトル12の数値マトリクスをデジタル画像化する(S100)。
局所ピーク切り出し装置20は、デジタル画像化された典型的スペクトルを1画素ごとに、又は典型的スペクトル12に沿って小フレームで走査し、典型的スペクトル12の画像からピーク周辺の小フレームを切り出す(S110)。局所ピークストレージ30は、局所ピーク切り出し装置20で切り出された小フレームを局所ピークストレージに保存する(S120)。n×1アイコン生成装置40は、切り出された小フレーム内のピークに対して、ピークを意味する正解のアイコンを与える(S130)。
正解データストレージ50には、与えられた正解のアイコンが格納される(S140)。学習用比較機70では、正解データストレージ50に格納された正解のアイコンと局所ピーク学習用ニューラルネットワーク60の出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を局所ピーク学習用ニューラルネットワーク60に出力する(S150)。学習用比較機70による学習の結果として、局所ピーク学習用ニューラルネットワーク60では、局所ピークストレージ30に保存された小フレームに対して、正解データストレージ50に保存された前記正解のアイコンを回答するようにニューラルネットワークのパラメータが最適化される(S160)。 上記処理は、プログラムによりコンピュータに実行させてもよい。
【0024】
様々な形の小フレームに対して、同じ形状のn×1の正解のアイコンを回答させることで、「ピーク」の概念を教え、汎化する。こうして「ピーク概念」のパラメータがニューラルネットワーク(NN)内でいったん決まると、以後あらゆるピーク入力に対して、「ピークらしさ」のスコアを与えるようになる。そのスコアは、ピークの広がりや非対称性などで決まる。
【0025】
<実施例1>
スペクトル数値列データの二次元デジタル画像変換による、形状情報を含んだ入力信号の形成処理
スペクトルの数値列データを、横軸波数cm
-1、縦軸信号強度の通常のプロットで表すと
図3(A)のようになる。これは横軸xに対して、縦軸f(x)をプロットしたものといえる。これを二次元デジタル画像情報B(x,y)として、次式で表す。
B(x,y)=1(0≦y≦f(x))
B(x,y)=0(y>f(x)) (1)
上式で表される二次元デジタル画像情報B(x,y)は、
図3(B)のように1ビット二次元デジタル画像に変換したものである。ここで画像のビット情報として黒を1白を0、または黒を0白を1とする。ここでは1と0で差を表したが、二値化していれば数値は問わない。この変換により、数列f(x)は二次元デジタル情報B(x,y)に変換される。従って、コンピュータに小フレームでスペクトルを入力することにより、数列情報としてではなく二次元デジタル情報としてf(x)周辺の情報を含んだ形状認識が可能となる。
【0026】
<実施例2>
小フレームを用いることによる外的攪乱要素の最小化処理
B(x,y)に変換されたスペクトルの特徴を表している一部を小フレームで切り出すことで人工知能が学習するトレーニングデータとする(
図4)。典型的にはスペクトルの尖った部分となるが、それに限らない。小フレームのサイズは、スペクトル全体のフレームサイズの1/400程度が好ましい。
この小フレームを使うことで、広い範囲に及ぶスペクトルのうねりの影響を排した機械学習が可能になる。さらに、小フレーム位置を、フレームのサイズをΔxf,Δyfとして、フレーム位置を±Δxf/2、±Δyf/2の範囲で変化させることで、スペクトルの特徴をより多くトレーニングすることができる。また、小フレームで切り出したスペクトルを左右反転させるトレーニング量を増やすことも学習効果を高めるのに望ましい。
【0027】
<実施例3>
尖部の有限ビット表示による機械が理解可能な尖度の概念化処理
切り出された小フレームの二次元デジタル情報のうち、尖度を解させるための有限ビット表示A(x,y)を、次式で表す。
A(x,y)=1(xはdf(x)/dx=0となるx,f(x)-BL≦y≦f(x))
A(x,y)=0(xはdf(x)/dx=0となるx,y<f(x)-BL,y>f(x))
A(x,y)=0(xはdf(x)/dx≠0となるx,yは任意)(2)
ここでBLは有限ビット長であり、A(x,y)を尖った部分という意味を与えるセマンティックセグメントとなる。具体的には
図5(A)の小フレームのスペクトルに対して、
図5(B)が正解データなる。この時のBLはフレームサイズの1/4から1が好ましい。
【0028】
図6は、本発明の一実施例を示す物質同定システムの構成ブロック図である。図において、物質同定システムは、標準スペクトルデータベース110、第1の数値マトリクス―画像変換装置120、第1のスペクトルトレーサ130、第1の局所ピーク学習済みニューラルネットワーク140、第1のハッシュ結合装置150、標準FP(フィンガープリント)ストレージ160、標準フィンガープリント格納管理部170を備えている。
本発明の物質同定システムは、更に、非負線形回帰装置180、計測スペクトル210、第2の数値マトリクス―画像変換装置220、第2のスペクトルトレーサ230、第2の局所ピーク学習済みニューラルネットワーク240、第2のハッシュ結合装置250及び比較機260を備えている。
【0029】
第1の数値マトリクス―画像変換装置120は、標準スペクトルデータベース110に格納されている標準スペクトルを画像化するものである。標準スペクトルは、本発明の物質同定システムで解析対象となるスペクトル、例えばラマン分光分析計、赤外線分光分析計、近赤外分光分析計等がある。機械学習を前提としているので、標準スペクトルの画像データの数は多いほうが好ましく、例えば1000枚から10000枚程度を準備するとよい。
【0030】
第1のスペクトルトレーサ130は、標準スペクトルデータベース110に格納されている標準スペクトルの画像を対象として、小フレームの中心をトレースさせる。即ち、第1のスペクトルトレーサ130は、標準スペクトル全体に対して十分小さい矩形の小フレームの対角線の交点(中心)を、スペクトル形状を示す画面上の線と一致するように移動させることができる。 第1の局所ピーク学習済みニューラルネットワーク140は、前出のスペクトル汎化システムで学習した局所ピーク学習用ニューラルネットワーク60によって、前記標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する。即ち、第1の局所ピーク学習済みニューラルネットワーク140が、標準スペクトル曲線のトレースにより逐次変化する小フレーム内のピークに対して、予測のアイコンを与え、該予測のアイコンを数値化したデータを出力する。ここで、逐次ピーク尤度とは、標準スペクトルに逐次現れるピークに対して、ピーク形状に関する統計モデルの適合度を示す指標である。
ハッシュ化とは、ハッシュ関数を用いて、任意のデータから、別の値を得るための操作をいい、当該別の値は、多くの場合は短い固定長の値である。ハッシュ関数は、主に検索の高速化やデータ比較処理の高速化に使われるもので、例えば、データベース内の項目を探したり、大きなファイル内で重複しているレコードや似ているレコードを検出する場合に利用される。
【0031】
第1のハッシュ結合装置150は、第1の局所ピーク学習済みニューラルネットワーク140によって出力されたデータを結合して第1のフィンガープリントを作成する。
標準フィンガープリントストレージ160は、第1のハッシュ結合装置150で作成された第1のフィンガープリントが格納されるものである。
本発明におけるフィンガープリントは、標準スペクトルに逐次現れるピーク形状について抽出した特徴量をベクトル化したもので、標準スペクトルに用いられた試料の素性の同一性を表すものである。本発明におけるフィンガープリントは、ピーク形状について抽出した特徴量を用いて、測定されたスペクトルの成分の照合に用いられる。
【0032】
標準フィンガープリント格納管理部170は、標準スペクトルデータベース110に格納されている標準スペクトルの各々に対して作成された第1のフィンガープリントについて、類型化して、各類型化された個別の第1のフィンガープリントを識別して、個別の第1のフィンガープリント毎に標準フィンガープリントストレージ160に格納する。
【0033】
第2の数値マトリクス―画像変換装置220は、今回の同定対象となる計測スペクトルを画像化する。計測スペクトルは、計測スペクトル210として、例えばラマン分光分析計、赤外線分光分析計、近赤外分光分析計等から送られる。
第2のスペクトルトレーサ230は、小フレームの中心を今回の同定対象となる計測スペクトル210の画像についてトレースさせる。
第2の局所ピーク学習済みニューラルネットワーク240は、前出のスペクトル汎化システムで学習した局所ピーク学習済みニューラルネットワーク240によって、前記計測スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する。
【0034】
第2のハッシュ結合装置250は、第2の局所ピーク学習済みニューラルネットワーク240により出力されたデータを結合して第2のフィンガープリントを作成する。
比較機260は、第1のハッシュ結合装置150で作成された第1のフィンガープリントと、第2のハッシュ結合装置250で作成された第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する。比較機260の比較アルゴリズムは、分類を行う機械学習を含むアルゴリズムであるとよい。分類を行う機械学習を含むアルゴリズムとしては、位置の一致、コサイン類似度、サポートベクターマシーン、ランダムフォレスト等、各種のものがある。
【0035】
次に、このように構成された装置の動作について説明する。
図7は、本発明の一実施例を示す物質同定方法のフローチャートである。
第1の数値マトリクス―画像変換装置120は、標準スペクトルデータベース110に格納されている標準スペクトルを画像化する(S200)。
第1のスペクトルトレーサ130は、標準スペクトルデータベース110に格納されている標準スペクトルの画像を対象として、小フレームの中心のトレースを行なう(S210)。
続いて、前出のスペクトル汎化方法を用いて学習した第1の局所ピーク学習済みニューラルネットワーク140によって、標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する(S220)。第1のハッシュ結合装置150により、第1の局所ピーク学習済みニューラルネットワーク140によって出力されたデータを結合して、第1のフィンガープリントを作成する(S230)。
【0036】
そして、第1のハッシュ結合装置150で作成された第1のフィンガープリントを標準フィンガープリントストレージ160に格納する(S240)。
標準フィンガープリント格納管理部170により、標準スペクトルデータベース110に格納されている標準スペクトルの各々に対して作成された第1のフィンガープリントについて類型化する(S250)。さらに、標準フィンガープリント格納管理部170は、各類型化された個別の第1のフィンガープリントを識別して、個別の第1のフィンガープリント毎に標準フィンガープリントストレージ160に格納する(S260)。
【0037】
図8は、本発明の一実施例を示す物質同定方法のフローチャートで、
図7の続きである。
第2の数値マトリクス―画像変換装置220は、今回の同定対象となる計測スペクトルの画像化する(S300)。
第2のスペクトルトレーサ230は、今回の同定対象となる計測スペクトルの画像について、小フレームの中心のトレースを行なう(S310)。
続いて、前出のスペクトル汎化方法を用いて学習した第2の局所ピーク学習済みニューラルネットワーク240によって、前記計測スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する(S320)。第2のハッシュ結合装置250により、第2の局所ピーク学習済みニューラルネットワーク240によって出力されたデータを結合して、第2のフィンガープリントを作成する(S330)。
比較機260は、第1のハッシュ結合装置150で作成された第1のフィンガープリントと、第2のハッシュ結合装置250で作成された第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する(S340)
【0038】
<実施例4>
スペクトルの尖部の予測結果(ビット表示)の一軸射影などによる次元削減とそのフィンガープリント化処理
図5で例示したようなトレーニングデータ(A)と対応する正解データ(B)を人工知能が学習することにより、例えば小フレームに
図9(A)のようなスペクトルが存在する場合に、人工知能は
図9(B)のような推測結果を出力する。
【0039】
この予測結果は、人工知能がトレーニングデータから得た局所的なスペクトルの概念を基に、新たな入力スペクトルを診断し表現したものであり、形状に固有のものとなる。
図9(B)の予測はピークの二つのピークの重なりを示唆して、二か所に尖度のあると予測している。
図3(B)の全フレームに渡ってこの予測を行うことにより、スペクトル全体が、人工知能が学んだ局所スペクトルの概念を基に機械可読な形式に変換される。この変換結果自体フィンガープリントとなるが、これをスペクトル照合に用いるために、例えば
【数1】
によって一次元に次元削減を行うことが望ましい。このFP(x)による次元削減されたフィンガープリントの具体例として、
図9(B)の場合、式(3)のようになる。
FP(x)=(0,0,0,0,0,4,0,0,0,0,0,0,6,6,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0) (3)
【0040】
<実施例5>
スペクトルのフィンガープリントのライブラリ化と新たな測定結果のフィンガープリントの一致度の導入による成分同定法
実施例4に例示した通りフィンガープリント化した標準スペクトルは、ライブラリとして保存される。このライブラリにあるフィンガープリントFPstdと、測定したスペクトルのフィンガープリントFPmeasの比較(一致度診断)を行い、一致度の高いものから順に確からしい成分として予測結果が出力される。一致度診断には、例えば、次の式(4)で表されるコサイン類似度が有効である。
【数2】
ここでn
fはフィンガープリントの次元である。コサイン類似度の他には、例えばサポートベクターマシーンなども有効である。この成分同定法のフローを
図10に示す。
【0041】
図10は、
図6に示す本発明の他の一実施例を、スペクトル測定と標準スペクトルを用いた信号処理の観点から説明した構成ブロック図である。
図10に示す構成ブロック図のように、標準スペクトルのフィンガープリントのライブラリ化と新たな測定結果のフィンガープリントの一致度診断による成分同定処理が行える。
図10に示すスペクトル測定と標準スペクトルを用いた信号処理によれば、外的攪乱因子のないフィンガープリント同士の比較による成分同定が可能になる。
【0042】
図11は、本発明の他の実施例を示す物質同定システムの構成ブロック図で、
図6に示す物質同定システムに非負線形回帰装置180を付加したものである。なお、
図11において、
図6と同一作用を行うものには同一符号を付して説明を省略する。
図において、非負線形回帰装置180は、標準スペクトルデータベース110から標準スペクトルと、入力された計測スペクトル210とを用いて、非負線形回帰処理によって、候補となる成分を絞り込む。候補となる成分は、被測定物質に含まれる各種の成分に応じたものであり、中性子、X線、紫外線、可視光線、赤外線、マイクロ波、超音波など様々な電磁波を使い、吸収、散乱、回折現象など各種の現象に応じたスペクトル形状を示すものに対して適合度が高いものである。非負線形回帰処理については、後で説明する。
比較機260は、第1のハッシュ結合装置150で作成された第1のフィンガープリントに代えて、非負線形回帰装置180で選定された候補に対応するフィンガープリントを標準フィンガープリントストレージ160から呼び出して、第2のハッシュ結合装置250で作成された第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する。
【0043】
図12は、
図11に示す物質同定方法のフローチャートで、
図7の続きである。なお、
図12において、
図7と同一作用を行う工程には同一符号を付して説明を省略する。
S330に続いて、計測スペクトル210が得られた場合は、非負線形回帰装置180による非負線形回帰処理を用いて、標準フィンガープリントストレージ160に格納された複数の第1のフィンガープリントの中から候補となる成分を絞り込む(S360)。
比較機260によって、非負線形回帰装置180で選定された候補に対応するフィンガープリントを標準フィンガープリントストレージ160から呼び出して、第2のハッシュ結合装置250で作成された第2のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する(S370)。
【0044】
<実施例6>
非負線形回帰(NNLS)によるプレスクリーニングとの組み合わせることによる成分同定の改良処理
図13は、本発明の他の一実施例を示す非負線形回帰(NNLS)によるプレスクリーニングとの組み合わせによる成分同定処理の一例であって、
図10の構成ブロック図で示す装置にプレスクリーニングのセレクタを設けてある。
実施例5ではライブラリにある全標準スペクトルのフィンガープリントを一致度診断に使うため、効率が低い。本発明の物質同定システムに係る成分同定の原理実証には過不足ないが、セレクタとして非負線形回帰処理を組み合わせる事で同定効率を高めることができる。
【0045】
図14は、本発明の他の一実施例を示す非負線形回帰(NNLS)処理によるプレスクリーニングとの組み合わせによる成分同定の改良である。非負線形回帰(NNLS)によりライブラリから候補を事前に絞り、予測効率と精度を上げることが可能になる。なお、非負線形回帰(NNLS)処理については、後で説明する。
標準スペクトルライブラリで数百以上ある候補は、NNLSにより6乃至10程度にプレスクリーニングすることができ、検索効率は10倍以上に改善された。
【0046】
図14に示す物質同定システム及び方法による同定の精度は、二成分の混合試料の上位二成分が正解に一致する事例が85.7%、上位三成分に正解が含まれるものが100%となった
【0047】
<実施例7>
スペクトルの形状をトレースすることにより予測を効率的に行うシステム及び方法
図15は、本発明の他の実施例を示すスペクトルの形状をトレースすることにより予測を効率的に行う処理過程の説明図で、
図15(A)は逐次予測のための小フレーム走査の一例、
図15(B)スペクトル形状f(x)に沿って局所予測する改善事例を示している。
図15(A)に示す信号処理では、原理的には[(Fx-Δxf)/Δxf]×[(Fy-Δyf)/Δyf]回の局所的なフィンガープリントの予測が必要になる。ここで、Fxはスペクトルのx軸のピクセル数、Fyはスペクトルのy軸のピクセル数、Δxfはx軸の一ピクセル当たりの周波数又は波数、Δyfはy軸の一ピクセル当たりの周波数又は波数である。
図15(A)を基準とすると、
図15(B)に示す処理は(Fy-Δyf)×Δxf/Δyf倍の予測回数の効率化が図れる。
【0048】
即ち、小フレームによるセマンティックセグメンテーションを全スペクトル領域に適用する場合、二次元デジタル画像のスペクトルサイズをFx×Fyとすると、原理的には[(Fx-Δxf)/Δxf]×[(Fy-Δyf)/Δyf]回の局所的なフィンガープリントの予測が必要になる。その逐次予測のための小フレーム走査の一例を
図15(A)に示す。その多くは、空白部分を走査しており、明らかに無駄な局所フィンガープリントの予測が繰り返される。
これに対して、本実施の形態ではスペクトル形状f(x)に沿って局所予測する改善例である
図15(B)の場合、Fx-Δxf回の局所フィンガープリントの予測でスペクトル全体のフィンガープリントが近似的に得られる。
図15(A)と
図15(B)の予測回数の比は(Fy-Δyf)×Δxf/Δyfとなり、フレームサイズが1000×1000程度の典型的なスペクトルの場合>1000倍程度の効率化が図れる。ここで、
図15(B)において間引きnにより(Fx-Δxf)/n回の局所フィンガープリントの予測でスペクトル全体のフィンガープリントを近似することで、さらにn倍の予測効率の改善が図られる。
【0049】
本発明の構成要件事項として、赤外吸収分光やX線回折等での混合成分解析の問題で取り扱われる数学的概念である、非負線形回帰演算(NNLS)について説明する。
【0050】
<非負最小二乗(NNLS、 Non Negative Least Squares)>
混合成分の問題は、赤外吸収分光に限ったものではない。例えば、光の波長も原理も異なるが、極めて汎用的な結晶構造分析法であるX線回折で混合成分を解析した場合、回折パターンが重なり合い、どのピークがどの成分に帰属するか特定することは困難である。本発明の構成要件事項として、X線回折で良好な解決法となった非負線形回帰演算としての非負線形回帰(NNLS)処理について述べる。
【0051】
X線回折での混合成分解析の問題は、市販・実験・公知情報などに基づくライブラリまたはデータベースの中から、最も確からしいデータを選ぶ、という課題に換言できる。
【0052】
このタスクは、測定結果がライブラリにあるデータの線形和で表されると考えると、次の式(5)における成分p(ドット)を求める数学的問題に帰結できる。
【数3】
この問題を解く方法としては、例えば特異値分解(SVD, Singular Value Decomposition)といった、誤差二乗(フロベニウスノルムFrobenius norm)を最小にする成分を抽出する次元削減などの近似解法が考えられる。例えば、[Christopher J. Gilmore, Gordon Barr and Jonathan Paisley, J. Appl. Cryst. 37, 231 (2004)]参照。
【0053】
これは一般的に行列A(成分a
ij)のフロベニウスノルムが、次の式(6)となることによる。
【数4】
【0054】
ここで、ランク(rank)とは、線型代数学における行列の階数のことで、行列の最も基本的な特性数(characteristic)の一つであって、その行列が表す線型方程式系および線型変換がどのくらい「非退化」であるかを示すものである。行列の階数を定義する方法として、行列Aの階数rank(A)は、Aの列空間(列ベクトルの張るベクトル空間)の次元に等しく、またAの行空間の次元とも等しい。行列の階数は、対応する線型写像の階数である。
【0055】
式(6)においては、長方行列のランクまでの適当な範囲で二乗和を打ち切ることで次元削減が実現できる。これを低ランク近似というが、特異値が小さいものを0とすれば、基本的に主成分分析(PCA, Principal Component Analysis)と等価である。
【0056】
しかし、SVDやPCAの座標変換による直交成分最大を使った成分分離の考え方は、いくつかの主要な成分を決定するには効果的であるが、赤外線分光分析での混合成分解析用のタスクには必ずしも適さない。すなわち、直交成分最大を取ることは、見方を変えると類似ベクトルを縮退させることに対応するために、ライブラリに含まれる、プロセスなどに依存してわずかに異なる(しかしよく似た)同じ材料を過小評価することになる。実際の試料ではよく似た二つ以上の成分が混合していることはよくあり、更に赤外吸収分光ではこうした微小な差が重要であることが多い。従って、微小な差は、本来は削減されずに線形結合により確からしいものとして選ばれることが望まれる。またSVDの次元削減は、根本的に微小成分を過小評価する方向にある点も、分析上は見逃し難い点である。
【0057】
そこで、式(4)を直交分解(QR分解)すなわち、最小二乗(LS, Least Squares)法で解くことを考える。この場合は絶対的な直交空間内で各成分の残差を等しく見積もる反面、数学的に誤差最小をとる傾向が強まり、結果的に競合的な成分を負にすることがよくある。実際、SVDでも問題になった、よく似たスペクトルを持つ材料でこの傾向は特に著しくなる。こうした物理的に本来あり得ない解は、そのほかの成分の抽出結果にも影響が及ぶため、避ける必要がある。
【0058】
この解決策として、負の成分を与える基底ベクトルを取り除き回帰を行うNNLSを考える。NNLSは、例えば文献[C. L. Lawson and R. J. Hanson, Solving Least Squares Problems (Society for Industrial and Applied Mathematics, Philadelphia, 1995) 参照]でも記載されている古典的手法ながら、本発明の課題解決には良い結果を与える。非負回帰の手順は、次の手順(あ)~(う)に要約され、主要なものから順次成分xを決定することが可能である。
(あ):基底ベクトルと、それに対応する双対ベクトルλを計算。
(い):λが最大になる基底ベクトルを選んで、ほかの基底ベクトルと交換。
(う):(あ)と(い)の処理をすべてのλについて繰り返す。
【0059】
特に、λ≦0になるまで繰り返すことにすれば、非負の全ての成分による近似が可能になる。この手順によれば、直交成分最大を使うことなく確からしい成分を抽出し、かつ物理的にあり得ない負の成分を除くことができる。
図16はライブラリにあるX線回折の実測値を使って、NNLSによってX線回折の測定結果(破線)をフィッティングした例(実線)であり、良い一致が得られていることがわかる。
【0060】
なお、上述した実施例は本発明の説明のための例示であり、制限的に解釈されるべきではない。例えば、本発明のスペクトル汎化システムとして数値マトリクス-画像変換装置10を用いる場合を示したが、要は波数又は周波数と信号強度からなる数値マトリクスを予め定められた画素密度で画像変換できるものであればよく、このような画像変換された数値マトリクスによるスペクトル画像は、スキャナーや写真などの外部機器を用いて、本発明のスペクトル汎化システムにデータとして供給されてもよい。また、本発明の物質同定システムとして第1の数値マトリクス-画像変換装置120や第2の数値マトリクス-画像変換装置220を用いる場合を示したが、要は波数又は周波数と信号強度からなる数値マトリクスを予め定められた画素密度で画像変換できるものであればよく、このような画像変換された数値マトリクスによるスペクトル画像は、スキャナーや写真などの外部機器を用いて、本発明の物質同定システムにデータとして供給されてもよい。
【産業上の利用可能性】
【0061】
本発明のスペクトル汎化システム及び方法、並びに物質同定システム及び方法は、極めて広いスペクトル解析に用いることができる。スペクトル解析は中性子、X線、紫外線、可視光線、赤外線、マイクロ波、超音波など様々な電磁波を使い、吸収、散乱、回折現象などを基盤としており、その観測スペクトル形状はよく似ているためである。人工知能を用いたこれらのスペクトルの汎化により、ハッシュ化を多様な基準で行えるようになり、分析化学における網羅的な材料の同定や特性の予測に適用可能となる。
【符号の説明】
【0062】
スペクトル汎化システムについて
10 数値マトリクス-画像変換装置
12 典型的スペクトル
20 局所ピーク切り出し装置
30 局所ピークストレージ
40 nx1アイコン生成装置(ピーク形状類型の判別パターン)
50 正解データストレージ
60 局所ピーク学習用NN(ニューラルネットワーク)
70 学習用比較機
物質同定システムについて
110 標準スペクトルDB(データベース)
120、220 数値マトリクス-画像変換装置
130、230 スペクトルトレーサ
140、240 局所ピーク学習済NN(ニューラルネットワーク)
150、250 ハッシュ結合装置
160 標準FP(フィンガープリント)ストレージ
170 標準フィンガープリント格納管理部
180 非負線形回帰装置
210 計測スペクトル
260 比較機