(58)【調査した分野】(Int.Cl.,DB名)
時間的に変化する同一の第1の関数に従って、識別対象試料を複数のチャンネルを有する化学センサに入力として与えることにより、前記複数のチャンネルからの時間的に変化する複数の出力からなる識別対象試料出力の群を求め、
時間的に変化する同一の第2の関数に従って、対照用試料を前記化学センサと同一のまたは前記化学センサと同一の特性の複数のチャンネルを有する化学センサに入力として与えることにより、当該複数のチャンネルからの時間的に変化する複数の出力からなる対照用試料出力の群を求め、
前記識別対象試料出力の群と前記対照用試料出力の群との間の対応する前記チャンネル間の関係を求めてから、当該関係を前記複数のチャンネルの間で比較する第1の比較を行うか、あるいは
前記識別対象試料出力の群及び前記対照用試料出力の群のそれぞれにおいて前記チャンネルに対応する前記出力間の関係を求めてから、当該関係を前記識別対象試料出力と前記対照用試料との間で比較する第2の比較を行い、
前記第1または第2の比較の結果に基づいて前記識別対象試料と前記対照用試料とを識別する
化学センサによる試料識別方法。
前記化学センサの各チャネルにおいて、当該チャネルの出力が当該チャネルの入力と当該チャネルの伝達関数(h)との乗算または加算の形で相互に分離して記述できる、請求項1に記載の化学センサによる試料識別方法。
前記式(1)を多項式で表現されるようにする変換における前記多項式は、以下の乗算の式(2)として表され、X、Y及びHをそれぞれ前記チャンネルへの入力、出力及びその間の伝達関数に対応する変数または定数とすると、
Y=HX (2)
の形式である、請求項3に記載の化学センサによる試料識別方法。
前記式(1)を多項式で表現されるようにする変換は、前記式(1)における前記畳み込み演算を行列またはベクトルの乗算に変換することである、請求項4から6の何れか1項に記載の化学センサによる試料識別方法。
前記式(1)を多項式で表現されるようにする変換は、前記式(1)を時間領域の関数から周波数領域の関数へ変換することである、請求項4から6の何れか1項に記載の化学センサによる試料識別方法。
【発明を実施するための形態】
【0021】
本発明の一態様では、複数の特性の異なるチャンネルを有する化学センサに試料を導入する際に、各チャンネルでの応答を基に解析を行うことで試料の識別を行う手法が提供される。これにより、試料の導入の時間変化を制御・モニタすることなしに試料の特性(試料の化学種、濃度、温度等)による識別手法が提供される。
【0022】
本発明は、化学センサを用いた測定により試料の分析を行うものである。化学センサとは気相や液相等の中に存在する各種の分子やイオンを識別・検出するセンサを指す広い概念である。本願ではその例として、膜が特定の化学種である化学物質を吸着することによる微小な膨張・収縮を検出して電気信号に変換するナノメカニカルセンサの一種である膜型表面応力センサ(MSS)を取り上げて説明を行っている。しかし、化学センサとは検出対象に基づく概念であって、その動作原理や構造等は問わない。例えば、化学センサの動作原理としては他にも、各種の化学反応を利用するもの、電気化学的な現象を利用するもの、半導体素子とその周辺に存在する各種の物質との相互作用を利用するもの、酵素などの生物学的な機能を利用するもの、その他多様な原理が応用されている。本発明で使用可能なセンサ本体は、試料に対し何らかの応答を示すものであれば、その構造、動作原理等は特に制限されない。
<理論的背景>
【0023】
図1に本発明の概念図を示す。特性の異なる複数のチャンネルを持つ化学センサに対して何らかの入力があると、各チャンネルでそれぞれ異なるシグナルが得られる。今、入力とシグナルの関係を結ぶものを「伝達関数」と定義する。この伝達関数は、どのような時間ないし周波数の関数の入力であっても変化しない、センサ‐試料の組み合わせに固有のものである場合が多いので、試料の導入を入力、シグナルを出力とした伝達関数を求めることで試料の識別を行うことが可能となる。今、特性の異なる複数のチャンネルから構成されるセンサで測定を行った場合を考える。この場合、入力は全チャンネルで同一となるが、各チャンネルでその試料に対する伝達関数が異なるため、得られるシグナルはチャンネルごとに異なる。今、入力が全チャンネルで同一であることから、ある任意の入力に対するチャンネル間のシグナルの比較により、チャンネル間の伝達関数の比較を行うことが可能となる。このチャンネルごとの伝達関数の間の関係も試料に固有のものであるから、これを元に試料の識別が可能となる。これにより、入力を制御・モニタすることなく、チャンネル間のシグナルの相対値のみを用いて試料の識別を行うことが可能となる。
【0024】
このようにして複数のチャンネルを持つ化学センサを用いて試料の識別を行う場合、識別の方法は大別すると2通り考えられる。今、C個のチャンネルからなる化学センサを用いて化学種、濃度、温度等が未知の試料(測定対象試料とも呼ぶ)uについて測定を行い、予め測定を行っている既知の試料gと一致するかどうかを評価することを考える。
図2および
図3に示すように、既知の試料gの測定で得られた学習用データY
gと未知の試料uの測定で得られたデータY
u(機械学習等の分野において多用されている、推定を検証するためのデータをテスト用データと呼ぶ用語法に従い、本願ではこれをテスト用データと呼ぶ)について、c番目のチャンネルで特徴量F
q,c(qはgもしくはu)が得られたとする。まず一つの方法は、
図2に示したように、F
u,cとF
g,cから新たな特徴量G
ug,cを求め、各チャンネルについて比較する方法である。このとき入力の関数は測定ごとに異なると考えなければならないので、得られる特徴量G
ug,cも試料のみで決まるものでなく、同じgとuの組み合わせであっても測定ごとに変わる値である。しかし、未知試料uと学習した試料gが一致するとき、G
ug,cは全てのチャンネルで同じ値になるため、G
ug,cをチャンネル間で比較することにより、未知の試料uが既知の試料gと同じものかどうか評価することが可能となる。もう一つの方法は、
図3に示したように、任意のチャンネルmとnについて、それぞれのチャンネルで得られる特徴量F
q,m、F
q,nから新たな特徴量K’
q,mnを求める方法である。このとき得られる特徴量K’
q,mnは試料固有のものであり、試料が同じであれば測定によらず常に同じ値を取る。したがって、未知試料uについて任意の2つのチャンネルm、nから特徴量K’
u,mnを求め、その値を学習した試料gのK’
g,mnと比較することで試料uが試料gと同じものかどうか識別することが可能となる。
【0025】
このような試料の識別は、出力(y)が入力(x)とその伝達関数(h)との乗算もしくは加算の形で相互に分離して記述できるときに可能である。ここで乗算の形で記述できる場合には対数を取れば加算の形となり、逆も同様であることから、一方を説明するだけで十分である。よって、以下では乗算の場合について説明を行う。例として、入力と出力との関係が線形である系について考える。まず、試料gのセンサ素子への流入量をx
g(t)とし、その結果チャンネルcでセンサシグナルy
g,c(t)を得たとする。ただしtは時刻である。今、x
g(t)とy
g,c(t)は線形性を有すると仮定していることから、時間伝達関数h
g,c(t)を用いて
【数1】
と畳み込みで表すことができる。通常畳み込み積分では積分区間を−∞から+∞までとするが、因果律より時刻tより後の未来のx
g(t)が現在のy
g,c(t)に影響を与えることはないのでτ<0をτの積分区間から除外する。また、測定はx
g(t)からy
g,cへの信号伝達に要する時間よりも十分長時間行われ、測定開始時刻t=0より過去のx
g(t)の現在のy
g,c(t)への影響は無視できると仮定し、t−τ<0、すなわちτ>tをτの積分区間から除外する。したがって、積分区間は[0:t]とすることができる。この時間伝達関数h
g,c(t)は線形の系である限り試料gの流入量x
g(t)には依存しない一方で、試料の特性により異なる。
【0026】
次にこれを周波数領域での表現で考える。時間領域で考えた場合の入力x
g(t)、出力y
g,c(t)、及び時間伝達関数h
g,c(t)はフーリエ変換もしくはラプラス変換することで周波数fの関数として夫々X
g(f)、Y
g,c(f)、及びH
g,c(f)と表すことができる。このときY
g,c(f)は、X
g(f)と周波数伝達関数H
g,c(f)を用いて、
【数2】
と乗算の形で記述することができる。時間伝達関数と同様に周波数伝達関数H
g,c(f)も試料の特性により異なるため、測定によりH
g,c(f)を求めることで試料の識別が可能となる。なお、式(1)及び式(2)は夫々時間領域および周波数領域での表現であり、数学的に等価である。
【0027】
ここで、複数のチャンネルでの測定を考える。式(1)より、試料gがx
g(t)で入力されたとき、チャンネルc=1,2,・・・,Cで得られるシグナルy
g,1(t),y
g,2(t),・・・,y
g,C(t)は、各チャンネルでの時間伝達関数h
g,1(t),h
g,2(t),・・・,h
g,C(t)を用いて、
【数3】
と表すことができる。
【0028】
次に、ある別の試料uを同じセンサに入力した場合を考える。このときの入力をx
u(t)とし、チャンネルcで得られるシグナルy
u,c(t)、試料uに対するチャンネルcでの周波数伝達関数をh
u,c(t)とすると、式(3)と同様に
【数4】
が得られる。
【0029】
同じことを周波数領域で考える。式(2)より、試料gの入力X
g(f)に対するチャンネルcでのシグナルY
g,c(f)は、各チャンネルでの周波数伝達関数H
g,c(f)を用いて
【数5】
と表すことができる。また、ある別の試料uを同じセンサにX
u(f)で入力したとき、チャンネルcで得られるシグナルY
u,c(f)は試料uに対するチャンネルcでの周波数伝達関数H
u,c(f)を用いて
【数6】
と表すことができる。
【0030】
今、識別したい未知試料をu、学習用の測定試料をgとし、入力x
q(t)もしくはX
q(f)を用いることなく、y
u,c(t)とy
g,c(t)、あるいはY
u,c(f)とY
g,c(f)のみ用いて、uとgが一致するかどうか評価することを考える。
【0031】
なお、学習用データを得るための入力の関数及びテスト用データを得るための入力x
q(t)もしくはX
q(f)を用いないということは、試料識別のための処理ではこれらの関数が何であるかという情報は使用されていないことになるのに注意されたい。これは以下の評価法1〜3でさらに具体的に示されている。このことは、両関数が違っていても、あるいはたまたま同じであってもよいこと、別言すれば両者を互いに関連なく独立に決めてよいことを意味する。
<評価法1:時間領域における解析>
【0032】
テスト用データで得られた特徴量と学習用データで得られた特徴量とをチャンネルごとに比較することで試料の識別を行う解析手法(
図2)について、時間領域で評価を行う。式(1)を時間離散化すると、
【数7】
ただし、h’
g,c(j×Δt)=h
g,c(j×Δt)×Δt、c=1,2,・・・,C、p×Δt=t、i=1,2,・・・,2I−1である。このとき、各チャンネルについて
【数8】
であるから、
【数9】
となる。ただし、
【数10】
である。x
gは要素が統計的にランダムなので概ね正則と仮定することができる。未知試料uの測定についても同様に
【数11】
であるから、
【数12】
となる。ただし、
【数13】
である。x
uは要素が統計的にランダムなので概ね正則と仮定することができる。
【0033】
もしu=gであるなら、各チャンネルについて
【数14】
が成り立つことから式(9)と式(12)より
【数15】
が成り立つ。したがって、
【数16】
となる。式(16)の最右辺はx
u、x
g(i=1,2,…,2I−1)にのみ依存しチャンネルに依存しない。したがって、R
ug,cは全てのチャンネルについて等しい。
【0034】
一方u≠gのとき
【数17】
であるから、R
ug,cは多くのチャンネルで等しくない。したがって、各チャンネル間でのR
ug,cを比較することで、入力x
q(t)を制御・モニタすることなく未知試料uが学習用試料gかどうか識別することが可能となる。
【0035】
なお、連続関数を時間離散化した場合にも、上述の例では上述の式(1)を多項式で表現されるようにする変換は行列の乗算として表現した。しかし、これは必ずしも行列である必要はなく、ベクトルの乗算として表現してもよいことに注意されたい。
<評価法2:周波数領域における解析(その1)>
【0036】
テスト用データで得られた特徴量と学習用データで得られた特徴量とをチャンネルごとに比較することで試料の識別を行う解析手法(
図2)について、周波数領域で評価を行う。u=gである場合、いかなる入力X
q(f)であっても周波数伝達関数H
q,c(f)は不変であるため、
【数18】
が成り立つ。したがって、式(5)、(6)より
【数19】
となる。ただし、C
ug(f)=X
g(f)/X
u(f)である。ここで、
とおくと式(19)は
【数20】
と書ける。ただし、
である。このとき、式(20)の両辺の絶対値について
【数21】
であることから、
【数22】
となる。また、式(20)の両辺の位相成分について
【数23】
が成り立つ。
【0037】
一方、u≠gである場合、
【数24】
であるから
【数25】
となり、式(22)及び(23)の等式が成り立たなくなる。
【0038】
したがって、未知試料uの測定と学習用試料gの測定から
をチャンネル間でそれぞれ比較することで、入力X
q(f)を制御・モニタすることなく未知試料uが学習用試料gと同じものかどうか評価することが可能となる。
<評価法3: 周波数領域に基づく解析(その2)>
【0039】
測定ごとにチャンネル間で特徴量の比較を行うことで試料の識別を行う解析手法(
図3)について、周波数領域で評価を行う。式(5)より、
【数26】
であることから、任意のチャンネルmとnについて
【数27】
が成り立つ。未知試料uの測定についても式(6)から同様に
【数28】
となる。試料が同じであれば、どのような入力X
q(f)であっても周波数伝達関数H
q,c(f)は不変であることから、u=gのときK’
u,mn(f)=K’
g,mn(f)となり、u≠gのときK’
u,mn(f)≠K’
g,mn(f)となる。したがって、未知試料の測定で求めたK’
u,mn(f)と学習用の測定で予め求めていたK’
g,mn(f)とを比較することで、入力X
q(f)を制御・モニタすることなく未知試料uが学習用試料gと同じものかどうか識別することが可能となる。
【0040】
以上示したように、複数の化学センサを用いて試料の識別を行う場合には、テスト用データで得られた特徴量と学習用データで得られた特徴量とをチャンネルごとに比較することで試料の識別を行う解析手法(
図2)と、測定ごとにチャンネル間で特徴量の比較を行うことで試料の識別を行う解析手法(
図3)の2通りが考えられる。評価法1、2では前者(
図2)の考え方に基づいてそれぞれ時間領域・周波数領域での具体的な解析手法を示し、評価法3では後者(
図3)の考え方に基づいて周波数領域での具体的な解析手法を示した。時間領域において測定ごとにチャンネル間で特徴量の比較を行うことで試料の識別を行う解析手法(
図3)も当然のことながら考えることができるが、評価法1〜3より可能であることは明白であるためここでは説明を省略する。
【0041】
なお、学習用データを得るための入力の関数及びテスト用データを得るための入力の関数は上述した理論的説明が成り立つような関数であれば特に制限はなく、様々な周波数成分を含む関数や時間的に変化する関数であれば理論的に解析が可能となる。したがって、例えばランダムに時間変化する関数、周波数成分が所定の範囲内に分布する関数などであってよい。このような関数はその都度何らかの手段で発生させてもよいし、あるいはランダムに見えるが実際にはメモリ等に記憶しておいたパターン等の予め設定されている関数であってもよい。
【0042】
また、上述した評価法1では、化学センサ出力を時間離散化したものに対して処理を行うことになる。しかし、これに限らず、評価法1以外の方法で評価を行う場合でも、そのような評価は実際にはほとんどの場合にディジタルコンピュータを利用した情報処理装置で実現されると考えられることから、評価法1以外でも、化学センサ出力結果を時間離散化された式(1)や式(2)に基づいて解析してもよい。このように、時間離散化して情報処理を行うための手法やそれに使用される機器等は当業者には周知の事項であるので、具体的な説明は省略する。
【0043】
更には、本発明に係る試料識別装置においては、化学センサに試料を与えるためのポンプや流量を制御するための機器類等は必ずしも必要でないことに注意する必要がある。例えば、試料の発生源自体が適切な入力関数に従った試料流を提供したり、あるいは試料源と化学センサとの位置関係を取り付け具などによって完全に固定せず、適切な位置に手で保持したり、必要であれば、例えば手や試料を動かすことで入力の関数を更に適切なものとする等が十分に実用的であることは理解できるであろう。したがって、本発明に係る試料識別装置で最小限必要とされる要素は、化学センサ及びその出力を取り込んで解析する情報処理装置だけである。
【実施例】
【0044】
以下、実施例に基づいて本発明をさらに詳細に説明するが、当然ながら、本発明はこれら実施例に限定されるものではない。例えば、以下では化学センサとして膜型表面応力センサ(MSS)(特許文献1、非特許文献1)を例として使用したが、これ以外の種類の化学センサも、状況に応じて使用できる。
【0045】
図4に本実施例で使用した実験系100の概要を示す。2つのマスフローコントローラ(MFC)10、20より窒素ガスを供給し、その一方のMFC(MFC1)10は試料となる溶媒30が入ったバイアル瓶40に接続した。溶媒30が入ったバイアル瓶40はさらに別の空のバイアル瓶50に接続し、もう片方のMFC(MFC2)20もこの空のバイアル瓶50に直接接続した。この空のバイアル瓶50をさらにMSSチップがセットされているセンサチャンバー60に接続し、センサチャンバー60を通ったガスはその後排気した。この実験系により、ヘッドスペースガス70の濃度を様々に変化させてセンサに供給することができる。溶媒ごとに飽和蒸気圧が異なることから、ここでは比飽和蒸気濃度x
iを入力として用いる。例えば溶媒として水(H
2O)を用いてMFC1 10の流量を30sccm、MFC2 20の流量を70sccmとした場合、水の比飽和蒸気濃度x
H2Oは30%となる。
【0046】
図5に本実施例で使用したMSSチップの光学顕微鏡写真を示す。MSSチップは4チャンネルのものを使用し、チャンネル1から4(Ch.1〜4)はガス感応膜としてそれぞれ、ポリメタクリル酸メチル、ポリエチレンオキシド、ポリエピクロロヒドリン、ポリ(スチレン‐co‐ブタジエン)を被覆しておいた。バイアル瓶およびセンサチャンバーはインキュベータ内に設置され、温度を一定(25℃)に保持した。
【0047】
本実施例ではMFC1 10でランダムに流量を変化させて測定を行った。周波数伝達関数は、原理的にはインパルス(時間的幅が無限小で高さが無限大のパルス)を入力として与え、それに対する応答を見ることで求めることができる。しかし、現実の実験系ではこのようなインパルスを与えることは困難であり、さらに出力にノイズが入り込んでいる場合には出力信号からインパルスに対する応答のみを抽出することは難しいという問題がある。そこで、本実施例では入力としてインパルスではなく、ホワイトノイズを与えることで周波数伝達関数を求めた。ホワイトノイズは全周波数に渡って一定の値をとることから、ホワイトノイズに対する応答を評価することで周波数伝達関数を求めることが可能となる。現実の実験系では、入力を制御できる周波数は有限であるため、ナイキストの定理よりこの周波数の半分の周波数までの応答が解析に有意となる。本実施例では、
図6に示すように、MFC1 10の流量を0〜100sccmの範囲で1秒ごと(1Hz)にランダムに変化させた。MFC1の流量をV
1,in(t)sccmとすると、MFC2 20の流量V
2,in(t)はV
2,in(t)=100−V
1,in(t)sccmとし、MFC1 10とMFC2 20の流量の和が常に100sccmとなるようにした。測定時間は1試料につき120秒とし、サンプリング周波数20Hzで2400点のデータを取得した(0.05秒刻みで0秒から119.95秒まで)。試料として水(H
2O)、エタノール(EtOH)、ベンゼン(Benzene)、ヘキサン(Hexane)、酢酸エチル(AcOEt)、テトラヒドロフラン(THF)の6種類の溶媒を用いた。これらの溶媒の測定結果をそれぞれ
図7A〜
図7Fに示す。
【実施例1】
【0048】
<解析例1:時間伝達関数に基づく解析(評価法1)>
本解析では<理論的背景>の<評価法1>に基づき解析を行った。20Hz、120秒の測定データをK=2400/(2I)に分割し、K−1回を学習用データ(測定番号k=1,2,・・・,K−1)、残りの1回(k=K)をテスト用データとした。式(16)、(17)より、R
ug,c同士が等しいかどうかを評価することでガスの識別を行うことができる。R
ug,c同士が等しいかどうかをR
ug,cの各(i,j)要素のチャンネルにわたる分散の大きさで判断すると、R
ug,cの構造が全般に似ていなくてもy
g,c(t)やy
u,c(t)のスケールの組合せによってR
ug,cの各要素が全般に小さい場合には、似ていると判断されてしまう。これを避けるために、R
ug,c同士が等しいかどうかを各要素値の対数と符合の違いによって評価する。もしu=gであるなら、式(16)より
【数29】
【数30】
となる。ただし、R
ug,c(i,j)はR
ug,cの(i,j)要素である。また、sign(x)はxの符号であり、x<0、x=0、x>0のときそれぞれ−1、0、1となる。一方u≠gのとき、多くのR
ug,c(i,j)についてチャンネル間で
は一致しない。
【0049】
ここで、テスト用データと測定番号kの学習用データより求まるR
ug,ckについて、LR
ug,k(i,j)およびSR
ug,k(i,j)を以下のように定義する。
【数31】
【数32】
u=gならば、R
ug,ck(i,j)はcに依らず共通の平均LR
ug,k、SR
ug,kを有する。ここで、
は、kによらずそれぞれ共通の分布
にしたがうものと仮定する。ただし、
は
の正規分布である。また、
は、各チャンネルに関するK個の測定値y
g,ck1とy
g,ck2から式(16)のR
ug,cと同様に計算してできる行列をR
g,ck1k2として
【数33】
【数34】
とする。ただし、
【数35】
【数36】
である。
【0050】
以上より、テスト用データy
u,c(t)と学習用データy
g,ck(t)との比較において、すべてのチャンネルc、すべての学習用データ(測定番号k)、各伝達行列要素(i,j)にわたる物質gへの一致確率L(u,g)は、
【数37】
となる。式(37)の対数を取った対数尤度LL(u,g)は、
【数38】
となる。したがって、各テスト用データについて式(38)の最右辺を計算することで、学習用データのガス種への一致確率を評価することができる。
【0051】
以上の議論にしたがいLL(u,g)の計算を行った。なお、他の解析例(解析例2,3)についてはその計算に使用したデータの表を本明細書末尾付近に掲載したが、本解析例においてはデータ点数が数百万個と極めて膨大になったため、掲載は省略した。データの下処理としては、カットオフ周波数0.5Hzの設定で有限応答(FIR)ローパスフィルタにより高周波ノイズを除去した。I=10,K=120としたときの結果を表1に示す。ただし、実際のLL(u,g)は表の値に10
7をかけたものである。各行で最も大きいLL(u,g)を与えるものをボールド体で示した。水,エタノール,酢酸エチルの4種類の溶媒については、最大尤度を与える学習用データがテスト用データのものと一致した。すなわち、試料の識別に成功した。ヘキサンは最大尤度を与える学習用データがベンゼンとなり不正解となったが、正解となるヘキサンの学習用データは2番目に大きな尤度を与えた。しかしTHFでは、正解となるTHFの学習用データでの対数尤度が5番目となり精度は良くなかった。
図2の概念に基づいた時間領域での解析で精度がこのようにあまり良くなかったのは<評価法1>の原理的な問題ではなく、時間領域での解析では全ての時間ステップに関係付けた行列の推定が必要であることから推定すべき量の個数が多くなるため、統計的に不安定になりやすいという非本質的な理由によるものと考えられる。このような問題を解決するには、IのサイズやFIRローパスフィルタのカットオフ周波数などを最適化する必要がある。
【0052】
【表1】
【実施例2】
【0053】
<解析例2:周波数伝達関数に基づく解析(評価法2)>
本解析では<理論的背景>の<評価法2>に基づき解析を行った。120秒の測定を6分割し(K=6)、5回を学習用データ(測定番号k=1,2,3,4,5)、残りの1回(k=6)をテスト用データとした。まず測定データをフーリエ変換し、センサシグナルの周波数成分を求める。本実施例ではサンプリング周波数20Hzで20秒(400点)測定を行っていることから、0.05Hz刻みでの周波数特性が得られる。本実施例では流量を1秒おき(1Hz)でランダムに変化させているため、ナイキストの定理より、1Hzの半分の0.5Hzまでの周波数成分が解析で有用となる。なお、上述したように、現実の装置では入力を制御できる周波数には上限があって、本実施例ではMFCの応答性の制限などから、1Hzよりも高い周波数での流量切り替えを行おうとしても系がほとんど追随できなかった。したがって、0.05、0.1、0.15、・・・、0.5Hzの10成分を解析に用いる。これより、1測定1チャンネルにつき10次元の複素ベクトルとしてY
q,c(f)が得られる。
【0054】
以上より、評価法2に基づいて得られたテスト用データのフーリエ成分Y
u,c(f)を学習用データのフーリエ成分Y
g,ck(f)と比較することによってテスト用データのガス種を識別することを考える。ここでは式(20)より、
である確率をもとにガスの識別を行う。
【0055】
式(22)、(23)よりu=gのとき、
は全てのチャンネルで同じ値となる。これより、測定により得られるチャンネルcでのテスト用データY
u,c(f)とk番目の学習用データY
g,ck(f)から
をそれぞれ以下のように定義する。
【数39】
【数40】
ここで、
はそれぞれ共通の分布
にしたがうものと仮定する。ここで、Y
u,c(f)はY
g,ck(f)と同様な母集団分布にしたがうと仮定すると、
の分散も、
の分散
と同等と考えられる。したがって、
は
【数41】
【数42】
となる。ただし、
【数43】
【数44】
であり、
はそれぞれ
【数45】
【数46】
である。
【0056】
以上より、テスト用データY
u,c(f)が学習用データY
g,ck(f)と一致する確率
は
【数47】
となる。したがって、全てのチャンネルc、全ての学習用データ(測定番号k)、全ての周波数成分f(最低周波数f
Lから最高周波数f
Hまで)にわたる物質gへの一致確率L(u,g)は
【数48】
で求められる。式(48)の対数を取った対数尤度LL(u,g)は
【数49】
となる。したがって、各テスト用データについて式(49)の最右辺を計算することで、学習用データのガス種への一致確率を評価することができる。
【0057】
表2に結果を示す。この計算に使用したデータの表は、解析例3におけるデータの表と併せて、本明細書末尾付近にまとめて示すので、必要に応じて参照されたい。各行で最も大きいLL(u,g)を与えるものをボールド体で示した。水,エタノール,ヘキサン,酢酸エチル,THFの5種類の溶媒については、最大尤度を与える学習用データがテスト用データのものと一致した。すなわち、試料の識別に成功した。ベンゼンについてのみ最大尤度を与える学習用データがエタノールとなり不正解となったが、正解となるベンゼンの学習用データは2番目に大きな尤度を与えた。これより、評価法2に基づく解析法によりガスの識別が可能であることが示された。
【0058】
【表2】
【実施例3】
【0059】
<解析例3:周波数伝達関数に基づく解析(評価法3)>
本解析では<理論的背景>の<評価法3>に基づき解析を行った。120秒の測定を6分割し(K=6)、5回を学習用データ(測定番号k=1,2,3,4,5)、残りの1回(k=6)をテスト用データとした。まず測定データをフーリエ変換し、センサシグナルの周波数成分を求める。本解析例についても<解析例2>と同様に、0.05、0.1、0.15、・・・、0.5Hzの10成分を解析に用いる。1測定1チャンネルにつき10次元の複素ベクトルとしてY
q,c(f)が得られる。
【0060】
K'
q,mn(f)は複素数であるから、
【数50】
と書くことができる。このとき、学習用データについてr
g,mnk(f)およびθ
g,mnk(f)がkによらずそれぞれ共通の分布
にしたがうと仮定する。ただし
【数51】
【数52】
とする。ここで、K’
u,mn(f)はK’
g,mnk(f)と同様な母集団分布にしたがうと仮定すると、
の分散も、
の分散
と同等と考えられる。したがって、
は
【数53】
【数54】
となる。ただし、
【数55】
【数56】
である。
【0061】
以上より、テスト用データで得られたK’
u,mn(f)と学習用データ(測定番号k)で得られたK’
g,mnk(f)が一致する確率
は
【数57】
となる。したがって、全てのチャンネル間の組み合わせ(m,n m<n)、すべての学習用データ(測定番号k)、全ての周波数f(最低周波数f
Lから最高周波数f
Hまで)にわたる物質gへの一致確率L(u,g)は
【数58】
で求められる。式(58)の対数を取った対数尤度LL(u,g)は
【数59】
となる。したがって、各テスト用データについて式(59)の最右辺を計算することで、学習用データのガス種への一致確率を評価することができる。
【0062】
表3に結果を示す。この計算に使用したデータの表は、解析例2におけるデータの表と併せて、本明細書末尾付近にまとめて示すので、必要に応じて参照されたい。各行で最も大きいLL(u,g)を与えるものをボールド体で示した。全ての溶媒について、最大尤度を与える学習用データがテスト用データのものと一致した。すなわち、試料の識別に成功し、さらに本実施例で行った解析の中でも最も精度が良かった。同じ周波数領域での解析にも関わらず、
図3の考え方に基づいた<解析例3>が、
図2の考え方に基づいた<解析例2>よりも精度が良かった理由としては、統計的な安定性の違いが挙げられる。
図2の考え方に基づく解析では、チャンネルごとに特徴量を評価しているため、C個のチャンネルがあったとき最大でC通りの指標に基づいて評価を行うことができる。これに対して
図3の考え方に基づく解析では、2つのチャンネル間での特徴量を評価しているため、C個のチャンネルがあったとき最大で
CC
2=C(C−1)/2通りの指標に基づいて評価を行うことが可能である。本実施例ではC=4であり、u=gとなる確率P(u=g)を指標として評価を行っている。したがって、
図2の考え方に基づいた<解析例2>では評価に用いる指標
は4通りであるのに対し、
図3の考え方に基づいた<解析例3>は評価に用いる指標
は6通りとなるため、統計的に後者の方が安定したため精度が向上したものと考えられる。
【0063】
【表3】
<計算過程のデータ>
【0064】
以下に解析例2、3において実際の測定データから対数尤度LLを求めるために使用した計算過程中のデータの表をまとめて示す。解析例2と解析例3のそれぞれで、これらのデータを測定した溶媒ごとに一つの表にまとめた。ただし、表は横方向に非常に長いため、これを横方向に4分割して示す。分割された表の左上、及び表の下のコードは、
[1桁の数字(解析例番号)]−[溶媒を表す略号]−[1桁の数字(表分割番号)]
なる構成の表識別コードを示す。表分割番号は当該分割表が元の大きな表上で左端から何番目のものであるかを示す。例えば、表識別コードが「2−H2O−4」となっている分割表は、解析例2で水についての元のデータをまとめた表を4分割した分割表のうちの右端のものであることを示す。
【0065】
(A)解析例2のデータ
【0066】
【表4】
2−H2O−1
【0067】
【表5】
2−H2O−2
【0068】
【表6】
2−H2O−3
【0069】
【表7】
2−H2O−4
【0070】
【表8】
2−EtOH−1
【0071】
【表9】
2−EtOH−2
【0072】
【表10】
2−EtOH−3
【0073】
【表11】
2−EtOH−4
【0074】
【表12】
2−Benzene−1
【0075】
【表13】
2−Benzene−2
【0076】
【表14】
2−Benzene−3
【0077】
【表15】
2−Benzene−4
【0078】
【表16】
2−Hexane−1
【0079】
【表17】
2−Hexane−2
【0080】
【表18】
2−Hexane−3
【0081】
【表19】
2−Hexane−4
【0082】
【表20】
2−AcOEt−1
【0083】
【表21】
2−AcOEt−2
【0084】
【表22】
2−AcOEt−3
【0085】
【表23】
2−AcOEt−4
【0086】
【表24】
2−THF−1
【0087】
【表25】
2−THF−2
【0088】
【表26】
2−THF−3
【0089】
【表27】
2−THF−4
(B)解析例3のデータ
【0090】
【表28】
3−H2O−1
【0091】
【表29】
3−H2O−2
【0092】
【表30】
3−H2O−3
【0093】
【表31】
3−H2O−4
【0094】
【表32】
3−EtOH−1
【0095】
【表33】
3−EtOH−2
【0096】
【表34】
3−EtOH−3
【0097】
【表35】
3−EtOH−4
【0098】
【表36】
3−Benzene−1
【0099】
【表37】
3−Benzene−2
【0100】
【表38】
3−Benzene−3
【0101】
【表39】
3−Benzene−4
【0102】
【表40】
3−Hexane−1
【0103】
【表41】
3−Hexane−2
【0104】
【表42】
3−Hexane−3
【0105】
【表43】
3−Hexane−4
【0106】
【表44】
3−AcOEt−1
【0107】
【表45】
3−AcOEt−2
【0108】
【表46】
3−AcOEt−3
【0109】
【表47】
3−AcOEt−4
【0110】
【表48】
3−THF−1
【0111】
【表49】
3−THF−2
【0112】
【表50】
3−THF−3
【0113】
【表51】
3−THF−4