(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-22
(45)【発行日】2024-12-02
(54)【発明の名称】情報処理装置、及び情報処理装置の制御方法
(51)【国際特許分類】
G01N 35/00 20060101AFI20241125BHJP
G01N 27/62 20210101ALI20241125BHJP
G06N 20/00 20190101ALI20241125BHJP
【FI】
G01N35/00 A
G01N27/62 D
G06N20/00 130
(21)【出願番号】P 2020182350
(22)【出願日】2020-10-30
【審査請求日】2023-10-26
(31)【優先権主張番号】P 2019200321
(32)【優先日】2019-11-01
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】100126240
【氏名又は名称】阿部 琢磨
(74)【代理人】
【識別番号】100223941
【氏名又は名称】高橋 佳子
(74)【代理人】
【識別番号】100159695
【氏名又は名称】中辻 七朗
(74)【代理人】
【識別番号】100172476
【氏名又は名称】冨田 一史
(74)【代理人】
【識別番号】100126974
【氏名又は名称】大朋 靖尚
(72)【発明者】
【氏名】田谷 彰大
(72)【発明者】
【氏名】吉正 泰
(72)【発明者】
【氏名】河村 英孝
【審査官】伊藤 昭治
(56)【参考文献】
【文献】特開2019-086473(JP,A)
【文献】特開2019-053491(JP,A)
【文献】国際公開第2018/134952(WO,A1)
【文献】特開2018-152000(JP,A)
【文献】特開2006-043007(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 35/00
G01N 27/62
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
被検物質を含む試料のスペクトル情報を学習モデルに入力することにより推定され
た前記被検物質の定量的な情報を取得する情報取得手段と、
前記被検物質の定量的な情報に関する寄与度を取得する寄与度取得手段と、
を有する情報処理装置であって、
前記寄与度は、前記学習モデルに入力された試料のスペクトル情報のうち、前記被検物質の定量的な情報の推定に対して影響を与えた情報、及び前記影響の度合いを示す情報を含み、
前記学習モデルは、正解データと入力データの組合せによって構成される教師データを用いて生成されたものであり、
前記正解データは前記被検物質のスペクトル情報に基づいて特定される被検物質の定量的な情報であり、前記入力データは、前記被検物質のスペクトル情報とランダムノイズとを用いて生成された、前記被検物質と夾雑物とを含む仮想的な試料のスペクトル情報である情報処理装置。
【請求項2】
前記スペクトル情報が
、複数のピークを有するグラフの情報を含み、前記
複数のピークにおけるピークの高さは、前記試料に含まれる物質の定量的な情報に対応し、前記ピークの位置は前記試料に含まれる物質の種類に関する情報に対応するものである請求項
1に記載の情報処理装置。
【請求項3】
前記寄与度は、前記複数のピークに関して、前記被検物質の定量的な情報を取得する際の寄与の高さを示す情報である請求項
2に記載の情報処理装置。
【請求項4】
前記寄与度取得手段は、前記試料のスペクトル情報を変化させたときに、取得される、前記被検物質の定量的な情報に及ぼす影響の度合いに基づいて、前記寄与度を取得する請求項1乃至
3のいずれか1項に記載の情報処理装置。
【請求項5】
前記取得された寄与度を表示部に表示させる表示制御手段
を更に有することを特徴とする、請求項1乃至
4のいずれか1項に記載の情報処理装置。
【請求項6】
前記表示制御手段は、更に前記取得された前記被検物質の定量的な情報を前記表示部に表示させることを特徴とする、請求項
5に記載の情報処理装置。
【請求項7】
前記ランダムノイズは、複数のガウス関数の組み合わせによって得られる波形であることを特徴とする、請求項
1乃至6のいずれか1項に記載の情報処理装置。
【請求項8】
前記試料のスペクトル情報を前記学習モデルに入力することにより、前記被検物質の定量的な情報を推定する推定手段
を更に有することを特徴とする、請求項1乃至
7の何れか1項に記載の情報処理装置。
【請求項9】
前記スペクトル情報は、クロマトグラム、光電子スペクトル、赤外線吸収スペクトル、核磁気共鳴スペクトル、蛍光スペクトル、蛍光X線スペクトル、紫外/可視吸収スペクトル、ラマンスペクトル、原子吸光スペクトル、フレーム発光スペクトル、発光分光スペクトル、X線吸収スペクトル、X線回折スペクトル、常磁性共鳴吸収スペクトル、電子スピン共鳴スペクトル、質量スペクトル、及び熱分析スペクトルの少なくとも1つであることを特徴とする、請求項1乃至
8のいずれか1項に記載の情報処理装置。
【請求項10】
前記試料のスペクトル情報を取得するための分析を行う分析手段
を更に有することを特徴とする、請求項1乃至
9のいずれか1項に記載の情報処理装置。
【請求項11】
前記分析手段は、クロマトグラフィー、キャピラリー電気泳動法、光電子分光法、赤外吸収分光法、核磁気共鳴分光法、蛍光分光法、蛍光X線分光法、可視・紫外線吸収分光法、ラマン分光法、原子吸光法、フレーム発光分光法、発光分光法、X線吸収分光法、X線回折法、常磁性共鳴吸収を利用した電子スピン共鳴分光法、質量分析法、及び熱分析法の少なくとも1つを行うことを特徴とする請求項
10に記載の情報処理装置。
【請求項12】
前記分析手段は、飛行時間型二次イオン質量分析法を行うことを特徴とする請求項
10に記載の情報処理装置。
【請求項13】
前記被検物質は、タンパク質、DNA、ウイルス、菌類、水溶性ビタミン類、脂溶性ビタミン類、有機酸類、脂肪酸類、アミノ酸類、糖類、農薬、及び環境ホルモンの少なくとも1つであることを特徴とする、請求項1乃至
12の何れか1項に記載の情報処理装置。
【請求項14】
前記定量的な情報は、前記被検物質が前記試料に含まれる量、前記被検物質が前記試料に含まれる濃度、前記試料中の前記被検物質の有無、前記被検物質の基準量に対する前記試料に含まれる前記被検物質の濃度あるいは量の比率、前記被検物質が前記試料に含まれる量あるいは濃度の比率の少なくとも1つであることを特徴とする、請求項1乃至
13の何れか1項に記載の情報処理装置。
【請求項15】
被検物質を含む試料のスペクトル情報を学習モデルに入力することにより推定された前記被検物質の定量的な情報を取得する情報取得工程と、
前記取得された、前記被検物質の定量的な情報に関する寄与度を取得する寄与度取得工程と、
を有する情報処理方法であって、
前記寄与度は、前記学習モデルに入力された試料のスペクトル情報のうち、前記被検物質の定量的な情報の推定に対して影響を与えた情報、及び前記影響の度合いを示す情報を含み、
前記学習モデルは、正解データと入力データの組合せによって構成される教師データを用いて生成されたものであり、
前記正解データは前記被検物質のスペクトル情報に基づいて特定される被検物質の定量的な情報であり、前記入力データは、前記被検物質のスペクトル情報とランダムノイズとを用いて生成された、前記被検物質と夾雑物とを含む仮想的な試料のスペクトル情報である情報処
理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、及び情報処理装置の制御方法に関する。
【背景技術】
【0002】
様々な試料中に含まれる特定成分(以下被検物質)の濃度や量を知る方法としてスペクトル解析が広く用いられている。スペクトル解析では、試料に何らかの刺激を与えた際の応答を検出し、得られた信号をもとに試料を構成する成分に関する情報(スペクトル情報)を得ることができる。刺激や応答を特徴づける、光を含む電磁波の強度の他、温度、質量、そして特定の質量をもった破片のカウント数がスペクトル情報である。刺激として電子衝突を用いて、分解によって生じた破片の質量に対しその量を記録し構造などの情報を得ることもスペクトル解析には含まれる。具体的には可視・紫外線吸収スペクトル(UV/Visスペクトル)、赤外線吸収スペクトル(IRスペクトル)、核磁気共鳴スペクトル(NMRスペクトル)、ラマンスペクトル分析、蛍光スペクトル分析、原子吸光分析、フレーム分析、発光分光分析、X線分析、X線回析、蛍光X線回析、常磁性共鳴吸収スペクトル、質量スペクトル分析、熱分析、キャピラリー電気泳動等が含まれる。
【0003】
スペクトル解析の中にはあらかじめ構成成分間の立体的大きさや、電荷、親・疎水性の違いを利用し、分離を試みた後に電磁波を照射して解析を行う方法もある。これは分離分析と呼ばれる。例えば液体クロマトグラフィー(以下HPLC)では、カラム種や移動相種、そして温度や流速などの分析条件を最適化することにより被検物質とその他の物質(以下、夾雑物と呼ぶ)を分離する。そして分離した被検物質のスペクトルを計測する事で濃度や量を知る事ができる。
【0004】
別の例では、飛行時間型二次イオン質量分析法(TOF-SIMS法)などの二次イオン質量分析法は、固体試料にイオンビームを照射して固体試料の表面に存在する元素及び分子の情報を得る手法である。高真空中で固体試料にイオンビーム(一次イオン)を照射すると、固体試料表面の構成成分が真空中に放出される。この過程で発生する正又は負の電荷を帯びたイオン(二次イオン)を、電場によって一方向に収束し、一定距離だけ離れた位置で検出する。固体試料表面の組成に応じて、さまざまな質量を持った二次イオンが発生するが、一定の電界中では、質量の小さいイオンほど速く、質量の大きいイオンほど遅く飛行する。そのため、二次イオンが発生してから検出器に到達するまでの時間(飛行時間)を測定することで、発生した二次イオンの質量を分析することができる。
【0005】
しかしながら、スペクトル解析による分析手法は、そのスペクトルの値を読み取るのに知識や技術が必要である。例えばHPLCであれば被検物質とその他の夾雑物とのスペクトル情報が十分に分離できている必要があり、分離の手順や前処理等の技術が必要である。TOF-SIMS法は被検物質と同時に夾雑物も検出されてしまう事から、スペクトル情報のどこに着目するべきか判断するのに知識と経験が必要である。
【0006】
近年、深層学習を用いた機械学習法の発展に伴って、分析手法にも機械学習が導入されてきている。特許文献1では質量分析装置で得られた質量スペクトル情報から深層学習を利用して疾病に罹患しているか否かを判別している。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【発明が解決しようとする課題】
【0008】
深層学習を用いた機械学習法は、これまで知識や技術が必要だったスペクトル解析を簡便かつ高精度で実現できる手法である。しかし、深層学習におけるデータ処理はブラックボックスであり、算出の結果に至った根拠に関しては明らかにされることはなく、得られた結果に関して信頼してよいかどうか判断する事が難しいという課題があった。
【課題を解決するための手段】
【0009】
本発明に係る情報処理装置は、被検物質を含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得手段と、前記取得された、前記被検物質の定量的な情報に関する寄与度を取得する寄与度取得手段と、を有する。
【0010】
本発明に係る情報処理装置の制御方法は、被検物質を含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得工程と、前記取得された、前記被検物質の定量的な情報に関する寄与度を取得する寄与度取得工程と、を有する。
【発明の効果】
【0011】
本発明に係る情報処理装置によれば、これまで知識や技術が必要だったスペクトル解析に対して深層学習で結果を得た上で、その推論の結果に至った根拠を同時に表示する事で、得られた結果に関して信頼してよいかどうか判断する事ができるようになる。
【図面の簡単な説明】
【0012】
【
図1】本発明の実施形態に係る情報処理装置を含む情報処理システムの全体構成の一例を示す図である。
【
図2】本発明の実施形態における、学習モデルの生成に関する処理手順のフローチャートの一例を示す図である。
【
図3】本発明の実施形態における、寄与度を取得する処理手順のフローチャートの一例を示す図である。
【
図4】本発明の実施形態1に係る分析装置の概略ブロック図である。
【
図5】本発明の実施例を説明するフローチャートである。
【
図7】本発明の別の実施例によるHPLCの表示部の例である。
【
図8】TOF-SIMSにおける表示部の例である。
【
図9】添加物濃度と特定の質量スペクトルの強度の関係を示す図である。
【
図10】別の実施例によるTOF-SIMSの表示部の例を示す図である。
【
図11】本発明の実施形態において、表示部に表示させる表示態様の例の1つである。
【
図12】本発明の実施形態において、表示部に表示させる表示態様の例の1つである。
【
図13】本発明の実施形態において、表示部に表示させる表示態様の例の1つである。
【
図14】本発明の実施形態において、表示部に表示させる表示態様の例の1つである。
【
図15】本発明の実施形態において、表示部に表示させる表示態様の例の1つである。
【
図16】本発明の実施形態において、表示部に表示させる表示態様の例の1つである。
【
図17】本発明の実施例において、表示部に表示させる表示態様の例の1つである。
【
図18】本発明の実施例において、行った学習の手法を説明するための模式図である。
【
図19】本発明の実施例において、表示部に表示させる出力の例である。
【
図20】本発明の実施例において、表示部に表示させる出力の例である。
【発明を実施するための形態】
【0013】
まず、本発明の実施形態を説明するにあたり、用語の説明を行う。
【0014】
(試料)
本実施形態における試料とは、複数種類の化合物を含み構成される混合物である。本実施形態では、試料には被検物質とその他の物質(夾雑物)とが含まれているものとする。試料は混合物であれば、特に限定されない。また、混合物の成分が特定されている必要はなく、未知の成分が含有されていてもよい。例えば、血液、尿、唾液等の生体由来の混合物でも良いし、飲食物でもよい。生体由来のサンプルの分析はサンプル提供者の栄養や健康状態を知るための手がかりを含むため、その分析は医学的にも栄養学的にも価値がある。例えば尿中ビタミンB3は糖質、脂質、タンパク質の代謝、エネルギー産生に関与しているため、その尿中代謝物であるN1-メチル-2-ピリドン-5-カルボキサミドの測定は健康維持のための栄養指導に役立つ。
【0015】
(被検物質)
本実施形態における被検物質とは、試料中に含まれる1つ以上の既知の成分である。例えば、タンパク質、DNA、ウイルス、菌類、水溶性ビタミン類、脂溶性ビタミン類、有機酸類、脂肪酸類、アミノ酸類、糖類、農薬、環境ホルモンで構成される群から選択される少なくとも一種である。
【0016】
例えば、栄養素の量を知りたいのであれば被検物質としては、チアミン(ビタミンB1)、リボフラビン(ビタミンB2)、ビタミンB3代謝物であるN1-メチルニコチンアミド、N1-メチル-2-ピリドン-5-カルボキサミド、ビタミンB6代謝物である4-ピリドキシン酸などある。ほかに、N1-メチル-4-ピリドン-3-カルボキサミド、パントテン酸(ビタミンB5)、ピリドキシン(ビタミンB6)、ビオチン(ビタミンB7)、プテロイルモノグルタミン酸(ビタミンB9)、シアノコバラミン(ビタミンB12)、アスコルビン酸(ビタミンC)等の水溶性ビタミンがある。ほかに、L-トリプトファン、リシン、メチオニン、フェニルアラニン、トレオニン、バリン、ロイシン、イソロイシン、L-ヒスチジン等のアミノ酸がある。ほかに、ナトリウム、カリウム、カルシウム、マグネシウム、リン等のミネラル、が挙げられる。
【0017】
(定量的な情報)
本実施形態における定量的な情報とは、被検物質が試料に含まれる量、被検物質が試料に含まれる濃度、試料中の被検物質の有無で構成される群から選択される少なくとも一つである。また、被検物質の基準量に対して試料に含まれる濃度あるいは量の比率、被検物質の試料に含まれる量あるいは濃度の比率で構成される群から選択される少なくとも一つである。
【0018】
(スペクトル情報)
本実施形態におけるスペクトル情報とは、クロマトグラム、光電子スペクトル、赤外線吸収スペクトル(IRスペクトル)、核磁気共鳴スペクトル(NMRスペクトル)、蛍光スペクトル、蛍光X線スペクトル、紫外/可視吸収スペクトル(UV/Visスペクトル)、ラマンスペクトル、原子吸光スペクトル、フレーム発光スペクトル、発光分光スペクトル、X線吸収スペクトル、X線回折スペクトル、常磁性共鳴吸収スペクトル、電子スピン共鳴スペクトル、質量スペクトル、熱分析スペクトルで構成される群から選択される少なくとも一種である。
【0019】
次に、
図1を用いて、本実施形態における情報処理システムを説明する。
図1は、第1の実施形態に係る情報処理装置を含む情報処理システムの全体構成を示す図である。
【0020】
情報処理システムは、情報処理装置10とデータベース22と分析装置23とを含んでいる。情報処理装置10とデータベース22とは、通信手段を介して互いに通信可能に接続されている。本実施形態においては、通信手段はLAN(Local Area Network)21で構成される。また、情報処理装置10と分析装置23とは、USB(Universal Serial Bus)等の規格の通信手段で接続されている。なお、LANは有線LANでも無線LANでもよいし、WANであってもよい。また、USBはLANであってもよい。
【0021】
データベース22は、分析装置23による分析によって取得されたスペクトル情報を管理する。また、データベース22は、後述する学習モデル生成部42により生成された学習モデル(学習済みモデル)を管理する。情報処理装置10は、データベース22で管理されたスペクトル情報や学習モデルを、LAN21を介して取得する。
【0022】
本実施形態における学習モデルとは、回帰学習モデルであり、深層学習などの機械学習によって生成されたものを用いることができる。機械学習アルゴリズムに教師データを用いて学習を行い、適切な予測が行えるように構築したものをここでは学習モデルと呼ぶ。学習モデルに用いる機械学習アルゴリズムには様々な種類がある。例えば、ニューラルネットワークを用いた深層学習を使うことができる。ニューラルネットワークは入力層、出力層、複数の隠れ層から構成され、各層は活性化関数と呼ばれる計算式で結合されている。ラベル(入力に対応する出力)付き教師データを用いる場合、入力と出力の関係が成り立つように活性化関数の係数を決定していく。複数の教師データを用いて係数を決定して行くことで、高い精度で入力に対する出力を予測できる学習モデルを生成する事ができる。
【0023】
分析装置23は、試料や被検物質等を分析するための装置である。分析装置23は、分析手段の一例に相当する。なお、前述したように、本実施形態では、情報処理装置10と分析装置23とが通信可能に接続されている。しかし、情報処理装置10の内部に分析装置23を備える形態であってもよいし、分析装置23の内部に情報処理装置10を備える形態であってもよい。更に、不揮発メモリなどの記録媒体を介して分析結果(スペクトル情報)を分析装置23から情報処理装置10へ受け渡す形態でもよい。
【0024】
本実施形態における分析装置23は、スペクトル情報を取得できるものであれば限定されず、化学的な分析手法や、物理的な分析手法を用いた装置を利用できる。本実施形態において、化学的な分析手法を用いた装置は、例えば、液体クロマトグラフィーやガスクロマトグラフィー等のクロマトグラフィー、及びキャピラリー電気泳動法で構成される群から選択される少なくとも一種の手法を用いる。本実施形態において、物理的な分析手法を用いた装置は、例えば、光電子分光法、赤外吸収分光法、核磁気共鳴分光法、蛍光分光法、蛍光X線分光法、可視・紫外線吸収分光法、ラマン分光法、原子吸光法、フレーム発光分光法、発光分光法、X線吸収分光法、X線回折法、常磁性共鳴吸収等を利用した電子スピン共鳴分光法、質量分析法、熱分析法で構成される群から選択される少なくとも一種の手法を用いる。質量分析法は、例えば、飛行時間型二次イオン質量分析法を用いることができる。
【0025】
例えば、液体クロマトグラフィーを用いた装置では移動相容器、送液ポンプ、試料注入部、カラム、検出器、A/D変換機を備える。検出器は紫外線や可視光線、赤外線などを用いた電磁波検出器をはじめ、電気化学検出器、イオン検出器等が用いられる。この場合、得られるスペクトル情報は時間に対する検出器からの出力強度となる。
【0026】
情報処理装置10は、その機能的な構成として、通信IF31、ROM32、RAM33、記憶部34、操作部35、表示部36、制御部37を具備する。
【0027】
通信IF(Interface)31は、例えば、LANカード及びUSBのインターフェースカードで実現される。通信IF31は、LAN21とUSBを介した外部装置(例えば、データベース22と分析装置23)と情報処理装置10との間の通信を司る。ROM(Read Only Memory)32は、不揮発性のメモリ等で実現され、各種プログラム等を記憶する。RAM(Random Access Memory)33は、揮発性のメモリ等で実現され、各種情報を一時的に記憶する。記憶部34は、例えば、HDD(Hard Disk Drive)等で実現され、各種情報を記憶する。操作部35は、例えば、キーボードやマウス等で実現され、ユーザからの指示を装置内に入力する。表示部36は、例えば、ディスプレイ等で実現され、各種情報をユーザに向けて表示する。操作部35や表示部36は、制御部37からの制御によりGUI(Graphical User Interface)としての機能を提供する。
【0028】
制御部37は、例えば、少なくとも1つのCPU(Central Processing Unit)等で実現され、情報処理装置10における処理を統括制御する。制御部37は、その機能的な構成として、スペクトル情報取得部41、学習モデル生成部42、学習モデル取得部43、推定部44、情報取得部45、寄与度取得部46、表示制御部47を具備する。
【0029】
ここで、寄与度は、スペクトル情報に含まれる情報に関して、被検物質の定量的な情報を取得する際の、寄与の度合いに関する情報であってもよい。
【0030】
スペクトル情報取得部41は、被検物質を含む試料の分析結果、具体的には試料のスペクトル情報を分析装置23から取得する。なお、あらかじめ分析結果が格納されたデータベース22から、試料のスペクトル情報を取得してもよい。また、同様に被検物質のスペクトル情報を取得する。この被検物質のスペクトル情報は、被検物質が単一で存在した場合のスペクトル情報である。そして、スペクトル情報取得部41は、取得した試料のスペクトル情報を、推定部44と寄与度取得部46に出力する。また、取得した被検物質のスペクトル情報を学習モデル生成部42と寄与度取得部46に出力する。
【0031】
ここで、スペクトル情報が、複数のピークを有するグラフの情報を含み、ピークの高さは、試料に含まれる物質の定量的な情報に対応し、ピークの位置は試料に含まれる物質の種類に関する情報に対応するものであってもよい。この場合、寄与度は、前記複数のピークに関して、前記被検物質の定量的な情報を取得する際の寄与の高さを示す情報であってもよい。
【0032】
学習モデル生成部42は、スペクトル情報取得部41が取得した被検物質のスペクトル情報を用いて教師データを生成する。そして、学習モデル生成部42は、教師データを用いて深層学習を実行し、学習モデルを生成する。教師データの生成及び学習モデルの生成に関する詳細な説明は、後述する。そして、学習モデル生成部42は、生成した学習モデルを学習モデル取得部43へ出力する。なお、学習モデル生成部42は、生成した学習モデルをデータベース22へ出力してもよい。
【0033】
学習モデル取得部43は、学習モデル生成部42が生成した学習モデルを取得する。なお、学習モデルがデータベース22に格納されている場合には、学習モデル取得部43は、データベース22から学習モデルを取得する。そして、学習モデル取得部43は、取得した学習モデルを推定部44へ出力する。
【0034】
推定部44は、学習モデル取得部43が取得した学習モデルに、スペクトル情報取得部41が取得した試料のスペクトル情報を入力することにより、試料に含まれる被検物質の定量的な情報を学習モデルに推定させる。そして、推定部44は、推定された定量的な情報を、情報取得部45へ出力する。推定部44は、試料のスペクトル情報を学習モデルに入力することにより、被検物質の定量的な情報を推定する推定手段の一例に相当する。
【0035】
情報取得部45は、学習モデルが推定した定量的な情報を取得する。すなわち、情報取得部45は、被検物質を含む試料のスペクトル情報を学習モデルに入力することにより推定された、前記被検物質の定量的な情報を取得する情報取得手段の一例に相当する。そして、情報取得部45は、取得した定量的な情報を表示制御部47へ出力する。
【0036】
寄与度取得部46は、情報取得部45が取得した、被検物質の定量的な情報に関する寄与度を取得する。すなわち、寄与度取得部46は、前記取得された、前記被検物質の定量的な情報に関する寄与度を取得する寄与度取得手段の一例に相当する。本実施形態における寄与度とは、学習モデルによって推定された被検物質の定量的な情報に関して、試料のスペクトル情報のうちどの情報がどれだけ影響を及ぼしているのかの度合い寄与しているのかを示す指標である。寄与度の取得に関する詳細な説明は後述する。そして、寄与度取得部46は、取得した寄与度を表示制御部47へ出力する。
【0037】
表示制御部47は、情報取得部45が取得した定量的な情報と、寄与度取得部46が取得した寄与度とを表示部36に表示させる。表示制御部47は、表示制御手段の一例に相当する。
【0038】
なお、制御部37が具備する各部の少なくとも一部は、独立した装置として実現してもよい。また、夫々が機能を実現するソフトウェアとして実現してもよい。この場合、機能を実現するソフトウェアは、クラウドをはじめとするネットワークを介したサーバ上で動作してもよい。本実施形態では各部はローカル環境におけるソフトウェアにより夫々実現されているものとする。
【0039】
また、
図1に示す情報処理システムの構成はあくまで一例である。例えば、情報処理装置10の記憶部34がデータベース22の機能を具備し、記憶部34が各種情報を保持してもよい。
【0040】
次に
図2~
図3を用いて、本実施形態における処理手順を説明する。
【0041】
図2は、学習モデルの生成に関する処理手順のフローチャートである。
【0042】
(S201)(被検物質単体を分析)
ステップS201では、分析装置23は、被検物質単体を分析し、被検物質のスペクトル情報を取得する。分析条件は、感度や分析時間などの観点から適宜選択すればよい。その際、分析装置23は、被検物質の濃度を何通りか変化させて分析する。どの程度の数が必要であるかは、物質の性質などによっても異なるが、一般的に3点以上変化させることが望ましい。被検物質が複数種類ある場合は、被検物質ごとにそれぞれ分析することが望ましいが、被検物質同士の信号が十分分離できている場合は、同時に分析してもよい。そして、分析装置23は、取得したスペクトル情報を情報処理装置10に出力する。情報処理装置10は分析装置23からスペクトル情報を受信し、RAM33又は記憶部34に保持する。スペクトル情報取得部41は、こうして保持されたスペクトル情報を取得する。なお、前述したように、分析結果であるスペクトル情報は、データベース22が保持してもよい。この場合、スペクトル情報取得部41は、データベース22からスペクトル情報を取得する。また、分析装置23が被検物質を分析するタイミングは、ステップS202における教師データの生成よりも前に実行されれば、どのようなタイミングであってもよい。
【0043】
(S202)(教師データを生成)
ステップS202では、学習モデル生成部42は、スペクトル情報取得部41が取得した、被検物質のスペクトル情報を用いて、複数の教師データを生成する。教師データの生成方法について、具体的に説明する。教師データは、被検物質のスペクトル情報に乱数で生成した任意の波形を加算することで生成される。例えば、液体クロマトグラフィーでは、スペクトル情報(クロマトグラム)が示す波形はガウス分布であることが多い。そのため、学習モデル生成部42は、ピークの高さ、中央値、標準偏差を乱数で決定した複数のガウス曲線(ガウス関数)を足し合わせて、複数のランダムノイズを生成する。そして、学習モデル生成部42は、この複数のランダムノイズそれぞれと被検物質のスペクトル情報が示す波形とを足し合わせた複数の波形を生成する。こうして生成された複数の波形は、被検物質と夾雑物とを含む仮想的な試料のスペクトル情報(学習用スペクトル情報)として用いられる。つまり、生成された複数のスペクトル情報を、教師データを構成する入力データとして決定する。更に、学習モデル生成部42は、生成されたスペクトル情報の基となった、被検物質のスペクトル情報から特定されるピークの高さ(定量的な情報)を、教師データを構成する正解データとして決定する。このようにして、学習モデル生成部42は、入力データと正解データの組である複数の教師データを生成する。そして、ステップS201において、学習モデル生成部42は、被検物質の濃度に応じたスペクトル情報を取得しているので、この濃度ごとに複数の教師データを生成する。
【0044】
従来技術として、検体のマススペクトルデータを癌の有無と紐付けて機械学習させる方法がある。しかし、機械学習の精度を上げる為には多量の教師データを必要とする。例えば教師データとして9万種のデータを用意する必要がある。つまり、機械学習は複雑な分析結果に対して精度良く解析できるが、多量の教師データを用意する必要がある点が難点である。本実施形態では、機械学習の難点である教師データを多量に用意する必要がないため、ユーザの負担を軽減することができる。
【0045】
なお、このようにして教師データを生成したが、複数の試料を分析装置23で分析することで、学習用の試料のスペクトル情報を取得し、被検物質の定量的な情報と併せて教師データとしてもよい。また、前述した方法とは異なる方法で、仮想的な試料のスペクトル情報を生成してもよい。
【0046】
(S203)(学習モデルを生成)
ステップS203では、学習モデル生成部42は、ステップS202で濃度ごとに生成した複数の教師データを用いて、所定のアルゴリズムに従った機械学習を実施することにより、学習モデルを生成する。本実施形態では、所定のアルゴリズムとして、ニューラルネットワークを用いる。学習モデル生成部42は、複数の教師データを用いてニューラルネットワークに学習をさせることにより、試料のスペクトル情報の入力に基づいて、試料に含まれる被検物質の定量的な情報を推定する学習モデルを生成する。なお、ニューラルネットワークの学習方法は、周知技術であるため、本実施形態では詳細な説明を省略する。また、所定のアルゴリズムとして、例えば、SVM(サポートベクターマシン)、DNN(ディープニューラルネットワーク)、CNN(コンボリューショナルニューラルネットワーク)等を用いてもよい。被検物質が複数種類ある場合は、それぞれの物質に対して学習モデルを構築する。そして、学習モデル生成部42は、RAM33、記憶部34、又はデータベース22に、生成した学習モデルを格納する。
【0047】
以上のようにして、試料のスペクトル情報に基づいて、試料に含まれる被検物質の定量的な情報を推定する学習モデルを生成する。
【0048】
次に、寄与度を取得する方法について、説明する。
図3は、寄与度を取得する処理手順を示すフローチャートである。
【0049】
(S301)(試料を分析)
ステップS301では、分析装置23は、目的の試料を分析し、試料のスペクトル情報を取得する。分析条件は、前述したステップS201と同一の条件とする。そして、分析装置23は、取得したスペクトル情報を情報処理装置10に出力する。情報処理装置10は分析装置23からスペクトル情報を受信し、RAM33又は記憶部34に保持する。スペクトル情報取得部41は、こうして保持されたスペクトル情報を取得する。なお、前述したように、分析結果であるスペクトル情報は、データベース22が保持してもよい。この場合、スペクトル情報取得部41は、データベース22からスペクトル情報を取得する。また、分析装置23が試料を分析するタイミングは、ステップS302における定量的な情報の推定よりも前に実行されれば、どのようなタイミングであってもよい。
【0050】
(S302)(定量的な情報を推定)
ステップS302では、学習モデル取得部43は、RAM33、記憶部34、又はデータベース22に格納された学習モデルを取得する。そして、推定部44は、取得された学習モデルに、ステップS301で取得された試料のスペクトル情報を入力することにより、試料に含まれる被検物質の定量的な情報を推定させる。また、必要に応じて、推定部44は、推定された定量的な情報を、表示部36において表示する形式に換算する。表示部36において表示する形式としては、濃度でもよいし、基準量(標準量)に対する割合でもよい。学習モデルにより推定される値がこれらの表示形式であれば、換算する必要はない。そして、情報取得部45は、推定された定量的な情報を推定部44から取得し、RAM33又は記憶部34に格納する。
【0051】
このように、被検物質のピークと夾雑物のピークが完全に分離できていなくても機械学習で得られる学習モデルを利用することで、分析に関する複雑で高度な知識が無くても精度よく被検物質の定量的な情報を得ることができる。
【0052】
その結果、熟練者でなくとも簡易に高精度で被検物質の定量分析を行うことができる。
【0053】
(S303)(寄与度を取得)
ステップS303では、寄与度取得部46は、ステップS302で推定された定量的な情報に関する寄与度を取得する。
【0054】
以下に、図面を参照しながら、寄与度の取得方法含め、本発明の実施形態の一例について説明する。但し、本発明の範囲は以下で説明する各実施形態に限定されるものではない。
【0055】
図4は本発明の分析データ処理装置の処理フローを示す概略ブロック図である。
【0056】
(分析データ処理装置の構成)
この分析データ処理装置は、分析装置から分析データを取得する分析部と、分析部で得られたスペクトル情報から結果を推論する推論部、推論の根拠を推定する根拠推定部、およびそれらの結果を表示する表示部から構成される。
【0057】
(分析部)
分析部は前記試料の分析結果を得るための各種分析機である。分析に用いられる機器は様々であるが、例えば可視・紫外線吸収スペクトル(UV/Visスペクトル)、赤外線吸収スペクトル(IRスペクトル)、核磁気共鳴スペクトル(NMRスペクトル)、ラマンスペクトル分析、蛍光スペクトル分析、原子吸光分析、フレーム分析、発光分光分析、X線分析、X線回析、蛍光X線回析、常磁性共鳴吸収スペクトル、質量スペクトル分析、熱分析、ガスクロマトグラフィー、液体クロマトグラフィーなどがある。
【0058】
例えば、液体クロマトグラフィーでは移動相容器、送液ポンプ、試料注入部、カラム、検出器、A/D変換機を備える。検出器は紫外線や可視光線、赤外線などを用いた電磁波検出器をはじめ、電気化学検出器、イオン検出器等が用いられる。この場合、得られるスペクトル情報は時間に対する検出器からの出力強度となる。
【0059】
(推論部)
推論部は予め機械学習によって得られた学習済モデルを用いて、スペクトル情報から試料の量や種類を算出する。学習済モデルの作成に用いる機械学習アルゴリズムには様々な種類がある。例えば、ニューラルネットワークを用いた深層学習を使うことができる。ニューラルネットワークは入力層、出力層、複数の隠れ層から構成され、各層は活性化関数と呼ばれる計算式で結合されている。ラベル(入力に対応する出力)付き教師データを用いる場合、入力と出力の関係が成り立つように活性化関数の係数を決定していく。複数の教師データを用いて係数を決定して行く事で、高い精度で入力に対する出力を予測できる学習モデルを作製する事ができる。
【0060】
本実施形態において学習済モデルは、深層学習などの機械学習によって生成されたものを用いることができる。学習済モデルとは教師データを用いて予め用意した学習モデルの各種係数をフィッティングし、適切な予測が行えるように構築したものの事である。学習モデルには様々な種類がある。例えば、ディープニューラルネットワークと呼ばれる学習モデルでは入力層、出力層、複数の隠れ層から構成され、各層は活性化関数と呼ばれる計算式で結合されている。ラベル(入力に対応する出力)付き教師データを用いる場合、入力と出力の関係が成り立つように活性化関数の係数を決定していく。複数の教師データを用いて係数を決定して行く事で、入力に対する出力を高い精度で予測できる学習済モデルを作製する事ができる。
【0061】
(根拠推定部)
根拠推定部では、推論におけるスペクトル情報の寄与度を算出し、その結果に基づいて根拠を推定する。学習済モデルを用いた機械学習における寄与度の算出方法としては、出力に対する入力の各次元の寄与度を偏微分を用いて算出する方法が知られている。例えばスペクトル情報f(x)のx=αにおける値をβ変動させる(
図4中(1)データ加工)。変動させたスペクトル情報を学習済モデルに適用する(
図4中(2)学習済モデルで推論)。得られた推論結果の変化分Δyを算出し、Δy/βをx=αにおける寄与度とする(
図4中(3)寄与度算出)。使用する学習済モデルは推論部で使用するものと同一である。
【0062】
根拠の推定方法としては、スペクトル情報の中の寄与度が大きい部分を算出の根拠として出力する(
図4中(4)根拠推定)。例えば質量スペクトルから物質の種類を同定する分析であれば、出力されたピークの位置が同定の根拠となる。
【0063】
別の寄与度の算出方法として、スペクトル情報中の複数の情報を変動させる方法もある。スペクトル情報f(x)のx=α1,α2,α3…αnにおける値をそれぞれ変化させた時の出力の変化分から、α1,α2,α3…αnの組合せにおける寄与度が算出できる。例えば、TOF-SIMSにおける質量スペクトルでは試料の濃度に比例して特定のピークの大きさが変化するとは限らず、試料がある濃度を超えると別のピークが大きくなるといった複数のピークの組合せで1つの試料の濃度が決まる場合も多い。ピークの組合せ毎の寄与度を求める事で、どのピークの組合せに着目して推論したか、その根拠を推定する事ができる。
【0064】
(表示部)
表示部では分析部で得られたスペクトル情報、推論部で得られた推論情報、根拠推定部で得られた根拠情報を表示する。
【0065】
(情報処理装置の制御方法)
本発明の実施形態に係る情報処理装置の制御方法について説明する。本実施形態に係る制御方法は、以下の工程を少なくとも有する。
(1)被検物質を含む試料のスペクトル情報を学習モデルに入力することにより推定された、被検物質の定量的な情報を取得する情報取得工程。
(2)取得された、被検物質の定量的な情報に関する寄与度を取得する寄与度取得工程。
【0066】
本方法における情報処理装置は、前述の情報処理装置の説明と共通する。
【実施例1】
【0067】
本実施例では、分析部に高速液体クロマトグラフィー(以下HPLC)を用いた液体試料中の被検物質の定量法について説明する。
図5は本実施例を説明するフローチャートである。
【0068】
事前準備として学習済モデルを用意する。まず、被検物質の量が既知の試料を複数用意し、HPLCにてスペクトル情報(クロマトグラフ)を得る(ステップS1)。得られたスペクトル情報と被検物質の量を教師データとして機械学習を行う(ステップS2)。具体的な学習の手法としては例えば、一般的な機械学習手法としてニューラルネットワークやサポートベクターマシンなどを用いてもよいし、隠れ層が多層になった深層学習手法として、DNN(ディープニューラルネットワーク)やCNN(コンボリューショナルニューラルネットワーク)などを用いてもよい。被検物質が複数種類ある場合は、それぞれの物質に対して学習済モデルを構築しても良い。深層学習を用いる場合は、回帰型ニューラルネットワークを構築すると良い。
【0069】
次に、量が未知の被検物質に対して、その量を推論する。量が未知の前記被検物質を含む試料のクロマトグラフをHPLCにて取得する(S3)。ここで表示部にクロマトグラフを表示する。前記学習済みモデルに前記試料のクロマトグラフを入力し、前記被検物質の量を推論する(S4)。推論結果を表示部に表示する。
【0070】
さらに、前記推論の結果に対する根拠を推定する。前記クロマトグラフは時間に対する検出器の強度iのデータであり、i(t)の配列で表せる。ここでtは0から始まる整数であり、Δt間隔でデータを取得した場合は、データ取得時間をΔtで除算することでtを得る。クロマトグラフの取得終了時間をtENDΔtとすると、tは0からtENDまでの値を取る。t=nの時j(t)=0とし、t≠nの時j(t)=i(t)とする新しいクロマトグラムj(t)を作成する(S5)。j(t)に対して前記学習済モデルを適用し推論を行う。i(t)の推論結果とj(t)の推論結果の差分の絶対値をk(n)とし、nを0からtENDまで変化させてk(n)の配列を取得する。ここで得られたk(n)が推論に対するクロマトグラムの寄与度となる(S6)。寄与度の極大値を求め、これを推論の根拠として表示部に表示する(S7)。推論の根拠は寄与度の極大値の上位2つから3つ程度でもよい。
【0071】
図6は表示部における表示の一例である。この例では、被検物質はHPLCで他の夾雑物と完全には分離できていないが、機械学習によって被検物質単離時のピーク高さが推論されている(302)。そして、このピーク高さを推論した根拠として、クロマトグラム中の2点が指示されている(303)。この2点に着目し、従来からも行われているベースラインからピーク高さを推算する方法で算出すると(304)学習済モデルを用いて推論した結果とよく一致する事が分かる。
【0072】
また、
図11は表示部における別の例である。計測されたクロマトグラム(801)と推論されたピークの情報(807)の他に、推論の根拠として、クロマトグラム(801)中に濃淡のグラデーションが表示されている。濃い部分ほど、寄与度が大きい事を意味する。この例では、目的の物質は検出されなかった(ピーク高さが0)と推論されている。ピークが現れる位置である803のクロマトグラムは804の値を持っているが、ここにはピークがあるわけではなく、805と806のピークの影響により804の値になっていることを示している。802は寄与度の表示方法の別の例で、801の濃淡のグラデーションをグラフで表示したものである。
図12、13は
図11における寄与度の別の表示方法の例である。
図12では寄与度の数値と対応するピークが線で結ばれている。
図13はピークの位置を示す数値とそれに対応して寄与度の数値が示されている。
【実施例2】
【0073】
実施例1の推論の結果に対する根拠の推定を以下のように変更した。
クロマトグラム中の最大値をiMAXとする。t=nの時j(t)=i(t)+imax×0.1とし、t≠nの時j(t)=i(t)とする新しいクロマトグラムj(t)を作成する。この他は実施例1と同様である。
【0074】
実施例1ではクロマトグラムの一部を0として、その時の推論結果の変動値を見ていたが、本実施例では、クロマトグラムの一部に定数を加算する方法で、推論結果の変動をみる。実施例1では検出器の強度によって寄与度が変わってしまう可能性があったが、本実施例では検出器の強度が小さい場合においても、精度良く寄与度を求める事ができる。
【0075】
図7は検出器の強度が小さい場合の推論の根拠の表示例である。推論の根拠として寄与度の極大値の上位2つを表示している。
図7(a)は実施例1、
図7(b)は実施例2の場合である。被検物質の検出感度が小さかったため、
図7(a)では寄与が小さいが値が大きい401が根拠として選ばれている。
図7(b)では寄与が大きい部分が正確に選択されている。
【実施例3】
【0076】
本実施例では、分析部に飛行時間型二次イオン質量分析法(以下TOF-SIMS)を用いた個体試料中の被検物質の分類法について説明する。手順のフローチャートは実施例1と同様に
図5を用いる。
【0077】
事前準備として学習済モデルを用意する。まず、被検物質の種類が既知の試料を複数用意し、夾雑物と混合し固化した後に、TOF-SIMSにてスペクトル情報(質量スペクトル)を得る(ステップS1)。得られたスペクトル情報と被検物質の種類を教師データとして機械学習を行う(ステップS2)。具体的な学習の手法としては例えば、一般的な機械学習手法としてニューラルネットワークやサポートベクターマシンなどを用いてもよいし、隠れ層が多層になった深層学習手法として、DNN(ディープニューラルネットワーク)やCNN(コンボリューショナルニューラルネットワーク)などを用いてもよい。被検物質が複数種類ある場合は、それぞれの物質に対して学習済モデルを構築しても良い。深層学習を用いる場合は、分類型ニューラルネットワークを構築すると良い。
【0078】
次に、種類が未知の被検物質に対して、その種類を推論する。種類が未知の前記被検物質を含む試料の質量スペクトルをTOF-SIMSにて取得する(S3)。ここで表示部に質量スペクトルを表示する。前記学習済みモデルに前記試料の質量スペクトルを入力し、前記被検物質の種類を推論する(S4)。推論結果を表示部に表示する。
【0079】
さらに、前記推論の結果に対する根拠を推定する。前記質量スペクトルは質量を電荷で除算した値に対する検出器の強度iのデータであり、i(t)の配列で表せる。ここでtは0から始まる整数であり、機器の分解能によって決まるΔtの間隔でデータは取得されている。質量を電荷で除算した値をさらにΔtで除算することでtを得る。質量スペクトルの取得終了値をtENDΔtとすると、tは0からtENDまでの値を取る。t=nの時j(t)=0とし、t≠nの時j(t)=i(t)とする新しいクロマトグラムj(t)を作成する(S5)。j(t)に対して前記学習済モデルを適用し推論を行う。i(t)の推論結果とj(t)の推論結果の差分の絶対値をk(n)とし、nを0からtENDまで変化させてk(n)の配列を取得する。ここで得られたk(n)が推論に対する質量スペクトルの寄与度となる(S6)。寄与度の極大値を求め、これを推論の根拠として表示部に表示する(S7)。推論の根拠は寄与度の極大値の上位2つから3つ程度でもよい。
【0080】
図8は表示部における表示の一例である。この例ではメタクリル酸メチルを主成分とした紫外線硬化性樹脂中に含まれる添加物を同定した例である。501は質量スペクトル、502は深層学習を用いて同定した結果である。複数の添加物候補からアセチレノールE-100(川研ファインケミカル(株)製)が添加物であると示されている。この分類結果に対して、その根拠として503が表示されている。504は503のうちユーザが選択した一部を拡大表示している。505には根拠として選択した質量スペクトルの情報が表示されている。
【0081】
ここで、504で根拠として示した質量スペクトルについて着目してみる。添加物(アセチレノールE-100)の濃度を0.2%、0.4%、0.6%、1.5%、10%と変化させた時の、質量スペクトルm/z=231が
図9である。m/z=231は信号としては小さいが、添加物濃度との相関が高い事から添加物由来の信号であると考えられる。したがって、質量スペクトルm/z=231は同定の根拠の1つであると言える。
【0082】
また、
図14は表示部における別の例である。901は質量スペクトル、902は深層学習を用いて同定した結果である。その際の寄与度が903に表示されており、904は寄与度の高い質量スペクトルの情報である。
図15、16は
図14における寄与度の別の表示方法の例であり、寄与度の高い質量スペクトルの情報と共にその寄与度が表示されている。
図15では質量スペクトルの情報と共に寄与度の数値が対応するピークと線で結ばれている。
図16はピークの位置を示す数値とそれに対応して質量スペクトルの情報と寄与度の数値が示されている。
【実施例4】
【0083】
実施例3の推論の結果に対する根拠の推定を以下のように変更した。
質量スペクトル中の最大値をiMAXとする。t=nの時j(t)=i(t)+imax×0.1とし、t≠nの時j(t)=i(t)とする新しい質量スペクトルj(t)を作成する。この他は実施例3と同様である。結果としては実施例3と同様に推論の根拠が表示された。
【実施例5】
【0084】
実施例3の推論の結果に対する根拠の推定を以下のように変更した。
t=n1またはt=n2の時j(t)=0とし、t≠n1かつt≠n2の時j(t)=i(t)とする新しい質量スペクトルj(t)を作成する。i(t)の推論結果とj(t)の推論結果の差分の絶対値をk(n1,n2)とし、n1を0からtENDまで、n2を0からtENDまで変化させてk(n1,n2)の配列を取得する。
【0085】
この場合、k(n1,n2)が極大となるn1、n2が推論の根拠となる。
図10は表示部における表示の一例である。n1、n2が揃う事で同定結果になったという事から、2つは近い部位に存在していた可能性が高い。
図10中703(A)はより質量が大きい右側のピークの物質が分解して左のピークの物質になったことを示唆している。これらの情報を合わせる事で推論結果に対する根拠とすることができる。
【実施例6】
【0086】
本実施例では、分析部に質量分析法を用いた個体試料中の被検物質の同定と定量を同時に行う方法について説明する。手順のフローチャートは実施例1と同様(
図5)である。
【0087】
事前準備としては実施例3で行った被験物質の種類を変えて学習させた方法に加えて、同じ方法で被験物質の量を変えた学習方法も行う。この場合、スペクトル情報と被検物質の量が教師データとなる。推論の根拠は実施例3と同様の方法で求める事が出来る。
【0088】
実施例3で作られた学習モデルと本実施例で作られた学習モデルの2つを用いる事で、1つの質量スペクトルから種類と量を推論する事が出来る。また、スペクトル情報と被検物質の種類、および量を教師データとし、1回の推論で種類と量を求めてもよい。表示例を
図17に示す。1001は質量スペクトルであり、1002は種類の推論結果とその種類に分類した根拠として選ばれた質量スペクトルの情報を示している。1003は量の推論結果とその根拠として選ばれた質量スペクトルの情報を示している。
【実施例7】
【0089】
本実施例では、分析部に質量分析法を用いた個体試料中の被検物質の同定を行う別の方法について説明する。手順のフローチャートは実施例1と同様(
図5)である。事前準備としては実施例3で行った被験物質の種類を変えて学習させた方法を行っておく。この時、
図18に示したディープニューラルネットワーク(以下DNN)を用いて学習を行う。このDNNは分類型であり、出力層1102には分類する数に応じたノードが存在し、各ノードにその分類となる確率が出力される。教師データは、入力がスペクトル情報、出力が対応する分類を1、それ以外を0とした確率情報として学習を行う。出力層とその一つ前の層を繋ぐ活性化関数としてはソフトマックス関数を使うことが好ましい。これにより出力層のノードの合計値を1にする事が出来る。学習後の学習モデルの入力層にスペクトル情報を入れると、出力層から各分類に対する確率が出力される。ここで、出力層の1つのノードに着目し実施例3と同様の根拠の推定を行う。これを全出力層のノードに対して行うことで、各分類結果になった根拠(質量スペクトルの寄与度)を求める事が出来る。
図19は本実施例における出力結果の表示例である。1201は入力した質量スペクトルであり、1202は分類結果で最も確率が高かった物質の情報とその根拠となるピーク情報、および寄与度が表示されている。1203は2番目に確率が高かった物質の情報とその根拠となるピーク情報、および寄与度である。
【実施例8】
【0090】
実施例7と同様の方法で質量スペクトルを分類、各分類候補に対する物質の情報とその根拠となるピーク情報、および寄与度を表示する。さらに質量スペクトル中の最大値をi
MAXとし、t=nの時j(t)=i
max、t≠nの時j(t)=i(t)とする新しい質量スペクトルj(t)を作成する。この他は実施例3と同様にして各分類候補に対する寄与度を新たに求める。ここで求める寄与度は、各分類候補に対して質量スペクトルの一部にピークを足したときに、その分類の確率を上げる量を示している。
図20に本実施例における出力結果の表示例を示す。1301に示した不足ピークがその分類の確率を上げる最も寄与度の大きかったピークである。
図20の例では(A)のピーク(m/z=57、図中の1302)が存在すれば分類候補(2)ペンタンである確率が80%増加したことを意味している。つまり、この質量スペクトルは分類候補(1)酢酸の確率87.5%と分類したが、(A)にピークがあれば分類候補(2)である確率の方が大きくなり、分類候補(2)ペンタンであると分類されたということである。(A)にピークが無かった事が分類候補(1)の確率が最も高くなった根拠ということができる。
【符号の説明】
【0091】
10 情報処理装置
21 LAN
22 データベース
23 分析装置
31 通信IF
32 ROM
33 RAM
34 記憶部
35 操作部
36 表示部
37 制御部
41 スペクトル情報取得部
42 学習モデル生成部
43 学習モデル取得部
44 推定部
45 情報取得部
46 寄与度取得部
47 表示制御部