特許第6872034号(P6872034)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧 ▶ 株式会社島津製作所の特許一覧

<>
  • 特許6872034-波形解析装置 図000002
  • 特許6872034-波形解析装置 図000003
  • 特許6872034-波形解析装置 図000004
  • 特許6872034-波形解析装置 図000005
  • 特許6872034-波形解析装置 図000006
  • 特許6872034-波形解析装置 図000007
  • 特許6872034-波形解析装置 図000008
  • 特許6872034-波形解析装置 図000009
  • 特許6872034-波形解析装置 図000010
  • 特許6872034-波形解析装置 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6872034
(24)【登録日】2021年4月20日
(45)【発行日】2021年5月19日
(54)【発明の名称】波形解析装置
(51)【国際特許分類】
   G01N 30/86 20060101AFI20210510BHJP
【FI】
   G01N30/86 B
   G01N30/86 C
   G01N30/86 E
【請求項の数】10
【全頁数】16
(21)【出願番号】特願2019-551828(P2019-551828)
(86)(22)【出願日】2017年11月9日
(86)【国際出願番号】JP2017040487
(87)【国際公開番号】WO2019092837
(87)【国際公開日】20190516
【審査請求日】2020年5月7日
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(73)【特許権者】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】110001069
【氏名又は名称】特許業務法人京都国際特許事務所
(72)【発明者】
【氏名】小副川 健
(72)【発明者】
【氏名】樋田 祐輔
(72)【発明者】
【氏名】金澤 裕治
(72)【発明者】
【氏名】金澤 慎司
(72)【発明者】
【氏名】山田 洋平
(72)【発明者】
【氏名】安田 弘之
(72)【発明者】
【氏名】國澤 研大
【審査官】 高田 亜希
(56)【参考文献】
【文献】 特開2017−58361(JP,A)
【文献】 国際公開第2016/185552(WO,A1)
【文献】 国際公開第2017/094170(WO,A1)
【文献】 特開平6−201673(JP,A)
【文献】 特開2008−2895(JP,A)
【文献】 Dan Kutscher,Taking the Pain Out of Chromatographic Peak Integration,Eastern Analytical Symposium 2014,Thermo Fisher,2014年
(58)【調査した分野】(Int.Cl.,DB名)
G01N 30/00−30/96
G01N 27/60−27/92
(57)【特許請求の範囲】
【請求項1】
試料に対して所定の分析を行うことで得られた信号列に基づく信号波形を解析し該信号波形上のピークに関連する情報を求める波形解析装置において、
a)ピークの始点及び終点が既知である複数の信号波形を用いた機械学習によって予め構築された学習済みモデルを使用して、目的試料についての信号波形に現れる一又は複数のピークの始点の位置又は終点の位置の少なくとも一方を含むピーク情報を推定するとともに、その推定の確からしさを示す指標値である確度情報を求めるピーク検出部と、
b)前記ピーク検出部により一つのピークに対して得られた一又は複数のピーク情報をそれぞれの確度情報と対応付けて、前記目的試料についての信号波形とともに表示部の画面上に表示する表示処理部と
備えることを特徴とする波形解析装置。
【請求項2】
請求項1に記載の波形解析装置であって、
前記表示処理部により前記表示部の画面上に表示されたピーク情報を修正するピーク情報修正部、をさらに備えることを特徴とする波形解析装置。
【請求項3】
請求項に記載の波形解析装置であって、
前記表示処理部は、信号波形上の一つのピークについて得られた複数のピーク情報のうちの一つを最有力候補として、それ以外のピーク情報である候補とは識別可能に表示し、
前記ピーク情報修正部は、前記最有力候補とは別の候補をユーザが選択指示する指示部を含み、該指示部により選択指示された候補を最有力候補に変更することを特徴とする波形解析装置。
【請求項4】
請求項に記載の波形解析装置であって、
前記表示処理部は、一つのピークについて得られた複数のピーク情報のうち確度情報の値が最も大きいものを最有力候補とし、少なくともその次に確度情報の値が大きなピーク情報である候補と共に表示することを特徴とする波形解析装置。
【請求項5】
請求項に記載の波形解析装置であって、
前記表示処理部は、一つのピークについて得られた複数のピーク情報に対応する確度情報を確率とみなし、該複数のピーク情報に含まれるピークの始点及び/又は終点の位置に対する確率の分布を示す確度分布を求め、該確度分布に基づいて前記最有力候補を決めることを特徴とする波形解析装置。
【請求項6】
請求項に記載の波形解析装置であって、
前記表示処理部は、前記確度分布において確度情報の値が最大であるピーク情報に含まれるピーク始点及び/又は終点の位置の近傍で、且つ該確度情報の値が極大点となる位置に対応するピーク始点及び/又は終点を含むピーク情報を求め、これを最有力候補とすることを特徴とする波形解析装置。
【請求項7】
請求項に記載の波形解析装置であって、
前記表示処理部は、前記確度分布に複数の凸部が存在する場合に、その凸部のそれぞれの極大点のうちの上位から所定個数の極大点に対応するピークの始点及び/又は終点をそれぞれ含むピーク情報を候補とすることを特徴とする波形解析装置。
【請求項8】
請求項1に記載の波形解析装置であって、
前記表示処理部は、一つのピークについて得られた複数のピーク情報の中から、そのピーク情報に対応する確度情報の値と、同じ目的試料についての分析で得られた信号列又は信号波形に基づいて求まった同じピークについてのピーク情報に対応する確度情報の値との差異が所定以内であるピーク情報を選択して表示することを特徴とする波形解析装置。
【請求項9】
請求項1に記載の波形解析装置であって、
前記表示処理部は、同じ目的試料について複数回の分析で得られた複数の信号列又は信号波形に基づいて求まった同じピークについての複数のピーク情報及び確度情報を同時に表示することを特徴とする波形解析装置。
【請求項10】
請求項1に記載の波形解析装置であって、
前記表示処理部は、一つのピークに対する複数のピーク情報の候補のうち指標値が最大である候補又は最有力候補のピークの始点及び/又は終点の近傍で且つ信号強度が最も低くなる位置をピークの始点及び/又は終点の最有力候補として表示することを特徴とする波形解析装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分析装置で得られた信号の波形を解析する波形解析装置に関する。本発明は例えば、ガスクロマトグラフ(GC)装置や液体クロマトグラフ(LC)装置などで取得されるクロマトグラム波形、質量分析装置で取得されるマススペクトル波形、分光光度計などで取得される吸光スペクトル波形、X線分析装置で取得されるX線スペクトル波形など、各種の分析装置で得られる信号の波形の解析に好適である。
【背景技術】
【0002】
ガスクロマトグラフ装置や液体クロマトグラフ装置では、各種成分が含まれる試料をカラムに導入し、該試料がカラムを通過する過程で各種成分を時間方向に分離し、カラムの出口に設けた検出器により検出する。検出器により得られた検出信号に基づいて作成されるクロマトグラムには、試料中の成分に対応するピークが現れる。そのピークが観測される時間(保持時間)は成分の種類に対応しているため、このピークの保持時間から成分を特定する、つまりは定性分析を行うことができる。また、ピークの高さや面積はその成分の濃度又は含有量に対応しているため、ピークの高さ値や面積値からその成分の濃度や含有量を求める、つまりは定量分析を行うことができる。
【0003】
定性分析や定量分析を行うには、クロマトグラム波形上でピークを的確に検出し、ピークの始点、終点の位置(時間)を確定する必要がある。実際のクロマトグラム波形では様々なノイズが重畳されていたり、ベースラインが変動していたり、或いは複数の成分由来のピークが重なっていたりする。そのため、クロマトグラム波形からピークを的確に検出するのは容易ではなく、従来、クロマトグラム波形に基づくピーク検出法として様々なアルゴリズムが提案され、実用に供されている(特許文献1、2など参照)。
【0004】
従来の一般的なピーク検出アルゴリズムでは、実測のクロマトグラム波形に対し、スムージング等のノイズ除去、ピーク位置の検出、ベースライン推定、ピーク始点及び終点の検出、重なっているピークの分離などの波形処理を経て、ピークの高さ値や面積値が算出される。アルゴリズムによっては、ピーク位置の検出に先だって、ベースライン推定やピーク始点及び終点の検出が実行される場合もあるが、いずれにしても、従来の一般的なピーク検出アルゴリズムでは、様々なパラメータを予めオペレータ(分析担当者)が設定したり、表示画面上でクロマトグラム波形をオペレータが観察してピークの始点・終点を指定したり、或いは、重なっているピークを分離するためにどのようなベースラインが適切であるのかをオペレータが判断して選択したりする等、オペレータによるかなりの作業が必要であった。また、そもそも、ベースラインやピークの形状が様々であるクロマトグラム波形に対し、一つの決まったピーク検出アルゴリズムを適用することは難しいため、予め用意された複数のピーク検出アルゴリズムの中から使用するアルゴリズムをオペレータが選択する作業も必要であった。
【0005】
こうした作業はオペレータに大きな負担であって解析作業の効率改善に大きな支障となる。また、解析作業には或る程度の熟練や経験が必要であるため、担当できる者が限られる。さらにまた、オペレータによって判断にばらつきが生じることは避けられないし、オペレータによる恣意的な操作が入り込む余地もある。そのため、解析結果の精度や再現性、或いは信頼性を確保するのが難しいという問題もある。
【0006】
オペレータによる作業の負担を軽減するために、ピークの始点・終点を自動で検出するアルゴリズムも開発されている(非特許文献1など参照)。しかしながら、こうしたアルゴリズムにおいても未だオペレータの操作に依存する要素は大きく、さらなる負担の軽減が要望されている。
【0007】
また、こうしたアルゴリズムによって自動的にピーク検出がなされたとしても、その検出結果が適切でない場合もある。そのため、自動検出されたピークの始点・終点をオペレータが表示画面上で確認したうえで必要に応じて修正するという作業は実際上欠かせない。多成分一斉分析においては、クロマトグラム波形に数万を超えるピークが含まれる場合があり、こうした場合に全てのピークについてそれぞれ始点及び終点を目視で確認しながら手作業で修正すると膨大な時間を要してしまう。こうしたことから、ピークの自動検出が行われる場合でも、その検出結果を確認し修正する作業を簡略化し、作業負担を軽減することが重要である。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2009−8582号公報
【特許文献2】国際公開第2017/094170号パンフレット
【非特許文献】
【0009】
【非特許文献1】「インテリジェントな波形処理アルゴリズムで解析業務を効率化」、[online]、[平成29年10月23日検索]、株式会社島津製作所、インターネット<URL:http://www.an.shimadzu.co.jp/hplc/support/faq/faq8/i-peakfinder_introduction.htm>
【非特許文献2】「ディープラーニング技術を活用したスモールスタートサービスで予測分析導入を支援」、Wave 2017.5 vol.21、[online]、[平成29年10月23日検索]、東芝情報システム株式会社、インターネット<URL: https://www.tjsys.co.jp/wave/files/Wave-21_06.pdf>
【非特許文献3】ウェイ・リウ(Wei Liu)、ほか6名、「SSD:シングル・ショット・マルチボックス・デテクタ(SSD: Single Shot Multibox Detector)」、[online]、[平成29年10月23日検索]、arXiv.org、インターネット<URL: https://arxiv.org/pdf/1512.02325.pdf>
【非特許文献4】緒方 貴紀、「SSD: Single Shot MultiBox Detector (ECCV2016) 」、[online]、[平成29年10月24日検索]、slideshare、インターネット<URL: https://www.slideshare.net/takanoriogata1121/ssd-single-shot-multibox-detector-eccv2016>
【発明の概要】
【発明が解決しようとする課題】
【0010】
本発明は上記課題を解決するために成されたものであり、その目的とするところは、ピーク検出処理によって検出されたピークの始点や終点等のピーク情報を、オペレータが簡便に且つ効率良く確認しつつ、必要に応じて修正して高い精度のピーク検出結果を出力することができる波形解析装置を提供することである。
【課題を解決するための手段】
【0011】
上記課題を解決するために成された本発明は、試料に対して所定の分析を行うことで得られた信号列に基づく信号波形を解析し該信号波形上のピークに関連する情報を求める波形解析装置において、
a)ピークの始点及び終点が既知である複数の信号波形を用いた機械学習によって予め構築された学習済みモデルを使用して、目的試料についての信号波形に現れる一又は複数のピークの始点の位置又は終点の位置の少なくとも一方を含むピーク情報を推定するとともに、その推定の確からしさを示す指標値である確度情報を求めるピーク検出部と、
b)前記ピーク検出部により一つのピークに対して得られた一又は複数のピーク情報をそれぞれの確度情報と対応付けて、前記目的試料についての信号波形とともに表示部の画面上に表示する表示処理部と、
備えることを特徴としている。
また本発明に係る波形解析装置では、前記表示処理部により前記表示部の画面上に表示されたピーク情報を修正するピーク情報修正部、をさらに備える構成とすることができる。
【0012】
本発明において、所定の分析とは例えば、液体クロマトグラフィやガスクロマトグラフィなどのクロマトグラフ分析、質量分析、イオン移動度分析、吸光分光分析や蛍光分光分析などの分光分析、X線分析などである。また、こうした分析を行うことで得られた信号列に基づく信号波形とは、時間、質量電荷比、イオン移動度、波長、エネルギーなどを変数とする信号強度の変化を示すクロマトグラム波形やスペクトル波形などである。
【0013】
本発明に係る波形解析装置において、ピーク検出部は、ピークの正確な始点及び終点が既知である複数の(通常はかなり多数の)信号波形を用いた機械学習によって予め構築された学習済みモデルを備える。目的試料を分析することで得られた信号列が与えられると、ピーク検出部は学習済みモデルを使用して、その信号列又は信号列から求まる信号波形から信号波形に現れる一又は複数のピークの始点・終点の位置を推定するとともに、その推定の信頼度を量る確度情報を算出する。なお、ここで使用する機械学習の手法は、広義の機械学習に含まれるディープラーニングも含め、特に限定されない。
【0014】
次に表示処理部は、推定されたピーク情報を正解の候補として確度情報と対応付け、目的試料についての信号波形とともに表示部の画面上に表示する。オペレータ(ユーザ)は表示画面上で信号波形とピーク情報の候補及び確度情報とを目視で確認し、必要な場合についてのみ、ピーク情報修正部によりピーク情報を修正する。例えば確度情報が十分に高い値であるピーク情報の候補が見いだされているピークについては確認作業を省略し、確度情報の値が相対的に低いピーク情報候補しかないピークについてのみオペレータが信号波形上でピーク波形を確認し、必要であれば手動でピーク始点・終点を指定するといった手間を省いた作業が可能である。
【0015】
本発明において、上記表示処理部による表示、及び、ピーク情報修正部による修正の指示やその指示に応じた修正動作は、様々な態様を採り得る。
【0016】
具体的には本発明の一態様として、前記表示処理部は、信号波形上の一つのピークについて得られた複数のピーク情報のうちの一つを最有力候補として、それ以外のピーク情報である候補とは識別可能に表示し、
前記ピーク情報修正部は、前記最有力候補とは別の候補をユーザが選択指示する指示部を含み、該指示部により選択指示された候補を最有力候補に変更する構成とするとよい。 上記指示部としては例えば、画面上に表示されている文字や記号等をクリック操作するためのポインティングデバイスを用いればよい。
【0017】
この態様において、前記表示処理部は、一つのピークについて得られた複数のピーク情報のうち確度情報の値が最も大きいものを最有力候補とし、少なくともその次に確度情報の値が大きなピーク情報である候補と共に表示する構成とするとよい。
【0018】
この態様によれば、最有力候補となっているピーク情報を修正したい場合にオペレータは単に他の候補を選択指示する操作を行いさえすればよいので、修正の操作が簡単であって、効率良くピーク情報を修正することができる。
【0019】
また上記態様において、前記表示処理部は、一つのピークについて得られた複数のピーク情報に対応する確度情報を確率とみなし、該複数のピーク情報に含まれるピークの始点及び/又は終点の位置に対する確率の分布を示す確度分布を求め、該確度分布に基づいて前記最有力候補を決める構成としてもよい。
【0020】
またこの場合、上記確度分布では、複数のピーク情報のうちの確度情報の値が最大となるピーク情報に含まれるピークの始点・終点の位置で極大点が現れるとは限らず、そのピークの始点・終点の位置から少しずれた位置において確度分布の極大点が現れる可能性がある。この極大点が現れる位置のほうが、ピークの始点・終点としてより妥当であると推測される。
そこで、上記構成では、前記確度分布において確度情報の値が最大であるピーク情報に含まれるピーク始点及び/又は終点の位置の近傍で、且つ該確度情報の値が極大点となる位置に対応するピーク始点及び/又は終点を含むピーク情報を求め、これを最有力候補としてもよい。
【0021】
こうした構成によれば、複数のピーク情報の中で単に確度情報の値が最も大きいものを最有力候補とする場合に比べて、確率的により確からしいピーク始点・終点を含むピーク情報を最有力候補としてオペレータに提示することができる。
【0022】
また、上記構成において、前記確度分布に複数の凸部が存在する場合には、その凸部のそれぞれの極大点のうちの上位から所定個数の極大点に対応するピークの始点及び/又は終点をそれぞれ含むピーク情報を候補としてもよい。
【0023】
また本発明の他の態様として、前記表示処理部は、一つのピークについて得られた複数のピーク情報の中から、そのピーク情報に対応する確度情報の値と、同じ目的試料についての分析で得られた信号列又は信号波形に基づいて求まった同じピークについてのピーク情報に対応する確度情報の値との差異が所定以内であるピーク情報を選択して表示する構成とするとよい。
【0024】
また本発明のさらに他の実施態様として、前記表示処理部は、同じ目的試料について複数回の分析で得られた複数の信号列又は信号波形に基づいて求まった同じピークについての複数のピーク情報及び確度情報を同時に表示する構成とするとよい。
【0025】
これら構成のように、同じ試料について複数回の分析を実行した場合には、その複数の分析によって得られた信号列又は信号波形に基づいてそれぞれ推定されたピーク情報及び確度情報を比較することで又はその差異をとることで、より信頼性の高い結果を導き出すことができる。
【0026】
また本発明のさらに他の態様として、前記表示処理部は、一つのピークに対する複数のピーク情報の候補のうち指標値が最大である候補又は最有力候補のピークの始点及び/又は終点の近傍で且つ信号強度が最も低くなる位置をピークの始点及び/又は終点の最有力候補として表示する構成としてもよい。
【0027】
この構成によれば、ピーク検出部により推定されたピークの始点・終点の位置そのものではなく、その位置の近傍でより妥当性の高い位置を示すピーク情報を最有力候補として挙げることができる。
【発明の効果】
【0028】
本発明に係る波形解析装置によれば、自動的に検出されたピークの始点、終点等のピーク情報を、ユーザが効率良く確認し、必要に応じて修正することができる。特に、確からしいピーク情報とそれよりも信頼性の低いピーク情報とを簡単に識別できるように表示することで、ユーザによる目視での確認や修正の指示が一層簡単になり、そうした作業におけるユーザの負担を軽減することができる。また、波形解析のスループットを向上させることができる。さらにまた、例えば多数のピークが観測される信号波形を解析する際に、ユーザが確認すべきピークの数が減ることで確認作業のミスや見落としなどを防止するのにも有効である。
【図面の簡単な説明】
【0029】
図1】本発明に係る波形解析装置の一実施例を用いた液体クロマトグラフシステム及び該システムに用いられる学習済みモデルを作成するシステムの概略構成図。
図2】本実施例の波形解析装置において使用される学習済みモデルを作成する際の処理の流れを示すフローチャート。
図3】本実施例の波形解析装置におけるピーク検出処理の流れを示すフローチャート。
図4】本実施例の波形解析装置におけるクロマトグラム波形の画像化の一例を示す図。
図5】本実施例の波形解析装置において用いられる、ニューラルネットワークによる学習済みモデルを示す模式図
図6】本実施例の波形解析装置において用いられる学習済みモデルを作成する際の処理を説明するための模式図。
図7】本実施例の波形解析装置において学習済みモデルを用いたピーク検出処理を説明するための模式図。
図8】本実施例の波形解析装置におけるピーク自動検出処理によって求まるピークの始点・終点の候補の表示の一例を示す図。
図9】本実施例の波形解析装置におけるピーク自動検出処理によって求まるピークの始点・終点の候補の表示の一例を示す図。
図10】本実施例の波形解析装置において自動的に検出されたピークの終点を修正する際の作業例を示す図。
【発明を実施するための形態】
【0030】
以下、本発明に係る波形解析装置の一実施例について詳細に説明する。
図1は本発明に係る波形解析装置の一実施例を用いた液体クロマトグラフ(LC)システム及び該システムに用いられる学習済みモデルを作成するシステムの概略構成図である。
【0031】
このLCシステム1は、LC測定部10、データ解析部11、操作部12、及び表示部13を備える。LC測定部10は図示しないが、送液ポンプ、インジェクタ、カラム、カラムオーブン、検出器などを含み、与えられた試料についてのLC分析を実行して、検出器による信号強度の時間的な変化を示すクロマトグラムデータを取得する。
データ解析部11は、データ収集部110、ピーク検出処理部111、定性・定量解析部117などの機能ブロックを含み、ピーク検出処理部111はさらに、画像生成部112、ピーク位置推定部113、学習済みモデル記憶部114、ピーク情報修正処理部115、ピーク決定部116などの機能ブロックを含む。
【0032】
データ解析部11において、データ収集部110はLC測定部10で得られたクロマトグラムデータを収集しこれを記憶する。本発明に係る波形解析装置に相当するピーク検出処理部111は、収集されたクロマトグラムデータに基づくクロマトグラム波形においてピークを自動的に検出し、検出したピークの始点及び終点の位置(保持時間)を含むピーク情報を出力する。定性・定量解析部117は、ピーク検出処理部111から与えられたピーク情報に基づいて各ピークに対応する成分を同定したり、ピーク高さ値やピーク面積値を計算し、その値から各成分の濃度又は含有量を算出したりする。
【0033】
図1において、LCシステム1とは別に設けられているモデル作成部2は、学習データ入力部20、画像生成部21、学習実行部22、及びモデル構築部23を機能ブロックとして含む。このモデル作成部2において作成される学習済みモデルが、LCシステム1のデータ解析部11における記憶部に格納されて学習済みモデル記憶部114として機能する。
【0034】
なお、通常、データ解析部11の実体は、所定のソフトウェアがインストールされたパーソナルコンピュータやより性能の高いワークステーション、或いは、そうしたコンピュータと通信回線を介して接続された高性能なコンピュータを含むコンピュータシステムである。即ち、データ解析部11に含まれる各ブロックの機能は、コンピュータ単体又は複数のコンピュータを含むコンピュータシステムに搭載されているソフトウェアを実行することで実施される、該コンピュータ又はコンピュータシステムに記憶されている各種データを用いた処理によって具現化されるものとすることができる。
【0035】
次に、ピーク検出処理部111において実施されるピーク検出処理について詳細に説明する。
ごく概略的にいうと、このピーク検出処理部111では、クロマトグラム波形(クロマトグラムカーブ)を2次元画像に変換したうえで、その画像上に存在する物体のカテゴリーと位置とを検出する機械学習の一手法であるディープラーニング(Deep Learning)の手法を用いることによって、ピークの始点及び終点の位置を検出している。
【0036】
[学習済みモデルの作成]
よく知られているように、機械学習法では、多数の学習データを用いて学習済みモデルを予め構築しておく必要がある。上述したように、この学習済みモデルの構築の作業は、LCシステム1の一部であるデータ解析部11において行われるのではなく、別のコンピュータシステムにより構成されるモデル作成部2で実施され、その結果が学習済みモデル記憶部114に格納される。それは、一般に学習済みモデルの構築作業は多量のデータを処理するために計算量が膨大であり、かなり高性能で且つ画像処理に対応したコンピュータが必要であるためである。図2は、モデル作成部2において行われる学習済みモデル作成時の処理の流れを示すフローチャートである。
【0037】
学習済みモデルを作成する際には、多数で多様なクロマトグラム波形データを用意すると共に、その各クロマトグラム波形に現れている一又は複数のピークの始点及び終点の保持時間を正確に求めておく。ここでいう多様なクロマトグラム波形データとは、実際にピーク検出を実施する際のクロマトグラム波形に現れる可能性がある、様々なノイズの混入、ベースラインの変動(ドリフト)、複数のピークの重なり、或いは、ピーク形状の変形、などの要素を含むクロマトグラム波形である。学習データ入力部20は、この多数のクロマトグラム波形データとピーク始点・終点を含む正確なピーク情報とのセットを学習データとして読み込む(ステップS1)。
【0038】
画像生成部21は、時系列信号であるクロマトグラム波形データに基づいてクロマトグラムを作成し、時間経過に伴う信号強度の変化を示すクロマトグラム波形(クロマトグラムカーブ)を所定の画素数の2次元画像に変換する(ステップS2)。ここでは一例として、画素数は512×512であるものとする。この画像変換の際に、クロマトグラム波形上のピークの中で信号強度が最大であるピークのピークトップが矩形状の画像の上辺に一致するように、その波形のy方向のサイズを規格化する。また、クロマトグラム波形の全測定時間範囲又は一部の測定時間範囲(例えばユーザにより指示された測定時間範囲)が矩形状の画像のx方向(横方向)の長さに一致するように、その波形のx方向のサイズを規格化する(ステップS3)。
【0039】
上記のようにクロマトグラム波形を規格化すると、この波形に対応する線を境界として矩形状の画像は二つに分割される。そこで、その画像分割により形成された二つの領域の一方を他方とは異なる所定の色で塗りつぶす(ステップS4)。このとき、色の濃さを多段階にし、波形に対応する線つまりは二つの領域の境界線の近傍で境界線と画素との位置関係に応じて各画素の色の濃さを決定するとよい。具体的には、例えば0〜255の256段階のグレイスケールで一方の領域の塗りつぶしを行うと、一方の領域における境界線から離れた部分は黒色、他の領域における境界線から離れた部分は白色になるが、境界線付近の画素はその中間色となる。
【0040】
図4には、クロマトグラム波形の一例(a)と、これに対してステップS2〜S4による画像化を実施して得られる2次元画像(b)を示している。図4(b)の下には、二つの領域の境界線付近の画素の色を模式的に示している。なお、ここでは、二つの領域の一方の全体を塗りつぶしている。これにより、各領域中の微小領域(1個の画素又は複数の画素の集合)同士を比較したときに、異なる領域であることの識別が可能となる。このことは、後述する機械学習のアルゴリズムにおいて画像認識の精度を上げるには都合がよい。ただし、使用する機械学習のアルゴリズムによっては、必ずしも二つの領域の一方の全体を塗りつぶさずとも、例えばその境界線全体に沿って該境界線から所定長さの範囲内のみ塗りつぶす画像を用いてもよい。また、当然のことながら、グレイスケールでなく黒以外の一色、又はカラースケールに従った複数色での塗りつぶしを行ってもよい。即ち、境界線を挟んだ両側の領域における微小領域の間での識別が可能であるように塗りつぶせばよい。
【0041】
ステップS1で読み込まれた全てのクロマトグラム波形データについて同様にして画像に変換する。クロマトグラム波形の規格化を伴う画像化の処理によって元のクロマトグラム波形の強度情報や時間情報は失われ、波形形状を表す画像が生成されることになる。なお、ステップS1において全てのデータを読み込んでからステップS2〜S4の処理を実行するのではなく、ステップS1におけるデータの読み込みを行いながら、すでに読み込まれたデータについてステップS2〜S4による画像化を行ってもよいことは当然である。
【0042】
また画像生成部21は、クロマトグラム波形データとセットになっているピーク情報を、上述した画像化に際してのx方向、y方向の規格化、つまりはクロマトグラム波形の伸縮に応じて、画像上の位置情報つまりはx方向及びy方向の画素位置の情報に変換する(ステップS5)。
【0043】
次に、学習実行部22は、上記のようにして学習データであるクロマトグラム波形から生成された多数の画像を用いた機械学習を実施し、モデル構築部23はその学習結果に基づき、クロマトグラム波形上のピークの始点及び終点を推定するための学習モデルを構築する。周知のように機械学習には様々なアルゴリズムがあるが、ここでは画像認識における一般物体検知アルゴリズムの一つであるディープラーニングを用い、その中でも特に画像認識に優れているSSD法を用いる(ステップS6)。
【0044】
SSD法は、ディープラーニングの中では最も広く利用されている畳み込みニューラルネットワーク(CNN)を用いた手法の一つであり、現時点では最も高速で且つ高い認識精度を実現可能なアルゴリズムである。SSD法は、リウ(Liu Wei)らにより非特許文献3で提案されたものであり、そのアルゴリズムの詳細については非特許文献3、4等に詳細に説明されているので、ここでは本実施例における特徴点についてのみ述べる。
【0045】
一般的なSSD法では、2次元的な画像内で物体が存在している部分を推測するためにCNNにより抽出した画像特徴マップ(feature map)を使用するが、その画像特徴マップを少しずつ畳み込んでいくことにより様々なサイズ(画素数)の画像特徴マップを利用している。これによって様々な大きさの物体領域候補を検出することができる。これに対し、本実施例において検出したいのはピークの始点及び終点のx方向の位置である。そこで、x方向の様々な大きさの区間内に存在するピークの始点及び終点を検出するようにアルゴリズムを変更している。
【0046】
図5は、本実施例で用いられるニューラルネットワークによる学習済みモデルを示す模式図である。また図6は学習済みモデルを作成する際の処理を説明するための模式図である。図6に示しているように、ここでは、上記ステップS2〜S4の処理で生成された画像のx方向の長さ全体の幅のウインドウを持つセグメントSg1を設定し、次に、セグメントSg1のウインドウを半分に分割したウインドウ幅が1/2であるセグメントSg2、Sg3を設定する。同様にして、セグメントSg2、Sg3のウインドウをそれぞれ半分に分割したウインドウ幅が元の1/4である4個のセグメントSg4、Sg5、Sg6、Sg7を設定する、という操作を繰り返し、全部で120個のセグメントSg1〜Sg120を定める。この各セグメントがCNNにより画像特徴マップを抽出する単位であり、学習データとしての画像に基づいてこの単位毎にピークの始点及び終点で決まるピーク範囲を学習する。
【0047】
この学習モデルにおけるニューラルネットワークでは図5に示すように、入力層に設けられた262144個のノードのそれぞれに512×512画素の画像における各画素の画素値(ここではグレイスケールの0〜255の範囲)が入力される。図5においてpxnは1枚の画像におけるn番目の画素を示す。なお、画像がカラー又は複数色である場合には、画素毎に例えば三原色の各色の画素値が入力されるため、入力層のノード数は例えば3倍になる。
【0048】
学習実行部22では、多数の画像に基づく上記のような入力に対しディープラーニングによって多数の中間層から成る層構造のネットワークが学習され、最終的な出力層に設けられた600個のノードからそれぞれ数値情報が出力される。この600個のノードから出力される情報は、120個のセグメントSg1〜Sg120のそれぞれについて算出される、ピーク検出の確度(confidence)confn、そのセグメントのウインドウの左端からピーク始点までのx方向のオフセット量xsn、入力画像の下端からピーク始点までのy方向のオフセット量ysn、そのセグメントのウインドウの右端からピーク終点までのx方向のオフセット量xen、入力画像の下端からピーク終点までのy方向のオフセット量yen、という5次元の情報である。図6中では1番目のセグメントSg1に対する上記5次元の情報を{conf1, xs1, ys1, xe1, ye1}として示している。ここでは、ピーク検出の確度はピーク範囲とウインドウとの重なりの長さで定義し、その値の範囲は0〜1である。
【0049】
図6の例ではクロマトグラム波形に二つのピークが存在する。前半のピークの始点の画素位置は(xs_a, ys_a)、終点の画素位置は(xe_a, ye_a)であり、そのピーク範囲はAである。一方、後半のピークの始点の画素位置は(xs_b, ys_b)、終点の画素位置は(xe_b, ye_b)であり、ピーク範囲はBである。この場合、セグメントSg1におけるxs1、ys1、xe1、及びye1は図6中に示すようになる。また、confはSg1のウインドウの幅とピーク範囲Aとの重なりに応じた計算値である。上述したように学習データにおけるピークの始点・終点の画素位置やピーク範囲は既知であるから、多数の学習データについて正解にできるだけ一致するように学習を行って各中間層におけるネットワーク重みを算出しつつモデルを構築する。
【0050】
モデル構築部23はこうして多数の学習データを用いてディープラーニングを行うことで求めた学習モデルを一旦保存する(ステップS7)。LCシステム1においてデータ解析部11の学習済みモデル記憶部114には、モデル作成部2において上述したように作成された学習モデルが例えば通信回線を介して伝送され格納される。
【0051】
[目的試料に対するピーク検出処理]
次に、LCシステム1のデータ解析部11で実行される、目的試料に対して得られたクロマトグラム波形上のピークの検出処理を説明する。図3はピーク検出処理部111において行われるピーク検出処理の流れを示すフローチャートである。
まず、画像生成部112は処理対象であるクロマトグラム波形データをデータ収集部110から読み込む(ステップS11)。そして、読み込んだデータに対し、モデル作成部2の画像生成部21で実行されたステップS2〜S4によるクロマトグラム波形データの画像化と同様のステップS12〜S14の処理を実行することにより、クロマトグラムカーブを含む512×512画素の画像を生成する。
【0052】
ピーク位置推定部113は、生成された画像の各画素の画素値に、学習済みモデル記憶部114に格納されている学習済みモデルを適用して120個のセグメント毎の上記5次元の情報を取得する。即ち、画像内でピークの始点及び終点と推測される画素位置の情報をピーク検出確度と共に取得する(ステップS15)。
【0053】
図7はピーク検出結果の一例を示す図である。ここでは、セグメント毎に{confn, xsn, ysn, xen, yen}(ただしnは1〜120)が求まるため、多くの場合、一つのピークに対し複数のセグメントで、ピーク検出の確度が0でない{confn, xsn, ysn, xen, yen}が得られる。なお、一般にピーク検出の確度confnが低いものは信頼性に乏しい。そこで、この例では算出されたconfnが所定値(ここでは0.5)以下である場合に、その5次元のピーク情報は有用でないとみなして{0, 0, 0, 0, 0}としているが、そうした確度による取捨選択を行わずに全ての結果を利用するようにしてもよい。
【0054】
[ピークの始点・終点の修正作業]
上述したように一般的に、一つのピークに対し始点・終点の位置がピーク検出確度と共に複数得られる。したがって、その複数のピーク始点・終点の中でピーク検出確度が最も高いものが正解であると推定し、そのピークの始点・終点の情報をピーク検出結果として出力してもよい。しかしながら、場合によっては、最大のピーク検出確度を示すピーク始点・終点の位置が必ずしも正解であるとは限らないことがある。また、一つのピークについて得られた複数のピーク始点・終点の中に正解がない場合もあり得る。そこで、本実施例の装置において、ピーク情報修正処理部115は以下のようにしてオペレータによる確認及び修正作業を支援する。
【0055】
ピーク情報修正処理部115はまず、一つのピークに対して得られた複数のピーク始点・終点をそれぞれ候補とし、その複数の候補の中でピーク検出確度が所定の閾値(例えば0.2)以下である候補を除去したうえで、ピーク検出確度が高い順に最大で所定数(例えば3個)の候補を選択する。そして、その所定数の候補に示されているピークの始点・終点の画像上の位置情報を時間情報に変換したうえで、そのピーク前後の所定の時間範囲のクロマトグラム波形と共に、ピーク自動検出結果として表示部13の画面上に表示する(ステップS16)。
【0056】
上記表示の態様は様々な態様のいずれかとすることができる。
オペレータが複数の候補の中からいずれか一つを選択するうえで目安となるのはピーク検出確度であるから、ピーク検出確度が最大である候補を最有力候補として他の候補とは視覚的に識別容易であるように表示することが好ましい。そこで、各候補によるピークの始点・終点をクロマトグラム波形上に所定の色の丸印等の記号で示すものとし、最有力候補を示す記号は濃い色で、他の候補を示す記号は淡い色で示すようにするとよい。また、ピーク検出確度が高い順に記号の色の濃淡に変化をつけるようにしてもよい。また、ピークの始点と終点との区別を容易にするために、例えば始点と終点とを異なる色としたり、始点は丸印、終点は三角印等、異なる記号を用いて表示したりしてもよい。
【0057】
図8は、各ピークについて推定されたピークの始点の位置を丸印、終点の位置を三角印で示し、且つ最有力候補を黒色の塗りつぶしで、それ以外の候補を白抜きで示した例である。こうした表示により、最有力候補とそれ以外の候補とが一目で判別可能である。
【0058】
オペレータは表示部13の画面上で、クロマトグラム波形と、候補となっているピークの始点・終点の位置とを目視で確認する。そして、最有力候補である始点・終点の位置ではなくそれ以外の候補である始点・終点のほうが妥当であると判断したならば、例えば、より妥当である始点・終点の記号の上又はその近傍をポインティングデバイスによるクリック操作で選択指示する。ピーク情報修正処理部115はこの指示を受けて、指示された始点・終点の位置を最有力候補に変更する。このようにしてオペレータはピークの自動検出結果を自らの判断及び操作によって修正することができる(ステップS17)。
【0059】
上述したようにピーク検出確度に応じた色等の情報をピーク始点・終点を示す記号に付与することでその確度の大小関係は分かるものの、ピーク検出確度の数値自体もオペレータが確認できるようにしたほうがより適切な判断が可能である。そこで、画面上のクロマトグラム波形の近傍に吹き出し等により複数の候補のピーク検出確度を数値で表示するようにしてもよい。図9はそうした表示の一例である。この例では、括弧()内の先頭の数値がピーク検出確度(0〜1の範囲)であり、それに続く数値はピーク始点の時間及び強度の情報である。ここでは、比較の際に最も重要であるピーク検出確度の数値を、他の数値よりも目立つように太字で示している。これにより、オペレータはピーク検出確度の数値を一目で確認し、より妥当性の高い候補を選択することができる。
【0060】
なお、図9に示した吹き出しは常時表示されるようにしてもよいが、例えば画像上のカーソルをクロマトグラム波形又はピーク始点・終点を示す記号に近づけたときのみに吹き出し表示が現れるようにしてもよい。また、ピーク検出確度の数値を太字とするのではなく、そのフォントの色やサイズ、斜体字の傾斜角などを変えることで、見立ち易くしてもよい。また、この場合、表示されているピーク検出確度の数値や吹き出し内の任意の部位をクリック操作することで、候補の選択指示を行えるようにしてもよい。
【0061】
また、ピーク検出確度の大きさに基づいて最終的な結果を選択したり最有力候補を定めたりする代わりに、ピーク情報修正処理部115は次のような処理を実施してもよい。
いま、一つのピークに対してピーク始点・終点の候補が複数(実際には或る程度多数)ある場合、始点、終点毎に、時間軸上でのピーク検出確度の変化を確度分布として捉えグラフ化する。このグラフは線グラフでもよいしヒートマップ等でもよい。例えば複数の点に対して適宜のフィッティングを行って確度分布曲線を求めると、その点の中でピーク検出確度が最大である点で確度分布曲線が極大値をとるとは限らず、そのピーク検出確度が最大である点の近傍で確度分布曲線が極大値をとることがある。その場合、その極大値をとる位置(時間)のほうがピーク始点又は終点として妥当であると考えられる。そこで、確度分布曲線が極大値をとる位置をピーク始点又は終点の最有力候補とすればよい。またそのときの極大値をその最有力候補に対応するピーク検出確度とすればよい。
【0062】
また、確度分布曲線に複数の凸部が現れる場合には、その複数の凸部のうち極大値が大きい順に所定数の数の凸部を選択し、その複数の凹部に対応する位置をピークの始点・終点の候補とすればよい。
【0063】
いずれにしても、ピークの自動検出結果についてオペレータが必要に応じて適宜の修正を行ったあとにピーク検出結果の確定の指示を行うと、これを受けてピーク決定部116はその時点で最有力候補となっているピーク始点及び終点を最終的なピーク検出結果として確定させ出力する(ステップS18)。
【0064】
データ解析部11において定性・定量解析部117はピーク検出結果を受けて、例えばピーク毎にピーク面積値又は高さ値を計算し、その値を予め取得しておいた検量線に照らして目的成分の濃度や含有量を算出する。或いは、成分が未知である場合には、ピーク毎にその保持時間に基づいて成分を同定する。
【0065】
本実施例において上述したピークの始点・終点の確認及び修正作業についてはさらに次のように変形することもできる。
【0066】
上記説明では、一つの目的試料を分析することで得られたクロマトグラム波形から学習モデルを利用してピークを検出していたが、同じ試料を繰り返し分析すると該試料について複数のクロマトグラム波形が得られるから、その複数のクロマトグラム波形に対するそれぞれのピーク自動検出結果を組み合わせるようにしてもよい。
【0067】
具体的には、同じ試料中の同じ成分由来のピークの同じ始点・終点位置についての複数のピーク検出確度を共に表示するようにしてもよい。これにより、オペレータは複数のピーク検出確度が共に高いものを信頼性が高いものと判断して候補の選択を行うことができる。また、同じピークの同じ始点・終点位置についての複数のピーク検出確度の差異を計算し、その差異が所定閾値以上であるものは信頼度が低いとみなして候補から除外するようにしてもよい。このように、同じ試料に対して複数回の分析を行うことで求めた情報を利用することで、ピークの検出精度を一層向上させることができ、高い定量性を実現することができる。
【0068】
また、オペレータの操作に応じてピークの始点・終点の位置を修正するのではなく、これを自動的に行うようにしてもよい。具体的には、候補が示すピーク始点や終点を中心とする一定の時間範囲内で信号強度が最小となる点に、始点や終点の位置を自動的に修正するとよい。図10は、候補であるピークの終点Peに対する所定の時間幅Wの範囲内で強度が最小である点Pe’に終点を自動的に変更する例である。
【0069】
ここで、時間幅Wは、予め決められた固定の時間範囲としてもよいし、ピーク幅の関数(例えばピーク幅の1/10=±1/20の範囲)で決まる値としてもとよい。また、時間幅W内で信号強度が最小である点を選択する代わりに、時間幅W内のクロマトグラム波形の平均値としたり、時間幅W内の最大値と最小値とから求まる中間値などとしたりしてもよい。また、時間幅W内のクロマトグラムデータに基づいて、本アルゴリズムとは異なる適宜の方法で算出されたベースライン値などを用いてもよい。
【0070】
上記実施例では、学習モデルを作成するためにディープラーニングの中のSSD法を用いていたが、本発明に利用可能なアルゴリズムはこれに限るものではない。また、ディープラーニングに限らず、それ以外の機械学習の手法を利用しても構わない。
【0071】
また、上記実施例は本発明に係る波形解析装置をLCやGCであるクロマトグラフ装置により得られるクロマトグラム波形に適用してピーク検出を行う例であるが、本発明はクロマトグラフ装置以外の様々な分析装置で得られる信号波形の処理に利用することができる。例えば、質量分析装置で得られるマススペクトル、吸光分光光度計や蛍光分光光度計などの各種の分光分析装置で得られる光学スペクトル、イオン移動度分析装置で得られるイオン移動度スペクトル、X線分析装置で得られるX線スペクトルなどに現れるピークの検出にも本発明を適用できることは明らかである。
【0072】
さらにまた、上記記載以外の点について、本発明の趣旨の範囲で適宜変形、修正、追加を行っても本願特許請求の範囲に包含されることは明らかである。
【符号の説明】
【0073】
1…液体クロマトグラフ(LC)システム
10…LC測定部
11…データ解析部
110…データ収集部
111…ピーク検出処理部
112…画像生成部
113…ピーク位置推定部
114…モデル記憶部
115…ピーク情報修正処理部
116…ピーク決定部
117…定性・定量解析部
12…操作部
13…表示部
2…モデル作成部
20…学習データ入力部
21…画像生成部
22…学習実行部
23…モデル構築部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10