(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023157085
(43)【公開日】2023-10-26
(54)【発明の名称】データ解析方法、データ解析装置、及び分析装置
(51)【国際特許分類】
G01N 27/62 20210101AFI20231019BHJP
G01N 35/00 20060101ALI20231019BHJP
G06T 7/00 20170101ALI20231019BHJP
【FI】
G01N27/62 B
G01N35/00 A
G06T7/00 350A
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2022066756
(22)【出願日】2022-04-14
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り https://neuroscience2021.jnss.org/index.html、https://neuroscience2021.jnss.org/systems.html、令和3年7月1日 〔刊行物等〕 第44回日本神経科学大会/CJK第1回国際会議、令和3年7月30日 〔刊行物等〕 一般社団法人日本医用マススペクトル学会、第46回日本医用マススペクトル学会年会 プログラム・抄録集、第89頁、令和3年8月25日 〔刊行物等〕第46回日本医用マススペクトル学会年会、令和3年9月17日
(71)【出願人】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(71)【出願人】
【識別番号】503092180
【氏名又は名称】学校法人関西学院
(74)【代理人】
【識別番号】110001069
【氏名又は名称】弁理士法人京都国際特許事務所
(72)【発明者】
【氏名】矢尾 育子
(72)【発明者】
【氏名】森田 夕月
(72)【発明者】
【氏名】山口 真一
【テーマコード(参考)】
2G041
2G058
5L096
【Fターム(参考)】
2G041CA01
2G041DA04
2G041EA04
2G041EA06
2G041GA08
2G041GA09
2G041GA10
2G058GD05
2G058GD07
5L096BA03
5L096BA18
5L096GA59
(57)【要約】 (修正有)
【課題】形状や大きさが相違する試料の間の差異解析を、面倒な画像変形処理を行うことなく自動的に実行するデータ解析方法、データ解析装置及び分析装置を提供する。
【解決手段】コンピューターを用いて複数の試料の間の差異に関連する目的情報を取得する機器分析用データ解析方法であって、複数のデータ群のそれぞれにおいて、一つのデータ群から得られるm次元(mは2以上n以下の整数)配列構造の信号値を含むデータに対してパーシステントホモロジー処理を行い、パーシステント図を作成する演算処理ステップS3と、複数のデータ群からそれぞれ得られたパーシステント図を比較し、比較対象のパーシステント図全体におけるプロットの分散状態の相違性及び/又は比較対象のパーシステント図上で位置の対応付けがとれないプロットについての情報に基いて、目的情報を求める解析処理ステップS4、S5、S7、S8と、を実行する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
複数の試料に対し所定の機器分析をそれぞれ行うことで得られた、信号値がn次元(nは2以上の整数)配列構造を有する複数のデータ群に基く解析をコンピューターを用いて行うことにより、前記複数の試料の間の差異に関連する目的情報を取得する機器分析用データ解析方法であって、
前記複数のデータ群のそれぞれにおいて、一つのデータ群から得られるm次元(mは2以上n以下の整数)配列構造の信号値を含むデータに対してパーシステントホモロジー処理を行い、パーシステント図を作成する演算処理ステップと、
前記複数のデータ群からそれぞれ得られたパーシステント図を比較し、比較対象のパーシステント図全体におけるプロットの分散状態の相違性、及び/又は該比較対象のパーシステント図上で位置の対応付けがとれないプロットについての情報に基いて、前記目的情報を求める解析処理ステップと、
を実行する機器分析用データ解析方法。
【請求項2】
前記機器分析は、質量分析又は光学的分析を利用したイメージング分析であり、n次元(但しnは3又は4)のうちの一つの次元は質量電荷比又は波長若しくは波数である第1のパラメーターであり、残りのn-1次元は試料における平面的な又は立体的な位置を示す情報である、請求項1に記載の機器分析用データ解析方法。
【請求項3】
前記演算処理ステップでは、前記第1のパラメーターの値毎にパーシステント図を作成し、前記解析処理ステップでは、複数の試料について前記第1のパラメーターの値が同じである複数のパーシステント図に基いて、該複数の試料の間で差異を示す第1のパラメーターの値を抽出する、請求項2に記載の機器分析用データ解析方法。
【請求項4】
前記複数の試料は、第1のグループに属する試料と、該第1のグループとは異なる特徴を有する第2のグループに属する試料と、を含み、前記複数のデータ群は、前記第1のグループに属する試料について同じ機器分析が2回以上実施されることで得られたデータ群を含み、
前記解析処理ステップでは、第1のパラメーターの値毎に、第1のグループに属する試料に対応する複数のデータ群に基いてそれぞれ作成されたパーシステント図の間で求まるボトルネック距離と、第1のグループに属する試料に対応するデータ群と第2のグループに属する試料に対応するデータ群とに基いてそれぞれ作成されたパーシステント図の間で求まるボトルネック距離との比較により、該第1のグループと該第2のグループとの間で差異を示す第1のパラメーターの値を抽出する、請求項3に記載の機器分析用データ解析方法。
【請求項5】
前記解析処理ステップでは、比較対象のパーシステント図上で位置の対応付けがとれないプロットに基く逆解析を行うことで、該プロットに対応する、試料における平面的な又は立体的な位置の情報を求める、請求項2~4のいずれか1項に記載の機器分析用データ解析方法。
【請求項6】
前記演算処理ステップの実行に先立って、各データ群からそれぞれ得られるm次元配列構造の信号値を含むデータに対し、該m次元のうちの少なくとも一つの次元の軸における単位長さに対応する数値範囲を調整するデータ調整処理ステップ、をさらに実行し、
該データ調整処理ステップによる処理実行後のデータに対して前記演算処理ステップによる処理を実行する、請求項2~4のいずれか1項に記載の機器分析用データ解析方法。
【請求項7】
複数の試料に対し所定の機器分析をそれぞれ行うことで得られた、信号値がn次元(nは2以上の整数)配列構造を有する複数のデータ群に基く解析を行うことにより、前記複数の試料の間の差異に関連する目的情報を取得する機器分析用データ解析装置であって、
前記複数のデータ群のそれぞれにおいて、一つのデータ群から得られるm次元(mは2以上n以下の整数)配列構造の信号値を含むデータに対してパーシステントホモロジー処理を行い、パーシステント図を作成する演算処理部と、
前記複数のデータ群からそれぞれ得られたパーシステント図を比較し、比較対象のパーシステント図全体におけるプロットの分散状態の相違性、及び/又は該比較対象のパーシステント図上で位置の対応付けがとれないプロットについての情報に基いて、前記目的情報を求める解析処理部と、
を備える機器分析用データ解析装置。
【請求項8】
前記機器分析は、質量分析又は光学的分析を利用したイメージング分析であり、n次元(但しnは3又は4)のうちの一つの次元は質量電荷比又は波長若しくは波数である第1のパラメーターであり、残りのn-1次元は試料における平面的な又は立体的な位置を示す情報である、請求項7に記載の機器分析用データ解析装置。
【請求項9】
前記演算処理部は、前記第1のパラメーターの値毎にパーシステント図を作成し、前記解析処理部は、複数の試料について前記第1のパラメーターの値が同じである複数のパーシステント図に基いて、該複数の試料の間で差異を示す第1のパラメーターの値を抽出する、請求項8に記載の機器分析用データ解析装置。
【請求項10】
前記複数の試料は、第1のグループに属する試料と、該第1のグループとは異なる特徴を有する第2のグループに属する試料と、を含み、前記複数のデータ群は、前記第1のグループに属する試料について同じ機器分析が2回以上実施されることで得られたデータ群を含み、
前記解析処理部は、第1のパラメーターの値毎に、第1のグループに属する試料に対応する複数のデータ群に基いてそれぞれ作成されたパーシステント図の間で求まるボトルネック距離と、第1のグループに属する試料に対応するデータ群と第2のグループに属する試料に対応するデータ群とに基いてそれぞれ作成されたパーシステント図の間で求まるボトルネック距離との比較により、該第1のグループと該第2のグループとの間で差異を示す第1のパラメーターの値を抽出する、請求項9に記載の機器分析用データ解析装置。
【請求項11】
前記解析処理部は、比較対象のパーシステント図上で位置の対応付けがとれないプロットに基く逆解析を行うことで、該プロットに対応する、試料における平面的な又は立体的な位置の情報を求める、請求項8~10のいずれか1項に記載の機器分析用データ解析装置。
【請求項12】
各データ群からそれぞれ得られるm次元配列構造の信号値を含むデータに対し、該m次元のうちの少なくとも一つの次元の軸における単位長さに対応する数値範囲を調整する調整処理部、をさらに備え、
前記演算処理部は、前記調整処理部による処理実行後のデータに対して処理を実行する、請求項8~10のいずれか1項に記載の機器分析用データ解析装置。
【請求項13】
請求項7に記載の機器分析用データ解析装置を用いた分析装置であって、
複数の試料に対し所定の機器分析をそれぞれ行うことで、信号値がn次元(nは2以上の整数)配列構造を有する複数のデータ群を取得する測定実行部、をさらに備える分析装置。
【請求項14】
前記測定実行部は、質量分析又は光学的分析を利用したイメージング分析を行うことにより、n次元(但しnは3又は4)のうちの一つの次元が質量電荷比又は波長若しくは波数である第1のパラメーターであり、残りのn-1次元が試料における平面的な又は立体的な位置を示す情報であるデータ群を取得する、請求項13に記載の分析装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機器分析用のデータ解析方法、データ解析装置、及び、該データ解析装置を用いた分析装置に関する。
【背景技術】
【0002】
質量分析装置の一つとして、特許文献1等に記載されているイメージング質量分析装置が知られている。イメージング質量分析装置は、マトリックス支援レーザー脱離イオン化(Matrix Assisted Laser Desorption/Ionization:MALDI)法等によるイオン源を搭載しており、生体組織切片などの試料の表面の微細な組織等の形態を光学顕微鏡によって観察しながら、その試料上の所望の2次元領域を細かく区切った微小領域毎に、所定の質量電荷比(m/z)範囲に亘るマススペクトルデータを収集することができる。
【0003】
また、イメージング質量分析の別の方法として、レーザーマイクロダイセクションと呼ばれる試料採取方法を利用することで、試料上の所望の2次元領域内における多数の微小領域からそれぞれ試料片を切り出し、各試料片から調製した液体試料をそれぞれ質量分析することで、微小領域毎のマススペクトルデータを取得する方法も知られている(特許文献2等参照)。
【0004】
上記いずれの方法でも、試料上の微小領域毎に得られたマススペクトルデータ(以下、一つの試料から得られたマススペクトルデータをまとめて「MSイメージングデータ」という場合がある)から、例えば特定の化合物に由来するイオンのm/z値における信号強度値を抽出し、試料上での各微小領域の位置に応じてその信号強度値を2次元的に配置した画像を作成することで、その特定の化合物の分布状況を示す画像(以下、この画像を「MSイメージング画像」又は単に「イメージング画像」という場合がある)が得られる。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第4973360号公報
【特許文献2】国際公開第2021/130840号
【非特許文献】
【0006】
【非特許文献1】平岡、大林、「パーシステントホモロジーの基礎と材料工学への適用例」、まてりあ(日本金属学会会報)、第58巻、第1号、2019年
【非特許文献2】福永、「パーシステント図に対する統計的機械学習」、[online]、[2022年2月24日検索]、中央大学統計数理研究所、インターネット<URL: https://www.math.chuo-u.ac.jp/ENCwMATH/EwM70_Fukumizu.pdf>
【非特許文献3】Xiyu Ouyanga、ほか5名、「Comprehensive two-dimensional liquid chromatography coupled tohigh resolution time of flight mass spectrometry for chemical characterization of sewage treatment plant effluents」、Journal of Chromatography A、1380、2015年、pp.139-145
【非特許文献4】Nikita Prianichnikov、ほか7名、「MaxQuant Software for Ion Mobility Enhanced Shotgun Proteomics」、Molecular & Cellular Proteomics 19、2020年、pp.1058-1069
【発明の概要】
【発明が解決しようとする課題】
【0007】
イメージング質量分析装置を用いた解析では、例えば、同種の実験動物における正常体である臓器から採取された切片試料と病変体である同じ臓器から採取された切片試料とを比較して差異を調べる、つまり差異解析を行うことがしばしばある。異なる個体由来の試料同士を比較する場合、同じ臓器から採取された切片試料であっても、多くの場合、大きさや形状が一致するわけではない。また、同じ臓器にあって異なる位置から採取された切片試料同士を比較することもあるが、位置が相違すれば大きさや形状が異なることが多い。このように大きさや形状が相違する複数の切片試料を測定することで得られたMSイメージング画像同士を比較する場合、解析担当者が目視で比較して評価するか、或いは、特許文献1に記載されているように、一方又は両方のMSイメージング画像に対し大きさや形状を一致させるような画像変形処理を実施したうえで両画像の間で同じ位置毎の差異を調べるような解析を行っている。
【0008】
しかしながら、MSイメージング画像はm/z値毎に得られるため、一般にその画像の数は膨大である。そのため、解析担当者がm/z値毎に複数のMSイメージング画像を目視で比較するのはかなり困難であるし、担当者にとって負担が大きい。また、目視による解析作業の精度は担当者の技量や経験等に依存するため、作業に当たれる担当者は限られる。また、担当者による結果のばらつきが避けられず、定量的な結果の評価は困難である。
【0009】
一方、大きさや形状を変形させる画像変形処理を実施したうえで差異解析を行う場合でも、膨大な数の画像を変形させる処理を行う必要があるため、作業にかなりの手間と時間が掛かる。また、画像変形処理によって試料の輪郭の形状を合わせることができたとしても、生体の内部構造の細部に亘って画像内での位置を正確に合わせることは非常に難しい。そのため、多大な時間と手間を掛けたとしても、十分な精度や信頼性を以て差異解析を行うことは困難である。
【0010】
こうしたことから、複数の試料からそれぞれ得られたMSイメージング画像を比較するような解析を効率良く行うことは現状では難しく、特に、複数の画像の間での比較対象の部位の位置の相違の影響を実質的に受けずに、そうした複数の画像の間での差異解析を効率的に且つ高い精度で行う手法の確立が強く要望されている。
【0011】
勿論、こうした問題は、イメージング質量分析装置におけるデータ解析に限らず、ラマン分光法、フーリエ変換赤外分光(Fourier Transform Infrared Spectroscopy:FTIR)法などの光学的手法を用いたイメージング分析においても同様である。
【0012】
本発明は上記課題を解決するためになされたものであり、その一つの目的は、例えば大きさや形状が相違する試料からそれぞれ得られたMSイメージング画像に対して大きさや形状を揃えるような画像変形処理を行うことなく、また担当者が目視でMSイメージング画像を比較するような作業を行うことなく、試料間の差異等の解析を効率良く実施することができるデータ解析方法、データ解析装置、及びそうしたデータ解析装置を用いた分析装置を提供することである。
【課題を解決するための手段】
【0013】
上記課題を解決するためになされた本発明に係る機器分析用データ解析方法の一態様は、複数の試料に対し所定の機器分析をそれぞれ行うことで得られた、信号値がn次元(nは2以上の整数)配列構造を有する複数のデータ群に基く解析をコンピューターを用いて行うことにより、前記複数の試料の間の差異に関連する目的情報を取得する機器分析用データ解析方法であって、
前記複数のデータ群のそれぞれにおいて、一つのデータ群から得られるm次元(mは2以上n以下の整数)配列構造の信号値を含むデータに対してパーシステントホモロジー処理を行い、パーシステント図を作成する演算処理ステップと、
前記複数のデータ群からそれぞれ得られたパーシステント図を比較し、比較対象のパーシステント図全体におけるプロットの分散状態の相違性、及び/又は該比較対象のパーシステント図上で位置の対応付けがとれないプロットについての情報に基いて、前記目的情報を求める解析処理ステップと、
を実行するものである。
【0014】
また上記課題を解決するためになされた本発明に係るデータ解析装置の一態様は、複数の試料に対し所定の機器分析をそれぞれ行うことで得られた、信号値がn次元(nは2以上の整数)配列構造を有する複数のデータ群に基く解析を行うことにより、前記複数の試料の間の差異に関連する目的情報を取得する機器分析用データ解析装置であって、
前記複数のデータ群のそれぞれにおいて、一つのデータ群から得られるm次元(mは2以上n以下の整数)配列構造の信号値を含むデータに対してパーシステントホモロジー処理を行い、パーシステント図を作成する演算処理部と、
前記複数のデータ群からそれぞれ得られたパーシステント図を比較し、比較対象のパーシステント図全体におけるプロットの分散状態の相違性、及び/又は該比較対象のパーシステント図上で位置の対応付けがとれないプロットについての情報に基いて、前記目的情報を求める解析処理部と、
を備えるものである。
【0015】
また上記課題を解決するためになされた本発明に係る分析装置の一態様は、本発明に係る機器分析用データ解析装置の上記態様を用いた分析装置であって、
複数の試料に対し所定の機器分析をそれぞれ行うことで、信号値がn次元(nは2以上の整数)配列構造を有する複数のデータ群を取得する測定実行部、をさらに備えるものである。
【発明の効果】
【0016】
上記MSイメージングデータはn次元配列構造を有するデータ群の一例である。その場合、n=3であり、3次元のうちの2次元が試料上の互いに異なる方向の位置情報であって、残りの1次元はm/z値の情報である。
【0017】
詳しくは後述するが、位相的データ解析の一手法であるパーシステントホモロジーは、2次元又は3次元な画像における構造的な要素に着目して特徴量を抽出する手法であり、その特徴量は画像内のオブジェクトの位置や向きなどの影響を殆ど受けない。これにより、本発明の上記各態様によれば、例えば大きさや形状が相違する試料からそれぞれ得られたMSイメージング画像に対して、試料の大きさや形状を揃えるような画像変形処理を行うことなく、また担当者が目視でMSイメージング画像を比較するような作業を行うことなく、試料間で分布状況の差異が大きい化合物の特定、或いは、特定の化合物の存在量に差異がある部位の抽出といった、試料間の差異に関する解析を効率良く且つ十分な精度で実施することができる。
【図面の簡単な説明】
【0018】
【
図1】本発明に係る分析装置の一実施形態であるイメージング質量分析装置の概略構成図。
【
図2】本実施形態のイメージング質量分析装置における解析処理の手順の一例を示すフローチャート。
【
図3】本実施形態のイメージング質量分析装置において取得されるデータとパーシステント図との関係を示す模式図。
【
図4】形状の異なる二つの試料に対するMSイメージング画像(A1)及び(B1)とそれら画像から求まるパーシステント図(A2)及び(B2)の一例を示す図。
【
図5】m/z値毎のボトルネック距離の計算例を示す図。
【
図6】野生型(WT)試料と遺伝子改変型(KO)試料に対するMSイメージング画像(A1)及び(B1)とそれら画像から求まるパーシステント図(A2)及び(B2)の一例を示す図。
【
図7】野生型(WT)試料と遺伝子改変型(KO)試料に対するMSイメージング画像(A1)及び(B1)、それらに対応するパーシステント図上のプロットの対応付け状況を示す図(C)、並びに、パーシステント図上で対応つけられないプロットに基く逆解析により得られる特徴的な部位を示すイメージング画像(D)の一例を示す図。
【
図8】本発明に係る分析装置の一変形例におけるデータ処理部の概略ブロック構成図。
【発明を実施するための形態】
【0019】
[上記態様の例示]
本発明の上記態様において、所定の機器分析とは、試料に対する分析(又は計測若しくは測定)の結果として「信号値がn次元配列構造を有する」データ群を取得することが可能である手法であればよい。
【0020】
ここで「信号値」とは、分析により得られた信号強度値であるのは勿論のこと、信号強度値から各種の演算により求まったデータ値でもよい。従って、信号値は、例えば信号強度値を補正した補正値のほか、濃度値や含有量などの定量値であってもよい。
【0021】
また、「信号値がn次元配列構造を有する」とは、それぞれ所定の数値範囲の変数であるn種類のパラメーターに対する信号値であることを意味する。そのパラメーターとしては機器分析の手法に応じて、例えば、位置、時間、波長、波数、質量電荷比、エネルギー、電圧、電流、温度などを含む様々なものが考え得る。
【0022】
例えば、機器分析の手法がイメージング質量分析である場合、nは3であり、3次元のうちの2次元が試料上の互いに異なる方向の位置情報であり、残りの1次元はm/z値の情報である。但し、立体的な試料の内部の3次元的な微小位置におけるマススペクトルデータを扱う場合には、nは4であり、4次元のうちの3次元が試料中の互いに異なる3方向の位置情報であり、残りの1次元がm/z値の情報である。
【0023】
機器分析の手法がラマン分光イメージングやFTIRイメージングである場合、nは3であり、3次元のうちの2次元が試料上の互いに異なる方向の位置情報であり、残りの1次元は波長又は波数の情報である。
【0024】
機器分析の手法が液体クロマトグラフ質量分析やガスクロマトグラフ質量分析などのクロマトグラフ質量分析である場合、nは2であり、2次元のうちの1次元は時間、他の1次元はm/z値の情報である。
【0025】
機器分析の手法が例えば非特許文献3に記載されているような包括的2次元クロマトグラフ(GC×GC又はLC×LC)である場合には、nは2であり、その2次元はいずれも時間の情報である。
【0026】
機器分析の手法が非特許文献4に記載されているような液体クロマトグラフ-イオン移動度質量分析(LC-IMS-MS)である場合には、nは3であり、その3次元のうちの1次元は時間、他の1次元はイオン移動度、残りの1次元はm/z値の情報である。
【0027】
また、ここでいう「複数の試料」とは、当然、それぞれ異なる個体である試料を意味する場合もあれば、同じ個体において異なる部位から取り出した試料である場合もある。また、或る一つの試料に由来し、異なる処理や加工を行うことで異なる物理的又は化学的性質を有するに至った試料である場合もあり得る。
【0028】
[一実施形態の装置の構成及び動作]
本発明に係る機器分析用データ解析方法、機器分析用データ解析装置、及び分析装置の実施形態について以下に説明する。
ここでは、分析装置としてイメージング質量分析装置を例に挙げて説明するが、それ以外の分析装置にも拡張可能であることは後述する。
【0029】
図1は、本実施形態のイメージング質量分析装置の概略ブロック構成図である。
図1に示すように、このイメージング質量分析装置は、イメージング質量分析部1、データ処理部2、操作部3、及び表示部4、を含む。
【0030】
イメージング質量分析部1としては例えば、特許文献1に開示されているような大気圧MALDIイオントラップ飛行時間型質量分析装置を用いることができるが、イオン化法や質量分離の手法はそれに限らない。また、イメージング質量分析部1は、特許文献2に開示されているような、レーザーマイクロダイセクション装置と、該装置によって試料から採取された微細な試料片から調製された試料を質量分析する質量分析装置とを組み合わせた装置であってもよい。
【0031】
データ処理部2は、機能ブロックとして、データ格納部20、イメージング画像作成部21、パーシステントホモロジー処理部22、ボトルネック距離算出部23、m/z値絞込部24、特異的プロット抽出部25、逆解析処理部26、及び表示処理部27、を含む。このデータ処理部2は、本発明におけるデータ解析装置に相当するものであり、且つ本発明におけるデータ解析方法を実施するものである。
【0032】
本実施形態のイメージング質量分析装置において、データ処理部2は、CPU、RAM、ROMなどを含んで構成されるパーソナルコンピューター(又はより高性能なコンピューター)をハードウェア資源とし、該コンピューターにインストールされたデータ処理ソフトウェア(コンピュータープログラム)を該コンピューター上で実行することによりその機能の少なくとも一部を実現する構成とすることができる。この場合、操作部3はコンピューターに付設されたキーボードやポインティングデバイス(マウスなど)であり、表示部4はディスプレイモニターである。
【0033】
上記コンピュータープログラムは、例えば、CD-ROM、DVD-ROM、メモリーカード、USBメモリー(ドングル)などの、コンピューターが読み取り可能である非一時的な記憶媒体に格納されてユーザーに提供されるものとすることができる。また、上記プログラムは、インターネットなどの通信回線を介したデータ転送の形式で、ユーザーに提供されるようにすることもできる。さらにまた、上記プログラムは、ユーザーがシステムを購入する時点で、システムの一部であるコンピューター(厳密にはコンピューターの一部である記憶装置)にプリインストールしておくこともできる。
【0034】
上記コンピュータープログラムはその全体が一つにパッケージ化されたソフトウェアであってもよいが、複数のソフトウェアから成るものでもよく、その場合、一部は既存つまりは一般に有償又は無償で入手可能であるソフトウェアを利用したものでもよい。
【0035】
本実施形態のイメージング質量分析装置における特徴的な解析について、
図2等を参照して説明する。
図2は、本実施形態のイメージング質量分析装置における解析処理の手順の一例を示すフローチャートである。
ここでは、野生型(以下「WT」と記す場合がある)と遺伝子改変型(以下「KO」と記す場合がある)という2種類の実験動物の生体組織切片を試料として、その両者を比較する差異解析を例として挙げる。
【0036】
測定対象の試料はユーザーにより試料プレート上に載せられ、その表面にMALDI用のマトリックスが塗布(又は蒸着)されてイメージング質量分析部1の所定位置にセットされる。イメージング質量分析部1は、試料上の2次元的な拡がりを有する所定の測定領域を格子状に細かく区切った微小領域毎にそれぞれ質量分析を実行し、所定のm/z値範囲に亘るマススペクトルデータを取得する(ステップS1)。
【0037】
具体的に言うと、イメージング質量分析部1では、試料上の測定領域内の一つの微小領域にレーザー光を短時間照射し、その微小領域に存在する種々の化合物由来のイオンを発生させる。発生した各種イオンはイオントラップに一旦保持され、所定のタイミングで飛行時間型質量分離器に送り込まれ、m/z値に応じて分離されたうえで検出される。イメージング質量分析部1は、試料上でレーザー光の照射位置が少しずつずれるように該試料をステップ状に移動させながら上記質量分析動作を繰り返し行うことで、測定領域内に設定された全ての微小領域におけるマススペクトルデータ(MSイメージングデータ)を収集する。
【0038】
一つの試料についての測定が終了すると、ユーザーにより試料が交換される。イメージング質量分析部1は、上記と同様の手順で、新たな試料上の所定の測定領域についてのMSイメージングデータを収集する。用意された全ての試料についてこうした測定が実行される。試料毎に収集された各微小領域におけるマススペクトルデータ、即ち測定領域全体についてのMSイメージングデータは、イメージング質量分析部1からデータ処理部2に送られ、データ格納部20に格納される。一つの試料に対するMSイメージングデータは、
図3(A)に示すように、試料上の互いに直交するx方向及びy方向それぞれの位置の情報とm/z値とをパラメーターとする3次元配列構造の信号値データである。即ち、この例において、一つの試料に対するMSイメージングデータは、本発明における信号値がn次元配列構造を有するデータ群に相当する。但し、ここでは、2種類の試料のうち、WT試料に対しては2回の測定(イメージング質量分析)を行い、それぞれMSイメージングデータを収集する。その理由は後述する。
【0039】
なお、イメージング質量分析部1では通常の質量分析ではなく、特定のm/z値を有する又はm/z値範囲に含まれるイオンをプリカーサーイオンとしたMS/MS分析やnが3以上のMSn分析を行ってプロダクトイオンスペクトルデータを取得してもよい。その場合でも、収集されるデータは3次元配列構造の信号値データである。
【0040】
適宜の時点で、ユーザーにより操作部3から解析の実行が指示されると、パーシステントホモロジー処理部22は、処理対象である複数の試料に対してそれぞれ得られたMSイメージングデータをデータ格納部20から取得する。そして、まず、データ前処理としてデータの規格化処理を実行する(ステップS2)。
【0041】
MALDIイオン源では、試料表面のマトリックスの形成状況によってイオン生成効率に差異が生じ易く、それによってイオンの検出感度に差異が生じることがある。そこで、ここでは、試料毎に、測定領域全体に亘ってほぼ均一に検出されると想定される、マトリックス由来の化合物に対応するm/z値におけるイオンの強度を基準とし、他のm/z値におけるイオンの強度を正規化する処理を実行する。この基準として用いるm/z値は事前に設定しておくこともできるし、測定実施後に決めることができるようにしてもよい。データの規格化を行うことにより、試料毎のイオン強度のばらつきの影響を軽減することができる。なお、例えば試料へのマトリックス付着の再現性が高い場合など、試料毎のイオン強度のばらつきの影響が無視できる程度である場合には、ステップS2の処理は省くことができる。
【0042】
次いで、パーシステントホモロジー処理部22は、試料毎に、各m/z値におけるMSイメージング画像を構成するデータに対してパーシステントホモロジー処理を実行し、パーシステント図を求める(ステップS3)。
【0043】
パーシステントホモロジーは位相的データ解析の一つであり、非特許文献1、2等を始めとする種々の文献において詳しく説明されている。また、パーシステントホモロジーの計算を行うコンピュータープログラムも数多く知られており容易に入手可能である。従って、ここではその詳しい説明は省略するが、簡単に言うと、パーシステントホモロジーは、2次元空間又は3次元空間内における図形の連結部分、孔、空隙などの構造的な要素に着目してデータの形の情報を定量的に特徴量として抽出する手法である。ここでは、一つのMSイメージング画像を構成する2次元配列構造のデータに対するパーシステントホモロジー処理により、孔の発生半径(又は時間)と孔の消失半径(又は時間)とをそれぞれ軸とする、一つのパーシステント図を作成する。
【0044】
図4は、切片の形状が異なる二つのWT試料に対する同じm/z値(m/z 702.5)におけるMSイメージング画像(A1)、(B1)とそれらMSイメージング画像を構成するデータから算出されたパーシステント図(A2)、(B2)の一例を示す図である。通常、パーシステント図上の1個のプロットは、MSイメージング画像上の一つのデータ点(画素)に対応している。
【0045】
図4(A1)、(B1)を見れば分かるように、元の切片試料の形状はかなり相違しているものの、
図4(A2)、(B2)に示すように、パーシステント図におけるプロットの分散状態はかなり類似している。ここで、二つのパーシステント図におけるプロットの分散状態の類似性を表す指標として、次の(1)式で求まる類似度Pを用いる。
P=1/(1+d
B) …(1)
但し、d
Bは、後述する(2)式に基いて比較対象である二つのパーシステント図におけるペアとなるプロットに基いて算出されるボトルネック距離である。
【0046】
(1)式による類似度Pは、比較対象である二つのパーシステント図が完全に一致する場合に1であり、それらの類似性が高いほど1に近い値を示す。
図4(A1)、(B1)に示したパーシステント図の類似度は0.9以上であり、それらの類似性はかなり高いということができる。
図4の例以外にも、多くの切片試料について同様の比較を行ったが、多くのケースで類似度は0.8以上である。このことから、パーシステント図は、元の切片の形状の差異の影響を実質的に受けずに、試料上のイオンの分布状況つまりは化合物の分布状況を高い精度で表していると解釈することができる。
【0047】
ステップS3では、解析対象の全ての試料について、一つのm/z値におけるMSイメージング画像毎にそれぞれパーシステント図が得られる。
図3に示すように、一つの試料に対してN個のm/z値におけるMSイメージング画像が存在する場合、得られるパーシステント図の数もNである。多くの場合、一つの試料当たり、数百~数千程度の数のm/z値におけるMSイメージング画像が得られるから、作成されるパーシステント図の数も膨大である。
【0048】
次いで、ボトルネック距離算出部23は、膨大な数のm/z値の中から、WT試料とKO試料との間で特徴的な変化が生じている可能性があるm/z値の候補を抽出するために、各m/z値に対応する複数のパーシステント図の間のボトルネック距離を計算する(ステップS4)。
【0049】
ボトルネック距離は、非特許文献2に記載されているように、二つのパーシステント図の間の距離としてよく知られている指標値の一つであり、次の(2)式で表される。
【数1】
【0050】
(2)式は次のような技術的意味を持つ。まず、二つのパーシステント図の間のプロット又はそれぞれのパーシステント図中のプロットから、y=xである直線に対して垂線を描いた際の該直線との交点の座標をそれぞれ写像ηによって対応付け、そのときのx座標又はy座標の差の上限値をそれぞれの対応付けパターン毎に算出する。そして、その上限値の下限を見つけることで、各対応付けパターンの中で最も適した対応付けパターンを検出する。そのときの値がボトルネック距離である。実際には、ボトルネック距離は、例えばpythonライブラリの一つであるGUDHI(https://gudhi.inria.fr)などの既存のソフトウェアを用いて計算することができるため、その実装は容易である。
【0051】
二つのパーシステント図のプロットの分散状況が異なるほどボトルネック距離は大きい。そこで、m/z値絞込部24は、パーシステント図のペア毎に算出されたボトルネック距離を利用して、膨大な数のm/z値の中からWT試料とKO試料との間の差異解析に有意である可能性のあるm/z値を抽出する(ステップS5)。
【0052】
但し、単に、WT試料に対するパーシステント図とKO試料に対するパーシステント図の間で求まったボトルネック距離を比較しても、その大小の評価は難しい。何故なら、同じ試料に対する測定毎のばらつき(再現性)の影響があるためである。そこで、本実施形態では、WT試料に対する2回の測定によりそれぞれ得られたMSイメージングデータから作成される二つのパーシステント図同士のボトルネック距離と、WT試料に対する一つのパーシステント図とKO試料に対する一つのパーシステント図との間のボトルネック距離をそれぞれ計算し、その両者を比較して、後者が前者よりも所定の閾値以上大きいm/z値を、KO試料における変化が大きなm/z値の候補として抽出する。
【0053】
また、m/z値絞込部24は、ステップS5で絞り込まれたあとのm/z値のMSイメージングデータに基いてイメージング画像作成部21で作成されたMSイメージング画像を利用して、更なるm/z値の絞込みを行う(ステップS6)。具体的には、MSイメージング画像と必要に応じて光学顕微鏡画像とに基いて、実質的に試料(生体組織)が存在せず、主としてマトリックス由来のイオン強度のみが捉えられているMSイメージング画像があるか否かを判定し、そうしたMSイメージング画像があった場合にはそれに対応するm/z値を候補から除外する処理を実行することができる。なお、このステップS6の処理は省略することができる。
【0054】
以上のステップS6までの処理によって、膨大な数のm/z値の中から、WT試料とKO試料との間で化合物の分布に明確な差異がある可能性が高いm/z値の候補を抽出することができる。以下、WT試料とKO試料との間で化合物の分布に明確な差異がある試料上の部位を、MSイメージング画像において可視化する処理を行う。
【0055】
即ち、特異的プロット抽出部25は、抽出された候補のm/z値毎に、比較対象の二つのパーシステント図、つまりはWT試料に対するパーシステント図とKO試料に対するパーシステント図とを縦、横の軸が共に揃うように重ね合わせる。そして、各パーシステント図においてそれぞれ最も近いプロット同士について一対一で対応付けることでプロットのペアを作成し、ペアが作成できなかったプロットを、WT試料又はKO試料に特有の特異的プロットとして抽出する(ステップS7)。
【0056】
上述したようにパーシステント図を重ね合わせる場合には、一般に、パーシステント図上でbirth値及びdeath値の差が大きなプロットが重要な性質を示していると考えるのが妥当である。そこで、逆解析処理部26は、ステップS7において抽出された特異的プロットの全て又はその中でbirth値とdeath値との差が所定値以上であるとして選択されたプロットについて、パーシステントホモロジー処理に関する逆解析を実行する。
この逆解析では、パーシステント図上におけるプロットに対応する、MSイメージング画像上の部位(微小領域)を求めることができる。従って、逆解析により、WT試料に対するパーシステント図上の特異的プロットに対応するMSイメージング画像上の部位と、KO試料に対するパーシステント図上の特異的プロットに対応するMSイメージング画像上の部位とをそれぞれ特定することができる(ステップS8)。
【0057】
表示処理部27は、ステップS5、S6で抽出された特徴的なm/z値の候補におけるMSイメージング画像と、ステップS8において特定された試料上の部位を示す逆解析画像とを含む解析結果を、表示部4の画面上に表示する(ステップS9)。この解析結果により、ユーザーは、WT試料とKO試料との間で化合物の分布に明確な差異があるm/z値における強度分布画像と、その中で特徴的な差異を示す試料上の部位とを確認することができる。勿論、解析結果として、各MSイメージング画像に対応するパーシステント図や同m/z値で重ね合わされたパーシステント図などを併せて表示してもよい。
【0058】
また、場合によっては、差異解析に有用なm/z値のみを表示すれば十分であることもあり、その場合には、表示処理部27は、ステップS5、S6において比較対象の試料の間で特徴的な差異があるm/z値の候補が得られた段階で、そのm/z値を表示部4に一覧表示するようにしてもよい。
【0059】
[実測例]
上述した解析手法に従った実測例を示す。
この実測では、切片試料はマウスの脳の切片であり、KO試料は、シナプス伝達の調整に関与するタンパク質の一つであるSCRAPPERをノックアウトした、いわゆるScrapper-KO(以下「SCR-KO」と記す)マウスである。SCR-KOでは脳内において過剰な神経伝達物質の放出が誘導されるため、多くの個体では致死性を示し、生き残った個体においても神経変性などが引き起こされていることが知られている。
【0060】
イメージング質量分析の主要な条件は次の通りである。
・マトリックス:9-アミノアクリジン(9-Aminoacridine)
・イオン化モード:負イオン化モード
・m/z範囲:m/z 600-1000
【0061】
SCR-KOマウスとWTマウスそれぞれから得られた脳の切片試料に対してイメージング質量分析を行ったところ、14744個のm/z値に対するMSイメージングデータが得られた。既に説明した
図4に示したMSイメージング画像は、こうして得られたMSイメージングデータの一部により作成された画像である。こうして取得されたMSイメージングデータに対して上述したようにパーシステントホモロジー処理を実行し、それによって得られたパーシステント図間のボトルネック距離を上述した手順で求めた。
【0062】
図5は、SCR-KOマウスとWTマウスとのペア(KO-WTペア)におけるパーシステント図の間のボトルネック距離と、WTマウスとWTマウスとのペア(WT-WTペア:但し、これは同じWTマウスに対する2回の測定結果)におけるパーシステント図の間のボトルネック距離との差を、m/z値毎の棒グラフで表した図である。このボトルネック距離の差が大きなm/z値が特徴的なm/z値である可能性が高い。そこで、この中から、KO-WTペアのボトルネック距離がWT-WTペアよりも300以上大きく、且つ、試料プレート上のマトリックス部分からではなく脳切片試料上からイオン強度が取得できているm/z値を候補と抽出した。その結果、50個のm/z値を候補として絞り込むことができた。
【0063】
図6は、こうして抽出されたm/z値の一つである、m/z 863.6のMSイメージング画像とそれに対応するパーシステント図である。これは、SCR-KOによって、主としてマウスの中脳、橋、延髄、視床下部、大脳皮質、嗅球付近において化合物の増加が生じているケースの例である。
【0064】
図6(A1)と(B1)のMSイメージング画像を比較すると、SCR-KOマウスはWTマウスに比べて、中脳、橋、延髄小脳、大脳皮質、嗅球付近の輝度がかなり高くなっており、3000以上の輝度値を示す領域が顕著に増加している。その変化は、
図6(A2)、(B2)に示すパーシステント図のプロットに反映されており、WTマウスに対するパーシステント図ではbirth値3000以上のプロットが殆ど存在しないのに対し、SCR-KOマウスに対するパーシステント図では、birth値が3000以上であるプロットがWTマウスに対するパーシステント図に比べてかなり増加していることが分かる。
【0065】
図7は、
図6に示したパーシステント図に基く逆解析の結果であり、
図7(A)、(B)は
図6(A1)、(B1)と同じである。
図7(C)は、
図6(A2)、(B2)に示したパーシステント図の重ね合わせ及びプロットの対応付けの結果を示す図である。
図7(C)では、WTマウスに対するパーシステント図とSCR-KOマウスに対するパーシステント図とで一致している(対応付けが可能である)プロット、WTマウスに対するパーシステント図のみに存在するプロット、及びSCR-KOマウスに対するパーシステント図のみに存在するプロットの3種類を、それぞれプロットの色を変えて描画している。
図7(D)は、SCR-KOマウスに対するパーシステント図からWTマウスに対するパーシステント図を差し引いて、残ったプロットのみに対して逆解析を行うことにより得られた微小領域を高い輝度の点で示したイメージング画像である。これらの部位の試料上での位置を追跡すると、中脳、橋、延髄、視床下部、大脳皮質、嗅球、小脳付近に位置していることが確認できた。
【0066】
以上の実測結果から、質量電荷比がm/z 863.6である化合物分子は、SCR-KOによってその存在量が顕著に増加し、その変化は特に中脳、橋、延髄、視床下部、大脳皮質、嗅球、小脳付近にて強く現れると推定することができる。
【0067】
このようにして本実施形態のイメージング質量分析装置によれば、イメージング質量分析により収集された膨大な量のデータの中から、比較対象の試料の差異に関連して特徴的なm/z値を抽出することができ、そのm/z値を持つ化合物が顕著に増加又は減少する試料中の部位を特定することができる。特に、切片試料の形状や大きさが相違する場合であっても、その相違の影響を実質的に受けることなく、上述したような差異解析が可能である。
【0068】
[変形例1]
上記実施形態は、
図3(A)に示したように、2次元的な拡がりを有する試料上のx方向及びy方向それぞれの位置をパラメーターとする2次元配列構造の信号値データにパーシステントホモロジー処理を適用し、パーシステント図を作成していたが、立体的な試料において互いに直交するx、y、zの3方向の位置をパラメーターとする3次元配列構造の信号値データにパーシステントホモロジー処理を適用することもできる。こうした信号値データは、立体的な試料をz方向に薄くスライスすることで多数の切片試料を作成し、その多数の切片試料に対してそれぞれ上述したようなイメージング質量分析を実行することにより取得することができる。
【0069】
[変形例2]
また、上記実施形態は本発明をイメージング質量分析に適用した例であるが、試料上の2次元的な測定領域内の微小領域毎に、又は立体的な試料中の3次元的な測定範囲内の微小単位毎に、例えば光学的な測定を実施して信号値データを取得するような装置全般に本発明を適用できることは明らかである。具体的には、ラマン分光イメージング法、FTIRイメージング法などでは微小領域又は微小単位毎に波長(又は波数)毎の信号値データが得られるから、こうした手法による装置に本発明を適用することは想到容易である。この場合、測定により得られる信号値データは、試料のx及びy方向又はx、y及びz方向のそれぞれの位置と波長又は波数をパラメーターとする3次元配列構造又は4次元配列構造であり、波長毎又は波数毎の2次元配列構造又は3次元配列構造の信号値データにパーシステントホモロジー処理を適用する。
【0070】
また、n次元配列構造の信号値データのパラメーターは、これまで述べた位置情報、m/z値、波長(又は波数)に限らない。例えば、時間、エネルギー値、電圧値、電流値、温度、圧力など、機器分析の際に変数として採用し得るものであれば、パラメーターの種類に制限はない。
【0071】
[変形例3]
例えば、検出器としてフォトダイオード検出器や波長走査可能な紫外可視分光光度計などを用いた液体クロマトグラフでは、時間と波長をパラメーターとする2次元配列構造の信号値データが得られる。従って、この信号値データに対してパーシステントホモロジー処理を適用してパーシステント図を作成し、異なる試料からそれぞれ得られたパーシステント図を比較することで、複数の試料についての差異解析を行うことができる。
【0072】
[変形例4]
また、液体クロマトグラフ質量分析装置やガスクロマトグラフ質量分析装置等のクロマトグラフ質量分析装置では、時間とm/z値をパラメーターとする2次元配列構造の信号値データが得られる。従って、この信号値データに対してパーシステントホモロジー処理を適用してパーシステント図を作成し、異なる試料からそれぞれ得られたパーシステント図を比較することで、複数の試料についての差異解析を行うことができる。
【0073】
[変形例5]
また、包括的2次元液体クロマトグラフや包括的2次元ガスクロマトグラフでは、例えば非特許文献3のFig.1、2に開示されているような、1次元方向の時間と2次元方向の時間をパラメーターとする2次元配列構造の信号値データが得られる。
従って、この信号値データに対してパーシステントホモロジー処理を適用してパーシステント図を作成し、異なる試料からそれぞれ得られたパーシステント図を比較することで、複数の試料についての差異解析を行うことができる。
【0074】
[変形例6]
また、液体クロマトグラフやガスクロマトグラフとイオン移動度質量分析装置とを組み合わせた装置では、時間、イオン移動度、m/z値の三つのパラメーターに対する信号値を示す3次元配列構造の信号値データが得られるから、これに基いて、例えば非特許文献4のFig.1に開示されているような、1次元方向の時間と2次元方向のm/z値をパラメーターとする2次元配列構造の信号値データを、イオン移動度毎に得ることができる。また、1次元方向の時間と2次元方向のイオン移動度をパラメーターとする2次元配列構造の信号値データを、m/z値毎に得ることもできる。従って、こうした信号値データに対してパーシステントホモロジー処理を適用してパーシステント図を作成し、異なる試料からそれぞれ得られたパーシステント図を比較することで、複数の試料の間で特徴的な差異を示すイオン移動度やm/z値を抽出したり、それらにおける試料間での差異解析を行ったりすることができる。
【0075】
[変形例における利点]
イメージング質量分析やそのほかの光学的なイメージング分析法においては、上述したように、生体組織切片などの試料の差異解析を行う際に、画像上で試料の形状や大きさを揃えるための画像変形処理を行う必要がないという利点がある。一方、上記変形例3~6の場合、イメージング分析法ではないものの、実質的にイメージング分析法と同様の利点がある。
【0076】
即ち、上記変形例3~6ではクロマトグラフにおける分離方向である時間(保持時間)をパラメーターとして含むが、この時間はm/z値のような化合物に固有の値ではなく、特定の条件の下での値である。具体的には、カラムの種類は勿論のこと、移動相の流量(流速)、温度、移動相の種類などの種々の分離条件によって、保持時間は変動する。そのため、仮に同一分離条件の下で複数の試料に対する分析を実行した場合であっても、例えば移動相の流量の変動やばらつきなどによって試料毎に保持時間がずれることはしばしば起こる。従来は、例えば非特許文献3に記載されているようなアライメントの手法によって保持時間のずれを修正したうえで、異なる試料の比較を行う必要があった。
【0077】
上記保持時間ずれは、時間を一つの次元とする2次元配置構造の信号値データをグラフ化したヒートマップや等高線図等においてはイメージング分析法における試料の形状の相違と同等である。そのため、本発明のデータ解析方法を利用すれば、こうした保持時間ずれなどに起因する同一化合物由来の信号値の位置のずれを修正することなく、複数の試料の間の差異や類似性に関する解析を行うことができる。
【0078】
[処理対象の画像における軸の補正]
通常のイメージング分析法では、試料上の測定領域内の2次元方向(
図3(A)におけるx方向及びy方向)の軸は位置又は長さを示しており、両軸の数値精度は同じ又はほぼ同程度である。従って、分析により得られたMSイメージング画像データ等をそのまま対象としてパーシステントホモロジー処理を適用することができる。これに対し、分析の種類によっては、パーシステントホモロジー処理を適用したい対象の画像データの二つの軸の数値精度が大きく相違する場合がある。例えば、包括的2次元液体クロマトグラフ等では二つの軸はいずれも時間であるが、1次元目のカラムと2次元目のカラムとでは分離の安定性等が異なる場合がしばしばあり、それによって両方の保持時間の数値精度に差が生じることがある。また、クロマトグラフ質量分析やクロマトグラフ-イオン移動度質量分析などの場合、二つの軸のパラメーターの種類が全く異なるため、同じ単位長さでもその数値精度が全く異なる。例えば、m/z値における1Daと保持時間の1secとでは全く意味合いが異なり、数値精度も相違する。
【0079】
パーシステントホモロジー処理では、画像上の離散的なデータ点を中心とする半径の孔を構造的な要素として考えるため、二つの軸における軸方向の長さの精度の差異が大きいとパーシステント図の精度が低下するおそれがある。そこで、本発明の一変形例によるデータ解析方法では、必要に応じて、パーシステントホモロジー処理を適用する前に、処理対象の画像における二つの軸の、軸方向の単位長さとパラメーターの数値範囲との対応関係を適宜調整することが好ましい。
【0080】
図8は、本発明の一変形例である分析装置におけるデータ処理部2の概略ブロック構成図である。
図1と相違するのは、画像軸調整部28を備えることである。この画像軸調整部28は、例えば以下に述べるような手法により、パーシステントホモロジー処理の対象である画像データにおける二つの軸の一方又は両方の軸方向の単位長さに対応する数値範囲を調整する。これは、実質的に、画像全体をその二つの軸の一方又は両方の方向に伸縮することを意味する。
【0081】
具体的には、包括的2次元液体(又はガス)クロマトグラフのように二つの軸が共に保持時間である場合には、画像上の各軸の軸方向の単位長さに対応付けられる時間がそれぞれの保持時間の測定時間間隔よりも短くなるように調整するとよい。なお、ここでいう単位長さとは、MSイメージング画像における一つの微小領域のx方向、y方向のサイズに相当するものである。
【0082】
一方、クロマトグラフ質量分析、クロマトグラフ-イオン移動度質量分析などのように二つの軸のパラメーターの種類が全く異なる場合には、処理対象の画像上の各軸の軸方向の単位長さに対応する数値範囲の精度が同程度になるように、いずれか一方又は両方の軸の数値に適宜の補正係数を乗じる補正処理を実行し、その補正後の画像データに対してパーシステントホモロジー処理を実行するとよい。通常、保持時間、m/z値、イオン移動度などの所定の数値範囲(例えば1Da)に対する精度は装置によって決まっているため、分析に使用する装置の精度に基いて補正係数は予め決めることができる。
【0083】
上述したように、パーシステントホモロジー処理を実施する対象の画像の二つの軸の軸方向の長さを適宜調整することにより、該画像自体をその二軸の一方又は両方に適宜に伸縮させることで、パーシステントホモロジー処理を適切に適用し、画像の構造的な特徴を反映したパーシステント図を得ることができる。それによって、複数の試料の間の差異解析を高い精度で実行することが可能である。
また、パーシステントホモロジー処理の前に処理対象の画像の軸を調整する代わりに、パーシステントホモロジー処理の演算に、各軸の軸方向の長さを調整する演算処理を組み込むようにしてもよい。
【0084】
なお、上記実施形態や変形例はあくまでも本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加等を行っても本願特許請求の範囲に包含されることは当然である。
【0085】
[種々の態様]
上述した例示的な実施形態は、以下の態様の具体例であることが当業者により理解される。
【0086】
(第1項)本発明に係る機器分析用データ解析方法の一態様は、複数の試料に対し所定の機器分析をそれぞれ行うことで得られた、信号値がn次元(nは2以上の整数)配列構造を有する複数のデータ群に基く解析をコンピューターを用いて行うことにより、前記複数の試料の間の差異に関連する目的情報を取得する機器分析用データ解析方法であって、
前記複数のデータ群のそれぞれにおいて、一つのデータ群から得られるm次元(mは2以上n以下の整数)配列構造の信号値を含むデータに対してパーシステントホモロジー処理を行い、パーシステント図を作成する演算処理ステップと、
前記複数のデータ群からそれぞれ得られたパーシステント図を比較し、比較対象のパーシステント図全体におけるプロットの分散状態の相違性、及び/又は該比較対象のパーシステント図上で位置の対応付けがとれないプロットについての情報に基いて、前記目的情報を求める解析処理ステップと、
を実行するものである。
【0087】
(第2項)第1項に記載の機器分析用データ解析方法において、前記機器分析は、質量分析又は光学的分析を利用したイメージング分析であり、n次元(但しnは3又は4)のうちの一つの次元は質量電荷比又は波長若しくは波数である第1のパラメーターであり、残りのn-1次元は試料における平面的な又は立体的な位置を示す情報であるものとすることができる。
【0088】
(第7項)また本発明に係る機器分析用データ解析装置の一態様は、複数の試料に対し所定の機器分析をそれぞれ行うことで得られた、信号値がn次元(nは2以上の整数)配列構造を有する複数のデータ群に基く解析を行うことにより、前記複数の試料の間の差異に関連する目的情報を取得する機器分析用データ解析装置であって、
前記複数のデータ群のそれぞれにおいて、一つのデータ群から得られるm次元(mは2以上n以下の整数)配列構造の信号値を含むデータに対してパーシステントホモロジー処理を行い、パーシステント図を作成する演算処理部と、
前記複数のデータ群からそれぞれ得られたパーシステント図を比較し、比較対象のパーシステント図全体におけるプロットの分散状態の相違性、及び/又は該比較対象のパーシステント図上で位置の対応付けがとれないプロットについての情報に基いて、前記目的情報を求める解析処理部と、
を備えるものである。
【0089】
(第8項)第7項に記載の機器分析用データ解析装置において、前記機器分析は、質量分析又は光学的分析を利用したイメージング分析であり、n次元(但しnは3又は4)のうちの一つの次元は質量電荷比又は波長若しくは波数である第1のパラメーターであり、残りのn-1次元は試料における平面的な又は立体的な位置を示す情報であるものとすることができる。
【0090】
(第13項)本発明に係る分析装置の一態様は、第7項に記載の機器分析用データ解析装置を用いた分析装置であって、
複数の試料に対し所定の機器分析をそれぞれ行うことで、信号値がn次元(nは2以上の整数)配列構造を有する複数のデータ群を取得する測定実行部、をさらに備えるものである。
【0091】
(第14項)第13項に記載の分析装置において、前記測定実行部は、質量分析又は光学的分析を利用したイメージング分析を行うことにより、n次元(但しnは3又は4)のうちの一つの次元が質量電荷比又は波長若しくは波数である第1のパラメーターであり、残りのn-1次元が試料における平面的な又は立体的な位置を示す情報であるデータ群を取得するものとすることができる。
【0092】
ここで、質量分析又は光学的分析を利用したイメージング分析とは、質量分析イメージング法、ラマン分光イメージング法、FTIRイメージング法などの手法による分析である。
【0093】
第1項に記載の機器分析用データ解析方法、第7項に記載の機器分析用データ解析装置、又は第13項に記載の分析装置によれば、例えば大きさや形状が相違する試料からそれぞれ得られたMSイメージング画像やラマン分光イメージング画像に対して、その大きさや形状を揃えるような画像変形処理を行うことなく、また担当者が目視でMSイメージング画像を比較するような作業を行うことなく、試料間で分布状況の差異が大きい化合物の特定、或いは、特定の化合物の存在量に差異がある部位の抽出といった、試料間の差異に関する解析を効率良く且つ十分な精度で実施することができる。
【0094】
(第3項)第2項に記載の機器分析用データ解析方法において、前記演算処理ステップでは、前記第1のパラメーターの値毎にパーシステント図を作成し、前記解析処理ステップでは、複数の試料について前記第1のパラメーターの値が同じである複数のパーシステント図に基いて、該複数の試料の間で差異を示す第1のパラメーターの値を抽出するものとすることができる。
【0095】
(第9項)同様に第8項に記載の機器分析用データ解析装置において、前記演算処理部は、前記第1のパラメーターの値毎にパーシステント図を作成し、前記解析処理部は、複数の試料について前記第1のパラメーターの値が同じである複数のパーシステント図に基いて、該複数の試料の間で差異を示す第1のパラメーターの値を抽出するものとすることができる。
【0096】
例えばイメージング質量分析では、所定のm/z値範囲に亘るm/z値毎にそれぞれMSイメージング画像が得られるから、複数の試料に対して得られるMSイメージング画像をユーザーが確認しながら特徴的なm/z値を抽出する作業は非常に手間が掛かる。それに対し、第3項に記載の機器分析用データ解析方法又は第9項に記載の機器分析用データ解析装置によれば、ユーザーによる面倒な手間を省きながら、試料間で分布に差異があるm/z値を的確に抽出することができる。また、ユーザーによる判断を伴わないので、見落としや判断誤りなどの作業ミスによる解析精度の低下を回避できるほか、作業に当たる担当者の熟練度合や技量の差の影響を受けずに常に一定のレベルでの解析を行うことができる。
【0097】
(第4項)第3項に記載の機器分析用データ解析方法において、前記複数の試料は、第1のグループに属する試料と、該第1のグループとは異なる特徴を有する第2のグループに属する試料と、を含み、前記複数のデータ群は、前記第1のグループに属する試料について同じ機器分析が2回以上実施されることで得られたデータ群を含み、
前記解析処理ステップでは、第1のパラメーターの値毎に、第1のグループに属する試料に対応する複数のデータ群に基いてそれぞれ作成されたパーシステント図の間で求まるボトルネック距離と、第1のグループに属する試料に対応するデータ群と第2のグループに属する試料に対応するデータ群とに基いてそれぞれ作成されたパーシステント図の間で求まるボトルネック距離との比較により、該第1のグループと該第2のグループとの間で差異を示す第1のパラメーターの値を抽出するものとすることができる。
【0098】
(第10項)また第9項に記載の機器分析用データ解析装置において、前記複数の試料は、第1のグループに属する試料と、該第1のグループとは異なる特徴を有する第2のグループに属する試料と、を含み、前記複数のデータ群は、前記第1のグループに属する試料について同じ機器分析が2回以上実施されることで得られたデータ群を含み、
前記解析処理部は、第1のパラメーターの値毎に、第1のグループに属する試料に対応する複数のデータ群に基いてそれぞれ作成されたパーシステント図の間で求まるボトルネック距離と、第1のグループに属する試料に対応するデータ群と第2のグループに属する試料に対応するデータ群とに基いてそれぞれ作成されたパーシステント図の間で求まるボトルネック距離との比較により、該第1のグループと該第2のグループとの間で差異を示す第1のパラメーターの値を抽出するものとすることができる。
【0099】
ボトルネック距離は複数のパーシステント図の類似性や相違性を示す代表的な指標である。第4項に記載の機器分析用データ解析方法又は第10項に記載の機器分析用データ解析装置によれば、このボトルネック距離を評価に用いることで、パーシステント図におけるプロットの分散状況の相違性を高い精度で評価することができる。また、単に比較対象の二つのパーシステント図のボトルネック距離を比較するのではなく、同じ試料を複数回測定した結果に基く複数のパーシステント図間のボトルネック距離を基準としてボトルネック距離を評価するので、例えばMALDIイオン源を用いた質量分析装置のように、分析毎の分析結果のばらつきが比較的大きいような場合であっても、試料に対する差異解析を高い精度で以て行うことができる。
【0100】
(第5項)第2項~第4項のいずれか1項に記載の機器分析用データ解析方法において、前記解析処理ステップでは、比較対象のパーシステント図上で位置の対応付けがとれないプロットに基く逆解析を行うことで、該プロットに対応する、試料における平面的な又は立体的な位置の情報を求めるものとすることができる。
【0101】
(第11項)同様に第8項~第10項のいずれか1項に記載の機器分析用データ解析装置において、前記解析処理部は、比較対象のパーシステント図上で位置の対応付けがとれないプロットに基く逆解析を行うことで、該プロットに対応する、試料における平面的な又は立体的な位置の情報を求めるものとすることができる。
【0102】
第5項に記載の機器分析用データ解析方法又は第11項に記載の機器分析用データ解析装置では、複数の試料の間で、特定の化合物の存在量に大きな差異があるような試料中の部位を特定することができる。これにより、例えば生体組織において特定の疾病や異常において増加が著しい化合物が蓄積され易い部位などを調べることが可能となる。
【0103】
(第6項)第2項~第4項のいずれか1項に記載の機器分析用データ解析方法は、前記演算処理ステップの実行に先立って、各データ群からそれぞれ得られるm次元配列構造の信号値を含むデータに対し、該m次元のうちの少なくとも一つの次元の軸における単位長さに対応する数値範囲を調整するデータ調整処理ステップ、をさらに実行し、
該データ調整処理ステップによる処理実行後のデータに対して前記演算処理ステップによる処理を実行するものとすることができる。
【0104】
(第12項)同様に第8項~第10項のいずれか1項に記載の機器分析用データ解析装置は、各データ群からそれぞれ得られるm次元配列構造の信号値を含むデータに対し、該m次元のうちの少なくとも一つの次元の軸における単位長さに対応する数値範囲を調整する調整処理部、をさらに備え、
前記演算処理部は、前記調整処理部による処理実行後のデータに対して処理を実行するものとすることができる。
【0105】
第6項に記載の機器分析用データ解析方法又は第12項に記載の機器分析用データ解析装置では、パーシステントホモロジー処理の実施対象であるm次元配列構造の信号値を含むデータの、m次元の各軸のパラメーターの数値精度が大きく異なる場合であっても、予め複数の軸の単位長さにおける数値精度を概ね合わせることができる。これにより、パーシステントホモロジー処理を適切に行うことができ、精度の高いパーシステント図を作成することができる。
【符号の説明】
【0106】
1…イメージング質量分析部
2…データ処理部
20…データ格納部
21…イメージング画像作成部
22…パーシステントホモロジー処理部
23…ボトルネック距離算出部
24…m/z値絞込部
25…特異的プロット抽出部
26…逆解析処理部
27…表示処理部
28…画像軸調整部
3…入力部
4…表示部