(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6908136
(24)【登録日】2021年7月5日
(45)【発行日】2021年7月21日
(54)【発明の名称】データ解析装置
(51)【国際特許分類】
G01N 27/62 20210101AFI20210708BHJP
【FI】
G01N27/62 D
【請求項の数】7
【全頁数】12
(21)【出願番号】特願2019-568538(P2019-568538)
(86)(22)【出願日】2018年2月5日
(86)【国際出願番号】JP2018003757
(87)【国際公開番号】WO2019150573
(87)【国際公開日】20190808
【審査請求日】2020年3月2日
(73)【特許権者】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】110001069
【氏名又は名称】特許業務法人京都国際特許事務所
(72)【発明者】
【氏名】山口 真一
【審査官】
伊藤 裕美
(56)【参考文献】
【文献】
特開2017−224283(JP,A)
【文献】
国際公開第2017/002226(WO,A1)
【文献】
国際公開第2014/175211(WO,A1)
【文献】
新間秀一,イメージング質量顕微鏡を用いたがんの不均一性の解析,実験医学,2018年 2月 1日,36/2,211-217
(58)【調査した分野】(Int.Cl.,DB名)
G01N 27/62
H01J 49/00 − H01J 49/48
G06T 1/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
複数の試料についてそれぞれイメージング質量分析を実行することで得られた、2次元的な測定領域内の複数の測定点それぞれにおける、質量電荷比をパラメータとしたマススペクトルデータである第1のデータ群と、該複数の試料についてそれぞれイメージング質量分析とは異なる測定手法で得られた、前記測定領域内の所定の信号強度の分布を示す画像データである第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
a)前記第1のデータ群を説明変数、前記第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
b)前記第1の統計的解析処理部で算出された複数の指標値を説明変数、前記複数の試料にそれぞれ関連する他の情報を被説明変数(目的変数)とする所定の統計的解析処理を実施し、前記指標値と前記他の情報との類似性又は相違性を示す複数の指標値を算出する第2の統計的解析処理部と、
c)前記第2の統計的解析処理部で算出された複数の指標値を用い、前記他の情報と前記第1のデータ群との関係、又は、前記他の情報と前記第2のデータ群との関係、を示すグラフを作成して表示する表示処理部と、
を備えることを特徴とするデータ解析装置。
【請求項2】
請求項1に記載のデータ解析装置において、
前記第1の統計的解析処理部は、試料毎に、前記第2のデータ群による一つ又は複数の画像と、前記第1のデータ群による一つの質量電荷比における信号強度の分布画像との類似性又は相違性を示す指標値を算出することを特徴とするデータ解析装置。
【請求項3】
請求項2に記載のデータ解析装置であって、
前記第1の統計的解析処理部による所定の統計的解析処理は部分最小二乗回帰分析であることを特徴とするデータ解析装置。
【請求項4】
請求項2に記載のデータ解析装置であって、
前記第2の統計的解析処理部による所定の統計的解析処理は部分最小二乗回帰分析又は主成分回帰分析であることを特徴とするデータ解析装置。
【請求項5】
複数の試料についてそれぞれ得られた、質量電荷比をパラメータとしたマススペクトルデータである第1のデータ群と、該複数の試料の試料毎の状態を示す情報である第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
a)前記第1のデータ群を説明変数、前記第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
b)前記第1の統計的解析処理部で算出された複数の指標値を、より低次元の情報に集約するための所定の統計的解析処理を実施する第2の統計的解析処理部と、
c)前記第2の統計的解析処理部による結果に基づき、前記第2のデータ群と前記第1のデータ群における各パラメータ値との関係を示すグラフを作成して表示する表示処理部と、
を備えることを特徴とするデータ解析装置。
【請求項6】
請求項5に記載のデータ解析装置であって、
前記第1の統計的解析処理部による所定の統計的解析処理は部分最小二乗回帰分析であることを特徴とするデータ解析装置。
【請求項7】
請求項5に記載のデータ解析装置であって、
前記第2の統計的解析処理部による所定の統計的解析処理は主成分分析、因子分析又はクラスター分析であることを特徴とするデータ解析装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、試料や被検体に対し測定や観察を行うことで得られたデータを解析するデータ解析装置に関し、特に、様々な条件の下で得られた多数の試料についての測定データに基づいてそれら試料についての有用な情報を引き出したり、同じ試料に対して異なる測定手法や観察手法で得られた複数の多次元的な測定データに基づいて該試料についての有用な情報を引き出したりするのに好適なデータ解析装置に関する。
【背景技術】
【0002】
近年、質量分析装置、クロマトグラフ装置、光学分析装置といった様々な分析装置で得られたデータの解析に、統計的解析手法の一つである多変量解析が盛んに利用されるようになってきている。例えば異なる複数の試料についてそれぞれ分析を行うことで得られた膨大なデータに基づいて試料間の相違を見つけたり、そうした相違に関連する要因を見つけたりする際に、多変量解析は非常に有用な手法である。
分析装置で得られるデータの解析に多変量解析を用いた一例を簡単に説明する。
【0003】
近年、生体組織切片などの試料上の2次元的な測定領域内の多数の測定点それぞれについて質量分析を実行することが可能な質量分析装置が知られている。この種の質量分析装置はイメージング質量分析装置と呼ばれており、付設された光学顕微鏡によって試料の表面の微細な形態を観察しながら、同じ試料表面における特定の質量電荷比(m/z)を有するイオンの2次元的な強度分布を示す質量分析イメージング画像を取得することが可能である。
【0004】
特許文献1に記載のイメージング質量分析装置では、光学顕微鏡で得られた顕微画像を分析者が確認して着目する部位(関心領域)を特徴付ける色を指定すると、顕微画像においてその色を示す部位の分布に類似したイオン強度分布を示す質量電荷比が相関分析や回帰分析によって抽出される。それにより、質量電荷比に基づく化合物の特定が可能であれば、試料上で分析者が着目する部位と類似した分布を示す化合物を特定することができる。
【0005】
もちろん、顕微画像で観測される分布と類似した分布を示す質量分析イメージング画像だけでなく、イオン強度分布が互いに類似している複数の質量電荷比も比較的容易に見つけることができる。これにより、同じ動態を示す複数の化合物を見いだしたり、同じ化合物に由来する複数の部分構造を見つけて化合物の構造を推定したりすることもできる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】国際公開第2017/002226号パンフレット
【特許文献2】国際公開第2016/092608号パンフレット
【発明の概要】
【発明が解決しようとする課題】
【0007】
上記のような従来の解析は一つの試料についてのみの解析であるが、多数の試料についての解析結果を適切に結び付けることが可能であれば、癌などの特定の疾病の原因の究明やより的確な診断の研究などに非常に有用な情報が得られる可能性がある。例えば、癌の進行度合いが様々である多数の試料についての分析結果から、癌が進行したあとでなくその初期段階で特異的に発現する化合物を見つけたり、或いは治療の効果の程度を反映した化合物を見つけたりすることができる可能性がある。しかしながら、こうしたことを目的としたデータ解析を簡便に実現することができる手法は従来存在しなかった。
【0008】
また、そもそも一般に、多変量解析を行う従来のデータ解析装置により得られる解析結果は専門的な知識を有する者でないと把握することが難しく、十分に有用な情報をユーザに提供できていないという問題があった。
【0009】
本発明はこうした課題を解決するために成されたものであり、その主たる目的の一つは、異なる種類の測定や観察などによって得られた複数のデータを比較したり関連付けたりする解析処理を行うことで、従来の解析手法では得られない有用な情報を取得することができるデータ解析装置を提供することである。
【課題を解決するための手段】
【0010】
上記課題を解決するために成された本発明に係る第1の態様のデータ解析装置は、複数の試料についてそれぞれ
イメージング質量分析を実行することで
得られた、2次元的な測定領域内の複数の測定点それぞれにおける、質量電荷比をパラメータ
としたマススペクトルデータである第1のデータ群と、該複数の試料についてそれぞれ
イメージング質量分析とは
異なる
測定手
法で得られた
、前記測定領域内の所定の信号強度の分布を示す画像データである第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
a)
前記第1のデータ群を説明変数、
前記第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
b)前記第1の統計的解析処理部で算出された複数の指標値を説明変数、前記複数の試料にそれぞれ関連する他の情報を被説明変数(目的変数)とする所定の統計的解析処理を実施し、前記指標値と前記他の情報との類似性又は相違性を示す複数の指標値を算出する第2の統計的解析処理部と、
c)前記第2の統計的解析処理部で算出された複数の指標値を用い、前記他の情報と前記第1のデータ群との関係、又は、前記他の情報と前記第2のデータ群との関係、を示すグラフを作成して表示する表示処理部と、
を備えることを特徴としている。
【0011】
本発明に係る第1の態様のデータ解析装置における典型的な実施形態として
、前記第1の統計的解析処理部は、試料毎に、前記第2のデータ群による一つ又は複数の画像と、前記第1のデータ群による各質量電荷比における信号強度の分布画像との類似性又は相違性を示す指標値を算出する構成とすることができる。
【0012】
上記「イメージング質量分析とは異なる測定手法」としては、ラマン分光測定、蛍光測定、様々な波長(テラヘルツ域、遠近赤外域、可視域、紫外域、X線域など)の電磁波の放出強度の測定や吸収測定、PET(Positron Emission Tomography)測定、MRI(Magnetic Resonance Imaging)測定、ESR(Electron Spin Resonance)測定、CT(Computed Tomography)測定、EPMA(Electron Probe MicroAnalyser)による表面分析などの各種の測定や分析、或いは、電子顕微鏡や光学顕微鏡による観察などのいずれかとすることができる。例えば第2のデータ群が上述したような光学的な測定手法で得られた画像データを含むものである場合、複数の波長それぞれにおいて異なる画像を構成する画像データであってもよいし特定の一つの波長における一つの画像を構成する画像データであってもよい。
【0013】
いま例えば第2のデータ群が一つのカラー画像をモノクロ化した光学顕微画像を構成する画像データ、つまりは測定点に対応する画素の画素値を示すデータ群である場合、第1の統計的解析処理部は、試料毎に、その試料における画素値データ
による画像と、各質量電荷比の信号強度の分布を示す分布画像との類似性又は相違性を示す指標値を計算する。この第1の統計的解析処理部による所定の統計的解析処理は例えば、部分最小二乗回帰(PLS回帰)分析とするとよい。
【0014】
上記データに対しPLS回帰分析を適用することにより、上記指標値として質量電荷比毎に回帰係数を求めることができる。一つの試料について求まる質量電荷比毎の回帰係数を係数行列とすれば、複数の試料について複数の係数行列が求まる。
【0015】
本発明に係る第1の態様のデータ解析装置ではさらに第2の統計的解析処理部が、この複数の係数行列を説明変数、複数の試料にそれぞれ関連する他の情報を被説明変数とする所定の統計的解析処理を実施する。ここで、「複数の試料にそれぞれ関連する他の情報」とは数値化可能な状態であれば特にその内容を問わず、解析の目的等に応じて適宜の情報を用いることができる。また、第2の統計的解析処理部による所定の統計的解析処理は第1の統計的解析処理部による統計的解析処理と同じ手法でもよいし、それとは異なる手法でもよい。具体的には例えば、部分最小二乗回帰(PLS回帰)分析又は主成分回帰分析を用いるとよい。
【0016】
例えば複数の試料が特定の疾病に罹患した被検体から採取された生体組織切片であり、試料毎にその疾病の進行度合や重篤度合などが他の情報として与えられている場合、第2の統計的解析処理部でPLS回帰分析を行うことで、第1の統計的解析処理部で得られた試料毎の回帰係数と疾病の進行度合との類似性を示す回帰係数を求めることができる。この場合、この回帰係数は、光学顕微画像に現れている特定の分布と類似した分布を示す質量電荷比、つまりは化合物と、疾病の進行度合いとの関連性を示している。表示処理部は例えばその関連性を示す適宜の形式のグラフを作成して表示部の画面上に表示する。これにより、ユーザは例えば、光学顕微画像に現れている特定の分布と類似した分布を示す特定の化合物が疾病の進行度合に関連しているか否かを簡便に且つ視覚的に確認することができる。
【0017】
上記本発明に係る第1の態様のデータ解析装置では、複数の試料についてそれぞれ所定の測定を実行することで所定のパラメータ値毎に得られたデータを集約した第1のデータ群と、同じ複数の試料についてそれぞれ別の手法による測定を実行することで得られたデータを集約した第2のデータ群と、について一段階目の統計的解析処理を実行し、その結果と同じ複数の試料にそれぞれ関連する他の情報である第3のデータとについて、二段階目の統計的解析処理を実施していた。これに対し、一段階目の統計的解析処理で得られた結果を分かり易く或いはより大局的に表現するために二段階目の統計的解析処理を実施するようにしてもよい。
【0018】
即ち、本発明に係る第2の態様のデータ解析装置は、複数の試料についてそれぞ
れ得られた、
質量電荷比をパラメータ
としたマススペクトルデータである第1のデータ群と
、該複数の試料
の試料毎の状態を示す情報であ
る第2のデータ群と、に基づく解析処理により前記複数の試料全般に関する情報を求めるデータ解析装置であって、
a)
前記第1のデータ群を説明変数、
前記第2のデータ群を被説明変数(目的変数)とする所定の統計的解析処理を実施し、両データ群中のデータの類似性又は相違性を示す複数の指標値を算出する第1の統計的解析処理部と、
b)前記第1の統計的解析処理部で算出された複数の指標値を、より低次元の情報に集約するための所定の統計的解析処理を実施する第2の統計的解析処理部と、
c)前記第2の統計的解析処理部による結果に基づき、前記第2のデータ群と前記第1のデータ群における各パラメータ値との関係を示すグラフを作成して表示する表示処理部と、
を備えることを特徴としている。
【0019】
本発明に係る第2の態様のデータ解析装置では上記第1の態様のデータ解析装置と同様に、第1の統計的解析処理部による所定の統計的解析処理は例えば、部分最小二乗回帰分析とするとよい。一方、第2の統計的解析処理部による所定の統計的解析処理は、主成分分析、因子分析、クラスター分析などを用いることができる。
【0020】
本発明に係る第2の態様のデータ解析装置において、例えば試料は生体由来の試料であり、第1のデータ群は、複数の試料についてそれぞれ得られたマススペクトルデータ、第2のデータ群は試料毎の状態を示す情報であるものとする。こうしたデータに対し第1の統計的解析処理部によりPLS回帰分析を実行すると、質量電荷比値とその試料毎の状態の関連性の強さの程度を示す指標値として、それぞれの回帰係数を算出することができる。そして、こうして得られた複数の回帰係数について主成分分析を行い、表示処理部がその結果に基づいてスコアプロット又はローディングプロットを作成すると、試料毎の状態と質量電荷比値との関係が俯瞰的に観察できるようになる。
【発明の効果】
【0021】
本発明に係るデータ解析装置によれば、例えば、異なる種類の測定や観察などによって得られた複数のデータを比較したり関連付けたりすることで、従来の解析手法では得られない有用な情報を取得することができる。具体的には例えば、癌などの特定の疾病が進行したあとでなくその初期段階で特異的に発現する化合物を見つけたり、或いはそうした疾病に対する治療の効果の程度を反映した化合物を見つけたりすることができる可能性がある。
【図面の簡単な説明】
【0022】
【
図1】本発明に係るデータ解析装置を用いたイメージング質量分析システムの一実施例の概略構成図。
【
図2】本実施例のイメージング質量分析システムにおけるデータ解析処理の概念図。
【
図3】本実施例のイメージング質量分析システムにおけるデータ解析の手順を示すフローチャート。
【
図4】本実施例のイメージング質量分析システムにおけるデータ解析の変形例の説明図。
【
図5】本発明に係るデータ解析装置を用いた質量分析システムの一実施例の概略構成図。
【
図6】本実施例の質量分析システムにおけるデータ解析処理の概念図。
【発明を実施するための形態】
【0023】
[第1実施例]
本発明に係るデータ解析装置を用いたイメージング質量分析システムの一実施例について、添付図面を参照して説明する。
図1は本実施例のイメージング質量分析システムの概略構成図である。
このシステムは、光学顕微観察部11とイメージング質量分析部12を含む測定部1、データ解析部2、入力部3、及び表示部4、を含む。
【0024】
光学顕微観察部11は試料上の測定領域についての光学的な顕微観察画像を取得するものである。一方、イメージング質量分析部12は、同じ試料上の測定領域を細かく区分した微小領域(測定点)毎にそれぞれ所定の質量電荷比範囲に亘る質量分析を実施し、それぞれマススペクトルデータを収集するものである。
【0025】
データ解析部2は、光学顕微観察部11で取得される光学顕微画像データ及びイメージング質量分析部12で取得されるマススペクトルデータを受け取るデータ入力部21と、受け付けられたデータを格納するデータ格納部22と、演算データ前処理部23と、第1多変量解析処理部24と、第2多変量解析処理部25と、解析結果表示処理部26と、を機能ブロックとして備える。
なお、一般に、データ解析部2の実体はパーソナルコンピュータ又はより高性能なコンピュータであるワークステーションであり、そのコンピュータにインストールされた専用の解析ソフトウェアを該コンピュータで実行することにより各部の機能が実現されるものとすることができる。
【0026】
図2は本実施例のイメージング質量分析システムにおける特徴的なデータ解析処理の概念図、
図3はそのデータ解析処理の手順を示すフローチャートである。
ここでは、多数の被検体(例えばマウス)の同じ生体組織(例えば肝臓)からそれぞれ切り出された切片を試料とする。この多数の試料は異なる被検体の同じ生体組織のほぼ同じ部位の切片である。被検体は癌を発症しているが、その癌の進行の程度(重症度)は様々であり、その重症度は予め数値化されて試料毎に既知であるものとする。
【0027】
測定部1では、各試料についてそれぞれ、イメージング質量分析部12により、測定領域内の多数の測定点のマススペクトルデータ(これをMSイメージングデータという)を取得する。また、上記各試料とそれぞれ同じであるとみなせる試料(同じ被検体、同じ生体組織において連続した切片である試料)に対し特定のタンパク質についての蛍光標識を行ったうえで光学顕微観察部11で撮影を行い、蛍光画像データを取得する。データ入力部21はこうして取得された同じであるとみなせる試料についてのMSイメージングデータと蛍光画像データとをまとめ、さらに該試料の癌の重症度を示す情報を付加して、具体的には一つのデータファイルとしてデータ格納部22に格納する。したがって、データ格納部22には、試料の数(同じであるとみなせる二つの試料を一つとする)と同数のデータファイルが格納される。
【0028】
上述したように複数の試料についてのMSイメージングデータ及び蛍光画像データがデータ格納部22に格納されている状態で、以下のようにして解析処理が実施される。
ユーザが入力部3から処理対象のデータ等を指示すると、データ解析部2において演算データ前処理部23は、データ格納部22から処理対象である一つの試料についてのMSイメージングデータ及び蛍光画像データを読み出す(ステップS1)。上述したようにそれらデータが一つのデータファイルに格納されている場合には、そのデータファイルを読み出せばよい。
【0029】
演算データ前処理部23は、予め設定されている条件に従って蛍光画像の各画素のデータを単純な画素値データに変換する。例えばヘマトキリシン・エオジン(HE)等による蛍光画像ではその蛍光色の強度値が画素値としてデータ化される。また、演算データ前処理部23は、必要に応じて、蛍光顕微画像上とMSイメージング画像上における同じ対象物の像の大きさ、向き、歪みなどを修正する位置合わせ処理と解像度を合わせる解像度調整処理を実行する(ステップS2)。
【0030】
位置合わせ処理では、具体的には、例えば顕微画像を基準としてMSイメージング画像について拡大・縮小、回転、さらには、所定のアルゴリズムに従った変形を行うことで両画像における試料上での位置関係をおおむね一致させる。この位置合わせには例えば特許文献1に記載の手法を利用することができる。
【0031】
また、光学顕微観察部11における撮像の解像度(位置分解能)は通常、撮像用カメラの解像度で決まるのに対し、MSイメージング画像の解像度はイオン化のために試料に照射されるレーザ光のスポット径によって決まる。そのため、MSイメージング画像の解像度は光学画像の解像度に比べて低いことが多い。そこで、後述する画像の多変量解析を行うために、両画像の解像度を揃える解像度調整処理を実施する。解像度を揃える簡単な方法は、解像度が高いほうの画像の解像度を落として低解像である画像に合わせる方法である。こうした方法としては例えばビニング処理が有用である。また、解像度が低いほうの画像の解像度を上げることで高解像である画像に合わせるようにしてもよい。そのためには、低解像の画像に対しアップサンプリング処理を行って画素数をみかけ上合わせたあとに、或る画素に隣接する又は近接する複数の画素値を利用した補間処理によって、アップサンプリングによって新たに挿入された画素の画素値を算出して埋めればよい。
【0032】
上述した位置合わせ処理及び解像度調整処理によって、蛍光画像から求めた輝度値分布の画像とMSイメージング画像との間で、2次元的に同じ位置にある画素同士を対応付けることができる。そのあと、第1多変量解析処理部24は、一つの試料についてのMSイメージングデータに基づいて作成された2次元行列を説明変数(X)、蛍光画像の画素値データに基づいて作成された1次元行列を被説明変数(Y)としてPLS回帰分析を実行する。2次元行列は、質量電荷比値を一つの方向、測定点(画素)の位置を上記一つの方向に直交する他の方向にとり、信号強度値を要素とする行列である。PLS回帰分析により、Y=Bpis・X+B
0 で示される回帰モデルが作成される。ここで、Bpisは回帰係数である。回帰係数は質量電荷比毎に求まり、蛍光画像のパターン、つまりはタンパク質の空間分布と類似している質量電荷比又はその分布と反転した分布を示す質量電荷比では、回帰係数Bplsの絶対値が大きくなる。この回帰係数は1次元行列となる(ステップS3)。
【0033】
データ解析部2では、処理対象である全ての試料についてのデータ処理を実施したか否かを判定し(ステップS4)、未処理の試料があればステップS4からS1に戻る。したがって、ステップS1〜S4の処理を繰り返すことで、処理対象として指定された全ての試料についてのデータに基づく回帰係数行列が求まる。回帰係数行列の数は試料の総数と同数である。この回帰係数行列中の一つの回帰係数の値は、該当する質量電荷比におけるイオン強度の分布(つまりはその質量電荷比に対応する化合物の分布)と蛍光画像中で蛍光標識された化合物の分布の類似性を示している。したがって、一つの試料において蛍光標識された化合物の分布に類似した分布を示す化合物を調べたい場合には、ここまでの処理で十分である。
【0034】
本実施例のイメージング質量分析システムでは、さらに、
図2に示すように、第2多変量解析処理部25が、試料数と同数である回帰係数行列を説明変数(X)、各試料についての付随的な情報として与えられている癌の重症度を示す情報を被説明変数(Y)としたPLS回帰分析を実行する。癌の重症度は、或る時点での癌の重症の程度を表す指標値である。試料毎に重症度の情報が与えられているので、この重症度合いの行列は要素数が試料数と同数の1次元行列である。このPLS回帰分析ではステップS3の処理と同様に、その要素数が試料数と同数の1次元行列である回帰係数行列が得られる(ステップS5)。この回帰係数行列中の回帰係数は、重症度合いと蛍光画像の分布に類似した化合物との関係性の程度を示している。即ち、このときの回帰係数の絶対値が大きくなる質量電荷比に対応する化合物は、癌の重症度合いとの関連性が強いと推定される。
【0035】
解析結果表示処理部26は、ステップS5で求まった回帰係数行列に基づいて、予め決められた適宜のグラフを作成し、これを表示部4の画面上に表示する(ステップS6、S7)。例えば、最も簡単なグラフとしては、ステップS5で求まった回帰係数行列に基づき、横軸を質量電荷比、縦軸を係数値(ただし正負の極性あり)としたマススペクトル様のグラフを作成するとよい。これにより、蛍光標識された化合物と類似した2次元分布を示す化合物の中で、癌の重症度と関連性の強い化合物(化合物に対応する質量電荷比)を一目で確認することができる。
【0036】
なお、上記処理では、蛍光画像を単純な画素値データに変換していたが、蛍光画像がカラー画像又は複数の波長成分を含む画像であっても、同様の処理が可能である。この場合には、一つの試料に対して蛍光画像は一つではなく、波長の数だけ蛍光画像が存在することになる。蛍光画像が一つのみの場合には、ステップS3におけるPLS回帰分析の被説明変数(Y)は一つ(1次元行列が一つ)のみであったが、蛍光画像が複数ある場合、ステップS3におけるPLS回帰分析の被説明変数(Y)が複数になる。したがって、このときのPLS回帰分析はPLS2アルゴリズムを用いればよい。
【0037】
このときに得られる回帰係数は
図4(a)に示すような各波長における各質量電荷比の係数、つまりは2次元的な表形式のものとなる。そこで、これを
図4(b)に示すように、質量電荷比と波長とを合わせた1次元の配列に並び替え、ステップS5において、試料の数だけ用意した1次元配列の係数行列を説明変数(X)、癌の重症度を示す情報を被説明変数(Y)としたPLS回帰分析を実行すればよい。
当然のことながら、こうして得られる回帰係数行列は、質量電荷比と波長との組に対する係数の行列である。
【0038】
また、上記例において、蛍光画像に代えて、試料中の特定の化合物の分布が可視化されるような別の測定手法による画像を用いてもよい。
例えば、特定の波長を有する光やX線などの電磁波の吸収の度合いや放射強度の分布を示すデータ、ラマン散乱光や蛍光などの強度分布を示すデータや染色画像データ、PET(陽電子放出断層撮影)、CT(コンピュータ断層撮影)、MRI(核磁気共鳴画像)、ESR(電子スピン共鳴)などにより撮影された画像データ、放射線同位体標識を利用した画像データ、EPMAやSPM(Scanning Probe Microscope)などで取得された表面凹凸画像データなどを2次元画像データとして用いることができる。
【0039】
[第2実施例]
第1実施例では、複数の試料からそれぞれ得られたMSイメージングデータ(測定領域内の複数の測定点それぞれで得られたマススペクトルデータ)について多変量解析を行っていたが、一つの試料から一つのマススペクトルデータが得られる場合にも本発明を適用することができる。この実施例による質量分析システムの概略構成図を
図5に示す。このシステムは、イメージング質量分析部100、データ解析部200、入力部300、及び表示部400、を含み、データ解析部200は、イメージング質量分析部100で得られたマススペクトルデータを受け取るデータ入力部201と、受け付けられたデータを格納するデータ格納部202と、平均マススペクトル算出部203と、第1多変量解析処理部204と、第2多変量解析処理部205と、解析結果表示処理部206と、を機能ブロックとして備える。
【0040】
本実施例による質量分析システムにおける解析の例として、非アルコール性脂肪性肝炎と食事との関連について調べる場合の例について説明する。
図6は本実施例の質量分析システムにおける特徴的なデータ解析処理の概念図である。
【0041】
試料は、特別な餌(以下「特別餌」という)を与えることで非アルコール性脂肪性肝炎(NASH=Non Alcoholic SteatoHepatitis)を発症させたマウスの肝臓、及び、通常の餌(以下「通常餌」という)を与えたマウスの肝臓(コントロール試料)であり、それぞれ給餌期間が4週、8週、16週と3段階に異なる、合計6種類である。なお、経験的に特別餌の給餌期間が長いほどNASHの炎症の重症度は上がることが分かっているため、給餌期間4週、8週、16週をそれぞれ重症度:1、2、3と記すこととする。また、NASHを発症していない状態を重症度:0と記すこととする。
【0042】
上記6種類の試料についてそれぞれイメージング質量分析部100で質量分析を実行し、測定点毎にマススペクトルデータを取得する。データ解析部200において平均マススペクトル算出部203は、試料毎に、全ての測定点におけるマススペクトルデータの平均を計算することで平均マススペクトルを算出する。これにより、試料数と同数の平均マススペクトルが得られる。こうして得られた平均マススペクトルを構成するデータをPLS回帰分析の説明変数(X)とする。
【0043】
一方、重症度の進行に応じた化合量の変化のパターンを被説明変数(Y)とするが、化合物量がどのように変化するのか不明であるため、ここでは、次の5種類のパターンを想定する。
Y1=(1,2,3):重症度に比例して化合物量が増加又は減少
Y2=(1,2,1):給餌期間の途中で一時的に化合物量が増加又は減少
Y3=(1,0,0):給餌期間の初期にのみ化合物が存在する、又は給餌期間の初期にのみ化合物が存在しない
Y4=(0,1,0):給餌期間の途中にのみ化合物が存在する、又は給餌期間の途中にのみ化合物が存在しない
Y5=(0,0,1):給餌期間の末期にのみ化合物が存在する、又は給餌期間の末期にのみ化合物が存在しない
【0044】
複数の平均マススペクトル(X)に対してそれぞれY1〜Y5の特性値(Y)を設定し、PLS回帰のためのデータセットを作成する。そして第1多変量解析処理部204はこうして作成されたデータセット毎にPLS回帰分析を実行し、回帰係数Bplsを算出する。したがって、この回帰係数Bplsは、特性値毎で質量電荷比値毎に求まる。つまり、特性値毎に、質量電荷比毎の回帰係数を並べた1次元行列が求まる。ただし、この結果だけを見ても、特性値(Y1〜Y5)と各質量電荷比との全体像を把握することは難しい。
【0045】
そこで次に、第2多変量解析処理部205は、全ての特性値についての回帰係数行列を対象として主成分分析を実施する。よく知られているように、主成分分析を行うことで、解析結果としてスコアプロットとローディングプロットを求めることができる。この場合、スコアプロットでは、二つの主成分(通常は第1主成分及び第2主成分)を直交する軸とするグラフ上に、特性値Y1〜Y5が位置付けられる。また、ローディングプロットでは、同じく二つの主成分を直交する軸とするグラフ上に、各質量電荷比値が位置付けられる。解析結果表示処理部206はこうしたグラフを作成して表示部400の画面上に表示する。これにより、ユーザは、特性値と特徴的な質量電荷比値との関係を俯瞰的に把握することができる。
【0046】
なお、上記実施例はいずれも本発明の一例にすぎず、上記記載した以外の点において、本発明の趣旨の範囲で適宜変形、修正、追加などを行っても本願特許請求の範囲に包含されることは明らかである。
【符号の説明】
【0047】
1…測定部
11…光学顕微観察部
12、100…イメージング質量分析部
2、200…データ解析部
21、201…データ入力部
22、202…データ格納部
23…演算データ前処理部
203…平均マススペクトル算出部
24、204…第1多変量解析処理部
25、205…第2多変量解析処理部
26、206…解析結果表示処理部
3、300…入力部
4、400…表示部