IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社堀場製作所の特許一覧

特許7232771判別方法、学習方法、判別装置及びコンピュータプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-22
(45)【発行日】2023-03-03
(54)【発明の名称】判別方法、学習方法、判別装置及びコンピュータプログラム
(51)【国際特許分類】
   G01N 21/65 20060101AFI20230224BHJP
   G01N 33/48 20060101ALI20230224BHJP
   G01N 33/483 20060101ALI20230224BHJP
   C12Q 1/04 20060101ALI20230224BHJP
   C12M 1/34 20060101ALI20230224BHJP
【FI】
G01N21/65
G01N33/48 M
G01N33/483 C
C12Q1/04
C12M1/34 B
【請求項の数】 9
(21)【出願番号】P 2019559678
(86)(22)【出願日】2018-12-12
(86)【国際出願番号】 JP2018045591
(87)【国際公開番号】W WO2019117177
(87)【国際公開日】2019-06-20
【審査請求日】2021-10-05
(31)【優先権主張番号】P 2017238644
(32)【優先日】2017-12-13
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000155023
【氏名又は名称】株式会社堀場製作所
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】奥野 義人
(72)【発明者】
【氏名】入倉 大祐
(72)【発明者】
【氏名】赤路 佐希子
(72)【発明者】
【氏名】三宅 司郎
【審査官】横尾 雅一
(56)【参考文献】
【文献】米国特許出願公開第2011/0317158(US,A1)
【文献】国際公開第2017/073737(WO,A1)
【文献】KIM W , et al.,Instrument-Free Synthesizable Fabrication of Label-Free Optical Biosensing Paper Strips for the Earl,Analytical Chemistry,2016年04月29日,Vol.88,pp.5531-5537, S-1 - S-6,DOI: 10.1021/acs.analchem.6b01123
【文献】DIES H , et al.,Rapid identification and quantification of illicit drugs on nanodendritic surface-enhanced Raman sca,Sensors and Actuators B,2017年10月31日,Vol.257,pp.382-388,https://doi.org/10.1016/j.snb.2017.10.181
(58)【調査した分野】(Int.Cl.,DB名)
G01N 21/00 - G01N 21/74
G01N 33/48
C12Q 1/04
C12M 1/34
G06N 20/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
試料に含まれる細胞の種類を判別する方法において、
種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルを主成分分析することにより得られた複数の主成分のスペクトルと、前記主成分分析により得られた、各細胞のラマンスペクトルが前記複数の主成分のスペクトルに対して寄与する割合を示す複数の主成分スコアを、教師あり学習を用いる学習モデルによって種類別に分類した分類結果とを記憶し、
一つの未判別の細胞から一つのラマンスペクトルを取得し、
前記主成分のスペクトルに対して前記主成分スコアを計算した方法と同じ行列計算によって、前記複数の主成分のスペクトルに対して前記未判別の細胞のラマンスペクトルが一致する度合を示す複数の一致度を計算し、
前記分類結果に基づいて前記複数の一致度を分類することにより、前記未判別の細胞の種類を判別すること
を特徴とする判別方法。
【請求項2】
前記学習モデルは、サポートベクターマシンであり、
前記分類結果は、種類の判明している複数の細胞の夫々に対応する複数の主成分スコアを成分とする座標点が含まれる座標空間を、前記サポートベクターマシンによって、異なる種類の細胞に対応する座標点は異なる領域に含まれるように複数の領域に分割した境界と、前記複数の領域の夫々に対応する細胞の種類とを含むこと
を特徴とする請求項1に記載の判別方法。
【請求項3】
種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルを主成分分析することにより得られた、複数の主成分のスペクトル、及び前記複数の細胞の夫々に対応する複数の主成分スコアを取得し、
複数組の前記複数の主成分スコアと前記複数の細胞の夫々の種類とを教師データとして、前記学習モデルによって種類別に複数組の前記複数の主成分スコアを分類することができるように、前記学習モデルの機械学習を行い、
学習後の前記学習モデルによる前記分類結果を取得すること
を特徴とする請求項1又は2に記載の判別方法。
【請求項4】
一つの細胞の全体に励起光を照射し、
前記一つの細胞の全体からのラマン散乱光を測定することにより、ラマンスペクトルを取得すること
を特徴とする請求項1乃至3のいずれか一つに記載の判別方法。
【請求項5】
試料に含まれる細胞の種類を判別する装置において、
種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルを主成分分析することにより得られた複数の主成分のスペクトルと、前記主成分分析により得られた、各細胞のラマンスペクトルが前記複数の主成分のスペクトルに対して寄与する割合を示す複数の主成分スコアを、教師あり学習を用いる学習モデルによって種類別に分類した分類結果とを記憶する記憶部と、
前記主成分のスペクトルに対して前記主成分スコアを計算した方法と同じ行列計算によって、前記複数の主成分のスペクトルに対して未判別の細胞から取得したラマンスペクトルが一致する度合を示す複数の一致度を計算する計算部と、
前記分類結果に基づいて前記複数の一致度を分類することにより、前記未判別の細胞の種類を判別する判別部と
を備えることを特徴とする判別装置。
【請求項6】
種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルを主成分分析することにより得られた、複数の主成分のスペクトル、及び前記複数の細胞の夫々に対応する複数の主成分スコアを取得する主成分分析部と、
複数組の前記複数の主成分スコアと前記複数の細胞の夫々の種類とを教師データとして、前記学習モデルによって種類別に複数組の前記複数の主成分スコアを分類することができるように、前記学習モデルの機械学習を行う学習部と、
学習後の前記学習モデルによる前記分類結果を取得する分類結果取得部と
を更に備えることを特徴とする請求項に記載の判別装置。
【請求項7】
前記教師データを外部から取得する第1取得部
を更に備えることを特徴とする請求項に記載の判別装置。
【請求項8】
前記複数の主成分のスペクトル、及び前記種類の判明している複数の細胞の夫々に対応する複数の主成分スコアを前記学習モデルによって種類別に分類した結果を、外部から取得する第2取得部
を更に備えることを特徴とする請求項乃至のいずれか一つに記載の判別装置。
【請求項9】
コンピュータに、試料に含まれる細胞の種類を判別する処理を実行させるコンピュータプログラムにおいて、
コンピュータに、
種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトル主成分分析することにより得られた複数の主成分のスペクトルと、前記主成分分析により得られた、各細胞のラマンスペクトルが前記複数の主成分のスペクトルに対して寄与する割合を示す複数の主成分スコアを、教師あり学習を用いる学習モデルによって種類別に分類した分類結果とを記憶している状態で、前記主成分のスペクトルに対して前記主成分スコアを計算した方法と同じ行列計算によって、前記複数の主成分のスペクトルに対して未判別の細胞から取得したラマンスペクトルが一致する度合を示す複数の一致度を計算するステップと、
前記分類結果に基づいて前記複数の一致度を分類することにより、前記未判別の細胞の種類を判別するステップと
を含む処理を実行させることを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ラマンスペクトルに基づいて細胞の種類を判別するための判別方法、学習方法、判別装置及びコンピュータプログラムに関する。
【背景技術】
【0002】
再生医療の分野では、培養した細胞が所望の種類の細胞に分化しているのかを調べる必要がある。医療診断の分野では、患者から採取された細胞が正常な種類の細胞であるか否かを調べることがある。このように、生物由来の細胞の種類を判別する方法が必要となっている。細胞を染色する方法、又は細胞を破壊する方法を用いた場合は、判別した細胞の時系列的な変化を観察すること、又は判別した細胞の培養等を行うことができないので、細胞の種類を判別する方法は、非破壊的及び非侵襲的な方法であることが望ましい。このような方法として、ラマン分光を利用した方法がある。特許文献1には、細胞の複数の箇所から測定したラマンスペクトル又は所定波長域のラマンスペクトルに対して主成分分析を行い、得られた主成分スコアから細胞の判定を行うことが記載されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2010-181391号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
細胞からのラマン散乱光を測定する場合、細胞膜、核、ゴルジ体等、細胞内の各部分から、夫々にラマン散乱光が発生する。このため、細胞より得られるラマンスペクトルは、多数の信号が重なって複雑な形状になる。このため、細胞より得られるラマンスペクトルから、その細胞を特徴付けるラマンバンドを見つけ出して評価することは、困難である。特許文献1に記載の技術では、細胞内のラマンスペクトルの分布を得る必要があり、測定に必要な時間が長いという問題がある。また、同種の細胞であっても細胞内の種々の構造体の分布は多様であり、構造体の分布に応じたラマンスペクトルの分布を得ることの重要性は明確ではない。換言すれば、ラマンスペクトルを利用して正確に細胞の種類を判別する手法は未だ確立していない。
【0005】
本発明は、斯かる事情に鑑みてなされたものであって、その目的とするところは、細胞から得られるラマンスペクトルに基づいて、従来よりも正確に細胞の種類を判別することを可能にする判別方法、学習方法、判別装置及びコンピュータプログラムを提供することにある。
【課題を解決するための手段】
【0006】
本発明に係る判別方法は、試料に含まれる細胞の種類を判別する方法において、種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルを主成分分析することにより得られた複数の主成分のスペクトルと、前記主成分分析により得られた、各細胞のラマンスペクトルが前記複数の主成分のスペクトルに対して寄与する割合を示す複数の主成分スコアを、教師あり学習を用いる学習モデルによって種類別に分類した分類結果とを記憶し、一つの未判別の細胞から一つのラマンスペクトルを取得し、前記主成分のスペクトルに対して前記主成分スコアを計算した方法と同じ行列計算によって、前記複数の主成分のスペクトルに対して前記未判別の細胞のラマンスペクトルが一致する度合を示す複数の一致度を計算し、前記分類結果に基づいて前記複数の一致度を分類することにより、前記未判別の細胞の種類を判別することを特徴とする。
【0007】
本発明に係る判別方法は、前記学習モデルは、サポートベクターマシンであり、前記分類結果は、種類の判明している複数の細胞の夫々に対応する複数の主成分スコアを成分とする座標点が含まれる座標空間を、前記サポートベクターマシンによって、異なる種類の細胞に対応する座標点は異なる領域に含まれるように複数の領域に分割した境界と、前記複数の領域の夫々に対応する細胞の種類とを含むことを特徴とする。
【0008】
本発明に係る判別方法は、種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルを主成分分析することにより得られた、複数の主成分のスペクトル、及び前記複数の細胞の夫々に対応する複数の主成分スコアを取得し、複数組の前記複数の主成分スコアと前記複数の細胞の夫々の種類とを教師データとして、前記学習モデルによって種類別に複数組の前記複数の主成分スコアを分類することができるように、前記学習モデルの機械学習を行い、学習後の前記学習モデルによる前記分類結果を取得することを特徴とする。
【0009】
本発明に係る判別方法は、一つの細胞の全体に励起光を照射し、前記一つの細胞の全体からのラマン散乱光を測定することにより、ラマンスペクトルを取得することを特徴とする。
【0012】
本発明に係る判別装置は、試料に含まれる細胞の種類を判別する装置において、種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルを主成分分析することにより得られた複数の主成分のスペクトルと、前記主成分分析により得られた、各細胞のラマンスペクトルが前記複数の主成分のスペクトルに対して寄与する割合を示す複数の主成分スコアを、教師あり学習を用いる学習モデルによって種類別に分類した分類結果とを記憶する記憶部と、前記主成分のスペクトルに対して前記主成分スコアを計算した方法と同じ行列計算によって、前記複数の主成分のスペクトルに対して未判別の細胞から取得したラマンスペクトルが一致する度合を示す複数の一致度を計算する計算部と、前記分類結果に基づいて前記複数の一致度を分類することにより、前記未判別の細胞の種類を判別する判別部とを備えることを特徴とする。
【0013】
本発明に係る判別装置は、種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルを主成分分析することにより得られた、複数の主成分のスペクトル、及び前記複数の細胞の夫々に対応する複数の主成分スコアを取得する主成分分析部と、複数組の前記複数の主成分スコアと前記複数の細胞の夫々の種類とを教師データとして、前記学習モデルによって種類別に複数組の前記複数の主成分スコアを分類することができるように、前記学習モデルの機械学習を行う学習部と、学習後の前記学習モデルによる前記分類結果を取得する分類結果取得部とを更に備えることを特徴とする。
【0014】
本発明に係る判別装置は、前記教師データを外部から取得する第1取得部を更に備えることを特徴とする。
【0015】
本発明に係る判別装置は、前記複数の主成分のスペクトル、及び前記種類の判明している複数の細胞の夫々に対応する複数の主成分スコアを前記学習モデルによって種類別に分類した結果を、外部から取得する第2取得部を更に備えることを特徴とする。
【0016】
本発明に係るコンピュータプログラムは、コンピュータに、試料に含まれる細胞の種類を判別する処理を実行させるコンピュータプログラムにおいて、コンピュータに、種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトル主成分分析することにより得られた複数の主成分のスペクトルと、前記主成分分析により得られた、各細胞のラマンスペクトルが前記複数の主成分のスペクトルに対して寄与する割合を示す複数の主成分スコアを、教師あり学習を用いる学習モデルによって種類別に分類した分類結果とを記憶している状態で、前記主成分のスペクトルに対して前記主成分スコアを計算した方法と同じ行列計算によって、前記複数の主成分のスペクトルに対して未判別の細胞から取得したラマンスペクトルが一致する度合を示す複数の一致度を計算するステップと、前記分類結果に基づいて前記複数の一致度を分類することにより、前記未判別の細胞の種類を判別するステップとを含む処理を実行させることを特徴とする。
【0018】
本発明においては、一つの細胞から一つのラマンスペクトルを取得し、取得したラマンスペクトルに基づいて細胞の種類を判別する。また、種類の判明している複数の細胞から得られた複数のラマンスペクトルの主成分分析の結果に基づいて、主成分のスペクトルに対して未判別の細胞のラマンスペクトルが一致する度合を示す複数の一致度を計算する。種類の判明している複数の細胞に対応する複数の主成分スコアを教師あり学習を用いる学習モデルによって分類した結果に基づいて、未判別の細胞に対応する複数の一致度を分類することにより、細胞の種類を判別する。各細胞から一つずつ取得したラマンスペクトルを用いることにより、細胞全体の特徴に応じた判別の処理が行われる。なお、ラマンスペクトルの全部を用いて判別を行ってもよく、又は、ラマンスペクトルの一部分を用い、他の部分を用いずに判別を行ってもよい。また、ラマンスペクトルの全部を用いて学習を行ってもよく、又は、ラマンスペクトルの一部分を用い、他の部分を用いずに学習を行ってもよい。
【0019】
また、本発明においては、教師あり学習を用いる学習モデルとして、サポートベクターマシンを用いることにより、複数の細胞の夫々に対応する複数の主成分スコアを容易に分類し、未判別の細胞に対応する複数の一致度を容易に分類する。
【0020】
また、本発明においては、種類の判明している複数の細胞の夫々に対応する複数の主成分スコアと夫々の細胞の種類とを教師データとして、サポートベクターマシン等の学習モデルの機械学習を行う。機械学習の結果、より正確な細胞の種類の判別が可能となる。
【0021】
また、本発明においては、細胞の種類の判別を行う判別装置は、外部から教師データを取得する。判別装置の使用者以外によって行われたラマンスペクトルの測定結果に基づいて、学習モデルを学習させることができる。
【0022】
また、本発明においては、判別装置は、種類の判明している複数の細胞から得られた複数のラマンスペクトル主成分分析により得られた複数の主成分のスペクトルと、種類の判明している複数の細胞の夫々に対応する複数の主成分スコアを学習モデルによって種類別に分類した結果とを、外部から取得する。判別装置の使用者以外によって行われた学習の結果を用いて、細胞の種類の判別を行うことができる。
【0023】
また、本発明においては、種類の判明している複数の細胞の夫々に対応する複数の主成分スコアを分類する際に、複数の主成分スコアを成分とした座標点が含まれる座標空間を、サポートベクターマシン等の学習モデルによって複数の領域に分割する。例えば、座標点は第1主成分スコア及び第2主成分スコアを成分とした二次元の座標点である。座標空間の分割に応じて、細胞の種類別に複数の主成分スコアが分類される。
【0024】
また、本発明においては、一つの細胞から一つのラマンスペクトルを取得する際に、一つの細胞の全体に励起光を照射し、一つの細胞の全体からのラマン散乱光を測定する。ラマンスペクトルの測定を短時間で行うことが可能となり、また、細胞全体の特徴を反映したラマンスペクトルの測定が可能となる。
【発明の効果】
【0025】
本発明にあっては、細胞内の細かい構造に影響されることなく細胞全体の特徴に応じた判別の処理が行われ、また、ラマンスペクトルに含まれる一部のラマンバンドを用いるのではなく、ラマンスペクトルの全体的な特徴を比較して細胞の種類の判別を行う。従って、従来よりも正確に細胞の種類を判別することが可能となる等、本発明は優れた効果を奏する。
【図面の簡単な説明】
【0026】
図1】ラマン散乱光測定装置の構成を示すブロック図である。
図2】判別装置の内部構成を示すブロック図である。
図3】判別装置が学習を行う処理の手順を示すフローチャートである。
図4】ラマンスペクトルの例を示すグラフである。
図5】ラマンスペクトルデータの例を示す図表である。
図6A】複数のRBL及び複数のCHOから得られた複数のラマンスペクトルを主成分分析することにより得られた主成分のスペクトルの例を示すグラフである。
図6B】複数のRBL及び複数のCHOから得られた複数のラマンスペクトルを主成分分析することにより得られた主成分のスペクトルの例を示すグラフである。
図7】主成分スコアの計算結果の例を示す図表である。
図8】実施形態1に係るサポートベクターマシンにより座標空間を分割した例を示す特性図である。
図9】記憶装置の内部構成例を示すブロック図である。
図10】外部から教師データを取得して判別装置が学習を行う処理の手順を示すフローチャートである。
図11】外部から学習データを取得することによって判別装置が学習を行う処理の手順を示すフローチャートである。
図12】判別装置が細胞の種類の判別を行う処理の手順を示すフローチャートである。
図13】ラマンスペクトル中の指紋領域の例を示すグラフである。
図14A】指紋領域に係る主成分のスペクトルの例を示すグラフである。
図14B】指紋領域に係る主成分のスペクトルの例を示すグラフである。
図15】実施形態2に係るサポートベクターマシンにより座標空間を分割した例を示す特性図である。
【発明を実施するための形態】
【0027】
以下本発明をその実施の形態を示す図面に基づき具体的に説明する。
本実施形態に係る細胞の種類の判別方法では、ラマン散乱光測定装置により、複数の細胞が含まれる試料から各細胞のラマンスペクトルを測定し、判別装置により、測定されたラマンスペクトルに基づいて細胞の種類の判別を行う。試料には、複数種類の細胞が含まれている。例えば、試料は、培養された細胞を含む試料、又は人等の生物から採取された細胞を含む試料である。ここで、細胞の種類の違いとは、活性化した細胞と活性化していない細胞との違い、生細胞と死細胞との違い、正常な細胞と異常になった細胞との違い等の違いを含む。
【0028】
(実施形態1)
図1は、ラマン散乱光測定装置1の構成を示すブロック図である。ラマン散乱光測定装置1は、試料5を保持する試料保持部16と、レーザ光を照射する照射部11と、マスク142と、ビームスプリッタ141と、レンズ15とを備えている。例えば、試料5は液状であり、シャーレ等の容器に収容されている。試料保持部16は、例えば、試料5を収容した容器が載置される試料台である。試料保持部16は試料台以外の形態であってもよい。照射部11が照射するレーザ光は、マスク142で細い光束に絞られ、ビームスプリッタ141で反射し、レンズ15を通り、試料5へ照射される。照射部11、マスク142、ビームスプリッタ141及びレンズ15は、レンズ15の中でレーザ光が光軸及び光軸近傍のみを通るように、配置されている。図1中ではレーザ光を実線矢印で示している。
【0029】
ラマン散乱光測定装置1は、更に、分光器13と、光を検出する検出部12とを備えている。試料5中のレーザ光が照射された部分では、ラマン散乱が生起する。発生したラマン散乱光は、レンズ15で集光され、ビームスプリッタ141を通過し、分光器13へ入射する。図1中では、ラマン散乱光を破線矢印で示している。分光器13は、入射されたラマン散乱光を分光する。検出部12は、分光器13が分光した夫々の波長の光を検出する。ラマン散乱光測定装置1は、レーザ光及びラマン散乱光の導光、集光及び分離のためにミラー、レンズ及びフィルタ等の多数の光学部品からなる光学系を備えている。図1では、マスク142、レンズ15及びビームスプリッタ141以外の光学部品を省略している。なお、ラマン散乱光測定装置1は、照射部11からのレーザ光がビームスプリッタ141を通過し、ラマン散乱光がビームスプリッタ141で反射する構成であってもよい。
【0030】
ラマン散乱光測定装置1は、更に、試料保持部16を移動させる駆動部17と、制御部18と、試料保持部16が保持する試料5を観察するためのカメラ19とを備えている。例えば、駆動部17は、試料保持部16を水平方向に移動させる。駆動部17が試料保持部16を移動させることにより、試料5が移動し、試料5の中で照射部11からレーザ光を照射される部分が変更される。即ち、駆動部17の動作により、試料5の中でラマン散乱光が発生する部分が変更される。カメラ19は、例えば、撮像素子を含んでいる。照射部11、検出部12、分光器13、駆動部17及びカメラ19は、制御部18に接続されている。
【0031】
制御部18は、ラマン散乱光測定装置1の各部を制御する。照射部11は、オンとオフとを制御部18に制御される。分光器13は、分光して検出部12に検出させる光の波長を制御部18に制御される。検出部12は、夫々の波長の光の検出強度に応じた信号を制御部18へ出力する。制御部18は、検出部12が出力した信号を入力され、分光器13に分光させた光の波長と入力された信号が示す光の検出強度とに基づいてラマンスペクトルを生成する。制御部18は、駆動部17の動作を制御して、試料保持部16を移動させ、試料5の中でラマン散乱光が発生する部分を変更させる。また、制御部18は、カメラ19に試料5を撮像させ、試料5の中でラマン散乱光が発生する部分を確認することを可能にする。このようにして、ラマン散乱光測定装置1は、試料5の各部分からのラマンスペクトルの取得を可能にする。例えば、カメラ19は、照射部11から試料5へ照射されるレーザ光と同軸の光を用いて試料5を撮像するように配置されている。レーザ光と同軸の光を用いた撮像を行うことにより、試料5の中でラマン散乱光が発生する部分の位置を確認し、調整することが容易となる。
【0032】
ラマン散乱光測定装置1には、試料5に含まれる細胞の種類を判別するための処理を行う判別装置2が接続されている。判別装置2は制御部18に接続されている。図2は、判別装置2の内部構成を示すブロック図である。判別装置2は、パーソナルコンピュータ等のコンピュータを用いて構成されている。判別装置2は、演算を行うCPU(Central Processing Unit )21と、演算に伴って発生する一時的なデータを記憶するRAM(Random Access Memory)22と、光ディスク等の記録媒体20から情報を読み取るドライブ部23と、ハードディスク等の不揮発性の記憶部24とを備えている。また判別装置2は、使用者の操作を受け付けるキーボード又はマウス等の操作部25と、液晶ディスプレイ等の表示部26と、インタフェース部27と、通信部28とを備えている。インタフェース部27には、制御部18が接続されている。通信部28は、判別装置2外の通信ネットワーク3に接続され、通信ネットワーク3を介して、外部の装置と通信を行う。通信部28は、通信ネットワーク3を介して外部からデータをダウンロードすることが可能である。
【0033】
CPU21は、記録媒体20に記録されたコンピュータプログラム241をドライブ部23に読み取らせ、読み取ったコンピュータプログラム241を記憶部24に記憶させる。CPU21は、必要に応じてコンピュータプログラム241を記憶部24からRAM22へロードし、ロードしたコンピュータプログラム241に従って、判別装置2に必要な処理を実行する。なお、コンピュータプログラム241は、通信部28により判別装置2の外部からダウンロードされてもよい。制御部18は、生成したラマンスペクトルを表すラマンスペクトルデータを判別装置2へ出力する。判別装置2は、ラマンスペクトルデータをインタフェース部27で受け付け、CPU21は、ラマンスペクトルデータを記憶部24に記憶させる。
【0034】
ラマン散乱光測定装置1及び判別装置2は、一つの分析装置を構成する。判別装置2は、ラマン散乱光測定装置1の動作を制御することも可能である。制御部18は、カメラ19を用いて撮像した試料5の画像を表す画像データを判別装置2へ出力し、判別装置2は、画像データをインタフェース部27で受け付け、CPU21は、画像データが表す試料5の画像を表示部26に表示させてもよい。使用者は、操作部25を操作して、ラマン散乱光測定装置1を制御するための指示を入力してもよい。例えば、CPU21は、入力された指示に応じて、試料5中の特定の部分のラマンスペクトルを測定することを指示する制御信号を、インタフェース部27から制御部18へ出力する。制御部18は、制御信号を受け付け、受け付けた制御信号に従って、照射部11、検出部12、分光器13及び駆動部17の動作を制御し、試料5中の特定の部分のラマンスペクトルを測定する。
【0035】
本実施形態では、判別装置2は、教師あり学習を用いる学習モデルであるサポートベクターマシンによって細胞の種類の判別を行う。適切に細胞の種類の判別を行うためには、サポートベクターマシンの学習を行う必要がある。図3は、判別装置2が学習を行う処理の手順を示すフローチャートである。CPU21は、コンピュータプログラム241に従って、判別装置2に必要な処理を実行する。ラマン散乱光測定装置1は、種類の判明している複数の細胞を含んだ試料5から、複数のラマンスペクトルを取得する(S11)。ラマン散乱光測定装置1は、試料5に含まれる複数の細胞の夫々から一つずつラマンスペクトルを測定する。例えば、照射部11からのレーザ光が一つの細胞の全体に照射されるように、レンズ15を含む光学系を調整しておき、ラマン散乱光測定装置1は、レーザ光を一つの細胞の全体に照射する。レーザ光はレンズ15の中で光軸及び光軸近傍のみを通ることにより、一つの細胞の全体に照射される。レンズ15は、レーザ光の照射によって細胞の全体から発生したラマン散乱光を集光し、検出部12は細胞の全体からのラマン散乱光を検出する。一つの細胞について平均的なラマンスペクトルが得られ、得られたラマンスペクトルは、細胞全体の特徴を反映する。一つの細胞から一つのラマンスペクトルを取得するので、一つの細胞から複数のラマンスペクトルを取得する場合に比べて、測定時間が短縮される。
【0036】
ラマン散乱光測定装置1は、駆動部17で試料保持部16を移動させることにより、レーザ光を照射する細胞を変更しながら、複数の細胞の夫々から一つずつラマンスペクトルを取得する。例えば、制御部18は、カメラ19を用いて各細胞を検出し、各細胞に順次レーザ光が照射されるように駆動部17を制御する。また、例えば、表示部26に表示された試料5の画像を確認した使用者が操作部25を操作することにより、試料5の位置を変更する指示を判別装置2へ入力してもよい。指示に従った制御信号が判別装置2から制御部18へ入力され、制御部18は、制御信号に従って駆動部17を制御し、各細胞に順次レーザ光が照射される。このようにして、試料5から複数のラマンスペクトルが取得される。
【0037】
図4は、ラマンスペクトルの例を示すグラフである。横軸はラマンシフトを示し、縦軸は夫々のラマンシフトにおけるラマン散乱光の強度を示す。ラマンシフトは波数で表されており、単位はcm-1である。ラマン散乱光の強度の単位はa.u.(arbitrary unit,任意単位)である。図4には、細胞としてRBL(Rat Basophilic Leukemia cell)とCHO(Chinese Hamster Ovary cell)とを用いた例を示している。図4では、CHOのラマンスペクトルのベースラインをRBLのベースラインよりも大きい値にして、二種類のラマンスペクトルを示している。二種類のラマンスペクトルの形状は似通っており、ラマンスペクトルの形状から二種類の細胞を区別することは困難である。
【0038】
制御部18は、複数のラマンスペクトルを表すラマンスペクトルデータを出力し、判別装置2は、ラマンスペクトルデータをインタフェース部27で受け付け、ラマンスペクトルデータを記憶部24で記憶する。ラマンスペクトルデータは、複数の細胞の夫々から得られたラマンスペクトルを表すデータを含んでいる。一つのラマンスペクトルを表すデータは、測定されたラマン散乱光が発生した一つの細胞、即ちラマンスペクトルの発生元の細胞に関連付けられている。
【0039】
図5は、ラマンスペクトルデータの例を示す図表である。図5には、ラマンスペクトルを測定した細胞の数がN(Nは自然数)である例を示している。図5では、夫々の細胞に番号を付して互いを区別しており、細胞の番号を縦方向に並べている。ラマンスペクトルデータでは、夫々の細胞に関連付けて、夫々のラマンシフトについて測定されたラマン散乱光の強度の値が記録されている。図5中の**は数値を示す。夫々の細胞について、複数のラマン散乱光の強度の値が横方向に並んでおり、夫々のラマン散乱光の強度の値は夫々のラマンシフトの値に対応する。図5では、番号1の細胞のラマンスペクトルを表すデータを太枠で囲んでいる。一つの細胞のラマンスペクトルは、夫々のラマンシフトに対応するラマン散乱光の強度からなる多次元データで表されている。ラマンスペクトルデータは、複数の細胞に対応する複数の多次元データを含んでいる。
【0040】
CPU21は、次に、取得した複数のラマンスペクトルからバックグラウンドの信号を除去するバックグラウンド処理を行う(S12)。CPU21は、次に、複数のラマンスペクトルの主成分分析を行う(S13)。S13では、CPU21は、複数のラマンスペクトルを表す複数の多次元データの主成分分析を行う。具体的には、ラマンスペクトルを測定した細胞の数をN、一つのラマンスペクトルに含まれるラマン散乱光の強度の値の数をM(Mは自然数)とすると、ラマン散乱光の強度の値を要素とするN行M列の行列に対して主成分分析を行う。例えば、図5に示す枠で囲んだ行列が主成分分析の対象である。一つの行に含まれるM個の要素からなる多次元データが、一つのラマンスペクトルを表し、一つの細胞に対応する。
【0041】
CPU21は、主成分分析により、複数のラマンスペクトルの全情報の内で最も多い割合の情報を集約した第1主成分のスペクトル、次に多い割合の情報を集約した第2主成分のスペクトル等、複数の主成分のスペクトルを生成する計算を行う。図6A及び図6Bは、複数のRBL及び複数のCHOから得られた複数のラマンスペクトルを主成分分析することにより得られた主成分のスペクトルの例を示すグラフである。図6A及び図6Bは、複数のRBL及び複数のCHOから得られた複数のラマンスペクトルを主成分分析した結果を示す。図6Aは第1主成分のスペクトルの例を示し、図6Bは第2主成分のスペクトルの例を示す。横軸はラマンシフトを示し、縦軸は夫々のラマンシフトにおけるラマン散乱光の強度を示す。
【0042】
S13では、更に、CPU21は、複数のラマンスペクトルの夫々について、複数の主成分スコアを計算する。主成分スコアは、主成分のスペクトルに対して夫々のラマンスペクトルが寄与する割合を示す数値である。第1主成分スコアは、第1主成分のスペクトルに対して一のラマンスペクトルが寄与する割合を示し、第2主成分スコアは、第2主成分のスペクトルに対して一のラマンスペクトルが寄与する割合を示す。言い換えれば、主成分スコアは、夫々のラマンスペクトルがどのような割合で組み合わされば主成分のスペクトルが構成されるのかを示す。夫々に第1主成分スコアを乗じた複数のラマンスペクトルを加算することにより、第1主成分のスペクトルが得られる。CPU21は、行列計算により複数の主成分スコアを計算する。夫々のラマンスペクトルについて複数の主成分スコアが計算される。この結果、夫々のラマンスペクトル及び細胞に対応して、複数の主成分スコアが得られる。
【0043】
図7は、主成分スコアの計算結果の例を示す図表である。夫々のラマンスペクトルの発生元の細胞の番号に対応付けて、複数の主成分スコアが記録されている。図7中の**は数値を示す。夫々の細胞について、複数の主成分スコアが横方向に並んでいる。図7では、番号1の細胞に対応する複数の主成分スコアの値を太枠で囲んでいる。複数の主成分スコアの組は、一つのラマンスペクトルに対応し、当該ラマンスペクトルの発生元の一つの細胞に対応する。複数のラマンスペクトル及び複数の細胞に対応して、複数の主成分スコアが複数組計算される。CPU21は、複数組の複数の主成分スコアをRAM22又は記憶部24に記憶させる。
【0044】
CPU21は、次に、複数の細胞の夫々に対応する複数の主成分スコアを成分とする座標点が含まれる座標空間を生成する(S14)。例えば、CPU21は、第1主成分スコア及び第2主成分スコアを成分とする複数の座標点を二次元座標上にプロットすることにより、複数の細胞に対応する複数の座標点が含まれる座標空間を生成する。ラマンスペクトルを測定した細胞が何れの種類の細胞であるのかを示す細胞情報をインタフェース部27又は操作部25で受け付け、CPU21は、次に、受け付けた細胞情報と複数の細胞の夫々に対応する複数の主成分スコアとを教師データとして、サポートベクターマシンの学習を行う(S15)。S15では、CPU21は、夫々の細胞に対応する複数の主成分スコアを、細胞情報が示す夫々の細胞の種類に応じて分類することができるように、サポートベクターマシンのパラメータを調整する機械学習を行う。例えば、CPU21は、細胞の種類を判別するために、第1主成分スコア及び第2主成分スコアを成分とする複数の座標点が含まれる座標空間をサポートベクターマシンによって複数の領域に分割する処理を行う。この際に、CPU21は、異なる種類の細胞に対応する座標点は異なる領域に含まれるように座標空間を分割すべく、サポートベクターマシンのパラメータを調整する。
【0045】
図8は、実施形態1に係るサポートベクターマシンにより座標空間を分割した例を示す特性図である。図中には、横軸は第1主成分スコアを示し、縦軸は第2主成分スコアを示す。二次元座標空間内に、第1主成分スコア及び第2主成分スコアを成分とする複数の座標点が含まれている。図8中には、複数のRBLから得られた複数のラマンスペクトルに対応する複数の座標点と、複数のCHOから得られた複数のラマンスペクトルに対応する複数の座標点とを示している。同じ種類の細胞からは、似た形状のラマンスペクトルが得られ、主成分スコアも似た数値となる。このため、座標空間内では、同じ種類の細胞に対応する座標点は互いに近い位置に存在し、異なった種類の細胞に対応する座標点は互いに離れた位置に存在する傾向がある。破線で囲んだ複数の座標点は、複数のCHOに対応する。一点鎖線で囲んだ複数の座標点は、複数のRBLに対応する。CPU21は、サポートベクターマシンにより、CHOに対応する座標点が含まれる領域と、RBLに対応する座標点が含まれる領域とに二次元座標空間を分割することができるように、サポートベクターマシンのパラメータを調整する。図8には、分割した複数の領域の境界61を直線で示している。更に、CPU21は、座標空間内で座標点と境界61との間のマージンが可及的に大きくなるように、サポートベクターマシンのパラメータを調整する。S15の処理は、学習部に対応する。
【0046】
CPU21は、次に、学習後のサポートベクターマシンの処理により、異なる種類の細胞に対応する座標点は異なる領域に含まれるように座標空間を分割した境界61を生成する計算を行う(S16)。図8に示すように二次元の座標空間を分割する場合は、境界61は二次元空間内の直線又は曲線として生成される。CPU21は、次に、サポートベクターマシンの学習結果を表し、S13で生成した主成分のスペクトル、S16で生成した境界61、及び境界61で分割された各領域に対応する細胞の種類を表すデータを含む学習データを、記憶部24に記憶させる(S17)。境界61、及び境界61で分割された各領域に対応する細胞の種類は、種類の判明している複数の細胞の夫々に対応する複数の主成分スコアを種類別に分類した結果に対応する。以上で、判別装置2が学習を行う処理は終了する。S11~S17の処理は、随時繰り返される。例えば、試料5に含まれる細胞の種類を変更して、S11~S17の処理が繰り返される。例えば、想定される複数の種類の組み合わせについてS11~S17の処理が行われる。
【0047】
以上の説明では、判別装置2が教師データを作成する例を示したが、判別装置2は、教師データを外部から取得する処理を行ってもよい。通信ネットワーク3には、教師データを記憶する記憶装置4が接続されている。
【0048】
図9は、記憶装置4の内部構成例を示すブロック図である。記憶装置4は、サーバ装置等のコンピュータである。記憶装置4は、CPU41と、RAM42と、ハードディスク等の不揮発性の記憶部43と、通信部44とを備えている。通信部44は、通信ネットワーク3に接続する。記憶部43は、コンピュータプログラム431を記憶している。CPU41は、コンピュータプログラム431に従って各種の処理を実行する。また、記憶部43は、教師データを記憶している。教師データは、ラマン散乱光測定装置1若しくは判別装置2のメーカ、又は他の使用者によって、記憶装置4へアップロードされている。なお、本実施形態では、単一のコンピュータで記憶装置4を構成した例を示しているが、記憶装置4は、通信ネットワーク3を介して互いに接続された複数のコンピュータで構成されていてもよい。
【0049】
図10は、外部から教師データを取得して判別装置2が学習を行う処理の手順を示すフローチャートである。判別装置2及び記憶装置4は、判別装置2が記憶装置4から教師データを取得するために必要な認証処理を行う(S21)。例えば、判別装置2のCPU21は、使用者が操作部25を操作することによって入力されたパスワード等の認証情報を、通信部28に通信ネットワーク3を介して記憶装置4へ送信させる。記憶装置4のCPU41は、判別装置2から送信された認証情報が正当であるか否かを判定し、認証情報が正当である場合は教師データのダウンロードを許可し、認証情報が正当でない場合はダウンロードを不許可とする処理を行う。また、例えば、判別装置2のCPU21は、教師データの使用料を支払うための処理を行う。記憶装置4のCPU41は、支払いのための処理が行われたか否かを確認する処理を行い、支払いのための処理が行われたことが確認された場合に教師データのダウンロードを許可し、支払いのための処理が行われたことが確認されない場合にダウンロードを不許可とする処理を行う。例えば、CPU41は、認証結果を示す情報を、通信部44に通信ネットワーク3を介して判別装置2へ送信させる。
【0050】
ダウンロードを許可する認証結果が得られた場合に、CPU21は、通信部28により記憶装置4から教師データをダウンロードし、記憶部24に記憶させる(S22)。例えば、CPU21は、ダウンロードを許可する認証結果を示す情報を通信部28で受信した場合に、S22の処理を行う。教師データは、複数の細胞のラマンスペクトルの主成分分析により得られる複数の主成分のスペクトルと、複数の細胞の夫々に対応する複数の主成分スコアと、夫々の細胞が何れの種類の細胞であるのかを示す細胞情報とを含んでいる。S22の処理は、第1取得部に対応する。CPU21は、ダウンロードした教師データを用いて、サポートベクターマシンの機械学習を行う(S23)。S23の処理は、S14~S16の処理と同様の処理である。CPU21は、次に、教師データに含まれる主成分のスペクトル、生成した境界61、及び各領域に対応する細胞の種類を表すデータを含む学習データを記憶部24に記憶させ(S24)、判別装置2が学習を行う処理を終了する。
【0051】
また、判別装置2は、ラマンスペクトルデータを外部から取得する処理を行ってもよい。記憶装置4は、ラマンスペクトルデータ及び細胞情報を記憶部43に記憶している。ラマンスペクトルデータ及び細胞情報は、ラマン散乱光測定装置1若しくは判別装置2のメーカ、又は他の使用者によって、記憶装置4へアップロードされている。CPU21は、S11で、通信部28により通信ネットワーク3を介して記憶装置4からラマンスペクトルデータ及び細胞情報をダウンロードすることによって、ラマンスペクトルデータを外部から取得し、ラマンスペクトルデータ及び細胞情報を記憶部24に記憶させる。CPU21は、取得したラマンスペクトルデータ及び細胞情報を用いて、S12~S17の処理を実行する。CPU21は、ダウンロードを行う前に、S21と同様の認証処理を行ってもよい。
【0052】
また、学習に用いる教師データは、複数回の測定から得られたデータであってもよい。例えば、ラマン散乱光測定装置1は複数の試料5を用いて複数回の測定を行い、判別装置2は複数回の測定により得られたラマンスペクトルから教師データを作成してもよい。例えば、ラマン散乱光測定装置1は異なる細胞を含んだ複数の試料5を用いて複数回の測定を行い、判別装置2は複数回の測定により得られたラマンスペクトルから教師データを作成してもよい。また、学習に用いる教師データは、ラマンスペクトルデータから作成した教師データと、外部から取得した教師データとの両方を含んだデータであってもよい。
【0053】
また、判別装置2は、学習データを外部から取得する処理を行ってもよい。記憶装置4は、主成分のスペクトル、サポートベクターマシンにより生成された境界61、及び境界61で分割された各領域に対応する細胞の種類を表すデータを含んだ学習データを、記憶部43に記憶している。学習データは、ラマン散乱光測定装置1若しくは判別装置2のメーカ、又は他の使用者によって、記憶装置4へアップロードされている。図11は、外部から学習データを取得することによって判別装置2が学習を行う処理の手順を示すフローチャートである。判別装置2及び記憶装置4は、判別装置2が記憶装置4から学習データを取得するために必要な認証処理を行う(S31)。例えば、判別装置2のCPU21は、認証情報を通信部28に記憶装置4へ送信させ、記憶装置4のCPU41は、認証情報が正当であるか否かを判定し、認証情報が正当である場合は学習データのダウンロードを許可し、認証情報が正当でない場合はダウンロードを不許可とする処理を行う。また、例えば、判別装置2のCPU21は、学習データの使用料を支払うための処理を行う。記憶装置4のCPU41は、支払いのための処理が行われたことが確認された場合に学習データのダウンロードを許可し、支払いのための処理が行われたことが確認されない場合にダウンロードを不許可とする処理を行う。例えば、CPU41は、認証結果を示す情報を、通信部44に通信ネットワーク3を介して判別装置2へ送信させる。
【0054】
ダウンロードを許可する認証結果が得られた場合に、CPU21は、通信部28により通信ネットワーク3を介して記憶装置4から学習データをダウンロードする(S32)。例えば、CPU21は、ダウンロードを許可する認証結果を示す情報を通信部28で受信した場合に、S32の処理を行う。S32の処理は、第2取得部に対応する。CPU21は、次に、ダウンロードした学習データを記憶部24に記憶させ(S33)、判別装置2が学習を行う処理を終了する。なお、判別装置2は、ラマンスペクトルデータ、教師データ又は学習データを記憶装置4へアップロードする処理を行ってもよい。
【0055】
本実施形態では、判別装置2は、学習データを利用して、試料5に含まれる細胞の種類の判別を行う。図12は、判別装置2が細胞の種類の判別を行う処理の手順を示すフローチャートである。CPU21は、コンピュータプログラム241に従って、判別装置2に必要な処理を実行する。ラマン散乱光測定装置1は、種類が判別されていない一又は複数の細胞を含んだ試料5から、ラマンスペクトルを取得する(S41)。ラマン散乱光測定装置1は、S11での測定と同様に、試料5に含まれる一つの細胞毎に一つのラマンスペクトルを測定する。判別対象の細胞が一つである場合は一つのラマンスペクトルが得られ、判別対象の細胞が複数である場合は複数のラマンスペクトルが得られる。制御部18は、一又は複数のラマンスペクトルを表すラマンスペクトルデータを出力し、判別装置2は、ラマンスペクトルデータをインタフェース部27で受け付け、ラマンスペクトルデータを記憶部24で記憶する。
【0056】
CPU21は、次に、取得したラマンスペクトルからバックグラウンドの信号を除去するバックグラウンド処理を行う(S42)。CPU21は、次に、学習データに含まれるデータが表す複数の主成分のスペクトルに対して取得したラマンスペクトルが一致している度合を示す複数の一致度を計算する(S43)。一致度は、主成分分析の際に計算される主成分スコアと同等の方法により計算される。S43では、CPU21は、S12において複数のラマンスペクトルの夫々について複数の主成分スコアを計算した計算方法と同じ計算方法を用いて、種類が判別されていない細胞のラマンスペクトルの、複数の主成分のスペクトルに対する一致度を計算する。CPU21は、一つのラマンスペクトルについて、S12において計算される主成分スコアと同じ数の一致度を計算する。例えば、CPU21は、S12での行列計算において主成分スコアを計算するために用いられた行列を用いて、行列計算を行うことにより、複数の一致度を計算する。例えば、CPU21は、第1主成分スコアと同等の計算方法で計算される第1の一致度、及び第2主成分スコアと同等の計算方法で計算される第2の一致度を計算する。第1の一致度は、学習データが表す第1主成分のスペクトルに対して種類が判別されていない細胞のラマンスペクトルがどの程度一致しているかを示し、第2の一致度は、第2主成分のスペクトルに対してラマンスペクトルがどの程度一致しているかを示す。S43の処理は計算部に対応する。
【0057】
CPU21は、次に、各細胞に対応する複数の一致度を成分とする座標点を座標空間内にプロットする(S44)。例えば、CPU21は、第1の一致度及び第2の一致度を成分とする座標点を二次元座標上にプロットする。CPU21は、次に、学習データに含まれるデータが表す境界61により座標空間を複数の領域に分割し、各細胞に対応する座標点が何れの領域に含まれているかを判定する(S45)。
【0058】
CPU21は、次に、学習データに含まれるデータが表す、境界61で分割された各領域に対応する細胞の種類を、各領域に含まれていると判定された座標点に対応する細胞の種類とすることにより、細胞の種類を判別する(S46)。S44~S46の処理は判別部に対応する。CPU21は、次に、細胞の種類の判別結果を示すデータを、記憶部24に記憶させる(S47)。CPU21は、細胞の種類の判別結果を表示部26に表示させてもよい。以上で、細胞の種類の判別を行う処理は終了する
【0059】
例えば、判別装置2は、培養によって所望の種類に分化した細胞と未分化の細胞とを判別するために用いられる。分化していることが判明している細胞と未分化であることが判明している細胞とから得られたラマンスペクトルに基づいて教師データを作成し、サポートベクターマシンの学習を行い、学習データを作成する。その後、培養された細胞を含む試料5からラマンスペクトルをラマン散乱光測定装置1で測定し、判別装置2は、学習データに基づいて、試料5に含まれた細胞が所望の種類に分化した細胞であるか又は未分化の細胞であるかを判別する。また、判別装置2は、サポートベクターマシンによって細胞の種類を判別した際に、座標空間における各細胞に対応する座標点と境界61との間の距離に応じて、細胞の分化の度合いを判定することも可能である。
【0060】
例えば、判別装置2は、採取された細胞が正常な種類の細胞であるか否かを判別するために用いられる。正常であることが判明している細胞と異常であることが判明している細胞とから得られたラマンスペクトルに基づいて教師データを作成し、サポートベクターマシンの学習を行い、学習データを作成する。その後、採取された細胞を含む試料5からラマンスペクトルをラマン散乱光測定装置1で測定し、判別装置2は、学習データに基づいて、試料5に含まれた細胞が正常な細胞であるか否かを判別する。また、判別装置2は、サポートベクターマシンによって細胞の種類を判別した際に、座標空間における各細胞に対応する座標点と境界61との間の距離に応じて、異常な細胞の異常の度合いを判定することも可能である。
【0061】
以上詳述した如く、本実施形態においては、一つの細胞から一つのラマンスペクトルを取得し、取得したラマンスペクトルに基づいて細胞の種類を判別する。細胞内のラマンスペクトルの分布を用いて細胞の種類を判別する方法に比べて、判別のために必要な時間が短縮される。各細胞から一つずつ取得したラマンスペクトルを用いることにより、細胞内のラマンスペクトルの分布を用いる場合に比べて、細胞内の細かい構造に影響されることなく細胞全体の特徴に応じた判別の処理が行われる。
【0062】
また、本実施形態においては、判別装置2は、種類の判明している複数の細胞から得られた複数のラマンスペクトルを主成分分析し、複数のラマンスペクトルの夫々に対応する複数の主成分スコアを、サポートベクターマシンによって種類別に分類する。また、判別装置2は、種類の判明している複数の細胞の夫々に対応する複数の主成分スコアの分類結果に基づいて、未判別の細胞に対応する複数の一致度を分類することにより、細胞の種類を判別する。同じ種類の細胞からは、似た形状のラマンスペクトルが得られ、主成分スコアも似た数値となる傾向があるので、種類の判明している細胞に対応する主成分スコアの組を分類することができ、分類結果に応じて未判別の細胞に対応する一致度を分類することにより、細胞が判別される。ラマンスペクトルに含まれる一部のラマンバンドを細胞に特徴的なものとして着目するのではなく、ラマンスペクトルの全体的な特徴を比較して細胞の種類の判別を行うので、従来よりも正確にまた容易に細胞の種類を判別することが可能となる。また、サポートベクターマシンを用いて判別を行うので、サポートベクターマシンの学習を行うことによって、より正確に細胞の種類を判別することが可能となるように判別装置2を改良することが可能となる。
【0063】
(実施形態2)
実施形態2においては、ラマンスペクトルの一部分を用いて細胞の判別を行う形態を示す。細胞のラマンスペクトルには、細胞の特徴を比較的強く反映しており、細胞の種類による変化が大きい部分と、細胞の特徴をあまり反映しておらず、細胞の種類による変化が小さい部分とが含まれる。以下、細胞のラマンスペクトル中で細胞の特徴を強く反映した部分を、指紋領域と言う。実施形態2では、指紋領域を用いて細胞の判別を行う。
【0064】
図13は、ラマンスペクトル中の指紋領域の例を示すグラフである。図13に示したラマンスペクトルは、図4に示したラマンスペクトルと同一である。指紋領域の範囲は、ラマンシフトが1250~1750cm-1である範囲である。指紋領域は、シトクロムC、核酸、脂質、又はアミドの二次構造(アミドI、II若しくはIII等)等、細胞の内部の構成物に由来する重要な情報を反映している。このため、指紋領域は、細胞の特徴を強く反映しており、ラマンスペクトル中の他の部分に比べて、細胞の種類による変化が大きい。
【0065】
実施形態2においても、ラマン散乱光測定装置1の構成は、実施形態1と同様である。実施形態1と同様に、ラマン散乱光測定装置1は、S11~S17の処理を実行することにより、細胞の種類の判別を行うためのサポートベクターマシンの学習を行う。S11では、ラマン散乱光測定装置1は、試料5に含まれる複数の細胞の夫々から一つずつラマンスペクトルを測定することにより、複数のラマンスペクトルを取得する。
【0066】
S13では、判別装置2のCPU21は、複数のラマンスペクトル中の指紋領域の主成分分析を行う。即ち、CPU21は、複数のラマンスペクトルを表す複数の多次元データの中で、指紋領域に対応する多次元データに対して主成分分析を行う。例えば、図5に示す行列の中で、ラマンシフトが1250~1750cm-1である範囲に対応する部分から抽出した行列が、主成分分析の対象である。CPU21は、主成分分析により、指紋領域に係る第1主成分のスペクトル、及び指紋領域に係る第2主成分のスペクトル等、指紋領域に係る複数の主成分のスペクトルを生成する計算を行う。
【0067】
図14A及び図14Bは、指紋領域に係る主成分のスペクトルの例を示すグラフである。図14A及び図14Bは、複数のRBL及び複数のCHOから得られた複数のラマンスペクトルを主成分分析した結果を示す。図14Aは第1主成分のスペクトルの例を示し、図14Bは第2主成分のスペクトルの例を示す。横軸はラマンシフトを示し、縦軸は夫々のラマンシフトにおけるラマン散乱光の強度を示す。
【0068】
S13では、更に、CPU21は、複数のラマンスペクトルの夫々について、指紋領域に係る第1主成分スコア、及び指紋領域に係る第2主成分スコア等、指紋領域に係る複数の主成分スコアを計算する。指紋領域に係る第1主成分スコアは、指紋領域に係る第1主成分のスペクトルに対して一のラマンスペクトル中の指紋領域が寄与する割合を示す。夫々のラマンスペクトル及び細胞に対応して、指紋領域に係る複数の主成分スコアが得られる。
【0069】
なお、判別装置2は、S13では、指紋領域の範囲よりも広いラマンシフトの範囲に対応する主成分のスペクトルを生成し、主成分のスペクトルから指紋領域に対応する部分を抽出し、抽出した部分を利用して指紋領域に係る主成分スコアを計算してもよい。また、ラマン散乱光測定装置1は、S11において測定したラマンスペクトルから、指紋領域を抽出し、抽出した指紋領域を表すデータに対してS12以降の処理を行ってもよい。また、ラマン散乱光測定装置1は、S11においてラマンスペクトルを測定する際に、指紋領域のみを測定し、測定した指紋領域を表すデータに対してS12以降の処理を行ってもよい。いずれの方法を用いた場合であっても、指紋領域に係る複数の主成分スコアが得られる。
【0070】
CPU21は、S14では、次に、指紋領域に係る複数の主成分スコアを成分とする座標点が含まれる座標空間を生成する。例えば、CPU21は、指紋領域に係る第1主成分スコア及び指紋領域に係る第2主成分スコアを成分とする複数の座標点を二次元座標上にプロットする。S15では、CPU21は、細胞情報と指紋領域に係る複数の主成分スコアとを教師データとして、サポートベクターマシンの学習を行う。例えば、CPU21は、細胞の種類を判別するために、指紋領域に係る第1主成分スコア及び指紋領域に係る第2主成分スコアを成分とする複数の座標点が含まれる座標空間をサポートベクターマシンによって複数の領域に分割する処理を行う。実施形態1と同様に、CPU21は、異なる種類の細胞に対応する座標点は異なる領域に含まれるように座標空間を分割すべく、サポートベクターマシンのパラメータを調整する。
【0071】
図15は、実施形態2に係るサポートベクターマシンにより座標空間を分割した例を示す特性図である。横軸は指紋領域に係る第1主成分スコアを示し、縦軸は指紋領域に係る第2主成分スコアを示す。図中には、二次元座標空間内に、指紋領域に係る第1主成分スコア及び指紋領域に係る第2主成分スコアを成分とする複数の座標点が含まれている。図15中には、複数のRBLから得られた複数のラマンスペクトルに対応する複数の座標点と、複数のCHOから得られた複数のラマンスペクトルに対応する複数の座標点とを示している。同じ種類の細胞からは、同様の指紋領域が得られ、指紋領域に係る主成分スコアは似た数値となる。このため、座標空間内では、同じ種類の細胞に対応する座標点は互いに近い位置に存在し、異なった種類の細胞に対応する座標点は互いに離れた位置に存在する傾向がある。破線で囲んだ複数の座標点は、複数のCHOに対応する。一点鎖線で囲んだ複数の座標点は、複数のRBLに対応する。CPU21は、CHOに対応する座標点が含まれる領域と、RBLに対応する座標点が含まれる領域とに二次元座標空間を分割することができるように、サポートベクターマシンのパラメータを調整する。図15には、分割した複数の領域の境界61を折れ線で表現した例を示している。更に、CPU21は、座標空間内で座標点と境界61との間のマージンが可及的に大きくなるように、サポートベクターマシンのパラメータを調整する。
【0072】
CPU21は、実施形態1と同様に、S16及びS17の処理を実行する。S11~S17の結果、指紋領域に係る主成分のスペクトル、境界61、及び境界61で分割された各領域に対応する細胞の種類を表すデータを含む学習データが、記憶部24に記憶される。実施形態1と同様に、判別装置2は、教師データ又は学習データを外部から取得する処理を行ってもよい。
【0073】
実施形態1と同様に、ラマン散乱光測定装置1は、S41~S47の処理を実行することにより、学習データを利用して、試料5に含まれる細胞の種類の判別を行う。S41では、ラマン散乱光測定装置1は、試料5に含まれる細胞一つにつき一つのラマンスペクトルを取得する。S43では、判別装置2のCPU21は、取得したラマンスペクトルから指紋領域を抽出し、学習データに含まれるデータが表す指紋領域に係る主成分のスペクトルに対して、抽出した指紋領域が一致している度合を示す一致度を計算する。CPU21は、主成分スコアを計算した計算方法と同じ計算方法を用いて、指紋領域に係る一致度を計算する。CPU21は、一つのラマンスペクトルについて、指紋領域に係る一致度を、指紋領域に係る主成分スコアと同じ数だけ計算する。例えば、CPU21は、第1主成分スコアと同等の計算方法で計算される第1の一致度、及び第2主成分スコアと同等の計算方法で計算される第2の一致度を計算する。
【0074】
なお、ラマン散乱光測定装置1は、S41においてラマンスペクトルを測定する際に、指紋領域のみを測定し、測定した指紋領域を表すデータに対してS42以降の処理を行ってもよい。この場合であっても、指紋領域に係る一致度が得られる。
【0075】
CPU21は、実施形態1と同様に、S44~S47の処理を実行する。S41~S47の処理により、試料5に含まれる細胞の種類の判別結果が得られる。以上のように、実施形態2では、細胞から得られるラマンスペクトル中の指紋領域を利用して、サポートベクターマシンの学習、及び細胞の判別を行う。指紋領域は、細胞の特徴を強く反映しており、細胞の種類による変化が大きいので、判別装置2は、指紋領域を利用することによって、種類の異なる細胞をより確実に分類することができるようにサポートベクターマシンを学習させることができる。このサポートベクターマシンを用いることにより、判別装置2は、細胞の種類の判別をより精度良く行うことが可能となる。
【0076】
以上の実施形態1及び2においては、ラマン散乱光測定装置1が試料5へレーザ光を照射する形態を示したが、ラマン散乱光測定装置1は、ラマンスペクトルの測定のためにレーザ光以外の励起光を試料5へ照射する形態であってもよい。また、実施形態1及び2においては、試料5の中でラマン散乱光が発生する部分を変更させるために試料5を移動させる形態を示したが、ラマン散乱光測定装置1は、試料5の中でラマン散乱光が発生する部分を変更させるために励起光の光路を移動させる形態であってもよい。
【0077】
また、実施形態1及び2においては、一つの細胞から一つのラマンスペクトルを測定するために一つの細胞全体にレーザ光を照射してラマンスペクトルを測定する形態を示した。しかしながら、ラマン散乱光測定装置1は、一つの細胞内の複数の部分に順次励起光を照射し、一つの細胞内の複数の部分に対応する複数のラマンスペクトルを測定し、複数のラマンスペクトルを代表する一つのラマンスペクトルを作成してもよい。例えば、ラマン散乱光測定装置1は、複数のラマンスペクトルを平均したラマンスペクトルを作成する。このようにしても、一つの細胞から一つのラマンスペクトルが測定される。一つの細胞内の複数の部分に順次励起光を照射するように光学系が設定されているラマン散乱光測定装置1をも、細胞の種類の判別のために利用することができる。
【0078】
また、実施形態1及び2においては、細胞の種類の判別のために二次元座標空間をサポートベクターマシンによって複数の領域に分割する処理を行う形態を示したが、判別装置2は、三次元以上の座標空間を複数の領域に分割する処理を行う形態であってもよい。例えば、判別装置2が三次元の座標空間を複数の領域に分割する処理を行う形態では、第1主成分スコア、第2主成分スコア及び第3主成分スコアを成分とする座標点を含んだ座標空間、並びに第1、第2及び第3の一致度を成分とする座標点を含んだ座標空間が用いられ、境界61は平面又は曲面となる。また、実施形態1及び2においては、教師あり学習を用いる学習モデルとしてサポートベクターマシンを用いた形態を示したが、判別装置2は、サポートベクターマシン以外の学習モデルを用いた形態であってもよい。例えば、判別装置2は、教師あり学習を用いる学習モデルとしてコンボリューショナル・ニューラルネットワークを用いた形態であってもよい。また、判別装置2は、細胞の種類の判別だけではなく、細胞核の種類の判別又はタンパク質の種類の判別等、細胞内の部分又は生体物質の判別にも用いることが可能である。また、実施形態1及び2においては、ラマン散乱光測定装置1と判別装置2とが一体になって分析装置を構成した形態を示したが、判別装置2はラマン散乱光測定装置1から分離した形態であってもよい。
【0079】
本発明は上述した実施の形態の内容に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。即ち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態も本発明の技術的範囲に含まれる。
【0080】
(付記1)
試料に含まれる細胞の種類を判別する方法において、
一つの未判別の細胞から一つのラマンスペクトルを取得し、
種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルの予め定められたラマンシフト範囲に対応する部分に対する主成分分析により得られた複数の主成分のスペクトルの前記ラマンシフト範囲に対応する部分に対して、前記未判別の細胞のラマンスペクトルの前記ラマンシフト範囲に対応する部分が一致する度合を示す複数の一致度を計算し、
前記主成分分析により得られた前記種類の判明している複数の細胞の夫々に対応する複数の主成分スコアを、教師あり学習を用いる学習モデルによって種類別に分類した結果に基づいて、前記複数の一致度を分類することにより、前記未判別の細胞の種類を判別すること
を特徴とする判別方法。
【0081】
(付記2)
試料に含まれる細胞の種類をラマンスペクトルに基づいて判別するための学習を行う方法であって、
種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルの予め定められたラマンシフト範囲に対応する部分を主成分分析することにより得られた、複数の主成分のスペクトルの前記ラマンシフト範囲に対応する部分、及び前記複数の細胞の夫々に対応する複数の主成分スコアを取得し、
複数組の前記複数の主成分スコアと、前記複数の細胞の夫々の種類とを教師データとして、教師あり学習を用いる学習モデルによって前記種類に応じて複数組の前記複数の主成分スコアを分類することができるように、前記学習モデルの機械学習を行い、
前記複数の主成分のスペクトルの前記ラマンシフト範囲に対応する部分、及び学習後の前記学習モデルによる前記複数の主成分スコアの分類結果を記憶すること
を特徴とする学習方法。
【0082】
(付記3)
試料に含まれる細胞の種類を判別する装置において、
種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルの予め定められたラマンシフト範囲に対応する部分に対する主成分分析により得られた複数の主成分のスペクトルの前記ラマンシフト範囲に対応する部分に対して、未判別の細胞から取得したラマンスペクトルの前記ラマンシフト範囲に対応する部分が一致する度合を示す複数の一致度を計算する計算部と、
前記主成分分析により得られた前記種類の判明している複数の細胞の夫々に対応する複数の主成分スコアを、教師あり学習を用いる学習モデルによって種類別に分類した結果に基づいて、前記複数の一致度を分類することにより、前記未判別の細胞の種類を判別する判別部と
を備えることを特徴とする判別装置。
【0083】
(付記4)
コンピュータに、試料に含まれる細胞の種類を判別する処理を実行させるコンピュータプログラムにおいて、
コンピュータに、
種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトルの予め定められたラマンシフト範囲に対応する部分に対する主成分分析により得られた複数の主成分のスペクトルの前記ラマンシフト範囲に対応する部分に対して、未判別の細胞から取得したラマンスペクトルの前記ラマンシフト範囲に対応する部分が寄与する度合を示す複数の一致度を計算するステップと、
前記主成分分析により得られた前記種類の判明している複数の細胞の夫々に対応する複数の主成分スコアを、教師あり学習を用いる学習モデルによって種類別に分類した結果に基づいて、前記複数の一致度を分類することにより、前記未判別の細胞の種類を判別するステップと
を含む処理を実行させることを特徴とするコンピュータプログラム。
【0084】
(付記5)
コンピュータに、試料に含まれる細胞の種類を判別するための学習を行わせるコンピュータプログラムであって、
コンピュータに、
種類の判明している複数の細胞の夫々から一つずつ得られたラマンスペクトルからなる複数のラマンスペクトル予め定められたラマンシフト範囲に対応する部分を主成分分析することにより得られた、複数の主成分のスペクトルの前記ラマンシフト範囲に対応する部分、及び前記複数の細胞の夫々に対応する複数の主成分スコアを取得するステップと、
複数組の前記複数の主成分スコアと、前記複数の細胞の夫々の種類とを教師データとして、教師あり学習を用いる学習モデルによって前記種類に応じて前記複数の主成分スコアを分類することができるように、前記学習モデルの機械学習を行うステップと、
前記複数の主成分のスペクトルの前記ラマンシフト範囲に対応する部分、及び学習後の前記学習モデルによる前記複数の主成分スコアの分類結果を記憶するステップと
を含む処理を実行させることを特徴とするコンピュータプログラム。
【符号の説明】
【0085】
1 ラマン散乱光測定装置
11 照射部
12 検出部
13 分光器
15 レンズ
18 制御部
2 判別装置
21 CPU
24 記憶部
241 コンピュータプログラム
3 通信ネットワーク
4 記憶装置
5 試料
図1
図2
図3
図4
図5
図6A
図6B
図7
図8
図9
図10
図11
図12
図13
図14A
図14B
図15