IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 浜松ホトニクス株式会社の特許一覧

特許7564408色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム
<>
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図1
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図2
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図3
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図4
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図5
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図6
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図7
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図8
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図9
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図10
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図11
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図12
  • 特許-色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-09-30
(45)【発行日】2024-10-08
(54)【発明の名称】色素データ取得方法、色素データ取得装置、及び色素データ取得プログラム
(51)【国際特許分類】
   G01N 21/64 20060101AFI20241001BHJP
【FI】
G01N21/64 F
【請求項の数】 14
(21)【出願番号】P 2024541848
(86)(22)【出願日】2023-12-26
(86)【国際出願番号】 JP2023046650
【審査請求日】2024-07-11
(31)【優先権主張番号】P 2023027533
(32)【優先日】2023-02-24
(33)【優先権主張国・地域又は機関】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】000236436
【氏名又は名称】浜松ホトニクス株式会社
(74)【代理人】
【識別番号】100088155
【弁理士】
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100113435
【弁理士】
【氏名又は名称】黒木 義樹
(74)【代理人】
【識別番号】100140442
【弁理士】
【氏名又は名称】柴山 健一
(74)【代理人】
【識別番号】100124800
【弁理士】
【氏名又は名称】諏澤 勇司
(72)【発明者】
【氏名】樋口 貴文
(72)【発明者】
【氏名】池村 賢一郎
(72)【発明者】
【氏名】山内 嘉晃
(72)【発明者】
【氏名】辻井 健太
(72)【発明者】
【氏名】武宮 孝嗣
(72)【発明者】
【氏名】松岡 泰正
【審査官】伊藤 裕美
(56)【参考文献】
【文献】特開2020-87465(JP,A)
【文献】特開2021-36224(JP,A)
【文献】米国特許出願公開第2022/0082488(US,A1)
【文献】国際公開第2023/026742(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 21/00-21/83
G01N 15/00-15/1492
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
N個(Nは2以上の整数)の対象物を対象に、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを取得するデータ取得ステップと、
前記C個の検出波長毎の各対象物の前記強度値を基に、前記N個の対象物をL個(Lは2以上N-1以下の整数)に対象物群にクラスタリングして、前記C個の検出波長毎の前記強度値をクラスタリングした対象物群毎に配列したL個のクラスタ行列を生成するクラスタリングステップと、
L個のクラスタ行列ごとにC個の検出波長における前記対象物群の前記強度値の統計値を計算する計算ステップと、
L個のクラスタ行列ごとの前記C個の検出波長における前記統計値を用いて、前記C個の検出波長を対象にアンミキシングを行い、K個(Kは2以上C以下の整数)の蛍光色素毎の分布を示す前記K個の色素データを生成するデータ生成ステップと、
を備える色素データ取得方法。
【請求項2】
前記データ取得ステップでは、
複数の励起波長の励起光のそれぞれを前記対象物に照射することで、前記C個の検出波長毎の前記強度値の分布である前記スペクトルデータを取得する、
請求項1に記載の色素データ取得方法。
【請求項3】
前記クラスタリングステップでは、前記強度値の前記C個の検出波長毎の分布情報を基に前記N個の対象物をクラスタリングする、
請求項2に記載の色素データ取得方法。
【請求項4】
前記計算ステップでは、前記統計値を、前記対象物群の前記強度値の積算値、最頻値、あるいは中間値に基づいて計算する、
請求項1~3のいずれか1項に記載の色素データ取得方法。
【請求項5】
前記データ生成ステップでは、L個のクラスタ行列ごとの前記C個の検出波長の前記統計値を用いて、ミキシング行列を求め、前記ミキシング行列を用いてアンミキシングを行う、
請求項1~のいずれか1項に記載の色素データ取得方法。
【請求項6】
前記データ生成ステップでは、非負値行列因子分解を用いて、L個のクラスタ行列ごとの前記C個の検出波長の前記統計値を基に損失値を計算し、前記損失値の和を基に前記ミキシング行列を求める、
請求項5に記載の色素データ取得方法。
【請求項7】
前記データ生成ステップでは、L個のクラスタ行列ごと前記損失値を前記統計値を基に補正し、補正した前記損失値の和を基に前記ミキシング行列を求める、
請求項6に記載の色素データ取得方法。
【請求項8】
前記クラスタリングステップでは、
前記N個の対象物毎に、前記強度値を基に、前記C個の検出波長をM個(Mは2以上C-1以下の整数)の検出波長群にクラスタリングして、前記N個の対象物毎の前記強度値をクラスタリングした検出波長群毎に配列したM個のクラスタ行列をさらに生成する、
請求項1~のいずれか1項に記載の色素データ取得方法。
【請求項9】
N個(Nは2以上の整数)の対象物を対象に、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを処理する色素データ取得装置であって、
前記C個の検出波長毎の各対象物の強度値を基に、前記N個の対象物をL個(Lは2以上N-1以下の整数)に対象物群にクラスタリングして、前記C個の検出波長毎の前記強度値をクラスタリングした対象物群毎に配列したL個のクラスタ行列を生成し、
L個のクラスタ行列ごとにC個の検出波長における前記対象物群の前記強度値の統計値を計算し、
L個のクラスタ行列ごとの前記C個の検出波長における前記統計値を用いて、前記C個の検出波長を対象にアンミキシングを行い、K個(Kは2以上C以下の整数)の蛍光色素毎の分布を示す前記K個の色素データを生成する、
色素データ取得装置。
【請求項10】
複数の励起波長の励起光のそれぞれを前記対象物に照射することで、前記C個の検出波長毎の前記強度値の分布である前記スペクトルデータを取得するデータ取得装置をさらに備える、
請求項9に記載の色素データ取得装置。
【請求項11】
N個(Nは2以上の整数)の対象物を対象にした、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを基に、前記対象物における蛍光色素の分布を示す色素データを生成するための色素データ取得プログラムであって、
コンピュータに、
前記C個の検出波長毎の各対象物の強度値を基に、前記N個の対象物をL個(Lは2以上N-1以下の整数)に対象物群にクラスタリングして、前記C個の検出波長毎の前記強度値をクラスタリングした対象物群毎に配列したL個のクラスタ行列を生成するステップ、
L個のクラスタ行列ごとにC個の検出波長における前記対象物群の前記強度値の統計値を計算するステップ、及び
L個のクラスタ行列ごとの前記C個の検出波長における前記統計値を用いて、前記C個の検出波長を対象にアンミキシングを行い、K個(Kは2以上C以下の整数)の蛍光色素毎の分布を示す前記K個の色素データを生成するステップ、
を実行させる色素データ取得プログラム。
【請求項12】
N個(Nは2以上の整数)の対象物を対象に、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを取得するデータ取得ステップと、
前記N個の対象物毎に、前記強度値を基に、前記C個の検出波長をM個(Mは2以上C-1以下の整数)の検出波長群にクラスタリングして、前記N個の対象物毎の前記強度値をクラスタリングした検出波長群毎に配列したM個のクラスタ行列を生成するクラスタリングステップと、
前記M個のクラスタ行列ごとに前記N個の対象物における前記検出波長群の前記強度値の統計値を計算する計算ステップと、
前記M個のクラスタ行列ごとの前記N個の対象物における前記統計値を用いて、前記N個の対象物を対象にアンミキシングを行い、K個(Kは2以上M以下の整数)の蛍光色素毎の分布を示す前記K個の色素データを生成するデータ生成ステップと、
を備える色素データ取得方法。
【請求項13】
N個(Nは2以上の整数)の対象物を対象に、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを処理する色素データ取得装置であって、
前記N個の対象物毎に、前記強度値を基に、前記C個の検出波長をM個(Mは2以上C-1以下の整数)の検出波長群にクラスタリングして、前記N個の対象物毎の前記強度値をクラスタリングした検出波長群毎に配列したM個のクラスタ行列を生成し、
前記M個のクラスタ行列ごとに前記N個の対象物における前記検出波長群の前記強度値の統計値を計算し、
前記M個のクラスタ行列ごとの前記N個の対象物における前記統計値を用いて、前記N個の対象物を対象にアンミキシングを行い、K個(Kは2以上M以下の整数)の蛍光色素毎の分布を示す前記K個の色素データを生成する、
色素データ取得装置。
【請求項14】
N個(Nは2以上の整数)の対象物を対象にした、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを基に、前記対象物における蛍光色素の分布を示す色素データを生成するための色素データ取得プログラムであって、
コンピュータに、
前記N個の対象物毎に、前記強度値を基に、前記C個の検出波長をM個(Mは2以上C-1以下の整数)の検出波長群にクラスタリングして、前記N個の対象物毎の前記強度値をクラスタリングした検出波長群毎に配列したM個のクラスタ行列を生成するステップ、
前記M個のクラスタ行列ごとに前記N個の対象物における前記検出波長群の前記強度値の統計値を計算するステップ、及び
前記M個のクラスタ行列ごとの前記N個の対象物における前記統計値を用いて、前記N個の対象物を対象にアンミキシングを行い、K個(Kは2以上M以下の整数)の蛍光色素毎の分布を示す前記K個の色素データを生成するステップ、
を実行させる色素データ取得プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
実施形態の一側面は、色素データ取得方法、色素データ取得装置、及び色素データ取得プログラムに関する。
【背景技術】
【0002】
従来から、細胞等の試料を対象にレーザ光を利用して、計数、選別、及び特性解析する技術としてフローサイトメトリーが知られている。例えば、下記特許文献1には、フローサイトメータにおいて出力された細胞からの各色光の蛍光データを対象に、細胞をクラスタリングすることが開示されている。また、下記非特許文献2には、フローサイトメータにおいて出力された蛍光データをアンミキシングして蛍光色素毎の蛍光スペクトルを生成した後、その蛍光スペクトルに対してクラスタリング処理を実行することが開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2020-87465号公報
【文献】特開2021-36224号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述したような従来の手法においては、アンミキシングに用いるミキシング行列が未知の場合に精度の良い蛍光スペクトルを得ることは難しい傾向にある。例えば、観察する色素の種類、使用する励起光の種類、等が変わったことにより観察条件が変化した場合に精度の良い蛍光スペクトルを得るのは難しい。
【0005】
そこで、実施形態の一側面は、かかる課題に鑑みてなされたものであり、観察条件が変化した場合でも精度の良い蛍光スペクトルを得ることが可能な色素データ取得方法、色素データ取得装置、及び色素データ取得プログラムを提供することを課題とする。
【課題を解決するための手段】
【0006】
実施形態の第一の側面に係る色素データ取得方法は、N個(Nは2以上の整数)の対象物を対象に、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを取得するデータ取得ステップと、C個の検出波長毎の各対象物の強度値を基に、N個の対象物をL個(Lは2以上N-1以下の整数)に対象物群にクラスタリングして、C個の検出波長毎の強度値をクラスタリングした対象物群毎に配列したL個のクラスタ行列を生成するクラスタリングステップと、L個のクラスタ行列ごとにC個の検出波長における対象物群の強度値の統計値を計算する計算ステップと、L個のクラスタ行列ごとのC個の検出波長における統計値を用いて、C個の検出波長を対象にアンミキシングを行い、K個(Kは2以上C以下の整数)の蛍光色素毎の分布を示すK個の色素データを生成するデータ生成ステップと、を備える。
【0007】
あるいは、実施形態の第二の側面に係る色素データ取得装置は、N個(Nは2以上の整数)の対象物を対象に、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを処理する色素データ取得装置であって、C個の検出波長毎の各対象物の強度値を基に、N個の対象物をL個(Lは2以上N-1以下の整数)に対象物群にクラスタリングして、C個の検出波長毎の強度値をクラスタリングした対象物群毎に配列したL個のクラスタ行列を生成し、L個のクラスタ行列ごとにC個の検出波長における対象物群の強度値の統計値を計算し、L個のクラスタ行列ごとのC個の検出波長における統計値を用いて、C個の検出波長を対象にアンミキシングを行い、K個(Kは2以上C以下の整数)の蛍光色素毎の分布を示すK個の色素データを生成する。
【0008】
あるいは、実施形態の第三の側面に係る色素データ取得プログラムは、N個(Nは2以上の整数)の対象物を対象にした、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを基に、対象物における蛍光色素の分布を示す色素データを生成するための色素データ取得プログラムであって、コンピュータに、C個の検出波長毎の各対象物の強度値を基に、N個の対象物をL個(Lは2以上N-1以下の整数)に対象物群にクラスタリングして、C個の検出波長毎の強度値をクラスタリングした対象物群毎に配列したL個のクラスタ行列を生成するステップ、L個のクラスタ行列ごとにC個の検出波長における対象物群の強度値の統計値を計算するステップ、及びL個のクラスタ行列ごとのC個の検出波長における統計値を用いて、C個の検出波長を対象にアンミキシングを行い、K個(Kは2以上C以下の整数)の蛍光色素毎の分布を示すK個の色素データを生成するステップ、を実行させる。
【0009】
上記第一の側面、上記第二の側面、あるいは上記第三の側面によれば、N個の対象物毎にC個の検出波長の蛍光分布のスペクトルデータが取得される。このスペクトルデータがL個の対象物群にクラスタリングされ、C個の検出波長毎に対象物群の強度値を配列したL個のクラスタ行列が生成され、L個のクラスタ行列毎に対象物群の強度値の統計値が計算される。さらに、L個のクラスタ行列の統計値を基にアンミキシングが行われる結果、K個の蛍光色素の対象物毎の分布を示すK個の色素データが生成される。これにより、観察する色素の種類、あるいは観察に用いる励起光の種類等が変化した場合、色素毎の数の偏りが発生した場合であっても、その観察条件に適したアンミキシングが実行され、精度の良い蛍光スペクトルデータである色素データを得ることができる。
【0010】
実施形態の第四の側面に係る色素データ取得方法は、N個(Nは2以上の整数)の対象物を対象に、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを取得するデータ取得ステップと、N個の対象物毎に、強度値を基に、C個の検出波長をM個(Mは2以上C-1以下の整数)の検出波長群にクラスタリングして、N個の対象物毎の強度値をクラスタリングした検出波長群毎に配列したM個のクラスタ行列を生成するクラスタリングステップと、M個のクラスタ行列ごとにN個の対象物における検出波長群の強度値の統計値を計算する計算ステップと、M個のクラスタ行列ごとのN個の対象物における統計値を用いて、N個の対象物を対象にアンミキシングを行い、K個(Kは2以上M以下の整数)の蛍光色素毎の分布を示すK個の色素データを生成するデータ生成ステップと、を備える。
【0011】
あるいは、実施形態の第五の側面に係る色素データ取得装置は、N個(Nは2以上の整数)の対象物を対象に、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを処理する色素データ取得装置であって、N個の対象物毎に、強度値を基に、C個の検出波長をM個(Mは2以上C-1以下の整数)の検出波長群にクラスタリングして、N個の対象物毎の強度値をクラスタリングした検出波長群毎に配列したM個のクラスタ行列を生成し、M個のクラスタ行列ごとにN個の対象物における検出波長群の強度値の統計値を計算し、M個のクラスタ行列ごとのN個の対象物における統計値を用いて、N個の対象物を対象にアンミキシングを行い、K個(Kは2以上M以下の整数)の蛍光色素毎の分布を示すK個の色素データを生成する。
【0012】
あるいは、実施形態の第六の側面に係る色素データ取得プログラムは、N個(Nは2以上の整数)の対象物を対象にした、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを基に、対象物における蛍光色素の分布を示す色素データを生成するための色素データ取得プログラムであって、コンピュータに、N個の対象物毎に、強度値を基に、C個の検出波長をM個(Mは2以上C-1以下の整数)の検出波長群にクラスタリングして、N個の対象物毎の強度値をクラスタリングした検出波長群毎に配列したM個のクラスタ行列を生成するステップ、M個のクラスタ行列ごとにN個の対象物における検出波長群の強度値の統計値を計算するステップ、及び M個のクラスタ行列ごとのN個の対象物における統計値を用いて、N個の対象物を対象にアンミキシングを行い、K個(Kは2以上M以下の整数)の蛍光色素毎の分布を示すK個の色素データを生成するステップ、を実行させる。
【0013】
上記第四の側面、上記第五の側面、あるいは上記第六の側面によれば、N個の対象物毎にC個の検出波長の蛍光分布のスペクトルデータが取得される。このスペクトルデータがM個の検出波長群にクラスタリングされ、N個の対象物毎に検出波長群の強度値を配列したM個のクラスタ行列が生成され、M個のクラスタ行列毎に検出波長群の強度値の統計値が計算される。さらに、M個のクラスタ行列の統計値を基にアンミキシングが行われる結果、K個の蛍光色素の対象物毎の分布を示すK個の色素データが生成される。これにより、観察する色素の種類、あるいは観察に用いる励起光の種類等が変化した場合であっても、その観察条件に適したアンミキシングが実行され、精度の良い蛍光スペクトルデータである色素データを得ることができる。
【発明の効果】
【0014】
実施形態の一側面によれば、観察条件が変化した場合に精度の良い蛍光スペクトルを得ることができる。
【図面の簡単な説明】
【0015】
図1】実施形態にかかる色素データ取得システム1の概略構成図である。
図2図1のデータ取得装置3の概略構成図である。
図3図1のデータ処理装置5のハードウェア構成の一例を示すブロック図である。
図4図1のデータ処理装置5の機能構成を示すブロック図である。
図5図4の統計値計算部203によって再生成される行列データY’及び図4の行列推定部204によって導出される色素行列データX’のイメージを示す図である。
図6】実施形態に係る色素データ取得方法の手順を示すフローチャートである。
図7】フローサイトメトリーにおける一般的な分析対象物の集団同定の方法を説明するためのグラフである。
図8】色素データ取得システム1においてクラスタリング処理を省略して取得された2つの色素に関する色素データの分布を示すグラフである。
図9】色素データ取得システム1においてクラスタリング処理を実行して取得された2つの色素に関する色素データの分布を示すグラフである。
図10】色素データ取得システム1においてクラスタリング処理を省略して取得された2つの色素に関する色素データの分布を示すグラフである。
図11】色素データ取得システム1においてクラスタリング処理を実行して取得された2つの色素に関する色素データの分布を示すグラフである。
図12】実施形態に係る色素データ取得システム1において取得されたある蛍光波長帯の強度のヒストグラム及び色素Bの発現量のヒストグラムを示すグラフである。
図13】変形例に係るデータ取得装置3Aの概略構成図である。
【発明を実施するための形態】
【0016】
以下、添付図面を参照して、本発明の実施形態について詳細に説明する。なお、説明において、同一要素又は同一機能を有する要素には、同一符号を用いることとし、重複する説明は省略する。
【0017】
図1は、実施形態にかかる色素データ取得装置である色素データ取得システム1の概略構成図である。色素データ取得システム1は、分析対象物である細胞(セル)、粒子等の試料内に含まれる色素(蛍光色素)の量を特定するための色素データを生成するための装置である。色素データ取得システム1によって生成される色素データは、そのデータの解析を通じた、セル等の計数、選別、特性解析等の目的に用いられる。そのため、色素データ取得システム1には、多量の分析対象物の色素データを高スループットで生成することが求められる。色素データ取得システム1は、分析対象物を対象にフローサイトメトリーによる分析を実行するデータ取得装置3と、データ取得装置3によって取得されたデータを処理するデータ処理装置5とを備えている。データ取得装置3とデータ処理装置5とは、それらの間で有線通信あるいは無線通信を用いてデータが送受信可能に構成されていてもよいし、記録媒体を介してデータが入出力可能に構成されていてもよい。また、データ取得装置3とデータ処理装置5とは一体化された装置によって構成されていてもよい。
【0018】
図2は、図1のデータ取得装置3の概略構成図である。データ取得装置3は、フローサイトメトリーを実施するためのシステムであり、一般的にフローサイトメータと呼ばれ、流体システム52、光学システム(光学系)53、及び電子システム(信号処理装置)54によって構成される。
【0019】
流体システム52は、細胞あるいは粒子等の分析対象物を含むサンプル流体が注入され、サンプル流体に含まれる分析対象物を細いチャネル55内に整列させて通過させることが可能なフローセル56を含んで構成される。このフローセル56には、ゲーティングされた分析対象物を電場制御等によってソーティング(分類および振り分け)する機能(図示せず)も設けられている。
【0020】
光学システム53は、フローセル56内を通過する分析対象物をフローサイトメトリーにより光学的に分析するシステムである。この光学システム53は、光源7a,7b,7c,7d、ダイクロイックミラー57a,57b,57c、ミラー57d、レンズ8、フィルタ9a,9b,9c,9d、ダイクロイックミラー10b,10c、光検出器11a,11b,11c,11dを含んで構成され、フローサイトメトリーによって分析対象物から発生した各種の光を光検出器11a,11b,11c,11dに導光する。光源7a,7b,7c,7dは、それぞれ、互いに異なる中心波長(励起波長)を有する光(励起光)を生成する光源装置である。光源7a,7b,7c,7dは、例えば、レーザ光源、発光ダイオード或いはスーパールミネッセントダイオードなどである。ダイクロイックミラー57aは、光源7aから照射された光をレンズ8に向けて透過し、その他の光源7b,7c,7dから照射された光をレンズ8に向けて反射する。ダイクロイックミラー57bは、光源7bから照射された光をダイクロイックミラー57aに向けて反射し、光源7c,7dから照射された光をダイクロイックミラー57aに向けて透過する。ダイクロイックミラー57cは、光源7cから照射された光をダイクロイックミラー57bに向けて反射し、光源7dから照射された光をダイクロイックミラー57bに向けて透過する。ミラー57dは、光源7dから照射された光をダイクロイックミラー57cに向けて反射する。レンズ8は光源7a,7b,7c,7dから出射された光をフローセル56内のチャネル55に集光する。フィルタ9aは、光の照射によってサンプル流体から生じた前方散乱光(つまり、光源7a,7b,7c,7dからの光の少なくとも1つの光)を透過させる。ダイクロイックミラー10bは、光源7a,7b,7c,7dからそれぞれ出射された光の照射によってサンプル流体から生じた蛍光のうち第一の波長帯(第一の検出波長)の蛍光(第一の蛍光)を反射し、サンプル流体から生じた蛍光のうち残余の蛍光を透過させる。ダイクロイックミラー10cは、ダイクロイックミラー10bを透過した蛍光のうちの第二の波長帯(第二の検出波長)の蛍光(第二の蛍光)を反射し、ダイクロイックミラー10bを透過した蛍光のうちの残余の波長帯(第三の検出波長)の蛍光(第三の蛍光)を透過させる。フィルタ9bは、ダイクロイックミラー10bによって反射された第一の波長帯の第一の蛍光を透過させ、フィルタ9cは、ダイクロイックミラー10cによって反射された第二の波長帯の第二の蛍光を透過させる。フィルタ9dは、ダイクロイックミラー10cを透過した蛍光のうち第三の波長帯の第三の蛍光を透過させる。光検出器11a,11b,11c,11dは、それぞれ、前方散乱光、第一の蛍光、第二の蛍光、及び第三の蛍光の光軸上に設けられ、前方散乱光、第一の蛍光、第二の蛍光、及び第三の蛍光のそれぞれの強度を測定する。光検出器11a,11b,11c,11dは、例えば、光電子増倍管、アバランシェフォトダイオード、HPD(Hybrid Photo Detector)或いはSiPM(Silicon Photomultipliers)などである。また、光検出器11a,11b,11c,11dは、複数の検出口を有する単一の光検出器によって構成されてもよい。このような単一の光検出器としては、マルチアノード光電子増倍管などがある。光学システム53は、ダイクロイックミラー、フォルタ、光検出器の組み合わせの数に応じて、C個(Cは2以上の整数)の検出波長毎の蛍光のそれぞれの強度を測定することができる。
【0021】
なお、光学システム53は、光源7a,7b,7c,7dから複数の波長帯の光を切り替えて照射させながら、前方散乱光、第一の蛍光、第二の蛍光、及び第三の蛍光のそれぞれの強度を測定することが可能とされている。これにより、複数波長帯の蛍光の強度を効率的に測定できる。また、光学システム53は、光源7a,7b,7c,7dから複数の波長帯の光を連続的に照射させながら、前方散乱光、第一の蛍光、第二の蛍光、及び第三の蛍光のそれぞれの強度を測定することが可能とされてもよい。また、光学システム53は、上記と同様な構成により、側方散乱光を観察可能な構成を有していてもよい。
【0022】
電子システム54は、光学システム53によって測定された光の強度のデータを収集するための装置である。具体的には、電子システム54は、複数の光検出器11a,11b,11c,11dに電気的に接続され、複数の光検出器11a,11b,11c,11dの各チャネルで検出された強度を示す強度信号をA/D変換することにより、A/D変換後の分析対象物毎の強度値を一次元に配列した配列データを生成し、外部に送信する。ここで、電子システム54は、複数の光検出器11a,11b,11c,11dによって検出された強度信号をそのままA/D変換して配列データを生成してもよいし、強度信号あるいはA/D変換後の強度値を各種パラメータによって補正して、補正後の強度信号あるいは補正後の強度値に基づいた配列データを生成してもよい。
【0023】
次に、図3および図4を参照して、データ処理装置5の構成を説明する。図3は、データ処理装置5のハードウェア構成の一例を示すブロック図であり、図4は、データ処理装置5の機能構成を示すブロック図である。
【0024】
図3に示すように、データ処理装置5は、物理的には、プロセッサであるCPU(Central Processing Unit)101、記録媒体であるRAM(Random Access Memory)102又はROM(Read Only Memory)103、通信モジュール104、及び入出力モジュール106等を含んだコンピュータ等であり、各々は電気的に接続されている。なお、データ処理装置5は、入出力デバイスとして、ディスプレイ、キーボード、マウス、タッチパネルディスプレイ等を含んでいてもよいし、ハードディスクドライブ、半導体メモリ等のデータ記録装置を含んでいてもよい。また、データ処理装置5は、複数のコンピュータによって構成されていてもよい。
【0025】
図4に示すように、データ処理装置5は、機能的な構成要素として、データ取得部201、クラスタリング部202、統計値計算部203、行列推定部204、及びデータ生成部205を備えている。図4に示すデータ処理装置5の各機能部は、CPU101及びRAM102等のハードウェア上にプログラム(実施形態にかかる色素データ取得プログラム)を読み込ませることにより、CPU101の制御のもとで、通信モジュール104、及び入出力モジュール106等を動作させるとともに、RAM102におけるデータの読み出し及び書き込みを行うことで実現される。データ処理装置5のCPU101は、このコンピュータプログラムを実行することによって図4の各機能部を機能させ、後述する色素データ取得方法に対応する処理を順次実行する。なお、CPU101は、単体のハードウェアでもよく、ソフトプロセッサのようにFPGAのようなプログラマブルロジックの中に実装されたものでもよい。RAMやROMについても単体のハードウェアでもよく、FPGAのようなプログラマブルロジックの中に内蔵されたものでもよい。このコンピュータプログラムの実行に必要な各種データ、及び、このコンピュータプログラムの実行によって生成された各種データは、全て、ROM103、RAM102等の内蔵メモリ、又は、ハードディスクドライブなどの記憶媒体に格納される。以下、データ処理装置5の機能的な構成要素の機能について詳細に説明する。
【0026】
データ取得部201は、N個(Nは2以上の整数)の分析対象物を対象とした予め指定されたC個(Cは2以上の整数)の波長帯の蛍光に関する配列データを、データ取得装置3から取得する。これらのC個の配列データは、データ取得装置3において、複数の波長帯の光を切り替えて照射させながら、N個の分析対象物からのC個の波長帯毎の蛍光の強度値の分布を測定することによって得られたスペクトルデータである。このとき、取得される配列データの個数C(観察される蛍光の波長帯の数C)は、分析対象物に含まれうる色素の最大の数以上になるように予め指定される。
【0027】
クラスタリング部202は、データ取得部201によって取得されたC個の配列データを読み取って、C個の波長帯毎の各分析対象物の強度値を基に、C個の配列データを構成するN個の分析対象物を対象にクラスタリングを実行する。クラスタリングの処理に先立って、クラスタリング部202は、C個の配列データのそれぞれを構成するN個の分析対象物の強度値を並列に一次元に配列した行列データYを生成する。
【0028】
そして、クラスタリング部202は、各蛍光の波長帯の強度値の分布情報を基に、N個の分析対象物をL個(Lは2以上N-1以下の整数)の対象物群にクラスタリングする。例えば、クラスタリング部202は、色素間で強度値の差が生じやすい波長帯を選択し、その波長帯の強度値のヒストグラムを作成し、そのヒストグラムを基に2つのピーク間に閾値を設定する。さらに、クラスタリング部202は、設定した閾値と配列データの強度値とを比較することによって、分析対象物を2つの対象物群にクラスタリングすることができる。クラスタリング部202は、同様な機能により、分析対象物を3以上の対象物群に分類することができる。ここで、クラスタリング部202がクラスタリングする対象物群の数Lは、分析対象物に存在しうる色素の種類の数に対応させて、データ処理装置5内に記憶されるパラメータとして予め設定される。そして、クラスタリング部202は、C個の配列データの分析対象物の強度値を一次元に並列に配列した行列データYを、L個の対象物群毎のクラスタ行列に分割して再生成する。なお、クラスタリング部202がクラスタリングする対象物群の数Lは、検出波長帯の種類や検出波長帯の数(C個)に応じて予め設定されてもよい。また、クラスタリング部202がクラスタリングする対象物群の数Lは、これらに無関係に設定されてもよい。
【0029】
統計値計算部203及び行列推定部204は、分析対象物を対象にして得られたL個のクラスタ行列を基に、C個の配列データからK個(Kは2以上C以下の整数)の色素のそれぞれの分布を示すK個の色素データを生成するためのミキシング行列Aを求める。一般に、非負値行列因子分解(NMF)の演算方式によれば、観測値行列である行列データYと、K個の色素データを分析対象物毎に一次元に並列に配列した色素行列データXとの関係は、ミキシング行列Aを用いて、下記式;
Y=AX
で表わされる。ここで、Yは、C行N列の行列データであり、Aは、C行K列の行列データであり、Xは、K行N列の行列データである。逆に、ミキシング行列Aの値が求まれば、色素行列データXは、ミキシング行列Aの逆行列A-1と行列データYとを用いて、下記式;
X=A-1
によって導き出すことができる(この処理をアンミキシングと言う。)。
【0030】
ここで、統計値計算部203は、クラスタリング部202によって生成された行列データYを、クラスタリング部202によってクラスタリングされた対象物群単位で圧縮することによって、行列データY’を再生成する。詳細には、統計値計算部203は、行列データYの各行の強度値を対象に、クラスタリングされたクラスタ行列の対象物群毎に統計値を計算し、各行の対象物群を、計算した統計値を有する1つの対象物に圧縮する。これにより、統計値計算部203は、C行L列の行列データである行列データY’を再生成する。統計値計算部203は、統計値として、強度値の積算値に基づいた平均値を計算してもよいし、強度値の最頻値を計算してもよいし、強度値の中間値を計算してもよい。
【0031】
行列推定部204は、統計値計算部203が再生した行列データY’、及び、色素行列データXから同様にして圧縮される色素行列データX’にも、ミキシング行列Aを含む下記式;
Y’=AX’
が成立する性質を利用して、行列データY’を基にミキシング行列Aを導出する。図5には、統計値計算部203によって再生成される行列データY’、及びそれに対応する色素行列データX’のイメージを示している。図5に図示される1つの升目は行列データの1つの要素を表している。例えば、3つの対象物群PGr01~PGr03に分割された色素行列データX及び行列データYは、対象物群PGr01~PGr03毎の統計値を代表値として、3列の色素行列データX’及び行列データY’に圧縮される。
【0032】
行列推定部204は、次のようにして、行列データY’を基にミキシング行列Aを導出する。すなわち、行列推定部204は、ミキシング行列Aに初期値を設定し、ミキシング行列Aの値を順次変更しながら下記のロス関数(損失値)Losを計算し、ロス関数Losの値を低減させるようなミキシング行列Aを導出する。なお、このロス関数には、L1ノルムλ|A|(λは正則化項を重視する度合いを示す係数)等の正則化項が追加されてもよい。
【数1】

上記式中、jは行列データの行の位置(蛍光の波長帯に対応)を示すパラメータであり、行列の添え字1jは、1番目のクラスタ行列のj番目の行の行列データを示し、行列の添え字2jは、2番目のクラスタ行列のj番目の行の行列データを示し、行列の添え字3jは、3番目のクラスタ行列のj番目の行の行列データを示す。また、パラメータa、b、cは、行列データY’の各列の統計値の平均値を示している。
【0033】
上記のように、行列推定部204は、クラスタリング部202によって分割されたL個のクラスタ行列毎に、C個の行列データY’の統計値を参照してロス関数を計算し、L個のロス関数の和を基にロス関数Losを計算し、そのロス関数Losを基にミキシング行列Aを求める。この際、行列推定部204は、L個のクラスタ行列毎に計算したロス関数を、C個の行列データY’の統計値の平均値a,b,cで除算することによって補正してから、補正したロス関数の和を計算することによってロス関数Losを求めている。なお、行列推定部204は、L個のクラスタ行列毎のロス関数を、差分値Y’-AX’の蛍光の波長帯毎の行成分を蛍光の各波長帯に対応するC個の統計値を用いて除算して補正することによって、計算してもよい。
【0034】
なお、上記式は、次のように一般化することもできる。つまり、行列推定部204は、次のようにして、行列データY’を基にミキシング行列Aと色素行列データX’を導出する。すなわち、行列推定部204は、ミキシング行列Aと色素行列データX’に初期値を設定し、ミキシング行列Aと色素行列データX’の値を順次変更しながら下記式を用いてロス関数(損失値)Losを計算し、ロス関数Losの値を低減させるようなミキシング行列Aと色素行列データX’を導出する。なお、このロス関数には、L1ノルムλ|A|(λは正則化項を重視する度合いを示す係数)等の正則化項が追加されてもよい。また、ミキシング行列Aと色素行列データX’が非負値になるような制約をかけて計算してもよい。
【数2】

上記式中、jは行列データの行の位置(蛍光の波長帯に対応)を示すパラメータであり、iは行列データの列の位置(i番目のクラスタに対応)を示すパラメータである。また、wijは行列データの各要素の重みを表しており、各要素の値またはその標準偏差から計算しても良い。また、wijを全て同じ値にして各要素の重みを考慮しないことも可能である。なお、上記式における行列データY’の各列の統計値の平均値をa、b、c、…とし、w1j=1/a、w2j=1/b、w3j=1/cと置き換えた式は、先に示したロス関数Losの式と同じとなる。
【0035】
上記のように、行列推定部204は、クラスタリング部202によって分割されたL個のクラスタ行列毎に、C個の行列データY’の統計値を参照してロス関数を計算し、L個のロス関数Losの和を基にロス関数Losを計算し、そのロス関数Losを基にミキシング行列Aを求める。なお、行列推定部204は、L個のクラスタ行列毎のロス関数Losを、差分値Y’-AX’の蛍光の波長帯毎の行成分を蛍光の各波長帯に対応するC個の統計値を用いて除算して補正することによって、計算してもよい。
【0036】
データ生成部205は、分析対象物を対象にして得られたC個の配列データに対して、行列推定部204によって導出されたミキシング行列Aを用いてアンミキシングすることによって、K個の色素データを取得する。具体的には、データ生成部205は、クラスタリング部202によってC個の配列データを基に生成された行列データYに、ミキシング行列Aの逆行列A-1を適用することにより、色素行列データXを計算する。そして、データ生成部205は、色素行列データXからK個の色素データを再生し、再生したK個の色素データを出力する。このときの出力先は、ディスプレイ、タッチパネルディスプレイ等のデータ処理装置5の出力デバイスであってもよいし、データ処理装置5にデータ通信可能に接続された外部の装置であってもよい。また、データ生成部205によって生成された色素データは、分析対象物の計数、選別、特性解析等の目的でデータ解析に用いられてもよい。
【0037】
次に、本実施形態に係る色素データ取得システム1を用いた分析対象物を対象にした観察処理の手順、すなわち、本実施形態に係る色素データ取得方法の流れについて説明する。図6は、色素データ取得システム1による観察処理の手順を示すフローチャートである。
【0038】
まず、データ取得装置3によって、複数の分析対象物を対象にした観察処理が実行される結果、配列データが生成および送信される(ステップS1)。次に、データ処理装置5のデータ取得部201によって、C個の蛍光波長帯の配列データが、データ取得装置3から取得される(ステップS2;データ取得ステップ)。
【0039】
さらに、データ処理装置5のクラスタリング部202によって、C個の配列データを対象にクラスタリングが実行され、配列データのN個の分析対象物がL個の対象物群にクラスタリングされる(ステップS3;クラスタリングステップ)。次に、データ処理装置5の統計値計算部203により、L個の対象物群の統計値を計算することにより、クラスタリング部202によって生成された行列データYを基に行列データY’が再生成される(ステップS4;計算ステップ)。
【0040】
そして、データ処理装置5の行列推定部204により、行列データY’を基にミキシング行列Aが導出される(ステップS5;データ生成ステップ)。最後に、データ処理装置5のデータ生成部205により、分析対象物を対象にしたC個の配列データを基に生成された行列データYがミキシング行列Aを用いてアンミキシングされることにより、K個の色素データが取得および出力される(ステップS6;データ生成ステップ)。以上により、複数の分析対象物を対象にした観察処理が完了する。
【0041】
以上説明した色素データ取得システム1によれば、N個の分析対象物毎にC個の波長帯の蛍光の分布を示すスペクトルデータが取得される。このスペクトルデータがL個の対象物群にクラスタリングされ、C個の蛍光波長帯毎に対象物群の強度値を配列したL個のクラスタ行列が生成され、L個のクラスタ行列毎に対象物群の強度値の統計値が計算される。さらに、L個のクラスタ行列の統計値を基にアンミキシングが行われる結果、K個の蛍光色素の対象物毎の分布を示すK個の色素データが生成される。これにより、観察する色素の種類、あるいは観察に用いる励起光の種類等が変化した場合、色素毎の数の偏りが発生した場合であっても、その観察条件に適したアンミキシングが実行され、精度の良い蛍光スペクトルデータである色素データを得ることができる。
【0042】
フローサイトメトリーは、細胞、細胞表面タンパク質、細胞内タンパク質を染色することで、細胞集団の同定あるいは定量を可能とし、セルソーティング、免疫表現型などの用途に利用できる手法である。本実施形態によれば、取得した色素データを基に、例えば、血液細胞に対して使用した抗体の発現の組み合わせを分析することによって、どの細胞が腫瘍化しているのかを精度よく同定することができる。
【0043】
本実施形態においては、複数の波長帯の光のそれぞれを分析対象物に照射することで、C個の蛍光波長帯毎の強度値の分布であるスペクトルデータが取得されている。これにより、複数の波長帯の光を用いることで、複数種類の蛍光色素からの蛍光を効率よく観察することができる。その結果、複数の蛍光色素を観察対象とする場合に精度の良い色素データを得ることができる。
【0044】
また、本実施形態においては、強度値のC個の蛍光波長帯毎の分布情報を基にN個の分析対象物がクラスタリングされている。このように分布情報を利用することで、蛍光波長分布の類似性を基にクラスタリングすることができる。その結果、観察条件に適したアンミキシングが実行され、精度の良い色素データを得ることができる。
【0045】
また、本実施形態においては、配列データの統計値が、対象物群の強度値の積算値、最頻値、あるいは中間値に基づいて計算されている。この場合、クラスタ行列におけるL個の対象物群の強度値の全体的傾向を基にアンミキシングを実行することができ、観察条件に適したアンミキシングが実行され、精度の良い色素データを得ることができる。
【0046】
また、本実施形態においては、L個のクラスタ行列ごとのC個の蛍光波長帯の統計値を用いて、ミキシング行列Aが求められ、ミキシング行列Aを用いてアンミキシングが行われている。この場合、解析対象物の数、観察に用いる励起光の種類、あるいは、観察する蛍光バンドの数が増加しても、アンミキシングを行う際の計算量を抑えることができる。また、クラスタリングされたクラスタ行列毎の強度値の統計値を用いてアンミキシングを行うことで、色素データの分離の精度も向上させることができる。従来は、ミキシング行列Aの導出を各色素のリファレンス情報(蛍光スペクトル、吸収スペクトル等)を基に計算することによって行っていた。本実施形態では、そのようなリファレンス情報が未知の場合であっても、配列データから得られる行列データYからミキシング行列を推定することができる。結果として、分離データの精度を高めつつ色素データを取得する際のスループットの向上を図ることができる。
【0047】
さらに、本実施形態においては、非負値行列因子分解を用いて、L個のクラスタ行列ごとのC個の蛍光波長帯の統計値を基にロス関数Losが計算され、ロス関数Losの和を基にミキシング行列Aが求められている。この場合、クラスタリングされた配列データのL個の対象物群の統計値を基にロス関数Losが計算され、これらのロス関数Losの和を基にミキシング行列Aが求められ、そのミキシング行列Aを用いてアンミキシングを実行することができる。これにより、複数の分析対象物に含まれる各色素の量に差がある場合であっても、生成される色素データの精度をさらに向上させることができる。すなわち、クラスタリングすることなく配列データを対象にロス関数Losを計算する場合には、相対的に量が多い色素の分離精度が重視されるため、結果として相対的に量が少ない色素の分離精度が低下してしまうが、本実施形態では、複数の色素の分離精度を一律に向上させることができる。また、色素データを取得する際のスループットの向上も図ることができる。
【0048】
また、本実施形態においては、L個のクラスタ行列ごとロス関数Losが統計値を基にした係数a,b,cを用いて補正され、補正されたロス関数Losの和を基にミキシング行列Aが求められている。こうすれば、クラスタリングされた配列データのL個の対象物群の統計値を基にロス関数Losが計算され、ロス関数Losの和を求める際に統計値を基にそれぞれのロス関数Losが補正される。これにより、分析対象物の配列データにおける各色素の蛍光強度に差がある場合であっても、精度よく色素データを生成することができる。すなわち、L個のロス関数Losを補正することなくロス関数Losを計算する場合には、相対的に強度の強い色素の分離精度が重視されるため、結果として相対的に強度の弱い色素の分離精度が低下してしまうが、本実施形態では、複数の色素の分離精度を一律に向上させることができる。
【0049】
図7は、フローサイトメトリーにおける一般的な分析対象物の集団同定の方法を説明するためのグラフである。一般的なフローサイトメトリーでは、複数の細胞に関する、“検出波長1”の波長帯の蛍光強度及び“検出波長2”の波長帯の蛍光強度を基に、ドットプロットDPのグラフが生成され、そのドットプロットDPを基に、“検出波長1”の強度のヒストグラムHG1と、“検出波長2”の強度のヒストグラムHG2が作成される。そして、HG1,HG2の分布を基に決定した閾値を基に、もしくはドットプロットDPを基にゲーティングを行うことで、“色素A”の集団と、“色素B”の集団とが同定される。
【0050】
しかしながら、単一の色素からの蛍光には複数種類の蛍光波長帯が含まれており、異なる色素間で蛍光に含まれる波長帯の分布が複雑に変化している。また、1つの分析対象物には複数の色素が含まれうる。上記の従来の集団同定方法では、色素間でヒストグラムHG1,HG2の分布が重なり合う場合は閾値によって精度よく2つの色素を分離することが難しく、精度よく色素を同定することができない。また、ドットプロットDP上でゲーティングしても精度よく2つの色素を分離することが難しく、精度よく色素を同定することができない。そればかりか、1つの分析対象物に含まれる複数の色素を同定することは難しい。これに対して、本実施形態によれば、C個の蛍光波長帯の配列データをアンミキシングして処理することにより、精度よい各色素の発現量を定量的に得ることができる。
【0051】
図8図11には、色素データ取得システム1において取得された2つの色素に関する色素データの分布を示す。図8図11において、(a)部は2つの蛍光波長帯の強度値のドットプロットを示すグラフであり、(b)部は2つの色素“色素A”、“色素B”の発現量(分布)を示すグラフである。図8は、色素毎の数に差がある場合(色素Aのセル数が色素Bのセル数の1/100の場合)にデータ処理装置5においてクラスタリング処理を省略して色素データを取得した結果を示し、図9は、色素毎の数に差がある場合(色素Aのセル数が色素Bのセル数の1/100の場合)にデータ処理装置5においてクラスタリング処理を実行して色素データを取得した結果を示す。また、図10は、色素毎の強度に差がある場合(色素Aのセルの強度が色素Bのセルの強度の1/10の場合)にデータ処理装置5においてクラスタリング処理を省略して色素データを取得した結果を示し、図11は、色素毎の強度に差がある場合(色素Aのセルの強度が色素Bのセルの強度の1/10の場合)にデータ処理装置5においてクラスタリング処理を実行して色素データを取得した結果を示す。
【0052】
図8に示すように、クラスタリング処理を省略した場合は、点線で示す範囲に色素Aの単色セルが存在しているが、2つの色素の発現量が分離して求められていない。これに対して、図9に示すように、クラスタリング処理を実行した場合には、点線で示す範囲に色素Aの単色セルの発現量が計算されており、2つの色素の発現量が精度よく分離されている。
【0053】
図10に示すように、クラスタリング処理を省略した場合は、2つの色素の発現量が分離して求められていない。これに対して、図11に示すように、クラスタリング処理を実行した場合には、2つの色素の発現量が分離されており、2つの色素の発現量が精度よく計算されている。
【0054】
図12には、(a)部に色素データ取得システム1において取得されたある蛍光波長帯の強度の色素Aのセル及び色素Bのセル毎のヒストグラムを示し、(b)部に色素データ取得システム1において取得された色素Bの発現量のヒストグラムを示している。このように、蛍光波長帯の強度のヒストグラムについては2つの色素間で重なりが大きいため、このヒストグラムによっては色素の同定が難しいことが理解される。これに対して、本実施形態によって得られた色素データによれば、色素Bの発現量を精度よく分離できている。
【0055】
以上、本発明の種々の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、各請求項に記載した要旨を変更しない範囲で変形し、又は他のものに適用したものであってもよい。
【0056】
データ処理装置5における対象物群のクラスタリングの手法としては、K-means法のような機械学習を用いた手法、ディープラーニングを用いた手法等が採用されてもよい。
【0057】
また、データ処理装置5における対象物群のクラスタリングの手法としては、K-means法の他に、決定木、サポートベクタマシン、KNN(K最近傍)、自己組織化マップ、スペクトラルクラスタリング、混合ガウスモデル、DBSCAN、Affinity Propagation、MeanShift、Ward、Agglomerative Clustering、OPTICS、BIRCHのような機械学習を用いた手法、ディープラーニングを用いた手法等が採用されてもよい。また、クラスタリングを適用する前に行列データYに前処理を行ってもよい。例えば、Phasor Analysisや主成分分析、特異値分解、独立成分分析、線形判別分析、t-SNE、UMAP、その他機械学習などにより、各分析対象物C次元のデータを次元削減してもよい。
【0058】
データ処理装置5のクラスタリング部202は、行列データYを、各波長帯の強度値を基にC個の蛍光波長帯をM個(Mは2以上C-1以下の整数)の波長群(検出波長群)にクラスタリングして、検出対象物毎の強度値を波長群毎に配列したM個のクラスタ行列をさらに生成してもよい。このM個のクラスタ行列の生成は、上述したL個のクラスタ行列の生成前であってもよいし、L個のクラスタ行列の生成後であってもよい。この際、統計値計算部203は、上述した方法と同様な方法によって、クラスタリングされた波長群単位でも行列データYを統計値を用いて圧縮することによって行列データY’を再生成する。このように、蛍光波長帯どうしでもクラスタリングすることによって、色素データのS/Nを向上させることができる。また、アンミキシングを行う際の計算量をさらに抑えることができる。また、クラスタリングされた波長群毎の強度値の統計値を用いてアンミキシングを行うことで、色素データの分離の精度も維持することができる。
【0059】
なお、データ処理装置5のクラスタリング部202は、上述した実施形態におけるL個の対象物群へのクラスタリングを行わないで、上記のM個の波長群へのクラスタリングのみを行ってM個のクラスタ行列の生成のみを行ってもよい。この場合、データ処理装置5のデータ生成部205は、M個のクラスタ行列毎のN個の分析対象物における統計値を用いてアンミキシングを行ってK個(Kは2以上M以下の整数)の色素データを生成する。
【0060】
上記実施形態のデータ取得装置3は、図13に示す構成に変更されてもよい。図13に示す変形例に係るデータ取得装置3Aのデータ取得装置3Aとの相違点は、光学システム53として分光器58及び検出器59を備える点である。分光器58は、サンプル流体から生じた蛍光を、複数の波長帯(例えば、1024チャンネルの波長帯)に分光する。検出器59は、複数の画素(例えば1024画素)を有する一次元検出器或いは二次元検出器であり、分光器58から各画素に入射した各波長帯の蛍光の強度を測定し電子システム54に出力する。このようなデータ取得装置3Aによれば、複数の蛍光波長帯の配列データを生成することができる。例えば、データ取得装置3Aによって生成された1024チャンネルの配列データは、データ処理装置5によって、隣接する2つのチャンネルが1つの波長群にクラスタリングされることによって、512個のクラスタ行列に分割される。
【0061】
上記第一の側面においては、データ取得ステップでは、複数の励起波長の励起光のそれぞれを対象物に照射することで、C個の検出波長毎の強度値の分布であるスペクトルデータを取得する、ことが好適である。また、上記第二の側面においては、複数の励起波長の励起光のそれぞれを対象物に照射することで、C個の検出波長毎の強度値の分布であるスペクトルデータを取得するデータ取得装置をさらに備える、ことが好適である。これにより、複数の励起波長の励起光を用いることで、複数種類の蛍光色素からの蛍光を効率よく観察することができる。その結果、複数の蛍光色素を観察対象とする場合に精度の良い色素データを得ることができる。
【0062】
また、上記第一の側面においては、クラスタリングステップでは、強度値のC個の検出波長毎の分布情報を基にN個の対象物をクラスタリングする、ことも好適である。このように分布情報を利用することで、波長分布の類似性を基にクラスタリングすることができる。その結果、観察条件に適したアンミキシングが実行され、精度の良い色素データを得ることができる。
【0063】
また、上記第一の側面においては、計算ステップでは、統計値を、対象物群の強度値の積算値、最頻値、あるいは中間値に基づいて計算する、ことも好適である。この場合、観察条件に適したアンミキシングが実行され、精度の良い色素データを得ることができる。
【0064】
また、上記第一の側面においては、データ生成ステップでは、L個のクラスタ行列ごとのC個の検出波長の統計値を用いて、ミキシング行列を求め、ミキシング行列を用いてアンミキシングを行う、ことが好適である。この場合、対象物の数、観察に用いる励起光の種類、あるいは、観察する蛍光バンドの数が増加しても、アンミキシングを行う際の計算量を抑えることができる。また、クラスタリングされたクラスタ行列毎の強度値の統計値を用いてアンミキシングを行うことで、色素データの分離の精度も向上させることができる。その結果、分離データの精度を高めつつ色素データを取得する際のスループットの向上を図ることができる。
【0065】
さらに、上記第一の側面においては、データ生成ステップでは、非負値行列因子分解を用いて、L個のクラスタ行列ごとのC個の検出波長の統計値を基に損失値を計算し、損失値の和を基にミキシング行列を求める、ことも好適である。この場合、分離データの精度を高めつつ色素データを取得する際のスループットの向上を図ることができる。
【0066】
またさらに、上記第一の側面においては、データ生成ステップでは、L個のクラスタ行列ごと損失値を統計値を基に補正し、補正した損失値の和を基にミキシング行列を求める、ことも好適である。こうすれば、蛍光色素毎の強度に偏りがある場合であっても色素データの分離の精度を向上させることができる。
【0067】
さらにまた、上記第一の側面においては、クラスタリングステップでは、N個の対象物毎に、強度値を基に、C個の検出波長をM個(Mは2以上C-1以下の整数)の検出波長群にクラスタリングして、N個の対象物毎の強度値をクラスタリングした検出波長群毎に配列したM個のクラスタ行列をさらに生成する、ことも好適である。こうすれば、アンミキシングを行う際の計算量をさらに抑えることができる。また、クラスタリングされた検出波長群毎の強度値の統計値を用いてアンミキシングを行うことで、色素データの分離の精度も維持することができる。
【0068】
実施形態の色素データ取得方法は、[1]「N個(Nは2以上の整数)の対象物を対象に、C個(Cは2以上の整数)の検出波長毎の蛍光の強度値の分布であるスペクトルデータを取得するデータ取得ステップと、前記C個の検出波長毎の各対象物の前記強度値を基に、前記N個の対象物をL個(Lは2以上N-1以下の整数)に対象物群にクラスタリングして、前記C個の検出波長毎の前記強度値をクラスタリングした対象物群毎に配列したL個のクラスタ行列を生成するクラスタリングステップと、L個のクラスタ行列ごとにC個の検出波長における前記対象物群の前記強度値の統計値を計算する計算ステップと、L個のクラスタ行列ごとの前記C個の検出波長における前記統計値を用いて、前記C個の検出波長を対象にアンミキシングを行い、K個(Kは2以上C以下の整数)の蛍光色素毎の分布を示す前記K個の色素データを生成するデータ生成ステップと、を備える色素データ取得方法」である。
【0069】
実施形態の色素データ取得方法は、[2]「前記データ取得ステップでは、複数の励起波長の励起光のそれぞれを前記対象物に照射することで、前記C個の検出波長毎の前記強度値の分布である前記スペクトルデータを取得する、上記[1]に記載の色素データ取得方法」であってもよい。
【0070】
実施形態の色素データ取得方法は、[3]「前記クラスタリングステップでは、前記強度値の前記C個の検出波長毎の分布情報を基に前記N個の対象物をクラスタリングする、上記[2]に記載の色素データ取得方法」であってもよい。
【0071】
実施形態の色素データ取得方法は、[4]「前記計算ステップでは、前記統計値を、前記対象物群の前記強度値の積算値、最頻値、あるいは中間値に基づいて計算する、上記[1]~[3]のいずれかに記載の色素データ取得方法」であってもよい。
【0072】
実施形態の色素データ取得方法は、[5]「前記データ生成ステップでは、L個のクラスタ行列ごとの前記C個の検出波長の前記統計値を用いて、ミキシング行列を求め、前記ミキシング行列を用いてアンミキシングを行う、上記[1]~[4]のいずれかに記載の色素データ取得方法」であってもよい。
【0073】
実施形態の色素データ取得方法は、[6]「前記データ生成ステップでは、非負値行列因子分解を用いて、L個のクラスタ行列ごとの前記C個の検出波長の前記統計値を基に損失値を計算し、前記損失値の和を基に前記ミキシング行列を求める、上記[5]に記載の色素データ取得方法」であってもよい。
【0074】
実施形態の色素データ取得方法は、[7]「前記データ生成ステップでは、L個のクラスタ行列ごと前記損失値を前記統計値を基に補正し、補正した前記損失値の和を基に前記ミキシング行列を求める、上記[6]に記載の色素データ取得方法」であってもよい。
【0075】
実施形態の色素データ取得方法は、[8]「前記クラスタリングステップでは、前記N個の対象物毎に、前記強度値を基に、前記C個の検出波長をM個(Mは2以上C-1以下の整数)の検出波長群にクラスタリングして、前記N個の対象物毎の前記強度値をクラスタリングした検出波長群毎に配列したM個のクラスタ行列をさらに生成する、上記[1]~[7]のいずれかに記載の色素データ取得方法」であってもよい。
【符号の説明】
【0076】
1…色素データ取得システム、3,3A…データ取得装置、5…データ処理装置、201…データ取得部、202…クラスタリング部、203…統計値計算部、204…行列推定部、205…データ生成部、A…ミキシング行列。

【要約】
データ処理装置5は、N個(Nは2以上の整数)の分析対象物を対象に、C個(Cは2以上の整数)の波長帯毎の蛍光の強度値の分布であるスペクトルデータを処理する装置であって、C個の波長帯毎の各分析対象物の強度値を基に、N個の分析対象物をL個(Lは2以上N-1以下の整数)に対象物群にクラスタリングして、C個の波長帯毎の強度値をクラスタリングした対象物群毎に配列したL個のクラスタ行列を生成し、L個のクラスタ行列ごとにC個の波長帯における対象物群の強度値の統計値を計算し、L個のクラスタ行列ごとのC個の波長帯における統計値を用いて、C個の波長帯を対象にアンミキシングを行い、K個(Kは2以上C以下の整数)の蛍光色素毎の分布を示すK個の色素データを生成する。

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13