(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-16
(45)【発行日】2023-10-24
(54)【発明の名称】分取システム、及び分取方法
(51)【国際特許分類】
G01N 15/14 20060101AFI20231017BHJP
G01N 21/64 20060101ALI20231017BHJP
C12M 1/00 20060101ALI20231017BHJP
C12M 1/34 20060101ALI20231017BHJP
C12Q 1/04 20060101ALI20231017BHJP
【FI】
G01N15/14 K
G01N21/64 F
G01N15/14 C
C12M1/00 A
C12M1/34 B
C12Q1/04
(21)【出願番号】P 2019099716
(22)【出願日】2019-05-28
【審査請求日】2022-04-19
(73)【特許権者】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】山根 健治
(72)【発明者】
【氏名】加藤 泰信
(72)【発明者】
【氏名】吉田 大峰
【審査官】遠藤 直恵
(56)【参考文献】
【文献】国際公開第2018/198586(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 15/00-15/14
(57)【特許請求の範囲】
【請求項1】
生体由来粒子からの光情報に対して
非線形処理を施
す非線形処理部と、
前記
非線形処理により得られた情報に基づ
き特定された分取対象
に関する情報と前記光情報とを用いて
学習データを作成し、前記学習データに対して機械学習を行うこと
により学習モデルを構築する学習部と、
前記学習モデル
に基づき、分取ユニットに対して分取指示を出力する
判別部と、
を
有する分取
システム。
【請求項2】
前記非線形処理は、次元圧縮処理である、請求項1に記載の分取
システム。
【請求項3】
前記次元圧縮処理は、前記生体由来粒子からの光情報の次元を三次元以下に圧縮する、請求項
2に記載の分取
システム。
【請求項4】
前記光情報は、前記生体由来粒子からの光強度を各色の蛍光色素の発現量に蛍光分離した情報である、請求項1に記載の分取
システム。
【請求項5】
前記蛍光分離は、重み付け最小二乗法によって行われる、請求項
4に記載の分取
システム。
【請求項6】
前記機械学習は、教師あり学習である、請求項1に記載の分取
システム。
【請求項7】
前記分取対象に関する情報は、分取対象であるか否かを示す情報である、請求項1に記載の分取システム。
【請求項8】
前記分取対象に関する情報は、いずれの回収部に分取するかを示す情報である、請求項1に記載の分取システム。
【請求項9】
前記学習部は、構築された前記学習モデルの正答率が閾値を超えるか否かを判断する、請求項1に記載の分取システム。
【請求項10】
前記学習部は、前記非線形処理に用いた複数の生体由来粒子の光情報を分割し、分割された各部分のうち一部に含まれる光情報にて前記学習モデルを構築し、残りの部分に含まれる光情報の判別を前記学習モデルで行うことで前記正答率を算出する、請求項9に記載の分取システム。
【請求項11】
前記学習部は、構築された前記学習モデルの前記正答率が前記閾値を超えた場合、前記機械学習の完了を通知する、請求項9に記載の分取システム。
【請求項12】
前記
非線形処理を施した後の情報をユーザに提示するインタフェース部をさらに備える、請求項1に記載の分取
システム。
【請求項13】
前記インタフェース部は、前記
非線形処理を施した後の情報を三次元以下の領域にマッピングすることで、前記ユーザに提示する、請求項
12に記載の分取
システム。
【請求項14】
前記インタフェース部は、前記機械学習に用いられた前記生体由来粒子の集団と、分取された前記生体由来粒子の集団とを同一の処理を施して、前記ユーザに視覚的に提示する、請求項
12に記載の分取
システム。
【請求項15】
前記生体由来粒子は、細胞である、請求項1に記載の分取
システム。
【請求項16】
生体由来粒子に対してレーザ光を照射することにより光強度を取得する測定ユニットと、
前記分取指示に基づき分取を行う分取ユニットと、
をさらに備え、
前記判別部は、前記光強度に基づく光情報と前記学習モデルとを用いて、前記生体由来粒子が分取対象かどうか判別する、
請求項1に記載の分取システム。
【請求項17】
前記測定ユニットは、
前記生体由来粒子に対して光を照射するレーザ光源と、前記光強度を取得する光検出器と、を含む、
請求項16に記載の分取システム。
【請求項18】
前記測定ユニットは、
前記生体由来粒子に対して照射した光により生じた蛍光を分光する光学部材をさらに有し、
前記光検出器は、
前記光学部材にて分光された蛍光を検出する、複数の光電変換素子をアレイ状に配置した光検出器アレイである、
請求項17に記載の分取システム。
【請求項19】
生体由来粒子からの光情報に対して非線形処理を施し、
前記非線形処理により得られた情報に基づき特定された分取対象に関する情報と前記光情報とを用いて学習データを作成し、前記学習データに対して機械学習を行うことにより学習モデルを構築し、
前記学習モデルに基づき、分取ユニットに対して分取指示を出力する
分取方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、分取システム、及び分取方法に関する。
【背景技術】
【0002】
医学又は生化学等の分野では、大量の粒子の特性を迅速に測定するために、フローサイトメータを用いることが一般的になっている。フローサイトメータは、流れる細胞又はビーズ等の粒子に光線を照射し、該粒子から発せられる蛍光等を検出することで、粒子の各々の特性を測定する装置である。
【0003】
また、フローサイトメータにて検出された蛍光情報に基づいて粒子の移動先を制御することで、測定サンプルの中から特定の蛍光を発する粒子を分取する装置も開発されている。このような分取装置は、セルソータとも称される。
【0004】
ここで、近年、フローサイトメータでは、一度に測定可能な蛍光物質の数を増やすことで、粒子のより詳細な解析を可能とすることが検討されている。しかしながら、蛍光物質の数を増やすことは、測定データの次元数を増加させてしまうため、フローサイトメータにおける解析をより複雑化させてしまう。
【0005】
そこで、フローサイトメータにおける測定データの解析方法が種々検討されている。例えば、下記の特許文献1には、光線を照射した生体由来対象から検出されるパルス波形のピーク位置に基づいて、生体由来対象の形状情報を推定する技術が開示されている。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
一方で、セルソータなどの分取装置では、流れる粒子について測定及び解析を行い、測定及び解析結果に基づいて該粒子を分取するか否かを判別する処理を粒子が装置内を通流する限られた時間内に行うことが求められる。
【0008】
したがって、セルソータなどの分取装置では、粒子が分取対象であるか否かをより迅速かつリアルタイムで判別することが求められていた。
【課題を解決するための手段】
【0009】
本開示によれば、生体由来粒子からの光情報に対して非線形処理を施す非線形処理部と、前記非線形処理により得られた情報に基づき特定された分取対象に関する情報と前記光情報とを用いて学習データを作成し、前記学習データに対して機械学習を行うことにより学習モデルを構築する学習部と、前記学習モデルに基づき、分取ユニットに対して分取指示を出力する判別部と、を有する分取システムが提供される。
本開示によれば、生体由来粒子からの光情報に対して非線形処理を施し、前記非線形処理後の情報に基づき特定された分取対象に関する情報と前記光情報とを用いて学習データを作成し、前記学習データに対して機械学習を行うことにより学習モデルを構築し、前記学習モデルに基づき、分取ユニットに対して分取指示を出力する分取方法が提供される。
【図面の簡単な説明】
【0012】
【
図1】本開示の一実施形態に係る分取システムの構成例を示すブロック図である。
【
図2A】測定ユニットのフィルタ方式の検出機構を説明する説明図である。
【
図2B】測定ユニットのスペクトル方式の検出機構を説明する説明図である。
【
図3】同実施形態に係る情報処理装置の構成例を示すブロック図である。
【
図4】分取装置から取得される生体由来粒子の蛍光に関する情報の一例を示す表図である。
【
図5A】クラスタリング処理の結果を示す説明図である。
【
図5B】クラスタリング処理の結果を示す説明図である。
【
図6】生体由来粒子の各蛍光物質の発現量に関する情報をt-SNEアルゴリズムを用いて2次元まで次元圧縮処理した結果を示す説明図である。
【
図7】学習部の機械学習にて教師データとして用いられる情報を示す表図である。
【
図8A】同実施形態に係る分取システムの学習モデルを構築する動作の流れを説明するフローチャート図である。
【
図8B】同実施形態に係る分取システムの生体由来粒子を分取する動作の流れを説明するフローチャート図である。
【
図9A】第1の変形例に係る分取システムにてユーザに提示される画像の一例を示す説明図である。
【
図9B】第1の変形例に係る分取システムにてユーザに提示される画像の一例を示す説明図である。
【
図10】第2の変形例に係る分取システムの構成例を示すブロック図である。
【
図11】第2の変形例に係る情報処理装置及び情報処理サーバの構成例を示すブロック図である。
【
図12】本開示の一実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。
【発明を実施するための形態】
【0013】
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0014】
なお、説明は以下の順序で行うものとする。
1.分取システムの構成
2.情報処理装置の構成
3.分取システムの動作
4.分取システムの変形例
5.ハードウェア構成例
【0015】
<1.分取システムの構成>
まず、
図1を参照して、本開示の一実施形態に係る分取システム1の構成について説明する。
図1は、本実施形態に係る分取システム1の構成例を示すブロック図である。
【0016】
図1に示すように、本実施形態に係る分取システム1は、サンプルSから測定データを取得し、かつ情報処理装置20の判別に基づいて分取対象の粒子を分取する分取装置10と、分取装置10にて取得された測定データを解析し、該粒子が分取対象であるか否かを判別する情報処理装置20と、を備える。本実施形態に係る分取システム1は、例えば、いわゆるセルソータとして用いられ得る。
【0017】
サンプルSは、例えば、細胞、微生物又は生体関連粒子などの生体由来粒子であり、複数の生体由来粒子の集団を含む。分取装置10は、サンプルSの測定データを解析することによって、生体由来粒子をそれぞれ内的結合及び外的分離された複数の集団に分類し、分類された特定の集団を分取することができる。サンプルSは、例えば、動物細胞(例えば、血球系細胞など)、若しくは植物細胞などの細胞、大腸菌等の細菌類、タバコモザイクウイルス等のウイルス類、若しくはイースト等の菌類などの微生物、染色体、リポソーム、ミトコンドリア、若しくは各種オルガネラ(細胞小器官)などの細胞を構成する生体関連粒子、又は核酸、タンパク質、脂質、糖鎖、若しくはこれらの複合体などの生体関連高分子などの生体由来の微小粒子であってもよい。
【0018】
ここで、サンプルSは、1つ以上の蛍光色素によって標識(染色)されている。蛍光色素によるサンプルSの標識は、公知の手法によって行うことができる。例えば、サンプルSが細胞である場合、細胞表面に存在する抗原に対して選択的に結合する蛍光標識抗体と、測定対象の細胞とを混合し、細胞表面の抗原に蛍光標識抗体を結合させることで、測定対象の細胞を蛍光色素にて標識することができる。
【0019】
蛍光標識抗体は、標識として蛍光色素を結合させた抗体である。具体的には、蛍光標識抗体は、ビオチン標識した抗体に、アビジンを結合させた蛍光色素をアビジン-ビオジン反応によって結合させたものであってもよい。または、蛍光標識抗体は、抗体に蛍光色素を直接結合させたものであってもよい。なお、抗体は、ポリクローナル抗体又はモノクローナル抗体のいずれを用いることも可能である。また、細胞を標識するための蛍光色素も特に限定されず、細胞等の染色に使用される公知の色素を少なくとも1つ以上用いることが可能である。
【0020】
分取装置10は、測定ユニットと、分取ユニットと、を含む。分取装置10は、いわゆるフローセル型の分取装置10であってもよく、マイクロ流路チップ型の分取装置であってもよい。
【0021】
測定ユニットは、サンプルSに対してレーザ光等の光線を照射することで、サンプルSから発せられる蛍光を測定する。具体的には、測定ユニットは、サンプルSを分散させたシース液を層流とすることでサンプルSを一方向に整列させる。このとき、測定ユニットは、整列したサンプルSに、サンプルSを標識する蛍光色素を励起可能な波長を有するレーザ光を照射し、レーザ光が照射されたサンプルSから発生する蛍光をCCD(Charge Coupled Device)、CMOS(Complementary Metal Oxide Semiconductor)又はフォトダイオード、PMT(Photo Multiplier Tube)などの公知の光電変換素子によって光電変換する。これにより、測定ユニットは、サンプルSからの蛍光を取得することができる。
【0022】
測定ユニットにおけるサンプルSからの蛍光の検出機構は、フィルタ方式又はスペクトル方式のいずれでもよい。ここで、サンプルSからの蛍光の検出機構について、
図2A及び
図2Bを参照して説明する。
図2Aは、フィルタ方式の検出機構を説明する説明図であり、
図2Bは、スペクトル方式の検出機構を説明する説明図である。
【0023】
図2Aに示すように、フィルタ方式の検出機構では、流路13を通流するサンプルSに、光源11からの光線を照射することで得られた蛍光をダイクロイックミラー15A、15B、15Cで分光する。これにより、フィルタ方式の検出機構は、光検出器17A、17B、17Cにて所定の波長帯域ごとに蛍光の強度を取得することができる。
【0024】
具体的には、ダイクロイックミラー15A、15B、15Cは、特定の波長帯域の光を反射し、その他の波長帯域の光を透過させるミラーである。これにより、測定ユニットは、サンプルSからの蛍光の光路上に、異なる波長帯域の光を反射するダイクロイックミラー15A、15B、15Cを設けることで、蛍光を波長帯域ごとに分光することができる。例えば、測定ユニットは、サンプルSからの蛍光が入射する側から順に、赤色の波長帯域の光を反射するダイクロイックミラー15A、緑色の波長帯域の光を反射するダイクロイックミラー15B、及び青色の波長帯域の光を反射するダイクロイックミラー15Cをそれぞれ設けることで、サンプルSからの蛍光を波長帯域ごとに分光することができる。
【0025】
図2Bに示すように、スペクトル方式の検出機構では、流路13を通過するサンプルSに光源11からの光線を照射することで得られた蛍光をプリズム16で分光する。これにより、スペクトル方式の検出機構は、光検出器アレイ18にて連続的な蛍光スペクトルを取得することができる。
【0026】
具体的には、プリズム16は、入射する光を分散させる光学部材である。これにより、測定ユニットは、サンプルSからの蛍光をプリズム16にて分散させることで、複数の光電変換素子をアレイ状に配置した光検出器アレイ18にて蛍光の連続的なスペクトルを検出することができる。
【0027】
分取ユニットは、分取対象となったサンプルSの一部を分取する。具体的には、まず、分取ユニットは、サンプルSの液滴を生成し、分取対象となるサンプルSの液滴を荷電させる。次に、分取ユニットは、生成した液滴を偏向板により生成された電場中に移動させる。このとき、荷電した液滴は、帯電した偏光板側に引き寄せられるため、液滴の移動方向が変更される。これにより、分取ユニットは、分取対象となるサンプルSの液滴と、分取対象ではないサンプルSの液滴とを分離することができるため、分取対象となる生体由来粒子を分取することが可能となる。なお、分取ユニットの分取方式は、ジェットインエアー方式又はキュベットフローセル方式のいずれであってもよい。また、サンプルSは、フローセル又はマイクロ流路チップの外部に射出されることで分取されてもよく、マイクロ流路チップの内部にて分取されてもよい。サンプルSを分取するか否かは、分取装置10に備えられたロジック回路(例えば、FPGA(field-programmable gate array)回路)にて判断されてもよく、情報処理装置20からの指示にて判断されてもよい。
【0028】
情報処理装置20は、測定ユニットによって取得されたサンプルSの測定データを解析し、解析したデータをユーザに提示する。ユーザは、情報処理装置20にて解析されたデータを確認することで、分取対象となる生体由来粒子の集団を特定することができる。
【0029】
ここで、情報処理装置20は、サンプルSの測定データから、生体由来粒子における蛍光色素の発現量を算出することで、生体由来粒子の特性を解析している。しかしながら、近年のフローサイトメータの多色化に伴って測定データの次元数が増加し、組み合わせ爆発が発生するため、ユーザは、蛍光色素の発現量から生体由来粒子の集団の各々を把握することが困難となっていた。そこで、データ圧縮処理などによって、ユーザによる生体由来粒子の集団の把握を支援する技術が検討されている。ここでのデータ圧縮処理とは、いわゆる圧縮及び解凍が可能な可逆圧縮ではなく、非可逆圧縮を表す。すなわち、データ圧縮処理は、圧縮により元のデータの一部を欠落させてしまうものの、情報を減らすことでデータの解析をより容易にするための処理である。
【0030】
しかし、このようなデータ圧縮処理は、処理後のデータから処理前のデータを再現することが困難となることがある。そのため、データ圧縮処理後のデータに基づいてユーザが特定した生体由来粒子の集団がどのような蛍光情報を有しているのかを導出することは困難であった。
【0031】
したがって、情報処理装置20は、データ圧縮処理後のデータに基づいてユーザが特定した分取対象の生体由来粒子の集団について、測定データにおける判別条件を設定することが困難であった。
【0032】
また、分取装置10は、実時間で、装置内を通流する生体由来粒子の蛍光を測定し、かつ情報処理装置20の判別結果に基づいて、蛍光を測定した生体由来粒子を分取している。そのため、情報処理装置20は、限られた時間内に、生体由来粒子からの測定データを解析した上で、生体由来粒子が分取対象であるか否かを判別し、判別結果を分取装置10に出力することが求められる。
【0033】
しかしながら、近年のフローサイトメータの多色化に伴い、生体由来粒子における蛍光色素の発現量を算出するための計算量も膨大となっている。したがって、情報処理装置20がサンプルSの測定データから生体由来粒子における蛍光色素の発現量を算出するまでの時間も膨大となっている。加えて、上記のデータ圧縮処理も計算時間が膨大となる。したがって、サンプルSが分取装置10を通流する実時間内に、情報処理装置20が生体由来粒子の1つ1つに対して上記解析をそれぞれ実行し、データ圧縮処理後のデータを算出することは現実的ではない。
【0034】
そのため、ユーザがデータ圧縮処理後のデータに基づいて特定した分取対象の生体由来粒子がどのような蛍光情報を有しているのかを解析し、測定データの生体由来粒子が分取対象か否かを迅速に判別することが可能な分取システムが求められていた。
【0035】
本発明者らは、上記事情を鑑みることで、本開示に係る技術を想到するに至った。本開示に係る技術は、蛍光に基づいて生体由来粒子を分取する分取システムにおいて、分取対象となる生体由来粒子のデータ圧縮処理前の情報を用いて機械学習を行うことで、蛍光情報から生体由来粒子が分取対象であるか否かを判別することを可能にするものである。
【0036】
本開示に係る技術によれば、測定された生体由来粒子の蛍光情報から該生体由来粒子が分取対象であるのか否かを複雑な計算を行うことなく迅速に判別することが可能である。したがって、本開示に係る技術によれば、生体由来粒子を標識する蛍光物質の数、及び測定データの解析方法に依らずに、生体由来粒子が分取対象であるか否かを迅速に判別することが可能である。
【0037】
<2.情報処理装置の構成>
続いて、
図3を参照して、本実施形態に係る分取システム1に含まれる情報処理装置20のより具体的な構成について説明する。
図3は、本実施形態に係る情報処理装置20の構成例を示すブロック図である。
【0038】
図3に示すように、情報処理装置20は、取得部201と、解析部203と、リファレンススペクトル記憶部205と、データ圧縮処理部207と、インタフェース部209と、学習部211と、学習モデル記憶部213と、判別部215と、を備える。
【0039】
取得部201は、分取装置10から生体由来粒子の蛍光に関する情報を取得する。具体的には、分取装置10は、スペクトル方式の検出機構によって生体由来粒子の光を検出し、取得部201は、生体由来粒子の光のスペクトルに関する情報を取得する。生体由来粒子の光とは、レーザ光を照射された生体由来粒子からの散乱光又は蛍光のいずれかであってもよく、その両方であってもよい。取得部201は、例えば、ネットワーク等を介して分取装置10から生体由来粒子の光に関する情報を取得してもよく、有線若しくは無線のLAN(Local Area Network)、又は有線ケーブルを介して分取装置10から生体由来粒子の光に関する情報を取得してもよい。
【0040】
例えば、取得部201にて取得された生体由来粒子の光に関する情報は、
図4に示すような情報であってもよい。
図4は、分取装置10から取得される生体由来粒子の光に関する情報の一例を示す表図である。
【0041】
図4に示すように、生体由来粒子の光に関する情報は、細胞(すなわち、生体由来粒子)の識別番号ごとに、光検出器アレイに配置されたN個の光電子増倍管(Photo Multiplier Tube:PMT)の各々にて検出されたゲインを「PMT1」~「PMTN」として示したものであってもよい。これらのN個の光電子増倍管は、プリズムによる光の分散方向に一列にアレイ状に配置されている。そのため、これらのN個の光電子増倍管のゲインをヒストグラムとして連続的に並べることで、細胞の光のスペクトルを取得することができる。
図4では、N個の細胞の各々について、N個の光電子増倍管のゲインの測定結果が示されている。
【0042】
解析部203は、分取装置10にて測定された生体由来粒子の光に関する情報を解析することで、生体由来粒子の特性に関する情報を導出する。具体的には、解析部203は、分取装置10にて測定された蛍光スペクトルに含まれる蛍光の各々を分離することで、蛍光の各々に対応する蛍光物質の生体由来粒子における発現量を導出する。
【0043】
測定対象の生体由来粒子は、互いに重なり合った波長分布の蛍光を発する複数の蛍光物質によって標識されている。そのため、解析部203は、分取装置10にて測定された蛍光スペクトルに対して、各蛍光物質から発せられる蛍光の波長分布を重み付けしてフィッティングすることで、各蛍光物質の発現量を導出することができる。
【0044】
より具体的には、まず、解析部203は、リファレンススペクトル記憶部205から生体由来粒子を標識している蛍光物質が発する蛍光の波長分布を示すリファレンススペクトルをそれぞれ取得する。次に、解析部203は、各蛍光物質のリファレンススペクトルを重ね合わせて、重み付け最小二乗法を用いて分取装置10にて測定された蛍光スペクトルにフィッティングすることで、各蛍光物質の発現量を推定することができる。
【0045】
リファレンススペクトル記憶部205は、生体由来粒子を標識可能な蛍光物質が発する蛍光の波長分布を示すリファレンススペクトルをそれぞれ記憶する。リファレンススペクトル記憶部205は、情報処理装置20又は分取装置10のいずれかに備えられていてもよく、ネットワークを介して通信可能な他の情報処理装置又は情報処理サーバに備えられていてもよい。
【0046】
データ圧縮処理部207は、解析部203にて解析した生体由来粒子の光情報に対してデータ圧縮処理を行う。
【0047】
データ圧縮処理とは、非線形処理、又は線形処理のいずれをも含む。例えば、非線形処理としては、次元圧縮処理、クラスタリング処理、又はグルーピング処理を含んでもよい。例えば、線形処理としては、蛍光分離を行うことで、生体由来粒子の光のスペクトル情報から蛍光色素ごとの蛍光情報を生成する処理を含んでもよい。
【0048】
なお、非線形処理には、教師あり若しくは教師なしの機械学習、又は弱教師ありの機会学習のいずれのアルゴリズムが用いられてもよい。ただし、非線形処理に用いられる機械学習アルゴリズムは、後述する学習部211にて用いられる機械学習アルゴリズムとは異なることが望ましい。
【0049】
具体的には、データ圧縮処理部207は、生体由来粒子の各蛍光物質の発現量に関する情報に対してクラスタリング処理を行ってもよい。これによれば、データ圧縮処理部207は、生体由来粒子を外的分離及び内的結合した複数の集団に分類することができる。
【0050】
クラスタリング処理のアルゴリズムは、特に限定されず、公知のクラスタリングアルゴリズムを用いることが可能である。例えば、データ圧縮処理部207は、k-means等のクラスタ数を指定できるアルゴリズムを用いてクラスタリング処理を行ってもよく、flowsom等の自動的にクラスタ数を決定するようなアルゴリズムを用いてクラスタリング処理を行ってもよい。
【0051】
データ圧縮処理部207によるクラスタリング処理の結果は、
図5A及び
図5Bに示すような形式にてユーザに提示されてもよい。
図5A及び
図5Bは、クラスタリング処理の結果を示す説明図である。
【0052】
例えば、
図5Aに示すように、データ圧縮処理部207によるクラスタリング結果は、表形式にてユーザに提示されてもよい。
【0053】
図5Aでは、1000個の細胞(すなわち、生体由来粒子)の集団がN個のクラスタに分割されており、クラスタ及び細胞の各々に付された識別番号にて、各クラスタへの細胞の所属が示されている。具体的には、
図5Aでは、識別番号「1」のクラスタには、識別番号「1」、「2」、「2」及び「10」の細胞が所属しており、識別番号「2」のクラスタには、識別番号「11」、「12」、「22」及び「31」の細胞が所属しており、識別番号「3」のクラスタには、識別番号「4」~「6」、「14」及び「15」の細胞が所属しており、識別番号「N」のクラスタには、識別番号「1000」の細胞が所属している。このような表形式によるユーザへの提示では、細胞の各クラスタへの所属を簡潔に示すことができる。
【0054】
例えば、
図5Bに示すように、データ圧縮処理部207によるクラスタリング結果は、ミニマムスパニングツリー(Minimum Spanning Tree)形式にてユーザに提示されてもよい。
【0055】
図5Bでは、複数の色(
図5Bでは色をハッチングの種類で区別する)で塗り分けられたレーダチャートが互いに接続された樹状に配列されている。各レーダチャートは、各細胞(すなわち、生体由来粒子)を表している。具体的には、各レーダチャートの分布及び大きさは、細胞の各蛍光物質の発現量に対応するベクトルを表している。ここで、各色で塗り分けられた領域は、各細胞が所属するクラスタを表す。例えば、同じ色(すなわち、同一種のハッチング)で塗り分けられたレーダチャートで示される細胞は、同じクラスタに所属していることを表す。
【0056】
さらに、
図5Bでは、レーダチャート間の距離がレーダチャートで表される細胞同士の類似度に対応している。すなわち、
図5Bでは、互いに接近したレーダチャートが表す細胞は互いに類似しており、互いに離れたレーダチャートが表す細胞は互いに類似していないことを示している。このようなミニマムスパニングツリー形式によるユーザへの提示によれば、細胞のクラスタへの所属に加えて、細胞の互いの類似関係を示すことができる。
【0057】
または、データ圧縮処理部207は、生体由来粒子の各蛍光物質の発現量に関する情報に対して次元圧縮処理を行ってもよい。これによれば、データ圧縮処理部207は、複数の蛍光物質の発現量を含む高次元データの次元を圧縮することで、高次元データの各々の関係性を低次元のマップ上にわかりやすく可視化することができる。したがって、ユーザは、次元圧縮処理後の低次元の情報を確認することで、次元圧縮処理前の高次元の情報よりも、より容易に生体由来粒子を複数の集団に分類することができる。データ圧縮処理部207は、次元数を少なくとも1以上減少させる次元圧縮処理を行うことができればよいが、例えば、生体由来粒子の各蛍光物質の発現量に関する情報の次元を三次元以下に圧縮することで、高次元データの各々の関係性をより明確に可視化することが可能である。
【0058】
次元圧縮処理のアルゴリズムは、特に限定されず、公知の次元圧縮アルゴリズムを用いることが可能である。例えば、データ圧縮処理部207は、PCA、t-SNE又はUmap等のアルゴリズムを用いて次元圧縮処理を行ってもよい。
【0059】
データ圧縮処理部207による次元圧縮処理の結果は、
図6に示すような形式にてユーザに提示されてもよい。
図6は、生体由来粒子の各蛍光物質の発現量に関する情報をt-SNEアルゴリズムを用いて二次元まで次元圧縮処理した結果を示す説明図である。
【0060】
例えば、
図6では、細胞の各蛍光物質の発現量という高次元データのユークリッド距離をスチューデントのt-分布の確率分布を用いて確率に変換して二次元座標上にマッピングしている。これにより、ユーザは、各蛍光物質の発現量を各々比較せずとも、細胞の各蛍光物質の発現量の類似度をより単純化して比較することができる。例えば、
図6では、同じ集団に属する細胞を異なる色(
図6では色をハッチングの種類で区別する)で表している。
図6を参照すると、次元圧縮処理によって、同じ集団に属する細胞が適切に内的結合及び外的分離されてグルーピングされることがわかる。
【0061】
インタフェース部209は、出力装置及び入力装置を含み、ユーザとの間での情報の入出力を行う。具体的には、インタフェース部209は、CRT(Cathode Ray Tube)表示装置、液晶表示装置又はOLED(Organic Light Emitting Diode)表示装置等を用いて、データ圧縮処理部207による非線形処理後の情報をユーザに提示してもよい。また、インタフェース部209は、タッチパネル、キーボード、マウス、ボタン、マイクロフォン、スイッチ又はレバーなどの入力装置を用いて、分取対象とする生体由来粒子を特定するユーザの入力を受け付けてもよい。
【0062】
ユーザは、インタフェース部209から出力されるデータ圧縮処理後の情報を確認することで、分取対象となる生体由来粒子の集団をより容易に指定することができる。例えば、ユーザは、クラスタリング処理後の情報を確認することで、分取対象となる生体由来粒子のクラスタを特定することができる。または、ユーザは、次元圧縮処理後の情報を確認することで、分取対象となる生体由来粒子の集団を範囲指定することができる。
【0063】
学習部211は、分取対象とされた生体由来粒子のデータ圧縮処理前の情報を用いて機械学習を行うことで、生体由来粒子から発せられる光に関する情報を用いて該生体由来粒子が分取対象であるのか否かを判別する学習モデルを構築する。
【0064】
構築された学習モデルは、例えば、情報処理装置20に備えられる学習モデル記憶部213に記憶されてもよい。これによれば、分取装置10は、情報処理装置20からの分取制御によって分取対象となる生体由来粒子を分取することができる。または、構築された学習モデルは、分取装置10に設けられたFPGA回路等のロジック回路に実装されてもよい。例えば、分取装置10には、判別部215が設けられており、分取装置10に設けられたFPGA回路には、判別部215の種類に基づいて設計され、構築された学習モデルを実行するロジックが実装されていてもよい。構築された学習モデルを実行するロジックは、学習部211が設計してもよい。
【0065】
本実施形態に係る分取システム1では、分取装置10は、ユーザが分取対象とした生体由来粒子の集団を分取する。しかしながら、データ圧縮処理部207にて行ったデータ圧縮処理は、非可逆圧縮であるため、データ圧縮処理部207による処理後の情報から処理前の情報を導出することが困難である。そのため、ユーザがデータ圧縮処理後の情報に基づいて分取対象となる生体由来粒子を特定した場合、分取対象となる生体由来粒子がどのような光を発するかを導出することが困難である。したがって、情報処理装置20は、分取対象となる生体由来粒子か否かを判別するための条件を決定することが困難である。
【0066】
本実施形態に係る分取システム1では、ユーザによって分取対象と特定された生体由来粒子の集団のデータ圧縮処理前の情報を用いて機械学習を行うことで、生体由来粒子が分取対象であるのか否かを判別する学習モデルを構築する。具体的には、学習部211は、分取対象と特定された生体由来粒子の光のスペクトルに関する情報を教師として機械学習を行うことで、生体由来粒子が分取対象であるのか否かを判別する学習モデルを構築することができる。
【0067】
なお、学習部211は、分取対象と特定された生体由来粒子の各蛍光物質の発現量に関する情報を用いて機械学習を行うことで、生体由来粒子が分取対象であるのか否かを判別する学習モデルを構築してもよい。
【0068】
ただし、解析部203による各蛍光物質の発現量の導出は、多色での生体由来粒子の標識に伴い、より膨大な計算量及び計算時間を要するようになっている。そのため、解析部203による生体由来粒子の蛍光スペクトルに関する情報から各蛍光物質の発現量に関する情報への解析も膨大な時間がかかってしまう。実際に分取装置10にて生体由来粒子を分取する際には、生体由来粒子が分取対象であるか否かを限られた時間内に判別することが重要となる。したがって、学習部211は、分取装置10にて測定される生体由来粒子の蛍光スペクトルを用いて学習モデルを構築するほうが、生体由来粒子が分取対象であるか否かをより迅速に判別する学習モデルを構築することが可能である。
【0069】
学習部211が行う機械学習のアルゴリズムは、分取対象と特定された生体由来粒子の蛍光スペクトルに関する情報を教師とする教師あり学習である。例えば、学習部211は、ランダムフォレスト、サポートベクターマシン、又はディープラーニングなどの機械学習アルゴリズムを用いて学習モデルを構築してもよい。
【0070】
本実施形態に係る分取システム1では、規格化されていない様々な情報を教師として用いるため、規格化の必要がないランダムフォレストの機械学習アルゴリズムを好適に用いることができる。また、ランダムフォレストの機械学習アルゴリズムは、学習モデルをハードウェア化しやすいため、生体由来粒子が分取対象であるか否かを迅速に判別することが重要な本実施形態に係る分取システム1に好適に用いることができる。
【0071】
学習部211にて機械学習に用いられる情報は、例えば、
図7に示すような情報であってもよい。
図7は、学習部211の機械学習にて教師データとして用いられる情報を示す表図である。
【0072】
図7に示すように、機械学習に用いられる情報は、細胞(すなわち、生体由来粒子)の識別番号ごとに、光検出器アレイに配置されたN個の光電子増倍管(PMT)の各々にて検出されたゲインを「PMT1」~「PMTN」として示し、かつ該細胞が分取対象であるか否かを「分取?」の列に「Yes」(分取対象である)又は「No」(分取対象ではない)として示したものであってもよい。このような情報を用いることで、学習部211は、分取対象である細胞の光電子増倍管の各々のゲインの特徴を学習した学習モデルを構築することができる。
【0073】
なお、学習部211は、分取対象の判別が十分可能な学習モデルが構築されたか否かを判断し、ユーザに通知してもよい。例えば、学習部211は、学習した生体由来粒子の情報の数、又は全体に対する割合が閾値を超えた場合に、分取対象の判別が十分可能な学習モデルが構築されたことをユーザに通知してもよい。
【0074】
または、学習部211は、学習モデルの正答率が閾値を超えた場合に、分取対象の判別が十分可能な学習モデルが構築されたことをユーザに通知してもよい。学習モデルの正答率は、例えば、N-fold-cross validationによって判断することが可能である。具体的には、教師に用いる情報の全体をN分割し、N-1個の分割部分に含まれる情報で学習を行って学習モデルを構築した後、残りの1個の分割部分に含まれる情報の判別を行うことで、構築した学習モデルの正答率を判断することができる。
【0075】
学習モデル記憶部213は、学習部211が構築した学習モデルを記憶する。学習モデル記憶部213は、FPGA(Field-Programmable Gate Array)回路などを用いて、学習モデルをハードウェア化して記憶してもよい。これによれば、生体由来粒子が分取対象であるか否かの判別をより高速に行うことができる。
【0076】
判別部215は、学習モデル記憶部213に記憶された学習モデルに基づいて、分取装置10にて測定された蛍光を発する生体由来粒子が分取対象であるか否かを判別する。生体由来粒子が分取対象であると判別される場合、判別部215は、分取装置10に該生体由来粒子を分取するように指示を出す。
【0077】
なお、学習モデル記憶部213、及び判別部215は、分取装置10に設けられてもよい。
【0078】
また、分取装置10が複数の生体由来粒子の集団を別々に分取することが可能である場合、判別部215は、生体由来粒子が分取対象であるか否かだけでなく、いずれの回収部に生体由来粒子を回収するかを分取装置10に指示してもよい。このような場合、学習部211は、分取後にいずれの回収部に回収するのかをさらに特定した生体由来粒子の蛍光スペクトルに関する情報を教師データとして機械学習を行う。これによれば、判別部215は、複数の生体由来粒子の集団を別々に分取するように分取装置10に指示を出力することが可能である。
【0079】
以上の構成によれば、本実施形態に係る分取システム1は、データ圧縮処理の後の情報に基づいて特定された分取対象の生体由来粒子をデータ圧縮処理前の情報に基づいて迅速に分取することが可能である。
【0080】
なお、逆に、本実施形態に係る分取システム1は、分取対象ではない生体由来粒子のデータ圧縮処理前の情報を用いて機械学習を行うことで、データ圧縮処理前の情報に基づいて分取対象ではない生体由来粒子を判別してもよい。このような場合でも、本実施形態に係る分取システム1は、判別した生体由来粒子以外の生体由来粒子を分取することで、分取対象の生体由来粒子を迅速に分取することが可能である。
【0081】
<3.分取システムの動作>
次に、
図8A及び
図8Bを参照して、本実施形態に係る分取システム1の動作の流れについて説明する。
図8Aは、本実施形態に係る分取システム1の学習モデルを構築する動作の流れを説明するフローチャート図である。
図8Bは、本実施形態に係る分取システム1の生体由来粒子を分取する動作の流れを説明するフローチャート図である。
【0082】
本実施形態に係る分取システム1で学習モデルを構築する場合、
図8Aに示すように、まず、分取装置10は、学習用に生体由来粒子のサンプルの測定を行う(S111)。情報処理装置20は、取得部201を介してサンプルの測定データを取得し、解析部203にて測定データを蛍光分離することで、各蛍光物質の発現量の情報(いわゆる、蛍光色素情報)を導出する(S112)。次に、情報処理装置20は、データ圧縮処理部207にて蛍光色素情報に対してデータ圧縮処理を実施する(S113)。その後、情報処理装置20は、インタフェース部209を介して、データ圧縮処理後の情報をユーザに提示する(S114)。
【0083】
ここで、ユーザは、提示されたデータ圧縮処理後の情報を参照することで、分取対象となるサンプルの集団を特定する(S115)。これにより、情報処理装置20は、分取対象として特定されたサンプルを学習部211にて分取対象としてマーキングする(S116)。続いて、情報処理装置20は、学習部211にて、分取対象としてマーキングされた測定データを教師データとして機械学習を実行する(S117)。十分な数の教師データにて機械学習を行った後、情報処理装置20は、機械学習により構築された学習モデルを学習モデル記憶部213に記憶させる(S118)。
【0084】
一方、本実施形態に係る分取システム1で生体由来粒子を分取する場合、
図8Bに示すように、まず、分取装置10は、分取用の残りの生体由来粒子のサンプルの測定を行う(S121)。続いて、情報処理装置20は、取得部201を介してサンプルの測定データを取得する(S122)。次に、情報処理装置20は、取得した測定データを入力として、機械学習にて構築された学習モデルに基づいて、測定データのサンプルが分取対象か否かの判別を実施する(S123)。
【0085】
ここで、情報処理装置20は、判別部215にて、測定データのサンプルが分取対象と判別されたか否かを確認し(S124)、測定データのサンプルが分取対象であると判別された場合(S124/Yes)、測定データのサンプルを分取するように分取装置10に指示を出力する(S125)。一方、測定データのサンプルが分取対象ではないと判別された場合(S124/No)、測定データのサンプルを分取する指示が出力されないため、分取装置10は、測定データのサンプルを分取しない。
【0086】
以上の動作の流れによれば、本実施形態に係る分取システム1は、生体由来粒子が分取対象であるのか否かを機械学習にて構築された学習モデルに基づいて、迅速に判別することが可能である。
【0087】
<4.分取システムの変形例>
(第1の変形例)
続いて、
図9A及び
図9Bを参照して、本実施形態に係る分取システム1の第1の変形例について説明する。
図9A及び
図9Bは、第1の変形例に係る分取システム1にてユーザに提示される画像の一例を示す説明図である。
【0088】
第1の変形例に係る分取システム1は、生体由来粒子の情報として、
図7で示すような測定された光電子増倍管のゲイン、及び分取対象であるか否かについての情報に加えて、所属するクラスタの識別番号、次元圧縮後のパラメータ、機械学習の教師データとして用いたか否か、実際に分取されたか否か、又は蛍光分離後の各蛍光物質の発現量等の様々な情報を対応付けて記憶するものである。
【0089】
例えば、ユーザは、生体由来粒子を分取した後に、実際に分取した生体由来粒子の集団と、分取対象として特定した生体由来粒子の集団とが類似しているか否かを確認したい場合がある。これは、機械学習に用いた際の生体由来粒子の測定データと、実際に分取した際の生体由来粒子の測定データとでは、測定データの母集団の数、及びサンプル全体におけるサンプリングタイミング等が異なるため、測定データの分布が異なる場合があり得るためである。
【0090】
そのため、情報処理装置20は、生体由来粒子の各々について、機械学習時のクラスタの識別番号、又は次元圧縮後のパラメータ、機械学習に用いたか否か、及び実際に分取されたか否かに関する情報を併せて記憶する。これによれば、情報処理装置20は、サンプルの全ての測定が終了した後に、分取対象として機械学習に用いた生体由来粒子の分布と、実際に分取された生体由来粒子の分布とを同一の処理を施した上で、重ね合わせて同時にユーザに提示することができる。
【0091】
ここで、
図9A及び
図9Bを参照して、より具体的に説明する。例えば、機械学習用のサンプルの測定データを次元圧縮処理した後の分布が
図9Aで示すグラフのように集団M1e及びM2eに分かれており、集団M1eを分取対象として特定したとする。これにより、学習部211は、集団M1eの測定データを教師データとして機械学習を行うことで、学習モデルを構築する。その後、分取装置10は、判別部215は、分取用のサンプルの測定データを入力として学習モデルを適用し、分取対象と判別された生体由来粒子を分取するように分取装置10に指示を出力する。
【0092】
第1の変形例によれば、サンプルの分取が終了した後、全ての測定データを同一の次元圧縮処理した後の分布を
図9Bで示すグラフのようにユーザに提示することができる。これによれば、ユーザは、機械学習の教師データとして用いた生体由来粒子の集団M1eの分布と、実際に分取した生体由来粒子の集団M1rの分布とが同一の処理を施した際に重畳しているか否かを確認することができる。また、ユーザは、実際に分取した生体由来粒子の集団M1rの分布と、他の生体由来粒子の集団M2eの分布とが分離しているか否かを確認することができる。
【0093】
(第2の変形例)
次に、
図10及び
図11を参照して、本実施形態に係る分取システム1の第2の変形例について説明する。
図10は、第2の変形例に係る分取システム1Aの構成例を示すブロック図である。
図11は、第2の変形例に係る情報処理装置20A及び情報処理サーバ30Aの構成例を示すブロック図である。
【0094】
第2の変形例に係る分取システム1Aは、
図3で示す情報処理装置20の機能がネットワーク40を介して接続された情報処理装置及び情報処理サーバの複数の装置に分割されて設けられる例である。
【0095】
具体的には、
図10に示すように、第2の変形例に係る分取システム1Aは、サンプルSから測定データを取得し、かつ情報処理装置20の判別に基づいて分取対象の粒子を分取する分取装置10と、粒子が分取対象であるか否かを判別する情報処理装置20Aと、分取装置10にて取得された測定データを解析する情報処理サーバ30Aと、を備える。なお、情報処理装置20A及び情報処理サーバ30Aは、インターネット、電話回線網若しくは衛星通信網などの公衆回線網、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、又はWAN(Wide Area Network)等のネットワーク40にて互いに通信可能に接続される。
【0096】
例えば、
図11に示すように、情報処理装置20Aには、取得部201、インタフェース部209、学習モデル記憶部213、及び判別部215が備えられ、情報処理サーバ30Aには、解析部203、リファレンススペクトル記憶部205、データ圧縮処理部207、及び学習部211が備えられていてもよい。
【0097】
第2の変形例に係る分取システム1Aでは、計算負荷が大きい機能(例えば、解析部203、データ圧縮処理部207、及び学習部211)をより演算能力が高い装置に担当させることができる。一方、迅速な判別のためにネットワーク40等による遅延を避けたいこと、及び計算負荷が大きくないことから、判別部215及び学習モデル記憶部213の機能は、分取装置10と直接接続される情報処理装置20Aに担当させてもよい。
【0098】
なお、さらに迅速な判別を行う目的があれば、判別部215及び学習モデル記憶部213は、分取装置10に備えられていてもよい。このような場合、情報処理装置20A又は情報処理サーバ30Aのいずれかでは、学習部211にて構築された学習モデルを実現するロジックが判別部215の種類に基づいて設計される。その後、設計されたロジックは、分取装置10に送信されることで、分取装置10のFPGA回路に実装される。これによれば、第2の変形例に係る分取システム1Aは、分取対象となる生体由来粒子をより迅速に判別することが可能である。
【0099】
なお、本開示の一実施形態に係る分取システムの構成は、
図3及び
図10で例示する構成に限定されない。例えば、本実施形態に係る分取システムは、分取装置10のみにて構成されてもよい。具体的には、分取装置10は、情報処理装置20の機能をさらに備えていてもよい。または、分取装置10は、コンピュータに読み込まれることで情報処理装置20の機能を実現するプログラムによって動作するコンピュータにて構築された学習モデルを与えられることで、分取対象の生体由来粒子を分取可能となっていてもよい。
【0100】
<5.ハードウェア構成例>
続いて、
図12を参照して、本実施形態に係る情報処理装置20等のハードウェア構成の一例について説明する。
図12は、本実施形態に係る情報処理装置20のハードウェア構成の一例を示すブロック図である。
【0101】
図12に示すように、情報処理装置20は、CPU(Central Processing Unit)901、ROM(Read Only Memory)902、RAM(Random Access Memory)903、ホストバス905、ブリッジ907、外部バス906、インタフェース908、入力装置911、出力装置912、ストレージ装置913、ドライブ914、接続ポート915、及び通信装置916を備える。情報処理装置20は、CPU901に替えて、又はこれと共に、電気回路、DSP若しくはASIC等の処理回路を備えてもよい。
【0102】
CPU901は、演算処理装置、及び制御装置として機能し、各種プログラムに従って情報処理装置20内の動作全般を制御する。また、CPU901は、マイクロプロセッサであってもよい。ROM902は、CPU901が使用するプログラム及び演算パラメータ等を記憶する。RAM903は、CPU901の実行において使用するプログラム、及びその実行において適宜変化するパラメータ等を一時記憶する。CPU901は、例えば、取得部201、解析部203、データ圧縮処理部207、学習部211、及び判別部215の機能を実行してもよい。
【0103】
CPU901、ROM902及びRAM903は、CPUバスなどを含むホストバス905により相互に接続されている。ホストバス905は、ブリッジ907を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス906に接続されている。なお、ホストバス905、ブリッジ907、及び外部バス906は、必ずしも分離構成されなくともよく、1つのバスにこれらの機能が実装されてもよい。
【0104】
入力装置911は、例えば、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチ又はレバー等のユーザによって情報が入力される装置である。または、入力装置911は、赤外線又はその他の電波を利用したリモートコントロール装置であってもよく、情報処理装置20の操作に対応した携帯電話又はPDA等の外部接続機器であってもよい。さらに、入力装置911は、例えば、上記の入力手段を用いてユーザにより入力された情報に基づいて入力信号を生成する入力制御回路などを含んでもよい。
【0105】
出力装置912は、情報をユーザに対して視覚的又は聴覚的に通知することが可能な装置である。出力装置912は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、EL(ElectroLuminescence)ディスプレイ装置、レーザープロジェクタ、LED(Light Emitting Diode)プロジェクタ又はランプ等の表示装置であってもよく、スピーカ又はヘッドホン等の音声出力装置等であってもよい。
【0106】
出力装置912は、例えば、情報処理装置20による各種処理にて得られた結果を出力してもよい。具体的には、出力装置912は、情報処理装置20による各種処理にて得られた結果を、テキスト、イメージ、表、又はグラフ等の様々な形式で視覚的に表示してもよい。または、出力装置912は、音声データ又は音響データ等のオーディオ信号をアナログ信号に変換して聴覚的に出力してもよい。入力装置911及び出力装置912は、例えば、インタフェース部209の機能を実行してもよい。
【0107】
ストレージ装置913は、情報処理装置20の記憶部の一例として形成されたデータ格納用の装置である。ストレージ装置913は、例えば、HDD(Hard Disk Drive)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等により実現されてもよい。例えば、ストレージ装置913は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出装置、及び記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。ストレージ装置913は、CPU901が実行するプログラム、各種データ及び外部から取得した各種のデータ等を格納してもよい。ストレージ装置913は、例えば、リファレンススペクトル記憶部205、及び学習モデル記憶部213の機能を実行してもよい。
【0108】
ドライブ914は、記憶媒体用リーダライタであり、情報処理装置20に内蔵又は外付けされる。ドライブ914は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記憶媒体に記録されている情報を読み出して、RAM903に出力する。また、ドライブ914は、リムーバブル記憶媒体に情報を書き込むことも可能である。
【0109】
接続ポート915は、外部機器と接続されるインタフェースである。接続ポート915は、外部機器とのデータ伝送可能な接続口であり、例えばUSB(Universal Serial Bus)であってもよい。
【0110】
通信装置916は、例えば、ネットワーク920に接続するための通信デバイス等で形成されたインタフェースである。通信装置916は、例えば、有線若しくは無線LAN(Local Area Network)、LTE(Long Term Evolution)、Bluetooth(登録商標)又はWUSB(Wireless USB)用の通信カード等であってもよい。また、通信装置916は、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ又は各種通信用のモデム等であってもよい。通信装置916は、例えば、インターネット又は他の通信機器との間で、例えばTCP/IP等の所定のプロトコルに則して信号等を送受信することができる。
【0111】
なお、ネットワーク40は、情報の有線又は無線の伝送路である。例えば、ネットワーク40は、インターネット、電話回線網若しくは衛星通信網などの公衆回線網、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、又はWAN(Wide Area Network)などを含んでもよい。また、ネットワーク920は、IP-VPN(Internet Protocol-Virtual Private Network)などの専用回線網を含んでもよい。
【0112】
なお、情報処理装置20に内蔵されるCPU、ROM及びRAMなどのハードウェアに対して、上述した本実施形態に係る情報処理装置20の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供することが可能である。
【0113】
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
【0114】
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
【0115】
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
生体由来粒子からの光情報に対してデータ圧縮処理を施し、前記データ圧縮処理により得られた情報に基づいて特定された分取対象となる前記生体由来粒子の前記データ圧縮処理を施す前の光情報を用いて機械学習を行うことで、前記分取対象となる生体由来粒子から発せられる光情報を判別する学習モデルを構築する学習部と、
前記学習モデルを出力する出力部と、
を備える、分取装置。
(2)
前記データ圧縮処理は、クラスタリング処理である、前記(1)に記載の分取装置。
(3)
前記データ圧縮処理は、次元圧縮処理である、前記(1)に記載の分取装置。
(4)
前記次元圧縮処理は、前記生体由来粒子からの光情報の次元を三次元以下に圧縮する、前記(3)に記載の分取装置。
(5)
前記光情報は、前記生体由来粒子からの蛍光を各色の蛍光色素の発現量に蛍光分離した情報である、前記(1)~(4)のいずれか一項に記載の分取装置。
(6)
前記蛍光分離は、重み付け最小二乗法によって行われる、前記(5)に記載の分取装置。
(7)
前記機械学習は、教師あり学習である、前記(1)~(6)のいずれか一項に記載の分取装置。
(8)
前記機械学習のアルゴリズムは、ランダムフォレストである、前記(7)に記載の分取装置。
(9)
前記生体由来粒子は、複数の集団に分けられて分取される、前記(1)~(8)のいずれか一項に記載の分取装置。
(10)
前記データ圧縮処理を施した後の情報をユーザに提示するインタフェース部をさらに備える、前記(1)~(9)のいずれか一項に記載の分取装置。
(11)
前記インタフェース部は、前記データ圧縮処理を施した後の情報を三次元以下の領域にマッピングすることで、前記ユーザに提示する、前記(10)に記載の分取装置。
(12)
前記インタフェース部は、前記機械学習に用いられた前記生体由来粒子の集団と、分取された前記生体由来粒子の集団とを同一の処理を施して、前記ユーザに視覚的に提示する、前記(10)又は(11)に記載の分取装置。
(13)
前記学習部は、前記機械学習に用いられた前記生体由来粒子の数又は全体に対する割合が閾値を超えた場合、前記機械学習の完了を通知する、前記(1)~(12)のいずれか一項に記載の分取装置。
(14)
前記学習部は、構築された前記学習モデルの正答率が閾値を超えた場合、前記機械学習の完了を通知する、前記(1)~(12)のいずれか一項に記載の分取装置。
(15)
前記生体由来粒子は、細胞である、前記(1)~(14)のいずれか一項に記載の分取装置。
(16)
生体由来粒子に光線を照射し、前記生体由来粒子からの蛍光に基づいて、前記生体由来粒子を分取する分取装置と、
を含み、
前記分取装置は、
生体由来粒子からの光情報に対してデータ圧縮処理を施し、前記データ圧縮処理により得られた情報に基づいて特定された分取対象となる前記生体由来粒子の前記データ圧縮処理を施す前の光情報を用いて機械学習を行うことで、前記分取対象となる生体由来粒子から発せられる光情報を判別する学習モデルを構築する学習部と、
前記学習モデルを出力する出力部と、
としてコンピュータを機能させるプログラムを読み取らせた前記コンピュータが前記分取対象と判別した前記生体由来粒子を分取する、分取システム。
(17)
コンピュータに読み取られることで、前記コンピュータを、
生体由来粒子からの光情報に対してデータ圧縮処理を施し、前記データ圧縮処理により得られた情報に基づいて特定された分取対象となる前記生体由来粒子の前記データ圧縮処理を施す前の光情報を用いて機械学習を行うことで、前記分取対象となる生体由来粒子から発せられる光情報を判別する学習モデルを構築する学習部と、
として機能させる、プログラム。
【符号の説明】
【0116】
1、1A 分取システム
10 分取装置
11 光源
13 流路
15A、15B、15C ダイクロイックミラー
16 プリズム
17A、17B、17C 光検出器
18 光検出器アレイ
20、20A 情報処理装置
30A 情報処理サーバ
40 ネットワーク
201 取得部
203 解析部
205 リファレンススペクトル記憶部
207 データ圧縮処理部
209 インタフェース部
211 学習部
213 学習モデル記憶部
215 判別部