(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024133588
(43)【公開日】2024-10-02
(54)【発明の名称】情報処理方法、プログラム及び情報処理システム
(51)【国際特許分類】
G01N 15/1429 20240101AFI20240925BHJP
G01N 15/14 20240101ALI20240925BHJP
G01N 21/64 20060101ALI20240925BHJP
G01N 33/53 20060101ALI20240925BHJP
【FI】
G01N15/1429 200
G01N15/14 C
G01N21/64 F
G01N33/53 Y
【審査請求】有
【請求項の数】17
【出願形態】OL
(21)【出願番号】P 2024107781
(22)【出願日】2024-07-03
(62)【分割の表示】P 2020093877の分割
【原出願日】2020-05-29
(31)【優先権主張番号】P 2019152593
(32)【優先日】2019-08-23
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000002185
【氏名又は名称】ソニーグループ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】山根 健治
(72)【発明者】
【氏名】榎 潤一郎
(57)【要約】
【課題】多色化により増大したデータを解析する。
【解決手段】実施形態に係る情報処理装置は、それぞれ1以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行する次元圧縮部と、前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する初期値決定部と、前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行するクラスタリング部とを備える。
【選択図】
図12
【特許請求の範囲】
【請求項1】
それぞれ1以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数の蛍光強度データそれぞれに対してスケール変換を実行し、
前記スケール変換が実行された前記複数の蛍光強度データそれぞれに対して次元圧縮を実行し、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定し、
前記初期値を用いて前記複数の蛍光強度データに対するクラスタリングを実行することを含む、
情報処理方法。
【請求項2】
前記スケール変換は、非線形処理の変換を行う、
請求項1に記載の情報処理方法。
【請求項3】
前記スケール変換は、logicle変換、log変換又はbi-exponential変換を行う、
請求項2に記載の情報処理方法。
【請求項4】
前記複数の蛍光強度データは、前記複数の粒子それぞれから放射された前記蛍光成分を含む複数のスペクトルデータである、
請求項1に記載の情報処理方法。
【請求項5】
前記複数の蛍光強度データは、前記複数の粒子それぞれから放射された複数のスペクトルデータそれぞれから前記蛍光成分ごとの蛍光スペクトルに分離されたデータである、
請求項1に記載の情報処理方法。
【請求項6】
前記複数の蛍光強度データの次元ごとの平均値を算出し、
前記次元圧縮の結果得られた固有値と、前記平均値とに基づいて、前記複数のノードそれぞれの前記初期値を決定する、
請求項1に記載の情報処理方法。
【請求項7】
前記クラスタリングは、
前記複数の蛍光強度データそれぞれを前記複数のノードの何れかに割り当て、
前記複数のノードそれぞれに割り当てられた前記蛍光強度データに基づいて前記複数のノードそれぞれのノードベクトルを更新することにより実行される、
請求項1に記載の情報処理方法。
【請求項8】
前記クラスタリングは、
更新された前記複数のノードそれぞれの前記ノードベクトルに対してコンセンサスクラスタリングを実行することで、前記ノードの数を変更し、
前記変更後のノードに対して変更前の前記複数のノードそれぞれの前記ノードベクトルに基づくメタクラスタリングを実行することにより実行される、
請求項7に記載の情報処理方法。
【請求項9】
前記クラスタリングは、
前記複数の蛍光強度データを2以上のグループに分割し、
前記2以上のグループごとに、前記複数の蛍光強度データそれぞれを前記複数のノードの何れかに割り当てることにより実行される、
請求項8に記載の情報処理方法。
【請求項10】
前記クラスタリングは、前記グループの数と同数又はそれ以下の数の割当て部であって、前記割当て部それぞれが、互いに異なる情報処理装置に配置される前記割当て部により実行される、
請求項9に記載の情報処理方法。
【請求項11】
前記クラスタリングは、SOM(Self-Organizing Map)アルゴリズムを用いて実行される、
請求項1に記載の情報処理方法。
【請求項12】
前記ノードの数は、ユーザにより設定させる、
請求項1に記載の情報処理方法。
【請求項13】
前記次元圧縮は、前記複数の蛍光強度データの主成分分析である、
請求項1に記載の情報処理方法。
【請求項14】
前記スペクトルデータは、スペクトル型のフローサイトメータにより測定されたスペクトルデータである、
請求項4に記載の情報処理方法。
【請求項15】
前記クラスタリングの結果を表示する、
請求項1に記載の情報処理方法。
【請求項16】
コンピュータに、
それぞれ1以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を 含む複数の蛍光強度データそれぞれに対してスケール変換を実行する工程と、
前記スケール変換が実行された前記複数の蛍光強度データそれぞれに対して次元圧縮を実行する工程と、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する工程と、
前記初期値を用いて前記複数の蛍光強度データに対するクラスタリングを実行する工程と、
を実行させるためのプログラム。
【請求項17】
それぞれ1以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数の蛍光強度データを検出する測定装置と、
前記測定装置で検出された前記複数の蛍光強度データをクラスタリングする情報処理装置と、
を備え、
前記情報処理装置は、
前記測定装置で検出された前記複数の蛍光強度データそれぞれに対してスケール変換を実行するプレ処理部と、
前記スケール変換が実行された前記複数の蛍光強度データそれぞれに対して次元圧縮を実行する次元圧縮部と、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する初期値決定部と、
前記初期値を用いて前記複数の蛍光強度データに対するクラスタリングを実行するクラスタリング部と、
を備える、情報処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理方法、プログラム及び情報処理システムに関する。
【背景技術】
【0002】
医学または生化学等の分野では、大量の粒子の各々の特性を迅速に測定するために、フローサイトメータを用いることが一般的になっている。フローサイトメータは、フローセルを流れる細胞又はビーズ等の粒子に光線を照射することで、該粒子から発せられる蛍光又は散乱光などを検出し、粒子の各々の特性を光学的に測定する装置である。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007-132921号公報
【特許文献2】特表2016-511397号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
近年のフローサイトメータでは、細胞などの粒子を複数の蛍光色素で染色する多色化が進められているが、多色化が進むと、一度に測定できる蛍光物質の数が増加して、組合せ爆発が発生する。その結果、処理すべきデータ量が増大して、解析が困難になるという課題が存在する。
【0005】
そこで本開示では、多色化により増大したデータを解析することが可能な情報処理装置、情報処理方法、プログラム及び情報処理システムを提案する。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、本開示に係る一形態の情報処理装置は、それぞれ1以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行する次元圧縮部と、前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する初期値決定部と、前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行するクラスタリング部とを備える。
【0007】
なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、又は上記の効果に代えて、本明細書に示されたいずれかの効果、又は本明細書から把握され得る他の効果が奏されてもよい。
【図面の簡単な説明】
【0008】
【
図1】第1の実施形態に係る情報処理システムの構成を示すブロック図である。
【
図3】プレ処理パラメータテーブルの一例を示す図である。
【
図8】プレ処理部によるプレ処理のフローを示すフローチャートである。
【
図9】クラスタリング処理部による処理のフローを示すフローチャートである。
【
図10】蛍光分離部による蛍光分離処理のフローを示すフローチャートである。
【
図11】FlowSOMにおける初期化から学習までの一連の流れを説明するための模式図である。
【
図12】第2の実施形態に係る情報処理システムの構成を示すブロック図である。
【
図13】第2の実施形態に係るプレ処理/蛍光分離部の動作例を示すフローチャートである。
【
図14】第2の実施形態に係るクラスタリング処理部が実行するクラスタリング処理の一例を示すフローチャートである。
【
図15】
図14のステップS222で説明した、本実施形態に係る各代表ノードの代表ノードベクトルを初期化する際の動作を説明するための図である。
【
図16】
図14のステップS223で説明した、本実施形態に係るバッチ学習によるクラスタリングの一例を示すフローチャートである。
【
図17】
図14のステップS224で説明した、コンセンサスクラスタリングを用いてクラスタ数を決定する際の動作を説明するための図である。
【
図18】情報処理装置のハードウェア構成例を示すブロック図である。
【発明を実施するための形態】
【0009】
以下に、本開示の実施形態について図面に基づいて詳細に説明する。また、以下に示す項目順序に従って本開示を説明する。
1.第1の実施形態
1.1 情報処理システムの構成
1.2 情報処理装置の動作
1.3 作用・効果
2.第2の実施形態
2.1 情報処理システムの構成
2.2 情報処理装置の動作例
2.2.1 プレ処理/蛍光分離部の動作例
2.2.2 クラスタリング処理部の動作例
2.2.3 代表ノードベクトルの初期化について
2.2.4 バッチ学習によるクラスタリングについて
2.2.5 コンセンサスクラスアリングを用いたクラスタ数の決定について
2.3 作用・効果
3.情報処理装置のハードウェア構成
【0010】
1.第1の実施形態
近年のフローサイトメータは、細胞などの粒子を複数の蛍光色素で染色して一度に多くの蛍光シグナルを測定することで、より豊富な情報を取得できるようになってきている。一方で、このようなフローサイトメータの多色化により、従来のような手動のゲーティングによる解析の限界が指摘されている。例えば、n種類の蛍光色素を2次元の座標系にプロットする際の蛍光色素の組合せパターンは、nC2通りとなる。つまり、6色では15通りに対し、20色では190通りに増大する。
【0011】
このような、増大したデータを解析する手法としては、従来の手動によるゲーティングに代えて、クラスタリングによる自動分類を採用し、データをクラスタリングにより分類してから解析する手法が考えられる。
【0012】
ただし、一般的なクラスタリングでは、あるデータは何れかのクラスタに分類されるため、2つ以上のクラスタの境界に位置して判別が難しいデータであっても何れかのクラスタに分類されてしまう。そのため、フローサイトメータで取得されたデータをクラスタリングにより分類する場合、ある程度の誤分類が発生し得るという可能性がある。
【0013】
一方で、フローサイトメータには、蛍光における1又は2以上の特定の波長の強度を検出するフィルタ方式と、蛍光色素それぞれから放射した蛍光を波長スペクトルとして検出することでより多くの情報を取得することが可能なスペクトル方式とが存在する。スペクトル方式では、波長ごとの蛍光強度が得られるため、一つの粒子(サンプルともいう)から多くの特徴量を取得することが可能である。そのため、スペクトル方式を採用することで、より詳細な解析が可能となる。
【0014】
ただし、スペクトル方式で得られるスペクトルデータは、波長ごとの蛍光強度が線形ではなく指数関数的に変化する。そのため、スペクトルデータをユーザに認識しやすく表示するには、スペクトルデータをスケール変換する必要がある。一方、クラスタリングでは、データ間の距離に基づいて分類が行われる。そのため、波長ごとの蛍光強度が指数関数的に変化するスペクトルデータをそのままクラスタリングすると、蛍光強度の大きい部分の差がデータ間の距離全体に強く影響を及ぼすこととなり、誤分類が発生し得る。それにより、クラスタリング結果とスケール変換されて表示されるスペクトルデータとが正しく対応していない可能性がある。
【0015】
そこで、本実施形態では、スペクトルデータの表示結果とクラスタリング結果とをより正しく対応させることを可能にする情報処理装置、情報処理方法、プログラム及び情報処理システムについて、例を挙げて説明する。
【0016】
具体的には、フローサイトメータで取得したスペクトルデータに対してプレ処理としてlogicle変換を行う。そして、logicle変換が行われたスペクトルデータを用いてクラスタリングを行い、それにより得られたクラスタリング結果をユーザに表示する。それにより、本実施形態では、スペクトルデータのうち値の大きい部分でクラスタリングが行われることを可否することが可能となるため、スペクトルデータの表示結果とクラスタリング結果とがより正しく対応するようにクラスタリングを行うことが可能となる。以下、本実施形態に係る情報処理装置、情報処理方法、プログラム及び情報処理システムについて、図面を参照して詳細に説明する。
【0017】
ただし、本開示に係る技術は、上述した課題のすべてを同時に解決している必要はない。したがって、後述する構成の一部又は全部を備えることで上述した課題の一部又は全部を解決しているものは、本開示の技術的範疇に含まれるものと解される。
【0018】
1.1 情報処理システムの構成
図1は、本実施形態に係る情報処理システムの構成を示すブロック図である。
図1に示すように、情報処理システム4は、情報処理装置1と測定装置3を備える。
【0019】
測定装置3は、測定対象の細胞等から各色の蛍光スペクトルを検出することが可能な測定装置である。測定装置3は、例えば、フローサイトメータである。フローサイトメータで測定される測定サンプルは、細胞、微生物及び生体関連粒子などの生体由来の粒子であってもよい。例えば、細胞は、動物細胞(例えば、血球系細胞など)、植物細胞などであってもよい。例えば、微生物は、大腸菌等の細菌類、タバコモザイクウイルス等のウイルス類、イースト等の菌類などであってもよい。生体関連粒子は、染色体、リポソーム、ミトコンドリア、各種オルガネラ(細胞小器官)などの細胞を構成する粒子であってもよい。なお、生体関連粒子には、核酸、タンパク質、脂質、糖鎖、これらの複合体などの生体関連高分子が含まれてもよい。これらの生体由来の粒子は、球形及び非球形のうちのいずれの形状であってもよく、大きさ及び質量についても特に限定されない。
【0020】
また、測定サンプルは、ラテックス粒子、ゲル粒子、工業用粒子などの工業的に合成された粒子であってもよい。例えば、工業的に合成された粒子は、ポリスチレン、ポリメチルメタクリレートなどの有機樹脂材料、ガラス、シリカ、磁性体などの無機材料、又は、金コロイド、アルミニウムなどの金属で合成された粒子であってもよい。これらの工業的に合成された粒子についても、同様に、球形及び非球形のうちのいずれの形状であってもよく、大きさ及び質量についても特に限定されない。
【0021】
測定サンプルは、蛍光スペクトルの測定に先立って、1種類以上の蛍光色素によって標識(染色)され得る。蛍光色素による測定サンプルの標識は、公知の手法によって行われてもよい。具体的には、測定サンプルが細胞である場合、細胞表面に存在する抗原に対して選択的に結合する蛍光標識抗体と、測定対象の細胞とを混合し、細胞表面の抗原に蛍光標識抗体を結合させることで、測定対象の細胞を蛍光色素にて標識することができる。または、特定の細胞に対して選択的に取り込まれる蛍光色素と、測定対象の細胞とを混合することで、測定対象の細胞を蛍光色素にて標識することも可能である。
【0022】
蛍光標識抗体は、標識として蛍光色素を結合させた抗体である。蛍光標識抗体は、抗体に蛍光色素を直接結合させたものであってもよい。または、蛍光標識抗体は、ビオチン標識した抗体に、アビジンを結合させた蛍光色素をアビジン-ビオジン反応によって結合させたものであってもよい。なお、抗体には、ポリクローナル抗体及びモノクローナル抗体のうちのいずれを用いることも可能である。
【0023】
細胞を標識するための蛍光色素は、特に限定されず、細胞等の染色に使用される公知の色素を少なくとも1つ以上用いることが可能である。例えば、蛍光色素として、フィコエリスリン(PE)、フルオレセインイソチオシアネート(FITC)、PE-Cy5、PE-Cy7、PE-Texas Red(登録商標)、アロフィコシアニン(APC)、APC-Cy7、エチジウムブロマイド(ethidium bromide)、プロピジウムアイオダイド(propidium iodide)、Hoechst(登録商標)33258、Hoechst(登録商標)33342、DAPI(4’,6-diamidino-2-phenylindole)、アクリジンオレンジ(acridineorange)、クロモマイシン(chromomycin)、ミトラマイシン(mithramycin)、オリボマイシン(olivomycin)、ピロニン(pyronin)Y、チアゾールオレンジ(thiazole orange)、ローダミン(rhodamine)101、イソチオシアネート(isothiocyanate)、BCECF、BCECF-AM、C.SNARF-1、C.SNARF-1-AMA、イクオリン(aequorin)、Indo-1、Indo-1-AM、Fluo-3、Fluo-3-AM、Fura-2、Fura-2-AM、オキソノール(oxonol)、テキサスレッド(登録商標)、ローダミン123、10-N-ノニ-アクリジンオレンジ、フルオレセイン(fluorescein)、フルオレセインジアセテート(fluorescein diacetate)、カルボキシフルオレセイン(carboxyfluorescein)、カルボキシフルオレセインジアセテート(carboxyfluorescein diacetate)、カルボキシジクロロフルオレセイン(carboxydichlorofluorescein)、カルボキシジクロロフルオレセインジアセテート(carboxydichlorofluorescein diacetate)等を用いることができる。また、上述した蛍光色素の誘導体等も使用することが可能である。
【0024】
フローサイトメータは、測定サンプルSに標識された蛍光色素を励起可能な波長を有するレーザ光を射出するレーザ光源と、測定サンプルSを一方向に通流させるフローセルと、レーザ光が照射された測定サンプルSからの蛍光、りん光及び散乱光のうちのいずれか1つ以上を受光する光検出器と、を備える。
【0025】
レーザ光源は、例えば、所定の波長のレーザ光を出射する半導体レーザ光源である。レーザ光源は、複数設けられてもよい。レーザ光源が複数設けられる場合、フローセルにおいて、レーザ光源からのレーザ光が照射される位置は、同じであってもよく、異なっていてもよい。ただし、複数のレーザ光源からのレーザ光が異なる位置に照射される場合、測定サンプルSからの光を異なる光検出器にて検出することも可能となるため、そのような場合には、近接波長の蛍光を発する色素を用いた場合でも混色せずにそれぞれの蛍光スペクトルを測定することが可能となる。なお、レーザ光源から出射されるレーザ光は、パルス光及び連続光のうちのいずれであってもよい。例えば、レーザ光源は、波長480nm及び波長640nmのレーザ光をそれぞれ出射する複数の半導体レーザ光源であってもよい。
【0026】
フローセルは、複数の測定サンプルSを一方向に整列させて通流させる流路である。具体的には、フローセルは、測定サンプルSを包み込んだシース液を層流として高速で流すことで、複数の測定サンプルSを一方向に整列させて通流させる。フローセルはマイクロチップ又はキュベット内に形成されることができる。
【0027】
光検出器は、レーザ光が照射された測定サンプルSからの光を光電変換によって検出する。測定サンプルSからの光には、蛍光、りん光及び散乱光のうちの少なくとも1つが含まれ得る。
【0028】
例えば、光検出器は、測定サンプルSからの前方散乱光及び側方散乱光を含む散乱光LSを検出するディテクタと、測定サンプルSからの蛍光を検出する受光素子アレイと、を含んでもよい。
【0029】
ディテクタは、例えば、CCD(Charge Coupled Device)、CMOS(Complementary Metal Oxide Semiconductor)、フォトダイオードなどの公知の光電変換素子であってもよい。受光素子アレイは、例えば、検出する光の波長域が異なる独立した検出チャネルを複数配列することで構成され得る。具体的には、受光素子アレイは、検出する波長域が異なる複数のPMT(Photo Multiplier Tube)又はフォトダイオードを一次元等に配列させた受光素子アレイや、画素が2次元格子状に配列したイメージセンサなどであってもよい。受光素子アレイは、プリズム又はグレーティングなどの分光素子によって、波長ごとに分光された測定サンプルSからの蛍光を光電変換する。
【0030】
以上のような構成を備えるフローサイトメータでは、まず、レーザ光源から出射されたレーザ光がフローセル内を流れる測定サンプルSに照射される。レーザ光が照射されることで測定サンプルSは、散乱光および蛍光(又はりん光)を発する。測定サンプルSから発せられた散乱光は、ディテクタにて検出される。一方、測定サンプルSから発せられた蛍光は、分光素子にて波長ごとの光に分光された後、受光素子アレイにて受光される。それにより、測定サンプルSから発せられた蛍光のスペクトルが検出される。
【0031】
なお、以下の説明では、測定対象は細胞であるとする。測定装置3は、例えば、蛍光染色した細胞をフローセルに高速で流し、流れる細胞に光線を照射することで、細胞から放射された蛍光色素ごとの蛍光スペクトルを検出するスペクトル型フローサイトメータである。
図2は、蛍光スペクトルの一例を示す図である。
図2に示すように、蛍光スペクトルは、波長に対応するチャネルごとの蛍光強度にて表現される。
【0032】
測定装置3は、検出した蛍光スペクトルを測定データ2として出力する。測定データ2には、細胞ごとに、蛍光のスペクトルデータが含まれる。測定装置3は、測定データ2を例えば情報処理装置1に転送する。
【0033】
情報処理装置1は、測定装置3で測定された測定データ2を取得して解析を行い、解析結果を表示する。なお、情報処理装置1と測定装置3とは、ネットワークで接続されてもよく、情報処理装置1は、ネットワークを介して測定データ2を取得してもよい。
【0034】
情報処理装置1は、プレ処理部11と、プレ処理パラメータテーブル12と、スペクトル出力部13と、クラスタリング処理部14と、クラスタリング結果提示部15と、蛍光分離部16と、通常解析提示部17とを有する。なお、これらの機能部の全て又は一部は、クラウドで実施されてもよい。例えば、プレ処理パラメータテーブル12、クラスタリング処理部14、蛍光分離部16がクラウドで実施されてもよい。この場合、測定データ2は、クラウドにも転送される。
【0035】
プレ処理部11は、選択されたパラメータに応じて、スペクトルデータのプレ処理を行う。ここで、プレ処理とは、実際の観測値から、表示を行う座標変換のことである。変換は、例えば、単純にlog10変換でも良いし、観測装置の特性を考えたlogicle変換のようなものでもよい。パラメータには、W、T、M及びAがある。
【0036】
Wは、ゼロ近辺の値をリニアに表示する値である。Tは、蛍光強度の最大値であり、例えば104である。Mは、変換後の表示座標の最大値である。Aは、変換する最小のマイナス値である。
【0037】
プレ処理パラメータテーブル12は、プレ処理パラメータを記憶するテーブルである。
図3は、プレ処理パラメータテーブル12の一例を示す図である。
図3に示すように、プレ処理パラメータテーブル12は、W、T、M及びAの値の複数の組み合わせ(パラメータセットともいう)を記憶する。パラメータIDは、パラメータの組み合わせを識別する識別子である。
【0038】
プレ処理部11は、ユーザによりプレ処理パラメータテーブル12から選択されたW、T、M及びAの組み合わせを用いてlogicle変換を行う。なお、プレ処理部11は、プレ処理パラメータテーブル12からパラメータを選択する代わりに、デフォルト値を用いてもよい。あるいは、ユーザは、プレ処理パラメータテーブル12が記憶する値以外の値を指定することもできる。プレ処理部11は、ユーザがプレ処理パラメータを変更するごとにプレ処理を行う。なお、プレ処理部11は、logicle変換の代わりに、log変換、bi-exponential変換等の非線形処理の変換を行ってもよい。
【0039】
スペクトル出力部13は、プレ処理部11によりプレ処理が行われたスペクトルデータを用いてスペクトルプロットのイメージを生成し、生成したイメージを表示する。
図4は、スペクトルプロットの一例を示す図である。スペクトルプロットは、横軸に検出波長(Wavelength)を、縦軸に蛍光強度を示し、微粒子の数(イベント数あるいは密度)に関する情報(ポピュレーション情報)を色の濃淡や色調等で表現したものである。
【0040】
図4において、縦軸の「LD488」は、波長が488nm(nanometre:ナノメートル)のレーザ光を照射した場合の蛍光であることを示し、「_A」は、測定値が累積強度であることを示す。また、
図4において、微粒子の数の情報が網掛けで表現されているが、実際の画面では、微粒子の数の情報は色で表現される。
【0041】
図4の縦軸に示すように、スペクトルプロットでは、蛍光強度に相当する縦軸がlogicle変換されて表示される。このため、矢印91と矢印92とは、
図4では同じ長さで表示されているが、それぞれが示す範囲は大きく異なる。すなわち、縦軸が線形の場合、長さが全く異なり、矢印91の長さは矢印92よりずっと長い。
【0042】
クラスタリング処理部14は、プレ処理部11によりプレ処理が行われたスペクトルデータを用いて細胞のクラスタリングを行う。クラスタリング処理部14は、例えば、K-meansのようにKを指定されてスペクトルデータをK個のクラスタに分類する。あるいは、クラスタリング処理部14は、FlowSOM(Self-Organizing Map)のように、分割数を自動決定してもよい。
【0043】
あるいは、クラスタリング処理部14は、例えば、T-SNEのように次元圧縮を行って、次元圧縮の結果に対してゲーティングを行うことでクラスタリングを行ってもよい。あるいは、クラスタリング処理部14は、メタクラスタリングなどの2段階クラスタを行って、クラスタIDと、メタクラスタIDのようにクラスタの定義を2つ用いてもよい。ここで、メタクラスタとは、クラスタの集まりである。
【0044】
クラスタリング処理部14は、logicle変換されたスペクトルデータを用いてクラスタリングを行うことで、スペクトルデータの表示結果とクラスタリング結果の対応付けを容易にすることができる。
【0045】
クラスタリング結果提示部15は、クラスタリング処理部14によるクラスタリング結果を表示装置に表示する。クラスタリング結果提示部15は、分類数、あるいは、どの細胞群がどの分類に所属しているかを可視化する。
図5は、クラスタリング結果の一例を示す図である。
図5は、FlowSOMを用いてクラスタリングを行った場合を示す。
図5において、丸はクラスタを示し、クラスタは網掛けの異なるメタクラスタM#1~M#5に分類される。実際の表示では、メタクラスタM#1~M#5は異なる色で表示される。クラスタリング結果を表示することで、ユーザは、クラスタやメタクラスタの分布を知ることができる。
【0046】
蛍光分離部16は、測定データ2を取得し、蛍光分離処理(アンミキシングともいう)を行う。
図6は、蛍光分離処理を説明するための図である。
図6(a)は、測定された蛍光スペクトルを示す。測定された蛍光スペクトルは、
図6(b)に示すように、例えば3つの蛍光の蛍光スペクトルが重ね合わされたものである。
【0047】
そこで、蛍光分離部16は、
図6(c)に示す参照スペクトルを用いて3つの蛍光#1~#3のスペクトルに分離する。ここで、参照スペクトルは、蛍光ごとの蛍光スペクトルである。分離された蛍光#1~#3のスペクトルを
図6(d)に示す。蛍光分離部16は、蛍光ごとに分離されたスペクトルを用いて、例えば加重平均をとることで蛍光強度を計算する。
図6(e)は、蛍光分離部16により計算された蛍光#1~#3の強度を示す。
【0048】
通常解析提示部17は、蛍光分離部16により分離された蛍光強度を用いて解析を行い、解析結果を表示装置に表示する。
図7は、解析結果の表示例を示す図である。
図7は、APC-Cy7::CD24とPE-Dazzle594::CD38を2つの軸とする2次元プロットを示す。ここで、APC-Cy7::CD24、PE-Dazzle594::CD38は、蛍光強度の測定に使用された蛍光色素標識抗体である。「APC-Cy7」、「PE-Dazzle594」は蛍光色素であり、「CD24」、「CD38」は抗体である。ユーザは、2次元プロットにより、2つの蛍光色素に関する細胞の分布を知ることができる。
【0049】
なお、情報処理装置1は、ユーザによる二次元プロットの一部領域の選択に応じて、その領域に含まれる細胞群に対してプレ処理・クラスタリングを行い、クラスタリング結果を表示してもよい。また、情報処理装置1は、ユーザによるスペクトルプロットの一部領域の選択に応じて、その領域に含まれる細胞群に対してプレ処理・クラスタリングを行い、クラスタリング結果を表示してもよい。特に、スペクトルプロット内の密度が濃い部分等の特徴的な部分は、ユーザに選択されることが多い。
【0050】
1.2 情報処理装置の動作
次に、
図8~
図10を参照して、情報処理装置1の動作について説明する。
図8は、プレ処理部11によるプレ処理のフローを示すフローチャートである。
図8に示すように、プレ処理部11は、ユーザの指示に基づいてプレ処理パラメータを選択する(ステップS1)。
【0051】
そして、プレ処理部11は、プレ処理パラメータを用いてスペクトルデータのプレ処理を実施する(ステップS2)。そして、プレ処理部11は、ユーザがプレ処理パラメータを変更したか否かを判定し(ステップS3)、変更した場合には、プレ処理パラメータを変更してスペクトルデータのプレ処理を実施し(ステップS4)、ステップS3に戻る。
【0052】
一方、ユーザがプレ処理パラメータを変更しない場合には、プレ処理部11は、全対象細胞を処理したか否かを判定し(ステップS5)、処理していない対象細胞がある場合には、ステップS2に戻り、別の細胞を処理する。一方、全対象細胞を処理した場合には、プレ処理部11は、スペクトル出力部13に、プレ処理後のスペクトルデータをユーザに提示するように指示する(ステップS6)。また、プレ処理部11は、プレ処理後のスペクトルデータをクラスタリング処理部14に渡す。
【0053】
このように、プレ処理部11がスペクトルデータのプレ処理を行うことで、クラスタリング処理部14は、クラスタリング結果をスペクトルデータの表示結果と対応させることができる。
【0054】
図9は、クラスタリング処理部14による処理のフローを示すフローチャートである。
図9に示すように、クラスタリング処理部14は、プレ処理部11から、プレ処理されたスペクトルデータを取得し(ステップS11)、クラスタリング処理を実施する(ステップS12)。そして、クラスタリング処理部14は、クラスタリング結果提示部15に、クラスタリング結果を提示するように指示する(ステップS13)。
【0055】
このように、クラスタリング処理部14は、プレ処理されたスペクトルデータを用いてクラスタリングを行うので、クラスタリング結果をスペクトルデータの表示結果と対応させることができる。
【0056】
図10は、蛍光分離部16による蛍光分離処理のフローを示すフローチャートである。
図10に示すように、蛍光分離部16は、参照スペクトルを取得する(ステップS21)。そして、蛍光分離部16は、1つの細胞についてスペクトルデータを取得し(ステップS22)、蛍光分離処理を行う(ステップS23)。そして、蛍光分離部16は、全細胞を処理したか否かを判定し(ステップS24)、処理していない細胞がある場合には、ステップS22に戻り、全細胞を処理した場合には、蛍光分離処理を終了する。
【0057】
このように、蛍光分離部16が蛍光分離処理を行うので、通常解析提示部17は、蛍光データを解析して解析結果を表示することができる。
【0058】
1.3 作用・効果
以上のように、一実施形態によれば、プレ処理部11が、スペクトルデータを取得してプレ処理としてlogicle変換を行う。そして、クラスタリング処理部14が、logicle変換が行われたスペクトルデータを用いてクラスタリングを行う。そして、クラスタリング結果提示部15が、クラスタリング結果を表示装置に表示する。したがって、情報処理装置1は、スペクトルデータのうち値の大きい部分でクラスタリングが行われることを防ぐことができる。このため、情報処理装置1は、スペクトルデータの表示結果とクラスタリング結果が対応するようにクラスタリングを行うことができる。
【0059】
2.第2の実施形態
上述したように、近年のフローサイトメータでは、細胞などの粒子を複数の蛍光色素で染色するマルチスペクトル化が進められてきている。
【0060】
フローサイトメータのマルチスペクトル化が進むと、一度に測定できる蛍光物質の数が増加し、その結果、組合せ爆発がおこるため、人間の手で解析を行うことが難しくなってしまう。例えば、N(Nは自然数)色を一度に計測する場合、各色を2次元で扱おうとすると、その組み合わせはn(n-1)/2通りとなり、概ね、色数Nの2乗の半分に比例して増加する。
【0061】
このような組み合わせ爆発によって増大したデータを解析する手法としては、上述したように、例えば、FlowSOMなどのクラスタリングによってデータを分類してから解析する手法が考えられる。
【0062】
図11は、FlowSOMにおける初期化から学習までの一連の流れを説明するための模式図である。
図11に示す例では、解析対象のデータ群900に含まれる100個のベクトル(座標値)が、初期状態において2次元座標系で3行3列に配列する9つの代表ノードN11~N33に分類される場合が示されている。
【0063】
図11に示す例では、まず、データ群900の中からランダムサンプリングにより所定数(本例では9つ)のデータが選択され、この選択されたデータが代表ノードN11~N33の初期ノードベクトルN_ijとして設定される(ステップS1)。
【0064】
次に、代表ノードN11~N33それぞれの代表ノードベクトルN_ijを更新する学習が実行される。具体的には、まず、データ群900からランダムサンプリングにより1つのデータが取得される(ステップS2)。
【0065】
つづいて、取得されたデータ(ベクトル)が最も近い代表ノードに対して以下の式(1)に示される処理が実行されることで、この代表ノードの代表ノードベクトルN_ijが更新される(ステップS3)。なお、式(1)において、αは学習率ある。この学習率αは、経験則等に基づいて設定されてよく、例えば、0.1や0.01などの値であってよい。
新代表ノードベクトルN_ij=(1-α)×旧代表ノードベクトルN_ij+α×取得したデータのベクトル (1)
【0066】
つづいて、ステップS3で代表ノードベクトルN_ijが更新された代表ノードの周辺に位置する代表ノード(以下、周辺代表ノード)について、上記式(1)による変更にさらにβを乗算した以下の式(2)に示される処理が実行されることで、周辺代表ノードの代表ノードベクトル(以下、周辺代表ノードベクトルという)N_ijが更新される(ステップS4)。なお、式(2)において、β(r)は、経験則に基づいて決定された、アルゴリズムのパラメータであってもよく、例えば、0.1や0.01などの値であってよい。また、β(r)は、固定値であってもよいし、学習回数に応じて変更されてもよい。例えば、1回目の学習時と、2回目の学習時とで、β(r)値を変更してもよい。これは、αに対しても同様であってよい。
新周辺代表ノードベクトルN_ij=(1-β(r))×旧周辺代表ノードベクトル+β(r)×取得したデータのベクトル (2)
【0067】
なお、式(2)において、rは、更新対象のノードからの距離であってよく、βを距離に関連する関数で重み付けするための変数であってよい。例えば、隣接するノードの場合にはβ(r)=0.9とし、2つ隣りのノードに対してはβ(r)=0.5などとすることができる。このβ(r)は、上述したように、学習回数に応じて変更してもよく、例えば、学習回数が増加するほどβの値を減らしていくようにしてもよい。
【0068】
以降、データ群900に含まれる全てのデータに対する処理が完了するまで、ステップS2~S4の処理が繰り返し実行される。
【0069】
ただし、このようなFlowSOMでは、SOMアルゴリズムを用いることから、以下のような課題が存在する。
【0070】
第1に、SOMの代表ノード(以下、SOMノードともいう)の初期化では、上述したように、データのランダムサンプリングにより初期ノードベクトルが決定されるため(ステップS1)、実行ごとにクラスタリング結果が異なるという課題が存在する。
【0071】
第2に、SOMアルゴリズムは、ランダムサンプリングで学習しながらクラスタリングが実行されるため(ステップS2~S4)、サンプリングの順番次第で学習結果が異なり、それにより、実行ごとにクラスタリング結果が異なるという課題が存在する。
【0072】
第3に、第2の課題からの派生として、ランダムサンプリングで逐次学習を行う(ステップS2~S4)ことから、SOMノードのベクトルの更新が並列化(分割)できない不可分処理となり、それにより、処理の効率化や処理速度の向上ができないという課題が存在する。
【0073】
また、フローサイトメータのマルチスペクトル化により、より詳細な解析が可能となるが、それと同時に扱うデータ量が増大するため、データをクラスタリングにより分類する際に、処理時間の増大や次元の呪いが生じ易いという課題も発生する。
【0074】
さらに、近年では、フローサイトメータの計測速度の向上により解析対象のデータ数の増加も進んでいるが、データ数が増加すると、データ解析における描画時間が増大するだけでなく、ユーザによって生成されたクラスタを追加解析する際には、この描画時間の増大に加えて、単純に対象となるクラスタ数が増えることによる解析時間の増加という課題も発生する。
【0075】
そこで、本実施形態では、実行ごとの結果のばらつきを抑制することが可能なクラスタリングを効率的に実行すること可能にする情報処理装置、情報処理方法、プログラム及び情報処理システムについて、例を挙げて説明する。
【0076】
ただし、本開示に係る技術は、上述した課題のすべてを同時に解決している必要はない。したがって、後述する構成の一部又は全部を備えることで上述した課題の一部又は全部を解決しているものは、本開示の技術的範疇に含まれるものと解される。
【0077】
また、以下の説明において、上述した第1の実施形態と同様の構成、動作については、同一の符号を付し、その詳細な説明を省略する。
【0078】
2.1 情報処理システムの構成
図12は、本実施形態に係る情報処理システムの構成を示すブロック図である。
図12に示すように、情報処理システム200は、情報処理装置201と測定装置3とを備える。本実施形態において、測定装置3及び測定サンプルは、第1の実施形態において説明した測定装置3及び測定サンプルと同様であってよいため、ここでは詳細な説明を省略する。
【0079】
情報処理装置201は、プレ処理/蛍光分離部211と、プレ処理パラメータテーブル12と、スペクトル出力部13と、クラスタリング処理部214と、クラスタリング結果提示部15と、通常解析提示部17とを備える。この構成において、プレ処理パラメータテーブル12、クラスタリング結果提示部15及び通常解析提示部17は、第1の実施形態に係るそれらと同様であってよい。また、プレ処理/蛍光分離部211は、第1の実施形態に係るプレ処理部11及び蛍光分離部16の両方の機能を備えていてよい。なお、
図12ではスペクトル出力部13が省略されているが、第1の実施形態と同様のスペクトル出力部13が追加されてもよい。
【0080】
プレ処理/蛍光分離部211は、第1の実施形態に係る蛍光分離部16と同様に、参照スペクトルを用いることで、スペクトルデータである測定データ2を蛍光色素ごとの蛍光スペクトルに分離する。そして、プレ処理/蛍光分離部211は、アンミキシング後の蛍光スペクトルに対してLogicle変換などのプレ処理を実行する。プレ処理された蛍光色素ごとの蛍光スペクトルは、通常解析提示部17にてユーザに提示される。
【0081】
なお、プレ処理で使用する変換パラメータのパラメータセットは、第1の実施形態と同様に、ユーザがプレ処理パラメータテーブル12(
図3参照)で管理されているパラメータセットから使用するパラメータセットを指定することで選択されてよい。また、プレ処理パラメータテーブル12で管理されているパラメータセットは、ユーザが微調整可能であってもよい。
【0082】
本実施形態に係るクラスタリング処理部214は、プレ処理/蛍光分離部211から出力されたプレ処理後の蛍光スペクトルに対して、クラスタリング処理を実行する。クラスタリング処理部214で生成されたクラスタリング結果は、クラスタリング結果提示部15にてユーザに提示される。
【0083】
2.2 情報処理装置の動作例
次に、本実施形態に係る情報処理装置201の動作について説明する。
【0084】
2.2.1 プレ処理/蛍光分離部の動作例
まず、本実施形態に係るプレ処理/蛍光分離部211の動作例について説明する。
図13は、本実施形態に係るプレ処理/蛍光分離部の動作例を示すフローチャートである。
図13に示すように、本実施形態において、プレ処理/蛍光分離部211は、まず、
図8のステップS1と同様に、ユーザの指示に基づいてプレ処理パラメータを選択する(ステップS201)。
【0085】
次に、プレ処理/蛍光分離部211は、第1の実施形態において
図10を用いて説明した蛍光分離処理と同様に、測定データ2に含まれる全ての細胞のスペクトルデータに対して、参照スペクトルを用いた蛍光分離処理を実行する(ステップS202)。
【0086】
次に、プレ処理/蛍光分離部211は、
図8のステップS2~S5と同様に、測定データ2に含まれる全ての細胞のスペクトルデータに対して、ユーザにより選択又は変更されたプレ処理パラメータを用いたプレ処理を実行する(ステップS203~S206)。
【0087】
その後、全ての細胞のスペクトルデータに対するプレ処理が完了すると(ステップS206のYES)、プレ処理/蛍光分離部211は、プレ処理後のスペクトルデータをクラスタリング処理部214に入力し(ステップS208)、本動作を終了する。なお、プレ処理/蛍光分離部211は、例えば、
図8のステップS6と同様に、プレ処理後のスペクトルデータをユーザに提示するよう、スペクトル出力部13に指示してもよい。
【0088】
なお、本動作では、測定データ2に含まれる全細胞のスペクトルデータを対象としているが、これに限らず、後述するクラスタリングにおけるノード分割数(以下、必要数ともいう)以上の数の細胞のスペクトルデータであればよい。これは、後述するクラスタリング処理部の動作についても同様であってよい。
【0089】
2.2.2 クラスタリング処理部の動作例
次に、本実施形態に係るクラスタリング処理部214の動作例について説明する。本実施形態に係るクラスタリング処理部214が実行する動作の基本的な流れは、例えば、第1の実施形態において
図9を用いて説明した動作と同様であってよい。ただし、本実施形態では、
図9のステップS12で実行されるクラスタリング処理が、後述において
図14を用いて説明するクラスタリング処理に置き換えられる。
【0090】
図14は、本実施形態に係るクラスタリング処理部が実行するクラスタリング処理の一例を示すフローチャートである。なお、
図14に示すクラスタリング処理部214の動作からも分かるように、本実施形態に係るクラスタリング処理部214は、特許請求の範囲における、次元圧縮部、初期値決定部、クラスタリング部、平均値算出部、1以上の割当て部、更新部、ノード数変更部、メタクラスタリング部、分割部、及び、ノード設定部のうちの1つ以上としても機能し得る。
【0091】
図14に示すように、本実施形態では、クラスタリング処理部214は、まず、測定データ2に含まれる全て(又は必要数以上)の細胞のスペクトルデータに対して、主成分分析を実行する(ステップS221)。
【0092】
なお、ステップS221において対象とするスペクトルデータは、蛍光分離後にプレ処理が実施されたスペクトルデータであってよい。また、本説明では、主成分数を2つとしているが、これに限定されず、3以上であってもよい。さらに、ステップS221では、主成分分析に限られず、T-SNEのような統計学上のデータ解析手法を用いた種々の次元圧縮が実行されてよい。
【0093】
次に、クラスタリング処理部214は、ステップS221で決定した第1主成分及び第2主成分と、測定データ2に含まれる全細胞(又は必要数以上の細胞)の値(ベクトル)とに基づいて、SOMノードの代表ノードベクトルの初期値を決定する(ステップS222)。なお、ステップS222の詳細については、後述において
図15を用いて説明する。
【0094】
次に、クラスタリング処理部214は、バッチ学習を行うことでSOMクラスタリング処理を実行する(ステップS223)。なお、ステップS223の詳細については、後述において
図16を用いて説明する。
【0095】
次に、クラスタリング処理部214は、ステップS223で実行したSOMクラスタリング処理の結果に対して、例えば、コンセンサスクラスタリングなどの、クラスタ数を決定する処理(以下、メタクラスタリングという)を実行する(ステップS224)。これにより、クラスタリング処理におけるクラスタ数が決定される。なお、コンセンサスクラスタリングを用いた場合のステップS223の詳細については、後述において
図17を用いて説明する。
【0096】
その後、クラスタリング処理部214は、クラスタリング結果提示部15に、クラスタリング結果をユーザに提示するように指示する(ステップS225)。クラスタリング結果をユーザに提示するための可視化には、例えば、MST(Minimum Spanning Tree)法などを用いることが可能である。
【0097】
2.2.3 代表ノードベクトルの初期化について
図15は、
図14のステップS222で説明した、本実施形態に係る各代表ノードの代表ノードベクトルを初期化する際の動作を説明するための図である。なお、
図15に示す例では、
図11に示した例と同様に、プレ処理/蛍光分離部211による蛍光分離及びプレ処理が実行された100個の処理済みスペクトルデータ(ベクトル(座標値))が、初期状態において2次元座標系で3行3列に配列する9つの代表ノードN11~N33に分類される場合が示されている。
【0098】
図15に示すように、本実施形態に係る代表ノードベクトルの初期化では、まず、クラスタリング処理部214は、蛍光分離及びプレ処理後のスペクトルデータ(以下、処理済みスペクトルデータという)を含むデータ群(以下、単にデータ群という)302を対象として、各次元の平均値を計算する(ステップS301)。例えば、データの次元数が10である場合には、1次元から10次元それぞれについて、データ群302に含まれる全ての処理済みスペクトルデータにおける各次元の値が合算され、その平均が計算される。なお、次元数とは、データの種類数に相当する値であり、例えば、スペクトルデータであればチャネル数に相当し得る。したがって、例えば受光素子アレイが32チャネル、すなわち、受光素子アレイが検出範囲全体を32つの波長帯に区切って蛍光を検出する場合には、この受光素子アレイで取得されるスペクトルデータの次元数は32となる。
【0099】
つづいて、クラスタリング処理部214は、データ群302に含まれる全ての処理済みスペクトルデータの次元圧縮を行うことで、第1固有値及び第2固有値と、第1固有値の分散及び第2固有値の分散とをそれぞれ求める(ステップS302)。データの次元圧縮には、例えば、主成分分析などの統計学上のデータ解析手法を用いることができる。なお、第1固有値及び第2固有値は、次元圧縮後の次元から所定の規則に従って又は任意に選択されてよく、また、その数も第1固有値及び第2固有値の2つに限定されず、例えば、1つ又は3つ以上であってもよい。
【0100】
つづいて、クラスタリング処理部214は、各代表ノードN11~N33の初期ノードベクトルを以下の式(3)を用いて計算する(ステップS303)。なお、式(3)では、座標(i,j)の代表ノードNijの代表ノードベクトルの初期値(初期ノードベクトル)がN_ijと表されている。式(3)において、行分割数とは、行方向に並ぶ代表ノードの数であり、本例では3である。同様に、列分割数とは、列方向に並ぶ代表ノードの数であり、本例では3である。
初期ノードベクトルN_ij=各次元の平均値+(第1固有値/行分割数)×i+(第2固有値/列分割数)×j (3)
【0101】
以上のようにして各代表ノードの初期ノードベクトル(初期値)を決定することで、母集団が同一のデータ群302に対しては常に同じ初期ノードベクトルを設定することが可能となる。それにより、実行ごとにクラスタリング結果が異なること(上述した第1の課題に相当)を回避することが可能となる。
【0102】
2.2.4 バッチ学習によるクラスタリングについて
図16は、
図14のステップS223で説明した、本実施形態に係るバッチ学習によるクラスタリングの一例を示すフローチャートである。なお、
図16に示す例では、
図15に示した例と同様に、プレ処理/蛍光分離部211による蛍光分離及びプレ処理が実行された100個の処理済みスペクトルデータ(ベクトル(座標値))が、初期状態において2次元座標系で3行3列に配列する9つの代表ノードN11~N33に分類される場合が示されている。
【0103】
図16に示すように、本実施形態に係るバッチ学習によるクラスタリングでは、まず、クラスタリング処理部214は、データ群302から処理済みスペクトルデータを1つずつ選択し、選択した処理済みスペクトルデータをこれに最も近い代表ノードに割り当てる処理を実行する(ステップS304)。この割当て処理は、データ群302における全て(又は必要数以上)の処理済みスペクトルデータの割り当てが完了するまで繰り返される。
図16に示す例では、細胞IDが‘1’、‘3’である処理済みスペクトルデータが代表ノードN11に割り当てられ、細胞IDが‘2’である処理済みスペクトルデータが代表ノードN12に割り当てられ、細胞IDが‘100’である処理済みスペクトルデータが代表ノードN33に割り当てられている(細胞ID=‘4’~‘99’については説明が省略されている)。
【0104】
なお、細胞IDとは、データ群302に登録された処理済みスペクトルデータに対応する細胞を一意に識別するための識別子であってよい。また、データ群302から処理済みスペクトルデータを選択する際の順番は特に限定されず、例えば、データ群302に登録された処理済みスペクトルデータの細胞を一意に識別するための細胞IDの若い順や、データ群302への登録準など、種々の順番であってよい。
【0105】
次に、クラスタリング処理部214は、それぞれの代表ノードN11~N33に割り当てられた処理済みスペクトルデータに基づいて、代表ノードN11~N33それぞれの代表ノードベクトルを更新する処理を実行する(ステップS305)。代表ノードベクトルの更新では、例えば、以下の式(4)に基づいて、更新後の新代表ノードベクトルが計算される。
新代表ノードベクトルN_ij=(1-α)×旧代表ノードベクトルN_ij+α×割り当てられた処理済みスペクトルデータの平均値 (4)
【0106】
次に、クラスタリング処理部214は、ステップS305で代表ノードベクトルN_ijが更新された代表ノードの周辺に位置する周辺代表ノードについて、上記式(4)による変更にさらにβを乗算した以下の式(5)に示される処理を実行することで、周辺代表ノードの周辺代表ノードベクトルN_ijを更新する(ステップS306)。なお、式(5)において、β(r)は、上述した式(2)におけるβ(r)と同様であってよい。
新周辺代表ノードベクトルN_ij=(1-β(r))×旧周辺代表ノードベクトルN_ij+β(r)×代表ノードに割り当てられた処理済みスペクトルデータの平均値 (5)
【0107】
本実施形態では、上述したステップS304~S306の処理を所定回数(例えば、1回や2回以上)繰り返すことで、各代表ノードN11~N33の代表ノードベクトルが更新される。なお、ステップS304~S306の処理の繰り返しでは、繰り返すごとに学習率α及び/又はβが変化(例えば、減少又は増加)してもよい。
【0108】
以上のように、解析対象とする処理済みスペクトルデータの全てを代表ノードN11~N33の何れかに割り当てた後、各代表ノードN11~N33に割り当てられた処理済みスペクトルデータを用いて各代表ノードN11~N33の代表ノードベクトルを更新する手順とすることで、学習時のランダムサンプリングを排除することが可能となるため、実行ごとにクラスタリング結果が異なること(第2の課題に相当)を回避することが可能となる。
【0109】
また、全ての処理済みスペクトルデータの割当てが完了した後に代表ノードベクトルの更新が実行されるため、処理済みスペクトルデータの割当てから代表ノードベクトルの更新までの処理を細分化して異なる情報処理装置に実行させることが可能となる。
【0110】
例えば、データ群302に含まれる処理済みスペクトルデータを複数のグループに分割し、各グループに属するスペクトルデータの代表ノードへの割当てをそれぞれ異なる情報処理装置に実行させることが可能となる。例えば、本実施形態に係るクラスタリング処理部214は、複数の処理済みスペクトルデータを代表ノードN11~N33の何れかに割り当てる割当て部を備え、クラスタリング処理部214が備える割当て部の数は、グループ数と同数又はそれ以下の数であってよく、各割当て部は、互いに異なる情報処理装置において実行されてもよい。
【0111】
それにより、処理済みスペクトルデータの割当て処理を並列に実行することが可能となるため、処理の効率化や処理速度の向上等を達成することが可能となる。
【0112】
また、処理の細分化により、各情報処理装置が担当するデータ量を縮小することが可能となるため、クラスタリングする際の処理時間の増大や次元の呪いなどの不具合の発生も抑制することが可能となる。
【0113】
2.2.5 コンセンサスクラスアリングを用いたクラスタ数の決定について
図17は、
図14のステップS224で説明した、コンセンサスクラスタリングを用いてクラスタ数を決定する際の動作を説明するための図である。なお、
図17に示す例では、
図15及び
図16に示した例と同様に、プレ処理/蛍光分離部211による蛍光分離及びプレ処理が実行された100個の処理済みスペクトルデータ(ベクトル(座標値))が、初期状態において2次元座標系で3行3列に配列する9つの代表ノードN11~N33に分類される場合が示されている。
【0114】
上述の説明では、
図17の(a)に示されているように、データ群302に含まれる処理済みスペクトルデータの分類先、すなわち代表ノードの数が、初期設定において9つと設定されている場合について例示したが、データ群302に含まれる処理済みスペクトルデータによっては、初期設定された代表ノードの数(9つ)が必ずしも最適であるとは限らない。
【0115】
そこで本実施形態では、
図14のステップS224において、コンセンサスクラスタリングなどのメタクラスタリングを実行することで、
図17の(b)に示すように、より適した分割数と、メタクラスタリング後の代表ノード(以下、メタ代表ノードという)を構成する代表ノードの組合せとを決定する。
【0116】
図17に示す例では、メタクラスタリングの結果、代表ノードN11、N12及びN21で1つのメタ代表ノードNN1が構成され、代表ノードN22、N31及びN32で1つのメタ代表ノードNN2が構成され、代表ノードN13、N23及びN33で1つのメタ代表ノードNN3が構成される場合について例示されている。
【0117】
なお、本実施形態において、クラスタリングの実行時に設定されるノード分割数(本例では9つ)は、デフォルトで決定されている分割数であってもよいし、ユーザにより設定された分割数であってもよい。ユーザに当初のノード分割数を設定させる場合には、情報処理装置201は、ノード分割数をユーザに設定させるノード設定部として機能する操作入力部をさらに備えていてもよい。
【0118】
2.3 作用・効果
以上のように、本実施形態によれば、処理済みスペクトルデータの次元ごとの平均値と、処理済みスペクトルデータを次元圧縮することで得られた固有値とに基づいて、各代表ノードの初期ノードベクトル(初期値)が決定されるため、母集団が同一のデータ群302に対しては常に同じ初期ノードベクトルを設定することが可能となる。それにより、実行ごとにクラスタリング結果が異なることを回避することが可能となる。
【0119】
また、本実施形態によれば、解析対象とする処理済みスペクトルデータの全てが代表ノードN11~N33の何れかに割り当てられた後、各代表ノードN11~N33に割り当てられた処理済みスペクトルデータを用いて各代表ノードN11~N33の代表ノードベクトルが更新される手順であるため、実行ごとにクラスタリング結果が異なることを回避することが可能となる。
【0120】
さらに、本実施形態では、全ての処理済みスペクトルデータの割当てが完了した後に代表ノードベクトルの更新が実行されるため、処理済みスペクトルデータの割当てから代表ノードベクトルの更新までの処理を細分化して異なる情報処理装置に実行させることが可能となる。
【0121】
さらにまた、処理の細分化により、各情報処理装置が担当するデータ量を縮小することが可能となるため、クラスタリングする際の処理時間の増大や次元の呪いなどの不具合の発生も抑制することが可能となる。
【0122】
なお、本実施形態では、蛍光分離後のスペクトルデータをクラスタリング処理部214によるクラスタリング対象とした場合を例示したが、これに限定されず、例えば、測定装置3で取得された測定データ2をクラスタリング処理部214によるクラスタリング対象とすることも可能である。その場合、プレ処理/蛍光分離部211は、測定データ2にプレ処理を実行し、それにより得られた蛍光分離前のスペクトルデータをクラスタリング処理部214に入力する。そして、クラスタリング処理部214は、入力された蛍光分離前のスペクトルデータに対して、上述したクラスタリング処理を実行する。
【0123】
また、本実施形態では、プレ処理/蛍光分離部211が、測定データ2に含まれるスペクトルデータに対して蛍光分離処理を実行することで得られた蛍光色素ごとの蛍光スペクトルに対してプレ処理を実行する場合を例示したが、これに限定されず、例えば、プレ処理/蛍光分離部211が、測定データ2に含まれるスペクトルデータに対して先にプレ処理を実行してから蛍光分離処理を実行してもよい。
【0124】
その他の構成、動作及び効果は、上述した第1の実施形態と同様で会ってよいため、ここでは詳細な説明を省略する。
【0125】
3.情報処理装置のハードウェア構成
次に、
図18を参照して、上述した実施形態に係る情報処理装置1、201のハードウェア構成について説明する。
図18は、本開示の実施形態に係る情報処理装置のハードウェア構成例を示すブロック図である。なお、以下の説明では、情報処理装置1を例示するが、情報処理装置201に対しても同様に適用することが可能である。
【0126】
図18に示すように、情報処理装置1は、CPU(Central Processing Unit)901、ROM(Read Only Memory)903、及びRAM(Random Access Memory)905を含む。また、情報処理装置1は、ホストバス907、ブリッジ909、外部バス911、インタフェース913、入力装置915、出力装置917、ストレージ装置919、ドライブ921、接続ポート925、通信装置929を含む。情報処理装置1は、CPU901に代えて、又はこれとともに、DSP(Digital Signal Processor)又はASIC(Application Specific Integrated Circuit)と呼ばれるような処理回路を有してもよい。
【0127】
CPU901は、演算処理装置及び制御装置として機能し、ROM903、RAM905、ストレージ装置919、又はリムーバブル記録媒体923に記録された各種プログラムに従って、情報処理装置1内の動作全般又はその一部を制御する。例えば、CPU901は、上記の実施形態における情報処理装置1に含まれる各機能部の動作全般を制御する。ROM903は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM905は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一次記憶する。CPU901、ROM903、及びRAM905は、CPUバス等の内部バスにより構成されるホストバス907により相互に接続されている。さらに、ホストバス907は、ブリッジ909を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス911に接続されている。
【0128】
入力装置915は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ及びレバー等、ユーザによって操作される装置である。入力装置915は、例えば、赤外線やその他の電波を利用したリモートコントロール装置であってもよいし、情報処理装置1の操作に対応した携帯電話等の外部接続機器927であってもよい。入力装置915は、ユーザが入力した情報に基づいて入力信号を生成してCPU901に出力する入力制御回路を含む。ユーザは、この入力装置915を操作することによって、情報処理装置1に対して各種のデータを入力したり処理動作を指示したりする。
【0129】
出力装置917は、取得した情報をユーザに対して視覚的又は聴覚的に通知することが可能な装置で構成される。出力装置917は、例えば、LCD、PDP、OELD等の表示装置、スピーカ及びヘッドホン等の音響出力装置、並びにプリンタ装置等でありうる。出力装置917は、情報処理装置1の処理により得られた結果を、テキスト又は画像等の映像として出力したり、音響等の音として出力したりする。
【0130】
ストレージ装置919は、情報処理装置1の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置919は、例えば、HDD(Hard Disk Drive)等の磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等により構成される。このストレージ装置919は、CPU901が実行するプログラムや各種データ、及び外部から取得した各種のデータ等を格納する。
【0131】
ドライブ921は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体923のためのリーダライタであり、情報処理装置1に内蔵、あるいは外付けされる。ドライブ921は、装着されているリムーバブル記録媒体923に記録されている情報を読み出して、RAM905に出力する。また、ドライブ921は、装着されているリムーバブル記録媒体923に記録を書き込む。
【0132】
接続ポート925は、機器を情報処理装置1に直接接続するためのポートである。接続ポート925は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)ポート等でありうる。また、接続ポート925は、RS-232Cポート、光オーディオ端子、HDMI(登録商標)(High-Definition Multimedia Interface)ポート等であってもよい。接続ポート925に外部接続機器927を接続することで、情報処理装置1と外部接続機器927との間で各種のデータが交換されうる。
【0133】
通信装置929は、例えば、通信ネットワークNWに接続するための通信デバイス等で構成された通信インタフェースである。通信装置929は、例えば、有線又は無線LAN(Local Area Network)、Bluetooth(登録商標)、又はWUSB(Wireless USB)用の通信カード等でありうる。また、通信装置929は、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、又は、各種通信用のモデム等であってもよい。通信装置929は、例えば、インターネットや他の通信機器との間で、TCP/IP等の所定のプロトコルを用いて信号等を送受信する。また、通信装置929に接続される通信ネットワークNWは、有線又は無線によって接続されたネットワークであり、例えば、インターネット、家庭内LAN、赤外線通信、ラジオ波通信又は衛星通信等である。
【0134】
なお、本開示の技術的範囲は、上述の実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。
【0135】
例えば、上記実施形態では、情報処理システム4は情報処理装置1又は201と測定装置3とを備える構成であるとしたが、本技術はかかる例に限定されない。例えば、情報処理装置1又は201が測定装置3の有する機能(測定機能)を備えてもよい。この場合、情報処理システム4は、情報処理装置1又は201により実現される。また、測定装置3が情報処理装置1又は201の有する機能を備えてもよい。この場合、情報処理システム4は、測定装置3により実現される。また、情報処理装置1又は201の有する機能の一部を測定装置3が有してもよく、測定装置3の有する機能の一部を情報処理装置1又は201が有してもよい。
【0136】
なお、本技術は以下のような構成も取ることができる。
(1)
それぞれ1以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行する次元圧縮部と、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する初期値決定部と、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行するクラスタリング部と、
を備える情報処理装置。
(2)
前記複数のスペクトルデータの次元ごとの平均値を算出する平均値算出部をさらに備え、
前記初期値決定部は、前記次元圧縮の結果に加え、前記複数のスペクトルデータの前記次元ごとの平均値に基づいて、前記複数のノードそれぞれの前記初期値を決定する
前記(1)に記載の情報処理装置。
(3)
前記クラスタリング部は、
前記複数のスペクトルデータそれぞれを前記複数のノードの何れかに割り当てる割当て部と、
前記複数のノードそれぞれに割り当てられた前記スペクトルデータに基づいて前記複数のノードそれぞれのノードベクトルを更新する更新部と、
を含む前記(1)又は(2)に記載の情報処理装置。
(4)
前記クラスタリング部は、
前記更新部により更新された前記複数のノードそれぞれの前記ノードベクトルに対してコンセンサスクラスタリングを実行することで、前記ノードの数を変更するノード数変更部と、
前記ノード数変更部による変更後のノードに対して変更前の前記複数のノードそれぞれの前記ノードベクトルに基づくメタクラスタリングを実行するメタクラスタリング部と、
をさらに備える前記(3)に記載の情報処理装置。
(5)
前記クラスタリング部は、前記複数のスペクトルデータを2以上のグループに分割する分割部をさらに備え、
前記割当て部は、前記2以上のグループごとに、前記複数のスペクトルデータそれぞれを前記複数のノードの何れかに割り当てる
前記(4)に記載の情報処理装置。
(6)
前記クラスタリング部は、前記グループの数と同数又はそれ以下の数の前記割当て部を備え、
前記割当て部それぞれは、互いに異なる情報処理装置に配置される
前記(5)に記載の情報処理装置。
(7)
前記クラスタリング部は、SOM(Self-Organizing Map)アルゴリズムを用いたクラスタリングを実行する
前記(1)~(6)の何れか1項に記載の情報処理装置。
(8)
前記ノードの数をユーザに設定させるノード設定部をさらに備える
前記(1)~(7)の何れか1項に記載の情報処理装置。
(9)
前記次元圧縮部は、前記次元圧縮として、前記複数のスペクトルデータの主成分分析を実行する
前記(1)~(8)の何れか1項に記載の情報処理装置。
(10)
前記スペクトルデータは、スペクトル型のフローサイトメータにより測定されたスペクトルデータである
前記(1)~(9)の何れか1項に記載の情報処理装置。
(11)
前記複数のスペクトルデータそれぞれに対してスケール変換を実行するプレ処理部をさらに備え、
前記次元圧縮部は、前記スケール変換が実行された前記複数のスペクトルデータそれぞれに対して前記次元圧縮を実行する
前記(1)~(10)の何れか1項に記載の情報処理装置。
(12)
前記複数のスペクトルデータそれぞれを前記蛍光色素ごとの蛍光スペクトルに分離する蛍光分離部をさらに備え、
前記プレ処理部は、複数の前記蛍光スペクトルそれぞれに対して前記スケール変換を実行する
前記(11)に記載の情報処理装置。
(13)
前記プレ処理部は、前記スケール変換として非線形処理の変換を行う
前記(11)又は(12)に記載の情報処理装置。
(14)
前記プレ処理部は、前記スケール変換としてlogicle変換、log変換又はbi-exponential変換を行う
前記(13)に記載の情報処理装置。
(15)
前記クラスタリング部により実施された前記クラスタリングの結果を表示する表示制御部をさらに備える
前記(1)~(14)の何れか1項に記載の情報処理装置。
(16)
前記クラスタリング部により実施された前記クラスタリングの結果を表示する表示制御部をさらに備え、
前記表示制御部は、前記プレ処理部によりスケール変換が行われたデータを表示する
前記(11)~(14)の何れか1項に記載の情報処理装置。
(17)
それぞれ1以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行し、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定し、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行する
ことを含む情報処理方法。
(18)
コンピュータに、
それぞれ1以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータそれぞれに対して次元圧縮を実行する工程と、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する工程と、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行する工程と、
を実行させるためのプログラム。
(19)
それぞれ1以上の蛍光色素で標識された複数の粒子それぞれから放射された蛍光成分を含む複数のスペクトルデータを検出する測定装置と、
前記測定装置で検出された前記複数のスペクトルデータをクラスタリングする情報処理装置と、
を備え、
前記情報処理装置は、
前記測定装置で検出された前記複数のスペクトルデータそれぞれに対して次元圧縮を実行する次元圧縮部と、
前記次元圧縮の結果に基づいて複数のノードそれぞれの初期値を決定する初期値決定部と、
前記初期値を用いて前記複数のスペクトルデータに対するクラスタリングを実行するクラスタリング部と、
を備える情報処理システム。
【符号の説明】
【0137】
1,201 情報処理装置
2 測定データ
3 測定装置
4,200 情報処理システム
11 プレ処理部
12 プレ処理パラメータテーブル
13 スペクトル出力部
14,214 クラスタリング処理部
15 クラスタリング結果提示部
16 蛍光分離部
17 通常解析提示部
211 プレ処理/蛍光分離部
302 データ群