(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-17
(45)【発行日】2023-10-25
(54)【発明の名称】細胞集団同定システム、方法、およびプログラム
(51)【国際特許分類】
G01N 33/48 20060101AFI20231018BHJP
G01N 33/483 20060101ALI20231018BHJP
C12Q 1/04 20060101ALI20231018BHJP
C12M 1/34 20060101ALN20231018BHJP
【FI】
G01N33/48 M
G01N33/483 C
C12Q1/04
C12M1/34 A
(21)【出願番号】P 2023504112
(86)(22)【出願日】2022-08-31
(86)【国際出願番号】 JP2022032807
(87)【国際公開番号】W WO2023033056
(87)【国際公開日】2023-03-09
【審査請求日】2023-01-19
(31)【優先権主張番号】P 2021142556
(32)【優先日】2021-09-01
(33)【優先権主張国・地域又は機関】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】520104400
【氏名又は名称】イミュニティリサーチ株式会社
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】飴谷 章夫
【審査官】海野 佳子
(56)【参考文献】
【文献】特開2021-100414(JP,A)
【文献】特表2014-517954(JP,A)
【文献】特表2020-515832(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 33/48-33/98
(57)【特許請求の範囲】
【請求項1】
細胞集団の同定のためのシステムであって、
複数の細胞についての測定データを受信する受信手段と、
前記測定データに含まれる細胞の種類を
特定する特定手段
であって、前記特定手段は、
前記測定データの少なくとも一部から散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することであって、前記ピーク数は2またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別することと、
前記識別された細胞の種類をアノテーションテーブルに基づいて特定することと
を行うように構成されている、特定手段と、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出する導出手段と、
前記導出された比率を出力する出力手段と
を備え、前記システムは、前記アノテーションテーブルを記憶するデータベースと通信し、前記アノテーションテーブルは、細胞と前記細胞の細胞マーカーの状態の定義とを関連付けている、システム。
【請求項2】
前記決定されたピーク数の分布のうちの少なくとも2つは、相互に重なっている、請求項1に記載のシステム。
【請求項3】
前記ピーク数を決定することは、
ユーザ入力を受信することと、
前記ユーザ入力に基づいて前記ピーク数を決定すること
と
を含む、請求項
1に記載のシステム。
【請求項4】
前記特定手段は、前記識別された細胞の属性を特定することを行うようにさらに構成されている、請求項
1に記載のシステム。
【請求項5】
前記細胞の属性を特定することは、ユーザ入力に基づいて前記細胞の属性を特定することを含む、請求項
1に記載のシステム。
【請求項6】
前記データベースは、複数のアノテーションテーブルを記憶し、
前記特定手段は、前記複数のアノテーションテーブルのうちの少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、請求項1に記載のシステム。
【請求項7】
前記複数のアノテーションテーブルのうちの少なくとも1つのアノテーションテーブルを選択する入力を受信する第2の受信手段をさらに備え、
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、請求項6に記載のシステム。
【請求項8】
行うべき解析を示す入力を受信する第3の受信手段と、
前記行うべき解析を示す入力に基づいて、前記複数のアノテーションテーブルから少なくとも1つのアノテーションテーブルを選択する選択手段と
を備え、
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、請求項6に記載のシステム。
【請求項9】
前記複数のアノテーションテーブルは、第1のアノテーションテーブルと第2のアノテーションテーブルとを含み、前記第1のアノテーションテーブルは、第2のアノテーションテーブルよりも古い定義で前記細胞と前記細胞のマーカーの状態とを関連付ける、請求項6に記載のシステム。
【請求項10】
前記複数のアノテーションテーブルは、第1のアノテーションテーブルと第2のアノテーションテーブルとを含み、前記第1のアノテーションテーブルは、第2のアノテーションテーブルよりも概括的に前記細胞と前記細胞のマーカーの状態とを関連付ける、請求項6に記載のシステム。
【請求項11】
前記システムは、前記データベースを備える、請求項1に記載のシステム。
【請求項12】
前記アノテーションテーブルはさらに、前記細胞マーカーの測定結果と前記状態との関係を規定する基準を含む、請求項1に記載のシステム。
【請求項13】
前記特定手段による細胞の種類の特定の結果に基づいて、前記少なくとも1つのアノテーションテーブルを更新する更新手段をさらに備える、請求項12に記載のシステム。
【請求項14】
前記更新手段は、前記特定手段によって細胞の種類が特定されなかった測定データ、および/または、前記特定手段によって誤って細胞の種類が特定された測定データに対して、適切に細胞の種類を特定することができるように、前記アノテーションテーブルを更新する、請求項13に記載のシステム。
【請求項15】
前記更新は、
・前記細胞と、前記細胞の細胞マーカーの状態の定義、および/または
・前記細胞マーカーの測定結果と前記状態との関係を規定する基準
の更新を含む、請求項13に記載のシステム。
【請求項16】
前記測定データは、フローサイトメータによる測定データ、マスサイトメータによる測定データ、シングルセル遺伝子発現解析による測定データからなる群から選択される少なくとも1つの測定データを含む、請求項1に記載のシステム。
【請求項17】
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記複数の細胞を複数のクラスタに分け、そして前記複数のクラスタの少なくともいくつかを構成する細胞の種類を特定する、請求項1に記載のシステム。
【請求項18】
相関解析システムであって、
請求項1~17のいずれか一項に記載のシステムであって、前記システムは、第1の被験体の複数の細胞についての測定データから細胞の比率を出力する、システムと、
前記第1の被験体の医療データを受信する医療データ受信手段と、
前記医療データと前記細胞の比率とを突合することにより、複合データを生成する生成手段と、
前記複合データにおいて前記細胞の比率と前記医療データとの相関解析を行う解析手段と
を備える、相関解析システム。
【請求項19】
前記医療データに基づいて、複数のアノテーションテーブルから少なくとも1つのアノテーションテーブルを選択する選択手段
を備え、
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、請求項18に記載の相関解析システム。
【請求項20】
細胞集団の同定のための方法であって、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を
特定すること
であって、前記特定することは、
前記測定データの少なくとも一部から散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することであって、前記ピーク数は2またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別することと、
前記識別された細胞の種類をアノテーションテーブルに基づいて特定することと
を含む、ことと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む方法。
【請求項21】
細胞集団の同定のためのプログラムであって、前記プログラムは、プロセッサを備えるシステムにおいて実行され、前記プログラムは、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を
特定すること
であって、前記特定することは、
前記測定データの少なくとも一部から散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することであって、前記ピーク数は2またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別することと、
前記識別された細胞の種類をアノテーションテーブルに基づいて特定することと
を含む、ことと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む処理を前記プロセッサに行わせる、プログラム。
【請求項22】
細胞集団内の細胞を特定するためのシステムであって、
複数の細胞についての測定データを受信する受信手段と、
前記測定データに含まれる細胞の種類を特定する特定手段と、
前記特定された細胞の種類を出力する出力手段と
を備え、前記特定手段は、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定すること
であって、前記ピーク数は2またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別
することと
前記識別された細胞の種類を特定することと
を行うように構成されている、システム。
【請求項23】
細胞集団内の細胞を特定するための方法であって、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を
特定することと、
前記特定された細胞の種類を出力することと
を含み、前記特定することは、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定すること
であって、前記ピーク数は2またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別することと
前記識別された細胞の種類を特定することと
を含む方法。
【請求項24】
細胞集団内の細胞を特定するためのプログラムであって、前記プログラムは、プロセッサを備えるシステムにおいて実行され、前記プログラムは、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を
特定することと、
前記特定された細胞の種類を出力することと
を含む処理を前記プロセッサに行わせ、前記特定することは、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定すること
であって、前記ピーク数は2またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別することと
前記識別された細胞の種類を特定することと
を含む、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、細胞集団同定システム、方法、およびプログラムに関する。
【背景技術】
【0002】
免疫チェックポイント阻害剤の開発に代表されるように、患者の免疫状態は種々の疾患や状態、薬物の有効性等と関連性があることが明らかになっている。それに伴い、対象の免疫状態をモニタリングし、それによって得られる情報の価値は増大している。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明は、新規細胞集団同定システムを提供することを目的とする。
【0004】
本発明はまた、新規細胞集団同定システムを用いることによって得られる細胞のプロファイリング結果と臨床情報との相関解析の自動化システムを提供することを目的とする。
【0005】
本発明はまた、細胞のプロファイリング結果と臨床情報との相関の経時的変化を追うことが可能なモニタリングシステムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、例えば、以下の項目を提供する。
(項目1)
細胞集団の同定のためのシステムであって、
複数の細胞についての測定データを受信する受信手段と、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定する特定手段と、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出する導出手段と、
前記導出された比率を出力する出力手段と
を備え、前記システムは、前記アノテーションテーブルを記憶するデータベースと通信し、前記アノテーションテーブルは、細胞と前記細胞の細胞マーカーの状態の定義とを関連付けている、システム。
(項目2)
前記特定手段は、
前記測定データの少なくとも一部から散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することと、
前記決定されたピーク数の分布を前記散布図またはヒストグラムに当てはめることにより、前記分布に対応する細胞を識別することと、
を行うように構成されている、項目1に記載のシステム。
(項目3)
前記ピーク数を決定することは、ユーザ入力に基づいて前記ピーク数を決定することを含む、項目2に記載のシステム。
(項目4)
前記特定手段は、前記識別された細胞の属性を特定することを行うようにさらに構成されている、項目2または項目3に記載のシステム。
(項目5)
前記細胞の属性を特定することは、ユーザ入力に基づいて前記細胞の属性を特定することを含む、項目2~4のいずれか一項に記載のシステム。
(項目6)
前記データベースは、複数のアノテーションテーブルを記憶し、
前記特定手段は、前記複数のアノテーションテーブルのうちの少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目1~5のいずれか一稿に記載のシステム。
(項目7)
前記複数のアノテーションテーブルのうちの少なくとも1つのアノテーションテーブルを選択する入力を受信する第2の受信手段をさらに備え、
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目6に記載のシステム。
(項目8)
行うべき解析を示す入力を受信する第3の受信手段と、
前記行うべき解析を示す入力に基づいて、前記複数のアノテーションテーブルから少なくとも1つのアノテーションテーブルを選択する選択手段と
を備え、
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目6に記載のシステム。
(項目9)
前記複数のアノテーションテーブルは、第1のアノテーションテーブルと第2のアノテーションテーブルとを含み、前記第1のアノテーションテーブルは、第2のアノテーションテーブルよりも古い定義で前記細胞と前記細胞のマーカーの状態とを関連付ける、項目6~8のいずれか一項に記載のシステム。
(項目10)
前記複数のアノテーションテーブルは、第1のアノテーションテーブルと第2のアノテーションテーブルとを含み、前記第1のアノテーションテーブルは、第2のアノテーションテーブルよりも概括的に前記細胞と前記細胞のマーカーの状態とを関連付ける、項目6~8のいずれか一項に記載のシステム。
(項目11)
前記システムは、前記データベースを備える、項目1~10のいずれか一項に記載のシステム。
(項目12)
前記アノテーションテーブルはさらに、前記細胞マーカーの測定結果と前記状態との関係を規定する基準を含む、項目1~11のいずれか一項に記載のシステム。
(項目13)
前記特定手段による細胞の種類の特定の結果に基づいて、前記少なくとも1つのアノテーションテーブルを更新する更新手段をさらに備える、項目12に記載のシステム。
(項目14)
前記更新手段は、前記特定手段によって細胞の種類が特定されなかった測定データ、および/または、前記特定手段によって誤って細胞の種類が特定された測定データに対して、適切に細胞の種類を特定することができるように、前記アノテーションテーブルを更新する、項目13に記載のシステム。
(項目15)
前記更新は、
・前記細胞と、前記細胞の細胞マーカーの状態の定義、および/または
・前記細胞マーカーの測定結果と前記状態との関係を規定する基準
の更新を含む、項目13または14に記載のシステム。
(項目16)
前記測定データは、フローサイトメータによる測定データ、マスサイトメータによる測定データ、シングルセル遺伝子発現解析による測定データからなる群から選択される少なくとも1つの測定データを含む、項目1~15のいずれか一項に記載のシステム。
(項目17)
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記複数の細胞を複数のクラスタに分け、そして前記複数のクラスタの少なくともいくつかを構成する細胞の種類を特定する、項目1~16のいずれか一項に記載のシステム。
(項目18)
相関解析システムであって、
項目1~17のいずれか一項に記載のシステムであって、前記システムは、第1の被験体の複数の細胞についての測定データから細胞の比率を出力する、システムと、
前記第1の被験体の医療データを受信する医療データ受信手段と、
前記医療データと前記細胞の比率とを突合することにより、複合データを生成する生成手段と、
前記複合データにおいて前記細胞の比率と前記医療データとの相関解析を行う解析手段と
を備える、相関解析システム。
(項目19)
前記医療データに基づいて、複数のアノテーションテーブルから少なくとも1つのアノテーションテーブルを選択する選択手段
を備え、
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目18に記載の相関解析システム。
(項目20)
細胞集団の同定のための方法であって、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む方法。
(項目20A)
上記項目のうちの1つまたは複数の記載の特徴を含む、項目20に記載の方法。
(項目21)
細胞集団の同定のためのプログラムであって、前記プログラムは、プロセッサを備えるシステムにおいて実行され、前記プログラムは、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む処理を前記プロセッサに行わせる、プログラム。
(項目21A)
上記項目のうちの1つまたは複数の記載の特徴を含む、項目20に記載のプログラム。
(項目22)
細胞集団内の細胞を特定するためのシステムであって、
複数の細胞についての測定データを受信する受信手段と、
前記測定データに含まれる細胞の種類を特定する特定手段と、
前記特定された細胞の種類を出力する出力手段と
を備え、前記特定手段は、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することと、
前記決定されたピーク数の分布を前記散布図またはヒストグラムに当てはめることにより、前記分布に対応する細胞を識別特定することと
前記識別された細胞の種類を特定することと
を行うように構成されている、システム。
(項目22A)
上記項目のうちの1つまたは複数の記載の特徴を含む、項目22に記載のシステム。
(項目23)
細胞集団内の細胞を特定するための方法であって、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類を出力することと
を含み、前記特定することは、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することと、
前記決定されたピーク数の分布を前記散布図またはヒストグラムに当てはめることにより、前記分布に対応する細胞を識別することと
前記識別された細胞の種類を特定することと
を含む方法。
(項目23A)
上記項目のうちの1つまたは複数の記載の特徴を含む、項目23に記載の方法。
(項目24)
細胞集団内の細胞を特定するためのプログラムであって、前記プログラムは、プロセッサを備えるシステムにおいて実行され、前記プログラムは、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類を出力することと
を含む処理を前記プロセッサに行わせ、前記特定することは、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することと、
前記決定されたピーク数の分布を前記散布図またはヒストグラムに当てはめることにより、前記分布に対応する細胞を識別することと
前記識別された細胞の種類を特定することと
を含む、プログラム。
(項目24A)
上記項目のうちの1つまたは複数の記載の特徴を含む、項目24に記載のプログラム。
(項目A1)
細胞集団の同定のためのシステムであって、
複数の細胞についての測定データを受信する受信手段と、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定する特定手段と、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出する導出手段と、
前記導出された比率を出力する出力手段と
を備え、前記システムは、前記アノテーションテーブルを記憶するデータベースと通信し、前記アノテーションテーブルは、細胞と前記細胞の細胞マーカーの状態の定義とを含むテーブルである、システム。
(項目A2)
前記データベースは、複数のアノテーションテーブルを記憶し、
前記特定手段は、前記複数のアノテーションテーブルのうちの少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目A1に記載のシステム。
(項目A3)
前記複数のアノテーションテーブルのうちの少なくとも1つのアノテーションテーブルを選択する入力を受信する第2の受信手段をさらに備え、
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目A2に記載のシステム。
(項目A4)
行うべき解析を示す入力を受信する第3の受信手段と、
前記行うべき解析を示す入力に基づいて、前記複数のアノテーションテーブルから少なくとも1つのアノテーションテーブルを選択する選択手段と
を備え、
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目A2に記載のシステム。
(項目A5)
前記複数のアノテーションテーブルは、第1のアノテーションテーブルと第2のアノテーションテーブルとを含み、前記第1のアノテーションテーブルは、第2のアノテーションテーブルよりも古い定義で前記細胞と前記細胞のマーカーの状態とを関連付ける、項目A2~4のいずれか一項に記載のシステム。
(項目A6)
前記複数のアノテーションテーブルは、第1のアノテーションテーブルと第2のアノテーションテーブルとを含み、前記第1のアノテーションテーブルは、第2のアノテーションテーブルよりも概括的に前記細胞と前記細胞のマーカーの状態とを関連付ける、項目A2~4のいずれか一項に記載のシステム。
(項目A7)
前記システムは、前記データベースを備える、項目A1~6のいずれか一項に記載のシステム。
(項目A8)
前記アノテーションテーブルはさらに、前記細胞マーカーの測定結果と前記状態との関係を規定する基準を含む、項目A1~7のいずれか一項に記載のシステム。
(項目A9)
前記特定手段による細胞の種類の特定の結果に基づいて、前記少なくとも1つのアノテーションテーブルを更新する更新手段をさらに備える、項目A8に記載のシステム。
(項目A10)
前記更新手段は、前記特定手段によって細胞の種類が特定されなかった測定データ、および/または、前記特定手段によって誤って細胞の種類が特定された測定データに対して、適切に細胞の種類を特定することができるように、前記アノテーションテーブルを更新する、項目A9に記載のシステム。
(項目A11)
前記更新は、
・前記細胞と、前記細胞の細胞マーカーの状態の定義、および/または
・前記細胞マーカーの測定結果と前記状態との関係を規定する基準
の更新を含む、項目A9または10に記載のシステム。
(項目A12)
前記測定データは、フローサイトメータによる測定データ、マスサイトメータによる測定データ、シングルセル遺伝子発現解析による測定データからなる群から選択される少なくとも1つの測定データを含む、項目A1~11のいずれか一項に記載のシステム。
(項目A13)
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記複数の細胞を複数のクラスタに分け、そして前記複数のクラスタの少なくともいくつかを構成する細胞の種類を特定する、項目A1~12のいずれか一項に記載のシステム。
(項目A14)
相関解析システムであって、
項目A1~13のいずれか一項に記載のシステムであって、前記システムは、第1の被験体の複数の細胞についての測定データから細胞の比率を出力する、システムと、
前記第1の被験体の医療データを受信する医療データ受信手段と、
前記医療データと前記細胞の比率とを突合することにより、複合データを生成する生成手段と、
前記複合データにおいて前記細胞の比率と前記医療データとの相関解析を行う解析手段と
を備える、相関解析システム。
(項目A15)
前記医療データに基づいて、複数のアノテーションテーブルから少なくとも1つのアノテーションテーブルを選択する選択手段
を備え、
前記特定手段は、前記選択された少なくとも1つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目A12に記載の相関解析システム。
(項目A16)
細胞集団の同定のための方法であって、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む方法。
(項目A16A)
上記項目のうちの1つまたは複数の記載の特徴を含む、項目A16に記載の方法。
(項目A17)
細胞集団の同定のためのプログラムであって、前記プログラムは、プロセッサを備えるシステムにおいて実行され、前記プログラムは、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む処理を前記プロセッサに行わせる、プログラム。
(項目A17A)
上記項目のうちの1つまたは複数の記載の特徴を含む、項目A17に記載のプログラム。
【発明の効果】
【0007】
本発明は、新規細胞集団同定システムを提供する。
【0008】
本発明はまた、新規細胞集団同定システムを用いることによって得られる細胞プロファイリング結果(細胞集団情報)と臨床情報との相関解析システムを提供する。
【0009】
本発明はまた、細胞のプロファイリング結果と臨床情報との相関の経時的変化を追うことが可能なモニタリングシステムを提供する。
【0010】
これらによって、従来は人間の手作業によって、作業者のノウハウに依存して時間と労力をかけて行われていた細胞集団同定、細胞のプロファイリング結果と臨床情報との相関解析、および/または細胞のプロファイリング結果と臨床情報との相関の経時的変化の追跡が自動化され得る。これにより、特定の疾患または症状について臨床上重要な意味を有する細胞の特定が促進され得る。
【図面の簡単な説明】
【0011】
【
図1】
図1は、本発明の相関解析システムを用いた解析のフローの一例を示す図
【
図2】相関解析システム100の構成の一例を示す図
【
図3】相関解析システム100のより詳細な構成の一例を示す図
【
図4A】細胞集団同定システム120の構成の一例を示す図
【
図4B】細胞集団同定システム120の代替実施形態である細胞集団同定システム120’の構成の一例を示す図
【
図4C】細胞集団同定システム120の代替実施形態である細胞集団同定システム120’’の構成の一例を示す図
【
図5】相関解析システム100または細胞集団同定システム120を実装するサーバ装置500の構成の一例を示す図
【
図6】相関解析システム100の細胞集団同定システム120による処理600の一例を示すフローチャート
【
図7】免疫状態についての相関解析システム100による解析に係るフローの一例を示す図
【
図8】本発明のシステムが利用するアノテーションテーブルの一例を示す図
【
図9A】従来のゲーティングで行われていた手法を概略的に図示する図
【
図9B】本発明の発明者が開発した新たな分類手法を概略的に図示する図
【
図9C】従来の手法による結果と、本発明の手法による結果との比較の一例を示す図
【
図9D】本発明の手法によって陰性の画分と陽性の画分とに分離された細胞をさらに詳細に分けた結果を示す図
【
図10A】一実施形態において、ステップS602で特定手段122が、細胞の種類を特定するためにゲーティングを行うための処理の一例を示すフローチャート
【
図10B】一実施形態において、ステップS602で特定手段122が、細胞の種類を特定するためにゲーティングを行うための処理の別の一例を示すフローチャート
【
図10C】一実施形態において、ステップS602で特定手段122が、細胞の種類を特定するためにゲーティングを行うための処理のさらに別の一例を示すフローチャート
【発明を実施するための形態】
【0012】
以下、本発明を説明する。本明細書において使用される用語は、特に言及しない限り、当該分野で通常用いられる意味で用いられることが理解されるべきである。したがって、他に定義されない限り、本明細書中で使用される全ての専門用語および科学技術用語は、本発明の属する分野の当業者によって一般的に理解されるのと同じ意味を有する。矛盾する場合、本明細書(定義を含めて)が優先する。
【0013】
(1.定義)
本明細書において、「免疫細胞」とは生体内の免疫系を司る細胞の総称であり、リンパ球(T細胞、B細胞、ナチュラルキラー(NK)細胞)、単球(樹状細胞(ミエロイド系樹状細胞;mDC、形質細胞様樹状細胞;pDC)、マクロファージ)、顆粒球(好塩基球、好酸球、好中球)などが挙げられる。
【0014】
本明細書において、「細胞アノテーション」とは、任意の細胞を任意の1または複数の細胞マーカーの状態によって規定することをいう。本明細書において、「細胞マーカー」は、細胞を特徴付ける任意の情報をいう。「アノテーションテーブル」とは、細胞の種類と、それに対応する細胞マーカーの状態の定義との対応を含むテーブルをいう。なお、本発明のアノテーションテーブルは、必ずしも「テーブル」の形式である必要はなく、細胞の種類と、それに対応する細胞マーカーの状態の定義との対応を含む限り任意の形式であり得る。例えば、本発明のアノテーションテーブルは、条件式の羅列であってもよい。例えば、条件式を満たすかどうかを判定することで、ゲーティングまたは細胞アノテーションを行うことができる。例えば、本発明のアノテーションテーブルは、図であってもよい。例えば、図とのパターンマッチングを行い、類似するか否かを判定することで、ゲーティングまたは細胞アノテーションを行うことができる。
【0015】
本明細書において「細胞マーカー」という場合、細胞を特徴付ける任意の情報をいい、具体的には、細胞表面タンパク質、細胞内タンパク質または分泌型タンパク質(サイトカインもしくはホルモン)などの任意のタンパク質、任意の遺伝子の発現量や存在量、タンパク質を修飾している任意の部分(例えば、糖)の存在量、細胞の増殖能などが挙げられるが、これらに限定されない。
【0016】
本明細書において、「約」とは、後に続く数値の±10%を意味する。
【0017】
(2.アノテーションテーブル)
本発明の細胞集団同定システムは、被験体由来のサンプル中の複数の細胞の測定データに基づき、細胞群中の各細胞または各細胞集団に細胞アノテーションを付与して種類ごとに分類し、細胞群の中の各細胞の比率を同定し得る。
【0018】
細胞群の測定データは、典型的には、被験体由来のサンプル中に含まれる各細胞の細胞マーカーの存在量および/または発現量の測定データであり得る。被験体のサンプルは、末梢血、骨髄、腫瘍組織、造血組織、脾臓、正常組織、リンパ液等であり得る。特に末梢血サンプルは、非侵襲的で簡便に採取できるため、有利であり得る。サンプル中に含まれる各細胞の細胞マーカーの発現パターンの測定は、当該分野において公知の任意の方法によって行うことができるが、例えば、蛍光抗体を用いるフローサイトメータや、重金属ラベルされた抗体を用いるマスサイトメータ、および/またはシングルセル遺伝子発現解析によって行われ得る。好ましい実施形態において、本発明のアノテーションテーブルは、免疫細胞と、それに対応する複数の細胞マーカーそれぞれの発現パターンの定義とを含む。本発明のアノテーションテーブルは、細胞マーカーの種類(例えば、細胞表面タンパク質や細胞内タンパク質の発現量や存在量)と、その細胞マーカーの状態(例えば、発現パターンや存在パターン)との関係を規定する基準(すなわち、どの程度の発現(存在)量を、どのような発現(存在)パターンとして決定するか等)もさらに含んでもよい。サンプル中に含まれる各細胞の細胞マーカーの発現量の測定は、例えば蛍光抗体を用いるフローサイトメータ、または重金属ラベルされた抗体を用いるマスサイトメータによって行われ得、好ましくは、フローサイトメータによって行われ得る。1つの実施形態において、本発明のアノテーションテーブルは、免疫細胞と、それに対応する遺伝子の発現パターンの定義とを含み、さらに遺伝子の発現量と発現パターンとの関係を規定する基準も含んでもよい。遺伝子発現量の測定は、シングルセル遺伝子発現解析によって行われてもよい。特に好ましい実施形態において、本発明のアノテーションテーブルは、免疫細胞と、それに対応するタンパク質(例えば、細胞表面タンパク質や細胞内タンパク質)の発現パターンおよび遺伝子発現パターンの定義とを含み得る。
【0019】
免疫細胞において、例えばT細胞は、細胞異常の検出や細菌感染細胞の直接的破壊を担い、また、他の免疫細胞が抗体を産生するためのサポート役としても機能する免疫系の重要な細胞である。T細胞には、主にヘルパーT細胞およびキラーT細胞が含まれる。一般的には、ヘルパーT細胞は細胞マーカーとしてCD4を高発現(CD4+)しており、キラーT細胞はCD8を高発現(CD8+)している。さらに、ヘルパーT細胞やキラーT細胞の中でも、状態や機能によって異なる種類の細胞に細分化され得、それらの細分化された種類の細胞は、CD4やCD8以外の他の細胞マーカーの発現パターンによって定義され得る。細分化された細胞の種類は、例えば、分化後の細胞の種類だけではなく、一時的におかれる細胞の状態(刺激の前後、活性化、疲弊化など)、あるいは分化の各段階(未分化、分化途中、再分化中など)なども含み得る。例えば、T細胞は、状態(活性化T細胞または疲弊化T細胞等)や分化(未分化、分化途中、分化後)によって、さらに種類が細分化され得る。なお、これらの細分化の説明についてT細胞を例に挙げて説明したが、細胞の細分化はT細胞に限定されるものではない。好ましい実施形態において、本発明においては、細分化された種類の細胞と、それに対応する細胞マーカーの発現パターンを含むアノテーションテーブルが使用され得る。
【0020】
被験体のサンプルの測定データにおいて、アノテーションテーブルを参照することにより、細胞マーカーの発現パターンから、各細胞の種類が特定され得る。あるいは、被験体のサンプルの測定データにおいて、アノテーションテーブルを参照することによって細胞マーカーの発現パターンが識別され、アノテーションテーブルをさらに参照することにより、識別された細胞マーカーの発現パターンから、各細胞の種類が特定され得る。そして、サンプル中に含まれる各細胞の種類を特定することによって、それぞれの種類の細胞がサンプル中の細胞においてどのような比率で存在するのかを特定することができる。
【0021】
典型的な実施形態においては、アノテーションテーブルにおける各細胞の細胞アノテーションは、各細胞に対して、複数の細胞マーカーの発現パターンによって規定され得る。本発明のアノテーションテーブルは、各細胞に対して、典型的には5種類以上、より好ましくは10種類以上、特に好ましくは15種類以上の細胞マーカーの発現パターンを定義したものであり得る。ある場合には、50種類以上であってもよし、例えば、10,000種類以上であってもよい。発現パターンは、それぞれの測定方法に応じた適切な大きさの数値を使って、それぞれの細胞マーカーごとに上限および下限の範囲で表現しうるが、範囲の設定は上限および下限を用いなくてもよい。たとえば、2つの細胞マーカーそれぞれの発現量(存在量)を縦軸、横軸とした散布図において各細胞の細胞マーカー発現量(存在量)をプロットし、同種の細胞が集まってできたクラスタを楕円、多角形などで囲い、それを範囲としてもよい。あるいは数値を用いなくても、上限と下限の範囲は、-(発現なし)、+(発現あり)、2+(高い発現あり)、3+(顕著に高い発現あり)など、あるいは、-、low(またはdim)、highなどの指標を用いて表現され得る。例えば、典型的にはヘルパーT細胞は、CD4が「3+」であり、CD8が「-」であり、さらに他の細胞マーカーの発現パターンによって、分化後のヘルパーT細胞については活性化または疲弊化した状態、あるいはヘルパーT細胞への分化途中の細胞などの細胞群に細分化され得る。例えば、典型的にはキラーT細胞は、CD4が「-」であり、CD8が「3+」であり、さらに他の細胞マーカーの発現パターンによって、分化後のキラーT細胞については活性化または疲弊化した状態、あるいはキラーT細胞への分化途中の細胞などの細胞群に細分化され得る。
【0022】
さらに、アノテーションテーブルは、細胞マーカーの発現量と発現パターンとの関係を規定する基準も定義することができる。例えば、CD4について、「3+」の発現パターンと「2+」の発現パターンとの境界となる発現量、「2+」の発現パターンと「+」の発現パターンとの境界となる発現量、「+」の発現パターンと「-」の発現パターンとの境界となる発現量を規定することができる。これにより、測定データが示す発現量から、その測定データの発現パターンを識別することができる。
【0023】
細胞マーカーの発現パターンについては、どのレベルの発現を+、2+、3+などと評価するか、または範囲をどの散布図でどのような円形、多角形などで表現するかなどについて統一的・普遍的な指標は存在しないため、また数値による表現の場合は真の値は分子数でありながら実際に用いるのは測定方法に依存して表現される数値であるため、本発明のアノテーションテーブルにおける発現パターンの評価は、アノテーションテーブル内において定義される他の細胞群との対比による相対的な評価であり得る。好ましい実施形態において、本発明においては、アノテーションテーブルは、以下に説明するように機械学習により、またはマニュアルで、動的に更新され得る。すなわち、ある時点においてヘルパーT細胞は、CD4が「3+」であり、CD8が「-」であり、他の細胞マーカーの発現はいずれであってもよいと定義されていたとしても、機械学習によって、またはマニュアルで新しい知見を反映させることにより、ヘルパーT細胞を、CD4が「3+」であり、CD8が「-」であり、かつCD16が「-」である細胞群と、CD4が「3+」であり、CD8が「-」であり、かつCD16が「+」である細胞群とに細分化するように更新し得る。本発明において、細胞は、細胞の機能、状態(活性化、疲弊化)、分化(未分化、分化途中、分化後)などによって細分化され得る。このようにアノテーションテーブルを動的に更新することにより、より細分化された細胞群を得ることができる。またその細分化された各細胞の比率を求めることによって、被験体の免疫状態をより適切に特定することができる。
【0024】
好ましい実施形態において、アノテーションテーブルの更新は、以前にアノテーションテーブルを用いて行われた細胞の種類の分類の結果を利用した機械学習によって行われる。
【0025】
一実施形態において、例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、どの細胞にも分類されない細胞群が存在したとする。例えば、これは、分類結果を専門家が検証することによって検出されてもよいし、分類結果を検証するアルゴリズムを用いて検証されてもよい。分類結果を検証するアルゴリズムは、例えば、種類がわからない細胞あるいはいずれのクラスタにも分類されなった細胞を特定するための任意のアルゴリズムであり得る。分類結果を検証するアルゴリズムは、例えば、機械学習ベースのアルゴリズムであってもよいし、ルールベースのアルゴリズムであってもよい。本例では、どの細胞にも分類されなかった細胞群を分類することができるように、アノテーションテーブルを更新することができる。例えば、統計分析(例えば、主成分分析)または機械学習(例えば、ランダムフォレスト)等を用いて、どの細胞にも分類されなかった細胞群を分類することができる発現パターンを特定し、特定された発現パターンを含めるようにアノテーションテーブルを更新することができる。
【0026】
一実施形態において、例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、専門家の経験的にまたは学問的(例えば、免疫学的)に不正確に分類された細胞群が存在したとする。例えば、これは、分類結果を専門家が検証することによって検出されてもよいし、分類結果を検証するアルゴリズムを用いて検証されてもよい。分類結果を検証するアルゴリズムは、例えば、所定の基準を満たさない細胞あるいはクラスタ(例えば、所定の基準下では所定の境界で2つのクラスタが区分されるべきところ、その境界では区分されないクラスタなど)を特定するための任意のアルゴリズムであり得る。分類結果を検証するアルゴリズムは、例えば、機械学習ベースのアルゴリズムであってもよいし、ルールベースのアルゴリズムであってもよい。本例では、不正確に分類された細胞群を専門家の経験的にまたは学問的(例えば、免疫学的)に正しく分類することができるように、アノテーションテーブルを更新することができる。例えば、統計分析(例えば、主成分分析)または機械学習(例えば、ランダムフォレスト)等を用いて、不正確に分類された細胞群を正しく分類することができる発現パターンを特定し、特定された発現パターンを含めるようにアノテーションテーブルを更新することができる。
【0027】
好ましい実施形態において、アノテーションテーブルにおいて定義される、細胞マーカーの種類(例えば、細胞表面タンパク質や細胞内タンパク質の発現量や存在量)と、その細胞マーカーの状態(例えば、発現パターンや存在パターン)との関係を規定する基準(すなわち、どの程度の発現(存在)量を、どのような発現(存在)パターンとして決定するか等)についても、以下に説明するように機械学習により、またはマニュアルで、動的に更新され得る。CD4の発現量を細胞マーカーとする場合を例にすると、ある時点において、CD4について、「3+」の発現パターンと「2+」の発現パターンとの境界となる発現量がαであり、「2+」の発現パターンと「+」の発現パターンとの境界となる発現量がβであると定義されていたとしても、機械学習によって、またはマニュアルで新しい知見を反映させることにより、CD4について、「3+」の発現パターンと「2+」の発現パターンとの境界となる発現量がα’であり、「2+」の発現パターンと「+」の発現パターンとの境界となる発現量がβ’であると更新され得る。このようにアノテーションテーブルを動的に更新することにより、より正確に分類された細胞群を得ることができる。またこのようにして得た正確に分類された細胞群に基づいて、ある被験体における細分化された細胞の種類(例えば、状態(例えば、活性化T細胞、疲弊化T細胞)や分化(未分化、分化途中、分化後)などによって細分化された種類)ごとの割合を求めることができ、これにより、当該被験体の免疫状態を特定することができる。
【0028】
一実施形態において、アノテーションテーブルの更新は、以前にアノテーションテーブルを用いて行われた細胞の種類の分類の結果を利用した機械学習によって行われる。例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、どの細胞にも分類されない細胞群が存在したとする。例えば、これは、分類結果を専門家が検証することによって検出されてもよいし、分類結果を検証するアルゴリズムを用いて検証されてもよい。分類結果を検証するアルゴリズムは、例えば、種類がわからない細胞あるいはいずれのクラスタにも分類されなった細胞を特定するための任意のアルゴリズムであり得る。分類結果を検証するアルゴリズムは、例えば、機械学習ベースのアルゴリズムであってもよいし、ルールベースのアルゴリズムであってもよい。本例では、どの細胞にも分類されなかった細胞群を分類することができるように、アノテーションテーブルにおける細胞マーカーの発現量と発現パターンとの関係を規定する基準を更新することができる。例えば、統計分析(例えば、主成分分析)または機械学習(例えば、ランダムフォレスト、k平均法)等を用いて、どの細胞にも分類されなかった細胞群を分類することができるような、細胞マーカーの発現量と発現パターンとの関係を規定する基準を特定し、特定された基準を含めるようにアノテーションテーブルを更新することができる。
【0029】
例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、専門家の経験的にまたは学問的(例えば、免疫学的)に不正確に分類された細胞群および/または分類されなかった細胞群が存在したとする。例えば、これは、分類結果を専門家が検証することによって検出されてもよいし、分類結果を検証するアルゴリズムを用いて検証されてもよい。分類結果を検証するアルゴリズムは、例えば、所定の基準を満たさない細胞あるいはクラスタ(例えば、所定の基準下では所定の境界で2つのクラスタが区分されるべきところ、その境界では区分されないクラスタなど)を特定するための任意のアルゴリズムであり得る。分類結果を検証するアルゴリズムは、例えば、機械学習ベースのアルゴリズムであってもよいし、ルールベースのアルゴリズムであってもよい。本例では、不正確に分類された細胞群を専門家の経験的にまたは免疫学的に正しく分類することができるように、アノテーションテーブルを更新することができる。例えば、統計分析(例えば、主成分分析)または機械学習(例えば、ランダムフォレスト、k平均法)等を用いて、不正確に分類された細胞群および/または分類されなかった細胞群を正しく分類することができるような、細胞マーカーの種類と状態との関係を規定する基準を特定し、特定された基準を含めるようにアノテーションテーブルを更新することができる。
【0030】
アノテーションテーブルの更新は、例えば、アノテーションテーブルに定義される各細胞マーカーの状態を更新することによって行われてもよいし、各細胞マーカーの測定結果と状態との関係を規定する基準を更新することによって行われてもよいし、その両方を変更するように行われてもよい。例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、どの細胞にも分類されない細胞群が存在したとする。その場合、その細胞群を分類することができるように、アノテーションテーブルにおける細胞マーカーの発現パターンと、細胞マーカーの発現量と発現パターンとの関係を規定する基準との両方を更新することができる。例えば、統計分析(例えば、主成分分析)または機械学習(例えば、ランダムフォレスト、k平均法)等を用いて、どの細胞にも分類されなかった細胞群を分類することができる、発現パターンおよび細胞マーカーの発現量と発現パターンとの関係を規定する基準の両方を特定し、特定された発現パターンおよび基準を含めるようにアノテーションテーブルを更新することができる。
【0031】
例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、専門家の経験的にまたは学問的(例えば、免疫学的)に不正確に分類された細胞群が存在したとする。その場合、その細胞群を専門家の経験的にまたは学問的(例えば、免疫学的)に正しく分類することができるように、アノテーションテーブルを更新することができる。例えば、統計分析(例えば、主成分分析)または機械学習(例えば、ランダムフォレスト、k平均法)等を用いて、不正確に分類された細胞群を正しく分類することができる、発現パターン、および細胞マーカーの発現量と発現パターンとの関係を規定する基準との両方を特定し、特定された発現パターンおよび基準を含めるようにアノテーションテーブルを更新することができる。
【0032】
アノテーションテーブルを更新することの効果は、例えば、アノテーションテーブルに対する更新量を記憶しておき、アノテーションテーブルを参照するときに、測定データに対して更新量を適用することにより測定データを調整することによっても達成することができる。本明細書では、アノテーションテーブルを更新することは、アノテーションテーブル自体は固定されたものであるが、そのアノテーションテーブルに対する更新量で測定データを調整することも含む概念である。
【0033】
アノテーションテーブルを更新していくことで、ユーザは最新の知見に基づく解析を行うことができるようになる。これに加えて、アノテーションテーブルを更新することは、新しい細胞群または新しい発現パターンの発見につながり得る。
【0034】
(3.相関解析システムおよびモニタリングシステム)
本発明の発明者は、被験体由来のサンプル中の複数の細胞の測定データから、上述の細胞集団同定システムを用いて同定された細胞プロファイリング結果と、当該被験体の医療データとの関係を解析するための相関解析システムを開発した。この相関解析システムは、従来、測定データに対して手作業で行っていた細胞集団の同定を自動的に行う細胞集団同定システムに加えて、同定された細胞集団(細胞プロファイリング結果)と医療データとの関係を導出する手段をさらに含む。これにより、測定データと医療データとの関係を迅速かつ容易に行うことができる。さらには、手作業で行っていた手法では見出すことができなかった細胞集団または細胞集団と医療データとの関係を見出すことも可能であり得る。
【0035】
例えば、既知の疾患または症状を有する被験体から得られた測定データから得られた細胞プロファイリング結果と、医療データとの関係を解析することにより、その疾患または症状について臨床上重要な意味を有する細胞(例えば、その疾患または症状が悪化することに関連する細胞、その疾患または症状が回復することに関連する細胞、その疾患または症状の診断に役立つ細胞等)を特定することができる。
【0036】
図1は、本発明の相関解析システムを用いた解析のフローの一例を示す。相関解析システムを用いた解析により、ユーザUは解析結果を得ることができる。
【0037】
ステップS1では、被験体Sから取得されたサンプルが分析装置に提供される。被験体のサンプルは任意のサンプルであり得るが、例えば、末梢血、骨髄、腫瘍組織、造血組織、脾臓、正常組織、リンパ液等であり得る。分析装置は任意の装置であり得るが、例えば、フローサイトメータ、マスサイトメータ、シングルセル解析装置等であり得る。
【0038】
ステップS2では、分析装置によって出力された測定データが相関解析システム100(より具体的には、相関解析システム100における細胞集団同定システム120)に提供される。なお、
図1においては相関解析システム100が細胞集団同定システム120を含んでいる実施形態を図示したが、本発明はこれに限定されず、細胞集団同定システムまたは相関解析システムそれぞれが別個に本発明の主題である。測定データが細胞集団同定システムに提供される態様は問わない。測定データは、任意の態様で、細胞集団同定システムに提供されることができる。例えば、測定データは、ネットワーク(例えば、インターネット、LAN等)を介して相関解析システム100に提供されてもよいし、測定データを記憶した記憶媒体(例えば、リムーバブルメディア)を介して細胞集団同定システムに提供されてもよい。
【0039】
ステップS3では、被験体Sに関する医療データが相関解析システム100に提供される。医療データが相関解析システム100に提供される態様は問わない。医療データは、任意の態様で、相関解析システム100に提供されることができる。例えば、医療データは、ネットワーク(例えば、インターネット、LAN等)を介して相関解析システム100に提供されてもよいし、医療データを記憶した記憶媒体(例えば、リムーバブルメディア)を介して相関解析システム100に提供されてもよい。
【0040】
測定データが細胞集団同定システム(例えば、相関解析システム100における細胞集団同定システム120)に提供されると、細胞集団同定システムは、細胞群中の細胞(例えば、免疫細胞)を種類ごとに分類し、細胞群の中の各細胞の比率を同定することになる。このとき、細胞集団同定システムは、アノテーションテーブルを用いて、細胞群中の細胞の種類を特定することができる。アノテーションテーブルは、細胞集団同定システム、または細胞集団同定システム120を含む相関解析システム100と通信するデータベース部200に記憶されている。
【0041】
ステップS4では、細胞集団同定システム120、または細胞集団同定システム120を含む相関解析システム100がデータベース部200にアクセスする。データベース部200には、1または複数のアノテーションテーブルが記憶され得る。一実施形態では、データベース部200には、1つのみのアノテーションテーブルが記憶され得る。他の実施形態において、データベース部200に複数のアノテーションテーブルが記憶されている場合、細胞集団同定システム、または細胞集団同定システム120を含む相関解析システム100は、データベース部200に記憶されている複数のアノテーションテーブルから、測定データに含まれる細胞の種類を特定するためのアノテーションテーブルを検索する。アノテーションテーブルは、例えば、ユーザUが希望する解析条件に基づいて検索されてもよいし、例えば、測定データが取得された条件に基づいて検索されてもよい。1つの実施形態において、アノテーションテーブルは、ある時点において用意された第1のアノテーションテーブルと、その後の別の時点において更新された第2のアノテーションテーブルとを含む。別の実施形態において、アノテーションテーブルは、細胞マーカーの種類について、概括的に定義された第1のアノテーションテーブルと、詳細に定義された第2のアノテーションテーブルとを含む。別の実施形態において、アノテーションテーブルは、細胞マーカーの状態について、概括的に定義された第1のアノテーションテーブルと、詳細に定義された第2のアノテーションテーブルとを含む。ユーザは、これらの複数のアノテーションテーブルから目的に応じて適切なアノテーションテーブルを選択してもよいし、細胞集団同定システム、または細胞集団同定システムを含む相関解析システム100が適切なアノテーションテーブルを自動的に選択するように構成してもよい。
【0042】
解析に利用されるべきアノテーションテーブルが決定されると、ステップS5では、決定されたアノテーションテーブルがデータベース部200から細胞集団同定システム、または細胞集団同定システム120を含む相関解析システム100に提供される。細胞集団同定システムは、提供されたアノテーションテーブルを用いて細胞群中の免疫細胞の種類を特定する。細胞集団同定システムは、特定された細胞の種類に基づいて、細胞群の中の各免疫細胞の比率を同定することができる。
【0043】
続いて、相関解析システム100は、細胞集団同定システムによって同定された各免疫細胞の比率の情報を受け取り、それを医療データと突合することによって、複合データを生成することができる。
【0044】
相関解析システム100は、生成された複合データに基づく解析を行い、ステップS6では、その結果がユーザUに提供される。
【0045】
相関解析システム100は、例えば、複合データの相関解析を行うことができる。これにより、特定の疾患または症状について臨床上重要な意味を有する細胞(例えば、その疾患または症状が悪化することに関連する細胞、その疾患または症状が回復することに関連する細胞、その疾患または症状の診断に役立つ細胞等)を特定することができる。
【0046】
相関解析を行うとき、相関解析システム100は、複合データに含まれる細胞の比率を直接利用するようにしてもよいし、複合データに含まれる細胞の比率から導出される比率(例えば、複合データに含まれる細胞の比率の回帰分析により導出される比率)を利用するようにしてもよい。一実施形態において、医療データと相関する細胞の比率として種々の比率を採用することができ、例えば、ある被験体における細胞の種類ごとの比率を用いてもよいし、細胞の種類ごとの比率を用いて回帰分析を行い、得られた多項式によって出力される値が医療データと相関してもよい。また他の実施形態において、被験体におけるある細胞の量(X)の、他の細胞の量(Y)に対する相対値(例えば、X/YやX2/Yなど)が医療データと相関してもよい。ある時点で細胞集団同定システムによって得られた1つまたは多様な細胞の比率を細胞プロファイリング結果とし、この細胞プロファイリング結果を時間経過ごとに取得して、時間経過とともに比率が有意に変化する細胞を見つけることによって、つまり細胞状態のモニタリング(例えば、免疫細胞を対象にした免疫モニタリング)を行うこともできる。また、このような細胞状態のモニタリングは、複合データを用いて行うこともできる。
【0047】
一実施形態において、相関解析システム100は、例えば、複合データの次元削減解析を行うことができる。例えば相関解析システム100は、細胞の比率と医療データとを合わせた多変量のデータに対して多変量解析(例えば、主成分分析)を行うことにより、多変量データの次元を削減することができる。これにより、特徴的な集団についての発見(例えば、A細胞が多く、B細胞が少ない集団は長期生存するなど)をすることができる。
【0048】
好ましい実施形態において、相関解析システム100は、例えば、複合データに含まれる或る細胞の比率とPFS(無増悪生存期間)とからROC(受信者動作特性)カーブを描くことができる。これにより、その細胞の比率に、診断能力があるかどうかを特定することができる。
【0049】
以下に、相関解析システム100について、具体的に説明する。
【0050】
(4.相関解析システムの構成)
図2は、相関解析システム100の構成の一例を示す。
【0051】
相関解析システム100は、ネットワーク400を介して、データベース部200と、少なくとも1つのユーザ端末装置300とに接続されている。
【0052】
ネットワーク400は、任意の種類のネットワークであり得る。ネットワーク400は、例えば、インターネットであってもよいし、LANであってもよい。ネットワーク400は、有線ネットワークであってもよいし、無線ネットワークであってもよい。
【0053】
図2には、3つのユーザ端末装置300が示されているが、ユーザ端末装置300の数はこれに限定されない。相関解析システム100は、任意の数のユーザ端末装置300に接続されることができる。
【0054】
相関解析システム100の一例は、相関解析サービスを提供するサービスプロバイダに設置されている情報処理装置(例えば、サーバ装置)であるが、これに限定されない。ユーザ端末装置300の一例は、ユーザが保持する端末装置であるが、これに限定されない。相関解析システム100は、例えば、相関解析サービスを利用するためのアプリケーションをインストールしたユーザ端末装置であってもよい。この場合、相関解析システム100は、他のユーザ端末装置と接続される必要はない。
【0055】
サーバ装置および端末装置は、任意のタイプのコンピュータであり得る。例えば、端末装置は、スマートフォン、タブレット、パーソナルコンピュータ、スマートグラス等の任意のタイプの端末装置であり得る。
【0056】
データベース部200には、相関解析システム100のうちの細胞集団同定システム120によって利用され得るアノテーションテーブルが記憶され得る。一実施形態において、アノテーションテーブルは、例えば、解析条件と関連付けられて記憶され得る。これにより、ユーザが希望する解析条件に基づいてアノテーションテーブルを検索することができるようになる。例えば、アノテーションテーブルは、測定データが取得される条件と関連付けられて記憶され得る。これにより、測定データが取得された条件に基づいてアノテーションテーブルを検索することができるようになる。
【0057】
図3は、特に好ましい実施形態における相関解析システム100のより詳細な構成の一例を示す。
【0058】
相関解析システム100は、受信手段110と、細胞集団同定システム120と、生成手段130と、解析手段140とを備える。
【0059】
受信手段110は、相関解析システム100の外部から情報を受信するように構成されている。受信手段110が、どのような態様で情報を受信するかは問わない。例えば、受信手段110は、受信器がネットワーク400を介して相関解析システム100の外部から情報を受信してもよい。あるいは、例えば、受信手段110は、相関解析システム100に接続された記憶媒体から情報を読み取ることによって情報を受信してもよい。あるいは、例えば、受信手段110は、相関解析システム100が備える入力部(例えば、タッチパネル、キーボード、マウス、マイクなど)を介して入力された情報を受信してもよい。
【0060】
受信手段110は、複数の細胞についての測定データを受信することができる。
【0061】
測定データは、被験体の任意のサンプルを任意の分析装置によって分析した結果のデータであり得る。被験体のサンプルは、例えば末梢血、骨髄、腫瘍組織、造血組織、脾臓、正常組織、リンパ液等であり得、複数の細胞が含まれている。測定データは、被験体由来のサンプル中に含まれる各細胞の細胞マーカーの状態を表し得る。分析装置は、例えば、フローサイトメータ、マスサイトメータ、シングルセル解析装置等であるが、これらに限定されない。
【0062】
受信手段110はさらに、被験体の医療データを受信することができる。
【0063】
医療データは、被験体の臨床情報であり得る。医療データは、例えば、被験体の経過観察によって得られるデータであり得、例えば、被験体ID、性別、年齢、疾患名、治療薬剤、治療レジメン、PFS(無増悪生存期間)、OS(全生存期間)を含むがこれらに限定されない。好ましくは、医療データは、被験体の既往歴、血液検査結果、バイタル情報(心拍数、呼吸数、血圧、体温等)などを含み得る。医療データは、例えば、解析対象に応じた情報を含み得る。例えば、解析対象が腫瘍であれば、医療データは、治療効果判定、腫瘍径、標的病変と非標的病変、転移、stageなどを含み得る。例えば、解析対象が肺
がんであれば、医療データは、喫煙歴などを含み得る。好ましくは、医療データは、被験体の個人情報(氏名、住所、家族情報)を含まない。本発明の代表的な実施例においては、細胞の測定データおよび医療データはいずれも被験体IDを含み、細胞の測定データと医療データとの突合は、この被験体IDを用いて行われ得る。
【0064】
受信手段110によって受信された測定データは、後続の処理のために、細胞集団同定システム120に渡される。受信手段110によって受信された医療データは、後続の処理のために、生成手段130に渡される。
【0065】
細胞集団同定システム120は、測定データから細胞集団を同定するための構成を有し得る。
【0066】
図4Aは、好ましい実施形態における細胞集団同定システム120の構成の一例を示す。
【0067】
細胞集団同定システム120は、第1の受信手段121と、特定手段122と、導出手段123と、出力手段124とを備える。細胞集団同定システム120は、相関解析システム100の一部として存在していてもよいし、細胞集団同定システム120とは別個に独立して存在していてもよい。
【0068】
第1の受信手段121は、細胞集団同定システム120の外部から測定データを受信するように構成されている。第1の受信手段121は、例えば、受信手段110から測定データを受信することができる。測定データは、上述したように、被験体のサンプルを分析して得られたデータであり得る。被験体のサンプルには、複数の細胞が含まれ得る。測定データは、被験体のサンプルに含まれ得る細胞の細胞マーカーの発現量を表し得る。
【0069】
第1の受信手段121によって受信された測定データは、特定手段122に渡される。
【0070】
特定手段122は、測定データに含まれる細胞の種類を、アノテーションテーブルを用いて特定することができる。アノテーションテーブルは、細胞集団同定システム120が通信するデータベース部200(
図2を参照)に記憶され得る。データベース部200は、細胞集団同定システム120の一部であってもよいし、細胞集団同定システム120の外部にあってもよい。
【0071】
特定手段122は、例えば、アノテーションテーブルを参照し、測定データが表す特定の細胞マーカーの状態(例えば、あるタンパク質の発現量に基づく発現パターン)を識別することができる。特定手段122は、識別された細胞マーカーの状態に基づいて、測定データに含まれる複数の細胞の1つ1つの種類を特定するようにしてもよいし、測定データに含まれる複数の細胞を複数のクラスタにクラスタリングし、複数のクラスタのそれぞれについて、そのクラスタに属する細胞の種類を特定するようにしてもよい。
【0072】
特定手段122は、例えば、アノテーションテーブルにおいて、識別された細胞マーカーの状態と同一または類似する状態を有すると規定される細胞が、測定データに含まれる細胞であると特定することができる。例えば、特定手段122は、識別された発現パターンと、アノテーションテーブルに規定される複数の細胞の各々の発現パターンとの類似度を算出し、類似度が最も高いまたは類似度が所定の閾値よりも高い細胞が、測定データに含まれる細胞であると特定することができる。算出された類似度は、アノテーションテーブルの更新のために使用され得る。
【0073】
特定手段122は、例えば、測定データに含まれる複数の細胞のそれぞれの識別された細胞マーカーの状態に基づいて、複数の細胞を複数のクラスタにクラスタリングし、複数のクラスタの少なくともいくつかについて、それぞれのクラスタを構成する細胞の種類を特定することができる。特定手段122は、例えば、2次元ずつ階層的に測定データを絞り込んでいくことで、複数のクラスタにクラスタリングすることができる。これは、当該技術分野において、ゲーティングと呼ばれる。特定手段122は、例えば、アノテーションテーブルに規定される細胞マーカーの状態を基準として、ゲーティングを自動的に行うことができる。特定手段122は、例えば、測定データを或る2次元平面にプロットし、アノテーションテーブルに規定される細胞マーカーの特定の状態を利用して、プロットされたデータを少なくとも2つのクラスタに分類することができる。2次元平面は、アノテーションテーブルに規定される細胞マーカーの特定の状態に応じた軸を有し得る。次いで、少なくとも2つのクラスタのうちの1つに分類された測定データを別の2次元平面にプロットし、アノテーションテーブルに規定される細胞マーカーの特定の状態を利用して、プロットされたデータを少なくとも2つのクラスタに分類することができる。生成されるクラスタのそれぞれについて、これを繰り返すことにより、測定データを複数のクラスタに細分することができる。最終的に分類されたクラスタは、同種の細胞が属するクラスタとなり得る。
【0074】
従来、ゲーティングで細胞を分類することは、手作業で行われていた。手作業で細胞を分類するとき、測定データからヒストグラムを作成し、ヒスグラム中に現れる谷を目印にしてヒストグラムをまっすぐに分断し、分断された画分をひとまとまりとして処理していた。
【0075】
図9Aは、従来のゲーティングで行われていた手法を概略的に図示する。
図9Aは、CXCR3のヒストグラムを示している。
【0076】
ヒストグラムには、2つの山とそれらの間の谷とを見て取ることができる。ゲーティングでは、谷を目印にしてヒストグラムを左右に分断し、破線よりも左の第1の画分と、破線よりも右の第2の画分とに分離し、それぞれの画分をひとまとまりとして処理していた。
【0077】
本発明の発明者は、従来の手法により谷で分断したのでは、本来、左の山にピークを有する分布に対応する細胞が誤って第2の画分として分類されたり、逆に、右の山にピークを有する分布に対応する細胞が誤って第1の画分として分類されたりしてしまう問題を見出した。例えば、第1の画分および第2の画分のそれぞれの細胞数を計数する場合には、誤って第1の画分に分類された細胞数と、誤って第2の画分に分類された細胞数とが相殺され、計数に大きな問題は生じないと考えられる。しかしながら、第1の画分または第2の画分に対して更なる処理(例えば、より詳細な画分に分離すること)を行う際には、誤分類されたものに対して更なる処理を行うことになり、これは大きな誤差につながり、適切な結果が得られない可能性がある。本発明の発明者は、新たな分類手法を開発し、この問題に対処した。
【0078】
新たな分類手法では、ピークを有する分布を当てはめ、分布に対応する画分に細胞を分離する。すなわち、分布に対応する細胞を識別することによって細胞を分類するのである。
【0079】
図9Bは、本発明の発明者が開発した新たな分類手法を概略的に図示する。
図9Bも、CXCR3のヒストグラムを示している。
【0080】
まず、ヒストグラムに含まれるピークの数を決定する。ピークの数は、ヒストグラムの形状から推定することによって自動的に決定されてもよいし、ユーザによって決定されてもよい。
【0081】
次に、決定された数の分布をヒストグラムに当てはめる。これにより、分布に対応する細胞を識別する。ここで、分布は、数学的に定義され得る任意の分布であり得、例えば、正規分布であり得る。
【0082】
例えば、
図9Bに示される例では、ピークの数が2であると推定され、2つの分布を当てはめることにより、それぞれの分布に対応する細胞が識別される。本例では、左側のピークを有する左側の分布に対応する細胞と、右側のピークを有する右側の分布に対応する細胞とが識別される。
【0083】
次に、識別された細胞の属性を特定する。細胞の属性は、分類するための指標に関して陰性であるか、陽性であるかを含む。陽性は、複数の段階で示されてもよく、例えば、弱陽性、強陽性等を含む。細胞の属性は、他の分布との関係から推定することによって自動的に決定されてもよいし、ユーザによって決定されてもよい。
【0084】
例えば、
図9Bに示される例では、左側の分布に対応する細胞が、或る指標に対して陰性であると特定され、右側の分布に対応する細胞が、その指標に対して陽性であると特定される。
【0085】
このようにして特定された細胞は、その数を計数することができるともに、さらなる処理に供されることができる。例えば、或る指標に対して陽性であると特定された細胞を、別の指標に対して分類することができる。これにより、より詳細な細胞の分類が可能となる。
【0086】
図9Cは、従来の手法による結果と、本発明の手法による結果との比較の一例を示す。
図9Cでは、CXCR3のヒストグラムから、従来の手法によって上述した第1の画分(破線よりも左)に分類された細胞、従来の手法によって上述した第2の画分(破線よりも右)に分類された細胞、本発明の手法により陰性の画分に分類された細胞、および本発明の手法により陽性の画分に分類された細胞のそれぞれを、CCR4を縦軸としCCR6を横軸とした散布図に表した結果である。
【0087】
従来の手法と本発明の手法とでは、CCR4- CCR6+に該当するポピュレーションと、CCR4強陽性に該当するポピュレーションとに違いが見られている。(1)破線よりも左と(3)陰性とでは、CCR4- CCR6+ を構成する成分が異なっていることがわかる。(1)のCCR4- CCR6+は、(4)陽性に類似している。また、(2)破線よりも右は、CCR4強陽性をわずかに含んでいるが、(4)陽性には、CCR4強陽性はほとんど含まれない。(1)と(3)にはCCR4強陽性が多い。
【0088】
図9Dは、本発明の手法によって陰性の画分と陽性の画分とに分離された細胞をさらに詳細に分けた結果を示す。
図9Dでは、上部に示されるCXCR3のヒストグラムから陰性の画分および陽性の画分に分けた後、陰性の画分を(1)陽性と重ならない部分(破線よりも左の陰性の画分)と、(3)陽性と重なる部分(破線よりも右の陰性の画分)とに分け、陽性の画分を(2)陰性と重なる部分(破線よりも左の陽性の画分)と(4)陰性と重ならない部分(破線よりも右の陽性の画分)に分け、それぞれを、CCR4を縦軸としCCR6を横軸とした散布図に表した結果を示す。
【0089】
CCR4強陽性と、CCR4- CCR6+に注目すると、(1)は(3)に類似しており、(2)は(4)に類似していた。さらに、(1)と(2)とは類似しておらず、(3)と(4)とも類似していなかった。このことから、破線よりも左の画分に、陰性の細胞と陽性の細胞とが存在しており、同様に、破線よりも右側の画分にも陰性の細胞と陽性の細胞とが存在しており、単に破線で分断するだけでは適切に分離することができないところ、本発明の手法では、これらさえも適切に分離することができていることがわかる。従って、本発明の手法によって分離された細胞を、さらなる処理(例えば、別の指標での分離)に付したときに、誤差の少ない結果を得ることができる。
【0090】
上述した例では、ヒスグラムに対してピークを有する分布を当てはめることで、細胞を識別することを説明したが、本発明の手法は、ヒストグラム以外に、測定データから得られた散布図にも適用することができる。散布図においても、データの分布が見られる(例えば、プロットの数に関する等高線で表される)ため、ヒストグラムと同様に、分布を当てはめて細胞を識別することができるからである。ここで散布図は、二次元散布図であってもよいし、三次元散布図であってもよいし、それより多い次元の散布図であってもよい。
【0091】
一実施形態において、上述した手法は、特定手段122によって行われることができる。特定手段122は、第1の受信手段121によって受信された測定データの少なくとも一部から散布図またはヒストグラムを作成するステップと、散布図またはヒストグラムにおけるピーク数を決定するステップと、決定されたピーク数の分布を散布図またはヒストグラムに当てはめることにより、分布に対応する細胞を特定するステップとを行うことができる。このようにして、特定の細胞を1つのクラスタ(画分)にクラスタリングすることができる。特定手段122は、クラスタリングされた細胞に対して、細胞の属性を特定するステップをさらに行うことができる。細胞の属性は、分類するための指標に関して陰性であるか、陽性であるかを含む。陽性は、複数の段階で示されてもよく、例えば、弱陽性、強陽性等を含む。従って、特定手段122によって形成されるクラスタは、例えば、或る指標に対して陰性細胞のクラスタ、或る指標に対して陽性細胞のクラスタ、或る指標に対して弱陽性細胞のクラスタ、強陽性細胞のクラスタ等を含む。特定手段122は、1つのクラスタに分類された測定データに対して上記ステップを繰り返すことにより、より細分されたクラスタへのクラスタリングをすることができる。これにより、特定手段122は、細胞の種類を特定することができる。
【0092】
この実施形態において、特定手段122は、例えば、ユーザ入力に基づいて、ピーク数を決定するようにしてもよいし、ユーザ入力なしにピーク数を決定するようにしてもよい。
【0093】
例えば、ユーザ入力に基づいてピーク数を決定する場合、特定手段122は、ピーク数を入力するためのユーザインターフェースをユーザに提示し、ユーザにピーク数を入力させることができる。あるいは、特定手段122は、予めピーク数を推定し、推定されたピーク数を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定されたピーク数を受け入れるかどうかを入力させることができる。例えば、ユーザが推定されたピーク数を受け入れないことを入力した場合に、ピーク数を入力するためのユーザインターフェースをユーザに提示し、ユーザにピーク数を入力させるようにしてもよい。
【0094】
例えば、特定手段122は、測定データの少なくとも一部から作成された散布図またはヒストグラムの形状から、ピーク数を決定することができる。例えば、特定手段122は、機械学習モデルを用いて、ピーク数を決定することもできる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、そのピーク数との関係を学習している。
【0095】
この実施形態において、特定手段122は、例えば、ユーザ入力に基づいて、細胞の属性を特定するようにしてもよいし、ユーザ入力なしに(例えば、アノテーションテーブルに基づいて)細胞の属性を特定するようにしてもよい。
【0096】
例えば、ユーザ入力に基づいて細胞の属性を特定する場合、特定手段122は、細胞の属性を入力するためのユーザインターフェースをユーザに提示し、ユーザに細胞の属性を入力させることができる。あるいは、特定手段122は、予め細胞の属性を推定し、推定された細胞の属性を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定された細胞の属性を受け入れるかどうかを入力させることができる。例えば、ユーザが推定された細胞の属性を受け入れないことを入力した場合に、細胞の属性を入力するためのユーザインターフェースをユーザに提示し、ユーザに細胞の属性を入力させるようにしてもよい。
【0097】
例えば、特定手段122は、測定データの少なくとも一部から作成された散布図またはヒストグラムの形状から、細胞の属性を決定することができる。例えば、特定手段122は、機械学習モデルを用いて、細胞の属性を決定することもできる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、その細胞の属性との関係を学習している。
【0098】
上記ステップにおいて、分布は、典型的には、正規分布であり得るが、これに限定されない。分布は、数学的に定義され得る任意の分布であり得る。例えば、分布は、ユーザ入力に基づいて決定されるようにしてもよいし、ユーザ入力なしに決定されるようにしてもよいし、予め設定された分布であってもよい。ユーザ入力なしに決定されるとき、分布は、例えば、尤度関数を利用して決定され得る。分布は、ピーク数を決定する前に決定されていてもよいし、ピーク数を決定した後に決定されてもよい。
【0099】
ユーザに提示されるユーザインターフェースは、例えば、プルダウンから選択する形式のインターフェースであってもよいし、チェックボックスにチェックをすることで選択する形式のインターフェースであってもよい。あるいは、ユーザに提示されるユーザインターフェースは、ユーザがテキスト入力をする形式のインターフェース(例えば、チャットのような対話型のインターフェース)であってもよい。
【0100】
導出手段123は、特定手段122によって特定された細胞の種類に基づいて、複数の細胞中での各細胞の比率を導出するように構成されている。導出手段123は、例えば、特定された細胞の種類に基づいて、複数の細胞の1つ1つを計数することによって、各細胞の比率を導出することができる。導出手段123は、例えば、複数のクラスタのそれぞれについて、そのクラスタに属する細胞の数を計数することによって、各クラスタの細胞数の比率、ひいては、各細胞の比率を導出することができる。
【0101】
出力手段124は、導出手段123によって導出された比率を細胞集団同定システム120の外部に出力するように構成されている。出力手段124は、任意の態様で、導出された比率を細胞集団同定システム120の外部に出力することができる。出力手段124は、例えば、相関解析システム100の生成手段130へ、導出された比率を出力することができる。
【0102】
図4Bは、一実施形態における細胞集団同定システム120’の構成の一例を示す。細胞集団同定システム120’は、細胞集団同定システム120の代替実施形態である。細胞集団同定システム120’は、第2の受信手段125を備える点を除いて、細胞集団同定システム120と同様の構成を有する。ここでは、細胞集団同定システム120と同様の構成については同様の参照番号を付し、詳細な説明は省略する。
【0103】
細胞集団同定システム120’は、第1の受信手段121と、第2の受信手段125と、特定手段122と、導出手段123と、出力手段124とを備える。
【0104】
第2の受信手段125は、細胞集団同定システム120’が通信するデータベース部200(
図2を参照)に記憶され得る複数のアノテーションテーブルのうちの少なくとも1つのアノテーションテーブルを選択する入力を受信するように構成されている。第2の受信手段125は、例えば、細胞集団同定システム120’または相関解析システム100と通信するユーザ端末装置300から入力を受信することができる。これにより、ユーザ端末装置300のユーザは、解析に利用することを希望するアノテーションテーブルを選択することができるようになる。例えば、ユーザが最新の定義を有するアノテーションテーブルを用いた解析を希望する場合、ユーザは、最新の定義を有するアノテーションテーブルを選択する入力をユーザ装置300に提供し、第2の受信手段125は、これを受信することができる。例えば、ユーザが、過去の古い定義を有するアノテーションテーブルを用いた解析を希望する場合、ユーザは、古い定義を有するアノテーションテーブルを選択する入力をユーザ装置300に提供し、第2の受信手段125は、これを受信することができる。このような構成は、例えば、過去の解析と同じアノテーションテーブルで解析を行う必要があり、追加の新データにも過去の古い定義を適用することをユーザが希望する場合に、有用であり得る。例えば、ユーザが概括的な定義を有するアノテーションテーブルを用いた解析を希望する場合、ユーザは、概括的な定義を有するアノテーションテーブルを選択する入力をユーザ装置300に提供し、第2の受信手段125は、これを受信することができる。例えば、ユーザが、詳細な定義を有するアノテーションテーブルを用いた解析を希望する場合、ユーザは、詳細な定義を有するアノテーションテーブルを選択する入力をユーザ装置300に提供し、第2の受信手段125は、これを受信することができる。
【0105】
特定手段122は、第2の受信手段125によって受信された入力に基づいて、細胞集団同定システム120’が通信するデータベース部200(
図2を参照)からアノテーションテーブルを取り出し、取り出されたアノテーションテーブルを用いて、細胞の種類を特定することができる。
【0106】
このようにして、細胞集団同定システム120’は、ユーザが希望する粒度で、細胞集団を同定することができる。
【0107】
図4Cは、一実施形態における細胞集団同定システム120’’の構成の一例を示す。細胞集団同定システム120’’は、細胞集団同定システム120の代替実施形態である。細胞集団同定システム120’’は、第3の受信手段126と選択手段127とを備える点を除いて、細胞集団同定システム120と同様の構成を有する。ここでは、細胞集団同定システム120と同様の構成については同様の参照番号を付し、詳細な説明は省略する。
【0108】
細胞集団同定システム120’’は、第1の受信手段121と、第3の受信手段126と、選択手段127と、特定手段122と、導出手段123と、出力手段124とを備える。
【0109】
第3の受信手段126は、行うべき解析を示す入力を受信するように構成されている。第3の受信手段126は、例えば、細胞集団同定システム120’’または相関解析システム100と通信するユーザ端末装置300から入力を受信することができる。これにより、ユーザ端末装置300のユーザは、行うべき解析が何であるかを細胞集団同定システム120’’に入力することができる。例えば、ユーザが特定の細胞と医療データとの相関解析を希望する場合、ユーザは、相関解析を示す入力をユーザ装置300に提供し、第3の受信手段126は、これを受信することができる。例えば、ユーザが多変量解析を希望する場合、ユーザは、多変量解析を示す入力をユーザ装置300に提供し、第3の受信手段126は、これを受信することができる。例えば、ユーザがROC解析を希望する場合、ユーザは、ROC解析を示す入力をユーザ装置300に提供し、第3の受信手段126は、これを受信することができる。
【0110】
選択手段127は、行うべき解析を示す入力に基づいて、細胞集団同定システム120’’が通信するデータベース部200(
図2を参照)に記憶され得る複数のアノテーションテーブルから少なくとも1つのアノテーションテーブルを選択するように構成されている。例えば、選択手段127は、行うべき解析のために好適なアノテーションテーブルを選択することができる。選択手段127は、例えば、行うべき解析とアノテーションテーブルとの関係を規定するルールベースで、アノテーションテーブルを選択するようにしてもよいし、行うべき解析とアノテーションテーブルとの関係を学習した学習済モデルを用いて、アノテーションテーブルを選択するようにしてもよい。
【0111】
特定手段122は、選択手段127によって選択されたアノテーションテーブルを、細胞集団同定システム120’’が通信するデータベース部200(
図2を参照)から取り出し、取り出されたアノテーションテーブルを用いて、細胞の種類を特定することができる。
【0112】
このようにして、細胞集団同定システム120’’は、ユーザが希望する解析に応じて、細胞集団を同定することができる。
【0113】
上述した細胞集団同定システム120、120’または120’’は、特定手段122による細胞の種類の特定の結果に基づいて、アノテーションテーブルを更新する更新手段をさらに備えてもよい。更新手段は、データベース部200(
図2を参照)と通信し、データベース部200に記憶されているアノテーションテーブルのうちの少なくとも1つを更新することができる。
【0114】
更新手段は、特定手段によって細胞の種類が特定されなかった測定データ、および/または、特定手段によって誤って細胞の種類が特定された測定データに対して、適切に細胞の種類を特定することができるように、アノテーションテーブルを更新することができる。更新手段は、ユーザまたは専門家による入力に基づいて、すなわち、マニュアルで、アノテーションテーブルを更新することができる。好ましくは、更新手段は、機械学習により、アノテーションテーブルを更新することができる。
【0115】
一例において、特定手段によって細胞の種類が特定されなかった測定データが存在したとする。その場合、更新手段は、その測定データの細胞の種類を特定することができるように、アノテーションテーブルを更新する。更新手段は、例えば、ランダムフォレスト、k平均法等を用いて、細胞の種類が特定されなかった測定データの細胞の種類を特定することができる発現パターンおよび/または細胞マーカーの発現量と発現パターンとの関係を規定する基準を特定し、特定された基準を含めるようにアノテーションテーブルを更新することができる。
【0116】
別の例において、特定手段によって誤って細胞の種類が特定された測定データが存在したとする。その場合、更新手段は、その測定データの細胞の種類を正しく特定することができるように、アノテーションテーブルを更新する。更新手段は、例えば、ランダムフォレスト、k平均法等を用いて、誤って細胞の種類が特定された測定データの細胞の種類を正しく特定することができる発現パターンおよび/または細胞マーカーの発現量と発現パターンとの関係を規定する基準を特定し、特定された基準を含めるようにアノテーションテーブルを更新することができる。上述した機械学習のアルゴリズムは一例であり、他の任意のアルゴリズムを用いた機械学習を利用することができる。
【0117】
上述した細胞集団同定システム120、120’または120’’では、細胞の比率を導出して出力するものとして説明したが、細胞集団同定システム120、120’または120’’は、細胞の種類を特定して出力するものであってもよい。すなわち、そのような細胞集団同定システム120、120’または120’’では、導出手段123が省略されることができる。出力手段124は、特定された細胞の種類を出力することになる。細胞集団同定システム120、120’または120’’によって出力される細胞の種類は、例えば、診断やスクリーニングのための指標として利用されることができる。
【0118】
再び
図3を参照して、生成手段130は、受信手段110によって受信された医療データと、細胞集団同定システム120によって出力された細胞の比率とを突合することにより、複合データを生成するように構成されている。生成手段130は、同一の被験体からの医療データと細胞の比率とを突合することにより、同一の被験体についての複合データを生成することができる。これにより、解析手段140が、同一の被験体に関する解析を行うことができるようになる。複合データは、任意の形式であり得る。
【0119】
生成手段130は、例えば、過去の医療データ、過去の測定データから同定された細胞の比率、または、過去の複合データと現在の複合データとを合わせた時系列データを生成することも可能である。生成手段130は、例えば、過去に生成され、記憶手段(例えば、データベース部200(
図2)または600(
図5を参照して後述))に記憶されている複合データと、新たに作成された複合データとを合わせることによって時系列データを生成することができる。あるいは、生成手段130は、記憶手段(例えば、データベース部200(
図2)または600(
図5))に記憶されている過去の医療データおよび測定データから複合データを生成し、現在の医療データおよび測定データから複合データを生成し、これらを合わせることによって時系列データを生成することができる。記憶手段に記憶されている過去の医療データおよび測定データは、ハッシュ値と共に記憶され、これにより、記憶されたデータの同一性が担保され得る。
【0120】
生成手段130によって生成されたデータは、解析のために解析手段140に渡される。
【0121】
解析手段140は、複合データの解析を行うように構成されている。解析手段140は、公知の手法を用いて、複合データに対して任意の解析を行うことができる。解析は、例えば、医療データと細胞比率との相関解析、ROC解析、多変量解析などを含むがこれらに限定されない。
【0122】
解析手段140による解析結果は、相関解析システム100から出力される。解析結果は、例えば、ユーザに提供され得る。あるいは、解析結果は、例えば、データベース部200(
図2)または600(
図5)に記憶され得る。
【0123】
このように、相関解析システム100は、測定データからの細胞の比率を自動的に出力することができ、医療データと細胞比率との複合データの生成および解析も自動的に行うことができる。これによって、従来は人間の手作業によって、作業者のノウハウに依存して時間と労力をかけて行われていた細胞のプロファイリング結果と臨床情報との解析が自動化され得る。これは、特定の疾患または症状について臨床上重要な意味を有する細胞の特定が促進される点で有用である。
【0124】
なお、上述した例では、細胞集団同定システム120、120’、120’’が相関解析システム100内に含まれることを説明したが、細胞集団同定システム120、120’、120’’と相関解析システム100とは別個のシステムであってもよい。
【0125】
相関解析システム100は、例えば、後述するように、サーバ装置500によって実装されることができる。
【0126】
図5は、一実施形態における相関解析システム100または細胞集団同定システム120を実装するサーバ装置500の構成の一例を示す。
【0127】
サーバ装置500は、通信インターフェース部510と、メモリ部520と、プロセッサ部530とを備える。サーバ装置500は、データベース部600に接続されている。
【0128】
データベース部600には、被験体の測定データおよび/または医療データが格納され得る。データベース部600は、データベース部200と同一のデータベース部であってもよいし、異なるデータベース部であってもよい。好ましくは、データベース部600は、データベース部200とは異なるデータベース部200であり得る。被験体の測定データおよび/または医療データの管理と、アノテーションテーブルの管理とを別にすることで、被験体の測定データおよび/または医療データのプライバシを維持しつつ、かつ、アノテーションテーブルの機密性も維持することができる。
【0129】
通信インターフェース部510は、サーバ装置500の外部と情報のやり取りを行う。サーバ装置500のプロセッサ部530は、通信インターフェース部510を介して、サーバ装置500の外部から情報を受信することが可能であり、サーバ装置500の外部に情報を送信することが可能である。通信インターフェース部510は、任意の形式で情報のやり取りを行うことができる。例えば、ユーザの端末装置300(
図2を参照)は、通信インターフェース部510を介して、サーバ装置500と通信することができる。
【0130】
相関解析システム100の受信手段110は、通信インターフェース部510によって実装され得る。あるいは、細胞集団同定システム120の第1の受信手段121、細胞集団同定システム120’の第1の受信手段121および第2の受信手段125、細胞集団同定システム120’’の第1の受信手段121および第3の受信手段126は、通信インターフェース部510によって実装され得る。
【0131】
メモリ部520は、サーバ装置500の処理を実行するために必要とされるプログラムやそのプログラムの実行に必要とされるデータ等を格納する。メモリ部520は、細胞集団を同定するための処理をプロセッサ部に行わせるためのプログラム(例えば、後述する
図6、
図10A~
図10Cのいずれかに示される処理を実現するプログラム)を格納してもよい。あるいは、メモリ部520は、相関解析を行うための処理をプロセッサ部に行わせるためのプログラムを格納してもよい。ここで、プログラムをどのようにしてメモリ部520に格納するかは問わない。例えば、プログラムは、メモリ部520にプリインストールされていてもよい。あるいは、プログラムは、ネットワークを経由してダウンロードされることによってメモリ部520にインストールされるようにしてもよい。あるいは、プログラムは、コンピュータ読み取り可能な記憶媒体に格納されていてもよい。メモリ部520は、任意の記憶手段によって実装され得る。
【0132】
プロセッサ部530は、サーバ装置500の処理を実行し、かつ、サーバ装置500全体の動作を制御する。プロセッサ部530は、メモリ部520に格納されているプログラムを読み出し、そのプログラムを実行する。これにより、サーバ装置500を所望のステップを実行するシステムとして機能させることが可能である。プロセッサ部530は、単一のプロセッサによって実装されてもよいし、複数のプロセッサによって実装されてもよい。
【0133】
相関解析システム100の生成手段130、解析手段140は、プロセッサ部530によって実装され得る。あるいは、細胞集団同定システム120の特定手段122、導出手段123、出力手段124、細胞集団同定システム120’’の選択手段127は、プロセッサ部530によって実装され得る。
【0134】
図5に示される例では、データベース部600は、サーバ装置500の外部に設けられているが、本発明はこれに限定されない。データベース部600の少なくとも一部をサーバ装置500の内部に設けることも可能である。このとき、データベース部600の少なくとも一部は、メモリ520を実装する記憶手段と同一の記憶手段によって実装されてもよいし、メモリ部520を実装する記憶手段とは別の記憶手段によって実装されてもよい。いずれにせよ、データベース部600の少なくとも一部は、サーバ装置500のための記憶部として構成される。データベース部600の構成は、特定のハードウェア構成に限定されない。例えば、データベース部600は、単一のハードウェア部品で構成されてもよいし、複数のハードウェア部品で構成されてもよい。例えば、データベース部600は、サーバ装置500の外付けハードディスク装置として構成されてもよいし、ネットワークを介して接続されるクラウド上のストレージとして構成されてもよい。
【0135】
なお、上述したサーバ装置500の各構成要素は、単一のハードウェア部品で構成されていてもよいし、複数のハードウェア部品で構成されていてもよい。複数のハードウェア部品で構成される場合は、各ハードウェア部品が接続される態様は問わない。各ハードウェア部品は、無線で接続されてもよいし、有線で接続されてもよい。プロセッサ部530をデジタル回路ではなくアナログ回路によって構成することも本発明の範囲内である。相関解析システム100は、特定のハードウェア構成には限定されない。相関解析システム100の構成は、その機能を実現できる限りにおいて上述したものに限定されない。
【0136】
(5.細胞集団の同定のための処理)
図6は、好ましい実施形態における細胞集団同定システム120による処理600の一例を示す。なお、処理600は、細胞集団同定システム120に代えて、細胞集団同定システム120’または細胞集団同定システム120’’によって実行されてもよい。
【0137】
ステップS601では、細胞集団同定システム120の第1の受信手段121が、複数の細胞についての測定データを受信する。測定データは、相関解析システム100の受信手段110が受信した測定データであり得る。測定データは、被験体のサンプルを分析して得られたデータであり得る。被験体のサンプルには、複数の細胞が含まれ得る。測定データは、被験体のサンプルに含まれ得る細胞の細胞マーカーの状態を表し得る。
【0138】
第1の受信手段121は、受信した測定データを特定手段122に渡し、特定手段122がこれを受信する。
【0139】
ステップS602では、細胞集団同定システム120の特定手段122が、ステップS601で受信された測定データに含まれる細胞の種類を、アノテーションテーブルを用いて特定する。特定手段122は、例えば、アノテーションテーブルを参照し、測定データが表す細胞マーカーの状態を識別することができる。特定手段122は、識別された細胞マーカーの状態に基づいて、測定データに含まれる複数の細胞の1つ1つの種類を特定するようにしてもよいし、測定データに含まれる複数の細胞を複数のクラスタにクラスタリングし、複数のクラスタのそれぞれについて、そのクラスタに属する細胞の種類を特定するようにしてもよい。
【0140】
処理600が細胞集団同定システム120’によって実行される場合には、ステップS602では、細胞集団同定システム120’の第2の受信手段125が、複数のアノテーションテーブルのうちの少なくとも1つのアノテーションテーブルを選択する入力を受信し、特定手段122は、選択されたアノテーションテーブルを用いて、細胞の種類を特定することができる。
【0141】
処理600が細胞集団同定システム120’’によって実行される場合には、ステップS602では、細胞集団同定システム120’’の第3の受信手段126が、行うべき解析を示す入力を受信し、選択手段127が、行うべき解析を示す入力に基づいて、アノテーションテーブルを選択し、特定手段122は、選択されたアノテーションテーブルを用いて、細胞の種類を特定することができる。
【0142】
図10Aは、一実施形態において、ステップS602で特定手段122が、細胞の種類を特定するための処理の一例を示す。
図10Aに示される例では、特定手段122が、散布図またはヒストグラムにおけるピーク数および細胞の属性を決定し、それをユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいてピーク数および細胞の属性を決定することを説明する。
図10Aにおいて、灰色で示されるステップは、ユーザインターフェースを介してユーザに提示するか、ユーザの入力を受け付けるステップである。
【0143】
ステップS901では、特定手段122は、第1の受信手段121から測定データを受信する。
【0144】
ステップS902では、特定手段122は、ステップS901で受信された測定データの少なくとも一部から散布図またはヒストグラムを作成する。散布図またはヒストグラムは、解析目的に応じた任意の指標に対して作成されることができる。測定データの少なくとも一部に含まれる細胞に応じて、散布図またはヒストグラムにおける分布の形状は変わり得る。従って、分布の形状を推定する必要がある。
【0145】
ステップS903では、特定手段122は、分布の形状を推定するために、散布図またはヒストグラムにおけるピーク数を決定する。ステップS903では、特定手段122は、散布図またはヒストグラムにおけるピーク数を推定し、それをユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいてピーク数を決定することになる。
【0146】
ステップS9031では、特定手段122は、散布図またはヒストグラムにおけるピーク数を推定する。例えば、特定手段122は、機械学習モデルを用いて、ピーク数を決定することもできる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、そのピーク数との関係を学習している。
【0147】
ステップS9032では、特定手段122は、ステップS9031で推定されたピーク数をユーザにリコメンドするために、ユーザに提示する。特定手段122は、出力手段124を介して、ピーク数のリコメンドをユーザに提示することができる。ピーク数のリコメンドは、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、ピーク数のリコメンドは、リコメンドされるピーク数の分布を散布図またはヒストグラムに重ね合わせた図によって提示され得る。
【0148】
ステップS9033では、特定手段122は、ユーザがピーク数のリコメンドを受け入れるかどうかの入力を受け付ける。特定手段122は、推定されたピーク数を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定されたピーク数を受け入れるかどうかを入力させることができる。ユーザがリコメンドを受け入れると(すなわち、Yesの場合)、ステップS9034に進み、特定手段122は、ユーザに提示したリコメンドのとおりにピーク数を決定する。ユーザがリコメンドを拒否すると(すなわち、Noの場合)、ステップ9035に進み、ユーザ入力に基づいてピーク数を決定することになる。
【0149】
ステップ9035では、特定手段122は、ピーク数についてのユーザ入力を受け付け、これを受信する。特定手段122は、ピーク数を入力するためのユーザインターフェースをユーザに提示し、ユーザにピーク数を入力させることができる。
【0150】
ステップ9036では、特定手段122は、ユーザ入力に基づいてピーク数を決定する。
【0151】
このようにして、特定手段122によるリコメンドまたはユーザ入力に基づいて、ピーク数が決定される。ピーク数が決定されると、決定されたピーク数の分布を散布図またはヒストグラムに当てはめる。ステップS904では、当てはめられた分布がユーザに提示される。このとき、分布は、予め設定された分布(例えば、正規分布)であってもよいし、別途のユーザ入力に基づいて決定される分布であってもよいし、特定手段122によって推定される分布であってもよい。
【0152】
図11(a)は、ユーザに提示される分布の一例である。ピーク数が2と決定された場合、
図11(a)に示されるように、2つの正規分布が、ヒストグラムに重ね合わせて表示されることができる。
【0153】
ステップS905では、特定手段122は、特定された分布を有する細胞の属性を特定する。ステップS905では、特定手段122は、特定された分布を有する細胞の属性を推定し、それをユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいて属性を決定することになる。
【0154】
ステップS9051では、特定手段122は、測定データおよびピーク数に基づいて、細胞の属性を推定する。例えば、特定手段122は、アノテーションテーブルに基づいて、細胞の属性を推定することができる。例えば、特定手段122は、機械学習モデルを用いて、細胞の属性を決定することもできる。このとき、機械学習モデルは、測定データおよびピーク数と、細胞の属性との関係を学習している。
【0155】
ステップS9052では、特定手段122は、ステップS9051で推定された細胞の属性をユーザにリコメンドするために、ユーザに提示する。特定手段122は、出力手段124を介して、細胞の属性のリコメンドをユーザに提示することができる。細胞の属性は、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、細胞の属性は、リコメンドされる細胞の属性を
図11(a)に示されるような分布に重ね合わせた図によって提示され得る。
【0156】
ステップS9053では、特定手段122は、ユーザが細胞の属性のリコメンドを受け入れるかどうかの入力を受け付ける。特定手段122は、推定された細胞の属性を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定された細胞の属性を受け入れるかどうかを入力させることができる。ユーザがリコメンドを受け入れると(すなわち、Yesの場合)、ステップS9054に進み、特定手段122は、ユーザに提示したリコメンドのとおりに細胞の属性を決定する。ユーザがリコメンドを拒否すると(すなわち、Noの場合)、ステップ9055に進み、ユーザ入力に基づいて細胞の属性を決定することになる。
【0157】
ステップ9055では、特定手段122は、細胞の属性についてのユーザ入力を受け付け、これを受信する。特定手段122は、細胞の属性を入力するためのユーザインターフェースをユーザに提示し、ユーザに細胞の属性を入力させることができる。
【0158】
ステップ9056では、特定手段122は、ユーザ入力に基づいて細胞の属性を決定する。
【0159】
このようにして、特定手段122によるリコメンドまたはユーザ入力に基づいて、細胞の属性が決定される。細胞の属性が決定されると、結果が出力されることになる。ステップS906では、結果がユーザに提示される。結果は、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、結果は、決定された細胞の属性を
図11(b)に示されるようにヒストグラムに重ね合わせた図によって提示され得る。
【0160】
例えば、一連の処理が終わった後に、結果が適切ではないとユーザが感じたとき、ユーザは、ステップ9035に戻ってピーク数を変更し、処理をやり直すことができる。例えば、ステップS9035でピーク数を2と入力していたが、処理の結果を見ると、陰性・陽性では説明できない追加の分布も見られそうだと判断した場合、ステップ9035に戻ってピーク数を3またはそれより多い数に変更して再度処理を行うことができる。このようにして。適切なピーク数および属性を探索することができる。
【0161】
ステップS901~ステップ905によって、測定データの少なくとも一部を、例えば、陰性細胞のクラスタと、陽性細胞のクラスタとにクラスタリングすることができる。例えば、陰性細胞のクラスタに分類された測定データに対して、別の指標に関して、ステップS901~ステップS905を繰り返すことにより、さらに細分されたクラスタにクラスタリングすることができる。
【0162】
図10Bは、一実施形態において、ステップS602で特定手段122が、細胞の種類を特定するためにゲーティングを行うための処理の別の一例を示す。
図10Bに示される例では、特定手段122が、散布図またはヒストグラムにおけるピーク数および細胞の属性を決定し、それをユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいてピーク数および細胞の属性を決定することを説明する。
図10Aに示される例とは、細胞の属性を推定するタイミングが異なっている。
図10Bにおいて、灰色で示されるステップは、ユーザインターフェースを介してユーザに提示するか、ユーザの入力を受け付けるステップである。
【0163】
ステップS911では、特定手段122は、第1の受信手段121から測定データを受信する。
【0164】
ステップS912では、特定手段122は、ステップS911で受信された測定データの少なくとも一部から散布図またはヒストグラムを作成する。散布図またはヒストグラムは、解析目的に応じた任意の指標に対して作成されることができる。測定データの少なくとも一部に含まれる細胞に応じて、散布図またはヒストグラムにおける分布の形状は変わり得る。従って、分布の形状を推定する必要がある。
【0165】
ステップS913では、特定手段122は、測定データに基づいて、細胞の属性推定を推定する。例えば、特定手段122は、アノテーションテーブルに基づいて、細胞の属性を推定することができる。例えば、特定手段122は、機械学習モデルを用いて、細胞の属性を決定することもできる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、細胞の属性との関係を学習している。
【0166】
ステップS914では、特定手段122は、分布の形状を推定するために、散布図またはヒストグラムにおけるピーク数を決定する。ステップS914では、特定手段122は、散布図またはヒストグラムにおけるピーク数を推定し、それをユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいてピーク数を決定することになる。
【0167】
ステップS9141では、特定手段122は、散布図またはヒストグラムにおけるピーク数を推定する。例えば、特定手段122は、機械学習モデルを用いて、ピーク数を決定することもできる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、そのピーク数との関係を学習している。
【0168】
ステップS9142では、特定手段122は、ステップS9141で推定されたピーク数をユーザにリコメンドするために、ユーザに提示する。特定手段122は、出力手段124を介して、ピーク数のリコメンドをユーザに提示することができる。ピーク数のリコメンドは、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、ピーク数のリコメンドは、リコメンドされるピーク数の分布を散布図またはヒストグラムに重ね合わせた図によって提示され得る。
【0169】
ステップS9143では、特定手段122は、ユーザがピーク数のリコメンドを受け入れるかどうかの入力を受け付ける。特定手段122は、推定されたピーク数を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定されたピーク数を受け入れるかどうかを入力させることができる。ユーザがリコメンドを受け入れると(すなわち、Yesの場合)、ステップS9144に進み、特定手段122は、ユーザに提示したリコメンドのとおりにピーク数を決定する。ユーザがリコメンドを拒否すると(すなわち、Noの場合)、ステップ9145に進み、ユーザ入力に基づいてピーク数を決定することになる。
【0170】
ステップ9145では、特定手段122は、ピーク数についてのユーザ入力を受け付け、これを受信する。特定手段122は、ピーク数を入力するためのユーザインターフェースをユーザに提示し、ユーザにピーク数を入力させることができる。
【0171】
ステップ9146では、特定手段122は、ユーザ入力に基づいてピーク数を決定する。
【0172】
このようにして、特定手段122によるリコメンドまたはユーザ入力に基づいて、ピーク数が決定される。ピーク数が決定されると、決定されたピーク数の分布を散布図またはヒストグラムに当てはめる。ステップS915では、特定された分布がユーザに提示される。
図11(a)に示されるように、当てはめられた分布がユーザに提示される。このとき、分布は、予め設定された分布(例えば、正規分布)であってもよいし、別途のユーザ入力に基づいて決定される分布であってもよいし、特定手段122によって推定される分布であってもよい。
【0173】
ステップS916では、特定手段122は、特定された分布を有する細胞の属性を特定する。ステップS916では、特定手段122は、ステップS913で推定された細胞の属性をユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいて属性を決定することになる。
【0174】
ステップS9161では、特定手段122は、ステップS913で推定された細胞の属性をユーザにリコメンドするために、ユーザに提示する。特定手段122は、出力手段124を介して、細胞の属性のリコメンドをユーザに提示することができる。細胞の属性は、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、細胞の属性は、リコメンドされる細胞の属性を
図11(a)に示されるような分布に重ね合わせた図によって提示され得る。
【0175】
ステップS9162では、特定手段122は、ユーザが細胞の属性のリコメンドを受け入れるかどうかの入力を受け付ける。特定手段122は、推定された細胞の属性を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定された細胞の属性を受け入れるかどうかを入力させることができる。ユーザがリコメンドを受け入れると(すなわち、Yesの場合)、ステップS9163に進み、特定手段122は、ユーザに提示したリコメンドのとおりに細胞の属性を決定する。ユーザがリコメンドを拒否すると(すなわち、Noの場合)、ステップ9164に進み、ユーザ入力に基づいて細胞の属性を決定することになる。
【0176】
ステップ9164では、特定手段122は、細胞の属性についてのユーザ入力を受け付け、これを受信する。特定手段122は、細胞の属性を入力するためのユーザインターフェースをユーザに提示し、ユーザに細胞の属性を入力させることができる。
【0177】
ステップ9165では、特定手段122は、ユーザ入力に基づいて細胞の属性を決定する。
【0178】
このようにして、特定手段122によるリコメンドまたはユーザ入力に基づいて、細胞の属性が決定される。細胞の属性が決定されると、結果が出力されることになる。ステップS917では、結果がユーザに提示される。結果は、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、結果は、決定された細胞の属性を
図11(b)に示されるようにヒストグラムに重ね合わせた図によって提示され得る。
【0179】
例えば、一連の処理が終わった後に、結果が適切ではないとユーザが感じたとき、ユーザは、ステップ9145に戻ってピーク数を変更し、処理をやり直すことができる。例えば、ステップS9145でピーク数を2と入力していたが、処理の結果を見ると、陰性・陽性では説明できない追加の分布も見られそうだと判断した場合、ステップ9145に戻ってピーク数を3またはそれより多い数に変更して再度処理を行うことができる。このようにして、適切なピーク数および属性を探索することができる。
【0180】
ステップS911~ステップ917によっても、測定データの少なくとも一部を、例えば、陰性細胞のクラスタと、陽性細胞のクラスタとにクラスタリングすることができる。例えば、陰性細胞のクラスタに分類された測定データに対して、別の指標に関して、ステップS911~ステップS917を繰り返すことにより、さらに細分されたクラスタにクラスタリングすることができる。
【0181】
図10Cは、一実施形態において、ステップS602で特定手段122が、細胞の種類を特定するためにゲーティングを行うための処理のさらに別の一例を示す。
図10Cに示される例では、特定手段122が、ユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数および細胞の属性を決定するかどうかをユーザに委ねることを説明する。
図10Cにおいて、灰色で示されるステップは、ユーザインターフェースを介してユーザに提示するか、ユーザの入力を受け付けるステップである。
【0182】
ステップS921では、特定手段122は、第1の受信手段121から測定データを受信する。
【0183】
ステップS922では、特定手段122は、ステップS921で受信された測定データの少なくとも一部から散布図またはヒストグラムを作成する。散布図またはヒストグラムは、解析目的に応じた任意の指標に対して作成されることができる。測定データの少なくとも一部に含まれる細胞に応じて、散布図またはヒストグラムにおける分布の形状は変わり得る。従って、分布の形状を推定する必要がある。
【0184】
ステップS923では、特定手段122は、分布の形状を推定するために、散布図またはヒストグラムにおけるピーク数を決定する。ステップS923では、特定手段122は、ユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数を決定するかどうかをユーザに委ね、ユーザがユーザ入力に基づいてピーク数を決定すると判断した場合に、ユーザ入力に基づいてピーク数を決定し、そうでない場合に、推定に基づいてピーク数を決定することになる。
【0185】
ステップS9231では、特定手段122は、ユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数を決定するかどうかをユーザに入力させるためのユーザインターフェースをユーザに提示し、ユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数を決定するかどうかの入力を受信する。ユーザがユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数を決定しないと判断すると(すなわち、Noの場合)、ステップS9232に進み、特定手段122は、測定データに基づく推定によってピーク数を決定する。ユーザがユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数を決定すると判断すると(すなわち、Yesの場合)、ステップ9233に進み、ユーザ入力に基づいてピーク数を決定することになる。
【0186】
ステップS9232では、特定手段122は、測定データに基づいてピーク数を推定する。例えば、特定手段122は、機械学習モデルを用いて、ピーク数を決定することができる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、そのピーク数との関係を学習している。
【0187】
ステップ9234では、特定手段122は、ピーク数についてのユーザ入力を受け付け、これを受信する。特定手段122は、ピーク数を入力するためのユーザインターフェースをユーザに提示し、ユーザにピーク数を入力させることができる。
【0188】
ステップ9234では、特定手段122は、ユーザ入力に基づいてピーク数を決定する。
【0189】
このようにして、特定手段122による推定またはユーザ入力に基づいて、ピーク数が決定される。ピーク数が決定されると、決定されたピーク数の分布を散布図またはヒストグラムに当てはめる。ステップS924では、特定された分布がユーザに提示される。
図11(a)に示されるように、当てはめられた分布がユーザに提示される。このとき、分布は、予め設定された分布(例えば、正規分布)であってもよいし、別途のユーザ入力に基づいて決定される分布であってもよいし、特定手段122によって推定される分布であってもよい。
【0190】
ステップS925では、特定手段122は、特定された分布を有する細胞の属性を特定する。ステップS925では、ステップS923では、特定手段122は、ユーザ入力に基づいて細胞の属性を決定するかどうかをユーザに委ね、ユーザがユーザ入力に基づいて細胞の属性を決定すると判断した場合に、ユーザ入力に基づいて細胞の属性を決定し、そうでない場合に、推定に基づいて細胞の属性を決定することになる。
【0191】
ステップS9251では、特定手段122は、ユーザ入力に基づいて細胞の属性を決定するかどうかをユーザに入力させるためのユーザインターフェースをユーザに提示し、ユーザ入力に基づいて細胞の属性を決定するかどうかの入力を受信する。ユーザがユーザ入力に基づいて細胞の属性を決定しないと判断すると(すなわち、Noの場合)、ステップS9252に進み、特定手段122は、測定データに基づく推定によって細胞の属性を決定する。ユーザがユーザ入力に基づいて細胞の属性を決定すると判断すると(すなわち、Yesの場合)、ステップ9253に進み、ユーザ入力に基づいて細胞の属性を決定することになる。
【0192】
ステップS9252では、特定手段122は、測定データに基づいて細胞の属性を推定する。例えば、特定手段122は、機械学習モデルを用いて、細胞の属性を決定することができる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、細胞の属性との関係を学習している。あるいは、特定手段122は、測定データと、決定されたピーク数とに基づいて細胞の属性を推定することもできる。
【0193】
ステップ9253では、特定手段122は、細胞の属性についてのユーザ入力を受け付け、これを受信する。特定手段122は、細胞の属性を入力するためのユーザインターフェースをユーザに提示し、ユーザに細胞の属性を入力させることができる。
【0194】
ステップ9254では、特定手段122は、ユーザ入力に基づいて細胞の属性を決定する。
【0195】
このようにして、特定手段122による推定またはユーザ入力に基づいて、細胞の属性が決定される。細胞の属性が決定されると、結果が出力されることになる。ステップS926では、結果がユーザに提示される。結果は、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、結果は、決定された細胞の属性を
図11(b)に示されるようにヒストグラムに重ね合わせた図によって提示され得る。
【0196】
例えば、一連の処理が終わった後に、結果が適切ではないとユーザが感じたとき、ユーザは、ステップ9233に戻ってピーク数を変更し、処理をやり直すことができる。例えば、ステップS9233でピーク数を2と入力していたが、処理の結果を見ると、陰性・陽性では説明できない追加の分布も見られそうだと判断した場合、ステップ9233に戻ってピーク数を3またはそれより多い数に変更して再度処理を行うことができる。このようにして。適切なピーク数および属性を探索することができる。
【0197】
ステップS921~ステップ926によっても、測定データの少なくとも一部を、例えば、陰性細胞のクラスタと、陽性細胞のクラスタとにクラスタリングすることができる。例えば、陰性細胞のクラスタに分類された測定データに対して、別の指標に関して、ステップS921~ステップS926を繰り返すことにより、さらに細分されたクラスタにクラスタリングすることができる。
【0198】
ステップS603では、細胞集団同定システム120の導出手段123が、ステップS602で特定された細胞の種類に基づいて、複数の細胞中での各細胞の比率を導出する。導出手段123は、例えば、特定された細胞の種類に基づいて、複数の細胞の1つ1つを計数することによって、各細胞の比率を導出することができる。導出手段123は、例えば、複数のクラスタのそれぞれについて、そのクラスタに属する細胞の数を計数することによって、各クラスタの細胞数の比率、ひいては、各細胞の比率を導出することができる。
【0199】
ステップS604では、細胞集団同定システム120の出力手段124が、ステップS603で導出された比率を出力する。出力手段124は、任意の態様で、導出された比率を細胞集団同定システム120の外部に出力することができる。出力手段124は、例えば、相関解析システム100の生成手段130へ、導出された比率を出力することができる。
【0200】
処理600の後、相関解析システム100が、出力された細胞の比率を用いた解析を行うことができる。
【0201】
この解析では、まず、相関解析システム100の受信手段110が、医療データを受信する。受信された医療データは、生成手段130に渡され、生成手段130がこれを受信する。
【0202】
次いで、生成手段130が、受信手段110によって受信された医療データと、処理600によって出力された細胞の比率とを突合することにより、複合データを生成する。生成手段130は、同一の被験体からの医療データと細胞の比率とを突合することにより、同一の被験体についての複合データを生成することができる。これにより、解析手段140が、同一の被験体に関する解析を行うことができるようになる。
【0203】
次いで、解析手段140が、複合データの解析を行う。解析は、例えば、医療データと細胞比率との相関解析、ROC解析、多変量解析などを含むがこれらに限定されない。
【0204】
このようにして、相関解析システム100は、医療データと細胞比率との複合データの生成および解析も自動的に行うことができる。解析結果は、例えば、ユーザに提供され、あるいは、データベース部200(
図2)または600(
図5)に記憶され得る。解析結果は、例えば、特定の疾患または症状について臨床上重要な意味を有する細胞を特定するために利用され得る。
【0205】
図6を参照して上述した例では、特定の順序で各ステップが実行されることを説明したが、示される順序は一例であり、各ステップが実行される順序は、これに限定されない。論理的に可能な任意の順序で各ステップが実行されることができる。また、示されるステップに加えて、または、示されるステップに代えて、他のステップが行われることができる。
【0206】
図6を参照して上述した例では、
図6に示される各ステップの処理は、細胞集団同定システム120を実装するサーバ装置500のプロセッサ部530とメモリ部520に格納されたプログラムとによって実現することができる。しかしながら、本発明はこれに限定されない。
図6に示される各ステップの処理のうちの少なくとも1つは、制御回路などのハードウェア構成によって実現されてもよい。
【0207】
図7は、特に好ましい実施形態における相関解析システム100による解析に係るフローの一例を示す。
【0208】
ステップS701では、測定データが取得される。ここでは、フローサイトメータを用いた測定が行われる。フローサイトメータを用いた測定により、測定データとして、例えば、FCSデータが取得される。測定データは、相関解析システム100に提供される。
【0209】
ステップS702では、相関解析システム100は、測定データに含まれる複数の細胞を、複数のクラスタにクラスタリングする。相関解析システム100は、細胞の細胞マーカーの発現量に従って、複数の細胞を複数のクラスタにクラスタリングすることができる。このとき、相関解析システム100は、アノテーションテーブルを利用して、細胞の細胞マーカーの発現量から発現パターンを導出し、発現パターンに基づいて、複数の細胞を複数のクラスタにクラスタリングすることができる。
【0210】
クラスタリングされた細胞は、ステップS703で同定される。
【0211】
図8(a)は、好ましい実施形態において相関解析システム100が利用するアノテーションテーブルの一例を図示する。
【0212】
アノテーションテーブルでは、細胞種類1、細胞種類2、細胞種類3・・・のそれぞれについて、その細胞種類を同定するための発現パターンが規定されている。例えば、アノテーションテーブルを数値で作成する場合、細胞種類1について、マーカー1が「分布(1..3)」を有し、マーカー2が「分布(2..6)」を有し、マーカー3が「分布(3..8)」を有し、マーカー4が「分布(3..9)」を有し、・・・という発現パターンが規定されている。測定データのうちの或る細胞または細胞群がこの発現パターンと同様の発現パターンを有する場合、その細胞または細胞群は、細胞種類1であると同定され得る。例えば、細胞種類2について、マーカー1が「分布(7..12)」を有し、マーカー2が「分布(-2..9)」を有し、マーカー3が「分布(-1..4)」を有し、マーカー4が「分布(1..30)」を有し、・・・という発現パターンが規定されている。測定データのうちの或る細胞または細胞群がこの発現パターンと同様の発現パターンを有する場合、その細胞または細胞群は、細胞種類2であると同定され得る。
【0213】
相関解析システム100は、例えば、アノテーションテーブルに定義された発現パターンに基づいて、複数の細胞のそれぞれがどのクラスタにクラスタリングされるかを決定することができる。1つの例において、例えば、
図8(a)に示されるアノテーションテーブルの場合、測定データをマーカー1の分布およびマーカー2の分布に関して2次元にプロットする。プロットされた測定データのうち、所定の範囲に属するデータを抽出する。例えば、マーカー1の分布(1..3)およびマーカー2の分布(2..6)を満たす測定データを抽出する。抽出されたデータを別の分布、例えば、マーカー3の分布およびマーカー4の分布に関して2次元にプロットし、所定の範囲、例えば、マーカー3の分布(3..8)およびマーカー4の分布(6..9)に属するデータをさらに抽出する。アノテーションテーブルに規定される発現パターンについて、プロットおよび抽出を繰り返すことにより、測定データを複数のクラスタにクラスタリングすることができる。そして、複数のクラスタの各々は、アノテーションテーブルに規定される発現パターンを有することになり、対応する細胞種類であることが同定され得る。上述した例では、各マーカーの数値範囲がアノテーションテーブルに規定される数値範囲に属するか否かを判定することにより、細胞種類を同定したが、別の例では、各マーカーの数値範囲とアノテーションテーブルに規定される数値範囲との類似度を算出し、類似度を統計的に評価することで、細胞種類を同定することもできる。例えば、測定データから得られた各マーカーの発現パターンと、アノテーションテーブルに規定される複数の細胞種類のそれぞれの発現パターンとの類似度を算出し、測定データに含まれる細胞が、アノテーションテーブルに規定される複数の細胞種類のうちの統計的に近い細胞種類であると同定することが可能であり、複数の細胞種類のそれぞれとどの程度近いかを統計的に数字で評価することも可能である。
【0214】
クラスタリングまたは細胞同定の結果、専門家の経験的にまたは免疫学的に不正確に分類された細胞群および/または分類されなかった細胞群が存在した場合、アノテーションテーブルを更新することができる。専門家の経験的にまたは免疫学的に不正確に分類された細胞群および/または分類されなかった細胞群は、例えば、相関解析システム100が自動的に特定するようにしてもよい。相関解析システム100は、例えば、測定データから得られた各マーカーの発現パターンが、アノテーションテーブルに規定される細胞種類のいずれにも当てはまらなかった場合に、その測定データに含まれる細胞群を、分類されなかった細胞群として特定することができ、または、測定データから得られた各マーカーの発現パターンと、アノテーションテーブルに規定される複数の細胞種類のそれぞれの発現パターンとの類似度が所定の閾値よりも低かった場合に、その測定データに含まれる細胞群を、専門家の経験的にまたは免疫学的に不正確に分類された細胞群として特定することができる。あるいは、専門家の経験的にまたは免疫学的に不正確に分類された細胞群および/または分類されなかった細胞群は、例えば、相関解析システム100による結果をユーザまたは専門家が手動的に特定するようにしてもよい。アノテーションテーブルの更新は、例えば、機械学習を用いて行われることができる。
【0215】
例えば、機械学習(例えば、ランダムフォレスト)等を用いて、どの細胞にも分類されなかった細胞群を分類することができる発現パターンを特定し、特定された発現パターンを含めるようにアノテーションテーブルを更新することができる。例えば、機械学習(例えば、ランダムフォレスト)等を用いて、上記のように相関解析システム100またはユーザもしくは専門家によって特定された不正確に分類された細胞群を正しく分類することができる発現パターンを特定し、特定された発現パターンを含めるようにアノテーションテーブルを更新することができる。
【0216】
図8(b)は、更新されたアノテーションテーブルの一例を図示する。
【0217】
例えば、どの細胞にも分類されなかった細胞群が、新たな細胞種類4であり、その発現パターンが特定されると、例えば、
図8(b)の斜線で表されるように、アノテーションテーブルに、細胞種類4の発現パターンが含まれることになる。
【0218】
例えば、細胞種類2が不正確に分類されており、正しく分類するためのマーカー2の分布が特定されると、例えば、
図8(b)の灰色で表されるように、アノテーションテーブルに、細胞種類2の正しい発現パターンが含まれることになる。
【0219】
例えば、細胞種類3が不正確に分類されており、正しく分類するためのマーカー3の分布が特定されると、例えば、
図8(b)の点描で表されるように、アノテーションテーブルに、細胞種類3の正しい発現パターンが含まれることになる。
【0220】
このように、アノテーションテーブルを更新していくことで、相関解析システム100のユーザが、最新の知見に基づく解析を行うことができるようになる。これに加えて、アノテーションテーブルを更新することは、新しい細胞群または新しい発現パターンの発見につながり得る。
【0221】
ステップS704では、相関解析システム100は、同定された細胞を計数することにより、各細胞の比率を導出し、各細胞の名称および比率を示す細胞データを出力する。細胞データは、被験体毎に出力されることができる。細胞データは、例えば、CSVファイルで出力される。
【0222】
ステップS705では、医療・健康データが相関解析システム100に提供され、相関解析システム100は、これを受信する。医療データは、例えば、血液検査結果、カルテ情報、バイタル情報であり得、好ましくは、PFS(無増悪生存期間)、OS(全生存期間)、被験体IDを含むがこれらに限定されない。医療データは、例えば、CSVファイルで提供される。
【0223】
ステップS704で出力された細胞データと、ステップS705で受信された医療データとは、被験体IDを用いて突合され、複合データが生成される。
【0224】
ステップS706では、相関解析システム100は、生成された複合データを用いた解析を行う。
【0225】
相関解析システム100は、例えば、複合データの相関解析を行うことができる。これにより、特定の疾患または症状について臨床上重要な意味を有する細胞(例えば、その疾患または症状が悪化することに関連する細胞、その疾患または症状が回復することに関連する細胞、その疾患または症状の診断に役立つ細胞等)を特定することができる。
【0226】
相関解析を行うとき、相関解析システム100は、複合データに含まれる細胞の比率を直接利用するようにしてもよいし、複合データに含まれる細胞の比率から導出される比率(例えば、複合データに含まれる細胞の比率の回帰分析により導出される比率)を利用するようにしてもよい。
【0227】
相関解析システム100は、例えば、複合データの次元削減解析を行うことができる。例えば相関解析システム100は、細胞の比率と医療データとを合わせた多変量のデータに対して多変量解析(例えば、主成分分析)を行うことにより、多変量データの次元を削減することができる。これにより、特徴的な集団についての発見(例えば、A細胞が多く、B細胞が少ない集団は長期生存するなど)をすることができる。
【0228】
相関解析システム100は、例えば、複合データに含まれる或る細胞の比率とPFSとからROCカーブを描くことができる。これにより、その細胞の比率に、診断能力があるかどうかを特定することができる。
【0229】
相関解析システム100は、例えば、カプランマイヤー法による生存時間分析を行うこともできる。
【0230】
ステップS707では、相関解析システム100による解析の結果がユーザに提供される。例えば、ユーザは、ネットワークを介して解析の結果を受信し、自身の端末装置で解析の結果をレビューすることができる。
【0231】
このようにして、相関解析システム100による一連の処理により、ユーザは、細胞のプロファイリング結果と臨床情報との解析の結果を容易に取得することができる。
【0232】
相関解析システム100においてはさらに、ある時点での細胞プロファイリング結果または複合データと、時間経過ごとに取得した細胞プロファイリング結果または複合データとを用いて、時間経過とともに比率が有意に変化する免疫細胞を見つけることによって、免疫モニタリングを行うこともできる。
【産業上の利用可能性】
【0233】
本発明は、細胞集団同定による細胞プロファイリングの自動化や、細胞のプロファイリング結果と臨床情報との解析の自動化を提供するものとして有用である。
【符号の説明】
【0234】
100 相関解析システム
110 受信手段
120、120’、120’’ 細胞集団同定システム
130 生成手段
140 解析手段
200 データベース部
300 ユーザ端末装置
400 ネットワーク
500 サーバ装置
510 通信インターフェース部
520 メモリ部
530 プロセッサ部
600 データベース部