特許7368679 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ イミュニティリサーチ株式会社の特許一覧

特許7368679細胞集団同定システム、方法、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4A
4B
4C
5
6
7
8
9A
9B
9C
9D
10A
10B
10C
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-10-17

(45)【発行日】2023-10-25

(54)【発明の名称】細胞集団同定システム、方法、およびプログラム

(51)【国際特許分類】

G01N 33/48 20060101AFI20231018BHJP

G01N 33/483 20060101ALI20231018BHJP

C12Q 1/04 20060101ALI20231018BHJP

C12M 1/34 20060101ALN20231018BHJP

【ＦＩ】

G01N33/48 M

G01N33/483 C

C12Q1/04

C12M1/34 A

【請求項の数】 24

(21)【出願番号】P 2023504112

(86)(22)【出願日】2022-08-31

(86)【国際出願番号】 JP2022032807

(87)【国際公開番号】W WO2023033056

(87)【国際公開日】2023-03-09

【審査請求日】2023-01-19

(31)【優先権主張番号】P 2021142556

(32)【優先日】2021-09-01

(33)【優先権主張国・地域又は機関】JP

【早期審査対象出願】

(73)【特許権者】

【識別番号】520104400

【氏名又は名称】イミュニティリサーチ株式会社

(74)【代理人】

【識別番号】100078282

【弁理士】

【氏名又は名称】山本秀策

(74)【代理人】

【識別番号】100113413

【弁理士】

【氏名又は名称】森下夏樹

(74)【代理人】

【識別番号】100181674

【弁理士】

【氏名又は名称】飯田貴敏

(74)【代理人】

【識別番号】100181641

【弁理士】

【氏名又は名称】石川大輔

(74)【代理人】

【識別番号】230113332

【弁護士】

【氏名又は名称】山本健策

(72)【発明者】

【氏名】飴谷章夫

【審査官】海野佳子

(56)【参考文献】

【文献】特開２０２１－１００４１４（ＪＰ，Ａ）

【文献】特表２０１４－５１７９５４（ＪＰ，Ａ）

【文献】特表２０２０－５１５８３２（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０１Ｎ３３／４８－３３／９８

(57)【特許請求の範囲】

【請求項1】

細胞集団の同定のためのシステムであって、
複数の細胞についての測定データを受信する受信手段と、
前記測定データに含まれる細胞の種類を特定する特定手段であって、前記特定手段は、
前記測定データの少なくとも一部から散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することであって、前記ピーク数は２またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別することと、
前記識別された細胞の種類をアノテーションテーブルに基づいて特定することと
を行うように構成されている、特定手段と、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出する導出手段と、
前記導出された比率を出力する出力手段と
を備え、前記システムは、前記アノテーションテーブルを記憶するデータベースと通信し、前記アノテーションテーブルは、細胞と前記細胞の細胞マーカーの状態の定義とを関連付けている、システム。

【請求項2】

前記決定されたピーク数の分布のうちの少なくとも２つは、相互に重なっている、請求項１に記載のシステム。

【請求項3】

前記ピーク数を決定することは、
ユーザ入力を受信することと、
前記ユーザ入力に基づいて前記ピーク数を決定することと
を含む、請求項１に記載のシステム。

【請求項4】

前記特定手段は、前記識別された細胞の属性を特定することを行うようにさらに構成されている、請求項１に記載のシステム。

【請求項5】

前記細胞の属性を特定することは、ユーザ入力に基づいて前記細胞の属性を特定することを含む、請求項１に記載のシステム。

【請求項6】

前記データベースは、複数のアノテーションテーブルを記憶し、
前記特定手段は、前記複数のアノテーションテーブルのうちの少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、請求項１に記載のシステム。

【請求項7】

前記複数のアノテーションテーブルのうちの少なくとも１つのアノテーションテーブルを選択する入力を受信する第２の受信手段をさらに備え、
前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、請求項６に記載のシステム。

【請求項8】

行うべき解析を示す入力を受信する第３の受信手段と、
前記行うべき解析を示す入力に基づいて、前記複数のアノテーションテーブルから少なくとも１つのアノテーションテーブルを選択する選択手段と
を備え、
前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、請求項６に記載のシステム。

【請求項9】

前記複数のアノテーションテーブルは、第１のアノテーションテーブルと第２のアノテーションテーブルとを含み、前記第１のアノテーションテーブルは、第２のアノテーションテーブルよりも古い定義で前記細胞と前記細胞のマーカーの状態とを関連付ける、請求項６に記載のシステム。

【請求項10】

前記複数のアノテーションテーブルは、第１のアノテーションテーブルと第２のアノテーションテーブルとを含み、前記第１のアノテーションテーブルは、第２のアノテーションテーブルよりも概括的に前記細胞と前記細胞のマーカーの状態とを関連付ける、請求項６に記載のシステム。

【請求項11】

前記システムは、前記データベースを備える、請求項１に記載のシステム。

【請求項12】

前記アノテーションテーブルはさらに、前記細胞マーカーの測定結果と前記状態との関係を規定する基準を含む、請求項１に記載のシステム。

【請求項13】

前記特定手段による細胞の種類の特定の結果に基づいて、前記少なくとも１つのアノテーションテーブルを更新する更新手段をさらに備える、請求項１２に記載のシステム。

【請求項14】

前記更新手段は、前記特定手段によって細胞の種類が特定されなかった測定データ、および／または、前記特定手段によって誤って細胞の種類が特定された測定データに対して、適切に細胞の種類を特定することができるように、前記アノテーションテーブルを更新する、請求項１３に記載のシステム。

【請求項15】

前記更新は、
・前記細胞と、前記細胞の細胞マーカーの状態の定義、および／または
・前記細胞マーカーの測定結果と前記状態との関係を規定する基準
の更新を含む、請求項１３に記載のシステム。

【請求項16】

前記測定データは、フローサイトメータによる測定データ、マスサイトメータによる測定データ、シングルセル遺伝子発現解析による測定データからなる群から選択される少なくとも１つの測定データを含む、請求項１に記載のシステム。

【請求項17】

前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記複数の細胞を複数のクラスタに分け、そして前記複数のクラスタの少なくともいくつかを構成する細胞の種類を特定する、請求項１に記載のシステム。

【請求項18】

相関解析システムであって、
請求項１～１７のいずれか一項に記載のシステムであって、前記システムは、第１の被験体の複数の細胞についての測定データから細胞の比率を出力する、システムと、
前記第１の被験体の医療データを受信する医療データ受信手段と、
前記医療データと前記細胞の比率とを突合することにより、複合データを生成する生成手段と、
前記複合データにおいて前記細胞の比率と前記医療データとの相関解析を行う解析手段と
を備える、相関解析システム。

【請求項19】

前記医療データに基づいて、複数のアノテーションテーブルから少なくとも１つのアノテーションテーブルを選択する選択手段
を備え、
前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、請求項１８に記載の相関解析システム。

【請求項20】

細胞集団の同定のための方法であって、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を特定することであって、前記特定することは、
前記測定データの少なくとも一部から散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することであって、前記ピーク数は２またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別することと、
前記識別された細胞の種類をアノテーションテーブルに基づいて特定することと
を含む、ことと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む方法。

【請求項21】

細胞集団の同定のためのプログラムであって、前記プログラムは、プロセッサを備えるシステムにおいて実行され、前記プログラムは、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を特定することであって、前記特定することは、
前記測定データの少なくとも一部から散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することであって、前記ピーク数は２またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別することと、
前記識別された細胞の種類をアノテーションテーブルに基づいて特定することと
を含む、ことと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む処理を前記プロセッサに行わせる、プログラム。

【請求項22】

細胞集団内の細胞を特定するためのシステムであって、
複数の細胞についての測定データを受信する受信手段と、
前記測定データに含まれる細胞の種類を特定する特定手段と、
前記特定された細胞の種類を出力する出力手段と
を備え、前記特定手段は、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することであって、前記ピーク数は２またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別することと
前記識別された細胞の種類を特定することと
を行うように構成されている、システム。

【請求項23】

細胞集団内の細胞を特定するための方法であって、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を特定することと、
前記特定された細胞の種類を出力することと
を含み、前記特定することは、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することであって、前記ピーク数は２またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別することと
前記識別された細胞の種類を特定することと
を含む方法。

【請求項24】

細胞集団内の細胞を特定するためのプログラムであって、前記プログラムは、プロセッサを備えるシステムにおいて実行され、前記プログラムは、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を特定することと、
前記特定された細胞の種類を出力することと
を含む処理を前記プロセッサに行わせ、前記特定することは、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することであって、前記ピーク数は２またはそれより多い数である、ことと、
前記散布図またはヒストグラムにおいて、前記決定された前記ピーク数に対応する分布を特定することにより、前記分布に対応する細胞を識別することと
前記識別された細胞の種類を特定することと
を含む、プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、細胞集団同定システム、方法、およびプログラムに関する。

【背景技術】

【0002】

免疫チェックポイント阻害剤の開発に代表されるように、患者の免疫状態は種々の疾患や状態、薬物の有効性等と関連性があることが明らかになっている。それに伴い、対象の免疫状態をモニタリングし、それによって得られる情報の価値は増大している。

【発明の概要】

【発明が解決しようとする課題】

【0003】

本発明は、新規細胞集団同定システムを提供することを目的とする。

【0004】

本発明はまた、新規細胞集団同定システムを用いることによって得られる細胞のプロファイリング結果と臨床情報との相関解析の自動化システムを提供することを目的とする。

【0005】

本発明はまた、細胞のプロファイリング結果と臨床情報との相関の経時的変化を追うことが可能なモニタリングシステムを提供することを目的とする。

【課題を解決するための手段】

【0006】

本発明は、例えば、以下の項目を提供する。
（項目１）
細胞集団の同定のためのシステムであって、
複数の細胞についての測定データを受信する受信手段と、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定する特定手段と、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出する導出手段と、
前記導出された比率を出力する出力手段と
を備え、前記システムは、前記アノテーションテーブルを記憶するデータベースと通信し、前記アノテーションテーブルは、細胞と前記細胞の細胞マーカーの状態の定義とを関連付けている、システム。
（項目２）
前記特定手段は、
前記測定データの少なくとも一部から散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することと、
前記決定されたピーク数の分布を前記散布図またはヒストグラムに当てはめることにより、前記分布に対応する細胞を識別することと、
を行うように構成されている、項目１に記載のシステム。
（項目３）
前記ピーク数を決定することは、ユーザ入力に基づいて前記ピーク数を決定することを含む、項目２に記載のシステム。
（項目４）
前記特定手段は、前記識別された細胞の属性を特定することを行うようにさらに構成されている、項目２または項目３に記載のシステム。
（項目５）
前記細胞の属性を特定することは、ユーザ入力に基づいて前記細胞の属性を特定することを含む、項目２～４のいずれか一項に記載のシステム。
（項目６）
前記データベースは、複数のアノテーションテーブルを記憶し、
前記特定手段は、前記複数のアノテーションテーブルのうちの少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目１～５のいずれか一稿に記載のシステム。
（項目７）
前記複数のアノテーションテーブルのうちの少なくとも１つのアノテーションテーブルを選択する入力を受信する第２の受信手段をさらに備え、
前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目６に記載のシステム。
（項目８）
行うべき解析を示す入力を受信する第３の受信手段と、
前記行うべき解析を示す入力に基づいて、前記複数のアノテーションテーブルから少なくとも１つのアノテーションテーブルを選択する選択手段と
を備え、
前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目６に記載のシステム。
（項目９）
前記複数のアノテーションテーブルは、第１のアノテーションテーブルと第２のアノテーションテーブルとを含み、前記第１のアノテーションテーブルは、第２のアノテーションテーブルよりも古い定義で前記細胞と前記細胞のマーカーの状態とを関連付ける、項目６～８のいずれか一項に記載のシステム。
（項目１０）
前記複数のアノテーションテーブルは、第１のアノテーションテーブルと第２のアノテーションテーブルとを含み、前記第１のアノテーションテーブルは、第２のアノテーションテーブルよりも概括的に前記細胞と前記細胞のマーカーの状態とを関連付ける、項目６～８のいずれか一項に記載のシステム。
（項目１１）
前記システムは、前記データベースを備える、項目１～１０のいずれか一項に記載のシステム。
（項目１２）
前記アノテーションテーブルはさらに、前記細胞マーカーの測定結果と前記状態との関係を規定する基準を含む、項目１～１１のいずれか一項に記載のシステム。
（項目１３）
前記特定手段による細胞の種類の特定の結果に基づいて、前記少なくとも１つのアノテーションテーブルを更新する更新手段をさらに備える、項目１２に記載のシステム。
（項目１４）
前記更新手段は、前記特定手段によって細胞の種類が特定されなかった測定データ、および／または、前記特定手段によって誤って細胞の種類が特定された測定データに対して、適切に細胞の種類を特定することができるように、前記アノテーションテーブルを更新する、項目１３に記載のシステム。
（項目１５）
前記更新は、
・前記細胞と、前記細胞の細胞マーカーの状態の定義、および／または
・前記細胞マーカーの測定結果と前記状態との関係を規定する基準
の更新を含む、項目１３または１４に記載のシステム。
（項目１６）
前記測定データは、フローサイトメータによる測定データ、マスサイトメータによる測定データ、シングルセル遺伝子発現解析による測定データからなる群から選択される少なくとも１つの測定データを含む、項目１～１５のいずれか一項に記載のシステム。
（項目１７）
前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記複数の細胞を複数のクラスタに分け、そして前記複数のクラスタの少なくともいくつかを構成する細胞の種類を特定する、項目１～１６のいずれか一項に記載のシステム。
（項目１８）
相関解析システムであって、
項目１～１７のいずれか一項に記載のシステムであって、前記システムは、第１の被験体の複数の細胞についての測定データから細胞の比率を出力する、システムと、
前記第１の被験体の医療データを受信する医療データ受信手段と、
前記医療データと前記細胞の比率とを突合することにより、複合データを生成する生成手段と、
前記複合データにおいて前記細胞の比率と前記医療データとの相関解析を行う解析手段と
を備える、相関解析システム。
（項目１９）
前記医療データに基づいて、複数のアノテーションテーブルから少なくとも１つのアノテーションテーブルを選択する選択手段
を備え、
前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目１８に記載の相関解析システム。
（項目２０）
細胞集団の同定のための方法であって、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む方法。
（項目２０Ａ）
上記項目のうちの１つまたは複数の記載の特徴を含む、項目２０に記載の方法。
（項目２１）
細胞集団の同定のためのプログラムであって、前記プログラムは、プロセッサを備えるシステムにおいて実行され、前記プログラムは、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む処理を前記プロセッサに行わせる、プログラム。
（項目２１Ａ）
上記項目のうちの１つまたは複数の記載の特徴を含む、項目２０に記載のプログラム。
（項目２２）
細胞集団内の細胞を特定するためのシステムであって、
複数の細胞についての測定データを受信する受信手段と、
前記測定データに含まれる細胞の種類を特定する特定手段と、
前記特定された細胞の種類を出力する出力手段と
を備え、前記特定手段は、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することと、
前記決定されたピーク数の分布を前記散布図またはヒストグラムに当てはめることにより、前記分布に対応する細胞を識別特定することと
前記識別された細胞の種類を特定することと
を行うように構成されている、システム。
（項目２２Ａ）
上記項目のうちの１つまたは複数の記載の特徴を含む、項目２２に記載のシステム。
（項目２３）
細胞集団内の細胞を特定するための方法であって、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類を出力することと
を含み、前記特定することは、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することと、
前記決定されたピーク数の分布を前記散布図またはヒストグラムに当てはめることにより、前記分布に対応する細胞を識別することと
前記識別された細胞の種類を特定することと
を含む方法。
（項目２３Ａ）
上記項目のうちの１つまたは複数の記載の特徴を含む、項目２３に記載の方法。
（項目２４）
細胞集団内の細胞を特定するためのプログラムであって、前記プログラムは、プロセッサを備えるシステムにおいて実行され、前記プログラムは、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類を出力することと
を含む処理を前記プロセッサに行わせ、前記特定することは、
前記測定データから散布図またはヒストグラムを作成することと、
前記散布図またはヒストグラムにおけるピーク数を決定することと、
前記決定されたピーク数の分布を前記散布図またはヒストグラムに当てはめることにより、前記分布に対応する細胞を識別することと
前記識別された細胞の種類を特定することと
を含む、プログラム。
（項目２４Ａ）
上記項目のうちの１つまたは複数の記載の特徴を含む、項目２４に記載のプログラム。
（項目Ａ１）
細胞集団の同定のためのシステムであって、
複数の細胞についての測定データを受信する受信手段と、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定する特定手段と、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出する導出手段と、
前記導出された比率を出力する出力手段と
を備え、前記システムは、前記アノテーションテーブルを記憶するデータベースと通信し、前記アノテーションテーブルは、細胞と前記細胞の細胞マーカーの状態の定義とを含むテーブルである、システム。
（項目Ａ２）
前記データベースは、複数のアノテーションテーブルを記憶し、
前記特定手段は、前記複数のアノテーションテーブルのうちの少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目Ａ１に記載のシステム。
（項目Ａ３）
前記複数のアノテーションテーブルのうちの少なくとも１つのアノテーションテーブルを選択する入力を受信する第２の受信手段をさらに備え、
前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目Ａ２に記載のシステム。
（項目Ａ４）
行うべき解析を示す入力を受信する第３の受信手段と、
前記行うべき解析を示す入力に基づいて、前記複数のアノテーションテーブルから少なくとも１つのアノテーションテーブルを選択する選択手段と
を備え、
前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目Ａ２に記載のシステム。
（項目Ａ５）
前記複数のアノテーションテーブルは、第１のアノテーションテーブルと第２のアノテーションテーブルとを含み、前記第１のアノテーションテーブルは、第２のアノテーションテーブルよりも古い定義で前記細胞と前記細胞のマーカーの状態とを関連付ける、項目Ａ２～４のいずれか一項に記載のシステム。
（項目Ａ６）
前記複数のアノテーションテーブルは、第１のアノテーションテーブルと第２のアノテーションテーブルとを含み、前記第１のアノテーションテーブルは、第２のアノテーションテーブルよりも概括的に前記細胞と前記細胞のマーカーの状態とを関連付ける、項目Ａ２～４のいずれか一項に記載のシステム。
（項目Ａ７）
前記システムは、前記データベースを備える、項目Ａ１～６のいずれか一項に記載のシステム。
（項目Ａ８）
前記アノテーションテーブルはさらに、前記細胞マーカーの測定結果と前記状態との関係を規定する基準を含む、項目Ａ１～７のいずれか一項に記載のシステム。
（項目Ａ９）
前記特定手段による細胞の種類の特定の結果に基づいて、前記少なくとも１つのアノテーションテーブルを更新する更新手段をさらに備える、項目Ａ８に記載のシステム。
（項目Ａ１０）
前記更新手段は、前記特定手段によって細胞の種類が特定されなかった測定データ、および／または、前記特定手段によって誤って細胞の種類が特定された測定データに対して、適切に細胞の種類を特定することができるように、前記アノテーションテーブルを更新する、項目Ａ９に記載のシステム。
（項目Ａ１１）
前記更新は、
・前記細胞と、前記細胞の細胞マーカーの状態の定義、および／または
・前記細胞マーカーの測定結果と前記状態との関係を規定する基準
の更新を含む、項目Ａ９または１０に記載のシステム。
（項目Ａ１２）
前記測定データは、フローサイトメータによる測定データ、マスサイトメータによる測定データ、シングルセル遺伝子発現解析による測定データからなる群から選択される少なくとも１つの測定データを含む、項目Ａ１～１１のいずれか一項に記載のシステム。
（項目Ａ１３）
前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記複数の細胞を複数のクラスタに分け、そして前記複数のクラスタの少なくともいくつかを構成する細胞の種類を特定する、項目Ａ１～１２のいずれか一項に記載のシステム。
（項目Ａ１４）
相関解析システムであって、
項目Ａ１～１３のいずれか一項に記載のシステムであって、前記システムは、第１の被験体の複数の細胞についての測定データから細胞の比率を出力する、システムと、
前記第１の被験体の医療データを受信する医療データ受信手段と、
前記医療データと前記細胞の比率とを突合することにより、複合データを生成する生成手段と、
前記複合データにおいて前記細胞の比率と前記医療データとの相関解析を行う解析手段と
を備える、相関解析システム。
（項目Ａ１５）
前記医療データに基づいて、複数のアノテーションテーブルから少なくとも１つのアノテーションテーブルを選択する選択手段
を備え、
前記特定手段は、前記選択された少なくとも１つのアノテーションテーブルを用いて、前記細胞の種類を特定する、項目Ａ１２に記載の相関解析システム。
（項目Ａ１６）
細胞集団の同定のための方法であって、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む方法。
（項目Ａ１６Ａ）
上記項目のうちの１つまたは複数の記載の特徴を含む、項目Ａ１６に記載の方法。
（項目Ａ１７）
細胞集団の同定のためのプログラムであって、前記プログラムは、プロセッサを備えるシステムにおいて実行され、前記プログラムは、
複数の細胞についての測定データを受信することと、
前記測定データに含まれる細胞の種類を、アノテーションテーブルに基づいて特定することと、
前記特定された細胞の種類に基づいて、前記複数の細胞中での各細胞の比率を導出することと、
前記導出された比率を出力することと
を含む処理を前記プロセッサに行わせる、プログラム。
（項目Ａ１７Ａ）
上記項目のうちの１つまたは複数の記載の特徴を含む、項目Ａ１７に記載のプログラム。

【発明の効果】

【0007】

本発明は、新規細胞集団同定システムを提供する。

【0008】

本発明はまた、新規細胞集団同定システムを用いることによって得られる細胞プロファイリング結果（細胞集団情報）と臨床情報との相関解析システムを提供する。

【0009】

本発明はまた、細胞のプロファイリング結果と臨床情報との相関の経時的変化を追うことが可能なモニタリングシステムを提供する。

【0010】

これらによって、従来は人間の手作業によって、作業者のノウハウに依存して時間と労力をかけて行われていた細胞集団同定、細胞のプロファイリング結果と臨床情報との相関解析、および／または細胞のプロファイリング結果と臨床情報との相関の経時的変化の追跡が自動化され得る。これにより、特定の疾患または症状について臨床上重要な意味を有する細胞の特定が促進され得る。

【図面の簡単な説明】

【0011】

【図1】図１は、本発明の相関解析システムを用いた解析のフローの一例を示す図

【図2】相関解析システム１００の構成の一例を示す図

【図3】相関解析システム１００のより詳細な構成の一例を示す図

【図4A】細胞集団同定システム１２０の構成の一例を示す図

【図4B】細胞集団同定システム１２０の代替実施形態である細胞集団同定システム１２０’の構成の一例を示す図

【図4C】細胞集団同定システム１２０の代替実施形態である細胞集団同定システム１２０’’の構成の一例を示す図

【図5】相関解析システム１００または細胞集団同定システム１２０を実装するサーバ装置５００の構成の一例を示す図

【図6】相関解析システム１００の細胞集団同定システム１２０による処理６００の一例を示すフローチャート

【図7】免疫状態についての相関解析システム１００による解析に係るフローの一例を示す図

【図8】本発明のシステムが利用するアノテーションテーブルの一例を示す図

【図9A】従来のゲーティングで行われていた手法を概略的に図示する図

【図9B】本発明の発明者が開発した新たな分類手法を概略的に図示する図

【図9C】従来の手法による結果と、本発明の手法による結果との比較の一例を示す図

【図9D】本発明の手法によって陰性の画分と陽性の画分とに分離された細胞をさらに詳細に分けた結果を示す図

【図10A】一実施形態において、ステップＳ６０２で特定手段１２２が、細胞の種類を特定するためにゲーティングを行うための処理の一例を示すフローチャート

【図10B】一実施形態において、ステップＳ６０２で特定手段１２２が、細胞の種類を特定するためにゲーティングを行うための処理の別の一例を示すフローチャート

【図10C】一実施形態において、ステップＳ６０２で特定手段１２２が、細胞の種類を特定するためにゲーティングを行うための処理のさらに別の一例を示すフローチャート

【図11】ユーザに提示される図の一例を示す図

【発明を実施するための形態】

【0012】

以下、本発明を説明する。本明細書において使用される用語は、特に言及しない限り、当該分野で通常用いられる意味で用いられることが理解されるべきである。したがって、他に定義されない限り、本明細書中で使用される全ての専門用語および科学技術用語は、本発明の属する分野の当業者によって一般的に理解されるのと同じ意味を有する。矛盾する場合、本明細書（定義を含めて）が優先する。

【0013】

（１．定義）
本明細書において、「免疫細胞」とは生体内の免疫系を司る細胞の総称であり、リンパ球（Ｔ細胞、Ｂ細胞、ナチュラルキラー（ＮＫ）細胞）、単球（樹状細胞（ミエロイド系樹状細胞；ｍＤＣ、形質細胞様樹状細胞；ｐＤＣ）、マクロファージ）、顆粒球（好塩基球、好酸球、好中球）などが挙げられる。

【0014】

本明細書において、「細胞アノテーション」とは、任意の細胞を任意の１または複数の細胞マーカーの状態によって規定することをいう。本明細書において、「細胞マーカー」は、細胞を特徴付ける任意の情報をいう。「アノテーションテーブル」とは、細胞の種類と、それに対応する細胞マーカーの状態の定義との対応を含むテーブルをいう。なお、本発明のアノテーションテーブルは、必ずしも「テーブル」の形式である必要はなく、細胞の種類と、それに対応する細胞マーカーの状態の定義との対応を含む限り任意の形式であり得る。例えば、本発明のアノテーションテーブルは、条件式の羅列であってもよい。例えば、条件式を満たすかどうかを判定することで、ゲーティングまたは細胞アノテーションを行うことができる。例えば、本発明のアノテーションテーブルは、図であってもよい。例えば、図とのパターンマッチングを行い、類似するか否かを判定することで、ゲーティングまたは細胞アノテーションを行うことができる。

【0015】

本明細書において「細胞マーカー」という場合、細胞を特徴付ける任意の情報をいい、具体的には、細胞表面タンパク質、細胞内タンパク質または分泌型タンパク質（サイトカインもしくはホルモン）などの任意のタンパク質、任意の遺伝子の発現量や存在量、タンパク質を修飾している任意の部分（例えば、糖）の存在量、細胞の増殖能などが挙げられるが、これらに限定されない。

【0016】

本明細書において、「約」とは、後に続く数値の±１０％を意味する。

【0017】

（２．アノテーションテーブル）
本発明の細胞集団同定システムは、被験体由来のサンプル中の複数の細胞の測定データに基づき、細胞群中の各細胞または各細胞集団に細胞アノテーションを付与して種類ごとに分類し、細胞群の中の各細胞の比率を同定し得る。

【0018】

細胞群の測定データは、典型的には、被験体由来のサンプル中に含まれる各細胞の細胞マーカーの存在量および／または発現量の測定データであり得る。被験体のサンプルは、末梢血、骨髄、腫瘍組織、造血組織、脾臓、正常組織、リンパ液等であり得る。特に末梢血サンプルは、非侵襲的で簡便に採取できるため、有利であり得る。サンプル中に含まれる各細胞の細胞マーカーの発現パターンの測定は、当該分野において公知の任意の方法によって行うことができるが、例えば、蛍光抗体を用いるフローサイトメータや、重金属ラベルされた抗体を用いるマスサイトメータ、および／またはシングルセル遺伝子発現解析によって行われ得る。好ましい実施形態において、本発明のアノテーションテーブルは、免疫細胞と、それに対応する複数の細胞マーカーそれぞれの発現パターンの定義とを含む。本発明のアノテーションテーブルは、細胞マーカーの種類（例えば、細胞表面タンパク質や細胞内タンパク質の発現量や存在量）と、その細胞マーカーの状態（例えば、発現パターンや存在パターン）との関係を規定する基準（すなわち、どの程度の発現（存在）量を、どのような発現（存在）パターンとして決定するか等）もさらに含んでもよい。サンプル中に含まれる各細胞の細胞マーカーの発現量の測定は、例えば蛍光抗体を用いるフローサイトメータ、または重金属ラベルされた抗体を用いるマスサイトメータによって行われ得、好ましくは、フローサイトメータによって行われ得る。１つの実施形態において、本発明のアノテーションテーブルは、免疫細胞と、それに対応する遺伝子の発現パターンの定義とを含み、さらに遺伝子の発現量と発現パターンとの関係を規定する基準も含んでもよい。遺伝子発現量の測定は、シングルセル遺伝子発現解析によって行われてもよい。特に好ましい実施形態において、本発明のアノテーションテーブルは、免疫細胞と、それに対応するタンパク質（例えば、細胞表面タンパク質や細胞内タンパク質）の発現パターンおよび遺伝子発現パターンの定義とを含み得る。

【0019】

免疫細胞において、例えばＴ細胞は、細胞異常の検出や細菌感染細胞の直接的破壊を担い、また、他の免疫細胞が抗体を産生するためのサポート役としても機能する免疫系の重要な細胞である。Ｔ細胞には、主にヘルパーＴ細胞およびキラーＴ細胞が含まれる。一般的には、ヘルパーＴ細胞は細胞マーカーとしてＣＤ４を高発現（ＣＤ４^＋）しており、キラーＴ細胞はＣＤ８を高発現（ＣＤ８^＋）している。さらに、ヘルパーＴ細胞やキラーＴ細胞の中でも、状態や機能によって異なる種類の細胞に細分化され得、それらの細分化された種類の細胞は、ＣＤ４やＣＤ８以外の他の細胞マーカーの発現パターンによって定義され得る。細分化された細胞の種類は、例えば、分化後の細胞の種類だけではなく、一時的におかれる細胞の状態（刺激の前後、活性化、疲弊化など）、あるいは分化の各段階（未分化、分化途中、再分化中など）なども含み得る。例えば、Ｔ細胞は、状態（活性化Ｔ細胞または疲弊化Ｔ細胞等）や分化（未分化、分化途中、分化後）によって、さらに種類が細分化され得る。なお、これらの細分化の説明についてＴ細胞を例に挙げて説明したが、細胞の細分化はＴ細胞に限定されるものではない。好ましい実施形態において、本発明においては、細分化された種類の細胞と、それに対応する細胞マーカーの発現パターンを含むアノテーションテーブルが使用され得る。

【0020】

被験体のサンプルの測定データにおいて、アノテーションテーブルを参照することにより、細胞マーカーの発現パターンから、各細胞の種類が特定され得る。あるいは、被験体のサンプルの測定データにおいて、アノテーションテーブルを参照することによって細胞マーカーの発現パターンが識別され、アノテーションテーブルをさらに参照することにより、識別された細胞マーカーの発現パターンから、各細胞の種類が特定され得る。そして、サンプル中に含まれる各細胞の種類を特定することによって、それぞれの種類の細胞がサンプル中の細胞においてどのような比率で存在するのかを特定することができる。

【0021】

典型的な実施形態においては、アノテーションテーブルにおける各細胞の細胞アノテーションは、各細胞に対して、複数の細胞マーカーの発現パターンによって規定され得る。本発明のアノテーションテーブルは、各細胞に対して、典型的には５種類以上、より好ましくは１０種類以上、特に好ましくは１５種類以上の細胞マーカーの発現パターンを定義したものであり得る。ある場合には、５０種類以上であってもよし、例えば、１０，０００種類以上であってもよい。発現パターンは、それぞれの測定方法に応じた適切な大きさの数値を使って、それぞれの細胞マーカーごとに上限および下限の範囲で表現しうるが、範囲の設定は上限および下限を用いなくてもよい。たとえば、２つの細胞マーカーそれぞれの発現量（存在量）を縦軸、横軸とした散布図において各細胞の細胞マーカー発現量（存在量）をプロットし、同種の細胞が集まってできたクラスタを楕円、多角形などで囲い、それを範囲としてもよい。あるいは数値を用いなくても、上限と下限の範囲は、－（発現なし）、＋（発現あり）、２＋（高い発現あり）、３＋（顕著に高い発現あり）など、あるいは、－、ｌｏｗ（またはｄｉｍ）、ｈｉｇｈなどの指標を用いて表現され得る。例えば、典型的にはヘルパーＴ細胞は、ＣＤ４が「３＋」であり、ＣＤ８が「－」であり、さらに他の細胞マーカーの発現パターンによって、分化後のヘルパーＴ細胞については活性化または疲弊化した状態、あるいはヘルパーＴ細胞への分化途中の細胞などの細胞群に細分化され得る。例えば、典型的にはキラーＴ細胞は、ＣＤ４が「－」であり、ＣＤ８が「３＋」であり、さらに他の細胞マーカーの発現パターンによって、分化後のキラーＴ細胞については活性化または疲弊化した状態、あるいはキラーＴ細胞への分化途中の細胞などの細胞群に細分化され得る。

【0022】

さらに、アノテーションテーブルは、細胞マーカーの発現量と発現パターンとの関係を規定する基準も定義することができる。例えば、ＣＤ４について、「３＋」の発現パターンと「２＋」の発現パターンとの境界となる発現量、「２＋」の発現パターンと「＋」の発現パターンとの境界となる発現量、「＋」の発現パターンと「－」の発現パターンとの境界となる発現量を規定することができる。これにより、測定データが示す発現量から、その測定データの発現パターンを識別することができる。

【0023】

細胞マーカーの発現パターンについては、どのレベルの発現を＋、２＋、３＋などと評価するか、または範囲をどの散布図でどのような円形、多角形などで表現するかなどについて統一的・普遍的な指標は存在しないため、また数値による表現の場合は真の値は分子数でありながら実際に用いるのは測定方法に依存して表現される数値であるため、本発明のアノテーションテーブルにおける発現パターンの評価は、アノテーションテーブル内において定義される他の細胞群との対比による相対的な評価であり得る。好ましい実施形態において、本発明においては、アノテーションテーブルは、以下に説明するように機械学習により、またはマニュアルで、動的に更新され得る。すなわち、ある時点においてヘルパーＴ細胞は、ＣＤ４が「３＋」であり、ＣＤ８が「－」であり、他の細胞マーカーの発現はいずれであってもよいと定義されていたとしても、機械学習によって、またはマニュアルで新しい知見を反映させることにより、ヘルパーＴ細胞を、ＣＤ４が「３＋」であり、ＣＤ８が「－」であり、かつＣＤ１６が「－」である細胞群と、ＣＤ４が「３＋」であり、ＣＤ８が「－」であり、かつＣＤ１６が「＋」である細胞群とに細分化するように更新し得る。本発明において、細胞は、細胞の機能、状態（活性化、疲弊化）、分化（未分化、分化途中、分化後）などによって細分化され得る。このようにアノテーションテーブルを動的に更新することにより、より細分化された細胞群を得ることができる。またその細分化された各細胞の比率を求めることによって、被験体の免疫状態をより適切に特定することができる。

【0024】

好ましい実施形態において、アノテーションテーブルの更新は、以前にアノテーションテーブルを用いて行われた細胞の種類の分類の結果を利用した機械学習によって行われる。

【0025】

一実施形態において、例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、どの細胞にも分類されない細胞群が存在したとする。例えば、これは、分類結果を専門家が検証することによって検出されてもよいし、分類結果を検証するアルゴリズムを用いて検証されてもよい。分類結果を検証するアルゴリズムは、例えば、種類がわからない細胞あるいはいずれのクラスタにも分類されなった細胞を特定するための任意のアルゴリズムであり得る。分類結果を検証するアルゴリズムは、例えば、機械学習ベースのアルゴリズムであってもよいし、ルールベースのアルゴリズムであってもよい。本例では、どの細胞にも分類されなかった細胞群を分類することができるように、アノテーションテーブルを更新することができる。例えば、統計分析（例えば、主成分分析）または機械学習（例えば、ランダムフォレスト）等を用いて、どの細胞にも分類されなかった細胞群を分類することができる発現パターンを特定し、特定された発現パターンを含めるようにアノテーションテーブルを更新することができる。

【0026】

一実施形態において、例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、専門家の経験的にまたは学問的（例えば、免疫学的）に不正確に分類された細胞群が存在したとする。例えば、これは、分類結果を専門家が検証することによって検出されてもよいし、分類結果を検証するアルゴリズムを用いて検証されてもよい。分類結果を検証するアルゴリズムは、例えば、所定の基準を満たさない細胞あるいはクラスタ（例えば、所定の基準下では所定の境界で２つのクラスタが区分されるべきところ、その境界では区分されないクラスタなど）を特定するための任意のアルゴリズムであり得る。分類結果を検証するアルゴリズムは、例えば、機械学習ベースのアルゴリズムであってもよいし、ルールベースのアルゴリズムであってもよい。本例では、不正確に分類された細胞群を専門家の経験的にまたは学問的（例えば、免疫学的）に正しく分類することができるように、アノテーションテーブルを更新することができる。例えば、統計分析（例えば、主成分分析）または機械学習（例えば、ランダムフォレスト）等を用いて、不正確に分類された細胞群を正しく分類することができる発現パターンを特定し、特定された発現パターンを含めるようにアノテーションテーブルを更新することができる。

【0027】

好ましい実施形態において、アノテーションテーブルにおいて定義される、細胞マーカーの種類（例えば、細胞表面タンパク質や細胞内タンパク質の発現量や存在量）と、その細胞マーカーの状態（例えば、発現パターンや存在パターン）との関係を規定する基準（すなわち、どの程度の発現（存在）量を、どのような発現（存在）パターンとして決定するか等）についても、以下に説明するように機械学習により、またはマニュアルで、動的に更新され得る。ＣＤ４の発現量を細胞マーカーとする場合を例にすると、ある時点において、ＣＤ４について、「３＋」の発現パターンと「２＋」の発現パターンとの境界となる発現量がαであり、「２＋」の発現パターンと「＋」の発現パターンとの境界となる発現量がβであると定義されていたとしても、機械学習によって、またはマニュアルで新しい知見を反映させることにより、ＣＤ４について、「３＋」の発現パターンと「２＋」の発現パターンとの境界となる発現量がα’であり、「２＋」の発現パターンと「＋」の発現パターンとの境界となる発現量がβ’であると更新され得る。このようにアノテーションテーブルを動的に更新することにより、より正確に分類された細胞群を得ることができる。またこのようにして得た正確に分類された細胞群に基づいて、ある被験体における細分化された細胞の種類（例えば、状態（例えば、活性化Ｔ細胞、疲弊化Ｔ細胞）や分化（未分化、分化途中、分化後）などによって細分化された種類）ごとの割合を求めることができ、これにより、当該被験体の免疫状態を特定することができる。

【0028】

一実施形態において、アノテーションテーブルの更新は、以前にアノテーションテーブルを用いて行われた細胞の種類の分類の結果を利用した機械学習によって行われる。例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、どの細胞にも分類されない細胞群が存在したとする。例えば、これは、分類結果を専門家が検証することによって検出されてもよいし、分類結果を検証するアルゴリズムを用いて検証されてもよい。分類結果を検証するアルゴリズムは、例えば、種類がわからない細胞あるいはいずれのクラスタにも分類されなった細胞を特定するための任意のアルゴリズムであり得る。分類結果を検証するアルゴリズムは、例えば、機械学習ベースのアルゴリズムであってもよいし、ルールベースのアルゴリズムであってもよい。本例では、どの細胞にも分類されなかった細胞群を分類することができるように、アノテーションテーブルにおける細胞マーカーの発現量と発現パターンとの関係を規定する基準を更新することができる。例えば、統計分析（例えば、主成分分析）または機械学習（例えば、ランダムフォレスト、ｋ平均法）等を用いて、どの細胞にも分類されなかった細胞群を分類することができるような、細胞マーカーの発現量と発現パターンとの関係を規定する基準を特定し、特定された基準を含めるようにアノテーションテーブルを更新することができる。

【0029】

例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、専門家の経験的にまたは学問的（例えば、免疫学的）に不正確に分類された細胞群および／または分類されなかった細胞群が存在したとする。例えば、これは、分類結果を専門家が検証することによって検出されてもよいし、分類結果を検証するアルゴリズムを用いて検証されてもよい。分類結果を検証するアルゴリズムは、例えば、所定の基準を満たさない細胞あるいはクラスタ（例えば、所定の基準下では所定の境界で２つのクラスタが区分されるべきところ、その境界では区分されないクラスタなど）を特定するための任意のアルゴリズムであり得る。分類結果を検証するアルゴリズムは、例えば、機械学習ベースのアルゴリズムであってもよいし、ルールベースのアルゴリズムであってもよい。本例では、不正確に分類された細胞群を専門家の経験的にまたは免疫学的に正しく分類することができるように、アノテーションテーブルを更新することができる。例えば、統計分析（例えば、主成分分析）または機械学習（例えば、ランダムフォレスト、ｋ平均法）等を用いて、不正確に分類された細胞群および／または分類されなかった細胞群を正しく分類することができるような、細胞マーカーの種類と状態との関係を規定する基準を特定し、特定された基準を含めるようにアノテーションテーブルを更新することができる。

【0030】

アノテーションテーブルの更新は、例えば、アノテーションテーブルに定義される各細胞マーカーの状態を更新することによって行われてもよいし、各細胞マーカーの測定結果と状態との関係を規定する基準を更新することによって行われてもよいし、その両方を変更するように行われてもよい。例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、どの細胞にも分類されない細胞群が存在したとする。その場合、その細胞群を分類することができるように、アノテーションテーブルにおける細胞マーカーの発現パターンと、細胞マーカーの発現量と発現パターンとの関係を規定する基準との両方を更新することができる。例えば、統計分析（例えば、主成分分析）または機械学習（例えば、ランダムフォレスト、ｋ平均法）等を用いて、どの細胞にも分類されなかった細胞群を分類することができる、発現パターンおよび細胞マーカーの発現量と発現パターンとの関係を規定する基準の両方を特定し、特定された発現パターンおよび基準を含めるようにアノテーションテーブルを更新することができる。

【0031】

例えば、アノテーションテーブルを用いて細胞の種類の分類を行った結果、専門家の経験的にまたは学問的（例えば、免疫学的）に不正確に分類された細胞群が存在したとする。その場合、その細胞群を専門家の経験的にまたは学問的（例えば、免疫学的）に正しく分類することができるように、アノテーションテーブルを更新することができる。例えば、統計分析（例えば、主成分分析）または機械学習（例えば、ランダムフォレスト、ｋ平均法）等を用いて、不正確に分類された細胞群を正しく分類することができる、発現パターン、および細胞マーカーの発現量と発現パターンとの関係を規定する基準との両方を特定し、特定された発現パターンおよび基準を含めるようにアノテーションテーブルを更新することができる。

【0032】

アノテーションテーブルを更新することの効果は、例えば、アノテーションテーブルに対する更新量を記憶しておき、アノテーションテーブルを参照するときに、測定データに対して更新量を適用することにより測定データを調整することによっても達成することができる。本明細書では、アノテーションテーブルを更新することは、アノテーションテーブル自体は固定されたものであるが、そのアノテーションテーブルに対する更新量で測定データを調整することも含む概念である。

【0033】

アノテーションテーブルを更新していくことで、ユーザは最新の知見に基づく解析を行うことができるようになる。これに加えて、アノテーションテーブルを更新することは、新しい細胞群または新しい発現パターンの発見につながり得る。

【0034】

（３．相関解析システムおよびモニタリングシステム）
本発明の発明者は、被験体由来のサンプル中の複数の細胞の測定データから、上述の細胞集団同定システムを用いて同定された細胞プロファイリング結果と、当該被験体の医療データとの関係を解析するための相関解析システムを開発した。この相関解析システムは、従来、測定データに対して手作業で行っていた細胞集団の同定を自動的に行う細胞集団同定システムに加えて、同定された細胞集団（細胞プロファイリング結果）と医療データとの関係を導出する手段をさらに含む。これにより、測定データと医療データとの関係を迅速かつ容易に行うことができる。さらには、手作業で行っていた手法では見出すことができなかった細胞集団または細胞集団と医療データとの関係を見出すことも可能であり得る。

【0035】

例えば、既知の疾患または症状を有する被験体から得られた測定データから得られた細胞プロファイリング結果と、医療データとの関係を解析することにより、その疾患または症状について臨床上重要な意味を有する細胞（例えば、その疾患または症状が悪化することに関連する細胞、その疾患または症状が回復することに関連する細胞、その疾患または症状の診断に役立つ細胞等）を特定することができる。

【0036】

図１は、本発明の相関解析システムを用いた解析のフローの一例を示す。相関解析システムを用いた解析により、ユーザＵは解析結果を得ることができる。

【0037】

ステップＳ１では、被験体Ｓから取得されたサンプルが分析装置に提供される。被験体のサンプルは任意のサンプルであり得るが、例えば、末梢血、骨髄、腫瘍組織、造血組織、脾臓、正常組織、リンパ液等であり得る。分析装置は任意の装置であり得るが、例えば、フローサイトメータ、マスサイトメータ、シングルセル解析装置等であり得る。

【0038】

ステップＳ２では、分析装置によって出力された測定データが相関解析システム１００（より具体的には、相関解析システム１００における細胞集団同定システム１２０）に提供される。なお、図１においては相関解析システム１００が細胞集団同定システム１２０を含んでいる実施形態を図示したが、本発明はこれに限定されず、細胞集団同定システムまたは相関解析システムそれぞれが別個に本発明の主題である。測定データが細胞集団同定システムに提供される態様は問わない。測定データは、任意の態様で、細胞集団同定システムに提供されることができる。例えば、測定データは、ネットワーク（例えば、インターネット、ＬＡＮ等）を介して相関解析システム１００に提供されてもよいし、測定データを記憶した記憶媒体（例えば、リムーバブルメディア）を介して細胞集団同定システムに提供されてもよい。

【0039】

ステップＳ３では、被験体Ｓに関する医療データが相関解析システム１００に提供される。医療データが相関解析システム１００に提供される態様は問わない。医療データは、任意の態様で、相関解析システム１００に提供されることができる。例えば、医療データは、ネットワーク（例えば、インターネット、ＬＡＮ等）を介して相関解析システム１００に提供されてもよいし、医療データを記憶した記憶媒体（例えば、リムーバブルメディア）を介して相関解析システム１００に提供されてもよい。

【0040】

測定データが細胞集団同定システム（例えば、相関解析システム１００における細胞集団同定システム１２０）に提供されると、細胞集団同定システムは、細胞群中の細胞（例えば、免疫細胞）を種類ごとに分類し、細胞群の中の各細胞の比率を同定することになる。このとき、細胞集団同定システムは、アノテーションテーブルを用いて、細胞群中の細胞の種類を特定することができる。アノテーションテーブルは、細胞集団同定システム、または細胞集団同定システム１２０を含む相関解析システム１００と通信するデータベース部２００に記憶されている。

【0041】

ステップＳ４では、細胞集団同定システム１２０、または細胞集団同定システム１２０を含む相関解析システム１００がデータベース部２００にアクセスする。データベース部２００には、１または複数のアノテーションテーブルが記憶され得る。一実施形態では、データベース部２００には、１つのみのアノテーションテーブルが記憶され得る。他の実施形態において、データベース部２００に複数のアノテーションテーブルが記憶されている場合、細胞集団同定システム、または細胞集団同定システム１２０を含む相関解析システム１００は、データベース部２００に記憶されている複数のアノテーションテーブルから、測定データに含まれる細胞の種類を特定するためのアノテーションテーブルを検索する。アノテーションテーブルは、例えば、ユーザＵが希望する解析条件に基づいて検索されてもよいし、例えば、測定データが取得された条件に基づいて検索されてもよい。１つの実施形態において、アノテーションテーブルは、ある時点において用意された第１のアノテーションテーブルと、その後の別の時点において更新された第２のアノテーションテーブルとを含む。別の実施形態において、アノテーションテーブルは、細胞マーカーの種類について、概括的に定義された第１のアノテーションテーブルと、詳細に定義された第２のアノテーションテーブルとを含む。別の実施形態において、アノテーションテーブルは、細胞マーカーの状態について、概括的に定義された第１のアノテーションテーブルと、詳細に定義された第２のアノテーションテーブルとを含む。ユーザは、これらの複数のアノテーションテーブルから目的に応じて適切なアノテーションテーブルを選択してもよいし、細胞集団同定システム、または細胞集団同定システムを含む相関解析システム１００が適切なアノテーションテーブルを自動的に選択するように構成してもよい。

【0042】

解析に利用されるべきアノテーションテーブルが決定されると、ステップＳ５では、決定されたアノテーションテーブルがデータベース部２００から細胞集団同定システム、または細胞集団同定システム１２０を含む相関解析システム１００に提供される。細胞集団同定システムは、提供されたアノテーションテーブルを用いて細胞群中の免疫細胞の種類を特定する。細胞集団同定システムは、特定された細胞の種類に基づいて、細胞群の中の各免疫細胞の比率を同定することができる。

【0043】

続いて、相関解析システム１００は、細胞集団同定システムによって同定された各免疫細胞の比率の情報を受け取り、それを医療データと突合することによって、複合データを生成することができる。

【0044】

相関解析システム１００は、生成された複合データに基づく解析を行い、ステップＳ６では、その結果がユーザＵに提供される。

【0045】

相関解析システム１００は、例えば、複合データの相関解析を行うことができる。これにより、特定の疾患または症状について臨床上重要な意味を有する細胞（例えば、その疾患または症状が悪化することに関連する細胞、その疾患または症状が回復することに関連する細胞、その疾患または症状の診断に役立つ細胞等）を特定することができる。

【0046】

相関解析を行うとき、相関解析システム１００は、複合データに含まれる細胞の比率を直接利用するようにしてもよいし、複合データに含まれる細胞の比率から導出される比率（例えば、複合データに含まれる細胞の比率の回帰分析により導出される比率）を利用するようにしてもよい。一実施形態において、医療データと相関する細胞の比率として種々の比率を採用することができ、例えば、ある被験体における細胞の種類ごとの比率を用いてもよいし、細胞の種類ごとの比率を用いて回帰分析を行い、得られた多項式によって出力される値が医療データと相関してもよい。また他の実施形態において、被験体におけるある細胞の量（Ｘ）の、他の細胞の量（Ｙ）に対する相対値（例えば、Ｘ／ＹやＸ^２／Ｙなど）が医療データと相関してもよい。ある時点で細胞集団同定システムによって得られた１つまたは多様な細胞の比率を細胞プロファイリング結果とし、この細胞プロファイリング結果を時間経過ごとに取得して、時間経過とともに比率が有意に変化する細胞を見つけることによって、つまり細胞状態のモニタリング（例えば、免疫細胞を対象にした免疫モニタリング）を行うこともできる。また、このような細胞状態のモニタリングは、複合データを用いて行うこともできる。

【0047】

一実施形態において、相関解析システム１００は、例えば、複合データの次元削減解析を行うことができる。例えば相関解析システム１００は、細胞の比率と医療データとを合わせた多変量のデータに対して多変量解析（例えば、主成分分析）を行うことにより、多変量データの次元を削減することができる。これにより、特徴的な集団についての発見（例えば、Ａ細胞が多く、Ｂ細胞が少ない集団は長期生存するなど）をすることができる。

【0048】

好ましい実施形態において、相関解析システム１００は、例えば、複合データに含まれる或る細胞の比率とＰＦＳ（無増悪生存期間）とからＲＯＣ（受信者動作特性）カーブを描くことができる。これにより、その細胞の比率に、診断能力があるかどうかを特定することができる。

【0049】

以下に、相関解析システム１００について、具体的に説明する。

【0050】

（４．相関解析システムの構成）
図２は、相関解析システム１００の構成の一例を示す。

【0051】

相関解析システム１００は、ネットワーク４００を介して、データベース部２００と、少なくとも１つのユーザ端末装置３００とに接続されている。

【0052】

ネットワーク４００は、任意の種類のネットワークであり得る。ネットワーク４００は、例えば、インターネットであってもよいし、ＬＡＮであってもよい。ネットワーク４００は、有線ネットワークであってもよいし、無線ネットワークであってもよい。

【0053】

図２には、３つのユーザ端末装置３００が示されているが、ユーザ端末装置３００の数はこれに限定されない。相関解析システム１００は、任意の数のユーザ端末装置３００に接続されることができる。

【0054】

相関解析システム１００の一例は、相関解析サービスを提供するサービスプロバイダに設置されている情報処理装置（例えば、サーバ装置）であるが、これに限定されない。ユーザ端末装置３００の一例は、ユーザが保持する端末装置であるが、これに限定されない。相関解析システム１００は、例えば、相関解析サービスを利用するためのアプリケーションをインストールしたユーザ端末装置であってもよい。この場合、相関解析システム１００は、他のユーザ端末装置と接続される必要はない。

【0055】

サーバ装置および端末装置は、任意のタイプのコンピュータであり得る。例えば、端末装置は、スマートフォン、タブレット、パーソナルコンピュータ、スマートグラス等の任意のタイプの端末装置であり得る。

【0056】

データベース部２００には、相関解析システム１００のうちの細胞集団同定システム１２０によって利用され得るアノテーションテーブルが記憶され得る。一実施形態において、アノテーションテーブルは、例えば、解析条件と関連付けられて記憶され得る。これにより、ユーザが希望する解析条件に基づいてアノテーションテーブルを検索することができるようになる。例えば、アノテーションテーブルは、測定データが取得される条件と関連付けられて記憶され得る。これにより、測定データが取得された条件に基づいてアノテーションテーブルを検索することができるようになる。

【0057】

図３は、特に好ましい実施形態における相関解析システム１００のより詳細な構成の一例を示す。

【0058】

相関解析システム１００は、受信手段１１０と、細胞集団同定システム１２０と、生成手段１３０と、解析手段１４０とを備える。

【0059】

受信手段１１０は、相関解析システム１００の外部から情報を受信するように構成されている。受信手段１１０が、どのような態様で情報を受信するかは問わない。例えば、受信手段１１０は、受信器がネットワーク４００を介して相関解析システム１００の外部から情報を受信してもよい。あるいは、例えば、受信手段１１０は、相関解析システム１００に接続された記憶媒体から情報を読み取ることによって情報を受信してもよい。あるいは、例えば、受信手段１１０は、相関解析システム１００が備える入力部（例えば、タッチパネル、キーボード、マウス、マイクなど）を介して入力された情報を受信してもよい。

【0060】

受信手段１１０は、複数の細胞についての測定データを受信することができる。

【0061】

測定データは、被験体の任意のサンプルを任意の分析装置によって分析した結果のデータであり得る。被験体のサンプルは、例えば末梢血、骨髄、腫瘍組織、造血組織、脾臓、正常組織、リンパ液等であり得、複数の細胞が含まれている。測定データは、被験体由来のサンプル中に含まれる各細胞の細胞マーカーの状態を表し得る。分析装置は、例えば、フローサイトメータ、マスサイトメータ、シングルセル解析装置等であるが、これらに限定されない。

【0062】

受信手段１１０はさらに、被験体の医療データを受信することができる。

【0063】

医療データは、被験体の臨床情報であり得る。医療データは、例えば、被験体の経過観察によって得られるデータであり得、例えば、被験体ＩＤ、性別、年齢、疾患名、治療薬剤、治療レジメン、ＰＦＳ（無増悪生存期間）、ＯＳ（全生存期間）を含むがこれらに限定されない。好ましくは、医療データは、被験体の既往歴、血液検査結果、バイタル情報（心拍数、呼吸数、血圧、体温等）などを含み得る。医療データは、例えば、解析対象に応じた情報を含み得る。例えば、解析対象が腫瘍であれば、医療データは、治療効果判定、腫瘍径、標的病変と非標的病変、転移、stageなどを含み得る。例えば、解析対象が肺
がんであれば、医療データは、喫煙歴などを含み得る。好ましくは、医療データは、被験体の個人情報（氏名、住所、家族情報）を含まない。本発明の代表的な実施例においては、細胞の測定データおよび医療データはいずれも被験体ＩＤを含み、細胞の測定データと医療データとの突合は、この被験体ＩＤを用いて行われ得る。

【0064】

受信手段１１０によって受信された測定データは、後続の処理のために、細胞集団同定システム１２０に渡される。受信手段１１０によって受信された医療データは、後続の処理のために、生成手段１３０に渡される。

【0065】

細胞集団同定システム１２０は、測定データから細胞集団を同定するための構成を有し得る。

【0066】

図４Ａは、好ましい実施形態における細胞集団同定システム１２０の構成の一例を示す。

【0067】

細胞集団同定システム１２０は、第１の受信手段１２１と、特定手段１２２と、導出手段１２３と、出力手段１２４とを備える。細胞集団同定システム１２０は、相関解析システム１００の一部として存在していてもよいし、細胞集団同定システム１２０とは別個に独立して存在していてもよい。

【0068】

第１の受信手段１２１は、細胞集団同定システム１２０の外部から測定データを受信するように構成されている。第１の受信手段１２１は、例えば、受信手段１１０から測定データを受信することができる。測定データは、上述したように、被験体のサンプルを分析して得られたデータであり得る。被験体のサンプルには、複数の細胞が含まれ得る。測定データは、被験体のサンプルに含まれ得る細胞の細胞マーカーの発現量を表し得る。

【0069】

第１の受信手段１２１によって受信された測定データは、特定手段１２２に渡される。

【0070】

特定手段１２２は、測定データに含まれる細胞の種類を、アノテーションテーブルを用いて特定することができる。アノテーションテーブルは、細胞集団同定システム１２０が通信するデータベース部２００（図２を参照）に記憶され得る。データベース部２００は、細胞集団同定システム１２０の一部であってもよいし、細胞集団同定システム１２０の外部にあってもよい。

【0071】

特定手段１２２は、例えば、アノテーションテーブルを参照し、測定データが表す特定の細胞マーカーの状態（例えば、あるタンパク質の発現量に基づく発現パターン）を識別することができる。特定手段１２２は、識別された細胞マーカーの状態に基づいて、測定データに含まれる複数の細胞の１つ１つの種類を特定するようにしてもよいし、測定データに含まれる複数の細胞を複数のクラスタにクラスタリングし、複数のクラスタのそれぞれについて、そのクラスタに属する細胞の種類を特定するようにしてもよい。

【0072】

特定手段１２２は、例えば、アノテーションテーブルにおいて、識別された細胞マーカーの状態と同一または類似する状態を有すると規定される細胞が、測定データに含まれる細胞であると特定することができる。例えば、特定手段１２２は、識別された発現パターンと、アノテーションテーブルに規定される複数の細胞の各々の発現パターンとの類似度を算出し、類似度が最も高いまたは類似度が所定の閾値よりも高い細胞が、測定データに含まれる細胞であると特定することができる。算出された類似度は、アノテーションテーブルの更新のために使用され得る。

【0073】

特定手段１２２は、例えば、測定データに含まれる複数の細胞のそれぞれの識別された細胞マーカーの状態に基づいて、複数の細胞を複数のクラスタにクラスタリングし、複数のクラスタの少なくともいくつかについて、それぞれのクラスタを構成する細胞の種類を特定することができる。特定手段１２２は、例えば、２次元ずつ階層的に測定データを絞り込んでいくことで、複数のクラスタにクラスタリングすることができる。これは、当該技術分野において、ゲーティングと呼ばれる。特定手段１２２は、例えば、アノテーションテーブルに規定される細胞マーカーの状態を基準として、ゲーティングを自動的に行うことができる。特定手段１２２は、例えば、測定データを或る２次元平面にプロットし、アノテーションテーブルに規定される細胞マーカーの特定の状態を利用して、プロットされたデータを少なくとも２つのクラスタに分類することができる。２次元平面は、アノテーションテーブルに規定される細胞マーカーの特定の状態に応じた軸を有し得る。次いで、少なくとも２つのクラスタのうちの１つに分類された測定データを別の２次元平面にプロットし、アノテーションテーブルに規定される細胞マーカーの特定の状態を利用して、プロットされたデータを少なくとも２つのクラスタに分類することができる。生成されるクラスタのそれぞれについて、これを繰り返すことにより、測定データを複数のクラスタに細分することができる。最終的に分類されたクラスタは、同種の細胞が属するクラスタとなり得る。

【0074】

従来、ゲーティングで細胞を分類することは、手作業で行われていた。手作業で細胞を分類するとき、測定データからヒストグラムを作成し、ヒスグラム中に現れる谷を目印にしてヒストグラムをまっすぐに分断し、分断された画分をひとまとまりとして処理していた。

【0075】

図９Ａは、従来のゲーティングで行われていた手法を概略的に図示する。図９Ａは、ＣＸＣＲ３のヒストグラムを示している。

【0076】

ヒストグラムには、２つの山とそれらの間の谷とを見て取ることができる。ゲーティングでは、谷を目印にしてヒストグラムを左右に分断し、破線よりも左の第１の画分と、破線よりも右の第２の画分とに分離し、それぞれの画分をひとまとまりとして処理していた。

【0077】

本発明の発明者は、従来の手法により谷で分断したのでは、本来、左の山にピークを有する分布に対応する細胞が誤って第２の画分として分類されたり、逆に、右の山にピークを有する分布に対応する細胞が誤って第１の画分として分類されたりしてしまう問題を見出した。例えば、第１の画分および第２の画分のそれぞれの細胞数を計数する場合には、誤って第１の画分に分類された細胞数と、誤って第２の画分に分類された細胞数とが相殺され、計数に大きな問題は生じないと考えられる。しかしながら、第１の画分または第２の画分に対して更なる処理（例えば、より詳細な画分に分離すること）を行う際には、誤分類されたものに対して更なる処理を行うことになり、これは大きな誤差につながり、適切な結果が得られない可能性がある。本発明の発明者は、新たな分類手法を開発し、この問題に対処した。

【0078】

新たな分類手法では、ピークを有する分布を当てはめ、分布に対応する画分に細胞を分離する。すなわち、分布に対応する細胞を識別することによって細胞を分類するのである。

【0079】

図９Ｂは、本発明の発明者が開発した新たな分類手法を概略的に図示する。図９Ｂも、ＣＸＣＲ３のヒストグラムを示している。

【0080】

まず、ヒストグラムに含まれるピークの数を決定する。ピークの数は、ヒストグラムの形状から推定することによって自動的に決定されてもよいし、ユーザによって決定されてもよい。

【0081】

次に、決定された数の分布をヒストグラムに当てはめる。これにより、分布に対応する細胞を識別する。ここで、分布は、数学的に定義され得る任意の分布であり得、例えば、正規分布であり得る。

【0082】

例えば、図９Ｂに示される例では、ピークの数が２であると推定され、２つの分布を当てはめることにより、それぞれの分布に対応する細胞が識別される。本例では、左側のピークを有する左側の分布に対応する細胞と、右側のピークを有する右側の分布に対応する細胞とが識別される。

【0083】

次に、識別された細胞の属性を特定する。細胞の属性は、分類するための指標に関して陰性であるか、陽性であるかを含む。陽性は、複数の段階で示されてもよく、例えば、弱陽性、強陽性等を含む。細胞の属性は、他の分布との関係から推定することによって自動的に決定されてもよいし、ユーザによって決定されてもよい。

【0084】

例えば、図９Ｂに示される例では、左側の分布に対応する細胞が、或る指標に対して陰性であると特定され、右側の分布に対応する細胞が、その指標に対して陽性であると特定される。

【0085】

このようにして特定された細胞は、その数を計数することができるともに、さらなる処理に供されることができる。例えば、或る指標に対して陽性であると特定された細胞を、別の指標に対して分類することができる。これにより、より詳細な細胞の分類が可能となる。

【0086】

図９Ｃは、従来の手法による結果と、本発明の手法による結果との比較の一例を示す。図９Ｃでは、ＣＸＣＲ３のヒストグラムから、従来の手法によって上述した第１の画分（破線よりも左）に分類された細胞、従来の手法によって上述した第２の画分（破線よりも右）に分類された細胞、本発明の手法により陰性の画分に分類された細胞、および本発明の手法により陽性の画分に分類された細胞のそれぞれを、ＣＣＲ４を縦軸としＣＣＲ６を横軸とした散布図に表した結果である。

【0087】

従来の手法と本発明の手法とでは、ＣＣＲ４－ＣＣＲ６＋に該当するポピュレーションと、ＣＣＲ４強陽性に該当するポピュレーションとに違いが見られている。（１）破線よりも左と（３）陰性とでは、ＣＣＲ４－ＣＣＲ６＋を構成する成分が異なっていることがわかる。（１）のＣＣＲ４－ＣＣＲ６＋は、（４）陽性に類似している。また、（２）破線よりも右は、ＣＣＲ４強陽性をわずかに含んでいるが、（４）陽性には、ＣＣＲ４強陽性はほとんど含まれない。（１）と（３）にはＣＣＲ４強陽性が多い。

【0088】

図９Ｄは、本発明の手法によって陰性の画分と陽性の画分とに分離された細胞をさらに詳細に分けた結果を示す。図９Ｄでは、上部に示されるＣＸＣＲ３のヒストグラムから陰性の画分および陽性の画分に分けた後、陰性の画分を（１）陽性と重ならない部分（破線よりも左の陰性の画分）と、（３）陽性と重なる部分（破線よりも右の陰性の画分）とに分け、陽性の画分を（２）陰性と重なる部分（破線よりも左の陽性の画分）と（４）陰性と重ならない部分（破線よりも右の陽性の画分）に分け、それぞれを、ＣＣＲ４を縦軸としＣＣＲ６を横軸とした散布図に表した結果を示す。

【0089】

ＣＣＲ４強陽性と、ＣＣＲ４－ＣＣＲ６＋に注目すると、（１）は（３）に類似しており、（２）は（４）に類似していた。さらに、（１）と（２）とは類似しておらず、（３）と（４）とも類似していなかった。このことから、破線よりも左の画分に、陰性の細胞と陽性の細胞とが存在しており、同様に、破線よりも右側の画分にも陰性の細胞と陽性の細胞とが存在しており、単に破線で分断するだけでは適切に分離することができないところ、本発明の手法では、これらさえも適切に分離することができていることがわかる。従って、本発明の手法によって分離された細胞を、さらなる処理（例えば、別の指標での分離）に付したときに、誤差の少ない結果を得ることができる。

【0090】

上述した例では、ヒスグラムに対してピークを有する分布を当てはめることで、細胞を識別することを説明したが、本発明の手法は、ヒストグラム以外に、測定データから得られた散布図にも適用することができる。散布図においても、データの分布が見られる（例えば、プロットの数に関する等高線で表される）ため、ヒストグラムと同様に、分布を当てはめて細胞を識別することができるからである。ここで散布図は、二次元散布図であってもよいし、三次元散布図であってもよいし、それより多い次元の散布図であってもよい。

【0091】

一実施形態において、上述した手法は、特定手段１２２によって行われることができる。特定手段１２２は、第１の受信手段１２１によって受信された測定データの少なくとも一部から散布図またはヒストグラムを作成するステップと、散布図またはヒストグラムにおけるピーク数を決定するステップと、決定されたピーク数の分布を散布図またはヒストグラムに当てはめることにより、分布に対応する細胞を特定するステップとを行うことができる。このようにして、特定の細胞を１つのクラスタ（画分）にクラスタリングすることができる。特定手段１２２は、クラスタリングされた細胞に対して、細胞の属性を特定するステップをさらに行うことができる。細胞の属性は、分類するための指標に関して陰性であるか、陽性であるかを含む。陽性は、複数の段階で示されてもよく、例えば、弱陽性、強陽性等を含む。従って、特定手段１２２によって形成されるクラスタは、例えば、或る指標に対して陰性細胞のクラスタ、或る指標に対して陽性細胞のクラスタ、或る指標に対して弱陽性細胞のクラスタ、強陽性細胞のクラスタ等を含む。特定手段１２２は、１つのクラスタに分類された測定データに対して上記ステップを繰り返すことにより、より細分されたクラスタへのクラスタリングをすることができる。これにより、特定手段１２２は、細胞の種類を特定することができる。

【0092】

この実施形態において、特定手段１２２は、例えば、ユーザ入力に基づいて、ピーク数を決定するようにしてもよいし、ユーザ入力なしにピーク数を決定するようにしてもよい。

【0093】

例えば、ユーザ入力に基づいてピーク数を決定する場合、特定手段１２２は、ピーク数を入力するためのユーザインターフェースをユーザに提示し、ユーザにピーク数を入力させることができる。あるいは、特定手段１２２は、予めピーク数を推定し、推定されたピーク数を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定されたピーク数を受け入れるかどうかを入力させることができる。例えば、ユーザが推定されたピーク数を受け入れないことを入力した場合に、ピーク数を入力するためのユーザインターフェースをユーザに提示し、ユーザにピーク数を入力させるようにしてもよい。

【0094】

例えば、特定手段１２２は、測定データの少なくとも一部から作成された散布図またはヒストグラムの形状から、ピーク数を決定することができる。例えば、特定手段１２２は、機械学習モデルを用いて、ピーク数を決定することもできる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、そのピーク数との関係を学習している。

【0095】

この実施形態において、特定手段１２２は、例えば、ユーザ入力に基づいて、細胞の属性を特定するようにしてもよいし、ユーザ入力なしに（例えば、アノテーションテーブルに基づいて）細胞の属性を特定するようにしてもよい。

【0096】

例えば、ユーザ入力に基づいて細胞の属性を特定する場合、特定手段１２２は、細胞の属性を入力するためのユーザインターフェースをユーザに提示し、ユーザに細胞の属性を入力させることができる。あるいは、特定手段１２２は、予め細胞の属性を推定し、推定された細胞の属性を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定された細胞の属性を受け入れるかどうかを入力させることができる。例えば、ユーザが推定された細胞の属性を受け入れないことを入力した場合に、細胞の属性を入力するためのユーザインターフェースをユーザに提示し、ユーザに細胞の属性を入力させるようにしてもよい。

【0097】

例えば、特定手段１２２は、測定データの少なくとも一部から作成された散布図またはヒストグラムの形状から、細胞の属性を決定することができる。例えば、特定手段１２２は、機械学習モデルを用いて、細胞の属性を決定することもできる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、その細胞の属性との関係を学習している。

【0098】

上記ステップにおいて、分布は、典型的には、正規分布であり得るが、これに限定されない。分布は、数学的に定義され得る任意の分布であり得る。例えば、分布は、ユーザ入力に基づいて決定されるようにしてもよいし、ユーザ入力なしに決定されるようにしてもよいし、予め設定された分布であってもよい。ユーザ入力なしに決定されるとき、分布は、例えば、尤度関数を利用して決定され得る。分布は、ピーク数を決定する前に決定されていてもよいし、ピーク数を決定した後に決定されてもよい。

【0099】

ユーザに提示されるユーザインターフェースは、例えば、プルダウンから選択する形式のインターフェースであってもよいし、チェックボックスにチェックをすることで選択する形式のインターフェースであってもよい。あるいは、ユーザに提示されるユーザインターフェースは、ユーザがテキスト入力をする形式のインターフェース（例えば、チャットのような対話型のインターフェース）であってもよい。

【0100】

導出手段１２３は、特定手段１２２によって特定された細胞の種類に基づいて、複数の細胞中での各細胞の比率を導出するように構成されている。導出手段１２３は、例えば、特定された細胞の種類に基づいて、複数の細胞の１つ１つを計数することによって、各細胞の比率を導出することができる。導出手段１２３は、例えば、複数のクラスタのそれぞれについて、そのクラスタに属する細胞の数を計数することによって、各クラスタの細胞数の比率、ひいては、各細胞の比率を導出することができる。

【0101】

出力手段１２４は、導出手段１２３によって導出された比率を細胞集団同定システム１２０の外部に出力するように構成されている。出力手段１２４は、任意の態様で、導出された比率を細胞集団同定システム１２０の外部に出力することができる。出力手段１２４は、例えば、相関解析システム１００の生成手段１３０へ、導出された比率を出力することができる。

【0102】

図４Ｂは、一実施形態における細胞集団同定システム１２０’の構成の一例を示す。細胞集団同定システム１２０’は、細胞集団同定システム１２０の代替実施形態である。細胞集団同定システム１２０’は、第２の受信手段１２５を備える点を除いて、細胞集団同定システム１２０と同様の構成を有する。ここでは、細胞集団同定システム１２０と同様の構成については同様の参照番号を付し、詳細な説明は省略する。

【0103】

細胞集団同定システム１２０’は、第１の受信手段１２１と、第２の受信手段１２５と、特定手段１２２と、導出手段１２３と、出力手段１２４とを備える。

【0104】

第２の受信手段１２５は、細胞集団同定システム１２０’が通信するデータベース部２００（図２を参照）に記憶され得る複数のアノテーションテーブルのうちの少なくとも１つのアノテーションテーブルを選択する入力を受信するように構成されている。第２の受信手段１２５は、例えば、細胞集団同定システム１２０’または相関解析システム１００と通信するユーザ端末装置３００から入力を受信することができる。これにより、ユーザ端末装置３００のユーザは、解析に利用することを希望するアノテーションテーブルを選択することができるようになる。例えば、ユーザが最新の定義を有するアノテーションテーブルを用いた解析を希望する場合、ユーザは、最新の定義を有するアノテーションテーブルを選択する入力をユーザ装置３００に提供し、第２の受信手段１２５は、これを受信することができる。例えば、ユーザが、過去の古い定義を有するアノテーションテーブルを用いた解析を希望する場合、ユーザは、古い定義を有するアノテーションテーブルを選択する入力をユーザ装置３００に提供し、第２の受信手段１２５は、これを受信することができる。このような構成は、例えば、過去の解析と同じアノテーションテーブルで解析を行う必要があり、追加の新データにも過去の古い定義を適用することをユーザが希望する場合に、有用であり得る。例えば、ユーザが概括的な定義を有するアノテーションテーブルを用いた解析を希望する場合、ユーザは、概括的な定義を有するアノテーションテーブルを選択する入力をユーザ装置３００に提供し、第２の受信手段１２５は、これを受信することができる。例えば、ユーザが、詳細な定義を有するアノテーションテーブルを用いた解析を希望する場合、ユーザは、詳細な定義を有するアノテーションテーブルを選択する入力をユーザ装置３００に提供し、第２の受信手段１２５は、これを受信することができる。

【0105】

特定手段１２２は、第２の受信手段１２５によって受信された入力に基づいて、細胞集団同定システム１２０’が通信するデータベース部２００（図２を参照）からアノテーションテーブルを取り出し、取り出されたアノテーションテーブルを用いて、細胞の種類を特定することができる。

【0106】

このようにして、細胞集団同定システム１２０’は、ユーザが希望する粒度で、細胞集団を同定することができる。

【0107】

図４Ｃは、一実施形態における細胞集団同定システム１２０’’の構成の一例を示す。細胞集団同定システム１２０’’は、細胞集団同定システム１２０の代替実施形態である。細胞集団同定システム１２０’’は、第３の受信手段１２６と選択手段１２７とを備える点を除いて、細胞集団同定システム１２０と同様の構成を有する。ここでは、細胞集団同定システム１２０と同様の構成については同様の参照番号を付し、詳細な説明は省略する。

【0108】

細胞集団同定システム１２０’’は、第１の受信手段１２１と、第３の受信手段１２６と、選択手段１２７と、特定手段１２２と、導出手段１２３と、出力手段１２４とを備える。

【0109】

第３の受信手段１２６は、行うべき解析を示す入力を受信するように構成されている。第３の受信手段１２６は、例えば、細胞集団同定システム１２０’’または相関解析システム１００と通信するユーザ端末装置３００から入力を受信することができる。これにより、ユーザ端末装置３００のユーザは、行うべき解析が何であるかを細胞集団同定システム１２０’’に入力することができる。例えば、ユーザが特定の細胞と医療データとの相関解析を希望する場合、ユーザは、相関解析を示す入力をユーザ装置３００に提供し、第３の受信手段１２６は、これを受信することができる。例えば、ユーザが多変量解析を希望する場合、ユーザは、多変量解析を示す入力をユーザ装置３００に提供し、第３の受信手段１２６は、これを受信することができる。例えば、ユーザがＲＯＣ解析を希望する場合、ユーザは、ＲＯＣ解析を示す入力をユーザ装置３００に提供し、第３の受信手段１２６は、これを受信することができる。

【0110】

選択手段１２７は、行うべき解析を示す入力に基づいて、細胞集団同定システム１２０’’が通信するデータベース部２００（図２を参照）に記憶され得る複数のアノテーションテーブルから少なくとも１つのアノテーションテーブルを選択するように構成されている。例えば、選択手段１２７は、行うべき解析のために好適なアノテーションテーブルを選択することができる。選択手段１２７は、例えば、行うべき解析とアノテーションテーブルとの関係を規定するルールベースで、アノテーションテーブルを選択するようにしてもよいし、行うべき解析とアノテーションテーブルとの関係を学習した学習済モデルを用いて、アノテーションテーブルを選択するようにしてもよい。

【0111】

特定手段１２２は、選択手段１２７によって選択されたアノテーションテーブルを、細胞集団同定システム１２０’’が通信するデータベース部２００（図２を参照）から取り出し、取り出されたアノテーションテーブルを用いて、細胞の種類を特定することができる。

【0112】

このようにして、細胞集団同定システム１２０’’は、ユーザが希望する解析に応じて、細胞集団を同定することができる。

【0113】

上述した細胞集団同定システム１２０、１２０’または１２０’’は、特定手段１２２による細胞の種類の特定の結果に基づいて、アノテーションテーブルを更新する更新手段をさらに備えてもよい。更新手段は、データベース部２００（図２を参照）と通信し、データベース部２００に記憶されているアノテーションテーブルのうちの少なくとも１つを更新することができる。

【0114】

更新手段は、特定手段によって細胞の種類が特定されなかった測定データ、および／または、特定手段によって誤って細胞の種類が特定された測定データに対して、適切に細胞の種類を特定することができるように、アノテーションテーブルを更新することができる。更新手段は、ユーザまたは専門家による入力に基づいて、すなわち、マニュアルで、アノテーションテーブルを更新することができる。好ましくは、更新手段は、機械学習により、アノテーションテーブルを更新することができる。

【0115】

一例において、特定手段によって細胞の種類が特定されなかった測定データが存在したとする。その場合、更新手段は、その測定データの細胞の種類を特定することができるように、アノテーションテーブルを更新する。更新手段は、例えば、ランダムフォレスト、ｋ平均法等を用いて、細胞の種類が特定されなかった測定データの細胞の種類を特定することができる発現パターンおよび／または細胞マーカーの発現量と発現パターンとの関係を規定する基準を特定し、特定された基準を含めるようにアノテーションテーブルを更新することができる。

【0116】

別の例において、特定手段によって誤って細胞の種類が特定された測定データが存在したとする。その場合、更新手段は、その測定データの細胞の種類を正しく特定することができるように、アノテーションテーブルを更新する。更新手段は、例えば、ランダムフォレスト、ｋ平均法等を用いて、誤って細胞の種類が特定された測定データの細胞の種類を正しく特定することができる発現パターンおよび／または細胞マーカーの発現量と発現パターンとの関係を規定する基準を特定し、特定された基準を含めるようにアノテーションテーブルを更新することができる。上述した機械学習のアルゴリズムは一例であり、他の任意のアルゴリズムを用いた機械学習を利用することができる。

【0117】

上述した細胞集団同定システム１２０、１２０’または１２０’’では、細胞の比率を導出して出力するものとして説明したが、細胞集団同定システム１２０、１２０’または１２０’’は、細胞の種類を特定して出力するものであってもよい。すなわち、そのような細胞集団同定システム１２０、１２０’または１２０’’では、導出手段１２３が省略されることができる。出力手段１２４は、特定された細胞の種類を出力することになる。細胞集団同定システム１２０、１２０’または１２０’’によって出力される細胞の種類は、例えば、診断やスクリーニングのための指標として利用されることができる。

【0118】

再び図３を参照して、生成手段１３０は、受信手段１１０によって受信された医療データと、細胞集団同定システム１２０によって出力された細胞の比率とを突合することにより、複合データを生成するように構成されている。生成手段１３０は、同一の被験体からの医療データと細胞の比率とを突合することにより、同一の被験体についての複合データを生成することができる。これにより、解析手段１４０が、同一の被験体に関する解析を行うことができるようになる。複合データは、任意の形式であり得る。

【0119】

生成手段１３０は、例えば、過去の医療データ、過去の測定データから同定された細胞の比率、または、過去の複合データと現在の複合データとを合わせた時系列データを生成することも可能である。生成手段１３０は、例えば、過去に生成され、記憶手段（例えば、データベース部２００（図２）または６００（図５を参照して後述））に記憶されている複合データと、新たに作成された複合データとを合わせることによって時系列データを生成することができる。あるいは、生成手段１３０は、記憶手段（例えば、データベース部２００（図２）または６００（図５））に記憶されている過去の医療データおよび測定データから複合データを生成し、現在の医療データおよび測定データから複合データを生成し、これらを合わせることによって時系列データを生成することができる。記憶手段に記憶されている過去の医療データおよび測定データは、ハッシュ値と共に記憶され、これにより、記憶されたデータの同一性が担保され得る。

【0120】

生成手段１３０によって生成されたデータは、解析のために解析手段１４０に渡される。

【0121】

解析手段１４０は、複合データの解析を行うように構成されている。解析手段１４０は、公知の手法を用いて、複合データに対して任意の解析を行うことができる。解析は、例えば、医療データと細胞比率との相関解析、ＲＯＣ解析、多変量解析などを含むがこれらに限定されない。

【0122】

解析手段１４０による解析結果は、相関解析システム１００から出力される。解析結果は、例えば、ユーザに提供され得る。あるいは、解析結果は、例えば、データベース部２００（図２）または６００（図５）に記憶され得る。

【0123】

このように、相関解析システム１００は、測定データからの細胞の比率を自動的に出力することができ、医療データと細胞比率との複合データの生成および解析も自動的に行うことができる。これによって、従来は人間の手作業によって、作業者のノウハウに依存して時間と労力をかけて行われていた細胞のプロファイリング結果と臨床情報との解析が自動化され得る。これは、特定の疾患または症状について臨床上重要な意味を有する細胞の特定が促進される点で有用である。

【0124】

なお、上述した例では、細胞集団同定システム１２０、１２０’、１２０’’が相関解析システム１００内に含まれることを説明したが、細胞集団同定システム１２０、１２０’、１２０’’と相関解析システム１００とは別個のシステムであってもよい。

【0125】

相関解析システム１００は、例えば、後述するように、サーバ装置５００によって実装されることができる。

【0126】

図５は、一実施形態における相関解析システム１００または細胞集団同定システム１２０を実装するサーバ装置５００の構成の一例を示す。

【0127】

サーバ装置５００は、通信インターフェース部５１０と、メモリ部５２０と、プロセッサ部５３０とを備える。サーバ装置５００は、データベース部６００に接続されている。

【0128】

データベース部６００には、被験体の測定データおよび／または医療データが格納され得る。データベース部６００は、データベース部２００と同一のデータベース部であってもよいし、異なるデータベース部であってもよい。好ましくは、データベース部６００は、データベース部２００とは異なるデータベース部２００であり得る。被験体の測定データおよび／または医療データの管理と、アノテーションテーブルの管理とを別にすることで、被験体の測定データおよび／または医療データのプライバシを維持しつつ、かつ、アノテーションテーブルの機密性も維持することができる。

【0129】

通信インターフェース部５１０は、サーバ装置５００の外部と情報のやり取りを行う。サーバ装置５００のプロセッサ部５３０は、通信インターフェース部５１０を介して、サーバ装置５００の外部から情報を受信することが可能であり、サーバ装置５００の外部に情報を送信することが可能である。通信インターフェース部５１０は、任意の形式で情報のやり取りを行うことができる。例えば、ユーザの端末装置３００（図２を参照）は、通信インターフェース部５１０を介して、サーバ装置５００と通信することができる。

【0130】

相関解析システム１００の受信手段１１０は、通信インターフェース部５１０によって実装され得る。あるいは、細胞集団同定システム１２０の第１の受信手段１２１、細胞集団同定システム１２０’の第１の受信手段１２１および第２の受信手段１２５、細胞集団同定システム１２０’’の第１の受信手段１２１および第３の受信手段１２６は、通信インターフェース部５１０によって実装され得る。

【0131】

メモリ部５２０は、サーバ装置５００の処理を実行するために必要とされるプログラムやそのプログラムの実行に必要とされるデータ等を格納する。メモリ部５２０は、細胞集団を同定するための処理をプロセッサ部に行わせるためのプログラム（例えば、後述する図６、図１０Ａ～図１０Ｃのいずれかに示される処理を実現するプログラム）を格納してもよい。あるいは、メモリ部５２０は、相関解析を行うための処理をプロセッサ部に行わせるためのプログラムを格納してもよい。ここで、プログラムをどのようにしてメモリ部５２０に格納するかは問わない。例えば、プログラムは、メモリ部５２０にプリインストールされていてもよい。あるいは、プログラムは、ネットワークを経由してダウンロードされることによってメモリ部５２０にインストールされるようにしてもよい。あるいは、プログラムは、コンピュータ読み取り可能な記憶媒体に格納されていてもよい。メモリ部５２０は、任意の記憶手段によって実装され得る。

【0132】

プロセッサ部５３０は、サーバ装置５００の処理を実行し、かつ、サーバ装置５００全体の動作を制御する。プロセッサ部５３０は、メモリ部５２０に格納されているプログラムを読み出し、そのプログラムを実行する。これにより、サーバ装置５００を所望のステップを実行するシステムとして機能させることが可能である。プロセッサ部５３０は、単一のプロセッサによって実装されてもよいし、複数のプロセッサによって実装されてもよい。

【0133】

相関解析システム１００の生成手段１３０、解析手段１４０は、プロセッサ部５３０によって実装され得る。あるいは、細胞集団同定システム１２０の特定手段１２２、導出手段１２３、出力手段１２４、細胞集団同定システム１２０’’の選択手段１２７は、プロセッサ部５３０によって実装され得る。

【0134】

図５に示される例では、データベース部６００は、サーバ装置５００の外部に設けられているが、本発明はこれに限定されない。データベース部６００の少なくとも一部をサーバ装置５００の内部に設けることも可能である。このとき、データベース部６００の少なくとも一部は、メモリ５２０を実装する記憶手段と同一の記憶手段によって実装されてもよいし、メモリ部５２０を実装する記憶手段とは別の記憶手段によって実装されてもよい。いずれにせよ、データベース部６００の少なくとも一部は、サーバ装置５００のための記憶部として構成される。データベース部６００の構成は、特定のハードウェア構成に限定されない。例えば、データベース部６００は、単一のハードウェア部品で構成されてもよいし、複数のハードウェア部品で構成されてもよい。例えば、データベース部６００は、サーバ装置５００の外付けハードディスク装置として構成されてもよいし、ネットワークを介して接続されるクラウド上のストレージとして構成されてもよい。

【0135】

なお、上述したサーバ装置５００の各構成要素は、単一のハードウェア部品で構成されていてもよいし、複数のハードウェア部品で構成されていてもよい。複数のハードウェア部品で構成される場合は、各ハードウェア部品が接続される態様は問わない。各ハードウェア部品は、無線で接続されてもよいし、有線で接続されてもよい。プロセッサ部５３０をデジタル回路ではなくアナログ回路によって構成することも本発明の範囲内である。相関解析システム１００は、特定のハードウェア構成には限定されない。相関解析システム１００の構成は、その機能を実現できる限りにおいて上述したものに限定されない。

【0136】

（５．細胞集団の同定のための処理）
図６は、好ましい実施形態における細胞集団同定システム１２０による処理６００の一例を示す。なお、処理６００は、細胞集団同定システム１２０に代えて、細胞集団同定システム１２０’または細胞集団同定システム１２０’’によって実行されてもよい。

【0137】

ステップＳ６０１では、細胞集団同定システム１２０の第１の受信手段１２１が、複数の細胞についての測定データを受信する。測定データは、相関解析システム１００の受信手段１１０が受信した測定データであり得る。測定データは、被験体のサンプルを分析して得られたデータであり得る。被験体のサンプルには、複数の細胞が含まれ得る。測定データは、被験体のサンプルに含まれ得る細胞の細胞マーカーの状態を表し得る。

【0138】

第１の受信手段１２１は、受信した測定データを特定手段１２２に渡し、特定手段１２２がこれを受信する。

【0139】

ステップＳ６０２では、細胞集団同定システム１２０の特定手段１２２が、ステップＳ６０１で受信された測定データに含まれる細胞の種類を、アノテーションテーブルを用いて特定する。特定手段１２２は、例えば、アノテーションテーブルを参照し、測定データが表す細胞マーカーの状態を識別することができる。特定手段１２２は、識別された細胞マーカーの状態に基づいて、測定データに含まれる複数の細胞の１つ１つの種類を特定するようにしてもよいし、測定データに含まれる複数の細胞を複数のクラスタにクラスタリングし、複数のクラスタのそれぞれについて、そのクラスタに属する細胞の種類を特定するようにしてもよい。

【0140】

処理６００が細胞集団同定システム１２０’によって実行される場合には、ステップＳ６０２では、細胞集団同定システム１２０’の第２の受信手段１２５が、複数のアノテーションテーブルのうちの少なくとも１つのアノテーションテーブルを選択する入力を受信し、特定手段１２２は、選択されたアノテーションテーブルを用いて、細胞の種類を特定することができる。

【0141】

処理６００が細胞集団同定システム１２０’’によって実行される場合には、ステップＳ６０２では、細胞集団同定システム１２０’’の第３の受信手段１２６が、行うべき解析を示す入力を受信し、選択手段１２７が、行うべき解析を示す入力に基づいて、アノテーションテーブルを選択し、特定手段１２２は、選択されたアノテーションテーブルを用いて、細胞の種類を特定することができる。

【0142】

図１０Ａは、一実施形態において、ステップＳ６０２で特定手段１２２が、細胞の種類を特定するための処理の一例を示す。図１０Ａに示される例では、特定手段１２２が、散布図またはヒストグラムにおけるピーク数および細胞の属性を決定し、それをユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいてピーク数および細胞の属性を決定することを説明する。図１０Ａにおいて、灰色で示されるステップは、ユーザインターフェースを介してユーザに提示するか、ユーザの入力を受け付けるステップである。

【0143】

ステップＳ９０１では、特定手段１２２は、第１の受信手段１２１から測定データを受信する。

【0144】

ステップＳ９０２では、特定手段１２２は、ステップＳ９０１で受信された測定データの少なくとも一部から散布図またはヒストグラムを作成する。散布図またはヒストグラムは、解析目的に応じた任意の指標に対して作成されることができる。測定データの少なくとも一部に含まれる細胞に応じて、散布図またはヒストグラムにおける分布の形状は変わり得る。従って、分布の形状を推定する必要がある。

【0145】

ステップＳ９０３では、特定手段１２２は、分布の形状を推定するために、散布図またはヒストグラムにおけるピーク数を決定する。ステップＳ９０３では、特定手段１２２は、散布図またはヒストグラムにおけるピーク数を推定し、それをユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいてピーク数を決定することになる。

【0146】

ステップＳ９０３１では、特定手段１２２は、散布図またはヒストグラムにおけるピーク数を推定する。例えば、特定手段１２２は、機械学習モデルを用いて、ピーク数を決定することもできる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、そのピーク数との関係を学習している。

【0147】

ステップＳ９０３２では、特定手段１２２は、ステップＳ９０３１で推定されたピーク数をユーザにリコメンドするために、ユーザに提示する。特定手段１２２は、出力手段１２４を介して、ピーク数のリコメンドをユーザに提示することができる。ピーク数のリコメンドは、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、ピーク数のリコメンドは、リコメンドされるピーク数の分布を散布図またはヒストグラムに重ね合わせた図によって提示され得る。

【0148】

ステップＳ９０３３では、特定手段１２２は、ユーザがピーク数のリコメンドを受け入れるかどうかの入力を受け付ける。特定手段１２２は、推定されたピーク数を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定されたピーク数を受け入れるかどうかを入力させることができる。ユーザがリコメンドを受け入れると（すなわち、Ｙｅｓの場合）、ステップＳ９０３４に進み、特定手段１２２は、ユーザに提示したリコメンドのとおりにピーク数を決定する。ユーザがリコメンドを拒否すると（すなわち、Ｎｏの場合）、ステップ９０３５に進み、ユーザ入力に基づいてピーク数を決定することになる。

【0149】

ステップ９０３５では、特定手段１２２は、ピーク数についてのユーザ入力を受け付け、これを受信する。特定手段１２２は、ピーク数を入力するためのユーザインターフェースをユーザに提示し、ユーザにピーク数を入力させることができる。

【0150】

ステップ９０３６では、特定手段１２２は、ユーザ入力に基づいてピーク数を決定する。

【0151】

このようにして、特定手段１２２によるリコメンドまたはユーザ入力に基づいて、ピーク数が決定される。ピーク数が決定されると、決定されたピーク数の分布を散布図またはヒストグラムに当てはめる。ステップＳ９０４では、当てはめられた分布がユーザに提示される。このとき、分布は、予め設定された分布（例えば、正規分布）であってもよいし、別途のユーザ入力に基づいて決定される分布であってもよいし、特定手段１２２によって推定される分布であってもよい。

【0152】

図１１（ａ）は、ユーザに提示される分布の一例である。ピーク数が２と決定された場合、図１１（ａ）に示されるように、２つの正規分布が、ヒストグラムに重ね合わせて表示されることができる。

【0153】

ステップＳ９０５では、特定手段１２２は、特定された分布を有する細胞の属性を特定する。ステップＳ９０５では、特定手段１２２は、特定された分布を有する細胞の属性を推定し、それをユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいて属性を決定することになる。

【0154】

ステップＳ９０５１では、特定手段１２２は、測定データおよびピーク数に基づいて、細胞の属性を推定する。例えば、特定手段１２２は、アノテーションテーブルに基づいて、細胞の属性を推定することができる。例えば、特定手段１２２は、機械学習モデルを用いて、細胞の属性を決定することもできる。このとき、機械学習モデルは、測定データおよびピーク数と、細胞の属性との関係を学習している。

【0155】

ステップＳ９０５２では、特定手段１２２は、ステップＳ９０５１で推定された細胞の属性をユーザにリコメンドするために、ユーザに提示する。特定手段１２２は、出力手段１２４を介して、細胞の属性のリコメンドをユーザに提示することができる。細胞の属性は、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、細胞の属性は、リコメンドされる細胞の属性を図１１（ａ）に示されるような分布に重ね合わせた図によって提示され得る。

【0156】

ステップＳ９０５３では、特定手段１２２は、ユーザが細胞の属性のリコメンドを受け入れるかどうかの入力を受け付ける。特定手段１２２は、推定された細胞の属性を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定された細胞の属性を受け入れるかどうかを入力させることができる。ユーザがリコメンドを受け入れると（すなわち、Ｙｅｓの場合）、ステップＳ９０５４に進み、特定手段１２２は、ユーザに提示したリコメンドのとおりに細胞の属性を決定する。ユーザがリコメンドを拒否すると（すなわち、Ｎｏの場合）、ステップ９０５５に進み、ユーザ入力に基づいて細胞の属性を決定することになる。

【0157】

ステップ９０５５では、特定手段１２２は、細胞の属性についてのユーザ入力を受け付け、これを受信する。特定手段１２２は、細胞の属性を入力するためのユーザインターフェースをユーザに提示し、ユーザに細胞の属性を入力させることができる。

【0158】

ステップ９０５６では、特定手段１２２は、ユーザ入力に基づいて細胞の属性を決定する。

【0159】

このようにして、特定手段１２２によるリコメンドまたはユーザ入力に基づいて、細胞の属性が決定される。細胞の属性が決定されると、結果が出力されることになる。ステップＳ９０６では、結果がユーザに提示される。結果は、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、結果は、決定された細胞の属性を図１１（ｂ）に示されるようにヒストグラムに重ね合わせた図によって提示され得る。

【0160】

例えば、一連の処理が終わった後に、結果が適切ではないとユーザが感じたとき、ユーザは、ステップ９０３５に戻ってピーク数を変更し、処理をやり直すことができる。例えば、ステップＳ９０３５でピーク数を２と入力していたが、処理の結果を見ると、陰性・陽性では説明できない追加の分布も見られそうだと判断した場合、ステップ９０３５に戻ってピーク数を３またはそれより多い数に変更して再度処理を行うことができる。このようにして。適切なピーク数および属性を探索することができる。

【0161】

ステップＳ９０１～ステップ９０５によって、測定データの少なくとも一部を、例えば、陰性細胞のクラスタと、陽性細胞のクラスタとにクラスタリングすることができる。例えば、陰性細胞のクラスタに分類された測定データに対して、別の指標に関して、ステップＳ９０１～ステップＳ９０５を繰り返すことにより、さらに細分されたクラスタにクラスタリングすることができる。

【0162】

図１０Ｂは、一実施形態において、ステップＳ６０２で特定手段１２２が、細胞の種類を特定するためにゲーティングを行うための処理の別の一例を示す。図１０Ｂに示される例では、特定手段１２２が、散布図またはヒストグラムにおけるピーク数および細胞の属性を決定し、それをユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいてピーク数および細胞の属性を決定することを説明する。図１０Ａに示される例とは、細胞の属性を推定するタイミングが異なっている。図１０Ｂにおいて、灰色で示されるステップは、ユーザインターフェースを介してユーザに提示するか、ユーザの入力を受け付けるステップである。

【0163】

ステップＳ９１１では、特定手段１２２は、第１の受信手段１２１から測定データを受信する。

【0164】

ステップＳ９１２では、特定手段１２２は、ステップＳ９１１で受信された測定データの少なくとも一部から散布図またはヒストグラムを作成する。散布図またはヒストグラムは、解析目的に応じた任意の指標に対して作成されることができる。測定データの少なくとも一部に含まれる細胞に応じて、散布図またはヒストグラムにおける分布の形状は変わり得る。従って、分布の形状を推定する必要がある。

【0165】

ステップＳ９１３では、特定手段１２２は、測定データに基づいて、細胞の属性推定を推定する。例えば、特定手段１２２は、アノテーションテーブルに基づいて、細胞の属性を推定することができる。例えば、特定手段１２２は、機械学習モデルを用いて、細胞の属性を決定することもできる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、細胞の属性との関係を学習している。

【0166】

ステップＳ９１４では、特定手段１２２は、分布の形状を推定するために、散布図またはヒストグラムにおけるピーク数を決定する。ステップＳ９１４では、特定手段１２２は、散布図またはヒストグラムにおけるピーク数を推定し、それをユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいてピーク数を決定することになる。

【0167】

ステップＳ９１４１では、特定手段１２２は、散布図またはヒストグラムにおけるピーク数を推定する。例えば、特定手段１２２は、機械学習モデルを用いて、ピーク数を決定することもできる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、そのピーク数との関係を学習している。

【0168】

ステップＳ９１４２では、特定手段１２２は、ステップＳ９１４１で推定されたピーク数をユーザにリコメンドするために、ユーザに提示する。特定手段１２２は、出力手段１２４を介して、ピーク数のリコメンドをユーザに提示することができる。ピーク数のリコメンドは、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、ピーク数のリコメンドは、リコメンドされるピーク数の分布を散布図またはヒストグラムに重ね合わせた図によって提示され得る。

【0169】

ステップＳ９１４３では、特定手段１２２は、ユーザがピーク数のリコメンドを受け入れるかどうかの入力を受け付ける。特定手段１２２は、推定されたピーク数を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定されたピーク数を受け入れるかどうかを入力させることができる。ユーザがリコメンドを受け入れると（すなわち、Ｙｅｓの場合）、ステップＳ９１４４に進み、特定手段１２２は、ユーザに提示したリコメンドのとおりにピーク数を決定する。ユーザがリコメンドを拒否すると（すなわち、Ｎｏの場合）、ステップ９１４５に進み、ユーザ入力に基づいてピーク数を決定することになる。

【0170】

ステップ９１４５では、特定手段１２２は、ピーク数についてのユーザ入力を受け付け、これを受信する。特定手段１２２は、ピーク数を入力するためのユーザインターフェースをユーザに提示し、ユーザにピーク数を入力させることができる。

【0171】

ステップ９１４６では、特定手段１２２は、ユーザ入力に基づいてピーク数を決定する。

【0172】

このようにして、特定手段１２２によるリコメンドまたはユーザ入力に基づいて、ピーク数が決定される。ピーク数が決定されると、決定されたピーク数の分布を散布図またはヒストグラムに当てはめる。ステップＳ９１５では、特定された分布がユーザに提示される。図１１（ａ）に示されるように、当てはめられた分布がユーザに提示される。このとき、分布は、予め設定された分布（例えば、正規分布）であってもよいし、別途のユーザ入力に基づいて決定される分布であってもよいし、特定手段１２２によって推定される分布であってもよい。

【0173】

ステップＳ９１６では、特定手段１２２は、特定された分布を有する細胞の属性を特定する。ステップＳ９１６では、特定手段１２２は、ステップＳ９１３で推定された細胞の属性をユーザに提示し、ユーザが受け入れない場合に、ユーザ入力に基づいて属性を決定することになる。

【0174】

ステップＳ９１６１では、特定手段１２２は、ステップＳ９１３で推定された細胞の属性をユーザにリコメンドするために、ユーザに提示する。特定手段１２２は、出力手段１２４を介して、細胞の属性のリコメンドをユーザに提示することができる。細胞の属性は、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、細胞の属性は、リコメンドされる細胞の属性を図１１（ａ）に示されるような分布に重ね合わせた図によって提示され得る。

【0175】

ステップＳ９１６２では、特定手段１２２は、ユーザが細胞の属性のリコメンドを受け入れるかどうかの入力を受け付ける。特定手段１２２は、推定された細胞の属性を受け入れるかどうかを入力するためのユーザインターフェースをユーザに提示し、ユーザに推定された細胞の属性を受け入れるかどうかを入力させることができる。ユーザがリコメンドを受け入れると（すなわち、Ｙｅｓの場合）、ステップＳ９１６３に進み、特定手段１２２は、ユーザに提示したリコメンドのとおりに細胞の属性を決定する。ユーザがリコメンドを拒否すると（すなわち、Ｎｏの場合）、ステップ９１６４に進み、ユーザ入力に基づいて細胞の属性を決定することになる。

【0176】

ステップ９１６４では、特定手段１２２は、細胞の属性についてのユーザ入力を受け付け、これを受信する。特定手段１２２は、細胞の属性を入力するためのユーザインターフェースをユーザに提示し、ユーザに細胞の属性を入力させることができる。

【0177】

ステップ９１６５では、特定手段１２２は、ユーザ入力に基づいて細胞の属性を決定する。

【0178】

このようにして、特定手段１２２によるリコメンドまたはユーザ入力に基づいて、細胞の属性が決定される。細胞の属性が決定されると、結果が出力されることになる。ステップＳ９１７では、結果がユーザに提示される。結果は、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、結果は、決定された細胞の属性を図１１（ｂ）に示されるようにヒストグラムに重ね合わせた図によって提示され得る。

【0179】

例えば、一連の処理が終わった後に、結果が適切ではないとユーザが感じたとき、ユーザは、ステップ９１４５に戻ってピーク数を変更し、処理をやり直すことができる。例えば、ステップＳ９１４５でピーク数を２と入力していたが、処理の結果を見ると、陰性・陽性では説明できない追加の分布も見られそうだと判断した場合、ステップ９１４５に戻ってピーク数を３またはそれより多い数に変更して再度処理を行うことができる。このようにして、適切なピーク数および属性を探索することができる。

【0180】

ステップＳ９１１～ステップ９１７によっても、測定データの少なくとも一部を、例えば、陰性細胞のクラスタと、陽性細胞のクラスタとにクラスタリングすることができる。例えば、陰性細胞のクラスタに分類された測定データに対して、別の指標に関して、ステップＳ９１１～ステップＳ９１７を繰り返すことにより、さらに細分されたクラスタにクラスタリングすることができる。

【0181】

図１０Ｃは、一実施形態において、ステップＳ６０２で特定手段１２２が、細胞の種類を特定するためにゲーティングを行うための処理のさらに別の一例を示す。図１０Ｃに示される例では、特定手段１２２が、ユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数および細胞の属性を決定するかどうかをユーザに委ねることを説明する。図１０Ｃにおいて、灰色で示されるステップは、ユーザインターフェースを介してユーザに提示するか、ユーザの入力を受け付けるステップである。

【0182】

ステップＳ９２１では、特定手段１２２は、第１の受信手段１２１から測定データを受信する。

【0183】

ステップＳ９２２では、特定手段１２２は、ステップＳ９２１で受信された測定データの少なくとも一部から散布図またはヒストグラムを作成する。散布図またはヒストグラムは、解析目的に応じた任意の指標に対して作成されることができる。測定データの少なくとも一部に含まれる細胞に応じて、散布図またはヒストグラムにおける分布の形状は変わり得る。従って、分布の形状を推定する必要がある。

【0184】

ステップＳ９２３では、特定手段１２２は、分布の形状を推定するために、散布図またはヒストグラムにおけるピーク数を決定する。ステップＳ９２３では、特定手段１２２は、ユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数を決定するかどうかをユーザに委ね、ユーザがユーザ入力に基づいてピーク数を決定すると判断した場合に、ユーザ入力に基づいてピーク数を決定し、そうでない場合に、推定に基づいてピーク数を決定することになる。

【0185】

ステップＳ９２３１では、特定手段１２２は、ユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数を決定するかどうかをユーザに入力させるためのユーザインターフェースをユーザに提示し、ユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数を決定するかどうかの入力を受信する。ユーザがユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数を決定しないと判断すると（すなわち、Ｎｏの場合）、ステップＳ９２３２に進み、特定手段１２２は、測定データに基づく推定によってピーク数を決定する。ユーザがユーザ入力に基づいて散布図またはヒストグラムにおけるピーク数を決定すると判断すると（すなわち、Ｙｅｓの場合）、ステップ９２３３に進み、ユーザ入力に基づいてピーク数を決定することになる。

【0186】

ステップＳ９２３２では、特定手段１２２は、測定データに基づいてピーク数を推定する。例えば、特定手段１２２は、機械学習モデルを用いて、ピーク数を決定することができる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、そのピーク数との関係を学習している。

【0187】

ステップ９２３４では、特定手段１２２は、ピーク数についてのユーザ入力を受け付け、これを受信する。特定手段１２２は、ピーク数を入力するためのユーザインターフェースをユーザに提示し、ユーザにピーク数を入力させることができる。

【0188】

ステップ９２３４では、特定手段１２２は、ユーザ入力に基づいてピーク数を決定する。

【0189】

このようにして、特定手段１２２による推定またはユーザ入力に基づいて、ピーク数が決定される。ピーク数が決定されると、決定されたピーク数の分布を散布図またはヒストグラムに当てはめる。ステップＳ９２４では、特定された分布がユーザに提示される。図１１（ａ）に示されるように、当てはめられた分布がユーザに提示される。このとき、分布は、予め設定された分布（例えば、正規分布）であってもよいし、別途のユーザ入力に基づいて決定される分布であってもよいし、特定手段１２２によって推定される分布であってもよい。

【0190】

ステップＳ９２５では、特定手段１２２は、特定された分布を有する細胞の属性を特定する。ステップＳ９２５では、ステップＳ９２３では、特定手段１２２は、ユーザ入力に基づいて細胞の属性を決定するかどうかをユーザに委ね、ユーザがユーザ入力に基づいて細胞の属性を決定すると判断した場合に、ユーザ入力に基づいて細胞の属性を決定し、そうでない場合に、推定に基づいて細胞の属性を決定することになる。

【0191】

ステップＳ９２５１では、特定手段１２２は、ユーザ入力に基づいて細胞の属性を決定するかどうかをユーザに入力させるためのユーザインターフェースをユーザに提示し、ユーザ入力に基づいて細胞の属性を決定するかどうかの入力を受信する。ユーザがユーザ入力に基づいて細胞の属性を決定しないと判断すると（すなわち、Ｎｏの場合）、ステップＳ９２５２に進み、特定手段１２２は、測定データに基づく推定によって細胞の属性を決定する。ユーザがユーザ入力に基づいて細胞の属性を決定すると判断すると（すなわち、Ｙｅｓの場合）、ステップ９２５３に進み、ユーザ入力に基づいて細胞の属性を決定することになる。

【0192】

ステップＳ９２５２では、特定手段１２２は、測定データに基づいて細胞の属性を推定する。例えば、特定手段１２２は、機械学習モデルを用いて、細胞の属性を決定することができる。このとき、機械学習モデルは、散布図またはヒストグラムの形状と、細胞の属性との関係を学習している。あるいは、特定手段１２２は、測定データと、決定されたピーク数とに基づいて細胞の属性を推定することもできる。

【0193】

ステップ９２５３では、特定手段１２２は、細胞の属性についてのユーザ入力を受け付け、これを受信する。特定手段１２２は、細胞の属性を入力するためのユーザインターフェースをユーザに提示し、ユーザに細胞の属性を入力させることができる。

【0194】

ステップ９２５４では、特定手段１２２は、ユーザ入力に基づいて細胞の属性を決定する。

【0195】

このようにして、特定手段１２２による推定またはユーザ入力に基づいて、細胞の属性が決定される。細胞の属性が決定されると、結果が出力されることになる。ステップＳ９２６では、結果がユーザに提示される。結果は、例えば、テキスト形式であってもよいし、グラフィカル形式であってもよい。より好ましくは、結果は、決定された細胞の属性を図１１（ｂ）に示されるようにヒストグラムに重ね合わせた図によって提示され得る。

【0196】

例えば、一連の処理が終わった後に、結果が適切ではないとユーザが感じたとき、ユーザは、ステップ９２３３に戻ってピーク数を変更し、処理をやり直すことができる。例えば、ステップＳ９２３３でピーク数を２と入力していたが、処理の結果を見ると、陰性・陽性では説明できない追加の分布も見られそうだと判断した場合、ステップ９２３３に戻ってピーク数を３またはそれより多い数に変更して再度処理を行うことができる。このようにして。適切なピーク数および属性を探索することができる。

【0197】

ステップＳ９２１～ステップ９２６によっても、測定データの少なくとも一部を、例えば、陰性細胞のクラスタと、陽性細胞のクラスタとにクラスタリングすることができる。例えば、陰性細胞のクラスタに分類された測定データに対して、別の指標に関して、ステップＳ９２１～ステップＳ９２６を繰り返すことにより、さらに細分されたクラスタにクラスタリングすることができる。

【0198】

ステップＳ６０３では、細胞集団同定システム１２０の導出手段１２３が、ステップＳ６０２で特定された細胞の種類に基づいて、複数の細胞中での各細胞の比率を導出する。導出手段１２３は、例えば、特定された細胞の種類に基づいて、複数の細胞の１つ１つを計数することによって、各細胞の比率を導出することができる。導出手段１２３は、例えば、複数のクラスタのそれぞれについて、そのクラスタに属する細胞の数を計数することによって、各クラスタの細胞数の比率、ひいては、各細胞の比率を導出することができる。

【0199】

ステップＳ６０４では、細胞集団同定システム１２０の出力手段１２４が、ステップＳ６０３で導出された比率を出力する。出力手段１２４は、任意の態様で、導出された比率を細胞集団同定システム１２０の外部に出力することができる。出力手段１２４は、例えば、相関解析システム１００の生成手段１３０へ、導出された比率を出力することができる。

【0200】

処理６００の後、相関解析システム１００が、出力された細胞の比率を用いた解析を行うことができる。

【0201】

この解析では、まず、相関解析システム１００の受信手段１１０が、医療データを受信する。受信された医療データは、生成手段１３０に渡され、生成手段１３０がこれを受信する。

【0202】

次いで、生成手段１３０が、受信手段１１０によって受信された医療データと、処理６００によって出力された細胞の比率とを突合することにより、複合データを生成する。生成手段１３０は、同一の被験体からの医療データと細胞の比率とを突合することにより、同一の被験体についての複合データを生成することができる。これにより、解析手段１４０が、同一の被験体に関する解析を行うことができるようになる。

【0203】

次いで、解析手段１４０が、複合データの解析を行う。解析は、例えば、医療データと細胞比率との相関解析、ＲＯＣ解析、多変量解析などを含むがこれらに限定されない。

【0204】

このようにして、相関解析システム１００は、医療データと細胞比率との複合データの生成および解析も自動的に行うことができる。解析結果は、例えば、ユーザに提供され、あるいは、データベース部２００（図２）または６００（図５）に記憶され得る。解析結果は、例えば、特定の疾患または症状について臨床上重要な意味を有する細胞を特定するために利用され得る。

【0205】

図６を参照して上述した例では、特定の順序で各ステップが実行されることを説明したが、示される順序は一例であり、各ステップが実行される順序は、これに限定されない。論理的に可能な任意の順序で各ステップが実行されることができる。また、示されるステップに加えて、または、示されるステップに代えて、他のステップが行われることができる。

【0206】

図６を参照して上述した例では、図６に示される各ステップの処理は、細胞集団同定システム１２０を実装するサーバ装置５００のプロセッサ部５３０とメモリ部５２０に格納されたプログラムとによって実現することができる。しかしながら、本発明はこれに限定されない。図６に示される各ステップの処理のうちの少なくとも１つは、制御回路などのハードウェア構成によって実現されてもよい。

【0207】

図７は、特に好ましい実施形態における相関解析システム１００による解析に係るフローの一例を示す。

【0208】

ステップＳ７０１では、測定データが取得される。ここでは、フローサイトメータを用いた測定が行われる。フローサイトメータを用いた測定により、測定データとして、例えば、ＦＣＳデータが取得される。測定データは、相関解析システム１００に提供される。

【0209】

ステップＳ７０２では、相関解析システム１００は、測定データに含まれる複数の細胞を、複数のクラスタにクラスタリングする。相関解析システム１００は、細胞の細胞マーカーの発現量に従って、複数の細胞を複数のクラスタにクラスタリングすることができる。このとき、相関解析システム１００は、アノテーションテーブルを利用して、細胞の細胞マーカーの発現量から発現パターンを導出し、発現パターンに基づいて、複数の細胞を複数のクラスタにクラスタリングすることができる。

【0210】

クラスタリングされた細胞は、ステップＳ７０３で同定される。

【0211】

図８（ａ）は、好ましい実施形態において相関解析システム１００が利用するアノテーションテーブルの一例を図示する。

【0212】

アノテーションテーブルでは、細胞種類１、細胞種類２、細胞種類３・・・のそれぞれについて、その細胞種類を同定するための発現パターンが規定されている。例えば、アノテーションテーブルを数値で作成する場合、細胞種類１について、マーカー１が「分布（１．．３）」を有し、マーカー２が「分布（２．．６）」を有し、マーカー３が「分布（３．．８）」を有し、マーカー４が「分布（３．．９）」を有し、・・・という発現パターンが規定されている。測定データのうちの或る細胞または細胞群がこの発現パターンと同様の発現パターンを有する場合、その細胞または細胞群は、細胞種類１であると同定され得る。例えば、細胞種類２について、マーカー１が「分布（７．．１２）」を有し、マーカー２が「分布（－２．．９）」を有し、マーカー３が「分布（－１．．４）」を有し、マーカー４が「分布（１．．３０）」を有し、・・・という発現パターンが規定されている。測定データのうちの或る細胞または細胞群がこの発現パターンと同様の発現パターンを有する場合、その細胞または細胞群は、細胞種類２であると同定され得る。

【0213】

相関解析システム１００は、例えば、アノテーションテーブルに定義された発現パターンに基づいて、複数の細胞のそれぞれがどのクラスタにクラスタリングされるかを決定することができる。１つの例において、例えば、図８（ａ）に示されるアノテーションテーブルの場合、測定データをマーカー１の分布およびマーカー２の分布に関して２次元にプロットする。プロットされた測定データのうち、所定の範囲に属するデータを抽出する。例えば、マーカー１の分布（１．．３）およびマーカー２の分布（２．．６）を満たす測定データを抽出する。抽出されたデータを別の分布、例えば、マーカー３の分布およびマーカー４の分布に関して２次元にプロットし、所定の範囲、例えば、マーカー３の分布（３．．８）およびマーカー４の分布（６．．９）に属するデータをさらに抽出する。アノテーションテーブルに規定される発現パターンについて、プロットおよび抽出を繰り返すことにより、測定データを複数のクラスタにクラスタリングすることができる。そして、複数のクラスタの各々は、アノテーションテーブルに規定される発現パターンを有することになり、対応する細胞種類であることが同定され得る。上述した例では、各マーカーの数値範囲がアノテーションテーブルに規定される数値範囲に属するか否かを判定することにより、細胞種類を同定したが、別の例では、各マーカーの数値範囲とアノテーションテーブルに規定される数値範囲との類似度を算出し、類似度を統計的に評価することで、細胞種類を同定することもできる。例えば、測定データから得られた各マーカーの発現パターンと、アノテーションテーブルに規定される複数の細胞種類のそれぞれの発現パターンとの類似度を算出し、測定データに含まれる細胞が、アノテーションテーブルに規定される複数の細胞種類のうちの統計的に近い細胞種類であると同定することが可能であり、複数の細胞種類のそれぞれとどの程度近いかを統計的に数字で評価することも可能である。

【0214】

クラスタリングまたは細胞同定の結果、専門家の経験的にまたは免疫学的に不正確に分類された細胞群および／または分類されなかった細胞群が存在した場合、アノテーションテーブルを更新することができる。専門家の経験的にまたは免疫学的に不正確に分類された細胞群および／または分類されなかった細胞群は、例えば、相関解析システム１００が自動的に特定するようにしてもよい。相関解析システム１００は、例えば、測定データから得られた各マーカーの発現パターンが、アノテーションテーブルに規定される細胞種類のいずれにも当てはまらなかった場合に、その測定データに含まれる細胞群を、分類されなかった細胞群として特定することができ、または、測定データから得られた各マーカーの発現パターンと、アノテーションテーブルに規定される複数の細胞種類のそれぞれの発現パターンとの類似度が所定の閾値よりも低かった場合に、その測定データに含まれる細胞群を、専門家の経験的にまたは免疫学的に不正確に分類された細胞群として特定することができる。あるいは、専門家の経験的にまたは免疫学的に不正確に分類された細胞群および／または分類されなかった細胞群は、例えば、相関解析システム１００による結果をユーザまたは専門家が手動的に特定するようにしてもよい。アノテーションテーブルの更新は、例えば、機械学習を用いて行われることができる。

【0215】

例えば、機械学習（例えば、ランダムフォレスト）等を用いて、どの細胞にも分類されなかった細胞群を分類することができる発現パターンを特定し、特定された発現パターンを含めるようにアノテーションテーブルを更新することができる。例えば、機械学習（例えば、ランダムフォレスト）等を用いて、上記のように相関解析システム１００またはユーザもしくは専門家によって特定された不正確に分類された細胞群を正しく分類することができる発現パターンを特定し、特定された発現パターンを含めるようにアノテーションテーブルを更新することができる。

【0216】

図８（ｂ）は、更新されたアノテーションテーブルの一例を図示する。

【0217】

例えば、どの細胞にも分類されなかった細胞群が、新たな細胞種類４であり、その発現パターンが特定されると、例えば、図８（ｂ）の斜線で表されるように、アノテーションテーブルに、細胞種類４の発現パターンが含まれることになる。

【0218】

例えば、細胞種類２が不正確に分類されており、正しく分類するためのマーカー２の分布が特定されると、例えば、図８（ｂ）の灰色で表されるように、アノテーションテーブルに、細胞種類２の正しい発現パターンが含まれることになる。

【0219】

例えば、細胞種類３が不正確に分類されており、正しく分類するためのマーカー３の分布が特定されると、例えば、図８（ｂ）の点描で表されるように、アノテーションテーブルに、細胞種類３の正しい発現パターンが含まれることになる。

【0220】

このように、アノテーションテーブルを更新していくことで、相関解析システム１００のユーザが、最新の知見に基づく解析を行うことができるようになる。これに加えて、アノテーションテーブルを更新することは、新しい細胞群または新しい発現パターンの発見につながり得る。

【0221】

ステップＳ７０４では、相関解析システム１００は、同定された細胞を計数することにより、各細胞の比率を導出し、各細胞の名称および比率を示す細胞データを出力する。細胞データは、被験体毎に出力されることができる。細胞データは、例えば、ＣＳＶファイルで出力される。

【0222】

ステップＳ７０５では、医療・健康データが相関解析システム１００に提供され、相関解析システム１００は、これを受信する。医療データは、例えば、血液検査結果、カルテ情報、バイタル情報であり得、好ましくは、ＰＦＳ（無増悪生存期間）、ＯＳ（全生存期間）、被験体ＩＤを含むがこれらに限定されない。医療データは、例えば、ＣＳＶファイルで提供される。

【0223】

ステップＳ７０４で出力された細胞データと、ステップＳ７０５で受信された医療データとは、被験体ＩＤを用いて突合され、複合データが生成される。

【0224】

ステップＳ７０６では、相関解析システム１００は、生成された複合データを用いた解析を行う。

【0225】

【0226】

相関解析を行うとき、相関解析システム１００は、複合データに含まれる細胞の比率を直接利用するようにしてもよいし、複合データに含まれる細胞の比率から導出される比率（例えば、複合データに含まれる細胞の比率の回帰分析により導出される比率）を利用するようにしてもよい。

【0227】

相関解析システム１００は、例えば、複合データの次元削減解析を行うことができる。例えば相関解析システム１００は、細胞の比率と医療データとを合わせた多変量のデータに対して多変量解析（例えば、主成分分析）を行うことにより、多変量データの次元を削減することができる。これにより、特徴的な集団についての発見（例えば、Ａ細胞が多く、Ｂ細胞が少ない集団は長期生存するなど）をすることができる。

【0228】

相関解析システム１００は、例えば、複合データに含まれる或る細胞の比率とＰＦＳとからＲＯＣカーブを描くことができる。これにより、その細胞の比率に、診断能力があるかどうかを特定することができる。

【0229】

相関解析システム１００は、例えば、カプランマイヤー法による生存時間分析を行うこともできる。

【0230】

ステップＳ７０７では、相関解析システム１００による解析の結果がユーザに提供される。例えば、ユーザは、ネットワークを介して解析の結果を受信し、自身の端末装置で解析の結果をレビューすることができる。

【0231】

このようにして、相関解析システム１００による一連の処理により、ユーザは、細胞のプロファイリング結果と臨床情報との解析の結果を容易に取得することができる。

【0232】

相関解析システム１００においてはさらに、ある時点での細胞プロファイリング結果または複合データと、時間経過ごとに取得した細胞プロファイリング結果または複合データとを用いて、時間経過とともに比率が有意に変化する免疫細胞を見つけることによって、免疫モニタリングを行うこともできる。

【産業上の利用可能性】

【0233】