(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024054849
(43)【公開日】2024-04-17
(54)【発明の名称】染色キット及びそれを用いて疾患の特性決定された免疫細胞サブセットを特定するために免疫プロファイリングし且つ疾患を予測する方法
(51)【国際特許分類】
G01N 33/53 20060101AFI20240410BHJP
G01N 33/574 20060101ALI20240410BHJP
G01N 33/533 20060101ALI20240410BHJP
G16H 50/00 20180101ALI20240410BHJP
G01N 33/543 20060101ALI20240410BHJP
【FI】
G01N33/53 K
G01N33/574 Z
G01N33/533
G16H50/00
G01N33/543 597
【審査請求】有
【請求項の数】9
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023172839
(22)【出願日】2023-10-04
(31)【優先権主張番号】17/938,188
(32)【優先日】2022-10-05
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.PYTHON
(71)【出願人】
【識別番号】516199061
【氏名又は名称】フルホープ バイオメディカル カンパニー リミテッド
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ジャン-モウ・リー
(72)【発明者】
【氏名】リ-ジェン・リャオ
(72)【発明者】
【氏名】イェン-リン・チウ
(72)【発明者】
【氏名】チー-ハオ・ファン
(72)【発明者】
【氏名】カイ-ユアン・チョウ
(72)【発明者】
【氏名】ペイ-シェン・リュウ
(72)【発明者】
【氏名】チェン-ユン・リー
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA04
(57)【要約】
【課題】本発明は、疾患の特性決定された免疫細胞サブセットを特定するために、鼻咽頭癌(NPC)等の疾患を有する患者と健康対照との間で免疫細胞サブセットを包括的に比較することを目的とする。
【解決手段】T細胞、B細胞、NK細胞、単球、調節細胞、CD8、CD45、及びCTLA4に対する抗体を含む第1パターン;T細胞、B細胞、NK細胞、単球、調節細胞、樹状細胞、及びCD45に対する抗体を含む第2パターン;T細胞、B細胞、NK細胞、単球、CD8、CD45、CD45RA、CD62L、CD197、CX3CR1及びTCRαβに対する抗体を含む第3パターン;並びにB細胞、CD23、CD38、CD40、CD45及びIgMに対する抗体を含む第4パターンを含み、各パターンの抗体は蛍光色素を用いて標識されている、染色キットが提供される。疾患の特性決定された免疫細胞サブセットを特定する方法及び染色キットを用いて必要とする被験体においてNPCの尤度を予測する方法もまた提供される。
【選択図】なし
【特許請求の範囲】
【請求項1】
T細胞、B細胞、NK細胞、単球、調節細胞、CD8、CD45、及びCTLA4に対する抗体を含む第1パターン;T細胞、B細胞、NK細胞、単球、調節細胞、樹状細胞、及びCD45に対する抗体を含む第2パターン;T細胞、B細胞、NK細胞、単球、CD8、CD45、CD45RA、CD62L、CD197、CX3CR1及びTCRαβに対する抗体を含む第3パターン;並びにB細胞、CD23、CD38、CD40、CD45及びIgMに対する抗体を含む第4パターンを含み、各パターンの抗体は蛍光色素を用いて標識されている、染色キット。
【請求項2】
T細胞は、CD3、CD4、CD25、CD45RO、CCR7又はそれらのいずれかの組合せを含み;B細胞は、CD10、CD19、CD21、CD127、IgG又はそれらのいずれかの組合せを含み;NK細胞は、CD56を含み;単球は、CD14を含み;調節細胞は、PD-1、PD-L1、FoxP3又はそれらのいずれかの組合せを含み;及び樹状細胞は、CD11c、HLA-DR又はそれらの組合せを含む、請求項1に記載の染色キット。
【請求項3】
(a)それぞれ、複数の健康対照及び疾患を有する複数の患者から末梢血単核細胞(PBMC)及び/又は白血球(WBC)を取得する工程、
(b)請求項1に記載の染色キットを用いることにより、それぞれ、健康対照及び患者のPBMC及び/又はWBCを染色する工程、
(c)フローサイトメトリーを用いることにより、それぞれ、健康対照及び患者のPBMC及び/又はWBCに結合した各抗体の蛍光強度のデータ取得を行う工程、
(d)系統法を用いることにより、それぞれ、健康対照及び患者のPBMC及び/又はWBCにおける免疫細胞サブセットを特定し、免疫細胞サブセットのタイプ及びその割合に関するデータを含むデータセットを取得する工程、並びに
(e)機械学習ソフトウェアを用いることにより、データセットを評価し、疾患の特性決定された免疫細胞サブセットとして健康対照のものとは区別可能な患者の免疫細胞サブセットを取得する工程
を含む、疾患の特性決定された免疫細胞サブセットを特定する方法。
【請求項4】
工程(e)が、機械学習ソフトウェアにより行われる以下の工程:
(i)データセットのデータ前処理を行う工程、
(ii)Borutaアルゴリズムを用いることにより、前処理されたデータからの特徴選択を行い、選択された特徴として疾患の予め決定された免疫細胞サブセットを取得する工程、並びに
(ii)選択された特徴のデータを適用し、ランダムフォレスト(RF)アルゴリズム、ロジスティック回帰(LR)アルゴリズム及びサポートベクターマシン(SVM)アルゴリズムのうちの少なくとも1つにより、機械学習モデルを訓練する工程
を更に含む、請求項3に記載の方法。
【請求項5】
疾患が、がん、免疫学的疾患及び感染性疾患を含む、請求項3に記載の方法。
【請求項6】
がんが鼻咽頭癌(NPC)を含む、請求項5に記載の方法。
【請求項7】
NPCの特性決定された免疫細胞サブセットが、メモリーB細胞、単球、T細胞、ナイーブCD4αβT細胞、PD-1+CD4 T細胞、PD-L1+CD4 T細胞、PD-1+PD-L1+単球、CD4 NKTreg細胞、MHC II+CD4 T細胞及びMHC II+CD4 NKT細胞からなる群から選択される、請求項6に記載の方法。
【請求項8】
(a)請求項1に記載の染色キットを用いることにより、被験体からの末梢血単核細胞(PBMC)を染色する工程、
(b)フローサイトメトリーを用いることにより、NPCの特性決定された免疫細胞サブセットに結合した各抗体の蛍光強度のデータ取得を行い、特性決定された免疫細胞サブセットのタイプ及びその割合に関するデータを含むデータセットを取得する工程、及び
(c)機械学習ソフトウェアを用いることにより、データセットを評価し、被験体が鼻咽頭癌を有するか否かを予測する工程
を含む、必要とする被験体において鼻咽頭癌(NPC)の尤度を予測する方法であって、
NPCの特性決定された免疫細胞サブセットは、メモリーB細胞、単球、T細胞、ナイーブCD4αβT細胞、PD-1+CD4 T細胞、PD-L1+CD4 T細胞、PD-1+PD-L1+単球、CD4 NKTreg細胞、MHC II+CD4 T細胞及びMHC II+CD4 NKT細胞からなる群から選出される、方法。
【請求項9】
工程(c)が、機械学習ソフトウェアにより行われる以下の工程:
(i)特性決定された免疫細胞サブセットを有するホールドアウトセットを適用し、訓練された機械学習モデルを試験する工程、
(ii)RFアルゴリズム若しくはLRアルゴリズムから取得される予測された確率の値が第1閾値よりも大きいか、又はSVMアルゴリズムから取得される決定関数の値が第2閾値よりも大きい場合、被験体を鼻咽頭癌であると予測する工程
を更に含む、請求項8に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、染色キット及びその使用に関し、特に、染色キット、並びにそれを用いて疾患の特性決定された免疫細胞サブセットを特定する方法及び必要とする被験体において鼻咽頭癌(NPC)の尤度を予測する方法に関する。
【背景技術】
【0002】
がん発生率及び死亡に関する全体統計によれば、鼻咽頭癌(NPC)は、2020年には24番目に多い、致死性の癌であり、133,000名の新規に診断される被験体(新規に診断される被験体のうちの0.7%)及び80,000件の新規のがん死亡(新規のがん死亡のうちの0.8%)を含む。NPCは非常に致死性の高いがんではないが、NPCの早期診断は未だ困難である。NPCの診断アルゴリズムは、頚部、鼻、又は咽頭の症状から開始され、鼻咽頭画像法(磁気共鳴画像法、陽電子放出断層撮影、又はコンピューター断層撮影等)又は鼻咽頭生検を用いて確認される。しかしながら、非常に様々な症状及び咽頭陥凹における鼻咽頭画像法の死角に起因して、NPCを有する患者は、多くの場合に進行期(ステージIII又はIV)で診断される。更に、進行型NPCは、脳幹、骨髄、肝臓、及び肺への遠隔転移を有し、NPC細胞は放射線療法に対して非常に感受性ではあるが、それらの部位には化学療法及び放射線療法に関する毒性の懸念がある。したがって、進行型NPCの予後は、早期のNPCよりもはるかに悪い。
【0003】
欧州臨床腫瘍学会からの実践ガイドラインに基づけば、NPCの推奨される診断ツールは、発症後の生検と組み合わせた鼻咽頭画像法である[2]。しかしながら、ガイドライン中の調査プロジェクトの完全順守のコストが高いことにより、再発NPC被験体のうちの3分の2超が臨床において診断されない。したがって、癌専門医は、鼻咽頭画像法の感度を改善するために、深層学習、脳回ニューラルネットワーク(convolutional neural network)、及び狭帯域光観察を用いようとしている[1]。画像法技術における改善に加えて、抗エプスタイン・バーウイルス(EBV)抗体又はEBV cDNAの存在がNPCのリスクに密接に関連するが、ヒトパピローマウイルス(HPV)とは関連しない。しかしながら、約95%のヒト集団がEBVに感染しているが、感染したヒトのうちの0.01%未満がNPCを発症する。加えて、EBV感染はまた、バーキットリンパ腫、ホジキンリンパ腫、及び胃癌の発生率にも関連付けられる。したがって、抗EBV抗体及びEBV cDNAのいずれも、NPC診断を助けるか又はNPCの重要な指標であるための忠実な精度を有しない。つまり、NPC診断のための支持されるツールの開発が重要である。
【0004】
腫瘍と免疫細胞との間のクロストークは、どのようにして腫瘍細胞が免疫学的監視を逃れるかを説明する注目の話題である。それ故、組成、代謝、及びトランスクリプトームにおけるがん患者と健康対照(HC)との間での免疫プロファイルの比較は、広く研究されている。乳がん、結腸直腸がん、及び進行型肝細胞癌を有する患者に関して、それらの免疫プロファイルはHCとは異なり、がん診断における先行する指標として有望である。NPCに関して、HCと比較してEBV陽性NPCにおけるEBV抗原特異的CD8+調節T細胞の高い割合並びにCD4+T細胞、IL-17産生性CD8+T細胞、及び初期Bリンパ球の低い割合を除いて、NPCとHCとの間の免疫プロファイルの特性決定は、未だ不明である。また、NPCにおける免疫プロファイリングの変化に関する近年の研究は、単一細胞配列決定又は末梢血単核細胞(PBMC)と腫瘍浸潤性リンパ球との間での比較免疫プロファイリングを用いるトランスクリプトーム変化に焦点を当てている[2]。
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記の説明に鑑みて、本発明は、疾患の特性決定された免疫細胞サブセットを特定するために、鼻咽頭癌(NPC)等の疾患を有する患者と健康対照との間で免疫細胞サブセットを包括的に比較することを目的とする。更に、本発明は、必要とする被験体において、NPC等の疾患の尤度を予測するために、特性決定された免疫細胞サブセットを用いる。
【課題を解決するための手段】
【0006】
一態様では、本開示は、染色キットを提供する。染色キットは、T細胞、B細胞、NK細胞、単球、調節細胞、CD8、CD45、及びCTLA4に対する抗体を含む第1パターン;T細胞、B細胞、NK細胞、単球、調節細胞、樹状細胞、及びCD45に対する抗体を含む第2パターン;T細胞、B細胞、NK細胞、単球、CD8、CD45、CD45RA、CD62L、CD197、CX3CR1及びTCRαβに対する抗体を含む第3パターン;並びにB細胞、CD23、CD38、CD40、CD45及びIgMに対する抗体を含む第4パターンを含み、このとき、各パターンの抗体は蛍光色素を用いて標識されている。
【0007】
好ましくは、T細胞は、CD3、CD4、CD25、CD45RO、CCR7又はそれらのいずれかの組合せを含み;B細胞は、CD10、CD19、CD21、CD127、IgG又はそれらのいずれかの組合せを含み;NK細胞は、CD56を含み;単球は、CD14を含み;調節細胞は、PD-1、PD-L1、FoxP3又はそれらのいずれかの組合せを含み;及び樹状細胞は、CD11c、HLA-DR又はそれらの組合せを含む。
【0008】
別の態様では、本開示は、以下の工程:
(a)それぞれ、複数の健康対照及び疾患を有する複数の患者から末梢血単核細胞(PBMC)及び/又は白血球(WBC)を取得する工程、
(b)染色キットを用いることにより、それぞれ、健康対照及び患者のPBMC及び/又はWBCを染色する工程であって、
染色キットは、T細胞、B細胞、NK細胞、単球、調節細胞、CD8、CD45、及びCTLA4に対する抗体を含む第1パターン;T細胞、B細胞、NK細胞、単球、調節細胞、樹状細胞、及びCD45に対する抗体を含む第2パターン;T細胞、B細胞、NK細胞、単球、CD8、CD45、CD45RA、CD62L、CD197、CX3CR1及びTCRαβに対する抗体を含む第3パターン;並びにB細胞、CD23、CD38、CD40、CD45及びIgMに対する抗体を含む第4パターンを含み、各パターンの抗体は蛍光色素を用いて標識されている、工程、
(c)フローサイトメトリーを用いることにより、それぞれ、健康対照及び患者のPBMC及び/又はWBCに結合した各抗体の蛍光強度のデータ取得を行う工程、
(d)系統法を用いることにより、それぞれ、健康対照及び患者のPBMC及び/又はWBCにおける免疫細胞サブセットを特定し、免疫細胞サブセットのタイプ及びその割合に関するデータを含むデータセットを取得する工程、並びに
(e)機械学習ソフトウェアを用いることにより、データセットを評価し、疾患の特性決定された免疫細胞サブセットとして健康対照のものとは区別可能な患者の免疫細胞サブセットのタイプを取得する工程
を含む、疾患の特性決定された免疫細胞サブセットを特定する方法を提供する。
【0009】
更なる別の態様では、工程(e)は、機械学習ソフトウェアにより、以下の工程:
(i)データセットのデータ前処理を行う工程、
(ii)Borutaアルゴリズムを用いることにより、前処理されたデータからの特徴選択を行い、選択された特徴として疾患の予め決定された免疫細胞サブセットを取得する工程、並びに
(iii)選択された特徴のデータを適用し、ランダムフォレスト(RF)アルゴリズム、ロジスティック回帰(LR)アルゴリズム及びサポートベクターマシン(SVM)アルゴリズムのうちの少なくとも1つにより、機械学習モデルを訓練する工程
を行うことを更に含む。
【0010】
以下の工程:
(a)上記の染色キットを用いることにより、被験体からの末梢血単核細胞(PBMC)を染色する工程、
(b)フローサイトメトリーを用いることにより、NPCの特性決定された免疫細胞サブセットに結合した各抗体の蛍光強度のデータ取得を行い、特性決定された免疫細胞サブセットのタイプ及びその割合に関するデータを含むデータセットを取得する工程、及び
(c)機械学習ソフトウェアを用いることにより、データセットを評価し、被験体が鼻咽頭癌を有するか否かを予測する工程
を含む、必要とする被験体において鼻咽頭癌(NPC)の尤度を予測する方法であって、
NPCの特性決定された免疫細胞サブセットは、メモリーB細胞、単球、T細胞、ナイーブCD4αβT細胞、PD-1+CD4 T細胞、PD-L1+CD4 T細胞、PD-1+PD-L1+単球、CD4 NKTreg細胞、MHC II+CD4 T細胞及びMHC II+CD4 NKT細胞からなる群から選出される。
【0011】
好ましくは、工程(c)は、機械学習ソフトウェアにより行われる以下の工程を更に含む:
(i)特性決定された免疫細胞サブセットを有するホールドアウトセットを適用し、訓練された機械学習モデルを試験する工程、
(ii)RFアルゴリズム若しくはLRアルゴリズムから取得される予測された確率の値が第1閾値よりも大きいか、又はSVMアルゴリズムから取得される決定関数の値が第2閾値よりも大きい場合、被験体を鼻咽頭癌であると予測する工程。
【0012】
したがって、本開示は、少なくとも以下の利点を提供する:
1.特許請求される発明の染色キットは、疾患の特性決定された免疫細胞サブセットを容易且つ迅速に特性決定するために適用することができる。
2.特許請求される発明の染色キットは、必要とする被験体において、NPC等の疾患の尤度を効率的に予測するために適用することができる。
3.本発明は、染色キットを、RF、LR及び/又はSVMアルゴリズム解析を用いて、フローサイトメトリー及びPythonプログラム等の機械学習ソフトウェアと組み合わせて、それにより疾患診断を支持するための強力なツールを構築することにより、新規疾患診断プラットフォームを提供する。
4.特許請求される発明の疾患を予測/診断する方法の性能は、RF、LR及び/又はSVMアルゴリズム解析を用いて、高AUC(例えば、最大0.98)、感度(例えば、最大100%)及び特異度(例えば、最大90%)に達することができる。
【図面の簡単な説明】
【0013】
【
図1】NPCの特性決定された免疫細胞サブセットを特定するフローチャートを示す図である。
【
図2a】系統法を用いて免疫細胞サブセットを取得するためのフィルトレーションプロセスを示す図である。
図2aは、パターンPT-67系統を示す。
【
図2b1】系統法を用いて免疫細胞サブセットを取得するためのフィルトレーションプロセスを示す図である。
図2bは、パターンPT-67系統を示す。
【
図2c1】系統法を用いて免疫細胞サブセットを取得するためのフィルトレーションプロセスを示す図である。
図2cは、パターンPT-67系統を示す。
【
図2d1】系統法を用いて免疫細胞サブセットを取得するためのフィルトレーションプロセスを示す図である。
図2dは、パターンPT-64系統を示す。
【
図2e1】系統法を用いて免疫細胞サブセットを取得するためのフィルトレーションプロセスを示す図である。
図2eは、パターンPT-65系統を示す。
【
図2f】系統法を用いて免疫細胞サブセットを取得するためのフィルトレーションプロセスを示す図である。
図2fは、パターンPT-66系統を示す。
【
図2g】系統法を用いて免疫細胞サブセットを取得するためのフィルトレーションプロセスを示す図である。
図2gは、パターンPT-68系統を示す。
【
図2h1】系統法を用いて免疫細胞サブセットを取得するためのフィルトレーションプロセスを示す図である。
図2hは、パターンPT-87系統を示す。
【
図2i】系統法を用いて免疫細胞サブセットを取得するためのフィルトレーションプロセスを示す図である。
図2iは、パターンPT-83系統を示す。
【
図2j】系統法を用いて免疫細胞サブセットを取得するためのフィルトレーションプロセスを示す図である。
図2jは、パターンPT-85系統を示す。
【
図2k1】系統法を用いて免疫細胞サブセットを取得するためのフィルトレーションプロセスを示す図である。
図2kは、パターンPT-86系統を示す。
【
図3A】ランダムフォレスト(RF)アルゴリズムを用いて機械学習法から獲得された訓練セットのROC結果を示す図である。
【
図3B】ロジスティック回帰(LR)アルゴリズムを用いて機械学習法から獲得された訓練セットのROC結果を示す図である。
【
図3C】サポートベクターマシン(SVM)アルゴリズムを用いて機械学習法から獲得された訓練セットのROC結果を示す図である。
【
図4A】RFアルゴリズムを用いて機械学習法から獲得された訓練セットのSHAP結果を示す図である。
【
図4B】LRアルゴリズムを用いて機械学習法から獲得された訓練セットのSHAP結果を示す図である。
【
図4C】SVMアルゴリズムを用いて機械学習法から獲得された訓練セットのSHAP結果を示す図である。
【
図5A】RFアルゴリズムを用いて機械学習法から獲得されたホールドアウトセットのROC結果を示す図である。
【
図5B】LRアルゴリズムを用いて機械学習法から獲得されたホールドアウトセットのROC結果を示す図である。
【
図5C】SVMアルゴリズムを用いて機械学習法から獲得されたホールドアウトセットのROC結果を示す図である。
【
図6A】RFアルゴリズムを用いて機械学習法から獲得されたホールドアウトセットのSHAP結果を示す図である。
【
図6B】LRアルゴリズムを用いて機械学習法から獲得されたホールドアウトセットのSHAP結果を示す図である。
【
図6C】SVMアルゴリズムを用いて機械学習法から獲得されたホールドアウトセットのSHAP結果を示す図である。
【発明を実施するための形態】
【0014】
定義
用語「健康対照」とは、本明細書中で用いる場合、研究対象である疾患を有しないが、転帰に間接的に影響する他の状態を有し得る被験体を意味する。
【0015】
用語「特性決定された免疫細胞サブセット」とは、本明細書中で用いる場合、HCでのものよりも顕著に高いか又は低い患者における免疫細胞サブセットの量等の、患者と健康対照(HC)との間での比較免疫プロファイリングを有する免疫細胞サブセットの群を意味する。
【0016】
用語「予測された確率」とは、本明細書中で用いる場合、訓練された機械学習モデルにおける各群に関する被験体の確率を意味する。
【0017】
用語「決定関数」とは、本明細書中で用いる場合、SVM分類器の分離超平面に対する被験体の距離を算出する関数を意味する。
【0018】
用語「ホールドアウトセット」とは、本明細書中で用いる場合、機械学習モデル訓練プロセスでは用いられないデータセットを意味する。
【0019】
実施形態
実施形態1:T細胞、B細胞、NK細胞、単球、調節細胞、CD8、CD45、及びCTLA4に対する抗体を含む第1パターン;T細胞、B細胞、NK細胞、単球、調節細胞、樹状細胞、及びCD45に対する抗体を含む第2パターン;T細胞、B細胞、NK細胞、単球、CD8、CD45、CD45RA、CD62L、CD197、CX3CR1及びTCRαβに対する抗体を含む第3パターン;並びにB細胞、CD23、CD38、CD40、CD45及びIgMに対する抗体を含む第4パターンを含む染色キットであって、各パターンの抗体は蛍光色素を用いて標識されている、染色キット。
【0020】
実施形態2:T細胞は、CD3、CD4、CD25、CD45RO、CCR7又はそれらのいずれかの組合せを含み;B細胞は、CD10、CD19、CD21、CD127、IgG又はそれらのいずれかの組合せを含み;NK細胞は、CD56を含み;単球は、CD14を含み;調節細胞は、PD-1、PD-L1、FoxP3又はそれらのいずれかの組合せを含み;及び樹状細胞は、CD11c、HLA-DR又はそれらの組合せを含む、実施形態1の染色キット。
【0021】
実施形態3:CD3、CD4、CD8、CD14、CD19、CD25、CD45、CD56、CTLA4、Foxp3及びPD-1に対する抗体を含む第1パターン;CD3、CD4、CD11c、CD14、CD19、CD45、CD56、HLA-DR、PD-1及びPD-L1に対する抗体を含む第2パターン;CD4、CD8、CD14、CD19、CD45、CD45RA、CD45RO、CD56、CD62L、CD197、CX3CR1及びTCRαβに対する抗体を含む第3パターン;並びにCD10、CD19、CD21、CD23、CD38、CD40、CD45、CD127、IgG及びIgMに対する抗体を含む第4パターンであって、各パターンの抗体は蛍光色素を用いて標識されている、実施形態1又は2の染色キット。
【0022】
実施形態4:第1パターンにおいて、CD3、CD4、CD8、CD14、CD25、CD45、CD56、CTLA4、Foxp3及びPD-1に対する抗体は異なる蛍光色を用いて標識され、並びにCD14及びCD19に対する抗体は同じ蛍光色を用いて標識されている、実施形態3の染色キット。
【0023】
実施形態5:第2パターンにおいて、CD3、CD4、CD11c、CD14、CD19、CD45、CD56、HLA-DR、PD-1及びPD-L1に対する抗体は異なる蛍光色を用いて標識されている、実施形態3又は4の染色キット。
【0024】
実施形態6:第3パターンにおいて、CD4、CD8、CD14、CD45、CD45RA、CD45RO、CD62L、CD197、CX3CR1及びTCRαβに対する抗体は異なる蛍光色を用いて標識され、並びにCD14、CD19及びCD56に対する抗体は同じ蛍光色を用いて標識されている、実施形態3~5のいずれか1つの染色キット。
【0025】
実施形態7:第4パターンにおいて、CD10、CD19、CD21、CD23、CD38、CD40、CD45、CD127、IgG及びIgMに対する抗体は異なる蛍光色を用いて標識されている、実施形態3~6のいずれか1つの染色キット。
【0026】
実施形態8:以下のパターン:CD3、CD4、CD8、CD14、CD19、CD25、CD45、CD56、CD69、PD-1、TCRαβ及びTCRγδに対する抗体を含む第5パターン;CD3、CD11b、CD11c、CD13、CD14、CD19、CD33、CD39、CD45、CD56、及びHLA-DRに対する抗体を含む第6パターン;CD3、CD4、CD8、CD14、CD19、CD27、CD28、CD45、CD56、PD-1、TCRαβ及びTCRγδに対する抗体を含む第7パターン;CD3、CD11b、CD14、CD16、CD19、CD45、CD56、CD64、CD66b、CD123、CD193、CD203c及びSiglec-8に対する抗体を含む第8パターン;並びにCD4、CD8、CD14、CD19、CD45、CD45RO、CD56、CX3CR1、CD197、LAG-3、TCRαβ及びTIM-3に対する抗体を含む第9パターンのうちの少なくとも1つを更に含む、実施形態3~7のいずれか1つの染色キットであって、各パターンの抗体は、蛍光色を用いて標識されている、染色キット。
【0027】
実施形態9:第5パターンにおいて、CD3、CD4、CD8、CD25、CD45、CD56、CD69、PD-1、TCRαβ及びTCRγδに対する抗体は異なる蛍光色を用いて標識され、並びにCD3、CD14及びCD19に対する抗体は同じ蛍光色を用いて標識されている、実施形態3~8のいずれか1つの染色キット。
【0028】
実施形態10:第6パターンにおいて、CD3、CD11b、CD11c、CD13、CD14、CD33、CD39、CD45、及びHLA-DRに対する抗体は異なる蛍光色を用いて標識され、並びにCD3、CD19及びCD56に対する抗体は同じ蛍光色を用いて標識されている、実施形態3~9のいずれか1つの染色キット。
【0029】
実施形態11:第7パターンにおいて、CD3、CD4、CD8、CD27、CD28、CD45、CD56、PD-1、TCRαβ及びTCRγδに対する抗体は異なる蛍光色を用いて標識され、並びにCD3、CD14及びCD19に対する抗体は同じ蛍光色を用いて標識されている、実施形態3~10のいずれか1つの染色キット。
【0030】
実施形態12:第8パターンにおいて、CD3、CD11b、CD16、CD45、CD64、CD66b、CD123、CD193、CD203c及びSiglec-8に対する抗体は異なる蛍光色を用いて標識され、並びにCD3、CD14、CD19及びCD56に対する抗体は同じ蛍光色を用いて標識されている、実施形態3~11のいずれか1つの染色キット。
【0031】
実施形態13:第9パターンにおいて、CD4、CD8、CD14、CD45、CD45RO、CX3CR1、CD197、LAG-3、TCRαβ及びTIM-3に対する抗体は異なる蛍光色を用いて標識され、並びにCD14、CD19及びCD56に対する抗体は同じ蛍光色を用いて標識されている、実施形態3~12のいずれか1つの染色キット。
【0032】
実施形態14:以下の工程:
(a)それぞれ、複数の健康対照及び疾患を有する複数の患者から末梢血単核細胞(PBMC)及び/又は白血球(WBC)を取得する工程、
(b)実施形態1~13のいずれか1つの染色キットを用いることにより、それぞれ、健康対照及び患者のPBMC及び/又はWBCを染色する工程、
(c)フローサイトメトリーを用いることにより、それぞれ、健康対照及び患者のPBMC及び/又はWBCに結合した各抗体の蛍光強度のデータ取得を行う工程、
(d)系統法を用いることにより、それぞれ、健康対照及び患者のPBMC及び/又はWBCにおける免疫細胞サブセットを特定し、免疫細胞サブセットのタイプ及びその割合に関するデータを含むデータセットを取得する工程、並びに
(e)機械学習ソフトウェアを用いることにより、データセットを評価し、疾患の特性決定された免疫細胞サブセットとして健康対照のものとは区別可能な患者の免疫細胞サブセットを取得する工程
を含む、疾患の特性決定された免疫細胞サブセットを特定する方法。
【0033】
実施形態15:工程(e)が、機械学習ソフトウェアにより行われる以下の工程:
(i)データセットのデータ前処理を行う工程、
(ii)Borutaアルゴリズムを用いることにより、前処理されたデータからの特徴選択を行い、選択された特徴として疾患の予め決定された免疫細胞サブセットを取得する工程、並びに
(iii)選択された特徴のデータを適用し、ランダムフォレスト(RF)アルゴリズム、ロジスティック回帰(LR)アルゴリズム及びサポートベクターマシン(SVM)アルゴリズムのうちの少なくとも1つにより、機械学習モデルを訓練する工程
を更に含む、実施形態14の方法。
【0034】
実施形態16:疾患が、がん、免疫学的疾患及び感染性疾患を含む、実施形態14又は15の方法。
【0035】
実施形態17:免疫学的疾患が、限定するものではないが、特発性血小板減少性紫斑病、ギラン・バレー症候群、重症筋無力症、多発性硬化症、視神経炎、川崎病、関節リウマチ、全身性エリテマトーデス、アトピー性皮膚炎、アテローム性動脈硬化症、冠動脈疾患、心筋症、反応性関節炎、クローン病、潰瘍性大腸炎、移植片対宿主病、及び1型糖尿病を含む、実施形態14~16のいずれか1つの方法。
【0036】
実施形態18:感染性疾患が、限定するものではないが、カンジダ症、カンジダ性敗血症、アスペルギルス症、連鎖球菌性肺炎、連鎖球菌皮膚・口腔咽頭状態、グラム陰性菌敗血症、結核、単核球症、インフルエンザ、呼吸器合胞体ウイルスにより引き起こされる呼吸器疾患、ヒト免疫不全ウイルス、B型肝炎、C型肝炎、マラリア、住血吸虫症、メチシリン耐性黄色ブドウ球菌、バンコマイシン耐性腸球菌、カルバペネム耐性及びカルバペネマーゼ産生性腸内細菌科、マイコバクテリア症、及びトリパノソーマ症を含む、実施形態14~16のいずれか1つの方法。
【0037】
実施形態19:がんが、限定するものではないが、脳がん、骨がん、皮膚がん、食道がん、胃がん、胆管がん、結腸直腸がん、頭頚部がん、腎臓がん、線維肉腫、粘液肉腫、脂肪肉腫、軟骨肉腫、骨肉腫、脊索腫、血管肉腫、内皮肉腫(endotheliosarcoma)、リンパ管肉腫、リンパ管内皮肉腫(lymphangioendotheliosarcoma)、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、結腸癌、膵臓がん、乳がん、卵巣癌、前立腺癌、扁平上皮細胞癌、基底細胞癌、腺癌、汗腺癌、皮脂腺癌、乳頭癌、乳頭腺癌、嚢胞腺癌、髄様癌、気管支癌、腎細胞癌、肝細胞癌、胆管癌、絨毛腫、セミノーマ、胚性癌、ウィルムス腫瘍、子宮頸がん、精巣腫瘍、肺癌、小細胞肺癌、膀胱癌、上皮癌、神経膠腫、星状細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽細胞腫、聴神経腫、乏突起膠腫、髄膜腫、黒色腫、神経芽腫、網膜芽腫、白血病、リンパ腫、多発性骨髄腫、ワルデンストレームマクログロブリン血症、骨髄異形成疾患、重鎖病、神経内分泌腫瘍及び神経鞘腫(Schwanoma)を含む、実施形態14~16のいずれか1つの方法。
【0038】
実施形態20:頭頚部がんが鼻咽頭癌(NPC)を含む、実施形態19の方法。
【0039】
実施形態21:NPCの特性決定された免疫細胞サブセットが、メモリーB細胞、単球、T細胞、ナイーブCD4αβT細胞、PD-1+CD4 T細胞、PD-L1+CD4 T細胞、PD-1+PD-L1+単球、CD4 NKTreg細胞、MHC II+CD4 T細胞及びMHC II+CD4 NKT細胞からなる群から選択される、実施形態14~20のいずれか1つの方法。
【0040】
実施形態22:以下の工程:
(a)実施形態1~13のいずれか1つの染色キットを用いることにより、被験体からの末梢血単核細胞(PBMC)を染色する工程、
(b)フローサイトメトリーを用いることにより、NPCの特性決定された免疫細胞サブセットに結合した各抗体の蛍光強度のデータ取得を行い、特性決定された免疫細胞サブセットのタイプ及びその割合に関するデータを含むデータセットを取得する工程、及び
(c)機械学習ソフトウェアを用いることにより、データセットを評価し、被験体が鼻咽頭癌を有するか否かを予測する工程
を含む、必要とする被験体において鼻咽頭癌(NPC)の尤度を予測する方法であって、
NPCの特性決定された免疫細胞サブセットは、メモリーB細胞、単球、T細胞、ナイーブCD4αβT細胞、PD-1+CD4 T細胞、PD-L1+CD4 T細胞、PD-1+PD-L1+単球、CD4 NKTreg細胞、MHC II+CD4 T細胞及びMHC II+CD4 NKT細胞からなる群から選出される、方法。
【0041】
実施形態23:工程(c)が、機械学習ソフトウェアにより行われる以下の工程:
(i)特性決定された免疫細胞サブセットを有するホールドアウトセットを適用し、訓練された機械学習モデルを試験する工程、
(ii)RFアルゴリズム若しくはLRアルゴリズムから取得される予測された確率の値が第1閾値よりも大きいか、又はSVMアルゴリズムから取得される決定関数の値が第2閾値よりも大きい場合、被験体を鼻咽頭癌であると予測する工程
を更に含む、実施形態22の方法。
【0042】
実施形態24:予測された確率の第1閾値が0.5に等しく、及び決定関数の第2閾値が0に等しい、実施形態22又は23の方法。
【実施例0043】
NPCの特性決定された免疫細胞サブセットの特定
NPCの特性決定された免疫細胞サブセットを特定するフローチャートに関して、
図1を参照されたい。その関連する工程は、以下に詳細に記載される。
【0044】
NPC及びHC
NPCに関して、含められる適格性基準:20歳超、50キログラム超、実践ガイドラインに従って新規に診断された、ヒト免疫不全ウイルス及び梅毒等の重度感染性疾患の既往歴なし、1ヵ月間以内に放射線療法、化学療法、又は自己免疫治療を受けていない。中枢神経系転移、肺線維症又は線維性肺炎、及び有害事象共通用語規準(CTCAE)レベル2以上に適合する肺水腫又は腹水を有する患者は不適合であった。HCに登録された被験体は、診断されたNPCを除いて、NPCと同じ適格性基準を有した。この治験の転帰は、NPCとHCとの間での免疫細胞サブセットの分類及び割合の比較に依存した。したがって、臨床医は、受診中に、PBMC及び顆粒球単離及び特定のために、被験体から20mLの抗凝固末梢血を採取した。本臨床試験の研究設計は、ヘルシンキ宣言、及び亞東記念病院(Far Eastern Memorial Hospital)の施設内治験審査委員会により承認された本臨床試験のプロトコール(承認コード108170-E)に従った。
【0045】
試薬及び抗体
本研究で用いられる全ての試薬及び抗体を、Table 1(表1)及びTable 2(表2)に列挙した。試薬は、Cytiva社(Marlborough、MA、USA)、Lonza社(Basel、Switzerland)、及びSigma-Aldrich社(Merck KGaA、Darmstadt、Germany)から入手した。抗体は、全てBeckman-Coulter社(Brea、CA、USA)、Biolegend社(San Diego、CA、USA)、及びThermo-Fisher社(Waltham、MA、USA)から入手した。
【0046】
【0047】
【0048】
PBMC及び顆粒球単離及び免疫染色
EDTA抗凝固末梢血(以下では白血球と省略される)を2つのアリコートに分け、一方はPBMC単離用であり、他方は顆粒球単離用であった。PBMC単離のために、PBSのアリコートと混合した白血球を、フィコールを予めロードした遠沈管にロードし、室温で30分間、930×gで遠心分離した(X-15R、Beckman-Coulter社)。PBMCをバフィーコートから回収し、PBSによって洗浄し、続いて、750×gで7分間遠心分離し、その後、染色バッファー(0.02%(w/v)アジ化ナトリウムを含む0.5%ウシ血清アルブミン/PBS)に対して再懸濁し、免疫染色を行った。
【0049】
塩化アンモニウム・カリウム(ACK)溶解法を、溶解バッファーのマニュアル中のプロトコールに基づいて、顆粒球単離において赤血球(RBC)の溶解に対して適用した。簡潔には、全血の一部を20部のACK溶解バッファーと混合し、続いて、室温で10分間穏やかに振盪した。その後、混合物を、溶解した赤血球を除去するために、400×gで5分間遠心分離した。残余の白血球(WBC)をPBSによって洗浄し、続いて免疫染色した。
【0050】
全てのPBMCを、細胞表面マーカーを用いて染色し、それらの一部を、細胞内細胞マーカーを用いて更に染色した。各パターンは、細胞染色パターンページを参照する。全ての染色手順は、暗所で維持した。全ての染色手順は、暗所で維持した。表面マーカー染色に関して、PBMCは、染色キット中の蛍光色素(Table 2(表2)及びTable 3(表3)を参照されたい)によって標識された所望の抗体と共に、4℃で10分間、直接インキュベートした。細胞内マーカー染色に関して、表面マーカー標識されたPBMCの一部を、マニュアルからの推奨プロトコールによって、Foxp3/転写因子染色バッファーセット(eBioscience(商標))を用いて、固定及び透過化した。続いて、透過化したPBMCを、CTLA4又はFoxp3を用いて室温で30分間染色した。その後、染色したPBMCを、染色バッファーを用いて洗浄し、続いて、フローサイトメーターによる分析を行った。
【0051】
【0052】
データ取得及びデータ調整
データ取得に関して、PBMCの蛍光強度をフローサイトメーター(Navios、Beckman Coulter社)により測定し、生データを、Kaluza解析ソフトウェアV1.3(Beckman Coulter社)により収集した。免疫細胞サブセットを、2マーカーセットを用いるフィルトレーション(X軸及びY軸のパラメータ)を用いる系統法により定義した。細胞サブセットの定義は、Table 4(表4)に列挙した。
図2a~
図2kに示される通り、詳細なフィルトレーションプロセスは、少なくとも82タイプの免疫細胞サブセット及びその割合に関連する生データセットを取得するように、Table 4(表4)に基づいて行った。
【0053】
【表4A】
【表4B】
【表4C】
【表4D】
【表4E】
【表4F】
【0054】
Pythonプログラムを用いる機械学習
上記の生データセットは、HC(n=34)及びNPC(n=15)被験体からなった。データ前処理は、以下の工程により行った。最初に、標的標識を、HCに関して数値0及びNPCに関して数値1へと変換した。NPC被験体のうちの1名はパターンPT-87の7個の欠測値を有したので、欠測値補完を、NPCの他の特徴の平均に基づいて適用した(PT-87)。82タイプの免疫細胞サブセットを、データ前処理後に各被験体に関して保存した。ホールドアウトセットは、34名のHC被験体から分けられた一部のHC被験体(n=20)、並びに元の15名のNPC被験体の百分位数及び平均に基づいたNPC被験体(n=10)からなった。残余のHC被験体(n=14)及び元のNPC被験体(n=15)を、訓練セットとして用いた。訓練セットにおける特徴選択は、ランダムフォレスト分類アルゴリズムに基づくラッパーベースの技術であるBorutaアルゴリズムを用いて行った。Borutaは、全ての反復における特徴重要度を決定するために、シャッフルされたシャドウ特徴及び元の特徴のZスコアを比較した。予め規定された反復後、選択された特徴としての疾患の予め決定された免疫細胞サブセットを取得し、これは、無作為に再配置された特徴よりも分類に対して顕著に関連する。本実施例の選択された特徴を、Table 5(表5)に示す。選択された特徴の訓練セットを、3種類の異なるタイプの機械学習(ML)アルゴリズムを用いてモデルを訓練するために適用した。ランダムフォレスト(RF)、ロジスティック回帰(LR)、及びサポートベクターマシン(SVM)を、HC及びNPC被験体の2つのクラスからのフローサイトメトリーデータを分類するために用いた。距離算出に対する比較的高い等級(magnitude)を有する特徴の影響を最小化するために、Min-MaxスケーリングをSVMに対して適用し、分類器が超平面を構築した場合に、全ての特徴が類似の作用を有することを確実にした。Min-Maxスケーリングは、最小特徴値を0に、及び最大特徴値を1に変換する標準化技術である。続いて、モデルの識別能力を、受信者動作特性(ROC)曲線の曲線下面積(AUC)により評価した。ROC曲線は、多くの場合、臨床分類問題におけるモデル性能を比較するために用いられる。これは、各可能性閾値に関する偽陽性率(1-特異度)に対する真陽性率(感度)の関係を示す。モデルの識別能力が良好であれば、ROC曲線はプロットの左上の角に近付く。最後に、モデルの識別能力を、台形公式を用いてROC曲線下面積を計算して、AUC結果を取得することにより定量化した。モデル性能を比較するために、訓練セットのROC曲線及びAUC結果を可視化した。プロットを、
図3A~
図3Cに示す。予測に対するそれぞれの選択された特徴の寄与を計算することによりモデルを説明するために、Shapley Additive exPlanations(SHAP)を適用した。特徴重要度の順位付け及びSHAP値を有する被験体当たりの特徴の値を可視化するために、SHAPサマリープロットを描写した。各特徴におけるデータ点の色は、高いか又は低い特徴値を表し、各データ点は1名の被験体を表す。赤色は高い特徴値を示し、青色は低い特徴値を示す。プロットのy軸は選択された特徴の特徴重要度順位付けであり、x軸はSHAP値範囲である。訓練されたモデルに従って、SHAP値がより高ければ、NPCのリスクがより高い。訓練セットのサマリープロットを、
図4A~
図4Cに示す。
【0055】
3種類の異なるMLアルゴリズム(RF、LR、及びSVM)の訓練されたモデルを試験するために、選択された特徴を含むホールドアウトセットを適用した。HC及びNPC被験体の2つのクラスからのフローサイトメトリーデータを分類するために、訓練されたモデルを用いた。
SVMに関して、データ漏出がなく、且つ分類器が超平面を構築した場合に、全ての特徴が類似の作用を有することを確実にするために、訓練プロセスから取得されるMin-Maxスケーリング範囲をホールドアウトセットに適用した。
続いて、訓練されたモデルの感度及び特異度を、ホールドアウトセットを用いて試験した。訓練されたRF及びLRモデルの予測された確率が0.5超であった場合、モデルは、被験体をNPCと予測した。訓練されたSVMモデルの決定関数が0超であった場合、モデルは、被験体をNPCと予測した。ホールドアウトセットの予測結果を、Table 6(表6)に示す。
最後に、モデルの識別能力を評価するために、ROC曲線のAUCを用いた。ROC曲線は、多くの場合、臨床分類問題におけるモデル性能を比較するために用いられる。これは、各可能性閾値に関する偽陽性率(1-特異度)に対する真陽性率(感度)の関係を示す。モデルの識別能力が良好であれば、ROC曲線はプロットの左上の角に近付く。
要約すれば、本発明は、NPC等の疾患の診断のために用いることができるだけでなく、前記機械学習により選択された10種類の免疫細胞サブセットにおけるPD-L1、PD-1及びT細胞の状態に基づいて、免疫療法に関する予測を提供することもできる。例えば、被験体には、免疫細胞のPD-L1発現の量が増加する間、治療のためにアテゾリズマブを投与することができるか;免疫細胞のPD-1発現の量が増加する間、治療のためにニボルマブ若しくはペムブロリズマブを投与することができるか;又はT細胞が減少する間、治療のためにNK、DC、サイトカイン誘導型キラー(CIK)、及びT細胞等の免疫細胞を補充することができる。
別途定義されない限り、本明細書中で用いられる全ての技術用語及び科学用語並びにいずれかの頭字語は、本発明の分野の当業者により通常理解されるのと同じ意味を有する。本明細書中に記載されるものに対して類似又は同等であるいずれかの組成物、方法、キット、及び情報を伝えるための手段を、本発明を実施するために用いることができるが、好ましい組成物、方法、キット、及び情報を伝えるための手段は、本明細書中に記載される。