IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイエル・コシューマー・ケア・アクチェンゲゼルシャフトの特許一覧

特許7518097NTRKの発癌性融合を示す候補となる徴候の識別
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-08
(45)【発行日】2024-07-17
(54)【発明の名称】NTRKの発癌性融合を示す候補となる徴候の識別
(51)【国際特許分類】
   G16B 40/20 20190101AFI20240709BHJP
   C12Q 1/02 20060101ALI20240709BHJP
   C12M 1/00 20060101ALI20240709BHJP
   G01N 33/48 20060101ALI20240709BHJP
【FI】
G16B40/20
C12Q1/02
C12M1/00 A
G01N33/48 P
G01N33/48 Z
【請求項の数】 3
(21)【出願番号】P 2021566992
(86)(22)【出願日】2020-04-28
(65)【公表番号】
(43)【公表日】2022-07-12
(86)【国際出願番号】 EP2020061665
(87)【国際公開番号】W WO2020229152
(87)【国際公開日】2020-11-19
【審査請求日】2023-01-05
(31)【優先権主張番号】19173832.7
(32)【優先日】2019-05-10
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】521491602
【氏名又は名称】バイエル・コシューマー・ケア・アクチェンゲゼルシャフト
【氏名又は名称原語表記】BAYER CONSUMER CARE AG
(74)【代理人】
【識別番号】100091487
【弁理士】
【氏名又は名称】中村 行孝
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100126099
【弁理士】
【氏名又は名称】反町 洋
(74)【代理人】
【識別番号】100124372
【弁理士】
【氏名又は名称】山ノ井 傑
(72)【発明者】
【氏名】アルント、シュミッツ
(72)【発明者】
【氏名】エレン、メティン、エルシ
(72)【発明者】
【氏名】ファイドラ、スタブロプロウ
(72)【発明者】
【氏名】ミハイル、カチャラ
(72)【発明者】
【氏名】アンッティ、カールソン
(72)【発明者】
【氏名】ミッコ、トゥキアイネン
【審査官】山田 倍司
(56)【参考文献】
【文献】国際公開第2019/084697(WO,A1)
【文献】米国特許出願公開第2005/0262031(US,A1)
【文献】米国特許出願公開第2008/0032321(US,A1)
【文献】米国特許第06754380(US,B1)
【文献】PENAULT-LLORCA, Frederique et al.,Testing algorithm for identification of patients with TRK fusion cancer,J Clin Pathol,2019年05月09日,Vol.72,p.460-467,https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6589488/pdf/jclinpath-2018-205679.pdf
【文献】COUDRAY, Nicolas et al.,Classification and Mutation Prediction from Non-Small Cell Lung Cancer Histopathology Images using Deep Learning,Nat Med.,2018年10月,Vol.24,No.10,p.1559-1567,https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9847512/pdf/nihms-1861775.pdf
【文献】HECHTMAN, Jaclyn F. et al.,Pan-Trk Immunohistochemistry Is an Efficient and Reliable Screen for the Detection of NTRK Fusions,Am J Surg Pathol,2017年11月,Vol.41,No.11,p.1547-1551,https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5636652/pdf/nihms883557.pdf
(58)【調査した分野】(Int.Cl.,DB名)
G16B 5/00-99/00
C12Q 1/02
C12M 1/00
G01N 33/48
(57)【特許請求の範囲】
【請求項1】
対象患者と関連付けられた患者データ内でNTRKの発癌性融合を示す1つ以上の候補となる徴候を識別するためのコンピュータ実装方法であって、前記方法は、
- 癌を患う対象患者の患者データを受信することであって、前記患者データは、前記対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含み、前記組織病理学的画像は、前記対象患者のヘマトキシリンおよびエオシンで染色した腫瘍組織試料の組織病理学的組織スライドからの画像であることと、
- 訓練データのセットを用いた機械学習によって訓練された予測モデルに、前記患者データを入力することであって、前記予測モデルは、NTRKの発癌性融合の1つ以上の特徴を前記患者データ内で識別するように構成されることと、
- 前記予測モデルから確率値を出力として受信することであって、前記確率値は、NTRKの発癌性融合に起因する癌を患う前記対象患者の前記確率を示すことと、
を含むコンピュータ実装方法。
【請求項2】
プロセッサと、
前記プロセッサによって実行されるとき、対象患者と関連付けられた患者データ内でNTRKの発癌性融合を示す1つ以上の候補となる徴候を識別するための動作を実行するように構成されたアプリケーションプログラムを保存するメモリと、
を含むシステムであって、前記動作は、
- 癌を患う対象患者の患者データを受信することであって、前記患者データは、前記対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含み、前記組織病理学的画像は、前記対象患者のヘマトキシリンおよびエオシンで染色した腫瘍組織試料の組織病理学的組織スライドからの画像であることと、
- 訓練データのセットを用いた機械学習によって訓練された予測モデルに、前記患者データを入力することであって、前記予測モデルは、NTRKの発癌性融合の1つ以上の特徴を前記患者データ内で識別するように構成されることと、
- 前記予測モデルから確率値を出力として受信することであって、前記確率値は、NTRKの発癌性融合に起因する癌を患う前記対象患者の確率を示すことと、
を含むシステム。
【請求項3】
対象患者と関連付けられた患者データ内でNTRKの発癌性融合を示す1つ以上の候補となる徴候を識別する動作を実行するためのプロセッサ実行可能命令を含む非一過性コンピュータ可読記憶媒体であって、前記動作は、
- 癌を患う対象患者の患者データを受信することであって、前記患者データは、前記対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含み、前記組織病理学的画像は、前記対象患者のヘマトキシリンおよびエオシンで染色した腫瘍組織試料の組織病理学的組織スライドからの画像であることと、
- 訓練データのセットを用いた機械学習によって訓練された予測モデルに、前記患者データを入力することであって、前記予測モデルは、NTRKの発癌性融合の1つ以上の特徴を前記患者データ内で識別するように構成されることと、
- 前記予測モデルから確率値を出力として受信することであって、前記確率値は、NTRKの発癌性融合に起因する癌を患う前記対象患者の前記確率を示すことと、
を含む非一過性コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、患者データ内でNTRKの発癌性融合を示す1つ以上の候補となる徴候を識別することに関する。本発明の主題は、対象患者と関連付けられた患者データから確率値を決定するためのコンピュータ実装方法、システム、および非一過性コンピュータ可読記憶媒体であり、確率値は、神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因する癌を患う対象患者の確率を示す。
【背景技術】
【0002】
トロポミオシン受容体キナーゼ(Trk)受容体ファミリーは、Trk A、BおよびC(TrkA、TrkBおよびTrkC)受容体と称する3つの膜貫通タンパク質を含み、NTRK1、NTRK2およびNTRK3遺伝子によってそれぞれコードされている。
【0003】
これらの受容体チロシンキナーゼの野生型形態は、ヒトニューロン組織に発現しており、ニューロトロフィンによる活性化によって生理機能の発達および神経系の機能の両方で必要不可欠な役割を果たしている。
【0004】
NTRK遺伝子は、他の遺伝子と同様、融合を含む改変を受けやすい。Trk融合タンパク質が恒常的な細胞増殖と細胞生存とを媒介することによって腫瘍形成を促進することは、前臨床試験によって立証されている。
【0005】
NTRKの発癌性融合は、NTRKのキナーゼドメイン含有3’領域とNTRKの遺伝子パートナーの5’領域とを並置する染色体内または染色体間の再編成から生じるものである。
【0006】
NTRKの発癌性融合は、様々な種類の先天性の癌および獲得された癌で観察される、頻度は低いが再発性の事象である(例えば、Ed S. Kheder, David S. Hong: Emerging Targeted Therapy for Tumors with NTRK Fusion Proteins, clincancerres.aacrjournals.org, 2018, DOI: 10.1158/1078-0432.CCR-18-1156の表2を参照されたい。)
【0007】
恒常的活性型の再編成されたタンパク質の選択的阻害剤である新規化合物が開発されているために、癌療法の標的として、近年、これらの遺伝子異常が明らかになってきている。過去数年にわたって、Trkファミリーメンバーを標的とする様々な阻害剤が開発されており、臨床試験で検証されてきた(例えば、Ed S. Kheder, David S. Hong: Emerging Targeted Therapy for Tumors with NTRK Fusion Proteins, clincancerres.aacrjournals.org, 2018, DOI: 10.1158/1078-0432.CCR-18-1156の表3を参照されたい)。特に、ラロトレクチニブおよびエヌトレクチニブは、効力のある、安全かつ有望なTrk阻害剤であるものとして明らかになってきている。
【発明の概要】
【0008】
これらの阻害剤の開発および治療剤としてのそれらの使用における主な問題は、それぞれの単一の腫瘍組織構造において発現率が低いことである。
【0009】
次世代シーケンシングは、NTRK遺伝子融合を検出するための正確な方法を提供するものである(M.L. Metzker: Sequencing technologies - the next generation, Nat Rev Genet. 2010, 11(1), pages 31-46)。しかしながら、患者ごとに遺伝子解析を実行するには費用がかかり、NTRKの発癌性融合の発現率が低いために非効率的である。
【0010】
免疫組織化学染色は、NTRK遺伝子のタンパク質発現を検出するための常法を提供するものである(例えば、J. F. Hechtman et al.: Pan-Trk Immunohistochemistry Is an Efficient and Reliable Screen for the Detection of NTRK Fusions, Am J Surg Pathol. 2017, 41 (11), pages 1547 - 1551; https://www.prnewswire.com/news-releases/roche-launches-first-ivd-pan-trk-immunohistochemistry-assay-300755647.html)。しかしながら、免疫組織化学染色を実行するには技術が必要とされ、タンパク質の発現と遺伝子が融合した状態との間を相関させることは容易ではない。IHC結果の解釈には、訓練され、かつ公認の医療専門家である病理学者の技術が要求される。同様の現実的問題が、FISH(蛍光in situハイブリダイゼーション)またはPCR(ポリメラーゼ連鎖反応)などの他の分子アッセイにも当てはまる。
【0011】
本発明の主題は、この問題に対処するものである。
【図面の簡単な説明】
【0012】
【発明を実施するための形態】
【0013】
第1の態様では、本発明は、対象患者と関連付けられた患者データ内でNTRKの発癌性融合を示す1つ以上の候補となる徴候を識別するためのコンピュータ実装方法であって、以下の方法を含むコンピュータ実装方法を提供する。
【0014】
- 癌を患う対象患者の患者データを受信することであって、患者データは、対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含むこと、
- 訓練データのセットを用いた機械学習によって訓練された予測モデルに、患者データを入力することであって、予測モデルは、NTRKの発癌性融合の1つ以上の特徴を患者データ内で識別するように構成されること、
- 予測モデルから確率値を出力として受信することであって、確率値は、NTRKの発癌性融合に起因する癌を患う対象患者の確率を示すこと。
【0015】
第2の態様では、本発明は、
プロセッサと、
プロセッサによって実行されるとき、対象患者と関連付けられた患者データ内でNTRKの発癌性融合を示す1つ以上の候補となる徴候を識別するための動作を実行するように構成されたアプリケーションプログラムを保存するメモリとを含み、動作が、
- 癌を患う対象患者の患者データを受信することであって、患者データは、対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含むこと、
- 訓練データのセットを用いた機械学習によって訓練された予測モデルに、患者データを入力することであって、予測モデルは、NTRKの発癌性融合の1つ以上の特徴を患者データ内で識別するように構成されること、
- 予測モデルから確率値を出力として受信することであって、確率値は、NTRKの発癌性融合に起因する癌を患う対象患者の確率を示すことを含むシステムを提供する。
【0016】
第3の態様では、本発明は、対象患者と関連付けられた患者データ内でNTRKの発癌性融合を示す1つ以上の候補となる徴候を識別する動作を実行するためのプロセッサ実行可能命令を含む非一過性コンピュータ可読記憶媒体であって、以下の動作を含む非一過性コンピュータ可読記憶媒体を提供する。
【0017】
- 癌を患う対象患者の患者データを受信することであって、患者データは、対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含むこと、
- 訓練データのセットを用いた機械学習によって訓練された予測モデルに、患者データを入力することであって、予測モデルは、NTRKの発癌性融合の1つ以上の特徴を患者データ内で識別するように構成されること、
- 予測モデルから確率値を出力として受信することであって、確率値は、NTRKの発癌性融合に起因する癌を患う対象患者の確率を示すこと。
【0018】
本発明の主題の間で区別することなく、本発明を下記で更に具体的に説明する。これに対して、以下の説明は、それらが生じる文脈にかかわらず、全ての本発明の主題に同様に適用されることが意図される。
【0019】
本発明は、予測モデルによって、対象患者と関連付けられた患者データから、神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因する癌を患う対象患者の確率を示す確率値を決定する役割を果たすものである。
【0020】
本明細書における「変異」という用語は、改変されたアミノ酸配列を有するトロポミオシン受容体キナーゼ(Trk)受容体の発現をもたらすDNA再編成、ヌクレオチドの置換、付加および/または欠失を含む任意の遺伝子改変を意味する。特に、この用語は、NTRK(NTRK1、NTRK2、NTRK3)のキナーゼドメイン含有3’領域とNTRKの遺伝子パートナーの5’領域とを並置する遺伝子改変を意味する。
【0021】
NTRK遺伝子ファミリーの融合パートナーおよび関連する癌は、例えば、Ed S. Kheder, David S. Hong: Emerging Targeted Therapy for Tumors with NTRK Fusion Proteins, clincancerres.aacrjournals.org, 2018, DOI: 10.1158/1078-0432.CCR-18-1156に見出すことができ、その内容は全体的に参考として本明細書に組み込まれている(特に表1を参照されたい)。
【0022】
NTRK1遺伝子について、大腸癌に関連する以下の遺伝子融合パートナーが記載されている。
-TPM3(トロポミオシン3)(Ardini E, et al. The TPM3-NTRK1 rearrangement is a recurring event in colorectal carcinoma and is associated with tumor sensitivity to TRKA kinase inhibition.Mol Oncol. 2014;8(8):1495-507)、
-LMNA(ラミンA/C)(Sartore-Bianchi A et al. Sensitivity to Entrectinib Associated With a Novel LMNA-NTRK1 Gene Fusion in Metastatic Colorectal Cancer. J Natl Cancer Inst. 2016;108(1))、
-TPR(転座プロモーター領域)(Lee SJ et al. NTRK1 rearrangement in colorectal cancer patients: evidence for actionable target using patient-derived tumor cell line. Oncotarget. 2015;6(36):39028-35)、
-SCYL3(SCY1様偽キナーゼ3)(Milione M., et al. Identification and characterization of a novel SCYL3-NTRK1 rearrangement in a colorectal cancer patient. Oncotarget. 2017;8(33):55353-60。
【0023】
NTRK1遺伝子について、肺癌に関連する以下の遺伝子融合パートナーが記載されている。
-CD74(Vaishnavi A, et al. Oncogenic and drug-sensitive NTRK1 rearrangements in lung cancer. Nat Med. 2013;19(11):1469-72)、
-MPRIP(ミオシンホスファターゼrho相互作用タンパク質)(Vaishnavi A, et al. Oncogenic and drug-sensitive NTRK1 rearrangements in lung cancer. Nat Med. 2013;19(11):1469-72)、
-SQSTM1(セクエストソーム1)(Farago AF, et al. Durable Clinical Response to Entrectinib in NTRK1-Rearranged Non-Small Cell Lung Cancer. J Thorac Oncol. 2015;10(12):1670-4.)。
【0024】
NTRK2遺伝子について、肺癌に関連する以下の遺伝子融合パートナーが記載されている。
-TRIM24(三要素モチーフ含有24)(Stransky N, et al., The landscape of kinase fusions in cancer. Nat Commun. 2014;5:4846)。
【0025】
NTRK1遺伝子について、多形性膠芽腫の癌に関連する以下の遺伝子融合パートナーが記載されている。
-ARHGEF2(rho/racグアニンヌクレオチド交換因子2)(Zheng Z, et al. Anchored multiplex PCR for targeted next-generation sequencing. Nat Med. 2014;20(12):1479-84.)、
-BCAN(ブレビカン)(Kim J, et al. NTRK1 fusion in glioblastoma multiforme. PLoS One. 2014;9(3):e91940.)、
-NFASC(ニューロファシン)(Frattini V, et al. The integrated landscape of driver genomic alterations in glioblastoma. Nat Genet. 2013;45(10):1141-9.)、
-TPM3(トロポミオシン3)(Wu G, et al. The genomic landscape of diffuse intrinsic pontine glioma and pediatric non-brainstem high-grade glioma. Nat Genet. 2014;46(5):444-50.)。
【0026】
NTRK3遺伝子について、多形性膠芽腫の癌に関連する以下の遺伝子融合パートナーが記載されている。
-ETV6(etsバリアント6)(Zheng Z, et al. Anchored multiplex PCR for targeted next-generation sequencing. Nat Med. 2014;20(12):1479-84.およびFrattini V., et al. The integrated landscape of driver genomic alterations in glioblastoma. Nat Genet. 2013;45(10):1141-9)。
【0027】
NTRK2遺伝子について、毛様細胞性星細胞腫の癌に関連する以下の遺伝子融合パートナーが記載されている。
-NACC2(NACCファミリーメンバー2)(Jones DT, et al. Recurrent somatic alterations of FGFR1 and NTRK2 in pilocytic astrocytoma. Nat Genet. 2013;45(8):927-32.)、
-QKI(KHドメイン含有RNA結合)(Jones DT, et al. Recurrent somatic alterations of FGFR1 and NTRK2 in pilocytic astrocytoma. Nat Genet. 2013;45(8):927-32)。
【0028】
NTRK1遺伝子について、スピゾイド黒色腫の癌に関連する以下の遺伝子融合パートナーが記載されている。
-TP53(腫瘍タンパク質P53)(Wiesner T, et al. Kinase fusions are frequent in Spitz tumours and spitzoid melanomas. Nat Commun. 2014;5:3116.)、
-LMNA(ラミンA/C)(Wiesner T, , et al. Kinase fusions are frequent in Spitz tumours and spitzoid melanomas. Nat Commun. 2014;5:3116)。
【0029】
NTRK1遺伝子について、乳頭様甲状腺癌に関連する以下の遺伝子融合パートナーが記載されている。
-TPM3(トロポミオシン3)(Bongarzone I, et al. High frequency of activation of tyrosine kinase oncogenes in human papillary thyroid carcinoma. Oncogene. 1989;4(12):1457-62))、
-TFG(TRK融合遺伝子)(Greco A, et al. The DNA rearrangement that generates the TRK-T3 oncogene involves a novel gene on chromosome 3 whose product has a potential coiled-coil domain. Mol Cell Biol. 1995;15(11):6118-27.)、
-TPR(転座プロモーター領域)(Greco A, et al., TRK-T1 is a novel oncogene formed by the fusion of TPR and TRK genes in human papillary thyroid carcinomas. Oncogene.1992;7(2):237-42.))。
【0030】
NTRK3遺伝子について、乳腺相似分泌癌に関連する以下の遺伝子融合パートナーが記載されている。
-ETV6(etsバリアント6)(Ito S, et al., Case report of Mammary Analog Secretory Carcinoma of the parotid gland. Pathol Int. 2012;62(2):149-52.、Del Castillo et al. Secretory Breast Carcinoma: A Histopathologic and Genomic Spectrum Characterized by a Joint Specific ETV6-NTRK3 Gene Fusion. Am J Surg Pathol. 2015;39(11):1458-67)。
【0031】
NTRK3遺伝子について、分泌性乳癌に関連する以下の遺伝子融合パートナーが記載されている。
-ETV6(etsバリアント6)(Tognon C., et al. Expression of the ETV6-NTRK3 gene fusion as a primary event in human secretory breast carcinoma. Cancer Cell. 2002;2(5):367-76)。
【0032】
NTRK1遺伝子について、乳児線維肉腫の癌に関連する以下の遺伝子融合パートナーが記載されている。
-LMNA(ラミンA/C)(Wong V., et al. Evaluation of a Congenital Infantile Fibrosarcoma by Comprehensive Genomic Profiling Reveals an LMNA-NTRK1 Gene Fusion Responsive to Crizotinib. J Natl Cancer Inst. 2016;108(1))。
【0033】
NTRK2遺伝子について、頭頸部扁平上皮癌に関連する以下の遺伝子融合パートナーが記載されている。
-PAN3(ポリ(A)特異的リボヌクレアーゼサブユニット)(Stransky N, et al., landscape of kinase fusions in cancer. Nat Commun. 2014;5:4846.)。
【0034】
NTRK3遺伝子について、中胚葉腎腫の癌に関連する以下の遺伝子融合パートナーが記載されている。
-ETV6(etsバリアント6)(Anderson J, et al., Expression of ETV6-NTRK in classical, cellular and mixed subtypes of congenital mesoblastic nephroma. Histopathology. 2006;48(6):748-53)。
【0035】
NTRK3遺伝子について、消化管間質性腫瘍の癌に関連する以下の遺伝子融合パートナーが記載されている。
-ETV6(etsバリアント6)(Brenca M, et al. Transcriptome sequencing identifies ETV6-NTRK3 as a gene fusion involved in GIST. J Pathol. 2016;238(4):543-9.、Shi E, et al. FGFR1 and NTRK3 actionable alterations in "Wild-Type" gastrointestinal stromal tumors. J Transl Med. 2016;14(1):339)。
【0036】
神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因する癌の確率を示す確率値は、患者データから決定する。患者データは、対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含む。
【0037】
少なくとも1つの組織病理学的画像は、生検により対象患者から取得することができる。
【0038】
本発明の好ましい実施形態では、少なくとも1つの組織病理学的画像は、対象患者の腫瘍組織の顕微鏡画像である。拡大係数は10~60の範囲であることが好ましく、20~40の範囲であることがより好ましいが、例えば「20」の拡大係数とは、腫瘍組織での0.05mmの距離が、画像内での1mmの距離に対応する(0.05mm×20=1mm)ということを意味する。
【0039】
本発明の好ましい実施形態では、少なくとも1つの組織病理学的画像は、ホールスライド画像である。
【0040】
本発明の好ましい実施形態では、少なくとも1つの組織病理学的画像は、染色した腫瘍組織試料の画像である。染色画像を生成するために、1つ以上の染料を使用することができる。好ましい染料は、ヘマトキシリンおよびエオシンである。
【0041】
本発明の好ましい実施形態では、少なくとも1つの組織病理学的画像は、染色した腫瘍組織試料の組織病理学的組織スライドからのホールスライド画像である。
【0042】
組織病理学的画像、特に、染色されたホールスライドでの顕微鏡画像を生成する方法は、科学文献およびテキストに詳細にわたって記載されており(例えば、S. K. Suvarna et al.: Bancroft's Theory and Practice of Histological Techniques, 8th Ed., Elsevier 2019, ISBN 978-0-7020-6864-5; A. F. Frangi et al.: Medical Image Computing and Computer Assisted Intervention - MICCAI 2018, 21st International Conference Granada, Spain, 2018 Proceedings, Part II, ISBN 978-030-00933-5; L.C. Junqueira et al.: Histologie, Springer 2001, ISBN: 978-354-041858-0; N. Coudray et al.: Classification and mutation prediction from non-small cell lung cancer histopathology images using deep learning, Nature Medicine, Vol. 24, 2018, pages 1559-1567を参照されたい)、その内容は全体的に参考として本明細書に組み込まれている。
【0043】
少なくとも1つの組織病理学的画像は、デジタル画像である。デジタル画像は数値表現であり、通常は二進法の2次元画像である。画像解像度が固定されているか否かによって、デジタル画像はベクター形式であってもよいし、またはラスター形式であってもよい。本発明の好ましい実施形態では、少なくとも1つの組織病理学的画像は、3つの画像チャンネルにおいてRGBカラー値を有するラスター画像である。RGBカラーモデルは、多様な方法で赤(R)、緑(G)、および青(B)を共に加えて多岐にわたる色を再現する、付加的なカラーモデルである。あるいは、少なくとも1つの組織病理学的画像は、明るさ、輝度、および色の色差値を有する色空間のピクセル(YUV)形式である。他の形式も同様に考えられる。
【0044】
好ましくは、少なくとも1つの組織病理学的画像の記録ピクセル数(ピクセル分解能)は1,000×1,000ピクセルから500,000×500,000ピクセルの範囲であり、より好ましくは、10,000×10,000ピクセルから100,000~100,000ピクセルの範囲である。画像は、方形もしくは矩形または任意の他の形状であってもよい。
【0045】
好ましい実施形態では、患者データは、2つ以上の組織病理学的画像を含む。組織病理学的画像は、例えば、異なる拡大率で取得することができる(例えば、その内容が全体的に参考として本明細書に組み込まれている国際公開第2018/156133号パンフレットを参照されたい)。
【0046】
好ましい実施形態では、少なくとも1つの組織病理学的画像は、腫瘍領域と健康な領域とにセグメント化されている。腫瘍領域には腫瘍組織が表示され、健康な領域には健康な組織が表示される。セグメント化は、訓練された畳み込みニューラルネットワークを用いて自動的に行うことが好ましい(例えば、N. Coudray: Classification and mutation prediction from non-small cell lung cancer histopathology images using deep learning, Nature Medicine Vol 24, 1560, 2018, pages 1559-1567を参照されたい)。
【0047】
予測モデルの訓練および検証に用いる組織病理学的画像の大きさに応じて、ならびに、一方では予測のため、他方では利用可能なコンピュータの処理能力のために、画像をより小さく、好ましくは重ならないタイルに分割することができる。予測モデルの訓練および検証、ならびに確率値の予測は、画像全体ではなくタイルを用いて行うことが好ましい。腫瘍領域を示す、そのようなタイルのみを用いることが好ましい。
【0048】
確率値を予測するのに使用することができる更なる患者データは、患者の身長および体重、性別、年齢、生体パラメータ(血圧、呼吸頻度および心拍数など)、腫瘍悪性度、ICD-9分類、腫瘍の酸素化、腫瘍の転移の程度、PA値のような血球数値の腫瘍指標値に関する情報、更なる症状、病歴等から組織病理学的画像が生成される組織に関する情報(例えば組織型、臓器)などの、患者の解剖学的または生理学的データである。また、テキストマイニング手法を用いて確率値を予測するために、組織病理学的画像の病理報告を使用することができる。また、TRK遺伝子配列を含まない次世代シーケンンシングの未加工のデータセットを使用して、確率値を予測することができる。
【0049】
例えば、患者データを1つ以上のデータベースから収集することができ、または本発明によるシステムに患者データをユーザが手動で入力することができる。
【0050】
患者データは、予測モデルに入力される。予測モデルは、1つ以上の機械学習アルゴリズムを使用する。機械学習アルゴリズムとは、訓練データのセットに基づいて学習することができるアルゴリズムである。機械学習アルゴリズムの実施形態を、データセット内の高度抽象化をモデル化するように設計することができる。例えば、画像認識アルゴリズムを使用して、所与の入力が複数のカテゴリーのどれに属するのかを判断することができ、回帰アルゴリズムによって、入力の与えられた数値を出力することができる。
【0051】
予測モデルは、人工ニューラルネットワークであってもよく、またはこれを含んでもよい。本発明は、少なくとも3つの層の処理要素:入力ニューロン(ノード)を有する第1の層と、少なくとも1つの出力ニューロン(ノード)を有する第Nの層と、Nが2より大きい自然数であるN-2個の内層とを含む人工ニューラルネットワークを使用することが好ましい。
【0052】
このようなネットワークでは、出力ニューロンは、NTRKの発癌性融合に起因する癌を患う対象患者の確率を示す、少なくとも1つの確率値を予測する役割を果たす。入力ニューロンは、患者データを入力値として受信する役割を果たしている。通常は、少なくとも1つの組織病理学的画像のピクセルごとに、1つの入力ニューロンが存在する。上記に列挙したような更なる患者データのために、更なる入力ニューロンが存在していてもよい。
【0053】
層の処理要素は、それらの間が所定の結合加重による所定のパターンで相互接続されている。ネットワークは、患者データ内でNTRKの発癌性融合を示す1つ以上の候補となる徴候を識別するように予め訓練されている。この訓練は、腫瘍組織の遺伝子解析などの更なる医学的調査によってNTRKの発癌性融合を示す候補となる徴候が検証されているか、または除外されている患者データを含む訓練データのセットによって行うことができる。
【0054】
処理要素の間の結合加重には、訓練されている場合、患者データ(入力)と確率値(出力)との間の相関に関する情報が含まれており、これを使用して、新たな対象患者の確率値を彼/彼女の患者データに基づいて予測することができる。
【0055】
各ネットワークノードは、先行ノードからの入力の加重和の簡単な計算を示しており、非線形出力関数を示している。ネットワークノードを組み合わせて計算することにより、入力が出力に関連付けられる。
【0056】
個々のネットワークは、特性測定ごとに展開させることができるか、または特性のグループを単一のネットワークに含めることができる。アルゴリズムの最後に、異なる次元の患者データを組み合わせることが好ましい。
【0057】
訓練によって、ネットワークが測定された出力値に近似した出力値を算出することが可能となるネットワークの重みを推定する。教師あり訓練法を用いることができ、出力データはネットワークの重みを訓練する目的で用いられる。ネットワークの重みは、小さな乱数値、または以前に部分的に訓練されたネットワークの重みによって初期化される。訓練したデータ入力をネットワークに適用し、訓練したサンプルごとに出力値を計算する。ネットワークの出力値を、測定された出力値と比較する。誤差逆伝播アルゴリズムを適用して、測定された出力と計算された出力との間の誤差を減らす方向で重み値を補正する。誤差をこれ以上減少させることができなくなるまで、または所定の予測精度に到達するまで、プロセスを繰り返す。
【0058】
データを訓練データセットと検証データセットに分けるために、交差検証法を用いることができる。訓練データセットは、ネットワークの重みの誤差逆伝播の訓練に使用される。検証データセットは、訓練されたネットワークが良好な予測をするように汎化するのを検証するために使用する。最良のネットワークの重みのセットとは、テストデータセットの出力を最適に予測するものであると見なすことができる。同様に、ノードが隠れているネットワークの数を変更し、このデータセットによって最良のパフォーマンスをするネットワークを決定することにより、隠れノードの数が最適化される。
【0059】
前方予測において、訓練されたネットワークを使用して、NTRKの発癌性融合に起因する癌を患う患者の確率を示す確率値を計算する。患者データが訓練されたネットワークに入力される。ネットワークを介してフィードフォワード計算を行い、出力特性値を予測する。予測された測定値は、特性目標値または許容値と比較することができる。本発明の方法が特性値の履歴データに基づいているため、そのような方法を用いての特性値の予測は、典型的にはしばしば予測が検証実験と全く同じ程度に精密になるような、経験的データの誤差に近い誤差を有する。
【0060】
本発明の好ましい実施形態では、予測モデルは畳み込みニューラルネットワーク(CNN)であるか、またはそれを含んでもよい。
【0061】
CNNは、ディープニューラルネットワークの分類のことであり、最も一般的には視覚イメージを分析するために適用される。CNNは、入力ニューロンを有する入力層、少なくとも1つの出力ニューロンを有する出力層、ならびに入力層と出力層の間の複数の隠れ層を含む。
【0062】
CNNの隠れ層は典型的に、畳み込み層、ReLU(正規化線形ユニット)層、すなわち活性化関数、プーリング層、全結合層、および正規化層からなる。
【0063】
CNNの入力層におけるノードは、「フィルタ」(特徴検出器)のセットに組織化され、フィルタの各セットの出力は、ネットワークの連続した層のノードに伝播される。CNNの計算には、各フィルタに畳み込み数値演算を適用して、そのフィルタの出力を生成することが含まれる。畳み込みは、元の2つの関数のうちの1つを修正したバージョンである第3の関数を生成するために2つの関数によって実行される、特化した種類の数値演算である。畳み込みネットワークの用語では、畳み込みに対して最初の関数を入力と称してもよく、一方で2番目の関数を畳み込みカーネルと称してもよい。出力は、特徴マップと称してもよい。例えば、畳み込み層への出力は、入力画像の様々な色成分を規定する、データの多次元配列であってよい。畳み込みカーネルは、パラメータの多次元配列であってよく、訓練プロセスによってパラメータをニューラルネットワークに適応させる。
【0064】
CNNの分析によって、自明でなく、好ましく用いられた(すなわち、より強く重み付けされた)データのパターンを、訓練データを分析しながら明らかにすることができる。この説明可能なAI手法は、予測モデルのパフォーマンスに信頼性を生じさせるのに有用である。
【0065】
本発明を使用して、
a)訓練された指標以外の他の指標でNTRKの融合事象を検出し(すなわち、甲状腺のデータセットについて訓練されたアルゴリズムは、肺癌のデータセットにおいて有用である)、
b)他のTRKファミリーメンバーに関するNTRKの融合事象を検出し(すなわち、NTRK1、NTRK3融合について訓練されたアルゴリズムは、NTRK2融合を予測するのにも有用である)、
c)他の融合パートナーに関するNTRKの融合事象を検出し(すなわち、LMNA-融合データセットについて訓練されたアルゴリズムは、TPM3-融合データセットにも有用である)、
d)新規の融合パートナーを発見する(すなわち、公知の融合事象について訓練されたアルゴリズムは、新しいデータセットにおける融合を予測することができ、次いで、分子アッセイによってこれがNTRKファミリーメンバーのまだ説明されていない融合パートナーに関するものであることを確認する)ことができる。
【0066】
予測モデルは、NTRKの発癌性融合に起因する癌を患う患者の確率を示す確率値を生成する。確率値は、ユーザに出力されても、および/またはデータベース内に保存されてもよい。確率値は0~1の範囲の実数であってよいが、0の確率値とは、癌がNTRKの発癌性融合に起因することが不可能であることを意味し、1の確率値とは、癌がNTRKの発癌性融合に起因することが間違いないことを意味する。確率値は、百分率で表すこともできる。
【0067】
本発明の好ましい実施形態では、確率値は所定の閾値と比較される。確率値が閾値よりも低い場合、患者がNTRKの発癌性融合に起因する癌を患う確率が低く、Trk阻害剤で患者を治療することが指示されることはない。癌の原因を判断するために、更なる調査が必要となる。確率値が閾値以上である場合、癌がNTRKの発癌性融合に起因するものと仮定することが妥当であり、Trk阻害剤で患者を治療するように指示することができる。この仮定を検証するために、更なる調査を開始することができる(例えば、腫瘍組織の遺伝子解析を実行する)。
【0068】
閾値は、0.5~0.99999999999の値、例えば0.8(80%)または0.81(81%)または0.82(82%)または0.83(83%)または0.84(84%)または0.85(85%)または0.86(86%)または0.87(87%)または0.88(88%)または0.89(89%)または0.9(90%)または0.91(91%)または0.92(92%)または0.93(93%)または0.94(94%)または0.95(95%)または0.96(96%)または0.97(97%)または0.98(98%)または0.99(99%)または他の任意の値(百分率)であってよい。
【0069】
予測モデルはまた、分類を行うことができる。少なくとも1つの組織病理学的画像は、入力データに基づいて、少なくとも2つの分類、第1の分類および第2の分類のうちの1つに割り当てられる。第1の分類には、NTRKの発癌性融合に起因する腫瘍組織を表す画像が含まれる。第2の分類には、NTRKの発癌性融合に起因する腫瘍組織を表さない画像が含まれる。この場合、確率値はそれぞれの組織病理学的画像が割り当てられる分類を表す。
【0070】
更なる態様では、本発明は、対象患者の癌を治療するための薬剤の製造におけるTrk阻害剤の使用に関し、治療されるべき対象患者は、確率値が所定の閾値以上であると判断される対象患者であり、確率値は、NTRKの発癌性融合に起因する癌を患う患者の確率を示すものであり、患者データに基づいた予測モデルによって決定される。
【0071】
更なる態様では、本発明は、対象患者の癌を治療するのに使用されるTrk阻害剤に関し、治療されるべき対象患者は、確率値が所定の閾値以上であると判断される対象患者であり、確率値は、NTRKの発癌性融合に起因する癌を患う患者の確率を示すものであり、患者データに基づいた予測モデルによって決定される。
【0072】
更なる態様では、本発明は、対象患者の癌を治療する方法に使用されるTrk阻害剤に関し、治療されるべき対象患者は、確率値が所定の閾値以上であると判断される対象患者であり、確率値は、NTRKの発癌性融合に起因する癌を患う患者の確率を示すものであり、患者データに基づいた予測モデルによって決定される。
【0073】
更なる態様では、本発明は、対象患者の癌を治療するためのTrk阻害剤の使用に関し、治療されるべき対象患者は、確率値が所定の閾値以上であると判断される対象患者であり、確率値は、NTRKの発癌性融合に起因する癌を患う患者の確率を示すものであり、患者データに基づいた予測モデルによって決定される。
【0074】
更なる態様では、本発明は、癌を治療するためのTrk阻害剤に対して好ましい反応をするように処置された対象患者を識別するための方法に関し、方法は、以下の工程を含む。
【0075】
- 対象患者の患者データを受信することであって、患者データは、対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含むこと、
- 訓練データのセットを用いた機械学習によって訓練された予測モデルに、患者データを入力することであって、予測モデルは、NTRKの発癌性融合の1つ以上の特徴を患者データ内で識別するように構成されること、
- 予測モデルから確率値を出力として受信することであって、確率値は、NTRKの発癌性融合に起因する癌を患う対象患者の確率を示すこと、
- 確率値を所定の閾値と比較することであるが、確率値が所定の閾値以上であること。
【0076】
更なる態様では、本発明は、対象患者の癌を治療する方法に関し、方法は、
- 対象患者の患者データを受信することであって、患者データは、対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含むこと、
- 訓練データのセットを用いた機械学習によって訓練された予測モデルに、患者データを入力することであって、予測モデルは、NTRKの発癌性融合の1つ以上の特徴を患者データ内で識別するように構成されること、
- 予測モデルから確率値を出力として受信することであって、確率値は、NTRKの発癌性融合に起因する癌を患う対象患者の確率を示すこと、
- 確率値を所定の閾値と比較することであるが、確率値が所定の閾値以上であること、
- 治療上有効な量のTrk阻害剤を投与することを含む。
【0077】
更なる態様では、本発明は、
- Trk阻害剤を含む薬剤と、
- 対象患者と関連付けられた患者データ内でNTRKの発癌性融合を示す1つ以上の候補となる徴候を識別する動作を実行するためのプロセッサ実行可能命令を含む非一過性コンピュータ可読記憶媒体を含むコンピュータプログラム製品を含むキットに関し、動作は、
- 癌を患う対象患者の患者データを受信することであって、患者データは、対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含むこと、
- 訓練データのセットを用いた機械学習によって訓練された予測モデルに、患者データを入力することであって、予測モデルは、NTRKの発癌性融合の1つ以上の特徴を患者データ内で識別するように構成されること、
- 予測モデルから確率値を出力として受信することであって、確率値は、NTRKの発癌性融合に起因する癌を患う対象患者の確率を示すこと、
- 確率値を所定の閾値と比較することであるが、確率値が所定の閾値以上であることを含む。
【0078】
好ましい実施形態では、Trk阻害剤は、シトラバチニブ、ベリザチニブ、エヌトレクチニブ、またはラロトレクチニブである。
【0079】
シトラバチニブ(MGCD-516)は、MET、AXL、MER、ならびに血管内皮成長因子受容体(VEGFR)、血小板由来増殖因子(PDGFR)、ジスコイジンドメイン受容体チロシンキナーゼ2(DDR2)のメンバーおよびTrkファミリーを標的とする、低分子のマルチキナーゼ阻害剤である。
【0080】
ベリザチニブ(TSR-011)は、経口用の重複ALK阻害剤および汎Trk阻害剤である。
【0081】
エヌトレクチニブ(N-[5-(3,5-ジフルオロベンジル)-1H-インダゾール-3-イル]-4-(4-メチル-1-ピペラジニル)-2-(テトラヒドロ-2H-ピラン-4-イルアミノ)ベンズアミド)は、経口用のATP競合阻害剤、汎Trk阻害剤、ROS1およびALK Trk阻害剤である。
【0082】
ラロトレクチニブ((3S)-N-{5-[(2R)-2-(2,5-ジフルオロフェニル)ピロリジン-1-イル]ピラゾロ[1,5-a]ピリミジン-3-イル}-3-ヒドロキシピロリジン-1-カルボキサミド)は、固形腫瘍、非ホジキンリンパ腫、組織球性疾患、および原発性CNS癌を含むNTRK遺伝子融合を有する、ゲノム的に定義される癌を治療するために使用することが可能な、経口投与される選択的トロポミオシン受容体キナーゼ(Trk)阻害剤である。前駆細胞リンパ芽球性白血病-リンパ腫(急性リンパ芽球性白血病)に関する前臨床開発が米国において現在行われている。
【0083】
より好ましい実施形態では、Trk阻害剤は、ラロトレクチニブである。
【0084】
本発明の好ましい実施形態では、癌は、肺癌、大腸癌、乳頭様甲状腺癌、多形性膠芽腫、肉腫、分泌性乳癌、乳腺相似分泌癌、非ホジキンリンパ腫、組織球性疾患、および原発性CNS(中枢神経系)癌から選択される。
【0085】
更なる態様では、本発明は、
- 入力部と、
- 処理部と、
- 出力部とを含むシステムに関し、
入力部は、対象患者の患者データを受け入れるように構成され、患者データは対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含み、
処理部は、患者データに基づいて確率値を決定するように構成され、確率値はNTRKの発癌性融合に起因する癌を患う対象患者の確率を示しており、
処理部は、確率値を所定の閾値と比較するように所望により構成され、これによって比較結果を判断し、
出力部は、確率値を表示する、および/または比較結果を表示するように構成される。
【0086】
本明細書の教示による動作は、典型的には非一過性コンピュータ可読記憶媒体に保存された少なくとも1つのコンピュータによって所望の目的のために特別に構成された少なくとも1つのコンピュータ、または所望の目的のために特別に構成された汎用コンピュータによって実行してもよい。
【0087】
「非一過性」という用語は、本明細書では一過性の伝播信号または伝播波を除外するが、通常ではアプリケーションに好適な任意の揮発性または不揮発性コンピュータメモリ技術を含むものとして使用される。
【0088】
「コンピュータ」という用語は、非限定的な例として、パーソナルコンピュータ、サーバ、埋め込みコア、コンピューティングシステム、通信デバイス、プロセッサ(例えば、デジタルシグナルプロセッサ(DSP))、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)等)、および他の電子コンピューティングデバイスを含む、データ処理能力を備える任意の種類の電子デバイスを包含するものとして広義に解釈すべきである。
【0089】
上記で使用される「処理する(process)」という用語は、例えば、少なくとも1つのコンピュータまたはプロセッサのレジスタおよび/またはメモリ内に発生または存在し得る物理的、例えば電子的現象として表される、あらゆる種類のデータの計算または操作または変換を含むことが意図される。プロセッサという用語には、単一の処理部、または複数の分散したもしくは遠隔式のそのような処理部が含まれる。
【0090】
任意の好適なプロセッサ、ディスプレイ、および入力手段を使用して、例えば、コンピュータスクリーンまたは他のコンピュータ出力デバイス上で処理、表示し、本明細書で図示および記載される方法およびシステムのいずれかに使用される、またはそれによって生成される情報などの情報を保存して受け入れてもよく、上記プロセッサ、ディスプレイ、および入力手段は、本発明の実施形態の一部もしくは全部によるコンピュータプログラムを含む。フローチャート内の動作などであるがこれらに限定されない、本明細書で図示および記載される本発明のいずれかまたは全ての機能は、処理用に使用される汎用または特別に構成された少なくとも1つの従来のパーソナルコンピュータプロセッサ、ワークステーション、または他のプログラム可能デバイスもしくはコンピュータ、または電子コンピューティングデバイスもしくはプロセッサ;表示用のコンピュータディスプレイスクリーンおよび/またはプリンタおよび/またはスピーカー;光ディスク、CDROM、DVD、ブルーレイ、光磁気ディスクまたは他のディスクなどの機械可読メモリ;保存用のRAM、ROM、EPROM、EEPROM、磁気または光学または他のカード、および受け入れ用のキーボードまたはマウスのうちの任意の1つ以上によって実行してもよい。本明細書に図示および記載されるモジュールとしては、サーバ、データプロセッサ、メモリ/コンピュータ記憶装置、通信インタフェース、メモリ/コンピュータ記憶装置に保存されたコンピュータプログラムのいずれか1つまたはそれらの組み合わせまたは複数を挙げてもよい。
【0091】
本明細書に図示および記載されるシステムおよび方法によって受信された情報を生成するか、または別様にそれらを提供するために、カメラセンサなどであるがこれらに限定されない任意の好適な入力デバイスを使用してもよい。本明細書に図示および記載されるシステムおよび方法によって生成された情報を表示または出力するために、任意の好適な出力デバイスまたはディスプレイを使用してもよい。本明細書に記載されるような情報を計算または生成する、および/または本明細書に記載される機能を実行する、および/または本明細書に記載される任意のエンジン、インタフェース、または他のシステムを実装するために、任意の好適なプロセッサを使用してもよい。本明細書に図示および記載されるシステムによって受信または生成された情報を保存するために、任意の好適なコンピュータ化されたデータ記憶装置、例えば、コンピュータメモリを使用してもよい。本明細書に図示および記載される機能は、サーバコンピュータと複数のクライアントコンピュータとの間で分割されていてもよい。本明細書に図示および記載される、これらまたは任意の他のコンピュータ化された構成要素は、好適なコンピュータネットワークを介してそれらの間で通信することができる。
【0092】
本発明を提示する動作/工程/方法を実行するのに特に好適なシステムは、国際公開第2018/184194A号パンフレットに開示されており、その内容は参考として本明細書に組み込まれている。
【0093】
ここで、一部ではあるが全てではない本開示の実装形態を図示した添付図面を参照しながら、本開示のいくつかの実装形態を以下でより詳細に説明する。実際に、本開示の様々な実装形態は、多くの異なる形態で具現化してもよく、本明細書で説明される実装形態を限定するものとして解釈すべきではない。むしろ、これらの例示的な実装形態は、本開示が徹底的かつ完全なものであり、当業者に本開示の範囲を完全に伝えるように提供される。本明細書で使用する場合、例えば、単数形「a」、「an」、および「the」等は、文脈上特に明記されない限り、複数の指示対象を含む。いくつかの本発明の例示的な実装形態によれば、「データ」、「情報」、「コンテンツ」という用語および類似の用語は交換可能に用いることができ、伝送、受信、操作および/または保存することが可能なデータを意味する。また、例えば、定量的尺度、値、関係等が本明細書において言及され得る。特に指定しない限り、これらのうち全てではないが任意の1つ以上は、絶対的なものであってもよいか、または工学的公差等によるような発生し得る許容可能なバリエーションを考慮に入れるために、おおよそのものであってもよい。同一の参照番号は、全体を通して同一の要素を意味する。
【0094】
図1は、本発明によるシステム(1)の一実施形態を概略的に示している。このシステムは、入力部(10)、処理部(20)、および出力部(30)を含む。入力部(10)は、患者データを受け入れ、これらを処理部(20)に転送する(入力部と処理部との間の矢印で示されている)。処理部(20)は、患者データに基づいて確率値を決定する。処理部は、確率値を所定の閾値と比較するように所望により構成され、これによって比較結果を判断する。確率値および/または比較結果は、処理部(20)から出力部(30)に伝送される(処理部と出力部との間の矢印で示されている)。出力部(30)は、確率値および/または比較結果を表示する。入力部(10)、処理部(20)、および出力部(30)は、1つ以上のコンピュータシステムの構成要素であってよい。
【0095】
図2は、ある例示的な本開示の実装形態によるコンピュータシステム(1)をより詳細に図示している。一般的に、本開示の例示的な実装形態のコンピュータシステムはコンピュータと称してもよく、1つ以上の固定電子デバイスまたは携帯電子デバイスで構成され、含まれ、または具現化されてもよい。コンピュータは、例えば、メモリ(50)(例えば、記憶デバイス)に接続された処理部(20)などの、各々の多数の構成要素のうちの1つ以上を含んでもよい。
【0096】
処理部(20)は、1つ以上のプロセッサ単独で、または1つ以上のメモリと組み合わせた1つ以上のプロセッサから構成されていてもよい。処理部とは、一般的に、例えばデータ、コンピュータプログラム、および/または他の好適な電子情報などの情報を処理することができる、コンピュータハードウェアの任意の部分である。処理部は、電子回路の集まりで構成されており、その一部が1つの集積回路または複数の相互接続された集積回路(時に、より一般的には「チップ」と称される集積回路)としてパッケージングされていてもよい。処理部はコンピュータプログラムを実行するように構成されていてもよく、コンピュータプログラムが組み込まれて保存されていてもよく、または別様に、同一もしくは別のコンピュータのメモリ(50)内に保存されていてもよい。
【0097】
処理部(20)は、特定の実装形態に応じて、多数のプロセッサ、マルチコアプロセッサ、またはいくつかのその他の種類のプロセッサであってよい。更に、処理部は、メインプロセッサが1つ以上のセカンダリプロセッサと共に単一チップ上に存在する、多数の異種プロセッサシステムを使用して実装されていてもよい。別の例示的実施例として、処理部は同じ種類の複数のプロセッサを含む対称型マルチプロセッサシステムであってよい。更に別の実施例では、処理部は、1つ以上のASIC、FPGAなどとして具現化されるか、または別様にこれらを含んでもよい。従って、処理部は、1つ以上の機能を実行するためにコンピュータプログラムを実行することが可能であってもよく、様々な実施例の処理部は、コンピュータプログラムの支援を受けずに1つ以上の機能を実行することが可能であってもよい。いずれの場合も、処理部は、本開示の例示的な実装形態による機能または動作を実行するように適切にプログラムされていてもよい。
【0098】
メモリ(50)は一般的に、例えば、データ、コンピュータプログラム(例えば、コンピュータ可読プログラムコード(60))、および/または他の好適な情報などの情報を一時的および/または永続的に保存することができる、コンピュータハードウェアの任意の部分である。メモリとしては、揮発性および/または不揮発性メモリを挙げてもよく、固定式または着脱式メモリであってよい。好適なメモリの例としては、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、ハードドライブ、フラッシュメモリ、サムドライブ、着脱式フロッピーディスク、光ディスク、磁気テープ、または上記のいくつかの組み合わせが挙げられる。光ディスクとしては、コンパクトディスク読取り専用メモリ(CD-ROM)、読取り/書込み型コンパクトディスク(CD-R/W)、DVD、ブルーレイディスク等を挙げてもよい。様々な例では、メモリはコンピュータ可読記憶媒体と称することもできる。コンピュータ可読記憶媒体は、情報を保存することが可能な非一過性デバイスであり、ある位置から別の位置に情報を運搬することができる電子的な一過性信号などのコンピュータ可読伝送媒体と区別することができる。本明細書に記載されるようなコンピュータ可読媒体は一般的に、コンピュータ可読記憶媒体またはコンピュータ可読伝送媒体と称することができる。
【0099】
処理部(20)はまた、メモリ(50)に加えて、情報を表示、伝送、および/または受信するための1つ以上のインタフェースに接続されていてもよい。インタフェースには、1つ以上の通信インタフェースおよび/または1つ以上のユーザインタフェースが含まれていてもよい。通信インタフェースは、例えば他のコンピュータ、ネットワーク、データベース等に、および/またはそれらから情報を伝送および/または受信するように構成されていてもよい。通信インタフェースは、物理的(有線)および/または無線通信リンクによって、情報を伝送および/または受信するように構成されていてもよい。通信インタフェースは、セルラー電話、Wi-Fi、衛星、ケーブル、デジタル加入者回線(DSL)、光ファイバー等などの技術を使用するなどによってネットワークに接続するためのインタフェース(41)を含んでもよい。いくつかの実施例では、通信インタフェースは、NFC、RFID、Bluetooth、Bluetooth LE、Zigbee、赤外線(例えばIrDA)等などの近距離通信技術を使用して、デバイスを接続するように構成された1つ以上の近距離通信インタフェース(42)を含んでもよい。
【0100】
ユーザインタフェースには、ディスプレイ(30)が含まれていてもよい。ディスプレイは、ユーザに情報を提示し、または別様に情報を表示するように構成されていてもよく、その好適な例としては、液晶ディスプレイ(LCD)、発光ダイオードディスプレイ(LED)、プラズマディスプレイパネル(PDP)等が挙げられる。ユーザ入力インタフェース(11)は、有線であっても、または無線であってよく、ユーザからの情報を受信して、処理、保存、および/または表示などを行うためにコンピュータシステム(1)に送るように構成されていてもよい。ユーザ入力インタフェースの好適な例としては、マイク、画像またはビデオキャプチャデバイス、キーボードまたはキーパッド、ジョイスティック、タッチセンシティブサーフェス(タッチスクリーンとは別個の、またはタッチスクリーンに組み込まれた)等が挙げられる。いくつかの実施例では、機械可読情報のために、ユーザインタフェースに自動認識およびデータ取得(AIDC)技術(12)が含まれていてもよい。これには、バーコード、無線自動識別(RFID)、磁気ストライプ、光学式文字認識(OCR)、集積回路カード(ICC)等が含まれていてもよい。ユーザインタフェースは更に、プリンタ等などの周辺機器と通信するための1つ以上のインタフェースを含んでもよい。
【0101】
上記で示される通り、プログラムコード命令がメモリ内に保存されていてもよく、それによって本明細書に記載されるシステム、サブシステム、ツール、およびそれらのそれぞれの要素の機能を実装するためにプログラムされている処理部によって実行されてもよい。理解されるように、特定の機械を製造するために、任意の好適なプログラムコード命令をコンピュータ可読記憶媒体からコンピュータまたは他のプログラム可能装置にロードしてもよく、特定の機械が本明細書で指定される機能を実装するための手段となるようにしてもよい。これらのプログラムコード命令はまた、コンピュータ、処理部、または他のプログラム可能装置に特定の方法で機能するように指示し、それによって特定の機械または特定の製造品を生成することが可能であるコンピュータ可読記憶媒体に保存されていてもよい。コンピュータ可読記憶媒体に保存されている指示によって、本明細書に記載される機能を実装するための手段となる製造品を生産してもよい。プログラムコード命令は、コンピュータ、処理部、または他のプログラム可能装置を構成して、コンピュータ、処理部、または他のプログラム可能装置上で実行される、またはこれらによって実行される動作を実行するために、コンピュータ可読記憶媒体から読み出してもよく、コンピュータ、処理部、またはプログラム可能装置にロードされてもよい。
【0102】
プログラムコード命令の読み出し、ロード、および実行は、1つの命令が一度に読み出し、ロード、および実行されるように、順次実行されてもよい。いくつかの例示的な実装形態では、読み出し、ロード、および/または実行は、複数の命令が共に読み出し、ロード、および/または実行されるように、並列して実行されてもよい。プログラムコード命令を実行することによってコンピュータ実装プロセスを生成してもよく、コンピュータ、処理回路、または他のプログラム可能装置によって実行される命令が、本明細書に記載される機能を実装するための動作を提供するようにしてもよい。
【0103】
処理部によって命令を実行することで、またはコンピュータ可読記憶媒体に命令を保存することで、特定の機能を実行するための動作の組み合わせがサポートされる。このように、コンピュータシステム(1)は、処理部(20)および処理回路に結合されたコンピュータ可読記憶媒体またはメモリ(50)を含んでもよく、処理回路はメモリに保存されたコンピュータ可読プログラムコード(60)を実行するように構成されている。1つ以上の機能および機能の組み合わせは、特定の機能または専用ハードウェアとプログラムコード命令との組み合わせを実行する専用ハードウェアベースのコンピュータシステムおよび/または処理回路によって実装されてよいことも理解されよう。
【0104】
図3は、本発明のいくつかの実施形態により実行される工程を、フローチャート形式で概略的に示している。
【0105】
工程は以下の通りである。
(A1) 癌を患う対象患者の患者データを受信することであって、患者データは、対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含むこと、
(B1) 訓練データのセットを用いた機械学習によって訓練された予測モデルに、患者データを入力すること、
(C1) 予測モデルから確率値を取得することであって、確率値は、NTRKの発癌性融合に起因する癌を患う対象患者の確率を示すこと、
(D1) 確率値を出力および/または保存すること。
【0106】
図4は、本発明のいくつかの実施形態により実行される工程を、フローチャート形式で概略的に示している。
【0107】
工程は以下の通りである。
(A2) 癌を患う対象患者の患者データを受信することであって、患者データは、対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含むこと、
(B2) 訓練データのセットを用いた機械学習によって訓練された予測モデルに、患者データを入力すること、
(C2) 予測モデルから確率値を取得することであって、確率値は、NTRKの発癌性融合に起因する癌を患う対象患者の確率を示すこと、
(D2) 確率値を所定の閾値と比較し、これによって比較結果を判断すること、
(E2) 確率値および/または比較結果を出力および/または保存すること。
【0108】
図5は、本発明のいくつかの実施形態により実行される工程を、フローチャート形式で概略的に示している。
【0109】
工程は以下の通りである。
(A3) 癌を患う対象患者の患者データを受信することであって、患者データは、対象患者の腫瘍組織の少なくとも1つの組織病理学的画像を含むこと、
(B3) 訓練データのセットを用いた機械学習によって訓練された予測モデルに、患者データを入力すること、
(C3) 予測モデルから確率値を取得することであって、確率値は、NTRKの発癌性融合に起因する癌を患う対象患者の確率を示すこと、
(D3) 確率値を所定の閾値と比較すること、
(E3) 確率値が閾値以上である場合、対象患者がNTRKの発癌性融合に起因する癌を患っているとの指示を検証するために更なる調査を開始するか、または治療上有効な量のTrk阻害剤を投与すること。
【0110】
図6および7は、本発明によって確率値を決定するのに使用することができる、例示的な畳み込みニューラルネットワークを概略的に図示している。図6は、CNN内の様々な層を図示している。図6に示されるような、患者データ内のNTRKの発癌性融合の1つ以上の特徴を識別するのに使用される例示的なCNNは、入力された組織病理学的画像の赤、緑、および青(RGB)成分を表す入力(102)を受信することができる。入力(102)は、複数の畳み込み層(例えば、畳み込み層(104)、畳み込み層(106))によって処理することができる。複数の畳み込み層からの出力は、一連の全結合層(108、110)によって所望により処理してもよい。全結合層のニューロンは、前の層の全ての活性値と全結合している。全結合層(108)からの出力を使用して、ネットワークから出力結果(110)を生成することができる。出力結果は、NTRKの発癌性融合に起因する癌を患う患者の確率を示す確率値であり得る。
【0111】
全結合層(108)内の活性値は、畳み込みの代わりに行列の積を用いて計算することができる。CNNの実装形態の全てが全結合層を利用するわけではない。例えば、いくつかの実装形態では、畳み込み層(106)がCNNの出力を生成することができる。
【0112】
畳み込み層は疎らに結合されているが、これは、全結合層(108)で見られる従来のニューラルネットワーク構成とは異なるものである。従来のニューラルネットワーク層では、全ての出力部が全ての入力部と相互作用するように全結合されている。しかしながら、図示されているように、フィールドの畳み込みの出力が(フィールド内の各々のノードのそれぞれの状態値の代わりに)次の層のノードに入力されるため、畳み込み層は疎らに結合される。畳み込み層と関連付けられたカーネルは畳み込み操作を行い、その出力を次の層に送る。畳み込み層内で行われる次元削減は、CNNに大きな画像を処理させることを可能にする1つの態様である。
【0113】
図7は、CNNの畳み込み層内における例示的な計算ステージを図示する。CNNの畳み込み層(114)への入力(112)は、畳み込み層(114)の3つのステージで処理することができる。3つのステージは、畳み込みステージ(116)、検出器ステージ(118)、およびプーリングステージ(120)を含むことができる。畳み込み層(114)は次に、連続する畳み込み層にデータを出力することができる。ネットワークの最後の畳み込み層は、出力の特徴マップデータを生成したり、または、例えば分類値もしくは回帰値を生成するために、入力を全結合層に提供したりすることができる。
【0114】
畳み込み層(114)は、畳み込みステージ(116)内でいくつかの畳み込みを並列して実行し、線形活性値のセットを生成することができる。畳み込みステージ(116)はアフィン変換を含んでもよく、アフィン変換とは、線形変換に平行移動を加えたものとして定義することができる、任意の変換のことである。アフィン変換には、回転、平行移動、拡大縮小、およびこれらの変換の組み合わせが含まれる。畳み込みステージでは、ニューロンと関連付けられる局所領域として特定することができる、入力内の特定の領域に接続された関数(例えばニューロン)の出力が計算される。ニューロンは、ニューロンの重みとニューロンが接続されている局所入力における領域との間のドット積を計算する。畳み込みステージ(116)からの出力によって、畳み込み層(114)の連続するステージによって処理される線形活性値のセットが規定される。
【0115】
線形活性値は、検出器ステージ(118)によって処理することができる。検出器ステージ(118)では、非線形活性化関数によって各線形活性値を処理する。非線形活性化関数は、畳み込み層の受容野に影響を及ぼすことなくネットワーク全体の非線形特性を増大させる。いくつかの種類の非線形活性化関数を使用してもよい。1つの特定の種類は、f(x)=max(0,x)で定義され、活性値がゼロで閾値となるような活性化関数を用いる正規化線形ユニット(ReLU)である。
【0116】
プーリングステージ(120)は、畳み込み層(106)の出力を近傍の出力の要約統計量に置き換えるプーリング関数を使用する。プーリング関数を使用して平行移動不変性をニューラルネットワークに導入し、入力に対するわずかな平行移動によってプーリングした出力が変化しないようにすることができる。局所的な平行移動に対する不変性は、入力データ内の特徴の存在が、特徴の正確な位置よりも重要であるシナリオにおいて有用となり得る。プーリングステージ(120)の間に、最大プーリング、平均プーリング、およびl2ノルムプーリングを含む、様々な種類のプーリング関数を使用することができる。更に、いくつかのCNN実装形態では、プーリングステージが含まれない。その代わり、そのような実装形態では、以前の畳み込みステージに対してストライドを増加させた追加の畳み込みステージが代用されている。
【0117】
次に、畳み込み層(114)からの出力は、次の層(122)によって処理することができる。次の層(122)は、追加の畳み込み層であってもよく、または全結合層(108)のうちの1つであってもよい。例えば、図6の最初の畳み込み層(104)は2番目の畳み込み層(106)に出力することができ、一方で2番目の畳み込み層は全結合層(108)の最初の層に出力することができる。
【0118】
図8は、ニューラルネットワークの例示的な訓練および配置を図示している。タスクのために所与のネットワークが一度組織化されると、ニューラルネットワークは訓練データセット(1102)を使用して訓練される。
【0119】
訓練プロセスを開始するため、初期の重みをランダムに選択してもよく、またはディープビリーフネットワークを使用した事前訓練によって選択してもよい。次に、教師ありまたは教師なし方式のいずれかで訓練サイクルを実行する。教師あり学習は、訓練データセット(1102)が入力に望ましい出力と対になっている入力を含むときに、または、訓練データセットが既知の出力を有する入力を含み、ニューラルネットワークの出力が手動で類別されている場合などの、介在された演算として訓練を実行する学習法である。ネットワークは入力を処理し、予想される、または所望の出力のセットに対して得られた出力を比較する。次に、システムを通じて誤差を逆伝播する。訓練フレームワーク(1104)によって、訓練されていないニューラルネットワーク(1106)を制御する重みを調整することができる。訓練フレームワーク(1104)は、訓練されていないニューラルネットワーク(1106)が、既知の入力データに基づいて正確な解答を生成するのに好適なモデルに向かっていかに良好に収束していくのかを監視するためのツールを提供することができる。訓練プロセスは、ネットワークの重みを調整してニューラルネットワークによって生成された出力を精緻化するために、繰り返し行われる。ニューラルネットワークが、訓練されたニューラルネットワーク(1108)に関連する統計的に望ましい精度に達するまで、訓練プロセスを継続することができる。訓練されたニューラルネットワーク(1108)は次に、任意の回数の機械学習動作を実装するように配置させることができる。訓練されたニューラルネットワーク(1108)に新しい患者データ(1112)のセットを入力して、神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因する癌を患う患者の確率を示す確率値を決定することができる。
【0120】
図9は、癌を患う患者の腫瘍組織の組織病理学的画像(HI)の一例である。
【0121】
図10は、予測モデルの成果と、その出力を表示するための方法の一例とを図示した概略図である。
【0122】
図10(a)は、染色したホルマリン固定パラフィン包埋(FFPE)腫瘍組織切片を図示している。組織(200)は、穴(210)を含んでいる。このような画像は、予測モデルへの入力としての機能を果たす。HE染色(これによって組織切片に異なる色と強度とが生じる)によって明らかとなった組織の細部は、明確にするために省略されていることに留意されたい。しかしながら、これらは訓練を受けた人のみに細胞の位置、形状、従って種類を明らかにするものであり、それらの分子組成を明らかにするものではない。
【0123】
図10(b)は、予測ツールの出力例を図示している。デジタル画像は、図10(a)の組織スキャンの配置に対応して生成される。組織スキャンは通常、組織の領域がNTRKの発癌性融合に起因する腫瘍の癌を示す確率に色または色の強度が対応した疑似カラー画像によって重畳される(ここでは白黒画像のみが示されている)。好ましい実施形態では、免疫組織化学染色の色素の典型的な色(例えば、茶色がかった、または赤みがかった色)を表すような色が選択されて、「疑似IHC画像」を生成する。色は、点線(予測された弱い染色強度を示す)、交差陰影(中程度に染色されている)、または濃い陰影(強く染色されている)の領域によって、図中に示されている。
【0124】
図10(c)は、TRKタンパク質の存在を示すために、免疫組織化学染色を使用して抗体で染色した、隣接するFFPE腫瘍組織切片のデジタル画像を図示している。隣接する組織切片に分子アッセイを実施してはいるものの、図10(b)に示すように、デジタル画像が予測モデルで行った予測に極めてよく一致していることに留意されたい。
【0125】
この成果は、組織からモルホロジー/細胞レベルに拡大表示する場合の、より高い拡大率にも同様に当てはまることに留意されたい。好ましい実施形態では、図10(b)に示すような予測画像は、1つの領域に拡大表示したり、または組織の端から端まで移動する場合に、HEの色から疑似IHCの色に(ほぼ)リアルタイムで変化する。これはエッジ分析によって可能となり、本発明によるシステムが情報を局所的に処理し、状況に対してより迅速に応答することが可能となる。また、この特徴によって、スマートフォンなどのモバイルコンピューティングデバイスであったとしても、私達のツールを遠隔病理診断の設定で動作させることができる。好ましい実施形態では、予測モデルは、通常のコンピュータデバイスに都合よくインストールするために、ウェブサイトに埋め込まれている。
【0126】
例えば、研究目的の利用に限定されている、汎TRKモノクローナル抗体であるEPR17341(Abcam、Cambridge、MA)によってIHCを実行することができ、例えばVentana Autostainer Discovery Ultra装置を使用したHechtman et al., The American Journal of Surgical Pathology (2017), 41 (11), 1547 - 1551, PMID 28719467を参照されたい。
【0127】
図11は、実際に本発明を使用するためのプロセスの実施形態を概略的に示している。プロセスの出発点は患者である。患者は癌を患っている。このプロセスの目的の1つは、癌が神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因するのかどうかを明らかにすることである。第1の工程で、患者データ(1112)を収集する/読み出す。患者データ(1112)は、患者の腫瘍組織の少なくとも1つの組織病理学的画像(HI)を含む。次の工程では、教師あり学習で訓練した予測モデル(1108)に患者データを入力する。教師あり訓練では、患者が神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因する癌を患っているのか、または神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因しない癌を患っているのかどうかが判定されている、多数の患者の患者データを使用することができる。
【0128】
訓練された予測モデル(1108)は、入力された患者データ(1112)から確率値pを決定するように構成されている。確率値とは、神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因する癌を患う患者の確率を示すものである。
【0129】
更なる工程では、確率値pを所定の閾値tと比較する。
【0130】
確率値pが所定の閾値tよりも小さい場合(p≧t:「いいえ」)、患者が神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因する癌を患っている可能性は低く、癌の他の原因を特性しなければならず、プロセスは終了する。
【0131】
確率値pが所定の閾値t以上である場合(p≧t:「はい」)、患者が神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因する癌を患っている可能性が高く、後続の工程(1120)が開始される。本発明の一実施形態では、癌が神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因することを検証するために、更なる調査を開始する。これは、例えば、腫瘍組織の遺伝子解析によって行うことができる。更なる調査の結果を用いて、予測モデル(1108)を最適化することができる(更に教師あり学習を行う)。更なる調査によって、癌が神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因することが検証される場合に、患者をTrk阻害剤で治療することができる。別の実施形態では、癌が神経栄養因子受容体チロシンキナーゼ(NTRK)遺伝子の変異に起因する可能性を、Trk阻害剤で患者を直接(何らかの更なる腫瘍組織の遺伝子解析を行うことはせずに)治療するほど高いものであると見なす。
【0132】
図12~14は、確率値を予測するように人工ニューラルネットワークを設定した本発明の一例を図示しており、各確率値は、NTRKの発癌性融合に起因する甲状腺の癌を患う対象患者の確率を示している。
【0133】
図12は、人工ニューラルネットワークの層構造を示している。ネットワークは、Inception ResNet v2の名称でIBMによって提供されている(https://developer.ibm.com/exchanges/models/all/max-inception-resnet-v2/)。ImageNet上で事前訓練したネットワークを、(KerasとTensorflowにおける)転移学習で使用した。
【0134】
訓練および検証用のデータセットは、The Cancer Genome Atlas(TCGA:https://portal.gdc.cancer.gov/)から得た。更なるデータは、フィンランドのトゥルク大学病院のバイオバンクであるAuriaから取得した。
【0135】
HEで染色した(凍結および、またはFFPEホルマリン固定パラフィン包埋)組織切片の.svs形式でのデジタル画像を、組織病理学的画像として使用した。予測のための入力パラメータとして、診断時における患者の年齢も使用した。主要な癌遺伝子の変異状態に関する、TCGAで入手可能な全エクソームシーケンシングデータから抽出した情報は、AuriaサンプルのNGSパネル結果(Illumina TST 170)でも使用した。
【0136】
図13は、受信者動作特性曲線(ROC曲線)の形態で結果を示す。TRAINは訓練データセットを意味し、VALは検証データセットを意味し、TESTはテストデータセットを意味する。訓練データセットは予測モデルを訓練するために使用し、検証データセットは予測モデルを検証するために使用し、予測目的のためにテストデータセットを使用した。AUCとは曲線下面積を意味する。
【0137】
図14は、適合率-再現率曲線の形態で結果を示す。TRAINは訓練データセットを意味し、VALは検証データセットを意味し、TESTはテストデータセットを意味する。訓練データセットは予測モデルを訓練するために使用し、検証データセットは予測モデルを検証するために使用し、予測目的のためにテストデータセットを使用した。AUCとは曲線下面積を意味する。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10(a)】
図10(b)】
図10(c)】
図11
図12
図13
図14