(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-13
(45)【発行日】2024-08-21
(54)【発明の名称】定量的バイオマーカーに基づく癌診断方法とデータベース
(51)【国際特許分類】
G01N 33/574 20060101AFI20240814BHJP
【FI】
G01N33/574 Z
(21)【出願番号】P 2022525397
(86)(22)【出願日】2020-11-02
(86)【国際出願番号】 US2020058582
(87)【国際公開番号】W WO2021087477
(87)【国際公開日】2021-05-06
【審査請求日】2022-06-27
(32)【優先日】2019-11-01
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2019-12-11
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】519386866
【氏名又は名称】イェンタイ クワンティシジョン ディアグノスティックス インク
(74)【代理人】
【識別番号】110002620
【氏名又は名称】弁理士法人大谷特許事務所
(72)【発明者】
【氏名】チャン ジャンディ
【審査官】北条 弥作子
(56)【参考文献】
【文献】米国特許出願公開第2019/0004037(US,A1)
【文献】特表2005-514051(JP,A)
【文献】Jamaica D Cass,Automated Quantitative Analysis of p53, Cyclin D1, Ki67 and pERK Expression in Breast Carcinoma Does Not Differ from Expert Pathologist Scoring and Correlates with Clinico-Pathological Characteristics,Cancers (Basel),2012年07月18日,4(3),pp.725-42,doi: 10.3390/cancers4030725
【文献】Julie M Jorns,Breast Cancer Biomarkers: Challenges in Routine Estrogen Receptor, Progesterone Receptor, and HER2/neu Evaluation,Arch Pathol Lab Med.,2019年08月02日,143(12),pp.1444-1449,doi: 10.5858/arpa.2019-0205-RA
【文献】樋口智子,分子標的薬の治療標的と作用メカニズム,内分泌・甲状腺外科学会雑誌,2015年,32(2),pp.74-79
(58)【調査した分野】(Int.Cl.,DB名)
G01N 33/48~33/98
PubMed
(57)【特許請求の範囲】
【請求項1】
癌の診断、予測または予後に用いるためのデータベースを生成する方法であって、
癌の臨床成績がそれぞれ既知である複数の個体を提供するステップと、
前記複数の個体のそれぞれから個体癌プロファイル(ICP)を生成するステップであって、前記個体癌プロファイルは、i)個体毎に対して区別するための一組の臨床パラメータ
の組合せと、ii)癌の既知の臨床成績とを含み、前記臨床パラメータのそれぞれは、貯蔵されたホルマリン固定パラフィン包埋(FFPE)標本からのバイオマーカーの連続的かつ絶対的な量である
、異なるバイオマーカーの定量的測定の結果を表す、ステップと、
生成された複数の個体の個体癌プロファイルをデータベースに記憶するステップとを含
み、
前記データベースは、
前記一組の臨床パラメータの組合せにより、貯蔵されたFFPE標本の中から個々のFFPE標本を区別するのに十分であり、前記異なるバイオマーカーの組合せは、データベース中の前記貯蔵されたFFPE標本毎に対してユニークな組合せとなっており、このユニークな組合せを核心とし、それにマッチする臨床記録を結合することができるように構成されている、
方法。
【請求項2】
前記バイオマーカーはタンパク質マーカーである、請求項1に記載の方法。
【請求項3】
前記定量的測定は、定量ドットブロット(QDB)分析法により行われてなる、請求項1に記載の方法。
【請求項4】
前記癌は乳癌であり、前記バイオマーカーはエストロゲン受容体(ER)、プロゲステロン受容体(PR)、Ki67、p53、cyclinD1、またはHer2である、請求項1記載の方法。
【請求項5】
癌の診断、予測または予後を提供するためのデータベースであって、複数の個体癌プロファイルを含み、前記複数の個体癌プロファイルのそれぞれは、癌の臨床成績が既知である個体から生成され、
前記個体癌プロファイルは、i)個体の貯蔵されたFFPE標本から定量的に測定された、個体毎に対して区別するための一組の臨床パラメータ
の組合せと、ii)癌の既知の臨床成績とを含み、
前記臨床パラメータのそれぞれは、
異なるバイオマーカーの定量的測定の結果を表し、
前記定量的測定の結果は、前記標本中の前記バイオマーカーの連続的かつ絶対的な量であ
り、
前記データベースは、
前記一組の臨床パラメータの組合せにより、貯蔵されたFFPE標本の中から個々のFFPE標本を区別するのに十分であり、前記異なるバイオマーカーの組合せは、データベース中の前記貯蔵されたFFPE標本毎に対してユニークな組合せとなっており、このユニークな組合せを核心とし、それにマッチする臨床記録を結合することができるように構成されている、データベース。
【請求項6】
前記定量的測定は、定量ドットブロット(QDB)分析法により行われてなる、請求項5に記載のデータベース。
【請求項7】
前記癌は乳癌であり、前記バイオマーカーはエストロゲン受容体(ER)、プロゲステロン受容体(PR)、Ki67、p53、cyclinD1、またはHer2である、請求項5記載のデータベース。
【請求項8】
患者の癌診断用装置であって、請求項5に記載のデータベースを備える、装置。
【請求項9】
患者の癌診断用キットあって、請求項5に記載のデータベースを備える、キット。
【請求項10】
患者に癌の診断、予測または予後を提供するための方法であって、
1)貯蔵された患者のFFPE標本を採取するステップと、
2)請求項5に記載のデータベース
を得てから、i)記憶された個体癌プロファイルと、ii)データベースで使用される一組の臨床パラメータ
の組合せとを取得するステップと、
3)前記患者の前記FFPE標本から、前記データベースで使用される一組の臨床パラメータと同じ一組の臨床パラメータの定量レベルを測定するステップと、
4)前記患者の前記FFPE標本から測定された前記一組の臨床パラメータの定量レベルを
組合せの形で前記データベース中の同じ一組の臨床パラメータの定量レベルと比較するステップと、
5)
組合せの形での前記比較により、前記データベースから患者に最も適合する個体癌プロファイルを特定するステップと、
6)前記データベースから特定された個体癌プロファイルの臨床成績を出力するステップとを含む、方法。
【請求項11】
前記比較は、前記患者の前記FFPE標本から測定された前記一組の臨床パラメータと、個体癌プロファイルにおける同じ一組の臨床パラメータとの
、それぞれ組合せの形で構成された前記ユニークな組合せの間の最も大きい類似度を決定するためである、請求項10に記載の方法。
【請求項12】
前記類似度を決定する際に、各バイオマーカーの絶対レベルは、前記患者のFFPE標本から測定された同じ一組の臨床パラメータにおける同じバイオマーカーの絶対レベルの予め設定された範囲内にある、請求項11に記載の方法。
【請求項13】
前記類似度は、2つの定量的な同じ一組の臨床パラメータ間のユークリッド距離に基づいて算出される、請求項11に記載の方法。
【請求項14】
前記FFPE標本からの前記一組の臨床パラメータの前記定量レベルは、定量ドットブロット(QDB)分析法により行われてなる、請求項10に記載の方法。
【請求項15】
前記癌が乳癌であり、前記一組の臨床パラメータは、エストロゲン受容体(ER)、プロゲステロン受容体(PR)、Ki67、p53、cyclinD1、Her2、またはそれらの組合せを含む、請求項10記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本願は、2019年11月1日に出願された米国仮特許出願第62/929,396号に基づく全ての利益を主張しており、それに開示の全ての内容を参照により本明細書に組み込まれている。
【0002】
(技術分野)
本発明は、一組のバイオマーカーの定量レベルに基づいて癌患者の診断(diagnostics)、予測(prediction)および予後(prognosis)を行う方法、システム並びにソフトウェアに関する。本発明は、具体的には、データベース中の同じ組のバイオマーカーの定量レベルを参照して癌患者の診断、予測および予後を行うことに関する。
【背景技術】
【0003】
多くの癌患者にとって、それらの腫瘍組織は手術によって除去された後、ホルマリン固定パラフィン包埋(FFPE)の形式で病院またはその他の医療機関に保存される。そのため、数百万のFFPE標本を貯蔵し、それに関連する治療計画や臨床成績を含めた詳細な症例(医療記録)が膨大な数の医療資源として蓄積されている。これらのFFPE標本の膨大な数は、個体のレベルで異なる分子的アイデンティティ(molecular identity)をカバーするのに十分である。その既知の臨床成績を結合して、これらの標本は個人化された医学に向けた臨床研究に匹敵しない資源となった。ここでは、世界中のすべての癌患者に対して同様の分子的アイデンティティを持つ既知の症例を同定することができる。
【0004】
臨床実践において、免疫組織化学(IHC)分析は、臨床診断と予後のためにバイオマーカーのタンパク質レベル(protein levels)での評価に広く用いられている。典型的なバイオマーカーのIHCレポートには、「+」または「-」として記載し、またはそれらがさらに「0、1+、2+、3+」とするように分類されている。例えば、乳癌診断のために一般的に使用されるバイオマーカーであるHER2(ヒト上皮細胞成長因子受容体2)の発現レベルは、IHC法により分析され、HER2依存療法(Her2-dependent therapy)を治療計画に含めるべきかどうかを決定する。IHC結果は、0と1+、2+、および3+という3つの群に分けた。0群と1+群の結果は陰性と見なされ、3+群の結果は陽性と見なされ、2+群の結果は両義(equivocal)と見なされる。
【0005】
IHC結果の組合せは、臨床実践中の日常的な診断と予後に用いられている。例えば、乳癌患者にとって、4つの腫瘍バイオマーカーはエストロゲン受容体(ER)、プロゲステロン受容体(PR)、Ki67、およびHer2を含み、患者をLumina-A(Luminal A)型、Lumina-B(Luminal B)型、Her2型とトリプルネガティブ(triple negative)型の4つのサブタイプに区別するために用いられる。Her2とER/PRのIHC結果は、患者をLumina型、Her2型、トリプルネガティブ型に分類し、Ki67の発現レベルはLumina型をさらにLumina-A型とLumina-B型に分類した。
【0006】
IHC分析の分類結果も、さらなる臨床実践に用いることは困難である。例えば、陽性の個別患者では有意差があるものの、臨床現場では同一カテゴリーに分類されている。したがって、IHC分析の結果を用いて、より正確で予測的な診断および予後を提供するために十分なデータ分析を行うことは困難である。
【0007】
IHC法も固有の主観性と不一致性により厳しく制限されている。腫瘍組織の不均一性も診断過程を複雑化させる。
【0008】
多くの科学者はバイオマーカーを組織レベルで絶対的かつ連続的な変数として測定することに取り組んでいる。例えば、酵素結合免疫吸着測定法(ELISA)は新鮮組織と凍結組織におけるバイオマーカーの発現レベルを測定するために用いることができる。しかしながら、このような方法ではFFPE標本中のバイオマーカーの発現量を測定することはできない。そのため、臨床診断と予後への応用にも厳しく制限されている。
【0009】
定量ドットブロット(QDB:quantitative dot blot)分析法は、新鮮、凍結組織およびFFPE標本中のバイオマーカー発現レベルをハイスループットで絶対的かつ連続的な変数として測定できる。標準タンパク質を導入する場合、組換えタンパク質としても精製タンパク質としても、特定のタンパク質の含有量を細胞レベルまたは組織レベルで絶対定量するための絶対定量法に変換することは非常に容易である。
【0010】
QDB方法を適用する前に、保存(貯蔵)された数百万のFFPE標本を既存の利用可能なタンパク質技術で処理することはできない。これは、既存の技術では個々のFFPE標本を個体群レベルで効率的に区別できないためである。現在よく使われているタンパク質分析方法は、免疫組織化学(IHC)、ウエスタンブロット分析、逆相タンパク質マイクロアレイ(RPPA)、質量分析を含め、FFPE標本の分析に用いられている。しかしながら、これらの方法は、膨大な数のFFPE標本を分析するには不十分である。
【0011】
IHCやウエスタンブロット分析では、それらの定性的な内的特徴が個体群レベルでの個体差を曖昧にしている。
【0012】
他の方法はタンパク質発現レベルを定量的に測定して個体群レベルでの個体差を明らかにすることができるが、研究の規模を制限するために相対的な結果を提供している。このような制約は次の例としてよりよく説明することができる。タンパク質の発現レベルは、絶対値の表現(例えばnmole/g)または相対値の表現(参照タンパク質Bの百分率%)で表すことができる。複数(本明細書では、英語の「a plurality of」で「2つ以上」を意味し)の分析では絶対値の表現のタンパク質の量を比較することは容易であるが、複数の分析ではそれぞれ異なる参照タンパク質Bの量に基づく結果を比較することは困難である。
【0013】
MSもRPPAもこの場合に該当する。その結果は、1つの参照タンパク質に対する値として表現されているが、その参照タンパク質の含有量は研究ごとに異なりうる[Boellnerら、Microarrays、4(2):98-114、2015、DeSouzaら、Clin. Biochem. 46:421-431、2013]。そのため、これらの手法に基づく研究の規模も、研究あたりの標本の数に限られ、他の研究結果を統合することで研究の規模を拡大することはできない。リアルタイムPCR(RT-PCR)法によるデータセットにも同様の問題がある。
【0014】
一方、QDB法は、膨大な絶対的かつ連続的なFFPE標本のデータセットを扱うことができる手段を提供することができる。連続性に関しては、個体群レベルで個体間の微妙な差異を表現するために数量化の結果が必要である。絶対性に関しては、タイミング、場所などがどのように変化しても、個々のタンパク質の定量は一貫しているべきであり、これによりデータの共有、相互の裏付け、統合が保証され、データセットの急増が保証され、膨大な数のFFPE標本に対応できる。
【0015】
世界的に広く保存されているFFPE標本を用いて患者の診断を支援するための方法、システムおよびソフトウェアを提供する。臨床において、この方法は治療の有効性を著しく向上させ、個性的な治療の目的を実現できる。
【発明の概要】
【0016】
本発明は、連続変数である3以上のバイオマーカーを用いて癌の診断、予測、予後を行う方法を提供する。本発明のバイオマーカーの評価は、現行の一般的な定性的測定ではなく、定量的に行った後、絶対ユニットで表現することにより、既存のデータベースに容易に組み込むことができる。
【0017】
実験サンプルは個体(subject)由来の組織であってもよい。本発明の一実施形態において、組織は生検組織を指す。本発明の別の実施形態において、組織はホルマリン固定・パラフィン包埋された標本(FFPE標本)を指す。
【0018】
個体は患者でもよい。より具体的には、個体は癌患者である。本発明の一実施形態において、個体は乳癌患者であってもよい。
【0019】
タンパク質バイオマーカー含有量の絶対的定量化は、保存された大量のFFPE標本を最大限に活用するために、回顧的癌プロファイルデータベース(以下、RCデータベースとも言う)またはより正確には異なるタイプの癌(乳癌、結腸直腸癌または前立腺癌を含む)のデータベースを開発するために使用することができる。
【0020】
複数の絶対的に定量されたタンパク質マーカーを組合せることにより、数百万の保存されたFFPE標本の中から個々のFFPE標本を区別するのに十分である。これらのタンパク質マーカーの組合せは、ある意味では、データベース中のFFPE標本毎に対してユニークな「指紋」となっている。
【0021】
このユニークな「指紋」を核心とし、それにマッチする臨床記録を結合することができ、伝統的な臨床病理パラメータ、治療案と相応の臨床成績を含む各FFPE標本に全方位の情報を提供する。
【0022】
これらの異なる側面からのすべての情報は、データベース中のFFPE標本ごとの個体癌プロファイル(ICP:individual cancer profile)を構成する。その他の臨床関連所見(trait)はこれらの癌プロファイル(cancer profile)に含まれてもよい。例えば、一塩基変異(SNV:一塩基多型とも言う)、染色体変化(chromosomal alteration)、各種遺伝子予測分析のスコアなどの遺伝子情報を癌プロファイルに含まれてもよい。
【0023】
データベースの絶対的な特徴は、データベースが継続的に成長することを保証する。ICPの由来(ソース)は異なるが、そのデータに基づく絶対的な特徴は効率的に結合される可能性がある。新しい癌プロファイルも時間とともに増加し、追加することができる。将来、このデータベースには保存されたFFPE標本がかなりの量で記憶され、「ビッグデータ」に基づく臨床診断をサポートすることが期待される。
【0024】
また、上記の方法は、癌の診断、予測、予後を提供するためのRCデータベースを作成する方法をさらに含み、該方法は、癌の臨床成績がそれぞれ既知である複数の個体を提供するステップと、該複数の個体のそれぞれからICPを生成するステップとを含み、該ICPは、i)絶対定量的に測定された複数のタンパク質マーカーと、ii)癌の既知の臨床成績とを含み、生成された複数の個体のICPはデータベースに記憶される。
【0025】
本発明の一実施形態において、バイオマーカーの発現レベルを絶対的かつ連続的な変数として測定することができる。
【0026】
本発明の一実施形態において、バイオマーカーの発現レベルは、質量分析法により測定することができる。
【0027】
本発明の一実施形態において、バイオマーカーの発現レベルは、酵素結合免疫吸着測定(ELISA)法により測定することができる。
【0028】
本発明の一実施形態において、バイオマーカーの発現レベルは、定量ドットブロット(QDB:quantitative dot blot)分析法により測定することができる。
【0029】
本発明の一実施形態において、3つ以上のバイオマーカーのタンパク質発現レベルは、ELISA法、QDB分析法および質量分析法の任意の組合せの方法により測定することができる。
【0030】
データベース中のICPのバイオマーカーの定量発現量レベルは、それに関連する臨床情報と組合せて医学用の数学分析に用いることができる。例えば、バイオマーカーの絶対レベル(絶対量)と無病生存期間(DFS)との潜在的な関係を探索し、患者に予測的な臨床予後を提供することができる。
【0031】
本発明の一実施形態において、ICPからの連続変数の形態で表される複数のバイオマーカーの量を、関連臨床情報(無病生存期間、全生存期間(OS)、副作用、年齢、疾患の異なる進行期間を含むが、これらに限定されない)と組合せて、潜在的な因果関係を探し出すことができ、この因果関係を癌の診断および予後の目的に用いることができる。
【0032】
本発明の一実施形態において、ICPからの3つ以上のバイオマーカーの絶対レベルを(x、y、z)の座標として、X、Y、Z軸で決まる空間(spot:スポット)に個体を位置付けることができる。サンプルのスポット(位置決め点)は、関連臨床情報(無病生存期間、全生存期間、副作用、年齢、疾患の異なる進行期間を含むが、これらに限定されない)と結合して、空間的な相関性を求め、この相関性は診断と予後の目的に用いることができる。
【0033】
本発明の一実施形態において、X、Y、Z軸で決定される空間における1つ以上のICPのスポットを、臨床診断、予測、予後に関する臨床サブグループに分類することができる。
【0034】
本発明の別の態様によれば、患者からの生検サンプル中の複数のマーカーの定量的分析に基づいて患者の癌診断を行うための参照データベース(reference database)に関する。参照データベースは複数のICPを含み、各ICPは、(a)臨床診断が既知である癌患者から生検サンプルを取得するステップと、(b)生検サンプル中の3つ以上の前記バイオマーカーのレベルを絶対的かつ連続的な変数として測定するステップと、(c)3つのバイオマーカーのレベルを空間内のx、y、z座標点(スポット)として利用して各ICPを空間内に配置するステップと、(d)各ICPをスポット別にその癌患者の既知の臨床診断、予測、予後と関連付け、空間的な位置特定に基づいて参照プロファイル(reference profile)を取得するステップとのようなステップによって作成される。
【0035】
また、本発明の別の態様によれば、患者の癌を診断する方法を提供する。この方法は、(i)上記のような空間的な参照データベース(参照空間データベース:reference spatial database)を提供するステップと、(ii)患者から生検サンプルを取得するステップと、(iii)前記生検サンプル中の3つのバイオマーカーを測定し、その結果を絶対的かつ連続的な変数として表現し、その測定結果は前記生検サンプル中の3つのマーカーの連続的な変数であるステップと、(iV)前記3つのバイオマーカーのレベルをそれぞれ(x、y、z)座標としてサンプルを参照空間データベースに位置付けるステップと、(V)参照空間データベースにおいて患者サンプルに最も一致する参照空間プロファイル(reference spatial profile)を特定し、特定された参照プロファイルに関連する既知の臨床診断を出力するステップとを含む。
【0036】
本発明の別の態様によれば、癌の診断、予測または予後を提供するためのデータベースであって、癌の臨床成績がそれぞれ既知である個体から生成された複数の個体癌プロファイルを含むデータベースに関する。前記個体癌プロファイルは、i)個体の貯蔵されたFFPE標本から定量的に測定された複数の臨床パラメータと、ii)癌の既知の臨床成績とを含む。さらに、複数の臨床パラメータは、それぞれバイオマーカーの定量的測定の結果を表し、前記定量的測定の結果は、前記サンプル中の前記バイオマーカーの連続的かつ絶対的な量である。
【0037】
本発明の別の態様によれば、患者の癌の診断、予測または予後を提供する方法に関する。この方法には、1)患者のFFPE標本を採取するステップと、2)上記データベースからi)記憶されているICPおよびii)データベースで使用されている臨床パラメータセット(すなわち一組の臨床パラメータ)を取得するステップと、3)データベース中の各ICPでの前記臨床パラメータセットの定量レベルと患者のFFPE標本中の同一臨床パラメータセットの定量レベルとを比較するステップと、4)比較によりデータベース中の患者に最もマッチするICPを選択して特定(識別)するステップと、5)特定されたICPの臨床成績をデータベースから出力するステップとを含む。
【0038】
上記方法において、前記比較は、ICPにおける前記臨床パラメータセットと、患者のFFPE標本から測定された同じ臨床パラメータセットとの間の最も大きい類似度(maximum similarity)を決定することを目的とする。
【0039】
本発明の一実施形態において、類似度は、一連のタンパク質マーカーの絶対レベルを比較することにより決定することができる。同一バイオマーカーの予め設定された範囲内にあるICPは、患者のバイオマーカーの定量レベルを用いて同定される。一組のバイオマーカーのレベルが患者の同一組のバイオマーカー中の対応するバイオマーカーの予め設定された範囲内にあるICPについては、患者と類似していると考えられる。
【0040】
本発明の一実施形態において、一組のバイオマーカーにおける各バイオマーカーの設定範囲を同一とすることができる。
【0041】
本発明の別の実施形態において、ICPと患者との類似度を評価するために使用される一組のバイオマーカーのうち、予め設定されているバイオマーカー別の範囲が異なっていてもよい。
【0042】
本発明の一実施形態において、ICPと患者との類似度は、2つ(2組)の定量的な臨床パラメータセット同士間のユークリッド距離に基づいて算出することができる。
【0043】
複数のICPは、類似度に基づいてデータベースから特定する(identifying)ことができる。そしてその臨床成績を数学的に分析することによって患者に個性化的な予後を提供する。
【0044】
複数のICPは、類似度に基づいてデータベースから特定することができる。そしてその治療手法と臨床成績を数学的に分析することによって、患者に最も良い予後の治療計画を提供する。
【0045】
本発明の別の実施形態において、他の臨床症状(年齢、腫瘍サイズ、腫瘍グレード、リンパ節状態などの従来の臨床パラメータを含む)を用いて、ICPと患者との類似度をさらに高めることができる。
【0046】
本発明の詳細は、図面にも反映されており、以下の説明に記載されている。本発明の他の特徴、目的および利点は、図面および明細書、ならびに添付の特許請求の範囲を読むことによって、当業者に明らかになる。
【図面の簡単な説明】
【0047】
【
図1】1049個の乳癌サンプルからのPR、ER、Her2の発現レベルを座標として作成した3D散布図(3次元散布図)を示す。ER、PRおよびHer2の発現レベルはQDB法により測定され、その値はOriginソフトウェアによる3D散布図の作成に用いられ、X軸はPR、Y軸はER、Z軸はHer2を表す。各患者からのそれぞれのスポットの分布は空間を異なる領域に分割し、それはホルモン領域(ホルモン群:Hormone group)サンプルがX軸とY軸の平面上に完全に分布し、Her2領域(Her2群:Her2 group)がZ軸を取り囲み、コーナー領域(コーナー群:corner group)(サンプルがX、YとZ軸の境界に堆積する)を含む。コーナー領域にはトリプルネガティブ型(トリプルネガティブ群:triple negative group)と正常様型(正常様群:normal like group)がある。
【0048】
【
図2】Kaplan-Meier生存分析を用いて、ER、PR、Her2およびKi67の絶対レベルに基づいて同定された5名の仮想患者の類似群(similarity groups)の全生存期間(OS)と、対応する臨床サブタイプの全生存期間との比較を示す。IHCに基づく代替分析は、データベース中のプロフィルをLumina-A様サブタイプ、Lumina-B様サブタイプ、Her2陽性サブタイプ、トリプルネガティブ(TNBC)サブタイプに分け、それらの全生存期間を参考にし、Log-Rank検定を用いて5名の仮想患者の類似群と比較し、p<0.05は統計的有意性を有すると考えられた。(a)#1388と#1843患者の類似群とTNBCサブタイプの全生存期間を比較すること、(b)#1445患者の類似群とHer2陽性サブタイプの全生存期間を比較すること、(c)##1807患者の類似群とLumina-A様サブタイプの全生存期間を比較すること、および(d)#1519*患者の類似群とLumina-B様サブタイプの全生存期間を比較することである。2倍の定量下限[2×Limit of Quantitation(LOQ)]を下回るバイオマーカーのレベルとしては、分析可能なプロファイルの数を増やすために差がないと考えられる。
【0049】
【
図3】ER、PR、Her2、Ki67、およびcyclinD1の絶対レベルに基づいて同定された5名の仮想患者の類似群の全生存期間を、Kaplan-Meier生存分析を用いて、対応する臨床サブタイプの全生存期間と比較したものである。IHCの代替分析に基づいてデータベース中のプロフィルをLumina-A様サブタイプ、Lumina-B様サブタイプ、Her2陽性サブタイプとトリプルネガティブ(TNBC)サブタイプに分け、それらの全生存期間を参考にし、Log-Rank検定を用いて5名の仮想患者の類似群と比較し、p<0.05は統計的有意性を有すると考えた。(a)#1388と#1843患者の類似群とTNBCサブタイプの全生存期間を比較すること、(b)#1445患者の類似群とHer2陽性サブタイプの全生存期間を比較すること、(c)#1807患者の類似群とLumina-A様サブタイプの全生存期間を比較すること、および(d)#1519*患者の類似群とLumina-B様サブタイプの全生存期間を比較することである。2倍の定量下限(LOQ)以内のバイオマーカーの量は、分析可能なプロファイルの数を増やすために区別されないと考えられる。
【0050】
【
図4】Kaplan-Meier生存分析法を用いて、ER、PR、Her2、Ki67の絶対レベルで特定される5名の仮想患者の類似群内で異なる臨床治療を受けたプロファイルの全生存期間を比較したものである。治療計画不明瞭のプロフィルは分析に含まれていない。(a)#1388患者の類似群内に化学療法(Chemo)、内分泌療法(ET)および化学療法と内分泌療法との併用療法(CET:本明細書および添付図面では「C+E」とも記し、以下同じ)のプロファイルの全生存期間分析を受けること、(b)#1843患者の類似群内に化学療法(Chemo)、内分泌療法(ET)および化学療法と内分泌療法との併用療法(CET)のプロファイルの全生存期間分析を受けること、(c)#1807患者の類似群内に化学療法(Chemo)のプロファイルの全生存期間分析を受けること、(d)#1519*患者の類似群内に化学療法(Chemo)および化学療法と内分泌療法との併用療法(CET)のプロファイルの全生存期間分析を受けることである。分析可能なプロファイルの数を増やすために、2倍の定量下限(LOQ)以内のバイオマーカーのレベルは同じと考えられる。
【発明を実施するための形態】
【0051】
〔発明の詳細な説明〕
本発明に係る方法を説明する前に、本発明は、本明細書に記載された方法および装置に限定されることなく、特定の使用において変化することを主張することが必要である。本明細書に記載された用語は、特定の実施形態を説明するためのものであって、それらの実施形態を限定するものではなく、本発明の範囲は、添付の特許請求の範囲によってのみ限定される。
【0052】
本明細書で使用されるすべての技術用語は、特に断らない限り、当業者の理解と同じである。
【0053】
本発明は、主に臨床診断を目的とする。したがって、本明細書では、「決定、または同定または確定(determining)」、「測定、または検出(measuring)」、「評価(assessing)」、および「分析(assaying)」を混在させ交互に使用することができ、定量および定性の両方の測定方式を含む。これらの用語は、定量および半定量の両方を指すこともできるので、「決定、または同定、または確定(determining)」と「分析(assaying)」、「測定、または検出(measuring)」などの記述を混在させることができる。定量的測定を説明する場合、「分析物の量を測定する」等の記述を用いる。定量または半定量を説明する場合、「分析物のレベルを測定する」または「分析物を検出する」の説明を使用する。
【0054】
本明細書に記載の「定量(的)」分析は、典型的には、サンプル中の分析対象物と参照物質(対照:control)の相対的なレベルに関する情報を提供し、典型的にはデジタルで提示され、ここで、「0」の値は、分析対象物の量が検出限界(limit of detection:LOD)未満であることを指定することができる。
【0055】
「個体または対象(subject)」、「宿主(host)」、「患者」および「個人(individual)」は、本明細書では混用することができ、診断または治療を必要とする任意の哺乳類(特にヒト)の対象を指す。
【0056】
「空間」および「3次元」(3D)は、3次元空間におけるサンプルを表すスポット(spot)の位置を交換可能に記述するものであり、スポットの強度は、連続変数である4種類目のバイオマーカーの量を表す。
【0057】
組織レベルでのバイオマーカーのタンパク質発現レベルの定量は、任意の方法で行うことができる。この方法は、その最も広い文脈のもとで考えられるべきであり、バイオマーカーの発現レベルが連続変数として定量できる方法であればその中に含まれる。これらの方法としては、質量分析法や免疫分析法などが挙げられるが、これらに限定されるものではない。
【0058】
本発明の測定結果は、相対的な結果であってもよいし、標準タンパク質により絶対的に表現された結果であってもよい。「相対(的)」および「絶対(的)」という用語は、2つの測定方式を意味し、最も広い文脈を含むものとする。相対測定は一物質と他物質の比較結果であり、絶対測定は一物質の既知レベルを標準単位で測定した。おそらく、この2つの方法の最も顕著な違いは、その応用範囲にある。相対的な結果は同じ実験条件でしか意味がないが、絶対的な結果は全く異なる時間や場所で行っても、多くの異なる分析で比較することができる。
【0059】
本明細書において、「サンプル(sample)」、「患者サンプル(patient sample)」、または「標本(specimen)」と「生物学的サンプル(biological sample)」とは、一般に、特定の分子を測定するために用いることができるサンプルを指し、好ましくは、後述するバイオマーカーなどの、生物学的特徴に関連する特定のマーカー分子を指す。サンプルとしては、末梢血細胞、CNS液、血清、血漿、スワブ(swab)、尿、唾液、涙液、胸水などが挙げられるが、これらに限定されない。本発明におけるサンプルとは、一般に組織を指す。
【0060】
「マーカー」および「バイオマーカー」という用語は、それらの最も広い文脈として定義されるべきである。ここで互換可能に混用される「マーカー」および「バイオマーカー」とは、一般的に、ある表現型(例えば、疾患を有する個体)からのサンプル中に、別の表現型(例えば、疾患を有しない、または異なる疾患を有する個体)からのサンプルと比較して、異なる分子(例えば、ポリペプチド)が存在することを意味する。1つのバイオマーカーの確立は、2つの異なる表現型において発現が異なること、すなわち、第1の表現型における平均レベルまたは中央レベルが、第2の表現型において計算された統計学的有意差を示すことに基づいている。
【0061】
本発明において、バイオマーカーとは、生物学的または疾患状態に関連する測定可能な分子を意味する。十分に確立された臨床診断用バイオマーカー(例えば免疫組織化学分析用臨床バイオマーカー)または新たに発見されたインビトロ診断用バイオマーカーであってもよい。
【0062】
本明細書において、「参照(reference)」または「対照(control)」とは、観察されたデータと比較するために使用され得る既知のデータまたは既知のデータセットを互換的に指す。既知データは、2つのパラメータ間の既知の相関関係、例えば、バイオマーカーの発現レベルとそれに関連する表現型との相関関係を表す。ここで、既知データは、参照データベースにおける参照プロファイルを構成する。
【0063】
したがって、複数の参照プロファイルを記憶しておくことにより、診断目的で参照データベースを利用することができ、各参照プロファイルには、診断結果が既知である個体または治療後の臨床治療効果が既知である個体から得られたサンプル中のバイオマーカーのレベルが含まれる。
【0064】
一実施形態において、本発明は、癌患者に診断、予測および予後を提供するRCデータベースを作成する方法であって、癌の臨床成績がそれぞれ既知である複数の個体を提供するステップと、複数の個体のそれぞれに対してi)複数の絶対的かつ定量的に測定されたタンパク質マーカーおよびii)癌の既知の臨床成績を含むICPを生成するステップと、生成された複数の個体のICPをデータベースに記憶するステップとを含む方法に関する。
【0065】
各ICPには複数のタンパク質マーカーだけでなく、他の臨床所見(年齢、腫瘍サイズ、腫瘍グレード、リンパ節状態など)も含まれる。他の臨床分析の結果(血液バイオマーカーのレベルおよび各種酵素のレベルを含む)はICPに含めることができる。
【0066】
また、本発明は、回顧性癌データベースから患者プロファイルに最も一致する1以上の参照ICPを特定する方法に関する。この方法には、(a)適切なプログラム制御コンピュータ上で、患者の一組のタンパク質マーカーの発現レベルとデータベース内の各ICPの発現レベルとを比較するステップと、(b)適切なプログラム制御コンピュータ上で、患者と高度に類似するICPを選択して特定するステップと、(c)患者プロファイルに最も一致する参照データベース内のICPの最も大きい類似度またはその関連表現型を、ユーザインタフェースデバイス、コンピュータ可読記憶媒体、またはローカルもしくはリモートアクセス可能なコンピュータシステムに出力するまたは直接表示するステップとを含む。
【0067】
患者とデータベース中のICPとの類似度を比較する方法には、予め設定されたタンパク質マーカーの数学的分析に基づく評価、または一組のバイオマーカーの発現量によるICPの段階的選択など、様々な方法がある。
【0068】
バイオマーカーの発現レベルは、ICPと患者の類似度を数学的分析で比較する過程において校正(normalization:正規化)してもよいし、この過程において校正しなくてもよい。
【0069】
バイオマーカーの発現レベルは、ICPと患者の類似度を数学的分析で比較する過程において重み付けしてもよいし、この過程において重み付けしなくてもよい。
【0070】
一実施形態において、類似度は、一組のバイオマーカーに基づいて患者からのICPのユークリッド距離を計算することによって達成される。
【0071】
患者に類似のICPも、一組のバイオマーカーの発現レベルに基づいて段階的に選択して特定することができる。この方法には、a)そのバイオマーカーaが患者のバイオマーカーaの予め設定された発現範囲内にあるすべてのICPを選択して特定するステップと、b)選択されたICPから、さらにそのバイオマーカーbが患者のバイオマーカーbの予め設定された発現範囲内にあるすべてのICPを選択して特定するステップと、c)さらに選択されたICPから、さらにそのバイオマーカーcが患者のバイオマーカーcの予め設定された発現範囲内にあるすべてのICPを選択して特定するステップと、…n)さらに選択されたICPから、さらにそのバイオマーカーnが患者のバイオマーカーnの予め設定された発現範囲内にあるすべてのICPを選択して特定するステップとを含む。
【0072】
予め設定されたバイオマーカーにおいて、バイオマーカーごとの予め設定された範囲とは、同一であっても異なっていてもよい。
【0073】
本発明の一実施形態において、上記の過程を経て選択されたICPは、さらに、年齢、性別、腫瘍サイズ、腫瘍グレードなどの他の臨床症状により選択することができる。例えば、59歳の男性肺癌患者のうち、腫瘍サイズが2(級)であり、腫瘍グレードIII(級)であり、リンパ節状態がN2である患者では、タンパクマーカーに基づく類似ICPを、類似年齢(55歳~60歳)、男性で腫瘍サイズが2(級)であり、腫瘍グレードがIII(級)であり、リンパ節状態がN2であるICPにさらに絞り込んで、患者の臨床診断の正確性を高めることができる。
【0074】
1つの空間的関係に基づく方法は、(a)3つ以上のバイオマーカーのサンプルを連続変数として測定するステップと、(b)3つのバイオマーカー(A、B、C)の値を座標(x、y、z)として用いて、X、Y、Z軸で定められた空間にサンプルを代表する点(スポット)を位置付けるステップと、(c)患者の空間的なスポットに基づいて患者を評価するステップとを含むことができ、特にステップ(c)は患者の癌の診断と予後を含む。患者の癌の診断や予後の例としては、無病生存期間、全生存期間、癌治療予測などがある。
【0075】
上記の方法には、(d)上記の3つのバイオマーカーのうちの1つ、例えば(A、B、D)の代わりに、第4種類のバイオマーカー(D)を使用してサンプルの新しい空間への配置を確立し、次いで(e)新しい空間への配置に基づいて患者をさらに評価すること、特に(e)患者の癌の診断および予後を含むステップを含むことができる。患者の癌の診断や予後の例としては、無病生存期間、全生存期間、癌治療予測などがある。
【0076】
また、上記方法において、(d)上記3つのバイオマーカーのうちの1つ、例えば(A、D、E)に代えて、第4および第5種類のバイオマーカー(DおよびE)を用いることができ、(e)新たな空間におけるサンプルのスポットを確立することができ、(e)新たな空間におけるスポットに基づいて患者をさらに評価することができ、特にステップ(e)において患者の癌の診断および予後を含む。患者の癌の診断や予後の例としては、無病生存期間、全生存期間、癌治療予測などがある。
【0077】
また、上記の方法において、(d)第4、第5、第6のバイオマーカー(D、E、F)を用いてサンプルを新たな空間に位置付けることができ、(e)新たな空間の位置に基づいて患者をさらに評価することができ、特にステップ(e)は患者の癌の診断と予後を含む。患者の癌の診断や予後の例としては、無病生存期間、全生存期間、癌治療予測などがある。
【0078】
A、B、Cによって決定された空間的スポット位置、およびA、B、Dによって決定された新しいスポット位置は、患者の癌の診断および予後を含む患者のさらなる評価のために順次使用され得る。患者の癌の診断や予後の例としては、無病生存期間、全生存期間、癌治療予測などがある。
【0079】
A、B、Cによって決定された空間的スポット位置、およびA、B、Dによって決定された新しいスポット位置は、患者の癌の診断および予後を含む患者のさらなる評価のために同時に使用することができる。患者の癌の診断と予後は無病生存期間、全生存期間または癌治療予測を含む。
【0080】
A、B、Cによって決定された空間的なスポット位置、およびA、D、Eによって決定された新しいスポット位置は、患者の癌の診断および予後を含む患者のさらなる評価のために順次使用され得る。患者の癌の診断と予後は無病生存期間、全生存期間または癌治療予測を含む。
【0081】
A、B、Cによって決定された空間的スポット位置、およびA、D、Eによって決定された新しいスポット位置は、患者の癌の診断および予後を含む患者のさらなる評価のために同時に使用することができる。患者の癌の診断と予後は無病生存期間、全生存期間または癌治療予測を含む。
【0082】
A、B、Cによって決定された空間的な位置決定点、およびD、E、Fによって決定された新しい位置決定点は、患者の癌の診断および予後を含む患者のさらなる評価のために使用され得る。患者の癌の診断と予後は無病生存期間、全生存期間または癌治療予測を含む。
【0083】
A、B、Cによって決定された空間的スポット位置、およびD、E、Fによって決定された新しいスポット位置は、患者の癌の診断および予後を含む患者のさらなる評価のために同時に使用することができる。患者の癌の診断と予後は無病生存期間、全生存期間または癌治療予測を含む。
【0084】
一実施形態において、本発明は、患者プロファイルに最も一致する参照空間データベース内のサブグループ(sub-group)の参照空間プロファイル(reference spatial profile)を決定する方法をさらに含む。この方法は、(a)適切なプログラム制御コンピュータ上で、3つのバイオマーカーのレベルを座標として、患者サンプルからの空間内の位置(スポット)を比較するステップと、(b)参照空間データベース内の参照空間プロファイルのサブセットと比較して、参照空間プロファイルのサブセットとの近接性を決定するステップと、(b)適切なプログラム制御コンピュータ上で、スポットに最も近い参照空間プロファイルのサブセットを、参照データベース上で特定するステップと、(c)患者の空間プロファイルに最も一致する、参照データベース内の参照空間プロファイルのサブセットの最も大きい類似度またはその関連表現型を、ユーザインターフェース装置、コンピュータ可読記憶媒体、またはローカルもしくはリモートアクセス可能なコンピュータシステムに出力するか、または直接表示するステップとを含む。
【0085】
数学的方法を用いて患者の位置決め点と一つの臨床所見の推定関係を探求する。例えば、ER、PR、Her2の発現レベルからなる3D散布図における無病生存期間との関係が挙げられるが、これに限定されるものではない。これらの情報は同類の分析で他の患者に予後を提供することができる。
【0086】
上記のRCデータベースは、ICPと臨床成績との関係を探索するために用いることができる。各ICPに関連する既知の臨床成績とバイオマーカーの発現レベルとの因果関係を検討するために、数学分析を用いた。
【0087】
臨床の「所見(trait)」と臨床の「情報(information)」は互換性があり、そして最も広範な文脈の下で考慮すべきである。臨床所見(clinical trait)は、年齢、性別、血圧、ブドウ糖レベル、癌グレード、無病生存期間、または患者の診断、予防と治療に関連する情報を含むが、これらに限定されない。
【0088】
データベースの複数のICPの臨床成績をまとめて統計分析に用いて、患者に個性的な診断、予測と予後を提供することができる。統計方法は単要素生存分析、多要素生存分析、C指数分析、Kaplan-Meier生存分析およびLog-Rank生存分析を含む。
【0089】
現在普及している乳癌と前立腺癌の診断のための分類方法とは異なり、本発明は世界に広く存在する大量に保存されたFFPE標本を利用して、単一の患者を中心とし、その患者と高度に類似するICPのグループを特定し、その臨床成績を分析して、各癌患者に個別の診断、予測と予後を提供する。
【0090】
明らかに、使用可能なFFPE標本が多いほど、患者に提供する診断、予測と予後が正確になる。
【0091】
要するに、従来の診断方法は、いくつかの円を描き、その円の中に個々の癌患者を入れることで、癌患者に正確な治療を提供していた。これに対し、本発明では、各患者を中心として、それに似たICPを含むように個性化した円を描く。結果、いくつの癌患者があるか、いくつの円があり、RCデータベースを利用して個々の癌患者に個別の診断、予測と予後を提供する。
なお、ここで説明した実施形態は、現段階での好ましい実施形態であるので、これに限定されるものではない。各実施形態における特徴または技術案の説明は、一般に、他の実施形態における他の類似の特徴または技術案においても使用可能であると考えられるべきである。
【実施例1】
【0092】
材料および方法
個体およびヒト細胞株ホルマリン固定パラフィン包埋(FFPE)の乳癌組織切片および臨床情報は現地病院(山東煙台に位置する煙台毓黄頂病院と浜州医学院付属病院)から採取した。
【0093】
細胞培養に使用される共通試薬はすべてThermo Fisher Scientifics(米国マサチューセッツ州ウォルサム)から購入した。プロテアーゼインヒビターは、Sigma Aldrich社(ミズーリ州セントルイス)から購入した。他のすべての化学薬品は国薬グループ化学試薬有限公司(中国北京)から購入した。
【0094】
溶解液の調製2×15μmホルマリン固定パラフィン包埋組織片切片を2枚Eppendorf遠心管に採取した。切片を脱パラフィンし、プロテアーゼインヒビター(2μg/mLロイペプチン、2μg/mLアプロチニン、1μg/mLペプスタチン、2mM PMSF、2mM NaF)を加えた300μLの溶解緩衝液(50mM HEPES、137mM NaCl、5mM EDTA、1mM MgCl2、10mM Na2P2O7、1% TritonX-100、10% glycerol)中で2分間超音波処理した後、12000×gで5分間遠心分離した。上清を集めてイムノブロット分析を行った。全タンパク質濃度は、メーカーの指示に従いPierce BCAタンパク質測定キットを用いて測定した。
【0095】
QDB分析特異的抗体(Her2に対するEP3または4B5クローン、Ki67に対するMIB1クローン、エストロゲン受容体(ER)に対するSP1およびプロゲステロン受容体に対する1E2、cyclinD1に対するSA38-08)のそれぞれの線形範囲は、これらのバイオマーカーに陽性反応を示す患者の溶解物をそれぞれいくつか混合した混合液から決定した。まず、乳癌組織からの組織溶解液を等量3~4個混合し、混合溶解液を0~2μgで段階的に希釈してQDB分析の線形範囲を決定した。また、商品として購入した、または社内で自ら発現し精製された標準タンパク質についても、QDB分析の線形範囲を決定するために0pgから500pgの勾配で希釈した。
【0096】
サンプルは、QDBプレートに3連で2μL/ユニットで添加し、従来技術で説明したように処理した。各ウェルに一次抗体100μLを加え、4℃で一晩インキュベートした。さらにロバ抗ウサギまたはロバ抗マウス二次抗体をQDBプレートと室温で4時間インキュベートした。QDBプレートをTBSTで2回洗浄し、さらに10分間ずつ5回洗浄した後、メーカーの説明書に従って調製したECL溶液100μL/ウェルを予め添加した白色96ウェルプレートに3分間入れた。次に、Tecan Infiniti 200 proの酵素リーダーを用いて、ユーザーインターフェース上で「蓋付きプレート」を選択することにより、複合プレートの各ウェルからの化学発光シグナルを定量的に測定した。
【0097】
得られた読みを用いて、標準タンパク質(タンパク質標準品:protein standard)をコントロールすることにより、FFPE標本中のバイオマーカーのレベルを測定した。測定したPR、ER、Her2、Ki67のバイオマーカーのレベルをデータベースに入力した。サンプルをQDB分析のために3つのグループに分けた。各グループから6つのサンプル(2つの強表現、2つの弱表現、2つの中等表現)を選び、同じ実験で測定を行い、結果の一致性を検証した。
【0098】
これらの結果をOriginPro 9.1ソフトウェアを用いて3D散布図を作成した。
【0099】
実施例1では、ER、PR、Her2のタンパク質レベルを用いて3D散布図を作成し、その散布図を用いて患者の治療計画を決定する方法について説明する。
【0100】
PR、ERとHer2のタンパク質レベルをQDB法により絶対的かつ連続的な変数として測定し、その結果をQDBデータベースに入力する。
【0101】
より多くのサンプルの結果をQDBデータベースに入力し、データベースの成長を保証する。
【0102】
QDBデータベース内のER、PR、Her2レベルを使って3D散布図を作成し、その正確性と全体性を確保するために継続的に調整する(
図1)。
【0103】
各スポットがサンプルを表す3D散布図は、参照空間データベースとして定義される。
【0104】
DFSやOSなどの臨床情報を参照空間データベース内の各スポットに関連付けるには、数学的分析を使用する。
【0105】
QDB法を用いて患者FFPE標本のER、PR、Her2レベルを測定した。
【0106】
患者を表すスポットを参照空間データベースに配置する。
【0107】
参照空間プロファイルは、参照空間プロファイル内の患者の位置に基づいて特定され、この参照空間プロファイルから臨床情報が分析されて、患者の診断、予測、予後に用いられる。
【0108】
あるいは、参照空間プロファイルを、空間定位(spatial localization)に応じて異なるサブグループに分割してもよい。
【0109】
参照空間プロファイルの各サブセットに臨床情報(DFSとOSを含む)を関連付ける。この場合、ホルモン群、Her2群、コーナー群を指す。
【0110】
QDB法を用いて患者のFFPE標本中のER、PRとHer2のレベルを測定し、空間定位によりその位置決め点をあるサブグループに位置付ける(定位する)。
【0111】
位置決め点に位置するサブグループによって、患者に臨床診断、予測と予後を提供する。
【実施例2】
【0112】
材料および方法の詳細については、実施例1を参照されたい。
【0113】
本実施例では、臨床研究に基づく3Dモデル(3D model)を用いて患者に診断、予測、予後を提供する方法を紹介した。
【0114】
臨床情報にマッチする多くの研究空間情報を分析することにより、空間定位と臨床情報(DFSとOSを含む)を関連付ける3Dモデルを作成した。
【0115】
患者の3つのバイオマーカーのタンパク質レベルを絶対的かつ連続的な変数として測定した。
【0116】
機器やソフトウェアでサポートされている3Dモデルでは、3つのバイオマーカーの発現レベルに応じて患者の空間定位を行う。
【0117】
3Dモデルにより、3つのバイオマーカーのレベルに基づいて患者の空間定位を行い、患者に診断、予測または予後を提供する。
【実施例3】
【0118】
材料および方法の詳細については、実施例1を参照されたい。
【0119】
本実施例では、サブサブグループ(sub-sub-group)患者に2つの3D散布図を順に用いて、臨床診断、予測、予後を行う方法について説明する。
【0120】
QDB法を用いて2例の患者FFPE標本中の6種類のバイオマーカーER、PR、Her2、ki67、PCNAおよびp53のレベルを測定した。
【0121】
ER、PR、Her2の発現レベルをX、Y、Z軸とする参照空間データベース3D散布図では、これら2例の患者ER、PR、Her2の発現レベルから決定されるスポットの空間位置は、同一のサブグループに分類される。
【0122】
この2例の患者Ki67、PCNA、p53の発現レベルに基づいて決定された2つのスポットを、Ki67、PCNA、p53をX、Y、Z軸とする3D散布図に位置付ける。
【0123】
スポット201はKi67とPCNAで構成される側壁に位置し、p53は発現せず、スポット202はKi67、PCNA、p53の強い発現により空間に浮いている。
【0124】
したがって、患者201と202は、ER、PR、Her2の3D散布図では同じサブグループ(Lumina-A群)に属するが、Ki67、PCNA、p53の3D散布図では異なるサブグループに属する。
【実施例4】
【0125】
ローカルから採取した427例のFFPE標本から開発した乳癌プロファイルデータベースを用いて研究を行った。臨床成績は本研究における患者の全生存期間(OS)に限られる。類似度を評価するために最も好ましい一組のタンパク質マーカーはまだ探索されていないが、これらのFFPE標本中の乳癌に一般的に使用されているいくつかのバイオマーカー(ER、PR、Her2、Ki67、およびcyclinD1)の絶対定量はQDB法を用いて行われている。これらのタンパク質マーカーの測定結果を、症例に記録されている臨床病理パラメータ(年齢、腫瘍サイズ、腫瘍グレード、リンパ節状態)、治療計画および得られた臨床成績と合わせて、この原始的癌プロファイルデータベース中の各サンプルごとにICPを生成した。
【0126】
癌プロファイルデータベースから、バイオマーカーレベルに有意差のある少なくとも1つのFFPE標本(#1388、#1843、#1445、#1807、#1519)のプロファイルをランダムに選択し、仮想の新規患者として使用した(表1)。また、これらのサンプルはIHC置換分類(分析)に基づく四種類の臨床サブタイプを代表しており、その中で#1388と#1843はトリプルネガティブ(TNBC)サブタイプ、#1445はHer2陽性サブタイプ、#1807はLumina-A様サブタイプ、#1519はLumina-B様サブタイプである。
【0127】
臨床実践では、ER、PR、Her2およびKi67の4種類のバイオマーカーが患者の臨床サブタイプの定義に最初に用いられている。本研究では、これら4種類のマーカーを用いて、まず、異なる仮想患者とデータベース中の個体癌プロファイルとの類似度を評価する。各仮想患者とデータベース内の各癌プロファイルとのユークリッド距離を計算し、低から高までソートする。バイオマーカーのレベルがいずれも最も低い定量下限(LOQ)未満であれば、それらの発現レベルは同じであると考えられる。また、データベースの規模が小さいため、ある癌プロファイルのバイオマーカーのレベルが、仮想患者の50%未満、またはその2倍以上である場合には、その癌プロファイルは採用されない。例えば、#1519仮想患者のERレベルが2nmole/gであり、データベース中のERが1nmole/g未満または4nmole/gを超える癌プロファイルは、#1519患者と類似せずに拒否されると考えられる。
【0128】
このミニデータベースでは、仮想患者#1388、#1843、#1445、#1807にそれぞれ18、35、10、14例の類似癌プロファイルを見つけたとしており、患者#1519と類似しているのは3つの癌プロファイルのみである(表1)。明らかに、データベースの規模は利用者や研究者の分析能力を大きく制限しており、この方法の潜在力を十分に発揮するためには、データベースを数千~数百万に拡大する必要があることが強調されている。
【0129】
群ごとに類似した癌プロファイル(類似群)のOSと仮想患者に対応する臨床サブタイプのOSを比較した(
図2)。
図2のa部に示すように、#1388の類似群(本明細書およびその図では「#1388類似群」または「#1388群」ともいい、その他は類推する)と#1843の類似群の10年生存率(略称:10y-SP)は、いずれもTNBCサブタイプよりもやや高かった。しかしながら、これらの差異は統計的有意性に達していない(p=0.057)。Her2陽性サブタイプである#1445の類似群に対するOSはHer2陽性群全体より若干向上し、10y-SPは72%から88%(p=0.27)に向上した。Lumina-A様サブタイプである#1807に類似する14個の癌プロファイルについて、その10y-SPはLumina-A様サブタイプ全体と高度に類似している(p=0.91)。
【0130】
データベースサイズが小さいため、3つの癌プロファイルのみがLumina-B様サブタイプである#1519と類似している。このデータセットから潜在的な指示情報を抽出して参考にするために、類似度の制限、すなわち2×LOQ未満のバイオマーカーのレベルを有する癌のプロファイルも含めていく。例えば、Her2のLOQが0.15nmole/gである場合、Her2が0.3nmole/g未満であるプロファイルは、同じHer2レベルであると考えられる。この緩和条件下では、16個の癌プロファイルが#1519と類似していることが確認され、この類似群は全Lumina-B様サブタイプと比較して10y-SPが有意に悪化していた(p=0.0096)。
【0131】
評価に含まれるバイオマーカーが多いほど、プロファイルと新規患者との類似度はより高いレベルになると考えられる。したがって、cyclinD1は、Lumina様サブタイプ患者の全生存期間を予測するうえでKi67以外のバイオマーカーとは無関係であることを考慮して、5名の仮想患者のそれぞれの類似群を同定するための評価に含めた。データベース中の各プロファイルとこの5名の仮想患者とのユークリッド距離をそれぞれ計算し、距離順にソートした(表2)。仮想患者のバイオマーカーのレベルと比較して50%以下または2倍以上の癌プロファイルは、すべて類似群に含まれない。
【0132】
予想に反して、すべての症例において仮想患者に類似の癌のプロファイルがより少ないことが認められた。#1388類似群は18例から7例に下げ、#1843類似群は35例から20例に下げ、#1445類似群は10例から7例に下げ、#1807類似群は14例から5例に下げ、#1519類似群は16例から9例に下げた。Log Rank検定を用いて、各類似群のOSと仮想患者に対応する臨床サブタイプのOSを比較した(
図3)。驚くべきことに、cyclinD1の添加は#1843群、#1388群とTNBC群の差を統計的有意差(p=0.023)にすることができ、#1843群の10y-SP(100%)は有意に高く、#1388群の10y-SP(57%)はTNBCサブタイプの10y-SP(75%)より有意に低かった(
図3のa)。一方、cyclinD1の加入は#1445群の予後にあまり寄与しなかった(
図3のb)。cyclinD1の加入により#1807群の予後はLumina-A様サブタイプよりも劣っていたが、この差は統計学的差に達しなかった(p=0.095)。#1519群では、OSはやはりLumina-B様サブタイプより劣り、Log Rank検定値はp=0.034であった。
【0133】
この方法の最大の使い道は、新規患者にカスタマイズされた治療アドバイスを提供することである。したがって、各類似群内のプロファイルは、それが受けた治療に応じてさらにグループ化され、OS分析が行われて、最適な治療計画が決定される。データベースの規模が小さいため、治療方式は化学療法(CT)、内分泌治療(ET)および化学療法・内分泌治療の併用治療(CET)に簡単に分けられる。この研究では、ER、PR、Her2、Ki67の4種類のバイオマーカーに基づいて決定された類似群を用いて、より多くのプロファイルを分析のために導入した。
【0134】
#1388類似群(
図4のa)では、CTのみの患者(n=12)の5年生存率(以下略称:5y-SP)は92%であったのに対し、CET治療を受けた患者(n=3)の5y-SPは67%であった。#1843群では、どのような治療を受けてもすべての患者が生存していた。#1445群では、すべての患者がCTのみを受けていたため、いずれの関連情報も抽出できなかった。#1807群では、CTのみの患者(n=4)の10y-SPは100%であったのに対し、CETを受けた患者(n=8)の10y-SPは71%であった。#1519群では、CETを受けた患者(n=6)の5y-SPはCTのみの患者(n=9)より優位であったが、後期では優位が消失した。
【0135】
そこで、本明細書では、隣接する原則に基づく診断方法が、5名の仮想患者に個別化OSの予測を提供する可能性を示した。#1388、#1843、#1519の10y-SPは、対応する臨床サブタイプの10y-SPと有意差があった。OS分析により、5名の仮患者の類似群についても各種治療様式の有効性評価を行った。しかしながら、データベースサイズの制約から、それらの差異は統計的に有意ではなく、これらの仮想患者には指導できなかった。
【0136】
注目すべきは、#1843は最も予後の悪い臨床サブタイプTNBCに属するが、その類似群の全部患者がどのような治療を受けても研究終了時に生存していることである(
図3のaおよび
図4のb)。これは、#1843が最初の分子タイピング研究で記述された正常様サブタイプ(Normal-like subtype)であることが疑われる。
【0137】
明らかに、概念や技術の成熟とともに、日常の臨床実践にこの新しい診断法を応用した律速段階は、本研究で用いたデータベースよりもはるかに大きい癌プロファイルデータベースの開発である。例えば、乳癌プロファイル(breast cancer profile)が10000例よりも大きい場合、5種類のバイオマーカーに基づいて、約500個(10000/400×20)のプロファイルが#1843と高度に類似し、125個のプロファイルが#1807と高度に類似し、175個のプロファイルが#1388および#1445と高度に類似していると決定することができ、5名の仮想患者に確実な指導を提供することができる。
【0138】
しかしながら、このような規模であっても、#1519のような十分な数の癌プロファイルを認識することは困難であり、4種類のバイオマーカーに基づいて75種類のプロファイルしか認識できず、類似度の評価に5種類のバイオマーカーを用いると、認識できるプロファイルが少なくなる。#1519のような患者は、現在の臨床実践では過治療あるいは治療不足になる可能性が高いのは、数百症例に及ぶ臨床試験では十分な対応ができないためと考えられる。
【0139】
同様に、データベースの規模が限られているため、本研究では治療法をCT、ET、CETに分類した。しかしながら、化学療法だけでは、アルキル化剤、抗腫瘍抗生物質、代謝拮抗剤、有糸分裂抑制剤の4種類以上の薬物がある。各タイプには、いくつかの異なる薬剤がある。明らかに、データベースを拡張することによって初めて、新規患者に最良の治療効果を有する確実な薬物を探し出すことができる。
【0140】
これらの考えはいずれもデータベースを広く拡張する必要性を強調している。幸いにも、QDB技術の絶対的定量的特性から、前述の癌プロファイルデータベースは成長しつつあるデータベースである。この方法が世界規模で受け入れられるようになるにつれ、このデータベースは近い将来に急増すると予想されている。
【0141】
本研究で用いた5種類のバイオマーカーは、必ずしも乳癌患者の類似度を評価するための最良の選択肢ではない。しかしながら、これらは、乳癌患者間の類似度を評価するために、既存のバイオマーカーおよびバイオマーカー候補の全てから最も好ましい数および組合せを特定するための基礎として使用することができる。患者に確実な指導を提供するために必要な類似のプロファイルの最低数は、全世界の腫瘍学者と統計学者の協力によって決定する必要がある。
【0142】
本研究におけるユークリッド距離の役割には限界があることは否めないが、すべてのバイオマーカーのレベルが、仮想患者と比較して50%以上200%未満の癌プロファイル数には限界があるためである。しかしながら、顕著に拡張されたデータベースに対する大きな効果として、ユークリッド距離に基づくカットオフ値を確立し、新規患者との類似度が最も高い癌のプロファイルを特定することが考えられる。
【0143】
同様に、本研究では、類似度の評価は一組のタンパク質マーカーの発現レベルに完全に基づいているが、他の臨床病理パラメータ(例えば、年齢、腫瘍サイズ、リンパ節状態、OncotypeによるRSスコア、PAM50によるRORスコア)も、類似度のレベルを高めるために評価に組み込むことができる。同様に、本研究はOS分析に限定されているが、再発を含めた他の臨床成績も必要に応じて評価に用いることができる。
【0144】
(材料および方法)
個体およびヒト細胞系:浜州医学院煙台附属病院と青島大学附属煙台毓黄頂病院(中国煙台市)から、ホルマリン固定パラフィン包埋(FFPE)した乳癌組織の490例の切片(2×15μm/例)を共同で提供し、その中で427例は全生存期間(OS)データを持っていた。サンプルの採集と研究方案を含むすべての研究は『ヘルシンキ宣言』に符合し、そして浜州医学院煙台付属病院倫理委員会(承認番号:#20191127001ハオ俊梅)と毓黄頂病院倫理委員会(承認番号:[2017]76於国華)の承認を得た。この2つの研究における個体は、病院で大量に保存されている匿名で、回顧的な臨床データを持つFFPE標本であるため、インフォームドコンセントを提供する要求は免除されている。
【0145】
バイオマーカーレベルはQDB法で測定したが、臨床情報はすべてカルテから得た。QDBフローは他の文献にも詳細に記述されている。
【0146】
共通試薬:すべての共通試薬は他所に記載されており、ER(SP1)ウサギ単クローン抗体はAbcam Inc.から購入され、PR(1E2)ウサギ単クローン抗体はRoche Diagnostics GmbHから購入し、Her2(EP3)ウサギ単抗体、Ki67(MIA1)マウス単抗体およびcyclinD1(EP12)ウサギ単抗体は中杉金橋生物技術有限公司(中国北京、www.zsbio.com)から購入された。HRP標識ロバ抗ウサギIgG二次抗体はJackson ImmunoResearch研究所(米国PA、Pike West Grove)から購入された。QDBプレートはQuanticision Diagnostics Incより(米国NC、RTP)提供された。
【0147】
ユークリッド距離の算出: サンプルa(ER、PR、Her2、Ki67)とサンプルb(ER’、PR’、Her2’、Ki67’)およびサンプルc(ER、PR、Her2、Ki67、cyclinD1)とサンプルd(ER’、PR’、Her2’、Ki67’、cyclinD1’)との距離をそれぞれ以下の式で算出する。
【数1】
【数2】
【0148】
全サンプル中の各バイオマーカーのQDB結果を予め標準化(z-score変換)した。定量下限(LOQ):Her2は0.15nmol/g、ERは0.1nmol/g、PRは0.25nmol/g、Ki67は1.3nmol/g。
【0149】
生存分析:異なるサブグループの全生存期間はKaplan-Meier法で表示し、log-rank検定で比較した。P<0.05は統計的有意性が認められた。すべての統計分析はR4.0.1(http://www.r-project.org)を用いて行った。
【0150】
添付の特許請求の範囲では、上記に開示した本発明の特徴の組合せおよびサブ組合せのいくつかが、新規性および進歩性を備えていることを特に指摘していると考えられる。その他、特徴、機能、要素、属性等の組合せやサブ組合せを具体化した発明としては、特許請求の範囲を変更したり、特許請求の範囲に記載の発明を新規なものとして保護することができる。これらの変更または新規な請求項は、それらが異なる発明に向けられているか、同じ発明に向けられているかにかかわらず、それらが元の請求項と範囲が異なる、より広い、より狭い、または同じであるかにかかわらず、開示されている発明の対象の範囲内に含まれると見なされている。
<表1>ER、PR、Her2およびKi67タンパク質の絶対定量レベルに基づく類似の癌プロファイル群
(類似群)
【表1-1】
【表1-2】
【表1-3】
【表1-4】
【表1-5】
〔略語〕 すべての臨床病理因子は米国癌合同委員会(AJCC)の定義に合致する。C:化学療法、E:内分泌治療、LumAとLumB:Lumina-A様とLumina-B様の臨床サブタイプ、TNBC:トリプルネガティブ型乳癌、Her2:Her2陽性サブタイプ、生存成績:0-生存、1-死亡。
〔注〕 定量下限(LOQ)範囲内のすべてのバイオマーカーのレベルは同じと見なされる。少なくとも1つのバイオマーカーのレベルが仮想患者と有意差(<50%または>200%)を有するサンプルは放棄される。*:2×LOQ範囲内のバイオマーカーのレベルは同じと考えられる。少なくとも1つのバイオマーカーのレベルが仮想患者と有意差(<50%または>200%)を有するサンプルは放棄される。
<表2>ER、PR、Her2、Ki67およびcyclinD1タンパク質の絶対定量レベルに基づく類似の癌プロファイル群(類似群)
【表2-1】
【表2-2】
【表2-3】
【表2-4】
【表2-5】
〔略語〕 すべての臨床病理因子は米国癌合同委員会(AJCC)の定義に合致する。C:化学療、E:内分泌治療、LumAとLumB:Lumina-A様とLumina-B様の臨床サブタイプ、TNBC:トリプルネガティブ型乳癌、Her2:Her2陽性サブタイプ、生存成績:0-生存、1-死亡。
〔注〕 定量下限(LOQ)範囲内のすべてのバイオマーカーのレベルは同じと見なされる。少なくとも1つのバイオマーカーのレベルが仮想患者と有意差(<50%または>200%)を有するサンプルは放棄される。*:2×LOQ範囲内のバイオマーカーのレベルは同じと考えられる。少なくとも1つのバイオマーカーのレベルが仮想患者と有意差(<50%または>200%)を有するサンプルは放棄される。