(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-24
(45)【発行日】2024-11-01
(54)【発明の名称】血漿サンプル中のマイクロサテライトの安定性およびゲノム変化を検出する次世代シークエンシングに基く方法
(51)【国際特許分類】
C12N 15/11 20060101AFI20241025BHJP
C12Q 1/6869 20180101ALI20241025BHJP
【FI】
C12N15/11 Z
C12Q1/6869 Z
(21)【出願番号】P 2021517643
(86)(22)【出願日】2019-09-29
(86)【国際出願番号】 CN2019109036
(87)【国際公開番号】W WO2020063964
(87)【国際公開日】2020-04-02
【審査請求日】2022-09-26
(31)【優先権主張番号】201811149015.9
(32)【優先日】2018-09-29
(33)【優先権主張国・地域又は機関】CN
(31)【優先権主張番号】201811149011.0
(32)【優先日】2018-09-29
(33)【優先権主張国・地域又は機関】CN
【前置審査】
(73)【特許権者】
【識別番号】519271584
【氏名又は名称】▲広▼州燃石医学▲検▼▲験▼所有限公司
【氏名又は名称原語表記】GUANGZHOU BURNING ROCK DX CO., LTD.
(74)【代理人】
【識別番号】100145403
【氏名又は名称】山尾 憲人
(74)【代理人】
【識別番号】100162684
【氏名又は名称】呉 英燦
(74)【代理人】
【識別番号】100221523
【氏名又は名称】佐藤 渉
(74)【代理人】
【識別番号】100126778
【氏名又は名称】品川 永敏
(72)【発明者】
【氏名】漢 雨生
(72)【発明者】
【氏名】劉 成林
(72)【発明者】
【氏名】張 之宏
(72)【発明者】
【氏名】張 周
(72)【発明者】
【氏名】段 飛蝶
【審査官】山内 達人
(56)【参考文献】
【文献】中国特許出願公開第107513565(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
C12N
C12M
C12Q
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
血漿サンプル中のマイクロサテライトの安定性を検出するためのキットであって、
前記キットが、
bMS-BR3、bMS-BR4、bMS-BR7、bMS-BR1、bMS-BR5、bMS-BR2、bMS-BR6、およびbMS-BR8を含むバイオマーカーパネルのための検出試薬を含み、前記検出試薬が、次世代ハイスループットシークエンシング(NGS)を実施するための試薬であり、
前記キットが、癌の非侵襲的診断、予後評価、治療法の選択または遺伝学的スクリーニングで使用され
、
前記血漿サンプルが、癌血漿サンプルであ
り、
前記検出試薬が、プローブであることを特徴とする、キット。
【請求項2】
前記キットが、結腸直腸癌、胃癌または子宮内膜癌の非侵襲的診断、予後評価、治療法の選択または遺伝学的スクリーニングで使用される、請求項
1に記載のキット。
【請求項3】
前記キットが、腸癌の非侵襲的診断、予後評価、治療法の選択または遺伝学的スクリーニングで使用される、請求項
1に記載のキット。
【請求項4】
前記血漿サンプルが、結腸直腸癌血漿サンプル、胃癌血漿サンプルまたは子宮内膜癌血漿サンプルである、請求項
1に記載のキット。
【請求項5】
前記血漿サンプルが、腸癌血漿サンプルである、請求項
1に記載のキット。
【請求項6】
前記検出試薬が、以下の41個の遺伝子:AKT1、APC、ATM、BLM、BMPR1A、BRAF、BRCA1、BRCA2、CDH1、CHEK2、CYP2D6、DPYD、EGFR、EPCAM、ERBB2、GALNT12、GREM1、HRAS、KIT、KRAS、MET、MLH1、MSH2、MSH6、MUTYH、NRAS、PDGFRA、PIK3CA、PMS1、PMS2、POLD1、POLE、PTCH1、PTEN、SDHB、SDHC、SDHD、SMAD4、STK11、TP53、およびUGT1A1のうちのいずれか1つ以上のエクソンおよびイントロン領域を捕捉するためのビオチン標識プローブセットを含む、請求項
1に記載のキット。
【発明の詳細な説明】
【技術分野】
【0001】
<関連出願への相互参照>
本出願は、2018年09月29日に出願された、出願番号がCN201811149011.0、発明名称が「血漿からマイクロサテライトの安定性およびゲノム変化を検出する次世代シークエンシングに基く方法」である特許出願、および2018年09月29日に出願された、出願番号がCN201811149015.9、発明名称が「マイクロサテライトバイオマーカーパネル、検出キットおよびその使用」である特許出願の優先権を主張する。
【0002】
<技術分野>
本発明は、バイオマーカーパネル、それを検出するキット、それを用いた血漿サンプル中のマイクロサテライトの安定性を検出する方法、および癌(好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌)の非侵襲的診断、予後評価、治療法の選択、または遺伝学的スクリーニングにおけるその使用に関する。
【背景技術】
【0003】
マイクロサテライトは、ゲノムにおける反復DNA短配列または単一ヌクレオチド領域である。腫瘍細胞において、DNAメチル化または遺伝子突然変異によってミスマッチ修復遺伝子が機能しなくなると、マイクロサテライト反復配列ミスマッチ(マイクロサテライト変異)が引き起こし、その配列が短縮しったり延長しったりして、それによってマイクロサテライト不安定性(microsatellite instability,MSI)が生じる。MSIの不安定性の程度に応じて、高頻度マイクロサテライト不安定性(microsatellite instability-high,MSI-H)、低頻度マイクロサテライト不安定性(microsatellite instability-low,MSI-L)およびマイクロサテライト安定性(microsatellite stable,MSS)のタイプに分類される。
【0004】
MSIは悪性腫瘍の発症に関与しており、結腸直腸癌(例えば腸癌)、胃癌および子宮内膜癌と密接に関連していることが多数の研究により示されている。例えば、結腸直腸癌患者の約15%がMSI-H現象を示し、そのなかの典型的な遺伝性非ポリポーシス性結腸直腸癌(hereditary nonpolyposis colorectal cancer ,HNPCC)患者の90%以上がMSI-Hを示し、これは、MSI-HがHNPCC患者を検出する際の重要なマーカーとして使用できることを表す。MSS(即ち、マイクロサテライト安定性)の結腸直腸癌と比較して、MSI-Hを有する結腸直腸癌患者は、予後がより良好であり、また、両者の薬物応答性も異なり、これはMSI-Hが結腸直腸癌の予後の独立した予測因子として使用できることを示唆する。したがって、MSI検査は結腸直腸癌患者にとって非常に重要である。
【0005】
2016年最新版の全米総合癌情報ネットワーク(National Comprehensive Cancer Network、NCCN、2016 Version 2)の結腸直腸癌治療ガイドラインは、はじめて「結腸直腸癌の既往歴のあるすべての患者は、MMR(ミスマッチ修復)またはMSIの検査を受けるべきである」と明確に述べている。それは、MSI-H(即ち、高マイクロサテライト不安定性)のII期結腸直腸癌の予後は良好(単純手術5y-OS率が80%)であり、且つ5FU補助化学療法の恩恵を受けることができない(逆に有害である)ためである。また、ガイドラインは、はじめてPD-1モノクローナル抗体PembrolizumabおよびNivolumabを、dMMR/MSI-H分子表現型を有するmCRC末期治療に応用することを推奨し、末期結腸直腸癌におけるMMRおよびMSIの検出の重要性を十分に実証している。同時に、遺伝性結腸直腸癌に関連する遺伝子の数が多いため、2016年最新のNCCN結腸直腸癌遺伝的リスク評価ガイドラインには、明らかな家族歴を有する患者およびその家族は、多遺伝子パネル(panel)シークエンシングを使用し最初の検出を実施することを推奨している。
【0006】
2017年、メルク社のPD-1モノクローナル抗体Keytrudaは、MSI-Hまたはミスマッチ修復の欠損(dMMR)を伴う固形腫瘍患者の治療薬として米国のFDAによって承認された。これは、MSI-Hが腫瘍の部位に依存しない汎癌の腫瘍マーカーとして使用できることを改めて証明した。したがって、MSIによる癌の検出は非常に重要である。
【0007】
現在、MSIの検出方法は組織の検出に限定される。例えば、中国の病院で実施されているMMR遺伝子検査は、通常、MLH1とMSH2のみを含み、その一部にはMSH6とPMS2も同時に含むが、その陽性結果とMSI検査結果との一致率が低い。少数の病院のみはキャピラリー電気泳動法と組み合わせたPCR法によるMSI状態検出を実施しており、それらのほとんどは外部委託検出である。この方法では、通常、長さが約25bpである5~11個の単一ヌクレオチド反復部位を選択し、PCR増幅した後、キャピラリー電気泳動によってその長さ分布間隔を測定して、サンプルのマイクロサテライト不安定性を判定する。この方法は、現在のゴールドスタンダード検出方法である。最近、次世代シークエンシングに基づく組織におけるMSIの検出方法は、PCR-MSIと非常に高い一致率を示すことが証明されており、MSIの状態を判断しながらゲノムマップを作成して、癌の診断により多くの情報を提供できるようになっている。しかし、これらの方法はいずれも、十分の腫瘍細胞の割合を必要する。血中循環腫瘍DNA(ctDNA)は極めて少ないため、組織に基づく方法は血漿中では実現できない。
【0008】
腫瘍の血液検査は、組織検査にはない非侵襲性、リアルタイム性、非組織特異性などの特徴があり、臨床的にも重要な意義を持つ。したがって、当技術分野では、血漿に基くMSI検出方法、特に癌、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌の非侵襲的診断、予後評価、治療法の選択、または遺伝学的スクリーニングにおいて、腫瘍の血液検査でMSIを検出する方法が切望されている。
【発明の概要】
【0009】
本発明は、初めて血漿MSIの検出方法を提出し、組織MSIの検出と比較して、本発明の血漿MSIの検出は、非侵襲性、リアルタイム性、非組織特異性、複数の病変を早期に検出できることなどの特徴がある。同時に、本発明の方法は、ctDNA含有量が非常に低い血漿サンプル中のマイクロサテライト状態の検出を実現することができ、血漿サンプルによるマイクロサテライト状態の検出のギャップを埋めた。また、本発明の方法は、検出速度が速く、白血球サンプルのマッチングに依存せず、価格が低く、検出が便利で、サンプルのマイクロサテライトの安定性(MS)の状態を高精度、高感度、高特異性で判定することができる。
【0010】
さらに、本発明の検出方法は、癌、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌の患者への非侵襲的診断、予後評価、または治療法の選択に使用することができる。
【0011】
具体的には、本発明は以下の態様に関するものである。
【0012】
一側面では、本発明は、表1に示される8つのマイクロサテライト遺伝子座のうちの1つ以上を含むバイオマーカーパネルを提供する。
【0013】
別の一側面では、本発明は、マイクロサテライト遺伝子座と1つ以上の遺伝子との組み合わせを含むバイオマーカーパネルを提供し、ここで、マイクロサテライト遺伝子座は、請求項1に示される8つのマイクロサテライト遺伝子座、またはそれらのいずれか、又はそれらのいくつかの組み合わせを含み、1つ以上の遺伝子は、以下の41種の遺伝子:AKT1、APC、ATM、BLM、BMPR1A、BRAF、BRCA1、BRCA2、CDH1、CHEK2、CYP2D6、DPYD、EGFR、EPCAM、ERBB2、GALNT12、GREM1、HRAS、KIT、KRAS、MET、MLH1、MSH2、MSH6、MUTYH、NRAS、PDGFRA、PIK3CA、PMS1、PMS2、POLD1、POLE、PTCH1、PTEN、SDHB、SDHC、SDHD、SMAD4、STK11、TP53、UGT1A1のいずれか1つ以上である。
【0014】
別の一側面では、本発明は、血漿サンプル中のマイクロサテライトの安定性を検出するためのキットであって、本発明のバイオマーカーパネルに使用するための検出試薬を含むことを特徴とするキットを提供する。
【0015】
別の一側面では、本発明は、癌、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌の非侵襲的診断、予後評価、治療法の選択または遺伝学的スクリーニングに使用するためのキットであって、本発明のバイオマーカーパネルに使用するための検出試薬を含むことを特徴とするキットを提供する。
【0016】
好ましくは、本発明によって提供されるキットにおいて、前記の血漿サンプルは、癌血漿サンプル、好ましくは、腸癌血漿サンプルのような結腸直腸癌血漿サンプル、胃癌血漿サンプル、子宮内膜癌血漿サンプルである。より好ましくは、前記のマイクロサテライトの安定性は、高頻度マイクロサテライト不安定性(microsatellite instability-high,MSI-H)、低頻度マイクロサテライト不安定性(microsatellite instability-low,MSI-L)、およびマイクロサテライト安定性(microsatellite stable,MSS)のタイプを含む。
【0017】
一実施形態では、本発明によって提供されるキットにおいて、前記の検出試薬は、ハイスループット次世代シークエンシング(Next-generation sequencing,NGS)を実行するための試薬である。
【0018】
さらに、本発明は、血漿サンプル中のマイクロサテライトの安定性の検出における、バイオマーカーパネルの使用に関する。好ましくは、前記の血漿サンプルは、癌血漿サンプル、好ましくは腸癌血漿サンプルのような結腸直腸癌血漿サンプル、胃癌血漿サンプル、子宮内膜癌血漿サンプルである。より好ましくは、前記のマイクロサテライトの安定性は、高頻度マイクロサテライト不安定性(microsatellite instability-high,MSI-H)、低頻度マイクロサテライト不安定性(microsatellite instability-low,MSI-L)、およびマイクロサテライト安定性(microsatellite stable,MSS)のタイプを含む。
【0019】
また、本発明は、癌、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌の非侵襲的診断、予後評価、治療法の選択または遺伝学的スクリーニングにおける、バイオマーカーパネルの使用に関する。
【0020】
一側面では、本発明は、以下の工程を含む、血漿サンプル中のマイクロサテライトの安定性の状態の検出に使用することができるマイクロサテライトマーカー遺伝子座を判定する方法を提供する。
1)サンプルにおけるシークエンシング領域のマイクロサテライト遺伝子座を検出する工程;
2)マイクロサテライト遺伝子座iのいずれか1つについて、NGSデータ統計によってカウントされた異なる反復配列の長さタイプのリード(リード(reads)とは、単一のDNA断片のすべてまたは一部に対応する塩基対(または塩基対確率)の推定された配列)の数をカウントする工程;および
3)マイクロサテライト遺伝子座のいずれか1つについて、マイクロサテライト安定性タイプ(MSS)での遺伝子座の反復配列の長さ特性、および高頻度マイクロサテライト不安定性(MSI-H)での遺伝子座の反復配列の長さ特性を判定し;ここで、MSSの長さ特性は、MSSサンプル中の対応するリードの数が、その遺伝子座でサポートされるリードの総数の75%を超えるような、連続した長さの最小範囲であり;MSI-Hの長さ特性は、MSSサンプルとMSI-Hサンプルにおいて高度に区別される連続した長さの範囲であり、ここで、a)この範囲でサポートされるリードの総数が、MSSサンプルにおける該遺伝子座のリードの総数の0.2%未満であり、且つb)MSI-Hサンプルにおける該遺伝子座のリードの総数の50%以上を占め、上記の特徴を有するマイクロサテライト遺伝子座を、マイクロサテライト遺伝子座の検出マーカーとする工程。
【0021】
一実施形態では、マイクロサテライトマーカー遺伝子座の判定方法において、前記のサンプルは、正常な白血球および癌患者の組織に由来するサンプルを含み、ここで、前記の癌が、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌である。好ましくは、本発明のマイクロサテライトマーカー遺伝子座の判定方法で判定されるマイクロサテライト遺伝子座は、表1に示される8つのマイクロサテライト遺伝子座のうちの1つ以上を含む。
【0022】
より好ましくは、マイクロサテライトマーカー遺伝子座の判定方法において、前記のマイクロサテライトの安定性の状態の検出は、癌、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌の非侵襲的診断、予後評価、治療法の選択または遺伝学的スクリーニングに用いられる。
【0023】
一側面では、本発明は、以下の工程を含む、次世代ハイスループットシークエンシング法に基づいて癌患者の血漿サンプルによってマイクロサテライト遺伝子座の安定性を判定する方法を提供する。
1)次世代シークエンシング法に基づいて、血漿サンプルおよび参照サンプルとしてのMSS血漿サンプルにおける複数のマイクロサテライト遺伝子座の反復配列の長さ特性を測定し、ここで、前記の複数のマイクロサテライト遺伝子座が、表1に示される8つのマイクロサテライト遺伝子座から選択される1つ以上のマイクロサテライト遺伝子座を含む工程;
2)1)に記載のマイクロサテライト遺伝子座のいずれか1つについて、その対応するエンリッチメント指数(enrichment index)Zscoreを算出する工程;
3)すべてのマイクロサテライト遺伝子座のエンリッチメント指数Zscoreを合計して、サンプルのマイクロサテライトの状態を判断する指数MSscoreを算出する工程;
4)参照サンプルとしてのMSS血漿サンプルのMSscoreの平均値(mean)および標準偏差SDを算出し、そのmean+3SDを閾値cutoffとする工程;
5)癌患者に由来する血漿サンプルについて、そのMSscore>cutoffの場合は該サンプルをMSI-Hと判定し、MSscore≦cutoffの場合は該サンプルをMSSと判定する工程。
【0024】
一実施形態では、次世代ハイスループットシークエンシング法に基づいて癌患者の血漿サンプルによってマイクロサテライト遺伝子座の安定性の状態を判定する方法において、前記のZscoreは、H
Sによって評価される。
【数1】
【数2】
式中、NはMSI-H状態およびMSS状態の反復配列の長さのセットのreadsの総数であり、KはMSI-H状態の反復配列の長さのセットのリードの総数であり、N-KはMSS状態の反復配列の長さのセットのリードの総数であり、これらに対応して、nおよびkはそれぞれ、測定サンプルにおける対応するリードの数である。
【0025】
一実施形態では、次世代ハイスループットシークエンシング法に基づいて癌患者の血漿サンプルによってマイクロサテライト遺伝子座の安定性の状態を判定する方法において、MSscoreは、以下の式に基づいて算出する。
【数3】
【0026】
好ましくは、前記の癌は、結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌である。
【0027】
さらに、別の側面において、本発明は、以下の工程を含む、次世代ハイスループットシークエンシング法に基づいて患者におけるマイクロサテライトの安定性の状態および疾患関連遺伝子変異を検出することで、該患者またはその家族のリスク管理、治療および/または予後に関する臨床的ガイダンスを提供する方法を提供する。
(1)請求項15に記載の複数のマイクロサテライト遺伝子座を同時に検出する工程;
(2)請求項15~18のいずれか一項に記載の方法に従って、前記のサンプル中のマイクロサテライト遺伝子座の安定性の状態を判定する工程;
(3)シークエンシングの結果に従って、1つ以上の前記の疾患関連遺伝子の検出結果を取得する工程;
(4)上記の工程(2)、(3)の結果を組み合わせることにより、該患者またはその家族のリスク管理、治療および/または予後に関する臨床的ガイダンスを提供する工程。
【0028】
好ましくは、本発明によって提供される、次世代ハイスループットシークエンシングに基づいて患者におけるマイクロサテライトの安定性の状態および疾患関連遺伝子変異を検出することで、該患者またはその家族のリスク管理、治療および/または予後に関する臨床的ガイダンスを提供する方法において、前記の疾患は癌、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌である。
【0029】
さらに、別の側面において、本発明は、前記の複数のマイクロサテライト遺伝子座を検出するための試薬を含む、本発明の様々な方法のうちの1つに用いられるキットに関する。
【0030】
さらに、別の側面において、本発明は、以下のモジュールを含む、血漿サンプル中のマイクロサテライトの安定性の状態の検出に用いられるマイクロサテライトマーカー遺伝子座を判定するための装置を提供する。
シークエンシング装置で取得して保存したサンプルのシークエンシングデータを読み取るためのシークエンシングデータ読み取りモジュール;
サンプルのシークエンシングデータから、サンプルにおけるシークエンシング領域のすべてのマイクロサテライト遺伝子座を解析して検出するためのマイクロサテライトマーカー遺伝子座検出モジュール;
マイクロサテライト遺伝子座iのいずれか1つについて、シークエンシングデータ読み取りモジュールで読み取られたサンプルシーケンスデータによって、異なる反復配列の各長さタイプのリードの数をカウントするための反復配列長さタイプ判定モジュール;および
第1の解析モジュール、第2の解析モジュール、および第3の解析モジュールを含む、マイクロサテライト遺伝子座iのいずれか1つがマイクロサテライトマーカー遺伝子座であるかどうかを判定するための判定モジュール;
前記の第1の解析モジュールは、マイクロサテライト安定性(MSS)での遺伝子座反復配列の長さ特性を判定し、また、MSSサンプル中の対応するリードの数が遺伝子座でサポートされるリードの総数の75%を超えるかどうかを判定するために使用され、ここで、MSSの長さ特性が連続した長さの最小範囲であり、肯定的な結果が得られた場合では「+」と記録し、否定的な結果が得られた場合では「-」と記録し、
前記の第2の解析モジュールは、高頻度マイクロサテライト不安定性(MSI-H)での遺伝子座反復配列の長さ特性を判定し、また以下のa)およびb)を判定するために使用され、ここで、MSI-Hの長さ特性が、MSSサンプルとMSI-Hサンプルにおいて高度に区別される連続した長さの範囲であり、a)前記の連続した長さの範囲内でサポートされるリードの総数が、MSSサンプルにおける遺伝子座のリードの総数の0.2%未満であるかどうかを判定し、肯定的な結果が得られた場合では「+」と記録し、否定的な結果が得られた場合では「-」と記録し、
b)前記のリードが、MSI-Hサンプルにおける該遺伝子座のリードの総数の50%以上を占めるかどうかを判定し、肯定的な結果が得られた場合では「+」と記録し、否定的な結果が得られた場合では「-」と記録し、
前記の第3の解析モジュールは、第1の解析モジュールおよび第2の解析モジュールの結果を分析するために使用され、3つの肯定的な結果、即ち3つの「+」が得られた場合では、前記のマイクロサテライト遺伝子座iをマイクロサテライトマーカー遺伝子座として判定する。
【0031】
好ましくは、本発明によって提供される血漿サンプル中のマイクロサテライトの安定性の状態の検出に用いられるマイクロサテライトマーカー遺伝子座を判定するための装置において、前記のサンプルは、正常な白血球および癌患者の組織に由来するサンプルを含み、前記の癌症は、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌である。より好ましくは、上記の装置によって判定されるマイクロサテライト遺伝子座は、表1に示される前記の8つのマイクロサテライト遺伝子座のうちの1つ以上を含む。
【0032】
一実施形態では、本発明によって提供される血漿サンプル中のマイクロサテライトの安定性の状態の検出に用いられるマイクロサテライトマーカー遺伝子座を判定するための装置において、前記のマイクロサテライトの安定性の状態の検出は、癌、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌の非侵襲的診断、予後評価、治療法の選択または遺伝学的スクリーニングに用いられる。
【0033】
さらに、別の側面において、本発明は、以下のモジュールを含む、次世代ハイスループットシークエンシング法に基づいて癌患者の血漿サンプルによってマイクロサテライト遺伝子座の安定性の状態を判定するための装置を提供する。
シークエンシング装置で取得して保存したサンプルのシークエンシングデータを読み取るためのシークエンシングデータ読み取りモジュール;
サンプルのシークエンシングデータから、血漿サンプルおよび参照サンプルとしてのMSS血漿サンプルにおける複数のマイクロサテライト遺伝子座の反復配列の長さ特性を解析するための反復配列長さ特性判定モジュール;
ここで、前記の複数のマイクロサテライト遺伝子座が、表1に示される8つのマイクロサテライト遺伝子座から選択される1つ以上のマイクロサテライト遺伝子座を含み;
マイクロサテライト遺伝子座のエンリッチメント指数Zscoreを算出するためのエンリッチメント指数算出モジュール;
すべてのマイクロサテライト遺伝子座のエンリッチメント指数Zscoreを合計して、サンプルのマイクロサテライトの状態を判断することができる指数MSscoreを算出するためのマイクロサテライト状態指数算出モジュール;
参照サンプルとしてのMSS血漿サンプルのMSscoreの平均値meanおよび標準偏差SDを算出し、そのmean+3SDを閾値cutoffとする閾値算出モジュール;および
癌患者に由来する血漿サンプルについて、そのMSscore>cutoffの場合は該サンプルをMSI-Hと判定し、MSscore≦cutoffの場合は該サンプルをMSSと判定するような、指数MSscoreと閾値cutoffを比較するためのマイクロサテライト遺伝子座安定性状態判定モジュール。
【0034】
一実施形態では、次世代ハイスループットシークエンシング法に基づいて癌患者の血漿サンプルによってマイクロサテライト遺伝子座の安定性の状態を判定するための装置において、前記のZscoreは、H
Sによって評価される。
【数4】
【数5】
式中、NはMSI-H状態およびMSS状態の反復配列の長さのセットのreadsの総数であり、KはMSI-H状態の反復配列の長さのセットのリードの総数であり、N-KはMSS状態の反復配列の長さのセットのリードの総数であり、これらに対応して、nおよびkはそれぞれ、測定サンプルにおける対応するリードの数である。
【0035】
好ましくは、上記のマイクロサテライト遺伝子座の安定性の状態を判定するための装置において、MSscoreは、以下の式に基づいて算出する。
【数6】
【0036】
より好ましくは、上記のマイクロサテライト遺伝子座の安定性の状態を判定するための装置において、前記の疾患は癌、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌である。
【図面の簡単な説明】
【0037】
【
図1】
図1(A)は、完全MSI-H癌細胞および白血球サンプルにおけるマイクロサテライトマーカー遺伝子座bMS-BR1の各反復配列の長さのリードの数の分布を示す。青枠(下の方)は、該遺伝子座のMSSの特性範囲が22~25bpであることを示し、赤枠(上の方)は、該遺伝子座のMSI-Hの特性範囲が<16bpであることを示す。
図1(B)は、完全MSI-H癌細胞および白血球サンプルにおける非マーカー遺伝子座の各反復配列の長さの断片の分布を示す。該遺伝子座の反復配列の長さは約2bp短くなったが、この差は、腫瘍のctDNA含有量が非常に少ない条件下で、白血球自体の捕捉の変動と区別するのに十分ではなく、MSI-Hサンプルにのみ高頻度で現れる反復配列の長さタイプは存在しない。
【
図2】
図2は、bMSISEAの検出効果を示す。
図2(A)は、127例の腸癌血漿サンプルのMSscoreの分布を示す。ここで、MS状態は、マッチした組織によって判定され、合計44例のMSI-Hサンプルと83例のMSSサンプルを含む。MSscoreがcutoff=15より高い場合、血漿サンプルはMSI-Hと判定され、MSscoreが15以下の場合、MSSと判定された。
図2(B)は、44例のMSI-HサンプルmaxAFとMSscoreとの相関関係を示す。赤い点(水平線の下)はMSscore>15であることを示し、該サンプルはMSI-Hと判定され、青い点(水平線の上)はMSscoreが閾値を満たしていなかったことを示し、該サンプルはMSSと判定された。
図2(C)は、シミュレーションサンプルによる検出感度とmaxAFとの相関関係を示す。結果は、異なるctDNA含有量勾配を持つ350例のシミュレーションサンプルに基づいてたものである。横軸は、maxAFが対応する値より大きいサンプルのみがカウントされるものを示し、縦軸はMSI-Hの検出感度を示す。maxAF>0.2%の場合、MSI-H検出の感度は93%より高く、maxAF>0.5%の場合、感度は98%より高い。
【発明を実施するための形態】
【0038】
本発明は、次世代シークエンシングに基づいて、血漿によってマイクロサテライトの安定性および疾患関連遺伝子を検出する方法を初めて提供する。また、この検出方法に基づいて、癌、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌を高い感度および特異性で検出するためのMSI遺伝子座が得られる。
【0039】
さらに、本発明は、血漿サンプルに基づいてマイクロサテライト状態を検出することに使用できるマイクロサテライトマーカー遺伝子座を決定する方法を確立する。さらに、本発明は、サンプル中の複数のマイクロサテライト遺伝子座と複数の疾患関連遺伝子との同時検出を実現し、これにより、検出されたサンプルについて、予後、治療、調査などに関するより総合的な結論および提案を与えることができる。
【0040】
このように、本発明は、初めて血漿MSIの検出方法を提供し、組織MSIの検出と比較して、本発明の血漿MSIの検出は、非侵襲性、リアルタイム性、非組織特異性などの特徴がある。同時に、本発明の方法は、ctDNA含有量が非常に低い血漿サンプルにおいてマイクロサテライト状態の検出を実現することができ、血漿サンプルによるマイクロサテライト状態の検出のギャップを埋めた。また、本発明の方法は、ctDNA含有量が0.4%超のサンプルに対して非常に高い正確率を達成することができ、検出速度が速く、白血球サンプルのマッチングに依存せず、価格が低く、検出が便利で、サンプルのマイクロサテライトの安定性(MS)の状態を高感度、高特異性で判定することができる。
【0041】
さらに、本発明の検出方法は、癌、好ましくは結腸直腸癌(例えば腸癌)、胃癌または子宮内膜癌の患者への非侵襲的診断、予後評価、または治療法の選択に使用することができる。
【0042】
また、本発明は、血漿サンプル中のマイクロサテライトの安定性の状態の検出に用いられるマイクロサテライトマーカー遺伝子座を判定するための装置、および次世代ハイスループットシークエンシング法に基づいて癌患者の血漿サンプルによってマイクロサテライト遺伝子座の安定性の状態を判定するための装置を提供する。
【0043】
本発明者らは、高頻度マイクロサテライト不安定性のサンプルについて、そのマイクロサテライト遺伝子座が、誤ったDNA重複により、多数の反復配列の拡張または収縮を引き起こすことを見出した。この点に対して、MSI-H組織サンプルと正常な白血球サンプルについて、リードの反復配列の長さタイプを比較することにより、MSI-H組織サンプルでは多数出現し、正常な白血球サンプルではほとんど出現しない反復配列の長さタイプを見出し、MSI-H状態の遺伝子座の反復配列の長さの特徴とする。
【0044】
マーカー遺伝子座を選択する具体的な基準は次の通りである。a)MSSサンプルにおいて該反復配列の長さ範囲内のリードの数は、該遺伝子座のリードの総数の0.2%未満である。b)MSI-Hサンプルにおいて、該範囲内のリードの数は、遺伝子座でサポートされるリードの総数の50%以上を占める。なお、該長さ範囲は、MSI-H状態の遺伝子座の反復配列の長さの特性として定義される。上記の2つの条件により、本方法は、ctDNAの含有量が極めて少ない場合でも、MSI-Hの長さ特性をカバーするリードがほぼ完全に腫瘍DNAに由来することを確保する。
【0045】
この選択に基づいて、発明者らは、8つのマイクロサテライトマーカー遺伝子座(詳細は表1を参照)をスクリーニングした。
表1 マイクロサテライト検出マーカー遺伝子座の情報
【表1】
【0046】
本発明は、次世代ハイスループットシークエンシングに基づいて癌患者に由来する血漿サンプル中のマイクロサテライト遺伝子座の安定性の状態を判定する方法に基づき、つまり、出願者のbMSISEAというマイクロサテライト不安定性血漿検出技術の主な戦略は、まず、組織サンプルに基いて、MSI-HおよびMSS状態でのリードのカバレッジが全く異なるマーカー遺伝子座を見出し、両方の状態で遺伝子座によってサポートされるリードの主な長さのタイプを記述し、各マーカー遺伝子座についてMSI-H状態でのリードの特性をエンリッチメント解析することにより、不安定性の状態を評価し、サンプルのマイクロサテライトの状態を判定する。
【0047】
本発明の癌患者に由来する血漿サンプル中のマイクロサテライト遺伝子座の安定性の状態を判定する方法は、以下の工程を含む。1)サンプルの準備、シークエンシング領域のマイクロサテライト遺伝子座の検出、および遺伝子座の反復配列の長さタイプに関する統計を含むデータの準備;2)マーカー遺伝子座のスクリーニングおよび遺伝子座特性の記述;3)マイクロサテライト不安定性の特性のエンリッチメント解析;4)各遺伝子座のエンリッチメント指数の平均変動レベルの評価;5)測定血漿サンプルのエンリッチメント指数の相対レベルに基づいてMSscoreを構築し、サンプルのMS状態を判定する。
【0048】
さらに、本明細書は、本発明を理解するために以下の実施例を提供するが、本発明の範囲は、添付の特許請求の範囲に示されている。所定の方法は、本発明の精神から逸脱することなく変更できることを理解すべきである。
【0049】
実施例
1.データの準備:遺伝子パネルの検出は、次世代シークエンシング法に基づいて以下のような手順で実行された。
組織サンプルの採取手順は次の通りである。QIAamp DNA FFPE tissue kit(QIAGEN:56404)を使用して腫瘍組織および側癌性(paracancerous)正常組織のDNAを抽出した。Qubit3.0蛍光光度計およびdsDNA HS アッセイキット(ThermoFisher:Q32854)を使用して正確な定量を行った。ソニケーターCovaris M220(Covaris:PN500295)を使用して、物理的にDNAを180~250bpの断片に断片化し、末端修復、リン酸化させ、3’末端にデオキシアデニンを付加し、リンカーでライゲーションした。次に、増幅リンカーにライゲーションされたDNAを、Agencourt AMPure XP常磁性ビーズで精製し、PCRポリメラーゼで前増幅を行い、精製された増幅産物を、Agilentでカスタマイズされた多重ビオチン標識プローブセットとハイブリダイズさせた(遺伝子パネル(panel)のデザインには、41遺伝子のエクソンおよび一部のイントロン領域の配列を含む)。ハイブリダイゼーションに成功した断片を特異的に溶出し、PCRポリメラーゼで増幅した後、定量化および断片長さの分布の測定を行い、IlluminaNovaseq 6000シークエンサー(カタログ番号:20012850)を使用してシークエンシング深度(sequencing depth)1000Xで次世代シークエンシングを実行した。
【0050】
血液サンプルの採取手順は次の通りである。まず、核酸抽出試薬で血漿中の遊離DNAおよびマッチした末梢血白血球のゲノムDNAを抽出し、白血球のゲノムDNAを断片化した。次に、リンカーの付加、PCR増幅などの手順を経て、全ゲノムプレライブラリーを作成した。ビオチンで標識された特定の配列のRNAプローブをこのプレライブラリーとハイブリダイズさせて、ヒトゲノムにおける41遺伝子のエクソンおよびイントロン領域の一部(全コーディング領域、エクソン-イントロン接合領域、UTR領域およびプロモーター領域)を特異的に捕捉した。プローブによって捕捉されたDNA断片を、ストレプトアビジン磁気ビーズで濃縮し、濃縮したDNA断片を増幅のテンプレートとして使用して、最終的なライブラリーを作成した。最終ライブラリーの定量および品質管理の後、IlluminaNovaSeq遺伝子シークエンサーを使用して、15000Xのシークエンシング深度で最終ライブラリーに対してハイスループットシークエンシングを行った。
【0051】
最後に、BWAバージョン0.7.10を使用して、測定された配列をヒトゲノム配列(バージョンhg19)とアライメントし、アライメントの局所的最適化にGATK 3.2を使用し、変異コールにVarScan 2.4.3を使用し、変異アノテーションにANNOVARおよびSnpEff4.3を使用した。変異コール(calling)について、カバレッジの低い遺伝子座はVarScanfpfilterによって除去され(組織:50X未満、血漿:500X未満、白血球:20X未満);インデル(indel)および単一点突然変異について、それぞれ少なくとも5つと8つの変異したリードが必要であった。
【0052】
2.次世代ハイスループットシークエンシング(Next-generation sequencing,NGS)データに基づくマイクロサテライト遺伝子座の反復配列の長さタイプの統計
マイクロサテライト不安定性検出アルゴリズムbMSISEAの検出には、癌血漿サンプルのバイナリシークエンスアラインメント(BAM、binary sequence alignment)ファイルのみが必要である。ベースライン構築の際には、マッチしたMSI-H癌組織および正常組織の十分なサンプル(数が50を超える)、十分な白血球サンプル(数が100を超える)、および十分なMSS血漿サンプル(数が100を超える)のBAMファイルもさらに必要である。
【0053】
この方法では、まず、MSIsensor(v0.5)ソフトウェアで、シークエンシングカバレッジ領域において長さが10を超え、且つ反復配列が1であるマイクロサテライト遺伝子座をすべて取得し、マイクロサテライト遺伝子座の各長さタイプの反復配列によってカバーされるリードの数を算出した。
【0054】
MSIsensorによって遺伝子座の各長さタイプでカバーされるリードの数をカウントする方法は次の通りである。各マイクロサテライト遺伝子座について、まず、ヒトゲノムでその位置情報および両端の配列を検索し、さらに、両端の配列によって接続された1~L-10bpの中間的反復配列の長さを持つすべての配列を、検索辞書として構築し、ここで、Lがリードの長さである。例えば、1番染色体上のある1塩基のマイクロサテライト遺伝子座(14T、Tは繰り返し塩基、14は繰り返し数)の場合、その両端の配列はそれぞれATTCCとGCTTTであり、構築された検索辞書は、ATTCCTGCTTT(繰り返し長さが1)、ATTCCTTGCTTT(繰り返し長さが2)、ATTCCTTTGCTTT(繰り返し長さが3)などを含む。次に、少なくとも片方の端が遺伝子座の2kb以内に位置するペアのリード(paired reads)を、サンプルのBAMファイルから抽出し、該遺伝子座の検索辞書における配列にアラインメントした。検索辞書における異なる長さをカバーするリードの数をカウントし、遺伝子座のすべての長さタイプをカバーするリードの数のヒストグラムを作成した。
【0055】
3.マイクロサテライト不安定性のマーカー遺伝子座のスクリーニング
3.1 MSS状態の遺伝子座の反復配列の長さ特性
正常なサンプルのマイクロサテライト遺伝子座について、リードがカバーされる確率が高いのは、サンプルの遺伝子型に対応する1種または2種の反復配列の長さタイプである。このステップでは、白血球サンプルに基づいて、正常状態の各遺伝子座のリードに現れる確率が高い反復配列の長さタイプを、MSS状態の遺伝子座の反復配列の長さ特性として記述した。各遺伝子座の各白血球サンプルについて、対応するリードの数が、その遺伝子座によってサポートされるリードの総数の75%を超えるように、連続した長さの最小範囲を検索し、この連続した長さの範囲は、該サンプルの該遺伝子座におけるピーク(peak)領域と呼ばれる。各遺伝子座について、白血球サンプルの少なくとも25%でピーク(peak)領域として選択された反復配列の長さ範囲を、MSS状態の該遺伝子座の反復配列の長さ特性とした。
【0056】
3.2 MSI-H状態の遺伝子座の反復配列の長さ特性およびマーカー遺伝子座の選択
高頻度マイクロサテライト不安定性のサンプルについて、そのマイクロサテライト遺伝子座は、誤ったDNA重複により、多数の反復配列の拡張または収縮を引き起こす。ここでは、長い反復配列の配列収縮の現象に注目した。このステップでは、マッチしたMSI-H癌組織および側癌性正常組織のサンプルに基づいて、MSI-H状態でリードに大量発生する正常状態とは異なる反復配列の長さのタイプを、MSI-H状態の遺伝子座の反復配列の長さ特性として記述した。癌組織のサンプルは癌細胞と正常細胞との混合物であるため、本方法の最初のステップは、サンプル中の腫瘍細胞の割合を推定することである。具体的に、癌組織および側癌性正常組織において、各遺伝子座のMSS状態に対応する遺伝子座の反復配列の長さタイプのリードの数をカウントし、癌組織のサンプルにおけるMSS状態のリードが完全に正常細胞から由来すると仮定して、線形モデルを確立し、腫瘍細胞の割合uを推定した。次のステップでは、癌組織およびマッチした正常組織のリードの総数を正規化した後、癌組織における各遺伝子座での反復配列のそれぞれの長さのリードの数から、マッチした正常組織の対応するデータのu倍を対応して差し引くことにより、完全なMSI-H癌細胞の反復配列の長さの統計データを推定した。
【0057】
すべてのマイクロサテライト遺伝子座について、完全なMSI-H癌細胞の反復配列の長さの統計データに基づいて、bMSISEAのマーカー遺伝子座として、以下の特徴を持つ遺伝子座を選択し、その反復配列の長さ範囲をMSI-H状態の遺伝子座での反復配列の長さ特性とした。前記の特徴は、該反復配列の長さ範囲でサポートされるリードの総数が、MSSサンプルにおいて該遺伝子座のリードの総数の0.2%未満であり、且つMSI-Hサンプルにおいて該遺伝子座のリードの総数の50%以上を占めることである。上記の2つの条件により、ctDNAの含有量が極めて少ない場合でも、MSI-Hの長さ特性をカバーするリードは、ほぼ完全に癌DNAに由来する。
【0058】
上記の方法に従ってスクリーニングされたマイクロサテライト状態検出用の8つのマイクロサテライト検出マーカー遺伝子座を表1に示す。
図1(A)は、マーカー遺伝子座bMS-BR1を示す。ここで、MSS状態の遺伝子座の反復配列の特徴的な長さ範囲は22~25bpであり、MSI-Hの特徴的な長さ範囲は1~16bpである。また、
図1(B)は、2種類のサンプルにおける非マーカー遺伝子座のカバレッジ特徴マップを示す。MSSサンプルと比較して、MSI-H状態の該遺伝子座の反復配列の長さは約2bp短くなったが、この変動は、ctDNA含有量が非常に少ない条件下で、白血球自体の捕捉の変動と区別できず、マーカー遺伝子座のスクリーニング条件を満たさないため、サンプルのマイクロサテライト状態の判定には使用できない。
【0059】
4.MSI特性のエンリッチメント解析
各マーカー遺伝子座について、正常な白血球サンプルにおけるMSSおよびMSI-H状態での長さ特性のセットに対応するリードの数をバックグラウンドとして、血漿サンプルをMSI-H特性のエンリッチメント解析にかけた。このステップでは、大量の正常な白血球のサンプルに基づいて、MSS状態およびMSI-H状態での反復配列の長さセットに対応するリードの総数を算出し、それぞれKおよびN-Kと表記した。また、血漿サンプルについては、MSS状態およびMSI-H状態での反復配列の長さセットに対応するリードの数kおよびn-kを同様に算出した。サンプルの状態がMSSであれば、リードの特性は、白血球のサンプルの状態と一致し、超幾何分布に適合する。
【数7】
したがって、遺伝子座のエンリッチメント指数は、H
Sによって評価することができる。
【数8】
【0060】
さらに、大量のMSS血漿サンプルに基づいて、各遺伝子座のエンリッチメント指数の変動範囲を求めた。測定血漿サンプルについて、この変動範囲に基づいて、各遺伝子座のエンリッチメント指数Zscoreを算出し、すべてのZscoreを合計して、サンプルのマイクロサテライト状態を判定する指数MSscoreを得た。
【数9】
【0061】
bMS-BR1遺伝子座を例として、100例のWBCサンプルに基づいて、反復配列の長さ範囲が1~16bpのリードの総数Kは504であり、長さ範囲が1~16bpまたは22~25bpのリードの総数Nは190588である。また、測定サンプルについては、1~16bpの長さ範囲にある該遺伝子座での反復配列のリードの総数kは65であり、1~16bpまたは22~25bpの長さ範囲にあるリードの総数nは1308である。これにより、H
S=-log(P
S(X>k
S)=-log(P
S(X>65)=140.6である。さらに、MSS血漿サンプルに基づいて、H
Sの変動レベルを評価した。その結果を表1に示す。
によって該遺伝子座のZscore値は108.6である。その他の遺伝子座の計算方法は上記の通りである。最後に、すべてのZscoreを合計して、該遺伝子座の最終的なMSscoreは355.3である。このサンプルでは、MLH1の疑わしい病原性のシステムのフレームシフト変異p.D214fsと、PIK3CA、KRAS、PTENを含む病原性/疑わしい病原性の変異と、BRCA2、STK11、PMS1を含む病原性の情報が不明な変異と、キットに含まれる他の遺伝子の良性変異とを同時に検出した。
【0062】
5.癌サンプルにおけるマイクロサテライト状態の判定
血漿サンプルについて、MSS血漿サンプルのMSscore値に基づいて、その平均値meanおよび標準偏差SDを算出し、mean+3SDを閾値cutoffとする。MSscore>cutoffの場合、サンプルをMSI-Hと判定し、MSscore≦cutoffの場合、サンプルをMSSと判定する。
【0063】
6.bMSISEAマイクロサテライト不安定性の血漿の検出結果
bMSISEAマイクロサテライト検出技術を使用し、表1に示される8つのマイクロサテライトマーカー遺伝子座および検出キットに基づいて、127例の実際の臨床腸癌の血漿サンプルでに対して、変異およびマイクロサテライトの検出を含むNGS検出を実行した。サンプルのマイクロサテライト状態は、対応する患者のマッチした組織サンプルに基づいて、IHCおよびNGS-MSI技術によって二重確認され、最終的に44例のMSI-Hサンプルと83例のMSSサンプルで構成された。ここで、組織の検出方法は次の通りである。反復配列の長さの違いに基づいて、NGS検出法で22個のマーカー遺伝子座によってサンプルのマイクロサテライト状態を判定した。本方法では、各マーカー遺伝子座について、MSS状態で集合的に現れたリードの反復配列の長さ範囲を評価し、この範囲内のリードの該遺伝子座でのリードの総数に対する変化率を評価した。mean-3sdを閾値として、測定サンプルにおける該遺伝子座での上記の比率が閾値よりも小さい場合、該遺伝子座は不安定性の遺伝子座であると判断される。不安定性の遺伝子座の総数が遺伝子座の総数の15%未満であれば、サンプルはMSSと判定され、また、40%を超えれば、サンプルはMSI-Hと判定され、両方の中間であれば、MSI-Lとして判定される。この検出方法は、中国特許出願第201710061152.6号を参照することができる。さらに、組織病理学的切片を通してIHC評価を行った。MLH1、PMS2、MSH2、およびMSH6タンパク質を含むMMRタンパク質の発現状況は、免疫組織化学法を使用したIHC法によって検出された。タンパク質の1つが欠失している場合はdMMRと判定され、タンパク質が欠失していない場合はpMMRと判定される。dMMRの患者は通常、ミスマッチ修復機構の異常なによってMSI-Hになっている。
【0064】
該127例の血漿サンプルにおけるbMSISEA法による検出結果およびそれらにマッチした組織の検出結果に基づて比較することで、bMSISEA法の感度および特異性を得た。それぞれ表2に示す。
【0065】
表2. 127例の腸癌の血漿に基づくbMSISEAの検出結果(組織検出結果に基づく)
【表2】
【0066】
ctDNA(maxAF>0.2%)の場合、血漿MSIの検出の精度は98.5%に達した。
【表3】
【0067】
*組織検出によるマイクロサテライトの状態の結果は、NGSおよびIHCの方法で二重確認された。検出指標のうち、感度:sensitivity;特異性:specificity;PPV:陽性予測値(positive predictive value);NPV:陰性予測値(negative predictive value);精度:accuracy。それらの計算方法は以下の通りである。
【数10】
【0068】
ここで、TP、TN、FP、FNはそれぞれ、真陽性(組織と血漿の検出結果が両方ともMSI-H)、真陰性(組織と血漿の検出結果が両方ともMSS)、偽陽性(組織の検出結果がMSS、血漿の検出結果がMSI-H)、偽陰性(組織の検出結果がMSI-H、血漿の検出結果がMSS)であるサンプルの数を表す。
【0069】
表2から、血漿サンプルによるMSI-H検出の特異性は100%であることが分かる。スクリーニングせずにすべてのサンプルを含む場合、ほとんどのサンプルにおけるctDNA含有量が極めて低いため、全体の検出感度はわずか52.3%であり、精度は83.5%である。これに対して、maxAF>0.2%(ctDNA>0.4%)を満たた血漿サンプルのみをスクリーニングした場合、検出感度は93.8%、精度は98.5%である。実際に、このサンプル群の中でmaxAF>0.5%のサンプルのみをスクリーニングした場合、検出精度は100%である。このように、検出の特異性を確保することを前提として、血漿中に十分な量のctDNAを含む場合、bMSISEAは十分に高い検出感度を有することが分かる。
【0070】
さらに、より詳細な検出結果を
図2に示す。
図2(A)は、127例の腸癌の血漿サンプルのMSI検出によるMSscore分布を示す。bMSISEA法によると、83例のMSSサンプルのMSscoreは15未満であり、特異性は100%である。23/44例のMSI-HサンプルのMSscoreは15を超え、感度は52.3%である。サンプル間のctDNA含有量の違いを考慮して、
図2(B)は、maxAFとMSI-HサンプルのMSscoreとの相関関係を示す。maxAF>0.2%のサンプルのみを考慮すると、15/16例のMSI-HサンプルのMSscoreは15を超え、精度は93.8%である。
【0071】
7.シミュレーション実験における検出感度に対する血漿中のctDNA含有量の影響の確認
一般に、血漿中のctDNAの含有量は極めて低いため、検出感度はctDNAの含有量に影響される。そこで、本実験では、実際の臨床血漿および白血球サンプルに基づいて、ctDNA含有量勾配が異なる350例のシミュレーションサンプル群を構築し、異なるctDNA含有量の条件下で、本方法で血漿サンプルによってマイクロサテライト不安定性を検出する感度を評価した。ここで、癌サンプルのctDNA含有量は、サンプルの最大体細胞遺伝子変異頻度(maxAF)によって評価することができる。
【0072】
マッチした血漿と白血球のサンプルの18ペアを選択し、血漿および白血球のサンプルのbamファイルを、血漿サンプルのmaxAFによる割合で混合し、元の血漿サンプルに再サンプリングして、ctDNA含有量勾配が異なる350例のサンプルをシミュレートし、異なる含有量のctDNAを含む血漿サンプルの感度レベルを評価した。シミュレーションサンプルでは、実際の臨床サンプルと同様の変異検出プロセスを採用して変異を検出し、maxAFレベルを決定した。
図2(C)に示すように、横軸はmaxAFが閾値より大きいサンプルのみをカウントしたものであり、縦軸はMSI-Hの検出感度である。maxAF>0.2%の場合、MSI-Hの検出感度は93%より高く、maxAF>0.5%の場合、感度は98%より高い。ctDNAの含有量が低すぎると、MSI-Hの検出に限界があるが、ctDNAの含有量が安定した検出範囲(maxAF>0.2%)に達すると、bMSISEA法は、サンプルのマイクロサテライトの安定性(MS)の状態を高精度と高感度で判定することができ、血漿中のMSの状態を非侵襲的に検出する可能性を提供する。
【0073】
したがって、maxAF>0.2%(0.4%を超えるctDNA含有量にほぼ対応)の血漿サンプルに対して、bMSISEA法により、組織検出に匹敵する感度および極めて高い特異性を得ることができる。組織のMSI検出と比べて、本発明の血漿のMSI検出には、非侵襲的診断、非組織特異性、複数の病変の検出などのリキッドバイオプシーの独特の利点がある。bMSISEA法は、マッチした白血球サンプルに依存せずに、サンプルのマイクロサテライトの状態を判定しながら変異を検出するため、低価格で高速に処理することができる。