(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-05-25
(54)【発明の名称】マイクロサテライト不安定性シグネチャー
(51)【国際特許分類】
G16B 20/20 20190101AFI20230518BHJP
G01N 33/50 20060101ALI20230518BHJP
C12Q 1/6869 20180101ALI20230518BHJP
A61K 45/00 20060101ALI20230518BHJP
A61K 39/395 20060101ALI20230518BHJP
A61P 35/00 20060101ALI20230518BHJP
C07K 16/40 20060101ALN20230518BHJP
C07K 16/28 20060101ALN20230518BHJP
【FI】
G16B20/20
G01N33/50 P ZNA
C12Q1/6869 Z
A61K45/00
A61K39/395 D
A61K39/395 N
A61K39/395 U
A61P35/00
C07K16/40
C07K16/28
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2022554317
(86)(22)【出願日】2021-03-10
(85)【翻訳文提出日】2022-11-04
(86)【国際出願番号】 US2021021769
(87)【国際公開番号】W WO2021183683
(87)【国際公開日】2021-09-16
(32)【優先日】2020-03-12
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】521209823
【氏名又は名称】パーソナル ゲノム ダイアグノスティクス インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ウッド, デリック
【テーマコード(参考)】
2G045
4B063
4C084
4C085
4H045
【Fターム(参考)】
2G045AA26
2G045CB02
2G045DA13
4B063QA13
4B063QQ02
4B063QQ08
4B063QQ28
4B063QQ42
4B063QQ62
4B063QR08
4B063QR32
4B063QR42
4B063QR72
4B063QR77
4B063QS03
4B063QS25
4B063QS34
4B063QS36
4B063QX02
4C084AA17
4C084NA14
4C084ZB26
4C085AA13
4C085AA14
4C085BB11
4C085EE01
4H045AA11
4H045AA20
4H045AA30
4H045BA10
4H045CA40
4H045DA76
4H045EA28
4H045FA74
(57)【要約】
患者サンプルからの核酸におけるヌクレオチドリピートトラクトおよび体細胞変異に基づいてマイクロサテライト不安定性(MSI)を決定する方法が本明細書で提供される。本明細書で提供される方法は、サンプルをMSIまたはマイクロサテライト安定性(MSS)として分類するためのゲノムシグネチャースコアおよびMSIスコアを決定するステップを含む。本明細書で提供される方法は、免疫療法のために患者を選択するのに有用である。
【特許請求の範囲】
【請求項1】
マイクロサテライト不安定性(MSI)を決定する方法であって、
(i)対象から得られたサンプル中の配列決定されたDNAの複数のヌクレオチドリピートトラクトにおける体細胞対立遺伝子長の存在を決定するステップと、
(ii)前記複数のヌクレオチドリピートトラクトの外側領域における前記DNAの体細胞変異の存在を決定するステップと、
(iii)前記複数のヌクレオチドリピートトラクトの外側に見出される前記体細胞変異のゲノムシグネチャーとミスマッチ修復欠損のゲノムシグネチャーとの適合を決定するステップと、
(iv)MSIスコアを取得するために前記決定ステップの結果に規則を適用するステップと、
(v)前記MSIスコアに基づいて前記サンプルをマイクロサテライト不安定性-高(MSI-H)またはマイクロサテライト安定性(MSS)として分類するステップと
を含む、方法。
【請求項2】
前記MSIスコアと、前記サンプルのマイクロサテライト不安定性-高(MSI-H)またはマイクロサテライト安定性(MSS)としての分類とを含むレポートを作成するステップをさらに含む、請求項1に記載の方法。
【請求項3】
前記サンプルが腫瘍サンプルである、請求項1に記載の方法。
【請求項4】
前記複数のヌクレオチドリピートトラクトが、モノヌクレオチドリピート、ジヌクレオチドリピート、トリヌクレオチドリピート、テトラヌクレオチドリピート、ペンタヌクレオチドリピート、ヘキサヌクレオチドリピート、ヘプタヌクレオチドリピート、オクタヌクレオチドリピートまたはそれらの組み合わせを含む、請求項1に記載の方法。
【請求項5】
前記複数のヌクレオチドリピートトラクトがモノヌクレオチドリピートを含む、請求項4に記載の方法。
【請求項6】
MSI-Hサンプル中のヌクレオチドリピートトラクトが、参照サンプル中のヌクレオチドリピートトラクトと比較してより短い、請求項1に記載の方法。
【請求項7】
MSI-Hサンプル中のヌクレオチドリピートトラクトが、参照サンプル中のヌクレオチドリピートトラクトと比較して少なくとも2塩基対短い、請求項1に記載の方法。
【請求項8】
前記参照サンプルが、マッチした正常サンプルまたはMSSサンプルである、請求項6に記載の方法。
【請求項9】
ヌクレオチドリピートのより短いトラクトの頻度を決定するステップをさらに含む、請求項6に記載の方法。
【請求項10】
前記複数のヌクレオチドリピートトラクトが1またはそれを超えるマイクロサテライトマーカーを含む、請求項1に記載の方法。
【請求項11】
前記1またはそれを超えるマイクロサテライトマーカーがヒトゲノムマイクロサテライトマーカーから選択される、請求項10に記載の方法。
【請求項12】
前記体細胞変異の前記ゲノムシグネチャーが、前記体細胞変異を取り囲む11塩基対を含む、請求項1に記載の方法。
【請求項13】
前記体細胞変異にゲノムシグネチャースコアを割り当てるステップをさらに含む、請求項12に記載の方法。
【請求項14】
体細胞変異が、前記ゲノムシグネチャースコアに基づいて、MSI-HサンプルまたはMSSサンプルに関連するものとして分類される、請求項13に記載の方法。
【請求項15】
前記MSIスコアに基づいて前記患者への処置を選択または施すステップをさらに含む、請求項1に記載の方法。
【請求項16】
前記MSIスコアが、前記患者の前記サンプルがマイクロサテライト不安定性-高(MSI-H)であり、前記処置が免疫チェックポイント阻害剤を含むことを示す、請求項15に記載の方法。
【請求項17】
前記免疫チェックポイント阻害剤が抗体を含む、請求項16に記載の方法。
【請求項18】
前記抗体が、抗PD-1抗体;抗IDO抗体;抗CTLA-4抗体;抗PD-L1抗体;および抗LAG-3抗体からなる群から選択される、請求項17に記載の方法。
【請求項19】
前記チェックポイント阻害剤がペンブロリズマブ、ニボルマブ、アテゾリズマブ、またはイピリムマブである、請求項17に記載の方法。
【請求項20】
前記サンプル中の配列決定されたDNAが、1またはそれを超える配列決定されたゲノム、1またはそれを超える配列決定されたエクソーム、または1またはそれを超える配列決定されたゲノムもしくは1またはそれを超える配列決定されたエクソームの領域を含む、請求項1に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本出願は、米国特許法第35 USC§119条(e)項の下、現在係属中の2020年3月12日に出願された米国出願第62/988,571号に基づく利益を主張している。先の出願の開示は、本出願の開示の一部とみなされ、参照により本出願の開示に組み込まれる。
発明の分野
【0002】
本発明は、一般に、マイクロサテライト不安定性(MSI)の検出に関し、より具体的には、体細胞変異のヌクレオチドトラクトリピート長およびゲノムシグネチャーの分析に関する。
配列表の組み込み
【0003】
添付の配列表のデータは、参照により本出願に組み込まれる。添付の配列表テキストファイル、名前PGDX3100-1 WO_SL.txtは、2021年3月8日に作成され、750バイトである。ファイルは、Windows(登録商標) OSを使用するコンピュータ上のMicrosoft Wordを使用してアクセスすることができる。
【背景技術】
【0004】
背景情報
腫瘍におけるマイクロサテライト不安定性(MSI)は、患者の処置のために、チェックポイント阻害剤療法などの免疫療法の選択を導くバイオマーカーである。マイクロサテライト不安定性は、次世代シーケンシング(NGS)データの分析および/または増幅断片長の分析によって検出することができる。これらのアッセイは、配列決定または増幅されたマイクロサテライト長分布を調べる。しかしながら、マイクロサテライトは、高精度に増幅または配列決定することが困難であることが知られている。
【0005】
個々の置換は、個々のマイクロサテライト長よりも低い検出限界で正確に検出することができる。例えば、体細胞変異は、マイクロサテライトよりも正確に配列決定するのが容易なゲノムの領域に位置することが多い。
【発明の概要】
【課題を解決するための手段】
【0006】
本発明は、マイクロサテライトトラクトおよび体細胞変異の分析を用いたマイクロサテライト不安定性の検出に関する。
【0007】
いくつかの実施形態では、マイクロサテライト不安定性(MSI)を決定する方法であって、(i)対象から得られたサンプル中の配列決定されたDNAの複数のヌクレオチドリピートトラクトにおける体細胞対立遺伝子長の存在を決定するステップと、(ii)複数のヌクレオチドリピートトラクトの外側領域におけるDNAの体細胞変異の存在を決定するステップと、(iii)複数のヌクレオチドリピートトラクトの外側に見出される体細胞変異のゲノムシグネチャーとミスマッチ修復欠損のゲノムシグネチャーとの適合を決定するステップと、(iv)MSIスコアを取得するために決定ステップの結果に規則を適用するステップと、(v)MSIスコアに基づいてサンプルをマイクロサテライト不安定性-高(MSI-H)またはマイクロサテライト安定性(MSS)として分類するステップとを含む方法が本明細書で提供される。
【0008】
いくつかの実施形態では、本明細書で提供される方法は、MSIスコアと、サンプルのマイクロサテライト不安定性-高(MSI-H)またはマイクロサテライト安定性(MSS)としての分類とを含むレポートを作成するステップをさらに含む。いくつかの実施形態では、サンプルは腫瘍サンプルである。
【0009】
いくつかの実施形態では、本明細書で提供される方法の複数のヌクレオチドリピートトラクトは、モノヌクレオチドリピート、ジヌクレオチドリピート、トリヌクレオチドリピート、テトラヌクレオチドリピート、ペンタヌクレオチドリピート、ヘキサヌクレオチドリピート、ヘプタヌクレオチドリピート、オクタヌクレオチドリピートまたはそれらの組み合わせを含む。いくつかの実施形態では、複数のヌクレオチドリピートトラクトは、モノヌクレオチドリピートを含む。いくつかの実施形態では、MSI-Hサンプル中のヌクレオチドリピートのトラクトは、参照サンプル中のヌクレオチドリピートのトラクトと比較してより短い。いくつかの実施形態では、MSI-Hサンプル中のヌクレオチドリピートのトラクトは、参照サンプル中のヌクレオチドリピートのトラクトと比較して少なくとも2塩基対短い。いくつかの実施形態では、参照サンプルは、マッチした正常サンプルまたはMSSサンプルである。
【0010】
いくつかの実施形態では、本明細書で提供される方法は、ヌクレオチドリピートのより短いトラクトの頻度を決定するステップをさらに含む。いくつかの実施形態では、本明細書で提供される方法の複数のヌクレオチドリピートトラクトは1またはそれを超えるマイクロサテライトマーカーを含む。いくつかの実施形態では、1またはそれを超えるマイクロサテライトマーカーは、ヒトゲノムマイクロサテライトマーカーから選択される。いくつかの実施形態では、1またはそれを超えるマイクロサテライトマーカーは、BAT-25;BAT-26;MONO-27;NR-21;NR-24;およびそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、1またはそれを超えるマイクロサテライトマーカーは、BAT-25;BAT-26;D5S346;D2S123;D17S250;およびそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、1またはそれを超えるマイクロサテライトマーカーは、BAT-25;BAT-26;MONO-27;NR-21;NR-24;D5S346;D2S123;D17S250;BAT40;およびそれらの任意の組み合わせからなる群から選択される。
【0011】
いくつかの実施形態では、本明細書で提供される方法の体細胞変異のゲノムシグネチャーは、体細胞変異を取り囲む11塩基対を含む。いくつかの実施形態では、本明細書で提供される方法は、体細胞変異にゲノムシグネチャースコアを割り当てるステップをさらに含む。いくつかの実施形態では、体細胞変異は、ゲノムシグネチャースコアに基づいて、MSI-HサンプルまたはMSSサンプルに関連するものとして分類される。
【0012】
いくつかの実施形態では、本明細書で提供される方法は、MSIスコアに基づいて患者への処置を選択または施すステップをさらに含む。いくつかの実施形態では、MSIスコアは、患者のサンプルがマイクロサテライト不安定性-高(MSI-H)、処置が免疫チェックポイント阻害剤を含むことを示す。いくつかの実施形態では、免疫チェックポイント阻害剤は抗体を含む。いくつかの実施形態では、抗体は、抗PD-1抗体;抗IDO抗体;抗CTLA-4抗体;抗PD-L1抗体;および抗LAG-3抗体からなる群から選択される。いくつかの実施形態では、チェックポイント阻害剤は、ペンブロリズマブ(KEYTRUDA(登録商標))、ニボルマブ(OPDIVO(登録商標))、アテゾリズマブ(TECENTRIQ(登録商標))、またはイピリムマブ(YERVOY(登録商標))である。
【0013】
いくつかの実施形態では、配列決定されたDNAは、1またはそれを超える配列決定されたゲノム、1またはそれを超える配列決定されたエクソーム、または1またはそれを超える配列決定されたゲノムもしくは1またはそれを超える配列決定されたエクソームの領域を含む。
【図面の簡単な説明】
【0014】
【0015】
【
図2】
図2は、高次元データが多数のトレーニングデータを必要とすることを示す。
【0016】
【
図3】
図3は、体細胞変異発見のための機械学習アプローチであるPGDx Cerebroを示す。
【0017】
【
図4】
図4は、モノヌクレオチドトラクトでの短い対立遺伝子の検出を示す。
【0018】
【
図5】
図5は、ミスマッチ修復欠損変異シグネチャー(https://cancer.sanger.ac.uk/cosmic/signatures_v2;Wellcome Sanger Instituteで入手可能なCatalogue of Somatic Mutations in Cancer(COSMIC))の検出を示す。
【0019】
【
図6】
図6は、エクソームシグネチャースコアとPCRとの間のマッチを示す。代表的なエクソームデータを示す。
【0020】
【
図7】
図7は、モノヌクレオチドトラクトでの短い対立遺伝子の検出とミスマッチ修復欠損変異シグネチャーの検出とを組み合わせて得られた結果を示す。
【0021】
【
図8】
図8は、MSI検出のアンサンブル法を用いて得られたデータの線形分離性を示す。
【発明を実施するための形態】
【0022】
発明の詳細な説明
多くの癌は、ミスマッチ修復(MMR)欠損の結果である変異の蓄積を伴う。MMR欠損の重要なマーカーは、マイクロサテライト不安定性(MSI)である。MMR欠損またはMSIの存在は、例えばチェックポイント阻害剤療法などの免疫療法に対する応答性のマーカーとして役立ち得る。本明細書で提供される方法は、MSIの検出および治療レジメンの選択に有用である。
【0023】
いくつかの実施形態では、マイクロサテライト不安定性(MSI)を決定する方法であって、(i)対象から得られたサンプル中の配列決定されたDNAの複数のヌクレオチドリピートトラクトにおける体細胞対立遺伝子長の存在を決定するステップと、(ii)複数のヌクレオチドリピートトラクトの外側領域におけるDNAの体細胞変異の存在を決定するステップと、(iii)複数のヌクレオチドリピートトラクトの外側に見出される体細胞変異のゲノムシグネチャーとミスマッチ修復欠損のゲノムシグネチャーとの適合を決定するステップと、(iv)MSIスコアを取得するために決定ステップの結果に規則を適用するステップと、(v)MSIスコアに基づいてサンプルをマイクロサテライト不安定性-高(MSI-H)またはマイクロサテライト安定性(MSS)として分類するステップとを含む方法が本明細書で提供される。
【0024】
本明細書で提供される方法は、アンサンブル法を含み得る 本明細書で使用される場合、「アンサンブル法」とは、2以上の分類システムからの結果またはデータを使用して最終的な分類を行うことを指す。本明細書で提供される方法では複数の分類システムを使用して最終的な分類を行うことができる。任意の数の分類システム、例えば1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、およびそれらの間の任意の数もしくは範囲、またはそれを超える分類システムを使用して最終的な分類を行うことができる。いくつかの実施形態では、本明細書で提供される方法は、2つの分類システムからのデータを使用する。いくつかの実施形態では、2つの分類システムは、トラクトベースおよび変異シグネチャーベースの分類システムである。
【0025】
本明細書で使用される場合、「MSI-H」という用語は「マイクロサテライト不安定性が高い」ことを意味する。本明細書で使用される場合、「MSI」という用語は、文脈によって示されるように、「マイクロサテライト不安定」または「マイクロサテライト不安定性」を意味する。本明細書で使用される場合、「MSI-L」という用語は「マイクロサテライト不安定性が低い」ことを意味する。本明細書で使用される場合、「MSS」という用語は、「マイクロサテライト安定性」を意味する。MSIの状態を使用して、腫瘍および/または腫瘍サンプルを、マイクロサテライト不安定性およびマイクロサテライト安定性腫瘍を含む腫瘍群に分類することができる。本明細書で使用される場合、MSI腫瘍は、正常もしくは非腫瘍組織と比較して、またはMSI-LもしくはMSS腫瘍もしくはサンプルと比較して、より高度のマイクロサテライト不安定性を有する腫瘍またはサンプルである。したがって、MSI腫瘍サンプルは、正常もしくは非腫瘍サンプルまたはMSI-LもしくはMSS腫瘍由来のサンプルと比較して、より高度のマイクロサテライト不安定性を有するサンプルである。本明細書中で使用される場合、「MSI」および「MSI-H」という用語は、文脈において別途明確に示さない限り、腫瘍または腫瘍サンプルのMSI状態を指すときに交換可能に使用され得る。
【0026】
本明細書で提供される方法を使用して、任意の数のヌクレオチドリピートトラクトを分析することができる。分析され得るヌクレオチドリピートトラクトの例示的な数には、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、少なくとも50、少なくとも51、少なくとも52、少なくとも53、少なくとも54、少なくとも55、少なくとも56、少なくとも57、少なくとも58、少なくとも59、少なくとも60、少なくとも61、少なくとも62、少なくとも63、少なくとも64、少なくとも65、少なくとも66、少なくとも67、少なくとも68、少なくとも69、少なくとも70、少なくとも71、少なくとも72、少なくとも73、少なくとも74、少なくとも75、少なくとも76、少なくとも77、少なくとも78、少なくとも79、少なくとも80、少なくとも81、少なくとも82、少なくとも83、少なくとも84、少なくとも85、少なくとも86、少なくとも87、少なくとも88、少なくとも89、少なくとも90、少なくとも91、少なくとも92個、少なくとも93、少なくとも94、少なくとも95、少なくとも96、少なくとも97、少なくとも98、少なくとも99、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも350、少なくとも400、少なくとも450、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、およびそれらの間の任意の数もしくは範囲、またはそれを超えるヌクレオチドリピートトラクトが含まれる。
シーケンシング
【0027】
いくつかの実施形態では、本明細書で提供される方法は、患者から得られたサンプル中の配列決定されたDNAを含む。例えば、標識されたターミネーターまたはプライマーおよびスラブもしくはキャピラリーシステムでのゲル分離を使用するサンガーシーケンシング、ならびに次世代シーケンシング(NGS)を含む、任意のシーケンシング法を使用することができる。例示的なNGS方法論には、Roche 454シーケンサー、Life Technologies SOLiD(登録商標)システム、Life Technologies Ion Torrent、ならびにIlluminaシステム、例えばIllumina Genome Analyzer II、Illumina MiSeq、Illumina HiSeq、Illumina NextSeq、およびIllumina NovaSeq装置が含まれる。
【0028】
いくつかの実施形態では、サンプル中の配列決定されたDNAは、1もしくはそれを超える配列決定されたゲノムまたはそのトラクトを含む。いくつかの実施形態では、サンプル中の配列決定されたDNAは、1もしくはそれを超える配列決定されたエクソームまたはそのトラクトを含む。本明細書で使用される場合、「エクソームシーケンシング」という用語は、ゲノム内の遺伝子のタンパク質をコードするすべてのエクソンを配列決定することを指す。エクソームシーケンシングは、例えば、核酸のアレイベースの捕捉および溶液中捕捉などの標的濃縮方法を含み得る。
ヌクレオチドリピート
【0029】
いくつかの実施形態では、本明細書で提供される方法は、患者サンプルからのDNAの複数のヌクレオチドリピートトラクトにおける体細胞対立遺伝子長の存在を決定するステップを含む。ヌクレオチドリピートは、マイクロサテライトまたはショートタンデムリピート(STR)を構成し得る。したがって、本明細書で使用される場合、「マイクロサテライト」および「マイクロサテライトマーカー」という用語は、反復ヌクレオチド配列を含む多型DNA遺伝子座を指す。ヌクレオチドリピートは、任意の長さであり得る。本明細書で提供される方法によって、任意のマイクロサテライトマーカーまたはマイクロサテライトマーカーの組み合わせを分析することができる。いくつかの実施形態では、マイクロサテライトマーカーはヒトゲノムに存在するが、当業者は、任意の種のマイクロサテライトマーカーを本明細書で提供される方法によって分析できることを理解するであろう。分析のためのマイクロサテライトマーカーは、例えば、ヌクレオチドリピートについて参照ゲノムをスキャンすることによって同定することができる。
【0030】
典型的には、ヌクレオチドリピートのDNAモチーフは、例えば、5回~50回繰り返されるが、より少ない繰り返しまたはより多い繰り返しも可能である。さらに、ヌクレオチドリピートのトラクトは、繰り返される任意の数のヌクレオチドを有し得る。例えば、ヌクレオチドリピートは、繰り返しDNAモチーフとして1塩基対~6塩基対または最大10塩基対を含み得る。いくつかの実施形態では、複数のヌクレオチドリピートトラクトは、モノヌクレオチドリピート、ジヌクレオチドリピート、トリヌクレオチドリピート、テトラヌクレオチドリピート、ペンタヌクレオチドリピート、ヘキサヌクレオチドリピート、ヘプタヌクレオチドリピート、オクタヌクレオチドリピートまたはそれらの組み合わせを含む。いくつかの実施形態では、複数のヌクレオチドリピートトラクトは、モノヌクレオチドリピートを含む。分析のためのマイクロサテライトマーカーは、例えば、任意の他の長さのモノヌクレオチドリピートおよび/またはリピートについて参照ゲノムをスキャンすることによって同定することができる。
【0031】
患者のサンプルからのDNAのヌクレオチドリピートは、参照サンプル中のヌクレオチドリピートと長さが任意の数のヌクレオチドだけ異なり得る。ヌクレオチドリピート長の違いは、異なる数のリピートDNAモチーフに起因し得る。一例として、MSIもしくはMSI-Hサンプルまたは腫瘍のヌクレオチドリピート長は、参照サンプルまたは腫瘍のヌクレオチドリピート長より短くなり得る。別の例として、MSIもしくはMSI-Hサンプルまたは腫瘍中のヌクレオチドリピート長は、参照サンプルまたは腫瘍中のヌクレオチドリピート長よりも長くなり得る。さらに別の例として、リピートDNAモチーフの部分的リピート、リピートDNAモチーフ内の欠失、リピートDNAモチーフ内の挿入、リピートDNAモチーフ内の置換、またはそれらの任意の組み合わせは、ヌクレオチドリピートの長さを変えることができる。ヌクレオチドリピート長は、任意の数のヌクレオチドまたはヌクレオチドリピートによって、参照サンプルまたは腫瘍と比較してMSIもしくはMSI-Hサンプルまたは腫瘍においてより長くまたはより短くなり得る。いくつかの実施形態では、MSIまたはMSI-Hサンプル中のヌクレオチドリピートのトラクトは、1またはそれを超える参照サンプル中のヌクレオチドリピートのトラクトと比較してより短い。いくつかの実施形態では、MSIまたはMSI-Hサンプル中のヌクレオチドリピートのトラクトは、1またはそれを超える参照サンプル中のヌクレオチドリピートのトラクトと比較して少なくとも2塩基対短い。いくつかの実施形態では、1またはそれを超える参照サンプルは、マッチした正常サンプルまたはMSSサンプルである。
【0032】
いくつかの実施形態では、本明細書で提供される方法は、ヌクレオチドリピートのより短いトラクトの頻度を決定するステップをさらに含む。例えば、ヌクレオチドリピートのより短いトラクトの頻度は、1またはそれを超える参照サンプル中のヌクレオチドリピートのより短いトラクトの頻度と比較して、MSIもしくはMSI-Hサンプルまたは腫瘍の場合により大きくなり得る。一例として、任意の変化した対立遺伝子、例えばヌクレオチドリピートのより短いまたはより長いトラクトは、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、125%、150%、175%、200%、225%、250%、275%、300%、325%、350%、375%、400%、425%、450%、475%、500%、550%、600%、650%、700%、750%、800%、850%、900%、950%、1000%、およびそれらの間の任意の数もしくは範囲で、参照対立遺伝子に対してより高い頻度で生じ得る。
【0033】
分析された不安定なヌクレオチドリピートトラクトの割合を使用して、サンプルをMSIまたはMSI-Hサンプルとして分類することができる。本明細書で使用される場合、ヌクレオチドリピートトラクトを指す場合の「不安定」という用語は、サンプル中のヌクレオチドリピートトラクトの長さが変化し得ることを意味する。例えば、ヌクレオチドリピートトラクトは、より短くまたはより長くなり得る。いくつかの実施形態では、サンプル中のヌクレオチドリピートトラクトの長さは、参照サンプル中のヌクレオチドリピートトラクトの長さと比較して変化する。いくつかの実施形態では、ヌクレオチドリピートトラクトの長さは、ヌクレオチドリピートトラクトの生殖系列対立遺伝子の長さと比較して変化する。いくつかの実施形態では、サンプル中のヌクレオチドリピートトラクトの長さは、参照サンプル中のヌクレオチドリピートトラクトの長さと比較してより短い。いくつかの実施形態では、サンプル中のヌクレオチドリピートトラクトの長さは、ヌクレオチドリピートトラクトの生殖細胞系列対立遺伝子の長さと比較して短い。いくつかの実施形態では、ヌクレオチドリピートトラクトの長さは、参照サンプル中のヌクレオチドリピートトラクトの長さと比較してより長い。いくつかの実施形態では、サンプル中のヌクレオチドリピートトラクトの長さは、ヌクレオチドリピートトラクトの生殖細胞系列対立遺伝子の長さと比較してより長い。
【0034】
約50、約51、約52、約53、約54、約55、約56、約57、約58、約59、約60、約61、約62、約63、約64、約65、約66、約67、約68、約69、約70、約71、約72、約73、約74、約75、約76、約77、約78、約79、約80、約81、約82、約83、約84、約85、約86、約87、約88、約89、約90、約91、約92、約93、約94、約95、約96、約97、約98、約99、約100またはそれを超える分析されるヌクレオチドリピートトラクトのうち、約2、約3、約4、約5、約6、約7、約8,約9、約10、約11、約12、約13、約14、約15またはそれを超えるより短いヌクレオチドリピートトラクトの存在を使用して、サンプルをMSIまたはMSI-Hサンプルとして分類することができる。いくつかの実施形態では、約68の分析されるヌクレオチドリピートトラクトのうち、より短い対立遺伝子を有する約8のヌクレオチドリピートトラクトの存在を使用して、サンプルをMSIサンプルまたはMSI-Hサンプルとして分類する。いくつかの実施形態では、約11の分析されるヌクレオチドリピートトラクトのうち、より短い対立遺伝子を有する約68のヌクレオチドリピートトラクトの存在を使用して、サンプルをMSIサンプルまたはMSI-Hサンプルとして分類する。いくつかの実施形態では、分析されるすべてのヌクレオチドリピートトラクトがより短い対立遺伝子を有する場合、サンプルはMSIまたはMSI-Hサンプルとして分類される。いくつかの実施形態では、サンプルは腫瘍サンプルである。
【0035】
いくつかの実施形態では、複数のヌクレオチドリピートトラクトは、1またはそれを超えるマイクロサテライトマーカーを含む。例示的なマイクロサテライトマーカーとしては、BAT-25、BAT-26、MONO-27、NR-21、NR-24、BAT-40、TGFβRII、IGFIIR、hMSH3、BAXおよびジヌクレオチド遺伝子座、例えばD2S123、D9S283、D9S1851、D2S123、D17S250およびD 18S58が挙げられる。いくつかの実施形態では、1またはそれを超えるマイクロサテライトマーカーは、BAT-25;BAT-26;MONO-27;NR-21;NR-24;およびそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、1またはそれを超えるマイクロサテライトマーカーは、BAT-25;BAT-26;D5S346;D2S123;D17S250;およびそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、1またはそれを超えるマイクロサテライトマーカーは、BAT-25;BAT-26;MONO-27;NR-21;NR-24;D5S346;D2S123;D17S250;BAT40;およびそれらの任意の組み合わせからなる群から選択される。
体細胞変異の検出
【0036】
いくつかの実施形態では、本明細書で提供される方法は、患者サンプルからのDNAの体細胞変異の存在を決定するステップを含む。体細胞変異の存在は、複数のヌクレオチドリピートトラクトの外側領域のDNAにおいて決定することができる。
【0037】
データの1次元を見るだけでは、データを別個のクラスに分離するのに十分ではない場合がある。むしろ、データを正しいクラスに分離することを可能にするために、データの多次元を調べることがしばしば必要である(
図1)。
【0038】
体細胞変異検出は、分析を混乱させる可能性がある実験室アーチファクト、シーケンシングアーチファクト、およびアラインメントアーチファクトアーチファクトのために、多くの次元を必要とする場合がある。実験室アーチファクトは、例えば、鎖間バイアス、ゲノムコンテキスト、ならびに参照対立遺伝子と代替対立遺伝子との組み合わせによって検出することができる。配列アーチファクトは、例えば、低い塩基品質によって、またはゲノムコンテキストによって検出することができる。アラインメントアーチファクトの検出に寄与し得る例示的なパラメータとしては、例えば、マッピング品質、アライナーマッチ、および位置分布を挙げることができる。体細胞変異の検出においてさらに混乱させる側面は、生殖細胞系列変異が存在する可能性である。生殖細胞系列変異は、例えば、変異を有すると特定されていない個体、すなわち正常者に存在し得る。さらに、生殖細胞系列変異は、例えば、データベースにおいて見出され得る。
【0039】
高次元データは、多数のトレーニングデータを必要とし得る。例えば、十分で代表的なトレーニングデータがなければ、分類器が不適切に適合し、オーバーフィッティングにつながる可能性がある(
図2)。機械学習法は、人間よりもはるかに容易かつ正確に大規模データセットに適合することができる。70次元以上を調べるCerebroと呼ばれる機械モデルが開発されている。さらに、エクソームデータの場合、200万を超える標識された候補変異がこのモデルで使用される。
【0040】
体細胞変異検出に使用するためのCerebroの特徴を
図3に示す(Woodら、Sci.Transl.Med.2018,Vol.10,eaar7939)。Cerebroは、機械学習モデルを使用して、候補変異をスコア化し、生殖系列変異およびアーチファクトから真の体細胞変異を分離する。例えば、デュアルアラインメントは、2つのアラインメントからのデータを提供することによって、変異ごとの統計分析のためのデータを増やすCerebroによって考慮される更なる特徴としては、変異コンテキスト、例えば%GCおよびDUST(配列複雑性の測定値)の分析、例えば、サンプルカバレッジ、例えば別個のカバレッジおよび変異対立遺伝子頻度(MAF)、配列および/またはアラインメントの品質、例えばマッピング品質および塩基品質などの配列および/またはアラインメントの質、ならびに例えば、腫瘍サンプルおよび正常サンプルの分析およびFisherの正確率検定(FET)などの統計の適用を含むカバレッジ比較が挙げられる。したがって、いくつかの実施形態では、本明細書で提供される方法における体細胞変異の検出は、Cerebroの使用を含む。
体細胞変異のゲノムシグネチャー
【0041】
いくつかの実施形態では、本明細書で提供される方法は、体細胞変異のゲノムシグネチャーを決定するステップを含む。いくつかの実施形態では、本明細書で提供される方法は、複数のヌクレオチドリピートトラクトの外側に見出される体細胞変異のゲノムシグネチャーとミスマッチ修復欠損のゲノムシグネチャーとの適合を決定するステップを含む。ゲノムシグネチャーは、体細胞変異に隣接する配列、体細胞変異を取り囲む配列、または体細胞変異を含む配列を含む、体細胞変異の任意の配列コンテキストを含み得る。体細胞変異に隣接する配列は、体細胞変異の5’および/または3’に位置し、体細胞変異から任意の数の塩基対に広がり得る。本明細書で使用される場合、「隣接する」という用語は、体細胞変異のすぐ隣の配列を指す。いくつかの実施形態では、体細胞変異の配列コンテキストまたはゲノムシグネチャーを構成する配列は、体細胞変異から離れて位置し得る。例えば、体細胞変異の配列コンテキストまたはゲノムシグネチャーを構成する配列は、体細胞変異に直接隣接して位置するのではなく、体細胞変異から1塩基対、2塩基対、3塩基対、4塩基対、5塩基対、6塩基対、7塩基対、8塩基対、9塩基対、10塩基対、11塩基対、12塩基対、13塩基対、14塩基対、15塩基対、16塩基対、17塩基対、18塩基対、19塩基対、20塩基対、25塩基対、30塩基対、35塩基対、40塩基対、45塩基対、50塩基対、55塩基対、60塩基対、65塩基対、70塩基対、75塩基対、80塩基対、85塩基対、90塩基対、95塩基対、100塩基対、125塩基対、150塩基対、200塩基対、250塩基対、300塩基対、350塩基対、400塩基対、450塩基対、500塩基対、600塩基対、700塩基対、800塩基対、900塩基対、1000塩基対、5000塩基対、10キロ塩基対(kbp)、20kbp、30kbp、40kbp、50kbp、60kbp、70kbp、80kbp、90kbp、100kbp、200kbp、300kbp、400kbp、500kbp、600kbp、700kbp、800kbp、900kbp、1メガ塩基対(Mbp)、およびそれらの間の任意の数もしくは範囲の距離に位置し得る。そのような配列は、体細胞変異のいずれかの側、すなわち5’もしくは3’、または両側、すなわち5’および3’に位置し得る。体細胞変異の5’もしくは3’または5’および3’の両方に位置する配列の場合、配列コンテキストは体細胞変異を含み得る。いくつかの実施形態では、体細胞変異の5’および3’の両方に位置する配列の場合、配列コンテキストは体細胞変異を取り囲む。
【0042】
配列コンテキストまたはゲノムシグネチャーは、1塩基対、2塩基対、3塩基対、4塩基対、5塩基対、6塩基対、7塩基対、8塩基対、9塩基対、10塩基対、11塩基対、12塩基対、13塩基対、14塩基対、15塩基対、16塩基対、17塩基対、18塩基対、19塩基対、20塩基対、25塩基対、30塩基対、35塩基対、40塩基対、45塩基対、50塩基対、55塩基対、60塩基対、65塩基対、70塩基対、75塩基対、80塩基対、85塩基対、90塩基対、95塩基対、100塩基対、125塩基対、150塩基対、200塩基対、250塩基対、300塩基対、350塩基対、400塩基対、450塩基対、500塩基対、600塩基対、700塩基対、800塩基対、900塩基対、1000塩基対、およびそれらの間の任意の数もしくは範囲などの任意の数の塩基対を含み得る。いくつかの実施形態では、体細胞変異のゲノムシグネチャーは、体細胞変異を取り囲む11塩基対を含む。
【0043】
本明細書で提供される方法は、体細胞変異にゲノムシグネチャースコアを割り当てるステップを含み得る。いくつかの実施形態では、体細胞変異は、ゲノムシグネチャースコアに基づいて、MSI-HもしくはMSIサンプルまたはMSSサンプルに関連するものとして分類される。例えば、参照対立遺伝子、代替対立遺伝子、および参照塩基を中心とする11ntのコンテキストまたはゲノムシグネチャー(以下の実施例2)を考慮すると、特定の一塩基置換(SBS)がMSIまたはMSI-H腫瘍に由来する対数尤度を評価する位置特異的重み行列(PWM)のセットを使用することができる。
【0044】
体細胞変異のゲノムシグネチャーは、任意の構造的コンテキストを含み得る。したがって、本明細書で提供される方法は、体細胞変異の核酸構造的コンテキストを決定するステップを含み得る。本明細書で使用される場合、「構造的コンテキスト」とは、一次構造、二次構造、三次構造、四次構造、およびそれらの任意の組み合わせを意味する。例えば、一次構造は、シーケンスコンテキストを含み得る。二次構造は、例えば、二本鎖領域、ステム-ループ、ヘアピンループ、テトラループ、およびシュードノットの形成などの塩基間の相互作用を含み得る。三次構造は、例えば、ステムループ、ヘアピンループ、および他の二次構造的特徴の相互作用などの二次構造の大規模な折り畳みおよび相互作用を含み得る。四次構造は、核酸分子とタンパク質との間の相互作用、例えばヌクレオソームへのDNAの編成、および例えば別々の核酸間の相互作用を含み得る。
【0045】
一例として、一次構造のコンテキストまたは配列は、ミスマッチ修復欠損などの特定の変異プロセスによって変異される塩基の傾向に影響を及ぼし得る。別の例として、二次構造のコンテキストは、ミスマッチ修復欠損などの特定の変異プロセスによって塩基が変異する傾向に影響を及ぼし得る。さらに別の例として、エクソン塩基と、例えば最も近いスプライス部位などのスプライス部位との間の距離は、ミスマッチ修復欠損などの特定の変異プロセスによって塩基が変異する傾向に影響を及ぼし得る。構造的コンテキストは、体細胞変異の相対位置にも影響を及ぼし得る。例えば、体細胞変異は、エクソンの中心または内部に蓄積し得る。いくつかの実施形態では、三次および/または四次構造は、ミスマッチ修復欠損などの特定の変異プロセスによって塩基が変異する傾向に影響を及ぼす。いくつかの実施形態では、体細胞変異はミスマッチ修復欠損に起因する。いくつかの実施形態では、体細胞変異はMSIまたはMSI-H状態を示す。いくつかの実施形態では、体細胞変異はMSIまたはMSI-H変異である。
【0046】
いくつかの実施形態では、一次構造コンテキストまたは配列コンテキストが決定される。いくつかの実施形態では、二次構造コンテキストが決定される。いくつかの実施形態では、三次構造コンテキストが決定される。いくつかの実施形態では、四次構造コンテキストが決定される。一次構造、二次構造、三次構造、および四次構造などの任意の構造的コンテキストおよび構造的コンテキストの任意の組み合わせを決定することができる。いくつかの実施形態では、一次構造のコンテキスト、二次構造のコンテキスト、三次構造のコンテキスト、四次構造のコンテキスト、エクソン塩基とスプライス部位との間の距離、エクソン塩基と最も近いスプライス部位との間の距離、エクソン内の体細胞変異の位置、またはそれらの任意の組み合わせが決定される。任意の構造的コンテキストは、ミスマッチ修復欠損などの特定の変異プロセスから生じる体細胞変異のゲノムシグネチャーを提供し得る。いくつかの実施形態では、構造的コンテキストは、ミスマッチ修復欠損に起因する体細胞変異についてのゲノムシグネチャーを提供する。
MSIスコアおよび分類
【0047】
MSIスコアは、患者サンプルなどのサンプルからのDNAの複数のヌクレオチドリピートトラクトにおける体細胞対立遺伝子長の存在、複数のヌクレオチドリピートトラクトの外側のトラクトにおけるDNAの体細胞変異の存在、および複数のヌクレオチドリピートトラクトの外側に見られる体細胞変異のゲノムシグネチャーを決定するステップの結果に規則を適用することによって取得することができる。いくつかの実施形態では、サンプルまたはサンプルが採取された腫瘍は、MSIスコアに基づいて、マイクロサテライト不安定性-高(MSI-H)、マイクロサテライト不安定性(MSI)、またはマイクロサテライト安定性(MSS)として分類される。いくつかの実施形態では、本明細書で提供される方法は、MSIスコアと、マイクロサテライト不安定性-高(MSI-H)、マイクロサテライト不安定性(MSI)、またはマイクロサテライト安定性(MSS)としてのサンプルの分類とを含むレポートを作成することをさらに含む。
【0048】
例えば、BAT-25、BAT-26、MONO-27、NR-21、NR-24、BAT-40、TGFβRII、IGFIIR、hMSH3、BAXおよびジヌクレオチド座位、例えばD2S123、D9S283、D9S1851、D2S123、D17S250およびD18S58を含む任意のマイクロサテライトマーカーまたはマイクロサテライトマーカーの組み合わせを使用して、MSIスコアを取得することができる。いくつかの実施形態では、1またはそれを超えるマイクロサテライトマーカーは、BAT-25;BAT-26;MONO-27;NR-21;NR-24;およびそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、1またはそれを超えるマイクロサテライトマーカーは、BAT-25;BAT-26;D5S346;D2S123;D17S250;およびそれらの任意の組み合わせからなる群から選択される。いくつかの実施形態では、1またはそれを超えるマイクロサテライトマーカーは、BAT-25;BAT-26;MONO-27;NR-21;NR-24;D5S346;D2S123;D17S250;BAT40;およびそれらの任意の組み合わせからなる群から選択される。例示的なマイクロサテライトマーカーを
図4に示す。
【0049】
いくつかの実施形態では、1またはそれを超えるマイクロサテライトマーカーは、ヒトゲノムマイクロサテライトマーカーから選択される。任意のヒトマイクロサテライトマーカーまたはヒトマイクロサテライトマーカーの組み合わせを使用することができる。例えば、任意の哺乳動物、例えばげっ歯類(マウス、ラット、ハムスターおよびモルモットを含む)、ネコ、イヌ、ウサギ、ウシ、ウマ、ヤギ、ヒツジ、ブタなどを含む家畜、および霊長類(サル、チンパンジー、オランウータンおよびゴリラを含む)からのマイクロサテライトマーカーを含む、ヒト以外の種からのマイクロサテライトマーカーまたはマイクロサテライトマーカーの組み合わせも使用することができる。マイクロサテライトマーカーの不安定トラクトは、例えば上記のように、参照対立遺伝子よりも短いまたは長くなり得る。MSIスコアを取得する例示的な方法を以下に説明する(実施例3および実施例4)。
コンピューティングデバイス
【0050】
当業者が必要または最も適していると認識するように、本明細書で提供される方法の性能は、プロセッサ(例えば、中央処理装置(CPU)、グラフィックス処理装置(GPU)など)、コンピュータ可読記憶装置(例えば、メインメモリ、スタティックメモリなど)、またはバスを介して互いに通信するそれらの組み合わせのうちの1もしくはそれを超えるものを含む1もしくはそれを超えるコンピューティングデバイス、コンピューティングシステム、またはコンピュータを含むことができる
【0051】
プロセッサは、Intel(カリフォルニア州サンタクララ)によるプロセッサXEON(登録商標)E7、またはAMD(カリフォルニア州サニーベール)による商標OPTERON(商標)6200で販売されているプロセッサなど、当該技術分野で既知の任意の適切なプロセッサを含むことができる。
【0052】
メモリは、好ましくは、システムに本明細書に記載の機能(例えば、本明細書に見られる任意の方法論もしくは機能を実現するソフトウェア、または上記で言及されたコンピュータプログラム)を実行させるように実行可能な1もしくはそれを超える命令セット;データ(例えば、医薬品データ、個人データ、もしくは医薬品のデータベースのソース画像);または両方を格納することができる少なくとも1の有形の非一時的媒体を含む。コンピュータ可読記憶装置は、例示的な実施形態では単一の媒体であってよいが、「コンピュータ可読記憶装置」という用語は、命令またはデータを格納する単一の媒体または複数の媒体(例えば、集中型もしくは分散型データベース、ならびに/または関連するキャッシュおよびサーバ)を含むと解釈されるべきである。したがって、「コンピュータ可読記憶装置」という用語は、ソリッドステートメモリ(例えば、加入者識別モジュール(SIM)カード、セキュアデジタルカード(SDカード)、マイクロSDカード、またはソリッドステートドライブ(SSD))、光学および磁気媒体、ならびに任意の他の有形記憶媒体を含むが、これらに限定されないと解釈されるべきである。
【0053】
例えば、Amazon Web Services、コンピューティングシステムのメモリ、クラウドストレージ、サーバ、または他のコンピュータ可読ストレージなどの任意の適切なサービスをストレージに使用することができる。
【0054】
本明細書で提供される方法による入力/出力デバイスは、ディスプレイユニット(例えば、液晶ディスプレイ(LCD)もしくは陰極線管(CRT)モニタ)、英数字入力デバイス(例えば、キーボード)、カーソル制御デバイス(例えば、マウスもしくはトラックパッド)、ディスクドライブユニット、プリンタ、信号生成デバイス(例えば、スピーカ)、タッチスクリーン、ボタン、加速度計、マイクロフォン、セルラー無線周波数アンテナ、ネットワークインターフェースデバイスのうちの1またはそれを超えるものを含むことができ、ネットワークインターフェースデバイスは、例えば、ネットワークインターフェースカード(NIC)、Wi-Fiカード、またはセルラーモデム、またはそれらの任意の組み合わせとすることができる。
【0055】
当業者は、本明細書に記載の方法を実施するために任意の適切な開発環境またはプログラミング言語を使用できることを認識するであろう。例えば、本明細書の方法は、Perl、Python、C++、C#、Java(登録商標)、JavaScript(登録商標)、Visual Basic、Ruby on Rails、GroovyおよびGrails、または任意の他の適切なツールを使用して実施することができる。モバイルデバイスの場合、ネイティブxCodeまたはAndroid Java(登録商標)を使用することが好ましい場合がある。
サンプル
【0056】
いくつかの実施形態では、本明細書で提供される方法は、患者から得られたサンプル中の配列決定されたDNAを含む。いくつかの実施形態では、患者は腫瘍または癌に罹患している。いくつかの実施形態では、サンプルは腫瘍サンプルである。固形腫瘍および液性腫瘍の両方からのサンプルを本明細書に記載の方法で使用することができる。本明細書で使用される場合、「腫瘍」という用語は、異常細胞の蓄積によって形成される組織の塊またはしこりを指す。腫瘍は、良性(すなわち、癌ではない)、悪性(すなわち、癌)、または前悪性(すなわち、前癌性)であり得る。「腫瘍」および「新生物」という用語は互換的に使用することができる。一般に、癌性腫瘍は悪性である。
【0057】
本明細書で使用される場合、「固形腫瘍」という用語は、通常、嚢胞または液状部を含まない異常な組織の塊を指す。例示的な固形腫瘍としては、例えば、肉腫および癌腫が挙げられる。本明細書で使用される場合、「液性腫瘍」という用語は、血液および骨髄などの体液に存在する腫瘍または癌を指す。例示的な液体腫瘍としては、白血病およびリンパ腫などの造血性腫瘍が挙げられ、例えばリンパ節で成長することによって固形腫瘍として成長するリンパ腫の能力にもかかわらず含まれる。「液性腫瘍」という用語は、文脈において別途明確に示さない限り、「血液癌」という用語と互換的に使用することができる。
【0058】
任意の癌由来のサンプルは、本明細書で提供される方法によって分析することができる。本明細書で提供される方法によって、任意の種類の癌を分析することができる。いくつかの実施形態では、癌は、乳癌、膵臓癌、肺癌、黒色腫、皮膚癌、造血癌、白血病、リンパ腫、結腸癌、直腸癌、腎臓癌、腎細胞癌、膀胱癌、口腔癌、咽頭癌、甲状腺癌、頭頸部癌、脳癌、骨癌、筋肉癌、肉腫、横紋筋肉腫、卵巣癌、子宮頸癌、子宮癌、前立腺癌などから選択される。したがって、本明細書で提供される方法の患者は、任意の癌に罹患し得る。いくつかの実施形態では、患者は、乳癌、膵臓癌、肺癌、黒色腫、皮膚癌、造血癌、白血病、リンパ腫、結腸癌、直腸癌、腎臓癌、腎細胞癌、膀胱癌、口腔癌、咽頭癌、甲状腺癌、頭頸部癌、脳癌、骨癌、筋肉癌、肉腫、横紋筋肉腫、卵巣癌、子宮頸癌、子宮癌、前立腺癌、または任意の他の癌に罹患している。
【0059】
本明細書で提供される方法では、任意のサンプルまたはサンプルの種類を使用することができる。いくつかの実施形態では、サンプルは、血液、唾液、血漿、血清、尿、または他の生物学的流体である。更なる例示的な生物学的流体としては、漿液、リンパ液、脳脊髄液、粘膜分泌物、膣液、腹水液、胸水、心膜液、腹腔液および腹水が挙げられる。いくつかの実施形態では、サンプルは組織サンプルである。いくつかの実施形態では、サンプルは癌由来の組織サンプルである。いくつかの実施形態では、サンプルは細胞サンプルである。いくつかの実施形態では、サンプルは癌由来の細胞サンプルである。いくつかの実施形態では、サンプルは癌サンプルである。癌サンプルは、固形腫瘍または液性腫瘍由来のサンプルであり得る。
患者の選択および処置方法
【0060】
いくつかの実施形態では、本明細書で提供される方法は、MSIスコアに基づいて患者への処置を選択または施すステップを含む。いくつかの実施形態では、患者は癌に罹患している。いくつかの実施形態では、MSIスコアは、患者のサンプルがマイクロサテライト不安定性-高(MSI-H)またはマイクロサテライト不安定性(MSI)であり、処置が免疫療法を含むことを示す。患者は、以下に記載されるように、任意の免疫療法による処置のために選択することができる。いくつかの実施形態では、MSIスコアは、患者のサンプルがマイクロサテライト不安定性-高(MSI-H)またはマイクロサテライト不安定性(MSI)であり、処置が免疫チェックポイント阻害剤を含むことを示す。いくつかの実施形態では、免疫チェックポイント阻害剤は、以下に記載されるように抗体を含む。いくつかの実施形態では、抗体は、抗PD-1抗体;抗IDO抗体;抗CTLA-4抗体;抗PD-L1抗体;および抗LAG-3抗体からなる群から選択される。いくつかの実施形態では、チェックポイント阻害剤は、ペンブロリズマブ(KEYTRUDA(登録商標))、ニボルマブ(OPDIVO(登録商標))、アテゾリズマブ(TECENTRIQ(登録商標))、またはイピリムマブ(YERVOY(登録商標))である。
免疫療法
【0061】
免疫療法には、活性化免疫療法による処置および抑制免疫療法による処置が含まれる。活性化免疫療法は免疫応答を誘発または活性化し、抑制免疫療法は免疫応答を低減または抑制する。免疫療法は、インターロイキン、サイトカイン、ケモカイン、免疫調節性イミド薬(IMiD)などの免疫調節剤による処置を含み得る。任意のインターロイキン、サイトカイン、ケモカインまたは免疫調節性イミド薬(IMiD)を免疫療法に使用することができる。免疫療法のための例示的なインターロイキンとしては、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-10、IL-12、IL-15、IL-18、IL-21およびIL-23が挙げられる。免疫療法のための例示的なサイトカインとしては、インターフェロン、TNF-α、TGF-β、G-CSFおよびGM-CSFが挙げられる。免疫療法のための例示的なケモカインとしては、CCL 3、CCL 26およびCXCL7が挙げられる。例示的なIMiDとしては、サリドマイドおよびその類似体であるレナリドマイド、ポマリドマイドおよびアプレミラストが挙げられる。他の免疫調節剤としては、例えば、シトシンリン酸-グアノシン、オリゴデオキシヌクレオチドおよびグルカンが挙げられる。
【0062】
癌免疫療法は、一般に、癌細胞および腫瘍を破壊するための免疫系の刺激を含む。例示的な癌免疫療法としては、キメラ抗原受容体(CAR)を患者のT細胞に導入してCAR-T細胞を生成するCAR-T細胞療法が挙げられる。次いで、CAR-T細胞を患者の血流に導入して、養子細胞移入(ACT)によって癌を処置する。CARは、一般に、癌細胞の細胞表面に発現される抗原を標的とし得る抗原認識ドメインと1またはそれを超えるシグナル伝達ドメインとを含む。したがって、CAR-T細胞は、標的抗原を発現する癌細胞を標的とし、破壊することができる。例示的なCAR-T細胞療法としては、チサゲンレクルユーセル(KYMRIAH(登録商標))およびアキシカブタゲンシロルユーセル(YESCARTA)が挙げられる。
【0063】
更なる癌免疫療法としては、TCR療法、別の種類のACTが挙げられる。CAR-T細胞療法と同様に、T細胞は患者から採取され、再操作され、患者に導入される。ACTの更なるタイプとしては、腫瘍浸潤リンパ球(TIL)療法が挙げられる。患者由来のTILを患者の腫瘍組織から単離し、インビトロで増殖させた後、患者に導入する。
【0064】
さらに別の種類の癌免疫療法は、モノクローナル抗体による処置である。免疫療法に使用するためのモノクローナル抗体は、裸であってもよく、すなわち非コンジュゲート型、またはコンジュゲート型であってもよく、すなわち化学療法薬または放射性粒子が結合していてもよい。モノクローナル抗体に加えて、例えば、インターロイキンおよびサイトカインなどの他の分子を、癌細胞を標的化するためにコンジュゲート化することができる。一例として、デニロイキンジフチトクス(ONTAK)には、ジフテリア毒素に結合したIL-2が含まれる。さらに、癌免疫療法のためのモノクローナル抗体は二重特異性であり得、すなわち、2つの異なるタンパク質を認識して結合するように設計され得る。したがって、二重特異性モノクローナル抗体は、例えば、癌細胞の表面上の2以上の抗原を認識することができる。別の例として、二重特異性抗体は、癌細胞上のタンパク質または抗原および免疫細胞上のタンパク質または抗原を認識し、それによって免疫細胞を促進して癌細胞を攻撃することができる。
【0065】
癌を処置するための例示的なモノクローナル抗体としては、アレムツズマブ(CAMPATH)、トラスツズマブ(HERCEPTIN(登録商標))、イブリツモマブチウキセタン(ZEVALIN)、ブレンツキシマブベドチン(ADCETRIS(登録商標))、トラスツズマブエムタンシン(KADCYLA(登録商標))、ブリナツモマブ(BLINCYTO(登録商標))、ベバシズマブ(AVASTIN(登録商標))およびセツキシマブ(ERBITUX)が挙げられる。
【0066】
更なる癌免疫療法には、癌細胞に対する免疫応答を誘発する癌ワクチンが含まれる。さらに別の癌免疫療法は、以下にさらに記載される「チェックポイント阻害剤療法」である。
チェックポイント阻害剤療法
【0067】
チェックポイント阻害剤療法は、免疫系の機能に影響を及ぼす免疫チェックポイントを使用または標的化する癌処置の一形態である。免疫チェックポイントは、刺激性または阻害性であり得る。腫瘍は、免疫系の攻撃から自身を保護するためにこれらのチェックポイントを使用することができる。チェックポイント療法は、阻害性チェックポイントを遮断し、免疫系機能を回復させることができる。チェックポイントタンパク質としては、プログラム細胞死1タンパク質(PDCD1、PD-1;CD279としても知られる)およびそのリガンド、PD-1リガンド1(PD-L1、CD274)、細胞傷害性Tリンパ球関連タンパク質4(CTLA-4)、A2AR(アデノシンA2A受容体)、B7-H3(またはCD276)、B7-H4(またはVTCN1)、BTLA(BおよびTリンパ球アテニュエーター、またはCD272)、IDO(インドールアミン2,3-ジオキシゲナーゼ)、KIR(キラー細胞免疫グロブリン様受容体)、LAG3(リンパ球活性化遺伝子3)、TIM-3(T細胞免疫グロブリンドメインおよびムチンドメイン3)、およびVISTA(T細胞活性化のVドメインIg抑制因子)が挙げられる。
【0068】
PD-1およびCD279(分化クラスター279)としても知られるプログラム細胞死タンパク質1は、T細胞炎症活性を抑制することによって免疫系を下方制御し、自己免疫寛容を促進する重要な役割を果たす細胞表面受容体である。理論によって限定されるものではないが、PD-1は免疫チェックポイントであり、リンパ節の抗原特異的T細胞におけるアポトーシス(プログラム細胞死)を促進すると同時に、制御性T細胞(抗炎症性、抑制性T細胞)におけるアポトーシスを減少させるという二重の機構を介して自己免疫を防御する。PD-1は、B7ファミリーのメンバーである2つのリガンド、PD-L1およびPD-L2を有する。PD-L1タンパク質は、LPSおよびGM-CSF処置に応答してマクロファージおよび樹状細胞(DC)上、ならびにTCRおよびB細胞受容体シグナル伝達時にT細胞およびB細胞上で上方制御されるが、安静時マウスでは、例えば、PD-L1 mRNAは心臓、肺、胸腺、脾臓および腎臓で検出され得る。PD-L1は、IFN-γによる処置時に、PA1骨髄腫、P815肥満細胞腫およびB16メラノーマを含む、ほとんどすべてのマウス腫瘍細胞株において発現される。PD-L2発現はより制限されており、主にDCおよび少数の腫瘍株によって発現される。
【0069】
PD-L1は、いくつかの癌において発現される。PD-1を標的とするモノクローナル抗体は、癌の処置のために免疫系を増強することができる。多くの腫瘍細胞は、免疫抑制性PD-1リガンドであるPD-L1を発現する;PD-1とPD-L1との間の相互作用の阻害は、インビトロでT細胞応答を増強し、前臨床抗腫瘍活性を媒介することができる。
【0070】
CD152(分化クラスター152)としても知られるCTLA4またはCTLA-4(細胞傷害性Tリンパ球関連タンパク質4)は、免疫チェックポイントとして機能し、免疫応答を下方制御するタンパク質受容体である。CTLA4は、制御性T細胞において構成的に発現されるが、一般に、活性化後の従来のT細胞、特に癌において上方制御される。CTLA4は、活性化T細胞によって発現されかつ阻害性シグナルをT細胞に伝達する免疫グロブリンスーパーファミリーのメンバーである。CTLA4は、T細胞共刺激タンパク質CD28と相同であり、両方の分子は、抗原提示細胞上のそれぞれB7-1およびB7-2とも呼ばれるCD80およびCD86に結合する。理論によって限定されるものではないが、CTLA-4は、CD28よりも高い親和性および結合活性でCD80およびCD86に結合し、したがって、そのリガンドについてCD28を打ち負かすことができる。CTLA4は阻害シグナルをT細胞に伝達し、CD28は刺激シグナルを伝達する。CTLA4はまた、制御性T細胞において見出され、その阻害機能に寄与する。T細胞受容体およびCD28を介したT細胞活性化は、CTLA-4の発現増加をもたらす。
【0071】
いくつかのチェックポイント阻害剤を使用して癌を処置することができる。PD-1阻害剤としては、ペンブロリズマブ(KEYTRUDA(登録商標))およびニボルマブ(OPDIVO(登録商標))が挙げられる。PD-L1阻害剤としては、例えば、アテゾリズマブ(TECENTRIQ(登録商標))、アベルマブ(BAVENCIO(登録商標))およびデュルバルマブ(IMFINZI(登録商標))が挙げられる。CTLA-4阻害剤としては、例えば、イプリムマブ(YERVOY(登録商標))が挙げられる。他のチェックポイント阻害剤としては、例えば、抗B7-H3抗体(MGA271)、抗KIR抗体(リリルマブ)、および抗LAG3抗体(BMS-986016)が挙げられる。任意のチェックポイント阻害剤を、本明細書中に記載される方法において使用することができる。さらに、任意のチェックポイント阻害剤に対する応答を、本明細書中に記載される方法を使用して決定または予測することができる。いくつかの実施形態では、チェックポイント阻害剤は、ペンブロリズマブ(KEYTRUDA(登録商標))、ニボルマブ(OPDIVO(登録商標))、アテゾリズマブ(TECENTRIQ(登録商標))、アベルマブ(BAVENCIO(登録商標))、デュルバルマブ(IMFINZI(登録商標))、またはイピリムマブ(YERVOY(登録商標))である。
【0072】
本明細書で使用される場合、単数形「a」、「an」および「the」は、文脈上他に明確に指示されない限り、複数形を含む。したがって、例えば、「方法」への言及は、本開示などを読めば当業者には明らかになるであろう、本明細書に記載の種類の1もしくはそれを超える方法および/またはステップを含む。
【0073】
量、持続時間などの測定可能な値を指す場合に本明細書で使用される「約」とは、指定された値から±20%、または±10%、または±5%、またはさらには±1%の変動を包含することを意味し、そのような変動は、開示された方法または開示された方法を実行するのに適切である。「約」という用語は、文脈と明らかに矛盾しない限り、「およそ」という用語と互換的に使用することができる。
【0074】
他に定義されない限り、本明細書で使用されるすべての技術用語および科学用語は、本開示が属する技術分野の当業者によって一般的に理解されるのと同じ意味を有する。
【0075】
本明細書で使用される場合、「タンパク質」という用語は、アミノ酸の任意のポリマー鎖を指す。「ペプチド」および「ポリペプチド」という用語は、「タンパク質」という用語と互換的に使用され、アミノ酸のポリマー鎖も指す。「タンパク質」という用語は、タンパク質配列の天然または人工のタンパク質、タンパク質断片およびポリペプチド類似体を包含する。タンパク質は、モノマーまたはポリマーであり得る。「タンパク質」という用語は、文脈により矛盾しない限り、その断片およびバリアント(バリアントの断片を含む)を包含する。
【0076】
本明細書で使用される場合、「核酸」という用語は、任意のデオキシリボ核酸(DNA)分子、リボ核酸(RNA)分子、または核酸類似体を指す。DNAまたはRNA分子は、二本鎖または一本鎖であり得、任意のサイズであり得る。例示的な核酸としては、染色体DNA、プラスミドDNA、cDNA、無細胞DNA(cfDNA)、mRNA、tRNA、rRNA、siRNA、マイクロRNA(miRNAまたはmiR)、hnRNAが含まれるが、これらに限定されない。例示的な核酸類似体としては、ペプチド核酸、モルホリノおよびロックド核酸、グリコール核酸およびトレオース核酸が挙げられる。
【0077】
本明細書で使用される場合、「患者」という用語は、本明細書に開示される方法が実施される任意の個体または対象を指す。「患者」という用語は、「個体」または「対象」という用語と互換的に使用することができる。患者はヒトであり得るが、患者は動物であってもよいことが当業者によって理解されるであろう。したがって、哺乳動物、例えばげっ歯類(マウス、ラット、ハムスターおよびモルモットを含む)、ネコ、イヌ、ウサギ、ウシ、ウマ、ヤギ、ヒツジ、ブタなどを含む家畜、および霊長類(サル、チンパンジー、オランウータンおよびゴリラを含む)を含む他の動物は、患者の定義内に含まれる。
【0078】
本明細書で使用される場合、「処置する」、「処置」、「治療(療法)」、「治療的」などの用語は、所望の薬理学的および/または生理学的効果を得ることを指し、疾患または障害の緩和、進行の遅延もしくは減速、効果または症状の軽減、疾患もしくは障害の発症の抑制、改善、治療的利益および/または予防的利益などの、疾患、障害、または病状に関して有益なもしくは所望の結果を得ることが含まれるが、これらに限定されない。本明細書で使用される「処置」は、哺乳動物、特にヒトにおける疾患の任意の処置を包含し、(a)疾患にかかりやすいか、または疾患にかかるリスクがあるが、それを有するとまだ診断されていない対象において疾患が発生するのを予防することと、(b)疾患を抑制すること、すなわち、その発症を停止させることと、(c)疾患を軽減すること、すなわち、疾患を退行させることとを含む。治療的な利益には、処置される基礎疾患の根絶または改善が含まれる。また、治療的利益は、対象が依然として基礎疾患に罹患している可能性があるにもかかわらず、対象において改善が観察されるように、基礎疾患に関連する生理学的症状の1もしくはそれを超える根絶または改善によって達成される。場合によっては、予防的利益のために、特定の疾患を発症するリスクがある対象、または疾患の診断がなされていない可能性がある場合であっても疾患の生理学的症状の1もしくはそれを超える症状を報告する対象に処置が施される。本開示の方法は、任意の哺乳動物または他の動物と共に使用され得る。場合によっては、処置は症状の減少または停止をもたらし得る。予防的効果は、疾患もしくは症状の出現を遅延もしくは排除すること、疾患もしくは症状の兆候を遅延もしくは排除すること、疾患もしくは症状の進行を遅延させること、停止させること、もしくは逆転させること、またはそれらの任意の組み合わせを含む。
【0079】
本明細書で使用される場合、「サンプル」および「生物学的サンプル」という用語は、本明細書で提供される方法に適した任意のサンプルを指す。本方法で使用されるサンプルは、対象からの組織サンプルもしくは体液、または生検手順(例えば、針生検)もしくは外科的手順によって得られた組織から得ることができる。特定の実施形態では、本方法の生物学的サンプルは、例えば、体液、例えば脳脊髄液(CSF)、血液、血清、血漿、尿、唾液、涙および腹水のサンプルである。体液のサンプルは、当業者に公知の任意の適切な方法によって回収することができる。
【実施例】
【0080】
実施例1
この実施例は、MSI関連変異の変異シグネチャーモデリングを例示する。
【0081】
突然変異誘発プロセスは、特定の「シグネチャー」、または特定の参照対立遺伝子が特定の配列コンテキストによって取り囲まれている場合、それらの参照対立遺伝子を特定の代替対立遺伝子に変異させる傾向を有する傾向にある。マイクロサテライト不安定性(MSI)は、既知の癌シグネチャーのコレクションにおいて公的に詳述されている少なくとも4つの既知のシグネチャーを有するミスマッチ修復欠損によって引き起こされる。これらのシグネチャーを使用し、マイクロサテライト安定性(MSS)腫瘍に対するMSIまたはMSI-H腫瘍に由来する変異の可能性を示すことができる位置特異的重み行列(PWM)に基づいてモデルを作成した。次いで、このモデルを使用して腫瘍内の変異をスコア化することができ、腫瘍の変異スコアの合計は、腫瘍自体がMSIまたはMSSであるかどうかを決定するために使用できる「腫瘍シグネチャースコア」をもたらす。このスコアは、MSI/MSS分類を実行するために単独でまたはアンサンブル法で使用することができる。
【0082】
この方法のモデルは、公開されている変異データ(TCGA MC3;Ellrott,Kら、Scalable Open Science Approach for Mutation Calling of Tumor Exomes Using Multiple Genomic Pipelines.Cell Systems 2018)に適合している。このモデルは、参照対立遺伝子を中心とする特定の置換(例えば、C>A、C>G、T>A)および11 bpコンテキスト(例えば、CATGCCCAGTC(配列番号1))を入力とする位置特異的重み行列のセットである。モデルの出力は、変異がMSS腫瘍よりもMSI腫瘍に由来する可能性が高い場合に陽性であり、変異がMSI腫瘍よりもMSS腫瘍に由来する可能性が高い場合に陰性であるスコアである。ソフトウェアを書き込み、モデルフィッティングおよびスコアリングを行った。
【0083】
このモデルを、公開されているエクソーム体細胞置換データに適合させ、公開されているMOSAIC MSI分類標識(Hause Rら、Classification and characterization of microsatellite instability across 18 cancer types.Nat Med 2016)を使用してMSI/MSS標識を個々のエクソームに割り当てた。MSIエクソームからの変異を使用して、6つの位置確率行列(PPM)のセットを作成した(ピリミジン参照塩基の可能な置換ごとに1つ、すなわち、C>A、C>G、C>T、T>A、T>CおよびT>G)。同じことを、MSSエクソームからの変異を用いて別々に行った。これらの2セットのPPMは、所与の置換のMSI PPMをその同じ置換の対応するMSS PPMでエントリごとに除算し、次いで各商の対数をPWMの様々なエントリに格納することによって、6つのPWMの1セットに結合した。使用されるPPMおよびPWMは、隣接する塩基が変異シグネチャーに及ぼし得る影響をより適切に説明するために、従来のPPM/PWMが使用する単一文字ではなく、重複するトリプレットの頻度に基づく。重複するトリプレットは、従来のPWM実装をさらに強化するためのオプション機能として使用することができる。
実施例2
【0084】
この実施例は、個々の変異および腫瘍のMSIシグネチャースコアリングを説明する。
【0085】
理論によって制限されることなく、マイクロサテライト不安定性はミスマッチ修復欠損によって引き起こされる。ミスマッチ修復欠損は、特定のコンテキストで特定の体細胞変異を生じさせる可能性がある(
図5)。MSIまたはMSI-H腫瘍またはMSS腫瘍に由来する置換の可能性を推定するモデルを作成した。
【0086】
参照対立遺伝子、代替対立遺伝子、および参照塩基を中心とする11ntのコンテキストを考慮して、特定の一塩基置換(SBS)がMSI腫瘍に由来する対数尤度を評価する位置特異的重み行列(PWM)のセットを作成した。この行列のセットは、所与の症例がMSI/MSI-HまたはMSSであるかどうかを決定するためにMOSAIC分類を使用して、TCGA MC3データから開発された。行列セットは、腫瘍内のすべてのSBSをスコアリングするために使用され、それらのSBSからスコアを合計して腫瘍自体のシグネチャースコアを取得する。次いで、このシグネチャースコアを、トラクトベースのスコア(体細胞欠失を有すると考えられるモノヌクレオチドトラクトの割合)と組み合わせて、全体的なMSIスコアを取得し、これを腫瘍の分類を決定するために使用する。
位置特異的重み行列の構造
【0087】
PWMは、背景および前景の位置確率行列(PPM)から構築された。背景行列はMSSの場合の置換から開発され、前景行列はMSIの場合の置換から開発された。PWMは、前景行列内の確率を背景行列内の対応する確率で除算し、商の常用(底10)対数を計算することによって作成された。
【0088】
PWMの各列は、従来のPWMの列に対応する1ntとは対照的に、変異のシーケンスコンテキストの3nt部分文字列を表す。配列コンテキストにおける隣接ヌクレオチドの相互作用をより適切に表すために、個々の塩基の代わりに重複する3nt部分文字列(3量体)を使用する。
位置特異的重み行列のセット
【0089】
参照塩基がピリミジンであることを必要として(COSMICシグネチャーで行われるように)、6つの可能な置換が存在する:C>A、C>G、C>T、T>A、T>C、およびT>G。これら6つの置換の各々について1つのPWMが維持される。さらに、C>A、C>GなどのMSIの場合の置換の割合が記録される。MSS置換についても同じことが行われる。PWMの計算と同様に、MSI置換割合をMSS置換割合で除算し、常用対数を計算して割合スコアが得られる。例えば、MSI置換の1.26%はC>Gであるが、MSS置換の12.01%はC>Gである。したがって、C>G置換の割合スコアはlog(0.0126/0.1201)=-0.9792であり、C>G置換がMSI症例よりもMSS症例に由来する可能性が約10倍高いことを示す。
置換のスコアリング
【0090】
置換は、参照対立遺伝子、代替対立遺伝子、および参照塩基を中心とする11ntのコンテキストによって定義される。慣例により、参照塩基は塩基対のピリミジン塩基であると仮定され、置換はそれに応じて修飾される(例えば、順方向鎖上のG>T置換は、逆方向鎖から抽出されたコンテキストによるC>A置換として扱われる)。参照対立遺伝子および代替対立遺伝子は、使用される比率スコアを決定し、コンテキストは、特定の置換に対応するPWMのセットからのPWMを使用してスコア化される。例えば、CAAAGTGAGGA(配列番号2)のコンテキストによるT>G置換は、T>G PWMを使用してスコア化され、-0.1704の比率スコアを受け取り、コンテキストは-0.7253のスコアを有する。変異のシグネチャースコアは、比率スコアとコンテキストスコアとの合計である。前の例では、シグネチャースコアは-0.8957であり、変異がMSS症例(スコアが負であるため;MSI置換は正である可能性が高い)に由来する可能性がより高いことを示す。
患者サンプルのスコアリング
【0091】
腫瘍のシグネチャースコアは、腫瘍サンプル中に見られるすべての体細胞変異に対する変異シグナチャースコアを合計することによって決定される。0を超えるシグネチャースコアを有する腫瘍はMSIである可能性がより高く、0を下回るシグネチャースコアを有する腫瘍はMSSである可能性がより高い。
実施例3
【0092】
この例は、MSIの決定のためにシグネチャースコアをトラクトベーススコアと組み合わせることを説明する。
【0093】
モノヌクレオチドトラクトでの短い対立遺伝子の検出を用いたマイクロサテライト不安定性の決定を
図4に示す。BAT25、BAT26、MONO27、NR21およびNR24を含む例示的なモノヌクレオチドトラクト遺伝子座を示す。変異シグネチャーを用いたミスマッチ修復欠損の検出を
図5に示す。例示的な変異シグネチャーを示す。
【0094】
725個の腫瘍のデータを調べた後、シグネチャーのスコア情報を、マイクロサテライト不安定性を検出するためのアンサンブル手法にトラクトベーススコアと組み合わせる分類規則を確立した。2つの成分スコアは大きく相関しており、10%未満のトラクトベースのスコアを有するすべての腫瘍が+10未満のシグネチャースコアを有し、25%を超えるトラクトベースのスコアを有するすべての症例が0よりも大きいシグネチャースコアを有する。どちらの成分スコアも、正確な分類である可能性が高いものを完全に決定するものではなかった(いくつかの場合では、PCR直交データが利用可能であり、他の場合では、変異データの分析を使用した)。(0.1、20)と(0.25、-10)とのポイント間の境界線セグメントは、x軸上にトラクトベーススコア、y軸上にシグネチャースコアを有する平面において確立された。このセグメントを含む線の傾き(-200)およびy切片(40)は、200x+y>=40の点がMSIに分類され、200x+y<40の点がMSSに分類されることを示す。データがなかった2つの「不確定」領域:(a)x<=0.1およびy>=20の領域、および(b)x>=0.25およびy<=-10の領域もある。不確定トラクトに該当する成分スコアを有する腫瘍は、分類が割り当てられていない。不確定領域の面積の減少は、境界線セグメントの勾配、切片、および/または終点を変化させることができる。
実施例4
【0095】
この実施例は、PGDx elio(商標)tissue completeを使用したマイクロサテライト不安定性の検出を説明する。
【0096】
PGDx elio(商標)tissue complete pipelineは、選択されたモノヌクレオチドトラクトおよび配列変異のゲノムコンテキストシグネチャーに基づいてマイクロサテライト不安定性を同定する。線形分類器は、不安定なトラクトの頻度と観察された変異のシグネチャーとを組み合わせることによって、マイクロサテライト不安定性-高(MSI-H)、マイクロサテライト安定性(MSS)、または不確定性の全体的な症例状態を決定する。
【0097】
不安定なトラクトを決定するために、ピーク発見アルゴリズムを使用して、目的のトラクト(ROI)にわたる68のモノヌクレオチドトラクトについて観察されたトラクト長を決定した。個々のトラクトの対立遺伝子の長さを参照長さと比較して、参照長さよりも>2bp短い不安定なトラクトを決定した。トラクトの伸長が報告されているが、不安定なモノヌクレオチドトラクトは典型的には長さが短く、より長い長さへのシフトはまれである。サンプルのモノヌクレオチドトラクトにわたる体系的な伸長は観察されていない。PGDx elio(商標)tissue completeで評価された多数のモノヌクレオチドマイクロサテライトトラクトは、任意の単一トラクトの伸長、またはトラクトの頻度が少ないことが、マイクロサテライト不安定性の検出を妨げないことを保証した。低カバレッジトラクトは分析から除外した。
【0098】
位置特異的重み行列のセットを使用して、ゲノムシグネチャースコアを取得した。これらの行列は、変異の代替対立遺伝子および周囲の11bpゲノムコンテキストを考慮すると、MSS症例に対するMSI-H症例における変異を観察する可能性をコードする。行列は、癌ゲノムアトラス(TCGA)からのMSI-HおよびMSSコンテキスト症例を使用して開発された。候補の一塩基置換を、生殖細胞系列の状態、機能的結果、マッピング品質、および配列品質メトリクスに基づいてフィルタリングした。残りの配列バリアントには、そのバリアントがMSI-H表現型と関連しているか否かを示すゲノムシグネチャースコアを割り当てた。候補の一塩基置換からの尤度スコアを加えて、サンプルの全体的なゲノムシグネチャースコアを取得した。ゲノムシグネチャースコアをトラクト不安定性頻度と組み合わせて、全体的なMSIスコアを取得した。この全体的なMSIスコアは、ゲノムシグネチャースコアに200を乗算した不安定トラクトの割合を加算することによって決定した。全体的なMSIスコア>40はMSI-Hとして分類され、そうでなければサンプルはMSSとして分類される。トラクトとシグネチャースコアとの間のMSI状態が大幅に異なるサンプルは、不確定として報告される。
【0099】
他の研究では、エクソームデータを使用して取得されたシグネチャースコアは、結腸直腸癌サンプル、胃癌サンプル、腎臓癌サンプルおよび子宮癌サンプルについてPCRを使用して取得された結果と一致するように見えることがわかった(
図6)。MSIを決定するためのヌクレオチドリピートのトラクトの分析と体細胞変異のゲノムシグネチャーとを組み合わせて取得された結果を、マイクロサテライト不安定性(MSI)またはマイクロサテライト安定性(MSS)として分類されたサンプルを描写する
図7および
図8に示す。データは、両方の尺度、すなわちMSIトラクト頻度およびシグネチャースコアのみでデータが線形分離可能になることをさらに示す。
【0100】
まとめると、これらのデータは、マイクロサテライト不安定性(MSI)を検出するための、MSIトラクト頻度と体細胞変異シグネチャースコアとを組み合わせるアンサンブル法が、単一のパラメータまたはスコアに依存する方法よりも高い精度でMSI/MSI-HまたはMSSとしてサンプルを分類できることを示している。
【0101】
本発明を上記の実施例を参照して説明したが、本発明の精神および範囲内に修正および変形が包含されることが理解されよう。したがって、本発明は、以下の特許請求の範囲によってのみ限定される。
【配列表】
【手続補正書】
【提出日】2023-02-01
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
マイクロサテライト不安定性(MSI)を決定する方法であって、
(i)対象から得られたサンプル中の配列決定されたDNAの複数のヌクレオチドリピートトラクトにおける体細胞対立遺伝子長の存在を決定するステップと、
(ii)前記複数のヌクレオチドリピートトラクトの外側領域における前記DNAの体細胞変異の存在を決定するステップと、
(iii)前記複数のヌクレオチドリピートトラクトの外側に見出される前記体細胞変異のゲノムシグネチャーとミスマッチ修復欠損のゲノムシグネチャーとの適合を決定するステップと、
(iv)MSIスコアを取得するために前記決定ステップの結果に規則を適用するステップと、
(v)前記MSIスコアに基づいて前記サンプルをマイクロサテライト不安定性-高(MSI-H)またはマイクロサテライト安定性(MSS)として分類するステップと
を含む、方法。
【請求項2】
前記MSIスコアと、前記サンプルのマイクロサテライト不安定性-高(MSI-H)またはマイクロサテライト安定性(MSS)としての分類とを含むレポートを作成するステップをさらに含む、請求項1に記載の方法。
【請求項3】
前記サンプルが腫瘍サンプルである、請求項1に記載の方法。
【請求項4】
前記複数のヌクレオチドリピートトラクトが、モノヌクレオチドリピート、ジヌクレオチドリピート、トリヌクレオチドリピート、テトラヌクレオチドリピート、ペンタヌクレオチドリピート、ヘキサヌクレオチドリピート、ヘプタヌクレオチドリピート、オクタヌクレオチドリピートまたはそれらの組み合わせを含む、請求項1に記載の方法。
【請求項5】
前記複数のヌクレオチドリピートトラクトがモノヌクレオチドリピートを含む、請求項4に記載の方法。
【請求項6】
MSI-Hサンプル中のヌクレオチドリピートトラクトが、参照サンプル中のヌクレオチドリピートトラクトと比較してより短い、請求項1に記載の方法。
【請求項7】
MSI-Hサンプル中のヌクレオチドリピートトラクトが、参照サンプル中のヌクレオチドリピートトラクトと比較して少なくとも2塩基対短い、請求項1に記載の方法。
【請求項8】
前記参照サンプルが、マッチした正常サンプルまたはMSSサンプルである、請求項6に記載の方法。
【請求項9】
ヌクレオチドリピートのより短いトラクトの頻度を決定するステップをさらに含む、請求項6に記載の方法。
【請求項10】
前記複数のヌクレオチドリピートトラクトが1またはそれを超えるマイクロサテライトマーカーを含む、請求項1に記載の方法。
【請求項11】
前記1またはそれを超えるマイクロサテライトマーカーがヒトゲノムマイクロサテライトマーカーから選択される、請求項10に記載の方法。
【請求項12】
前記体細胞変異の前記ゲノムシグネチャーが、前記体細胞変異を取り囲む11塩基対を含む、請求項1に記載の方法。
【請求項13】
前記体細胞変異にゲノムシグネチャースコアを割り当てるステップをさらに含む、請求項12に記載の方法。
【請求項14】
体細胞変異が、前記ゲノムシグネチャースコアに基づいて、MSI-HサンプルまたはMSSサンプルに関連するものとして分類される、請求項13に記載の方法。
【請求項15】
前記MSIスコアが、前記患者の前記サンプルがマイクロサテライト不安定性-高(MSI-H)であ
ることを示し、前記
患者に免疫チェックポイント阻害剤を含む
処置が投与され得ることを示す、請求項
1に記載の方法。
【請求項16】
前記免疫チェックポイント阻害剤が抗体を含む、請求項1
5に記載の方法。
【請求項17】
前記抗体が、抗PD-1抗体;抗IDO抗体;抗CTLA-4抗体;抗PD-L1抗体;および抗LAG-3抗体からなる群から選択される、請求項1
6に記載の方法。
【請求項18】
前記チェックポイント阻害剤がペンブロリズマブ、ニボルマブ、アテゾリズマブ、またはイピリムマブである、請求項1
6に記載の方法。
【請求項19】
前記サンプル中の配列決定されたDNAが、1またはそれを超える配列決定されたゲノム、1またはそれを超える配列決定されたエクソーム、または1またはそれを超える配列決定されたゲノムもしくは1またはそれを超える配列決定されたエクソームの領域を含む、請求項1に記載の方法。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0101
【補正方法】変更
【補正の内容】
【0101】
本発明を上記の実施例を参照して説明したが、本発明の精神および範囲内に修正および変形が包含されることが理解されよう。したがって、本発明は、以下の特許請求の範囲によってのみ限定される。
本発明は、例えば、以下の項目を提供する。
(項目1)
マイクロサテライト不安定性(MSI)を決定する方法であって、
(i)対象から得られたサンプル中の配列決定されたDNAの複数のヌクレオチドリピートトラクトにおける体細胞対立遺伝子長の存在を決定するステップと、
(ii)前記複数のヌクレオチドリピートトラクトの外側領域における前記DNAの体細胞変異の存在を決定するステップと、
(iii)前記複数のヌクレオチドリピートトラクトの外側に見出される前記体細胞変異のゲノムシグネチャーとミスマッチ修復欠損のゲノムシグネチャーとの適合を決定するステップと、
(iv)MSIスコアを取得するために前記決定ステップの結果に規則を適用するステップと、
(v)前記MSIスコアに基づいて前記サンプルをマイクロサテライト不安定性-高(MSI-H)またはマイクロサテライト安定性(MSS)として分類するステップと
を含む、方法。
(項目2)
前記MSIスコアと、前記サンプルのマイクロサテライト不安定性-高(MSI-H)またはマイクロサテライト安定性(MSS)としての分類とを含むレポートを作成するステップをさらに含む、項目1に記載の方法。
(項目3)
前記サンプルが腫瘍サンプルである、項目1に記載の方法。
(項目4)
前記複数のヌクレオチドリピートトラクトが、モノヌクレオチドリピート、ジヌクレオチドリピート、トリヌクレオチドリピート、テトラヌクレオチドリピート、ペンタヌクレオチドリピート、ヘキサヌクレオチドリピート、ヘプタヌクレオチドリピート、オクタヌクレオチドリピートまたはそれらの組み合わせを含む、項目1に記載の方法。
(項目5)
前記複数のヌクレオチドリピートトラクトがモノヌクレオチドリピートを含む、項目4に記載の方法。
(項目6)
MSI-Hサンプル中のヌクレオチドリピートトラクトが、参照サンプル中のヌクレオチドリピートトラクトと比較してより短い、項目1に記載の方法。
(項目7)
MSI-Hサンプル中のヌクレオチドリピートトラクトが、参照サンプル中のヌクレオチドリピートトラクトと比較して少なくとも2塩基対短い、項目1に記載の方法。
(項目8)
前記参照サンプルが、マッチした正常サンプルまたはMSSサンプルである、項目6に記載の方法。
(項目9)
ヌクレオチドリピートのより短いトラクトの頻度を決定するステップをさらに含む、項目6に記載の方法。
(項目10)
前記複数のヌクレオチドリピートトラクトが1またはそれを超えるマイクロサテライトマーカーを含む、項目1に記載の方法。
(項目11)
前記1またはそれを超えるマイクロサテライトマーカーがヒトゲノムマイクロサテライトマーカーから選択される、項目10に記載の方法。
(項目12)
前記体細胞変異の前記ゲノムシグネチャーが、前記体細胞変異を取り囲む11塩基対を含む、項目1に記載の方法。
(項目13)
前記体細胞変異にゲノムシグネチャースコアを割り当てるステップをさらに含む、項目12に記載の方法。
(項目14)
体細胞変異が、前記ゲノムシグネチャースコアに基づいて、MSI-HサンプルまたはMSSサンプルに関連するものとして分類される、項目13に記載の方法。
(項目15)
前記MSIスコアに基づいて前記患者への処置を選択または施すステップをさらに含む、項目1に記載の方法。
(項目16)
前記MSIスコアが、前記患者の前記サンプルがマイクロサテライト不安定性-高(MSI-H)であり、前記処置が免疫チェックポイント阻害剤を含むことを示す、項目15に記載の方法。
(項目17)
前記免疫チェックポイント阻害剤が抗体を含む、項目16に記載の方法。
(項目18)
前記抗体が、抗PD-1抗体;抗IDO抗体;抗CTLA-4抗体;抗PD-L1抗体;および抗LAG-3抗体からなる群から選択される、項目17に記載の方法。
(項目19)
前記チェックポイント阻害剤がペンブロリズマブ、ニボルマブ、アテゾリズマブ、またはイピリムマブである、項目17に記載の方法。
(項目20)
前記サンプル中の配列決定されたDNAが、1またはそれを超える配列決定されたゲノム、1またはそれを超える配列決定されたエクソーム、または1またはそれを超える配列決定されたゲノムもしくは1またはそれを超える配列決定されたエクソームの領域を含む、項目1に記載の方法。
【国際調査報告】