特許第6403923号(P6403923)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ナントミクス,エルエルシーの特許一覧

特許6403923転移の遺伝的分析のためのシステムおよび方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】6403923
(24)【登録日】2018年9月21日
(45)【発行日】2018年10月10日
(54)【発明の名称】転移の遺伝的分析のためのシステムおよび方法
(51)【国際特許分類】
   G06F 19/14 20110101AFI20181001BHJP
【FI】
   G06F19/14
【請求項の数】20
【全頁数】35
(21)【出願番号】特願2018-510329(P2018-510329)
(86)(22)【出願日】2016年8月25日
(86)【国際出願番号】US2016048778
(87)【国際公開番号】WO2017035400
(87)【国際公開日】20170302
【審査請求日】2018年4月26日
(31)【優先権主張番号】62/209,850
(32)【優先日】2015年8月25日
(33)【優先権主張国】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】516001591
【氏名又は名称】ナントミクス,エルエルシー
(74)【代理人】
【識別番号】100114775
【弁理士】
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【弁理士】
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【弁理士】
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100191086
【弁理士】
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】サンボーン,ジョン ザキャリー
【審査官】 山内 裕史
(56)【参考文献】
【文献】 米国特許出願公開第2015/0197815(US,A1)
【文献】 特表2015−513392(JP,A)
【文献】 特開2013−123420(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 19/10 − 19/28
(57)【特許請求の範囲】
【請求項1】
コンピュータにより実施される、転移の系統発生を決定する方法であって、
原発腫瘍、第1の転移、第2の転移、および同じ患者の非腫瘍組織からの複数のそれぞれの核酸配列を提供するステップと、
前記同じ患者の非腫瘍組織由来の前記核酸配列に対する前記原発腫瘍、前記第1の転移、および前記第2の転移に関する体細胞性単一ヌクレオチド変異を決定するステップと、
前記決定された体細胞性単一ヌクレオチド変異をフィルタリングするステップと、
前記原発腫瘍、前記第1の転移、および前記第2の転移からの前記核酸配列の各々についてそれぞれフィルタリングされた体細胞性単一ヌクレオチド変異に関する状態を決定するステップと、
前記状態を用いて完全共有体細胞性単一ヌクレオチド変異、部分共有体細胞性単一ヌクレオチド変異、固有体細胞性単一ヌクレオチド変異、または非存在体細胞性単一ヌクレオチド変異からなる群から選択されるクラスへとそれぞれフィルタリングされた体細胞性単一ヌクレオチドを分類するステップと、
前記フィルタリングされた体細胞性単一ヌクレオチド変異の前記分類を使用して前記原発腫瘍、前記第1の転移、および前記第2の転移について系統発生プロファイルを計算するステップと、
を含む方法。
【請求項2】
体細胞性単一ヌクレオチド変異を決定する前記ステップが、前記原発腫瘍、前記第1の転移、および前記第2の転移についてすべての可能な遺伝子型の尤度を計算するステップを含む、請求項1に記載の方法。
【請求項3】
体細胞性単一ヌクレオチド変異を決定する前記ステップが、エラー確率モデルを使用する、請求項1〜2のいずれか一項に記載の方法。
【請求項4】
前記フィルタリングされた体細胞性単一ヌクレオチド変異が、ヘテロ接合性である、請求項1〜3のいずれか一項に記載の方法。
【請求項5】
前記フィルタリングするステップが、遺伝子型品質によるフィルタリング、体細胞スコアによるフィルタリング、マッピング品質によるフィルタリング、ミスマッチの品質合計によるフィルタリング、ミスマッチの平均数によるフィルタリング、3’末端までの分画距離によるフィルタリング、および変異対立遺伝子深度によるフィルタリングの少なくとも1つを含む、請求項1に記載の方法。
【請求項6】
前記状態が、「存在」または「非存在」である、請求項1〜5のいずれか一項に記載の方法。
【請求項7】
各クラスが、少なくとも3つのフィルタリングされた体細胞性単一ヌクレオチド変異の存在を必要とし、かつ前記フィルタリングされた体細胞性単一ヌクレオチド変異の各々が、1未満の99%信頼区間で腫瘍変異率を確立するのに十分なシーケンシングカバレッジを有する必要がある、請求項1〜6のいずれか一項に記載の方法。
【請求項8】
体細胞性単一ヌクレオチド変異を決定する前記ステップが、エラー確率モデルを使用する、請求項1に記載の方法。
【請求項9】
前記フィルタリングされた体細胞性単一ヌクレオチド変異が、ヘテロ接合性である、請求項1に記載の方法。
【請求項10】
前記フィルタリングするステップが、遺伝子型品質によるフィルタリング、体細胞スコアによるフィルタリング、マッピング品質によるフィルタリング、ミスマッチの品質合計によるフィルタリング、ミスマッチの平均数によるフィルタリング、3’末端までの分画距離によるフィルタリング、および変異対立遺伝子深度によるフィルタリングの少なくとも1つを含む、請求項9に記載の方法。
【請求項11】
前記状態が、「存在」または「非存在」である、請求項1に記載の方法。
【請求項12】
各クラスが、少なくとも3つのフィルタリングされた体細胞性単一ヌクレオチド変異の存在を必要とし、かつ前記フィルタリングされた体細胞性単一ヌクレオチド変異の各々が、1未満の99%信頼区間で腫瘍変異率を確立するのに十分なシーケンシングカバレッジを有する必要がある、請求項1に記載の方法。
【請求項13】
転移の系統発生を決定する方法であって、
配列データベースに分析エンジンを情報的に連結するステップであって、前記配列データベースが、原発腫瘍、第1の転移、第2の転移、および同じ患者の非腫瘍組織由来の複数の核酸配列を保存するステップと、
前記同じ患者の非腫瘍組織由来の前記核酸配列と比較して前記原発腫瘍、前記第1の転移、および前記第2の転移に関する体細胞性単一ヌクレオチド変異を、前記分析エンジンによって、決定するステップであって、エラー確率モデルを使用する可能な遺伝子型に関する尤度の決定を含むステップと、
前記決定された体細胞性単一ヌクレオチド変異を、前記分析エンジンによってフィルタリングするステップと、
完全共有体細胞性単一ヌクレオチド変異、部分共有体細胞性単一ヌクレオチド変異、固有体細胞性単一ヌクレオチド変異、および非存在体細胞性単一ヌクレオチド変異であるフィルタリングされた体細胞性単一ヌクレオチド変異を前記原発腫瘍、前記第1の転移、および前記第2の転移の各々について、前記分析エンジンによって、同定するステップと、
完全共有体細胞性単一ヌクレオチド変異、部分共有体細胞性単一ヌクレオチド変異、固有体細胞性単一ヌクレオチド変異、および非存在体細胞性単一ヌクレオチド変異に基づいて前記原発腫瘍、前記第1の転移、および前記第2の転移について系統発生プロファイルを、前記分析エンジンによって、計算するステップと、
を含む方法。
【請求項14】
前記複数の核酸配列が、エクソーム核酸配列または全ゲノム核酸配列である、請求項13に記載の方法。
【請求項15】
前記複数の核酸配列が、SAMまたはBAMフォーマットである、請求項13に記載の方法。
【請求項16】
体細胞性単一ヌクレオチド変異を決定する前記ステップが、前記原発腫瘍、前記第1の転移、および前記第2の転移についてすべての可能な遺伝子型の尤度を計算するステップを含む、請求項13に記載の方法。
【請求項17】
前記フィルタリングされた体細胞性単一ヌクレオチド変異が、ヘテロ接合性である、請求項13に記載の方法。
【請求項18】
前記フィルタリングステップが、遺伝子型品質によるフィルタリング、体細胞スコアによるフィルタリング、マッピング品質によるフィルタリング、ミスマッチの品質合計によるフィルタリング、ミスマッチの平均数によるフィルタリング、3’末端までの分画距離によるフィルタリング、および変異対立遺伝子深度によるフィルタリングの少なくとも1つを含む、請求項13に記載の方法。
【請求項19】
前記体細胞性単一ヌクレオチド変異について対立遺伝子状態を決定するステップを更に含む、請求項13に記載の方法。
【請求項20】
コピー数の異常を決定するステップを更に含む、請求項13に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2015年8月25日に出願された同時係属中米国仮出願第62/209,850号の優先権を主張する。
【0002】
本発明の分野は、原発腫瘍およびその転移の遺伝情報の計算分析であり、特に、転移およびその遺伝的起源における亜集団の遺伝的分化および系統発生に関する。
【背景技術】
【0003】
背景技術に関する記述は、本発明の理解に有用であり得る情報を含む。本明細書で提供される情報のいずれかが先行技術であるか、または現在請求されている発明と関連していること、または具体的または暗示的に参照されている出版物が先行技術であることを認めるものではない。
【0004】
本明細書に記載されている全ての刊行物および特許出願は、個々の刊行物または特許出願が、具体的かつ個別に参照により組み込まれると示されているのと同じ程度に、参照により組み込まれる。組み込まれた参考文献における用語の定義または使用が矛盾しているか、または本明細書で提供されるその用語の定義に反する場合、本明細書で提供されるその用語の定義が適用され、参照におけるその用語の定義は適用されない。
【0005】
他の多くの固形腫瘍と同様に、黒色腫転移は、多くの場合最初に原発腫瘍の領域を排出するリンパ節に存在し、遠隔転移は後に現れる傾向にある。黒色腫が原発腫瘍から局所〜遠隔転移への線形進行に追従するという結論は、治癒的意図を有する局所リンパ節の先取外科的除去の裏付となっている。しかし、いくつかの観察は、局所転移と同時に、遠隔転移が早期に播種されることを示唆した。転移の疑いのあるリンパ節領域(lymph node basin)の切除を受ける患者は、平均余命の有意な延長を経験することはない。さらに、循環黒色腫細胞が、局所に検出される転移のみを有する患者の26%の血液中に検出された。残念なことに、現在の決定方法では、特に複数の転移が存在する場合、腫瘍の播種および系統発生に関するより詳細な洞察が得られないことが多い。
【0006】
1つの公知の方法では、WO2014/058987に記載されているように腫瘍クローン性は対立遺伝子状態図を用いてオミクスデータから決定される。このような分析は、腫瘍のクローン多様性、および場合によってはサブクローンの系統発生についての貴重な洞察をもたらすが、このような分析は、異なる部位または時点での腫瘍およびそれらの転移からのオミクスデータには一般に適用できない。
【0007】
したがって、原発腫瘍およびその転移に関連する遺伝情報の計算分析のための、特にそれが転移およびその遺伝的起源における亜集団の遺伝的分化および系統発生の解析に関係する場合、改良されたシステムおよび方法が依然として必要とされている。
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明の主題は、腫瘍およびその転移からのオミクスデータを分析して、転移の系統発生を決定するシステムおよび方法に関する。好ましくは、分析は、腫瘍および転移サンプルにおける体細胞性単一ヌクレオチド変異の厳密な決定および状態、ならびに完全共有SSNV、部分SSNV、固有SSNV、または非存在SSNVなどの体細胞性単一ヌクレオチド変異(SSNV)の分類を含む。そのように分類されたSSNVはその後、原発腫瘍およびその転移の系統発生プロファイルの計算を可能にする。
【0009】
本発明の主題の1つの態様において、本発明者は、原発腫瘍、第1の転移、第2の転移、および同じ患者の非腫瘍組織由来の複数のそれぞれの核酸配列を提供するステップを含む、転移の系統発生を決定する方法を企図する。さらなるステップでは、同じ患者の非腫瘍組織からの核酸配列と比較して原発腫瘍、第1の転移、および第2の転移についての体細胞SSNVが決定され、さらに別のステップでは、原発腫瘍、第1の転移、および第2の転移からの核酸配列の各々に関して、各SSNVの状態(例えば、「存在」または「非存在」)が決定される。最も一般的には、状態は、各SSNVをクラス(例えば、完全共有、部分共有、固有、または非存在)に分類するために使用され、分類は、原発腫瘍、第1の転移、および第2の転移の系統発生プロファイルを計算するために使用される。
【0010】
本発明の主題に限定されるものではないが、SSNVを決定するステップは、例えば、エラー確率モデルを用いて、原発腫瘍、第1の転移、および第2の転移について、全ての考えられる遺伝子型の尤度を計算することを含むことが典型的には好ましい。さらに、このように決定されたSSNVは、特に、決定された体細胞性単一ヌクレオチド変異がヘテロ接合性である場合、1つ以上のフィルタリング基準を用いてさらにフィルタリングされ得ることが企図される。例えば、フィルタリング基準は、遺伝子型の質による、体細胞スコアによる、マッピングの質による、ミスマッチの質の合計による、平均ミスマッチ数による、3’末端までの分画距離によるフィルタリング、および/または変異対立遺伝子(mutant allele)の深度によるフィルタリングを含む。さらに企図される態様において、SSNVクラスの各々は、最小数のSSNVメンバー(例えば、少なくとも3つ)の存在を必要とすることがあり、また、SSNVの各々は、最小のシーケンシングカバレッジ(例えば、99%信頼区間で腫瘍変異率1未満を確立するために)を必要とし得る。
【0011】
したがって、別の観点から見て、本発明者らは、配列データベースに分析エンジンを情報的に連結するステップを含む、転移の系統発生を決定する方法を企図し、ここで配列データベースは原発腫瘍、第1の転移、第2の転移、および同じ患者の非腫瘍組織由来の複数の核酸配列を保存する。さらなるステップでは、分析エンジンは、典型的には、エラー確率モデルを用いる可能な遺伝子型の尤度の決定を用いて、同じ患者の非腫瘍組織からの核酸配列に対する原発腫瘍、第1の転移、および第2の転移について、SSNVを決定する。分析エンジンはさらに、原発腫瘍、第1の転移、および第2の転移の各々の完全共有SSNV、部分共有SSNV、固有SSNV、および非存在SSNVを識別し、かつ完全共有SSNV、部分共有SSNV、固有SSNV、および非存在SSNVに基づいて原発腫瘍、第1の転移、および第2の転移のプロファイルを計算する。
【0012】
特に企図される態様では、核酸配列は、エクソーム核酸配列もしくは全ゲノム核酸配列であってよく、および/またはSAMまたはBAMフォーマットであり得る。さらに、体細胞性単一ヌクレオチド変異を決定するステップは、原発腫瘍、第1の転移、および第2の転移についての全ての可能な遺伝子型の尤度を計算するステップを含むことが一般的に企図される。このようにして決定されたSSNVは次に、特に、決定された体細胞性単一ヌクレオチド変異がヘテロ接合性である場合、さらなるフィルタリングにかけられてよい。好適なフィルタは、遺伝子型の質による、体細胞スコアによる、マッピングの質による、ミスマッチの質の合計による、平均ミスマッチ数による、3’末端までの分画距離によるフィルタリング、および/または変異対立遺伝子の深度によるフィルタリングを含む。さらに、本明細書中に提示される方法は、体細胞性単一ヌクレオチド変異の対立遺伝子状態を決定するステップ、および/またはコピー数異常を決定するステップも含み得ることが企図される。
【0013】
本発明の主題の様々な目的、特徴、態様および利点は、同様の数字が同様の構成要素を表す添付の図面とともに、以下の好ましい実施形態の詳細な説明からより明らかになるであろう。
【図面の簡単な説明】
【0014】
図1】異なる患者からの原発腫瘍およびそれらの転移におけるSSNVの状態を示す図である。
図2】SSNVの状態に基づいて、選択された患者についての原発腫瘍およびそれらの転移の系統発生プロファイルを概略的に示す図である。
図3A-1】選択された患者の腫瘍について、第3、第20、および第14の腫瘍染色体に沿ったヘテロ接合性SNPの対立遺伝子の割合、ならびに原発腫瘍および転移の場所を示す例示的な散布図である。
図3A-2】選択された患者の腫瘍について、第3、第20、および第14の腫瘍染色体に沿ったヘテロ接合性SNPの対立遺伝子の割合、ならびに原発腫瘍および転移の場所を示す例示的な散布図である。
図3B-1】原発腫瘍と転移との間の全てのSSNVについて相関するTVPを示す例示的プロット、ならびに原発腫瘍および転移の場所を示す図である。
図3B-2】原発腫瘍と転移との間の全てのSSNVについて相関するTVPを示す例示的プロット、ならびに原発腫瘍および転移の場所を示す図である。
図4】選択された患者についての転移性サブクローン形成、出発、および到着の統合されたポートレートを示す概略図である。
【発明を実施するための形態】
【0015】
黒色腫は、他の癌と同様に、腫瘍細胞内の遺伝子変化の蓄積によって生じ進化すると考えられている。このため、原発腫瘍における体細胞突然変異と同じ患者由来の局所転移および遠隔転移を比較することは、異なる腫瘍細胞集団と転移性播種の順序との間の系統発生学的関係の洞察をもたらし得る。このような分析は、転移する原発腫瘍中の細胞が新たな遺伝子変化を介して他の解剖学的部位に広がり播種する能力を獲得したかどうか、または転移性コロニー形成は単純に、原発腫瘍中の全ての細胞が継承する能力はあるが継承することはほとんどない、確率論的過程であるか、という問いに対する回答ももたらし得る。
【0016】
発明者は、発見のための全エクソームシーケンシング、および検証のための標的シーケンシングを使用して、8人の患者の各々における原発性黒色腫および2つ以上の転移の突然変異パターンを分析してそれらの系統発生関係を決定した。本発明者は、これまでに標的化療法を受けたことのない転移性黒色腫患者からの腫瘍サンプルのシーケンシングを行うことにより、転移を播種する原発腫瘍中の細胞の遺伝進化を追跡できた。本発明者はまた、原発腫瘍中の別個の細胞が、多くの場合共通の親細胞亜集団から進化後に、シード転移と並行して複数回出現することを示すことができた。注目すべきことに、本発明者は、単一の転移が、原発癌において見出された複数の細胞集団によって樹立され得ることも発見した。これらのメカニズムは、重大な遺伝的多様性が複数の転移の間に自然に生じ、成長および薬物耐性をどのように引き起こすかを示すが、ある種の突然変異が転移するように運命付けられた細胞を区別し得ることも示す。
【0017】
転移の系統発生を決定する1つの例示的な方法では、原発腫瘍サンプルおよび転移癌を患者から収集し、典型的には新鮮凍結させるか、または核酸抽出に直接供する。ほとんどの場合、ゲノムおよび/またはエクソーム解析が好ましいが、追加または同様の情報をRNAシーケンシングから得ることもできる。核酸単離は、一般に、既知のプロトコルに従う。同様に、シーケンシングは多数の方法で行うことができるが、ハイスループットおよび次世代シーケンシングが特に好ましい。その結果、核酸配列は、患者特異的単一ヌクレオチド変異を同定するために、原発腫瘍、第1の転移、第2の転移、および典型的には同じ患者の非腫瘍組織からも得られる。当然のことながら、配列データは、FASTA、SAM、BAM、GAR、または生フォーマットなどを含む様々なフォーマットであってよく、またペアエンドリードまたは単一のリードであってよいことに留意されたい。さらに、配列のリードは、さらに処理され(例えば、アライナで、またはユーザが追加するメタデータによって)、シーケンシング装置から直接使用され、あるいはデータベースまたは他のデータキャリア中に任意選択で後に保存され得ることを理解されたい。
【0018】
次のステップでは、好ましくは原発腫瘍、第1の転移、および第2の転移についての全ての考えられる遺伝子型の尤度を計算することによって、SSNVを次に決定する。最も正確な結果を得るために、SSNVは、以下で更に詳細に説明するように、エラー確率モデルおよび1つ以上の厳格なフィルタリングプロセスを使用して通常計算される。フィルタリングの際に、さらなる条件フィルタを使用して原発腫瘍および転移の各々について患者の各SSNVの状態が次いで決定され、それらの状態を次いで用いて、SSNVを様々なグループ(すなわち、完全共有SSNV、部分共有SSNV、固有SSNV、非存在SSNV)に分類する。
【0019】
このような方法は、非常に複雑で難解なデータを大量に使用し、これらのデータをゲノムまたはエクソーム内の最も可能性の高い構成に高精度で単純化し、さらに以下に説明されるように系統発生を戻って追跡することを実質的に容易にすることを特に理解されたい。当然のことながら、このようなシステムは、本明細書に記載された分析を生涯にわたってヒトによって行うことができないので、コンピュータ環境の文脈で一般的に使用される。さらに、本明細書に提示されている企図されたシステムおよび方法は、他のアライメントおよび分析方法よりもデータ処理速度および精度を実質的に高め、したがってSSNVのコンピュータ駆動分析の機能および結果を改善することに留意されたい。
【0020】
コンピュータまたはコンピューティングデバイスに向けられるいかなる言語も、サーバ、インターフェース、システム、器具、データベース、エージェント、ピア、エンジン、コントローラ、モジュール、または個々に、集合的に、または協働的に動作する他のタイプのコンピュータデバイスを含む、コンピューティングデバイスの任意の適切な組み合わせを含むように、読み取られるべきであることに留意されたい。コンピューティングデバイスは、有形の非一時的なコンピュータ可読記憶媒体(例えば、ハードドライブ、FPGA、PLA、ソリッドステートドライブ、RAM、フラッシュ、ROMなど)に保存されたソフトウェア命令を実行するように構成される1つ以上のプロセッサを備えることを理解されたい。ソフトウェア命令は、開示される器具に関して以下に説明するように、役割、責任、または他の機能性を提供するようにコンピュータデバイスを具体的に構成またはプログラムする。さらに、開示された技術は、プロセッサにコンピュータベースのアルゴリズム、プロセス、方法、または他の命令の実行に関連する開示されたステップを実行させるソフトウェア命令を保存する有形の非一時的なコンピュータ可読媒体を含むコンピュータプログラム製品として具体化され得る。いくつかの実施形態では、様々なサーバ、システム、またはインターフェースは、おそらくHTTP、HTTPS、AES、公開/非公開鍵交換、ウェブサービスAPI、既知の金融取引プロトコル、または他の電子情報交換方法に基づき、標準プロトコルまたはアルゴリズムを用いてデータを交換する。デバイス間のデータ交換は、パケット交換ネットワーク、インターネット、LAN、WAN、VPN、または他のタイプのパケット交換ネットワーク;回線交換ネットワーク;セル交換ネットワーク;または他のタイプのネットワークを介して行われてよい。
【0021】
本明細書の記述および以下の特許請求の全範囲で使用されるように、システム、エンジン、サーバ、デバイス、モジュール、または他のコンピュータ要素が、メモリ内のデータに関する機能を実施または実行するように構成されると記述される場合、「ように構成され」または「ようにプログラムされ」の意味は、コンピュータ構成要素の1つ以上のプロセッサまたはコアが、コンピュータ要素のメモリ内に保存された1組のソフトウェア命令によって、メモリ内に保存されている標的データまたはデータオブジェクトに対して一連の関数を実行するようにプログラムされているものとして定義される。
【0022】
従って、異なる観点からみて、本発明者は、原発腫瘍、第1の転移、第2の転移、および同じ患者の非腫瘍組織からの複数の核酸配列を保存するまたは提供する配列データベースまたは1つ以上のシーケンシングデバイスに分析エンジンを情報的に連結できることを企図する。分析エンジンは、好ましくは以下に更に詳細に記述するエラー確率モデルを用いて、同じ患者の非腫瘍組織からの核酸配列に対する原発腫瘍、第1の転移、および第2の転移についてSSNVを次いで決定する。分析エンジンは、原発腫瘍、第1の転移、および第2の転移の各々について完全共有SSNV、部分共有SSNV、固有SSNV、および非存在SSNVを次いで識別し、かつ完全共有SSNV、部分共有SSNV、固有SSNV、および非存在SSNVに基づいて原発腫瘍、第1の転移、および第2の転移について系統発生プロファイルを計算する。
【0023】
上述の方法およびシステムを使用して、また以下に更に詳細に提供されるように、本発明者は、8人の患者からの原発性黒色腫および多数の一致した転移の全エクソームシーケンシングを行い、それらの系統発生学的関係を解明した。本発明者は、8人の患者のうちの6人において、原発腫瘍中の遺伝的に異なる細胞集団が、1つの部位から次の部位へ順次ではなく、異なる解剖学的部位に並行して転移したことを見出した。これらの6人の患者のうちの5人において、転移性細胞は原発腫瘍中の共通の親の亜集団から自然に生じ、転移を確立する能力が遅く進化する形質であり得ることを示した。興味深いことに、本発明者はまた、遺伝的に異なる原発腫瘍の複数の細胞集団によって個々の転移が樹立される場合があることも発見した。複数の腫瘍亜集団によるこのような転移の確立は、全身療法に対する最初の応答後に異なる部位で異なる抵抗性変異体が同定される理由を説明するのに役立つ可能性がある。例えば、1つの原発腫瘍はCTNNB1において異なる発癌突然変異を有する2つのサブクローンを有し、実験的モデルによって示唆されているとおり、これらは両方とも同じ転移に伝えられ、WNTシグナル伝達の活性化が関与するという可能性を高める。
実施例
【0024】
研究デザインと腫瘍サンプル:腫瘍サンプルは、以下から得た。1)MIA(旧Sydney Melanoma Unit)を介して1996年以来インフォームドコンセントとIRBの承認により得られた新鮮凍結腫瘍の有望なコレクションである、Melanoma Institute Australia(MIA)Biospecimen Bank;および2)MSKCCのInstitutional Review Board and the Human Biospecimen Utilization Committeeによって既定された要件に従って獲得および管理される新鮮凍結された腫瘍の生物検体コレクションである、Tumor Procurement Service of Memorial Sloan−Kettering Cancer Center(MSKCC)。原発性黒色腫および2つ以上の転移癌が入手可能であった患者からの腫瘍を含んだ。研究の過程ではいずれのサンプルも除外しなかった。追加の除外基準はなかった。
【0025】
最初の提示および病期(SLNB)の時点でのリンパ節転移を有する患者は、B、D、E、およびFであった。複数の陽性リンパ節が検出された場合には、シーケンシング用に1つのみを採取した。これらの患者は、標的治療薬の出現前にプロファイリングされ、腫瘍がバンクに保存される前にインターフェロンまたはいかなる全身化学療法も受けなかった。
【0026】
分析のために選択された、バンクに保存した新鮮凍結腫瘍転移サンプルを病理学者が検討し、存在する腫瘍細胞およびネクローシスの率について採点した。関与する節の数、最大の転移サイズおよび節外の広がりの存在について、連結した病理学的データを得た。
【0027】
DNA単離およびシーケンシング:DNeasyキット(Qiagen)およびFlexigeneキット(いずれもQiagen)をそれぞれ用いて、切開した組織由来の少なくとも5マイクログラムのDNAおよび末梢血由来の一致DNAを抽出した。シーケンシング用に、腫瘍および正常組織由来の約1.0μgのゲノムDNAを、Covaris E220音響超音波装置で超音波処理によって平均長さ150bpにせん断した。v4 exome+UTRベイトライブラリとAgilent SureSelect Exome Captureキットを使用するオリゴヌクレオチドベースのハイブリッドキャプチャを用いて、約71メガベースのコード配列および非翻訳領域を標的にした。Illumina HiSeq2000システムを用いる合成によるシーケンシングの結果、標的領域の85%以上が90%超の塩基で150倍のカバレッジを受けた。
【0028】
体細胞性単一ヌクレオチド変異(SSNV)の呼び出し:IlluminaのFASTQデータフォーマットでの生シーケンシングデータを、Sangerベースコールフォーマットでコード化されたベース品質スコアでFASTQファイルに変換した。次に、BWAアライナ(Genome Res 18(11):1851−1858)を使用してリードを整列した。このアライナは、Burrows−Wheeler transformationに基づいており、ペアエンドリードを整列させ、挿入欠失を堅牢に取り扱う。BWAの出力は、SAMフォーマット(整列したシーケンスデータ用の現在の標準ファイルフォーマット)で整列されたリードである。SAMフォーマットで保存されたリードを次いで、samtools software(Bioinformatics25(16):2078−2079)を使用してバイナリBAMフォーマットに変換した。ソートされインデックス付けが行われたBAMファイルフォーマットで読み込みが行われると、位置ベースのリードの検索が迅速化され、データストレージ要件が最小化された。次に、PCR複製による誤った突然変異の呼び出しを除去するために、Broad Institute(URL:sourceforge.net/projects/picard/)によって開発されたPicardソフトウェアパッケージに含まれる解析ツールMarkDuplicatesを使用して、全ての重複リードを除去した。重複リードの除去後、ベース品質スコアを、これもBroad Instituteによって開発されたGATKソフトウェア(URL:www.broadinstitute.org/gatk/#Introduction)に含まれるCountCovariatesおよびTableRecalibrationツールを使用して再度較正した。
【0029】
腫瘍および一致した正常BAMファイルを、以下の方法を用いて単一ヌクレオチド変異について分析した。腫瘍および一致した正常の両方においてマッピング品質≧20を有する≧8の一意的(非重複リード)配列塩基を使用して、MAQ誤りモデルを用いて、全ての可能な遺伝子型(AA、AT、ACなど)の尤度を計算した。この文脈では、新しいシーケンシング技術のうちのいくつかは、処理するために新しいアルゴリズムを事実上必要とする非常に短いリードを生成することに留意されたい。特に、参照ゲノムに対し短いリードを効果的に整列させること、およびこのアライメントでのあいまい性または精度の欠如を取り扱うことにおいて、実質的な問題に遭遇する。この目的のために、誤りモデルは、マッピング品質(マッピングアルゴリズムによってそれが整列された位置からリードが実際に来ているという信頼度の尺度)が考慮される場合に特に有利である。例えば、MAQは、倍数体(ヒト)ゲノムのコンセンサス配列の遺伝子型の呼び出しを導出する品質スコアを用いて、参照ゲノムにショットガンショートリードをマッピングすることによってアセンブリを構築できる。MAQはメイトペア情報を充分に活用し、各リードアライメントのエラー確率を推定する。エラー確率は、最終的な遺伝子型の呼び出しについて、最も好ましくは、マッピング品質、生シーケンス品質スコアからのエラー確率、2つのハプロタイプのサンプリング、およびある部位での相関エラーの経験的モデルを組み込んだベイジアン統計モデルを使用して、導出されてもよい。例えば、適切なベイジアン統計モデルはsamtoolsソースコードで利用可能である。2つ未満のリードが現在の位置で何らかの非参照対立遺伝子を裏付ける場合、その位置は同型接合参照とみなされ、さらなる分析を行わなかった。
【0030】
遺伝子型尤度は、参照についての事前確率、ヒトゲノムにおけるヘテロ接合位置の割合、正常な遺伝子型の腫瘍の遺伝子型への変換確率を組み込んで、Somatic Sniper法(Bioinformatics 28(3):311−317)によって使用されるベイズモデルにおいて使用された。このモデルを用いて各腫瘍/正常遺伝子型ペアを採点した。データを与えられた最も高い尤度を有する遺伝子型ペアが、最も可能性の高い腫瘍および正常遺伝子型として選択された。腫瘍および正常の両方で参照対立遺伝子についてホモ接合であると決定されたいかなる位置もさらなる分析は行わなかった。
【0031】
腫瘍および正常遺伝子型が同一であった場合、変異体を生殖系列として分類した。正常な遺伝子型がヘテロ接合性であり腫瘍遺伝子型がホモ接合性であった場合は、ヘテロ接合性喪失(LOH)の領域を示唆し、このような変異体をLOHに分類した。生殖系列またはLOHのいずれかに分類される変異体については、ペア形成された遺伝子型の対数尤度を用いて、生殖系列変異体のPhred−スケール化された質/信頼度を計算した。他の全ての変異体を体細胞突然変異として分類し、それらの体細胞スコア(SS)を計算した。
【0032】
腫瘍および/または正常遺伝子型が参照対立遺伝子に対してホモ接合でない任意の位置について、以下を含む多数のメトリクスを計算した。総リード数、対立遺伝子リード数、平均塩基およびマッピング品質、マッピング品質=0であるリード数、変異体または参照対立遺伝子を有するリードにおけるミスマッチの数および品質合計、リードの3’末端までの変異体の距離、および順方向/逆方向の鎖に整列されたリードの数。全ての推定変異体およびそれらに関連するメトリクスをVCFフォーマットに変換し、以下のフィルタ(Bioinformatics 28(3):311−317)を適用した。構成:遺伝子型の質または体細胞スコア≧100;dp:全深度(正常+原発DP)≧8;mq0:#マッピング品質=0のリード数<5;sb:突然変異対立遺伝子鎖バイアスp値>0.005。(二項検定);mmqs:ミスマッチの品質合計(リード当たり)≦20;amm:平均ミスマッチ数(リード当たり)≦1.5;detp:3’までの分画距離<0.2または>0.8;ad:腫瘍での突然変異対立遺伝子深度≧4;gad:正常での突然変異対立遺伝子深度≦3;およびma:その位置で2つの対立遺伝子のみがリードサポート≧2を有する。
【0033】
上記の全てのフィルタを合格した変異体を、それらのVCFレコードのフィルタ列にPASSとマークした。さもなければ、変異体が失敗した各フィルタの名前を代わりに記録した。各腫瘍サンプル(すなわち、原発腫瘍または転移癌)について単一のVCFファイルを生成した。
【0034】
mutectと比較した本方法を用るSSNVの呼び出し:変異体解析パイプラインの交差検証を、単一のシリーズに対して(患者RPA08−0209の1つの原発腫瘍および3つの転移癌)BroadのMutect(Nat Biotechnol 31(3):213−219)呼び出しを用いて行った。Mutectは、対照として患者の一致した正常を使用して、デフォルト設定で実行した。各腫瘍対一致した正常についてMutectによって行われたフィルタリングされた変異体呼び出しのセットを、本明細書に提示される変異体呼び出し法によってなされた変異体呼び出しと同様に次いで後処理し、各同定された変異体を完全共有(全サンプル中に存在する)、固有(1つのサンプルのみに存在する)、または1つより多いが全てではないサンプルで見出されたものとして分類した。Mutectによって作成されたRPA08−0209シリーズについて分類された変異体呼び出しのセットを、本明細書で提示される方法によって確立された変異体呼び出しと次いで比較した。
【0035】
全体として、2,301の変異体が同一のカテゴリーの両方のセットで見出された。追加の732の変異体はMutectのセットにしかなく、229の変異体は現在の方法にしかなかった。Mutectのセットにしかなかった732の変異体のうち、617の完全共有変異体(84%)、105の固有変異体(14%)、および他のサンプルの組合せ物中に存在する10の変異体(1%)があった。本方法にしかなかった229のうち、208が完全共有と分類され(91%)、10が固有(4%)と分類され、11が他のサンプルの組み合わせ中で発見された(5%)。注目すべきことに、Mutectのセットで発見された変異体のいくつかが本発明の方法で呼び出されなかった理由を調べると、Mutectセット中の617の完全共有変異体のうち611の変異体は、本発明の方法によって呼び出されたがフィルタリングによって除外されたことが明らかになった。2つのフィルタ、MMQSおよびAMMが、これらの呼び出しの大部分をフィルタで除外することに関与した。これらのフィルタは、多数の他のミスマッチ塩基を有するシーケンシングリード上に位置する変異体を廃棄し、アライメントが不正確である低品質および/またはリードによって引き起こされる誤検出の数を減らそうと試みる。Mutectのセットに独占的な105の固有変異体のうち、88は本発明の方法で呼び出されず(84%)、17はフィルタにより除去された(16%)。予想されたように、これらの88の変異体は、低い変異対立遺伝子頻度を有し、その中には、Mutect突然変異モデルの主要な強度を含む。しかし、低い対立遺伝子頻度を有する固有変異体は、発散後のこれらの腫瘍の発達の間に遅く現れる可能性が最も高いため、それらは限られた情報を系統発生解析にもたらす。
【0036】
Indel(挿入欠失)の呼出しを、エクソームシーケンシンググ入力データ用に推奨されるように、その深度フィルタをオフにした以外はデフォルトパラメータを用いてStrelka(Bioinformatics 2012年7月15日、28(14):1811−7)により実施した。Strelkaによって呼び出される全ての体細胞のindelを各サンプルについて収集した。各indelについての存在/非存在状態を、上記のように、置換SSNVの取り扱い方法と同じ様式で、患者系列中のサンプルについて次いで決定した。
【0037】
個々の患者におけるSSNV検出状態の分類:所与の患者からのサンプルのいずれかにおいて発見された全ての変異体を組み合わせて、その変異体が全てのサンプル中に存在するかどうかを決定した。シリーズの全サンプルで1つ以上のフィルタリングに失敗した変異体を取り除いた。シリーズのうちの少なくとも1つのサンプルでPASSとマークされた変異体については、シリーズの全てのサンプルについて、全体的なリード深度、参照および変異対立遺伝子の深度、失敗したフィルタ(存在する場合)、ならびに同じ位置に突然変異を有するCOSMICデータベースでのタンパク質の変化、変異体の分類、およびサンプルの数などの変異体の一般的な情報を含む、変異体のサンプル特異的メトリクスを収集した(Release v55(Nucleic Acids Res 39(Database issue):D945−950))。上に列挙した8以上の一意的リードのフィルタ基準は、一連のサンプルのうちの1つにおいて低い割合で存在する変異体が見逃される可能性を考慮した。この可能性を考慮するため、各サンプルのBAMファイルでの生シーケンシングデータを使用して、シリーズの一致した正常を含む全サンプルについて参照および変異対立遺伝子のリード深度を更新し、参照および変異対立遺伝子の数をベースクオリティ≧20で集計した。
【0038】
個々の変異体について上で詳述した厳密なPASS指定に基づいて、患者の各サンプルについて各体細胞変異体を存在または非存在として次いで分類した。変異体は、以下の場合存在すると分類された。1)サンプル中でPASSとして呼び出された場合、または2)サンプルの生シーケンシングデータで任意の深度で検出され、かつ同じ患者での少なくとも1つの他のサンプルでPASSと呼び出された場合。変異体は、同じ患者での少なくとも1つの他のサンプルでPASSとして呼び出されたが、問題のサンプルの生シーケンシングデータにおいてエビデンスが欠如していた場合には、非存在と分類された。患者の全サンプルで存在として分類された体細胞変異体は、その患者で全ての腫瘍がこれらの変異体を共有した場合、完全共有として更に分類され、それらがその変異体を有する共通の祖先細胞に由来することを示す。た。他の全ての変異体は、非完全共有として分類され、それらが後で発生する進化的分枝に存在することを示す。
【0039】
サンプル間の系統発生学的関係について、ある患者での全てのサンプルにわたり同一の存在/非存在状態を有するSSNVクラスをさらに分析した。最大のエビデンスによって支持されるクラスに焦点を当てるために、以下を必要とした。1)1クラスあたり少なくとも3つのSSNVおよび2)各メンバーSSNVが、99%信頼区間でTVP1未満を確立するのに十分なシーケンスカバレッジを有すること(例えば、全サンプルにわたって平均正常細胞混入がある場合には、この閾値は、重複の除去後≧42リードであった)。弱く支持された変異体の呼び出し(例えば、全ての腫瘍および一致した正常において、全リード深度が42リード未満)は、ゲノムの低捕獲領域または非標的領域に見出される傾向があったことがさらに観察され、それらの除外をさらに正当化する。
【0040】
SSNVの数がこれらの閾値を満たし、以下の図1および表1に示されるようにクラスに分類された。図1には、転移播種中の進化的発散が例示的に示される。高信頼性のコピー数の推定値ももたらす8人の患者のうちの7人について、各腫瘍組織におけるSSNVの数が示される。全腫瘍に存在する完全共有SSNVの数が、下の欄のグラフに表示される。いずれのサンプル中にも存在しないSSNVの数が、上の欄のグラフに示される。いずれのサンプル中にも存在しないSSNVは、各サンプルについて、SSNV階層にさらに細分化される: 他の腫瘍と部分共有されるもの(濃灰色)、サンプル固有のもの(患者の1つのサンプル中にのみ存在するもの、薄灰色)、およびサンプル中に検出されないもの(白)である。SSNVが3つ未満の階層は表示していない。Pは存在を示し、Aは非存在を示し、カッコ内に位置を示す。

【表1】
【0041】
TERT中のプロモーター突然変異(Science339(6122):957−959)を手作業で検査した。C228T突然変異が患者FおよびGの腫瘍で検出され、C250T突然変異が患者A、C、およびDの腫瘍において発見された。突然変異は全患者の全腫瘍の間で完全に共有され、例外は患者Fの遠隔背部転移であったが、この位置を網羅するのは20のリードのみであり、それは存在していたがサンプリングが不十分であった可能性がある。
【0042】
Ion torrent検証シーケンシング:各サンプルから、単位複製配列を等モル量でプールし、10〜100ngをIon Xpress Plus Fragment Library Kitに入力した。Ion PGM Template OT2 200キットを使用するIon OneTouch 2でエマルションPCRを使用してシーケンシングテンプレートを作成した。最大12のバーコード付きサンプルを、Ion 318 v2またはIon 316 v22チップ上で多重化した。シーケンシングを、Ion PGM 200 v2シーケンシングキットを使用してPersonal Genome Machine(PGM)シーケンサー(Ion Torrent)で実施した。Torrent Suiteソフトウェアバージョン4.0.2を使用して、リードをhg19に整列した。リードを、IGV v 2.2.32(Broad Institute)を用いて可視化し、変異体対立遺伝子頻度を、イルミナシーケンシングによって以前に同定された部位について決定した。
【0043】
コピー数異常(CNA)の呼び出し:ここではCNAと呼ばれるコピー数の異常/変異体について、平均腫瘍対一致正常の相対カバレッジおよび標準偏差を、エキソン内の各位置について、腫瘍で測定されたリード深度を一致した正常でのリード深度で割ることにより、各捕獲されたエキソンについて計算した。腫瘍および一致した正常の両方で十分に網羅されなかったエキソン(平均リード深度<5リード)を、残りの分析から除外した。平均相対カバレッジを、LOWESS回帰を使用してGCバイアスについて補正した。腫瘍および一致した正常の両方における平均多数対立遺伝子の割合を、正常組織中の少なくとも1つのヘテロ接合性SNPを有するエキソンについて計算した:

【数1】
【0044】
式中、
【数2】
は、最大のリードサポートを有する生殖細胞系の対立遺伝子のリード深度であり、
【数3】
は、それぞれ、腫瘍と一致正常中の位置での合計リード深度である。相対カバレッジは、腫瘍で観察されたカバレッジを一致正常のカバレッジで割ること、すなわち
【数4】
によって簡単に求められる。
【数5】
推定値の標準偏差を、少なくとも3つのヘテロ接合性SNPを特徴とするエキソンについて計算した。
【0045】
CNAを決定するために、上記で計算されたエキソンレベルの統計を、階層的クラスタリングの趣旨と同様の凝集プロセスでより大きなセグメントに反復的に集約した。第1ラウンドでは、隣接エキソンの全てのペアを分析した。有意に異なる相対カバレッジを有さない隣接エキソンおよび
【数6】
(異種SNPを有するエキソンのみ)推定値(p>0.999、スチューデントt検定の2サンプル)を、単一のセグメントに統合した。新規セグメントについての平均相対カバレッジおよび
【数7】
を、2つの個々のエキソン測定値の塩基対カウントを調整した平均および標準偏差として計算した。この手順を、同じ方法を使用して隣接するセグメントでも引き続き行った。セグメントをもはや統合できない場合、1,000未満のリードおよび/または10のヘテロ接合性SNPを有する任意のセグメントまたはエキソンを除去した。その理由は、それらの弱い統計情報が、それらの直近が一緒に統合されるのを妨げる可能性があるためである。これらのセグメントおよびエキソンを除外した後で、互換性のあるセグメントが残らなくなるまで、互換性のある新たに隣接する任意のセグメントを組み合わせて、反復的な統合の別のラウンドを行った。全てのセグメントの相対カバレッジ推定値は、ゲノム全体の中央値に集中し、中央値は1.0の値が割り当てられ、正常なコピー数状態を示した。対立遺伝子のコピー数に潜在する不均衡ではなくサンプリングバイアスから多数の対立遺伝子のリードサポートが生じた場合に起こる
【数8】
推定値の非対称を、一致した正常サンプルで推定された
【数9】
を差し引くことによって補正した。しかし、そのようなサンプリングバイアスは、両方の対立遺伝子がほぼ等しいコピー数を有する領域でのみ生じるので、補正は以下の式を用いて行った:
【数10】
【0046】
補正されたセグメントおよびエキソンのセットを手作業で次いで見直して、類似の相対カバレッジおよび
【数11】
推定値を有する連続セグメントのより大きな領域を検索し、全ての連続セグメントが同じ対立遺伝子状態を共有することを示した。領域jについて、その領域の相対カバレッジおよび対立遺伝子の割合は、領域内の全てのセグメントの推定値の平均として定義され、以後
【数12】
と称する。
【0047】
相対カバレッジおよび対立遺伝子の割合からの対立遺伝子状態の決定:二倍体(1,1)または1コピーの獲得(2,1)などの、一体の対立遺伝子状態は、予想されるコピー数CN(先の2つの例では2および3)、および以下の式に基づく所定の対立遺伝子状態iについての対立遺伝子の割合AF(先の2つの例では50/50および66.6/33.3)を有する:

【数13】
【0048】
式中、
【数14】
は腫瘍におけるi番目の対立遺伝子の多数のおよび少数の対立遺伝子のコピー数であり、
【数15】
は一致した正常サンプルにおける各対立遺伝子のコピー数(二倍体、
【数16】
と考えられる)であり、αは腫瘍サンプルの正常な混入物の割合である。
【0049】
観察された相対カバレッジおよび対立遺伝子の割合の推定値を生成する可能性が最も高い対立遺伝子状態を決定するために、考えられる対立遺伝子状態セットからのコピー数および対立遺伝子の割合の予想値に観察されたデータを変換する、3つのパラメータを決定した。3つのパラメータは、以下の通りである:正常な混入の割合α、相対カバレッジデルタd、および相対カバレッジスケーリング係数s。パラメータαは、
【数17】
について予測される推定値を制御し、後者の2つのパラメータは、相対カバレッジの観測される推定値を変換する。パラメータdおよびsは、以下の式に従って、二倍体対立遺伝子状態(1,1)からのセグメントの相対カバレッジ推定値のy軸シフトおよびスケールに影響を及ぼす:
【数18】
【0050】

【数19】
はセグメントjの観測された相対カバレッジであり、
【数20】
は、セグメントjの観察された相対的コピー数である。
【0051】
これらの3つのパラメータの最適値を、腫瘍サンプルについて全領域にわたる最小二乗平均平方偏差(RMSD)を求めるGradient Steepest Descent Searchを使用して発見した。領域jの最小偏差を、
【数21】
を最も近い対立遺伝子状態の予測値と比較することによって決定した。
【数22】
【0052】
最小偏差を生成する対立遺伝子状態i
【数23】
を、現在のパラメータセットを与えられた領域jについて最も可能性の高い対立遺伝子状態として記録した。全ての領域のRMSDを、それらのゲノム幅
【数24】
によって重み付けされた全ての領域の最小偏差の和の平方根として次に計算して、RMSD計算上のより大きな領域に対するより短い領域の影響を正規化した:
【数25】
【0053】
検索は、各パラメータの初期値のセット(d=0、s=2、およびα=0.1)、および各パラメータの増分セット
【数26】
(dは増分値0.2で0〜1の範囲であり(5ステップ)、sは増分値0.5で0.5〜4の範囲であり(5ステップ)、およびαは増分値0.2で0.1〜0.9の範囲(4ステップ)である)で開始した。各パラメータp、およびパラメータ増分
【数27】
について、p、p+px,およびp−pxのRMSDを計算した。RMSDの最大の減少をもたらすパラメータ値を、そのパラメータの新しい現在の値として選択した。全てのパラメータとそれらの増分された対応する部分の現在の値を使用して新しいRMSDのセットを計算し、そこからパラメータ値の次の更新を選択した、など。現在のパラメータ増分でRMSDの減少が可能でない場合(すなわち、3つのパラメータの現在の値が最も低いRMSDを有する)、各増分が半分に分割され、検索が再開される。このようなパラメータ分割を3ラウンド行った後で、検索を終了し、3つのパラメータの最終値を最適フィットパラメータとして記録した。勾配降下探索は極小値になる可能性があることから、勾配探索プロセスを、一貫したフィットパラメータセットに収束するまで、異なる初期パラメータで複数回実行した。次に、手作業で、最終パラメータのセットを使用して、予想推定値と観測推定値とを比較して、勾配探索が良好な解を見つけたかどうかを決定した。
【0054】
多数のパラメータの初期化後に一貫したフィットパラメータのセットを求めることができなかった場合、または最適フィットパラメータが手動の見直し時に観測データを適切にモデル化できなかった場合、3つのパラメータを妥当なフィットが見つかるまで手動で調整した。全部で5×5×4=100の出発点を使用した。
【0055】
本発明者らは、散布図上の全てのセグメントについて相対カバレッジおよび対立遺伝子の割合の推定値をグラフ化するインタラクティブ型のウェブベースのツールを使用し、dおよびsの最適フィット値を用いて相対カバレッジを補正した。いくつかの対立遺伝子状態(例えば、(1,1)、(2,1)、(2,0)など)の位置を、アルファの最適フィット値によってそれらの位置を調整した後でこのグラフに重ねた。対立遺伝子状態の位置をセグメントのクラスターと比較して、大きなクラスターが対立遺伝子状態の位置と重複するかどうかを調べた。観察されたデータは、ある対立遺伝子状態を中心に全てのまたは大部分の大きなクラスターが集中する場合、フィットしたパラメータによって「適切に」モデル化された。ある対立遺伝子状態について多くの大きなクラスターが見つからなかった場合は、インタラクティブ型ツールを使用してパラメータd、s、およびαを調整し、より適切なフィットを手動で決定できるかどうか確認した。
【0056】
パラメータの確定されたセットを使用して、上記の方法で各領域jについて最も近い対立遺伝子状態を決定した。2つの対立遺伝子状態の間にそれらを置く観察されたコピー数および対立遺伝子の割合の推定値を有する領域は、それらの相対カバレッジおよび対立遺伝子の割合に基づいてそれらが「潜在的に」サブクローナルであることを示し、これは以下でより詳細に記載されるTVP推定によって検証されるか、または無効化された。対立遺伝子状態の正確な混合物を、下記の方法で決定した。
【0057】
各患者において見出された全ての一意的コピー数変異体の決定:各キュレートされたセグメントについて、全てのコピー数状態の一意的なセットを患者の全腫瘍サンプルについて同定した。ある領域がサンプル中でサブクローナルであった場合、観察されたコピー数状態を生成するために組み合わされ得る2つの完全なコピー数状態をセットに加えた。コピー数状態の一意的なセットを次いで推定した。FISH分析(以下)がA〜Gにおける優位な(1,1)二倍体状態を裏付けられたため、(1,1)対立遺伝子状態が検出された場合、その領域にはコピー数変異体がないと推定された。全てのサンプルが同一の異常状態(すなわち、(1,1)以外)を共有する場合、その変異体は完全に共有されていると決定された。他の全ての残りのコピー数状態であって、全てではなくいくつかのサンプルでコピー数異常を示すものは、完全に共有されていないと定義された。完全に共有された状態、完全に共有されていない状態の数、ならびにサブクローナル対立遺伝子状態を有するサンプルの総数は、各キュレートされたセグメントについて集計された。
【0058】
SSNVに関する腫瘍変異体パーセント(TVP)の計算および99%信頼区間:本発明者らは、各SSNVを含むサンプル中の腫瘍細胞の割合(TVP)を計算するよう試みた。対照的に、突然変異の対立遺伝子頻度は、各SSNVを含む全てのDNA鎖の割合であり、より高いコピー数およびその割合に影響を及ぼす正常な混入を伴う。したがって、SSNVを含むDNA鎖の割合を、鎖を含む腫瘍細胞の割合に変換する必要がある。この割合を決定するための原理的な統計的アプローチは、サンプルの正常細胞混入、SSNVでのコピー数状態、およびその参照および突然変異対立遺伝子のリード数の推定値を必要とした。
【0059】
TVPを計算するために、腫瘍細胞の2つの集団AおよびBが存在し、集団A由来の腫瘍細胞の割合が腫瘍変異体の割合(TVP)であると仮定した。集団Aの全ての細胞について、SSNVの場所を網羅するDNAの
【数28】
鎖(またはコピー)があり、
【数29】
のこれらの鎖がSSNVを含むように、各集団は均質であるとも仮定した。集団Bの
【数30】
も同様に定義された。次に正常な混入がなければ、SSNVの対立遺伝子頻度を以下のとおり表記できる。
【数31】
【0060】
正常な混入がある場合、細胞のαの割合は、それぞれが2本のDNA鎖に寄与する正常細胞であり、仮定によれば、SSNVを含まない。この場合、SSNVの対立遺伝子頻度は、以下となる。
【数32】
【0061】
この式を逆にしてTVPが求められる。
【数33】
【0062】
しかし、サブクローナルSSNVを検索する場合、定義上、一方のクローンに見られるが他方のクローンには見られない突然変異のみに関心があるので、これらの特定の例では、
【数34】
のいずれかである。分析を簡略化するために、2つの集団AおよびBが同じ全コピー数状態を有する、すなわち、
【数35】
である領域のみを考慮し、
【数36】
すなわち、Aクローンにおいて1つのコピーのみ変異したと仮定し得る。これは簡略化された式を導く:
【数37】
【0063】
各SSNVについて、本発明者らは、変異体のリード数をその位置での全リード数で割ることによって対立遺伝子頻度を計算した。Rでbinom.test関数を使用して、対立遺伝子頻度の推定値について標準99%二項CIを計算した。上のTVPの式を次いで使用して、これらをTVPの推定値および99%信頼区間に変換した。
【0064】
腫瘍サブクローンを定義するSSNV群の区別:この研究における多数のSSNVは、単一のSSNVに単に基づいて腫瘍サブクローンを同定する場合に擬似偽陽性のリスクを増大させる。本発明者らはしたがって、サンプル間でTVPの一致する変化を示すSSNV群を検索した。これは、異なる腫瘍サブクローンの存在に関するより大きな裏付けとなるであろう。そのような一致する変化を同定するために、正常なコピー数の領域についてのみ、1つの腫瘍由来の全てのSSNVのTVPを、その患者からのそれぞれの他の腫瘍でのそれらのTVPに対してマッピングした。得られたグラフを、共有クローンSSNV(TVP1,1)とは異なるSSNVのクラスターのエビデンスについて視覚的に調べた。そのようなパターンは、1人の患者(患者C)においてのみ検出された。その患者の各サンプルからのSSNVを、それらのTVP値に関する閾値にしたがって群に分割した。閾値を、Otsu法(Otsu N(1979年)A Threshold Selection Method from Gray−Level HistogramsIEEE Transactions on Systems, Man and Cybernetics 9(1):62−66)によって決定した。この方法は、値の1つのセットを2つの群に分割する全ての可能な閾値をテストする総当たりアプローチを利用し、次にその群内の分散を最小化する閾値を選択する。各サンプルについて選択された閾値(t_原発=0.55、t_局所領域1=0.29、およびt_局所領域2=0.35)を統合して、患者の腫瘍のSSNV群のセットを定義した。組み合わせの方法で各閾値より上または下の点を選ぶことにより全部で6群が可能であった。例えば、群1は、点のセット>t_原発、>t_局所領域1、および>局所領域2、群2は点のセット<t_原発、>t_局所領域、1および<t_局所領域2、などであり、3つの閾値の全ての組み合わせが作成されるまで続く。SSNVが2未満の群を除外した。図4に示す4つの残りの群は以下のように記述される:群1/黄(>t_原発、>t_局所領域1、>t_局所領域2)=855のSSNV、群2/青(<t_原発、>t_局所領域1、>t_局所領域2)=142のSSNV、群3/赤(<t_原発、>t_局所領域1、<t_局所領域2)=20のSSNV、群4/緑(<t_原発、<t_局所領域1、>t_局所領域2)=15のSSNV。
【0065】
群1でのSSNVのTVPは、図3Bで左に向かって延び、0.55に近づく。最も低いTVPを有するいくつかのこれらの群1のSSNVは実際にサブクローンの存在度であり得ることは理論的に可能である。しかし、これが事実であれば、それらは群2青色のSSNVと同じようになお分離し、局所領域転移1および2の両方で完全クローンの存在度に達し、したがって転移を樹立する細胞集団に関する結論を変えないであろう。
【0066】
CNAに関する腫瘍変異率(TVP)および99%信頼区間の計算:本発明者らは、多数の対立遺伝子の対立遺伝子頻度のバイアス補正された推定値(前の段落で説明した)を使用して各CNA領域についてTVPを計算し、CNAを含む腫瘍中の細胞の割合を表示した。正常細胞混入推定値αの場合、腫瘍細胞(主要な対立遺伝子状態Aおよび少数の対立遺伝子状態Bを有する)の率は、以下の式を使用して計算された:
【数38】
【0067】
【数39】
は、それぞれ、対立遺伝子状態AおよびBの多数の対立遺伝子コピー数および全コピー数であり、一致した正常なDNAにおいてセグメントが二倍体であると仮定する。TVP値が1.0より大きいか0.0より小さい場合、それをこの範囲内になるように切り捨てた。TVPの推定値が0.5未満であれば、対立遺伝子状態Aが優性クローンのままであるように、AおよびBの対立遺伝子の状態を入れ替えた。
【0068】
CNA領域に関するTVPの式の導出は、SSNVについて前述したものに従う。ここでの相違点は、対立遺伝子頻度が、単一ヌクレオチドでの突然変異の対立遺伝子の頻度ではなく、今度は多数の対立遺伝子鎖の対立遺伝子頻度であることであり、多数の対立遺伝子
【数40】
のコピー数が、突然変異
【数41】
を含むコピーの数に代わっている。さらに、CNAについて異なるコピー数変化を有する集団AおよびBを比較することに関心があるので、本発明者らは、SSNVの分析においてなされた
【数42】
および
【数43】
の値に関する単純化の仮定をこれ以上行わなかった。
【0069】
TVPの推定値を、次の項で説明するようにその領域に含まれるSNP中の対立遺伝子頻度によって決定されバイアス補正された、多数の決対立遺伝子のAFの推定値に上記式を適用することによって決定した。TVPの信頼区間を、AFの上下の99%ブートストラップ信頼区間に式を適用することによって計算した。TVPの信頼区間が0.01より大きく0.99未満である場合、キュレートされた領域は2つの対立遺伝子状態の混合であるとみなされ、したがってサブクローナルとみなされた。以下でより詳細に説明するように、AFのそのような推定および信頼区間が信頼できるように計算され得るCNAのみが、TVPの推定に考慮された。
【0070】
CNAに関する腫瘍変異率(TVP)の計算におけるSNP対立遺伝子頻度でのバイアスの原因の補正:CNAのTVPを計算するために、本発明者らは、主要な対立遺伝子に由来する全ての細胞中のDNA鎖の数として定義される、主要対立遺伝子の対立遺伝子頻度をまず推定した。これを行うために、その領域の個々のSNPを使用し、その各々は主要な対立遺伝子頻度の独立した推定値を提供し、これらを一緒に組み合わせて対立遺伝子頻度の単一の推定値を得る。
【表2】
【0071】
前述のように、平均の多数対立遺伝子の割合は、正常組織におけるヘテロ接合性SNPについて次式のとおり単純に計算される:
【数44】
【0072】
ここで
【数45】
は最大のリードサポートを有する生殖系列対立遺伝子のリード深度であり、
【数46】
は腫瘍中の位置iにおける全リード深度である。全ゲノムシーケンシングデータでのようにSNPを包括的に位相化できれば、SNPにわたる対立遺伝子頻度のランダム変異は平均0.5である。しかし、この研究でのように、エクソームシーケンシングデータにおいて位相化は非常に制限されるので、本発明者らは、リード深度に依存してSNPを位相化しならびに対立遺伝子頻度を推定した。これにより、確率的サンプリング誤差(すなわち、50%をわずかに上回る値)の結果として「多数」の対立遺伝子の誤同定に基づく小さい持続的なバイアスが生じ、このバイアスは、真の対立遺伝子頻度が0.5に近い場合、すなわち、両方の対立遺伝子が等しいコピー数を有する領域では、より大きくなる。バイアスはシーケンスの深度にも依存し、深度の大きいSNPはよりバイアスの少ない推定値を与える。
【0073】
CNA領域を同定しそれらのコピー数を推定する際に、本発明者らは、それらのコピー数状態に関する情報を必要とせず正常なSNPについて観察されたAFを用いることに依存する方法で、このバイアスを説明してバイアスを補正した。CNA領域に関するTVP計算のためのAFを計算する際に、本発明者らは、コピー数状態が正しく識別されたと仮定し、この設定で発明者は確率モデルに基づいてSNP固有のバイアス補正をより正式に計算した。
【0074】
CNAについては、その領域の優性クローンが同定され、かつこの優性クローンは対立遺伝子特異的コピー数C、例えばC=(2,1)を有すると仮定される。Cは優性クローン中の主要な対立遺伝子の対立遺伝子頻度を意味し、正常な混入αに対して調整され、それは
【数47】
と指定された。次いで、個々のSNPの対立遺伝子頻度の補正された推定値が、以下のように与えられる:
【数48】
【0075】

【数49】
は、二項モデルに基づく対立遺伝子頻度pについての予想されるバイアスであり、そのSNPのシーケンシング深度に特異的である。g(C)は同じ優性クローンコピー数Cを有するCNAにおける全てのSNPに適用される更なるバイアス補正であり、
【数50】
およびg(C)の決定は以下でより詳細に説明される。
【0076】
本発明者らは、CNA領域中の全てのSNPについて
【数51】
を計算し、分析を、シーケンシング深度m>50を有するSNP、および正常組織が
【数52】
を有するSNPに制限した。さらに、g(p)は、以下により完全に示すとおり、いくつかの優性クローン値について確実に推定できなかった。CNA領域全体の対立遺伝子頻度を推定するために、nの個々の
【数53】
推定値の中央値を取った(nはCNA領域中のSNPの数である)。
【0077】
本発明者らは非パラメトリックブートストラップを介して対立遺伝子頻度の99%信頼区間を計算した:
【数54】
値のリサンプリングおよび中央値の計算、次いで5,000回の繰り返し。99%信頼区間は、ブートストラップリサンプリング分布の0.025と0.975の分位点であり、0と1の間であるように切り捨てた(包括的)。
【0078】
【数55】
の導出:真の対立遺伝子頻度pが公知である場合、各SNPについて、二項分布
【数56】
下で
【数57】
の予想されるバイアスを計算できる。以下では添え字iは単純化のために省略される。シーケンシング深度mは一般に大きいので、予想バイアスについて正規近似値を使用した:
【数58】
【0079】
式中、
【数59】
ならびにφおよびΦは、それぞれ、標準正規密度および累積分布(CDF)関数である。p>0.6の場合、
【数60】
は一般に無視できる。これが、対立遺伝子頻度の最初のバイアス補正された推定値を与える
【数61】
【0080】
式中、pは、CNA中の優性クローンに関して対立遺伝子特異的コピー数によって示唆される対立遺伝子頻度であると扱われ、正常な混入αについて調整される(このため、(1,1)および(2,2)領域中のSNPについてはp=0.5である)。この場合も、優性クローンについてp=0.5を有する領域についてのみ、このバイアス補正は無視できないであろう。そのようなCNA領域では、その領域が本当にサブクローナルである場合、この推定値は一般にバイアスの過大評価であり、サブクローナル領域の検出をより控えめにする
【数62】
【0081】
g(C)の導出:このアプローチを用いる結果の詳細な検査は、全てではないがいくつかのバイアスがこの確率モデルによって説明された(したがって、
【数63】
を減算することにより補正された)ことを示した。p=0.5を有する領域由来の何千ものSNPにわたって予想バイアス
【数64】

【数65】
の観測バイアスと比較したところ、
【数66】
は、観測データでバイアスをわずかに過小評価したことが観察された。さらに、この差は異なるサンプルについて異なり、かつ正常なSNP
【数67】
をそれらの予想バイアスと比較したときに観察されたものとも異なっていた。予想される多数の対立遺伝子頻度が0.5ではない(したがって、対立遺伝子頻度の計算においてバイアスによる影響を受けない)領域中で、予想される対立遺伝子頻度と観察される対立遺伝子頻度との間で同様の差異が観察された。いくつかのサンプルでは、サブクローン性のためではなく、これが共有されたバイアスであることを観察するのに十分な数の、類似の対立遺伝子コピー数の領域が存在した。サブクローン性の推定は、観察された対立遺伝子頻度と予想された対立遺伝子頻度との間で差を見つけることに依存することから、この差が、サブクローン性を誤って検出することをもたらし得る。
【0082】
何故このような系統的バイアスが持続し得るのか、いくつか理解されている理由がある。例えば、参照ゲノムにマッピングすることによって、データベースまたはSSNVから欠けているSNPは、成功マッピングを低減し任意の対立遺伝子を優先する。そのような系統的バイアスの他の形態の影響を低減するために、本発明者らは、同じ対立遺伝子コピー数(例えば(1,0))を有する全てのSNPにわたりこの差の中央値を計算することによって各SNPの観察された対立遺伝子頻度をさらに補正した。これをg(C)と示す。本発明者らは、対立遺伝子頻度の最終的なバイアス補正済み推定値を計算する前に、
【数68】
からg(C)を減算した。本発明者らは、これを確実に行うことができる十分な数の領域を有する腫瘍サンプルについてのみこれを行い、いずれの領域も対立遺伝子頻度の予想値の調整に過度に影響しないようにした。具体的には、g(C)を計算するために、本発明者らは、シーケンシング深度が100より大きい少なくとも50のSNPを有した領域のみを考慮し、サンプルが同じ対立遺伝子コピー数を有する少なくとも5つのこのような領域を有することをさらに求めた。サンプルが特定の対立遺伝子コピー数の5つ未満の領域を有するか、または任意の単一領域が所定の対立遺伝子コピー数について全SNPの30%超を含んだ場合、その対立遺伝子コピー数を有する領域はg(C)の推定値をもたず、したがってサブクローン性を推定するための対立遺伝子頻度の推定値を与えなかった。シリーズ当たりのセグメント化領域の総数は、7シリーズにわたって29〜76の範囲であった。基準を満たし対立遺伝子頻度およびしたがってTVP推定値を受けたものは、23〜49(セグメントの60〜96%)の範囲であった。
【0083】
検出された体細胞性単一ヌクレオチド変異(SSNV)の数は、末端のまたは断続的に日光に曝された皮膚(患者E:踵、患者B:背中)由来の原発性黒色腫中のエクソーム当たり96〜115から、慢性的な日光曝露部位の原発性黒色腫での4,900超で変化し、ゲノム当たり4,800〜245,000の突然変異に相当する(全ての腫瘍について高信頼度のコピー数推定値を有する8人中7人の患者を図1に示す)。原発性黒色腫および対応する全ての転移組織中のいずれかの対立遺伝子頻度(AF)で検出されたSSNVは、BRAFV600E、CTNNB1S33Pなどの黒色腫での発癌性突然変異およびTERTプロモーター中の既知の発癌性突然変異を含み、完全に共有されると考えられた(下の黒色層、図1)。原発性腫瘍中の完全クローンAF(すなわち約100%)で検出された完全共有変異体は「祖先」であると考えられ、それらは、いずれかの転移を形成する前に、原発性腫瘍を含む細胞の集団が拡大する間に早期に発生した。対照的に、原発腫瘍と転移性腫瘍との間で完全に共有されないSSNVは、異なる進化履歴を示し、図1の上部に部分共有(濃灰色)および固有(薄灰色)として示される。
【0084】
患者A、C、E、F、およびGの腫瘍の追加の組織切片から抽出されたDNAを用いて、発明者は、平均リード深度953で、イオン半導体シーケンシングにより、エクソームシーケンシングによって最初に発見された72の代表的SSNVのAFを検証した。エクソームシーケンシングによって転移において検出された全てのSSNVは、標的シーケンシングによっても検出された。いくつかの例では、SSNVは複数の独立した原発腫瘍組織切片の一部においてのみ検出され、これは恐らくこれらの変異体の腫瘍異種性を反映している。
【0085】
黒色腫がいかなる局所的中間段階もなく、広範囲で播種するかどうかに関する論争がある。転移性播種が局所領域から遠隔場所に連鎖的に起こる場合、共通の系統発生分枝に局所転移および遠隔転移が存在することが予想される。原発腫瘍といくつかの、しかし全てではない転移との間で部分共有されるSSNVは、原発腫瘍の異なる亜集団が連続してではなく平行して、独立した転移を播種した例を明らかにした。これらの場合、部分共有変異体を獲得する前および後の両方における原発腫瘍中の細胞は、転移を確立しているはずである。患者A、C、およびFにおけるエクソームシーケンシングは、いくつかの転移でのみ共有される原発腫瘍中で、2つのこのような異なる親の部分集団をそれぞれはっきりと明らかにした。したがって、それらの転移は、他の転移から進化するのではなく、原発腫瘍中の独立した細胞から生じる可能性が最も高い。
【0086】
患者Fでは、検証シーケンシングは、少なくとも2つのSSNVが原発腫瘍中にサブクローンとして存在し、局所領域転移中には存在せず、さらにリンパ節および遠隔皮膚転移中に検出されることを確認した。逆に、少なくとも2つのSSNVが原発腫瘍中にサブクローンとして存在し、リンパ節および遠隔転移中には存在しないが、局所領域中に存在した。したがって本発明者は、局所領域腫瘍は、リンパ節および遠隔転移を生じるものとは異なる原発中の細胞集団から生じたと結論付けた。
【0087】
患者Hでは、原発腫瘍および脳転移中に第4染色体の1コピーの欠失が見られたが、リンパ節および局所領域の皮膚転移中には存在せず、後者の腫瘍は脳転移を引き起こすことができなかったことを示す。さらに、リンパ節および脳転移の両方からの固有変異は、C>T置換(それぞれ、1725/1849および804/973のSSNV)の優位性を有し、これらの転移も原発腫瘍中の異なる細胞から生じたことを示唆する。これらのUV駆動突然変異が原発腫瘍以外の腫瘍で獲得された可能性は低い。
【0088】
原発腫瘍が右脚に見つかった患者Dでは、鼠径部リンパ節および四肢右枝の局所領域転移で4つのSSNVが部分共有され、5つの追加のSSNVがわずか2つの局所領域転移で部分共有された。解剖学的関係では、鼠径部リンパ節中の細胞が戻って、原発腫瘍に近い、1つの脚でのみ複数の局所領域転移の基礎を築くことは起こりそうにない。従って本発明者は、5つの部分共有SSNVが原発腫瘍の異なる細胞中で獲得され、その一部が播種するままにされ局所領域的転移において2つの異なる亜集団を形成したと考えた。
【0089】
患者Eでは、CTNNB1の野生型コピーの間質欠失を有する細胞集団が、2つの別個の転移中でサブクローンの割合で検出され、それらが原発腫瘍中の単一の検出されない細胞亜集団によって樹立されたことを強く示唆する。全体として、8人中6人の患者が、原発腫瘍からの転移の平行播種の明確なエビデンスを示した。
【0090】
図2は、分類情報の系統発生的マップへの変換を例示的に示す。容易に分かるように、転移は、原発性黒色腫から平行して、遺伝的に発散した細胞亜集団から始まる。患者A、C、D、E、F、およびHについて、転移性細胞の系統発生履歴を、各腫瘍の新鮮なおよびFFPE部分のシーケンシングに基づいて再構築する。実線の矢印は可能な播種経路を示し、点線の矢印は複数の可能な経路を示す。四角の中の数字は、部分共有SSNVを示す。原発腫瘍中にあると推測されるが、シーケンシングによって直接検出されないSSNVの例を、推論線によって色分けする。播種のパターンは、各患者での転移が原発腫瘍中の異なる細胞に由来することを示し、これは多くの場合、互いの広範な遺伝的多様性を示す。
【0091】
完全クローン性の予想閾値を大きく下回るエクソームシーケンシングからのリード数を有するコピー数異常(CNA)を、サブクローナルとみなした。各患者は、このようなサブクローナルCNAを有する少なくとも1つの腫瘍を有した(患者1人当たり1〜10、腫瘍あたり最大6。原発腫瘍中のサブクローナルCNAは、病変が樹立された後に生じたにちがいない。このようなサブクローンの細胞から樹立された転移はいずれも、全ての細胞中でその新たな異常を有するはずである。
【0092】
予想していなかったが、患者Eでは、図3Aに概略的に示されるように、CTNNB1を欠失している第3染色体上の同一の34Mbの間質欠失が、サブクローンレベルで局所領域転移1および2の両方において観察された。欠失が共有する同一の隣接する不連続点を考えると、これらの2つの転移中でそれらが独立して発生したとは考えにくい。本発明者はしたがって、これらの転移はそれぞれ少なくとも2つの細胞集団、すなわち欠失を有する細胞集団および欠失を有さない細胞集団によって樹立されたはずであると結論付けた。他の患者では、本発明者は、1つより多い転移中で、同一の一意的サブクローナルCNAを同定できなかった。
【0093】
さらに図3Aを参照すると、散布グラフのチャートは、y軸に、患者Eの腫瘍について、第3、第20、および第14染色体に沿ったヘテロ接合性SNPの対立遺伝子の割合を示す。原発腫瘍、3つの局所領域転移、およびリンパ節転移を示し、臨床的提示の時間に従って上から下に順序付けられる。0.5からの対立遺伝子の割合の発散は、コピー数の変化を示す。得られた対立遺伝子状態を、各セグメントの下の赤い数字で示す。灰色線は、正常細胞の混入を考慮して、CNAが腫瘍の全ての細胞中に存在する場合、予想される対立遺伝子の割合を描写する。濃灰色の線は、各CNAについて観察された平均コピー数レベルを示す。円で表される第3染色体上の33.9Mb領域は、局所領域転移1におけるサブクローンの除去(TVP=32.1%、99%CI=28.0〜35.6%)および局所領域転移2におけるサブクローンの除去(TVP=91.9%、99%CI=90.4〜93.2%)ならびに転移3における完全クローンの除去(TVP=100%)を含む。第20染色体は、ダイヤモンド型によって表される、0〜25.53Mbおよび40.39〜50.93Mbにそれぞれ到達する2つの別個の除去を示し、これらは、全ての転移において完全クローンレベルで存在するが原発腫瘍中には存在しない。第14染色体の1コピー全体が全腫瘍中で完全クローンレベルにて除去されており、したがって完全共有(三角形)とみなされる。局所領域転移1および2中のサブクローンレベルでの第3染色体の9.72〜43.6Mbの欠失の存在は、これらの腫瘍のうちの少なくとも1つが、2つの異なる細胞集団、すなわち第3染色体の欠失を有する細胞集団および有さない細胞集団によって樹立されたことを示唆する。
【0094】
図3Bの散布図は、患者Cについて、コピー数の変化に影響されないゲノム領域中の全てのSSNVに関するTVPを示す。x軸上に原発腫瘍のTVPを示し、それぞれのy軸上に局所領域転移1(上のグラフ)および2(下のグラフ)を示す。完全共有SSNVは、三角形で描写され、完全なクローンレベルで全ての腫瘍中に存在する。原発腫瘍の細胞の約30%に存在するサブクローン(×)は、両方の転移においてほぼ完全クローンレベル(TVP=100%)で存在する。原発腫瘍中のTVP25%を有する第2のサブクローン(ダイヤモンド型)は、転移1では完全クローンであるが、転移2ではTVPは25%であり、転移2が、少なくとも2つの遺伝的に異なる樹立細胞(一方は赤いダイヤモンド型で描写されたSSNVを含み、他方は含まない)によって播種されたことを示唆する。原発性黒色腫中に3%で存在する第3のサブクローン(丸)は、転移1中には存在しないが、転移2中に約75%の存在度で存在し、それが転移2の細胞に、完全ではなく部分的に寄与したことを示す。この第3のサブクローンはしたがって、2つの遺伝的に異なる集団によって転移2が樹立されたことも示す。
【0095】
次に、SSNVデータが単一転移を樹立する複数の細胞集団を明らかにすることもできるかを調べた。個々のSSNVはサブクローンを明確に同定するのに不十分な検出力しか与えないので、発明者は、部分集団を示す、同様のサブクローンAFを有する部分共有または完全共有されるSSNVのクラスターを検索した。本発明者は、SSNVを保有する遺伝子座での正常な細胞混入およびコピー数を考慮して、二倍体領域中に各個々のSSNVを担持する腫瘍細胞率を推定した。患者Cのみで、原発腫瘍および両方の転移において、群化アルゴリズムを用いて、SSNVの4つのこうしたクラスターが識別された。これらのSSNVの4つのクラスターの各々は、原発腫瘍と2つの転移との間でTVPの座標変化を示した。
【0096】
このアルゴリズムによって生成されたクラスターは、原発腫瘍中のいくつかの完全クローンSSNVが両方の転移においても完全にクローンであることを明らかする(三角形、図3B)。原発腫瘍中のいくつかのサブクローナルSSNVは、両方の転移において完全クローン(×)である。より低い存在度で原発腫瘍中に存在するサブクローナルSSNVの2つのクラスター(ダイヤモンド型および丸)は、局所領域転移1中では共分離せず、それぞれが異なる細胞集団に存在しなければならないことを示唆する。しかし、驚くべきことに、これらの異なる亜集団の両方は患者Cで局所領域転移2中に検出される。したがって、患者CおよびEの両方でのシーケンシングデータは、それらの転移が単一細胞によってではなく、異なる遺伝的同一性を有する少なくとも2つの細胞によって播種されたことを示唆する。
【0097】
興味深いことに、両方の患者において、定義されるサブクローン集団はCTNNB1での改変も含んだ。患者Eにおいて、第3染色体上の間質欠失はCTNNB1の野生型コピーを除去し、半接合S33P突然変異を残した。患者Cでは、2つの異なる既知の発癌性CTNNB1変異体が検出された。これは、別個の腫瘍亜集団中で生じたようであり、SSNVの別個のクラスター内のそれらの場所によって実証された。図3Bに丸で示されるSSNVクラスターの一部であるG34E変異体は、原発腫瘍中の細胞の6%に存在し、局所領域転移1中には存在せず、局所領域転移2中の細胞の75%に存在すると推定された。対照的に、S33P変異体は、SSNVクラスター中でダイヤモンド型で示され、原発腫瘍中の細胞の31%に存在し、局所領域転移1中で完全クローンであり、局所領域転移2の細胞の25%に存在した。両方の亜集団は、局所領域転移2へと独立して播種したにちがいない。転移に関連するこれらの後期発生変異体の中で、β−カテニン中の既知の活性化突然変異が複数回現れたことは注目に値する。WNTシグナル伝達経路の活性化(例えば、β−カテニン突然変異による)もまた、黒色腫マウスモデルにおける転移能の促進に関与している。患者Cにおける転移性播種の再構成された進化を図4に描写する。
【0098】
図4は、855のSSNVを有する祖先細胞が増殖し、原発腫瘍を生成する状況を例示的に示す。原発腫瘍への拡大中に、特定の細胞がさらに142のSSNVを獲得し、その後、その亜集団由来の2つの細胞がさらに15(薄灰色)およびさらに20以上(濃灰色)のSSNVを獲得した。興味深いことに、これらの後に進化する亜集団(薄灰色および濃灰色、転移で見られるものと同一である)の各々は、異なる既知の発癌性CTNNB1突然変異をそれぞれ獲得する。両方のサブクローンが局所領域転移2中に見られ、一旦転移能を獲得すると、能力のあるサブクローンは既存の転移に到達できるか、または他の転移性サブクローンと同時に移動できることを示唆する。
【0099】
上述のとおり、患者CおよびDで、本発明者は原発性黒色腫中の転移性亜集団の段階的進化のエビデンスを見出し、原発腫瘍中で時間の経過とともに発生する転移の共通の前駆細胞を裏付けた。原発腫瘍中の特定のサブクローン集団からの転移性細胞集団の系統を裏付ける明確な一連のエビデンスは、全ての転移で部分共有されるが、原発腫瘍では検出されないSSNVの存在である。このような場合、転移を引き起こした原発腫瘍中の細胞集団は、i)シーケンシングされていない部分に存在する、またはii)シーケンシングされた部分に検出不可能な(<1%)サブクローンレベルで存在する、またはiii)本研究では分析されていない別個の転移由来である、のいずれかであった。3つのこのようなSSNVが患者Eで検出され、5つのこのようなSSNVが患者Hで検出された。
【0100】
患者Fでは、原発腫瘍と特異的転移との間で部分共有される4つのSSNVは、エクソームおよび検証シーケンシングのために使用された原発腫瘍の少なくとも10%に相当する組織中には検出されず、原発腫瘍の残りの部分中のサブクローン集団中の起源であることを示した。したがって、転移が原発腫瘍中の少なくとも2つの異なるサブクローン集団に由来した6人の患者のうちの5人(C、D、E、FおよびH)において、これらのサブクローン集団自体は共通の親サブクローナル集団に由来した。
【0101】
したがって、本研究は転移性播種のプロセスに対するいくつかの新しい洞察を提示することに留意すべきである。収集された材料は、本発明者が、高いシーケンスカバレッジにおいて、原発性黒色腫およびそれらの一致した転移の両方の異なる領域をサンプリングおよび分析できるようにした。得られたデータにより、発明者は、異なる部位での腫瘍集団間の系統発生の関係を描出し検証できた。この研究は、転移性播種が原発腫瘍の異なる亜集団から生じ得るというエビデンスをもたらし、それは多くの場合、連続的方式ではなく平行して播種して、局所転移および遠隔転移を形成する。原発性黒色腫からの遺伝的に異なる細胞集団の転移は、腫瘍組織の異質性をおそらく増強し、潜在的に薬物耐性に寄与する。
【0102】
転移性播種の逐次的概念は、局所転移が遠隔転移よりも早期にしばしば検出されるという臨床観察に基づく。原発腫瘍からの増殖刺激因子の分泌などの説明が提唱されているが、転移における複数の樹立集団の観察は、乳癌において実験的に実証されているように、局所転移は、原発腫瘍へのそれらの近接が播種事象の繰り返しの確率を高めるためより速く成長する、という可能性を高める。
【0103】
黒色腫のマウスモデルおよび患者の両方で近年検出されたように、場合によっては転移における複数の樹立集団は、細胞クラスターを播種した結果であり得ると考えられる。興味深いことに、乳癌における循環クラスターもまた、いくつかの転移においても活性化される分子であるカテニンを介する増強されたシグナル伝達を示す。ヒト黒色腫患者において本明細書で報告される現象は、標的治療で治療された患者の疾患再発の特定のパターンを説明し得る。例えば、抵抗性変異体を有する特定の細胞集団によって複数の転移が部分的に樹立された場合、これらの転移は、初期応答期間後に同時に増殖を再開し得る。このようなパターンは、BRAF突然変異黒色腫がRAF阻害に最初に応答したがその後著しい多発性再発を示した患者におけるMEK突然変異について示されている。
【0104】
最後に、本発明者は、細胞が転移を確立する能力は、サブクローナル親から出現する形質であり得ることを実証し、原発腫瘍の確立に必要な改変に加えて変化が必要とされることを示唆する。転移を樹立する細胞は、単に偶然に共通の親から繰り返し伝わった可能性がある。しかし、原発が活性化NRAS突然変異を有していた患者CおよびEでは、全ての6つの転移は、活性化されたCTNNB1を獲得した原発腫瘍のサブクローナル集団によってのみ樹立された。βカテニンは、これまでに黒色腫における転移と実験上では関連づけられている。患者Cで転移する2つの細胞集団のうち、それぞれが、β−カテニン中に異なる既知の活性化突然変異(S33PおよびG34E)を獲得し、これらは、転移を形成する際のCTNNB1活性化の必要性と一致する。
【0105】
転移性細胞亜集団の後期進化はいくつかの膵癌で報告されているが、それは乳癌転移の単一細胞シーケンシング分析では検出されなかった。いくつかの原発性黒色腫が転移のために追加の異常を必要とするモデルは、転移能が増強されたクローンの出現の前に腫瘍を切除することは治効があると予想されるため、それらの早期検出および除去によって生存利益が得られる理由を説明できる。確認されるならば、これらの転移可能な突然変異は、播種の危険がある原発性黒色腫を同定するためのバイオマーカーとして作用し得る。
【0106】
本明細書の発明概念から逸脱することなく、既に説明した以外の多くの修正が可能であることは、当業者には明らかである。したがって、本発明の主題は、添付の特許請求の範囲を除いて限定されるものではない。さらに、明細書および特許請求の範囲の両方を解釈するにあたり、全ての用語は、文脈と一致する最も広い可能な方法で解釈されるべきである。特に、用語「含む(comprises)」および「含んでいる(comprising)」は、要素、構成部品またはステップを非排他的な方法で参照するものと解釈され、参照された要素、構成部品またはステップが存在するか、利用するか、または明示的に言及されていない他の要素、構成部品、またはステップと組み合わせるができることを示している。明細書の請求項が、A、B、C...およびNからなる群から選択されたもののうちの少なくとも1つに言及する場合、この文章は、A+N、B+Nなどではなく、その群の要素を1つのみ必要とすると解釈する必要がある。
【要約】
企図されるシステムおよび方法は、原発腫瘍および転移に見出される体細胞性単一ヌクレオチド変異の同定および分類を使用して、転移の系統発生を決定する。
【選択図】図1
図1
図2
図3A-1】
図3A-2】
図3B-1】
図3B-2】
図4