特許第6268230号(P6268230)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ファイヴ3 ゲノミクス,エルエルシーの特許一覧

特許6268230MDM2を含む二重微小染色体およびその方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6268230
(24)【登録日】2018年1月5日
(45)【発行日】2018年1月24日
(54)【発明の名称】MDM2を含む二重微小染色体およびその方法
(51)【国際特許分類】
   C12Q 1/68 20180101AFI20180115BHJP
   G06F 19/22 20110101ALI20180115BHJP
   C12N 15/09 20060101ALN20180115BHJP
【FI】
   C12Q1/68 Z
   G06F19/22
   !C12N15/00 A
【請求項の数】15
【全頁数】22
(21)【出願番号】特願2016-126581(P2016-126581)
(22)【出願日】2016年6月27日
(62)【分割の表示】特願2014-546145(P2014-546145)の分割
【原出願日】2012年12月7日
(65)【公開番号】特開2016-195604(P2016-195604A)
(43)【公開日】2016年11月24日
【審査請求日】2016年6月27日
(31)【優先権主張番号】61/568,513
(32)【優先日】2011年12月8日
(33)【優先権主張国】US
(31)【優先権主張番号】61/616,535
(32)【優先日】2012年3月28日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】514145338
【氏名又は名称】ファイヴ3 ゲノミクス,エルエルシー
(74)【代理人】
【識別番号】100114775
【弁理士】
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【弁理士】
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100191086
【弁理士】
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】サンボーン,ジョン ザキャリー
(72)【発明者】
【氏名】ヴァスク,チャールズ ジョゼフ
(72)【発明者】
【氏名】ベンツ,ステファン チャールズ
【審査官】 西 賢二
(56)【参考文献】
【文献】 国際公開第2011/149534(WO,A2)
【文献】 荒木攻, 他3名,"特異な染色体異常−double minute chromosomes−を伴った多形性膠芽腫の1例",Neurol. Med. Chir. (Tokyo),1987年,Vol. 27,p. 789-794
【文献】 KAWASAKI, Tsutomu et al.,"BCL2L2 is a probable target for novel 14q11.2 amplification detected in a non-small cell lung cancer cell line",Cancer Sci.,2007年,Vol. 98,p. 1070-1077
【文献】 HILLMER, Axel M. et al.,"Comprehensive long-span paired-end-tag mapping reveals characteristic patterns of structural variations in epithelial cancer genomes",Genome Res.,2011年 5月,Vol. 21,p. 665-675
【文献】 ALEKSEYEV, M. A. et al.,"Breakpoint graphs and ancestral genome reconstructions",Genome Res.,2009年,Vol. 19,p. 943-957
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00−3/00
C12N 15/00−15/90
MEDLINE/EMBASE/BIOSIS/WPIDS(STN)
(57)【特許請求の範囲】
【請求項1】
全ゲノムのペアエンド配列解析を採用してゲノムデータを解析する方法であって、前記方法が、
腫瘍のゲノム配列と該腫瘍ゲノム配列を有する対象の非腫瘍組織由来である対応する正常ゲノム配列との間の相対コピー数を決定するステップ、
前記腫瘍のゲノム配列における信頼度の高い切断点および関連する高いコピー数を同定するステップ、
前記腫瘍のゲノム配列の位置および方向を同定するステップ、
前記信頼度の高い切断点を重要な切断点として確認するために、リード支援閾値を使用することと、
切断点グラフを作成し、および前記切断点グラフを解析して環状ソリューションに到達することによって環状ソリューションを有するゲノム構成を決定するために、前記相対コピー数、前記重要な切断点、および前記方向を使用するステップ
を含む、方法。
【請求項2】
前記相対コピー数を決定する前記ステップは、動的ウィンドウイングを使用して実行され、かつ/または信頼度の高い切断点を同定する前記ステップは、不一致のペアリードを使用して実行される、請求項1に記載の方法。
【請求項3】
前記コピー数は、前記切断点グラフにおいて縁部として表され、かつ前記切断点が前記切断点グラフにおいて頂点として表される、請求項1に記載の方法。
【請求項4】
前記信頼度の高い切断点を同定する前記ステップは、前記腫瘍ゲノム配列をフラグメント化すること、および前記フラグメント化により得られたフラグメントを参照データベースと比較することを使用して実行される、請求項1に記載の方法。
【請求項5】
前記リード支援閾値はユーザが決定する、請求項1に記載の方法。
【請求項6】
前記環状ソリューションは、二重微小染色体を前記ゲノム構成として示す、請求項1に記載の方法。
【請求項7】
前記腫瘍のゲノム配列は、固形腫瘍である腫瘍に由来し、前記腫瘍のゲノム配列は、体液中に存在する遺伝物質から取り出される、請求項1に記載の方法。
【請求項8】
前記体液は血液である、請求項7に記載の方法。
【請求項9】
前記固形腫瘍は、多形性膠芽腫または非小細胞肺癌である、請求項8に記載の方法。
【請求項10】
全ゲノムのペアエンド配列解析を採用して、血液中に存在する遺伝物質からゲノムデータを計算的に解析する方法であって、前記方法が、
切断点に対するリード支援閾値に達すると、腫瘍のゲノム配列のコピー数を前記腫瘍のゲノム配列内の前記切断点に関連付けるステップ、
前記腫瘍のゲノム配列の方向を決定するステップ、および
切断点グラフを作成し、および前記切断点グラフを解析して環状ソリューションに到達することによって環状ソリューションを有するゲノム構成を決定するために、前記腫瘍ゲノム配列を有する対象の非腫瘍組織由来の、腫瘍ゲノム配列と対応する正常ゲノム配列との間の相対コピー数、重要な切断点、および方向を使用するステップ
を含み、
前記腫瘍が固形腫瘍であり、
前記固形腫瘍は、多形性膠芽腫または非小細胞肺癌であり、かつ前記固形腫瘍ゲノム配列は、血液中に存在する遺伝物質より決定される、
方法。
【請求項11】
前記リード支援閾値は、ユーザが画定したリード支援閾値である、請求項10に記載の方法。
【請求項12】
前記切断点グラフにおいて、前記コピー数は縁部として表され、前記切断点は頂点として表される、請求項10に記載の方法。
【請求項13】
固体腫瘍を、腫瘍ゲノムの少なくとも一部が体液内に存在する腫瘍と同定するステップ、
患者由来の前記体液を用いて、前記腫瘍ゲノムの少なくとも一部を取り出すステップ、および
請求項1または請求項10の方法により、前記ゲノムデータを解析するために、前記腫瘍ゲノムの前記取り出された少なくとも一部を使用するステップ
を含み、全ゲノムのペアエンド配列解析を採用して固体腫瘍のゲノムデータを解析する方法。
【請求項14】
前記腫瘍ゲノムの前記少なくとも一部は、二重微小染色体として存在する、請求項13に記載の方法。
【請求項15】
前記腫瘍ゲノムの前記取り出された少なくとも一部内の腫瘍遺伝子または腫瘍抑制遺伝子を同定するステップをさらに含む、請求項13に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2011年12月8日に出願された米国特許仮出願第61/568,513号、および2012年3月28日に出願された米国特許仮出願第61/616,535号の優先権を主張する。本出願および本明細書に論じられた他のすべての外因材料は、それらの全体が参照によって組み込まれる。組み込まれた参照における用語の定義または使用が、本明細書に提供されたその用語の定義と矛盾する、または相容れない場合は、本明細書に提供されたその用語の定義を適用し、参照におけるその用語の定義は適用しない。
【0002】
本発明の分野は分子診断であり、特に、ゲノム再構成の解析および同定に関する。
【背景技術】
【0003】
全ゲノム配列の導入は、研究者にほとんどの癌のゲノム再構成の特徴の複合状態を測定する先例のない能力を提供してきた。ペアエンド配列データから構造変動を推測するための多数の方法が開発されてきたが(Bioinformatics(2009)、25、i222〜i230、Nature Methods2009年8月、6、677〜681、Nature Genetics2011年3月、43、964〜968)、このような方法によって名付けられた構造変異は、主に潜在的融合遺伝子を同定するために使用される、分離に過ぎないとみなされることが多い。すべての真の構造変異を発見し、誤検出を除去する難しさにより、腫瘍ゲノムの大領域を再構築する現在公知の方法の出力を使用することを困難にさせる。適切な腫瘍ゲノムアセンブリは腫瘍ゲノムの複雑な構造を明らかにするのに役立ち、それによって腫瘍遺伝子の増幅および腫瘍抑制遺伝子の欠失などの体細胞変異が起きる機構を推測するために使用できるので、このような難しさは特に遺憾なことである。
【0004】
また、全ゲノム配列のコストが急速に低減し、データ解像度が増加することは、血液からの癌診断の新しい分類が出現する見込みがある。例えば、Learyら(SciTransl Med2010年2月、2(20)、20ra14)は再構成された端部の個別分析(PARE)を開発し、PAREは、体細胞の再構成を使用して再発に対して血液に基づく診断検査を構築する。この新規の方法は、監視に対する強力な枠組みを提供する一方で、生体腫瘍組織の解析は、通常血液中で測定される特異的マーカーを見出すことが必要とされる。循環腫瘍細胞の測定などの他の監視技法は、転移能のある腫瘍が存在するときのみに実行可能な、非常に強力な成果を必要とする(Cancer Lett.2007年8月、253(2)、180〜204)。これらの技法はどちらも、最初の腫瘍診断に対してそれらの技法を不適切にさせる技術的障害を示す。
【0005】
二本鎖DNAは、細胞の細胞質内で高度に増幅し循環させることができ、二重微小として公知のものを形成することは充分に立証されている(Cancer Genet. Cytogenet.1982年2月、5(1)、81〜94)。二重微小(DM)は、ある種の薬物に対して耐性を与え、ならびにこの耐性を娘細胞に不均一に伝達することが示されてきた。DMは、数メガベースのサイズまで観察されており、実際の染色体に似た染色質を含むが、正常染色体内に見出されるセントロメアまたはテロメアがない。DMにはセントロメアがないので、DMは細胞分裂中に娘細胞に無原則に分散され、DMを維持するためにいくらかの選択圧がなければ、DMは概して次世代に喪失される。しかし、DMの無原則な分散はまた、次の世代で発癌性DMを急速に増幅する単純機構も提供し、この場合、細胞は二重微小の数百のコピーを蓄積することがある。多形性膠芽腫(GBM)における二重微小の頻度はほとんど知られていないが、Fanらによる最近の研究(J.Appl.Genet.2011年2月、52(1)、53〜59)は、神経細胞腫が2番目に高い割合のDMを有すると確認し、恐らくGBM腫瘍において頻繁に増幅された腫瘍遺伝子の一部は、発癌性二重微小の形成および蓄積によって説明することができる可能性を提供している。
【発明の概要】
【発明が解決しようとする課題】
【0006】
DMは、もともと30年以上前に同定されたという事実にもかかわらず、DMの包括的な配列解析が行われたという文献による証拠がない。したがって、改良された診断方法、特にDMの存在に関連付けることができる腫瘍性組織の遺伝子解析のための改良された方法が、依然として必要とされている。
【課題を解決するための手段】
【0007】
本発明の主題は、通常、腫瘍に関連した高度に増幅された腫瘍遺伝子を含む、損傷していないDMを完全に再構築するために、全ゲノムのペアエンド配列解析が、高信頼度の切断点および関連した高いコピー数の同定を介して、遺伝子の再構成の迅速で包括的な同定をできる方法および計算システムに向けられる。
【0008】
本発明の主題の特に好ましい一態様において、ゲノムデータを解析する方法は、腫瘍ゲノム配列および対応する正常ゲノム配列(matched normal genomic sequence)の間の相対コピー数を決定するステップを含む。該方法は、該腫瘍ゲノム配列および該対応する正常ゲノム配列における推定の切断点を同定するさらなるステップを含む。別のステップでは、該推定の切断点を精緻化するが、好ましくは該腫瘍ゲノム配列をフラグメント化することおよびこのフラグメントを参照データベースと比較することにより精緻化し、切断点の位置および該腫瘍ゲノムの方向を同定する。また、別の態様において、リード支援閾値(read support threshold)(例えば、ユーザが決定したリード支援閾値)を、該切断点が重要な切断点であるかを確認するために使用し、および、該方向を、環状ソリューション(circular solution)(該環状ソリューションは、二重微小染色体を示し得る)を有するゲノム構成を決定するために使用する。
【0009】
特に好ましい態様において、上記相対コピー数を決定するステップは、動的ウィンドウを用いて実施し、および/または、上記推定の切断点を同定するステップは、不一致の対リード(discordant paired read)を用いて実施する。本発明の主題に限定するものではないが、上記ゲノム構成を、切断点グラフを作成し、および該切断点グラフを解析して上記環状ソリューションに到達することによって決定することが一般的に好ましい。
【0010】
さらに企図された態様では、腫瘍のゲノム配列は固形腫瘍に由来するが、腫瘍のゲノム配列は、体液(例えば、血液、血清、血漿、吸引液など)中に存在する遺伝物質から取り出される。例えば、固体腫瘍は、多形性膠芽腫または非小細胞肺癌であってもよい。
【0011】
異なる視点から見ると、ゲノムデータを解析する企図された方法は、切断点に対するリード支援閾値(好ましくはユーザが画定する)に達すると、腫瘍のゲノム配列のコピー数を腫瘍のゲノム配列内の切断点に関連付けるステップ、および腫瘍のゲノム配列の方向を決定するステップを含んでもよい。このような方法は、腫瘍のゲノム配列のコピー数、切断点の位置および方向を使用して、ゲノム構成を決定するステップをさらに含む。必ずしもそうではないが、通常、ゲノム構成を決定するステップは、腫瘍のゲノム配列のコピー数、ゲノム内の切断点の位置、および腫瘍のゲノム配列の方向を使用して、切断点グラフを生成することによって実行され、切断点グラフにおいて、コピー数は縁部として表され、切断点の位置は頂点として表される。
【0012】
本発明の主題の別の態様において、固体腫瘍のゲノムデータの解析方法は、該固体腫瘍が、その腫瘍ゲノムの少なくとも一部が生体液中に存在する腫瘍であること、を同定するステップを含むであろう。また、該方法は、患者から生体液を獲得する別のステップおよび該腫瘍ゲノムの少なくとも一部を単離するステップも含むであろう。該腫瘍ゲノムの少なくとも一部は、その後、上記したように、および、詳細な記載内に記載されているように、ゲノムデータを解析するために使用する。もっとも一般的には、該腫瘍ゲノムの一部は、二重微小染色体として、該単離された少なくとも一部の該腫瘍ゲノム内に存在するが、該二重微小染色体は、発癌遺伝子または腫瘍抑制遺伝子を含み得る。このイベントにおいて、該方法は、該発癌遺伝子または腫瘍抑制遺伝子を標的とした医薬品の処方計画を用いて患者を治療するステップまたは治療の助言をするステップもまた含むであろう。
【0013】
本発明の主題のさらに別の態様では、固体腫瘍(は、例えば多形性膠芽腫または非小細胞肺癌である)のゲノムデータを解析する方法は、患者から体液(例えば、血液、血清、血漿など)を獲得し、体液から腫瘍ゲノムの少なくとも一部を取り出すステップ、および腫瘍遺伝子(例えば、EGFR、c−Myc、もしくはMDM2の野生型または突然変異型)を包囲する領域が、増幅された二重微小を示すクラスタ型の切断点を示すかどうかを判定するさらなるステップを含む。判定は、好ましくは上述および詳述におけるように実行される。
【0014】
したがって、発明者らはまた、患者から生体試料を獲得し、その試料から核酸を取り出すステップ、ならびにゲノム試料のコピー数およびゲノム試料内の切断点に対して核酸を解析するさらなるステップを含む、腫瘍性疾患(例えば、胃癌、大腸癌、前立腺癌、肺癌、白血病、または乳癌)をデノボ診断する方法も企図する。一層さらなるステップでは、ゲノム配列のコピー数は、切断点に対するリード支援閾値に達するとゲノム配列内の切断点に関連付けられ、ゲノム配列の方向が決定される。さらに別のステップでは、ゲノム構成は、ゲノム配列のコピー数、切断点の位置、および方向を使用して決定され、そのように同定されたゲノム構成を使用して、腫瘍性疾患に対する可能性を決定する。本発明の主題の少なくとも一部の態様では、ゲノム構成は、二重微小、および/または腫瘍遺伝子もしくは腫瘍抑制遺伝子を含むと同定される。
【0015】
本発明の主題の様々な目的、特徴、態様および利点は、同じ番号が同じ構成要素を表す添付図面とともに、好ましい実施形態の以下の詳述からより明らかになろう。
【図面の簡単な説明】
【0016】
図1図1は、本発明の主題に係る、推定構造の異形(変異)の初期の同定を表す例示的なグラフである。
図2図2は、図1の推定構造異形における切断点の精緻化した解析を表す例示的なグラフである。
図3図3は、本発明の主題に係る例示的な切断点グラフである。
図4図4は、体細胞の切断点に関するリード支援の例示的なヒストグラムである。
図5図5は、高いコピー数および高度にサポート(支援)された切断点を表す例示的なゲノムブラウザディスプレイである。
図6図6は、図5に示したデータ、および、切断点グラフに関する環状ソリューションの詳細な図である。
図7図7は、染色体7および12上の高いコピー数および高度にサポートされた切断点を表す例示的なゲノムブラウザディスプレイを示す。
図8図8は、図7に示した選択データおよび切断点グラフの環状ソリューションの詳細な図である。
図9図9は、本発明の主題に係るゲノム解析のための設定およびシステムを例示的に示す概略図である。
図10A-1】図10A−1は、第一の腫瘍試料における再構成パターンおよび対応する環状ソリューションの例示的な図である。
図10A-2】図10A−2は、第一の腫瘍試料における再構成パターンおよび対応する環状ソリューションの例示的な図である。
図10B-1】図10B−1は、第一の腫瘍試料における再構成パターンおよび対応する環状ソリューションの例示的な図である。
図10B-2】図10B−2は、第一の腫瘍試料における再構成パターンおよび対応する環状ソリューションの例示的な図である。
図11A-1】図11A−1は、第二の腫瘍試料における再構成パターンおよび対応する環状ソリューションの例示的な図である。
図11A-2】図11A−2は、第二の腫瘍試料における再構成パターンおよび対応する環状ソリューションの例示的な図である。
図11B-1】図11B−1は、第二の腫瘍試料における再構成パターンおよび対応する環状ソリューションの例示的な図である。
図11B-2】図11B−2は、第二の腫瘍試料における再構成パターンおよび対応する環状ソリューションの例示的な図である。
図12A-1】図12A−1は、さらに別の腫瘍試料における再構成パターンおよび対応する環状ソリューションの例示的な図である。
図12A-2】図12A−2は、さらに別の腫瘍試料における再構成パターンおよび対応する環状ソリューションの例示的な図である。
図12B図12Bは、さらに別の腫瘍試料における再構成パターンおよび対応する環状ソリューションの例示的な図である。
【発明を実施するための形態】
【0017】
本発明者らは、信頼度の高い切断点および関連する高いコピー数を同定することによって、ならびに、再構成プロットにおける環状ソリューションに到達するためのデータの解析によって、全ゲノム配列データから1以上のDMを同定するためにゲノム解析を実施できることを発見した。
【0018】
その目的のために、発明者らは、全ゲノム配列データの高信頼度の切断点、断片の方向、および解析を同定できるアルゴリズムを開発し使用した。これは、多くの場合、高度に増幅された腫瘍遺伝子を含む、損傷していないDMを最終的に完全に再構築することができる。例えば、発明者らは、損傷していないDMの完全な再構築のために、The Cancer Genome Atlas(癌ゲノムアトラス)(Nature2008年10月、455(7216)、1061〜1068)により2つの多形性膠芽腫(GBM)の試料配列を使用した。加えて、発明者らはまた、GBM腫瘍細胞は腫瘍遺伝子DMを血流に流すことを示す、同じ患者の血液試料内のDMの証拠も発見した。特に好ましいアルゴリズムは、BAMBAMを含み、これは米国特許第2012/0066001号および米国特許第2012/0059670号に記載されており、どちらも本明細書に参照によって組み込まれる。本明細書に提示された方法および計算システムは、全ゲノムのペアエンド配列を介して、遺伝子の再構成の迅速で包括的な同定を可能にする。より具体的には、発明者らは、全ゲノム配列データを解析するために以下に記載されたシステムおよび方法を利用して、完全に再構築されたDMを示す結果に達した。
【0019】
以下の検討を通して、サーバ、サービス、インターフェイス、ポータル、プラットフォーム、またはコンピューティングデバイスから形成された他のシステムに関して、多くの参照がなされる。こうした用語の使用は、コンピュータ可読の有形の持続性媒体上に記憶されたソフトウェア命令を実行するように構成された、少なくとも1つのプロセッサを有する、1つまたは複数のコンピューティングデバイスを表すと考えられることを理解されたい。例えば、サーバは、ウェブサーバ、データベースサーバ、または記載した役割、義務、または機能を果たす方法で他のタイプのコンピュータサーバとして作動する、1つまたは複数のコンピュータを含むことができる。
【0020】
本発明の主題の例示的一態様では、コピー数が決定され、構造変異は以下のように推測される。
【0021】
腫瘍および対応する正常(tumor and matched normal)の間の計算相対コピー数:腫瘍相対コピー数対正常相対コピー数を、動的ウィンドウアプローチを用いて計算する。該動的ウィンドウアプローチは、該腫瘍または正常配列データセットのいずれかにおけるリードの包括度(covarage)に応じてウィンドウのゲノム幅を拡張および収縮する。この工程は、ゼロ幅のウィンドウによって初期化される。該腫瘍および対応する正常配列データの両方から得られる、ある品質の閾値(例えば、リードマッピング品質)を超える各リードは、それぞれ、腫瘍カウントであるNtumorおよび正常カウントであるNnormalに計算される。第一のリードの開始位置および終了位置が初期ウィンドウ幅を定義し、ならびに、さらに多くのリードが収集されるにつれて、該ウィンドウ幅は、処理された全てのリードの最小の開始位置および最大の終了位置を含むように拡張する。
【0022】
相対コピー数計算は、次の条件に適合するときに実施される:腫瘍または対応する正常データセットのいずれかから得たリードカウントが、ユーザが定義した上限の閾値および100リードに固定された下限の閾値の両方を超える。この状況が生じた場合、該ウィンドウのサイズおよび位置、生のリードカウントであるNtumor、Nnormal、および相対コピー数計算値Ntumor/Nnormalが記録される。その後、全ての値は、次の収集および計算のためにリセットされる。局所リードの包括度に従うNnormalウィンドウのサイズに適合させることにより、この方法は、信号−ノイズ比を向上させるために狭い包括度の領域内に大きなウィンドウを作成する。一方で、高度に増幅された領域は、より小さなウィンドウを作成するだろう。これにより、アンプリコン境界の解像度が高められる。
【0023】
ペアエンドクラスタリンを用いた構造異形領域の推定:推定の染色体内および染色体間の再構成を同定するために、bambamは、座標で分類されたBAMファイルの一対のペア内に保存された不一致の対リードを検索する。該BAMファイルのペアの一方は、上記腫瘍試料からのものであり、他方は、上記対応する正常試料からのものである。ここで、該不一致対の各リードは、参照配列の異なる領域に位置する。染色体内の不一致対は、異常に大きい挿入サイズを有するものである(すなわち、該対リードを分離する上記参照配列上の該ゲノム距離は、ユーザが定義した閾値を超える。)。あるいは、染色体内の不一致対は、誤った方向に位置するものである(すなわち、逆位である)。染色体間の不一致対は、異なる染色体に位置する対リードによって定義される。この工程の概要を、図1に示す。図1は、構造異形呼び出しの概要を概略的に表す。推定構造異形の初期の同定は、不調和に位置する対リードを用いるbambamによって同定される。ここで、両方のリードは、該参照ゲノムに完全に位置するが、異常な、標準的でない方法で位置する。bambamによって見つけ出された該推定切断点は、その後、ブリッジ(bridge)と呼ばれるプログラムによって、該切断点の近辺内の任意の分離リードを用いて、精緻化される。
【0024】
腫瘍データセットおよび正常なデータセットの両方からのすべての不一致のペアエンドリードは、それらのゲノム位置に従って集められて、切断点であると考えられるおおよそのゲノム領域を画定する。凝集プロセスは、推定の切断点の両側に他のリードが重複し、同一方向を有するリードと一緒に分類するが、腫瘍データセットおよび正常なデータセットからきたリードの数の軌道を保つことを含む。クラスタ内の重複する不一致の対の数が、ユーザが確定した閾値を超えるとき、再構成を説明する切断点は、出力内に画定され記録される。
【0025】
切断点は、該切断点が上記腫瘍データセットからのリードに顕著にサポートされるとき「体細胞」に分類される。対応する正常データセットからの、「体細胞」切断点のためのリードサポートの最少量が、あるレベルの腫瘍DNAが上記対応する正常試料内に存在するケースに対応することができる。このケースにおいては、固体腫瘍のDNA内に存在する高度に増幅された領域が、血中に、低いが検出可能なレベルで放出される。あるいは、血液癌の場合、上記対応する正常試料(典型的には、皮膚)内への高レベルの腫瘍遺伝子移入が予想されるであろう。該対応する正常データセットにおいて許容される体細胞切断点のサポート量は、該対応する正常試料内に想定される腫瘍「汚染」の量によって調節することができる。「生殖細胞系」切断点は、腫瘍および対応する正常データセットの両方に顕著なサポートを有するもの、または、該対応する正常データセット内にのみサポートを有するものである。これらはこの解析において、上記の再構成が当面の問題には関係しないため、考慮されない。さらに、これらの切断点の多くが、擬似のものであると考えられるが、それは、シークエンシング機器、試料の調製(例えば、全ゲノム増幅など)、または採用した短リードマッピングアルゴリズムにおける系統的バイアスによって誘発された人工物のためである。
【0026】
分離リードを用いた構造異形の精緻化:bambamによって初期に発見された切断点は、近似である。この近似において、完全に位置するリード(fully−mapped reads)が用いられる。該リードは、その性質から、該切断点の実際の接合点と実質的には重複しないが、これは、それが上記参照(または、体細胞の再構成の場合は、上記対応する正常データセット)中に存在しない配列を示しているからである。該切断点の位置を精緻化するために、ブリッジと呼ばれるプログラムが開発された。
【0027】
bridgetは、完全にマッピングされたメイトにより、推定の切断点付近に固定されるすべてのアラインされていないリードに対してBAMBAMおよび検索によって見出された近似の切断点を与えられる。これらのマッピングされていないリードのそれぞれは、再構成の切断点の接合部に重複する「分離リード」である可能性を有する。切断点の両側を包囲する局所化されたゲノム配列は、独自のタイル(現在はタイルのサイズは16bpである)のセットに分割され、参照ゲノムにおけるタイル配列のタイルデータベースおよびそれらの位置が構築される。類似のタイルデータベースは、リードを同じサイズのタイルに分割し、リード内のそれらの位置を指摘することにより、アラインされていないリードのそれぞれに対して構築される。参照タイルデータベースとアラインされていないタイルデータベースを比較して、参照においてそれぞれのアラインされていないタイルのゲノム位置が決定される。これらの位置の「デュアルスパニングセット」は、切断点の各側に1つずつの、参照リードおよびアラインされていないリードの両方において隣接するタイルの最大セットを決定することによって計算される。
【0028】
参照座標内のデュアルスパニングセットの最小および最大ゲノム位置は、切断点の位置ならびに接合部の両側の方向(または鎖の数)を正確に決定する。情報が切断点の左右の境界を説明して、再構成された配列は完全に画定される、すなわち、左側は(例えば、染色体=chr1、位置=1000bp、鎖=フォワード)によって画定され、右側は(例えば、染色体=chr5、位置=500,000bp、鎖=リバース)によって画定される。切断点の配列相同性(すなわち、切断点の両方の境界で同一であることが観察されたが、2つの配列の接合部でアラインされたリード内に1度だけ観察された「CA」などの短い配列)も、これらのデュアルスパニングセットから決定される。
【0029】
アラインされていないリードのそれぞれに対して、デュアルスパニングセットは、切断点の潜在的位置を決定する。アラインされていないリードはそれぞれ、切断点に対して(切断点、反復配列などの付近の配列エラーに起因して)わずかに異なる位置を決定し得るので、デュアルスパニングセットから決定されるすべての切断点位置を使用して可能な接合配列を生成する。すべてのマッピングされていないリードは、これらの可能な接合配列のそれぞれに新たにアラインされ、それらのアライメントにおける全体の改善は、リードが元の配列にどの程度良好にアラインされたかを測定される。アライメントスコアにおいて最大の向上を得た接合配列は、真の再構成に対して最良の候補として評価される。この最良の接合配列が、アライメントスコアにおいてごくわずかな改善を得る場合は、この接合配列は、これは真の再構成を表す見込みがないとして廃棄される。この場合、分離リード確認がないことは、BAMBAMによって見出された元の構造再構成がスプリアスである証拠であると決定されてもよい。図2は、構造再構成が起きるゲノム内の位置を正確に同定する例示的方法を概略的に示す。タイル(またはkmer)は、潜在的分離リードおよび参照ゲノムの両方に対して決定される。デュアルスパニングセット(この図の一番下にある太い赤と紫のボックスに相当する)を決定し、これにより、再構成された配列を構築する方法が完全に定義される。デュアルスパニングセットは、分離リード内の配列エラーまたはSNPに対して頑健である。
【0030】
一旦構造変異が上述のように分離リードを使用して精緻化されると、1つまたは複数の切断点は、高度に増幅された領域に密接に関連して決定される。より具体的には、所与の切断点の支援は、切断点が接合する領域のコピー数に正比例する。したがって、高レベルのリード支援を有する切断点を要求することにより、腫瘍内の高度に増幅された領域の一部である切断点に焦点を合わせる代わりに、コピーニュートラル再構成の一部であるか、または低いコピー増幅および削除を引き起こす切断点をフィルターにかけることができる。特にリード支援閾値は、腫瘍ゲノムのコピーニュートラル領域が予期されるリード支援を有する切断点を取り除くように、選択される。
【0031】
次いで単位複製配列を、切断点グラフをたどることによって再構築できる。例えば、また最近出版された方法(Genome Res.2011年10月12日)と同様に、発明者らは、腫瘍ゲノムの増幅されたセグメントを表す縁部のセット、および互いに縁部を接合する方向頂点のセットを説明することにより、切断点グラフを構築した。ここでは、縁部は、相対コピー数に見られる腫瘍ゲノムの増幅されたセグメントと定義されるが、頂点は、上述の手法で見出される高度に支援された切断点である。増幅されたセグメントが切断点によって遮断される場合、そのセグメントは、遮断する切断点の位置で2つの縁部に分離される。
【0032】
セグメントがゲノム位置に従って構成され、発明者らは、最初に増幅されたセグメントの最左位置で開始することにより、再構成された腫瘍配列を表し、右に向けられた頂点に遭遇するまで右に進む、縁部の構成を決定した。経路は、頂点をそれが接合されているセグメントに続け、出る頂点によって指定された方向(左または右)に移動することにより継続する。切断点グラフのソリューションは、すべての縁部および頂点を通る経路が少なくとも1回横断したときに作成される。簡単な例の切断点グラフおよびそのソリューションは図3に示され、再構成された配列を再構築するために切断点グラフをたどることを実証する。セグメント「a」で開始し、出る切断点1に続いて右に進み、セグメント「b」の左側に入る。引き続き右に進み、出る切断点2に続いて、セグメント「c」の右側に入る。この切断点は左を指し、セグメント「c」が再構成された配列内で逆方向に見出されることを示す。最後の切断点3は、セグメント「a」の左側に戻り、コピー数におけるすべての追加コピーを構成する。したがって、見出された最後のソリューションは「ab〜c」である。
【0033】
このような緩い制約を考えれば、切断点グラフの満足のいく多くのソリューションが可能であり得ることが明らかである。しかし、グラフを通る光路(複数可)が、観察された相対コピー数に最も密接に一致する経路である。ソリューションが所与のセグメントを横断する回数は、そのセグメントのコピー数の見積を生成する。各ソリューションに対して観察された相対コピー数に対するセグメントの横断カウントの標準偏差(RMSD)が計算され、次いで最小のRMSDの値をもつソリューション(複数可)が最適であるとしてラベル付けされる。
【0034】
実施例
本発明者らは、上記の方法を2つの多形性膠芽腫(GBM)試料に適用した。該2つのGBM試料は、TCGA−06−0648およびTCGA−06−0152に指定されており、両者は、癌ゲノムアトラス(TCGA)プロジェクトにより配列が決定された。これらの試料から得た腫瘍および対応する正常(血液)配列データセットを、上記の方法に記載したように処理することによって、腫瘍対正常の相対コピー数の概算値を算出し、切断点を同定し、および、分離リード解析を実施した。該両試料の腫瘍および正常ゲノムは、約30xの平均包括度に配列した。
【0035】
合計3,696の切断点を、bambamによって同定し、そのうちの132の切断点について、ブリッジによって、上記推定切断点を直接スパニングする分離リードを有することが発見された。図4は、試料TCGA−06−0648内で観察される全ての体細胞切断点をサポートするリードのヒストグラムを示す。最小リードサポート閾値を100に設定することによって、16を除く全てのブリッジによってサポートされる該体細胞の切断点が、除去された。興味深いことに、図5に示すように、これら高度にサポートされた16の全ての切断点は、染色体12のクラスター化された領域内の高度に増幅されたセグメントの境界近くに存在する。図5において、該ゲノムブラウザは、TCGA−06−0648に関する、相対コピー数(灰色で示した「全体のコピー数」)および高度にサポートされた切断点(切断点サポートが>100リードである、「染色体間再構成」および「染色体内再構成」)を示す。合計で16の増幅されたセグメントが、GBMの腫瘍形成に関与する既知の発癌遺伝子MDM2を含有する一つのセグメントと共に発見される。事実、それぞれの増幅されたセグメントの境界は、単一の切断点と関連し得る。該単一の切断点は、それが増幅へと入るまたは増幅から出るように、正しく方向付けられている。これは、高度にサポートされた切断点および該増幅が関連していること、および、実際には腫瘍のゲノムにおいて増幅されたセグメントの再構成された構造を示しているかもしれないこと、を示唆する。
【0036】
図6は、図5と同じデータの図であり、サイズおよびいくつかのセグメントの位置を強調しているが、これは、図5のブラウザプロットでは、データ同士があまりにも近くに位置していて視覚化できないからである。図6は、MDM2を含有する増幅された二重微小染色体の存在を示唆する、TCGA−06−0648の切断点グラフの環状ソリューションを示す。切断点リードサポートは、腫瘍リードカウント/血液リードカウントとしてリストする。たとえば、1365/9は、切断点をサポートする1,365のリードが該腫瘍中で発見され、9のサポートリードが血中で発見されることを意味する。このソリューションは、セグメントの新しい構造における該セグメントの順序および方向をリストする。なお、マイナスの記号は、逆向きのセグメントを示すために用いた。該増幅されたセグメントの該コピー数は、平均的な腫瘍細胞内に存在する各セグメントのコピーが少なくとも40存在することを示唆する。この図は、切断点グラフを視覚的に描写したものであり、該切断点グラフを移動させることにより、単一の最適ソリューションが見つかる。このソリューションの興味深い点は、それが環状であり、該ソリューションにおいては、最後のセグメントの最終の横断が、開始位置に戻る。すなわち、最初の頂点が最後の頂点でもあるということである。該環状ソリューションは、全てのセグメントを正確に一度通り、さらに、該コピー数は、該腫瘍ゲノム内に、各セグメントのコピーが約40コピー存在することを示唆する。これらの特別なコピー(extra copies)を説明するために、その他の39パスに関するセグメントをループスルー(loop through)しなければならない。これらの追加のコピーは、多くの異なる構成内に存在し得るだろう。これは、以下の2つの対極によって例示される:(1)40コピーが、これらのセグメントの完全なタンデム配列を形成するように、正しい順序および方向で複製された、または(2)単一の、自己複製二重微小染色体が形成され、その平均的な腫瘍細胞は集積した40コピーを有する。明らかに、後者の選択肢がより倹約的である。なぜならば、いかなる増幅されたセグメントも喪失しないようにまたは異なる濃度で存在しないように、後者は、再構成された配列内のおおよそ同じ位置(すなわち、初期アンプリコンの境界頂点)に発生するための40の連続したタンデム複製を必要としないからである。したがって、該データは、GBM腫瘍試料内に存在するMDM2を含む発癌性のDMを示唆する。
【0037】
さらに、図6には、腫瘍および血液の配列データセットの両者における、全ての高度にサポートされた切断点に関するリードサポートを示した。第一に、該切断点が、非常に高いサポートを腫瘍内に有しており、そのうちのいくつかの切断点は2,000以上の分離リードによってサポートされていることに留意されたい。これは、再構成がアンプリコンを定義し、また該アンプリコンがとても高いコピー数で存在することが期待される。さらに興味深いことに、全ての切断点はまた、驚くほど高い量のサポートを患者の血液内で示す。連続した有糸分裂のステージの後に徐々に喪失するというDMの傾向を考慮に入れると、該DMが最初から生殖細胞系に存在し十数年も維持されていたわけではなさそうである。腫瘍形成中にのみ増幅されたのだろう。これは特に、発癌性DMが非腫瘍細胞に対して選択的優位性を提供するわけではなさそうであるということを考えると正しい。さらに倹約的なソリューションは、この発癌性DMが、体細胞に起源があるというよりも、ある時点での期間でまたは腫瘍形成の間に、構成されおよび増幅されたということである。このDMが提供する新生の腫瘍細胞に対する該選択的優位性によって、より少ないDMを有した細胞に対して、増殖優位性を有するより多くのDMのコピーを集積させる細胞がもたらされ、結果として、均一に高いコピー数を有し、このDMの一部と考えられる領域において観察される腫瘍細胞の集団をもたらした。MDM2がしばしば発癌性DMにおいて観察されるという事実は、この仮説にさらなるサポートを与える(Genomics. 1993 Feb;15(2):283−90)。
【0038】
他のGBM試料であるTCGA−06−0152における同様の結果を、本明細書に記載した方法によって処理した。図7に示したのは、染色体12上に高度に増幅された領域および染色体7の領域のブラウザショットである。該染色体12上の高度に増幅された領域は、発癌遺伝子CDK4およびMDM2を含み、該染色体7の領域は、EGFR発癌遺伝子を含む。ここでは、試料TCGA−06−0152上の(a)染色体12および(b)染色体7に関する、増幅されたセグメントおよび高度にサポートされた構造異形(リードサポートは、>100)のゲノムブラウザショットを示す。染色体12上の増殖された小さな領域と染色体7上の増幅された領域とを繋ぎ、これらの領域のEGFRAダイアグラムを含む、紫色で示した染色体間の切断点を、図8に示したことに留意されたい。ここでは、GBM試料TCGA−06−0152に関する該切断点グラフの環状ソリューションを示しており、これは、腫瘍内で増殖された2つの異なる発癌性DMの存在を示唆している。MDM2+CDK4二重微小のソリューションは、いくつかのセグメントを複数回、横断するが、全ての特別な横断は、観察された相対コピー数によって説明される。20の切断点のうち11の切断点が、患者の血液試料内における不一致リードの証拠を示す。合計で、該2つの染色体上の29のセグメントが増幅され、そのうちのいくつかのセグメントは、他のものよりも高い相対コピー数を示した。20の高度にサポートされた切断が発見され、前記したように、試料TCGA−06−0648で、全ての切断が、相対コピー数における断続と一意的に関連し得る。該切断点グラフを解析することによって、2つの独立した環状ソリューションが見つかった。ソリューション(1)は、染色体12上の2つの染色体内の切断点を除く全ての切断点を使用し、および発癌遺伝子CDK4の1つのコピーと発癌遺伝子MDM2の2つのコピーを含む。ソリューション(2)は、染色体7および12上で増幅された領域をスパニングする2つの染色体間の切断点、および染色体12上の染色体内の切断点を組込み、ならびに、発癌遺伝子EGFRを含む。これら2つのソリューションは、この試料において2つのDMが形成されおよび増殖されたことを示唆する。該試料の両方が、異なる発癌遺伝子を含み、および、増殖する腫瘍細胞に対する顕著な選択的優位性を備えているだろう。
【0039】
ソリューション(1)は、試料TCGA−06−0648内に観察されたより、増幅されたセグメントを通るはるかに多くの複雑な経路についても説明する。ソリューションにおいて高度に支援された切断点のすべてを包含するために、一部のセグメントを複数回横断しなければならなかった。29個のセグメントのうちの11個を2回横断し、1つの小さいセグメントを3回横断した。これらの横断によって予想されるはずであるコピー数の増加は、相対コピー数において観察され、平均腫瘍細胞は、このDMの約35個のコピーを含む。2回横断されるセグメントは、およそ70個のコピー数を有する。3回横断されたセグメントは、2回横断されたセグメントに比較してコピー数が増加したように見えるが(約85対約75)、小さいサイズのこのセグメントは、正確な相対コピー数を計算することが困難である。
【0040】
前述のように、患者TCGA−06−0152の血液試料中に腫瘍切断点の証拠は存在するが、TCGA−06−0648の血液試料内に観察されるより低い程度である。20個の切断点のうちの11個は、低レベルのリード支援を有するが、9個の切断点は、血液中にリード支援がない。このことが起こる場合の理由は多数ある。例えば、血液データはより低い包括度で配列されることがあり、あらゆる所与の体細胞の切断点を横切る配列の機会がより低くなる。あるいは、理由は生物学の性質にあることがあり、それによって一部の機構は、TCGA−06−0152の腫瘍を誘導して、DMを血流の中にTCGA−06−0648より低い率で流し、血液中に観察されるDMの濃度が低減した。
【0041】
次いで、DM特有の切断点の血液中に腫瘍の不一致のリードが存在することは、これらのGBMが媒介するDMが、血液脳関門を横切り、患者の血流に入ることを示唆する。最も興味深いことは、血液中のGBMが媒介するDMの数は、DM特有の切断点が患者の血液のみから由来する平均包括度で配列するデータを使用して検出可能であるということである。並べる証拠は腫瘍遺伝子DMの存在を強く示唆するが、増幅された腫瘍遺伝子のFISH(蛍光インサイチュー・ハイブリダイゼーション)解析は、この仮説を確認するために腫瘍試料および整合された正常試料の両方で実行されなければならないはずである。
【0042】
別の視点から見ると、ゲノムの不安定性および構造再構成は癌ゲノムの独特な特質であることを理解されたい。次世代配列技術で、腫瘍発生および進行を通して起きる構造再構成を測定する発明者らの能力は、著しく向上したが、これらの事象のより良好な理解に役立つために再構成の発見、解析、および可視化方法の急務が発生した。
【0043】
これらの課題に対処するために、発明者らの配列解析の供給経路は、個々の腫瘍の変異、小さいインデル、コピー数の変化、対立遺伝子特有の増幅および欠失、ゲノム再構成の発見を簡素化する。例えば、1つの代表的な解析では、再構成は、利用可能な場合は、切断点の近くに見出されるマッピングされていない推定分離リードを使用して、切断点の精度のために精緻化される。次いで結果が、好ましくは、高レベルの処理結果ならびに結果が由来する生データの両方の解析および可視化を提供する、相互作用するウェブベースのゲノムブラウザで表示され、これは図9に概略的に示されている。
【0044】
配列決定解析パイプラインを、癌ゲノムアトラス(TCGA)プロジェクトの17の全ゲノム多形性膠芽腫(GBM)腫瘍試料において、信頼度の高い、小規模および大規模の体細胞イベントを発見するために使用した。該パイプラインの使用において、該腫瘍試料に対応する正常配列を、体細胞の再構成を同定するために用いた。これらの試料において同定された多くの興味深い構造的異常のなかで、本発明者らは、極度に増幅された領域内に複雑な再構成パターンを有する2つの腫瘍を発見した。該極度に増幅された領域内の複雑な再構成パターンは、図10A/Bおよび図11A/Bに見られるように、ベースレベルの正確さで、環状の二重微小染色体を構成するように組み立てることができた。二重微小に特有な切断点の証拠が、血液の配列データにおいて見つかり、これによって、体細胞再構成の存在を定量するために、個体別のPCRに基づくアッセイが開発できるであろうことが支持された。該体細胞の再構成の定量結果は、脳腫瘍の進行を監視する際の代替物として使用することができる。
【0045】
また4つのGBM腫瘍は、それによりEGFRのエクソン2−6が削除される、EGFRvIII突然変異遺伝子の存在を示すEGFRの増幅および再構成を示すことが分かった。EGFRvIIIに関連した切断点のリード支援を近隣の正常にマッピングされたリードの量と比較することは、腫瘍内のEGFRコピーの総数のごく一部として存在する、EGFRvIII突然変異が野生型EGFRの増幅後に出現することを示唆する。例示的結果は、図12A/Bに示されている。
【0046】
したがって、相対コピー数を切断点と統合する能力は、癌細胞のゲノム技術を理解する新しい方法を提供することを理解されたい。より詳細には、発明者らは、腫瘍の高度に増幅された領域の場合に、観察されたコピー数および高度に支援された切断点のどちらも、単純な切断点グラフを解くことにより完全に説明することができ、これは腫瘍ゲノム内の高度に増幅されたセグメントの順番および方向を説明することを実証した。
【0047】
本明細書で議論した上記GBM試料において、増幅されたセグメントの該切断点グラフに対する上記最適ソリューションは、環状である。これらの環状ソリューションは、観察された増殖された領域が、二重微小と呼ばれる環状染色体を形成していたかもしれないこと示唆する。各二重微小上の発癌遺伝子の存在およびそれらの高度に増幅された状態は、該二重微小が強い発癌能を有し、選択的優位性を該腫瘍細胞に与えること、およびそれらの形状が、両GBM腫瘍の腫瘍形成において重要なイベントであったであろうことを示唆する。
【0048】
両方の腫瘍の進行に非常に大きな影響力を有した傾向がある、1対のこれらの腫瘍ゲノムの再構築と同様に重要なことは、DMに特有の切断点のほぼすべてが、当該患者の血液中に検出可能なリード支援も有するという事実である。この発見は、GBMが媒介するDMが、一部の機構により血流に入ることを示唆し、これは、GBM腫瘍を特徴付ける腫瘍遺伝子DMを、予め腫瘍配列を必要とせず、血液試料を使用して検出し監視し得ることを示唆するので、特に重要である。
【0049】
これらの腫瘍遺伝子DMに対する1つの可能な移送機構は、微小胞を介することであり、微小胞は、様々な細胞成分を含むことができる、ほとんどの細胞型から放出された細胞膜の細胞外断片である。研究は、腫瘍細胞が、診断および監視のために使用される可能性を有する、核酸およびタンパク質を含む、複数の細胞内粒子を含有する大量の微小胞を放出することを示した。初めにmRNA、miRNAおよび血管新生タンパク質が、GBM腫瘍をもつ患者から取った血清内に同定された(Nat.Cell Biol.2008年12月、10(12)、1470〜1476)。最近になって、Balajら(Nat Commun2011年、2、180)は、増幅された腫瘍遺伝子配列、特にc−Mycをもつ一本鎖DNA(ssDNA)を含有する微小胞を取り出した。
【0050】
血流内のDMを検出する能力は、他の癌に拡張するべきである。該他の癌は、一般的に、例えば、非小細胞肺癌内のEGFRおよび急性骨髄性白血病内のc−Mycなどの既知の発癌遺伝子を含有する、高度に増幅されたDMを特徴とする。実際、この方法に用いられるDMを検出する能力は、血流が利用しやすい腫瘍タイプに関して向上し得る。さらに、特にDMに基づいたメカニズムによって一般的に増幅される遺伝子を標的とする薬剤を、血流のみから集めた証拠に基づいて処方してよく、痛みを回避すること、およびGBM腫瘍の場合は危険な腫瘍生体検査を回避することができる。
【0051】
EGFR、c−Myc、MDM2などの公知の腫瘍遺伝子を包囲する領域が、増幅された二重微小を示すクラスタ型の切断点を示すかどうかを確実に判定するために、血液試料の全ゲノム配列データを包含する配列ベースの分析を想定することができる。こうした領域を横切る不一致のリードを組み合わせることにより、血流内のDMの濃度が低いときでも、これらの領域を同定する能力を向上させるべきである。微小胞がDMを実際に移動させる場合は、微小胞を高める技法は、血液試料から低レベルの腫瘍遺伝子DMを検出する能力をさらに向上させる。
【0052】
したがって、上記に基づいて、本明細書に提示された分子診断ツールを、腫瘍性疾患の診断および/または確認に疾患の予備知識を持たずに利用できることを理解されたい。最も好ましくは、生体試料は血液または血液の血清/血漿分画であるが、生検材料または吸引液を含んでもよい。一層さらに、このような診断方法は、すべてのタイプの腫瘍性疾患、特に癌(例えば、様々な癌、リンパ腫、および肉腫)に適切であり得ることが企図される。
【0053】
それ故に、発明者らは特に、1つまたは複数の再構成の型の遺伝子情報の使用および/または同定を企図し、最も好ましくは、遺伝子情報を全血(またはそれを処理した断片)から直接獲得することを企図する。最も典型的には、再構成の型は、特に環状分子がゲノム材料(通常、3Mb以下のサイズを有する)から形成される、ゲノム再構成を含む。特に企図された使用および方法では、環状に再構成されたゲノム材料は、腫瘍遺伝子および/または腫瘍抑制遺伝子の少なくとも一部を含む。しかし、最も典型的には、環状に再構成されたゲノム材料は、腫瘍遺伝子および/もしくは腫瘍抑制遺伝子の完全な機能または少なくとも完全に発現可能な形を含む。したがって、哺乳類の試料は、様々な治療法、診断法、または予後方法において解析できる(好ましくは、二重微小を検出する簡単な血液検査を使用し、特に腫瘍遺伝子および/または腫瘍抑制遺伝子を含む二重微小。それ故に、また担癌の固体が血流内に二重微小を有する(特に腫瘍遺伝子および/または腫瘍抑制遺伝子を含む二重微小)という観察を前提として、新しいまたは今まで未確認の腫瘍遺伝子および/または腫瘍抑制遺伝子は、担癌の固体から(または細胞培養もしくは動物モデルからさえ)取り出された二重微小の解析から発見されることがあることを認識されたい。
【0054】
さらなる観察に基づいて、ゲノム情報に対する二重微小の数値的比率を、疾患、特に腫瘍性疾患の徴候に対する閾値として利用してもよいことも、発明者らは企図する。したがって、二重微小の解析は、癌の危険性または転移を予測するために、先行指標として使用されてもよい。当然のことながら、二重微小は、このような解析に必ずしも腫瘍遺伝子および/または腫瘍抑制遺伝子を含む必要がないことに留意されたい。
【0055】
さらに、二重微小内の腫瘍遺伝子のタイプは、特定のタイプの疾患、特に腫瘍性疾患に関連付けられてもよいことが企図される。したがって、全血からのゲノム再構成の解析、ならびに二重微小内の腫瘍遺伝子および/または腫瘍抑制遺伝子の同定/数量化は、特定の腫瘍のタイプ、進行、および/または危険性に有益な情報を提供し得る。したがって、多数の全血ベースの試験(例えば、非分離、濾過など)は、疾患の診断または予測における腫瘍遺伝子の検出に特に有益であると考えられる。例えば、特定の切断点および特定の腫瘍タイプに特有の再構成を確立すると、特にこのような再構成(およびDM)の存在および/または量を同定する役に立つプライマーを設計できる。同様に、治療効果または薬物効果は、二重微小の解析、特に腫瘍遺伝子および/または腫瘍抑制遺伝子を含む二重微小の解析を使用する方法で決定されてもよい。試験のこのような方法は、ある種の化学療法および/または放射線治療において特に有益であることがあり、これは二本鎖切断(またはその修復阻害)に基づく。
【0056】
二重微小は、全血から大量に取り出すことができるという観察に基づいて、発明者らは、二重微小をタンパク質、リポタンパク質、脂質、および/または小胞構造、特に微小胞に関連付けてもよいことも企図する。したがって、二重微小が微小胞内でカプセル化される場合、微小胞からの表面エピトープは、それから微小胞が生じる細胞を代表することを理解されたい。それ故に、腫瘍起源(例えば、組織型)を、微小胞膜成分の解析に基づいて同定することができる。
【0057】
すでに記載されたものに加えて、より多くの修正形態が、本明細書の発明概念から逸脱することなく可能であることが、当業者には明らかであるべきである。したがって、本発明の主題は、添付の特許請求の範囲の精神以外に限定されない。さらに、本明細書および特許請求の範囲の両方を解釈する際に、すべての用語は、文脈と一致する可能な最も広い範囲の方法で解釈されるべきである。特に、用語「comprises」および「comprising」は、非排他的手法で要素、構成要素、もしくはステップを指すように解釈されるべきであり、言及された要素、構成要素、もしくはステップは、存在してもよく、または利用されてもよく、または明確に言及されていない他の要素、構成要素、もしくはステップと組み合わせられてもよいことを示す。本明細書の主張が、A、B、C…およびNからなる群から選択されたものの少なくとも1つを指す場合、その文はAプラスNではない、またはBプラスNではないなどの群から唯一の要素を必要とすると解釈されるべきである。
【0058】
本願には以下の発明を包含する。
(1) ゲノムデータを解析する方法であって、
腫瘍のゲノム配列と対応する正常ゲノム配列との間の相対コピー数を決定することと、
前記腫瘍のゲノム配列および前記対応する正常ゲノム配列における推定切断点を同定することと、
前記腫瘍のゲノム配列の切断点の位置および方向を同定するために、前記推定切断点を精緻化することと、
前記切断点を重要な切断点として確認するために、リード支援閾値を使用することと、
環状ソリューションを有するゲノム再構成を決定するために、前記相対コピー数、前記重要な切断点、および前記方向を使用することとを含む、方法。
(2) 前記相対コピー数を決定する前記ステップは、動的ウィンドウイングを使用して実行され、かつ/または推定切断点を同定する前記ステップは、不一致のペアリードを使用して実行される、(1)に記載の方法。
(3) 前記ゲノム構成は、環状ソリューションに到達するために、切断点グラフを生成し、前記切断点グラフを解くことによって決定される、(1)に記載の方法。
(4) 前記推定切断点を精緻化する前記ステップは、前記腫瘍ゲノム配列をフラグメント化すること、および前記フラグメント化により得られたフラグメントを参照データベースと比較することを使用して実行される、(1)に記載の方法。
(5) 前記リード支援閾値はユーザが決定する、(1)に記載の方法。
(6) 前記環状ソリューションは、二重微小染色体を前記ゲノム構成として示す、(1)に記載の方法。
(7) 前記腫瘍のゲノム配列は、固形腫瘍である腫瘍に由来し、前記腫瘍のゲノム配列は、体液中に存在する遺伝物質から取り出される、(1)に記載の方法。
(8) 前記体液は血液である、(7)に記載の方法。
(9) 前記固形腫瘍は、多形性膠芽腫または非小細胞肺癌である、(8)に記載の方法。
(10) ゲノムデータを解析する方法であって、
切断点に対するリード支援閾値に達すると、腫瘍のゲノム配列のコピー数を前記腫瘍のゲノム配列内の前記切断点に関連付けることと、
前記腫瘍のゲノム配列の方向を決定することと、
前記腫瘍のゲノム配列の前記コピー数、前記切断点の位置および方向を使用して、ゲノム構成を決定することとを含む、方法。
(11) 前記リード支援閾値は、ユーザが画定したリード支援閾値である、(10)に記載の方法。
(12) ゲノム構成を決定する前記ステップは、前記腫瘍のゲノム配列の前記コピー数、ゲノム内の前記切断点の前記位置、および前記腫瘍のゲノム配列の前記方向を使用して、切断点グラフを生成することによって実行され、前記切断点グラフにおいて、前記コピー数は縁部として表され、前記切断点の位置は頂点として表される、(10)に記載の方法。
(13) 前記固体腫瘍を腫瘍ゲノムの少なくとも一部が体液内に存在する腫瘍と同定することと、
患者から前記体液を獲得すること、および前記腫瘍ゲノムの前記少なくとも一部を取り出すことと、
(1)または(10)の方法により、前記ゲノムデータを解析するために、前記腫瘍ゲノムの前記取り出された少なくとも一部を使用することとを含む、固体腫瘍のゲノムデータを解析する方法。
(14) 前記腫瘍ゲノムの前記少なくとも一部は、二重微小染色体として存在する、(13)に記載の方法。
(15) 前記腫瘍ゲノムの前記取り出された少なくとも一部内の腫瘍遺伝子または腫瘍抑制遺伝子を同定するステップをさらに含む、(13)に記載の方法。
(16) 前記腫瘍遺伝子または腫瘍抑制遺伝子を目標とする薬剤処方計画を使用して、前記患者を治療するステップをさらに含む、(15)に記載の方法。
(17) 固体腫瘍のゲノムデータを解析する方法であって、
患者から体液を獲得すること、および前記体液から腫瘍ゲノムの少なくとも一部を取り出すことと、
腫瘍遺伝子を包囲する領域が、増幅された二重微小を示すクラスタ型の切断点を示すかどうかを判定することとを含む、方法。
(18) 腫瘍遺伝子は、EGFR、c−Myc、もしくはMDM2の野生型または突然変異型である、(17)に記載の方法。
(19) 判定する前記ステップは、(1)または(10)による方法の使用を含む、(17)に記載の方法。
(20) 前記固体腫瘍は、多形性膠芽腫または非小細胞肺癌であり、前記体液は血液である、(17)に記載の方法。
(21) 患者から生体試料を獲得すること、および前記試料から核酸を取り出すことと、
ゲノム試料のコピー数および前記ゲノム試料内の切断点に対して前記核酸を解析することと、
前記切断点に対するリード支援閾値に達すると、前記ゲノム配列の前記コピー数を前記ゲノム配列内の前記切断点に関連付けることと、
前記ゲノム配列の方向を決定することと、
前記ゲノム配列の前記コピー数、前記切断点の位置、および前記方向を使用して、ゲノム構成を決定することと、
前記腫瘍性疾患に対する可能性を決定するために前記ゲノム構成を使用することとを含む、腫瘍性疾患をデノボ診断する方法。
(22) 前記ゲノム構成を二重微小と同定するステップをさらに含む、(21)に記載の方法。
(23) 前記ゲノム構成内の腫瘍遺伝子または腫瘍抑制遺伝子を同定するステップをさらに含む、(22)に記載の方法。
(24) 前記腫瘍性疾患は、胃癌、大腸癌、前立腺癌、肺癌、白血病、または乳癌である、(21)に記載の方法。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10A-1】
図10A-2】
図10B-1】
図10B-2】
図11A-1】
図11A-2】
図11B-1】
図11B-2】
図12A-1】
図12A-2】
図12B