(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024041951
(43)【公開日】2024-03-27
(54)【発明の名称】腫瘍試料の多重遺伝子分析の最適化
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20240319BHJP
C12Q 1/6806 20180101ALI20240319BHJP
C12Q 1/6827 20180101ALI20240319BHJP
【FI】
C12Q1/6869 Z ZNA
C12Q1/6806 Z
C12Q1/6827 Z
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024005235
(22)【出願日】2024-01-17
(62)【分割の表示】P 2022019434の分割
【原出願日】2011-12-29
(31)【優先権主張番号】61/467,748
(32)【優先日】2011-03-25
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】61/467,798
(32)【優先日】2011-03-25
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】61/486,012
(32)【優先日】2011-05-13
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】61/486,006
(32)【優先日】2011-05-13
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】61/486,026
(32)【優先日】2011-05-13
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】61/552,884
(32)【優先日】2011-10-28
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】61/428,626
(32)【優先日】2010-12-30
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】61/428,638
(32)【優先日】2010-12-30
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】61/428,568
(32)【優先日】2010-12-30
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】61/486,033
(32)【優先日】2011-05-13
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】61/428,602
(32)【優先日】2010-12-30
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】512161826
【氏名又は名称】ファウンデーション メディシン インコーポレイテッド
【氏名又は名称原語表記】Foundation Medicine, Inc.
【住所又は居所原語表記】One Kendall Square, Suite B6501, Cambridge, Massachusetts 02139 U.S.A.
(74)【代理人】
【識別番号】100114188
【弁理士】
【氏名又は名称】小野 誠
(74)【代理人】
【識別番号】100119253
【弁理士】
【氏名又は名称】金山 賢教
(74)【代理人】
【識別番号】100124855
【弁理士】
【氏名又は名称】坪倉 道明
(74)【代理人】
【識別番号】100129713
【弁理士】
【氏名又は名称】重森 一輝
(74)【代理人】
【識別番号】100137213
【弁理士】
【氏名又は名称】安藤 健司
(74)【代理人】
【識別番号】100146318
【弁理士】
【氏名又は名称】岩瀬 吉和
(74)【代理人】
【識別番号】100127812
【弁理士】
【氏名又は名称】城山 康文
(72)【発明者】
【氏名】ダウニング,シーン,アール
(72)【発明者】
【氏名】ヤロス,ミルナ
(72)【発明者】
【氏名】リプソン,ドロン
(72)【発明者】
【氏名】オツトー,ジエフリー,アラン
(72)【発明者】
【氏名】パーカー,アレクサンダー,エヌ
(72)【発明者】
【氏名】シヤピロ,ミカイル,ジー
(72)【発明者】
【氏名】ステイーブンス,フイリツプ,ジエイムズ
(72)【発明者】
【氏名】イエレンスキー,ロマン
(57)【要約】 (修正有)
【課題】腫瘍試料由来の核酸を分析するために最適化された方法を提供する。
【解決手段】腫瘍試料を分析する方法は、複数の腫瘍メンバーを含むライブラリを試料から取得すること、ライブラリをベイトセットと接触させて選択されたメンバーを単離すること、サブゲノム間隔についての読み取りを選択されたメンバーから取得すること、読み取りをアライメントすること、および事前選択されたヌクレオチド位置に対する読み取りからのヌクレオチド値を割り当てる(例えば、変異を呼び出す)ことを含む。
【選択図】
図1A
【特許請求の範囲】
【請求項1】
明細書に記載の方法。
【発明の詳細な説明】
【関連出願】
【0001】
本出願は、2010年12月30日出願の米国仮出願第61/428,568号、20
10年12月30日出願の米国仮出願第61/428,602号、2010年12月30
日出願の米国仮出願第61/428,626号、2010年12月30日出願の米国仮出
願第61/428,638号、2011年3月25日出願の米国仮出願第61/467,
798号、2011年3月25日出願の米国仮出願第61/467,748号、2011
年5月13日出願の米国仮出願第61/486,006号、2011年5月13日出願の
米国仮出願第61/486,012号、2011年5月13日出願の米国仮出願第61/
486,026号、2011年5月13日出願の米国仮出願第61/486,033号、
および2011年10月28日出願の米国仮出願第61/552,884号の利益を主張
する。これらすべての先行出願の内容は、参照によりそれらの全体が本明細書に組み込ま
れる。
【技術分野】
【0002】
本発明の背景
本発明は、腫瘍試料由来の核酸を分析するために最適化された方法、例えば、統合され
た最適化核酸選択、読み取りアライメント、および変異呼び出しを有する方法に関する。
【発明の概要】
【0003】
本明細書に開示の方法は、例えば、サブゲノム間隔の最適化された組、例えば、癌に関
連した本明細書に記載のゲノムの断片の組に適用されるような、ベイトベースの選択、ア
ライメント、および変異呼び出しを含む1つ以上の最適化要素の統合を提供する。本明細
書に記載の方法は、癌ごとに、遺伝子ごとに、かつ/または部位ごとに最適化され得る腫
瘍の次世代配列決定(NGS)に基づく分析を提供する。
【0004】
したがって、一態様において、本発明は、腫瘍試料を分析する方法を特色とする。方法
は、
(a)複数の標的メンバー、例えば、腫瘍メンバーを含むライブラリを、試料、例えば
、腫瘍試料から取得することと、
(b)任意で、ライブラリをベイトセット(または複数のベイトセット)と接触させて
選択されたメンバーを提供することと(本明細書で「ライブラリ捕獲物」と称される場合
もある)、
(c)サブゲノム間隔についての読み取りを、例えば、配列決定によって、例えば、次
世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からの腫瘍メンバーか
ら取得することと、
(d)該読み取りをアライメントすることと、
(e)事前選択されたヌクレオチド位置、例えば、複数のサブゲノム間隔のそれぞれ、
例えば、複数の遺伝子のそれぞれにおいて事前選択されたヌクレオチド位置に対する該読
み取りからのヌクレオチド値を割り当てる(例えば、ベイズ方法を用いて、例えば、変異
を呼び出す)ことと、を含み、
それによって、該試料を分析し、
該分析において、
(i)X個のヌクレオチド位置がそれぞれ、ステップ(b)、(c)、(d)、もしく
は(e)のうちの1つまたはそれらの組み合わせについて一意の組の条件下で分析される
(一意とは、他のX-1個の組の条件とは異なることを意味し、Xは、少なくとも2、5
、10、20、30、40、50、100、200、300、もしくは500である)。
例えば、第1の組の条件、例えば、本明細書に記載の組の条件が、例えば、第1のサブゲ
ノム間隔または遺伝子における第1のヌクレオチド位置のために使用され、第2の組の条
件、例えば、本明細書に記載の第2の組の条件が、例えば、第2のサブゲノム間隔または
遺伝子における第2のヌクレオチド位置のために使用される。
(ii)X個のヌクレオチド位置のそれぞれについて、ヌクレオチド位置で生じ得る事
前選択された変化、例えば、変異の特性、例えば、本明細書に記載の特性に応答して、ヌ
クレオチド位置は、一意の組の条件下で分析され(一意とは、他のX-1個の組の条件と
は異なることを意味し、Xは、少なくとも2、5、10、20、30、40、50、10
0、200、300、もしくは500である)。例えば、第1のサブゲノム間隔における
ヌクレオチド位置で生じ得る事前選択された変化、例えば、変異の特性、例えば、本明細
書に記載の特性に応答して、ヌクレオチド位置は、第1の組の条件下で分析され、第2の
サブゲノム間隔におけるヌクレオチド位置で生じ得る事前選択された変化、例えば、変異
の特性、例えば、本明細書に記載の特性に応答して、ヌクレオチド位置は、第2の組の条
件下で分析され、そこで(iii)該方法は、試料、例えば、保存された腫瘍試料上で、
少なくとも2、5、10、20、50、もしくは100個のサブゲノム間隔、例えば、遺
伝子におけるヌクレオチド位置に対して95、98、もしくは99%の感度または特異性
を可能にする条件下で行われる。あるいは
(iv)方法は、以下のうちの1つ以上もしくはすべてを含む:
a)第1のサブゲノム間隔を配列決定して約500倍以上の配列決定深度を提供する、
例えば、試料由来の5%を超えない細胞に存在する変異を配列決定すること、
b)第2のサブゲノム間隔を配列決定して約200倍以上、例えば、約200倍~約5
00倍の配列決定深度を提供する、例えば、試料由来の10%を超えない細胞に存在する
変異を配列決定すること、
c)第3のサブゲノム間隔を配列決定して約10~100倍の配列決定深度を提供する
、例えば、a)異なる薬物を代謝する患者の能力を説明し得る薬理ゲノム(PGx)単一
ヌクレオチド多型(SNP)、またはb)患者を一意に特定する(例えば、フィンガープ
リントする)ために使用され得るゲノムSNPから選択される1つ以上のサブゲノム間隔
(例えば、エクソン)を配列決定すること、
d)第4のサブゲノム間隔を配列決定して約5~50倍の配列決定深度を提供し、例え
ば、ゲノム転座またはインデル等の構造ブレークポイントを検出すること。例えば、イン
トロンブレークポイントの検出は、高い検出信頼性を確保するために、5~50倍の配列
対スパン深度を必要とする。そのようなベイトセットを用いて、例えば、転座/インデル
の傾向のある癌遺伝子を検出することができる、または
e)第5のサブゲノム間隔を配列決定して約0.1~300倍の配列決定深度を提供し
、例えば、コピー数の変化を検出すること。一実施形態において、コピー数の変化を検出
するための配列決定深度は、約0.1~10倍の配列決定深度の範囲である。他の実施形
態では、ゲノムDNAのコピー数獲得/喪失またはヘテロ接合性の消失(LOH)を評価
するために使用されるゲノムSNP/遺伝子座を検出するための配列決定深度は、約10
0~300倍の範囲である。
【0005】
例となる第1および第2の組の条件は、以下であるものを含む:
第1のベイトセットが、第1のサブゲノム間隔のために使用され、第2のベイトセット
が、第2のサブゲノム間隔のために使用される。
第1のアライメント方法が、第1のサブゲノム間隔についての読み取りに適用され、第
2のアライメント方法が、第2のサブゲノム間隔についての読み取りに適用される。
第1の変異呼び出し方法が、第1のサブゲノム間隔のヌクレオチド位置に適用され、第
2の変異呼び出し方法が、第2のサブゲノム間隔のヌクレオチド位置に適用される。
ある実施形態において、
第1のヌクレオチド位置が、第1の組のベイト条件、第1のアライメント方法、および
第1の変異呼び出し方法で分析され、
第2のヌクレオチド位置が、該第1の組のベイト条件、第2のアライメント方法、およ
び該第1の変異呼び出し方法で分析され、
第3のヌクレオチド位置が、該第1の組のベイト条件、該第1のアライメント方法、お
よび第2の変異呼び出し方法で分析され、
他の2つと比較して、それぞれ一意の条件下で分析された3個のヌクレオチド位置を提
供する。
ある実施形態において、条件は、以下であるものを含む:
第1のベイトセットが、第1のサブゲノム間隔のために使用され、第2のベイトセット
が、第2のサブゲノム間隔のために使用されること、
第1のアライメント方法が、第1のサブゲノム間隔についての読み取りに適用され、第
2のアライメント方法が、第2のサブゲノム間隔についての読み取りに適用されること、
または
第1の変異呼び出し方法が、第1のサブゲノム間隔のヌクレオチド位置に適用され、第
2の変異呼び出し方法が、第2のサブゲノム間隔のヌクレオチド位置に適用されることを
含む。
【0006】
例となる特性は、以下を含む:
(i)変化が位置する遺伝子もしくは遺伝子型、例えば、癌遺伝子もしくは腫瘍抑制遺
伝子、事前選択されたバリアントもしくはバリアントの種類、例えば、変異、または事前
選択された頻度の変異を特徴とする遺伝子もしくは遺伝子型、または本明細書に記載の他
の遺伝子もしくは遺伝子型、
(ii)変化の種類、例えば、置換、挿入、欠失、または転座、
(iii)試料の種類、例えば、変化について分析されるFFPE試料、
(iv)評価される変化の該ヌクレオチド位置における配列またはその付近の配列、例
えば、予想されるサブゲノム間隔の誤アライメント傾向に影響を及ぼし得る配列、例えば
、ヌクレオチド位置における反復配列またはその付近の反復配列の存在、
(v)例えば、事前選択された腫瘍型における変化、例えば、変異を示す読み取りを観
察する先行(例えば、文献)予想、
(vi)塩基呼び出しエラーのみによる変化を示す読み取りを観察する確率、あるいは
(vii)変化の検出に所望される事前選択された配列決定深度。
【0007】
ある実施形態において、特性は、配列決定されるヌクレオチドの同一性以外であり、す
なわち、特性は、配列がaであるか、tであるかではない。
【0008】
ある実施形態において、ステップ(b)が存在する。ある実施形態において、ステップ
(b)が欠如する。
【0009】
ある実施形態において、少なくともX個の遺伝子、例えば、表1および表1Aの少なく
ともX個の遺伝子、例えば、表1および表1Aにおいて優先順位が1のアノテーションを
有する遺伝子由来のサブゲノム間隔が異なる条件下で分析され、Xは、2、3、4、5、
10、15、20、または30に等しい。
【0010】
ある実施形態において、方法は、以下のうちの1つ以上を含む:
(i)方法、例えば、上述の方法の(b)は、本明細書に記載のベイトセット、例えば
、表題「ベイト」もしくは「ベイトモジュール」に記載されるベイトセットの使用を含む
こと、
(ii)方法、例えば、上述の方法の(c)は、一組もしくは一群のサブゲノム間隔に
ついての読み取りを本明細書に記載の遺伝子の組もしくは群から取得することを含むこと
、
(iii)方法、例えば、上述の方法の(d)は、本明細書に記載の複数のアライメン
ト方法、例えば、表題「アライメント」もしくは「アライメントモジュール」に記載され
る方法の使用を含むこと、
(iv)方法、例えば、上述の方法の(e)は、ヌクレオチド値を本明細書に記載の事
前選択されたヌクレオチド位置に割り当てるための複数の方法、例えば、表題「変異呼び
出し」もしくは「変異呼び出しモジュール」または表題「臨床癌検体の次世代配列決定由
来の体細胞ゲノム変化の高感度検出に対するベイズ手法」の項に記載される方法の使用を
含むこと、あるいは
(v)方法は、ヌクレオチド値を本明細書、例えば、表題「遺伝子選択または遺伝子選
択モジュール」の項に記載の一組のサブゲノム間隔に割り当てることを含むこと。
【0011】
ある実施形態において、方法は、(i)、および(ii)~(v)のうちの1つ、2つ
、3つ、またはすべてを含む。
【0012】
ある実施形態において、方法は、(ii)、ならびに(i)および(iii)~(v)
のうちの1つ、2つ、3つ、またはすべてを含む。
【0013】
ある実施形態において、方法は、(iii)、ならびに(i)、(ii)、(iv)、
および(v)のうちの1つ、2つ、3つ、またはすべてを含む。
【0014】
ある実施形態において、方法は、(iv)、ならびに(i)~(iii)および(v)
のうちの1つ、2つ、3つ、またはすべてを含む。
【0015】
ある実施形態において、方法は、(v)、および(i)~(iv)のうちの1つ、2つ
、3つ、またはすべてを含む。
アライメント
【0016】
本明細書に開示の方法は、複数の個別に調整されたアライメント方法またはアルゴリズ
ムの使用を統合して、配列決定方法、具体的には、多数の様々な遺伝子における多数の様
々な遺伝的事象の大規模並列配列決定に依存する方法、例えば、腫瘍試料を分析する方法
の性能を最適化することができる。実施形態において、異なる遺伝子中のいくつかのバリ
アントのそれぞれに合わせて個別にカスタマイズまたは調整された複数のアライメント方
法を用いて、読み取りを分析する。実施形態において、調整は、配列決定される遺伝子(
または他のサブゲノム間隔)、試料中の腫瘍型、配列決定されるバリアント、または試料
もしくは対象の特性(のうちの1つ以上)の関数である。配列決定されるいくつかのサブ
ゲノム間隔に合わせて個別に調整されたアライメント条件の選択または使用は、速度、感
度、および特異性の最適化を可能にする。この方法は、比較的多数の様々なサブゲノム間
隔についての読み取りのアライメントが最適化されるときに特に効果的である。
【0017】
したがって、一態様において、本発明は、試料、例えば、腫瘍試料を分析する方法を特
色とする。方法は、
(a)複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
(b)任意で、例えば、ライブラリをベイトセット(または複数のベイトセット)と接
触させることによって事前選択された配列のライブラリを濃縮して、選択されたメンバー
(本明細書でライブラリ捕獲物と称される場合もある)を提供することと、
(c)サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
(d)該読み取りをアライメント方法、例えば、本明細書に記載のアライメント方法を
用いてアライメントすることと、
(e)事前選択されたヌクレオチド位置に対して該読み取りからのヌクレオチド値を割
り当てる(例えば、ベイズ方法を用いて、例えば、変異を呼び出す)ことと、を含み
それによって、該腫瘍試料を分析し、
X個の一意のサブゲノム間隔のそれぞれからの読み取りは、一意のアライメント方法で
アライメントされ、一意のサブゲノム間隔とは、他のX-1個のサブゲノム間隔とは異な
ることを意味し、一意のアライメント方法とは、他のX-1個のアライメント方法とは異
なることを意味し、Xは、少なくとも2である。
【0018】
ある実施形態において、ステップ(b)が存在する。ある実施形態において、ステップ
(b)が欠如する。
ある実施形態において、Xは、少なくとも3、4、5、10、15、20、30、50
、100、500、または1,000である。
ある実施形態において、少なくともX個の遺伝子、例えば、表1および表1Aの少なく
ともX個の遺伝子、例えば、表1および表1Aにおいて優先順位が1のアノテーションを
有する遺伝子由来のサブゲノム間隔は、一意のアライメント方法でアライメントされ、X
は、2、3、4、5、10、15、20、または30に等しい。
【0019】
ある実施形態において、方法(例えば、上述の方法の要素(d))は、読み取りを分析
するため、例えば、アライメントするためのアライメント方法を選択もしくは使用するこ
とを含み、
該アライメント方法は、以下のうちの1つ以上もしくはすべての関数であるか、それら
に応答して選択されるか、またはそれらのために最適化される:
(i)腫瘍型、例えば、該試料中の腫瘍型、
(ii)配列決定される該サブゲノム間隔が位置する遺伝子もしくは遺伝子型、例えば、
事前選択されたバリアントもしくはバリアントの種類、例えば、変異、または事前選択さ
れた頻度の変異を特徴とする遺伝子もしくは遺伝子型、
(iii)分析される部位(例えば、ヌクレオチド位置)、
(iv)評価されるサブゲノム間隔内のバリアントの種類、例えば、置換、
(v)試料の種類、例えば、FFPE試料、および
(vi)評価される該サブゲノム間隔における配列もしくはその付近の配列、例えば、
該サブゲノム間隔の予想される誤アライメント傾向、例えば、該サブゲノム間隔における
反復配列またはその付近の反復配列の存在。
【0020】
本明細書の他の箇所で言及されるように、方法は、比較的多数のサブゲノム間隔につい
ての読み取りのアライメントが最適化されるときに特に効果的である。したがって、ある
実施形態において、少なくともX個の一意のアライメント方法を用いて、少なくともX個
の一意のサブゲノム間隔についての読み取りを分析し、一意とは、他のX-1とは異なる
ことを意味し、Xは、2、3、4、5、10、15、20、30、50、100、500
、または1,000に相当する。
【0021】
ある実施形態において、例えば、表1および表1Aにおいて優先順位が1のアノテーシ
ョンを有する表1および表1Aの少なくともX個の遺伝子由来のサブゲノム間隔が分析さ
れ、Xは、2、3、4、5、10、15、20、または30に相当する。
【0022】
ある実施形態において、一意のアライメント方法は、少なくとも3、5、10、20、
40、50、60、70、80、90、または100個の異なる遺伝子のそれぞれにおけ
るサブゲノム間隔に適用される。
【0023】
ある実施形態において、少なくとも20、40、60、80、100、120、140
、160、または180個の遺伝子、例えば、表1および表1Aの遺伝子におけるヌクレ
オチド位置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意のアライ
メント方法は、少なくとも10、20、30、40、または50%の分析される該遺伝子
のそれぞれにおけるサブゲノム間隔に適用される。
【0024】
本明細書に開示の方法は、厄介な読み取り、例えば、再編成を有する読み取りの迅速か
つ効率的なアライメントを可能にする。したがって、サブゲノム間隔についての読み取り
が再編成、例えば、インデルを有するヌクレオチド位置を含む実施形態において、方法は
、適切に調整されるアライメント方法の使用を含んでもよく、
事前選択された再編成とアライメントするために事前選択される再編成参照配列を読み
取りとのアライメントのために選択することと(実施形態において、参照配列はゲノム再
編成と同一ではない)、
読み取りを該事前選択された再編成参照配列と比較する、例えば、アライメントするこ
とを含む。
【0025】
実施形態において、他の方法を用いて、厄介な読み取りをアライメントする。これらの
方法は、比較的多数の様々なサブゲノム間隔についての読み取りのアライメントが最適化
されるときに特に効果的である。例として、腫瘍試料を分析する方法は、
第1の組のパラメータ下で(例えば、第1のマッピングアルゴリズムまたは第1の参照
配列との)読み取りの比較、例えば、アライメント比較を行うことと、該読み取りが第1
の所定のアライメント基準を満たす(例えば、読み取りが、例えば、事前選択された数未
満のミスマッチで、該第1の参照配列とアライメントされ得る)かを決定することと、
該読み取りが第1の所定のアライメント基準を満たすことができない場合、第2の組のパ
ラメータ下で(例えば、第2のマッピングアルゴリズムまたは第2の参照配列との)第2
のアライメント比較を行うことと、
任意で、該読み取りが該第2の所定の基準を満たす(例えば、読み取りが事前選択された
数未満のミスマッチで該第2の参照配列とアライメントされ得る)かを決定することとを
含んでもよく、
該第2の組のパラメータは、一組のパラメータ、例えば、該第1の組のパラメータと比較
して、事前選択されたバリアント、例えば、再編成、例えば、挿入、欠失、または転座に
ついての読み取りとのアライメントをもたらす見込みがより高い該第2の参照配列の使用
を含む。
【0026】
これらおよび他のアライメント方法は、本明細書の他の箇所、例えば、表題「アライメ
ントモジュール」の項でさらに詳細に論じられる。そのモジュールの要素を、腫瘍を分析
する方法に含んでもよい。実施形態において、「アライメントモジュール」のアライメン
ト方法は、「変異呼び出しモジュール」の変異呼び出し方法および/または「ベイトモジ
ュール」のベイトセットと組み合わせられる。この方法を、「遺伝子選択モジュール」の
サブゲノム間隔の組に適用してもよい。
変異呼び出し
【0027】
本明細書に開示の方法は、配列決定方法、特に、例えば、腫瘍試料由来の多数の様々な
遺伝子における多数の様々な遺伝的事象の大規模並列配列決定に依存する方法の性能を最
適化するようにカスタマイズまたは調整された変異呼び出しパラメータの使用を統合する
ことができる。本方法の実施形態において、いくつかの事前選択されたサブゲノム間隔の
それぞれの変異呼び出しは、個別にカスタマイズまたは微調整される。カスタマイゼーシ
ョンまたは調整は、本明細書に記載の要因、例えば、試料中の癌型、配列決定されるサブ
ゲノム間隔が位置する遺伝子、または配列決定されるバリアントのうちの1つ以上に基づ
き得る。配列決定されるいくつかのサブゲノム間隔に合わせて微調整されたこのアライメ
ント条件の選択または使用は、速度、感度、および特異性の最適化を可能にする。この方
法は、比較的多数の様々なサブゲノム間隔についての読み取りのアライメントが最適化さ
れるときに特に効果的である。
【0028】
したがって、一態様において、本発明は、試料、例えば、腫瘍試料を分析する方法を特
色とする。方法は、
(a)複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを試料、例えば、腫瘍試料から取得することと、
(b)任意で、例えば、ライブラリをベイトセット(または複数のベイトセット)と接
触させることによって事前選択された配列のライブラリを濃縮して、選択されたメンバー
、例えば、ライブラリ捕獲物を提供することと、
(c)サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
(d)該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
を用いてアライメントすることと、
(e)事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる(例えば、ベイズ方法または本明細書に記載の呼び出し方法を用いて、例えば、
変異を呼び出す)ことと、を含み、
それによって、該腫瘍試料を分析し、
X個の一意のサブゲノム間隔のそれぞれにおいてヌクレオチド位置に対して割り当てら
れるヌクレオチド値は、一意の呼び出し方法によって割り当てられ、一意のサブゲノム間
隔とは、他のX-1個のサブゲノム間隔とは異なることを意味し、一意の呼び出し方法と
は、他のX-1個の呼び出し方法とは異なることを意味し、Xは、少なくとも2である。
呼び出し方法は、例えば、異なるベイズ先行値に依存するという点で異なり、したがって
、一意であり得る。
【0029】
ある実施形態において、ステップ(b)が存在する。ある実施形態において、ステップ
(b)が欠如する。
【0030】
ある実施形態において、該ヌクレオチド値の割り当ては、腫瘍型における該事前選択さ
れたヌクレオチド位置で事前選択されたバリアント、例えば、変異を示す読み取りを観察
する先行(例えば、文献)予想であるか、またはそれを表す値の関数である。
【0031】
ある実施形態において、方法は、少なくとも10、20、40、50、60、70、8
0、90、または100個の事前選択されたヌクレオチド位置に対するヌクレオチド値を
割り当てる(例えば、変異を呼び出す)ことを含み、それぞれの割り当ては、腫瘍型にお
ける該事前選択されたヌクレオチド位置で事前選択されたバリアント、例えば、変異を示
す読み取りを観察する先行(例えば、文献)予想であるか、またはそれを表す(他の割り
当ての値ではなく)一意の値の関数である。
【0032】
ある実施形態において、該ヌクレオチド値の割り当ては、バリアントがある頻度で(例
えば、1%、5%、10%等)試料中に存在する場合、および/またはバリアントが不在
である(例えば、塩基呼び出しエラーのみによる読み取りにおいて観察される)場合、該
事前選択されたヌクレオチド位置で該事前選択されたバリアントを示す読み取りを観察す
る確率を表す一組の値の関数である。
【0033】
ある実施形態において、方法(例えば、上述の方法の要素(e))は、変異呼び出し方
法を含む。本明細書に記載の変異呼び出し方法は、以下を含むことができる:
該X個のサブゲノム間隔のそれぞれにおける事前選択されたヌクレオチド位置に対して
、
(i)腫瘍型Xにおける該事前選択されたヌクレオチド位置で事前選択されたバリアント
、例えば、変異を示す読み取りを観察する先行(例えば、文献)予想であるか、またはそ
れを表す第1の値、
(ii)バリアントがある頻度で(例えば、1%、5%、10%等)試料中に存在する場
合、および/またはバリアントが不在である(例えば、塩基呼び出しエラーのみによって
読み取りにおいて観察される)場合、該事前選択されたヌクレオチド位置で該事前選択さ
れたバリアントを示す読み取りを観察する確率を表す第2の一組の値、
を取得することと、
該値に応答して、例えば、本明細書に記載のベイズ方法によって、第1の値を用いて第
2の組の値の間の比較を検討する(例えば、変異の存在の事後確率を算出する)ことによ
って、該事前選択されたヌクレオチド位置のそれぞれに対する該読み取りからのヌクレオ
チド値を割り当て(例えば、変異を呼び出す)、それによって、該試料を分析すること。
【0034】
ある実施形態において、方法は、以下のうちの1つ以上もしくはすべてを含む:
(i)少なくとも10、20、40、50、60、70、80、90、または100個の
事前選択されたヌクレオチド位置に対するクレオチド値を割り当てる(例えば、変異を呼
び出す)こと(この場合において、それぞれの割り当ては、(他の割り当てではなく)一
意の第1および/または第2の値に基づく)、
(ii)(i)の方法の割り当てであって、少なくとも10、20、30、もしくは40
個の割り当ては、例えば、事前選択された腫瘍型の細胞の5、10、または20%未満に
存在する事前選択されたバリアントの確率の関数である第1の値を用いて行われること、
(iii)割り当てがそれぞれ事前選択された腫瘍型、例えば、該試料の腫瘍型に存在す
る(他のX-1個の割り当てではなく)一意の確率を有する事前選択されたバリアントに
関連する、少なくともX個の事前選択されたヌクレオチド位置に対するヌクレオチド値を
割り当てる(例えば、変異を呼び出す)こと(この場合において、任意で、それぞれの該
X個の割り当ては、(他のX-1個の割り当てではなく)一意の第1および/または第2
の値(X=2、3、5、10、20、40、50、60、70、80、90、もしくは1
00)に基づく)、
(iv)ヌクレオチド値を第1および第2のヌクレオチド位置で割り当てる(例えば、変
異を呼び出す)ことであって、該第1のヌクレオチド位置における第1の事前選択された
バリアントが事前選択された腫瘍型(例えば、該試料の腫瘍型)に存在する可能性が、該
第2のヌクレオチド位置での第2の事前選択されたバリアントが存在する可能性よりも少
なくとも2、5、10、20、30、または40倍大きく、任意で、それぞれの割り当て
は、(他の割り当てではなく)一意の第1および/または第2の値に基づくこと、
(v)ヌクレオチド値を複数の事前選択されたヌクレオチド位置に割り当てる(例えば、
変異を呼び出す)ことであって、該複数の事前選択されたヌクレオチド位置は、以下の確
率範囲:
.01未満、.01~.02未満、
0.02より大きく0.03以下、
0.03より大きく0.04以下、
0.04より大きく0.05以下、
0.05より大きく0.1以下、
0.1より大きく0.2以下、
0.2より大きく0.5以下、
0.5より大きく1.0以下、
1.0より大きく2.0以下、
2.0より大きく5.0以下、
5.0より大きく10.0以下、
10.0より大きく20.0以下、
20.0より大きく50.0以下、ならびに
50より大きく100.0%以下
のうちの1つ以上、例えば、少なくとも3、4、5、6、7つ、もしくはすべてに分類さ
れるバリアントの割り当てを含み、
確率範囲は、事前選択されたヌクレオチド位置における事前選択されたバリアントが、事
前選択された腫瘍型(例えば、該試料の腫瘍型)に存在する確率の範囲であるか、または
事前選択されたヌクレオチド位置における事前選択されたバリアントが、事前選択された
型(例えば、該試料の腫瘍型)の腫瘍試料、腫瘍試料由来のライブラリ、またはそのライ
ブラリ由来のライブラリ捕獲物中の列挙された%の細胞に存在する確率であり、
任意で、それぞれの割り当ては、一意の第1および/もしくは第2の値に基づく(例えば
、列挙された確率範囲の他の割り当てではなく一意であるか、または他の列記された確率
範囲のうちの1つ以上もしくはすべての第1および/もしく第2の値とは対照的に一意で
ある)こと、
(vi)それぞれ独立して、該試料中のDNAの50、40、25、20、15、10、
5、4、3、2、1、0.5、0.4、0.3、0.2、または0.1%未満に存在する
事前選択されたバリアントを有する少なくとも1、2、3、5、10、20、40、50
、60、70、80、90、または100個の事前選択されたヌクレオチド位置に対する
ヌクレオチド値を割り当てる(例えば、変異を呼び出す)こと(この場合において、任意
で、それぞれの割り当ては、(他の割り当てではなく)一意の第1および/または第2の
値に基づく)、
(vii)ヌクレオチド値を第1および第2のヌクレオチド位置で割り当てる(例えば、
変異を呼び出す)ことであって、該試料のDNAにおける第1の位置での事前選択された
バリアントの可能性は、該試料のDNAにおける該第2のヌクレオチド位置での事前選択
されたバリアントの可能性よりも少なくとも2、5、10、20、30、または40倍大
きく、任意で、それぞれの割り当ては、(他の割り当てではなく)一意の第1および/ま
たは第2の値に基づくこと、
(viii)ヌクレオチド値を以下のうちの1つ以上もしくはすべてにおいて割り当てる
(例えば、変異を呼び出す)こと、
(1)該試料由来のライブラリにおける核酸、またはライブラリ由来のライブラリ捕獲物
における核酸の該試料の細胞の1.0%未満に存在する事前選択されたバリアントを有す
る少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置、
(2)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の1.0~2.0%に存在する事前選択されたバリアン
トを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置
、
(3)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の2.0%より大きく3%以下に存在する事前選択され
たバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレ
オチド位置、
(4)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の3.0%より大きく4%以下に存在する事前選択され
たバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレ
オチド位置、
(5)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の4.0%より大きく5%以下に存在する事前選択され
たバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレ
オチド位置、
(6)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の5.0%より大きく10%以下に存在する事前選択さ
れたバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌク
レオチド位置、
(7)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の10.0%より大きく20%以下に存在する事前選択
されたバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌ
クレオチド位置、
(8)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の20.0%より大きく40%以下に存在する事前選択
されたバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌ
クレオチド位置、
(9)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の40.0%より大きく50%以下に存在する事前選択
されたバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌ
クレオチド位置、あるいは
(10)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ
捕獲物における核酸の該試料の細胞の50.0%より大きく100%以下に存在する事前
選択されたバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択され
たヌクレオチド位置、
(この場合において、任意で、それぞれの割り当ては、一意の第1および/または第2の
値に基づく(例えば、列挙された範囲(例えば、1%未満の(i)の範囲)の他の割り当
てではなく一意であるか、または他の列記された範囲のうちの1つ以上もしくはすべてに
おける決定のために、第1および/または第2の値ではなく一意である))、あるいは
(ix)ヌクレオチド値をX個のヌクレオチド位置のそれぞれに割り当てる(例えば、変
異を呼び出す)ことであって、それぞれのヌクレオチド位置は、独立して、他のX-1個
のヌクレオチド位置での事前選択されたバリアントの可能性と比較して一意の(該試料の
DNAに存在する事前選択されたバリアントの)可能性を有し、Xは、1、2、3、5、
10、20、40、50、60、70、80、90、もしくは100以上であり、それぞ
れの割り当ては、(他の割り当てではなく)一意の第1および/または第2の値に基づく
こと。
【0035】
本方法の実施形態において、「閾値」を用いて、読み取りを評価し、読み取りからヌク
レオチド位置の値を選択する、例えば、遺伝子の特定の位置での変異を呼び出す。本方法
の実施形態において、いくつかの事前選択されたサブゲノム間隔のそれぞれの閾値は、カ
スタマイズまたは微調整される。カスタマイゼーションまたは調整は、本明細書に記載の
要因、例えば、試料中の癌型、配列決定されるサブゲノム間隔が位置する遺伝子、または
配列決定されるバリアントのうちの1つ以上に基づき得る。これは、配列決定されるいく
つかのサブゲノム間隔それぞれに対して微調整される呼び出しを提供する。この方法は、
比較的多数の様々なサブゲノム間隔が分析されるときに特に効果的である。
【0036】
したがって、別の実施形態では、腫瘍を分析する方法は、以下の変異呼び出し方法を含
む:
該X個のサブゲノム間隔のそれぞれについての閾値を取得し(該取得されたX個の閾値
がそれぞれ他のX-1個の閾値と比較して一意である)、それによって、一意のX個の閾
値を提供することと、
該X個のサブゲノム間隔のそれぞれについて、事前選択されたヌクレオチド位置におい
て事前選択されたヌクレオチド値を有する読み取りの数の関数である観察された値をその
一意の閾値と比較し、それによって、その一意の閾値を該X個のサブゲノム間隔のそれぞ
れに適用することと、
任意で、該比較の結果に応答して、ヌクレオチド値を事前選択されたヌクレオチド位置
に割り当てること。
式中、Xは、2以上である。
【0037】
ある実施形態において、方法は、ヌクレオチド値を少なくとも2、3、5、10、20
、40、50、60、70、80、90、または100個の事前選択されたヌクレオチド
位置で割り当てることを含み、それぞれ独立して、0.5、0.4、0.25、0.15
、0.10、0.05、0.04、0.03、0.02、または0.01未満の確率の関
数である第1の値を有する。
【0038】
ある実施形態において、方法は、ヌクレオチド値を少なくともX個のヌクレオチド位置
のそれぞれで割り当てることを含み、それぞれの独立して、他の第1のX-1個の値と比
較して一意の第1の値を有し、該第1のX個の値はそれぞれ、0.5、0.4、0.25
、0.15、0.10、0.05、0.04、0.03、0.02、または0.01未満
の確率の関数であり、
Xは、1、2、3、5、10、20、40、50、60、70、80、90、または10
0以上である。
【0039】
ある実施形態において、少なくとも20、40、60、80、100、120、140
、160、もしくは180個の遺伝子、例えば、表1の遺伝子におけるヌクレオチド位置
に、ヌクレオチド値が割り当てられる。ある実施形態において、一意の第1および/また
は第2の値が、少なくとも10、20、30、40、もしくは50%の分析される該遺伝
子のそれぞれにおけるサブゲノム間隔に適用される。
【0040】
本方法の実施形態は、例えば、以下の実施形態から見られるように、比較的多数のサブ
ゲノム間隔の閾値が最適化される場合に適用され得る。
【0041】
ある実施形態において、一意の閾値が、少なくとも3、5、10、20、40、50、
60、70、80、90、または100個の異なる遺伝子のそれぞれにおけるサブゲノム
間隔に適用される。
【0042】
ある実施形態において、少なくとも20、40、60、80、100、120、140
、160または180個の遺伝子、例えば、表1の遺伝子におけるヌクレオチド位置に、
ヌクレオチド値が割り当てられる。ある実施形態において、一意の閾値は、少なくとも1
0、20、30、40、または50%の分析される該遺伝子のそれぞれにおけるサブゲノ
ム間隔に適用される。
【0043】
ある実施形態において、優先順位が1のアノテーションを有する表1の少なくとも5、
10、20、30、または40個の遺伝子におけるヌクレオチド位置に、ヌクレオチド値
が割り当てられる。ある実施形態において、一意の閾値は、少なくとも10、20、30
、40、または50%の分析される該遺伝子のそれぞれにおけるサブゲノム間隔に適用さ
れる。
【0044】
これらのおよび他の変異呼び出し方法は、本明細書の他の箇所で、例えば、表題「変異
呼び出しモジュール」の項において、さらに詳細に論じられる。そのモジュールの要素を
、腫瘍を分析する方法に含んでもよい。実施形態において、「変異呼び出しモジュール」
のアライメント方法は、「アライメントモジュール」のアライメント方法および/または
「ベイトモジュール」のベイトセットと組み合わせられる。この方法を、「遺伝子選択モ
ジュール」の一組のサブゲノム間隔に適用することができる。
ベイト
【0045】
本明細書に記載の方法は、配列決定される標的核酸の選択のために、ベイト、例えば、
溶液ハイブリダイゼーション用のベイトの適切な選択によって、1つ以上の対象由来の試
料、例えば、腫瘍試料由来の多数の遺伝子および遺伝子産物の最適化された配列決定を提
供する。様々なサブゲノム間隔またはそのクラスの選択効率は、事前選択された選択効率
を有するベイトセットに従って適合される。この項で使用される「選択効率」は、標的サ
ブゲノム間隔(複数を含む)に従って調節されるときの配列の対象範囲のレベルまたは深
度を指す。
【0046】
したがって、方法(例えば、上述の方法の要素(b))は、ライブラリを複数のベイト
と接触させて選択されたメンバー(例えば、ライブラリ捕獲物)を提供することを含む。
【0047】
したがって、一態様において、本発明は、試料、例えば、腫瘍試料を分析する方法を特
色とする。方法は、
(a)複数のメンバー(例えば、標的メンバー)を含むライブラリを試料から、例えば
、複数の腫瘍メンバーを含むライブラリを腫瘍試料から取得することと、
(b)ライブラリをベイトセットと接触させて選択されたメンバー(例えば、ライブラ
リ捕獲物)を提供することと、
(c)サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
(d)該読み取りをアライメント方法、例えば、本明細書に記載のアライメント方法を
用いてアライメントすることと、
(e)事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる(例えば、ベイズ方法または本明細書に記載の方法を用いて、例えば、変異を呼
び出す)ことと、を含み、
それによって、該腫瘍試料を分析し、
この方法は、ライブラリを複数の、例えば、少なくとも2つ、3つ、4つ、または5つの
ベイトまたはベイトセットと接触させることを含み、該複数のそれぞれのベイトまたはベ
イトセットは、(複数のベイトセットのうちの他のベイトセットとではなく)一意の事前
選択された選択効率を有する。例えば、それぞれの一意のベイトまたはベイトセットは、
一意の配列決定深度を提供する。本明細書で使用される「ベイトセット」という用語は、
集合的に、1つのベイトまたは複数のベイト分子を指す。
【0048】
ある実施形態において、複数のベイトセットのうちの第1のベイトセットの選択効率は
、複数のベイトセットのうちの第2のベイトセットの効率とは少なくとも2倍異なる。あ
る実施形態において、第1および第2のベイトセットは、少なくとも2倍異なる配列決定
深度を提供する。
【0049】
ある実施形態において、方法は、以下のベイトセットのうちの1つもしくは複数をライ
ブラリと接触させることを含む:
a)約500倍以上の配列決定深度を提供する、例えば、試料由来の5%を超えない細
胞に存在する変異を配列決定するのに十分な数のサブゲノム間隔を含むメンバーを選択す
るベイトセット、
b)約200倍以上、例えば、約200倍~約500倍の配列決定深度を提供する、例
えば、試料由来の10%を超えない細胞に存在する変異を配列決定するのに十分な数のサ
ブゲノム間隔を含むメンバーを選択するベイトセット、
c)約10~100倍の配列決定深度を提供する、例えば、a)異なる薬物を代謝する
患者の能力を説明し得る薬理ゲノム(PGx)単一ヌクレオチド多型(SNP)、または
b)患者を一意に特定する(例えば、フィンガープリントする)ために使用され得るゲノ
ムSNPから選択される1つ以上のサブゲノム間隔(例えば、エクソン)を配列決定する
のに十分な数のサブゲノム間隔を含むメンバーを選択するベイトセット、
d)約5~50倍の配列決定深度を提供する、例えば、ゲノム転座またはインデル等の
構造ブレークポイントを検出するのに十分な数のサブゲノム間隔を含むメンバーを選択す
るベイトセット(例えば、イントロンブレークポイントの検出は、高い検出信頼性を確保
するために、5~50倍の配列対スパン深度を必要とし、そのようなベイトセットを用い
て、例えば、転座/インデルの傾向のある癌遺伝子を検出することができる)、または
e)約0.1~300倍の配列決定深度を提供する、例えば、コピー数の変化を検出す
るのに十分な数のサブゲノム間隔を含むメンバーを選択するベイトセット。一実施形態に
おいて、配列決定深度は、コピー数の変化を検出するために、約0.1~10倍の配列決
定深度の範囲である。他の実施形態では、配列決定深度は、ゲノムDNAのコピー数獲得
/喪失またはヘテロ接合性の消失(LOH)を評価するために使用されるゲノムSNP/
遺伝子座を検出するために、約100~300倍の範囲である。そのようなベイトセット
を用いて、例えば、増幅/欠失の傾向のある癌遺伝子を検出することができる。
【0050】
本明細書で使用される配列決定深度のレベル(例えば、配列決定深度のX倍のレベル)
は、重複読み取り、例えば、PCR重複読み取りの検出および除去後の読み取り(例えば
、一意の読み取り)の対象範囲のレベルを指す。
【0051】
一実施形態において、ベイトセットは、1つ以上の再編成を含有するサブゲノム間隔、
例えば、ゲノム再編成を含有するイントロンを選択する。そのような実施形態において、
ベイトセットは、反復配列がマスクされて選択効率を増加させるように設計される。再編
成が既知の接合配列を有する実施形態では、接合配列に対して相補的なベイトセットは、
選択効率を増加させるように設計されてもよい。
【0052】
実施形態において、方法は、それぞれが異なるベイト設計戦略を有する2つ以上の異な
る標的カテゴリーを捕捉するように設計されるベイトの使用を含む。実施形態において、
本明細書に開示のハイブリッド捕捉方法および組成物は、標的配列(例えば、標的メンバ
ー)の定義されたサブセットの外側の対象範囲を最小限に抑えながら、そのサブセットを
捕捉し、標的配列の均一な対象範囲を提供する。一実施形態において、標的配列は、ゲノ
ムDNAからの全エクソーム、またはその選択されたサブセットを含む。本明細書に開示
の方法および組成物は、複合標的核酸配列(例えば、核酸ライブラリ)の異なる深度およ
びパターンの対象範囲を達成するために、異なるベイトセットを提供する。
【0053】
ある実施形態において、方法は、核酸ライブラリ(例えば、ライブラリ捕獲物)の選択
されたメンバーを提供することを含む。その方法は、
複数のメンバー、例えば、標的核酸メンバー(例えば、複数の腫瘍メンバー、参照メン
バー、および/またはPGxメンバーを含む)を含むライブラリ(例えば、核酸ライブラ
リ)を提供することと、
ライブラリを、例えば、溶液ベースの反応において、複数のベイト(例えば、オリゴヌ
クレオチドベイト)と接触させて、複数のベイト/メンバーハイブリッドを含むハイブリ
ダイゼーション混合物を形成することと、
複数のベイト/メンバーハイブリッドを、例えば、該ハイブリダイゼーション混合物を
、該複数のベイト/メンバーハイブリッドの分離を可能にする結合実体と接触させること
によって、該ハイブリダイゼーション混合物から分離することと、を含み、
それによって、ライブラリ捕獲物(例えば、ライブラリ由来の核酸分子の選択または強化
されたサブグループ)を提供し、
複数のベイトは、以下のうちの2つ以上を含む:
a)低頻度、例えば、約5%(すなわち、それらのゲノムにおける変化を持つ試料由来
の細胞の5%)以下で出現する変化(例えば、1つ以上の変異)に対する高レベルの感度
を可能にするために最深の対象範囲が要求される、高レベルの標的(例えば、遺伝子、エ
クソン、または塩基等のサブゲノム間隔を含む1つ以上の腫瘍メンバー)を選択する第1
のベイトセット(一実施形態において、第1のベイトセットは、約500倍以上の配列決
定深度を必要とする変化(例えば、点変異)を含む腫瘍メンバーを選択する(例えば、そ
れに相補的である))、
b)a)における高レベルの標的よりも高い頻度、例えば、約10%(すなわち、それ
らのゲノムにおける変化を持つ試料由来の細胞の10%)の頻度で出現する変化(例えば
、1つ以上の変異)に対する高レベルの感度を可能にするために高い対象範囲が要求され
る、中間レベルの標的(例えば、遺伝子、エクソン、または塩基等のサブゲノム間隔を含
む1つ以上の腫瘍メンバー)を選択する第2のベイトセット(一実施形態において、第2
のベイトセットは、約200倍以上の配列決定深度を必要とする変化(例えば、点変異)
を含む腫瘍メンバーを選択する(例えば、それに相補的である))、
c)高レベルの感度を可能にするために、例えば、ヘテロ接合体対立遺伝子を検出する
ために低~中程度の対象範囲が要求される、低レベルの標的(例えば、遺伝子、エクソン
、または塩基等のサブゲノム間隔を含む1つ以上のPGxメンバー)を選択する第3のベ
イトセット(例えば、ヘテロ接合体対立遺伝子の検出は、高い検出信頼性を確保するため
に、10~100倍の配列決定深度を必要とする。一実施形態において、第3のベイトセ
ットは、以下のうちの2つ以上を含む:a)異なる薬物を代謝する患者の能力を説明し得
る薬理ゲノム(PGx)単一ヌクレオチド多型(SNP)、またはb)患者を一意に特定
する(例えば、フィンガープリントする)ために使用され得るゲノムSNPから選択され
る1つ以上のサブゲノム間隔(例えば、エクソン)を選択する)、
d)例えば、ゲノム転座またはインデル等の構造ブレークポイントを検出するために低
~中程度の対象範囲が要求される、第1のイントロン標的(例えば、イントロン配列を含
むメンバー)を選択する第4のベイトセット(例えば、イントロンブレークポイントの検
出は、高い検出信頼性を確保するために、5~50倍の配列対スパン深度を必要とする。
該第4のベイトセットを用いて、例えば、転座/インデルの傾向のある癌遺伝子を検出す
ることができる)、または
e)コピー数の変化を検出する能力を改善するために密でない対象範囲が要求される、
第2のイントロン標的(例えば、イントロンメンバー)を選択する第5のベイトセット(
例えば、いくつかの末端エクソンの1コピー欠失の検出は、高い検出信頼性を確保するた
めに、0.1~300倍の対象範囲を必要とする。一実施形態において、コピー数の変化
を検出するための対象範囲深度は、約0.1~10倍の範囲である。他の実施形態では、
ゲノムDNAのコピー数獲得/喪失またはヘテロ接合性の消失(LOH)を評価するため
に使用されるゲノムSNP/遺伝子座を検出するための対象範囲深度は、約100~30
0倍の範囲である。該第5のベイトセットを用いて、例えば、増幅/欠失の傾向のある癌
遺伝子を検出することができる)。
【0054】
前述のベイトセットのうちの2つ、3つ、4つ、またはそれ以上の任意の組み合わせ、
例えば、第1および第2のベイトセット;第1および第3のベイトセット;第1および第
4のベイトセット;第1および第5のベイトセット;第2および第3のベイトセット;第
2および第4のベイトセット;第2および第5のベイトセット;第3および第4のベイト
セット;第3および第5のベイトセット;第4および第5のベイトセット;第1、第2、
および第3のベイトセット;第1、第2、および第4のベイトセット;第1、第2、およ
び第5のベイトセット;第1、第2、第3、第4のベイトセット;第1、第2、第3、第
4、および第5のベイトセット等の組み合わせを用いることができる。
【0055】
一実施形態において、第1、第2、第3、第4、または第5のベイトセットはそれぞれ
、事前選択された選択(例えば、捕捉)効率を有する。一実施形態において、選択効率の
値は、a)~e)に従って、5つすべてのベイトのうちの少なくとも2つ、3つ、4つに
おいて同一である。他の実施形態では、選択効率の値は、a)~e)に従って、5つすべ
てのベイトのうちの少なくとも2つ、3つ、4つにおいて異なる。
【0056】
いくつかの実施形態では、少なくとも2つ、3つ、4つ、または5つすべてのベイトセ
ットは、事前選択された異なる効率値を有する。例えば、選択効率値は、のうちの1つ以
上から選択される:
(i)第1の事前選択された効率が、少なくとも約500倍以上の配列決定深度である
第1の選択効率値を有する(例えば、第2、第3、第4、もしくは第5の事前選択された
選択効率よりも大きい(例えば、第2の選択効率値よりも約2~3倍大きく、第3の選択
効率値よりも約5~6倍大きく、第4の選択効率値よりも約10倍大きく、第5の選択効
率値よりも約50~5000倍大きい)選択効率値を有する)。
(ii)第2の事前選択された効率が、少なくとも約200倍以上の配列決定深度であ
る第2の選択効率値を有する(例えば、第3、第4、もしくは第5の事前選択された選択
効率よりも大きい(例えば、第3の選択効率値よりも約2倍大きく、第4の選択効率値よ
りも約4倍大きく、第5の選択効率値よりも約20~2000倍大きい)選択効率値を有
する)。
(iii)第3の事前選択された効率が、少なくとも約100倍以上の配列決定深度で
ある第3の選択効率値を有する(例えば、第4もしくは第5の事前選択された選択効率よ
りも大きい(例えば、第4の選択効率値よりも約2倍大きく、第5の選択効率値よりも約
10~1000倍大きい)選択効率値を有する)。
(iv)第4の事前選択された効率が、少なくとも約50倍以上の配列決定深度である
第4の選択効率値を有する(例えば、第5の事前選択された選択効率よりも大きい(例え
ば、第5の選択効率値よりも約50~500倍大きい)選択効率値を有する)。または、
(v)第5の事前選択された効率が、少なくとも約10~0.1倍の配列決定深度であ
る第5の選択効率値を有する。
【0057】
ある特定の実施形態において、選択効率値は、異なるベイトセットの差次的表示、ベイ
トサブセットの差次的オーバーラップ、差次的ベイトパラメータ、異なるベイトセットの
混合、および/または異なる種類のベイトセットの使用のうちの1つ以上によって修正さ
れる。例えば、選択効率(例えば、それぞれのベイトセット/標的カテゴリーの相対配列
対象範囲)の変化を、以下のうちの1つ以上を変化させることによって調節することがで
きる:
(i)異なるベイトセットの差次的表示:所与の標的(例えば、標的メンバー)を捕捉
するためのベイトセット設計をより多い/より少ない数のコピーに含んで、相対的な標的
の対象範囲深度を強化する/減少させることができる。
(ii)ベイトサブセットの差次的オーバーラップ:所与の標的(例えば、標的メンバ
ー)を捕捉するためのベイトセット設計に、隣接ベイト間により長いか、またはより短い
オーバーラップを含ませて、相対的な標的の対象範囲を強化する/減少させることができ
る。
(iii)差次的ベイトパラメータ:所与の標的(例えば、標的メンバー)を捕捉する
ためのベイトセット設計に、配列修正/より短い長さを含ませて、捕捉効率を減少させ、
かつ相対的な標的の対象範囲を低下させることができる。
(iv)異なるベイトセットの混合:異なる標的セットを捕捉するように設計されるベ
イトセットを異なるモル比で混合して、相対的な標的の対象範囲深度を強化する/減少さ
せることができる。
(v)異なる種類のオリゴヌクレオチドベイトセットの使用:ある特定の実施形態にお
いて、ベイトセットは、以下のものを含んでもよい:
(a)1つ以上の化学的に(例えば、非酵素的に)合成された(例えば、個別に合成さ
れた)ベイト、
(b)アレイで合成された1つ以上のベイト、
(c)1つ以上の酵素的に調製された、例えば、生体外で転写されたベイト、
(d)(a)、(b)、および/もしくは(c)の任意の組み合わせ、
(e)1つ以上のDNAオリゴヌクレオチド(例えば、自然発生もしくは非自然発生の
DNAオリゴヌクレオチド)、
(f)1つ以上のRNAオリゴヌクレオチド(例えば、自然発生もしくは非自然発生の
RNAオリゴヌクレオチド)、
(g)(e)および(f)の組み合わせ、または
(h)上記のうちのいずれかの組み合わせ。
【0058】
異なるオリゴヌクレオチドの組み合わせを異なる比率、例えば、1:1、1:2、1:
3、1:4、1:5、1:10、1:20、1:50、1:100、1:1000等から
選択される比率で混合してもよい。一実施形態において、化学的に合成されたベイトとア
レイで生成されたベイトの比率は、1:5、1:10、または1:20から選択される。
DNAまたはRNAオリゴヌクレオチドは、自然発生または非自然発生であり得る。ある
特定の実施形態において、ベイトは、例えば、融解温度を増加させるために、1つ以上の
非自然発生のヌクレオチドを含む。例となる非自然発生のオリゴヌクレオチドは、修飾さ
れたDNAまたはRNAヌクレオチドを含む。例となる修飾されたヌクレオチド(例えば
、修飾されたRNAまたはDNAヌクレオチド)は、LNAヌクレオチドのリボース部分
が2’酸素と4’炭素を結合する追加の架橋で修飾されるロックド核酸(LNA);ペプ
チド核酸(PNA)、例えば、ペプチド結合によって結合された反復N-(2-アミノエ
チル)-グリシンユニットから成るPNA;低GC領域を捕捉するように修飾されたDN
AまたはRNAオリゴヌクレオチド;二環式核酸(BNA);架橋オリゴヌクレオチド;
修飾された5-メチルデオキシシチジン;および2,6-ジアミノプリンを含むが、これ
らに限定されない。他の修飾されたDNAおよびRNAヌクレオチドは、当技術分野で既
知である。
【0059】
ある特定の実施形態において、実質的に均一または同様の対象範囲の標的配列(例えば
、標的メンバー)が得られる。例えば、それぞれのベイトセット/標的カテゴリー内で、
対象範囲の均一性を、ベイトパラメータを修正することによって、例えば、以下のうちの
1つ以上によって最適化することができる:
(i)ベイト表示またはオーバーラップの増加/減少を用いて、同一のカテゴリー内の
他の標的と比較して不十分に/過度に対象範囲とされる標的(例えば、標的メンバー)の
対象範囲を強化する/減少させることができる。
(ii)標的配列(例えば、高GC含量配列)を捕捉するのが困難な低い対象範囲の場
合、ベイトセットで標的化される領域を拡大して、例えば、隣接配列(例えば、GCが比
較的豊富ではない隣接配列)を対象範囲とする。
(iii)ベイト配列の修正を行って、ベイトの二次構造を減少させ、かつその選択効
率を強化することができる。
(iv)ベイト長の修正を用いて、同一のカテゴリー内の異なるベイトの融解ハイブリ
ダイゼーション動態を均等化することができる。ベイト長を直接的に(異なる長さを有す
るベイトを産生することによって)または間接的に(一貫した長さのベイトを産生し、ベ
イト末端を任意の配列に置き換えることによって)修飾することができる。
(v)同一の標的領域(すなわち、順方向鎖および逆方向鎖)に対して異なる配向を有
するベイトの修正が、異なる結合効率を有し得る。それぞれの標的に最適な対象範囲を提
供するいずれかの配向を有するベイトセットを選択することができる。
(vi)それぞれのベイト上に存在する結合実体、例えば、捕捉タグ(例えば、ビオチ
ン)の量の修正が、その結合効率に影響を及ぼし得る。特定の標的を標的化するベイトの
タグレベルの増加/減少を用いて、相対標的対象範囲を強化する/減少させることができ
る。
(vii)異なるベイトに使用されるヌクレオチドの種類の修正を変更して、標的に対
する結合親和性に影響を及ぼし、かつ相対標的対象範囲を強化する/減少させることがで
きる。または、
(viii)例えば、より安定した塩基対合を有する修飾されたオリゴヌクレオチドベ
イトを使用して、高GC含量と比較して低いか、もしくは正常なGC含量の領域間の融解
ハイブリダイゼーション動態を均等化することができる。
【0060】
例えば、異なる種類のオリゴヌクレオチドベイトセットを用いることができる。
【0061】
一実施形態において、選択効率値は、異なる種類のベイトオリゴヌクレオチドを用いる
ことによって修正され、事前選択された標的領域を包含する。例えば、第1のベイトセッ
ト(例えば、10,000~50,000個のRNAまたはDNAベイトを含むアレイベ
ースのベイトセット)を用いて、広大な標的領域(例えば、1~2MBの全標的領域)を
対象範囲とすることができる。第1のベイトセットを、第2のベイトセット(例えば、5
,000個未満のベイトを含む個別に合成されたRNAまたはDNAベイトセット)でス
パイクして、事前選択された標的領域(例えば、例えば、250kb以下の標的領域にま
たがる目的とする選択されたサブゲノム間隔)および/または高次二次構造、例えば、よ
り高いGC含量を有する領域を対象範囲とすることができる。目的とする選択されたサブ
ゲノム間隔は、本明細書に記載の遺伝子もしくは遺伝子産物、またはその断片のうちの1
つ以上に対応し得る。第2のベイトセットは、所望のベイトオーバーラップに応じて、約
1~5,000、2~5,000、3~5,000、10~5,000、100~5,0
00、500~5,000、100~5,000、1000~5,000、2,000~
5,000個のベイトを含み得る。他の実施形態では、第2のベイトセットは、第1のベ
イトセット内にスパイクされる選択されたオリゴベイト(例えば、400、200、10
0、50、40、30、20、10、5、4、3、2または1個未満のベイト)を含み得
る。第2のベイトセットを、個別のオリゴベイトの任意の比率で混合してもよい。例えば
、第2のベイトセットは、1:1の等モル比で存在する個別のベイトを含み得る。あるい
は、第2のベイトセットは、例えば、ある特定の標的(例えば、ある特定の標的は、他の
標的と比較して5~10倍の第2のベイトを有し得る)の捕捉を最適化するために、異な
る比率(例えば、1:5、1:10、1:20)で存在する個別のベイトを含み得る。
【0062】
他の実施形態では、選択効率は、等モル混合物のベイトを用いるときに観察される差次
的配列捕捉効率を参照してベイトの相対存在量または結合実体の密度(例えば、ハプテン
または親和性タグ密度)を調節することによって、ある群内の個別のベイト(例えば、第
1、第2、または第3の複数のベイト)の効率を平準化し、その後、内部的に平準化され
た第2群に対して、差次的の過度の内部的に平準化された第1群を全体のベイト混合物に
導入することによって調節される。
【0063】
ある実施形態において、方法は、腫瘍メンバー、例えば、腫瘍細胞由来のサブゲノム間
隔を含む核酸分子を選択するベイトセット(本明細書で「腫瘍ベイトセット」とも称され
る)を含む複数のベイトセットの使用を含む。腫瘍メンバーは、腫瘍細胞に存在する任意
のヌクレオチド配列(例えば、変異、野生型、PGx、参照)または腫瘍もしくは癌細胞
に存在する本明細書に記載のイントロンヌクレオチド配列であり得る。一実施形態におい
て、腫瘍メンバーは、低頻度、例えば、それらのゲノムの変化を持つ腫瘍試料由来の細胞
の約5%以下で出現する変化(例えば、1つ以上の変異)を含む。他の実施形態では、腫
瘍メンバーは、腫瘍試料由来の細胞の約10%の頻度で出現する変化(例えば、1つ以上
の変異)を含む。他の実施形態では、腫瘍メンバーは、PGx遺伝子または遺伝子産物由
来のサブゲノム間隔、イントロン配列、例えば、本明細書に記載のイントロン配列、腫瘍
細胞に存在する参照配列を含む。
【0064】
別の態様では、本発明は、本明細書に記載のベイトセット、本明細書に記載の個別のベ
イトセットの組み合わせ、例えば、本明細書に記載の組み合わせを特色とする。ベイトセ
ット(複数を含む)は、取扱説明書、標準物質、緩衝液、もしくは酵素、または他の試薬
を任意で含み得るキットの一部であってもよい。
遺伝子選択
【0065】
分析のために事前選択されたサブゲノム間隔、例えば、複数の組または群の遺伝子およ
び他の領域に対する一群または一組のサブゲノム間隔が本明細書に記載される。
【0066】
したがって、実施形態において、方法は、例えば、次世代配列決定方法を用いて、取得
された核酸試料由来の少なくとも5、6、7、8、9、10、15、20、25、30個
、もしくはそれ以上の遺伝子または遺伝子産物由来のサブゲノム間隔を配列決定すること
を含み、遺伝子または遺伝子産物は、ABL1、AKT1、AKT2、AKT3、ALK
、APC、AR、BRAF、CCND1、CDK4、CDKN2A、CEBPA、CTN
NB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FL
T3、HRAS、JAK2、KIT、KRAS、MAP2K1、MAP2K2、MET、
MLL、MYC、NF1、NOTCH1、NPM1、NRAS、NTRK3、PDGFR
A、PIK3CA、PIK3CG、PIK3R1、PTCH1、PTCH2、PTEN、
RB1、RET、SMO、STK11、SUFU、またはTP53から選択され、それに
よって、腫瘍試料を分析する。
【0067】
したがって、一態様において、本発明は、試料、例えば、腫瘍試料を分析する方法を特
ショックとする。その方法は、
(a)複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
(b)任意で、例えば、ライブラリをベイトセット(または複数のベイトセット)と接
触させることによって事前選択された配列のライブラリを濃縮して、選択されたメンバー
(例えば、ライブラリ捕獲物)を提供することと、
(c)サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
(d)該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
を用いてアライメントすることと、
(e)事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる(例えば、ベイズ方法または本明細書に記載の方法を用いて、例えば、変異を呼
び出す)ことと、を含み、
それによって、該腫瘍試料を分析し、
該方法は、例えば、次世代配列決定方法を用いて、試料由来の少なくとも5、6、7、8
、9、10、15、20、25、30個、もしくはそれ以上の遺伝子または遺伝子産物由
来のサブゲノム間隔を配列決定することを含み、遺伝子または遺伝子産物は、ABL1、
AKT1、AKT2、AKT3、ALK、APC、AR、BRAF、CCND1、CDK
4、CDKN2A、CEBPA、CTNNB1、EGFR、ERBB2、ESR1、FG
FR1、FGFR2、FGFR3、FLT3、HRAS、JAK2、KIT、KRAS、
MAP2K1、MAP2K2、MET、MLL、MYC、NF1、NOTCH1、NPM
1、NRAS、NTRK3、PDGFRA、PIK3CA、PIK3CG、PIK3R1
、PTCH1、PTCH2、PTEN、RB1、RET、SMO、STK11、SUFU
、またはTP53から選択される。
【0068】
ある実施形態において、ステップ(b)が存在する。ある実施形態において、ステップ
(b)が欠如する。
【0069】
別の実施形態では、以下の組または群のうちの1つのサブゲノム間隔が分析される。例
えば、腫瘍または癌遺伝子もしくは遺伝子産物、参照(例えば、野生型)遺伝子もしくは
遺伝子産物、およびPGx遺伝子もしくは遺伝子産物に関連したサブゲノム間隔は、腫瘍
試料由来の一群または一組のサブゲノム間隔を提供することができる。
【0070】
ある実施形態において、方法は、一組のサブゲノム間隔についての読み取り、例えば、
配列を腫瘍試料から取得し、サブゲノム間隔は、以下のうちの少なくとも1、2、3、4
、5、6、7、8、9、10、11、12、13、またはすべてから選択される。
A)以下のうちの少なくとも5つ以上から選択される変異または野生型遺伝子もしくは
遺伝子産物由来の少なくとも5、6、7、8、9、10、15、20、25、30個、も
しくはそれ以上のサブゲノム間隔:ABL1、AKT1、AKT2、AKT3、ALK、
APC、AR、BRAF、CCND1、CDK4、CDKN2A、CEBPA、CTNN
B1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FLT
3、HRAS、JAK2、KIT、KRAS、MAP2K1、MAP2K2、MET、M
LL、MYC、NF1、NOTCH1、NPM1、NRAS、NTRK3、PDGFRA
、PIK3CA、PIK3CG、PIK3R1、PTCH1、PTCH2、PTEN、R
B1、RET、SMO、STK11、SUFU、もしくはTP53、
B)ABL2、ARAF、ARFRP1、ARID1A、ATM、ATR、AURKA
、AURKB、BAP1、BCL2、BCL2A1、BCL2L1、BCL2L2、BC
L6、BRCA1、BRCA2、CBL、CARD11、CBL、CCND2、CCND
3、CCNE1、CD79A、CD79B、CDH1、CDH2、CDH20、CDH5
、CDK6、CDK8、CDKN2B、CDKN2C、CHEK1、CHEK2、CRK
L、CRLF2、DNMT3A、DOT1L、EPHA3、EPHA5、EPHA6、E
PHA7、EPHB1、EPHB4、EPHB6、ERBB3、ERBB4、ERG、E
TV1、ETV4、ETV5、ETV6、EWSR1、EZH2、FANCA、FBXW
7、FGFR4、FLT1、FLT4、FOXP4、GATA1、GNA11、GNAQ
、GNAS、GPR124、GUCY1A2、HOXA3、HSP90AA1、IDH1
、IDH2、IGF1R、IGF2R、IKBKE、IKZF1、INHBA、IRS2
、JAK1、JAK3、JUN、KDM6A、KDR、LRP1B、LRP6、LTK、
MAP2K4、MCL1、MDM2、MDM4、MEN1、MITF、MLH1、MPL
、MRE11A、MSH2、MSH6、MTOR、MUTYH、MYCL1、MYCN、
NF2、NKX2-1、NTRK1、NTRK2、PAK3、PAX5、PDGFRB、
PKHD1、PLCG1、PRKDC、PTPN11、PTPRD、RAF1、RARA
、RICTOR、RPTOR、RUNX1、SMAD2、SMAD3、SMAD4、SM
ARCA4、SMARCB1、SOX10、SOX2、SRC、TBX22、TET2、
TGFBR2、TMPRSS2、TNFAIP3、TNK、TNKS2、TOP1、TS
C1、TSC2、USP9X、VHL、もしくはWT1のうちの少なくとも5つ以上から
選択される変異または野生型遺伝子もしくは遺伝子産物由来の少なくとも5、6、7、8
、9、10、15、20、25、30、35、40、45、50、55、60、65、7
0、75、80、85、90、95、100、105、110、115、120個、もし
くはそれ以上のサブゲノム間隔、
C)表1、1A、2、3、もしくは4に従う、遺伝子もしくは遺伝子産物由来の少なく
とも5、6、7、8、9、10、15、20個、もしくはそれ以上のサブゲノム間隔、
D)腫瘍または癌に関連した(例えば、腫瘍もしくは癌の正もしくは負の治療応答予測
因子であるか、腫瘍もしくは癌の正もしくは負の予後因子であるか、または腫瘍もしくは
癌の差次的診断を可能にする)遺伝子もしくは遺伝子産物、例えば、ABL1、AKT1
、ALK、AR、BRAF、BRCA1、BRCA2、CEBPA、EGFR、ERBB
2、FLT3、JAK2、KIT、KRAS、MET、NPM1、PDGFRA、PIK
3CA、RARA、AKT2、AKT3、MAP2K4、NOTCH1、およびTP53
のうちの1つ以上から選択される遺伝子もしくは遺伝子産物由来の少なくとも5、6、7
、8、9、10、15、20個、もしくはそれ以上のサブゲノム間隔、
E)ABL1遺伝子のコドン315;APCのコドン1114、1338、1450、
もしくは1556;BRAFのコドン600;CTNNB1のコドン32、33、34、
37、41、もしくは45;EGFRのコドン719、746~750、768、790
、858、もしくは861;FLT3のコドン835;HRASのコドン12、13、も
しくは61;JAK2のコドン617;KITのコドン816;KRASのコドン12、
13、もしくは61;PIK3CAのコドン88、542、545、546、1047、
もしくは1049;PTENのコドン130、173、233、もしくは267;RET
のコドン918;TP53のコドン175、245、248、273、もしくは306の
うちの1つ以上から選択される変異コドンまたは野生型コドンを含む少なくとも5、6、
7、8、9、10個、もしくはそれ以上のサブゲノム間隔(例えば、表1に示されるコド
ンのうちの1つ以上を含む、少なくとも5、10、15、20個、もしくはそれ以上のサ
ブゲノム間隔)、
F)ABCB1、BCC2、ABCC4、ABCG2、C1orf144、CYP1B
1、CYP2C19、CYP2C8、CYP2D6、CYP3A4、CYP3A5、DP
YD、ERCC2、ESR2、FCGR3A、GSTP1、ITPA、LRP2、MAN
1B1、MTHFR、NQO1、NRP2、SLC19A1、SLC22A2、SLCO
1B3、SOD2、SULT1A1、TPMT、TYMS、UGT1A1、もしくはUM
PSから選択される薬物代謝、薬物応答性、または毒性(本明細書で「PGx」遺伝子と
も称される)のうちの1つ以上に関連した遺伝子もしくは遺伝子産物に存在するサブゲノ
ム間隔の変異または野生型遺伝子もしくは遺伝子産物(例えば、単一ヌクレオチド多型(
SNP))由来の少なくとも5、6、7、8、9、10、15、20、25、30個、も
しくはそれ以上のサブゲノム間隔、
G)(i)薬物で治療された癌患者のより良好な生存率(例えば、パクリタキセル(例
えば、ABCB1遺伝子)で治療された乳癌患者のより良好な生存率)、(ii)パクリ
タキセル代謝(例えば、表2に示される異なる遺伝子座および変異におけるCYP2C8
遺伝子;CYP3A4遺伝子)、(iii)薬物に対する毒性(例えば、ABCC4遺伝
子で見られる6-MP毒性(表2);DPYD遺伝子、TYMS遺伝子、もしくはUMP
S遺伝子で見られる5-FU毒性(表2);TMPT遺伝子で見られるプリン毒性(表2
);NRP2遺伝子、Clorf144遺伝子、CYP1B1遺伝子で見られるダウノル
ビシン毒性(表2))、または(iv)薬物の副作用(例えば、ABCG2、TYMS、
UGT1A1、ESR1、およびESR2遺伝子(表2))のうちの1つ以上に関連した
遺伝子もしくは遺伝子産物に存在するサブゲノム間隔の変異または野生型PGx遺伝子ま
たは遺伝子産物(例えば、単一ヌクレオチド多型(SNP))由来の少なくとも5、6、
7、8、9、10、15、20、25、30個、もしくはそれ以上のサブゲノム間隔、
H)表3に従う少なくとも5、10、15、20、25、30、35、40、45、5
0、75、110個、もしくはそれ以上の遺伝子もしくは遺伝子産物の転座変化、
J)表3に明記される癌型由来の固形腫瘍試料における、表3に従う少なくとも5、1
0、15、20、25、30、35、40、45、50、75、110個、もしくはそれ
以上の遺伝子もしくは遺伝子産物の転座変化、
K)表4に従う少なくとも5、10、15、20、25、30、35、40、45、5
0、75、100、150、200個、もしくはそれ以上の遺伝子もしくは遺伝子産物の
転座変化、
L)表4に明記される癌型由来のヘム腫瘍試料における、表4に従う少なくとも5、1
0、15、20、25、30、35、40、45、50、75、100、150、200
個、もしくはそれ以上の遺伝子もしくは遺伝子産物の転座変化、
M)表1~4から選択される少なくとも5個の遺伝子もしくは遺伝子産物(例えば、事
前選択された位置における対立遺伝子変異は、事前選択された種類の腫瘍に関連し、該対
立遺伝子変異は、該腫瘍型中の細胞の5%未満に存在する)、
N)GCが豊富な領域に埋め込まれる表1、表1A-4から選択される少なくとも5個
の遺伝子もしくは遺伝子産物、あるいは
O)癌発生の遺伝(例えば、生殖細胞系危険)因子を示す少なくとも5個の遺伝子もし
くは遺伝子産物(例えば、遺伝子もしくは遺伝子産物は、BRCA1、BRCA2、EG
FR、HRAS、KIT、MPL、ALK、PTEN、RET、APC、CDKN2A、
MLH1、MSH2、MSH6、NF1、NF2、RB1、TP53、VHL、もしくは
WT1のうちの1つ以上から選択される)。
【0071】
さらに別の実施形態では、方法は、一組のサブゲノム間隔についての読み取り、例えば
、配列を腫瘍試料から取得し、サブゲノム間隔は、表1Bに記載される変化のうちの1、
2、3、4、5、10、15個、もしくはすべてから選択される。一実施形態において、
サブゲノム間隔は、カテゴリーA、B、C、D、またはEのうちの1つ以上に分類される
変化を含む。他の実施形態では、サブゲノム間隔は、腫瘍試料、例えば、結腸、肺、また
は乳房腫瘍試料におけるKRAS G13Dの変化を含む。他の実施形態では、サブゲノ
ム間隔は、腫瘍試料、例えば、黒色腫または結腸腫瘍試料におけるNRAS Q61Kの
変化を含む。さらに他の実施形態では、サブゲノム間隔は、腫瘍試料、例えば、黒色腫、
結腸、または肺腫瘍試料におけるBRAF V600Eの変化を含む。他の実施形態では
、サブゲノム間隔は、腫瘍試料、例えば、肺腫瘍試料におけるBRAF D594Gの変
化を含む。他の実施形態では、サブゲノム間隔は、腫瘍試料、例えば、乳房または結腸腫
瘍試料におけるPIK3CA H1047Rの変化を含む。さらに他の実施形態では、サ
ブゲノム間隔は、腫瘍試料、例えば、肺腫瘍試料におけるEGFR L858RまたはT
790Mの変化を含む。他の実施形態では、サブゲノム間隔は、腫瘍試料におけるERB
B2の変化、例えば、乳房腫瘍試料におけるERBB2増幅を含む。他の実施形態では、
サブゲノム間隔は、腫瘍試料におけるBRCA1の変化、例えば、乳房腫瘍試料における
BRCA1両アレル不活性化を含む。他の実施形態では、サブゲノム間隔は、腫瘍試料に
おけるBRCA2の変化、例えば、膵臓腫瘍試料におけるBRCA2両アレル不活性化を
含む。他の実施形態では、サブゲノム間隔は、腫瘍試料におけるATMの変化、例えば、
乳房腫瘍試料におけるATM両アレル不活性化を含む。他の実施形態では、サブゲノム間
隔は、腫瘍試料におけるTSCの変化、例えば、結腸腫瘍試料におけるTSC両アレル不
活性化を含む。他の実施形態では、サブゲノム間隔は、腫瘍試料におけるPTENの変化
、例えば、乳房または結腸腫瘍試料におけるPTEN両アレル不活性化を含む。さらに他
の実施形態では、サブゲノム間隔は、腫瘍試料におけるVHLの変化、例えば、腎臓腫瘍
試料におけるVHL両アレル不活性化を含む。他の実施形態では、サブゲノム間隔は、腫
瘍試料におけるATRの変化、例えば、乳房腫瘍試料におけるATR両アレル不活性化を
含む。他の実施形態では、サブゲノム間隔は、腫瘍試料におけるMYCの変化、例えば、
乳房腫瘍試料におけるMYC両アレル不活性化を含む。
【0072】
これらならびに他の組および群のサブゲノム間隔は、本明細書の他の箇所で、例えば、
表題「遺伝子選択モジュール」の項でさらに詳細に論じられる。
【0073】
本明細書に記載の方法のうちのいずれかを、以下の実施形態のうちの1つ以上と組み合
わせることができる。
【0074】
他の実施形態では、試料は腫瘍試料であり、例えば、1つ以上の前悪性または悪性細胞
を含む。ある特定の実施形態において、試料、例えば、腫瘍試料は、固形腫瘍、軟組織腫
瘍、または転移病巣から取得される。他の実施形態では、試料、例えば、腫瘍試料は、切
除縁由来の組織または細胞を含む。試料は、組織学的に正常な組織であり得る。別の実施
形態では、試料、例えば、腫瘍試料は、1つ以上の循環腫瘍細胞(CTC)(例えば、血
液試料から取得されたCTC)を含む。
【0075】
一実施形態において、方法は、試料、例えば、本明細書に記載の腫瘍試料を取得するこ
とをさらに含む。試料を直接的にまたは間接的に取得することができる。
【0076】
他の実施形態では、方法は、例えば、切除縁由来の試料、例えば、組織学的に正常な試
料を、本明細書に記載の方法を用いて評価することを含む。出願者は、組織学的に正常な
組織(例えば、さもなければ組織学的に正常な組織縁)から得られた試料が依然として本
明細書に記載の変化を有し得ることを発見した。したがって、方法は、検出された変化の
存在に基づいて組織試料を再分類することをさらに含み得る。
【0077】
別の実施形態では、取得または分析される読み取りの少なくとも10、20、30、4
0、50、60、70、80、もしくは90%が、本明細書に記載の遺伝子、例えば、表
1~1Aの遺伝子、または表1の優先順位が1の遺伝子由来のサブゲノム間隔に対するも
のである。
【0078】
ある実施形態において、この方法で行われる変異呼び出しの少なくとも10、20、3
0、40、50、60、70、80、もしくは90%が、本明細書に記載の遺伝子、例え
ば、表1~1Aの遺伝子、または表1の優先順位が1の遺伝子由来のサブゲノム間隔に対
するものである。
【0079】
ある実施形態において、この方法で使用される一意の閾値の少なくとも10、20、3
0、40、50、60、70、80、もしくは90%が、本明細書に記載の遺伝子、例え
ば、表1~1Aの遺伝子、または表1の優先順位が1の遺伝子由来のサブゲノム間隔に対
するものである。
【0080】
ある実施形態において、アノテートされるか、または第三者に報告される変異呼び出し
の少なくとも10、20、30、40、50、60、70、80、もしくは90%が、本
明細書に記載の遺伝子、例えば、表1~1Aの遺伝子、または表1の優先順位が1の遺伝
子由来のサブゲノム間隔に対するものである。
【0081】
ある実施形態において、方法は、腫瘍および/または対照核酸試料(例えば、FFPE
由来の核酸試料)から得られるヌクレオチド配列読み取りを取得することを含む。
【0082】
ある実施形態において、読み取りは、NGS配列決定方法によって提供される。
【0083】
ある実施形態において、方法は、核酸メンバーのライブラリを提供すること、および該
ライブラリの複数のメンバーからの事前選択されたサブゲノム間隔を配列決定することを
含む。実施形態において、方法は、配列決定のために該ライブラリのサブセットを選択す
るステップ、例えば、溶液ベースの選択または固体支持体(例えば、アレイ)ベースの選
択を含み得る。
【0084】
ある実施形態において、方法は、ライブラリを複数のベイトと接触させて、核酸の選択
されたサブグループ、例えば、ライブラリ捕獲物を提供するステップを含む。一実施形態
において、接触させるステップは、溶液ハイブリダイゼーションにおいて達成される。別
の実施形態では、接触させるステップは、固体支持体、例えば、アレイにおいて達成され
る。ある特定の実施形態において、方法は、1つ以上のさらなるラウンドのハイブリダイ
ゼーションによってハイブリダイゼーションステップを繰り返すことを含む。いくつかの
実施形態では、方法は、ライブラリ捕獲物を同一または異なる群のベイトを用いて1つ以
上のさらなるラウンドのハイブリダイゼーションに供することをさらに含む。
【0085】
さらに他の実施形態では、方法は、ライブラリ捕獲物を分析することをさらに含む。一
実施形態において、ライブラリ捕獲物は、配列決定方法、例えば、本明細書に記載の次世
代配列決定方法によって分析される。方法は、例えば、溶液ハイブリダイゼーションによ
ってライブラリ捕獲物を単離すること、および核酸配列決定によってライブラリ捕獲物を
供することを含む。ある特定の実施形態において、ライブラリ捕獲物を再配列決定するこ
とができる。次世代配列決定方法は当技術分野で既知であり、例えば、Metzker,
M.(2010)Nature Biotechnology Reviews 11:
31-46に記載されている。
【0086】
ある実施形態において、ヌクレオチド位置に対して割り当てられた値は、任意で、説明
的アノテーションを伴って、第三者に送信される。
【0087】
ある実施形態において、ヌクレオチド位置に対して割り当てられた値は、第三者に送信
されない。
【0088】
ある実施形態において、複数のヌクレオチド位置に対して割り当てられた値は、任意で
、説明的アノテーションを伴って、第三者に送信され、第2の複数のヌクレオチド位置に
対して割り当てられた値は、第三者に送信されない。
【0089】
ある実施形態において、少なくとも0.01、0.02、0.03、0.05、0.1
、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、15、
または30メガベースの塩基、例えば、ゲノム塩基が配列決定される。
【0090】
ある実施形態において、方法は、少なくとも1つのSNPを含む複数の読み取りを評価
することを含む。
【0091】
ある実施形態において、方法は、試料および/または対照読み取りにおけるSNPと対
立遺伝子の比率を決定することを含む。
【0092】
ある実施形態において、方法は、例えば、バーコードデコンボリューションによって、
1つ以上の読み取りを対象に割り当てることを含む。
【0093】
ある実施形態において、方法は、例えば、バーコードデコンボリューションによって、
1つ以上の読み取りを腫瘍読み取りまたは対照読み取りとして割り当てることを含む。
【0094】
ある実施形態において、方法は、例えば、参照配列とのアライメントによって、該1つ
以上の読み取りのそれぞれをマッピングすることを含む。
【0095】
ある実施形態において、方法は、呼び出された変異をメモリアライズすることを含む。
【0096】
ある実施形態において、方法は、呼び出された変異をアノテートする、例えば、呼び出
された変異を、変異構造、例えば、ミスセンス変異、または関数、例えば、疾患表現型の
指標を用いてアノテートすることを含む。
【0097】
ある実施形態において、方法は、腫瘍および対照核酸についてのヌクレオチド配列読み
取りを取得することを含む。
【0098】
ある実施形態において、方法は、例えば、ベイズ呼び出し方法または非ベイズ呼び出し
方法を用いて、X個のサブゲノム間隔のそれぞれのヌクレオチド値、例えば、バリアント
、例えば、変異を呼び出すことを含む。
【0099】
ある実施形態において、例えば、異なる対象由来の複数の試料が、同時に処理される。
【0100】
本明細書に開示の方法を用いて、対象のゲノムまたはトランスクリプトームに存在する
変化を検出することができ、DNAおよびRNAの配列決定、例えば、標的化されたRN
Aおよび/またはDNAの配列決定に適用することができる。したがって、本発明で特色
とされる別の態様は、本明細書に記載の変化を検出するために、標的化されたRNAを配
列決定する、例えば、試料、例えば、FFPE試料から取得されたRNA由来のcDNA
を配列決定する方法を含む。変化は、再編成、例えば、遺伝子融合物をコードする再編成
であり得る。他の実施形態では、方法は、遺伝子または遺伝子産物のレベルの変化(例え
ば、増加または減少)、例えば、本明細書に記載の遺伝子または遺伝子産物の発現の変化
の検出を含む。方法は、任意で、標的RNAの試料を濃縮するステップを含んでもよい。
他の実施形態では、方法は、ある特定の多量のRNA、例えば、リボソームまたはグロビ
ンRNAの試料を枯渇させるステップを含む。RNA配列決定方法を、単独で、または本
明細書に記載のDNA配列決定方法と組み合わせて用いることができる。一実施形態にお
いて、方法は、DNA配列決定ステップおよびRNA配列決定ステップを行うことを含む
。方法を任意の順序で行うことができる。例えば、方法は、RNA配列決定によって本明
細書に記載の変化の発現を確認すること、例えば、本発明のDNA配列決定方法によって
検出される異または融合の発現を確認することを含み得る。他の実施形態では、方法は、
RNA配列決定ステップ、その後、DNA配列決定ステップを行うことを含む。
【0101】
別の態様では、本発明は、標的とされるサブゲノム領域に対する配列決定/アライメン
トのアーチファクトのデータベースを構築することを含む方法を特色とする。実施形態に
おいて、データベースを用いて、誤った変異呼び出しを除外し、特異性を改善することが
できる。ある実施形態において、データベースは、非関連の非腫瘍(例えば、FFPE)
試料または細胞株を配列決定し、これらの正常な試料のうちの1つ以上において、無作為
な配列決定エラーのみに起因して予想されるより頻繁に出現する非参照対立遺伝子イベン
トを記録することによって構築される。この手法は、生殖細胞系バリエーションをアーチ
ファクトに分類し得るが、体細胞変異に関係した方法においては許容される。この生殖細
胞系バリエーションをアーチファクトとして誤分類することを、所望の場合、既知の生殖
細胞系バリエーション(一般的なバリアントを除去)および1人の個人にのみ出現するア
ーチファクト(より稀有なバリエーションを除去)に関するこのデータベースにフィルタ
をかけることによって改善することができる。
【0102】
本明細書に開示の方法は、例えば、癌に関連したゲノムの断片に適用されるとき、最適
化されたベイトベースの選択、最適化されたアライメント、および最適化された変異呼び
出しを含むいくつかの最適化要素の統合を可能にする。本明細書に記載の方法は、癌ごと
に、遺伝子ごとに、かつ部位ごとに最適化され得る腫瘍のNGSに基づく分析を提供する
。これを、例えば、本明細書に記載の遺伝子/部位および腫瘍型に適用することができる
。方法は、所与の配列決定技術を用いて変異検出への感度および特異性レベルを最適化す
る。癌ごと、遺伝子ごと、および部位ごとの最適化は、臨床産物にとって不可欠な非常に
高いレベルの感度/特異性(例えば、両方ともに99%を超える)を提供する。
【0103】
本明細書に記載の方法は、最適な治療法および疾患管理の決定を通知するために、次世
代配列決定技術を用いて、日常的な実在の試料由来の包括的な組の妥当な程度に行動でき
る遺伝子(典型的には、50~500個の範囲の遺伝子であり得る)のゲノム異常の臨床
および規制グレードの包括的分析ならびに解釈を提供する。
【0104】
本明細書に記載の方法は、最適な治療および疾患管理決定を通知するために腫瘍試料を
送り、かつその腫瘍についてのゲノムおよび他の分子変化の包括的分析および記述を受け
るワンストップショッピングを癌専門医/病理学者に提供する。
【0105】
本明細書に記載の方法は、標準の利用可能な腫瘍試料を取り込み、一試験において、癌
専門医に包括的記述を提供するために、どのような異常が腫瘍を推進し得、かつ癌専門医
に治療法の決定を通知するのに有用であり得るかの包括的ゲノムおよび他の分子異常分析
を提供する、実環境での強固な臨床癌診断ツールを提供する。
【0106】
本明細書に記載の方法は、臨床グレードの品質の患者の癌ゲノムの包括的分析を提供す
る。方法は、最も関連性のある遺伝子および可能性のある変化を含み、変異、コピー数、
再編成、例えば、転座、発現、およびエピジェネティックマーカーの分析のうちの1つ以
上を含む。遺伝分析の出力を、実用的な結果の記述的な報告書で文脈化することができる
。方法は、使用を最新の一連の関連性のある科学および医学知識と結びつける。
【0107】
本明細書に記載の方法は、治療の質と効率の両方の向上を提供する。これは、腫瘍が希
有であるか、またはよく研究されていない種類のものであり、したがって、標準的治療が
存在しないか、あるいは患者が確立された一連の治療に効果を示さず、さらなる治療法の
選択または臨床試験参加の合理的根拠が有用であり得る場合の、適用を含む。例えば、方
法は、治療の任意の時点で、意思決定を通知するために利用可能なすべての「分子像」お
よび/または「分子副診断」を有することによって癌専門医が恩恵を受ける、選択を可能
にする。
【0108】
本明細書に記載の方法は、例えば、電子形態、ウェブベース形態、または書面形態で、
患者または別の人物もしくは事業体、例えば、介護人、例えば、医師、例えば、癌専門医
、病院、診療所、第三者支払人、保険会社、もしくは官庁に報告書を提供することを含み
得る。報告書は、例えば、試料の腫瘍型に関連したサブゲノム間隔についての方法からの
出力、例えば、ヌクレオチド値の同定、変化、変異、または野生型配列の存在もしくは不
在の指標を含み得る。報告書は、疾患における配列、例えば、変化、変異、または野生型
配列の役割に関する情報も含み得る。そのような情報は、予後、抵抗、あるいは見込みが
あるか、または推奨される治療選択肢に関する情報を含み得る。報告書は、治療選択肢の
予期される有効性、治療選択肢の容認度、または治療選択肢を患者、例えば、試験で同定
され、かつ実施形態において、報告書で同定された配列、変化、または変異を有する患者
に適用する推奨度に関する情報を含み得る。例えば、報告書は、患者への薬物の投与、例
えば、事前選択された投与量もしくは事前選択された治療レジメンでの投与、例えば、他
の薬物と組み合わせた投与に関する情報、または提言を含み得る。ある実施形態において
、この方法において同定されるすべての変異が報告書で特定されるわけではない。例えば
、報告書は、例えば、事前選択された治療選択肢を用いた治療に対して、癌の発生、予後
、病期、または感受性との事前選択されたレベルの相関関係がある遺伝子における変異に
限定され得る。本明細書の特色とされる方法は、方法を実践する実在者が試料を受容して
から7、14、または21日以内に、例えば、本明細書に記載の実在者に報告書を送達す
ることを可能にする。
【0109】
したがって、本発明で取り上げられる方法は、迅速なターンアラウンドタイム(例えば
、試料の受容から7、14、または21日以内)を可能にする。
【0110】
本明細書に記載の方法を用いて、組織学的に正常な試料、例えば、切除縁由来の試料を
評価することもできる。本明細書に記載の1つ以上の変化が検出される場合、組織を、例
えば、悪性組織または前悪性組織に再分類することができ、かつ/または治療過程を修正
することができる。
【0111】
ある特定の態様において、本明細書に記載の配列決定方法は、非癌応用、例えば、法医
学的応用(例えば、歯科記録の使用の代替案として、またはそれに加えての特定)、実父
確定検査、ならびに例えば、とりわけ、嚢胞性線維症、ハンチントン病、アルツハイマー
病の疾患診断および予後において有用である。例えば、本明細書に記載の方法による遺伝
子変化の同定は、特定の障害の存在または個人が特定の障害を発症する危険性を示し得る
。
【0112】
別途定義されない限り、本明細書で使用されるすべての技術用語および科学用語は、本
発明が属する当業者によって一般に理解される意味と同一の意味を有する。それらの本明
細書に記載のものと同様または同等の方法および材料を本発明の実践または試験で使用す
ることができるが、好適な方法および材料が以下に記載される。本明細書で言及されるす
べての出版物、特許出願、特許、および他の参考文献は、参照によりそれらの全体が組み
込まれる。加えて、材料、方法、および実施例は、例示目的のみであり、限定することを
意図しない。
【0113】
本発明の他の特徴および利点は、発明を実施するための形態、図面、および特許請求の
範囲から明らかとなる。
【図面の簡単な説明】
【0114】
最初に図面を説明する。
【
図1A】A~Fは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。
【
図1B】A~Fは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。
【
図1C】A~Fは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。
【
図1D】A~Fは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。
【
図1E】A~Fは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。
【
図1F】A~Fは腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写である。
【
図2】先行予想および読み取り深度の変異検出への影響を示す。
【
図3】100個を超える臨床癌試料における変異頻度を示す。
【
図4】対象範囲ヒストグラムの線形表示である。標的の数(y軸)が、対象範囲の関数(x軸)として示される。線1は、個別に合成されたビオチン化DNAオリゴヌクレオチドベイトでスパイクされたアレイ由来のビオチン化RNAオリゴヌクレオチドベイトを含むベイトセット(本明細書で「ベイトセット1」と称される)を用いた対象範囲を表す。線2は、ビオチン化されたアレイ由来のRNAオリゴヌクレオチドベイトのみ(本明細書で「ベイトセット2」と称される)を含むベイトセットを用いて得られた対象範囲を表す。ベイトセット2を用いた全体の平均対象範囲が924であった一方で、ベイトセット2を用いた高GC含量の領域(約68%)における対象範囲は73であった。対照的に、ベイトセット1を用いたとき、全体の対象範囲は約918であったが、高GC含量の領域における対象範囲は183に改善された。
【
図5】アレイ由来のビオチン化RNAオリゴヌクレオチドベイトのみを含むベイトセット(「ベイトセット3」)と比較した、個別に合成されたビオチン化DNAオリゴヌクレオチドベイトのみからなるベイトセット(ベイトセット1)および個別に合成されたビオチン化DNAオリゴヌクレオチドベイト(「ベイトセット2」)でスパイクされたアレイ由来のビオチン化RNAオリゴヌクレオチドベイトを含むベイトセットを用いて検出された対象範囲の均一性を比較する対象範囲ヒストグラムである。ベイトセットは、
図5で1、2、および3として示される。
図5に示されるように、対象範囲におけるいくつかのギャップがベイトセット3を用いたときに検出されたが、ベイトセット1~2を用いたときは検出されなかった。
【発明を実施するための形態】
【0115】
選択された群の遺伝子および遺伝子産物を評価することによる、1つ以上の対象由来の
試料、例えば、腫瘍試料由来の多数の遺伝子および遺伝子産物を配列決定するための最適
化方法およびアッセイが開示される。一実施形態において、本発明で取り上げられる方法
およびアッセイは、マルチプレックスアッセイ形式で、例えば、多数の様々な遺伝的事象
からの複数のシグナルを多数の遺伝子に組み込んだアッセイにおいて使用される。癌表現
型(例えば、癌の危険性、癌進行、癌治療、または治療に対する抵抗のうちの1つ以上)
に(例えば、正もしくは負に)関連した選択された群の遺伝子または遺伝子産物に少なく
ともある程度基づく方法およびアッセイが本明細書に開示される。そのような事前選択さ
れた遺伝子または遺伝子産物は、配列決定方法、具体的には、例えば、腫瘍または対照試
料由来の多数の様々な遺伝子の大規模並列配列決定に依存する方法の適用を可能にする。
【0116】
ある特定の用語が最初に定義される。さらなる用語が本明細書を通して定義される。
【0117】
本明細書で使用される「a」および「an」という冠詞は、冠詞の文法上の目的語の1
つまたは2つ以上(例えば、少なくとも1つ)を指す。
【0118】
「約(about)」および「約(approxyimately)」は、概して、測
定の本質または精度を考慮して測定される量に対する誤差の許容できる程度を意味する。
例となる誤差の程度は、所与の値または値の範囲の20パーセント(%)以内、典型的に
は、10%以内、より典型的には、5%以内である。
【0119】
「取得する」または「取得すること」という用語が本明細書で使用されるとき、物理的
実体または値、例えば、数値を、物理的実体または値を「直接的に取得する」か、または
「間接的に取得する」ことによって、入手することを指す。「直接的に取得する」とは、
プロセスを行って(例えば、合成または分析方法を行って)物理的実体または値を得るこ
とを意味する。「間接的に取得する」とは、物理的実体または値を別の団体またはソース
(例えば、物理的実体または値を直接的に取得した第三者研究所)から受け取ることを指
す。物理的実体を直接的に取得することは、物理的物質、例えば、出発原料の物理的変化
を含むプロセスを行うことを含む。例となる変化は、物理的実体を2つ以上の出発原料か
ら作製すること、物質を剪断または断片化すること、物質を分離または精製すること、2
つ以上の別個の実体を混合物中に合わせること、共有もしくは非共有結合の破壊または形
成を含む化学反応を行うことを含む。値を直接的に取得することは、試料または別の物質
の物理的変化を含むプロセスを行うこと、例えば、物質、例えば、試料、検体、または試
薬の物理的変化を含む分析プロセスを行うこと(本明細書で「物理的分析」と称される場
合もある)、分析方法、例えば、物質、例えば、検体、またはその断片もしくは他の誘導
体を別の物質から分離または精製すること、検体、またはその断片もしくは他の誘導体を
、別の物質、例えば、緩衝液、溶媒、または反応物と合わせること、あるいは例えば、検
体の第1の原子と第2の原子との間の共有もしくは非共有結合を破壊または形成すること
によって、検体、またはその断片もしくは他の誘導体の構造を変化させること、あるいは
例えば、試薬の第1の原子と第2の原子との間の共有または非共有結合を破壊または形成
することによって、試薬、またはその断片もしくは他の誘導体の構造を変化させることの
うちの1つ以上を含む方法を行うことを含む。
【0120】
「配列を取得する」または「読み取りを取得する」という用語が本明細書で使用される
とき、配列または読み取りを「直接的に取得する」か、または「間接的に取得する」こと
によって、ヌクレオチド配列またはアミノ酸配列を入手することを指す。配列または読み
取りを「直接的に取得する」とは、プロセスを行って(例えば、合成または分析方法を行
って)、例えば、配列決定方法(例えば、次世代配列決定(NGS)方法)を行って、配
列を得ることを意味する。配列または読み取りを「間接的に取得する」ことは、別の団体
またはソース(例えば、配列を直接的に取得した第三者研究所)から配列の情報または知
識を受け取ること、あるいは配列を受け取ることを指す。取得した配列または読み取りは
、完全な配列である必要はなく、例えば、少なくとも1つのヌクレオチドを配列決定する
か、または対象に存在する本明細書に開示の変化のうちの1つ以上を特定する情報もしく
は知識を得ることが、配列を取得することの本質をなす。
【0121】
配列または読み取りを直接的に取得することは、物理的物質、例えば、組織もしくは細
胞試料、例えば、生検、または単離された核酸(例えば、DNAもしくはRNA)試料等
の出発原料の物理的変化を含むプロセスを行うことを含む。例となる変化は、物理的実体
を2つ以上の出発原料から作製すること、ゲノムDNA断片等の物質を剪断または断片化
すること、物質を分離または精製すること(例えば、核酸試料を組織から単離すること)
、2つ以上の別個の実体を混合物中に合わせること、共有もしくは非共有結合の破壊また
形成を含む化学反応を行うことを含む。値を直接的に取得することは、上述の試料または
別の物質の物理的変化を含むプロセスを行うことを含む。
【0122】
「試料を取得する」という用語が本明細書で使用されるとき、試料を「直接的に取得す
る」か、または「間接的に取得する」ことによって、試料、例えば、組織試料または核酸
試料を入手することを指す。「試料を直接的に取得する」とは、プロセスを行って(例え
ば、手術または摘出等の物理的方法を行って)試料を得ることを意味する。「試料を間接
的に取得する」とは、試料を別の団体またはソース(例えば、試料を直接的に取得した第
三者研究所)から受け取ることを指す。試料を直接的に取得することは、物理的物質、例
えば、出発原料、例えば、ヒト患者の組織または患者から以前に単離された組織等の組織
の物理的変化を含むプロセスを行うことを含む。例となる変化は、物理的実体を出発原料
から作製すること、組織を解剖または解体すること、物質(例えば、試料組織もしくは核
酸試料)を分離または精製すること、2つ以上の別個の実体を混合物中に合わせること、
共有もしくは非共有結合の破壊または形成を含む化学反応を行うことを含む。試料を直接
的に取得することは、例えば、上述の試料または別の物質の物理的変化を含むプロセスを
行うことを含む。
【0123】
本明細書で使用される「アライメントセレクタ」、は、アライメント方法の選択を可能
にするか、または指向するパラメータ、例えば、事前選択されたサブゲノム間隔の配列決
定を最適化することができるアライメントアルゴリズムまたはパラメータを指す。アライ
メントセレクタは、例えば、以下のうちの1つ以上の関数に特異的であり得るか、または
その関数として選択され得る:
1.該サブゲノム間隔についての読み取りの誤アライメント傾向に関連した配列コンテキ
スト、例えば、サブゲノム間隔(例えば、評価される事前選択されたヌクレオチド位置)
の配列コンテキスト。例えば、ゲノムの他の場所で繰り返される評価されるサブゲノム間
隔における配列要素、またはその付近での配列要素の存在が、誤アライメントを引き起こ
し、それによって、性能を低下させ得る。誤アライメントを最小化するアルゴリズムまた
はアルゴリズムパラメータを選択することによって、性能を強化することができる。この
場合において、アライメントセレクタの値は、配列コンテキスト、例えば、ゲノム(また
は分析されるゲノムの一部)で少なくとも事前選択された回数繰り返される事前選択され
た長さの配列の存在または不在の関数であり得る。
2.分析される腫瘍型。例えば、特定の腫瘍型は、欠失速度の増加を特徴とし得る。した
がって、インデルにより敏感なアルゴリズムまたはアルゴリズムパラメータを選択するこ
とによって、性能を強化することができる。この場合において、アライメントセレクタの
値は、腫瘍型の関数、例えば、腫瘍型の識別子であり得る。ある実施形態において、値は
、腫瘍型、例えば、乳癌の識別である。
3.分析される遺伝子または遺伝子型、例えば、ある遺伝子または遺伝子型を分析するこ
とができる。癌遺伝子は、例として、多くの場合、置換またはインフレームインデルを特
徴とする。したがって、これらのバリアントに特に敏感であり、かつ他のバリアントに対
して特異的なアルゴリズムまたはアルゴリズムパラメータを選択することによって、性能
を強化することができる。腫瘍抑制遺伝子は、多くの場合、フレームシフトインデルを特
徴とする。したがって、これらのバリアントに特に敏感なアルゴリズムまたはアルゴリズ
ムパラメータを選択することによって、性能を強化することができる。したがって、サブ
ゲノム間隔と適合するアルゴリズムまたはアルゴリズムパラメータを選択することによっ
て、性能を強化することができる。この場合において、アライメントセレクタの値は、遺
伝子または遺伝子型の関数、例えば、遺伝子または遺伝子型の識別子であり得る。ある実
施形態において、値は、遺伝子の識別である。
4.分析される部位(例えば、ヌクレオチド位置)。この場合において、アライメントセ
レクタの値は、部位または部位型の関数、例えば、部位または部位型の識別子であり得る
。ある実施形態において、値は、部位の識別である(例えば、その部位を含有する遺伝子
が別の遺伝子と高度に相同する場合、標準/高速の短い読み取りアライメントアルゴリズ
ム(例えば、BWA)は、2つの遺伝子を見分けるのが困難である場合があり、より集約
的なアライメント方法(Smith-Waterman)またはさらにはアセンブリ(A
RACHNE)を必要とする可能性がある。)同様に、遺伝子配列が複雑度の低い領域(
例えば、AAAAAA)を含有する場合、より集約的なアライメント方法が必要であり得
る。
5.評価されるサブゲノム間隔に関連したバリアントまたはバリアント型。例えば、置換
、挿入、欠失、転座、または他の再編成。したがって、特定のバリアント型により敏感な
アルゴリズムまたはアルゴリズムパラメータを選択することによって、性能を強化するこ
とができる。この場合において、アライメントセレクタの値は、バリアント型の関数、例
えば、バリアント型の識別子であり得る。ある実施形態において、値は、バリアント型、
例えば、置換の識別である。
6.試料の種類、FFPE、または他の固定試料。試料型/品質は、エラー(非参照配列
の誤った観察)速度に影響を及ぼし得る。したがって、試料における真のエラー率を正確
にモデル化するアルゴリズムまたはアルゴリズムパラメータを選択することによって、性
能を強化することができる。この場合において、アライメントセレクタの値は、試料の種
類の関数、例えば、試料の種類の識別子であり得る。ある実施形態において、値は、試料
の種類、例えば、固定試料の識別である。
【0124】
本明細書で使用される遺伝子もしくは遺伝子産物(例えば、マーカー遺伝子もしくは遺
伝子産物)の「変化」または「変化した構造」は、遺伝子もしくは遺伝子産物内における
1つの変異もしくは複数の変異の存在、例えば、正常な遺伝子または野生型遺伝子と比較
して、遺伝子もしくは遺伝子産物の量または活性に影響を及ぼす変異を指す。変化は、癌
組織または癌細胞における量、構造、および/または活性の、正常もしくは健常組織また
は細胞(例えば、対照)におけるその量、構造、および/または活性と比較した変化であ
り得、癌等の病状に関連する。例えば、癌に関連した変化、または抗癌治療に対する応答
性を予測する変化は、正常かつ健康な組織または細胞と比較して、1つの癌組織または複
数の癌細胞におけるヌクレオチド配列(例えば、変異)、アミノ酸配列、染色体転座、染
色体内逆位、コピー数、発現レベル、タンパク質レベル、タンパク質活性、またはメチル
化状態の変化を有し得る。例となる変異には、点変異(例えば、サイレント、ミスセンス
、またはナンセンス)、欠失、挿入、逆位、連鎖変異、重複、転座、染色体外再編成、お
よび染色体内再編成が含まれるが、これらに限定されない。変異は、遺伝子のコード領域
または非コード領域に存在し得る。ある特定の実施形態において、変化(複数を含む)は
、再編成、例えば、その1つ以上のイントロンまたは断片を含むゲノム再編成(例えば、
5’および/または3’-UTRにおける1つ以上の再編成)として検出される。ある特
定の実施形態において、変化は、表現型、例えば、癌表現型(例えば、癌の危険性、癌進
行、癌治療、または癌治療に対する抵抗のうちの1つ以上)に関連する(か、または関連
しない)。一実施形態において、変化は、癌の遺伝的危険因子、正の治療応答予測因子、
負の治療応答予測因子、正の予後因子、負の予後因子、または診断因子のうちの1つ以上
に関連する。
【0125】
本明細書で使用される「ベイト」は、一種のハイブリッド捕捉試薬である。ベイトは、
標的核酸にハイブリダイズし(例えば、標的核酸に相補的である)、それによって、標的
核酸の捕捉を可能にする核酸分子、例えば、DNA分子またはRNA分子であり得る。一
実施形態において、ベイトは、RNA分子(例えば、自然発生のRNA分子もしくは修飾
されたRNA分子)、DNA分子(例えば、自然発生のDNA分子もしくは修飾されたD
NA分子)、またはそれらの組み合わせである。他の実施形態では、ベイトは、例えば、
結合実体に結合することによって、結合実体、例えば、ベイトによって形成されたハイブ
リッドおよびベイトにハイブリダイズした核酸の捕捉および分離を可能にする親和性タグ
を含む。一実施形態において、ベイトは、溶液相ハイブリダイゼーションに好適である。
【0126】
本明細書で使用される「ベイトセット」は、1つまたは複数のベイト分子を指す。
【0127】
「結合実体」とは、検体に特異的に結合することができる、分子タグが直接的または間
接的に結合し得る任意の分子を意味する。結合実体は、それぞれのベイト配列上の親和性
タグであり得る。ある特定の実施形態において、結合実体は、アビジン分子等のパートナ
ー、またはハプテンもしくはその抗原結合断片に結合する抗体に結合することによって、
ハイブリダイゼーション混合物からのベイト/メンバーハイブリッドの分離を可能にする
。例となる結合実体には、ビオチン分子、ハプテン、抗体、抗体結合断片、ペプチド、お
よびタンパク質が含まれるが、これらに限定されない。
【0128】
「相補的」とは、2つの核酸鎖の領域間または同一の核酸鎖の2つの領域間の配列相補
性を指す。第1の核酸領域のアデニン残基は、残基がチミンまたはウラシルである場合、
第1の領域に逆平行な第2の核酸領域の残基と特定の水素結合を形成(「塩基対合」)で
きることが知られている。同様に、第1の核酸鎖のシトシン残基は、残基がグアニンであ
る場合、第1の鎖に逆平行な第2の核酸鎖の残基と塩基対合できることが知られている。
2つの領域が逆平行様式で配置されるとき、核酸の第1の領域は、第1の領域の少なくと
も1つのヌクレオチド残基が第2の領域の残基と塩基対合できる場合、同一または異なる
核酸の第2の領域に相補的である。ある特定の実施形態において、第1の領域が第1の部
分を含み、第2の領域が第2の部分を含み、それにより、第1および第2の部分が逆平行
様式で配置されるとき、第1の部分のヌクレオチド残基の少なくとも約50%、少なくと
も約75%、少なくとも約90%、または少なくとも約95%が、第2の部分のヌクレオ
チド残基で塩基対合できる。他の実施形態では、第1の部分のすべてのヌクレオチド残基
が、第2の部分のヌクレオチド残基と塩基対合することができる。
【0129】
「癌」または「腫瘍」という用語は、本明細書で同義に使用される。これらの用語は、
無制限増殖、不死、転移能、速い成長および増殖速度、ならびにある特定の特徴的な形態
学的特徴等の発癌性細胞の典型的な特性を有する細胞の存在を指す。癌細胞は、多くの場
合、腫瘍の形態であるが、そのような細胞は、動物内に単独で存在し得るか、または白血
病細胞等の非腫瘍原性癌細胞であり得る。これらの用語は、固形腫瘍、軟組織腫瘍、また
は転移病巣を含む。本明細書で使用される「癌」という用語は、前悪状態、ならびに悪性
癌を含む。
【0130】
本明細書で使用される「~の可能性が高い」または「可能性の増加」は、項目、目的物
、物体、または人が生じる確率の増加を指す。したがって、一例において、参照対象また
は対象群と比較して、治療に応答する可能性の高い対象は治療に応答する確率が増加する
。
【0131】
「~の可能性が低い」とは、参照に対して、事象、項目、目的物、物体、または人が生
じる確率の減少を指す。したがって、参照対象または対象群と比較して、治療に応答する
可能性の低い対象は治療に応答する確率が減少する。
【0132】
「対照メンバー」は、非腫瘍細胞由来の配列を有するメンバーを指す。
【0133】
本明細書で使用される「インデルアライメント配列セレクタ」は、事前選択されたイン
デルの場合、読み取りがアライメントされる配列の選択を可能にするか、または指向する
パラメータを指す。そのような配列を用いて、インデルを含む事前選択されたサブゲノム
間隔の配列決定を最適化することができる。インデルアライメント配列セレクタの値は、
事前選択されたインデルの関数、例えば、インデルの識別子である。ある実施形態におい
て、値は、インデルの識別である。
【0134】
本明細書で使用される「ライブラリ」という用語は、メンバーの収集物を指す。一実施
形態において、ライブラリは、核酸メンバーの収集物、例えば、全ゲノム、サブゲノム断
片、cDNA、cDNA断片、RNA、RNA断片、またはそれらの組み合わせの収集物
を含む。一実施形態において、ライブラリメンバーの一部またはすべては、アダプター配
列を含む。アダプター配列は、一方の末端または両方の末端に位置し得る。アダプター配
列は、例えば、増幅、逆転写、またはベクターへのクローニングのための配列決定方法(
例えば、NGS方法)に有用であり得る。
【0135】
ライブラリは、メンバーの収集物、例えば、標的メンバー(例えば、腫瘍メンバー、参
照メンバー、PGxメンバー、またはそれらの組み合わせ)を含み得る。ライブラリのメ
ンバーは、1人の個人由来であり得る。実施形態において、ライブラリは、1人を超える
対象(例えば、2、3、4、5、6、7、8、9、10、20、30人、またはそれ以上
の対象)由来のメンバーを含んでもよく、例えば、異なる対象由来の2つ以上のライブラ
リを、1人を超える対象由来のメンバーを有するライブラリと合わせることができる。一
実施形態において、対象は、癌もしくは腫瘍を有するか、またはそれを有する危険性のあ
るヒトである。
【0136】
「ライブラリ捕獲物」は、ライブラリのサブセット、例えば、事前選択されたサブゲノ
ム間隔に対して濃縮されたサブセット、例えば、事前選択されたベイトとのハイブリダイ
ゼーションによって捕捉された産物を指す。
【0137】
本明細書で使用される「メンバー」もしくは「ライブラリメンバー」または他の同様の
用語は、ライブラリのメンバーである核酸分子、例えば、DNA、RNA、またはそれら
の組み合わせを指す。典型的には、メンバーは、DNA分子、例えば、ゲノムDNAまた
はcDNAである。メンバーは、断片化された、例えば、剪断されたか、または酵素的に
調製されたゲノムDNAであり得る。メンバーは、対象由来の配列を含み、対象由来では
ない配列、例えば、アダプター配列、プライマー配列、または他の同定を可能にする配列
、例えば、「バーコード」配列も含み得る。
【0138】
本明細書で使用される「次世代配列決定またはNGSもしくはNG配列決定」は、ハイ
スループット様式で、(例えば、単一分子配列決定における)個別の核酸分子または個別
の核酸分子のクローン的に広がったプロキシのいずれかのヌクレオチド配列を決定する(
例えば、103、104、105より多いか、またはそれ以上の数の分子が同時に配列決
定される)任意の配列決定方法を指す。一実施形態において、配列決定実験によって生成
されるデータにおけるそれらの同族配列発生の相対数を計数することによって、ライブラ
リにおける核酸種の相対存在量を推定することができる。次世代配列決定方法は当技術分
野で既知であり、例えば、参照により本明細書に組み込まれるMetzker,M.(2
010)Nature Biotechnology Reviews 11:31-4
6に記載されている。次世代配列決定は、試料中の核酸の5%未満に存在するバリアント
を検出することができる。
【0139】
本明細書で言及される「ヌクレオチド値」は、事前選択されたヌクレオチド位置を占有
するか、またはそれに割り当てられるヌクレオチド(複数を含む)の識別を表す。典型的
なヌクレオチド値は、喪失(例えば、欠失)、付加(例えば、1つ以上のヌクレオチドの
挿入であり、その識別は含まれても含まれなくてもよい)、または存在(占有)、A、T
、C、もしくはGを含む。他の値は、例えば、Yでなくてもよく(Yは、A、T、G、も
しくはCである)、AもしくはX(Xは、T、G、もしくはCのうちの1つもしくは2つ
である)、TもしくはX(Xは、A、G、もしくはCのうちの1つもしくは2つである)
、GもしくはX(Xは、T、A、もしくはCのうちの1つもしくは2つである)、Cもし
くはX(Xは、T、G、もしくはAのうちの1つもしくは2つである)、ピリミジンヌク
レオチド、またはプリンヌクレオチドであり得る。ヌクレオチド値は、ヌクレオチド位置
における1個以上、例えば、2、3、もしくは4個の塩基の頻度(または本明細書に記載
の他の値、例えば、喪失または付加)であり得る。例えば、ヌクレオチド値は、ヌクレオ
チド位置におけるAの頻度およびGの頻度を含み得る。
【0140】
本明細書で使用される「または」は、文脈が別途明確に示さない限り、「および/また
は」という用語を意味し、それと同義に使用される。本明細書のいくつかの箇所での「お
よび/または」という用語の使用は、文脈が別途明確に示さない限り、「または」という
用語の使用が「および/または」という用語と同義ではないことを意味しない。
【0141】
「一次対照」は、腫瘍試料中のNAT組織以外の非腫瘍組織を指す。血液は、典型的な
一次対照である。
【0142】
本明細書で使用される「再編成アライメント配列セレクタ」は、事前選択された再編成
の場合に、読み取りがアライメントされる配列の選択を可能にするか、または指向するパ
ラメータを指す。そのような配列の使用が、再編成を含む事前選択されたサブゲノム間隔
の配列決定を最適化することができる。再編成アライメント配列セレクタの値は、事前選
択された再編成の関数、例えば、再編成の識別子である。ある実施形態において、値は、
再編成の識別である。「インデルアライメント配列セレクタ」(本明細書の他の箇所でも
定義される)は、再編成アライメント配列セレクタの一例である。
【0143】
「試料」、「組織試料」、「患者試料」、「患者細胞もしくは組織試料」、または「検
体」はそれぞれ、対象もしくは患者の組織または循環細胞から得られる同様の細胞の収集
物を指す。組織試料の供給源は、新鮮な、凍結し、かつ/もしくは保存された器官、組織
試料、生検、または吸引物;血液または任意の血液成分;脳脊髄液、羊水、腹水、もしく
は間質液等の体液;あるいは対象の妊娠または発達における任意の時点の細胞由来の固体
組織であり得る。組織試料は、防腐剤、抗凝固剤、緩衝液、固定剤、栄養剤、抗生物質等
の本質的に組織と自然混合されていない化合物を含有し得る。一実施形態において、試料
は、冷凍試料として、またはホルムアルデヒドもしくはパラホルムアルデヒド固定パラフ
ィン包埋(FFPE)組織調製物として保存される。例えば、試料を、マトリックス、例
えば、FFPEブロックまたは冷凍試料に埋め込むことができる。
【0144】
一実施形態において、試料は、腫瘍試料であり、例えば、1つ以上の前悪性または悪性
細胞を含む。ある特定の実施形態において、試料、例えば、腫瘍試料は、固形腫瘍、軟組
織腫瘍、または転移病巣から取得される。他の実施形態では、試料、例えば、腫瘍試料は
、切除縁由来の組織または細胞を含む。別の実施形態では、試料、例えば、腫瘍試料は、
1つ以上の循環腫瘍細胞(CTC)(例えば、血液試料から取得されたCTC)を含む。
【0145】
本明細書で使用される「感度」は、方法が配列の不均一集団において事前選択された配
列バリアントを検出することができる尺度である。方法は、事前選択された配列バリアン
トが試料中で配列の少なくともF%で存在する試料を考慮して、方法がC%の事前選択さ
れた信頼度(S%の確率)で事前選択された配列を検出することができる場合、F%のバ
リアントに対してS%の感度を有する。例として、方法は、事前選択されたバリアント配
列が試料中で配列の少なくとも5%で存在する試料を考慮して、方法が99%の事前選択
された信頼度(10中9)で事前選択された配列を検出することができる場合(F=5%
、C=99%、S=90%)、5%のバリアントに対して90%の感度を有する。例とな
る感度は、C=90%、95%、99%、および99.9%の信頼度レベルで、F=1%
、5%、10%、20%、50%、100%の配列バリアントに対して、S=90%、9
5%、99%の感度を含む。
【0146】
本明細書で使用される「特異性」は、方法が偽りなく生じる事前選択された配列バリア
ントを配列決定アーチファクトまたは他の密接に関連した配列から見分けることができる
尺度である。これは、誤検出を回避する能力である。誤検出は、試料調製中に目的とする
配列に導入されたエラー、配列決定エラー、または偽遺伝子もしくは遺伝子ファミリーの
メンバー等の密接に関連した配列の不注意による配列決定に起因し得る。方法は、XTr
ue個の配列が偽りのないバリアントであり、XNot trueが偽りのないバリアン
トではない、NTotal個の配列の試料セットに適用されるとき、方法が偽りのないバ
リアントではない配列の少なくともX%をバリアントではない配列として選択する場合、
X%の特異性を有する。例えば、方法は、500個が偽りなくバリアント配列であり、5
00個が偽りのないバリアント配列である、1,000個の配列の試料セットに適用され
るとき、方法が500個の偽りのないバリアントではない配列の90%をバリアントでは
ない配列としてを選択する場合、90%の特異性を有する。例となる特異性は、90、9
5、98、および99%を含む。
【0147】
本明細書で使用される「腫瘍核酸試料」は、腫瘍または癌試料由来の核酸分子を指す。
典型的には、それは、腫瘍もしくは癌試料由来のDNA、例えば、ゲノムDNA、または
RNA由来のcDNAである。ある特定の実施形態において、腫瘍核酸試料は、精製また
は単離される(例えば、その天然の状態から除去される)。
【0148】
本明細書で使用される「対照」または「参照」「核酸試料」は、対照または参照試料由
来の核酸分子を指す。典型的には、これは、遺伝子もしくは遺伝子産物の変化または変異
を含有しないDNA、例えば、ゲノムDNA、またはRNA由来のcDNAである。ある
特定の実施形態において、参照または対照核酸試料は、野生型または非変異配列である。
ある特定の実施形態において、参照核酸試料は、精製または単離される(例えば、その天
然の状態から除去される)。他の実施形態では、参照核酸試料は、同一または異なる対象
由来の非腫瘍試料、例えば、血液対照、正常な隣接腫瘍(NAT)、または任意の他の非
癌性試料に由来する。
【0149】
核酸分子の「配列決定」は、分子中の少なくとも1個のヌクレオチドの識別の決定を必
要とする。実施形態において、分子中のヌクレオチドのうちのすべてより少ない識別が決
定される。他の実施形態では、分子中のヌクレオチドのうちの大多数またはすべての識別
が決定される。
【0150】
本明細書で言及される「サブゲノム間隔」は、ゲノム配列の一部を指す。ある実施形態
において、サブゲノム間隔は、単一ヌクレオチド位置であり得、例えば、そのヌクレオチ
ド位置バリアントは、腫瘍表現型と(正または負に)関連する。ある実施形態において、
サブゲノム間隔は、1個を超えるヌクレオチド位置を含む。そのような実施形態は、少な
くとも2、5、10、50、100、150、または250長のヌクレオチド位置の配列
を含む。サブゲノム間隔は、全遺伝子、またはその事前選択された部分、例えば、コード
領域(もしくはその部分)、事前選択されたイントロン(もしくはその部分)、またはエ
クソン(もしくはその部分)を含み得る。サブゲノム間隔は、自然発生の、例えば、ゲノ
ムの核酸の断片のすべてまたは一部を含み得る。例えば、サブゲノム間隔は、配列決定反
応に供されるゲノムDNAの断片に相当し得る。実施形態において、サブゲノム間隔は、
ゲノムソース由来の連続配列である。実施形態において、サブゲノム間隔は、ゲノムにお
いて連続していない配列を含み、例えば、これは、cDNA中のエクソン-エクソン接合
部に見られる形成された接合部を含み得る。
【0151】
ある実施形態において、サブゲノム間隔は、単一ヌクレオチド位置;遺伝子内領域また
は遺伝子間領域;エクソンもしくはイントロン、またはその断片、典型的には、エクソン
配列またはその断片;コード領域もしくは非コード領域、例えば、プロモーター、エンハ
ンサー、5’非翻訳領域(5’UTR)、もしくは3’非翻訳領域(3’UTR)、また
はその断片;cDNAもしくはその断片;SNP;体細胞変異、生殖細胞変異、もしくは
それら両方;変化、例えば、点もしくは単一変異;欠失変異(例えば、インフレーム欠失
、遺伝子内欠失、全遺伝子欠失);挿入変異(例えば、遺伝子内挿入);逆位変異(例え
ば、染色体内逆位);連鎖変異;連鎖された挿入変異;逆位重複変異;タンデム重複(例
えば、染色体内タンデム重複);転座(例えば、染色体転座、非相反転座);再編成(例
えば、ゲノム再編成(例えば、1つ以上のイントロン、またはその断片の再編成;再編成
されたイントロンは、5’-および/もしくは3’-UTRを含み得る);遺伝子コピー
数の変化;遺伝子発現の変化;RNAレベルの変化;あるいはそれらの組み合わせを含む
か、またはそれらからなる。「遺伝子のコピー数」とは、特定の遺伝子産物をコードする
細胞におけるDNA配列の数を指す。概して、所与の遺伝子の場合、哺乳動物は、それぞ
れの遺伝子の2つのコピーを有する。コピー数は、例えば、遺伝子増幅もしくは重複によ
り増加し得るか、または欠失により減少し得る。
【0152】
本明細書で使用される「閾値」は、ヌクレオチド値をサブゲノム間隔に割り当てるため
に存在することが要求される読み取りの数の関数の値である。例えば、これは、サブゲノ
ム間隔においてそのヌクレオチド値をそのヌクレオチド位置に割り当てることが要求され
る、ヌクレオチド位置での特定のヌクレオチド値、例えば、Aを有する読み取りの数の関
数である。閾値を、例えば、読み取りの数(もしくはその関数)として、例えば、整数、
または事前選択された値を有する読み取りの割合として表すことができる。例として、閾
値がXであり、「A」のヌクレオチド値を有するX+1個の読み取りが存在する場合、「
A」の値は、サブゲノム間隔において事前選択された位置に割り当てられる。閾値を、変
異またはバリアント予想、変異頻度、またはベイズ先行の関数として表すことができる。
ある実施形態において、事前選択された変異頻度は、そのヌクレオチド値を呼び出すため
に、事前選択された位置でヌクレオチド値、例えば、AもしくはGを有する事前選択され
た数または割合の読み取りを必要とする。実施形態において、閾値は、変異予想、例えば
、変異頻度、および腫瘍型の関数であり得る。例えば、事前選択されたヌクレオチド位置
における事前選択されたバリアントは、患者が第1の腫瘍型を有する場合、第1の閾値を
有し得、患者が第2の腫瘍型を有する場合、第2の閾値を有し得る。
【0153】
本明細書で使用される「標的メンバー」は、核酸ライブラリから単離することが所望さ
れる核酸分子を指す。一実施形態において、標的メンバーは、本明細書に記載の腫瘍メン
バー、参照メンバー、対照メンバー、またはPGxメンバーであり得る。
【0154】
本明細書で使用される「腫瘍メンバー」、または他の同様の用語(例えば、「腫瘍また
は癌関連メンバー」)は、腫瘍細胞由来の配列を有するメンバーを指す。一実施形態にお
いて、腫瘍メンバーは、癌表現型に関連した変化(例えば、変異)を有する配列(例えば
、ヌクレオチド配列)を有するサブゲノム間隔を含む。他の実施形態では、腫瘍メンバー
は、野生型配列(例えば、野生型ヌクレオチド配列)を有するサブゲノム間隔を含む。例
えば、ヘテロ接合性またはホモ接合性野生型対立遺伝子由来のサブゲノム間隔は、癌細胞
に存在する。腫瘍メンバーには、参照メンバーまたはPGxメンバーが含まれ得る。
【0155】
本明細書で使用される「参照メンバー」または他の同様の用語(例えば、「対照メンバ
ー」)は、癌表現型に関連しない配列(例えば、ヌクレオチド配列)を有するサブゲノム
間隔を含むメンバーを指す。一実施形態において、参照メンバーは、変異が癌表現型に関
連する場合に、遺伝子もしくは遺伝子産物の野生型または非変異ヌクレオチド配列を含む
。参照メンバーは、癌細胞または非癌細胞に存在し得る。
【0156】
本明細書で使用される「PGxメンバー」または他の同様の用語は、遺伝子の薬理遺伝
学的または薬理ゲノム学的特性に関連したサブゲノム間隔を含むメンバーを指す。一実施
形態において、PGxメンバーは、SNP(例えば、本明細書に記載のSNP)を含む。
他の実施形態では、PGxメンバーは、表1または表2に従うサブゲノム間隔を含む。
【0157】
本明細書で使用される「バリアント」は、2個以上の構造を有し得るサブゲノム間隔で
存在し得る構造、例えば、多型遺伝子座における対立遺伝子を指す。
【0158】
例えば、(a)、(b)、(i)等の見出しは、単に本明細書および特許請求の範囲の
解釈を簡略化するために提示される。本明細書または特許請求の範囲における見出しの使
用は、ステップもしくは要素をアルファベット順もしくは番号順、またはそれらが提示さ
れる順序で行うことを必要としない。
遺伝子または遺伝子産物の選択
【0159】
選択された遺伝子または遺伝子産物(本明細書で「標的遺伝子または遺伝子産物」とも
称される)は、遺伝子内領域または遺伝子間領域を含むサブゲノム間隔を含み得る。例え
ば、サブゲノム間隔は、エクソンもしくはイントロン、またはその断片、典型的には、エ
クソン配列もしくはその断片を含み得る。サブゲノム間隔は、コード領域もしくは非コー
ド領域、例えば、プロモーター、エンハンサー、5’非翻訳領域(5’UTR)、または
3’非翻訳領域(3’UTR)、あるいはその断片を含み得る。他の実施形態では、サブ
ゲノム間隔は、cDNAまたはその断片を含む。他の実施形態では、サブゲノム間隔は、
SNP、例えば、本明細書に記載のSNPを含む。
【0160】
他の実施形態では、サブゲノム間隔、例えば、本明細書に記載のサブゲノム間隔のうち
の1つ以上は、ゲノム中の実質的にすべてのエクソン(例えば、目的とする選択された遺
伝子または遺伝子産物由来のエクソン(例えば、本明細書に記載の癌表現型に関連した遺
伝子または遺伝子産物))を含む。一実施形態において、サブゲノム間隔は、体細胞変異
、生殖細胞変異、またはこれら両方を含む。一実施形態において、サブゲノム間隔は、変
化、例えば、点変異もしくは単一変異、欠失変異(例えば、インフレーム欠失、遺伝子内
欠失、全遺伝子欠失)、挿入変異(例えば、遺伝子内挿入)、逆位変異(例えば、染色体
内逆位)、連鎖変異、連鎖された挿入変異、逆位重複変異、タンデム重複(例えば、染色
体内タンデム重複)、転座(例えば、染色体転座、非相反転座)、再編成、遺伝子コピー
数の変化、またはそれらの組み合わせを含む。ある特定の実施形態において、サブゲノム
間隔は、試料中の腫瘍細胞のゲノムのコード領域の5、1、0.5、0.1%、0.01
%、0.001%未満を構成する。他の実施形態では、サブゲノム間隔は、疾患に関与せ
ず、例えば、本明細書に記載の癌表現型に関連しない。
【0161】
一実施形態において、標的遺伝子または遺伝子産物は、バイオマーカーである。本明細
書で使用される「バイオマーカー」または「マーカー」は、変化することができる遺伝子
、mRNA、またはタンパク質であり、該変化は、癌に関連する。変化は、正常もしくは
健常な組織または細胞(例えば、対照)におけるその量、構造、および/または活性と比
較した、癌組織または癌細胞の量、構造、および/または活性の変化であり得、癌等の病
状に関連する。例えば、癌に関連したマーカー、または抗癌治療に対する応答性を予測す
るマーカーは、正常かつ健康な組織もしくは細胞と比較して、癌組織もしくは癌細胞にお
けるヌクレオチド配列、アミノ酸配列、染色体転座、染色体内逆位、コピー数、発現レベ
ル、タンパク質レベル、タンパク質活性、またはメチル化状態の変化を有し得る。さらに
、「マーカー」は、癌等の病状に関連した組織もしくは細胞に存在するときに、その構造
が変化する、例えば、変異する(変異を含有する)、例えば、ヌクレオチドまたはアミノ
酸レベルで野生型配列とは、例えば、置換、欠失、または挿入の分だけ異なる分子を含む
。
【0162】
一実施形態において、標的遺伝子または遺伝子産物は、単一ヌクレオチド多型(SNP
)を含む。別の実施形態では、遺伝子または遺伝子産物は、小さい欠失、例えば、小さい
遺伝子内欠失(例えば、インフレームまたはフレームシフト欠失)を有する。さらに別の
実施形態では、標的配列は、全遺伝子の欠失に起因する。さらに別の実施形態では、標的
配列は、小さい挿入、例えば、小さい遺伝子内挿入を有する。一実施形態において、標的
配列は、逆位、例えば、染色体内逆位に起因する。別の実施形態では、標的配列は、染色
体間転座に起因する。さらに別の実施形態では、標的配列は、タンデム重複を有する。一
実施形態において、標的配列は、望ましくない特徴(例えば、高GC含量または反復要素
)を有する。別の実施形態では、標的配列は、例えば、その反復性のため、それ自体うま
く標的化されることができないヌクレオチド配列の一部を有する。一実施形態において、
標的配列は、選択的スプライシングに起因する。別の実施形態では、標的配列は、表1、
1A、2、3、または4に従う遺伝子もしくは遺伝子産物、またはその断片から選択され
る。
【0163】
癌には、B細胞癌、例えば、多発性骨髄腫、黒色腫、乳癌、肺癌(非小細胞肺癌または
NSCLC等)、気管支癌、結腸直腸癌、前立腺癌、膵臓癌、胃癌(stomach c
ancer)、卵巣癌、膀胱癌(urinary bladder cancer)、脳
または中枢神経系の癌、末梢神経系の癌、食道癌、子宮頸癌、子宮または子宮内膜癌、口
腔または咽頭癌、肝臓癌、腎臓癌、睾丸癌、胆道癌、小腸または虫垂癌、唾液腺癌、甲状
腺癌、副腎癌、骨肉腫、軟骨肉腫、血液組織の癌、腺癌、炎症性筋線維芽腫瘍、消化管間
質腫瘍(GIST)、結腸癌、多発性骨髄腫(MM)、骨髄異形成症候群(MDS)、骨
髄増殖症候群(MPD)、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)
、慢性骨髄性白血病(CML)、慢性リンパ球性白血病(CLL)、真性赤血球増加症、
ホジキンリンパ腫、非ホジキンリンパ腫(NHL)、軟部組織肉腫、線維肉腫、粘液肉腫
、脂肪肉腫、骨肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ管内皮肉腫、
滑液腫瘍、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、扁平上皮癌、基底細胞癌
、腺癌、汗腺癌、脂腺癌、乳頭癌、乳頭腺癌、髄様癌、気管支癌、腎細胞癌、肝癌、胆管
癌、絨毛腫、セミノーマ、胎生期癌、ウィルムス腫瘍、膀胱癌(bladder car
cinoma)、上皮癌、神経膠腫、星状細胞腫、髄芽細胞腫、頭蓋咽頭腫、上衣細胞腫
、松果体腫、血管芽細胞腫、聴神経腫、乏突起膠腫、髄膜腫、神経芽細胞腫、網膜芽細胞
腫、濾胞性リンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、肝細胞
癌、甲状腺癌、胃癌(gastric cancer)、頭頸部癌、小細胞癌、本態性血
小板血症、原発性骨髄線維症、好酸球増加症候群、全身性肥満細胞症、家族性過好酸球増
加症、慢性好酸球性白血病、神経内分泌癌、カルチノイド腫瘍等が含まれるが、これらに
限定されない。
【0164】
一実施形態において、標的遺伝子もしくは遺伝子産物は、ABCB1、ABCC2、A
BCC4、ABCG2、ABL1、ABL2、AKT1、AKT2、AKT3、ALK、
APC、AR、ARAF、ARFRP1、ARID1A、ATM、ATR、AURKA、
AURKB、BCL2、BCL2A1、BCL2L1、BCL2L2、BCL6、BRA
F、BRCA1、BRCA2、C1orf144、CARD11、CBL、CCND1、
CCND2、CCND3、CCNE1、CDH1、CDH2、CDH20、CDH5、C
DK4、CDK6、CDK8、CDKN2A、CDKN2B、CDKN2C、CEBPA
、CHEK1、CHEK2、CRKL、CRLF2、CTNNB1、CYP1B1、CY
P2C19、CYP2C8、CYP2D6、CYP3A4、CYP3A5、DNMT3A
、DOT1L、DPYD、EGFR、EPHA3、EPHA5、EPHA6、EPHA7
、EPHB1、EPHB4、EPHB6、ERBB2、ERBB3、ERBB4、ERC
C2、ERG、ESR1、ESR2、ETV1、ETV4、ETV5、ETV6、EWS
R1、EZH2、FANCA、FBXW7、FCGR3A、FGFR1、FGFR2、F
GFR3、FGFR4、FLT1、FLT3、FLT4、FOXP4、GATA1、GN
A11、GNAQ、GNAS、GPR124、GSTP1、GUCY1A2、HOXA3
、HRAS、HSP90AA1、IDH1、IDH2、IGF1R、IGF2R、IKB
KE、IKZF1、INHBA、IRS2、ITPA、JAK1、JAK2、JAK3、
JUN、KDR、KIT、KRAS、LRP1B、LRP2、LTK、MAN1B1、M
AP2K1、MAP2K2、MAP2K4、MCL1、MDM2、MDM4、MEN1、
MET、MITF、MLH1、MLL、MPL、MRE11A、MSH2、MSH6、M
THFR、MTOR、MUTYH、MYC、MYCL1、MYCN、NF1、NF2、N
KX2-1、NOTCH1、NPM1、NQO1、NRAS、NRP2、NTRK1、N
TRK3、PAK3、PAX5、PDGFRA、PDGFRB、PIK3CA、PIK3
R1、PKHD1、PLCG1、PRKDC、PTCH1、PTEN、PTPN11、P
TPRD、RAF1、RARA、RB1、RET、RICTOR、RPTOR、RUNX
1、SLC19A1、SLC22A2、SLCO1B3、SMAD2、SMAD3、SM
AD4、SMARCA4、SMARCB1、SMO、SOD2、SOX10、SOX2、
SRC、STK11、SULT1A1、TBX22、TET2、TGFBR2、TMPR
SS2、TOP1、TP53、TPMT、TSC1、TSC2、TYMS、UGT1A1
、UMPS、USP9X、VHL、およびWT1からなる群から選択される全長のものま
たはそれらの断片から選択される。
【0165】
一実施形態において、標的遺伝子もしくは遺伝子産物、またはその断片は、薬理遺伝学
および薬理ゲノム学(PGx)、例えば、薬物代謝および毒性に関連する1つ以上のSN
Pを有する。例となる遺伝子または遺伝子産物には、ABCB1、ABCC2、ABCC
4、ABCG2、C1orf144、CYP1B1、CYP2C19、CYP2C8、C
YP2D6、CYP3A4、CYP3A5、DPYD、ERCC2、ESR2、FCGR
3A、GSTP1、ITPA、LRP2、MAN1B1、MTHFR、NQO1、NRP
2、SLC19A1、SLC22A2、SLCO1B3、SOD2、SULT1A1、T
PMT、TYMS、UGT1A1、およびUMPSが含まれるが、これらに限定されない
。
【0166】
別の実施形態では、標的遺伝子もしくは遺伝子産物、またはその断片は、癌に関連した
1つ以上のコドンを有する。例となる遺伝子または遺伝子産物には、ABL1(例えば、
コドン315)、AKT1、ALK、APC(例えば、コドン1114、1338、14
50、および1556)、AR、BRAF(例えば、コドン600)、CDKN2A、C
EBPA、CTNNB1(例えば、コドン32、33、34、37、41、および45)
、EGFR(例えば、719、746-750、768、790、858、および861
)、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FLT3(例えば、
コドン835)、HRAS(例えば、コドン12、13、および61)、JAK2(例え
ば、コドン617)、KIT(例えば、コドン816)、KRAS(例えば、コドン12
、13、および61)、MET、MLL、MYC、NF1、NOTCH1、NPM1、N
RAS、PDGFRA、PIK3CA(例えば、コドン88、542、545、546、
1047、および1049)、PTEN(例えば、コドン130、173、233、およ
び267)、RB1、RET(例えば、コドン918)、TP53(例えば、175、2
45、248、273、および306)が含まれるが、これらに限定されない。
【0167】
さらに別の実施形態では、標的遺伝子もしくは遺伝子産物、またはその断片は、癌に関
連する。例となる遺伝子または遺伝子産物には、ABL2、AKT2、AKT3、ARA
F、ARFRP1、ARID1A、ATM、ATR、AURKA、AURKB、BCL2
、BCL2A1、BCL2L1、BCL2L2、BCL6、BRCA1、BRCA2、C
ARD11、CBL、CCND1、CCND2、CCND3、CCNE1、CDH1、C
DH2、CDH20、CDH5、CDK4、CDK6、CDK8、CDKN2B、CDK
N2C、CHEK1、CHEK2、CRKL、CRLF2、DNMT3A、DOT1L、
EPHA3、EPHA5、EPHA6、EPHA7、EPHB1、EPHB4、EPHB
6、ERBB3、ERBB4、ERG、ETV1、ETV4、ETV5、ETV6、EW
SR1、EZH2、FANCA、FBXW7、FGFR4、FLT1、FLT4、FOX
P4、GATA1、GNA11、GNAQ、GNAS、GPR124、GUCY1A2、
HOXA3、HSP90AA1、IDH1、IDH2、IGF1R、IGF2R、IKB
KE、IKZF1、INHBA、IRS2、JAK1、JAK3、JUN、KDR、LR
P1B、LTK、MAP2K1、MAP2K2、MAP2K4、MCL1、MDM2、M
DM4、MEN1、MITF、MLH1、MPL、MRE11A、MSH2、MSH6、
MTOR、MUTYH、MYCL1、MYCN、NF2、NKX2-1、NTRK1、N
TRK3、PAK3、PAX5、PDGFRB、PIK3R1、PKHD1、PLCG1
、PRKDC、PTCH1、PTPN11、PTPRD、RAF1、RARA、RICT
OR、RPTOR、RUNX1、SMAD2、SMAD3、SMAD4、SMARCA4
、SMARCB1、SMO、SOX10、SOX2、SRC、STK11、TBX22、
TET2、TGFBR2、TMPRSS2、TOP1、TSC1、TSC2、USP9X
、VHL、およびWT1が含まれるが、これらに限定されない。
【0168】
前述の方法の適用は、医学検体における配列決定のために特定の遺伝子または遺伝子の
すべての既知の配列バリアント(またはそのサブセット)を含有するオリゴヌクレオチド
のライブラリの使用を含む。
遺伝子選択モジュール
【0169】
このモジュールは、本発明で取り上げられる方法で用いる複数の組のサブゲノム間隔、
例えば、本明細書に記載の遺伝子および他の領域の複数の組または群のサブゲノム間隔を
開示する。
【0170】
1名以上の対象由来の試料、例えば、腫瘍試料由来の多数の遺伝子および遺伝子産物を
配列決定するための最適化方法およびアッセイが開示される。一実施形態において、本発
明で特色とする方法およびアッセイ、例えば、多数の遺伝子に多数の様々な遺伝的事象か
らの複数のシグナルを組み込むアッセイは、マルチプレックスな多重遺伝子アッセイ形式
で使用される。癌表現型(例えば、癌の危険性、癌進行、癌治療応答、または癌治療に対
する抵抗のうちの1つ以上)に(例えば、正もしくは負に)関連する事前選択された組の
遺伝子または遺伝子産物に少なくともある程度基づく方法およびアッセイが本明細書に開
示される。そのような事前選択された遺伝子または遺伝子産物は、配列決定方法、具体的
には、例えば、腫瘍または対照試料由来の多数の様々な遺伝子の大規模並列配列決定に依
存する方法の適用を可能にする
【0171】
したがって、本発明は、試料、例えば、腫瘍試料を分析する方法を特色とする。方法は
、
(a)複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
(b)任意で、例えば、ライブラリをベイトセット(または複数のベイトセット)と接
触させることによって、事前選択された配列のライブラリを濃縮して、選択されたメンバ
ー(本明細書でライブラリ捕獲物と称される場合もある)を提供することと、
(c)サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
(d)該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
を用いてアライメントすることと、
(e)事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる(例えば、ベイズ方法または本明細書に記載の方法を用いて、例えば、変異を呼
び出す)ことと、を含み、
それによって、該腫瘍試料を分析し、
方法は、例えば、次世代配列決定方法を用いて、試料由来の少なくとも5、6、7、8、
9、10、15、20、25、30個、もしくはそれ以上の遺伝子もしくは遺伝子産物由
来のサブゲノム間隔を配列決定することを含み、遺伝子もしくは遺伝子産物は、ABL1
、AKT1、AKT2、AKT3、ALK、APC、AR、BRAF、CCND1、CD
K4、CDKN2A、CEBPA、CTNNB1、EGFR、ERBB2、ESR1、F
GFR1、FGFR2、FGFR3、FLT3、HRAS、JAK2、KIT、KRAS
、MAP2K1、MAP2K2、MET、MLL、MYC、NF1、NOTCH1、NP
M1、NRAS、NTRK3、PDGFRA、PIK3CA、PIK3CG、PIK3R
1、PTCH1、PTCH2、PTEN、RB1、RET、SMO、STK11、SUF
U、またはTP53から選択される。
【0172】
ある実施形態において、ステップ(b)が存在する。ある実施形態において、ステップ
(b)が欠如する。
【0173】
したがって、実施形態において、方法は、例えば、次世代配列決定方法を用いて、取得
された核酸試料由来の少なくとも5、6、7、8、9、10、15、20、25、30個
、もしくはそれ以上の遺伝子もしくは遺伝子産物由来のサブゲノム間隔を配列決定するこ
とを含み、遺伝子もしくは遺伝子産物は、ABL1、AKT1、AKT2、AKT3、A
LK、APC、AR、BRAF、CCND1、CDK4、CDKN2A、CEBPA、C
TNNB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、
FLT3、HRAS、JAK2、KIT、KRAS、MAP2K1、MAP2K2、ME
T、MLL、MYC、NF1、NOTCH1、NPM1、NRAS、NTRK3、PDG
FRA、PIK3CA、PIK3CG、PIK3R1、PTCH1、PTCH2、PTE
N、RB1、RET、SMO、STK11、SUFU、またはTP53から選択され、そ
れによって、腫瘍試料を分析する。
【0174】
ある特定の実施形態において、方法またはアッセイは、ABL2、ARAF、ARFR
P1、ARID1A、ATM、ATR、AURKA、AURKB、BAP1、BCL2、
BCL2A1、BCL2L1、BCL2L2、BCL6、BRCA1、BRCA2、CB
L、CARD11、CBL、CCND2、CCND3、CCNE1、CD79A、CD7
9B、CDH1、CDH2、CDH20、CDH5、CDK6、CDK8、CDKN2B
、CDKN2C、CHEK1、CHEK2、CRKL、CRLF2、DNMT3A、DO
T1L、EPHA3、EPHA5、EPHA6、EPHA7、EPHB1、EPHB4、
EPHB6、ERBB3、ERBB4、ERG、ETV1、ETV4、ETV5、ETV
6、EWSR1、EZH2、FANCA、FBXW7、FGFR4、FLT1、FLT4
、FOXP4、GATA1、GNA11、GNAQ、GNAS、GPR124、GUCY
1A2、HOXA3、HSP90AA1、IDH1、IDH2、IGF1R、IGF2R
、IKBKE、IKZF1、INHBA、IRS2、JAK1、JAK3、JUN、KD
M6A、KDR、LRP1B、LRP6、LTK、MAP2K4、MCL1、MDM2、
MDM4、MEN1、MITF、MLH1、MPL、MRE11A、MSH2、MSH6
、MTOR、MUTYH、MYCL1、MYCN、NF2、NKX2-1、NTRK1、
NTRK2、PAK3、PAX5、PDGFRB、PKHD1、PLCG1、PRKDC
、PTPN11、PTPRD、RAF1、RARA、RICTOR、RPTOR、RUN
X1、SMAD2、SMAD3、SMAD4、SMARCA4、SMARCB1、SOX
10、SOX2、SRC、TBX22、TET2、TGFBR2、TMPRSS2、TN
FAIP3、TNK、TNKS2、TOP1、TSC1、TSC2、USP9X、VHL
、またはWT1のうちの1、2、3、4、5、10、15、20、25、30、35、4
0、45、50、55、60、65、70、75、80、85、90、95、100、1
05、110、115、120個、もしくはそれ以上から選択される遺伝子または遺伝子
産物由来のサブゲノム間隔を配列決定することをさらに含む。
【0175】
他の実施形態では、方法またはアッセイは、薬物代謝、薬物応答性、または毒性のうち
の1つ以上に関連した遺伝子もしくは遺伝子産物(本明細書で「PGx」遺伝子とも称さ
れる)中に存在するサブゲノム間隔を配列決定することをさらに含む。ある特定の実施形
態において、配列決定されるサブゲノム間隔は、変化(例えば、単一ヌクレオチド多型(
SNP))を含む。一実施形態において、配列決定されるサブゲノム間隔は、ABCB1
、BCC2、ABCC4、ABCG2、C1orf144、CYP1B1、CYP2C1
9、CYP2C8、CYP2D6、CYP3A4、CYP3A5、DPYD、ERCC2
、ESR2、FCGR3A、GSTP1、ITPA、LRP2、MAN1B1、MTHF
R、NQO1、NRP2、SLC19A1、SLC22A2、SLCO1B3、SOD2
、SULT1A1、TPMT、TYMS、UGT1A1、またはUMPSのうちの1、2
、3、4、5、10、15、20、25、30個、もしくはそれ以上から選択される遺伝
子または遺伝子産物に由来する。
【0176】
他の実施形態では、方法またはアッセイは、ARFRP1、BCL2A1、CARD1
1、CDH20、CDH5、DDR2、EPHA3、EPHA5、EPHA7、EPHB
1、FOXP4、GPR124、GUCY1A2、INSR、LRP1B、LTK、PA
K3、PHLPP2、PLCG1、PTPRD、STAT3、TBX22、またはUSP
9Xのうちの1、2、3、4、5、10、15、20個、もしくはそれ以上から選択され
る遺伝子または遺伝子産物中に存在するサブゲノム間隔を配列決定することをさらに含む
。
【0177】
ある特定の実施形態において、核酸試料の配列決定されたサブゲノム間隔は、表1もし
くは表1Aの少なくとも50、75、100、150、200個、もしくはそれ以上の遺
伝子または遺伝子産物由来のヌクレオチド配列を含む。他の実施形態では、核酸試料の配
列決定されたサブゲノム間隔は、表1もしくは表1Aに明記される癌型由来の腫瘍試料か
ら取得された表1もしくは表1Aの少なくとも50、75、100、150、200個、
もしくはそれ以上の遺伝子または遺伝子産物由来のヌクレオチド配列を含む。さらに他の
実施形態では、配列決定されたサブゲノム間隔は、表1もしくは表1Aに従う優先順位が
1の遺伝子およびPGx遺伝子(例えば、表1もしくは表1Aに従う、少なくとも5、1
0、20、もしくは30個の優先順位が1の遺伝子、および少なくとも5、10、20、
もしくは30個のPGX遺伝子)との組み合わせを含む。他の実施形態では、配列決定さ
れたサブゲノム間隔は、表1もしくは表1Aに従う、優先順位が1の遺伝子、癌遺伝子、
およびPGx遺伝子(例えば、表1もしくは表1Aに従う、少なくとも5、10、20、
もしくは30個の優先順位が1の遺伝子;少なくとも5、10、20、もしくは30個の
癌遺伝子;および少なくとも5、10、20、もしくは30個のPGX遺伝子)の組み合
わせを含む。
【0178】
ある特定の実施形態において、核酸試料の配列決定されたサブゲノム間隔は、ABL1
遺伝子のコドン315;APCのコドン1114、1338、1450、もしくは155
6;BRAFのコドン600;CTNNB1のコドン32、33、34、37、41、も
しくは45;EGFRのコドン719、746~750、768、790、858、もし
くは861;FLT3のコドン835;HRASのコドン12、13、もしくは61;J
AK2のコドン617;KITのコドン816;KRASのコドン12、13、もしくは
61;PIK3CAのコドン88、542、545、546、1047、もしくは104
9;PTENのコドン130、173、233、もしくは267;RETのコドン918
;TP53のコドン175、245、248、273、もしくは306のうちの1つ以上
から選択されるコドンを含む。ある特定の実施形態において、前述のコドンのうちの2、
3、4、5、10、15、20個、もしくはそれ以上が配列決定される。他の実施形態で
は、配列決定されたサブゲノム間隔は、表1もしくは表1Aに示されるコドンのうちの1
つ以上を含む。
【0179】
他の実施形態では、核酸試料の配列決定されたサブゲノム間隔は、表1の少なくとも1
、5、10、15、20、25個、もしくはそれ以上のPGx遺伝子または遺伝子産物由
来のヌクレオチド配列を含む。他の実施形態では、核酸試料の配列決定されたサブゲノム
間隔は、表2の少なくとも1、5、10、15、20、25、30、35、40、45、
50、75個、もしくはそれ以上のPGx遺伝子または遺伝子産物由来のヌクレオチド配
列を含む。さらに他の実施形態では、配列決定されたサブゲノム間隔は、薬物代謝、薬物
応答性、薬物毒性、または副作用のうちの1つ以上に関連した表2に従う少なくとも1つ
のPGx遺伝子(および/または少なくとも1つのPGx遺伝子変異)由来のヌクレオチ
ド配列を含む。例えば、配列決定されたサブゲノム間隔は、薬物で治療された癌患者のよ
り良好な生存率(例えば、パクリタキセル(例えば、ABCB1遺伝子)で治療された乳
癌患者のより良好な生存率)に関連した少なくとも1個のPGx遺伝子由来のヌクレオチ
ド配列を含み得る。他の実施形態では、配列決定されたサブゲノム間隔は、パクリタキセ
ル代謝(例えば、表2に示される異なる遺伝子座および変異におけるCYP2C8遺伝子
、CYP3A4遺伝子)に関連する。さらに他の実施形態では、配列決定されたサブゲノ
ム間隔は、薬物に対する毒性(例えば、ABCC4遺伝子で見られる6-MP毒性(表2
);DPYD遺伝子、TYMS遺伝子、およびUMPS遺伝子で見られる5-FU毒性(
表2);TMPT遺伝子で見られるプリン毒性(表2);NRP2遺伝子、Clorf1
44遺伝子、CYP1B1遺伝子で見られるダウノルビシン毒性(表2))に関連する。
他の実施形態では、配列決定されたサブゲノム間隔は、薬物の副作用(例えば、ABCG
2、TYMS、UGT1A1、ESR1、およびESR2遺伝子(表2))に関連する。
【0180】
別の実施形態では、以下の組または群のうちの1つ由来のサブゲノム間隔、例えば、腫
瘍または癌遺伝子もしくは遺伝子産物、参照(例えば、野生型)遺伝子もしくは遺伝子産
物、またはPGx遺伝子もしくは遺伝子産物に関連したサブゲノム間隔が分析され、それ
によって、腫瘍試料由来のサブゲノム間隔の選択されたサブセットが得られる。
【0181】
ある実施形態において、方法は、腫瘍試料由来のサブゲノム間隔のサブセットを配列決
定し、サブゲノム間隔は、以下のうちの少なくとも1、2、3、4、5、6、7、8、9
、10、11、12、13個、もしくはすべてから選択される:
A)ABL1、AKT1、AKT2、AKT3、ALK、APC、AR、BRAF、C
CND1、CDK4、CDKN2A、CEBPA、CTNNB1、EGFR、ERBB2
、ESR1、FGFR1、FGFR2、FGFR3、FLT3、HRAS、JAK2、K
IT、KRAS、MAP2K1、MAP2K2、MET、MLL、MYC、NF1、NO
TCH1、NPM1、NRAS、NTRK3、PDGFRA、PIK3CA、PIK3C
G、PIK3R1、PTCH1、PTCH2、PTEN、RB1、RET、SMO、ST
K11、SUFU、またはTP53のうちの少なくとも5つ以上から選択される変異また
は野生型遺伝子もしくは遺伝子産物由来の少なくとも5、6、7、8、9、10、15、
20、25、30個、もしくはそれ以上のサブゲノム間隔、
B)ABL2、ARAF、ARFRP1、ARID1A、ATM、ATR、AURKA
、AURKB、BAP1、BCL2、BCL2A1、BCL2L1、BCL2L2、BC
L6、BRCA1、BRCA2、CBL、CARD11、CBL、CCND2、CCND
3、CCNE1、CD79A、CD79B、CDH1、CDH2、CDH20、CDH5
、CDK6、CDK8、CDKN2B、CDKN2C、CHEK1、CHEK2、CRK
L、CRLF2、DNMT3A、DOT1L、EPHA3、EPHA5、EPHA6、E
PHA7、EPHB1、EPHB4、EPHB6、ERBB3、ERBB4、ERG、E
TV1、ETV4、ETV5、ETV6、EWSR1、EZH2、FANCA、FBXW
7、FGFR4、FLT1、FLT4、FOXP4、GATA1、GNA11、GNAQ
、GNAS、GPR124、GUCY1A2、HOXA3、HSP90AA1、IDH1
、IDH2、IGF1R、IGF2R、IKBKE、IKZF1、INHBA、IRS2
、JAK1、JAK3、JUN、KDM6A、KDR、LRP1B、LRP6、LTK、
MAP2K4、MCL1、MDM2、MDM4、MEN1、MITF、MLH1、MPL
、MRE11A、MSH2、MSH6、MTOR、MUTYH、MYCL1、MYCN、
NF2、NKX2-1、NTRK1、NTRK2、PAK3、PAX5、PDGFRB、
PKHD1、PLCG1、PRKDC、PTPN11、PTPRD、RAF1、RARA
、RICTOR、RPTOR、RUNX1、SMAD2、SMAD3、SMAD4、SM
ARCA4、SMARCB1、SOX10、SOX2、SRC、TBX22、TET2、
TGFBR2、TMPRSS2、TNFAIP3、TNK、TNKS2、TOP1、TS
C1、TSC2、USP9X、VHL、またはWT1のうちの少なくとも5つ以上から選
択される変異または野生型遺伝子もしくは遺伝子産物由来の少なくとも5、6、7、8、
9、10、15、20、25、30、35、40、45、50、55、60、65、70
、75、80、85、90、95、100、105、110、115、120個、もしく
はそれ以上のサブゲノム間隔、
C)表1、1A、2、3、もしくは4に従う遺伝子もしくは遺伝子産物由来の少なくと
も5、6、7、8、9、10、15、20個、もしくはそれ以上のサブゲノム間隔、
D)腫瘍もしくは癌に関連した(例えば、腫瘍もしくは癌の正もしくは負の治療応答予
測因子であるか、腫瘍もしくは癌の正もしくは負の予後因子であるか、または腫瘍もしく
は癌の差次的診断を可能にする)遺伝子もしくは遺伝子産物、例えば、ABL1、AKT
1、ALK、AR、BRAF、BRCA1、BRCA2、CEBPA、EGFR、ERB
B2、FLT3、JAK2、KIT、KRAS、MET、NPM1、PDGFRA、PI
K3CA、RARA、AKT2、AKT3、MAP2K4、NOTCH1、およびTP5
3のうちの1つ以上から選択される遺伝子もしくは遺伝子産物由来の少なくとも5、6、
7、8、9、10、15、20個、もしくはそれ以上のサブゲノム間隔、
E)ABL1遺伝子のコドン315;APCのコドン1114、1338、1450、
もしくは1556;BRAFのコドン600;CTNNB1のコドン32、33、34、
37、41、もしくは45;EGFRのコドン719、746-750、768、790
、858、もしくは861;FLT3のコドン835;HRASのコドン12、13、も
しくは61;JAK2のコドン617;KITのコドン816;KRASのコドン12、
13、もしくは61;PIK3CAのコドン88、542、545、546、1047、
もしくは1049;PTENのコドン130、173、233、もしくは267;RET
のコドン918;TP53のコドン175、245、248、273、もしくは306の
うちの1つ以上から選択される変異コドンまたは野生型コドンを含む、少なくとも5、6
、7、8、9、10個、もしくはそれ以上のサブゲノム間隔(例えば、表1もしくは表1
Aに示されるコドンのうちの1つ以上を含む、少なくとも5、10、15、20個、もし
くはそれ以上のサブゲノム間隔)、
F)ABCB1、BCC2、ABCC4、ABCG2、C1orf144、CYP1B
1、CYP2C19、CYP2C8、CYP2D6、CYP3A4、CYP3A5、DP
YD、ERCC2、ESR2、FCGR3A、GSTP1、ITPA、LRP2、MAN
1B1、MTHFR、NQO1、NRP2、SLC19A1、SLC22A2、SLCO
1B3、SOD2、SULT1A1、TPMT、TYMS、UGT1A1、またはUMP
Sから選択される薬物代謝、薬物応答性、または毒性のうちの1つ以上に関連した遺伝子
または遺伝子産物に存在するサブゲノム間隔の変異または野生型遺伝子もしくは遺伝子産
物(例えば、単一ヌクレオチド多型(SNP))由来の少なくとも5、6、7、8、9、
10、15、20、25、30個、もしくはそれ以上のサブゲノム間隔、
G)(i)薬物で治療された癌患者のより良好な生存率(例えば、パクリタキセル(例
えば、ABCB1遺伝子)で治療された乳癌患者のより良好な生存率)、(ii)パクリ
タキセル代謝(例えば、表2に示される異なる遺伝子座および変異におけるCYP2C8
遺伝子、CYP3A4遺伝子)、(iii)薬物に対する毒性(例えば、ABCC4遺伝
子で見られる6-MP毒性(表2);DPYD遺伝子、TYMS遺伝子、もしくはUMP
S遺伝子で見られる5-FU毒性(表2);TMPT遺伝子で見られるプリン毒性(表2
);NRP2遺伝子、Clorf144遺伝子、CYP1B1遺伝子で見られるダウノル
ビシン毒性(表2)、または(iv)薬物の副作用(例えば、ABCG2、TYMS、U
GT1A1、ESR1、およびESR2遺伝子(表2))のうちの1つ以上に関連した遺
伝子もしくは遺伝子産物に存在するサブゲノム間隔の変異または野生型PGx遺伝子もし
くは遺伝子産物(例えば、単一ヌクレオチド多型(SNP))由来の少なくとも5、6、
7、8、9、10、15、20、25、30個、もしくはそれ以上のサブゲノム間隔、
H)表3に従う少なくとも5、10、15、20、25、30、35、40、45、5
0、75、110個、もしくはそれ以上の遺伝子または遺伝子産物の転座変化、
J)表3に明記される癌型由来の固形腫瘍試料における、表3に従う少なくとも5、1
0、15、20、25、30、35、40、45、50、75、110個、もしくはそれ
以上の遺伝子もしくは遺伝子産物の転座変化、
K)表4に従う少なくとも5、10、15、20、25、30、35、40、45、5
0、75、100、150、200個、もしくはそれ以上の遺伝子もしくは遺伝子産物の
転座変化、
L)表4に明記される癌型由来のヘム腫瘍試料における、表4に従う少なくとも5、1
0、15、20、25、30、35、40、45、50、75、100、150、200
個、もしくはそれ以上の遺伝子もしくは遺伝子産物の転座変化、
M)例えば、事前選択された位置での対立遺伝子変異は、事前選択された腫瘍型に関連
し、該対立遺伝子変異は、該腫瘍型の細胞の5%未満に存在する、表1、表1A-4から
選択される少なくとも5個の遺伝子もしくは遺伝子産物、
N)GCが豊富な領域に埋め込まれる表1、表1A-4から選択される少なくとも5個
の遺伝子もしくは遺伝子産物、あるいは
O)癌を発現させる遺伝(例えば、生殖細胞系危険)因子を示す少なくとも5個の遺伝
子もしくは遺伝子産物(例えば、遺伝子もしくは遺伝子産物は、BRCA1、BRCA2
、EGFR、HRAS、KIT、MPL、ALK、PTEN、RET、APC、CDKN
2A、MLH1、MSH2、MSH6、NF1、NF2、RB1、TP53、VHL、ま
たはWT1のうちの1つ以上から選択される)。
【0182】
ある特定の実施形態において、方法またはアッセイを取得するステップは、該腫瘍試料
由来の本明細書に記載の複数の腫瘍または癌関連メンバー、参照メンバー、および/また
はPGxメンバーを含むライブラリを取得することを含む。ある特定の実施形態において
、選択するステップは、例えば、それぞれ、本明細書に記載の遺伝子または遺伝子産物由
来のサブゲノム間隔を含む、腫瘍もしくは癌関連メンバー、参照メンバー(例えば、野生
型メンバー)、またはPGxメンバーを選択または濃縮するために、溶液ベースのハイブ
リダイゼーションを含む。
【0183】
本発明のさらなる実施形態または特徴は、以下の通りである。
一実施形態において、核酸試料のサブゲノム間隔は、遺伝子内領域または遺伝子間領域
を含む。一実施形態において、サブゲノム間隔は、遺伝子もしくはその断片、エクソンも
しくはその断片、または事前選択されたヌクレオチド位置を含む。別の実施形態では、サ
ブゲノム間隔は、エクソンもしくはイントロン、またはその断片、典型的には、エクソン
またはその断片を含む。一実施形態において、サブゲノム間隔は、コード領域または非コ
ード領域、例えば、プロモーター、エンハンサー、5’非翻訳領域(5’UTR)、もし
くは3’非翻訳領域(3’UTR)、またはその断片を含む。
【0184】
他の実施形態では、核酸試料のサブゲノム間隔は、例えば、癌表現型(例えば、癌の危
険性、癌進行、癌治療、または治療に対する抵抗のうちの1つ以上)に正もしくは負に関
連した変化(例えば、1つ以上の変異)を含む。さらに別の実施形態では、サブゲノム間
隔は、変化、例えば、点変異もしくは単一変異、欠失変異(例えば、インフレーム欠失、
遺伝子内欠失、全遺伝子欠失)、挿入変異(例えば、遺伝子内挿入)、逆位変異(例えば
、染色体内逆位)、連鎖変異、連鎖された挿入変異、逆位重複変異、タンデム重複(例え
ば、染色体内タンデム重複)、転座(例えば、染色体転座、非相反転座)、再編成、遺伝
子コピー数の変化、またはそれらの組み合わせを含む。
【0185】
他の実施形態では、核酸試料のサブゲノム間隔は、試料由来の腫瘍型の癌表現型に関連
しない核酸分子を(同一または異なるサブゲノム間隔において)含む。一実施形態におい
て、配列決定されたサブゲノム間隔は、変異が癌表現型に関連するとき、遺伝子もしくは
遺伝子産物の野生型または非変異ヌクレオチド配列(例えば、エクソン配列またはその断
片)(例えば、本明細書に記載の遺伝子もしくは遺伝子産物の野生型または非変異配列)
を含む。例えば、配列決定されたサブゲノム間隔は、腫瘍を有するか、または有する危険
性のある同一の対象由来の正常な(例えば、非癌性)参照試料(例えば、腫瘍試料を得た
同一の対象由来)、正常な隣接組織(NAT)、または血液試料に由来する。他の実施形
態では、配列決定されたサブゲノム間隔は、1名以上の異なる対象(例えば、健常な対象
、あるいは腫瘍を有するか、または有する危険性のある他の対象)由来の腫瘍または癌関
連メンバーとは異なる対象に由来する(例えば、異なる対象由来の同一もしくは異なる腫
瘍試料、正常な(例えば、非癌性)参照試料、正常な隣接組織(NAT)、または血液試
料のうちの1つ以上に由来する)。
【0186】
他の実施形態では、核酸試料のサブゲノム間隔は、表3、表4、またはそれらの組み合
わせに示される1つ以上の転座変化を含む。ある特定の実施形態において、配列決定され
たサブゲノム間隔は、表3に従う少なくとも5、10、15、20、25、30、35、
40、45、50、75、110個、もしくはそれ以上の遺伝子または遺伝子産物の転座
変化を含む。他の実施形態では、配列決定されたサブゲノム間隔は、表3に明記される癌
型由来の腫瘍試料における表3に従う少なくとも5、10、15、20、25、30、3
5、40、45、50、75、110個、もしくはそれ以上の遺伝子または遺伝子産物の
転座変化を含む。他の実施形態では、配列決定されたサブゲノム間隔は、表4に従う少な
くとも5、10、15、20、25、30、35、40、45、50、75、100、1
50、200個、もしくはそれ以上の遺伝子または遺伝子産物の転座変化を含む。他の実
施形態では、配列決定されたサブゲノム間隔は、表4に明記される癌型由来の腫瘍試料に
おける表4の少なくとも5、10、15、20、25、30、35、40、45、50、
75、100、150、200個、もしくはそれ以上の遺伝子または遺伝子産物の転座変
化を含む。
【0187】
一実施形態において、核酸試料のサブゲノム間隔は、癌表現型に関連した単一ヌクレオ
チド変化を含むエクソン配列を含む。例えば、サブゲノム間隔は、染色体12のヌクレオ
チド25,398,215~25,398,334を含む。他の実施形態では、サブゲノ
ム間隔は、KRAS遺伝子においてG12S変異を表す25,398,286位でのC-
T置換を含む。
【0188】
別の実施形態では、核酸試料のサブゲノム間隔は、参照ヌクレオチド(例えば、染色体
)配列由来の1、2、3、4、5、6、7、8、9、10、11、12、13、14、1
5、16、17、18、19、20個、もしくはそれ以上のコドンのインフレーム欠失を
含む。一実施形態において、サブゲノム間隔は、EGFR遺伝子のコドン746~750
のインフレーム欠失を含む(例えば、サブゲノム間隔は、染色体7のヌクレオチド55,
242,400~55,242,535を含むが、ヌクレオチド55,242,464~
55,242,479を欠く)。
【0189】
さらに別の実施形態では、核酸試料のサブゲノム間隔は、PTEN遺伝子のコドン64
からのジヌクレオチド配列「CA」の欠失を含む(例えば、サブゲノム間隔は、染色体1
0のヌクレオチド9,675,214~89,675,274、続いて、染色体10の塩
基89,675,277~89,675,337を含む)。
【0190】
さらに別の実施形態では、核酸試料のサブゲノム間隔は、PTENのコドン136に続
くアミノ酸残基「Gly-Met」の挿入を含む(例えば、サブゲノム間隔は、染色体1
0のヌクレオチド89,692,864~89,692,924、続いて、ヌクレオチド
配列「GGNATG」、続いて、染色体10のヌクレオチド89,692,925~89
,692,980を含む)。
【0191】
さらに別の実施形態では、核酸試料のサブゲノム間隔は、CDKN2A遺伝子の欠失を
含む(例えば、サブゲノム間隔は、染色体9の塩基22,001,175~22,001
,235に隣接した染色体9のヌクレオチド21,961,007~21,961,06
7を含む)。
【0192】
別の実施形態では、配列決定された核酸試料のサブゲノム間隔は、EML4-ALK融
合を引き起こす逆位を含む(例えば、サブゲノム間隔は、染色体2のヌクレオチド29,
449,993~29,449,933と並列した染色体2のヌクレオチド42,522
,893~42,522,953を含む)。
【0193】
別の実施形態では、核酸試料のサブゲノム間隔は、BCR-ABL融合をもたらす染色
体間転座を含む(例えば、サブゲノム間隔は、染色体9のヌクレオチド133,681,
793~133,681,853と並列した染色体22のヌクレオチド23,632,5
52~23,632,612を含む)。
【0194】
別の実施形態では、核酸試料のサブゲノム間隔は、FLT3遺伝子における内部タンデ
ム重複(ITD)変異を含む(例えば、サブゲノム間隔は、同一の配向に2回反復した染
色体13のヌクレオチド28,608,259~28,608,285を含む)。
【0195】
別の実施形態では、核酸試料のサブゲノム間隔は、マイクロサテライトマーカー配列を
含む(例えば、サブゲノム間隔は、D2S123のマイクロサテライトマーカー配列、例
えば、染色体2のヌクレオチド51,288,380~51,288,500およびヌク
レオチド51,288,560~51,288,680を含む)。
【0196】
別の実施形態では、核酸試料のサブゲノム間隔は、融合配列に対応するヌクレオチド配
列(例えば、非融合転写物の融合転写物または癌関連の選択的スプライシングされた形態
)を含む。
【0197】
他の実施形態では、核酸試料のサブゲノム間隔は、ヌクレオチド配列を含み、事前選択
された対立遺伝子バリアントの存在もしくは不在は、癌関連の表現型(例えば、癌の危険
性、癌進行、癌治療応答、または治療に対する抵抗、腫瘍病期分類、転移可能性等のうち
の1つ以上)を示す。ある特定の実施形態において、配列決定された核酸試料のサブゲノ
ム間隔は、ヌクレオチド配列を含み、事前選択された対立遺伝子バリアントの存在もしく
は不在は、正の臨床転帰、および/または治療に対する応答性を予測する。他の実施形態
では、配列決定された核酸試料のサブゲノム間隔は、ヌクレオチド配列を含み、事前選択
された対立遺伝子バリアントの存在もしくは不在は、負の臨床転帰、および/または治療
に対する応答性を予測する。ある特定の実施形態において、配列決定された核酸試料のサ
ブゲノム間隔は、ヌクレオチド配列を含み、事前選択された対立遺伝子バリアントの存在
または不在は、癌を発現させる遺伝(例えば、生殖細胞系危険)因子を示す(例えば、遺
伝子または遺伝子産物は、BRCA1、BRCA2、EGFR、HRAS、KIT、MP
L、ALK、PTEN、RET、APC、CDKN2A、MLH1、MSH2、MSH6
、NF1、NF2、RB1、TP53、VHL、またはWT1のうちの1つ以上から選択
される)。
【0198】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、表1、1A、3
、もしくは4に記載される癌型のうちの1つ以上から選択される癌に関連した表1、1A
、3、もしくは4に示される1つ以上の遺伝子または遺伝子産物に由来する。
【0199】
一実施形態において、核酸試料のサブゲノム間隔は、癌表現型、例えば、CML、AL
L、またはT-ALLのうちの1つ以上から選択される軟組織悪性腫瘍に関連したABL
-1遺伝子もしくは遺伝子産物に由来する。他の実施形態では、配列決定された核酸試料
のサブゲノム間隔は、癌表現型、例えば、乳癌、結腸直腸癌、卵巣癌、または非小細胞肺
癌(NSCLC)のうちの1つ以上から選択される癌に関連したAKT1遺伝子もしくは
遺伝子産物に由来する。
【0200】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、ALCL、NS
CLC、または神経芽細胞腫のうちの1つ以上から選択される癌に関連したALK遺伝子
もしくは遺伝子産物に由来する。
【0201】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、結腸直腸癌、膵
臓癌、類腱腫、肝芽腫、神経膠腫、または他のCNS癌もしくは腫瘍のうちの1つ以上か
ら選択される癌に関連したAPC遺伝子もしくは遺伝子産物に由来する。
【0202】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、黒色腫、結腸直
腸癌、肺癌、他の上皮悪性腫瘍、またはAMLもしくはALLを含む血液悪性腫瘍のうち
の1つ以上から選択される癌に関連したBRAF遺伝子もしくは遺伝子産物に由来する。
【0203】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、黒色腫、膵臓癌
、または他の腫瘍型のうちの1つ以上から選択される癌に関連したCDKN2A遺伝子も
しくは遺伝子産物に由来する。
【0204】
他の実施形態では、配列決定された核酸試料のサブゲノム間隔は、癌表現型、例えば、
AMLまたはMDSのうちの1つ以上から選択される癌に関連したCEBPA遺伝子もし
くは遺伝子産物に由来する。
【0205】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、結腸直腸癌、卵
巣癌、肝芽腫、または多形性唾液腺腫のうちの1つ以上から選択される癌に関連したCT
NNB1遺伝子もしくは遺伝子産物に由来する。
【0206】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、神経膠腫、肺癌
、またはNSCLCのうちの1つ以上から選択される癌に関連したEGFR遺伝子もしく
は遺伝子産物に由来する。
【0207】
他の実施形態では、核酸試料のサブゲノム間隔は、例えば、癌表現型、例えば、乳癌、
卵巣癌、NSCLC、胃癌、または他の固形腫瘍のうちの1つ以上から選択される癌に正
もしくは負に関連したERBB2遺伝子もしくは遺伝子産物に由来する。
【0208】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、乳房腫瘍、卵巣
腫瘍、または子宮内膜腫瘍のうちの1つ以上から選択される癌に関連したESR1遺伝子
もしくは遺伝子産物に由来する。
【0209】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、MPDまたはN
HLのうちの1つ以上から選択される癌に関連したFGFR1遺伝子もしくは遺伝子産物
に由来する。
【0210】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、胃腫瘍、NSC
LC、または子宮内膜腫瘍のうちの1つ以上から選択される癌に関連したFGFR2遺伝
子もしくは遺伝子産物に由来する。一実施形態において、ライブラリ、例えば、核酸ライ
ブラリは、胃腫瘍、NSCLC、もしくは子宮内膜腫瘍のうちの1つ以上を有するか、ま
たは有する危険性のある対象由来の試料から得られる。
【0211】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、膀胱癌、多発性
骨髄腫、またはT細胞リンパ腫のうちの1つ以上から選択される癌に関連したFGFR3
遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔に由来する。
【0212】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、AML、黒色腫
、結腸直腸癌、甲状腺乳頭癌、卵巣癌、非小細胞肺癌(NSCLC)、胆管癌、または毛
様細胞性星状細胞腫のうちの1つ以上から選択される癌に関連したFLT3遺伝子もしく
は遺伝子産物、またはそのサブゲノム間隔に由来する。
【0213】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、横紋筋肉腫、神
経節芽細胞腫、膀胱癌、肉腫、または他の癌型のうちの1つ以上から選択される癌に関連
したHRAS遺伝子もしくは遺伝子産物に由来する。
【0214】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、ALL、AML
、MPD、またはCMLのうちの1つ以上から選択される癌に関連したJAK2遺伝子も
しくは遺伝子産物に由来する。
【0215】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、消化管間質腫瘍
(GIST)、AML、TGCT、肥満細胞症、粘膜黒色腫、または上皮腫のうちの1つ
以上から選択される癌に関連したKIT遺伝子もしくは遺伝子産物に由来する。
【0216】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、膵臓癌、結腸癌
、結腸直腸癌、肺癌、甲状腺癌、またはAMLのうちの1つ以上から選択される癌に関連
したKRAS遺伝子もしくは遺伝子産物に由来する。
【0217】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、腎臓癌または頭
頸部扁平上皮癌のうちの1つ以上から選択される癌に関連したMET遺伝子もしくは遺伝
子産物に由来する。
【0218】
他の実施形態では、配列決定された核酸試料のサブゲノム間隔は、癌表現型、例えば、
AMLまたはALLのうちの1つ以上から選択される癌に関連したMLL遺伝子もしくは
遺伝子産物に由来する。
【0219】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、神経繊維腫また
は神経膠腫のうちの1つ以上から選択される癌に関連したNF1遺伝子もしくは遺伝子産
物に由来する。
【0220】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、T-ALL癌に
関連したNOTCH1遺伝子もしくは遺伝子産物に由来する。
【0221】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、NHL、APL
またはAMLのうちの1つ以上から選択される癌に関連したNPM1遺伝子もしくは遺伝
子産物に由来する。
【0222】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、黒色腫、結腸直
腸癌、多発性骨髄腫、AML、または甲状腺癌のうちの1つ以上から選択される癌に関連
したNRAS遺伝子もしくは遺伝子産物に由来する。
【0223】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、GISTまたは
特発性好酸球増加症候群のうちの1つ以上から選択される癌に関連したPDGFRA遺伝
子もしくは遺伝子産物に由来する。
【0224】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、結腸直腸癌、胃
癌、膠芽腫、または乳癌のうちの1つ以上から選択される癌に関連したPIK3CA遺伝
子もしくは遺伝子産物に由来する。
【0225】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、結腸直腸癌、神
経膠腫、前立腺癌、または子宮内膜癌のうちの1つ以上から選択される癌に関連したPT
EN遺伝子もしくは遺伝子産物に由来する。
【0226】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、網膜芽細胞腫、
肉腫、乳癌、または小細胞肺癌のうちの1つ以上から選択される癌に関連したRB1遺伝
子もしくは遺伝子産物に由来する。
【0227】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、甲状腺髄様癌、
甲状腺乳頭癌、または褐色細胞腫のうちの1つ以上から選択される癌に関連したRET遺
伝子もしくは遺伝子産物に由来する。
【0228】
他の実施形態では、核酸試料のサブゲノム間隔は、癌表現型、例えば、乳癌、結腸直腸
癌、肺癌、肉腫、副腎皮質癌、神経膠腫、または他の腫瘍型のうちの1つ以上から選択さ
れる癌に関連したTP53遺伝子もしくは遺伝子産物に由来する。
【0229】
一実施形態において、核酸試料のサブゲノム間隔は、治療応答の正の予測因子である。
治療応答の正の予測因子の例には、NSCLC患者の小分子EGFR TKI(例えば、
イレッサ/ゲフィチニブ)に対する応答性を予測するEGFR遺伝子における活性化変異
、NSCLC患者のALK阻害剤(例えば、PF-02341066)に対する応答性を
予測するEML4/ALK融合遺伝子の存在、黒色腫患者のBRAF阻害(例えば、PL
X-4032)に対する応答性を予測するBRAF V600E変異の存在が挙げられる
が、これらに限定されない。
【0230】
他の実施形態では、核酸試料のサブゲノム間隔は、治療応答の負の予測因子である。治
療応答の負の予測因子の例には、CRC患者の抗EGFRモノクローナル抗体(セテュキ
マブ、パニツムマブ)への応答欠如を予測するKRAS遺伝子における活性化変異、およ
びCML患者のグリーベック/イマチニブに対する抵抗を予測するBCR/Abl融合遺
伝子におけるM351T変異の存在が挙げられるが、これらに限定されない。
【0231】
他の実施形態では、核酸試料のサブゲノム間隔は、予後因子である。予後因子の例には
、AML患者の再発の負の予後であるFLT3遺伝子における挿入変異の存在、甲状腺髄
様癌患者の生存の負の予後因子である特定のRET遺伝子変異、例えば、M918Tの存
在が挙げられるが、これらに限定されない。
【0232】
他の実施形態では、核酸試料のサブゲノム間隔は、診断因子である。予後因子の例には
、CMLの診断であるBCR/Abl融合遺伝子の存在、および腎臓のラブドイド腫瘍の
診断であるSMARCB1変異の存在が挙げられるが、これらに限定されない。
【0233】
他の実施形態では、核酸試料は、腫瘍試料中の細胞の少数の一部(例えば、5%未満)
に存在する遺伝子または遺伝子産物由来のサブゲノム間隔を含む。一実施形態において、
核酸試料は、例えば、癌関連の表現型に正もしくは負に関連するが、腫瘍試料中の細胞の
少数の一部(例えば、未満5%)に存在する遺伝子または遺伝子産物由来のサブゲノム間
隔を含む。他の実施形態では、核酸試料は、腫瘍試料中の細胞の50、40、30、10
、5、もしくは1%未満に存在する遺伝子または遺伝子産物由来のサブゲノム間隔を含む
。さらに他の実施形態では、核酸試料は、腫瘍試料中の細胞の50、60、70、80%
を超えるか、もしくはそれ以上に存在する遺伝子または遺伝子産物由来のサブゲノム間隔
を含む。
【0234】
さらに他の実施形態では、核酸試料は、腫瘍試料中の腫瘍細胞のゲノムのコード領域の
5、1、0.5、0.1%、0.01%、0.001%未満に存在する遺伝子または遺伝
子産物由来のサブゲノム間隔を含む。
【0235】
一実施形態において、核酸試料は、腫瘍または癌に関連した(例えば、腫瘍または癌の
正もしくは負の治療応答予測因子であるか、腫瘍または癌の正もしくは負の予後因子であ
るか、あるいは腫瘍または癌の差次的診断を可能にする)遺伝子または遺伝子産物、例え
ば、ABL1、AKT1、ALK、AR、BRAF、BRCA1、BRCA2、CEBP
A、EGFR、ERBB2、FLT3、JAK2、KIT、KRAS、MET、NPM1
、PDGFRA、PIK3CA、RARA、AKT2、AKT3、MAP2K4、NOT
CH1、およびTP53のうちの1つ以上から選択される遺伝子または遺伝子産物由来の
サブゲノム間隔を含む。
【0236】
一実施形態において、遺伝子または遺伝子産物に関連した癌表現型は、腫瘍試料と同一
の腫瘍型である。他の実施形態では、遺伝子または遺伝子産物に関連した癌表現型は、腫
瘍試料とは異なる腫瘍型に由来する。
【0237】
ある特定の実施形態において、方法またはアッセイは、少なくともX名の対象(X=1
、2、3、4、5、6、7、8、9、10、20、30、40名、またはそれ以上の対象
)由来の腫瘍試料由来の核酸試料を配列決定することを含む。一実施形態において、対象
は、癌もしくは腫瘍を有するか、または有する危険性のあるヒトである。方法は、少なく
ともX名の対象由来の本明細書に記載の少なくとも5、10、15、20、30、40、
50、75個、もしくはそれ以上の遺伝子または遺伝子産物(例えば、表1、1A、2、
3、もしくは4の遺伝子または遺伝子産物)を配列決定することを含む。ある特定の実施
形態において、遺伝子または遺伝子産物は、癌表現型、例えば、癌の危険性、癌進行、癌
治療応答、または治療に対する抵抗のうちの1つ以上に関連した変化を含む。
【0238】
他の実施形態において、または前述の実施形態に加えて、方法またはアッセイは、腫瘍
試料と同一の対象由来の遺伝子または遺伝子産物由来の対照または参照サブゲノム間隔、
例えば、本明細書に記載の遺伝子または遺伝子産物(例えば、表1、1A、2、3、もし
くは4の遺伝子または遺伝子産物)の野生型または非変異ヌクレオチド配列を配列決定す
ることを含む。一実施形態において、対照遺伝子または遺伝子産物は、腫瘍を有するか、
または有する危険性のある同一の対象由来、あるいは異なる対象由来の腫瘍試料と同一の
対象または腫瘍試料とは異なる対象に由来する(例えば、同一もしくは異なる腫瘍試料、
正常な(例えば、非癌性)試料、正常な隣接組織(NAT)、または血液試料のうちの1
つ以上に由来する)。
【0239】
他の実施形態において、または前述の実施形態に加えて、方法またはアッセイは、薬物
代謝、薬物応答性、または毒性に関連した遺伝子(本明細書に記載のPGx遺伝子)に存
在するサブゲノム間隔を配列決定することを含む。ある特定の実施形態において、配列さ
れたサブゲノム間隔は、変化(例えば、単一ヌクレオチド多型(SNP))を含む。
【0240】
ある特定の実施形態において、方法またはアッセイは、第1の対象由来の表1、1A、
2、3、もしくは4の第1の組の遺伝子または遺伝子産物を配列決定する(かつ/または
配列決定の結果を報告する)ことを含む。他の実施形態では、方法またはアッセイは、第
1もしくは第2の対象由来の表1、1A、2、3、もしくは4の遺伝子または遺伝子産物
の第2の組、第3の組、またはそれ以上の(例えば、オーバーラップするが、異なる)組
を配列決定する(かつ/または配列決定の結果を報告する)ことを含む。ある特定の実施
形態において、第1の対象由来の腫瘍試料は、第1の型の腫瘍を含み、第2の対象由来の
腫瘍試料は、第2の型の腫瘍を含む。他の実施形態では、第1の対象および第2の対象由
来の腫瘍試料は、同一の腫瘍型に由来する。
【0241】
ある特定の実施形態において、方法またはアッセイは、以下のうちの1つ以上をさらに
含む:
(i) 核酸試料をフィンガープリントすること、
(ii) 核酸試料における遺伝子または遺伝子産物(例えば、本明細書に記載の遺伝
子または遺伝子産物)の存在量を定量化すること、
(iii) 試料における転写物の相対存在量を定量化すること、
(iv) 特定の対象(例えば、正常な対照または癌患者)に属する核酸試料を特定す
ること、
(v) 核酸試料中の遺伝形質(例えば、1つ以上の対象の遺伝子構造(例えば、民族
性、人種、家族性形質))を特定すること、
(vi) 核酸試料の倍数性を決定し、核酸試料におけるヘテロ接合性の消失を決定す
ること、
(vii) 核酸試料における遺伝子重複事象の存在もしくは不在を決定すること、
(viii) 核酸試料における遺伝子増幅事象の存在もしくは不在を決定すること、
あるいは
(ix) 核酸試料中の腫瘍/正常な細胞混合物のレベルを決定すること。
【0242】
他の実施形態では、核酸試料は、腫瘍試料由来の複数の腫瘍核酸メンバー、参照もしく
は対照(例えば、野生型)核酸メンバー、および/またはPGx関連の核酸メンバー(例
えば、本明細書に記載のサブゲノム間隔を含む核酸)を含むライブラリ、または選択され
たライブラリ出力を含む。一実施形態において、ライブラリ(例えば、核酸ライブラリ)
は、1、2、3、4、5、6、7、8、9、10、20、30名、もしくはそれ以上の対
象由来の複数のメンバー、例えば、標的核酸メンバーを含む。一実施形態において、対象
は、癌もしくは腫瘍を有するか、または有する危険性のあるヒトである。ある特定の実施
形態において、ライブラリは、1、2、3、4、5、6、7、8、9、10、20、30
名、もしくはそれ以上の対象由来の腫瘍または癌関連の核酸メンバーおよび対照核酸断片
をさらに含む。
【0243】
ある特定の実施形態において、選択されたサブゲノム間隔のサブセットは、溶液または
固体支持体ベースのハイブリダイゼーションによって核酸試料から分離または濃縮される
。一実施形態において、方法またはアッセイは、核酸ライブラリ(例えば、ライブラリ捕
獲物)の選択されたメンバーを提供する。方法は、
複数のメンバー、例えば、標的メンバー(例えば、複数の腫瘍もしくは癌関連のメンバ
ー、参照メンバー、および/またはPGxメンバーを含む)を含むライブラリ(例えば、
核酸ライブラリ)を提供することと、
ライブラリを、例えば、溶液もしくは固体支持体ベースの反応で、複数のベイト(例え
ば、オリゴヌクレオチドベイト)と接触させて、複数のベイト/メンバーハイブリッドを
含むハイブリダイゼーション混合物を形成することと、
複数のベイト/メンバーハイブリッドを、例えば、該ハイブリダイゼーション混合物を
、該複数のベイト/メンバーハイブリッドの分離を可能にする結合実体と接触させること
によって、該ハイブリダイゼーション混合物から分離することと、を含み、
それによって、ライブラリ捕獲物(例えば、ライブラリ由来の核酸分子の選択または濃縮
されたサブグループ)を提供し、
複数のベイトは、
a)本明細書に記載の腫瘍または参照遺伝子もしくは遺伝子産物、例えば、表1、1A
、3、もしくは4に記載される腫瘍または参照遺伝子もしくは遺伝子産物由来のサブゲノ
ム間隔を含む腫瘍もしくは癌関連または参照(例えば、野生型)メンバーを選択する第1
のベイトセット、
b)表1もしくは表2に記載される遺伝子もしくは遺伝子産物由来のサブゲノム間隔を
(aと同一または異なるサブゲノム間隔において)含むPGxメンバーを選択する第2の
ベイトセットのうちの少なくとも1つもしくは2つを含む。
【0244】
ある特定の実施形態において、方法またはアッセイは、該メンバーを配列決定するステ
ップをさらに含む。ある特定の実施形態において、少なくとも1、2、3、4、5、6、
7、8、9、10、20、30名、もしくはそれ以上の対象由来の腫瘍メンバーが配列決
定される(例えば、それぞれの対象由来の表1もしくは表1Aの遺伝子または遺伝子産物
由来の少なくとも50、75、100、もしくは150個のサブゲノム間隔が配列決定さ
れる)。
【0245】
ある特定の実施形態において、方法またはアッセイは、核酸試料において、表1の少な
くとも10個(例えば、20、30、40個)の優先、癌、またはPGx遺伝子もしくは
遺伝子産物の事前選択された変化(例えば、対立遺伝子変異)を検出するステップをさら
に含む。ある特定の実施形態において、変化(例えば、対立遺伝子変異)は、とりわけ、
細胞遺伝学的異常、非相反転座、再編成、染色体内逆位、変異、点変異、欠失、遺伝子コ
ピー数の変化、SNPを含む。
【0246】
ある特定の実施形態において、方法またはアッセイは、検出された変化(例えば、対立
遺伝子変異)の存在もしくは不在を参照値(例えば、文献報告書または腫瘍試料と同一の
対象または異なる対象由来の対照試料の配列、例えば、血液適合対照またはNAT(正常
な隣接腫瘍))と比較するステップをさらに含む。
【0247】
ある特定の実施形態において、方法またはアッセイは、変化(例えば、事前選択された
対立遺伝子変異)の存在もしくは不在をメモリアライズし、かつ例えば、メモリアライゼ
ーションを含む報告書を提供するするステップをさらに含む。
【0248】
ある特定の実施形態において、方法またはアッセイは、変化をアノテートし、かつ例え
ば、変異構造の指標を有する事前選択された対立遺伝子変異、例えば、ミスセンス変異、
または関数、例えば、疾患表現型との関連をアノテートするステップをさらに含む。
【0249】
ある特定の実施形態において、方法またはアッセイは、データセットを提供するステッ
プをさらに含み、データセットのそれぞれの要素は、腫瘍型、遺伝子、および事前選択さ
れた変化(例えば、対立遺伝子変異)(「TGA」)の関連性を含む。
【0250】
ある特定の実施形態において、方法またはアッセイは、対象のTGAの存在もしくは不
在をメモリアライズし、任意で関連したアノテーションを行って、報告書を形成するステ
ップをさらに含む。
【0251】
ある特定の実施形態において、方法またはアッセイは、報告書を受領関係者に送信する
ステップをさらに含む。
【0252】
前述の選択方法および試薬を含むアッセイ、例えば、マルチプレックスアッセイも提供
される。
核酸試料
【0253】
様々な組織試料が、本方法で使用される核酸試料の供給源であり得る。ゲノムまたはサ
ブゲノム核酸(例えば、DNAまたはRNA)を、対象の試料(例えば、腫瘍試料、正常
な隣接組織(NAT)、血液試料、循環腫瘍細胞(CTC)もしくは任意の正常な対照を
含有する試料)から単離することができる。ある特定の実施形態において、組織試料は、
冷凍試料またはホルムアルデヒドもしくはパラホルムアルデヒド固定パラフィン包埋(F
FPE)組織調製物として保存される。例えば、試料を、マトリックス、例えば、FFP
Eブロック、または冷凍試料に埋め込んでもよい。単離ステップは、個別の染色体の流動
選別、および/または対象の試料(例えば、腫瘍試料、NAT、血液試料)のミクロ解剖
を含んでもよい。
【0254】
「単離された」核酸分子は、核酸分子の天然供給源に存在する他の核酸分子から分離さ
れるものである。ある特定の実施形態において、「単離された」核酸分子は、核酸が由来
する生物のゲノムDNA中の核酸に自然に隣接する配列(タンパク質をコードする配列等
)(すなわち、核酸の5’末端および3’末端に位置する配列)を含まない。例えば、様
々な実施形態において、単離された核酸分子は、核酸が由来する細胞のゲノムDNA中の
核酸分子に自然に隣接するヌクレオチド配列の約5kB未満、約4kB未満、約3kB未
満、約2kB未満、約1kB未満、約0.5kB未満、または約0.1kB未満を含有し
得る。さらに、cDNA分子等の「単離された」核酸分子は、組換え技術によって産生さ
れるときに他の細胞物質または培養培地を実質的に含まないか、または化学的に合成され
るときに化学的前駆体もしくは他の化学物質を実質的に含まない場合がある。
【0255】
「他の細胞物質もしくは培養培地を実質的に含まない」という言い回しは、分子が細胞
の細胞成分から分離される核酸分子の調製物を含み、分子が細胞の細胞成分から単離され
るか、または組換え産生される。したがって、細胞物質を実質的に含まない核酸分子は、
他の細胞物質または培養培地の約30乾燥重量%未満、約20乾燥重量%未満、約10乾
燥重量%未満、もしくは約5乾燥重量%未満を有する核酸分子の調製物を含む。
【0256】
ある特定の実施形態において、核酸は、熟成試料、例えば、熟成FFPE試料から単離
される。熟成試料は、例えば、年齢、例えば、1年、2年、3年、4年、5年、10年、
15年、20年、25年、50年、75年、もしくは100年齢、またはそれ以上の年齢
であり得る。
【0257】
核酸試料を、様々な大きさの組織試料(例えば、生検またはFFPE試料)から得るこ
とができる。例えば、核酸を、5~200μm、またはそれより大きい組織試料から単離
することができる。例えば、組織試料は、5μm、10μm、20μm、30μm、40
μm、50μm、70μm、100μm、110μm、120μm、150μm、もしく
は200μm、またはそれ以上の大きさであることができる。
【0258】
組織試料からのDNA単離のプロトコルが実施例1に提供される。核酸(例えば、DN
A)をホルムアルデヒドまたはパラホルムアルデヒド固定パラフィン包埋(FFPE)組
織から単離するさらなる方法が、例えば、Cronin M.et al.,(2004
)Am J Pathol.164(1):35-42、Masuda N.et al
.,(1999)Nucleic Acids Res.27(22):4436-44
43、Specht K.et al.,(2001)Am J Pathol.158
(2):419-429、Ambion RecoverAll(商標)全核酸単離プロ
トコル(Ambion、カタログ番号AM1975、2008年9月)、Maxwell
(登録商標)16 FFPEPlus LEV DNA精製キット技術マニュアル(Pr
omega文献番号TM349、2011年2月)、E.Z.N.A.(登録商標)FF
PE DNAキットハンドブック(OMEGA bio-tek,Norcross,G
A、製品番号D3399-00、D3399-01、およびD3399-02、2009
年6月)、ならびにQIAamp(登録商標)DNA FFPE組織ハンドブック(Qi
agen、カタログ番号37625、2007年10月)に開示される。Recover
All(商標)全核酸単離キットは、パラフィン包埋試料を可溶化するためにキシレンを
高温で、かつ核酸を捕捉するためにガラス繊維フィルタを使用する。Maxwell(登
録商標)16 FFPEPlus LEV DNA精製キットは、1~10μmのFFP
E組織切片由来のゲノムDNAの精製のために、Maxwell(登録商標)16機器と
ともに使用される。DNAは、シリカクラッド常磁性粒子(PMP)を用いて精製され、
低溶出体積中に溶出される。E.Z.N.A.(登録商標)FFPE DNAキットは、
ゲノムDNAの単離のためにスピンカラムおよび緩衝系を使用する。QIAamp(登録
商標)DNA FFPE組織キットは、ゲノムおよびミトコンドリアDNAの精製のため
にQIAamp(登録商標)DNAマイクロ技術を使用する。血液からのDNA単離のプ
ロトコルが、例えば、Maxwell(登録商標)16 LEV血液DNAキットおよび
Maxwell 16 Buccal Swab LEV DNA精製キット技術マニュ
アル(Promega文献番号TM333、2011年1月1日)に開示される。
【0259】
RNA単離のプロトコルが、例えば、Maxwell(登録商標)16全RNA精製キ
ット技術告示(Promega文献番号TB351、2009年8月)に開示される。
【0260】
単離された核酸試料(例えば、ゲノムDNA試料)を、日常の技術を実践して断片化ま
たは剪断することができる。例えば、物理的剪断方法、酵素的切断方法、化学的切断方法
、および当業者に周知の他の方法によって、ゲノムDNAを断片化することができる。核
酸ライブラリは、ゲノムの複雑度のうちのすべてまたは実質的にすべてを含有し得る。「
実質的にすべて」という用語は、この文脈において、実際には、手順の最初のステップ中
に、ゲノムの複雑度にある望ましくない喪失が存在し得る可能性を指す。本明細書に記載
の方法は、核酸ライブラリがゲノムの一部である場合、すなわち、ゲノムの複雑度が設計
によって低下する場合にも有用である。いくつかの実施形態では、ゲノムの任意の選択さ
れた部分を本明細書に記載の方法とともに使用することができる。ある特定の実施形態に
おいて、全エクソームまたはそのサブセットが単離される。
【0261】
本発明が特色とする方法は、核酸試料を単離して、ライブラリ(例えば、本明細書に記
載の核酸ライブラリ)を提供することをさらに含むことができる。ある特定の実施形態に
おいて、核酸試料は、全ゲノム断片、サブゲノム断片、またはこれらの両方を含む。単離
された核酸試料を用いて、核酸ライブラリを調製することができる。したがって、一実施
形態において、本発明で取り上げられる方法は、核酸試料を単離して、ライブラリ(例え
ば、本明細書に記載の核酸ライブラリ)を提供することをさらに含む。ライブラリを全ゲ
ノム断片またはサブゲノム断片から単離および調製するためのプロトコル(例えば、Il
luminaのゲノムDNA試料調製キット)は、当技術分野で既知である。ある特定の
実施形態において、ゲノムまたはサブゲノムDNA断片は、対象の試料(例えば、腫瘍試
料、正常な隣接組織(NAT)、血液試料、または任意の正常な対照)から単離される。
一実施形態において、試料(例えば、腫瘍またはNAT試料)は、保存された検体である
。例えば、試料は、マトリックス、例えば、FFPEブロックまたは冷凍試料に埋め込ま
れる。ある特定の実施形態において、単離ステップは、個別の染色体の流動選別、および
/または対象の試料(例えば、腫瘍試料、NAT、血液試料)のミクロ解剖を含む。ある
特定の実施形態において、核酸ライブラリを生成するために使用される核酸試料は、5マ
イクログラム未満、1マイクログラム未満、または500ng未満、200ng未満、1
00ng未満、50ng未満、10ng未満、5ng未満、もしくは1ng未満である。
【0262】
さらに他の実施形態において、ライブラリを生成するために使用される核酸試料は、R
NAまたはRNA由来のcDNAを含む。いくつかの実施形態では、RNAは、全細胞R
NAを含む。他の実施形態では、ある特定の豊富なRNA配列(例えば、リボソームRN
A)が枯渇している。いくつかの実施形態では、全RNA調製物中のポリ(A)尾部mR
NA画分が濃縮されている。いくつかの実施形態では、cDNAは、ランダムプライムc
DNA合成法によって産生される。他の実施形態では、cDNA合成は、オリゴ(dT)
含有オリゴヌクレオチドによるプライミングによって、成熟したmRNAのポリ(A)尾
部で始まる。枯渇方法、ポリ(A)濃縮方法、およびcDNA合成方法は、当業者に周知
である。
【0263】
方法は、当業者に周知の特異的または非特異的核酸増幅法によって核酸試料を増幅する
ことをさらに含んでもよい。いくつかの実施形態、ある特定の実施形態では、核酸試料は
、例えば、ランダムプライム鎖置換増幅等の全ゲノム増幅法によって増幅される。
【0264】
他の実施形態では、核酸試料は、物理的もしくは酵素的方法によって断片化または剪断
され、合成アダプターにライゲートされ、寸法選択され(例えば、分取ゲル電気泳動によ
って)増幅される(例えば、PCRによって)。他の実施形態では、断片化され、かつア
ダプターでライゲートされた核酸の基は、ハイブリッド選択の前に明確な寸法選択または
増幅なしで使用される。
【0265】
他の実施形態では、単離されたDNA(例えば、ゲノムDNA)は、断片化または剪断
される。いくつかの実施形態では、ライブラリは、ゲノムの簡約表示または定義された部
分である、例えば、他の手段によって細分画されたゲノムDNAの細画分等のゲノムDN
Aの50%未満を含む。他の実施形態では、ライブラリは、すべてまたは実質的にすべて
のゲノムDNAを含む。
【0266】
いくつかの実施形態では、ライブラリは、ゲノムの簡約表示または定義された部分であ
る、例えば、他の手段によって細分画されたゲノムDNAの細画分等のゲノムDNAの5
0%未満を含む。他の実施形態では、ライブラリは、すべてまたは実質的にすべてのゲノ
ムDNAを含む。ライブラリを全ゲノムまたはサブゲノム断片から単離および調製するた
めのプロトコルは、当技術分野で既知であり(例えば、IlluminaのゲノムDNA
試料調製キット)、実施例2A、2B、および3として本明細書に記載される。DNA剪
断の代替方法が実施例2Bとして本明細書に記載される。例えば、代替のDNA剪断方法
は、より自動化可能であり、かつ/またはより効率的であり得る(例えば、劣化したFF
PE試料を用いて)。DNA剪断方法の代替案を、ライブラリ調製中のライゲーションス
テップを回避するために使用することもできる。
【0267】
本明細書に記載の方法を、例えば、供給源DNAの量が限定的であるとき(例えば、全
ゲノム増幅後でさえも)少量の核酸を用いて行うことができる。一実施形態において、核
酸は、約5μg、4μg、3μg、2μg、1μg、0.8μg、0.7μg、0.6μ
g、0.5μg、または400ng、300ng、200ng、100ng、50ng、
10ng、5ng、1ng未満、もしくはそれ以下の核酸試料を含む。例えば、典型的に
は、50~100ngのゲノムDNAから始めてもよい。しかしながら、ハイブリダイゼ
ーションステップ、例えば、溶液ハイブリダイゼーションの前にゲノムDNAを増幅する
場合(例えば、PCRを用いて)、それ未満で始めてもよい。したがって、ハイブリダイ
ゼーション、例えば、溶液ハイブリダイゼーションの前にゲノムDNAを増幅することは
可能であるが、必須ではない。
【0268】
ライブラリを生成するために使用される核酸試料は、RNAまたはRNA由来のcDN
Aも含み得る。いくつかの実施形態では、RNAは、全細胞RNAを含む。他の実施形態
では、ある特定の豊富なRNA配列(例えば、リボソームRNA)が枯渇している。他の
実施形態では、全RNA調製物中のポリ(A)尾部mRNA画分が濃縮されている。いく
つかの実施形態では、cDNAは、ランダムプライムcDNA合成法によって産生される
。他の実施形態では、cDNA合成は、オリゴ(dT)含有オリゴヌクレオチドによるプ
ライミングによって、成熟したmRNAのポリ(A)尾部で始まる。枯渇方法、ポリ(A
)濃縮方法、およびcDNA合成方法は、当業者に周知である。
【0269】
方法は、当業者に既知の特異的または非特異的核酸増幅法によって核酸試料を増幅する
ことをさらに含んでもよい。核酸試料を、例えば、ランダムプライム鎖置換増幅等の全ゲ
ノム増幅法によって増幅することができる。
【0270】
核酸試料を、本明細書に記載の物理的もしくは酵素的方法によって断片化または剪断し
、合成アダプターにライゲートし、寸法選択し(例えば、分取ゲル電気泳動によって)、
増幅する(例えば、PCRによって)ことができる。断片化され、かつアダプターでライ
ゲートされた核酸の基は、ハイブリッド選択の前に明確な寸法選択または増幅なしで使用
される。
ライブラリメンバー
【0271】
本明細書で使用される「メンバー」もしくは「ライブラリメンバー」または他の同様の
用語は、ライブラリのメンバー(または「ライブラリ捕獲物」)である核酸分子、例えば
、DNAまたはRNAを指す。ライブラリメンバーは、本明細書に記載の腫瘍メンバー、
参照メンバー、またはPGxメンバーのうちの1つ以上であり得る。典型的には、メンバ
ーは、DNA分子、例えば、ゲノムDNAまたはcDNA分子である。メンバーを、例え
ば、酵素的に、またはゲノムDNAを剪断することによって断片化することができる。メ
ンバーは、対象由来のヌクレオチド配列を含むことができ、対象由来ではないヌクレオチ
ド配列、例えば、プライマーまたはアダプター(例えば、PCR増幅または配列決定のた
めに)、または試料の特定を可能にする配列、例えば、「バーコード」配列も含むことが
できる。
【0272】
本明細書で使用される「標的メンバー」は、核酸ライブラリから単離することが所望さ
れる核酸分子を指す。一実施形態において、標的メンバーは、本明細書に記載の腫瘍メン
バー、参照メンバー、またはPGxメンバーであり得る。実際に核酸ライブラリから選択
されるメンバーは、本明細書で「ライブラリ捕獲物」と称される。一実施形態において、
ライブラリ捕獲物は、ライブラリのメンバーの選択または濃縮、例えば、本明細書に記載
の1つ以上のラウンドのハイブリッド捕捉後のライブラリの濃縮または選択された出力を
含む。
【0273】
標的メンバーは、ライブラリのサブグループであり得、すなわち、ライブラリメンバー
のすべてが本明細書に記載のプロセスの任意の特定の使用によって選択されるわけではな
い。他の実施形態では、標的メンバーは、所望の標的領域内である。例えば、標的メンバ
ーは、いくつかの実施形態では、最低で10%または最高で95%~98%、またはそれ
以上のライブラリメンバーの割合であってもよい。一実施形態において、ライブラリ捕獲
物は、標的メンバーの少なくとも約20%、30%、40%、50%、60%、70%、
75%、80%、85%、90%、95%、98%、99%、99.9%、またはそれ以
上を含む。別の実施形態では、ライブラリは、標的メンバーの100%を含有する。一実
施形態において、ライブラリ捕獲物の純度(標的に対してアライメントする読み取りの割
合)は、少なくとも約20%、30%、40%、50%、60%、70%、75%、80
%、85%、90%、95%、98%、99%、99.9%、またはそれ以上である。
【0274】
ゲノムDNAから得られる標的メンバー(またはライブラリ捕獲物)は、それがゲノム
DNAの約0.0001%未満、少なくとも約0.0001%、少なくとも約0.001
%、少なくとも約0.01%、または少なくとも約0.1%を含むように、全ゲノムDN
Aのごく一部を含み得るか、またはそれがゲノムDNAの少なくとも約1%、2%、3%
、4%、5%、6%、7%、8%、9%、もしくは10%、またはゲノムDNAの10%
超を含むように、全ゲノムDNAのより有意な割合を含み得る。
【0275】
一実施形態において、標的メンバー(またはライブラリ捕獲物)は、ゲノムの複合混合
物から選択される。例えば、1つの細胞型(例えば、癌細胞)由来のDNAの選択は、他
の細胞型(例えば、正常な細胞)由来のDNAを含有する試料からである。そのような適
用において、標的メンバーは、複合試料に存在する核酸配列の全複雑度の0.0001%
未満、少なくとも0.0001%、少なくとも約0.001%、少なくとも約0.01%
、もしくは少なくとも約0.1%を含み得るか、またはそれが複合試料に存在する核酸配
列の全複雑度の少なくとも約1%、2%、5%、10%、もしくは10%超を含むように
、より有意な割合を含み得る。
【0276】
一実施形態において、本明細書に記載の方法(例えば、溶液ハイブリダイゼーション選
択法)によって選択された標的メンバー(またはライブラリ捕獲物)は、ゲノム中のエク
ソンのすべてまたは一部、例えば、ゲノムエクソンの約0.1%、1%、2%、5%、1
0%、20%、30%、40%、50%、60%、70%、80%、90%、もしくは9
5%超を含む。別の実施形態では、標的メンバー(またはライブラリ捕獲物)は、特定の
群のエクソン、例えば、少なくとも約100、200、300、400、500、600
、700、800、900、または1000個の特定のエクソン、例えば、癌等の特定の
疾患に関連したエクソンであり得る。さらに別の実施形態では、標的メンバー(またはラ
イブラリ捕獲物)は、目的とする選択された遺伝子のエクソンまたは他の部分を含有する
。特定のベイト配列の使用は、熟練者が標的配列(選択される理想的な組の配列)および
多くのエクソンもしくはわずかなエクソン(または他の配列)を含有する核酸のサブグル
ープ(選択される実際の組の配列)を特定の選択のために核酸の群から選択することを可
能にする。
【0277】
一実施形態において、標的メンバー(またはライブラリ捕獲物)は、一組のcDNAを
含む。cDNA捕捉を用いて、例えば、スプライスバリアントを見出し、融合転写物を特
定する(例えば、ゲノムDNA転座から)ことができる。別の実施形態では、標的メンバ
ー(およびライブラリ捕獲物)は、例えば、腫瘍中の細胞、組織、または器官のRNA画
分に現れる単一塩基変化および他の配列変化を見出すために使用される。
【0278】
標的メンバー(またはライブラリ捕獲物)(例えば、エクソン、cDNA、および他の
配列)は、所望に応じて、関連性があってもなくてもよい。例えば、選択された標的メン
バー(およびライブラリ捕獲物)を、疾患に関与する遺伝子である核酸の群、例えば、癌
等の1つ以上の疾患に関与する遺伝子の群、特定のSNPを含有する核酸の群から得るこ
とができる。
ベイトの設計および構築
【0279】
ベイトは、標的核酸にハイブリダイズし(例えば、標的核酸に相補的であり)、それに
よって、標的核酸の捕捉を可能にすることができる核酸分子、例えば、DNA分子または
RNA分子であり得る。一実施形態において、ベイトは、RNA分子である。他の実施形
態では、ベイトは、例えば、結合実体に結合することによって、ベイトによって形成され
たハイブリッドおよびベイトにハイブリダイズした核酸の捕捉および分離を可能にする結
合実体、例えば、親和性タグを含む。一実施形態において、ベイトは、溶液相ハイブリダ
イゼーションに好適である。
【0280】
典型的には、RNA分子が、ベイト配列として使用される。RNA-DNA二本鎖は、
DNA-DNA二本鎖よりも安定しており、したがって、潜在的により良好な核酸の捕捉
を提供する。
【0281】
DNA依存性RNAポリメラーゼを用いたDNA分子のデノボ化学合成および転写を含
むが、これに限定されない当技術分野で既知の方法を用いて、RNAベイトを本明細書の
他の箇所で記載されるように作製することができる。一実施形態において、ベイト配列は
、PCR等の既知の核酸増幅法を用いて、例えば、鋳型としてヒトDNAまたはプールさ
れたヒトDNA試料を用いて産生される。その後、オリゴヌクレオチドをRNAベイトに
変換することができる。一実施形態において、生体外転写は、例えば、RNAポリメラー
ゼプロモーター配列のオリゴヌクレオチドの一方の末端への付加に基づいて使用される。
一実施形態において、RNAポリメラーゼプロモーター配列は、例えば、PCRまたは他
の核酸増幅法を用いてベイト配列を増幅または再増幅することによって、例えば、それぞ
れの標的特異的プライマー対の一方のプライマーにRNAプロモーター配列をテーリング
することによって、ベイトの末端に付加される。一実施形態において、RNAポリメラー
ゼは、T7ポリメラーゼ、SP6ポリメラーゼ、またはT3ポリメラーゼである。一実施
形態において、RNAベイトは、タグ、例えば、親和性タグで標識化される。一実施形態
において、RNAベイトは、例えば、ビオチン化されたUTPを用いた生体外転写によっ
て作製される。別の実施形態では、RNAベイトは、ビオチンを用いることなく産生され
、その後、ビオチンは、ソラレン架橋結合等の当技術分野で周知の方法を用いて、RNA
分子に架橋結合される。一実施形態において、RNAベイトは、RNase抵抗性RNA
分子であり、例えば、転写中に修飾されたヌクレオチドを用いて作製し、RNase分解
に抵抗するRNA分子を産生することができる。一実施形態において、RNAベイトは、
二本鎖DNA標的の1本の鎖にのみ一致する。典型的には、そのようなRNAベイトは、
自己相補的ではなく、ハイブリダイゼーションドライバとしてより効果的である。
【0282】
ベイトが参照配列の標的選択に最適であるように、ベイトセットを参照配列から設計す
ることができる。いくつかの実施形態では、ベイト配列は、混合塩基(例えば、縮重)を
用いて設計される。例えば、混合塩基(複数を含む)を共通のSNPまたは変異の位置(
複数を含む)でベイト配列に含み、ベイト配列を最適化して、両方の対立遺伝子(例えば
、SNPおよび非SNP、変異体および非変異体)を捕獲することができる。いくつかの
実施形態では、すべての既知の配列バリエーション(またはそのサブセット)を、混合縮
重オリゴヌクレオチドを用いるのではなく、複数のオリゴヌクレオチドベイトで標的化す
ることができる。
【0283】
ある特定の実施形態において、ベイトセットは、約100ヌクレオチド長~300ヌク
レオチド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。典型的に
は、ベイトセットは、約130ヌクレオチド長~230ヌクレオチド長、または約150
~200ヌクレオチド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含
む。他の実施形態では、ベイトセットは、約300ヌクレオチド長~1000ヌクレオチ
ド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。
【0284】
いくつかの実施形態では、オリゴヌクレオチド中の標的メンバー特異的配列は、約40
~1000ヌクレオチド長、約70~300ヌクレオチド長、約100~200ヌクレオ
チド長、典型的には、約120~170ヌクレオチド長である。
【0285】
いくつかの実施形態では、ベイトセットは、結合実体を含む。結合実体は、それぞれの
ベイト配列上の親和性タグであり得る。いくつかの実施形態では、親和性タグは、ビオチ
ン分子またはハプテンである。ある特定の実施形態において、結合実体は、アビジン分子
等のパートナー、またはハプテンもしくはその抗原結合断片に結合する抗体に結合するこ
とによって、ベイト/メンバーハイブリッドのハイブリダイゼーション混合物からの分離
を可能にする。
【0286】
他の実施形態では、ベイトセット中のオリゴヌクレオチドは、同一の標的メンバー配列
に対して順方向および逆位の相補的配列を含有し、それによって、逆方向相補メンバー特
異的配列を有するオリゴヌクレオチドは、逆方向に相補的なユニバーサル尾部も担持する
。これは、同一の鎖である、すなわち、相互に相補的ではないRNA転写物をもたらし得
る。
【0287】
他の実施形態では、ベイトセットは、1つ以上の位置で縮重または混合塩基を含有する
オリゴヌクレオチドを含む。さらに他の実施形態において、ベイトセットは、生物の単一
の種または群集の集団に存在する複数または実質的にすべての既知の配列バリアントを含
む。一実施形態において、ベイトセットは、ヒト集団に存在する複数または実質的にすべ
ての既知の配列バリアントを含む。
【0288】
他の実施形態では、ベイトセットは、cDNA配列を含むか、またはcDNA配列に由
来する。他の実施形態では、ベイトセットは、ゲノムDNA、cDNA、またはクローン
化DNAから増幅される増幅産物(例えば、PCR産物)を含む。
【0289】
他の実施形態では、ベイトセットは、RNA分子を含む。いくつかの実施形態では、ベ
イトセットは、より安定しており、かつRNaseに対して抵抗性を示すRNA分子を含
むが、これに限定されない、化学的かつ酵素的に修飾されたか、または生体外で転写され
たRNA分子を含む。
【0290】
さらに他の実施形態では、ベイトは、参照により本明細書に組み込まれる米国第201
0/0029498号およびGnirke,A.et al.(2009)Nat Bi
otechnol.27(2):182-189に記載の方法によって産生される。例え
ば、ビオチン化されたRNAベイトを、マイクロアレイ上に最初に合成された長い合成オ
リゴヌクレオチドのプールを得て、かつオリゴヌクレオチドを増幅してベイト配列を産生
することによって産生することができる。いくつかの実施形態では、ベイトは、ベイト配
列の一方の末端にRNAポリメラーゼプロモーター配列を付加し、かつRNAポリメラー
ゼを用いてRNA配列を合成することによって産生される。一実施形態において、合成オ
リゴデオキシヌクレオチドのライブラリを、Agilent Technologies
,Inc.等の商業的供給業者から入手することができ、既知の核酸増幅法を用いて増幅
することができる。
【0291】
したがって、前述のベイトセットの作製方法が提供される。方法は、1つ以上の標的特
異的ベイトオリゴヌクレオチド配列(例えば、本明細書に記載の参照または対照オリゴヌ
クレオチド配列を捕捉する1つ以上の変異)を選択すること、標的特異的ベイトオリゴヌ
クレオチド配列のプールを得る(例えば、マイクロアレイ合成によって、例えば、標的特
異的ベイトオリゴヌクレオチド配列のプールを合成する)こと、および任意で、オリゴヌ
クレオチドを増幅してベイトセットを産生することを含む。
【0292】
他の実施形態では、方法は、1つ以上のビオチン化されたプライマーを用いてオリゴヌ
クレオチドを増幅する(例えば、PCRによって)ことをさらに含む。いくつかの実施形
態では、オリゴヌクレオチドは、マイクロアレイに結合したそれぞれのオリゴヌクレオチ
ドの末端にユニバーサル配列を含む。方法は、ユニバーサル配列をオリゴヌクレオチドか
ら除去することをさらに含み得る。そのような方法は、オリゴヌクレオチドの相補鎖を除
去することと、オリゴヌクレオチドをアニーリングすることと、オリゴヌクレオチドを伸
長することとも含み得る。これらの実施形態のいくつかにおいて、オリゴヌクレオチドを
増幅する(例えば、PCRによって)方法は、1つ以上のビオチン化されたプライマーを
用いる。いくつかの実施形態では、方法は、増幅したオリゴヌクレオチドをサイズ選択す
ることをさらに含む。
【0293】
一実施形態において、RNAベイトセットが作製される。方法は、本明細書に記載の方
法に従って一組のベイト配列を産生すること、ベイト配列の一方の末端にRNAポリメラ
ーゼプロモーター配列を付加すること、およびRNAポリメラーゼを用いてRNA配列を
合成することを含む。RNAポリメラーゼを、T7 RNAポリメラーゼ、SP6 RN
Aポリメラーゼ、またはT3 RNAポリメラーゼから選択することができる。他の実施
形態では、RNAポリメラーゼプロモーター配列は、ベイト配列を増幅する(例えば、P
CRによって)ことによって、ベイト配列の末端に付加される。ベイト配列がゲノムまた
はcDNA由来の特異的プライマー対を用いてPCRによって増幅される実施形態におい
て、それぞれの対における2つの特異的プライマーのうちの1つの5’末端へのRNAプ
ロモーター配列の付加が、標準方法を用いてRNAベイトに転写され得るPCR産物をも
たらす。
【0294】
他の実施形態では、ベイトセットを、鋳型としてヒトDNAまたはプールされたヒトD
NA試料を用いて産生することができる。そのような実施形態において、オリゴヌクレオ
チドは、ポリメラーゼ連鎖反応(PCR)によって増幅される。他の実施形態では、増幅
したオリゴヌクレオチドは、ローリングサークル増幅または超分岐ローリングサークル増
幅によって再増幅される。鋳型としてヒトDNAまたはプールされたヒトDNA試料を用
いてベイト配列を産生するために、同一の方法を使用することもできる。制限消化、パル
スフィールドゲル電気泳動、流動選別、CsCl密度勾配遠心分離法、選択的動的再会合
、染色体調製物のミクロ解剖、および当業者に既知の他の分画方法を含むが、これらに限
定されない他の方法によって得られるゲノムの細画分を用いてベイト配列を産生するため
に、同一の方法を使用することもできる。
【0295】
ある特定の実施形態において、ベイトセット中のベイトの数は、1,000未満である
。他の実施形態では、ベイトセット中のベイトの数は、1,000を超えるか、5,00
0を超えるか、10,000を超えるか、20,000を超えるか、50,000を超え
るか、100,000を超えるか、または500,000を超える。
【0296】
一実施形態において、ベイト配列は、例えば、SNPをコードする標的遺伝子もしくは
遺伝子産物、またはその断片におけるその結合能力(例えば、親和性および/または特異
性)を増大させるために、SNPに相補的な塩基を選択する。例となる遺伝子もしくは遺
伝子産物には、ABCB1、ABCC2、ABCC4、ABCG2、C1orf144、
CYP1B1、CYP2C19、CYP2C8、CYP2D6、CYP3A4、CYP3
A5、DPYD、ERCC2、ESR2、FCGR3A、GSTP1、ITPA、LRP
2、MAN1B1、MTHFR、NQO1、NRP2、SLC19A1、SLC22A2
、SLCO1B3、SOD2、SULT1A1、TPMT、TYMS、UGT1A1、お
よびUMPSが含まれるが、これらに限定されない。
【0297】
別の実施形態では、ベイトセットは、癌に関連した標的遺伝子もしくは遺伝子産物、ま
たはその断片中のコドンを選択する。例となる遺伝子もしくは遺伝子産物には、ABL1
(例えば、コドン315)、AKT1、ALK、APC(例えば、コドン1114、13
38、1450、および1556)、AR、BRAF(例えば、コドン600)、CDK
N2A、CEBPA、CTNNB1(例えば、コドン32、33、34、37、41、お
よび45)、EGFR(例えば、719、746~750、768、790、858、お
よび861)、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FLT3
(例えば、コドン835)、HRAS(例えば、コドン12、13、および61)、JA
K2(例えば、コドン617)、KIT(例えば、コドン816)、KRAS(例えば、
コドン12、13、および61)、MET、MLL、MYC、NF1、NOTCH1、N
PM1、NRAS、PDGFRA、PIK3CA(例えば、コドン88、542、545
、546、1047、および1049)、PTEN(例えば、コドン130、173、2
33、および267)、RB1、RET(例えば、コドン918)、TP53(例えば、
175、245、248、273、および306)が含まれるが、これらに限定されない
。
【0298】
さらに別の実施形態では、ベイトセットは、癌に関連した標的遺伝子もしくは遺伝子産
物、またはその断片を選択する。例となる遺伝子もしくは遺伝子産物には、ABL2、A
KT2、AKT3、ARAF、ARFRP1、ARID1A、ATM、ATR、AURK
A、AURKB、BCL2、BCL2A1、BCL2L1、BCL2L2、BCL6、B
RCA1、BRCA2、CARD11、CBL、CCND1、CCND2、CCND3、
CCNE1、CDH1、CDH2、CDH20、CDH5、CDK4、CDK6、CDK
8、CDKN2B、CDKN2C、CHEK1、CHEK2、CRKL、CRLF2、D
NMT3A、DOT1L、EPHA3、EPHA5、EPHA6、EPHA7、EPHB
1、EPHB4、EPHB6、ERBB3、ERBB4、ERG、ETV1、ETV4、
ETV5、ETV6、EWSR1、EZH2、FANCA、FBXW7、FGFR4、F
LT1、FLT4、FOXP4、GATA1、GNA11、GNAQ、GNAS、GPR
124、GUCY1A2、HOXA3、HSP90AA1、IDH1、IDH2、IGF
1R、IGF2R、IKBKE、IKZF1、INHBA、IRS2、JAK1、JAK
3、JUN、KDR、LRP1B、LTK、MAP2K1、MAP2K2、MAP2K4
、MCL1、MDM2、MDM4、MEN1、MITF、MLH1、MPL、MRE11
A、MSH2、MSH6、MTOR、MUTYH、MYCL1、MYCN、NF2、NK
X2-1、NTRK1、NTRK3、PAK3、PAX5、PDGFRB、PIK3R1
、PKHD1、PLCG1、PRKDC、PTCH1、PTPN11、PTPRD、RA
F1、RARA、RICTOR、RPTOR、RUNX1、SMAD2、SMAD3、S
MAD4、SMARCA4、SMARCB1、SMO、SOX10、SOX2、SRC、
STK11、TBX22、TET2、TGFBR2、TMPRSS2、TOP1、TSC
1、TSC2、USP9X、VHL、およびWT1が含まれるが、これらに限定されない
。
【0299】
ベイト配列は、約70ヌクレオチド長~1000ヌクレオチド長であり得る。一実施形
態において、ベイトの長さは、約100~300ヌクレオチド長、110~200ヌクレ
オチド長、または120~170ヌクレオチド長である。上述のものに加えて、約70、
80、90、100、110、120、130、140、150、160、170、18
0、190、200、210、220、230、240、250、300、400、50
0、600、700、800、および900ヌクレオチド長の中程度のオリゴヌクレオチ
ドを本明細書に記載の方法で使用することができる。いくつかの実施形態では、約70、
80、90、100、110、120、130、140、150、160、170、18
0、190、200、210、220、または230塩基長のオリゴヌクレオチドを用い
ることができる。
【0300】
それぞれのベイト配列は、標的特異的(例えば、メンバー特異的)ベイト配列および一
方または両方の末端にユニバーサル尾部を含み得る。本明細書で使用される「ベイト配列
」という用語は、標的特異的ベイト配列、または標的特異的「ベイト配列」およびオリゴ
ヌクレオチドの他のヌクレオチドを含む全オリゴヌクレオチドを指し得る。ベイトの標的
特異的配列は、約40ヌクレオチド長~1000ヌクレオチド長である。一実施形態にお
いて、標的特異的配列は、約70ヌクレオチド長~300ヌクレオチド長である。別の実
施形態では、標的特異的配列は、約100ヌクレオチド長~200ヌクレオチド長である
。さらに別の実施形態では、標的特異的配列は、約120ヌクレオチド長~170ヌクレ
オチド長、典型的には、120ヌクレオチド長である。上述のものに加えて中程度の長さ
、例えば、約40、50、60、70、80、90、100、110、120、130、
140、150、160、170、180、190、200、210、220、230、
240、250、300、400、500、600、700、800、および900ヌク
レオチド長の標的特異的配列、ならびに上述の範囲内の長さの標的特異的配列等も本明細
書に記載の方法で使用することができる。
【0301】
一実施形態において、ベイトは、約50~200ヌクレオチド長(例えば、約50、6
0、80、90、100、110、120、130、140、150、160、170、
190、または200ヌクレオチド長)のオリゴマー(例えば、RNAオリゴマー、DN
Aオリゴマー、またはそれらの組み合わせから成る)である。一実施形態において、それ
ぞれのベイトオリゴマーは、標的特異的ベイト配列である約120~170個、または典
型的には、約120個のヌクレオチドを含む。ベイトは、一方または両方の末端に追加の
非標的特異的ヌクレオチド配列を含み得る。それらの追加のヌクレオチド配列を、例えば
、PCT増幅のために、またはベイト識別子として使用してもよい。ある特定の実施形態
において、ベイトは、本明細書に記載の結合実体(例えば、ビオチン分子等の捕捉タグ)
をさらに含む。結合実体、例えば、ビオチン分子は、ベイト、例えば、ベイトの5’末端
、3’末端、または内部に(例えば、ビオチン化されたヌクレオチドを組み込むことによ
って)結合することができる。一実施形態において、ビオチン分子は、ベイトの5’末端
に結合する。
【0302】
例となる一実施形態において、ベイトは、約150ヌクレオチド長のオリゴヌクレオチ
ドであり、そのうちの120個のヌクレオチドは、標的特異的「ベイト配列」である。残
りの30個のヌクレオチド(例えば、それぞれの末端に15個のヌクレオチド)は、PC
R増幅に使用される任意のユニバーサル尾部である。尾部は、ユーザが選択した任意の配
列であり得る。例えば、合成オリゴヌクレオチドのプールは、5’-ATCGCACCA
GCGTGTN120CACTGCGGCTCCTCA-3’(配列番号1)の配列のオ
リゴヌクレオチドを含み得、N120は、標的特異的ベイト配列を示す。
【0303】
本明細書に記載のベイト配列を、エクソンおよび短い標的配列の選択に用いることがで
きる。一実施形態において、ベイトは、約100ヌクレオチド長~300ヌクレオチド長
である。別の実施形態では、ベイトは、約130ヌクレオチド長~230ヌクレオチド長
である。さらに別の実施形態では、ベイトは、約150ヌクレオチド長~200ヌクレオ
チド長である。ベイトの標的特異的配列は、例えば、エクソンおよび短い標的配列の選択
のために、約40ヌクレオチド長~1000ヌクレオチド長である。一実施形態において
、標的特異的配列は、約70ヌクレオチド長~300ヌクレオチド長である。別の実施形
態では、標的特異的配列は、約100ヌクレオチド長~200ヌクレオチド長である。さ
らに別の実施形態では、標的特異的配列は、約120ヌクレオチド長~170ヌクレオチ
ド長である。
【0304】
いくつかの実施形態では、長いオリゴヌクレオチドは、標的配列を捕捉するのに必要な
オリゴヌクレオチドの数を最小限に抑えることができる。例えば、1個のエクソンにつき
1個のオリゴヌクレオチドを用いることができる。ヒトゲノムのタンパク質コードエクソ
ンの長さの平均および中央値が、それぞれ、約164個および120個の塩基対であるこ
とは、既知の当技術分野では既知である。より長いベイトは、短いベイトよりも特異的で
あり、より良好に捕捉することができる。結果として、1個のオリゴヌクレオチドベイト
配列当たりの成功率は、短いオリゴヌクレオチドよりも高い。一実施形態において、最小
のベイトが対象範囲とする配列は、例えば、エクソンサイズの標的を捕捉するために、1
個のベイト(例えば、120~170個の塩基)の大きさである。ベイト配列の長さを決
定する際、不必要に長いベイトがより多くの望ましくない標的に直接隣接したDNAを捕
獲することを考慮に入れることができる。より長いオリゴヌクレオチドベイトは、DNA
試料の標的化された領域における多型性に短いオリゴヌクレオチドベイトよりも高い耐性
を示し得る。典型的には、ベイト配列は、参照ゲノム配列に由来する。実際のDNA試料
中の標的配列が参照配列から外れる場合、例えば、それが単一ヌクレオチド多型(SNP
)を含有する場合、それは、より低い効率でベイトにハイブリダイズし得、したがって、
ベイト配列にハイブリダイズした配列において表示不足であるか、または完全に不在であ
り得る。例えば、120~170個の塩基における単一のミスマッチのハイブリッド安定
性に与える影響が20個または70個の塩基(それぞれ、マルチプレックス増幅およびマ
イクロアレイ捕捉において典型的なベイトまたはプライマーの長さである)における単一
のミスマッチよりも小さくあり得るという理由から、より長い合成ベイト分子におけるS
NPによる対立遺伝子ドロップアウトの可能性はより低い場合がある。
【0305】
ゲノム領域等の捕捉ベイトの長さよりも長い標的を選択する場合、ベイト配列の長さは
、典型的には、上述の短い標的のベイトと同一のサイズ範囲であるが、但し、隣接配列の
標的化を最小限に抑えることを唯一の目的としてベイト配列の最大サイズを制限する必要
はないということを除く。あるいは、はるかにより幅広いウィンドウ(典型的には、60
0個の塩基)にわたってオリゴヌクレオチドにタイトル付けすることができる。この方法
を用いて、典型的なエクソンよりもはるかに大きい(例えば、約500個の塩基)DNA
断片を捕捉することができる。結果として、はるかにより多くの望ましくないフランキン
グ非標的配列が選択される。
ベイト合成
【0306】
ベイトは、任意の種類のオリゴヌクレオチド、例えば、DNAまたはRNAであり得る
。DNAまたはRNAベイト(「オリゴベイト」)を、DNAまたはRNAベイトセット
(「アレイベイト」)として、個別に合成することができるか、またはアレイで合成する
ことができる。オリゴベイトは、アレイ形式で提供されるか、または単離されたオリゴと
して提供されるかにかかわらず、典型的には、一本鎖である。ベイトは、本明細書に記載
の結合実体(例えば、ビオチン分子等の捕捉タグ)をさらに含み得る。結合実体、例えば
、ビオチン分子は、ベイト、例えば、ベイトの5’末端または3’末端、典型的には、ベ
イトの5’末端に結合し得る。
【0307】
いくつかの実施形態では、個別のオリゴベイトをアレイベイトセットに付加してもよい
。これらの場合において、オリゴベイトを、アレイベイトによって標的化される領域と同
一の領域を標的化するように設計することができ、追加のオリゴベイトを設計し、標準の
アレイベイトに付加して、ゲノムのある特定の領域において強化されたか、またはより完
全な対象範囲を達成することができる。例えば、追加のオリゴベイトを、標準のアレイベ
イトセットを用いた最初の配列決定ラウンド後に配列対象範囲の低い領域を標的化するよ
うに設計することができる。いくつかの実施形態では、オリゴベイトは、アレイベイトセ
ットの対象範囲領域にわたってタイル状効果を有するか、または他のオリゴベイトの対象
範囲領域にわたってタイル状効果を有するように設計される。
【0308】
一実施形態において、個別のオリゴベイトは、RNAもしくはDNAオリゴアレイベイ
トセット、またはその組み合わせ(例えば、市販のアレイベイトセット)を補充するため
に使用されるDNAオリゴである。他の実施形態では、個別のオリゴベイトは、個別に設
計および合成されたオリゴの収集物であるRNAもしくはDNAオリゴベイトセット、ま
たはその組み合わせを補充するために使用されるDNAオリゴである。一実施形態におい
て、個別のオリゴベイトは、RNAもしくはDNAオリゴアレイベイトセット、またはそ
の組み合わせ(例えば、市販のアレイベイトセット)を補充するために使用されるRNA
オリゴである。他の実施形態では、個別のオリゴベイトは、個別に設計および合成された
オリゴの収集物であるRNAもしくはDNAオリゴベイトセット、またはその組み合わせ
を補充するために使用されるRNAオリゴである。
【0309】
さらに別の実施形態では、個別のオリゴベイトは、DNAオリゴアレイベイトセット(
例えば、市販のアレイベイトセット)を補充するために使用されるDNAオリゴであり、
他の実施形態では、個別のオリゴベイトは、個別に設計および合成されたオリゴの収集物
であるDNAオリゴベイトセットを補充するために使用されるDNAオリゴである。
【0310】
さらに別の実施形態では、個別のオリゴベイトは、RNAオリゴアレイベイトセット(
例えば、市販のアレイベイトセット)を補充するために使用されるDNAオリゴであり、
他の実施形態では、個別のオリゴベイトは、個別に設計および合成されたオリゴの収集物
であるRNAオリゴベイトセットを補充するために使用されるDNAオリゴである。
【0311】
さらに別の実施形態では、個別のオリゴベイトは、RNAオリゴアレイベイトセット(
例えば、市販のアレイベイトセット)を補充するために使用されるRNAオリゴであり、
他の実施形態では、個別のオリゴベイトは、個別に設計および合成されたオリゴの収集物
であるRNAオリゴベイトセットを補充するために使用されるRNAオリゴである。
【0312】
さらに別の実施形態では、個別のオリゴベイトは、DNAオリゴアレイベイトセット(
例えば、市販のアレイベイトセット)を補充するために使用されるRNAオリゴであり、
他の実施形態では、個別のオリゴベイトは、個別に設計および合成されたオリゴの収集物
であるDNAオリゴベイトセットを補充するために使用されるRNAオリゴである。
【0313】
一実施形態において、オリゴベイトは、特に関心のある遺伝子の配列を標的とする、例
えば、拡大された遺伝子の組の配列対象範囲増加を達成するように設計される。
【0314】
別の実施形態では、オリゴベイトは、ゲノムのサブセットを表す配列を標的とするよう
に設計され、混合され、アレイベイトの代わりに、またはアレイベイトに加えて、プール
として使用される。
【0315】
一実施形態において、第1の組のオリゴベイトは、配列対象範囲の低い領域を標的とす
るように設計され、第2の組のオリゴベイトは、特に関心のある遺伝子を標的化するよう
に設計される。その後、両方の組のオリゴベイトは合わせられ、任意で、配列決定のため
に使用される標準のアレイベイトセットと混合される。
【0316】
一実施形態において、オリゴベイト混合物が、例えば、ゲノム再編成およびコピー数の
変化(アレイCGH(包括的ゲノムハイブリダイゼーション)と同等)を探す目的で、例
えば、標的化された遺伝子パネルを同時に配列決定し、かつ作成された単一ヌクレオチド
多型(SNP)のパネルをスクリーニングするために使用される。例えば、SNPのパネ
ルを最初にアレイベイトとしてアレイ方法によって作製することができ、その後、追加の
DNAオリゴヌクレオチドベイトを、配列対象範囲の低い領域を標的化された組の遺伝子
に標的化するように設計することができる。その後、SNPの収集物の配列決定を最初の
アレイベイトセットに加えて追加のオリゴベイトで繰り返し、目的とする全配列対象範囲
を達成することができる。
【0317】
いくつかの実施形態では、オリゴベイトが、より完全な配列対象範囲を達成するために
、標準のアレイベイトセットに付加される。一実施形態において、オリゴベイトは、標準
のアレイベイトセットでの最初の配列決定ラウンド後に配列対象範囲の低い領域を標的す
るように設計される。
【0318】
別の実施形態では、オリゴベイトは、特に関心のある遺伝子の配列を標的化するように
設計される。これらのオリゴベイトを標準のアレイベイトセットまたは現行のオリゴ/ア
レイハイブリッドベイトセットに付加して、例えば、全アレイベイトプール再設計サイク
ルを経ることなく、拡大された遺伝子の組の配列対象範囲増加を達成することができる。
【0319】
オリゴベイトを、NimbleGen(Roche)から、またはDNAオリゴの場合
はIntegrated DNA Technologies(IDT)等の商業的供給
源から入手することができる。オリゴをAgilent Technologiesから
入手することができる。濃縮のプロトコルは、公的に入手可能であり、例えば、Sure
Select Target Enrichment Systemがある。
【0320】
ベイトを、参照により本明細書に組み込まれる米国第2010/0029498号およ
びGnirke,A.et al.(2009)Nat Biotechnol.27(
2):182-189に記載の方法で産生することができる。例えば、ビオチン化された
RNAベイトを、マイクロアレイ上で最初に合成された長い合成オリゴヌクレオチドのプ
ールを得て、かつオリゴヌクレオチドを増幅してベイト配列を産生することによって産生
することができる。いくつかの実施形態では、ベイトは、ベイト配列の一方の末端にRN
Aポリメラーゼプロモーター配列を付加し、かつRNAポリメラーゼを用いてRNA配列
を合成することによって産生される。一実施形態において、合成オリゴデオキシヌクレオ
チドのライブラリを、Agilent Technologies,Inc.等の商業的
供給業者から入手することができ、既知の核酸増幅法を用いて増幅することができる。
【0321】
例えば、ベイトの大きな収集物を、最初にオリゴヌクレオチドアレイ、例えば、Agi
lentのプログラム可能なDNAマイクロアレイ上で合成された合成オリゴヌクレオチ
ドのカスタムプールから生成することができる。したがって、少なくとも約2,500、
5,000、10,000、20,000、3,000、40,000、50,000、
または60,000個の一意のオリゴヌクレオチドを同時に合成することができる。
【0322】
一実施形態において、最小の組の一意のオリゴヌクレオチドが選択され、例えば、事前
選択された組の標的(例えば、事前選択された組のエクソン)を捕捉するように設計され
たベイトの場合、合成オリゴヌクレオチドアレイの最大容量に達するまで、追加のコピー
(例えば、逆補体と最初の順方向鎖との間で交互に起こる)が付加される。別の実施形態
では、標的は、例えば、順方向および逆方向相補オリゴヌクレオチドの両方を合成するこ
とによって、少なくとも2回表される。所与の標的のために順方向および逆方向相補オリ
ゴヌクレオチドを合成することで、この合成ステップにおいて全く同一の配列を2回合成
するよりも良好な冗長性を提供することができる。さらに別の実施形態では、PCR産物
またはベイトは、順方向および逆方向相補オリゴヌクレオチドの場合でも同じである。
【0323】
チップからのオリゴヌクレオチドを1度合成し、その後、増幅して、一組のオリゴヌク
レオチドを作成することができ、それを何度も使用することができる。この手法は、多数
の選択実験用のベイトとして使用することができるユニバーサル試薬を生成し、それによ
って、配列決定費用のごく一部であるチップの費用を償却する。あるいは、ベイト配列を
、鋳型としてヒトDNAまたはプールされたヒトDNA試料を用いたPCR等の既知の核
酸増幅法を用いて産生することができる。
【0324】
合成後、オリゴヌクレオチドを化学的切断によってアレイから解放し(例えば、取り去
り)、その後、保護基を除去し、ユニバーサルプライマーを用いてPCRを二本鎖DNA
に増幅することができる。第2ラウンドのPCRを用いて、プロモーター(例えば、T7
、SP6、またはT3プロモーター)部位を増幅産物に組み込むことができ、これは、D
NAを一本鎖RNAに転写するために使用される。
【0325】
一実施形態において、ベイトは、ギャップまたはオーバーラップなしで、配列(例えば
、エクソン)に沿ってタイルされる。例えば、ベイトは、UCSCゲノムブラウザに示さ
れる参照ゲノム配列の鎖の最も「左」のコード塩基で始まってもよく(例えば、遺伝子の
配向に応じて、コード配列に沿って5’から3’または3’から5’)、すべてのコード
塩基が対象範囲とされるまでさらにベイトが付加される。別の実施形態では、それぞれの
標的につき少なくとも2つ、3つ、4つ、または5つのベイトが、少なくとも約15、3
0、45、または60個の塩基分オーバーラップさせて設計される。オリゴヌクレオチド
合成およびユニバーサルプライマーを用いたPCR増幅後、二本鎖DNAの尾部のうちの
一方を酵素分解することができ、その後、その鎖のうちの1本を分解する。一本鎖産物を
ハイブリダイズし、充填して完全な二本鎖にし、PCRによって増幅することができる。
この様式で、少なくとも約300、400、500、または600個の連続した標的特異
的塩基を含有するベイトを産生することは可能であり、これは、化学的に合成され得るよ
りも多い。そのような長いベイトは、高い特異性および感度を必要とする用途、またはベ
イト長を制限すること(例えば、長く連続したゲノム領域の捕捉)から恩恵を受けるとは
限らない用途に有用であり得る。
【0326】
一実施形態において、それぞれの標的の対象範囲を評価することができ、同様の対象範
囲もたらす標的をグループ化することができる。はっきりと異なる組のベイト配列をそれ
ぞれの標的群のために作成し、表示をさらに改善することができる。別の実施形態では、
マイクロアレイチップからのオリゴヌクレオチドは、ハイブリダイゼーションの有効性に
ついて試験され、オリゴヌクレオチドがそれらの捕捉有効性によってグループ化されるマ
イクロアレイチップの産生ラウンドが要求され、したがって、ベイト有効性の変化を相殺
する。さらに別の実施形態では、複合体プールの間に捕捉有効性の変化が少ししか存在し
ないように、オリゴヌクレオチドプールを凝集して比較的少ない数の複合体プールを形成
することができる。
【0327】
本明細書に記載のベイトをタグ、例えば、親和性タグで標識化することができる。例と
なる親和性タグには、ビオチン分子、磁気粒子、ハプテン、またはタグ分子でタグ付けさ
れたベイトの単離を可能にする他のタグ分子が含まれるが、これらに限定されない。それ
らを核酸に結合するそのような分子および方法(例えば、本明細書に開示の方法で使用さ
れるベイト)は、当技術分野で周知である。ビオチン化されたベイトを作製する例となる
方法は、例えば、参照により全体が本明細書に組み込まれるGnirke A.et a
l.,Nat.Biotechnol.2009;27(2):182-9に記載されて
いる。
【0328】
タグ付けされたベイトに結合するか、またはタグ付けされたベイトをハイブリダイゼー
ション混合物から分離することができる分子、粒子、またはデバイスも当技術分野で既知
である。一実施形態において、分子、粒子、またはデバイスは、タグ(例えば、親和性タ
グ)に結合する。一実施形態において、分子、粒子、またはデバイスは、アビジン分子、
磁石、または抗体もしくはその抗原結合断片である。一実施形態において、タグ付けされ
たベイトは、ストレプトアビジン分子でコーティングされた磁気ビーズを用いて分離され
る。
【0329】
オリゴヌクレオチドライブラリを調製する例となる方法は、例えば、参照により全体が
本明細書に組み込まれるGnirke A.et al.,Nat.Biotechno
l.2009;27(2):182-9、およびBlumenstiel B.et a
l.,Curr.Protoc.Hum.Genet.2010;Chapter 18
:Unit 18.4に記載されている。
ハイブリダイゼーション条件
【0330】
本発明で特色とする方法は、ライブラリ(例えば、核酸ライブラリ)を複数のベイトと
接触させて、選択されたライブラリ捕獲物を提供するステップを含む。接触ステップを、
溶液ハイブリダイゼーションにおいて達成することができる。ある特定の実施形態におい
て、方法は、1つ以上のさらなるラウンドの溶液ハイブリダイゼーションによってハイブ
リダイゼーションステップを繰り返すことを含む。いくつかの実施形態では、方法は、同
一または異なるベイト収集物を用いて、ライブラリ捕獲物を1つ以上のさらなるラウンド
の溶液ハイブリダイゼーションに供することをさらに含む。
【0331】
他の実施形態では、本発明で取り上げられる方法は、ライブラリ捕獲物を増幅する(例
えば、PCRによって)ことをさらに含む。他の実施形態では、ライブラリ捕獲物は増幅
されない。
【0332】
さらに他の実施形態では、方法は、ライブラリ捕獲物を遺伝子型判定に供し、それによ
って、選択された核酸の遺伝子型を特定するステップをさらに含む。
【0333】
より具体的には、数千個のベイト配列の混合物が、核酸基のうちの相補的な核酸に効果
的にハイブリダイズすることができ、そのようなハイブリダイズした核酸(核酸のサブグ
ループ)を効果的に分離し、回収することができる。一実施形態において、本明細書に記
載の方法は、約1,000個を超えるベイト配列、約2,000個を超えるベイト配列、
約3,000個を超えるベイト配列、約4,000個を超えるベイト配列、約5,000
個を超えるベイト配列、約6,000個を超えるベイト配列、約7,000個を超えるベ
イト配列、約8,000個を超えるベイト配列、約9,000個を超えるベイト配列、約
10,000個を超えるベイト配列、約15,000個を超えるベイト配列、約20,0
00個を超えるベイト配列、約30,000個を超えるベイト配列、約40,000個を
超えるベイト配列、または約50,000個を超えるベイト配列を含有する一組のベイト
配列を使用する。
【0334】
いくつかの実施形態では、選択プロセスは、例えば、選択された核酸の濃縮を増加させ
るために、核酸の選択されたサブグループ上で繰り返される。例えば、ハイブリダイゼー
ションの1ラウンド後、数千倍の核酸の濃縮を観察することができる。第2ラウンド後、
濃縮は、例えば、約15,000倍の平均濃縮まで上昇することができ、単一のシーケン
サーランで数百倍の標的対象範囲を提供することができる。したがって、ハイブリッド選
択の単一のラウンドでは達成不可能な濃縮因子を必要とする実験において、方法は、典型
的には、その組のベイト配列を用いて、単離された核酸のサブグループ(すなわち、標的
配列の一部またはすべて)を1つ以上のさらなるラウンドの溶液ハイブリダイゼーション
に供することを含む。
【0335】
2つの異なるベイト配列(ベイト1、ベイト2)を用いた連続ハイブリッド選択を用い
て、「交差点」、すなわち、例えば、染色体間の濃縮を含むが、これに限定されない用途
に使用されるベイト1およびベイト2に結合するDNA配列のサブグループを単離し、配
列決定することができる。例えば、染色体1上の配列に特異的なベイトを有する腫瘍試料
からのDNAの選択、続いて、染色体2に特異的なベイトにハイブリダイズする配列の第
1の選択の産物からの選択は、それら両方の染色体由来の配列を含有する染色体転座接合
部で配列を濃縮することができる。
【0336】
任意の特定の核酸のモル濃度が、核酸のサブグループ内のすべての選択された核酸の平
均モル濃度のわずかな変化の範囲内であるように、選択された核酸のサブグループのモル
濃度を制御することができる。標的表示の均等性を制御および最適化する方法には、当技
術分野で周知のプローブ設計の物理化学的および経験的規定に基づいたベイト配列の合理
的設計、ならびに平均よりも低い働きをすることで既知であるか、または平均よりも低い
働きをする疑いのある配列がそれらの本質的弱点を相殺するために大きな比率を占めるベ
イトのプールが含まれるが、これらに限定されない。いくつかの実施形態では、単離され
た核酸のサブグループの少なくとも約50%、60%、65%、70%、75%、80%
、85%、90%、または95%は、平均モル濃度の約20倍、15倍、10倍、5倍、
3倍、または2倍の範囲内である。一実施形態において、単離された核酸のサブグループ
の少なくとも約50%は、平均モル濃度の約3倍の範囲内である。別の実施形態では、単
離された核酸のサブグループの少なくとも約90%は、平均モル濃度の約10倍の範囲内
である。
【0337】
ベイトの濃度を変化させることによって、選択効率の変化をさらに調節することができ
る。一実施形態において、選択効率は、ベイトの等モル混合物を用いるときに観察される
差次的配列捕捉効率を参照してベイトの相対存在量または結合実体の密度(例えば、ハプ
テンもしくは親和性タグ密度)を調節することによって、ある群内の個別のベイト(例え
ば、第1、第2、もしくは第3の複数のベイト)の効率を平準化し、その後、内部的に平
準化された第2群に対して、差次的の過度の内部的に平準化された第1群の必要な量を全
体のベイト混合物に導入することにより調節される。
【0338】
ある特定の実施形態において、本明細書に記載の方法は、標的配列の均等な対象範囲を
達成することができる。一実施形態において、予想される対象範囲の少なくとも約50%
を有する標的塩基の割合は、例えば、タンパク質コードエクソン等の短い標的の場合、少
なくとも約60%、70%、80%、または90%である。別の実施形態では、予想され
る対象範囲の少なくとも約50%を有する標的塩基の割合は、例えば、ゲノム領域等の捕
捉ベイトの長さよりも長い標的の場合、少なくとも約80%、90%、または95%であ
る。
【0339】
ハイブリダイゼーションの前に、ベイトを当技術分野で周知の方法に従って変性するこ
とができる。概して、ハイブリダイゼーションステップは、過剰なブロッキングDNAを
標識化されたベイト組成物に付加すること、ハイブリダイゼーション条件下でブロッキン
グされたベイト組成物を検出される標的配列と接触させること、ハイブリダイズされてい
ないベイトを洗い流すこと、およびベイト組成物の標的への結合を検出することを含む。
【0340】
ベイトは、ハイブリダイゼーション条件下で標的配列にハイブリダイズまたはアニーリ
ングされる。「ハイブリダイゼーション条件」は、ベイトと標的核酸との間のアニーリン
グを促進する条件である。異なるベイトのアニーリングがプローブの長さ、塩基濃度等に
応じて変化するため、アニーリングは、ベイト濃度、ハイブリダイゼーション温度、塩濃
度、および当技術分野で周知の他の要因を変化させることによって促進される。
【0341】
ハイブリダイゼーション条件は、ベイトの濃度、塩基組成、複雑度、および長さ、なら
びにインキュベーションの塩濃度、温度、および期間を変化させることによって促進され
る。例えば、ハイブリダイゼーションを、5倍SSPE、5倍デンハルト液、5mMのE
DTA、および0.1%のSDS、ならびにブロッキングDNAを含有するハイブリダイ
ゼーション緩衝液中で行って、非特異的ハイブリダイゼーションを抑制することができる
。ベイトがRNAである場合、RNase阻害剤を使用することができる。概して、上述
のハイブリダイゼーション条件は、約25℃~約65℃、典型的には、約65℃の温度、
および約0.5時間~約96時間、典型的には、約66時間のインキュベーション期間を
含む。さらなる例となるハイブリダイゼーション条件は、本明細書の実施例12A~12
Cおよび表14にある。
【0342】
本明細書に記載の方法は、標準の液体処理方法およびデバイスに適応可能である。いく
つかの実施形態では、方法は、マルチウェルプレートを処理するデバイス等の当技術分野
で既知の自動液体処理技術を用いて実行される(例えば、Gnirke,A.et al
.(2009)Nat Biotechnol.27(2):182-189を参照のこ
と)。これは、自動ライブラリ構築、ならびに溶液ハイブリダイゼーションの設定および
溶液ハイブリダイゼーション後の洗浄を含む溶液ハイブリダイゼーションステップを含み
得るが、これらに限定されない。例えば、そのような自動化された方法を実行するための
装置を溶液ハイブリダイゼーション反応後のビーズ捕捉および洗浄ステップに使用するこ
とができる。例となる装置は、ストレプトアビジンでコーティングされた磁気ビーズを含
有するマルチウェルプレート用の位置;試薬を予熱し、かつユーザ定義の温度で洗浄ステ
ップを実行するためのI/O制御熱ブロックである、ハイブリッド-選択反応溶液を含有
するマルチウェルプレート用の位置;ピペット先端のラック用の位置;ピペット先端を洗
浄し、かつ廃棄物を処分する洗浄ステーションである、磁石固定化ビーズからの上清の分
離を促進するある特定の構成でレイアウトされた磁石を有する位置;ならびに低および高
ストリンジェンシー洗浄緩衝液または最終捕獲物のアルカリ溶出用の溶液等の他の溶液お
よび試薬用の位置を含み得るが、これらに限定されない。一実施形態において、装置は、
同時に捕獲中和ステップを介するビーズ捕捉ステップからの最大96個のハイブリッド選
択を処理するように設計される。別の実施形態では、1つ以上の位置が二重機能を有する
。さらに別の実施形態では、ユーザは、1つのプレートを別のプレートに交換するプロト
コルによって指示される。
【0343】
直接的に選択された核酸を連鎖させて剪断することができ、これは、短い配列決定読み
取りの制限を打開するために行われる。一実施形態において、それぞれのエクソンサイズ
の配列決定標的は、標的と略同一のサイズであり、かつ標的のエンドポイントに近いエン
ドポイントを有する単一のベイト分子で捕捉される。約100個以上の連続塩基対を有す
る二本鎖分子を形成するハイブリッドのみが、ストリンジェントなハイブリダイゼーショ
ン後の洗浄に耐え抜く。結果として、選択された核酸のサブグループ(すなわち、「捕獲
物」)は、ランダムに剪断されたゲノムDNA断片のために濃縮され、その末端は、ベイ
ト分子の末端に近い。非常に短い配列決定読み取りを用いた単なる「捕獲物」の末端配列
決定が、標的の末端近く(またはさらには外側)でより高い対象範囲をもたらし、中間近
くで対象範囲を低下させ得る。
【0344】
ライゲーションによって「捕獲」分子を連鎖し、その後、ランダム剪断およびショット
ガン配列決定を行うことは、標的配列の全長に沿って配列対象範囲を得る1つの方法であ
る。この方法は、非常に短い読み取りでの末端配列決定よりも高い割合の(標的付近では
なく)標的上の配列決定された塩基を産生する。共ライゲーションによって分子を連鎖さ
せる方法は、当技術分野で周知である。連鎖を平滑末端ライゲーションによって行うこと
ができる。効率的なライゲーションのための「粘着」末端を、それらの5’末端近くに制
限部位を有するPCRプライマーを用いた「捕獲物」のPCR増幅、その後、対応する制
限酵素(例えば、NotI)での消化を含む様々な方法によって、あるいはT4 DNA
ポリメラーゼによる部分的「チューバック」等のPCR産物のライゲーション依存性クロ
ーニングに一般的に使用される戦略と同様の戦略(Aslanidis and de
Jong,Nucleic Acids Res.18:6069-6074,1990
)、またはUDGグリコシラーゼおよびリアーゼエンドVIIIでのウラシル含有PCR
産物の処理(例えば、New England Biolabs cat.E5500S
)によって産生することができる。
【0345】
別の実施形態では、互い違いの組のベイト分子を用いて領域を標的とし、標的領域にわ
たって頻出するベイト末端を得る。いくつかの実施形態では、単に末端配列された「捕獲
物」(すなわち、連鎖および剪断なし)が、実際の配列決定標的(例えば、エクソン)を
含むベイトによって対象範囲とされる全領域に沿って極めて均一な配列対象範囲を提供す
る。ベイト分子を互い違いにしてベイトによって対象範囲とされる断片を広げると、配列
決定された塩基は、より広い領域にわたって分布される。結果として、標的上の配列と標
的付近の配列との比率は、1つの標的につき単一のベイトのみを必要とすることの多いオ
ーバーラップしないベイトで選択した場合よりも低い。
【0346】
別の実施形態では、わずかにより長い読み取り(例えば、76個の塩基)での末端配列
決定は、短い選択された標的(例えば、エクソン)を配列決定するための典型的な方法で
ある。非常に短い読み取りでの末端配列決定とは異なり、この方法は、中間での対象範囲
の低下を伴うことなく単様式の対象範囲特性をもたらす。この方法は、上述の連鎖および
剪断方法よりも簡単に行われ、標的に沿って比較的均一の対象範囲をもたらし、ベイトお
よび標的に適切の重なる高い割合の配列決定された塩基を生成する。
【0347】
一実施形態において、選択された核酸のサブグループは、配列決定または遺伝子型判定
によって分析される前に増幅される(例えば、PCRによって)。別の実施形態では、サ
ブグループは、例えば、選択されたサブグループが、単一の分子を読み取ることができる
高感度分析法によって分析されるとき、増幅ステップなしで分析される。
ベイトモジュール
【0348】
本明細書に記載の方法は、配列決定される標的核酸の選択のために、ベイト、例えば、
溶液ハイブリダイゼーション用のベイトの適切な選択による1名以上の対象由来の試料、
例えば、腫瘍試料由来の多数の遺伝子および遺伝子産物の最適化配列決定を提供する。様
々なサブゲノム間隔またはそのクラスの選択効率は、事前選択された選択効率を有するベ
イトセットに従って適合される。
【0349】
したがって、方法(例えば、上述の方法の要素(b))は、ライブラリを複数のベイト
と接触させて選択されたメンバー(本明細書でライブラリ捕獲物と称される場合もある)
を提供することを含む。
【0350】
したがって、試料、例えば、腫瘍試料を分析する方法が提供される。方法は、
(a)複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
(b)ライブラリをベイトセットと接触させて選択されたメンバー(例えば、ライブラ
リ捕獲物)を提供することと、
(c)サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
(d)該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
によってアライメントすることと、
(e)事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる(例えば、ベイズ方法または本明細書に記載の方法を用いて、例えば、変異を呼
び出す)ことと、を含み、
それによって、該腫瘍試料を分析し、
方法は、ライブラリを複数、例えば、少なくとも2つ、3つ、4つ、または5つのベイト
セットと接触させることとを含み、該複数のベイトセットはそれぞれ、(他の複数のベイ
トセットとは対照的に)一意の事前選択された選択効率を有し、例えば、それぞれの一意
のベイトセットは、一意の配列決定深度を提供する。
【0351】
ある実施形態において、第1の複数のベイトセットの選択効率は、第2の複数のベイト
セットの効率とは少なくとも2倍異なる。ある実施形態において、第1および第2のベイ
トセットは、少なくとも2倍異なる配列決定深度を提供する。
【0352】
ある実施形態において、方法は、以下のベイトセットのうちの1つまたは複数をライブ
ラリと接触させることを含む:
a)約500倍以上の配列決定深度を提供する、例えば、試料由来の5%を超えない細
胞に存在する変異を配列決定するのに十分な数のサブゲノム間隔を含むメンバーを選択す
るベイトセット、
b)約200倍以上、例えば、約200倍~約500倍の配列決定深度を提供する、例
えば、試料由来の10%を超えない細胞に存在する変異を配列決定するのに十分な数のサ
ブゲノム間隔を含むメンバーを選択するベイトセット、
c)約10~100倍の配列決定深度を提供する、例えば、a)異なる薬物を代謝する
患者の能力を説明し得る薬理ゲノム(PGx)単一ヌクレオチド多型(SNP)、b)患
者を一意に同定する(例えば、フィンガープリントする)ために使用され得るゲノムSN
P、c)ゲノムDNAのコピー数の獲得/喪失およびヘテロ接合性の消失(LOH)を評
価するために使用され得るゲノムSNP/遺伝子座から選択される1つ以上のサブゲノム
間隔(例えば、エクソン)を配列決定するのに十分な数のサブゲノム間隔を含むメンバー
を選択するベイトセット、
d)約5~50倍の配列決定深度を提供する、例えば、ゲノム転座またはインデル等の
構造ブレークポイントを検出するのに十分な数のサブゲノム間隔を含むメンバーを選択す
るベイトセット(例えば、イントロンブレークポイントの検出は、高い検出信頼性を確保
するために、5~50倍の配列対スパン深度を必要とし、そのようなベイトセットを用い
て、例えば、転座/インデルの傾向のある癌遺伝子を検出することができる)、または
e)約0.1~300倍の配列決定深度を提供する、例えば、コピー数の変化を検出す
るのに十分な数のサブゲノム間隔を含むメンバーを選択するベイトセット。一実施形態に
おいて、コピー数の変化を検出するための配列決定深度は、約0.1~10倍の配列決定
深度の範囲である。他の実施形態では、ゲノムDNAのコピー数獲得/喪失またはヘテロ
接合性の消失(LOH)を評価するために使用されるゲノムSNP/遺伝子座を検出する
ための配列決定深度は、約100~300倍の範囲である。そのようなベイトセットを用
いて、例えば、増幅/欠失の傾向のある癌遺伝子を検出することができる。
【0353】
実施形態において、方法は、それぞれが異なるベイト設計戦略を有する2つ以上の異な
る標的カテゴリーを捕捉するように設計されるベイトの使用を含む。実施形態において、
本明細書に開示のハイブリッド捕捉方法および組成物は、標的配列(例えば、標的メンバ
ー)の定義されたサブセットの外側の対象範囲を最小限に抑えながら、そのサブセットを
捕捉し、標的配列の均一な対象範囲を提供する。一実施形態において、標的配列は、ゲノ
ムDNAからの全エクソーム、またはその選択されたサブセットを含む。本明細書に開示
の方法および組成物は、異なる深度およびパターンの複合標的核酸配列(例えば、核酸ラ
イブラリ)の対象範囲を達成するために、異なるベイトセットを提供する。
【0354】
ある実施形態において、方法は、核酸ライブラリ(例えば、ライブラリ捕獲物)の選択
されたメンバーを提供することを含む。方法は、
複数のメンバー、例えば、標的核酸メンバー(例えば、複数の腫瘍メンバー、参照メン
バー、および/またはPGxメンバーを含む)を含むライブラリ(例えば、核酸ライブラ
リ)を提供することと、
ライブラリを、例えば、溶液またはアレイベースの反応で、複数のベイト(例えば、オ
リゴヌクレオチドベイト)と接触させて、複数のベイト/メンバーハイブリッドを含むハ
イブリダイゼーション混合物を形成することと、
複数のベイト/メンバーハイブリッドを、例えば、該ハイブリダイゼーション混合物を
該複数のベイト/メンバーハイブリッドの分離を可能にする結合実体と接触させることに
よって、該ハイブリダイゼーション混合物から分離することと、を含み、
それによって、ライブラリ捕獲物(例えば、ライブラリ由来の核酸分子の選択または濃縮
されたサブグループ)を提供し、
複数のベイトは、以下のうちの2つ以上を含む:
a)低頻度、例えば、約5%(すなわち、それらのゲノムにおける変化を持つ試料由来
の細胞の5%)以下で出現する変化(例えば、1つ以上の変異)に対する高レベルの感度
を可能にするために最深の対象範囲が要求される、高レベルの標的(例えば、遺伝子、エ
クソン、または塩基等のサブゲノム間隔を含む1つ以上の腫瘍メンバー)を選択する第1
のベイトセット(一実施形態において、第1のベイトセットは、約500倍以上の配列決
定深度を必要とする変化(例えば、点変異)を含む腫瘍メンバーを選択する(例えば、そ
れに相補的である))、
b)a)における高レベルの標的よりも高い頻度、例えば、約10%(すなわち、それ
らのゲノムにおける変化を持つ試料由来の細胞の10%)の頻度で出現する変化(例えば
、1つ以上の変異)に対する高レベルの感度を可能にするために高い対象範囲が要求され
る、中間レベルの標的(例えば、遺伝子、エクソン、または塩基等のサブゲノム間隔を含
む1つ以上の腫瘍メンバー)を選択する第2のベイトセット(一実施形態において、第2
のベイトセットは、約200倍以上の配列決定深度を必要とする変化(例えば、点変異)
を含む腫瘍メンバーを選択する(例えば、それに相補的である))、
c)高レベルの感度を可能にするために、例えば、ヘテロ接合体対立遺伝子を検出する
ために低~中程度の対象範囲が要求される、低レベルの標的(例えば、遺伝子、エクソン
、または塩基等のサブゲノム間隔を含む1つ以上のPGxメンバー)を選択する第3のベ
イトセット(例えば、ヘテロ接合体対立遺伝子の検出は、高い検出信頼性を確保するため
に、10~100倍の配列決定深度を必要とする。一実施形態において、第3のベイトセ
ットは、a)異なる薬物を代謝する患者の能力を説明し得る薬理ゲノム(PGx)単一ヌ
クレオチド多型(SNP)、またはb)患者を一意に同定する(例えば、フィンガープリ
ントする)ために使用され得るゲノムSNP、c)ゲノムDNAのコピー数の獲得/喪失
およびヘテロ接合性の消失(LOH)を評価するために使用され得るゲノムSNP/遺伝
子座から選択される1つ以上のサブゲノム間隔(例えば、エクソン)を選択する、
d)例えば、ゲノム転座またはインデル等の構造ブレークポイントを検出するために低
~中程度の対象範囲が要求される、第1のイントロン標的(例えば、イントロン配列を含
むメンバー)を選択する第4のベイトセット(例えば、イントロンブレークポイントの検
出は、高い検出信頼性を確保するために、5~50倍の配列対スパン深度を必要とする。
該第4のベイトセットを用いて、例えば、転座/インデルの傾向のある癌遺伝子を検出す
ることができる)、または
e)コピー数の変化を検出する能力を改善するためにわずかな対象範囲が要求される、
第2のイントロン標的(例えば、イントロンメンバー)を選択する第5のベイトセット(
(例えば、いくつかの末端エクソンの1コピー欠失の検出は、高い検出信頼性を確保する
ために、0.1~10倍の対象範囲を必要とする。該第5のベイトセットを用いて、例え
ば、増幅/欠失の傾向のある癌遺伝子を検出することができる)。
【0355】
前述のベイトセットのうちの2、3、4つ、またはそれ以上の任意の組み合わせ、例え
ば、第1および第2のベイトセット;第1および第3のベイトセット;第1および第4の
ベイトセット;第1および第5のベイトセット;第2および第3のベイトセット;第2お
よび第4のベイトセット;第2および第5のベイトセット;第3および第4のベイトセッ
ト;第3および第5のベイトセット;第4および第5のベイトセット;第1、第2、およ
び第3のベイトセット;第1、第2、および第4のベイトセット;第1、第2、および第
5のベイトセット;第1、第2、第3、第4のベイトセット;第1、第2、第3、第4、
および第5のベイトセットの組み合わせ等を、本明細書で取り上げられる方法および組成
物で使用することができる。
【0356】
一実施形態において、第1、第2、第3、第4、または第5のベイトセットはそれぞれ
、事前選択された選択(例えば、捕捉)効率を有する。一実施形態において、選択効率値
は、a)~e)に従って、5つすべてのベイトのうちの少なくとも2つ、3つ、4つにお
いて同一である。他の実施形態では、選択効率値は、a)~e)に従って、5つすべての
ベイトのうちの少なくとも2つ、3つ、4つにおいて異なる。
【0357】
いくつかの実施形態では、少なくとも2つ、3つ、4つ、または5つすべてのベイトセ
ットは、異なる事前選択された効率値を有する。例えば、選択効率値は、のうちの1つ以
上から選択される:
(i)第1の事前選択された効率が、少なくとも約500倍以上の配列決定深度である
第1の選択効率値を有する(例えば、第2、第3、第4、もしくは第5の事前選択された
選択効率よりも大きい(例えば、第2の選択効率値よりも約2~3倍大きく、第3の選択
効率値よりも約5~6倍大きく、第4の選択効率値よりも約10倍大きく、第5の選択効
率値よりも約50~5000倍大きい)選択効率値を有する)こと、
(ii)第2の事前選択された効率が、少なくとも約200倍以上の配列決定深度であ
る第2の選択効率値を有する(例えば、第3、第4、もしくは第5の事前選択された選択
効率よりも大きい(例えば、第3の選択効率値よりも約2倍大きく、第4の選択効率値よ
りも約4倍大きく、第5の選択効率値よりも約20~2000倍大きい)選択効率値を有
する)こと、
(iii)第3の事前選択された効率が、少なくとも約100倍以上の配列決定深度で
ある第3の選択効率値を有する(例えば、第4もしくは第5の事前選択された選択効率よ
りも大きい(例えば、第4の選択効率値よりも約2倍大きく、第5の選択効率値よりも約
10~1000倍大きい)選択効率値を有する)こと、
(iv)第4の事前選択された効率が、少なくとも約50倍以上の配列決定深度である
第4の選択効率値を有する(例えば、第5の事前選択された選択効率よりも大きい(例え
ば、第5の選択効率値よりも約50~500倍大きい)選択効率値を有する)こと、また
は
(v)第5の事前選択された効率が、少なくとも約10~0.1倍の配列決定深度であ
る第5の選択効率値を有すること。
【0358】
ある特定の実施形態において、選択効率値は、異なるベイトセットの差次的表示、ベイ
トサブセットの差次的オーバーラップ、差次的ベイトパラメータ、または異なるベイトセ
ットの混合のうちの1つ以上によって修正される。例えば、選択効率(例えば、それぞれ
のベイトセット/標的カテゴリーの相対配列対象範囲)の変化を、以下のうちの1つ以上
を変化させることによって調節することができる。
(i)異なるベイトセットの差次的表示:所与の標的(例えば、標的メンバー)を捕捉
するためのベイトセット設計をより多い/より少ない数のコピーに含んで、相対標的対象
範囲深度を強化する/減少させることができる。
(ii)ベイトサブセットの差次的オーバーラップ:所与の標的(例えば、標的メンバ
ー)を捕捉するためのベイトセット設計に、隣接ベイト間により長いか、またはより短い
オーバーラップを含ませて、相対標的対象範囲深度を強化する/減少させることができる
。
(iii)差次的ベイトパラメータ:所与の標的(例えば、標的メンバー)を捕捉する
ためのベイトセット設計に、配列修正/より短い長さを含ませて、捕捉効率を減少させ、
かつ相対標的対象範囲深度を低下させることができる。
(iv)異なるベイトセットの混合:異なる標的セットを捕捉するように設計されるベ
イトセットを異なるモル比で混合して、相対標的対象範囲深度を強化する/減少させるこ
とができる。
(v)異なる種類のオリゴヌクレオチドベイトセットの使用:ある特定の実施形態にお
いて、ベイトセットは、以下のものを含んでもよい:
(a)1つ以上の化学的に(例えば、非酵素的に)合成された(例えば、個別に合成さ
れた)ベイト、
(b)アレイで合成された1つ以上のベイト、
(c)1つ以上の酵素的に調製された、例えば、生体外で転写されたベイト、
(d)(a)、(b)、および/もしくは(c)の任意の組み合わせ、
(e)1つ以上のDNAオリゴヌクレオチド(例えば、自然発生もしくは非自然発生の
DNAオリゴヌクレオチド)、
(f)1つ以上のRNAオリゴヌクレオチド(例えば、自然発生もしくは非自然発生の
RNAオリゴヌクレオチド)、
(g)(e)および(f)の組み合わせ、または
(h)上記のうちのいずれかの組み合わせ。
【0359】
異なるオリゴヌクレオチドの組み合わせを、異なる比率で、例えば、1:1、1:2、
1:3、1:4、1:5、1:10、1:20、1:50、1:100、1:1000等
から選択される比率で混合してもよい。一実施形態において、化学的に合成されたベイト
とアレイで生成されたベイトの比率は、1:5、1:10、または1:20から選択され
る。DNAまたはRNAオリゴヌクレオチドは、自然発生または非自然発生であり得る。
ある特定の実施形態において、ベイトは、例えば、融解温度を増加させるために、1つ以
上の非自然発生のヌクレオチドを含む。例となる非自然発生のオリゴヌクレオチドは、修
飾されたDNAまたはRNAヌクレオチドを含む。例となる修飾されたヌクレオチド(例
えば、修飾されたRNAまたはDNAヌクレオチド)は、LNAヌクレオチドのリボース
部分が2’酸素と4’炭素を結合する追加の架橋で修飾されるロックド核酸(LNA);
ペプチド核酸(PNA)、例えば、ペプチド結合によって結合された反復N-(2-アミ
ノエチル)-グリシンユニットから成るPNA;低GC領域を捕捉するように修飾された
DNAまたはRNAオリゴヌクレオチド;二環式核酸(BNA);架橋オリゴヌクレオチ
ド;修飾された5-メチルデオキシシチジン;および2,6-ジアミノプリンを含むが、
これらに限定されない。他の修飾されたDNAおよびRNAヌクレオチドは、当技術分野
で既知である。
【0360】
ある特定の実施形態において、実質的に均一または同様の対象範囲の標的配列(例えば
、標的メンバー)が得られる。例えば、それぞれのベイトセット/標的カテゴリー内で、
対象範囲の均一性を、ベイトパラメータを修正することによって、例えば、以下のうちの
1つ以上によって最適化することができる:
(i)ベイト表示またはオーバーラップの増加/減少を用いて、同一のカテゴリー内の
他の標的と比較して不十分に/過度に対象範囲とされるされる標的(例えば、標的メンバ
ー)の対象範囲を強化する/減少させることができること、
(ii)標的配列(例えば、高GC含量配列)を捕捉するのが困難な低対象範囲の場合
、ベイトセットで標的化される領域を拡大して、例えば、隣接配列(例えば、GCが比較
的豊富ではない隣接配列)を対象範囲とすること、
(iii)ベイト配列の修正を行って、ベイトの二次構造を減少させ、かつその選択効
率を強化することができること、
(iv)ベイト長の修正を用いて、同一のカテゴリー内の異なるベイトの融解ハイブリ
ダイゼーション動態を均等化することができること(ベイト長を直接的に(異なる長さを
有するベイトを産生することによって)または間接的に(一貫した長さのベイトを産生し
、ベイト末端を任意の配列に置き換えることによって)修飾することができる)、
(v)同一の標的領域(すなわち、順方向鎖および逆方向鎖)に対して異なる配向を有
するベイトの修正が、異なる結合効率を有し得ること(それぞれの標的に最適な対象範囲
を提供するいずれかの配向を有するベイトセットを選択することができる)、
(vi)それぞれのベイト上に存在する結合実体、例えば、捕捉タグ(例えば、ビオチ
ン)の量の修正が、その結合効率に影響を及ぼし得ること(特定の標的を標的化するベイ
トのタグレベルの増加/減少を用いて、相対標的対象範囲を強化する/減少させることが
できる)、
(vii)異なるベイトに使用されるヌクレオチドの種類の修正を変更して、標的に対
する結合親和性に影響を及ぼし、かつ相対標的対象範囲を強化する/減少させることがで
きること、または
(viii)例えば、より安定した塩基対合を有する修飾されたオリゴヌクレオチドベ
イトを使用して、高GC含量と比較して低いか、もしくは正常なGC含量の領域間の融解
ハイブリダイゼーション動態を均等化することができること。
【0361】
他の実施形態では、選択効率は、等モル混合物のベイトを用いるときに観察される差次
的配列捕捉効率を参照してベイトの相対存在量または結合実体の密度(例えば、ハプテン
または親和性タグ密度)を調節することによって、ある群内の個別のベイト(例えば、第
1、第2、または第3の複数のベイト)の効率を平準化し、その後、内部的に平準化され
た第2群に対して、差次的の過度の内部的に平準化された第1群を全体のベイト混合物に
導入することにより調節される。
【0362】
ある実施形態において、ライブラリ捕獲物が、腫瘍メンバー、例えば、腫瘍細胞由来の
サブゲノム間隔を含む核酸分子を選択するベイトセット(本明細書で「腫瘍ベイトセット
」とも称される)を含む複数のベイトセットの使用によって提供される。腫瘍メンバーは
、腫瘍細胞に存在する任意のヌクレオチド配列(例えば、変異、野生型、PGx、参照)
または腫瘍もしくは癌細胞に存在する本明細書に記載のイントロンヌクレオチド配列(例
えば、メンバー)であり得る。一実施形態において、腫瘍メンバーは、低頻度、例えば、
それらのゲノムの変化を持つ腫瘍試料由来の細胞の約5%以下で出現する変化(例えば、
1つ以上の変異)を含む。他の実施形態では、腫瘍メンバーは、腫瘍試料由来の細胞の約
10%の頻度で出現する変化(例えば、1つ以上の変異)を含む。他の実施形態では、腫
瘍メンバーは、PGx遺伝子または遺伝子産物由来のサブゲノム間隔、イントロン配列、
例えば、本明細書に記載のイントロン配列、腫瘍細胞に存在する参照配列を含む。
【0363】
他の実施形態では、方法は、非腫瘍メンバー、例えば、非腫瘍細胞に存在する核酸分子
(サブゲノム間隔等)を検出することをさらに含む。一実施形態において、複数のベイト
セットは、非腫瘍メンバー(本明細書で「非腫瘍ベイトセット」とも称される)を選択す
るベイトセットを含む。例えば、非腫瘍メンバーは、腫瘍を有するか、または有する危険
性のある同一の対象由来の正常な(例えば、非癌性)参照試料(例えば、腫瘍試料を得た
同一の対象由来)、正常な隣接組織(NAT)、または血液試料由来であり得る。他の実
施形態では、非腫瘍メンバーは、1名以上の異なる対象(例えば、健常な対象、あるいは
腫瘍を有するか、または有する危険性のある他の対象)由来の腫瘍メンバーとは異なる対
象に由来する(例えば、正常な(例えば、非癌性)参照試料、正常な隣接組織(NAT)
、または血液試料に由来する)。一実施形態において、非腫瘍メンバーは、非腫瘍細胞に
存在するPGx遺伝子または遺伝子産物、イントロン配列、参照配列由来のサブゲノム間
隔を含む。
【0364】
一実施形態において、腫瘍ベイトセットは、以下のA~Mのうちの1、2、3、4、5
、6、7、8、9、10、11、12個、もしくはすべてから選択される:
A.癌表現型に関連した単一ヌクレオチド変化を含むエクソン配列を選択するベイトセ
ット、
B.参照ヌクレオチド(例えば、染色体)配列由来の1、2、3、4、5、6、7、8
、9、10、11、12、13、14、15、16、17、18、19、20個、または
それ以上のコドンのインフレーム欠失を選択するベイトセット、
C.遺伝子内欠失を選択するベイトセット、
D.遺伝子内挿入を選択するベイトセット、
E.全遺伝子の欠失を選択するベイトセット、
F.逆位、例えば、染色体内逆位を選択するベイトセット、
G.染色体間転座を選択するベイトセット、
H.タンデム重複、例えば、染色体内タンデム重複を選択するベイトセット、
I.非反復隣接配列に隣接する目的とするヌクレオチド配列を選択するベイトセット、
J.融合配列に対応する1つ以上のサブゲノム間隔、例えば、融合配列(例えば、融合
転写物または非融合転写物の癌関連選択的スプライシングされた形態)に対応する事前選
択された対のサブゲノム間隔(例えば、事前選択された対のエクソン)を選択するベイト
セット、
K.望ましくない特徴を含むヌクレオチド配列、例えば、高GC含量のヌクレオチド配
列、1つ以上の反復要素および/または逆位反復を含むヌクレオチド配列に隣接したサブ
ゲノム間隔を選択するベイトセット、
L.再編成、例えば、ゲノム再編成(例えば、イントロン配列、例えば、5’もしくは
3’-UTRを含む再編成)を選択するベイトセット、あるいは
M.癌関連遺伝子融合物に隣接したエクソンを含むサブゲノム間隔を選択するベイトセ
ット。
【0365】
ベイトセットおよびそれらを使用する方法のさらなる実施形態は、以下の通りである。
一実施形態において、ベイトセットは、ハイブリダイゼーションによってメンバーを選
択する(例えば、ベイトセット中のベイトまたは複数のベイトは、本明細書に記載の1つ
以上のメンバー、例えば、第1~第5のメンバー等の標的メンバー、腫瘍または非腫瘍メ
ンバーに相補的である)。
【0366】
一実施形態において、ライブラリ(例えば、核酸ライブラリ)は、1、2、3、4、5
、6、7、8、9、10、20、30名、もしくはそれ以上の対象由来の複数のメンバー
、例えば、標的核酸メンバーを含む。一実施形態において、対象は、癌もしくは腫瘍を有
するか、または有する危険性のあるヒトである。
【0367】
ある特定の実施形態において、方法は、少なくともX名の対象由来の腫瘍試料由来の腫
瘍メンバーを配列決定することを含む(X=1、2、3、4、5、6、7、8、9、10
、20、30、40名、もしくはそれ以上の対象)。一実施形態において、対象は、癌も
しくは腫瘍を有するか、または有する危険性のあるヒトである。方法は、少なくともX名
の対象由来の本明細書に記載の少なくとも5、10、15、20、30、40、50、7
5個、もしくはそれ以上の遺伝子または遺伝子産物(例えば、表1、1A、2、3、もし
くは4の遺伝子または遺伝子産物)を配列決定することを含む。
【0368】
他の実施形態において、または前述の実施形態に加えて、方法は、腫瘍試料と同一の対
象由来の遺伝子または遺伝子産物、例えば、本明細書に記載の遺伝子または遺伝子産物(
例えば、表1、1A、2、3、もしくは4の遺伝子または遺伝子産物)の野生型または非
変異ヌクレオチド配列からの参照サブゲノム間隔を配列決定することを含む。一実施形態
において、参照遺伝子または遺伝子産物は、腫瘍を有するか、または有する危険性のある
同一の対象由来、あるいは異なる対象由来の腫瘍試料と同一の対象または異なる対象に由
来する(例えば、同一もしくは異なる腫瘍試料、正常な(例えば、非癌性)試料、正常な
隣接組織(NAT)、または血液試料のうちの1つ以上に由来する)。
【0369】
一実施形態において、メンバー(例えば、本明細書に記載のメンバーのうちのいずれか
)は、サブゲノム間隔を含む。一実施形態において、サブゲノム間隔は、遺伝子内領域ま
たは遺伝子間領域を含む。一実施形態において、サブゲノム間隔は、遺伝子もしくはその
断片、エクソンもしくはその断片、または事前選択されたヌクレオチド位置(例えば、塩
基)を含む。別の実施形態では、サブゲノム間隔は、エクソンもしくはイントロン、また
はその断片、典型的には、エクソンまたはその断片を含む。一実施形態において、サブゲ
ノム間隔は、コード領域もしくは非コード領域、例えば、プロモーター、エンハンサー、
5’非翻訳領域(5’UTR)、または3’非翻訳領域(3’UTR)、あるいはその断
片を含む。
【0370】
別の実施形態では、メンバー(例えば、本明細書に記載のメンバーのうちのいずれか)
のサブゲノム間隔は、癌表現型(例えば、癌の危険性、癌進行、癌治療、または癌治療に
対する抵抗のうちの1つ以上)に、例えば、正もしくは負に関連した変化(例えば、1つ
以上の変異)を含む。さらに別の実施形態では、サブゲノム間隔は、変化、例えば、点変
異または単一変異、欠失変異(例えば、インフレーム欠失、遺伝子内欠失、全遺伝子欠失
)、挿入変異(例えば、遺伝子内挿入)、逆位変異(例えば、染色体内逆位)、連鎖変異
、連鎖された挿入変異、逆位重複変異、タンデム重複(例えば、染色体内タンデム重複)
、転座(例えば、染色体転座、非相反転座)、再編成(例えば、ゲノム再編成(例えば、
1つ以上のイントロンもしくはその断片の再編成;再編成されたイントロンは、5’-お
よび/もしくは3’-UTRを含み得る)、遺伝子コピー数の変化、遺伝子発現の変化、
RNAレベルの変化、またはそれらの組み合わせを含む。一実施形態において、第1もし
くは第2のメンバーのサブゲノム間隔は、表1、1A、3、もしくは4に従う遺伝子また
は遺伝子産物の変化を含む。
【0371】
一実施形態において、腫瘍メンバーは、1つ以上の変化(例えば、腫瘍試料由来の遺伝
子もしくは遺伝子産物由来の1つ以上の変化または変異したサブゲノム間隔)を含む。い
くつかの実施形態では、ベイトセット(例えば、本明細書に記載のベイトセットのうちの
いずれか)は、癌表現型に、例えば、正もしくは負に関連した変化(例えば、1つ以上の
変異)を含む腫瘍メンバー、例えば、核酸分子(例えば、遺伝子、エクソン、またはその
断片等のサブゲノム間隔)を選択する(例えば、それに相補的である)。
【0372】
ある実施形態において、メンバーは、癌表現型、例えば、癌の危険性、癌進行、癌治療
、または癌治療に対する抵抗のうちの1つ以上に関連する。癌表現型との関連は、癌の遺
伝的危険因子、正の治療応答予測因子、負の治療応答予測因子、正の予後因子、負の予後
因子、または診断因子のうちの1つ以上を含み得る。一実施形態において、腫瘍メンバー
に関連した癌表現型は、試料の組織学的分析によって検出されるものと同一の腫瘍型であ
る。他の実施形態では、腫瘍メンバーに関連した癌表現型は、試料の組織学的分析によっ
て検出されるものとは異なる腫瘍型に由来する。
【0373】
ある特定の実施形態において、サブゲノム間隔は、ヌクレオチド配列を含み、事前選択
された対立遺伝子バリアントの存在もしくは不在は、正の臨床転帰および/または治療に
対する応答性を予測する。他の実施形態では、サブゲノム間隔は、ヌクレオチド配列を含
み、事前選択された対立遺伝子バリアントの存在もしくは不在は、負の臨床転帰および/
または治療に対する応答性を予測する。ある特定の実施形態において、核酸試料のサブゲ
ノム間隔は、ヌクレオチド配列を含み、事前選択された対立遺伝子バリアントの存在もし
くは不在は、癌を発現させる遺伝(例えば、生殖細胞系危険)因子を示す(例えば、遺伝
子または遺伝子産物は、BRCA1、BRCA2、EGFR、HRAS、KIT、MPL
、ALK、PTEN、RET、APC、CDKN2A、MLH1、MSH2、MSH6、
NF1、NF2、RB1、TP53、VHL、もしくはWT1のうちの1つ以上から選択
される)。
【0374】
他の実施形態では、メンバーは、癌表現型に関連しない。ある特定の実施形態において
、メンバー(例えば、本明細書に記載のメンバーのうちのいずれか)のサブゲノム間隔は
、試料由来の腫瘍型の癌表現型に関連しない核酸分子を(同一または異なるサブゲノム間
隔において)含む。
【0375】
一実施形態において、メンバー(例えば、本明細書に記載のメンバーのうちのいずれか
)のサブゲノム間隔は、遺伝子もしくは遺伝子産物の野生型または非変異ヌクレオチド配
列(例えば、エクソン配列またはその断片)を含む。一実施形態において、第1もしくは
第2のメンバーのサブゲノム間隔は、変異が癌表現型に関連するときに遺伝子もしくは遺
伝子産物の野生型または非変異ヌクレオチド配列(例えば、本明細書に記載の遺伝子もし
くは遺伝子産物、例えば、本明細書の表1、1A、3、もしくは4に記載の遺伝子もしく
は遺伝子産物の野生型または非変異配列)を含む。野生型または非変異遺伝子もしくは遺
伝子産物配列を含有するメンバーは、本明細書で「参照メンバー」とも称される。例えば
、サブゲノム間隔は、ヘテロ接合体変異の野生型対立遺伝子、正常な(例えば、非癌性)
参照試料(例えば、腫瘍試料を得た同一の対象由来)、正常な隣接組織(NAT)、ある
いは腫瘍を有するか、または有する危険性のある同一の対象由来の血液試料のうちの1つ
以上に由来する。他の実施形態では、サブゲノム間隔は、1名以上の異なる対象(例えば
、健常な対象、あるいは腫瘍を有するか、または有する危険性のある他の対象)由来の腫
瘍メンバーとは異なる対象に由来する(例えば、異なる対象、正常な(例えば、非癌性)
参照試料、正常な隣接組織(NAT)、または血液試料由来の同一または異なる腫瘍試料
のうちの1つ以上に由来する)。
【0376】
一実施形態において、第1のベイトセットまたは腫瘍ベイトセットは、約5%以下の頻
度で出現する、例えば、高い検出信頼性を確保するために約500倍以上の配列決定深度
を必要とする点変異を含む(すなわち、試料を調製した細胞の5%がそれらのゲノムでこ
の変異を持つ)サブゲノム間隔を選択する(例えば、それに相補的である)。
【0377】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、ABL1、AKT
1、AKT2、AKT3、ALK、APC、AR、BRAF、CCND1、CDK4、C
DKN2A、CEBPA、CTNNB1、EGFR、ERBB2、ESR1、FGFR1
、FGFR2、FGFR3、FLT3、HRAS、JAK2、KIT、KRAS、MAP
2K1、MAP2K2、MET、MLL、MYC、NF1、NOTCH1、NPM1、N
RAS、NTRK3、PDGFRA、PIK3CA、PIK3CG、PIK3R1、PT
CH1、PTCH2、PTEN、RB1、RET、SMO、STK11、SUFU、また
はTP53遺伝子もしくは遺伝子産物のうちの1、2、3、4、5、6、7、8、9、1
0、15、20、25、30個、もしくはそれ以上から選択される腫瘍または参照メンバ
ーを選択する(例えば、それに相補的である)。一実施形態において、第1のベイトセッ
トまたは腫瘍ベイトセットは、ABL1遺伝子のコドン315;APCのコドン1114
、1338、1450、もしくは1556;BRAFのコドン600;CTNNB1のコ
ドン32、33、34、37、41、もしくは45;EGFRのコドン719、746~
750、768、790、858、もしくは861;FLT3のコドン835;HRAS
のコドン12、13、もしくは61;JAK2のコドン617;KITのコドン816;
KRASのコドン12、13、もしくは61;PIK3CAのコドン88、542、54
5、546、1047、もしくは1049;PTENのコドン130、173、233、
もしくは267;RETのコドン918;TP53のコドン175、245、248、2
73、もしくは306のうちの1つ以上から選択される1、2、3、4、5、6、7、8
、9、10、15、20、25、30、35個のコドンを選択する(例えば、それに相補
的である)。
【0378】
一実施形態において、第1のベイトセットまたは腫瘍ベイトセットは、ある特定の癌型
において頻繁に変異する1つ以上のサブゲノム間隔、例えば、表1もしくは表1Aに従う
優先順位が1の癌遺伝子または遺伝子産物由来の少なくとも5、10、20、30個、も
しくはそれ以上のサブゲノム間隔を選択する。
【0379】
他の実施形態では、第2のベイトセットは、10%の頻度で出現する、例えば、高い検
出信頼性を確保するために約200倍以上の配列決定深度を必要とする変化(例えば、点
変異)を含む腫瘍メンバーを選択する(例えば、それに相補的である)。
【0380】
他の実施形態では、第2のベイトセットは、ABL2、ARAF、ARFRP1、AR
ID1A、ATM、ATR、AURKA、AURKB、BAP1、BCL2、BCL2A
1、BCL2L1、BCL2L2、BCL6、BRCA1、BRCA2、CBL、CAR
D11、CBL、CCND2、CCND3、CCNE1、CD79A、CD79B、CD
H1、CDH2、CDH20、CDH5、CDK6、CDK8、CDKN2B、CDKN
2C、CHEK1、CHEK2、CRKL、CRLF2、DNMT3A、DOT1L、E
PHA3、EPHA5、EPHA6、EPHA7、EPHB1、EPHB4、EPHB6
、ERBB3、ERBB4、ERG、ETV1、ETV4、ETV5、ETV6、EWS
R1、EZH2、FANCA、FBXW7、FGFR4、FLT1、FLT4、FOXP
4、GATA1、GNA11、GNAQ、GNAS、GPR124、GUCY1A2、H
OXA3、HSP90AA1、IDH1、IDH2、IGF1R、IGF2R、IKBK
E、IKZF1、INHBA、IRS2、JAK1、JAK3、JUN、KDM6A、K
DR、LRP1B、LRP6、LTK、MAP2K4、MCL1、MDM2、MDM4、
MEN1、MITF、MLH1、MPL、MRE11A、MSH2、MSH6、MTOR
、MUTYH、MYCL1、MYCN、NF2、NKX2-1、NTRK1、NTRK2
、PAK3、PAX5、PDGFRB、PKHD1、PLCG1、PRKDC、PTPN
11、PTPRD、RAF1、RARA、RICTOR、RPTOR、RUNX1、SM
AD2、SMAD3、SMAD4、SMARCA4、SMARCB1、SOX10、SO
X2、SRC、TBX22、TET2、TGFBR2、TMPRSS2、TNFAIP3
、TNK、TNKS2、TOP1、TSC1、TSC2、USP9X、VHL、またはW
T1遺伝子もしくは遺伝子産物のうちの1、2、3、4、5、10、15、20、25、
30、35、40、45、50、55、60、65、70、75、80、85、90、9
5、100、105、110、115、120個、もしくはそれ以上から選択される腫瘍
メンバーを選択する(例えば、それに相補的である)。
【0381】
一実施形態において、第2のベイトセットまたは腫瘍ベイトセットは、表1もしくは表
1Aに従う少なくとも5、10、20、30、40、50、60、70、80、90、1
00個、もしくはそれ以上の癌遺伝子または遺伝子産物から選択される1つ以上のサブゲ
ノム間隔(例えば、エクソン)を選択する。
【0382】
ある特定の実施形態において、第1もしくは第2のベイトセットまたは腫瘍ベイトセッ
トは、野生型および/または非変異ヌクレオチド配列、例えば、野生型または非変異ヌク
レオチド配列、例えば、本明細書に記載される、例えば、表1、1A、3、もしくは4に
記載される遺伝子もしくは遺伝子産物のサブゲノム間隔の野生型および/または非変異ヌ
クレオチド配列を有する参照メンバーを選択する。
【0383】
一実施形態において、第1もしくは第2のベイトセットまたは腫瘍セットは、変異が癌
表現型に、例えば、正もしくは負に関連するときに、遺伝子もしくは遺伝子産物の野生型
または非変異ヌクレオチド配列(例えば、エクソン配列またはその断片)を有するメンバ
ー、例えば、参照メンバーを選択する。
【0384】
一実施形態において、参照メンバーは、腫瘍を有するか、または有する危険性のある同
一の対象由来の腫瘍メンバーと同一の対象に由来する(例えば、同一もしくは異なる腫瘍
試料、変異メンバーの野生型ヘテロ接合体対立遺伝子、正常な(例えば、非癌性)参照試
料、正常な隣接組織(NAT)、または血液試料のうちの1つ以上に由来する)。他の実
施形態では、参照メンバーは、腫瘍を有するか、または有する危険性のある1名以上の異
なる対象由来の腫瘍メンバーとは異なる対象に由来する(例えば、異なる対象由来の同一
もしくは異なる腫瘍試料、正常な(例えば、非癌性)参照試料、正常な隣接組織(NAT
)、または血液試料のうちの1つ以上に由来する)。
【0385】
一実施形態において、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは、癌
表現型に関連した単一ヌクレオチド変化を含むエクソン配列を選択する。例えば、第1の
ベイトセットまたは腫瘍ベイトセットは、染色体12のヌクレオチド25,398,21
5~25,398,334に相補的なヌクレオチド配列を含むことができ、KRAS遺伝
子におけるG12S変異を表す25,398,286位でのC-T置換に相補的な塩基を
含有する。
【0386】
別の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは、参照
ヌクレオチド(例えば、染色体)配列由来の1、2、3、4、5、6、7、8、9、10
、11、12、13、14、15、16、17、18、19、20個、もしくはそれ以上
のコドンのインフレーム欠失を特徴とする腫瘍メンバーを選択する。一実施形態において
、第1のベイトセットまたは腫瘍ベイトセットは、それらの参照の5’から3’の配向で
、3、6、9、12、15、18、21、24、27、30、33、36、39、42、
45、48、51、54、57、60個、もしくはそれ以上のヌクレオチドのうちのいず
れかのギャップによって参照染色体配列上で分離された参照染色体配列の2つの不連続の
ヌクレオチド配列を含む(またはそれらからなる)。例えば、第1のベイトセットまたは
腫瘍ベイトセット、染色体7のヌクレオチド55,242,400~55,242,53
5に相補的であるが、ヌクレオチド55,242,464~55,242,479を欠く
ヌクレオチド配列を含んでもよく、これは、EGFR遺伝子のコドン746~750のイ
ンフレーム欠失を表す。
【0387】
さらに別の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは
、遺伝子内欠失を特徴とする腫瘍メンバーを選択する。一実施形態において、第1のベイ
トセットまたは腫瘍ベイトセットは、それらの参照の5’から3’の配向で、1、5、1
0、15、20、25、30、35、40、45、50、55、60個のヌクレオチドに
よって参照染色体配列から分離された参照ヌクレオチド(例えば、染色体)配列の2つの
不連続の断片を含む(またはそれらからなる)。例えば、第1のベイトセットまたは腫瘍
ベイトセットは、染色体10のヌクレオチド9,675,214~89,675,274
、続いて、染色体10の塩基89,675,277~89,675,337に相補的なヌ
クレオチド配列を含んでもよく、これは、PTEN遺伝子のコドン64からのジヌクレオ
チド配列「CA」の欠失を表す。
【0388】
さらに別の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは
、遺伝子内挿入を特徴とする腫瘍メンバーを選択する。一実施形態において、第1のベイ
トセットまたは腫瘍ベイトセットは、1、5、10、15、20、25、30、35、4
0、45、50、55、60個のヌクレオチドの非参照配列によって分離された参照ヌク
レオチド(例えば、染色体)配列の2つの連続した断片を含む(またはそれらからなる)
。例えば、第1のベイトセットまたは腫瘍ベイトセットは、染色体10のヌクレオチド8
9,692,864~89,692,924、続いて、ヌクレオチド配列「GGNATG
」、続いて、染色体10のヌクレオチド89,692,925~89,692,980に
相補的なヌクレオチド配列を含んでもよく、これは、PTEN遺伝子のコドン136の後
のアミノ酸残基「Gly-Met」の挿入を表す。
【0389】
別の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは、全遺
伝子の欠失を特徴とする腫瘍メンバーを選択する。一実施形態において、第1のベイトセ
ットまたは腫瘍ベイトセットは、それらの参照の5’から3’の配向で、500、100
0、1500、2000、2500、3000、4000、5000個、もしくはそれ以
上のヌクレオチドによって参照染色体配列から分離された参照ヌクレオチド(例えば、染
色体)配列の2つの不連続の断片を含む(またはそれらからなる)。例えば、第1のベイ
トセットまたは腫瘍ベイトセットは、染色体9の塩基22,001,175~22,00
1,235に隣接した染色体9の塩基21,961,007~21,961,067に相
補的なヌクレオチド配列を含んでもよく、これは、CDKN2A遺伝子の欠失を表す。
【0390】
別の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは、逆位
、例えば、染色体内逆位を特徴とする腫瘍メンバーを選択する。一実施形態において、第
1のベイトセットまたは腫瘍ベイトセットは、参照ヌクレオチド(例えば、染色体)配列
の2つの不連続の断片に相補的なヌクレオチド配列を含み、それらのうちの1つは、例え
ば、逆位に起因するメンバーを捕捉するために、その参照配向とは逆方向である。例えば
、第1のベイトセットまたは腫瘍ベイトセットは、染色体2のヌクレオチド29,449
,993~29,449,933と並列した染色体2のヌクレオチド42,522,89
3~42,522,953を含んでもよく、これは、EML4:ALK融合を産生する逆
位を表す。
【0391】
別の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは、染色
体間転座を特徴とする腫瘍メンバーを選択する。一実施形態において、第1のベイトセッ
トまたは腫瘍ベイトセットは、例えば、染色体内転座に起因するメンバーを捕捉するため
に、異なる参照染色体配列由来の参照ヌクレオチド(例えば、ゲノム)配列の2つの不連
続の断片に相補的なヌクレオチド配列を含む。例えば、第1のベイトセットまたは腫瘍ベ
イトセットは、染色体9のヌクレオチド133,681,793~133,681,85
3と並列した染色体22のヌクレオチド23,632,552~23,632,612を
含んでもよく、これは、BCR-ABL融合をもたらす染色体転座の存在を表す。
【0392】
さらに別の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは
、タンデム重複、例えば、染色体内タンデム重複を特徴とする腫瘍メンバーを選択する。
一実施形態において、第1のベイトセットまたは腫瘍ベイトセットは、例えば、タンデム
重複を有するメンバーを捕捉するために、その参照配向で少なくとも1度、例えば、2、
3、4、もしくは5回繰り返される、少なくとも3、6、9、12、15、18、21、
24、27、もしくは30ヌクレオチド長の参照ヌクレオチド(例えば、染色体)配列の
1つの断片に相補的なヌクレオチド配列を含む。例えば、ベイトは、同一の配向で2回繰
り返される染色体13の塩基28,608,259~28,608,285を含んでもよ
く、これは、FLT3遺伝子における内部タンデム重複(ITD)変異を表す。
【0393】
さらに別の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは
、非反復隣接配列に隣接する目的とするヌクレオチド配列を特徴とする腫瘍メンバーを選
択する。一実施形態において、第1のベイトセットまたは腫瘍ベイトセットは、少なくと
も2つの不連続のヌクレオチド配列を含む。第1のヌクレオチド配列は、目的とする配列
の5’フランキング領域に相補的であり、第2のヌクレオチド配列は、目的とする配列の
3’フランキング領域に相補的である。例えば、ベイトの第1および第2の対は、染色体
2のヌクレオチド51,288,380~51,288,500(ベイト1)に相補的な
第1のヌクレオチド配列と染色体2のヌクレオチド51,288,560~51,288
,680(ベイト2)に相補的な第2のヌクレオチド配列を含んでもよく、これは、マイ
クロサテライトマーカー配列D2S123を含有するメンバーを捕捉することができる。
【0394】
別の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは、融合
配列(例えば、融合転写物または非融合転写物の癌関連選択的スプライシングされた形態
)に対応する事前選択された対のサブゲノム間隔(例えば、事前選択された対のエクソン
)を選択する(例えば、それに相補的である)。
【0395】
他の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは、望ま
しくない特徴を含むヌクレオチド配列、例えば、高GC含量のヌクレオチド配列、1つ以
上の反復要素および/または逆位反復を含むヌクレオチド配列に隣接したサブゲノム間隔
を選択する。一実施形態において、第1のベイトセットまたは腫瘍ベイトセットは、反復
要素を含むが、反復要素にハイブリダイズしない(例えば、BRCA2遺伝子において反
復要素にハイブリダイズしない)サブゲノム間隔を選択する。
【0396】
他の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは、癌関
連遺伝子融合物に隣接したエクソンを含むサブゲノム間隔を選択し、それによって、遺伝
子融合物に隣接した核酸配列(例えば、cDNA断片)の捕捉を促進する。
【0397】
他の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは、癌表
現型、例えば、表1、1A、3、もしくは4に記載される癌型のうちの1つ以上から選択
される癌に関連した、表1、1A、3、もしくは4に示される1つ以上の遺伝子または遺
伝子産物に由来するサブゲノム間隔を選択する。
【0398】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、CML、ALL、もしくはT-ALLのうちの1つ以上から選択される軟組織悪性腫瘍
に関連したABL-1遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する
。一実施形態において、ライブラリ、例えば、核酸ライブラリは、CML、ALL、もし
くはT-ALLのうちの1つ以上を有するか、または有する危険性のある対象由来の試料
から得られる。
【0399】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、乳癌、結腸直腸癌、卵巣癌、もしくは非小細胞肺癌(NSCLC)のうちの1つ以上か
ら選択される癌に関連したAKT1遺伝子もしくは遺伝子産物、またはそのサブゲノム間
隔を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、乳癌、結
腸直腸癌、卵巣癌、もしくは非小細胞肺癌(NSCLC)のうちの1つ以上を有するか、
または有する危険性のある対象由来の試料から得られる。
【0400】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、ALCL、NSCLC、もしくは神経芽細胞腫のうちの1つ以上から選択される癌に関
連したALK遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施
形態において、ライブラリ、例えば、核酸ライブラリは、ALCL、NSCLC、もしく
は神経芽細胞腫のうちの1つ以上を有するか、または有する危険性のある対象由来の試料
から得られる。
【0401】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、結腸直腸癌、膵臓癌、類腱腫、肝芽腫、神経膠腫、もしくは他のCNS癌または腫瘍の
うちの1つ以上から選択される癌に関連したAPC遺伝子もしくは遺伝子産物、またはそ
のサブゲノム間隔を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラ
リは、結腸直腸癌、膵臓癌、類腱腫、肝芽腫、神経膠腫、もしくは他のCNS癌または腫
瘍のうちの1つ以上を有するか、または有する危険性のある対象由来の試料から得られる
。
【0402】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、黒色腫、結腸直腸癌、肺癌、他の上皮悪性腫瘍、またはAMLもしくはALLを含む血
液悪性腫瘍のうちの1つ以上から選択される癌に関連したBRAF遺伝子もしくは遺伝子
産物、またはそのサブゲノム間隔を選択する。一実施形態において、ライブラリ、例えば
、核酸ライブラリは、黒色腫、結腸直腸癌、肺癌、他の上皮悪性腫瘍、またはAMLもし
くはALLを含む血液悪性腫瘍のうちの1つ以上を有するか、または有する危険性のある
対象由来の試料から得られる。
【0403】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、黒色腫、膵臓癌、もしくは他の腫瘍型のうちの1つ以上から選択される癌に関連したC
DKN2A遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形
態において、ライブラリ、例えば、核酸ライブラリは、黒色腫、膵臓癌、または他の腫瘍
型のうちの1つ以上を有するか、または有する危険性のある対象由来の試料から得られる
。
【0404】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、AMLもしくはMDSのうちの1つ以上から選択される癌に関連したCEBPA遺伝子
もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態において、ライ
ブラリ、例えば、核酸ライブラリは、AMLもしくはMDSのうちの1つ以上を有するか
、または有する危険性のある対象由来の試料から得られる。
【0405】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、結腸直腸癌、卵巣癌、肝芽腫、もしくは多形性唾液腺腫のうちの1つ以上から選択され
る癌に関連したCTNNB1遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選
択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、結腸直腸癌、卵
巣癌、肝芽腫、もしくは多形性唾液腺腫のうちの1つ以上を有するか、または有する危険
性のある対象由来の試料から得られる。
【0406】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、神経膠腫、肺癌、もしくはNSCLCのうちの1つ以上から選択される癌に関連したE
GFR遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態に
おいて、ライブラリ、例えば、核酸ライブラリは、神経膠腫、肺癌、もしくはNSCLC
のうちの1つ以上を有するか、または有する危険性のある対象由来の試料から得られる。
【0407】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、例えば、癌表現型
、例えば、乳癌、卵巣癌、NSCLC、胃癌、もしくは他の固形腫瘍のうちの1つ以上か
ら選択される癌に正もしくは負に関連したERBB2遺伝子もしくは遺伝子産物、または
そのサブゲノム間隔を選択する。一実施形態において、ライブラリ、例えば、核酸ライブ
ラリは、乳房、卵巣、NSCLC、胃、もしくは他の固形腫瘍型のうちの1つ以上を有す
るか、または有する危険性のある対象由来の試料から得られる。
【0408】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、乳癌、卵巣癌、もしくは子宮内膜腫瘍のうちの1つ以上から選択される癌に関連したE
SR1遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態に
おいて、ライブラリ、例えば、核酸ライブラリは、乳癌、卵癌、もしくは子宮内膜腫瘍の
うちの1つ以上を有するか、または有する危険性のある対象由来の試料から得られる。
【0409】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、MPDもしくはNHLのうちの1つ以上から選択される癌に関連したFGFR1遺伝子
もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態において、ライ
ブラリ、例えば、核酸ライブラリは、MPDもしくはNHLのうちの1つ以上を有するか
、または有する危険性のある対象由来の試料から得られる。
【0410】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、胃癌、NSCLC、もしくは子宮内膜腫瘍のうちの1つ以上から選択される癌に関連し
たFGFR2遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施
形態において、ライブラリ、例えば、核酸ライブラリは、胃癌、NSCLC、もしくは子
宮内膜腫瘍のうちの1つ以上を有するか、または有する危険性のある対象由来の試料から
得られる。
【0411】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、膀胱癌、多発性骨髄腫、もしくはT細胞リンパ腫のうちの1つ以上から選択される癌に
関連したFGFR3遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。
一実施形態において、ライブラリ、例えば、核酸ライブラリは、膀胱癌、多発性骨髄腫、
もしくはT細胞リンパ腫のうちの1つ以上を有するか、または有する危険性のある対象由
来の試料から得られる。
【0412】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、。癌表現型、例え
ば、黒色腫、結腸直腸癌、甲状腺乳頭癌、卵巣癌、非小細胞肺癌(NSCLC)、胆管癌
、もしくは毛様細胞性星状細胞腫のうちの1つ以上から選択される癌に関連したFLT3
遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態において
、ライブラリ、例えば、核酸ライブラリは、黒色腫、結腸直腸癌、甲状腺乳頭癌、卵巣癌
、非小細胞肺癌(NSCLC)、胆管癌、もしくは毛様細胞性星状細胞腫のうちの1つ以
上を有するか、または有する危険性のある対象由来の試料から得られる。
【0413】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、横紋筋肉腫、神経節芽細胞腫、膀胱癌、肉腫、もしくは他の癌型のうちの1つ以上から
選択される癌に関連したHRAS遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔
を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、横紋筋肉腫
、神経節芽細胞腫、膀胱癌、肉腫、もしくは他の癌型のうちの1つ以上を有するか、また
は有する危険性のある対象由来の試料から得られる。
【0414】
他の実施形態では、癌表現型、例えば、ALL、AML、MPD、もしくはCMLのう
ちの1つ以上から選択される癌に関連した第1のベイトセットまたは腫瘍ベイトセットは
、JAK2遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形
態において、ライブラリ、例えば、核酸ライブラリは、ALL、AML、MPD、もしく
はCMLのうちの1つ以上を有するか、または有する危険性のある対象由来の試料から得
られる。
【0415】
他の実施形態では、癌表現型、例えば、消化管間質腫瘍(GIST)、AML、TGC
T、肥満細胞症、粘膜黒色腫、もしくは上皮腫のうちの1つ以上から選択される癌に関連
した第1のベイトセットまたは腫瘍ベイトセットは、KIT遺伝子もしくは遺伝子産物、
またはそのサブゲノム間隔を選択する。一実施形態において、ライブラリ、例えば、核酸
ライブラリは、消化管間質腫瘍(GIST)、AML、TGCT、肥満細胞症、粘膜黒色
腫、もしくは上皮腫のうちの1つ以上を有するか、または有する危険性のある対象由来の
試料から得られる。
【0416】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、膵臓癌、結腸癌、結腸直腸癌、肺癌、甲状腺癌、もしくはAMLのうちの1つ以上から
選択される癌に関連したKRAS遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔
を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、膵臓癌、結
腸癌、結腸直腸癌、肺癌、甲状腺癌、もしくはAMLのうちの1つ以上を有するか、また
は有する危険性のある対象由来の試料から得られる。
【0417】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、腎臓癌もしくは頭頸部扁平上皮癌のうちの1つ以上から選択される癌に関連したMET
遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態において
、ライブラリ、例えば、核酸ライブラリは、腎臓癌もしくは頭頸部扁平上皮癌のうちの1
つ以上を有するか、または有する危険性のある対象由来の試料から得られる。
【0418】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、AMLもしくはALLのうちの1つ以上から選択される癌に関連したMLL遺伝子もし
くは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態において、ライブラ
リ、例えば、核酸ライブラリは、AMLもしくはALLのうちの1つ以上を有するか、ま
たは有する危険性のある対象由来の試料から得られる。
【0419】
他の実施形態では、第1のベイトセットは、癌表現型、例えば、神経繊維腫もしくは神
経膠腫のうちの1つ以上から選択される癌に関連したNF1遺伝子もしくは遺伝子産物、
またはそのサブゲノム間隔を選択する(例えば、それに相補的である)。一実施形態にお
いて、ライブラリ、例えば、核酸ライブラリは、神経繊維腫もしくは神経膠腫のうちの1
つ以上を有するか、または有する危険性のある対象由来の試料から得られる。
【0420】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、T-ALL癌に関連したNOTCH1遺伝子もしくは遺伝子産物、またはそのサブゲノ
ム間隔を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、T-
ALL癌を有するか、または有する危険性のある対象由来の試料から得られる。
【0421】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、NHL、APL、もしくはAMLのうちの1つ以上から選択される癌に関連したNPM
1遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実施形態におい
て、ライブラリ、例えば、核酸ライブラリは、NHL、APL、もしくはAMLのうちの
1つ以上を有するか、または有する危険性のある対象由来の試料から得られる。
【0422】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、黒色腫、結腸直腸癌、多発性骨髄腫、AML、もしくは甲状腺癌のうちの1つ以上から
選択される癌に関連したNRAS遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔
を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは、黒色腫、結
腸直腸癌、多発性骨髄腫、AML、もしくは甲状腺癌のうちの1つ以上を有するか、また
は有する危険性のある対象由来の試料から得られる。
【0423】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、GISTもしくは特発性好酸球増加症候群のうちの1つ以上から選択される癌に関連し
たPDGFRA遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実
施形態において、ライブラリ、例えば、核酸ライブラリは、GISTもしくは特発性好酸
球増加症候群のうちの1つ以上を有するか、または有する危険性のある対象由来の試料か
ら得られる。
【0424】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、結腸直腸癌、胃癌、膠芽腫、もしくは乳癌のうちの1つ以上から選択される癌に関連し
たPIK3CA遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実
施形態において、ライブラリ、例えば、核酸ライブラリは、結腸直腸癌、胃癌、膠芽腫、
もしくは乳癌のうちの1つ以上を有するか、または有する危険性のある対象由来の試料か
ら得られる。
【0425】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、結腸直腸癌、神経膠腫、前立腺癌、もしくは子宮内膜癌のうちの1つ以上から選択され
る癌に関連したPTEN遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択す
る。一実施形態において、ライブラリ、例えば、核酸ライブラリは、結腸直腸癌、神経膠
腫、前立腺癌、もしくは子宮内膜癌のうちの1つ以上を有するか、または有する危険性の
ある対象由来の試料から得られる。
【0426】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、網膜芽細胞腫、肉腫、乳癌、もしくは小細胞肺癌のうちの1つ以上から選択される癌に
関連したRB1遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一実
施形態において、ライブラリ、例えば、核酸ライブラリは、網膜芽細胞腫、肉腫、乳癌、
もしくは小細胞肺癌のうちの1つ以上を有するか、または有する危険性のある対象由来の
試料から得られる。
【0427】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、甲状腺髄様癌、甲状腺乳頭癌、もしくは褐色細胞腫のうちの1つ以上から選択される癌
に関連したRET遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。一
実施形態において、ライブラリ、例えば、核酸ライブラリは、甲状腺髄様癌、甲状腺乳頭
癌、もしくは褐色細胞腫のうちの1つ以上を有するか、または有する危険性のある対象由
来の試料から得られる。
【0428】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、癌表現型、例えば
、乳癌、結腸直腸癌、肺癌、肉腫、副腎皮質癌、神経膠腫、もしくは他の腫瘍型のうちの
1つ以上から選択される癌に関連したTP53遺伝子もしくは遺伝子産物、またはそのサ
ブゲノム間隔を選択する。一実施形態において、ライブラリ、例えば、核酸ライブラリは
、乳癌、結腸直腸癌、肺癌、肉腫、副腎皮質癌、神経膠腫、もしくは他の腫瘍型のうちの
1つ以上を有するか、または有する危険性のある対象由来の試料から得られる。
【0429】
一実施形態において、第1のベイトセットまたは腫瘍ベイトセットは、治療応答の正の
予測因子である遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。治療
応答の正の予測因子の例には、NSCLC患者の小分子EGFR TKI(例えば、イレ
ッサ/ゲフィチニブ)に対する応答性を予測するEGFR遺伝子における活性化変異、N
SCLC患者のALK阻害剤(例えば、PF-02341066)に対する応答性を予測
するEML4/ALK融合遺伝子の存在、黒色腫患者のBRAF阻害(例えば、PLX-
4032)に対する応答性を予測するBRAF V600E変異の存在が挙げられるが、
これらに限定されない。
【0430】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、治療応答の負の予
測因子である遺伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。治療応
答の負の予測因子の例には、CRC患者の抗EGFRモノクローナル抗体(セテュキマブ
、パニツムマブ)への応答欠如を予測するKRAS遺伝子における活性化変異、およびC
ML患者のグリーベック/イマチニブに対する抵抗を予測するBCR/Abl融合遺伝子
におけるM351T変異の存在が挙げられるが、これらに限定されない。
【0431】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、予後因子である遺
伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。予後因子の例には、A
ML患者の再発の負の予後であるFLT3遺伝子における挿入変異の存在、甲状腺髄様癌
患者の生存の負の予後因子である特定のRET遺伝子変異、例えば、M918Tの存在が
挙げられるが、これらに限定されない。
【0432】
他の実施形態では、第1のベイトセットまたは腫瘍ベイトセットは、診断因子である遺
伝子もしくは遺伝子産物、またはそのサブゲノム間隔を選択する。予後因子の例には、C
MLの診断であるBCR/Abl融合遺伝子の存在、および腎臓のラブドイド腫瘍の診断
であるSMARCB1変異の存在が挙げられるが、これらに限定されない。
【0433】
さらに他の実施形態では、第1もしくは第2のベイトセットまたは腫瘍ベイトセットは
、腫瘍進行および/または耐性に関連した変化を含み、かつ癌進行の後期発症(例えば、
転移関連変異、薬物抵抗関連変異)を有する核酸分子(例えば、サブゲノム間隔)を選択
する。
【0434】
さらに他の実施形態では、腫瘍メンバーは、腫瘍試料中の腫瘍細胞のゲノムのコード領
域の5、1、0.5、0.1%、0.01%、0.001%未満に存在する遺伝子または
遺伝子産物由来のサブゲノム間隔を含む。
【0435】
一実施形態において、腫瘍メンバーは、腫瘍または癌に関連した(例えば、正もしくは
負の治療応答予測因子であるか、正もしくは負の予後因子であるか、または腫瘍または癌
の差次的診断を可能にする)遺伝子または遺伝子産物、例えば、ABL1、AKT1、A
LK、AR、BRAF、BRCA1、BRCA2、CEBPA、EGFR、ERBB2、
FLT3、JAK2、KIT、KRAS、MET、NPM1、PDGFRA、PIK3C
A、RARA、AKT2、AKT3、MAP2K4、NOTCH1、およびTP53のう
ちの1つ以上から選択される遺伝子または遺伝子産物由来のサブゲノム間隔を含む。
【0436】
一実施形態において、腫瘍メンバーは、表1、表1A-4に従う野生型または変異遺伝
子もしくは遺伝子産物から選択されるサブゲノム間隔を含む。
【0437】
一実施形態において、腫瘍メンバーは、GCが豊富な領域に埋め込まれる、表1、表1
A-4に従う野生型または変異遺伝子もしくは遺伝子産物から選択されるサブゲノム間隔
を含む。
【0438】
別の実施形態では、腫瘍メンバーは、表3に従う少なくとも5、10、15、20、2
5、30、35、40、45、50、75、110個、もしくはそれ以上の遺伝子または
遺伝子産物の転座変化を含む。他の実施形態では、腫瘍メンバーは、表3に明記される癌
型由来の固形腫瘍試料における、表3に従う少なくとも5、10、15、20、25、3
0、35、40、45、50、75、110個、もしくはそれ以上の遺伝子または遺伝子
産物の転座変化を含む。
【0439】
一実施形態において、腫瘍メンバーは、表4に従う少なくとも5、10、15、20、
25、30、35、40、45、50、75、100、150、200個、もしくはそれ
以上の遺伝子または遺伝子産物の転座変化を含む。別の実施形態では、腫瘍メンバーは、
表4に明記される癌型由来のヘム腫瘍試料における、表4に従う少なくとも5、10、1
5、20、25、30、35、40、45、50、75、100、150、200個、も
しくはそれ以上の遺伝子または遺伝子産物の転座変化を含む。
【0440】
他の実施形態では、複数のベイトは、対照メンバー、例えば、ライブラリにおける標的
核酸メンバーのフィンガープリント、ライブラリ中の標的核酸メンバーの存在量の定量化
、ライブラリ中の患者の標的核酸メンバーの同定、ライブラリが由来する試料の倍数性の
決定、ライブラリが由来する試料におけるヘテロ接合性の消失の決定、ライブラリが由来
する試料における遺伝子重複の決定、ライブラリが由来する試料における遺伝子増幅の決
定、またはライブラリが由来する試料における腫瘍/正常な細胞混合物の決定のうちの1
つ以上のために使用される核酸を選択する(例えば、それに相補的な)ベイトセットをさ
らに含む。そのようなベイトは、本明細書で「対照ベイト」と称される。一実施形態にお
いて、対照ベイトセットは、第3のベイトセットまたはPGxベイトセットである。他の
実施形態では、対照ベイトセットは、本明細書に記載のPGxメンバーを選択する(例え
ば、それに相補的である)。他の実施形態では、対照ベイトは、SNP(例えば、本明細
書に記載のSNP)を含む核酸分子を選択する。
【0441】
ある特定の実施形態において、第3のベイトセット、腫瘍もしくは非腫瘍ベイトセット
、またはPGxベイトセット(本明細書で集合的に「対照ベイトセット」と称される)は
、低レベルの標的である核酸分子を(腫瘍または参照メンバーと同一または異なるサブゲ
ノム間隔において)選択し、例えば、ヘテロ接合体対立遺伝子の検出は、高い検出信頼性
を確保するために、10~100倍の配列決定深度を必要とする。一実施形態において、
第3のベイトセット、または腫瘍もしくはPGxベイトセットは、ライブラリにおける標
的核酸メンバーのフィンガープリント、ライブラリにおける標的核酸メンバーの存在量の
定量化、ライブラリにおける患者の標的核酸メンバーの同定、ライブラリが由来する試料
の倍数性の決定、ライブラリが由来する試料におけるヘテロ接合性の消失の決定、ライブ
ラリが由来する試料における遺伝子重複の決定、ライブラリが由来する試料における遺伝
子増幅の決定、またはライブラリが由来する試料における腫瘍/正常な細胞混合物の決定
のうちの1つ以上のために使用されるサブゲノム間隔を選択する。
【0442】
一実施形態において、対照ベイトセット(例えば、第3のベイトセット、腫瘍もしくは
非腫瘍ベイトセット、またはPGxベイトセット)は、a)異なる薬物を代謝する患者の
能力を説明し得る薬理ゲノムSNP、b)患者を一意に特定する(フィンガープリントす
る)ために使用され得るゲノムSNP、c)ゲノムDNAのコピー数獲得/喪失およびヘ
テロ接合性の消失(LOH)を評価するために使用され得るゲノムSNP/遺伝子座から
選択される1つ以上のサブゲノム間隔(例えば、エクソン)を選択する。
【0443】
一実施形態において、対照ベイトセット(例えば、第3のベイトセット、腫瘍もしくは
非腫瘍ベイトセット、またはPGxベイトセット)は、薬物代謝または毒性に関連したバ
リアントを含む核酸分子を選択する。一実施形態において、対照ベイトセット(例えば、
第3のベイトセット、腫瘍もしくは非腫瘍ベイトセット、またはPGxベイトセット)は
、対象の遺伝子構造(例えば、民族性、人種、家族性形質)に関連した核酸分子を選択す
る(例えば、それに相補的である)。
【0444】
他の実施形態では、対照ベイトセット(例えば、第3のベイトセット、腫瘍もしくは非
腫瘍ベイトセット、またはPGxベイトセット)は、単一ヌクレオチド多型(SNP)を
選択する。一実施形態において、第3のベイトセット、腫瘍もしくは非腫瘍(例えば、P
Gx)ベイトセットは、ABCB1、ABCC2、ABCC4、ABCG2、C1orf
144、CYP1B1、CYP2C19、CYP2C8、CYP2D6、CYP3A4、
CYP3A5、DPYD、ERCC2、ESR2、FCGR3A、GSTP1、ITPA
、LRP2、MAN1B1、MTHFR、NQO1、NRP2、SLC19A1、SLC
22A2、SLCO1B3、SOD2、SULT1A1、TPMT、TYMS、UGT1
A1、およびUMPSのうちの1、2、3、4、5、10、15、20、25、または3
0個から選択されるSNPを選択する(例えば、それに相補的である)。一実施形態にお
いて、対照ベイトセットは、表2に従う遺伝子または遺伝子産物を選択する。
【0445】
他の実施形態では、対照ベイトセット(例えば、第3のベイトセット、腫瘍もしくは非
腫瘍ベイトセット、またはPGxベイトセット)は、(i)薬物で治療された癌患者のよ
り良好な生存率(例えば、パクリタキセル(例えば、ABCB1遺伝子)で治療された乳
癌患者のより良好な生存率)、(ii)パクリタキセル代謝(例えば、表2に示される異
なる遺伝子座および変異におけるCYP2C8遺伝子、CYP3A4遺伝子)、(iii
)薬物に対する毒性(例えば、ABCC4遺伝子で見られる6-MP毒性(表2);DP
YD遺伝子、TYMS遺伝子、またはUMPS遺伝子で見られる5-FU毒性(表2);
TMPT遺伝子で見られるプリン毒性(表2);NRP2遺伝子、Clorf144遺伝
子、CYP1B1遺伝子で見られるダウノルビシン毒性(表2)、または(iv)薬物の
副作用(例えば、ABCG2、TYMS、UGT1A1、ESR1、およびESR2遺伝
子(表2))のうちの1つ以上に関連した遺伝子もしくは遺伝子産物に存在するサブゲノ
ム間隔の変異または野生型PGx遺伝子もしくは遺伝子産物(例えば、単一ヌクレオチド
多型(SNP))由来のサブゲノム間隔を選択する。
【0446】
他の実施形態では、対照ベイトセット(例えば、第3のベイトセット、腫瘍もしくは非
腫瘍ベイトセット、またはPGxベイトセット)は、ライブラリにおける標的核酸メンバ
ーの存在量の定量化を提供するために事前選択されたサブゲノム間隔(例えば、エクソン
またはUTR配列)を選択する。一実施形態において、第3のベイトセット、腫瘍もしく
は非腫瘍(例えば、PGx)は、ライブラリ、例えば、cDNAライブラリにおける転写
物の相対存在量の定量化を提供する。
【0447】
他の実施形態では、第4のベイトセットは、例えば、ゲノム転座またはインデル等の構
造ブレークポイントを検出するために低~中程度の対象範囲が要求される、第1のイント
ロン標的(例えば、イントロン配列含むメンバー)を選択する。例えば、イントロンブレ
ークポイントの検出は、高い検出信頼性を確保するために、5~50倍の配列対スパン深
度を必要とする。該第4のベイトセットを用いて、例えば、転座/インデルの傾向のある
癌遺伝子を検出することができる。
【0448】
さらに他の実施形態では、第5のベイトセットは、コピー数の変化を検出する能力を改
善するために、わずかな対象範囲が要求される、第2のイントロン標的(例えば、イント
ロンメンバー)を選択する。例えば、いくつかの末端エクソンの1コピー欠失の検出は、
高い検出信頼性を確保するために、0.1~10倍の対象範囲を必要とする。該第5のベ
イトセットを用いて、例えば、増幅/欠失の傾向のある癌遺伝子を検出することができる
。
【0449】
さらに別の実施形態では、本明細書に記載のベイトセットのうちのいずれも(例えば、
第1、第2、第3のベイト、第4のベイト、第5のベイトセット、対照、腫瘍、非腫瘍ベ
イトセット、またはPGxベイトセット)、二次構造の形成を減少させるように修飾され
る(例えば、ヌクレオチドを二次構造の形成の減少をもたらす異なるヌクレオチドで置換
することによって)。一実施形態において、修飾されたベイトセットを用いて、高GC含
量の領域を捕捉する。一実施形態において、修飾されたベイト(または複数のベイト)は
、1つ以上のヌクレオチドの異なる天然ヌクレオチド(例えば、A、C、G、U、または
T)での置換を含む。別の実施形態では、修飾されたベイト(または複数のベイト)は、
1つ以上のヌクレオチドの非天然ヌクレオチド類似体(例えば、イノシンまたはデオキシ
イノシン)での置換を含む。一実施形態において、ベイトセットは、表8の例となる配列
によって示されるように修飾される。
【0450】
他の実施形態では、第1、第2、または第3のベイトセットのうちの2つ以上は、同一
のサブゲノム間隔(例えば、同一の遺伝子または遺伝子産物)である。一実施形態におい
て、第1および第2のベイトセットは、同一のサブゲノム間隔である。別の実施形態では
、第1および第3のベイトセットは、同一のサブゲノム間隔である。別の実施形態では、
第2および第3のベイトセットは、同一のサブゲノム間隔である。他の実施形態では、第
1、第2、および第3のベイトセットは、異なるサブゲノム間隔(例えば、異なる遺伝子
または遺伝子産物)である。
【0451】
前述のベイトセットの任意の組み合わせが、本明細書に記載の方法で使用され得る。一
実施形態において、前述の第1、第2、および/もしくは第3のベイトのサブセットまた
はすべて、あるいは複数のベイトは、組み合わせて使用される。
【0452】
一実施形態において、組み合わせは、本明細書に記載の第1のベイトセットおよび第2
のベイトセットを含む。例えば、第1のベイトセットは、表1もしくは表1Aにおいて優
先順位が1の本明細書に記載の変化(例えば、1つ以上の変異)を含む腫瘍メンバー、例
えば、サブゲノム間隔を選択し、第2のベイトセットは、表1もしくは表1Aにおいて癌
遺伝子として本明細書に記載のメンバーを選択する。
【0453】
他の実施形態では、組み合わせは、本明細書に記載の第1のベイトおよび第3のベイト
セットを含む。例えば、第1のベイトセットは、表1もしくは表1Aにおける優先順位が
1の本明細書に記載の変化(例えば、1つ以上の変異)を含む腫瘍メンバー、例えば、サ
ブゲノム間隔を選択し、第3のベイトセットは、PGxメンバー、例えば、試料のフィン
ガープリント、患者の試料の特定、倍数性の決定、ヘテロ接合性の消失の決定、遺伝子重
複の決定、遺伝子増幅の決定、または腫瘍/正常な細胞混合物(例えば、本明細書に記載
のSNP)のうちの1つ以上の決定のために使用される核酸分子を(同一または異なるサ
ブゲノム間隔において)選択する。
【0454】
他の実施形態では、組み合わせは、本明細書に記載の第2のベイトセットおよび第3の
ベイトセットを含む。例えば、第2のベイトセットは、表1もしくは表1Aにおける癌遺
伝子として本明細書に記載のメンバーを選択し、第3のベイトセットは、PGxメンバー
、例えば、試料のフィンガープリント、患者の試料の同定、倍数性の決定、ヘテロ接合性
の消失の決定、遺伝子重複の決定、遺伝子増幅の決定、または腫瘍/正常な細胞混合物(
例えば、本明細書に記載のSNP)の決定のうちの1つ以上のために使用れる核酸分子を
(同一または異なるサブゲノム間隔において)選択する。
【0455】
さらに他の実施形態では、組み合わせは、本明細書に記載の第1のベイトセット、第2
のベイトセット、および第3のベイトセットを含む。
【0456】
さらに他の実施形態では、組み合わせは、表1もしくは表1Aに従う遺伝子または遺伝
子産物の変化(例えば、本明細書に記載の1つ以上の変異)を含む変異腫瘍メンバー、例
えば、サブゲノム間隔を選択する第1のベイトセットを含む。一実施形態において、第1
のベイトセットは、ABL1遺伝子のコドン315;APCのコドン1114、1338
、1450、もしくは1556;BRAFのコドン600;CTNNB1のコドン32、
33、34、37、41、もしくは45;EGFRのコドン719、746~750、7
68、790、858、もしくは861;FLT3のコドン835;HRASのコドン1
2、13、もしくは61;JAK2のコドン617;KITのコドン816;KRASの
コドン12、13、もしくは61;PIK3CAのコドン88、542、545、546
、1047、もしくは1049;PTENのコドン130、173、233、もしくは2
67;RETのコドン918;TP53のコドン175、245、248、273、もし
くは306のうちの1つ以上から選択される1、2、3、4、5、6、7、8、9、10
、15、20、25、30、35個のコドンを選択し、野生型配列(例えば、参照メンバ
ー)を選択する第1のベイトセットは、前述の遺伝子または遺伝子産物のうちの1つ以上
に対応する。
【0457】
さらに他の実施形態では、組み合わせは、腫瘍メンバー、例えば、変化(例えば、本明
細書に記載の1つ以上の変異)を含むサブゲノム間隔を選択する第1のベイトセットを含
む。腫瘍または癌関連のメンバーは、ABL1、AKT1、ALK、APC、AR、BR
AF、CDKN2A、CEBPA、CTNNB1、EGFR、ERBB2、ESR1、F
GFR1、FGFR2、FGFR3、FLT3、HRAS、JAK2、KIT、KRAS
、MET、MLL、MYC、NF1、NOTCH1、NPM1、NRAS、PDGFRA
、PIK3CA、PTEN、RB1、RET、またはTP53遺伝子もしくは遺伝子産物
のうちの1、2、3、4、5、6、7、8、9、10、15、20、25、30個、もし
くはそれ以上から選択される。一実施形態において、第1のベイトセットは、ABL1遺
伝子のコドン315;APCのコドン1114、1338、1450、もしくは1556
;BRAFのコドン600;CTNNB1のコドン32、33、34、37、41、もし
くは45;EGFRのコドン719、746~750、768、790、858、もしく
は861;FLT3のコドン835;HRASのコドン12、13、もしくは61;JA
K2のコドン617;KITのコドン816;KRASのコドン12、13、もしくは6
1;PIK3CAのコドン88、542、545、546、1047、もしくは1049
;PTENのコドン130、173、233、もしくは267;RETのコドン918;
TP53のコドン175、245、248、273、もしくは306のうちの1つ以上か
ら選択される1、2、3、4、5、6、7、8、9、10、15、20、25、30、3
5個のコドンを選択し、第3のベイトセットは、試料のフィンガープリント、患者の試料
の同定、倍数性の決定、ヘテロ接合性の消失の決定、遺伝子重複の決定、遺伝子増幅の決
定、または腫瘍/正常な細胞混合物(例えば、本明細書に記載のSNP)の決定のうちの
1つ以上のために使用される核酸分子を(同一または異なるサブゲノム間隔において)選
択する。
【0458】
さらに他の実施形態では、第1のベイトセットは、腫瘍進行および/または耐性に関連
した変化を含み、かつ癌進行の後期発症(例えば、転移関連変異、薬物抵抗関連変異)を
有する核酸分子(例えば、サブゲノム間隔)を選択し、第2のベイトセットは、腫瘍進行
および/または耐性に関連した変化を含み、かつ癌進行の早期発症(例えば、結腸癌にお
けるAPCまたはTP53変異)を有する核酸分子(例えば、サブゲノム間隔)を選択す
る(例えば、それに相補的である)。
【0459】
別の実施形態では、ベイトセットは、以下のうちの少なくとも2つ、もしくはすべてを
含む:
第1のサブゲノム間隔の対象範囲の第1のパターンを有する第1のベイトセット、
第2のサブゲノム間隔の対象範囲の第2のパターンを有する第2のベイトセット、およ
び
(任意で)第3のサブゲノム間隔の対象範囲の第3のパターンを有する第3、第4、ま
たは第5のベイトセット。
【0460】
一実施形態において、第1のサブゲノム間隔は、第1の遺伝子、エクソン、イントロン
、遺伝子間領域、または本明細書に記載の事前選択されたSNPを有する領域のヌクレオ
チド配列のうちの1つ以上から選択される。
【0461】
一実施形態において、第2のサブゲノム間隔は、第1の遺伝子、エクソン、イントロン
、遺伝子間領域、または本明細書に記載の事前選択されたSNPを有する領域のヌクレオ
チド配列のうちの1つ以上から選択される。
【0462】
一実施形態において、第3のサブゲノム間隔は、第1の遺伝子、エクソン、イントロン
、遺伝子間領域、または本明細書に記載の事前選択されたSNPを有する領域のヌクレオ
チド配列のうちの1つ以上から選択される。
【0463】
一実施形態において、第4のサブゲノム間隔は、第1の遺伝子、エクソン、イントロン
、遺伝子間領域、または本明細書に記載の事前選択されたSNPを有する領域のヌクレオ
チド配列のうちの1つ以上から選択される。
【0464】
一実施形態において、第5のサブゲノム間隔は、第1の遺伝子、エクソン、イントロン
、遺伝子間領域、または本明細書に記載の事前選択されたSNPを有する領域のヌクレオ
チド配列のうちの1つ以上から選択される。
【0465】
一実施形態において、第1、第2、および第3のサブゲノム間隔は、異なる遺伝子また
は遺伝子産物に存在する。
【0466】
一実施形態において、第1、第2、および第3のサブゲノム間隔のうちの少なくとも2
つは、同一遺伝子または遺伝子産物に存在する。
【0467】
一実施形態において、第1、第2、および第3のサブゲノム間隔は、同一の遺伝子また
は遺伝子産物に存在する。
【0468】
ある特定の実施形態において、対象範囲の第1、第2、および第3のパターンは同一で
ある。
【0469】
他の実施形態では、該対象範囲パターンのうちの少なくとも1つ以上は異なる。
【0470】
他の実施形態では、該対象範囲パターンのうちの少なくとも2つ以上は異なる。
【0471】
さらに他の実施形態では、対象範囲の第1、第2、および第3のパターンは異なる。
【0472】
別の実施形態では、複数のベイトは、
第1のサブゲノム間隔に対して第1のレベルのオーバーハング(正または負)を有する
第1の複数のベイト、
第2のサブゲノム間隔に対して第2のレベルのオーバーハング(正または負)を有する
第2の複数のベイト、
第3のサブゲノム間隔に対して第2のレベルのオーバーハング(正または負)を有する
第3の複数のベイト、および
(任意で)第3のサブゲノム間隔に対して第2のレベルのオーバーハング(正または負
)を有する第4または第5の複数のベイトのうちの少なくとも2つ、もしくはすべてを含
み、少なくとも複数の該レベルは異なる。
【0473】
一実施形態において、第1、第2、第3、第4、または第5のサブゲノム間隔は、第1
の遺伝子、エクソン、イントロン、遺伝子間領域、または本明細書に記載の事前選択され
たSNPを有する領域のヌクレオチド配列のうちの1つ以上から選択される。
【0474】
別の態様では、本発明は、修飾されたベイトセットを提供する方法を特色とする。方法
は、二次構造を減少させるためにベイト配列および/または長さを修正することを含む。
【0475】
一実施形態において、二次構造は、ベイト配列の5’末端で形成される。別の実施形態
では、二次構造は、ベイト配列の中間で形成される。さらに別の実施形態では、二次構造
は、ベイト配列の3’末端で形成される。
【0476】
一実施形態において、方法は、ヌクレオチドを二次構造の形成の減少をもたらす異なる
ヌクレオチドで置換するステップを含む。一実施形態において、修飾されたベイト(また
は複数のベイト)は、高GC含量の領域を捕捉するために使用される。一実施形態におい
て、修飾されたベイト(または複数のベイト)は、1つ以上のヌクレオチドの異なる天然
ヌクレオチド(例えば、A、C、G、U、またはT)での置換を含む。別の実施形態では
、修飾されたベイト(または複数のベイト)は、1つ以上のヌクレオチドの非天然ヌクレ
オチド類似体(例えば、イノシンまたはデオキシイノシン)での置換を含む。一実施形態
において、ベイトセットは、表8の例となる配列によって示されるように修飾される。
【0477】
別の実施形態では、方法は、本明細書に記載のベイトのうちのいずれか、または複数の
ベイト(例えば、第1、第2、もしくは第3のベイト、もしくは複数のベイト)の比率(
例えば、モル濃度)の調節、最適化ハイブリダイゼーション緩衝液の提供のうちの1つ以
上を含む。
【0478】
別の態様では、本発明は、ベイトセット(例えば、本明細書に記載のベイトセット)を
特色とする。
【0479】
一実施形態において、ベイトまたはベイトの収集物は、本明細書に記載の第1、第2、
第3、第4、第5、腫瘍、もしくは対照ベイトセットのうちの1つ、そのサブセット、ま
たはそれらのすべてである/を含む。他の実施形態では、ベイトセットは、本明細書に記
載の変異捕捉、参照、もしくは対照ベイトセットのうちの1つ、そのサブセット、または
それらのすべてである/を含む。
【0480】
いくつかの実施形態では、ベイトセットは、本明細書に記載の遺伝子もしくは遺伝子産
物、またはそのサブゲノム間隔を選択し、本明細書に記載の癌表現型に、例えば、正もし
くは負に関連する。
【0481】
ある特定の実施形態において、ベイトセットは、野生型または非変異ヌクレオチド配列
を選択する。
【0482】
他の実施形態では、本明細書に記載のベイトセットは、ライブラリにおける標的核酸メ
ンバーのフィンガープリント、ライブラリにおける標的核酸メンバーの存在量の定量化、
ライブラリにおける患者の標的核酸メンバーの同定、ライブラリが由来する試料の倍数性
の決定、ライブラリが由来する試料におけるヘテロ接合性の消失の決定、ライブラリが由
来する試料における遺伝子重複の決定、ライブラリが由来する試料における遺伝子増幅の
決定、またはライブラリが由来する試料における腫瘍/正常な細胞混合物の決定のうちの
1つ以上のために使用される核酸を選択する。そのようなベイトは、本明細書で「対照ベ
イト」と称される。一実施形態において、核酸分子に相補的な対照ベイト(または複数の
対照ベイト)は、SNP(例えば、本明細書に記載のSNP)を含む。
【0483】
さらに別の実施形態では、本明細書に記載のベイトセットのうちのいずれかは、二次構
造の形成を減少させるように修飾される(例えば、ヌクレオチドを二次構造の形成の減少
をもたらす異なるヌクレオチドで置換することによって)。一実施形態において、修飾さ
れたベイト(または複数のベイト)は、高GC含量の領域を捕捉するために使用される。
一実施形態において、修飾されたベイト(または複数のベイト)は、1つ以上のヌクレオ
チドの異なる天然ヌクレオチド(例えば、A、C、G、U、またはT)での置換を含む。
別の実施形態では、修飾されたベイト(または複数のベイト)は、1つ以上のヌクレオチ
ドの非天然ヌクレオチド類似体(例えば、イノシンまたはデオキシイノシン)での置換を
含む。一実施形態において、ベイトセットは、表8の例となる配列によって示されるよう
に修飾される。
【0484】
本発明のさらなる実施形態または特徴は、以下の通りである。
別の態様では、本発明は、前述のベイトセットを作製する方法を特色とする。方法は、
1つ以上の標的特異的ベイトオリゴヌクレオチド配列(例えば、本明細書に記載の遺伝子
または遺伝子産物のサブゲノム間隔に対応するベイト配列のうちのいずれか)を選択する
こと、標的特異的ベイトオリゴヌクレオチド配列のプールを得ること(例えば、標的特異
的ベイトオリゴヌクレオチド配列のプールを、例えば、マイクロアレイ合成によって合成
すること)、および任意で、オリゴヌクレオチドを増幅してベイトセットを産生すること
を含む。
【0485】
さらに別の態様では、本発明は、核酸試料における癌表現型(例えば、本明細書に記載
の遺伝子または遺伝子産物の変化のうちの少なくとも10、20、30、50個、もしく
はそれ以上)に、例えば、正もしくは負に関連した変化の存在もしくは不在を決定するた
めの方法を特色とする。方法は、試料中の核酸を本明細書に記載の方法およびベイトのう
ちのいずれかに従う溶液ベースの選択に供して、核酸捕獲物を得ること、ならびに核酸捕
獲物のすべてまたはサブセットを(例えば、次世代配列決定によって)配列決定すること
を含み、それによって、本明細書に記載の遺伝子または遺伝子産物における変化の存在も
しくは不在を決定する。
【0486】
ある特定の実施形態において、ベイトセットは、約100ヌクレオチド長~300ヌク
レオチド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。典型的に
は、ベイトセットは、約130ヌクレオチド長~230ヌクレオチド長、または約150
~200ヌクレオチド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含
む。他の実施形態では、ベイトセットは、約300ヌクレオチド長~1000ヌクレオチ
ド長のオリゴヌクレオチド(または複数のオリゴヌクレオチド)を含む。
【0487】
いくつかの実施形態では、オリゴヌクレオチドの標的メンバー特異的配列は、約40~
1000ヌクレオチド長、約70~300ヌクレオチド長、約100~200ヌクレオチ
ド長、典型的には、約120~170ヌクレオチド長である。
【0488】
いくつかの実施形態では、ベイトセットは、結合実体を含む。結合実体は、それぞれの
ベイト配列上の親和性タグであり得る。いくつかの実施形態では、親和性タグは、ビオチ
ン分子またはハプテンである。ある特定の実施形態において、結合実体は、アビジン分子
等のパートナー、またはハプテンもしくはその抗原結合断片に結合する抗体に結合するこ
とによって、ベイト/メンバーハイブリッドのハイブリダイゼーション混合物からの分離
を可能にする。
【0489】
他の実施形態では、ベイトセット中のオリゴヌクレオチドは、同一の標的メンバー配列
に対して順方向および逆位の相補的配列を含有し、それによって、逆方向相補メンバー特
異的配列を有するオリゴヌクレオチドは、逆方向に相補的なユニバーサル尾部も担持する
。これは、同一の鎖である、すなわち、相互に相補的ではないRNA転写物をもたらし得
る。
【0490】
他の実施形態では、ベイトセットは、1つ以上の位置で縮重または混合塩基を含有する
オリゴヌクレオチドを含む。さらに他の実施形態において、ベイトセットは、生物の単一
の種または群集の集団に存在する複数または実質的にすべての既知の配列バリアントを含
む。一実施形態において、ベイトセットは、ヒト集団に存在する複数または実質的にすべ
ての既知の配列バリアントを含む。
【0491】
他の実施形態では、ベイトセットは、cDNA配列を含むか、またはcDNA配列由来
である。一実施形態において、cDNAは、RNA配列、例えば、腫瘍または癌細胞由来
のRNA、例えば、腫瘍-FFPE試料から得られるRNAから調製される。他の実施形
態では、ベイトセットは、ゲノムDNA、cDNA、またはクローン化DNAから増幅さ
れる増幅産物(例えば、PCR産物)を含む。
【0492】
他の実施形態では、ベイトセットは、RNA分子を含む。いくつかの実施形態では、ベ
イトセットは、より安定しており、かつRNaseに対して抵抗性を示すRNA分子を含
むが、これらに限定されない、化学的かつ酵素的に修飾されたか、または生体外で転写さ
れたRNA分子を含む。
【0493】
さらに他の実施形態では、ベイトは、参照により本明細書に組み込まれる米国第201
0/0029498号およびGnirke,A.et al.(2009)Nat Bi
otechnol.27(2):182-189に記載の方法によって産生される。例え
ば、ビオチン化されたRNAベイトを、マイクロアレイ上に最初に合成された長い合成オ
リゴヌクレオチドのプールを得て、オリゴヌクレオチドを増幅してベイト配列を産生する
ことによって産生することができる。いくつかの実施形態では、ベイトは、RNAポリメ
ラーゼプロモーター配列を末端ベイト配列の一方に付加し、RNAポリメラーゼを用いて
RNA配列を合成することによって産生される。一実施形態において、合成オリゴデオキ
シヌクレオチドのライブラリを、Agilent Technologies,Inc.
等の商業的供給業者から入手することができ、既知の核酸増幅法を用いて増幅することが
できる。
【0494】
したがって、前述のベイトセットを作製する方法が提供される。方法は、1つ以上の標
的特異的ベイトオリゴヌクレオチド配列(例えば、本明細書に記載の1つ以上の変異捕捉
、参照、または対照オリゴヌクレオチド配列)を選択すること、標的特異的ベイトオリゴ
ヌクレオチド配列のプールを得ること(例えば、標的特異的ベイトオリゴヌクレオチド配
列のプールを、例えば、マイクロアレイ合成によって合成すること)、および任意で、オ
リゴヌクレオチドを増幅してベイトセットを産生することを含む。
【0495】
他の実施形態では、方法は、1つ以上のビオチン化されたプライマーを用いてオリゴヌ
クレオチドを増幅すること(例えば、PCRによって)をさらに含む。いくつかの実施形
態では、オリゴヌクレオチドは、マイクロアレイに結合したそれぞれのオリゴヌクレオチ
ドの末端にユニバーサル配列を含む。方法は、ユニバーサル配列をオリゴヌクレオチドか
ら除去することをさらに含み得る。そのような方法は、オリゴヌクレオチドの相補鎖の除
去、オリゴヌクレオチドのアニーリング、およびオリゴヌクレオチドの伸長も含み得る。
これらの実施形態のうちのいくつかにおいて、オリゴヌクレオチドを増幅するための方法
(例えば、PCRによって)は、1つ以上のビオチン化されたプライマーを使用する。い
くつかの実施形態では、方法は、増幅したオリゴヌクレオチドをサイズ選択することをさ
らに含む。
【0496】
一実施形態において、RNAベイトセットが作製される。方法は、本明細書に記載の方
法に従って一組のベイト配列を産生すること、RNAポリメラーゼプロモーター配列を末
端ベイト配列の一方に付加すること、およびRNAポリメラーゼを用いてRNA配列を合
成することを含む。RNAポリメラーゼを、T7 RNAポリメラーゼ、SP6 RNA
ポリメラーゼ、またはT3 RNAポリメラーゼから選択することができる。他の実施形
態では、RNAポリメラーゼプロモーター配列は、ベイト配列を増幅する(例えば、PC
Rによって)ことによって、ベイト配列の末端に付加される。ベイト配列がゲノムまたは
cDNA由来の特異的プライマー対を用いてPCRによって増幅される実施形態において
、それぞれの対における2つの特異的プライマーのうちの1つの5’末端へのRNAプロ
モーター配列の付加が、標準方法を用いてRNAベイトに転写され得るPCR産物をもた
らす。
【0497】
他の実施形態では、ベイトセットを、鋳型としてヒトDNAまたはプールされたヒトD
NA試料を用いて産生することができる。そのような実施形態において、オリゴヌクレオ
チドは、ポリメラーゼ連鎖反応(PCR)によって増幅される。他の実施形態では、増幅
したオリゴヌクレオチドは、ローリングサークル増幅または超分岐ローリングサークル増
幅によって再増幅される。同一の方法を用いて、鋳型としてヒトDNAまたはプールされ
たヒトDNA試料を用いてベイト配列を産生することもできる。制限消化、パルスフィー
ルドゲル電気泳動、流動選別、CsCl密度勾配遠心分離法、選択的動的再会合、染色体
調製物のミクロ解剖、および当業者に既知の他の分画方法を含むが、これらに限定されな
い他の方法によって得られるゲノムの細画分を用いてベイト配列を産生するために、同一
の方法を使用することもできる。
【0498】
ある特定の実施形態において、ベイトセット中のベイトの数は、1,000未満、例え
ば、2、3、4、5、10、50、100、500個である。他の実施形態では、ベイト
セット中のベイトの数は、1,000を超えるか、5,000を超えるか、10,000
を超えるか、20,000を超えるか、50,000を超えるか、100,000を超え
るか、または500,000を超える。
【0499】
ある特定の実施形態において、ライブラリ(例えば、核酸ライブラリ)は、メンバーの
収集物を含む。本明細書に記載されるように、ライブラリメンバーは、標的メンバー(例
えば、本明細書でそれぞれ、第1、第2、および/または第3のメンバーとも称される腫
瘍メンバー、参照メンバー、および/または対照メンバー)を含み得る。ライブラリのメ
ンバーは、1人の個人由来であり得る。実施形態において、ライブラリは、1名を超える
対象(例えば、2、3、4、5、6、7、8、9、10、20、30名、もしくはそれ以
上の対象)由来のメンバーを含み得る。、例えば、異なる対象由来の2つ以上のライブラ
リを合わせて、1名を超える対象由来のメンバーを有するライブラリを形成することがで
きる。一実施形態において、対象は、癌もしくは腫瘍を有するか、または有する危険性の
あるヒトである。
【0500】
本明細書で使用される「メンバー」もしくは「ライブラリメンバー」または他の同様の
用語は、ライブラリのメンバーである核酸分子、例えば、DNAまたはRNAを指す。典
型的には、メンバーは、DNA分子、例えば、ゲノムDNAまたはcDNAである。メン
バーは、剪断されたゲノムDNAであり得る。他の実施形態では、メンバーは、cDNA
であり得る。他の実施形態では、メンバーは、RNAであり得る。メンバーは、対象由来
の配列を含み、対象由来ではない配列、例えば、同定を可能にするプライマーまたは配列
、例えば、「バーコード」配列も含み得る。
【0501】
さらに別の実施形態では、本発明で特色とされる方法は、核酸試料を単離してライブラ
リ(例えば、本明細書に記載の核酸ライブラリ)を提供することをさらに含む。ある特定
の実施形態において、核酸試料は、全ゲノム、サブゲノム断片、またはこれら両方を含む
。ライブラリを全ゲノムまたはサブゲノム断片から単離および調製するためのプロトコル
は、既知の当技術分野で既知である(例えば、IlluminaのゲノムDNA試料調製
キット)。ある特定の実施形態において、ゲノムまたはサブゲノムDNA断片は、対象の
試料(例えば、腫瘍試料、正常な隣接組織(NAT)、血液試料、または任意の正常な対
照))から単離される。一実施形態において、試料(例えば、腫瘍またはNAT試料)は
、保存される。例えば、試料は、マトリックス、例えば、FFPEブロックまたは冷凍試
料に埋め込まれる。ある特定の実施形態において、単離ステップは、個別の染色体の流動
選別、および/または対象の試料(例えば、腫瘍試料、NAT、血液試料)のミクロ解剖
を含む。ある特定の実施形態において、核酸ライブラリを生成するために使用される核酸
試料は、5マイクログラム未満、1マイクログラム未満、または500ng未満(例えば
、200ng以下)である。
【0502】
さらに他の実施形態において、ライブラリを生成するために使用される核酸試料は、R
NAまたはRNA由来のcDNAを含む。いくつかの実施形態では、RNAは、全細胞R
NAを含む。他の実施形態では、ある特定の豊富なRNA配列(例えば、リボソームRN
A)が枯渇している。いくつかの実施形態では、全RNA調製物中のポリ(A)尾部mR
NA画分が濃縮されている。いくつかの実施形態では、cDNAは、ランダムプライムc
DNA合成法によって産生される。他の実施形態では、cDNA合成は、オリゴ(dT)
含有オリゴヌクレオチドによるプライミングによって、成熟したmRNAのポリ(A)尾
部で始まる。枯渇方法、ポリ(A)濃縮方法、およびcDNA合成方法は、当業者に周知
である。
【0503】
方法は、当業者に周知の特異的または非特異的核酸増幅法によって核酸試料を増幅する
ことをさらに含み得る。
【0504】
いくつかの実施形態では、ある特定の実施形態、核酸試料は、例えば、ランダムプライ
ム鎖置換増幅等の全ゲノム増幅法によって増幅される。
【0505】
他の実施形態では、核酸試料は、物理的もしくは酵素的方法によって断片化または剪断
され、合成アダプターにライゲートされ、寸法選択され(例えば、分取ゲル電気泳動によ
って)、増幅される(例えば、PCRによって)。他の実施形態では、断片化され、かつ
アダプターでライゲートされた核酸の基は、ハイブリッド選択の前に明確な寸法選択また
は増幅なしで使用される。
【0506】
他の実施形態では、単離されたDNA(例えば、ゲノムDNA)は、断片化または剪断
される。いくつかの実施形態では、ライブラリは、ゲノムの簡約表示または定義された部
分である、例えば、他の手段によって細分画されたゲノムDNAの細画分等のゲノムDN
Aの50%未満を含む。他の実施形態では、ライブラリは、すべてまたは実質的にすべて
のゲノムDNAを含む。
【0507】
ある特定の実施形態において、ライブラリのメンバーは、遺伝子内領域または遺伝子間
領域を含むサブゲノム間隔を含む。別の実施形態では、サブゲノム間隔は、エクソンもし
くはイントロン、またはその断片、典型的には、エクソン配列またはその断片を含む。一
実施形態において、サブゲノム間隔は、コード領域もしくは非コード領域、例えば、プロ
モーター、エンハンサー、5’非翻訳領域(5’UTR)、もしくは3’非翻訳領域(3
’UTR)、またはその断片を含む。他の実施形態では、サブゲノム間隔は、cDNAま
たはその断片(例えば、腫瘍RNAから得られるcDNA(例えば、腫瘍試料、例えば、
FFPE-腫瘍試料から抽出されるRNA)を含む。他の実施形態では、サブゲノム間隔
は、例えば、本明細書に記載のSNPを含む。他の実施形態では、標的メンバーは、ゲノ
ム中の実質的にすべてのエクソンを含む。他の実施形態では、標的メンバーは、本明細書
に記載のサブゲノム間隔、例えば、選択された目的とする遺伝子または遺伝子産物(例え
ば、本明細書に記載の癌表現型に関連した遺伝子または遺伝子産物)由来のサブゲノム間
隔、例えば、エクソンを含む。
【0508】
一実施形態において、サブゲノム間隔は、体細胞変異、生殖細胞変異、またはこれら両
方を含む。一実施形態において、サブゲノム間隔は、変化、例えば、点変異もしくは単一
変異、欠失変異(例えば、インフレーム欠失、遺伝子内欠失、全遺伝子欠失)、挿入変異
(例えば、遺伝子内挿入)、逆位変異(例えば、染色体内逆位)、連鎖変異、連鎖された
挿入変異、逆位重複変異、タンデム重複(例えば、染色体内タンデム重複)、転座(例え
ば、染色体転座、非相反転座)、再編成(例えば、ゲノム再編成)、遺伝子コピー数の変
化、またはそれらの組み合わせを含む。ある特定の実施形態において、サブゲノム間隔は
、試料中の腫瘍細胞のゲノムのコード領域の5、1、0.5、0.1%、0.01%、0
.001%未満を構成する。他の実施形態では、サブゲノム間隔は、疾患に関与しない、
例えば、本明細書に記載の癌表現型に関連しない。
【0509】
本発明で特色とされる方法は、ライブラリ(例えば、核酸ライブラリ)を複数のベイト
と接触させて、核酸の選択されたサブグループ、例えば、ライブラリ捕獲物を提供するス
テップを含む。一実施形態において、接触ステップは、固体支持体、例えば、アレイにお
いて達成される。ハイブリダイゼーションに好適な固体支持体は、例えば、Albert
,T.J.et al.(2007)Nat.Methods 4(11):903-5
、Hodges,E.et al.(2007)Nat.Genet.39(12):1
522-7、Okou,D.T.et al.(2007)Nat.Methods 4
(11):907-9に記載されており、それらの内容は、参照により本明細書に組み込
まれる。他の実施形態では、接触ステップは、溶液ハイブリダイゼーションにおいて達成
される。ある特定の実施形態において、方法は、1つ以上のさらなるラウンドのハイブリ
ダイゼーションによってハイブリダイゼーションステップを繰り返すことを含む。いくつ
かの実施形態では、方法は、ライブラリ捕獲物を同一または異なるベイト収集物を用いて
1つ以上のさらなるラウンドのハイブリダイゼーションに供することをさらに含む。
【0510】
他の実施形態では、本発明で特色とされる方法は、ライブラリ捕獲物の増幅(例えば、
PCRによる)をさらに含む。他の実施形態では、ライブラリ捕獲物は増幅されない。
【0511】
さらに他の実施形態では、方法は、ライブラリ捕獲物の分析をさらに含む。一実施形態
において、ライブラリ捕獲物は、配列決定方法、例えば、本明細書に記載の次世代配列決
定方法によって分析される。方法は、溶液ハイブリダイゼーションによってライブラリ捕
獲物を単離すること、および核酸配列決定によってライブラリ捕獲物を供することを含む
。ある特定の実施形態において、ライブラリ捕獲物を再配列決定することができる。次世
代配列決定方法は、当技術分野で既知であり、例えば、Metzker,M.(2010
)Nature Biotechnology Reviews 11:31-46に記
載されている。
【0512】
さらに他の実施形態では、方法は、ライブラリ捕獲物を遺伝子型判定に供し、それによ
って、選択された核酸の遺伝子型を特定するステップをさらに含む。
ある特定の実施形態において、方法は、以下のうちの1つ以上をさらに含む:
(i) 核酸試料をフィンガープリントすること、
(ii) 核酸試料における遺伝子または遺伝子産物(例えば、本明細書に記載の遺伝
子または遺伝子産物)の存在量を定量化すること(例えば、試料における転写物の相対存
在量を定量化すること)、
(iii) 特定の対象(例えば、正常な対照または癌患者)に属するとして核酸試料
を特定すること、
(iv) 核酸試料における遺伝形質(例えば、1名以上の対象の遺伝子構成(例えば
、民族性、人種、家族性形質))を特定定すること、
(v) 核酸試料の倍数性を決定し、核酸試料におけるヘテロ接合性の消失を決定する
こと、
(vi) 核酸試料における遺伝子重複事象の存在もしくは不在を決定すること、
(vii) 核酸試料における遺伝子増幅事象の存在もしくは不在を決定すること、あ
るいは
(viii) 核酸試料における腫瘍/正常な細胞混合物のレベルを決定すること。
【0513】
本明細書に記載の方法のうちのいずれをも、以下の実施形態のうちの1つ以上と組み合
わせることができる。
【0514】
ある実施形態において、方法は、腫瘍および/または対照核酸試料(例えば、FFPE
由来の核酸試料)から得られるヌクレオチド配列読み取りを取得することを含む。
【0515】
ある実施形態において、読み取りは、次世代配列決定方法によって提供される。
【0516】
ある実施形態において、方法は、核酸メンバーライブラリを提供すること、および該ラ
イブラリの複数のメンバー由来の事前選択されたサブゲノム間隔を配列決定することを含
む。実施形態において、方法は、配列決定、例えば、溶液ベースの選択のために、該ライ
ブラリのサブセットを選択するステップを含み得る。
【0517】
ある特定の実施形態において、方法は、それぞれが異なるベイト設計戦略を有する2つ
以上の異なる標的カテゴリーを捕捉するように設計されるハイブリッド捕捉方法を含む。
ハイブリッド捕捉方法および組成物は、標的配列(例えば、標的メンバー)の定義された
サブセットの外側の対象範囲を最小限に抑えながら、そのサブセットを捕捉し、標的配列
の均一な対象範囲を提供するよう意図される。一実施形態において、標的配列は、ゲノム
DNAからの全エクソーム、またはその選択されたサブセットを含む。本明細書に開示の
方法および組成物は、複合標的核酸配列(例えば、ライブラリ)の異なる深度およびパタ
ーンの対象範囲を達成するために、異なるベイトセットを提供する。
【0518】
ある特定の実施形態において、ベイトセットおよび標的の異なるカテゴリーは、以下の
通りである。
A.低頻度で出現する変異に対する高レベルの感度を可能にするために最深の対象範囲
が要求される、高レベルの標的(例えば、遺伝子、エクソン、または塩基等の1つ以上の
腫瘍メンバーおよび/もしくは参照メンバー)を選択する第1のベイトセット。例えば、
約5%以下の頻度で出現する点変異の検出(すなわち、試料が調製された細胞の5%がそ
れらのゲノムでこの変異を持つ)。第1のベイトセットは、典型的には、高い検出信頼性
を確保するために、約500倍以上の配列決定深度を必要とする。一実施形態において、
第1のベイトセットは、ある特定の癌型、例えば、表1もしくは表1Aに従う優先順位が
1の癌遺伝子または遺伝子産物において頻繁に変異する1つ以上のサブゲノム間隔(例え
ば、エクソン)を選択する。
B.高レベルの標的よりも高い頻度、例えば、約10%の頻度で出現する変異に対する
高レベルの感度を可能にするために対象範囲が要求される、中間レベルの標的標的(例え
ば、遺伝子、エクソン、または塩基等の1つ以上の腫瘍メンバーおよび/もしくは参照メ
ンバー)を選択する第2のベイトセット。例えば、10%の頻度で出現する変化(例えば
、点変異)の検出は、高い検出信頼性を確保するために、約200倍以上の配列決定深度
を必要とする。一実施形態において、第2のベイトセットは、表1もしくは表1Aに従う
癌遺伝子または遺伝子産物から選択される1つ以上のサブゲノム間隔(例えば、エクソン
)を選択する。
C.高レベルの感度を可能にする、例えば、ヘテロ接合体対立遺伝子を検出するために
低~中程度の対象範囲が要求される、低レベルの標的(例えば、遺伝子、エクソン、また
は塩基等の1つ以上のPGxメンバー)を選択する第3のベイトセット。例えば、ヘテロ
接合体対立遺伝子の検出は、高い検出信頼性を確保するために、10~100倍の配列決
定深度を必要とする。一実施形態において、第3のベイトセットは、から選択される1つ
以上のサブゲノム間隔(例えば、エクソン)を選択する。a)異なる薬物を代謝する患者
の能力を説明し得る薬理ゲノムSNP、b)患者を一意に特定する(フィンガープリント
する)ために使用され得るゲノムSNP、c)ゲノムDNAのコピー数獲得/喪失および
ヘテロ接合性の消失(LOH)を評価するために使用され得るゲノムSNP/遺伝子座。
D.ゲノム転座またはインデル等の構造ブレークポイントを検出するために低~中程度
の対象範囲が要求される、イントロン標的(例えば、イントロンメンバー)を選択する第
4のベイトセット。例えば、イントロンブレークポイントの検出は、高い検出信頼性を確
保するために、5~50倍の配列対スパン深度を必要とする。該第4のベイトセットを用
いて、例えば、転座/インデルの傾向のある癌遺伝子を検出することができる。
E.コピー数の変化を検出する能力を改善するために、わずかな対象範囲が要求される
、イントロン標的(例えば、イントロンメンバー)を選択する第5のベイトセット。例え
ば、いくつかの末端エクソンの1コピー欠失の検出は、高い検出信頼性を確保するために
、0.1~10倍の対象範囲を必要とする。該第5のベイトセットを用いて、例えば、増
幅/欠失の傾向のある癌遺伝子を検出することができる。
【0519】
本発明で特色とされる方法および組成物は、それぞれのベイトセット/標的カテゴリー
の対象範囲の相対配列の調整を含む。ベイト設計における相対配列対象範囲の差を実行す
るための方法は、以下のうちの1つ以上を含む。
(i)異なるベイトセットの差次的表示:所与の標的(例えば、標的メンバー)を捕捉
するためのベイトセット設計をより多い/より少ない数のコピーに含んで、相対標的対象
範囲深度を強化する/減少させることができる。
(ii)ベイトサブセットの差次的オーバーラップ:所与の標的(例えば、標的メンバ
ー)を捕捉するためのベイトセット設計に、隣接ベイト間により長いか、またはより短い
オーバーラップを含ませて、相対標的対象範囲深度を強化する/減少させることができる
。
(iii)差次的ベイトパラメータ:所与の標的(例えば、標的メンバー)を捕捉する
ためのベイトセット設計に、配列修正/より短い長さを含ませて、捕捉効率を減少させ、
かつ相対標的対象範囲深度を低下させることができる。
(iv)異なるベイトセットの混合:異なる標的セットを捕捉するように設計されるベ
イトセットを異なるモル比で混合して、相対標的対象範囲深度を強化する/減少させるこ
とができる。
(v)異なる種類のオリゴヌクレオチドベイトセットの使用:ある特定の実施形態にお
いて、ベイトセットは、以下のものを含んでもよい:
(a)1つ以上の化学的に(例えば、非酵素的に)合成された(例えば、個別に合成さ
れた)ベイト、
(b)アレイで合成された1つ以上のベイト、
(c)1つ以上の酵素的に調製された、例えば、生体外で転写されたベイト、
(d)(a)、(b)、および/もしくは(c)の任意の組み合わせ、
(e)1つ以上のDNAオリゴヌクレオチド(例えば、自然発生もしくは非自然発生の
DNAオリゴヌクレオチド)、
(f)1つ以上のRNAオリゴヌクレオチド(例えば、自然発生もしくは非自然発生の
RNAオリゴヌクレオチド)、
(g)(e)および(f)の組み合わせ、または
(h)上記のうちのいずれかの組み合わせ。
【0520】
異なるオリゴヌクレオチド組み合わせを、異なる比率、例えば、1:1、1:2、1:
3、1:4、1:5、1:10、1:20、1:50、1:100、1:1000等から
選択される比率で混合してもよい。一実施形態において、化学的に合成されたベイトとア
レイで生成されたベイトの比率は、1:5、1:10、または1:20から選択される。
DNAまたはRNAオリゴヌクレオチドは、自然発生または非自然発生であり得る。ある
特定の実施形態において、ベイトは、例えば、融解温度を増加させるために、1つ以上の
非自然発生のヌクレオチドを含む。例となる非自然発生のオリゴヌクレオチドは、修飾さ
れたDNAまたはRNAヌクレオチドを含む。例となる修飾されたRNAヌクレオチドは
、ロックド核酸(LNA)であり、LNAヌクレオチドのリボース部分は、2’酸素と4
’炭素とを結合する追加の架橋で修飾される(Kaur,H、Arora,A、Weng
el,J、Maiti,S、Arora,A.、Wengel,J.、Maiti,S.
(2006)“Thermodynamic,Counterion,and Hydr
ation Effects for the Incorporation of L
ocked Nucleic Acid Nucleotides into DNA
Duplexes”.Biochemistry 45(23):7347-55)。他
の修飾された例となるDNAおよびRNAヌクレオチドは、ペプチド結合によって結合さ
れた反復N-(2-アミノエチル)-グリシンユニットから成るペプチド核酸(PNA)
(Egholm,M.et al.(1993)Nature 365(6446):5
66-8)、低GC領域を捕捉するように修飾されたDNAまたはRNAオリゴヌクレオ
チド、二環式核酸(BNA)または架橋オリゴヌクレオチド、修飾された5-メチルデオ
キシシチジン、および2,6-ジアミノプリンを含むが、これらに限定されない。他の修
飾されたDNAおよびRNAヌクレオチドは、当技術分野で既知である。
【0521】
ある特定の実施形態において、実質的に均一または同様の対象範囲の標的配列(例えば
、標的メンバー)が得られる。例えば、それぞれのベイトセット/標的カテゴリー内で、
対象範囲の均一性を、ベイトパラメータを修正することによって、例えば、以下のうちの
1つ以上によって最適化することができる:
(i)ベイト表示またはオーバーラップの増加/減少を用いて、同一のカテゴリー内の
他の標的と比較して不十分に/過度に対象範囲とされる標的(例えば、標的メンバー)の
対象範囲を強化する/減少させることができること、
(ii)標的配列(例えば、高GC含量配列)を捕捉するのが困難な低対象範囲の場合
、ベイトセットで標的化される領域を拡大して、例えば、隣接配列(例えば、GCが比較
的豊富ではない隣接配列)を対象範囲とすること、
(iii)ベイト配列の修正を行って、ベイトの二次構造を減少させ、かつその選択効
率を強化することができること、
(iv)ベイト長の修正を用いて、同一のカテゴリー内の異なるベイトの融解ハイブリ
ダイゼーション動態を均等化することができること(ベイト長を直接的に(異なる長さを
有するベイトを産生することによって)または間接的に(一貫した長さのベイトを産生し
、ベイト末端を任意の配列に置き換えることによって)修飾することができる)、
(v)同一の標的領域(すなわち、順方向鎖および逆方向鎖)に対して異なる配向を有
するベイトの修正が、異なる結合効率を有し得ること(それぞれの標的に最適な対象範囲
を提供するいずれかの配向を有するベイトセットを選択することができる)、
(vi)それぞれのベイト上に存在する結合実体、例えば、捕捉タグ(例えば、ビオチ
ン)の量の修正が、その結合効率に影響を及ぼし得ること(特定の標的を標的化するベイ
トのタグレベルの増加/減少を用いて、相対標的対象範囲を強化する/減少させることが
できる)、
(vii)異なるベイトに使用されるヌクレオチドの種類の修正を変更して、標的に対
する結合親和性に影響を及ぼし、かつ相対標的対象範囲を強化する/減少させることがで
きること、または
(viii)例えば、より安定した塩基対合を有する修飾されたオリゴヌクレオチドベ
イトを使用して、高GC含量と比較して低いか、もしくは正常なGC含量の領域間の融解
ハイブリダイゼーション動態を均等化することができること。
【0522】
例えば、異なる種類のオリゴヌクレオチドベイトセットを用いることができる。
【0523】
一実施形態において、選択効率値は、異なる種類のベイトオリゴヌクレオチドを用いる
ことによって修正され、事前選択された標的領域を包囲する。例えば、第1のベイトセッ
ト(例えば、10,000~50,000個のRNAまたはDNAベイトを含むアレイベ
ースのベイトセット)を用いて、広大な標的領域(例えば、1~2MBの全標的領域)を
対象範囲とすることができる。第1のベイトセットを、第2のベイトセット(例えば、5
,000個未満のベイトを含む個別に合成されたRNAまたはDNAベイトセット)でス
パイクして、事前選択された標的領域(例えば、250kb以下の標的領域にまたがる、
例えば、目的とする選択されたサブゲノム間隔)および/またはより高い二次構造、例え
ば、より高いGC含量の領域を対象範囲とすることができる。目的とする選択されたサブ
ゲノム間隔は、本明細書に記載の遺伝子もしくは遺伝子産物、またはその断片のうちの1
つ以上に相当し得る。第2のベイトセットは、所望のベイトオーバーラップに応じて、約
2,000~5,000個のベイトを含み得る。さらに他の実施形態では、第2のベイト
セットは、第1のベイトセット内にスパイクされる選択されたオリゴベイト(例えば、4
00、200、100、50、40、30、20、10個未満のベイト)を含み得る。第
2のベイトセットを、個別のオリゴベイトの任意の比率で混合してもよい。例えば、第2
のベイトセットは、1:1の等モル比で存在する個別のベイトを含み得る。あるいは、第
2のベイトセットは、例えば、ある特定の標的の捕捉を最適化するために、異なる比率(
例えば、1:5、1:10、1:20)で存在する個別のベイトを含み得る(例えば、あ
る特定の標的は、他の標的と比較して、第2のベイトの5~10倍を有し得る)。
配列決定
【0524】
本発明は、核酸を配列決定する方法も含む。これらの方法において、核酸ライブラリメ
ンバーは、本明細書に記載の方法を用いることによって、例えば、溶液ハイブリダイゼー
ションを用いることによって単離され、それによって、ライブラリ捕獲物を提供する。ラ
イブラリ捕獲物またはそのサブグループを配列決定することができる。したがって、本発
明で特色とされる方法は、ライブラリ捕獲物の分析をさらに含む。一実施形態において、
ライブラリ捕獲物は、配列決定方法、例えば、本明細書に記載の次世代配列決定方法によ
って分析される。方法は、溶液ハイブリダイゼーションによってライブラリ捕獲物を単離
すること、および核酸配列決定によってライブラリ捕獲物を供することを含む。ある特定
の実施形態において、ライブラリ捕獲物を再配列決定することができる。
【0525】
当技術分野で既知の任意の配列決定方法を用いることができる。選択方法によって単離
された核酸の配列決定は、典型的には、次世代配列決定(NGS)を用いて実行される。
次世代配列決定は、高度に並行した様式で、個別の核酸分子または個別の核酸分子のクロ
ーン的に広がったプロキシのいずれかのヌクレオチド配列を決定する任意の配列決定方法
を含む(例えば、105個を超える分子が同時に配列決定される)。一実施形態において
、ライブラリにおける核酸種の相対存在量を、配列決定実験によって生成されるデータに
おけるそれらの同族配列の発生の相対数を計数することにより推定することができる。次
世代配列決定方法は、当技術分野で既知であり、例えば、参照により本明細書に組み込ま
れるMetzker,M.(2010)Nature Biotechnology R
eviews 11:31-46に記載されている。
【0526】
一実施形態において、次世代配列決定は、個別の核酸分子のヌクレオチド配列の決定を
可能にする(例えば、Helicos BioSciencesのHeliScope遺
伝子配列決定システム、およびPacific BiosciencesのPacBio
RSシステム)。他の実施形態では、配列決定方法は、個別の核酸分子のクローン的に
広がったプロキシのヌクレオチド配列を決定し(例えば、Solexaシーケンサ、Il
lumina Inc.,San Diego,Calif;454 Life Sci
ences(Branford,Conn.);およびIon Torrent)(例え
ば、短い読み取りの大規模並列配列決定(例えば、Solexaシーケンサ、Illum
ina Inc.,San Diego,Calif.))、それは、より少ない数であ
るがより長い読み取りを生成する他の配列決定方法よりも1つの配列決定ユニット当たり
より多くの配列塩基を生成する。次世代配列決定のための他の方法または機械には、45
4 Life Sciences(Branford,Conn.)、Applied
Biosystems(Foster City,Calif.、SOLiDシーケンサ
)、Helicos BioSciences Corporation(Cambri
dge,Mass.)によって提供されるシーケンサ、ならびにエマルジョンおよびマイ
クロ流体配列決定技術であるナノ液滴(例えば、GnuBio液滴)が含まれるが、これ
らに限定されない。
【0527】
次世代配列決定用のプラットフォームには、Roche/454のゲノムシーケンサ(
GS)FLXシステム、Illumina/Solexaのゲノムアナライザ(GA)、
Life/APGの支持オリゴヌクレオチドライゲーション検出(SOLiD)システム
、PolonatorのG.007システム、Helicos BioSciences
のHeliScope遺伝子配列決定システム、およびPacific Bioscie
ncesのPacBio RSシステムが含まれるが、これらに限定されない。
【0528】
NGS技術は、以下のステップ、例えば、鋳型調製、配列決定および画像化、ならびに
データ分析のうちの1つ以上を含み得る。
【0529】
鋳型調製。鋳型調製法は、核酸(例えば、ゲノムDNAまたはcDNA)をランダムに
破壊してより小さくするステップ、および配列決定鋳型(例えば、断片鋳型または噛合対
鋳型)を生成するステップ等を含み得る。空間的に分離された鋳型は、固体表面もしくは
支持体に結合または固定化されてもよく、同時に行われる大量の配列決定反応を可能にす
る。NGS反応に使用することができる鋳型の種類には、例えば、単一DNA分子由来の
クローン的に増幅した鋳型、および単一DNA分子鋳型が含まれる。
【0530】
クローン的に増幅した鋳型を調製する方法には、例えば、エマルジョンPCR(emP
CR)および固相増幅が含まれる。
【0531】
EmPCRを用いて、NGS用の鋳型を調製することができる。典型的には、核酸断片
のライブラリが生成され、ユニバーサルプライミング部位を含有するアダプターが、断片
の末端にライゲートされる。その後、断片は一本鎖に変性され、ビーズによって捕捉され
る。それぞれのビーズは、単一の核酸分子を捕捉する。emPCRビーズの増幅および濃
縮後、大量の鋳型は、標準の顕微鏡スライド(例えば、Polonator)上のポリア
クリルアミドゲル中で結合または固定化されるか、アミノコーティングガラス表面(例え
ば、Life/APG、Polonator)に化学的に架橋結合するか、またはNGS
反応が行われ得る個別のPicoTiterPlate(PTP)ウェル(例えば、Ro
che/454)内に沈着することができる。
【0532】
固相増幅を用いて、NGS用の鋳型を産生することもできる。典型的には、順方向およ
び逆方向プライマーは、固体支持体に共有結合される。増幅した断片の表面密度は、支持
体上のプライマーと鋳型の比率によって定義される。固相増幅は、何億もの空間的に分離
された鋳型クラスター(例えば、Illumina/Solexa)を産生することがで
きる。鋳型クラスターの末端を、NGS反応用のユニバーサル配列決定プライマーにハイ
ブリダイズさせてもよい。
【0533】
クローン的に増幅した鋳型を調製する他の方法には、例えば、複数の置換増幅(MDA
)(Lasken R.S.Curr Opin Microbiol.2007;10
(5):510-6)も含まれる。MDAは、非PCRベースのDNA増幅技術である。
この反応は、ランダムな六量体プライマーの鋳型へのアニーリング、および高忠実度酵素
(典型的には、一定温度でФ29)によるDNA合成を含む。MDAは、大型の産物を低
いエラー頻度で生成することができる。
【0534】
PCR等の鋳型増幅法をNGSプラットフォームと連動させて、ゲノムの特定の領域(
例えば、エクソン)を標的化または濃縮することができる。例となる鋳型濃縮方法は、例
えば、微小液滴PCR技術(Tewhey R.et al.,Nature Biot
ech.2009,27:1025-1031)、カスタム設計されたオリゴヌクレオチ
ドマイクロアレイ(例えば、Roche/NimbleGenオリゴヌクレオチドマイク
ロアレイ)、および溶液ベースのハイブリダイゼーション法(例えば、分子逆位プローブ
(MIP)(Porreca G.J.et al.,Nature Methods,
2007,4:931-936、Krishnakumar S.et al.,Pro
c.Natl.Acad.Sci.USA,2008,105:9296-9310、T
urner E.H.et al.,Nature Methods,2009,6:3
15-316)、ならびにビオチン化されたRNA捕捉配列(Gnirke A.et
al.,Nat.Biotechnol.2009;27(2):182-9)を含む。
【0535】
単一分子鋳型は、NGS反応に使用され得る別の種類の鋳型である。空間的に分離され
た単一分子鋳型は、様々な方法によって固体支持体上に固定化され得る。1つの手法にお
いて、個別のプライマー分子は、固体支持体に共有結合される。アダプターが鋳型に付加
され、その後、鋳型は固定化プライマーにハイブリダイズされる。別の手法では、単一分
子鋳型が、一本鎖の単一分子鋳型をプライムし、かつそれを固定化されたプライマーから
伸長させることによって固体支持体に共有結合される。その後、ユニバーサルプライマー
が、鋳型にハイブリダイズされる。さらに別の手法では、単一ポリメラーゼ分子は、プラ
イムされた鋳型が結合される固体支持体に結合される。
【0536】
配列決定および画像化。NGSのための例となる配列決定および画像化方法には、循環
可逆的停止(CRT)、ライゲーションによる配列決定(SBL)、単一分子付加(熱配
列決定)、およびリアルタイム配列決定が含まれるが、これらに限定されない。
【0537】
CRTは、ヌクレオチド組み込みステップ、蛍光画像化ステップ、および切断ステップ
を最小限に含む循環方法において、可逆的ターミネーターを使用する。典型的には、DN
Aポリメラーゼは、鋳型塩基の相補的ヌクレオチドに対応する単一の蛍光修飾されたヌク
レオチドをプライマーに組み込む。DNA合成は、単一のヌクレオチドの付加後に終了し
、組み込まれていないヌクレオチドは洗い流される。画像化を行い、組み込まれた標識化
ヌクレオチドの同一性を決定する。その後、切断ステップにおいて、終了/阻害群および
蛍光色素が除去される。CRT方法を用いた例となるNGSプラットフォームには、全内
部反射蛍光(TIRF)によって検出される4色のCRT方法に連動してクローン的に増
幅した鋳型方法を用いるIllumina/Solexaゲノムアナライザ(GA)、お
よびTIRFによって検出される1色のCRT方法と連動して単一分子鋳型方法を用いる
Helicos BioSciences/HeliScopeが含まれるが、これらに
限定されない。
【0538】
SBLは、配列決定のために、DNAリガーゼおよび1塩基コードプローブまたは2塩
基コードプローブのいずれかを使用する。典型的には、蛍光標識されたプローブは、プラ
イムされた鋳型に隣接したその相補的配列にハイブリダイズする。DNAリガーゼを用い
て、色素標識されたプローブをプライマーにライゲートする。蛍光画像化を行い、ライゲ
ートしていないプローブが洗い流された後にライゲートしたプローブの同一性を決定する
。蛍光色素を切断可能なプローブを用いて除去し、その後のライゲーションサイクルのた
めに、5’-PO4基を再生成することができる。あるいは、古いプライマーが除去され
た後に、新たなプライマーを鋳型にハイブリダイズさせてもよい。例となるSBLプラッ
トフォームには、2塩基コードプローブを用いるLife/APG/SOLiD(支持オ
リゴヌクレオチドライゲーション検出)が含まれるが、これに限定されない。
【0539】
熱配列決定方法は、別の化学発光酵素を用いたDNAポリメラーゼの活性検出に基づく
。典型的には、この方法は、DNAの一本鎖に沿って相補鎖を1塩基対ずつ合成すること
によるDNAの一本鎖の配列決定、およびどの塩基が各ステップで実際に付加されたかの
検出を可能にする。鋳型DNAは不動であり、A、C、G、およびTヌクレオチドの溶液
は、連続して添加され、反応物から除去される。ヌクレオチド溶液が鋳型の第1の不対塩
基を補完する場合にのみ、光が産生される。化学発光シグナルを産生する溶液の配列は、
鋳型の配列決定を可能にする。例となる熱配列決定プラットフォームには、PTPウェル
内に沈着した100~200万個のビーズを用いたemPCRによって調製されたDNA
鋳型を用いるRoche/454が含まれるが、これに限定されない。
【0540】
リアルタイム配列決定は、DNA合成中に色素標識されたヌクレオチドの連続的な組み
込みを画像化することを含む。例となるリアルタイム配列決定プラットフォームには、リ
ン酸結合されたヌクレオチドが増大するプライマー鎖に組み込まれるときに、個別のゼロ
モード導波路(ZMW)検出器の表面に結合したDNAポリメラーゼ分子を用いて配列情
報を得るPacific Biosciencesプラットフォーム、蛍光共鳴エネルギ
ー移動(FRET)によるヌクレオチド組み込み後に、結合した蛍光色素を有する改変さ
れたDNAポリメラーゼを用いて強化されたシグナルを生成するLife/VisiGe
nプラットフォーム、および配列決定反応において色素クエンチャーヌクレオチドを用い
るLI-COR Biosciencesプラットフォームが含まれるが、これらに限定
されない。
【0541】
NGSの他の配列決定方法には、ナノ細孔配列決定、ハイブリダイゼーションによる配
列決定、ナノトランジスタアレイに基づく配列決定、ポロニー配列決定、走査トンネル顕
微鏡法(STM)に基づく配列決定、およびナノワイヤ分子センサに基づく配列決定が含
まれるが、これらに限定されない。
【0542】
ナノ細孔配列決定は、その中で単一核酸ポリマーを分析することができる高度に閉ざさ
れた空間を提供するナノスケール細孔を通る溶液中での核酸分子の電気泳動を含む。ナノ
細孔配列決定の例となる方法は、例えば、Branton D.et al.,Nat
Biotechnol.2008;26(10):1146-53に記載されている。
【0543】
ハイブリダイゼーションによる配列決定は、DNAマイクロアレイを用いる非酵素的方
法である。典型的には、DNAの単一のプールが蛍光標識され、既知の配列を含有するア
レイにハイブリダイズされる。アレイ上の所与のスポットからのハイブリダイゼーション
シグナルは、DNA配列を特定することができる。DNAの1本鎖のそのDNA二重らせ
んの相補鎖への結合は、ハイブリッド領域が短いときに均一な単一塩基ミスマッチに敏感
であるか、ミスマッチを検出するタンパク質が存在するときに特殊化される。ハイブリダ
イゼーションによる配列決定の例となる方法は、例えば、Hanna G.J.et a
l.,J.Clin.Microbiol.2000;38(7):2715-21、お
よびEdwards J.R.et al.,Mut.Res.2005;573(1-
2):3-12に記載されている。
【0544】
ポロニー配列決定は、複数の単一塩基伸長を介するポロニー増幅および合成による配列
決定に基づく(FISSEQ)。ポロニー増幅は、ポリアクリルアミド膜上でDNAをイ
ンサイチュ増幅する方法である。例となるポロニー配列決定方法は、例えば、米国特許出
願公開第2007/0087362号に記載されている。
【0545】
カーボンナノチューブ電界効果トランジスタ(CNTFET)等のナノトランジスタア
レイベースのデバイスもNGSに用いることができる。例えば、DNA分子が駆動微細加
工電極によって伸張され、ナノチューブ上を駆動する。DNA分子は、カーボンナノチュ
ーブ表面と連続的に接触し、それぞれの塩基からの電流フローの差異は、DNA分子とナ
ノチューブとの間の電荷移動によって産生される。DNAは、これらの差異を記録するこ
とによって配列決定される。例となるナノトランジスタアレイに基づく配列決定方法は、
例えば、米国特許出願公開第2006/0246497号に記載されている。
【0546】
走査トンネル顕微鏡法(STM)もNGSに用いることができる。STMは、検体のラ
スター走査を行ってその表面の画像を形成する圧電制御プローブを用いる。STMを用い
て、単一DNA分子の物理的特性を画像化する、例えば、走査トンネル顕微鏡とアクチュ
エータ駆動型の可塑性のギャップを統合することによって、コヒーレント電子トンネル画
像化および分光法を生成することができる。STMを用いた例となる配列決定方法は、例
えば、米国特許出願公開第2007/0194225号に記載されている。
【0547】
ナノワイヤ分子センサから成る分子分析デバイスもNGSに用いることができる。その
ようなデバイスは、ナノワイヤ上に配置される窒素性物質とDNA等の核酸分子との相互
作用を検出することができる。分子ガイドが、分子センサ付近の分子を誘導するように構
成され、相互作用およびその後の検出を可能にする。方法ナノワイヤ分子センサを用いた
例となる配列決定は、例えば、米国特許出願公開第2006/0275779号に記載さ
れている。
【0548】
両末端配列決定方法をNGSに用いることができる。両末端配列決定は、ブロックされ
たプライマーおよびブロックされていないプライマーを用いて、DNAのセンス鎖および
アンチセンス鎖の両方を配列決定する。典型的には、これらの方法は、ブロックされてい
ないプライマーを核酸の第1の鎖にアニーリングするステップ、第2のブロックされたプ
ライマーを核酸の第2の鎖にアニーリングするステップ、ポリメラーゼを用いて第1の鎖
に沿って核酸を伸長するステップ、第1の配列決定プライマーを終了するステップ、第2
のプライマーを脱ブロッキングするステップ、および第2の鎖に沿って核酸を伸長するス
テップを含む。例となる両末端配列決定方法は、例えば、米国特許第7,244,567
号に記載されている。
【0549】
データ分析。NGSの読み取りが生成された後、それらを既知の参照配列に対してアラ
イメントするか、またはデノボアセンブリすることができる。
【0550】
例えば、試料(例えば、腫瘍試料)における単一ヌクレオチド多型および構造バリアン
ト等の遺伝的バリエーションの特定を、NGS読み取りを参照配列(例えば、野生型配列
)に対してアライメントすることによって達成することができる。NGSのための配列ア
ライメント方法は、例えば、Trapnell C.and Salzberg S.L
.Nature Biotech.,2009,27:455-457に記載されている
。
【0551】
デノボアセンブリの例は、例えば、Warren R.et al.、Bioinfo
rmatics,2007,23:500-501、Butler J.et al.,
Genome Res.,2008,18:810-820、およびZerbino D
.R.and Birney E.,Genome Res.,2008,18:821
-829に記載されている。
【0552】
配列アライメントまたはアセンブリを、例えば、Roche/454およびIllum
ina/Solexa読み取りデータを混合した1つ以上のNGSプラットフォームから
の読み取りデータを用いて行うことができる。
アライメント
概要
【0553】
アライメントは、読み取りを位置、例えば、ゲノム位置と適合させるプロセスである。
誤アライメント(例えば、ゲノム内の誤った位置上の短い読み取りからの塩基対の配置)
、例えば、実際の癌変異前後の読み取りの配列コンテキスト(例えば、反復配列の存在)
による誤アライメントは、代替対立遺伝子の読み取りが代替対立遺伝子読み取りの主な集
積から変化し得るため、変異検出の感度の減少につながり得る。実際の変異が存在しない
場合に問題のある配列コンテキストが生じるとき、誤アライメントは、参照ゲノム塩基の
実際の読み取りを間違った位置に配置することによって、「変異」対立遺伝子の人為的な
読み取りを導入し得る。複数の多重遺伝子分析の変異呼び出しアルゴリズムがさらに低い
存在量変異に敏感であるべきであるという理由から、これらの誤アライメントは、誤検出
発見率を増加させ得る/特異性を減少させ得る。
【0554】
本明細書で論じられるように、実際の変異に対する感度の減少は、分析される遺伝子に
おける予想される変異部位周囲のアライメントの品質を評価する(手作業で、または自動
化された様式で)ことによって対処することができる。評価される部位を、癌変異のデー
タベース(例えば、COSMIC)から得ることができる。問題があると見なされる領域
を、例えば、Smith-Watermanアライメント等のより緩徐であるがより正確
なアライメントアルゴリズムを用いたアライメント最適化(または再アライメント)によ
って関連性のある配列コンテキストにおいてより良好な性能をもたらすために選択される
アルゴリズムを用いて修復することができる。一般的なアライメントアルゴリズムがその
問題を修正できない場合において、カスタマイズされたアライメント手法を、例えば、置
換を含有する可能性の高い遺伝子の最大差ミスマッチペナルティパラメータの調節、ある
特定の腫瘍型でよく見られる特異的変異型に基づく特定のミスマッチペナルティパラメー
タの調節(例えば、黒色腫におけるC→T)、またはある特定の試料型でよく見られる特
異的変異型に基づく特定のミスマッチペナルティパラメータの調節(例えば、FFPEで
よく見られる置換)によって作成することができる。誤アライメントによる評価される遺
伝子領域の特異性低下(誤検出率増加)を、配列決定される試料におけるすべての変異呼
び出しの手動または自動化された試験によって評価することができる。誤アライメントに
起因した誤った変異呼び出しの傾向があると考えられるそれらの領域を、上述と同一のア
ライメント修正に供してもよい。いかなるアルゴリズム修正も可能ではないと見なされる
場合、問題の領域からの「変異」を、試験パネルから分類または排除してもよい。
挿入/欠失(インデル)
【0555】
概して、インデル変異の正確な検出は、本明細書で無効にされた配列決定プラットフォ
ーム上での誤ったインデル率が比較的低いため、アライメントの演習である(したがって
、正しくアライメントされたインデルのわずかな観察でさえも変異の有力な証拠であり得
る)。しかしながら、インデルの存在下における正確なアライメントは困難であり得る(
特にインデルの長さが増加するとき)。アライメントに関連した一般的な問題、例えば、
置換の一般的な問題に加えて、インデル自体がアライメントに関連する問題を引き起こし
得る(例えば、ジヌクレオチド繰り返しの2bpの欠失を容易かつ断定的に配置すること
はできない)。感度および特異性の両方が、より短い(15bp未満)外見上のインデル
を含有する読み取りの誤った配置によって低下し得る。より大きいインデル(我々の現在
のプロセスにおいて、大きさが個別の読み取りの長さ(36bp)に近づいている)は、
全く読み取りをアライメントせず、標準の組のアライメントされた読み取りにおけるイン
デルの検出を不可能にし得る。
【0556】
癌変異のデータベースを用いて、これらの問題に対処し、性能を改善することができる
。誤検出インデルの発見を減少させる(特異性を改善する)ために、一般に予想されるイ
ンデル周辺の領域を、配列コンテキストに起因する問題のあるアライメントについて試験
し、上記の置換と同様に対処することができる。インデル検出の感度を改善するために、
癌において予想されるインデルに関する情報を用いたいくつかの異なる手法を使用するこ
とができる。例えば、予想されるインデルを含有する短い読み取りを模擬し、アライメン
トを試みることができる。アライメントを研究することができ、問題のあるインデル領域
は、例えば、ギャップの開き/伸長ペナルティを減少させることによって、または部分的
な読み取り(例えば、読み取りの前半もしくは後半)をアライメントすることによって、
アライメントパラメータを調節することができる。
【0557】
あるいは、正常な参照ゲノムだけでなく、既知のまたは見込みのある癌インデル変異の
それぞれを含有するゲノムの代替バージョンも用いて最初のアライメントを試みることが
できる。この手法において、最初にアライメントし損なったか、または誤ってアライメン
トされたインデルの読み取りは、ゲノムの代替(変異)バージョンでうまく配置される。
【0558】
この方法で、予想される癌遺伝子/部位のインデルアライメント(したがって、呼び出
し)を最適化することができる。例えば、乳癌試料を評価するとき、腫瘍抑制遺伝子PT
ENにおけるアライメントを、表5に例示されるように、インデル変異の存在の可能性の
ために最適化することができる。
【表1】
調整
調整:配列アライメントアルゴリズム
【0559】
本明細書で使用されるとき、配列アライメントアルゴリズムは、読み取り配列(例えば
、次世代配列決定に由来する、例えば、短い読み取り配列)が由来する可能性の高いゲノ
ム中の位置を読み取り配列と参照配列との間の類似性を評価することによって特定するた
めに使用される計算法または手法を具現化する。様々なアルゴリズムを、配列アライメン
ト問題に適用してもよい。いくつかのアルゴリズムは、比較的緩徐であるが、比較的高い
特異性を可能にする。これらには、例えば、ダイナミックプログラミングに基づくアルゴ
リズムが含まれる。ダイナミックプログラミングは、より単純なステップに分けることに
よって複雑な問題を解決するための方法である。他の手法は、比較的より効率的であるが
、典型的には、それほど完全ではない。これらには、例えば、大規模のデータベース検索
用に設計される発見的アルゴリズムおよび確率論的方法が含まれる。
【0560】
典型的には、アライメントプロセスには、2つのステップ、すなわち候補検索および配
列アライメントが存在し得る。候補検索は、配列アライメント用の検索空間を全ゲノムか
らより短いリストの可能性のあるアライメント位置まで減少させる。その用語が示唆する
ように、配列アライメントは、配列を候補検索ステップで提供される配列とアライメント
することを含む。これを、大域アライメント(例えば、Needleman-Wunsc
hアライメント)または局所アライメント(例えば、Smith-Watermanアラ
イメント)を用いて行うことができる。
【0561】
高速アライメントアルゴリズムのほとんどを、インデックス作成方法、すなわち、ハッ
シュ表(例えば、BLAST、ELAND、SOAP)、サフィックス木(例えば、Bo
wtie、BWA)、およびマージソート(例えば、Slider)に基づくアルゴリズ
ムに基づいて、3種類のうちの1つとして特徴づけることができる。
【0562】
短い読み取り配列は、典型的には、アライメントに使用される。短い読み取り配列用の
配列アライメントアルゴリズム/プログラムの例には、BFAST(Homer N.e
t al.、PLoS One.2009;4(11):e7767)、BLASTN(
www.blast.ncbi.nlm.nih.gov上)、BLAT(Kent W
.J.Genome Res.2002;12(4):656-64)、Bowtie(
Langmead B.et al.,Genome Biol.2009;10(3)
:R25)、BWA(Li H.and Durbin R.Bioinformati
cs,2009,25:1754-60)、BWA-SW(Li H.and Durb
in R.Bioinformatics,2010;26(5):589-95)、C
loudBurst(Schatz M.C.Bioinformatics.2009
;25(11):1363-9)、Corona Lite(Applied Bios
ystems,Carlsbad,California,USA)、CASHX(Fa
hlgren N.et al.,RNA,2009;15,992-1002)、CU
DA-EC(Shi H.et al.,J Comput Biol.2010;17
(4):603-15)、ELAND(www.bioit.dbi.udel.edu
/howto/eland上)、GNUMAP(Clement N.L.et al.
,Bioinformatics.2010;26(1):38-45)、GMAP(W
u T.D.and Watanabe C.K.Bioinformatics.20
05;21(9):1859-75)、GSNAP(Wu T.D.and Nacu
S.,Bioinformatics.2010;26(7):873-81)、Gen
eious Assembler(Biomatters Ltd.,Auckland
,New Zealand)、LAST、MAQ(Li H.et al.,Genom
e Res.2008;18(11):1851-8)、Mega-BLAST(www
.ncbi.nlm.nih.gov/blast/megablast.shtml上
)、MOM(Eaves H.L.and Gao Y.Bioinformatics
.2009;25(7):969-70)、MOSAIK(www.Bioinform
atics.bc.edu/marthlab/Mosaik上)、Novoalign
(www.novocraft.com/main/index.php上)、PALM
apper(www.fml.tuebingen.mpg.de/raetsch/s
uppl/palmapper上)、PASS(Campagna D.et al.,
Bioinformatics.2009;25(7):967-8)、PatMaN(
Prufer K.et al.、Bioinformatics.2008;24(1
3):1530-1)、PerM(Chen Y.et al.、Bioinforma
tics,2009、25(19):2514-2521)、ProbeMatch(K
im Y.J.et al.,Bioinformatics.2009;25(11)
:1424-5)、QPalma(de Bona F.et al.,Bioinfo
rmatics,2008,24(16):i174)、RazerS(Weese D
.et al.,Genome Research,2009,19:1646-165
4)、RMAP(Smith A.D.et al.、Bioinformatics.
2009;25(21):2841-2)、SeqMap(Jiang H.et al
.Bioinformatics.2008;24:2395-2396.)、Shre
c(Salmela L.,Bioinformatics.2010;26(10):
1284-90)、SHRiMP(Rumble S.M.et al.,PLoS C
omput.Biol.,2009,5(5):e1000386)、SLIDER(M
alhis N.et al.,Bioinformatics,2009、25(1)
:6-13)、SLIM Search(Muller T.et al.,Bioin
formatics.2001;17 Suppl 1:S182-9)、SOAP(L
i R.et al.,Bioinformatics.2008;24(5):713
-4)、SOAP2(Li R.et al.,Bioinformatics.200
9;25(15):1966-7)、SOCS(Ondov B.D.et al.,B
ioinformatics,2008;24(23):2776-7)、SSAHA(
Ning Z.et al.,Genome Res.2001;11(10):172
5-9)、SSAHA2(Ning Z.et al.,Genome Res.200
1;11(10):1725-9)、Stampy(印刷前に電子出版されたLunte
r G.and Goodson M.Genome Res.2010)、Taipa
n(www.taipan.sourceforge.net上)、UGENE(www
.ugene.unipro.ru上)、XpressAlign(www.bcgsc
.ca/platform/bioinfo/software/XpressAlig
n上)、およびZOOM(Bioinformatics Solutions Inc
.,Waterloo,ON,Canada)が含まれるが、これらに限定されない。
【0563】
配列アライメントアルゴリズムを、例えば、配列決定技術、読み取りの長さ、読み取り
の数、利用可能な計算資源、および感度/スコア化要件を含むいくつかの要因に基づいて
選択することができる。異なる配列アライメントアルゴリズムは、異なるレベルの速度、
アライメント感度、およびアライメント特異性を得ることができる。アライメント特異性
は、典型的には、予測されるアライメントと比較した、正しくアライメントされる提出試
料において見られるアライメントされた標的配列残基の割合を指す。アライメント感度は
、通常、予測されるアライメントにおいて見られるアライメントされた標的配列残基の割
合を指し、それは、提出試料でも正しくアライメントされている。
【0564】
速度が最初に考慮されるべき要因である場合、ELANDまたはSOAP等のアライメ
ントアルゴリズムを、短い読み取り(例えば、Illumina/Solexaシーケン
サからの)を参照ゲノムに対してアライメントする目的で使用することができる。特異性
が最も重要な要因である場合、BLASTまたはMega-BLAST等のアライメント
アルゴリズムを、短い読み取り(例えば、Roche FLXからの)を用いた類似点検
索の目的で用いることができるが、これらの方法は比較的緩徐である。MAQまたはNo
voalign等のアライメントアルゴリズムは、品質スコアを考慮に入れるため、精度
が絶対不可欠である場合に(例えば、ハイスループットSNP調査において)、シングル
エンドまたはペアエンドデータセットの両方に用いることができる。Bowtieまたは
BWA等のアライメントアルゴリズムは、Burrows-Wheeler変換(BWT
)を用いるため、比較的小さいメモリフットプリントを必要とする。BFAST、Per
M、SHRiMP、SOCS、またはZOOM等のアライメントアルゴリズムは、色空間
読み取りをマッピングするため、ABIのSOLiDプラットフォームとともに用いても
よい。いくつかの適用において、2つ以上のアライメントアルゴリズムからの結果を合わ
せてもよい。
調整:アライメントパラメータ
【0565】
アライメントパラメータが、アルゴリズムの性能を調節する、例えば、読み取り配列と
参照配列との間の最適な大域アライメントまたは局所アライメントをもたらすために、ア
ライメントアルゴリズムで使用される。アライメントパラメータは、適合、ミスマッチ、
およびインデルに重み付けを与えることができる。例えば、より低い重みは、より多くの
ミスマッチおよびインデルとのアライメントを可能にする。
【0566】
アライメントパラメータの例には、マッチリワード、ミスマッチペナルティ、ギャップ
ペナルティ(例えば、ギャップ開きペナルティ、ギャップ伸長ペナルティ)、予測閾値、
語長、フィルタ、またはマスクが含まれるが、これらに限定されない。
【0567】
例えば、ギャップペナルティは、アライメントが読み取り配列または参照配列における
挿入によって破壊されたときにアライメントスコアを減少させるように設計される。ギャ
ップペナルティを用いて、配列中の他の隣接点で残基と残基の良好なアライメントを達成
することが可能である場合に、アライメントにおけるギャップまたは挿入を容認するかの
決定を支援することができる。具体的には、ペナルティを、それぞれの開かれたギャップ
(「ギャップ開き」ペナルティ)のスコアと、損失(「ギャップ伸長」ペナルティ)を乗
じたギャップ空間の総数のスコアから差し引くことができる。典型的には、ギャップを伸
長する損失は、ギャップを開く損失よりも少なくとも約2、3、4、5、6、7、8、9
、または10倍低くなっている。予測閾値は、特定のサイズのデータベースを検索すると
きに偶然目撃することが「予測」され得るヒットの数を説明するパラメータである。
調整:アルゴリズムおよびパラメータの配列コンテキストに基づく選択/調整
【0568】
配列コンテキスト、例えば、反復配列(例えば、タンデム反復配列、散在反復配列)、
複雑度の低い領域、インデル、偽遺伝子、またはパラログの存在が、アライメント特異性
に影響を及ぼし得る(例えば、誤アライメントを引き起こし得る)。本明細書で使用され
るとき、誤アライメントは、ゲノム中の誤った位置上での短い読み取りからの塩基対の配
置を指す。
【0569】
より緩徐であるが、より正確なアライメントアルゴリズム(例えば、Smith-Wa
termanアライメント、または多配列(読み取り)アライナCLUSTALW)等の
アライメントアルゴリズムを選択して、アライメント特異性を増加させる(例えば、配列
コンテキスト、例えば、反復配列の存在によって引き起こされる誤アライメントの可能性
を減少させる)ことができる。
【0570】
マッチリワード、ミスマッチペナルティ、ギャップペナルティ(例えば、ギャップ開き
ペナルティ、ギャップ伸長ペナルティ)、予測閾値、語長、フィルタ、またはマスク等の
アライメントパラメータを調節して(例えば、増加または減少させて)、アライメント特
異性を増加させる(例えば、配列コンテキストによって引き起こされる誤アライメントの
可能性を減少させる)ことができる。
調整:アルゴリズムおよびパラメータの腫瘍型に基づく選択/調整
【0571】
腫瘍型、例えば、特異的変異もしくは変異型を有する傾向のある腫瘍型に基づいて、ア
ライメントアルゴリズムが選択されるか、またはアライメントパラメータが調節されると
き、アライメント感度を増加させることができる。
【0572】
核酸がある特定の腫瘍型の試料から単離されるときに、アライメントアルゴリズムを選
択して、アライメント感度を調節する(例えば、増加させる)ことができる。
【0573】
核酸がある特定の腫瘍型の試料から単離されるときに、マッチリワード、ミスマッチペ
ナルティ、ギャップペナルティ(例えば、ギャップ開きペナルティ、ギャップ伸長ペナル
ティ)、予測閾値、語長、フィルタ、またはマスク等のアライメントパラメータを調節し
て(例えば、増加または減少させて)、アライメント感度を調節する(例えば、増加させ
る)ことができる。例えば、C→T置換は、黒色腫の一般的な変異型である。したがって
、黒色腫試料からの核酸配列のミスマッチペナルティが減少または増加するときに、アラ
イメント感度を調節する(例えば、増加させる)ことができる。
調整:アルゴリズムおよびパラメータの遺伝子型に基づく選択/調整
【0574】
特定の遺伝子型(例えば、癌遺伝子、腫瘍抑制遺伝子遺伝子)に基づいて、アライメン
トアルゴリズムが選択されるか、またはアライメントパラメータが調節されるとき、アラ
イメント感度を増加させることができる。異なる種類の癌関連遺伝子における変異は、癌
表現型に異なる影響を有し得る。例えば、変異体癌遺伝子対立遺伝子は、典型的には、優
性である。変異体腫瘍抑制遺伝子対立遺伝子は、典型的には、劣性であり、これは、多く
の場合、影響が現れる前に腫瘍抑制遺伝子の両方の対立遺伝子が影響を受けていなくては
ならないことを意味する。
【0575】
遺伝子型(例えば、癌遺伝子、腫瘍抑制遺伝子)に基づいて、アライメントアルゴリズ
ムを選択して、アライメント感度を調節する(例えば、増加させる)ことができる。
【0576】
遺伝子型(例えば、癌遺伝子、腫瘍抑制遺伝子)に基づいて、マッチリワード、ミスマ
ッチペナルティ、ギャップペナルティ(例えば、ギャップ開きペナルティ、ギャップ伸長
ペナルティ)、予測閾値、語長、フィルタ、またはマスク等のアライメントパラメータを
調節して(例えば、増加または減少させて)、アライメント感度/特異性を調節する(例
えば、増加させる)ことができる。例えば、インフレームインデルは、腫瘍抑制遺伝子に
一般に関連している。したがって、標準のギャップペナルティ手法(例えば、ギャップ開
き+ギャップ伸長)が、癌遺伝子の場合はインフレームインデルを、腫瘍抑制遺伝子の場
合はフレームシフトインデルを好むように修正されるときに、アライメント感度および特
異性を調節する(例えば、増加させる)ことができる。
調整:アルゴリズムおよびパラメータの変異型に基づく選択/調整
【0577】
変異型(例えば、単一ヌクレオチド多型、インデル(挿入もしくは欠失)、逆位、転座
、タンデム反復)に基づいて、アライメントアルゴリズムが選択されるか、またはアライ
メントパラメータが調節されるときに、アライメント感度を調節する(例えば、増加させ
る)ことができる。
【0578】
変異型(例えば、単一ヌクレオチド多型、インデル(挿入または欠失)、逆位、転座、
タンデム反復)に基づいて、BWA(高速の単一の短い読み取り)、Smith-Wat
erman(より緩徐でより正確な単一の短い読み取り)、およびCLUSTALW(さ
らにより緩徐であるが、複数の読み取りを考慮する)等のアライメントアルゴリズムを選
択して、アライメント感度を調節する(例えば、増加させる)ことができる。
【0579】
変異型(例えば、単一ヌクレオチド多型、インデル(挿入もしくは欠失)、逆位、転座
、タンデム反復)に基づいて、マッチリワード、ミスマッチペナルティ、ギャップペナル
ティ(例えば、ギャップ開きペナルティ、ギャップ伸長ペナルティ)、予測閾値、語長、
フィルタ、またはマスク等のアライメントパラメータを調節して(例えば、増加または減
少させて)、アライメント感度/特異性を調節する(例えば、増加させる)ことができる
。例えば、点変異は、KRAS遺伝子に一般に関連している。したがって、その位置のミ
スマッチペナルティが減少すると、アライメント感度が増加し得る。同様に、欠失は、E
GFR遺伝子に一般に関連している。したがって、その位置(複数を含む)または遺伝子
のギャップペナルティ(例えば、ギャップの開きペナルティ、ギャップ伸長ペナルティ)
が減少すると、アライメント感度が増加し得る。部分的な配列(例えば、読み取りの前半
または後半)がアライメントに使用される場合、アライメント感度が増加する場合もある
。
アルゴリズムおよびパラメータの調整/変異部位に基づく選択/調整
【0580】
変異部位(例えば、変異ホットスポット)に基づいて、アライメントアルゴリズムが選
択されるか、またはアライメントパラメータが調節されるときに、アライメント感度を調
節する(例えば、増加させる)ことができる。変異ホットスポットは、変異が通常の変異
率よりも最大100倍頻繁に生じるゲノム中の部位を指す。
【0581】
変異部位(例えば、変異ホットスポット)に基づいて、アライメントアルゴリズムを選
択して、アライメント感度を調節する(例えば、増加させる)ことができる。
【0582】
変異部位(例えば、変異ホットスポット)に基づいて、マッチリワード、ミスマッチペ
ナルティ、ギャップペナルティ(例えば、ギャップ開きペナルティ、ギャップ伸長ペナル
ティ)、予測閾値、語長、フィルタ、またはマスク等のアライメントパラメータを調節し
て(例えば、増加または減少させて)、アライメント感度を調節する(例えば、増加させ
る)ことができる。例えば、コドン12での変異は、KRAS遺伝子に一般に関連してい
る。したがって、その部位のミスマッチペナルティが減少すると、アライメント感度が増
加し得る。
調整:アルゴリズムおよびパラメータの試料型に基づく選択/調整
【0583】
試料型(例えば、FFPE試料)に基づいて、アライメントアルゴリズムが選択される
か、またはアライメントパラメータが調節されるときに、アライメント感度/特異性を調
節する(例えば、増加させる)ことができる。
【0584】
試料型(例えば、FFPE試料)に基づいて、アライメントアルゴリズムを選択して、
アライメント感度/特異性を調節する(例えば、増加させる)ことができる。
【0585】
試料型(例えば、FFPE試料)に基づいて、マッチリワード、ミスマッチペナルティ
、ギャップペナルティ(例えば、ギャップ開きペナルティ、ギャップ伸長ペナルティ)、
予測閾値、語長、フィルタ、またはマスク等のアライメントパラメータを調節して(例え
ば、増加または減少させて)、アライメント感度/特異性を調節する(例えば、増加させ
る)ことができる。例えば、DNA損傷による移行変異アーチファクトは、FFPE試料
に一般に関連している。したがって、FFPE試料から得られる配列のミスマッチペナル
ティが増加すると、アライメント感度/特異性が増加し得る。
アライメントモジュール
アライメントの一般方法
【0586】
本明細書に開示の方法は、複数の個別に調整されたアライメント方法またはアルゴリズ
ムの使用を可能にし、配列決定方法、特に多数の様々な遺伝子における多数の様々な遺伝
的事象の大規模並列配列決定に依存する方法、例えば、腫瘍試料を分析する方法における
能力を最適化する。実施形態において、異なる遺伝子におけるいくつかのバリアントのそ
れぞれに個別にカスタマイズまたは調整される複数のアライメント方法を用いて、読み取
りを分析する。実施形態において、調整は、配列決定される遺伝子(または他のサブゲノ
ム間隔)、試料の腫瘍型、配列決定されるバリアント、または試料もしくは対象の特性(
のうちの1つ以上)の関数であり得る。配列決定されるいくつかのサブゲノム間隔に個別
に調整されたアライメント条件の選択または使用は、速度、感度、および特異性の最適化
を可能にする。方法は、比較的多数の様々なサブゲノム間隔についての読み取りのアライ
メントが最適化されるときに特に効果的である。
【0587】
したがって、一態様において、試料、例えば、腫瘍試料を分析する方法が提供される。
方法は、
(a)複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
(b)任意で、例えば、ライブラリをベイトセット(または複数のベイトセット)と接
触させることによって事前選択された配列のライブラリを濃縮して、選択されたメンバー
(本明細書でライブラリ捕獲物と称される場合もある)を提供することと、
(c)サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
(d)該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
を用いてアライメントすることと、
(e)事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる(例えば、ベイズ方法を用いて、例えば、変異を呼び出す)ことと、を含み、
それによって、該腫瘍試料を分析し、
X個の一意のサブゲノム間隔のそれぞれからの読み取りは、一意のアライメント方法と
アライメントされ、一意のサブゲノム間隔とは、他のX-1個のサブゲノム間隔とは異な
ることを意味し、一意のアライメント方法とは、他のX-1個のアライメント方法とは異
なることを意味し、Xは、少なくとも2である。
【0588】
ある実施形態において、ステップ(b)が存在する。ある実施形態において、ステップ
(b)が欠如する。
【0589】
ある実施形態において、Xは、少なくとも3、4、5、10、15、20、30、50
、100、500、または1,000である。
【0590】
したがって、ある実施形態において、本明細書に記載の方法、例えば、腫瘍試料を分析
する方法は、本明細書に記載のアライメント方法を含む。例として、方法(例えば、ステ
ップ(c))は、該読み取りを分析する、例えば、アライメントするためにアライメント
方法を選択することを含んでもよく、アライメント方法は、以下のうちの1つ以上もしく
はすべての関数であるか、それらに応答して選択されるか、またはそれらのために最適化
される:
(i)該試料における腫瘍型、例えば、腫瘍型、
(ii)配列決定される該サブゲノム間隔が位置する遺伝子または遺伝子型、例えば、バ
リアントまたはバリアント型、例えば、変異の事前選択された確率に関連した遺伝子また
は遺伝子型、
(iii)分析される部位(例えば、ヌクレオチド位置)、
(iv)評価されるサブゲノム間隔内のバリアント型、例えば、置換、
(v)試料型、例えば、FFPE試料、および
(vi)評価される該サブゲノム間隔における配列またはその付近の配列、例えば、該
サブゲノム間隔の予想される誤アライメント傾向、例えば、該サブゲノム間隔における反
復配列またはその付近の反復配列の存在。
【0591】
本明細書の他の箇所で言及されるように、方法は、比較的多数のサブゲノム間隔につい
ての読み取りのアライメントが最適化されるときに特に効果的である。したがって、ある
実施形態において、少なくともX個の一意のアライメント方法を用いて、少なくともX個
の一意のサブゲノム間隔についての読み取りを分析し、一意とは、他のX-1とは異なる
ことを意味し、Xは、2、3、4、5、10、15、20、30、50、100、200
、500、または1,000に等しい。
【0592】
ある実施形態において、サブゲノム間隔が表1の少なくともX個の遺伝子から分析され
、Xは、3、4、5、10、15、20、または30に等しい。
【0593】
ある実施形態において、サブゲノム間隔が優先順位が1のアノテーションを有する表1
の少なくともX個の遺伝子から分析され、Xは、3、4、5、10、15、20、または
30に等しい。
【0594】
ある実施形態において、一意のアライメント方法は、少なくとも3、5、10、20、
40、50、60、70、80、90、または100個の異なる遺伝子のそれぞれにおけ
るサブゲノム間隔に適用される。
【0595】
ある実施形態において、少なくとも20、40、60、80、100、120、140
、160、または180個の遺伝子、例えば、表1もしくは表1Aの遺伝子におけるヌク
レオチド位置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意のアラ
イメント方法は、少なくとも10、20、30、40、または50%の分析される該遺伝
子のそれぞれにおけるサブゲノム間隔に適用される。
【0596】
ある実施形態において、優先順位が1のアノテーションを有する表1もしくは表1Aの
少なくとも5、10、20、30、または40個の遺伝子におけるヌクレオチド位置に、
ヌクレオチド値が割り当てられる。ある実施形態において、一意のアライメント方法は、
少なくとも10、20、30、40、または50%の分析される該遺伝子のそれぞれにお
けるサブゲノム間隔に適用される。
【0597】
ある実施形態において、表1、表1A、表2、または表3の少なくとも10、20、3
0、40、50、100、150、200、300、400、または500個のバリアン
トまたはコドン、例えば、変異のヌクレオチド位置に、ヌクレオチド値が割り当てられる
。ある実施形態において、一意のアライメント方法は、少なくとも10、20、30、4
0、または50%の分析される該遺伝子のそれぞれにおけるサブゲノム間隔に適用される
。
【0598】
ある実施形態において、方法は、
一意のアライメント方法をX個のゲノム間隔のそれぞれに適用することを含み、該ゲノ
ム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリアントは、点
変異であり、Xは、2、3、5、10、20、40、50、60、70、80、90、ま
たは100より大きく、例えば、該サブゲノム間隔はそれぞれ、異なる遺伝子に位置する
。
【0599】
ある実施形態において、方法は、
一意のアライメント方法をX個のゲノム間隔のそれぞれ適用することを含み、該ゲノム
間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリアントは、再編
成、例えば、欠失、挿入、または転座であり、Xは、2、3、5、10、20、40、5
0、60、70、80、90、または100より大きく、該サブゲノム間隔はそれぞれ、
異なる遺伝子に位置する。
【0600】
ある実施形態において、
第1の一意のアライメント方法は、事前選択されたヌクレオチド位置を含む第1のサブ
ゲノム間隔に適用され、そのバリアントは、腫瘍表現型に関連し、
第2の一意のアライメント方法は、該第1の事前選択されたヌクレオチド位置以外の事
前選択されたヌクレオチドを含むサブゲノム間隔、例えば、腫瘍表現型を有するバリアン
トを有しない位置に適用される。
【0601】
ある実施形態において、方法は、
a)第1のゲノム間隔のバリアントが腫瘍表現型に関連し、例えば、バリアントが、点
変異、例えば、表6の変異である、第1の一意のアライメント方法を第1のゲノム間隔に
適用することと、
b)第2のゲノム間隔のバリアントが腫瘍表現型に関連し、例えば、バリアントが、再
編成、例えば、欠失、挿入、または転座、例えば、表5の変異である、第2の一意のアラ
イメント方法を第2のゲノム間隔に適用することと、
c)第3の一意のアライメント方法を第3のゲノム間隔、例えば、バリアントが腫瘍表
現型または該試料におけるその型の腫瘍に関連しないゲノム間隔に適用することと、を含
む。
【0602】
ある実施形態において、遺伝子または遺伝子型は、
例えば、チロシンキナーゼ領域における活性化変異に関連し得る癌遺伝子、
不活性化(例えば、ナンセンス)変異を伴い得る腫瘍抑制遺伝子、または
高活性もしくは低活性の生殖細胞系遺伝的バリエーションを伴い得る薬物ADME関連
遺伝子である。
【0603】
ある実施形態において、アライメント方法の選択は、アライメントアルゴリズムで用い
るパラメータ(またはその値)、例えば、マッチリワード、ミスマッチペナルティ、ギャ
ップペナルティ(例えば、ギャップ開きペナルティ、ギャップ伸長ペナルティ)、予想閾
値、語長、フィルタ、またはマスクの選択を含む。パラメータ(またはその値)を、事前
選択されたパラメータ、例えば、事前選択された限界または限度によって定義されるパラ
メータのパネルから選択してもよい。
【0604】
ある実施形態において、既知の癌置換および既知の生殖細胞系インデルを含有する遺伝
子のためにアライメントする(またはアライメントを最適化する)とき、生殖細胞系バリ
アントが正しく捕捉され、かつ目的とする体細胞変異周辺のアライメントに悪影響を及ぼ
さないように、ギャップペナルティを減少させることができる。
【0605】
ある実施形態において、アライメント方法の選択は、置換を含有する可能性の高い遺伝
子の最大差ミスマッチペナルティパラメータの選択を含む。
【0606】
ある実施形態において、アライメント方法の選択は、アライメントアルゴリズムの選択
、例えば、より高速な、例えば、BWAの代わりに、より緩徐であるが、より正確なアル
ゴリズム、例えば、Smith-Watermanアライメントの選択、またはCLUS
TALW等の複数のアライメント方法を用いたアライメント最適化の選択を含む。
【0607】
ある実施形態において、該アライメント方法は、核酸試料の特性、例えば、試料年齢、
試料組織源(例えば、膵臓)、発癌物質の存在/変異原暴露(例えば、喫煙、UV)、試
料における核酸試料の品質(例えば、核酸断片化のレベル)の関数であるか、それらに応
答して選択されるか、またはそれらのために最適化される。
【0608】
ある実施形態において、少なくともX個(Xは、1、2、3、4、5、10、15、2
0、30、40、もしくは50である)のアライメント方法(複数を含む)は、(i)の
関数であるか、それに応答して選択されるか、またはそのために最適化される。
【0609】
ある実施形態において、少なくともX個(Xは、1、2、3、4、5、10、15、2
0、30、40、もしくは50である)のアライメント方法(複数を含む)は、(ii)
の関数であるか、それに応答して選択されるか、またはそのために最適化される。
【0610】
ある実施形態において、少なくともX個(Xは、1、2、3、4、5、10、15、2
0、30、40、もしくは50である)のアライメント方法(複数を含む)は、(iii
)の関数であるか、それに応答して選択されるか、またはそのために最適化される。
【0611】
ある実施形態において、第1のアライメント方法は、(i)の関数であるか、それに応
答して選択されるか、またはそのために最適化され、第2のアライメント方法は、(ii
)の関数であるか、それに応答して選択されるか、またはそのために最適化され、第3の
アライメント方法は、(iii)の関数であるか、それに応答して選択されるか、または
そのために最適化される。
【0612】
ある実施形態において、少なくとも1つのアライメント方法は、(i)および(ii)
、(iii)、(iv)、(v)、または(vii)のうちの1つ以上の関数であるか、
それらに応答して選択されるか、またはそれらのために最適化される。
【0613】
ある実施形態において、少なくともX個(Xは、1、2、3、4、5、10、15、2
0、30、40、もしくは50である)のアライメント方法(複数を含む)は、(ii)
および(ii)、(iii)、(iv)、(v)、または(vii)のうちの1つ以上の
関数であるか、それらに応答して選択されるか、またはそれらのために最適化される。
【0614】
ある実施形態において、該アライメント方法は、遺伝子もしくは遺伝子型、例えば、事
前選択された確率またはバリアント型、例えば、変異に関連した遺伝子もしくは遺伝子型
の関数であるか、それらに応答して選択されるか、またはそれらのために最適化される。
【0615】
ある実施形態において、該アライメント方法は、以下を提供する:
置換を含有する可能性の高い遺伝子の最大差ミスマッチペナルティパラメータの調節、
設定、もしくは使用、
事前選択された腫瘍型によく見られる特異的変異型に基づく特定のミスマッチペナルテ
ィパラメータ(例えば、黒色腫におけるC→T)の調節、設定、もしくは使用、または
ある特定の試料型によく見られる特異的変異型に基づく特定のミスマッチペナルティパ
ラメータ(例えば、FFPEによく見られる置換)の調節、設定、もしくは使用。
【0616】
ある実施形態において、方法は、再編成に関連しないサブゲノム間隔のために最適化さ
れた第1のアライメント方法および再編成に関連したサブゲノム間隔のために最適化され
た第2のアライメント方法の使用を含む。
【0617】
ある実施形態において、方法は、以下のうちの1、2、3、4個、もしくはすべての適
用を含む(実施形態において、以下のうちの2つ以上の群が含まれ、その群のそれぞれの
アライメント方法が一意である):
(i)比較的低い頻度で出現する変異に対する高レベルの感度を可能にするために最深の
対象範囲が要求される高レベルの標的(例えば、遺伝子、エクソン、または塩基)に応答
して選択されるか、またはそのために最適化される第1のアライメント方法。例えば、試
料中の細胞、ライブラリの核酸、またはライブラリ捕獲物の核酸において5%以下の頻度
で出現するバリアント、例えば、点変異に応答して選択されるか、またはそのために最適
化されるアライメント方法。典型的には、これらのバリアントは、高い検出信頼性を確保
するために、500倍を超える配列決定深度を必要とする。例となる適用は、事前選択さ
れた癌において頻繁に変異されるエクソンである。
(ii)比較的高い頻度、例えば、上記の(i)の変異よりも高い頻度で出現する変異に
対する高レベルの感度を可能にするために高い対象範囲(実施形態において、上記の(i
)の対象範囲未満であるが)が要求される中間レベルの標的(例えば、遺伝子、エクソン
、または塩基)に応答して選択されるか、またはそのために最適化される第2のアライメ
ント方法。例えば、試料中の細胞、ライブラリの核酸、またはライブラリ捕獲物の核酸に
おいて5%を超え、最大10、15、もしくは20%の頻度で出現するバリアント、例え
ば、点変異に応答して選択されるか、またはそのために最適化されるアライメント方法。
典型的には、これらのバリアントは、高い検出信頼性を確保するために、200倍を超え
る配列決定深度を必要とする。例となる適用は、癌に関連した遺伝子における適用である
。
(iii)低~中程度の対象範囲(実施形態において、上述の(i)もしくは(ii)の
対象範囲未満)が、ヘテロ接合体対立遺伝子に対する高レベルの感度を可能にするために
要求される低レベルの標的(例えば、遺伝子、エクソン、または塩基)に応答して選択さ
れるか、またはそのために最適化される第3のアライメント方法。例えば、バリアント、
例えば、(1)薬物に応答するか、またはそれを代謝する患者の能力に関連し得る薬理ゲ
ノムSNP、(2)患者を一意に特定する(フィンガープリントする)ために使用され得
るゲノムSNP、あるいは(3)ゲノムDNAおよびLOHのコピー数獲得/喪失を評価
するために使用され得るゲノムSNP/遺伝子座に応答して選択されるか、またはそのた
めに最適化されるアライメント方法。
(iv)中間レベルの標的(例えば、再編成、例えば、転座またはインデルにおける、例
えば、構造ブレークポイント)に応答して選択されるか、またはそのために最適化される
第4のアライメント方法。実施形態において、該対象範囲は、(i)、(ii)、または
(iii)のうちの1つの対象範囲未満である。例えば、実施形態において、高い検出信
頼性を確保するために5~50倍の配列対スパン深度を必要とするバリアント、例えば、
イントロンブレークポイントに応答して選択されるか、またはそのために最適化されるア
ライメント方法。例となる適用は、転座/インデルの傾向のある癌遺伝子である。
(v)わずかな対象範囲がコピー数の変化を検出する能力を改善し得るイントロン標的等
の標的に応答して選択されるか、またはそのために最適化される第5のアライメント方法
。実施形態において、該対象範囲は、(i)、(ii)、(iii)、または(iv)の
うちの1つの対象範囲未満である。例えば、いくつかの末端エクソンの1コピー欠失の検
出は、高い検出信頼性を確保するために、0.1~10倍の対象範囲を必要とする。例と
なる適用は、増幅/欠失の傾向のある癌遺伝子に対する。
【0618】
ある実施形態において、該アライメント方法は、別のアライメント方法が読み取りをア
ライメントする目的、例えば、受け入れ難い目的で使用された後に適用される。
【0619】
ある実施形態において、方法は、事前選択されたサブゲノム間隔についての読み取りを
アライメントする第2またはその後の目的で第2のアライメント方法を選択および適用す
ることをさらに含む。例えば、ある実施形態において、第1の方法は、第1の比較的高速
なアルゴリズムの使用を含み、第2のアライメント方法は、第2のより緩徐であるがより
正確なアルゴリズムの使用を含む。
【0620】
ある実施形態において、該アライメント方法は、Smith-Watermanアライ
メントアルゴリズムもしくは同様のアルゴリズム、またはCLUSTALW等の複数のア
ライメントアルゴリズムを含む。
【0621】
ある実施形態において、(例えば、任意の方法によって)正確なアライメントに対して
抵抗性を示すサブゲノム間隔において、デノボまたは参照誘導アセンブリは、ARACH
NEまたはPhusion等の方法を用いることによって始まる。
【0622】
ある実施形態において、a~c、またはb~cは、上記の配列において行われる。
【0623】
ある実施形態において、方法は、
d)読み取りと該選択されたアライメント方法(例えば、事前選択されたアルゴリズム
またはパラメータ)との比較、例えば、アライメント比較を行うこと、および
e)任意で、該読み取りが所定のアライメント基準(例えば、所定の基準は、事前選択
された数未満のミスマッチまたはギャップを有する参照とのアライメントである)を満た
すかを決定することをさらに含む。
【0624】
ある実施形態において、(c)は、
f)サブゲノム間隔、例えば、バリアント、例えば、置換または再編成、例えば、イン
デルに関連したヌクレオチド位置を含むサブゲノム間隔のアライメントセレクタの値を取
得すること、および
g)アライメントセレクタの該取得された値に応答して、読み取りを分析する、例えば
、アライメントするためのアライメント方法を選択することによってアライメント方法を
選択することを含むが、
但し、該アライメントセレクタが、以下のうちの1つ以上もしくはすべての関数であるか
、それらに応答して選択されるか、またはそれらのために最適化されることを条件とする
:
i)該試料における腫瘍型、例えば、腫瘍型、
ii)配列決定される該サブゲノム間隔が位置する遺伝子もしくは遺伝子型、例えば、事
前選択された確率またはバリアント型、例えば、変異に関連した遺伝子もしくは遺伝子型
、
iii)分析される部位(例えば、ヌクレオチド位置)、
iv)評価されるサブゲノム間隔に関連したバリアントの種類、例えば、置換、
v)試料の種類、例えば、FFPE試料、および
vi)評価される該サブゲノム間隔における配列またはその付近の配列、例えば、該サ
ブゲノム間隔の予想される誤アライメント傾向、例えば、該サブゲノム間隔における反復
配列またはその付近の反復配列の存在。
【0625】
ある実施形態において、方法は、一意の閾値以外の閾値、例えば、一意ではない閾値を
取得し、かつそれをサブゲノム間隔、例えば、本明細書に記載の該サブゲノム間隔のうち
の1つに適用することを含む。
再編成をアライメントするための方法
【0626】
本明細書に開示の方法は、再編成、例えば、インデルに関連したサブゲノム間隔の配列
決定の性能、具体的には、例えば、腫瘍試料由来の多数の様々な遺伝子における多数の様
々な遺伝的事象の大規模並列配列決定に依存する方法の性能を最適化するように複数の個
別に調整されたアライメント方法またはアルゴリズムの使用を可能にする。実施形態にお
いて、異なる遺伝子におけるいくつかの再編成のそれぞれに個別にカスタマイズまたは調
整される複数のアライメント方法を用いて、読み取りを分析する。実施形態において、調
整は、配列決定される遺伝子(もしくは他のサブゲノム間隔)、試料における腫瘍型、配
列決定されるバリアント、または試料もしくは対象の特性(のうちの1つ以上)の関数で
あり得る。配列決定されるいくつかのサブゲノム間隔に微調整されたこのアライメント条
件の選択または使用は、速度、感度、および特異性の最適化を可能にする。方法は、比較
的多数の様々なサブゲノム間隔についての読み取りのアライメントが最適化されるときに
特に効果的である。実施形態において、方法は、再編成のために最適化されたアライメン
ト方法および再編成に関連しないサブゲノム間隔のために最適化されたその他のアライメ
ント方法の使用を含む。
【0627】
したがって、ある実施形態において、本明細書に記載の方法、例えば、腫瘍試料を分析
する方法は、本明細書に記載の再編成のアライメント方法を含む。
【0628】
例として、サブゲノム間隔についての読み取りが、再編成、例えば、インデルを有する
ヌクレオチド位置を含む場合、方法は、
c)事前選択された再編成とアライメントするために事前選択される再編成参照配列を
読み取りとのアライメントのために選択すること(実施形態において、参照配列は、ゲノ
ム再編成と同一ではない)(ある実施形態において、再編成参照配列断片(すなわち「代
替の参照」)は、読み取りにおいて見られることが予想される再編成と同一である。この
代替の参照が予想される再編成とも多少異なる(例えば、周辺の生殖細胞系バリアントも
含有し得る)ことも可能である)、
e)該事前選択された再編成参照配列を読み取りと比較する、例えば、アライメントす
ること、および
f)任意で、該読み取りが所定のアライメント基準を満たすかを決定することを含むア
ライメント方法を用いること(例えば、所定の基準は、事前選択されたレベル未満のミス
マッチまたはギャップを有する該事前選択された再編成参照とのアライメントであり得る
)を含み、
それによって、読み取りを分析するが、
但し、少なくともX個の一意の事前選択された再編成アライメント配列は、少なくとも
X個の一意のサブゲノム間隔についての読み取りを分析するために使用されることを条件
とし、一意とは、他のX-1とは異なることを意味し、Xは、2、3、4、5、10、1
5、20、30、50、100、300、500、1000、2000、または3000
に等しい。
【0629】
ある実施形態において、事前選択された再編成アライメント配列は、該事前選択された
再編成、例えば、事前選択されたインデルの特定を可能にするために選択された配列を含
む。
【0630】
ある実施形態において、事前選択された再編成アライメント配列は、該事前選択された
再編成、例えば、事前選択されたインデルに対応する配列(例えば、配列またはその相補
体のいずれか)を含む。
【0631】
ある実施形態において、事前選択された再編成アライメント配列は、該事前選択された
配列の読み取りとアライメントするために選択された模擬配列(例えば、インデルの配列
またはその相補体以外の配列)を含む。
【0632】
ある実施形態において、事前選択された再編成アライメント配列は、再編成の一方の側
面または両方の側面に隣接する配列、例えば、模擬配列を含む。
【0633】
ある実施形態において、事前選択された再編成アライメント配列は、該再編成の接合部
からの配列、例えば、模擬配列を含む。
【0634】
ある実施形態において、アライメントは、腫瘍型のために事前選択される事前選択され
た再編成アライメント配列で行われる。
【0635】
ある実施形態において、部分的な読み取りアライメントが行われる、例えば、すべてに
満たない読み取りがアライメントされる、例えば、90、80、70、50、50、40
、30、20、または10%未満の読み取りがアライメントされる。
【0636】
ある実施形態において、方法は、再編成に関連したサブゲノム間隔のために最適化され
る第1のアライメント方法および再編成に関連しないサブゲノム間隔のために最適化され
る第2のアライメント方法の使用を含む。
【0637】
ある実施形態において、方法は、
(g)該読み取りを分析する、例えば、アライメントするためにアライメント方法を選
択または適用することをさらに含み、
それによって、該読み取りを分析するが、
但し、該アライメント方法が、以下のうちの1つ以上もしくはすべての関数であるか、そ
れらに応答して選択されるか、またはそれらのために最適化されることを条件とする:
i)該試料における腫瘍型、例えば、腫瘍型、
ii)配列決定される該サブゲノム間隔が位置する遺伝子もしくは遺伝子型、例えば、
バリアントまたはバリアント型、例えば、変異の事前選択された確率に関連した遺伝子も
しくは遺伝子型、
iii)分析される部位(例えば、ヌクレオチド位置)、
iv)評価されるサブゲノム間隔に関連したバリアント型、例えば、置換、
v)試料型、例えば、FFPE試料、および
vi)評価される該サブゲノム間隔における配列またはその付近の配列、例えば、該サ
ブゲノム間隔の予想される誤アライメント傾向、例えば、該サブゲノム間隔における反復
配列またはその付近の反復配列の存在。
【0638】
本明細書の他の箇所で言及されるように、方法は、比較的多数のサブゲノム間隔につい
ての読み取りのアライメントが最適化されるときに特に効果的である。したがって、ある
実施形態において、少なくともX個の一意のアライメント方法を用いて、少なくともX個
の一意のサブゲノム間隔についての読み取りを分析し、一意とは、他のX-1とは異なる
ことを意味し、Xは、2、3、4、5、10、15、20、または30に等しい。
【0639】
ある実施形態において、表1もしくは表1Aの少なくともX個の遺伝子のサブゲノム間
隔が分析され、Xは、2、3、4、5、10、15、20、または30に等しい。
【0640】
ある実施形態において、優先順位が1のアノテーションを有する表1もしくは表1Aの
少なくともX個の遺伝子のサブゲノム間隔が分析され、Xは、2、3、4、5、10、1
5、20、または30に等しい。
【0641】
ある実施形態において、一意のアライメント方法が、少なくとも3、5、10、20、
40、50、60、70、80、90、または100個の異なる遺伝子のそれぞれにおけ
るサブゲノム間隔に適用される。
【0642】
ある実施形態において、少なくとも20、40、60、80、100、120、140
、160、または180個の遺伝子、例えば、表1もしくは表1Aの遺伝子におけるヌク
レオチド位置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意のアラ
イメント方法が、少なくとも10、20、30、40、または50%の分析される該遺伝
子のそれぞれにおけるサブゲノム間隔に適用される。
【0643】
ある実施形態において、優先順位が1のアノテーションを有する表1もしくは表1Aの
少なくとも5、10、20、30、または40個の遺伝子におけるヌクレオチド位置に、
ヌクレオチド値が割り当てられる。ある実施形態において、一意のアライメント方法が、
少なくとも10、20、30、40、または50%の分析される該遺伝子のそれぞれにお
けるサブゲノム間隔に適用される。
【0644】
ある実施形態において、例えば、表1、表2、または表3の少なくとも10、20、3
0、40、50、100、150、200、300、400、または500個のバリアン
トまたはコドンのヌクレオチド位置に、ヌクレオチド値が割り当てられる。ある実施形態
において、一意のアライメント方法が、少なくとも10、20、30、40、または50
%の分析される該遺伝子のそれぞれにおけるサブゲノム間隔に適用される。
【0645】
ある実施形態において、方法は、
一意のアライメント方法をX個のゲノム間隔のそれぞれに適用することを含み、該ゲノ
ム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリアントは、点
変異であり、Xは、2、3、5、10、20、40、50、60、70、80、90、ま
たは100より大きく、例えば、該サブゲノム間隔はそれぞれ、異なる遺伝子に位置する
。
【0646】
ある実施形態において、方法は、
一意のアライメント方法をX個のゲノム間隔のそれぞれに適用することを含み、該ゲノ
ム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリアントは、再
編成、例えば、欠失、挿入、または転座であり、Xは、2、3、5、10、20、40、
50、60、70、80、90、もしくは100より大きく、該サブゲノム間隔はそれぞ
れ、異なる遺伝子に位置する。
【0647】
ある実施形態において、
第1の一意のアライメント方法は、第1の事前選択されたヌクレオチド位置に適用され
、そのバリアントは、腫瘍表現型に関連し(例えば、表10に提供されるバリアント、例
えば、一般的な上皮癌、すなわち、肺癌、乳癌、結腸癌、前立腺癌におけるインデルバリ
アント)、
第2の一意のアライメント方法は、該第1の事前選択されたヌクレオチド位置以外の事
前選択されたヌクレオチド、例えば、腫瘍表現型に関連したバリアントを有しない位置(
例えば、表10において変数として存在しない配列)に適用される。
【0648】
ある実施形態において、方法は、
a)第1のゲノム間隔のバリアントが腫瘍表現型に関連し、例えば、バリアントが、点
変異、例えば、表6の変異である第1のゲノム間隔に、第1の一意のアライメント方法を
適用することと、
b)第2のゲノム間隔のバリアントが腫瘍表現型に関連し、例えば、バリアントが、再
編成、例えば、欠失、挿入、または転座、例えば、表5の変異である第2のゲノム間隔に
、第2の一意のアライメント方法を適用することと、
c)第3の一意のアライメント方法を取得し、これを第3のゲノム間隔、例えば、バリ
アントが腫瘍表現型または該試料におけるその型の腫瘍に関連しないゲノム間隔に適用す
ることとを含む。
【0649】
ある実施形態において、遺伝子もしくは遺伝子型は、
例えば、変異チロシンキナーゼ領域における活性化に関連し得る癌遺伝子、
不活性化(例えば、ナンセンス)変異を伴い得る腫瘍抑制遺伝子、または
高活性もしくは低活性の生殖細胞系遺伝的バリエーションを伴い得る薬物ADME関連
遺伝子である。
【0650】
ある実施形態において、アライメント方法の選択は、アライメントアルゴリズムに用い
るパラメータ(もしくはその値)、例えば、マッチリワード、ミスマッチペナルティ、ギ
ャップペナルティ(例えば、ギャップ開きペナルティ、ギャップ伸長ペナルティ)、予想
閾値、語長、フィルタ、またはマスク、の選択を含む。パラメータ(またはその値)を、
事前選択されたパラメータ、例えば、事前選択された限界または限度によって定義される
パラメータのパネルから選択してもよい。
【0651】
ある実施形態において、既知の癌置換および既知の生殖細胞系インデルを含有する遺伝
子をアライメントする(またはアライメントを最適化する)とき、生殖細胞系バリアント
が正しく捕捉され、かつ目的とする体細胞変異周囲のアライメントに悪影響を及ぼさない
ように、ギャップペナルティを減少させることができる。
【0652】
ある実施形態において、アライメント方法の選択は、置換を含有する可能性の高い遺伝
子の最大差ミスマッチペナルティパラメータの選択を含む。
【0653】
ある実施形態において、アライメント方法の選択は、アライメントアルゴリズムの選択
、例えば、より高速なアルゴリズム、例えば、BWAの代わりに、より緩徐であるが、よ
り正確なアルゴリズム、例えば、Smith-Watermanアライメントの選択、ま
たはCLUSTALW等の複数のアライメント方法を用いたアライメント最適化の選択を
含む。
【0654】
ある実施形態において、該アライメント方法は、核酸試料の特性、例えば、試料年齢、
試料組織源(例えば、膵臓)、発癌物質の存在/変異原暴露(例えば、喫煙、UV)、試
料における核酸試料の品質(例えば、核酸断片化のレベル)の関数であるか、それらに応
答して選択されるか、またはそれらのために最適化される。
【0655】
ある実施形態において、少なくともX個(Xは、1、2、3、4、5、10、15、2
0、30、40、もしくは50である)のアライメント方法(複数を含む)は、(i)の
関数であるか、それに応答して選択されるか、またはそのために最適化される。
【0656】
ある実施形態において、少なくともX個(Xは、1、2、3、4、5、10、15、2
0、30、40、もしくは50である)のアライメント方法(複数を含む)は、(ii)
の関数であるか、それに応答して選択されるか、またはそのために最適化される。
【0657】
ある実施形態において、少なくともX個(Xは、1、2、3、4、5、10、15、2
0、30、40、もしくは50である)のアライメント方法(複数を含む)は、(iii
)の関数であるか、それに応答して選択されるか、またはそのために最適化される。
【0658】
ある実施形態において、第1のアライメント方法は、(i)の関数であるか、それに応
答して選択されるか、またはそのために最適化され、第2のアライメント方法は、(ii
)の関数であるか、それに応答して選択されるか、またはそのために最適化され、第3の
アライメント方法は、(iii)の関数であるか、それに応答して選択されるか、または
そのために最適化される。
【0659】
ある実施形態において、少なくとも1つのアライメント方法は、(i)および(ii)
、(iii)、(iv)、(v)、または(vii)のうちの1つ以上の関数であるか、
それらに応答して選択されるか、またはそれらのために最適化される。
【0660】
ある実施形態において、少なくともX個(Xは、1、2、3、4、5、10、15、2
0、30、40、もしくは50である)のアライメント方法(複数を含む)は、(ii)
および(ii)、(iii)、(iv)、(v)、または(vii)のうちの1つ以上の
関数であるか、それに応答して選択されるか、またはそのために最適化される。
【0661】
ある実施形態において、該アライメント方法は、遺伝子もしくは遺伝子型、例えば、事
前選択された確率またはバリアント型、例えば、変異に関連した遺伝子または遺伝子型の
関数であるか、それらに応答して選択されるか、またはそれらのために最適化される。
【0662】
ある実施形態において、該アライメント方法は、以下を提供する:
置換を含有する可能性の高い遺伝子の最大差ミスマッチペナルティパラメータの調節、
設定、もしくは使用、
インデルを含有する可能性の高い遺伝子のギャップペナルティパラメータの調節、設定
、もしくは使用(例えば、NSCLCにおけるEGFR)、
事前選択された腫瘍型によく見られる特異的変異型に基づく特定のミスマッチペナルテ
ィパラメータの調節、設定、もしくは使用(例えば、黒色腫におけるC→T)、または
ある特定の試料型によく見られる特異的変異型に基づく特定のミスマッチペナルティパ
ラメータの調節、設定、もしくは使用(例えば、FFPEによく見られる置換)。
【0663】
ある実施形態において、方法は、再編成に関連しないサブゲノム間隔のために最適化さ
れた第1のアライメント方法および最適化再編成に関連したサブゲノム間隔のために最適
化された第2のアライメント方法の使用を含む。
【0664】
ある実施形態において、アライメントパラメータ、例えば、ギャップの開き/伸長ペナ
ルティは、調節される、例えば、減少させられる。
【0665】
ある実施形態において、方法は、以下のうちの1、2、3、4個、もしくはすべての適
用を含む(実施形態において、以下のうちの2つ以上の群が含まれ、その群のそれぞれの
アライメント方法が一意である):
(i)比較的低い頻度で出現する変異に対する高レベルの感度を可能にするために最深の
対象範囲が要求される高レベルの標的(例えば、遺伝子、エクソン、または塩基)に応答
して選択されるか、またはそのために最適化される第1のアライメント方法。例えば、試
料中の細胞、ライブラリの核酸、またはライブラリ捕獲物の核酸において5%以下の頻度
で出現するバリアント、例えば、点変異に応答して選択されるか、またはそのために最適
化されるアライメント方法。典型的には、これらのバリアントは、高い検出信頼性を確保
するために、500倍を超える配列決定深度を必要とする。例となる適用は、事前選択さ
れた癌において頻繁に変異されるエクソンである。
(ii)比較的高い頻度、例えば、上記の(i)の変異よりも高い頻度で出現する変異に
対する高レベルの感度を可能にするために高い対象範囲(実施形態において、上記の(i
)の対象範囲未満であるが)が要求される中間レベルの標的(例えば、遺伝子、エクソン
、または塩基)に応答して選択されるか、またはそのために最適化される第2のアライメ
ント方法。例えば、試料中の細胞、ライブラリの核酸、またはライブラリ捕獲物の核酸に
おいて5%を超え、最大10、15、もしくは20%の頻度で出現するバリアント、例え
ば、点変異に応答して選択されるか、またはそのために最適化されるアライメント方法。
典型的には、これらのバリアントは、高い検出信頼性を確保するために、200倍を超え
る配列決定深度を必要とする。例となる適用は、癌に関連した遺伝子における適用である
。
(iii)低~中程度の対象範囲(実施形態において、上述の(i)もしくは(ii)の
対象範囲未満)が、ヘテロ接合体対立遺伝子に対する高レベルの感度を可能にするために
要求される低レベルの標的(例えば、遺伝子、エクソン、または塩基)に応答して選択さ
れるか、またはそのために最適化される第3のアライメント方法。例えば、バリアント、
例えば、(1)薬物に応答するか、またはそれを代謝する患者の能力に関連し得る薬理ゲ
ノムSNP、(2)患者を一意に特定する(フィンガープリントする)ために使用され得
るゲノムSNP、あるいは(3)ゲノムDNAおよびLOHのコピー数獲得/喪失を評価
するために使用され得るゲノムSNP/遺伝子座に応答して選択されるか、またはそのた
めに最適化されるアライメント方法。
(iv)中間レベルの標的(例えば、再編成、例えば、転座またはインデルにおける、例
えば、構造ブレークポイント)に応答して選択されるか、またはそのために最適化される
第4のアライメント方法。実施形態において、実施形態において、該対象範囲は、(i)
、(ii)、または(iii)のうちの1つの対象範囲未満である。例えば、実施形態に
おいて、高い検出信頼性を確保するために5~50倍の配列対スパン深度を必要とするバ
リアント、例えば、イントロンブレークポイントに応答して選択されるか、またはそのた
めに最適化されるアライメント方法。例となる適用は、転座/インデルの傾向のある癌遺
伝子である。
(v)わずかな対象範囲がコピー数の変化を検出する能力を改善し得るイントロン標的等
の標的に応答して選択されるか、またはそのために最適化される第5のアライメント方法
。実施形態において、該対象範囲は、(i)、(ii)、(iii)、または(iv)の
うちの1つの対象範囲未満である。例えば、いくつかの末端エクソンの1コピー欠失の検
出は、高い検出信頼性を確保するために、0.1~10倍の対象範囲を必要とする。例と
なる適用は、増幅/欠失の傾向のある癌遺伝子に対する。
【0666】
ある実施形態において、該アライメント方法は、別のアライメント方法が読み取りをア
ライメントする目的、例えば、受け入れ難い目的で使用された後に適用される。
【0667】
ある実施形態において、方法は、事前選択されたサブゲノム間隔についての読み取りを
アライメントする第2またはその後の目的で第2のアライメント方法を選択および適用す
ることをさらに含む。例えば、ある実施形態において、第1の方法は、第1の比較的高速
なアルゴリズムの使用を含み、第2のアライメント方法は、第2のより緩徐であるがより
正確なアルゴリズムの使用を含む。
【0668】
ある実施形態において、該アライメント方法は、Smith-Watermanもしく
は同様のアルゴリズム、またはCLUSTALW等の複数のアライメントアルゴリズムを
含む。
【0669】
ある実施形態において、(例えば、任意の方法によって)正確なアライメントに対して
抵抗性を示すサブゲノム間隔において、デノボまたは参照誘導アセンブリは、ARACH
NEまたはPhusion等の方法を用いることによって始まる。
【0670】
ある実施形態において、a~c、またはb~cは、上記の順序において行われる。
【0671】
ある実施形態において、方法は、
d)読み取りと該選択されたアライメント方法(例えば、事前選択されたアルゴリズム
またはパラメータ)との比較、例えば、アライメント比較を行うことと、
e)任意で、該読み取りが所定のアライメント基準(例えば、所定の基準は、事前選択
された数未満のミスマッチまたはギャップを有する参照とのアライメントである)を満た
すかを決定することとをさらに含む。
【0672】
ある実施形態において、方法は、腫瘍および/または対照核酸試料(例えば、FFPE
由来の核酸試料)から得られるヌクレオチド配列読み取りの取得を含む。
【0673】
ある実施形態において、読み取りは、NGS配列決定方法によって提供される。
【0674】
ある実施形態において、方法は、核酸メンバーのライブラリを提供すること、および該
ライブラリの複数のメンバーからの事前選択されたサブゲノム間隔を配列決定することを
含む。実施形態において、方法は、配列決定のために、該ライブラリのサブセットを選択
するステップ、例えば、溶液ベースの選択を含み得る。
【0675】
ある実施形態において、(c)は、
f)サブゲノム間隔、例えば、バリアント、例えば、置換または再編成、例えば、イン
デルに関連したヌクレオチド位置を含むサブゲノム間隔のアライメントセレクタの値を取
得すること、および
g)アライメントセレクタの該取得された値に応答して、読み取りを分析する、例えば
、アライメントするためのアライメント方法を選択することによってアライメント方法を
選択することを含むが、
但し、該アライメントセレクタが、以下のうちの1つ以上もしくはすべての関数であるか
、それらに応答して選択されるか、またはそれらのために最適化されることを条件とする
:
i)該試料における腫瘍型、例えば、腫瘍型、
ii)配列決定される該サブゲノム間隔が位置する遺伝子もしくは遺伝子型、例えば、
事前選択された確率またはバリアント型、例えば、変異に関連した遺伝子もしくは遺伝子
型、
iii)分析される部位(例えば、ヌクレオチド位置)、
iv)評価されるサブゲノム間隔に関連したバリアント型、例えば、置換、
v)試料型、例えば、FFPE試料、および
vi)評価される該サブゲノム間隔における配列またはその付近の配列、例えば、該サ
ブゲノム間隔の予想される誤アライメント傾向、例えば、該サブゲノム間隔における反復
配列またはその付近の反復配列の存在。
【0676】
ある実施形態において、該取得された値は、核酸試料の特性、例えば、試料年齢、試料
組織源(例えば、膵臓)、発癌物質の存在/変異原暴露(例えば、喫煙、UV)、試料に
おける核酸試料の品質(例えば、核酸断片化のレベル)の関数である。
【0677】
ある実施形態において、例えば、第1の(または2個以上の)アライメント方法の失敗
後、方法は、例えば、新規の複雑な再編成を回収するために、アライメントされていない
読み取りの(例えば、ARACHNE方法を伴う)アセンブリを含む。
より困難な読み取りのアライメント
【0678】
本明細書に開示の方法は、厄介な読み取りの迅速かつ効率的なアライメントを可能にす
る。方法は、比較的多数の様々なサブゲノム間隔についての読み取りのアライメントが最
適化されるときに特に効果的である。例として、腫瘍試料を分析する方法は、
任意で、核酸を配列決定して読み取りを取得すること、
任意で、読み取りを取得すること(例えば、腫瘍および/または対照核酸試料(例えば
、FFPE由来の核酸試料)から得られるヌクレオチド配列読み取りを取得すること)、
第1の組のパラメータ下で(例えば、第1のマッピングアルゴリズム下で、または第1
の参照配列との)読み取りの比較、例えば、アライメント比較を行って、該読み取りが第
1の所定のアライメント基準を満たす(例えば、読み取りが、例えば、事前選択された数
未満のミスマッチを有する該第1の参照配列とアライメントされ得る)かを決定すること
、
該読み取りが第1の所定のアライメント基準を満たすことができない場合、第2の組の
パラメータ下で(例えば、第2のマッピングアルゴリズム下で、または第2の参照配列と
の)第2のアライメント比較を行うこと、および
任意で、該読み取りが該第2の所定の基準を満たす(例えば、読み取りが事前選択され
た数未満のミスマッチを有する該第2の参照配列とアライメントされ得る)かを決定する
ことを含んでもよく、
該第2の組のパラメータは、一組のパラメータ、例えば、該第1の組のパラメータと比較
して、事前選択されたバリアント、例えば、再編成、例えば、挿入、欠失、または転座に
ついての読み取りとのアライメントをもたらす可能性が高い該第2の参照配列の使用を含
み、
それによって、読み取りを分析する。
【0679】
ある実施形態において、該第2の参照配列は、事前選択されたバリアント、例えば、染
色体再編成、例えば、挿入、欠失、または転座に隣接する配列を含む。
【0680】
ある実施形態において、該第2の参照配列は、事前選択されたバリアント、例えば、染
色体再編成、例えば、挿入、欠失、または転座からの読み取りとアライメントするように
設計される配列を含む。
【0681】
ある実施形態において、該第2の参照配列は、該事前選択された再編成、例えば、事前
選択されたインデルの同定を可能にするように選択された配列を含む。
【0682】
ある実施形態において、該第2の参照配列は、該事前選択された再編成、例えば、事前
選択されたインデルに対応する配列(例えば、配列またはその相補体のいずれか)を含む
。
【0683】
ある実施形態において、該第2の参照配列は、該事前選択された配列の読み取りとアラ
イメントするように選択された模擬配列(例えば、インデルの配列またはその相補体以外
の配列)を含む。
【0684】
ある実施形態において、該第2の参照配列は、再編成の一方の側面または両方の側面に
隣接する配列、例えば、模擬配列を含む。
【0685】
ある実施形態において、該第2の参照配列は、該再編成の接合部からの配列、例えば、
模擬配列を含む。
変異呼び出し
【0686】
塩基呼び出しは、配列決定デバイスの生出力を指す。変異呼び出しは、配列決定される
ヌクレオチド位置のヌクレオチド値、例えば、A、G、T、またはCを選択するプロセス
を指す。典型的には、位置についての配列決定読み取り(または塩基呼び出し)は、2個
以上の値を提供し、例えば、いくつかの読み取りはTを提供し、いくつかの読み取りはG
を提供する。変異呼び出しは、ヌクレオチド値、例えば、配列に対する値のうちの1つを
割り当てるプロセスである。これは「変異」呼び出しと称されるが、これを適用して、ヌ
クレオチド値を任意のヌクレオチド位置、例えば、変異体対立遺伝子、野生型対立遺伝子
、変異体もしくは野生型のいずれにも見なされていない対立遺伝子に対応する位置、また
は可変性を特徴としない位置に割り当ててもよい。変異呼び出し方法は、参照配列におけ
るそれぞれの位置での情報に基づいて独立した呼び出しを行うこと(例えば、配列読み取
りを試験すること、塩基呼び出しおよび品質スコアを試験すること、可能性のある遺伝子
型を考慮して観察される塩基および品質スコアの確率を計算すること、および遺伝子型を
割り当てること(例えば、ベイズの規則を用いて))、誤検出を除去すること(例えば、
深度閾値を用いて、予測よりもはるかに低いか、または高い読み取り深度を有するSNP
を拒否する;局所再アライメントを用いて小さなインデルによる誤検出を除去する)、な
らびに連鎖不均衡(LD)/インピュテーションに基づく分析を行って呼び出しを洗練す
ることのうちの1つ以上を含み得る。
【0687】
特定の遺伝子型および位置に関連した遺伝子型の可能性を計算する等式は、例えば、L
i H.and Durbin R.Bioinformatics,2010;26(
5):589-95に記載されている。ある特定の癌型における特異的変異についての先
行予想をその癌型由来の試料を評価するときに用いることができる。そのような可能性は
、癌変異の公開データベース、例えば、癌における体細胞変異カタログ(COSMIC)
、HGMD(ヒト遺伝子変異データベース)、SNPコンソーシアム、乳癌変異データベ
ース(BIC)、および乳癌遺伝子データベース(BCGD)に由来し得る。
【0688】
LD/インピュテーションに基づく分析の例は、例えば、Browning B.L.
and Yu Z.Am.J.Hum.Genet.2009,85(6):847-6
1に記載されている。低対象範囲SNP呼び出し方法の例は、例えば、Li Y.et
al.,Annu.Rev.Genomics Hum.Genet.2009,10:
387-406に記載されている。
変異呼び出し:置換
【0689】
アライメント後、呼び出し方法、例えば、ベイズ変異呼び出し方法を用いて置換の検出
を行うことができ、それは、サブゲノム間隔のそれぞれにおける各塩基、例えば、評価さ
れる遺伝子のエクソンに適用され、そこで代替の対立遺伝子の存在が観察される。この方
法は、変異の存在下で読み取りデータを観察する確率と塩基呼び出しエラーのみの存在下
で読み取りデータを観察する確率を比較する。この比較が変異の存在を十分かつ強力に支
援する場合、変異を呼び出すことができる。
【0690】
癌DNAの分析のために50%または100%の頻度からの限定的なずれに対処する方
法が開発されている(例えば、SNVMix-Bioinformatics.2010
March15;26(6):730-736)。しかしながら、本明細書に開示の方
法は、試料DNAの1%~100%、および特に、50%よりも低いレベルでの変異体対
立遺伝子の存在の可能性の検討を可能にする。この手法は、天然(多クローン)腫瘍DN
Aの低純度のFFPE試料における変異の検出にとって特に重要である。
【0691】
ベイズ変異-検出手法の利点は、変異の存在の確率と塩基呼び出しエラーのみの確率と
の比較をその部位における変異の存在の先行予想によって重み付けをすることができるこ
とである。代替の対立遺伝子のいくつかの読み取りが所与の癌型の頻繁に変異した部位で
観察される場合、変異の存在は、変異の証拠量が通常閾値を満たさない場合でさえも確信
的に呼び出され得る。ひいては、この柔軟性を用いて、より珍しい変異/より低い純度の
試料の検出感度さえも増加させるか、または試験をよりロバストにして、読み取り対象範
囲を減少させることができる。癌において変異するゲノムにおけるランダム塩基対の可能
性は、約1e-6である。典型的な多遺伝子性癌ゲノムパネルにおける多くの部位での特
異的変異の可能性は、桁違いに高くあり得る。これらの可能性は、癌変異の公開データベ
ース(例えば、COSMIC)に由来し得る。例えば、分析される遺伝子のうちの1つで
あるKRASについて、以下の表6に提供される変異の先行予想を結腸癌試料の評価時に
用いることができる。
【表2】
そこで、そのような表を作成し、公開データベース内の十分な情報が利用可能な多遺伝子
試験における任意の遺伝子の変異呼び出しアルゴリズムで用いることができる。
変異呼び出し:インデル
【0692】
インデル呼び出しは、挿入または欠失の点で参照配列とは異なる配列決定データにおい
て塩基を見つけるプロセスであり、典型的には、関連した信頼スコアまたは統計学的証拠
メトリックを含む。
【0693】
インデル呼び出し方法は、候補インデルを特定するステップ、局所再アライメントを介
して遺伝子型の可能性を計算するステップ、ならびにLDベースの遺伝子型推測および呼
び出しを行うステップを含み得る。典型的には、可能性のあるインデル候補を得るために
ベイズ手法が使用され、その後、これらの候補は、ベイズフレームワーク内の参照配列と
ともに試験される。
【0694】
候補インデルを生成するアルゴリズムは、例えば、McKenna A.et al.
,Genome Res.2010;20(9):1297-303、Ye K.et
al.,Bioinformatics,2009;25(21):2865-71、L
unter G.and Goodson M.Genome Res.2010(印刷
前に電子出版された)、Li H.et al.,Bioinformatics 20
09,Bioinformatics 25(16):2078-9に記載されている。
【0695】
インデル呼び出しおよび個別レベルの遺伝子型の可能性を生成するための方法は、例え
ば、Dindelアルゴリズム(Albers C.A.et al.,Genome
Res.2010 Oct 27(印刷前に電子出版された))を含む。例えば、ベイズ
EMアルゴリズムを用いて、読み取りを分析し、最初のインデル呼び出しを作製し、それ
ぞれの候補インデルの遺伝子型の可能性を生成することができ、その後、例えば、QCA
LL(Le S.Q.and Durbin R.Genome Res.2010 O
ct 27(印刷前に電子出版された))を用いた遺伝子型のインピュテーションが続く
。インデルを観察する先行予想等のパラメータをインデルのサイズまたは位置に基づいて
調節する(例えば、増加または減少させる)ことができる。
【表3】
【表4】
【表5】
変異呼び出しモジュール
【0696】
本明細書に開示の方法は、配列決定方法、具体的には、例えば、腫瘍試料由来の多数の
様々な遺伝子における多数の様々な遺伝的事象の大規模並列配列決定に依存する方法の性
能を最適化するようにカスタマイズまたは調整された変異呼び出しパラメータの使用を提
供する。本方法の実施形態において、いくつかの事前選択されたサブゲノム間隔のそれぞ
れの変異呼び出しは、個別にカスタマイズまたは微調整される。カスタマイゼーションも
しくは調整は、本明細書に記載の要因、例えば、試料の癌型、配列決定されるサブゲノム
間隔が位置する遺伝子、または配列決定されるバリアントのうちの1つ以上に基づき得る
。
【0697】
この配列決定されるいくつかのサブゲノム間隔に微調整されたアライメント条件の選択
または使用は、速度、感度、および特異性の最適化を可能にする。方法は、比較的多数の
様々なサブゲノム間隔についての読み取りのアライメントが最適化されるときに特に効果
的である。
【0698】
したがって、一態様において、本発明は、試料、例えば、腫瘍試料を分析する方法を特
色とする。方法は、
(a)複数のメンバーを含むライブラリを試料から、例えば、複数の腫瘍メンバーを含
むライブラリを腫瘍試料から取得することと、
(b)任意で、例えば、ライブラリをベイトセット(または複数のベイトセット)と接
触させることとによって事前選択された配列のライブラリを濃縮して、選択されたメンバ
ー(本明細書でライブラリ捕獲物と称される場合もある)を提供することと、
(c)サブゲノム間隔についての読み取りを、例えば、配列決定を含む方法によって、
例えば、次世代配列決定方法を用いて、該ライブラリまたはライブラリ捕獲物からのメン
バー、例えば、腫瘍メンバーから取得することと、
(d)該読み取りを、アライメント方法、例えば、本明細書に記載のアライメント方法
を用いてアライメントすることと、
(e)事前選択されたヌクレオチド位置に対する該読み取りからのヌクレオチド値を割
り当てる(例えば、本明細書に記載のベイズ方法または呼び出し方法を用いて、例えば、
変異を呼び出す)こととを含み、
それによって、該腫瘍試料を分析し、
X個の一意のサブゲノム間隔のそれぞれにおいてヌクレオチド位置に対して割り当てら
れるヌクレオチド値は、一意の呼び出し方法によって割り当てられ、一意のサブゲノム間
隔とは、他のX-1個のサブゲノム間隔とは異なることを意味し、一意の呼び出し方法と
は、他のX-1個の呼び出し方法とは異なることを意味し、Xは、少なくとも2である。
呼び出し方法は異なってもよく、それによって、例えば、異なるベイズ先行値に依存する
という点で一意であってもよい。
【0699】
ある実施形態において、ステップ(b)が存在する。ある実施形態において、ステップ
(b)が欠如する。
【0700】
ある実施形態において、該ヌクレオチド値の割り当ては、腫瘍型における該事前選択さ
れたヌクレオチド位置で事前選択されたバリアント、例えば、変異を示す読み取りを観察
する先行(例えば、文献)予想であるか、またはそれを表す値の関数である。
【0701】
ある実施形態において、方法は、少なくとも10、20、40、50、60、70、8
0、90、または100個の事前選択されたヌクレオチド位置に対するヌクレオチド値を
割り当てる(例えば、変異を呼び出す)ことを含み、それぞれの割り当ては、腫瘍型にお
ける該事前選択されたヌクレオチド位置で事前選択されたバリアント、例えば、変異を示
す読み取りを観察する先行(例えば、文献)予想であるか、またはそれを表す(他の割り
当ての値ではなく)一意の値の関数である。
【0702】
ある実施形態において、該ヌクレオチド値の割り当ては、バリアントがある頻度で(例
えば、1%、5%、10%等)試料中に存在する場合、および/またはバリアントが不在
である(例えば、塩基呼び出しエラーのみによる読み取りにおいて観察される)場合、該
事前選択されたヌクレオチド位置で該事前選択されたバリアントを示す読み取りを観察す
る確率を表す一組の値の関数である。
【0703】
したがって、腫瘍試料を分析する方法は、変異呼び出し方法を含み得る。本明細書に記
載の変異呼び出し方法は、
(b)それぞれの該X個のサブゲノム間隔の事前選択されたヌクレオチド位置のために
、以下を取得することと、
(i)腫瘍型Xにおける該事前選択されたヌクレオチド位置で事前選択されたバリアン
ト、例えば、変異を示す読み取りを観察する先行(例えば、文献)予想であるか、または
それを表す第1の値、
(ii)バリアントがある頻度で(例えば、1%、5%、10%等)試料中に存在する場
合、および/またはバリアントが不在である(例えば、塩基呼び出しエラーのみによる読
み取りにおいて観察される)場合、該事前選択されたヌクレオチド位置で該事前選択され
たバリアントを示す読み取りを観察する確率を表す第2の一組の値、
(c)該値に応答して、例えば、本明細書に記載のベイズ方法によって、第1の値を用
いて第2の組の値の比較を検討する(例えば、変異の存在の事後確率を算出する)ことに
よって、該事前選択されたヌクレオチド位置のそれぞれに対する該読み取りからのヌクレ
オチド値を割り当てる(例えば、変異を呼び出す)こととを含んでもよく、それによって
、該試料を分析する。
【0704】
ある実施形態において、方法は、以下のうちの1つ以上もしくはすべてを含む:
(i)少なくとも10、20、40、50、60、70、80、90、もしくは100
個の事前選択されたヌクレオチド位置に対するヌクレオチド値を割り当てる(例えば、変
異を呼び出す)こと(それぞれの割り当ては、(他の割り当てではなく)一意の第1およ
び/もしくは第2の値に基づく)、
(ii)(i)の方法の割り当て(その割り当ての少なくとも10、20、30、もし
くは40個は、例えば、事前選択された腫瘍型における細胞の5、10、または20%未
満で存在する事前選択されたバリアントの確率の関数である第1の値で作成される)、
(iii)少なくともX個の事前選択されたヌクレオチド位置に対するヌクレオチド値
を割り当てる(例えば、変異を呼び出す)こと(X個の事前選択されたヌクレオチド位置
のそれぞれは、事前選択された腫瘍型、例えば、該試料の腫瘍型に存在する(他のX-1
個の割り当てとは対照的に)一意の確率を有する事前選択されたバリアントに関連し、任
意で、該X個の割り当てのそれぞれは、(他のX-1個の割り当てではなく)一意の第1
および/もしくは第2の値に基づく(X=23、5、10、20、40、50、60、7
0、80、90、もしくは100))、
(iv)ヌクレオチド値を第1および第2のヌクレオチド位置で割り当てる(例えば、
変異を呼び出す)こと(事前選択された腫瘍型(例えば、該試料の腫瘍型)に存在する該
第1のヌクレオチド位置での第1の事前選択されたバリアントの可能性は、存在する該第
2のヌクレオチド位置での第2の事前選択されたバリアントの可能性よりも少なくとも2
、5、10、20、30、もしくは40倍大きく、任意で、それぞれの割り当ては、(他
の割り当てではなく)一意の第1および/もしくは第2の値に基づく)、
(v)ヌクレオチド値を複数の事前選択されたヌクレオチド位置に割り当てる(例えば
、変異を呼び出す)こと(該複数は、以下の確率範囲のうちの1つ以上の、例えば、少な
くとも3、4、5、6、7個、もしくはすべてに分類されるバリアントの割り当てを含む
:
0.01未満、0.01~0.2、
0.02より大きく、0.03以下、
0.03より大きく、0.04以下、
0.04より大きく、0.05以下、
0.05より大きく、0.1以下、
0.1より大きく、0.2以下、
0.2より大きく、0.5以下、
0.5より大きく、1.0以下、
1.0より大きく、2.0以下、
2.0より大きく、5.0以下、
5.0より大きく、10.0以下、
10.0より大きく、20.0以下、
20.0より大きく、50.0以下、および
50より大きく、100.0%以下、
ここで確率範囲は、事前選択されたヌクレオチド位置での事前選択されたバリアントが
事前選択された腫瘍型(例えば、該試料の腫瘍型)に存在する確率、または事前選択され
たヌクレオチド位置での事前選択されたバリアントが事前選択された型の腫瘍試料(例え
ば、該試料の腫瘍型)、腫瘍試料由来のライブラリ、もしくはそのライブラリからのライ
ブラリ捕獲物中の細胞の列挙された%に存在する確率の範囲であり、
任意で、それぞれの割り当ては、一意の第1および/もしくは第2の値に基づく(例え
ば、列挙された確率範囲の他の割り当てではなく、一意であるか、または他の列記された
確率範囲のうちの1つ以上もしくはすべての第1および/もしくは第2の値ではなく、一
意である))、
(vi)少なくとも1、2、3、5、10、20、40、50、60、70、80、9
0、もしくは100個の事前選択されたヌクレオチド位置に対するヌクレオチド値を割り
当てる(例えば、変異を呼び出す)こと(事前選択されたヌクレオチド位置はそれぞれ、
独立して、該試料中のDNAの50、40、25、20、15、10、5、4、3、2、
1、0.5、0.4、0.3、0.2、もしくは0.1%未満に存在する事前選択された
バリアントを有し、任意で、それぞれの割り当ては、(他の割り当てではなく)一意の第
1および/もしくは第2の値に基づく)、
(vii)ヌクレオチド値を第1および第2のヌクレオチド位置で割り当てる(例えば
、変異を呼び出す)こと(該試料のDNAにおける第1の位置での事前選択されたバリア
ントの可能性は、該試料のDNAにおける該第2のヌクレオチド位置での事前選択された
バリアントの可能性よりも少なくとも2、5、10、20、30、もしくは40倍大きく
、任意で、それぞれの割り当ては、(他の割り当てではなく)一意の第1および/もしく
は第2の値に基づく)、
(viii)ヌクレオチド値を以下のうちの1つ以上もしくはすべてにおいて割り当て
る(例えば、変異を呼び出す)こと、
(1)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の1.0%未満に存在する事前選択されたバリアントを
有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置、
(2)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の1.0~2.0%に存在する事前選択されたバリアン
トを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレオチド位置
、
(3)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の2.0%より大きく3%以下に存在する事前選択され
たバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレ
オチド位置、
(4)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の3.0%より大きく4%以下に存在する事前選択され
たバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレ
オチド位置、
(5)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の4.0%より大きく5%以下に存在する事前選択され
たバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌクレ
オチド位置、
(6)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の5.0%より大きく10%以下に存在する事前選択さ
れたバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌク
レオチド位置、
(7)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の10.0%より大きく20%以下に存在する事前選択
されたバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌ
クレオチド位置、
(8)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の20.0%より大きく40%以下に存在する事前選択
されたバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌ
クレオチド位置、
(9)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ捕
獲物における核酸の該試料の細胞の40.0%より大きく50%以下に存在する事前選択
されたバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択されたヌ
クレオチド位置、または
(10)該試料由来のライブラリにおける核酸、またはそのライブラリ由来のライブラリ
捕獲物における核酸の該試料の細胞の50.0%より大きく100%以下に存在する事前
選択されたバリアントを有する少なくとも1、2、3、4、もしくは5個の事前選択され
たヌクレオチド位置、
ここで、任意で、それぞれの割り当ては、一意の第1および/もしくは第2の値に基づく
(例えば、列挙された範囲(例えば、(i)の1%未満の範囲)の他の割り当てではなく
、一意であるか、または他の列記された範囲のうちの1つ以上もしくはすべてにおける決
定のために第1および/もしくは第2の値ではなく、一意である))、あるいは
(ix)ヌクレオチド値をX個のヌクレオチド位置のそれぞれで割り当てる(例えば、
変異を呼び出す)こと(それぞれのヌクレオチド位置は、独立して、他のX-1個のヌク
レオチド位置での事前選択されたバリアントの可能性と比較して一意である(該試料のD
NAに存在する事前選択されたバリアントの)可能性を有し、Xは、1、23、5、10
、20、40、50、60、70、80、90、もしくは100以上であり、それぞれの
割り当ては、(他の割り当てではなく)一意の第1および/もしくは第2の値に基づく)
。
【0705】
ある実施形態において、方法は、ヌクレオチド値を少なくとも2、3、5、10、20
、40、50、60、70、80、90、または100個の事前選択されたヌクレオチド
位置で割り当てることを含み、事前選択されたヌクレオチド位置はそれぞれ独立して、0
.5、0.4、0.25、0.15、0.10、0.05、0.04、0.03、0.0
2、または0.01未満の確率の関数である第1の値を有する。
【0706】
ある実施形態において、方法は、ヌクレオチド値を少なくともX個のヌクレオチド位置
のそれぞれで割り当てることを含み、X個のヌクレオチド位置はそれぞれ独立して、他の
X-1個の第1の値と比較して一意の第1の値を有し、該X個の第1の値はそれぞれ、0
.5、0.4、0.25、0.15、0.10、0.05、0.04、0.03、0.0
2、または0.01未満の確率の関数であり、Xは、1、2、3、5、10、20、40
、50、60、70、80、90、または100以上である。
【0707】
ある実施形態において、該第1および/または第2の値は、該事前選択されたヌクレオ
チド位置での事前選択されたバリアントの存在の先行予想によって、例えば、腫瘍型の関
数として重み付けされる。
【0708】
ある実施形態において、事前選択されたヌクレオチド位置に対するヌクレオチド値を割
り当てる(例えば、変異を呼び出す)のに必要とされる読み取りの数は、該第1の値の大
きさと逆相関する。
【0709】
ある実施形態において、事前選択されたヌクレオチド位置に対するヌクレオチド値を割
り当てる(例えば、変異を呼び出す)のに必要とされる読み取りの数は、事前選択された
バリアントの予想される確率の大きさと正に相関する。
【0710】
本明細書の他の箇所で言及されるように、方法は、比較的多数のサブゲノム間隔の変異
呼び出しが最適化されるときに特に効果的である。したがって、ある実施形態において、
少なくともX個の一意の第1および/または第2の値は、少なくともX個の一意のサブゲ
ノム間隔についての読み取りを分析するために使用され、一意とは、他のX-1とは異な
ることを意味し、Xは、2、3、4、5、10、15、20、または30に相当する。
【0711】
ある実施形態において、表1の少なくともX個の遺伝子からのサブゲノム間隔が分析さ
れ、Xは、3、4、5、10、15、20、または30に等しい。
【0712】
ある実施形態において、優先順位が1のアノテーションを有する表1の少なくともX個
の遺伝子からのサブゲノム間隔が分析され、Xは、3、4、5、10、15、20、また
は30に等しい。
【0713】
ある実施形態において、一意の第1および/または第2の値が、少なくとも3、5、1
0、20、40、50、60、70、80、90、または100個の異なる遺伝子のそれ
ぞれのサブゲノム間隔に適用される。
【0714】
ある実施形態において、少なくとも20、40、60、80、100、120、140
、160または180個の遺伝子、例えば、表1もしくは表1Aの遺伝子におけるヌクレ
オチド位置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意の第1お
よび/または第2の値が、少なくとも10、20、30、40、または50%の分析され
る該遺伝子のそれぞれのサブゲノム間隔に適用される。
【0715】
ある実施形態において、優先順位が1のアノテーションを有する表1もしくは表1Aの
少なくとも5、10、20、30、または40個の遺伝子におけるヌクレオチド位置に、
ヌクレオチド値が割り当てられる。ある実施形態において、一意の第1および/または第
2の値が、少なくとも10、20、30、40、または50%の分析される該遺伝子のそ
れぞれのサブゲノム間隔に適用される。
【0716】
ある実施形態において、表1、表1A、表2、もしくは表3の少なくとも10、20、
30、40、50、100、150、200、300、400、もしくは500個のバリ
アントまたはコドン、例えば、変異のヌクレオチド位置に、ヌクレオチド値が割り当てら
れる。ある実施形態において、一意の第1および/もしくは第2の値が、少なくとも10
、20、30、40、もしくは50%の分析される該遺伝子のそれぞれのサブゲノム間隔
に適用される。
【0717】
ある実施形態において、方法は、
一意の第1および/または第2の値をX個のゲノム間隔のそれぞれに適用することを含
み、該ゲノム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリア
ントは、点変異であり、Xは、2、3、5、10、20、40、50、60、70、80
、90、または100より大きく、例えば、該サブゲノム間隔はそれぞれ、異なる遺伝子
に位置する。
【0718】
ある実施形態において、方法は、
一意の第1および/または第2の値をX個のゲノム間隔のそれぞれに適用することを含
み、該ゲノム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリア
ントは、再編成、例えば、欠失、挿入、または転座であり、Xは、2、3、5、10、2
0、40、50、60、70、80、90、または100より大きく、該サブゲノム間隔
はそれぞれ、異なる遺伝子に位置する。
【0719】
ある実施形態において、方法は、以下のうちの1、2、3、4個、もしくはすべてを含
む(実施形態において、以下のうちの2つ以上の群が含まれ、その群のそれぞれの第1お
よび/もしくは第2の値は一意である):
(i)第1および/もしくは第2の値に応答して、例えば、比較的低頻度で出現する変
異に対する高レベルの感度を可能にするために最深の対象範囲が要求される第1の事前選
択されたヌクレオチド位置に対する読み取りからのヌクレオチド値を割り当てる(例えば
、変異を呼び出す)こと(例として、試料中の細胞、ライブラリの核酸、またはライブラ
リ捕獲物の核酸において5%以下の頻度で出現するバリアント、例えば、点変異が挙げら
れる。典型的には、これらのバリアントは、高い検出信頼性を確保するために、500倍
を超える配列決定深度を必要とする。例となる適用は、事前選択された癌において頻繁に
変異するエクソンである)、
(ii)第1および/もしくは第2の値に応答して、例えば、高対象範囲(実施形態に
おいて、上記の(i)の対象範囲未満であるが)が、比較的高い頻度で、例えば、上記の
(i)における変異よりも高い頻度で出現する変異に対する高レベルの感度を可能にする
ために要求される第2の事前選択されたヌクレオチド位置に対する読み取りからのヌクレ
オチド値を割り当てる(例えば、変異を呼び出す)こと(例として、試料中の細胞、ライ
ブラリの核酸、またはライブラリ捕獲物の核酸において5%より大きく、最大10、15
、もしくは20%の頻度で出現するバリアント、例えば、点変異が挙げられる。典型的に
は、これらのバリアントは、高い検出信頼性を確保するために、200倍を超える配列決
定深度を必要とする。例となる適用は、癌に関連した遺伝子においてである)、
(iii)第1および/もしくは第2の値に応答して、例えば、低~中間の対象範囲(
実施形態において、上述の(i)もしくは(ii)の対象範囲未満である)が、ヘテロ接
合体対立遺伝子に対する高レベルの感度を可能にするために要求される第3の事前選択さ
れたヌクレオチド位置に対する読み取りからのヌクレオチド値を割り当てる(例えば、変
異を呼び出す)こと(例として、バリアント、例えば、(1)薬物に応答するか、または
それを代謝する患者の能力に関連し得る薬理ゲノムSNP、(2)患者を一意に特定する
(フィンガープリントする)ために使用され得るゲノムSNP、あるいは(3)ゲノムD
NAおよびLOHのコピー数獲得/喪失を評価するために使用され得るゲノムSNP/遺
伝子座が挙げられる)、
(iv)第1および/もしくは第2の値に応答して、第4の事前選択されたヌクレオチ
ド位置、例えば、再編成、例えば、転座またはインデルにおける、例えば、構造ブレーク
ポイントに対する読み取りからのヌクレオチド値を割り当てる(例えば、変異を呼び出す
)こと(実施形態において、対象範囲は、(i)、(ii)、もしくは(iii)のうち
の1つの対象範囲未満である。例として、実施形態において、高い検出信頼性を確保する
ために、5~50倍の配列対スパン深度を必要とするイントロンブレークポイントが挙げ
られる。例となる適用は、転座/インデルの傾向のある癌遺伝子である)、
(v)第1および/もしくは第2の値に応答して、例えば、わずかな対象範囲がコピー
数の変化を検出する能力を改善し得る第5の事前選択されたヌクレオチド位置に対する読
み取りからのヌクレオチド値を割り当てる(例えば、変異を呼び出す)こと(実施形態に
おいて、対象範囲は、(i)、(ii)(iii)、もしくは(iv)のうちの1つの対
象範囲未満である。例として、例えば、高い検出信頼性を確保するために0.1~10倍
の対象範囲を必要とするいくつかの末端エクソンの1コピー欠失がある。例となる適用は
、増幅/欠失の傾向のある癌遺伝子に対する)。
【0720】
本明細書に開示の方法は、配列決定方法、具体的には、多数の様々な遺伝子における多
数の様々な遺伝的事象の大規模並列配列決定に依存する方法の性能を最適化するようにカ
スタマイズまたは調整された変異呼び出しパラメータの使用を提供する。本方法の実施形
態において、「閾値」を用いて、読み取りを評価し、読み取りからヌクレオチド位置の値
を選択する、例えば、遺伝子の特定の位置で変異を呼び出す。本方法の実施形態において
、いくつかの事前選択されたサブゲノム間隔のそれぞれの閾値は、カスタマイズまたは微
調整される。カスタマイゼーションまたは調整は、本明細書に記載の要因、例えば、試料
の癌型、配列決定されるサブゲノム間隔が位置する遺伝子、または配列決定されるバリア
ントのうちの1つ以上に基づき得る。これは、配列決定されるいくつかのサブゲノム間隔
のそれぞれに微調整される呼び出しを提供する。方法は、比較的多数の様々なサブゲノム
間隔が分析されるときに特に効果的である。
【0721】
したがって、別の態様では、対象由来の試料、例えば、腫瘍試料を分析する方法を特徴
とする。方法は、
(a)X個のサブゲノム間隔のそれぞれについての1つまたは複数の読み取りを該試料
由来の核酸から取得することと、
(b)該X個のサブゲノム間隔のそれぞれのために、閾値を取得し(該取得されたX個
の閾値のそれぞれは、他のX-1個の閾値と比較して一意である)、それによって、X個
の一意の閾値を提供することと、
(c)該X個のサブゲノム間隔のそれぞれのために、事前選択されたヌクレオチド位置
で事前選択されたヌクレオチド値を有する読み取りの数の関数である観察された値をその
一意の閾値と比較し、それによって、その一意の閾値を該X個のサブゲノム間隔のそれぞ
れに適用することと、
(d)任意で、該比較の結果に応答して、ヌクレオチド値を事前選択されたヌクレオチ
ド位置に割り当てることとを含み、
Xは、2以上であり、
それによって、該試料を分析する。
【0722】
本方法の実施形態は、例えば、以下の実施形態に見られるように、比較的多数のサブゲ
ノム間隔の閾値が最適化される場合に適用され得る。
【0723】
ある実施形態において、Xは、少なくとも3、5、10、20、40、50、60、7
0、80、90、もしくは100である。
【0724】
ある実施形態において、一意の閾値が、少なくとも3、5、10、20、40、50、
60、70、80、90、もしくは100個の異なる遺伝子のそれぞれのサブゲノム間隔
に適用される。
【0725】
ある実施形態において、少なくとも20、40、60、80、100、120、140
、160、もしくは180個の遺伝子、例えば、表1もしくは表1Aの遺伝子におけるヌ
クレオチド位置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意の閾
値が、少なくとも10、20、30、40、もしくは50%の分析される該遺伝子のそれ
ぞれのサブゲノム間隔に適用される。
【0726】
ある実施形態において、優先順位が1のアノテーションを有する表1もしくは表1Aの
少なくとも5、10、20、30、もしくは40個の遺伝子におけるヌクレオチド位置に
、ヌクレオチド値が割り当てられる。ある実施形態において、一意の閾値が、少なくとも
10、20、30、40、もしくは50%の分析される該遺伝子のそれぞれのサブゲノム
間隔に適用される。
【0727】
ある実施形態において、表1、表1A、表2、もしくは表3の少なくとも10、20、
30、40、50、100、150、200、300、400、もしくは500個のバリ
アントまたはコドン、例えば、変異のヌクレオチド位置に、ヌクレオチド値が割り当てら
れる。ある実施形態において、一意の閾値が、少なくとも10、20、30、40、もし
くは50%の分析される該遺伝子のそれぞれのサブゲノム間隔に適用される。
【0728】
ある実施形態において、表9の下半分または下3分の1の少なくとも10、20、30
、40、50、100、もしくは200個のバリアント、例えば、変異のヌクレオチド位
置に、ヌクレオチド値が割り当てられる。ある実施形態において、一意の閾値が、少なく
とも10、20、30、40、もしくは50%の分析される該遺伝子のそれぞれのサブゲ
ノム間隔に適用される。
【0729】
ある実施形態において、方法は、
一意の閾値を取得し、それをX個のゲノム間隔のそれぞれに適用することを含み、該ゲ
ノム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリアントは、
点変異であり、Xは、2、3、5、10、20、40、50、60、70、80、90、
もしくは100より大きく、例えば、該サブゲノム間隔はそれぞれ、異なる遺伝子に位置
する。
【0730】
ある実施形態において、方法は、
一意の閾値を取得し、それをX個のゲノム間隔のそれぞれに適用することを含み、該ゲ
ノム間隔はそれぞれ、腫瘍表現型に関連したバリアントを有し、例えば、バリアントは、
再編成、例えば、欠失、挿入、または転座であり、Xは、2、3、5、10、20、40
、50、60、70、80、90、もしくは100より大きく、該サブゲノム間隔はそれ
ぞれ、異なる遺伝子に位置する。
【0731】
本方法の実施形態は、例えば、以下の実施形態で見られるように、適用において使用さ
れる他の閾値と比較した閾値の調整を可能にし得る。
【0732】
ある実施形態において、
一意の閾値が、ヌクレオチド値を表4の少なくとも10、20、30、40、50、7
5、100、150、もしくは200個のバリアント、例えば、変異に対応する事前選択
されたヌクレオチド位置に割り当てるために、サブゲノム間隔に適用される。
適用される該一意の閾値のうちのX個は、試験で使用される別の閾値よりも高い、例え
ば、50%高い閾値、例えば、使用される最低の閾値、使用される平均もしくは中央閾値
、または表9に列記される閾値等の一般的な臨床的に関連する変異の閾値を有し、Xは、
1、2、3、4、5、10、15、20、もしくは30以上である。
【0733】
ある実施形態において、表9の上半分または上3分の1の少なくとも10、20、30
、40、50、100、もしくは200個のバリアント、例えば、変異のヌクレオチド位
置にヌクレオチド値が割り当てられ、任意で、その割り当ては、第三者に送信される。実
施形態において、
一意の閾値は、ヌクレオチド値を少なくとも10、20、30、40、50、75、1
00、150、もしくは200個のバリアントに対応する事前選択されたヌクレオチド位
置に割り当てるために、サブゲノム間隔に適用され、
適用される該一意の閾値のX個は、試験で使用される別の閾値よりも低い、例えば、5
0%低い閾値、例えば、使用される最高閾値、使用される平均もしくは中央閾値、または
以前は癌において変異するように見られなかったゲノム位置の閾値を有し、Xは、1、2
、3、4、5、10、15、20、もしくは30以上である。
【0734】
ある実施形態において、
一意の閾値が、表11の大腸癌の遺伝子に列記される遺伝子のうちの少なくとも2、3
、5、7、もしくは8個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値のうちの3つずつのX個の組み合わせ(すなわち、対での組み合
わせ)について、対での組み合わせのメンバーは、表11のそれらの遺伝子が相互に対し
て有する相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、5、1
0、もしくは20以上である。例として、ある実施形態では、大腸癌の分析において、一
意の閾値が、APC、SMAD4、およびCDNK2aのサブゲノム間隔に(低い閾値か
ら高い閾値の順に)適用される。したがって、3つの対での組み合わせ、APC/SMA
D4、APC/CDNK2a、およびSMAD4/CDNK2aのそれぞれにおいて、対
での組み合わせのそれぞれの両方のメンバーは、表11のそれらの遺伝子が相互に対して
有する相対順位と同一の相対順位を相互に対して有する(例えば、実施形態および表11
の両方において、APCはSMAD4よりも低い)。
【0735】
ある実施形態において、
一意の閾値が、表11の大腸癌の遺伝子に列記される遺伝子のうちの少なくとも3、5
、7、もしくは8個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値のうちの3つずつのX個の組み合わせ(すなわち、3元の組み合
わせ)について、3元の組み合わせのメンバーは、表11のそれらの遺伝子が相互に対し
て有する相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、5、1
0、もしくは20以上である。例として、ある実施形態では、大腸癌の分析において、一
意の閾値が、APC、SMAD4、CDNK2a、およびVHLのサブゲノム間隔に適用
される(低い閾値から高い閾値の順)。したがって、例えば、3元の組み合わせ、APC
/SMAD4/CDNK2aにおいて、3元の組み合わせの3つのメンバーはすべて、表
11のそれらの遺伝子が相互に対して有する相対順位と同一の相対順位を相互に対して有
する。同様に、3元の組み合わせ、APC/CDNK2a/VHLにおいて、3元の組み
合わせの3つのメンバーはすべて、表11のそれらの遺伝子が相互に対して有する相対順
位と同一の相対順位を相互に対して有する。
【0736】
ある実施形態において、
一意の閾値が、表11の大腸癌の遺伝子に列記された遺伝子のうちの少なくとも4、5
、7、もしくは8個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の4つずつのX個の組み合わせ(すなわち、4元の組み合わせ)
について、4元の組み合わせのメンバーは、表11のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、10、もしく
は20以上である。例として、ある実施形態では、大腸癌の分析において、一意の閾値が
、APC、SMAD4、CDNK2a、VHL、MSH6、およびMSH2におけるサブ
ゲノム間隔に適用される(低い閾値から高い閾値の順)。したがって、例えば、APC/
SMAD4/CDNK2a/MSH2の4元の組み合わせにおいて、4元の組み合わせの
4つのメンバーはすべて、表11のそれらの遺伝子が相互に対して有する相対順位と同一
の相対順位を相互に対して有する。
【0737】
ある実施形態において、
一意の閾値が、表11の肺癌の遺伝子に列記された遺伝子のうちの少なくとも2、3、
5、もしくは7個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の2つずつのX個の組み合わせ(すなわち、対での組み合わせ)
について、対での組み合わせのメンバーは、表11のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、5、10、も
しくは20以上である。例として、ある実施形態では、肺癌の分析において、一意の閾値
が、CDNK2a、STK11、RB1、APC、およびSMAD4におけるサブゲノム
間隔に適用される(低い閾値から高い閾値の順)。したがって、3つの対での組み合わせ
、CDNK2a/STK11、STK11/APC、およびRB1/SMAD4のそれぞ
れにおいて、対での組み合わせのそれぞれの両方のメンバーは、表11のそれらの遺伝子
が相互に対して有する相対順位と同一の相対順位を相互に対して有する(例えば、実施形
態および表11の両方において、STK11はSMAD4よりも低い)。
【0738】
ある実施形態において、
一意の閾値は、表11の肺癌の遺伝子に列記された遺伝子のうちの少なくとも3、5、
もしくは7個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の3つずつのX個の組み合わせ(すなわち、3元の組み合わせ)
について、3元の組み合わせのメンバーは、表11のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、5、10、も
しくは20以上である。例として、ある実施形態では、肺癌の分析において、一意の閾値
は、CDNK2a、STK11、RB1、APC、およびSMAD4におけるサブゲノム
間隔に適用される(低い閾値から高い閾値の順)。したがって、例えば、3元の組み合わ
せ、CDNK2/APC/SMAD4において、3元の組み合わせの3つのメンバーはす
べて、表11のそれらの遺伝子が相互に対して有する相対順位と同一の相対順位を相互に
対して有する。
【0739】
ある実施形態において、
一意の閾値は、表11の肺癌の遺伝子に列記された遺伝子のうちの少なくとも4、5、
もしくは7個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の4つずつのX個の組み合わせ(すなわち、4元の組み合わせ)
について、4元の組み合わせのメンバーは、表11のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、10、もしく
は20以上である。例として、ある実施形態では、肺癌の分析において、一意の閾値が、
CDNK2a、STK11、RB1、APC、およびSMAD4におけるサブゲノム間隔
に適用される(低い閾値から高い閾値の順)。したがって、例えば、4元の組み合わせ、
CDNK2a/STK11/APC/SMAD4において、4元の組み合わせの4つのメ
ンバーはすべて、表11のそれらの遺伝子が相互に対して有する相対順位と同一の相対順
位を相互に対して有する。
【0740】
ある実施形態において、
一意の閾値が、表11の前立腺癌の遺伝子に列記された遺伝子のうちの少なくとも2、
3、4、5、6、もしくは7個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の2つずつのX個の組み合わせ(すなわち、対での組み合わせ)
について、対での組み合わせのメンバーは、表11のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、5、10、も
しくは20以上である。例として、ある実施形態では、前立腺癌の分析において、一意の
閾値が、CEBPA、MSH2、CDKN2A、APC、RB1、NF1におけるサブゲ
ノム間隔に適用される(低い閾値から高い閾値の順)。したがって、3つの対での組み合
わせ、STK11/CEBPA、RB1/NF1、およびCEBPA/CDKN2Aのそ
れぞれにおいて、対での組み合わせのそれぞれの両方のメンバーは、表11のそれらの遺
伝子が相互に対して有する相対順位と同一の相対順位を相互に対して有する(例えば、実
施形態および表11の両方において、STK11はCEBPAよりも低い)。
【0741】
ある実施形態において、
一意の閾値が、表11の前立腺癌の遺伝子に列記された遺伝子のうちの少なくとも3、
4、5、6、もしくは7個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の3つずつのX個の組み合わせ(すなわち、3元の組み合わせ)
について、3元の組み合わせのメンバーは、表11のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、もしくは5、
10、もしくは20以上である。例として、ある実施形態では、前立腺癌の分析において
、一意の閾値が、STK11、CEBPA、MSH2、CDKN2A、APC、およびR
B1におけるサブゲノム間隔に適用される(低い閾値から高い閾値の順)。したがって、
例えば、3元の組み合わせ、CDNK2/APC/RB1において、3元の組み合わせの
3つのメンバーはすべて、表11のそれらの遺伝子が相互に対して有する相対順位と同一
の相対順位を相互に対して有する。
【0742】
ある実施形態において、
一意の閾値が、表11の前立腺癌の遺伝子に列記された遺伝子のうちの少なくとも4、
5、6、もしくは7個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の4つずつのX個の組み合わせ(すなわち、4元の組み合わせ)
について、4元の組み合わせのメンバーは、表11のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、10、もしく
は20以上である。例として、ある実施形態では、前立腺癌の分析において、一意の閾値
が、STK11、CEBPA、MSH2、CDKN2A、APC、RB1、およびNF1
におけるサブゲノム間隔に適用される(低い閾値から高い閾値の順)。したがって、例え
ば、4元の組み合わせ、STK11/APC/RB1/NF1において、4元の組み合わ
せの4つのメンバーはすべて、表11のそれらの遺伝子が相互に対して有する相対順位と
同一の相対順位を相互に対して有する。
【0743】
ある実施形態において、
一意の閾値は、表11の乳癌の遺伝子に列記された遺伝子のうちの少なくとも2、3、
5、7、もしくは8個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の2つずつのX個の組み合わせ(すなわち、対での組み合わせ)
について、対での組み合わせのメンバーは、表11のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、5、10、も
しくは20以上である。例として、ある実施形態では、乳癌の分析において、一意の閾値
が、CDH1、CDKN2A、APC、RB1、SMAD4、NF2、STK11、MS
H2におけるサブゲノム間隔に適用される(低い閾値から高い閾値の順)。したがって、
3つの対での組み合わせ、APC/SMAD4、APC/NF2、およびSMAD4/M
SH2のそれぞれにおいて、対での組み合わせのそれぞれの両方のメンバーは、表11の
それらの遺伝子が相互に対して有する相対順位と同一の相対順位を相互に対して有する(
例えば、実施形態および表11の両方において、APCはSMAD4よりも低い)。
【0744】
ある実施形態において、
一意の閾値が、表11の乳癌の遺伝子に列記された遺伝子のうちの少なくとも3、5、
7、または8個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の3つずつのX個の組み合わせ(すなわち、3元の組み合わせ)
について、3元の組み合わせのメンバーは、表11のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、5、10、も
しくは20以上である。例として、ある実施形態では、乳癌の分析において、一意の閾値
が、CDH1、CDKN2A、RB1、SMAD4、NF2、STK11、MSH2にお
けるサブゲノム間隔に適用される(低い閾値から高い閾値の順)。したがって、例えば、
3元の組み合わせ、CDH1/RB1/STK11において、3元の組み合わせの3つの
メンバーはすべて、表11のそれらの遺伝子が相互に対して有する相対順位と同一の相対
順位を相互に対して有する。
【0745】
ある実施形態において、
一意の閾値が、表11の乳癌の遺伝子に列記された遺伝子のうちの少なくとも4、5、
7、または8個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の4つずつのX個の組み合わせ(すなわち、4元の組み合わせ)
について、4元の組み合わせのメンバーは、表11のそれらの遺伝子が相互に対して有す
る相対順位と同一の相対順位を相互に対して有し、Xは、1、2、3、4、10、もしく
は20以上である。例として、ある実施形態では、乳癌の分析において、一意の閾値が、
CDH1、CDKN2A、APC、RB1、SMAD4、NF2、STK11、MSH2
におけるサブゲノム間隔に適用される(低い閾値から高い閾値の順)。したがって、例え
ば、4元の組み合わせ、CDH1/SMAD4/STK11/MSH2において、4元の
組み合わせの4つのメンバーはすべて、表11のそれらの遺伝子が相互に対して有する相
対順位と同一の相対順位を相互に対して有する。
【0746】
ある実施形態において、
一意の閾値が、遺伝子APC、SMAD4、およびATMのうちの少なくとも2個もし
くは3個のそれぞれのサブゲノム間隔に適用され、
適用される一意の閾値の2つずつのX個の組み合わせ(すなわち、対での組み合わせ)
について、対での組み合わせのメンバーは、APC、SMAD4、およびATMの相対順
位であり、Xは、1、2、もしくは3以上である。例として、ある実施形態では、大腸癌
の分析において、一意の閾値が、APC、SMAD4、およびATMにおけるサブゲノム
間隔に適用される(低い閾値から高い閾値の順)。したがって、対での組み合わせ、AP
C/SMAD4およびAPC/ATMのそれぞれにおいて、対での組み合わせのそれぞれ
の両方のメンバーは、APC、SMAD4、およびATMにおける相対順位と同一の相対
順位を有する。
【0747】
ある実施形態において、
一意の閾値が、遺伝子APC、SMAD4、およびATMのそれぞれのサブゲノム間隔
に適用され、低い閾値から高い閾値の順位は、APC、SMAD4、およびATMである
。
(表11は、それらの遺伝子のいくつかまたはすべてのコード塩基対、例えば、表9の塩
基等のより速い速度で変異することで特に知られている塩基の別の廃止リストによって別
様に特定されない塩基対の閾値が増加する順に遺伝子の順序を列挙する。)
【0748】
ある実施形態において、
第1の一意の閾値が、第1の事前選択されたヌクレオチド位置に適用され、そのバリア
ントは、腫瘍表現型に関連し、
第2の一意の閾値が、該第1の事前選択されたヌクレオチド位置以外の事前選択された
ヌクレオチド、例えば、腫瘍表現型に関連したバリアントを有しない位置に適用され、該
第1の閾値は、第2の閾値よりも高い。
【0749】
ある実施形態において、方法は、
a)第1の一意の閾値を取得し、それを第1のゲノム間隔に適用することと(そのバリ
アントは、腫瘍表現型に関連し、例えば、バリアントは、点変異、例えば、表6の変異で
ある)、
b)第2の一意の閾値を取得し、それを第2のゲノム間隔に適用することと(そのバリ
アントは、腫瘍表現型に関連し、例えば、バリアントは、再編成、例えば、欠失、挿入、
または転座、例えば、表5の変異である)、
c)第3の一意の閾値を取得し、それを第3のゲノム間隔、例えば、バリアントが腫瘍
表現型または該試料の腫瘍型に関連しないゲノム間隔に適用することとを含む。
【0750】
ある実施形態において、方法は、以下のうちの1、2、3、4個、もしくはすべてを含
む(実施形態において、以下のうちの2つ以上の群が含まれ、その群のそれぞれの閾値が
一意である):
(i)例えば、最深の対象範囲が比較的低い頻度で出現する変異に対する高レベルの感
度を可能にするように要求される、第1の閾値を第1の事前選択されたヌクレオチド位置
についての読み取りに適用すること(例として、試料中の細胞、ライブラリの核酸、また
はライブラリ捕獲物の核酸において5%以下の頻度で出現するバリアント、例えば、点変
異が挙げられる。典型的には、これらのバリアントは、高い検出信頼性を確保するために
、500倍を超える配列決定深度を必要とする。例となる適用は、事前選択された癌にお
いて頻繁に変異するエクソンである)、
(ii)例えば、高い対象範囲(実施形態において、上記の(i)未満であるが)が、
比較的高い頻度、例えば、上記の(i)における変異よりも高い頻度で出現する変異に対
する高レベルの感度を可能にするために要求される、第2の閾値を第2の事前選択された
ヌクレオチド位置についての読み取りに適用すること(例として、試料中の細胞、ライブ
ラリの核酸、またはライブラリ捕獲物の核酸において5%より大きく、最大10、15、
もしくは20%の頻度で出現するバリアント、例えば、点変異が挙げられる。典型的には
、これらのバリアントは、高い検出信頼性を確保するために、200倍を超える配列決定
深度を必要とする。例となる適用は、癌に関連した遺伝子においてである)、
(iii)例えば、低~中程度の対象範囲(実施形態において、上述の(i)または(
ii)の対象範囲未満)が、ヘテロ接合体対立遺伝子に対する高レベルの感度を可能にす
るために要求される、第3の閾値を第3の事前選択されたヌクレオチド位置についての読
み取りに適用すること(例として、バリアント、例えば、(1)薬物に応答するか、また
はそれを代謝する患者の能力に関連し得る薬理ゲノムSNP、(2)患者を一意に特定す
る(フィンガープリントする)ために使用され得るゲノムSNP、あるいは(3)ゲノム
DNAおよびLOHのコピー数獲得/喪失を評価するために使用され得るゲノムSNP/
遺伝子座が挙げられる)、
(iv)第4の閾値を第4の事前選択されたヌクレオチド位置、例えば、再編成、例え
ば、転座またはインデルにおける、例えば、構造ブレークポイントについての読み取りに
適用すること(実施形態において、対象範囲は、(i)、(ii)、もしくは(iii)
のうちの1つの対象範囲未満である。例として、実施形態において、高い検出信頼性を確
保するために5~50倍の配列対スパン深度を必要とするイントロンブレークポイントが
挙げられる。例となる適用は、転座/インデルの傾向のある癌遺伝子である)、
(v)例えば、わずかな対象範囲がコピー数の変化を検出する能力を改善し得る、第5
の閾値を第5の事前選択されたヌクレオチド位置についての読み取りに適用すること(実
施形態において、対象範囲は、(i)、(ii)(iii)、もしくは(iv)のうちの
1つの対象範囲未満である。例として、例えば、高い検出信頼性を確保するために0.1
~10倍の対象範囲を必要とするいくつかの末端エクソンの1コピー欠失がある。例とな
る適用は、増幅/欠失の傾向のある癌遺伝子に対する)。
【0751】
ある実施形態において、
第1の閾値は、第2の閾値よりも大きく、
第2の閾値は、第3の閾値よりも大きく、
第3の閾値は、第4の閾値よりも大きく、
第4の閾値は、第5の閾値よりも大きい。
【0752】
ある実施形態において、X個の閾値、例えば、一意または非一意の閾値は、以下の特性
:
a)変異予想、
b)変異確率値、
c)ベイズ先行、
d)変異頻度、
e)事前選択されたヌクレオチド位置に関連したバリアント型、例えば、腫瘍表現型、
例えば、点変異または再編成、例えば、欠失、挿入、または転座に関連したバリアント、
f)コピー数、
g)サブゲノム間隔の腫瘍型、あるいは
h)サブゲノム間隔、
のうちの1、2、3、4個以上、もしくはすべての関数であるか、あるいはそれらに基づ
いて選択され、Xは、少なくとも1、2、3、5、10、20、40、50、60、70
、80、90、もしくは100である。
【0753】
ある実施形態において、X個の閾値、例えば、一意または非一意の閾値は、aおよびe
、aおよびg、eおよびgを含むか、またはそれらである要因の関数であるか、あるいは
それらに基づいて選択され、Xは、少なくとも1、2、3、5、10、20、40、50
、60、70、80、90、もしくは100である。
【0754】
ある実施形態において、特性a~fのうちの1つ以上もしくはすべては、事前選択され
たヌクレオチド位置、事前選択された腫瘍型、または事前選択された遺伝子のうちの1つ
以上もしくはすべての関数である。
【0755】
ある実施形態において、X個の閾値、例えば、一意または非一意の閾値は、バックグラ
ウンドゲノム変異頻度の関数であるか、またはそれに基づいて選択され、Xは、少なくと
も1、2、3、5、10、20、40、50、60、70、80、90、もしくは100
である。
【0756】
ある実施形態において、X個の閾値、例えば、一意または非一意の閾値は、以下の患者
特性:
年齢、性別、事前環境暴露、例えば、変異原もしくは発癌物質への事前環境暴露、薬物
もしくは治療への事前暴露、例えば、抗腫瘍剤での事前治療、患者が現在喫煙しているか
、または過去に喫煙していたか、腫瘍型、あるいはサブゲノム間隔における生殖細胞系変
化のうちの1、2、3、4個以上、もしくはすべての関数であるか、またはそれらに基づ
いて選択され、
Xは、少なくとも1、2、3、5、10、20、40、50、60、70、80、90、
もしくは100である。
【0757】
ある実施形態において、X個の閾値、例えば、一意または非一意の閾値は、以下の試料
特性:
腫瘍型、部位特異的腫瘍倍数性(例えば、SNP分析に基づいて)、腫瘍接合性、試料純
度、腫瘍試料中の細胞充実度(例えば、試料中の腫瘍細胞の割合)、対象の腫瘍と対照S
NP遺伝子型が適合するか、あるいは予測または観察されるDNA損傷のレベルのうちの
1、2、3、4個以上、もしくはすべての関数であるか、またはそれに基づいて選択され
、
Xは、少なくとも1、2、3、5、10、20、40、50、60、70、80、90、
もしくは100である。
【0758】
ある実施形態において、方法は、一意の閾値を複数のサブゲノム間隔に適用することを
含む。
【0759】
ある実施形態において、方法は、一意の閾値を第1のサブゲノム間隔の事前選択された
組の位置、例えば、遺伝子に適用することを含む。例えば、ある実施形態において、
該事前選択された組は、
第1の遺伝子におけるヌクレオチド位置のすべて、またはその事前選択された部分、
第1の遺伝子のイントロンのヌクレオチド位置のすべて、またはその事前選択された部
分、
第1の遺伝子のエクソンのヌクレオチド位置のすべて、またはその事前選択された部分
、
第1の遺伝子におけるヌクレオチド位置、例えば、バリアントが腫瘍表現型に関連する
ヌクレオチド位置を含む、事前選択された範囲内のヌクレオチド位置のすべてを含むか、
あるいはそれらに限定され、例えば、バリアントは、点変異または再編成、例えば、欠失
、挿入、または転座である。
【0760】
ある実施形態において、方法は、一意の閾値を、第1のサブゲノム間隔、例えば、遺伝
子の事前選択された組の位置に適用すること、および一意の閾値を、それに続く、例えば
、第2、第3、第4、第5、もしくは第6のサブゲノム間隔、例えば、遺伝子の事前選択
された組の位置にさらに適用することを含む。ある実施形態において、該それに続く遺伝
子の事前選択された組は、
該それに続く遺伝子におけるヌクレオチド位置のすべて、またはその事前選択された部
分、
該それに続く遺伝子のイントロンのヌクレオチド位置のすべて、またはその事前選択さ
れた部分、
該それに続く遺伝子のエクソンのヌクレオチド位置のすべて、またはその事前選択され
た部分、
該それに続く遺伝子におけるヌクレオチド位置を含む、事前選択された範囲内のヌクレ
オチド位置のすべてを含むか、あるいはそれに限定され、そのバリアントは、腫瘍表現型
に関連し、例えば、バリアントは、点変異または再編成、例えば、欠失、挿入、または転
座である。
【0761】
実施形態において、2個以上の閾値が、遺伝子、または他のサブゲノム間隔に適用され
る。したがって、ある実施形態において、方法は、
例えば、バックグラウンド変異率の関数である第1の一意の閾値を、サブゲノム間隔、
例えば、遺伝子の第1の事前選択された位置または第1の事前選択された組の位置に適用
すること、および
例えば、本明細書に開示の要因、例えば、腫瘍表現型に関連したバリアントの予想頻度
に応答して選択される、それに続く、例えば、第2、第3、第4、第5、もしくは第6の
一意の閾値を、該サブゲノム間隔のそれに続く、例えば、第2、第3、第4、第5、もし
くは第6の事前選択された位置または事前選択された組の位置に適用することを含む。
【0762】
そのような実施形態において、第1の事前選択された組は、
そのバリアントが腫瘍表現型に関連するヌクレオチド位置以外のヌクレオチド位置、また
は
遺伝子におけるヌクレオチド位置の大部分を含み得るか、あるいはそれに限定され得る
。
【0763】
ある実施形態において、第2の事前選択された組は、
そのバリアントが腫瘍表現型に関連するヌクレオチド位置、
該遺伝子のイントロンの第1の事前選択された部分のヌクレオチド位置、
該遺伝子のエクソンの第1の事前選択された部分のヌクレオチド位置、
そのバリアントが腫瘍表現型に関連するヌクレオチド位置を含む、事前選択された範囲
内のヌクレオチド位置のすべて(例えば、バリアントは、点変異または再編成、例えば、
欠失、挿入、または転座である)、
遺伝子におけるヌクレオチド位置の小さな一部、あるいは
遺伝子の1、2、3、3、5、10、もしくは20個を超えないヌクレオチド位置を含
むか、またはそれに限定される。
【0764】
そのような実施形態において、第1の事前選択された組は、
そのバリアントが腫瘍表現型に関連する該ヌクレオチド位置以外のヌクレオチド位置、
該遺伝子のイントロンの第1の事前選択された部分の該ヌクレオチド位置以外のヌクレ
オチド位置、
該遺伝子のエクソンの第1の事前選択された部分の該ヌクレオチド位置以外のヌクレオ
チド位置、
そのバリアントが腫瘍表現型に関連するヌクレオチド位置を含む、事前選択された範囲
内の該ヌクレオチド位置以外のヌクレオチド位置(例えば、バリアントは、点変異または
再編成、例えば、欠失、挿入、または転座である)を含み得るか、あるいはそれに限定さ
れ得る。
【0765】
そのような実施形態において、第1の一意の閾値は、該その後の一意の閾値よりも低く
あり得る。
臨床癌検体の次世代の配列決定からの体細胞のゲノム変化の高感度検出のためのベイズ手
法
【0766】
本明細書の他の箇所で論じられるように、本発明は、試料、例えば、腫瘍試料を分析す
る方法を特色とする。本明細書に記載の方法は、
(aaa)X個のサブゲノム間隔のそれぞれについての1つまたは複数の読み取りを該
試料由来の核酸から取得することと、
(bbb)該X個のサブゲノム間隔のそれぞれの事前選択されたヌクレオチド位置のた
めに、以下を取得することと、
(i)腫瘍型Xの該事前選択されたヌクレオチド位置で事前選択されたバリアント、
例えば、変異を示す読み取りを観察する先行(例えば、文献)予想であるか、またはそれ
を表す第1の値、および
(ii)バリアントがある頻度(例えば、1%、5%、10%等)で試料に存在する
場合、および/またはバリアントが不在である(例えば、塩基呼び出しエラーのみにより
読み取りで観察される)場合、該事前選択されたヌクレオチド位置で該事前選択されたバ
リアントを示す読み取りを観察する確率を表す第2の組の値、
(ccc)該値に応答して、第1の値を用いて第2の組の値の間の比較を検討する(例
えば、変異の存在の事後確率を算出する)ことによって、該事前選択されたヌクレオチド
位置のそれぞれに対する該読み取りからのヌクレオチド値を割り当てる(例えば、変異を
呼び出す)こととを含んでもよく、それによって、該試料を分析する。
【0767】
この方法は、例えば、その変数間の比較の検討において、NGSに基づく手法のための
分析成分を、体細胞変異頻度および多様性の知識を組み込んで検出を最適化する腫瘍ゲノ
ム評価に提供する。癌ゲノムにおける変異の頻度は比較的低いが(例えば、1Mbゲノム
幅当たり約1~10の割合の塩基置換が予想される)、特定のドライバ変異は、ある特定
の腫瘍型において頻繁に生じることが知られている。例えば、KRAS変異c.35G>
A(p.G12D)は、結腸癌の約10%において予想され得る。効率的な変異-検出手
法は、この先行情報を利用して、感度と特異性との間のトレードオフを最適化し、かつ「
困難な」試料における検出力を最大化することができる。例えば、方法は、以下の関係を
用いた分析を含み得る:
P(変異存在|読み取りデータ「R」)=P(変異の頻度「F」>0|R)=1-P(F
=0|R)
【化1】
【化2】
は、等式Aに対する離散近似であり、これを、離散化近似の代わりにこの関係において代
替的に評価することができる。
等式A:
【化3】
P(F=0)=癌型における変異の1-先行予想。「p」上記の(i)の値は、pに対
応する。
【化4】
(例えば、n=100)は、先行過剰頻度の均一な分布を仮定し、したがって、ii)で
言及される変異頻度の先行予想を特定する。この項は、特定の試料で測定された純度もし
くは異数性等の予想される変異頻度、または特定の腫瘍型、摘出方法等の予想される変異
頻度に関する任意の先行知識に対して調整するために、均一な分布から調節へと変化させ
ることができる。
【化5】
は、例えば、対立遺伝子計数観察、較正品質スコア、および置換変異の多項分布を用いて
、変異型に従って評価される。
【0768】
本明細書で提供される検出手法は、以下のステップを含むことができる:配列決定およ
びアライメント、品質スコア再較正、ベイズ変異呼び出し、ならびに変異呼び出しフィル
タリング。例えば、配列決定およびアライメントは、182個の癌関連遺伝子のエクソン
のハイブリッド選択、Illumina HiSeqプラットフォーム上での深部配列決
定、Burrows-Wheelerアライナ(BWA)でのアライメント(Li H.
and Durbin R.(2009)Bioinformatics,25:175
4-60)、ならびにゲノム分析ツールキット(GATK)(McKenna A.H.
et al.,Genome Res.2010 20(9):1297-303)を用
いたアライメント最適化を含み得る。品質スコア再較正は、報告された品質スコアを経験
的エラー率にマッピングする。ベイズ変異呼び出しは、変異が任意の頻度で存在する可能
性を可能にする(二倍体に限定されない)。COSMICからの変異の組織特異的先行確
率を組み込み、感度を高める。変異呼び出しフィルタリングは、鎖バイアス、低マッピン
グ品質、および読み取り位置バイアス等の指標を用いてアーチファクトをフィルタリング
し、最も細菌様のバリエーション(dbSNP)を除去する。
【0769】
関連性のあるP(読み取りデータR|変異頻度=f)を導き出すことによって、この手
法を追加の変異型(インデル/転座/CNV)まで拡張することができる。
重複読み取り
【0770】
配列決定プロセス中、エラーは、例えば、配列決定化学によって、または画像分析ソフ
トウェアによってプロセスの異なる段階で読み取りに導入され得る。重複読み取りは、典
型的には、別個の読み取りとして配列決定される。変異呼び出しアルゴリズムは、配列決
定エラーと実際の配列バリエーションを見分け、後者を正しく呼び出す必要がある。本明
細書に記載の方法は、配列決定エラーを減少させるように重複読み取りを分析し、それに
よって、変異呼び出しアルゴリズムの感度を改善することができる。
【0771】
これは、典型的には、同一のゲノム位置を対象範囲とする独立した読み取りを比較する
ことによって行われる。読み取り重複は、ライブラリ調製(例えば、PCR増幅)の様々
なステップ中に生成され、別個の読み取りとして配列決定される。これらが独立した読み
取りではない(すなわち、それらが同一の最初のDNA分子に由来する)ため、典型的に
は、任意の数の重複のうちの1つのみが変異検出プロセスに使用され、残りは破棄される
。
【0772】
配列決定エラーを減少させ、それによって、変異呼び出しアルゴリズムの感度を改善す
るための重複読み取りの使用が本明細書に記載される。重複読み取りを、同一の開始およ
び終了位置の所有によって特定することができる。本質的には重複読み取りが同一の最初
のDNA分子の複製読み取りであるため、重複の間の任意の相違は、配列決定エラーであ
るはずであり、したがって、無視してもよい。例えば、高度に重複したデータが利用可能
である場合、3個以上の重複のコンセンサスを用いることができる。あるいは、塩基の品
質スコアを、2個以上の読み取り重複の間の同意を反映するために再定義し、任意の下流
プロセスによって利用してもよい。例えば、変異呼び出しアルゴリズムは、すべての重複
によって支援されない配列相違に置かれる重点を軽くしてもよい。
【0773】
重複にコンセンサス配列を生成することによって、推奨される方法をいくつかの配列決
定データ上で試験した。コンセンサス読み取り配列のエラー率は、最初の読み取りのエラ
ー率よりも著しく低いことが示された。
【0774】
この方法は、例えば、1)シーケンサのいくつかの失敗モードがより高いエラー率を有
する使用可能な配列データをもたらし、これがこのデータにおける変異呼び出す能力に悪
影響を及ぼすときに用いることができる。2)試料における特にまれな癌細胞由来のDN
Aを配列決定するときに(例えば、循環腫瘍細胞は、試料中の細胞の1%未満であり得る
)、重複を用いてエラーを減少させることは、このシナリオにおいて特に効果的であるべ
きであり、変異呼び出しパイプラインを機械故障に対してよりロバストにし、塩基エラー
率の任意の改善は、これらの腫瘍細胞における変異を正しく同定する能力を著しく増加さ
せ得る。
【0775】
例となる一実施形態において、高い重複率(69%)を有するデータセットが重複につ
いて走査される。重複の1つの読み取りを任意に選択する一般に使用されるソフトウェア
除去ツール(Picard MarkDuplicates)を用いて重複が除去される
とき、結果として生じるエラー率は、0.40%であった。並行して、少なくとも3個の
重複を有するすべての読み取りは別個に処理され、それぞれの組の重複のコンセンサス配
列は、重複の最も一般的な配列を選択することによって得られた。コンセンサス配列のエ
ラー率は0.20%であり、それらの配列を比較することによってより低い重複読み取り
エラー率を達成することができることを実証した。
コンセンサス読み取りを導き出す例:
読み取り1: CCAAAACTAAACTGCTCTTTAAATATCTTAGAC
ACT(配列番号2)
読み取り2: CCAAAACTAAACTGCTCTTTAAATATCTTAGAC
ACT(配列番号3)
読み取り3: CCAACACTAAACTGCTCTTTAAATATCTTAGAC
ACT(配列番号4)
コンセンサス: CCAAAACTAAACTGCTCTTTAAATATCTTAGA
CACT(配列番号5)
【0776】
したがって、別の態様では、本発明は、例えば、
(a)任意で、(例えば、該サブゲノム間隔の最初のコピーの増幅によって形成された
)サブゲノム間隔の複数の重複を取得することと、
(b)該複数の重複のそれぞれについての読み取りを取得して、複数の重複読み取りを
提供することと、
(c)該複数の重複読み取りのそれぞれにおける第1のヌクレオチド位置でのヌクレオ
チド値を比較することと(典型的には、1個の重複読み取りにおけるヌクレオチド位置は
、第2の読み取りにおける対応するヌクレオチド位置と比較される)、
(d)任意で、該複数の重複読み取りのそれぞれにおける第2のヌクレオチド位置での
ヌクレオチド値を比較することと、
(この場合において、ヌクレオチド位置のうちの一方では、該複数の読み取りのそれぞ
れは、同一のヌクレオチド値を有さず、任意で、該ヌクレオチド位置の他方では、該複数
の読み取りのそれぞれは、同一のヌクレオチド値を有する)
(e)第1の分類子、例えば、品質スコアまたは重複調節されたヌクレオチド値を、該
複数の読み取りのすべてにおいて同一のヌクレオチド値を有しない位置でのヌクレオチド
値に割り当てることと、
(f)任意で、第2の分類子、例えば、品質スコアまたは重複調節されたヌクレオチド
値を、複数の読み取りのそれぞれにおいて同一のヌクレオチド値を有する位置でのヌクレ
オチド値に割り当てることとを含む、腫瘍試料由来の核酸の配列を分析する方法を含み、
該第1の分類子は、それが割り当てられるヌクレオチド値が正しいという第1のレベル
の品質または信頼度を示し、該第2の分類子は、それが割り当てられるヌクレオチド値が
正しいという第2のレベルの品質または信頼度を示し、該第1のレベルは、事前選択され
た基準以下である。
【0777】
一実施形態において、該第1のレベルは、該複数の読み取りがそれぞれ同一のヌクレオ
チド値を有した場合に割り当てられるヌクレオチド値よりも低い。
【0778】
別の実施形態では、該第1のレベルは、該第2のレベルよりも低い。
【0779】
別の実施形態では、分類は、複数のそのヌクレオチド位置とは異なるヌクレオチド値の
割合の関数である。
【0780】
別の実施形態では、分類は、複数の重複読み取りの数の関数である。
【0781】
さらに別の実施形態では、ヌクレオチド位置での変異呼び出し方法は、そのヌクレオチ
ド位置でのそのヌクレオチド値の分類の関数である。
【0782】
別の実施形態では、重複読み取りは、同定も除去もされない。重複読み取りの非除去は
、重複読み取りの画分が対照試料と試験試料との間で著しく異なるとき、腫瘍DNAにお
けるコピー数異常の同定および対立遺伝子バランスの評価に特に有用であり得る。例えば
、高い重複率を有する試料における高い対象範囲深度を有するゲノム領域は、低い重複率
を有する試料における比較可能な深度を有する同一の領域よりも多くの読み取りを喪失し
得るが、低対象範囲の領域は、この作用を起こす傾向が低いと思われる。したがって、重
複読み取りの画分が対照試料と試験試料との間で著しく異なる場合、その2つの間の比較
はよりノイズを有する場合があり、したがって、コピー数変化の呼び出しの感度および/
または特異性を低下させる。
【0783】
DNA試験試料、例えば、腫瘍から抽出されるDNA試料の配列分析は、試験試料と対
照試料、例えば、非癌性組織由来のDNA試料との比較を必要とする。
【0784】
ゲノムDNA試料の配列決定の際に重複読み取りが生成される。読み取り重複は、ライ
ブラリ調製(例えば、PCR増幅)の様々なステップ中に生成され、別個の読み取りとし
て配列決定される。これらが独立した読み取りではない(すなわち、それらが同一の最初
のDNA分子に由来する)ため、典型的には、任意の数の重複のうちの1つのみが変異検
出プロセスに使用されるが、残りは破棄される。典型的には、対照試料および試験試料の
両方からの重複読み取りは、試験DNA配列と対照DNA配列との間の比較分析を行う前
に除去される。
【0785】
一実施形態において、本出願者は、重複読み取りの数が試験試料と対照試料との間で著
しく異なる状況下において、(対照試料および試験試料のいずれか、またはそれらの両方
からの)重複読み取りの除去は、それが異なる試料の対象範囲深度パターンを別様に変形
させるため、コピー数の変化等の変化を呼び出す能力に悪影響を与えることを発見した。
したがって、重複読み取りの画分が試験試料と対照試料との間で著しく異なる(例えば、
20%超、30%超、40%超、50%超、60%超、またはそれ以上異なる)という状
況下において、試験試料における変異を正しく同定する能力を最大化するために、重複読
み取りが比較分析前に除去されないことが好ましい。例えば、対照試料および試験試料に
おける重複読み取りの数が、それぞれ、20%および80%(または70%または60%
または50%)である状況下において、重複読み取りは、好ましくは、比較分析前に除去
されない。
他の実施形態
【0786】
本明細書に記載の方法の実施形態において、本方法におけるステップまたはパラメータ
が、本方法における下流ステップまたはパラメータを修正するために使用される。
【0787】
ある実施形態において、腫瘍試料の特性が、該試料からの核酸の単離、ライブラリ構築
、ベイト設計もしくは選択、ハイブリダイゼーション条件、配列決定、読み取りマッピン
グ、変異呼び出し方法の選択、変異呼び出し、または変異アノテーションのうちの1つ以
上もしくはすべてにおける下流ステップまたはパラメータを修正するために使用される。
【0788】
ある実施形態において、単離された腫瘍または対照核酸の特性が、該試料からの核酸の
単離、ライブラリ構築、ベイト設計もしくは選択、ハイブリダイゼーション条件、配列決
定、読み取りマッピング、変異呼び出し方法の選択、変異呼び出し、または変異アノテー
ションのうちの1つ以上もしくはすべて下流ステップまたはパラメータを修正するために
使用される。
【0789】
ある実施形態において、ライブラリの特性が、該試料からの核酸の再単離、その後のラ
イブラリ構築、ベイト設計もしくは選択、ハイブリダイゼーション条件、配列決定、読み
取りマッピング、変異呼び出し方法の選択、変異呼び出し、または変異アノテーションの
うちの1つ以上もしくはすべてにおける下流ステップまたはパラメータを修正するために
使用される。
【0790】
ある実施形態において、ライブラリ捕獲物の特性が、該試料からの核酸の再単離、その
後のライブラリ構築、ベイト設計もしくは選択、ハイブリダイゼーション条件、配列決定
、読み取りマッピング、変異呼び出し方法の選択、変異呼び出し、または変異アノテーシ
ョンのうちの1つ以上もしくはすべてにおける下流ステップまたはパラメータを修正する
ために使用される。
【0791】
ある実施形態において、配列決定方法の特性が、該試料からの核酸の再単離、その後の
ライブラリ構築、ベイト設計もしくは選択、ハイブリダイゼーション条件のその後の決定
、その後の配列決定、読み取りマッピング、変異呼び出し方法の選択、変異呼び出し、ま
たは変異アノテーションのうちの1つ以上もしくはすべてにおける下流ステップまたはパ
ラメータを修正するために使用される。
【0792】
ある実施形態において、マッピングされた読み取りの収集物の特性が、該試料からの核
酸の再単離、その後のライブラリ構築、ベイト設計もしくは選択、ハイブリダイゼーショ
ン条件のその後の決定、その後の配列決定、その後の読み取りマッピング、変異呼び出し
方法の選択、変異呼び出し、または変異アノテーションのうちの1つ以上もしくはすべて
における下流ステップまたはパラメータを修正するために使用される。
【0793】
ある実施形態において、方法は、腫瘍試料特性の値を取得すること、例えば、該試料中
の腫瘍細胞の割合の値、該腫瘍試料の細胞充実度の値、または腫瘍試料の画像から値を取
得することを含む。
【0794】
実施形態において、方法は、該取得された腫瘍試料特性の値に応答して、腫瘍試料から
の核酸の単離、ライブラリ構築、ベイト設計もしくは選択、ベイト/ライブラリメンバー
ハイブリダイゼーション、配列決定、または変異呼び出しのパラメータを選択することを
含む。
【0795】
ある実施形態において、方法は、該腫瘍試料に存在する腫瘍組織の量の値を取得するこ
と、該取得された値を参照基準と比較すること、および該参照基準が満たされる場合、該
腫瘍試料を受容すること、例えば、該腫瘍試料が30、40、または50%を超える腫瘍
細胞を含有する場合、該腫瘍試料を受容することをさらに含む。
【0796】
ある実施形態において、方法は、例えば、該腫瘍試料、参照基準を満たすことができな
い腫瘍試料由来の腫瘍組織をマクロ解剖することによって、腫瘍細胞のために濃縮された
サブ試料を取得することをさらに含む。
【0797】
ある実施形態において、方法は、一次対照、例えば、血液試料が利用可能であるかを決
定すること、および利用可能である場合、対照核酸(例えば、DNA)を該一次対照から
単離することをさらに含む。
【0798】
ある実施形態において、方法は、NATが(例えば、いずれの一次対照試料も利用可能
ではない)該腫瘍試料に存在するかを決定することをさらに含む。
【0799】
ある実施形態において、方法は、例えば、一次対照を伴わない腫瘍試料中の該NAT由
来の非腫瘍組織をマクロ解剖することによって、非腫瘍細胞のために濃縮されたサブ試料
を取得することをさらに含む。
【0800】
ある実施形態において、方法は、一次対照もNATも利用可能ではないことを決定する
こと、および適合した対照なしで分析用の該腫瘍試料を作製することをさらに含む。
【0801】
ある実施形態において、方法は、核酸を該腫瘍試料から単離して、単離された腫瘍核酸
試料を提供することをさらに含む。
【0802】
ある実施形態において、方法は、核酸を対照から単離して、単離された対照核酸試料を
提供することをさらに含む。
【0803】
ある実施形態において、方法は、検出可能な核酸を有しない試料を拒否することをさら
に含む。
【0804】
ある実施形態において、方法は、該単離された核酸試料における核酸収率の値を取得す
ること、および取得された値を参照基準と比較すること、例えば、該取得された値が該参
照基準未満である場合、ライブラリ構築前に該単離された核酸試料を増幅することをさら
に含む。
【0805】
ある実施形態において、方法は、該単離された核酸試料中の核酸断片の大きさの値を取
得すること、および取得された値を参照基準、例えば、少なくとも300、600、また
は900bpの大きさ、例えば、平均の大きさと比較することをさらに含む。本明細書に
記載のパラメータを、この決定に応じて調節または選択することができる。
【0806】
ある実施形態において、方法は、該核酸断片の大きさが参照値以下であるライブラリを
取得することをさらに含み、該ライブラリは、DNA単離とライブラリ作製の間に断片化
ステップを伴うことなく作製される。
【0807】
ある実施形態において、方法は、核酸断片を取得することをさらに含み、該核酸断片の
大きさが参照値以上である場合、断片化され、その後、ライブラリにされる。
【0808】
ある実施形態において、方法は、例えば、同定可能なはっきりと異なる核酸配列(バー
コード)を複数のメンバーのそれぞれに付加することによって、複数のライブラリメンバ
ーのそれぞれを標識化することをさらに含む。
【0809】
ある実施形態において、方法は、プライマーを複数のライブラリメンバーのそれぞれに
付着させることをさらに含む。
【0810】
ある実施形態において、方法は、複数のベイトを提供すること、および
複数のベイトを選択することをさらに含み、該選択は、1)患者の特性、例えば、年齢、
腫瘍の病期、前治療、または抵抗力、2)腫瘍型、3)腫瘍試料の特性、4)対照試料の
特性、5)対照の存在または種類、6)単離された腫瘍(または対照)核酸試料の特性、
7)ライブラリの特性、8)腫瘍試料の腫瘍型に関連することが知られている変異、9)
腫瘍試料の腫瘍型に関連することが知られていない変異、10)事前選択された配列を配
列決定する(またはハイブリダイズもしくは回収する)か、または事前選択された変異、
例えば、高GC領域の配列決定もしくは再編成に関連した困難性を同定する能力、あるい
は11)配列決定される遺伝子に応答する。
【0811】
ある実施形態において、方法は、例えば、該腫瘍試料中の少数の腫瘍細胞の決定に応じ
て、ベイトまたは複数のベイトを選択すること、第2の遺伝子のメンバーと比較して第1
の遺伝子からのメンバーに比較的高効率の捕捉を与えることをさらに含み、例えば、第1
の遺伝子における変異は、腫瘍試料の腫瘍型の腫瘍表現型に関連する。
【0812】
ある実施形態において、方法は、ライブラリ捕獲物の特性、例えば、核酸濃度または表
示の値を取得すること、および取得された値を核酸濃度または表示の参照基準と比較する
ことをさらに含む。
【0813】
ある実施形態において、方法は、再処理の参照基準を満たさないライブラリ特性の値を
有するライブラリを選択することをさらに含む。
【0814】
ある実施形態において、方法は、ライブラリ定量化の参照基準を満たすライブラリ特性
の値を有するライブラリを選択することをさらに含む。
【0815】
ある実施形態において、方法は、対象の腫瘍型、遺伝子、および遺伝子変化(TGA)
の関連性を提供することをさらに含む。
【0816】
ある実施形態において、方法は、複数の要素を有する事前選択されたデータベースを提
供することをさらに含み、それぞれの要素は、TGAを含む。
【0817】
ある実施形態において、方法は、対象のTGAを特徴付けることをさらに含み、
該TGAが事前選択されたデータベース、例えば、有効なTGAのデータベースに存在
するかを決定すること、
所定のデータベースからのTGAの情報を該対象の該TGAと関連付ける(アノテート
する)こと、および
任意で、該対象の第2またはその後のTGAが該事前選択されたデータベースに存在す
るかを決定し、かつ存在する場合、所定のデータベースからの第2またはその後のTGA
の情報を該患者に存在する該第2のTGAと関連付けることを含む。
【0818】
ある実施形態において、方法は、報告書を作成するために、対象のTGAの存在もしく
は不在、および任意で関連したアノテーションをメモリアライズすることをさらに含む。
【0819】
ある実施形態において、方法は、該報告書を受領関係者に送信することをさらに含む。
【0820】
ある実施形態において、方法は、対象のTGAを特徴付けることをさらに含み、
該TGAが事前選択されたデータベース、例えば、有効なTGAのデータベースに存在
するかを決定すること、
該事前選択されたデータベースに存在しないTGAが既知の臨床的に関連性のあるGま
たはAを有するかを決定し、有する場合、該事前選択されたデータベースにおける該TG
Aの入力を提供することを含む。
【0821】
ある実施形態において、方法は、報告書を作成するために、対象由来の腫瘍試料のDN
Aに見られる変異の存在もしくは不在をメモリアライズすることをさらに含む。
【0822】
ある実施形態において、方法は、報告書を作成するために、対象のTGAの存在もしく
は不在、および任意で関連したアノテーションをメモリアライズすることをさらに含む。
【0823】
ある実施形態において、方法は、該報告書を受領関係者に送信することをさらに含む。
【0824】
腫瘍試料の多重遺伝子分析方法の実施形態のフローチャート描写が
図1に提供される。
例証
【0825】
本発明は、以下の実施例によってさらに説明され、それらは、限定的であると解釈され
るべきではない。本出願を通して引用されるすべての参考文献、図、配列表、特許、およ
び公開された特許出願の内容は、参照により本明細書に組み込まれる。
実施例1:腫瘍試料からの核酸単離
【0826】
パラフィンブロックから切り取られた3×20μmの切片を400μLの緩衝液FTL
とボルテックスによって混合し、1.5mLの遠心分離管内で90℃で15分間インキュ
ベートした。88~92℃の範囲がインキュベーションのために許容できるものであった
。その後、試料を20μLのプロテイナーゼKとともに55℃で6時間、および10μL
のRNase(1mg/mL)とともに室温で5分間インキュベートした。次に、460
μLの緩衝液BLおよび500μLの無水エタノールを試料に添加した。結果として得ら
れた試料溶液をさらに使用するまで室温で保管した。
【0827】
DNA結合カラムを調製するために、100μLの平衡緩衝液をMicroElute
カラムに添加し、そのカラムを10,000xgで30秒間遠心分離した。上述の700
μLの試料溶液をMicroEluteカラムに移し、そのカラムを10,000xgで
1分間遠心分離した。流体がMicroEluteカラムを完全に通過しなかった場合、
遠心分離ステップを繰り返した。残りの試料溶液をMicroEluteカラムに上述と
同一の方法で適用した。その後、MicroEluteカラムを500μLの緩衝液HB
で処理し、10,000xgで1分間遠心分離した。次に、エタノールで希釈した700
μLのDNA洗浄緩衝液をMicroEluteカラム内に添加し、そのカラムを10,
000xgで1分間遠心分離した。MicroEluteカラムをエタノールで希釈した
700μLのDNA洗浄緩衝液を用いて再度洗浄し、10,000xgで1分間遠心分離
し、13,000xg超で3分間遠心分離して、カラムを乾燥させた。MicroElu
teカラムを、蓋が取り外された状態の標準の1.5mLの遠心分離管内に設置した。7
0℃に予熱した50~75μLの溶出緩衝液をカラム内に添加し、室温で3分間インキュ
ベートした。そのカラムを回収管内で13,000xg超で1分間遠心分離した。70℃
に予熱した別の50~75μLの溶出緩衝液をMicroEluteカラム内に添加し、
室温で3分間インキュベートした。そのカラムを回収管内で13,000xg超で1分間
再度遠心分離した。全溶液を新鮮な1.5mLの遠心分離管に移し、-20℃で保管した
。
【0828】
FTL緩衝液、プロテイナーゼK、BL緩衝液、平衡緩衝液、MicroEluteカ
ラム、緩衝液HB、DNA洗浄緩衝液、および溶出緩衝液は、E.Z.N.A.(商標)
FFPE DNAキット(OMEGA bio-tek,Norcross,GA、カタ
ログ番号D3399-00、D3399-01、およびD3399-02)内に提供され
る。
【0829】
核酸(例えば、DNA)をホルムアルデヒドまたはパラホルムアルデヒド固定パラフィ
ン包埋(FFPE)組織から単離するさらなる方法が、例えば、Cronin M.et
al.,(2004)Am J Pathol.164(1):35-42、Masu
da N.et al.,(1999)Nucleic Acids Res.27(2
2):4436-4443、Specht K.et al.,(2001)Am J
Pathol.158(2):419-429、Ambion RecoverAll(
商標)全核酸単離プロトコル(Ambion、カタログ番号AM1975、2008年9
月)、Maxwell(登録商標)16 FFPEPlus LEV DNA精製キット
技術マニュアル(Promega、文献番号TM349、2011年2月)、およびQI
Aamp(登録商標)DNA FFPE組織ハンドブック(Qiagen、カタログ番号
37625、2007年10月)に開示されている。RecoverAll(商標)全核
酸単離キットは、パラフィン包埋試料を可溶化するためにキシレンを高温で、かつ核酸を
捕捉するためにガラス繊維フィルタを使用する。Maxwell(登録商標)16 FF
PEPlus LEV DNA精製キットを、FFPE組織の1~10μm切片のゲノム
DNA精製のために、Maxwell(登録商標)16機器とともに使用する。DNAを
シリカクラッド常磁性粒子(PMP)を用いて精製し、低溶出体積中に溶出される。QI
Aamp(登録商標)DNA FFPE組織キットは、ゲノムおよびミトコンドリアDN
Aの精製のために、QIAamp(登録商標)DNAマイクロ技術を使用する。
実施例2A:DNAの剪断
【0830】
循環冷却器を有するCovaris(商標)E210機器を4℃に設定した。その機器
の水槽に蒸留/脱イオン水を充填ラインのレベル「6」まで充填した。SonoLab(
商標)ソフトウェアを起動させ、指示されたときにシステムがホーミング配列を実行する
ことができた。機器の水槽内の水を少なくとも45分間脱気した後に、試料を剪断した。
【0831】
剪断用のゲノムDNA試料を調製するために、試料を最初にマイクロプレートリーダー
(Spectramax M2、分子デバイス)上のPicoGreen(登録商標)ア
ッセイ(Invitrogen)を用いて定量した。濃度に基づいて、低TE(10mM
のTris、0.2mMのEDTA、pH8.0)を有する120μLの所望の入力DN
A(2ng/μL)をこの実験に使用した。その100μLの個別の試料を管の蓋の隔壁
を通してCovaris MicroTUBE(Covaris、カタログ番号5200
45)内にピペットで緩徐に移した。その後、Covaris MicroTUBEをC
ovaris Eシリーズの管立てに設置した。200bp剪断のために、設定は以下の
通りであった:負荷サイクル10%、強度5、200サイクル/バースト、180秒間、
および周波数掃引モード。剪断後、小型遠心分離機内の適切なアダプターを用いてCov
aris MicroTUBEを短期間沈降させ、剪断した試料をきれいな1.5mLの
マイクロ遠心分離管に移した。それぞれの剪断したDNA試料をQIAGEN MinE
lute(登録商標)カラムを用いて精製した。簡潔に、5倍のQIAGEN PBI緩
衝液を1.5mLのマイクロ遠心分離管内の試料に添加した(例えば、500μLのPB
I緩衝液を100μLの試料に添加した)。それぞれの試料をボルテックスし、短期間沈
降させ、MinEluteスピンカラムに移した。MinEluteスピンカラムを13
,000rpmで1分間遠心分離し、流入物を廃棄した。750μLのQIAGEN P
E緩衝液をそのカラムに添加し、13,000rpmで1分間遠心分離し、流入物を廃棄
した。スピンカラムを再度13,000rpmで1分間遠心分離し、きれいな1.5mL
のマイクロ遠心分離管に移した。そのカラムを2~3分間風乾させた。第1の溶出におい
て、18μLのQIAGEN溶出緩衝液をそれぞれのカラムに添加し、2~3分間インキ
ュベートし、その後、13,000rpmで1分間遠心分離した。第2の溶出において、
15μLのQIAGEN溶出緩衝液を添加し、1分間インキュベートし、その後、13,
000rpmで1分間遠心分離した。溶出物を回収し、スピンカラムを廃棄した。
【0832】
典型的には、200ngはDNA剪断のために使用されるが、DNAの量は、20~2
00ngまたはそれ以上に及び得る。
実施例2B:DNA剪断の代替案
【0833】
本実施例は、実施例2AのDNA剪断の代替方法を説明する。
【0834】
二本鎖ゲノムDNAを最初に変性して一本鎖DNAとし、その後、プライマー、DNA
ポリメラーゼ(例えば、エキソ-DNAポリメラーゼ)、dNTP、および少量のddN
TPと混合した。プライマー配列は、ランダム六量体、または5’末端においてアダプタ
ー配列でタグ付けされたランダム六量体であり得る。タグ付けされたランダム六量体増幅
を用いて微量のDNAをクローニングおよび配列決定する方法は、例えば、Wong K
.K.et al.,Nucleic Acids Res.1996;24(19):
3778-83に記載されている。反応物をプライマー-鋳型アニーリングおよびDNA
合成を可能にする条件下でインキュベートする。DNA合成は、ddNTPが新たに合成
された第1の鎖に組み込まれるときに終了する。合成された第1の鎖DNAの長さを、d
NTPとddNTPの比率によって制御することができる。例えば、dNTPとddNT
Pのモル比は、少なくとも約1000:1、約5000:1、または約10000:1で
ある。第1の鎖の合成後、短い断片(短い長さおよびddNTPを有するプライマーおよ
び合成された第1の鎖DNA等)を、寸法選択によって(例えば、寸法選択スピンカラム
を用いて)除去することができる。結果として得られた第1の鎖DNAを、プライマー(
例えば、ランダム六量体またはアダプター配列でタグ付けされたランダム六量体)、DN
Aポリメラーゼ(例えば、エキソ+DNAポリメラーゼ)、およびdNTPと混合する。
エキソ+DNAポリメラーゼを用いて、3’末端ddNTPを第1の鎖DNAから除去す
るか、またはさらには第2のプライミング部位上に平滑末端を生成することができる。そ
の後、反応物をプライマー-鋳型アニーリングおよびDNA合成を可能にする条件下でイ
ンキュベートする。第2の鎖の合成後、結果として得られる二本鎖DNA断片を精製し、
ライブラリ構築で直接使用することができる。あるいは、二本鎖DNA断片を、アダプタ
ー配列を含有するプライマーを用いてPCR増幅することができる。これらのアダプター
配列が第1および第2の鎖合成のためにプライマーに含まれていた場合に、PCR増幅用
のプライマーは、全配列および/またはバーコード配列も含み得る。
実施例3:ライブラリ調製
末端修復反応
【0835】
末端修復試薬(NEB番号E6050L)を解凍し、末端修復マスターミックスを氷上
で調製した。1つの試料につき70μLのマスターミックスを調製するために、55μL
のヌクレアーゼを含まない水を10μLの10倍の末端修復反応緩衝液および5μLの末
端修復酵素ミックスと混合した。その後、70μLのマスターミックスを氷上の96ウェ
ルPCRプレート中の30μLのそれぞれ剪断されたDNA試料に添加した。反応物を熱
循環機内で20℃で30分間インキュベートした。それぞれの試料をQIAGEN Mi
nElute(登録商標)カラムを用いて精製した。簡潔に、5倍のQIAGEN PB
I緩衝液を、1.5mLのマイクロ遠心分離管中の試料に添加した(例えば、500μL
のPBI緩衝液を100μLの試料に添加した)。それぞれの試料をボルテックスし、短
期間沈降させ、MinEluteスピンカラムに移した。MinEluteスピンカラム
を13,000rpmで1分間遠心分離し、流入物を廃棄した。750μLのQIAGE
N PE緩衝液をそのカラムに添加し、13,000rpmで1分間遠心分離し、流入物
を廃棄した。スピンカラムを再度13,000rpmで1分間遠心分離し、きれいな1.
5mLのマイクロ遠心分離管に移した。カラムを2~3分間風乾させた。第1の溶出にお
いて、22μLのQIAGEN溶出緩衝液(10mMのTris、pH8.5)をそれぞ
れのカラムに添加し、2~3分間インキュベートし、その後、13,000rpmで1分
間遠心分離した。第2の溶出において、22μLのQIAGEN溶出緩衝液を添加し、1
分間インキュベートし、その後、13,000rpmで1分間遠心分離した。溶出物を回
収し、スピンカラムを廃棄した。
3’A-塩基添加
【0836】
A-塩基添加試薬(NEB番号E6053L)を氷上で解凍し、A-塩基添加マスター
ミックスを氷上で調製した。1つの試料につき10μLのマスターミックスを調製するた
めに、2μLのヌクレアーゼを含まない水を5μLの10倍のdAテーリング反応緩衝液
および3μLのKlenow断片(3’→5’のエキソ)と混合した。10μLのマスタ
ーミックスを氷上の96ウェルPCRプレート内の40μLのそれぞれ精製された末端修
復DNA試料に添加した。反応物を熱循環機内で37℃で30分間インキュベートした。
それぞれの試料をQIAGEN MinElute(登録商標)カラムを用いて精製した
。簡潔に、5倍のQIAGEN PBI緩衝液を1.5mLのマイクロ遠心分離管中の試
料に添加した(例えば、250μLのPBI緩衝液を50μLの試料に添加した)。それ
ぞれの試料をボルテックスし、短期間沈降させ、MinEluteスピンカラムに移した
。MinEluteスピンカラムを13,000rpmで1分間で遠心分離し、流入物を
廃棄した。750μLのQIAGEN PE緩衝液をそのカラムに添加し、13,000
rpmで1分間遠心分離し、流入物を廃棄した。スピンカラムを再度13,000rpm
で1分間遠心分離し、きれいな1.5mLのマイクロ遠心分離管に移した。カラムを2~
3分間風乾させた。第1の溶出において、13μLのQIAGEN溶出緩衝液(10mM
のTris、pH8.5)をそれぞれのカラムに添加し、2~3分間インキュベートし、
その後、13,000rpmで1分間遠心分離した。第2の溶出において、13μLのQ
IAGEN溶出緩衝液を添加し、1分間インキュベートし、その後、13,000rpm
で1分間遠心分離した。溶出物を回収し、スピンカラムを廃棄した。
マルチプレックスアダプターのライゲーション
【0837】
ライゲーション試薬(NEB番号E6056L)を解凍し、ライゲーションマスターミ
ックスを氷上で調製した。1つの試料につき36μLのマスターミックスを調製するため
に、12μLの5倍のQuickライゲーション反応緩衝液を3.3μLのIllumi
naマルチプレックスアダプター(15uM、Illumina、カタログ番号PE-4
00-1001に含まれる)に添加した(3.3μLのアダプター/1μgの出発入力D
NAを使用した)。例えば、500ngの入力DNAの1つの試料に対し、アダプターを
最初に水(2μLのアダプターおよび2μLのH2O)中に希釈し、その後、3.3μL
のこの希釈したアダプター混合物、15.7μLのヌクレアーゼを含まない水、および5
μLのQuick T4 DNAリガーゼをライゲーション反応物に添加した。1μgを
超える出発原料に対しては、3.3μLを超えるアダプターを使用した。したがって、よ
り少ない水を添加して、希釈したアダプター混合物の全体積およびヌクレアーゼを含まな
い水を19μLで維持した。
【0838】
36μLのマスターミックスおよびそれぞれ24μLのdAテーリングDNA試料を氷
上の96ウェルPCRプレートのウェルに添加した。反応物を熱循環機内で25℃で30
分間インキュベートした。それぞれの試料をQIAGEN MinElute(登録商標
)カラムを用いて精製した。簡潔に、5倍のQIAGEN PBI緩衝液を1.5mLの
マイクロ遠心分離管中の試料に添加した(例えば、300μLのPBI緩衝液を60μL
の試料に添加した)。それぞれの試料をボルテックスし、短期間沈降させ、MinElu
teスピンカラムに移した。MinEluteスピンカラムを13,000rpmで1分
間遠心分離し、流入物を廃棄した。750μLのQIAGEN PE緩衝液をそのカラム
に添加し、13,000rpmで1分間遠心分離し、流入物を廃棄した。スピンカラムを
再度13,000rpmで1分間遠心分離し、きれいな1.5mLのマイクロ遠心分離管
に移した。カラムを2~3分間風乾させた。第1の溶出において、20μLのQIAGE
N溶出緩衝液(10mMのTris、pH8.5)をそれぞれのカラムに添加し、2~3
分間インキュベートし、その後、13,000rpmで1分間遠心分離した。第2の溶出
において、20μLのQIAGEN溶出緩衝液を添加し、1分間インキュベートし、その
後、13,000rpmで1分間遠心分離した。溶出物を回収し、スピンカラムを廃棄し
た。
PCR濃縮
【0839】
PCR試薬を解凍し、PCRマスターミックスを氷上で調製した。1つの試料につき6
2μLのマスターミックスにおいて、50μLのHF緩衝液を有する2倍のPhusio
n高忠実度マスターミックス(Finnzyme、NEBカタログ番号F-531S)、
8μLのヌクレアーゼを含まない水、2μLのIlluminaプライマー1.0(25
μM)、および2μLのIlluminaプライマー2.0(0.5μM)を使用した。
その後、62μLのマスターミックスを、適切なバーコードを有する2μLのIllum
inaインデックスプライマー(25μM、Illuminaカタログ番号PE-400
-1001に含まれる)および36μLのライゲートされたDNA試料と96ウェルPC
Rプレート中で混合した。反応物を熱循環機内で以下のようにインキュベートした:
1サイクル 98℃ 30秒間
18サイクル 98℃ 10秒間
65℃ 30秒間
72℃ 30秒間
1サイクル 72℃ 5分間
4℃ 保持
【0840】
それぞれのPCR反応物を、1.8倍の体積のAMPureXPビーズ(Agenco
urt、Beckman Coulter Genomicsカタログ番号A6388)
でサイズ選択した。簡潔に、1.8倍のAMPureXPビーズを1.5mLのマイクロ
遠心分離管中の試料に添加し(例えば、180μLのビーズを100μLの試料に添加し
)、ボルテックスし、転倒回転混合しながら5分間インキュベートした。溶液が透明にな
るまで(2分間)管を磁石スタンドに設置した。磁石上に捕捉されたビーズを乱さずに上
清を廃棄した。600μLの新たに作製された70%エタノールをそのビーズに添加し、
1分間インキュベートし、その後、エタノールを除去した。第2の一定分量の600μL
の新たに作製された70%エタノールをそのビーズに添加し、1分間インキュベートし、
エタノールを除去した。管を磁石スタンドに1~2分間戻し、ビーズを再捕捉した。残り
のエタノールを除去し、ビーズを室温で5~10分間風乾させた。30μLのQIAGE
N溶出緩衝液をそのビーズに添加し、ボルテックスし、2分間インキュベートした。溶液
が透明になるまで(2分間)管を磁石スタンドに戻して設置した。上清を新鮮な1.5m
Lの管に移し、ビーズを廃棄した。Q-PCRアッセイを用いて溶出したDNA試料を定
量化した。これらの定量化は、プールされたハイブリッド捕捉選択内のそれぞれのライブ
ラリの均等な表示を確保するために、等モルプーリングを可能にする。
実施例4:ハイブリッド選択
プールインデックス試料ライブラリ
【0841】
Q-PCRによってインデックスされ、精製され、かつ定量化されたライブラリのプー
ル(最大12plex)を氷上で作製した。等モルプールを1.5mLのマイクロ遠心分
離管内で調製し、それぞれの試料がハイブリッド選択プロセスで均等に表されることを確
実にした。これらのプールのそれぞれの全入力DNAは、2000ng~500ngに及
び得る。典型的には、全入力DNAは、2000ngである。したがって、12個の試料
がプールされる場合、それぞれ166.67ngをプールして、合計2000ngにする
ことができる。2000ngのライブラリプールの最終量は、4μLであるはずである。
インデックスされたライブラリの異なる濃度により、より大量のプールを作製することが
できるが、そのプールを(低熱を用いた)SpeedVacによって乾燥させ、4μLの
ヌクレアーゼを含まない水中で再構成するべきである。
【0842】
ライブラリ構築の収率が大きいほど、ライブラリの複雑さが増す。
プールされたDNAライブラリをビオチン化RNAベイトにハイブリダイズする
【0843】
AgilentのSureSelect標的濃縮対合末端キット(番号G3360A-
J)をこの実験で使用した。ハイブリダイゼーション緩衝液3番、SureSelect
ブロック1番、SureSelectブロック2番、対合末端プライマー1.0ブロック
、インデックスプライマー1-12ブロック、RNAeブロック、およびビオチン化され
たRNAベイトを氷上で解凍した。以下のマスターミックスを調製した。
a. ハイブリダイゼーション緩衝混合液(1反応当たり13μL):
i. ハイブリダイゼーション緩衝液1番(Agilent)-25μL
ii. ハイブリダイゼーション緩衝液2番(Agilent)-1μL
iii. ハイブリダイゼーション緩衝液3番(Agilent)-10μL
iv. ハイブリダイゼーション緩衝液4番(Agilent)-13μL
b. ブロッキング混合物(1反応当たり8μL):
i. SureSelectブロック1番(Agilent)-2.5μL
ii. SureSelectブロック2番(Agilent)-2.5μL
iii. 対合末端プライマー1.0ブロック(IDT、H2Oで200uMに再懸濁
した)-1.5μL
iv. インデックスプライマー1-12ブロック(IDT、H2Oで200uMに再
懸濁した)-1.5μL
c. RNaseブロックの希釈
i. 3Mb未満のテリトリーを有するカスタムビオチン化RNAベイトの場合:1μ
LのRNaseブロック(Agilent)を9μLの水中に希釈した。
ii. 3Mbを超えるベイトテリトリーを有するカスタムベイトの場合:1μLのR
Naseブロックを3μLの水中に希釈した(7uLの捕捉反応につき依然として0.5
μLのRNaseブロック)
d. ベイト混合物:(1反応当たり7μL)
i. RNAベイト-2μL(3Mbを超えるベイトテリトリーを有するベイトの場合
、5μLのベイトを使用した)
ii. 希釈されたRNaseブロック-5μL(3Mbを超えるベイトテリトリーを
有するベイトの場合、上述のように希釈された2μLのRNaseブロックを使用した)
【0844】
ハイブリダイゼーション緩衝混合液、ブロッキング混合物、およびベイト混合物(複数
を含む)を調製した時点で、ハイブリダイゼーション緩衝混合液をボルテックスし、沈降
させ、65℃になるまで熱ブロック内で加熱した。ハイブリッド選択される4μLのそれ
ぞれプールされた試料ライブラリを8μLのブロッキング混合物と96ウェルPCRプレ
ート中で混合した。反応物を熱循環機内で95℃で5分間インキュベートし、その後、6
5℃で保持した。プールされた試料ライブラリ/ブロッキング混合物を95℃で5分間、
その後、65℃で2.5分間インキュベートしているときに、ベイト混合物(=ベイト/
RNAeブロック混合物)を熱ブロック内に65℃で2.5分間入れた。ハイブリダイゼ
ーション緩衝液含有管を急速に沈降させ、その後、即座に65℃の熱ブロックに戻した。
96ウェルプレートを65℃の熱循環機内に残したまま、13μLの加熱したハイブリダ
イゼーション緩衝混合液をピペットでそれぞれの試料ライブラリ/ブロック混合物に移し
た。ベイト混合物を65℃で2.5分間インキュベートした時点で、96ウェルプレート
を65℃の熱循環機内に残したまま、7μLのベイト混合物をそれぞれの試料ライブラリ
/ブロック/ハイブリダイゼーション緩衝混合液に添加した。反応物(全体積は32μL
であった)を熱循環機内で65℃で24時間インキュベートした。
磁気ビーズの調製
【0845】
SureSelect洗浄緩衝液2番を熱ブロック内で65℃で予温した。Dynal
MyOneストレプトアビジンT1ビーズ(Invitrogen)をボルテックスし
、再懸濁させた。ビーズを、50μLのDynalビーズにつき200μLのSureS
elect結合緩衝液を添加することによって洗浄した(例えば、300μLのDyna
lビーズを調製するのに1200μLのSureSelect結合緩衝液を使用した)。
ビーズを5秒間ボルテックスし、短期間沈降させた。ビーズを約15秒間、またはすべて
のビーズが捕捉されるまで磁石スタンドに設置した。上清を除去し、廃棄した。Sure
Select結合緩衝液での洗浄をもう2回繰り返し、合計3回洗浄した。洗浄後、ビー
ズを50μLのDynalビーズにつき200μLのSureSelect結合緩衝液中
に再懸濁させた(例えば、300μLのDynalビーズを調製するのに1200μLの
SureSelect結合緩衝液を使用した)。再懸濁したビーズをボルテックスし、短
期間沈降させた。200μLの再懸濁したビーズを個別の1.5mLのマイクロ遠心分離
管に分注した。
ハイブリッド捕捉DNAの選択
【0846】
24時間インキュベートした後、65℃の熱循環機内のPCRプレートのそれぞれのハ
イブリダイズした試料を室温の200μLの調製したビーズを含有する管にピペットで迅
速に移した。試料およびビーズの混合物を5秒間ボルテックスし、室温で30分間、ロー
テータ上でインキュベートし、適切な混合を確保した。その後、管を急速に沈降させた。
ビーズを磁石上に捕捉し(2分間)、上清を除去し、廃棄した。ビーズを低ストリンジェ
ンシー洗浄のために500μLのSureSelect洗浄緩衝液1番中に再懸濁させた
。試料を5秒間ボルテックスし、室温で15分間インキュベートし、磁石から外した。試
料を3~5分間おきに5秒間ボルテックスした。管を急速に沈降させた。その後、ビーズ
を磁石スタンド上で2分間捕捉し、上清を除去し、廃棄した。高ストリンジェンシー洗浄
で的外れの物質を除去するために、ビーズをSureSelect洗浄緩衝液2番で洗浄
し、65℃に予熱した。簡潔に、ビーズを500μLの予め加温したSureSelec
t洗浄緩衝液2番中に再懸濁させ、ボルテクサー上で5秒間混合し、ビーズを再懸濁した
。ビーズを遠心分離機内で短期間沈降させ、時々室温で5秒間ボルテックス混合しながら
65℃で10分間、熱ブロック内でインキュベートした。その後、ビーズを遠心分離機内
で短期間沈降させ、磁石上に2分間捕捉した。65℃に予め加温したSureSelec
t洗浄緩衝液2番での洗浄をさらに2回繰り返し、合計3回洗浄した。その後、洗浄緩衝
液を完全に除去し、50μLのSureSelect溶出緩衝液をビーズに添加し、続い
て5秒間ボルテックスしてビーズを混合した。時々5秒間ボルテックス混合しながら、試
料を室温で10分間インキュベートした。ビーズを遠心分離機内で短期間沈降させ、磁石
スタンド上で捕捉した。捕捉DNAを含有する上清を新しい1.5mLのマイクロ遠心分
離管にピペットで移した。50μLのSureSelect中和緩衝液を捕捉DNAに添
加した。試料を5秒間ボルテックスし、遠心分離機内で短期間沈降させ、1.8倍量のA
MPureXPビーズを用いて精製した。DNAを40μLのヌクレアーゼを含まない水
中に溶出した。
捕捉DNAのPCR濃縮
【0847】
PCR試薬を解凍し、PCRマスターミックスを氷上で調製した。1つの試料につき6
0μLのマスターミックスにおいて、HF緩衝液(NEB番号F-531S)を有する5
0μLの2倍のPhusion高忠実度マスターミックスを、8μLのヌクレアーゼを含
まない水、1μLのQPCRプライマー1.1(H2O中100μM)、および1μLの
QPCRプライマー2.1(H2O中100μM)と混合した。Q-PCRのプライマー
配列は、以下の通りである。
QPCRプライマー1.1(IDTからHPLC精製した):
5’AATGATACGGCGACCACCGAGAT3’(配列番号48)
QPCRプライマー2.1(IDTからHPLC精製した):
5’CAAGCAGAAGACGGCATACGA3’(配列番号49)
60μLのマスターミックスを96ウェルPCRプレート中の40μLのそれぞれ精製
した捕捉DNA試料に添加した。反応物を以下のように熱循環機内でインキュベートした
:
1サイクル 98℃ 30秒間
12サイクル 98℃ 10秒間
65℃ 30秒間
72℃ 30秒間
1サイクル 72℃ 5分間
4℃ 保持
【0848】
それぞれの100μLのPCR反応物を1.8倍量のAMPureXPビーズで精製し
、35μLの溶出緩衝液(10mMのTris、pH8.5)中に溶出した。ハイブリッ
ド選択/捕捉DNA試料をQ-PCRアッセイを用いて定量化した。Q-PCRアッセイ
は、末端アダプターを検出し、読み取りは、適切なクラスター密度を得るためにどれだけ
のそれぞれの試料が配列決定フローセル上に装填されるべきかを示した。
実施例5:方法
【0849】
以下は、実施例に従って変化を特定するために使用されるある特定の方法の実施形態お
よび実験条件を例示する。さらなる転座スクリーニングを、例えば、事前選択された腫瘍
試料から調製されたcDNAのqRT-PCR分析のいずれかを用いて行うことができる
。
【0850】
大規模並列DNA配列決定を、アーカイブした固定パラフィン包埋組織から単離された
DNAを用いてハイブリダイゼーションで捕捉したアダプターライゲーションベースのラ
イブラリ上で行った。分析ツールの組み合わせを用いてデータを分析し、DNA変化呼び
出しを割り当てた。さらなる転座スクリーニングを、冷凍腫瘍から調製されたcDNAの
qRT-PCR分析またはアーカイブしたFFPE検体のIHC評価のいずれかを用いて
行った。FFPE組織から単離されたRNAを用いて両方の新規の転座の発現を確認する
ために大規模並列cDNA配列決定を行った。血液由来の適合した正常な参照ゲノムDN
AをインデックスNSCLC患者のために配列決定して、再編成の体細胞起源を確認した
。
ゲノムDNA配列決定
【0851】
145個の癌遺伝子の2574個のエクソンの配列決定をアーカイブしたホルマリン固
定パラフィン包理(FFPE)腫瘍検体由来のDNAを用いて行い、24個はNSCLC
患者由来であった。配列決定ライブラリをゲノムDNAを用いたアダプターライゲーショ
ン方法によって構築し、最適化RNAハイブリダイゼーション捕捉プローブ(Agile
ntのSureSelectカスタムキット)でのハイブリダイゼーション選択が続いた
。253倍の平均深度に対して36×36の対合読み取りを用いて、配列決定をHiSe
q2000機器(Illumina)上で行った。腫瘍組織からの変異呼び出しのために
最適化されたツールの組み合わせを用いて、塩基置換、インデル、コピー数変化、および
ゲノム再編成のデータ処理ならびに変異割り当てを行った。
cDNA配列決定
【0852】
Roche High Pureキットを用いて単一の5~10umのFFPE組織切
片から抽出される全RNAからcDNAを生成し、SuperScript(登録商標)
III第1鎖合成システム(Invitrogen)を用いてランダム六量体プライマー
でcDNAに逆転写した。二本鎖cDNAをNEBNext(登録商標)mRN第2鎖合
成モジュール(New England Biolabs)で作製し、FFPE DNA
試料に関して、ライブラリ構築への入力、ハイブリッド捕捉、および配列決定として使用
した。分析ツールの組み合わせを用いて発現レベルの分析を行った。
実施例6:マルチプレックス分析用の例となる選択された遺伝子およびバリアント
【0853】
この実施例は、マルチプレックス分析のために遺伝子、バリアント、および癌型の選択
を概要する4つの例となる表を提供する。
【表6】
【表7】
【0854】
実用能カテゴリーは、下記のように分類される。表1Bは、異なる癌型の例となる変化へ
の異なるカテゴリーの適用の概要を提供する。
【0855】
カテゴリーA:承認された/標準の治療に対する感度または抵抗を予測する承認された/
標準の変化
転移性結腸癌におけるKRAS G13D
乳癌におけるERBB2増幅
非小細胞肺癌におけるEGFR L858R
カテゴリーB:特定の実験的治療の対象基準または除外基準である変化
結腸癌、肺癌、または乳癌におけるKRAS G13D
黒色腫、結腸癌、または肺癌におけるBRAF V600E
黒色腫におけるNRAS Q61K
乳癌におけるPIK3CA H1047R
乳癌におけるFGFR1増幅
乳癌におけるPTEN両アレル不活性化
乳癌または膵臓癌におけるBRCA1両アレル不活性化
カテゴリーC:標準治療もしくは実験的治療に対する感度または抵抗を予測する限られた
証拠(早期臨床データ、相反する臨床データ、臨床前データ、理論的データ)を有する変
化
結腸癌におけるKRAS Q61H(早期臨床)
乳癌におけるPIK3CA H1047R(相反する臨床)
結腸癌におけるBRAF V600E(相反する臨床)
肺癌におけるERBB2変異または増幅(ケース報告)
肺癌におけるBRAF D594G(臨床前)
乳癌におけるFGFR1増幅(臨床前)
乳癌におけるATM両アレル不活性化(臨床前)
結腸癌におけるTSC1両アレル不活性化(臨床前)
乳癌におけるATR二対立遺伝子不活性化(理論的)
肉腫におけるBRAF V600E変異(理論的)
カテゴリーD:特定の癌のサブタイプの予後または診断的有用性を有する変化
結腸癌におけるMSH2両アレル不活性化(強力な臨床的証拠)
結腸癌におけるBRAF V600E(強力な臨床的証拠)
肺癌におけるKRAS G13D(強力な臨床的証拠)
乳癌におけるBRCA1不活性化(強力な臨床的証拠)
カテゴリーE:明確な臨床的意義を有しない、癌における明確な生物学的意義を有する変
化(すなわち、ドライバ変異)
結腸癌におけるAPC両アレル不活性化
乳癌におけるTP53両アレル不活性化
黒色腫におけるMITF増幅
卵巣癌におけるARID1A
カテゴリーF:癌における既知の生物学的意義を有しない変化
既知の癌遺伝子における新規の変化
治療の標的
既知の癌遺伝子のオルソログ
【表8】
【表9】
【表10】
【表11】
実施例7:ハイブリッド捕捉のための例となるベイト配列
【0856】
表7は、例となるベイトを3つの標的:SMAD3_標的_10、SMAD3_標的_
11、SMAD3_標的_12に提供する。
表7:例となるベイト
1.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_10 染色体15:67477013~6747713
2
CCATTGTGTGTGAGCAAAGGCACCCTGTCCAGTCTAACCT
GAATCTCTGTAGGAAGAGGCGTGCGGCTCTACTACATCGG
AGGGGAGGTCTTCGCAGAGTGCCTCAGTGACAGCGCTATT
(配列番号6)
(ベイトID: SMAD3_標的_10.2)
2.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_10 染色体15:67477037~6747715
6
CTGTCCAGTCTAACCTGAATCTCTGTAGGAAGAGGCGTGC
GGCTCTACTACATCGGAGGGGAGGTCTTCGCAGAGTGCCT
CAGTGACAGCGCTATTTTTGTCCAGTCTCCCAACTGTAAC
(配列番号7)
(ベイトID: SMAD3_標的_10.4)
3.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_10 染色体15:67477061~6747718
0
GTAGGAAGAGGCGTGCGGCTCTACTACATCGGAGGGGAGG
TCTTCGCAGAGTGCCTCAGTGACAGCGCTATTTTTGTCCA
GTCTCCCAACTGTAACCAGCGCTATGGCTGGCACCCGGCC
(配列番号8)
(ベイトID: SMAD3_標的_10.6)
4.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_10 染色体15:67477085~6747720
4
TACATCGGAGGGGAGGTCTTCGCAGAGTGCCTCAGTGACA
GCGCTATTTTTGTCCAGTCTCCCAACTGTAACCAGCGCTA
TGGCTGGCACCCGGCCACCGTCTGCAAGATCCCACCAGGT
(配列番号9)
(ベイトID: SMAD3_標的_10.1)
5.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_10 染色体15:67477109~6747722
8
GAGTGCCTCAGTGACAGCGCTATTTTTGTCCAGTCTCCCA
ACTGTAACCAGCGCTATGGCTGGCACCCGGCCACCGTCTG
CAAGATCCCACCAGGTAAACGAGCCGCACAGGCACCCCTG
(配列番号10)
(ベイトID: SMAD3_標的_10.5)
6.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_10 染色体15:67477133~6747725
2
TTTGTCCAGTCTCCCAACTGTAACCAGCGCTATGGCTGGC
ACCCGGCCACCGTCTGCAAGATCCCACCAGGTAAACGAGC
CGCACAGGCACCCCTGCCTTGAGGTCCCTCTCCGAGTGCA
(配列番号11)
(ベイトID: SMAD3_標的_10.3)
7.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_11 染色体15:67479655~6747977
4
GACCTGGCCACTTCCATCCCCACAGCCCTGTTTCTGTGTT
TTTGGCAGGATGCAACCTGAAGATCTTCAACAACCAGGAG
TTCGCTGCCCTCCTGGCCCAGTCGGTCAACCAGGGCTTTG
(配列番号12)
(ベイトID: SMAD3_標的_11.1)
8.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_11 染色体15:67479679~6747979
8
GCCCTGTTTCTGTGTTTTTGGCAGGATGCAACCTGAAGAT
CTTCAACAACCAGGAGTTCGCTGCCCTCCTGGCCCAGTCG
GTCAACCAGGGCTTTGAGGCTGTCTACCAGTTGACCCGAA
(配列番号13)
(ベイトID: SMAD3_標的_11.5)
9.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_11 染色体15:67479703~6747982
2
GATGCAACCTGAAGATCTTCAACAACCAGGAGTTCGCTGC
CCTCCTGGCCCAGTCGGTCAACCAGGGCTTTGAGGCTGTC
TACCAGTTGACCCGAATGTGCACCATCCGCATGAGCTTCG
(配列番号14)
(ベイトID: SMAD3_標的_11.3)
10.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_11 染色体15:67479727~6747984
6
ACCAGGAGTTCGCTGCCCTCCTGGCCCAGTCGGTCAACCA
GGGCTTTGAGGCTGTCTACCAGTTGACCCGAATGTGCACC
ATCCGCATGAGCTTCGTCAAAGGCTGGGGAGCGGAGTACA
(配列番号15)
(ベイトID: SMAD3_標的_11.4)
11.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_11 染色体15:67479751~6747987
0
CCCAGTCGGTCAACCAGGGCTTTGAGGCTGTCTACCAGTT
GACCCGAATGTGCACCATCCGCATGAGCTTCGTCAAAGGC
TGGGGAGCGGAGTACAGGTCAGTTATGGGTGCTGCCTACA
(配列番号16)
(ベイトID: SMAD3_標的_11.2)
12.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_11 染色体15:67479775~6747989
4
AGGCTGTCTACCAGTTGACCCGAATGTGCACCATCCGCAT
GAGCTTCGTCAAAGGCTGGGGAGCGGAGTACAGGTCAGTT
ATGGGTGCTGCCTACATCAGGGGACCCAACTCCAGGTGAC
(配列番号17)
(ベイトID: SMAD3_標的_11.6)
13.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_12 染色体15:67482692~6748281
1
TGTAACCCCCTGGAGATTTTTTAAGTCCCCCACCCCACCC
CTTTCCCTATTTCTTACAGGAGACAGACTGTGACCAGTAC
CCCCTGCTGGATTGAGCTGCACCTGAATGGGCCTTTGCAG
(配列番号18)
(ベイトID: SMAD3_標的_12.5)
14.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_12 染色体15:67482716~6748283
5
GTCCCCCACCCCACCCCTTTCCCTATTTCTTACAGGAGAC
AGACTGTGACCAGTACCCCCTGCTGGATTGAGCTGCACCT
GAATGGGCCTTTGCAGTGGCTTGACAAGGTCCTCACCCAG
(配列番号19)
(ベイトID: SMAD3_標的_12.3)
15.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_12 染色体15:67482740~6748285
9
ATTTCTTACAGGAGACAGACTGTGACCAGTACCCCCTGCT
GGATTGAGCTGCACCTGAATGGGCCTTTGCAGTGGCTTGA
CAAGGTCCTCACCCAGATGGGCTCCCCAAGCATCCGCTGT
(配列番号20)
(ベイトID: SMAD3_標的_12.2)
16.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_12 染色体15:67482764~6748288
3
ACCAGTACCCCCTGCTGGATTGAGCTGCACCTGAATGGGC
CTTTGCAGTGGCTTGACAAGGTCCTCACCCAGATGGGCTC
CCCAAGCATCCGCTGTTCCAGTGTGTCTTAGAGACATCAA
(配列番号21)
(ベイトID: SMAD3_標的_12.4)
17.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_12 染色体15:67482788~6748290
7
CTGCACCTGAATGGGCCTTTGCAGTGGCTTGACAAGGTCC
TCACCCAGATGGGCTCCCCAAGCATCCGCTGTTCCAGTGT
GTCTTAGAGACATCAAGTATGGTAGGGGAGGGCAGGCTTG
(配列番号22)
(ベイトID: SMAD3_標的_12.6)
18.遺伝子 標的 ベイトゲノム位置
SMAD3 SMAD3_標的_12 染色体15:67482812~6748293
1
TGGCTTGACAAGGTCCTCACCCAGATGGGCTCCCCAAGCA
TCCGCTGTTCCAGTGTGTCTTAGAGACATCAAGTATGGTA
GGGGAGGGCAGGCTTGGGGAAAATGGCCATGCAGGAGGTG
(配列番号23)
(ベイトID: SMAD3_標的_12.1)
【0857】
表8は、配列を有するベイトを2つの標的:二次構造を減少させるように修飾されたF
LT3_標的_24、より短いベイトに効果的に類似したベイトの両末端上にいくつかの
任意の配列を有するFLT4_標的_31に提供する。両方ともに対象範囲を約4倍改善
した(約4倍の対象範囲改善)。
表8:例となるベイト
1.遺伝子 標的 ベイトゲノム位置
FLT3 FLT3_標的_24 染色体13:28674626~28674745
元の配列
CGTCGCGCGCCAACGCCGGCATGGCCTCCGGAGCCCGGGG
TCCCCAGGCCGCGCCGGCCCAGCCCTGCGATGCCGCCTGG
AGCGGCGCGCCTCGCGCTGCAGGTGGCTCTCTTAAGGATG
(配列番号24)
修飾された配列
CGTCTCACGCCAACGCAAGCATGTCCTCCGGAGCCCGGGG
TCCCCAGGCCGCGCCGGCCCAGCCCTGCGATGCCGCCTGG
AGCGGCGCGCCTCGCACTGCAGATGGCTCTCTTAAGGATG
(配列番号25)
(ベイトID: FLT3_標的_24.1)
2.遺伝子 標的 ベイトゲノム位置
FLT3 FLT3_標的_24 染色体13:28674602~28674721
元の配列
TACCGAGCAGCGGCAGCTGGCCGCCGTCGCGCGCCAACGC
CGGCATGGCCTCCGGAGCCCGGGGTCCCCAGGCCGCGCCG
GCCCAGCCCTGCGATGCCGCCTGGAGCGGCGCGCCTCGCG
(配列番号26)
修飾された配列
TACCGAGCAGCGGCAGCTGGCCGCCGTCGCGCGCCAACGC
CGGCATGGCCTCCGGAGCCCGGGGTCCCCAGGCCGCGCAT
GCCCAGCCCTGCGATGCCGCCTTGAGCAACGCGCCTCACG
(配列番号27)
(ベイトID: FLT3_標的_24.2)
3.遺伝子 標的 ベイトゲノム位置
FLT3 FLT3_標的_24 染色体13:28674578~28674697
元の配列
GCTGCGAGCGAGCGAGCGGGGCCTTACCGAGCAGCGGCAG
CTGGCCGCCGTCGCGCGCCAACGCCGGCATGGCCTCCGGA
GCCCGGGGTCCCCAGGCCGCGCCGGCCCAGCCCTGCGATG
(配列番号28)
修飾された配列
GCTTCGAGAGAGCGAGCGGGGCCTTACCGAGCAGCAGCAG
CTGGCCGCCGTCGCGCGCCAACGCCGGCATGGCCTCCGGA
GCCCGGGGTCCCCAGGCCGCGCCAGCCCAGCCCTGAGATG
(配列番号29)
(ベイトID: FLT3_標的_24.3)
4.遺伝子 標的 ベイトゲノム位置
FLT3 FLT3_標的_24 染色体13:28674554~28674673
元の配列
GTGGGGGCTGAGGGACCGCGAGGGGCTGCGAGCGAGCGAG
CGGGGCCTTACCGAGCAGCGGCAGCTGGCCGCCGTCGCGC
GCCAACGCCGGCATGGCCTCCGGAGCCCGGGGTCCCCAGG
(配列番号30)
修飾された配列
GAGGTGGCTGAGAGACCGCGAGGAGCTGCGAGCGAGCGAG
CGGGGCCTTACCGAGCAGCGGCAGCTGGCCGCCGTCGCGC
GCCAACGCAGGCATGGCCTCCGGAGCCCAGGGTCCCCAGG
(配列番号31)
(ベイトID: FLT3_標的_24.4)
5.遺伝子 標的 ベイトゲノム位置
FLT3 FLT3_標的_24 染色体13:28674506~28674625
元の配列
CGAGGCGGCTGGGCCGGAGGAGGCGCGCGCCCGGGTCCAC
ACTGCGGGGTGGGGGCTGAGGGACCGCGAGGGGCTGCGAG
CGAGCGAGCGGGGCCTTACCGAGCAGCGGCAGCTGGCCGC
(配列番号32)
修飾された配列
CGAGGCGGCTGGGCCGGAGGAGGCGCGCGCCCGGATCCAC
ACTGCGGGGTGGGGGCTGAGGGACCGCGAGGGGCTGCGAG
CGAGCGAGCGGGGACTTACCGAGCAGCGGCAACTGGACGC
(配列番号33)
(ベイトID: FLT3_標的_24.5)
6.遺伝子 標的 ベイトゲノム位置
FLT3 FLT3_標的_24 染色体13:28674530~28674649
元の配列
GCGCGCCCGGGTCCACACTGCGGGGTGGGGGCTGAGGGAC
CGCGAGGGGCTGCGAGCGAGCGAGCGGGGCCTTACCGAGC
AGCGGCAGCTGGCCGCCGTCGCGCGCCAACGCCGGCATGG
(配列番号34)
修飾された配列
GCACGCACGGATCCACACTGCGGGGTGGGGGCTGAGGGAC
CGCGAGGAGCTGCGAGCGAGCGAGCGGGGCCTTACCGAGC
AGCGGCAGCTGGCAGCCGTCGCGCGCCAACGCCGGCATGG
(配列番号35)
(ベイトID: FLT3_標的_24.6)
7.遺伝子 標的 ベイトゲノム位置
FLT4 FLT4_標的_31 染色体5:180076516~180076635
元の配列
TCGCAGGCACAGCGCGGCGCCCCGCTGCATCTCCGGCCGC
TGCGCGTGGGTCCGACCCGAGCGGCCGCGGCTCGGGGCTG
AAAGTGTCCGCGCGGGCGCCGGCTGGCCTGGGGCGGGGCG
(配列番号36)
修飾された配列
CACACACACAAGCGCGGCGCCCCGCTGCATCTCCGGCCGC
TGCGCGTGGGTCCGACCCGAGCGGCCGCGGCTCGGGGCTG
AAAGTGTCCGCGCGGGCGCCGGCTGGCCTGCACACACACA
(配列番号37)
(ベイトID: FLT4_標的_31.1)
8.遺伝子 標的 ベイトゲノム位置
FLT4 FLT4_標的_31 染色体5:180076396~18007651
5
元の配列
GGCGGAGCGGTCTCAGCGCCCGCCCCAGGTGCGCGGTACC
CCCTCCCCGGCCAGCCCCACGCTCGGGCGGGTGGCCCGTT
CGCCGCGCTCACCGTCCAGGAGTCCCAGGCAGAGCCACAG
(配列番号38)
修飾された配列
CACACACACATCTCAGCGCCCGCCCCAGGTGCGCGGTACC
CCCTCCCCGGCCAGCCCCACGCTCGGGCGGGTGGCCCGTT
CGCCGCGCTCACCGTCCAGGAGTCCCAGGCCACACACACA
(配列番号39)
(ベイトID: FLT4_標的_31.2)
9.遺伝子 標的 ベイトゲノム位置
FLT4 FLT4_標的_31 染色体5:180076420~18007653
9
元の配列
CCAGGTGCGCGGTACCCCCTCCCCGGCCAGCCCCACGCTC
GGGCGGGTGGCCCGTTCGCCGCGCTCACCGTCCAGGAGTC
CCAGGCAGAGCCACAGTCGCAGGCACAGCGCGGCGCCCCG
(配列番号40)
修飾された配列
CACACACACAGGTACCCCCTCCCCGGCCAGCCCCACGCTC
GGGCGGGTGGCCCGTTCGCCGCGCTCACCGTCCAGGAGTC
CCAGGCAGAGCCACAGTCGCAGGCACAGCGCACACACACA
(配列番号41)
(ベイトID: FLT4_標的_31.3)
10.遺伝子 標的 ベイトゲノム位置
FLT4 FLT4_標的_31 染色体5:180076468~18007658
7
元の配列
GGCCCGTTCGCCGCGCTCACCGTCCAGGAGTCCCAGGCAG
AGCCACAGTCGCAGGCACAGCGCGGCGCCCCGCTGCATCT
CCGGCCGCTGCGCGTGGGTCCGACCCGAGCGGCCGCGGCT
(配列番号42)
修飾された配列
CACACACACACCGCGCTCACCGTCCAGGAGTCCCAGGCAG
AGCCACAGTCGCAGGCACAGCGCGGCGCCCCGCTGCATCT
CCGGCCGCTGCGCGTGGGTCCGACCCGAGCCACACACACA
(配列番号43)
(ベイトID: FLT4_標的_31.4)
11.遺伝子 標的 ベイトゲノム位置
FLT4 FLT4_標的_31 染色体5:180076444~18007656
3
元の配列
GGCCAGCCCCACGCTCGGGCGGGTGGCCCGTTCGCCGCGC
TCACCGTCCAGGAGTCCCAGGCAGAGCCACAGTCGCAGGC
ACAGCGCGGCGCCCCGCTGCATCTCCGGCCGCTGCGCGTG
(配列番号44)
修飾された配列
CACACACACAACGCTCGGGCGGGTGGCCCGTTCGCCGCGC
TCACCGTCCAGGAGTCCCAGGCAGAGCCACAGTCGCAGGC
ACAGCGCGGCGCCCCGCTGCATCTCCGGCCCACACACACA
(配列番号45)
(ベイトID: FLT4_標的_31.5)
12.遺伝子 標的 ベイトゲノム位置
FLT4 FLT4_標的_31 染色体5:180076492~18007661
1
元の配列
CAGGAGTCCCAGGCAGAGCCACAGTCGCAGGCACAGCGCG
GCGCCCCGCTGCATCTCCGGCCGCTGCGCGTGGGTCCGAC
CCGAGCGGCCGCGGCTCGGGGCTGAAAGTGTCCGCGCGGG
(配列番号46)
修飾された配列
CACACACACAAGGCAGAGCCACAGTCGCAGGCACAGCGCG
GCGCCCCGCTGCATCTCCGGCCGCTGCGCGTGGGTCCGAC
CCGAGCGGCCGCGGCTCGGGGCTGAAAGTGCACACACACA
(配列番号47)
(ベイトID: FLT4_標的_31.6)
実施例8:次世代の配列決定臨床癌検体由来の体細胞ゲノム変化の高感度検出のためのベ
イズ手法
【0858】
本明細書に記載のベイズ手法を以下の例で実現した。
【0859】
この手法の実用性は、出力計算によって説明され、臨床状況において関連性のある変異
頻度のより狭い範囲内の置換検出へのデータ駆動先行の影響を説明する。
図2に示される
ように、先行予想(例えば、1e-6または10%先行)および変異頻度(例えば、1%
、5%、または15%変異)の値は、それぞれ、「次世代の配列決定臨床癌検体由来の体
細胞ゲノム変化の高感度検出のためのベイズ手法」の(i)および(ii)に記載される
値に相当する。
図2は、先行予想を組み込むことで、例えば、変異部位での必須の対象範
囲深度を減少させるか、または推定の変異検出力(感度)を増加させることにより、より
珍しい変異の検出力を改善することができることを示す。
実施例9:ベイズ手法:構成された低純度多クローン性試料への適用
【0860】
本明細書に開示のベイズ手法のこれらの利点をさらに実証するために、1000人ゲノ
ム計画のうちの10名の参加者由来のDNAを均等に混合することによって人工的な低純
度の多クローン性「腫瘍」試料を構築し、それによって、(非公式のヘテロ接合体SNP
から生じた)全DNAの約5%または10%に存在する多数の配列バリアントを含有する
DNAプールを作成した。その混合物を182個の癌関連遺伝子のエクソンのハイブリッ
ド選択に供し、llumina HiSeq2000プラットフォーム上で配列決定して
、遺伝子パネルにわたって約350倍の平均対象範囲をもたらした。それぞれの成分試料
も同様に個別に処理し、すべてのSNP部位における遺伝子型を決定した。プールに存在
する約260個の約5%「変異」のうち、89%が1e-6先行を用いて高信頼度で検出
された一方で、94%および95%が、それぞれ、1%および10%先行を用いて検出可
能であり(見逃された部位の平均対象範囲約125倍)、上記の理論的結論を支援する。
プールに存在する102個の10%「変異」のうち、98%が1e-6先行を用いて高信
頼度で検出されたが、99%および99%が、1%および10%先行を用いて検出可能で
あった(見逃された部位の対象範囲13倍)。
実施例10:ベイズ手法:肺および結腸腫瘍試料への適用
【0861】
COSMICデータベース(www.sanger.ac.uk/genetics/
CGP/cosmic上)からのいくつかの癌型における関連性のある変異の頻度の先行
予想を導き出し、日常の臨床検体から抽出される80個を超える肺および結腸癌試料を分
析した。20個を超える異なる遺伝子における既知の変異が観察され、その観察には、こ
の癌型におけるこの変異の3%先行の組み込みによってのみ検出することができた結腸癌
における1%のPIK3CA変異p.H1047Rが含まれた。これらの結果は、腫瘍型
特異的変異スペクトル周辺の先行予想の賢明な組み込みがNGSベースの腫瘍ゲノム分析
の臨床状況への変換において有益であり得ることを示す。
実施例11:ベイズ手法:乳癌試料への適用
【0862】
FFPE乳癌試料のために約260回配列決定された182個の癌関連遺伝子のエクソ
ンにおける置換変異呼び出しを行った。代替の対立遺伝子2個を超えるコピーを有する部
位の数は、1,793である。変異の存在下で99%を超える事後信頼を有する部位の数
は、402である。フィルタ後に留まったままの部位の数は188であり、バリアント部
位の予想数に近い。dbSNP中に存在しない部位の数は14であり、dbSNPが90
%を超えるバリエーションを捕捉するため、dbSNP中に存在しない部位の予想数に近
い。非同義部位の数は5である。COSMIC中の部位の数は2である(PIK3CA
p.H1047RおよびP53 p.F113S)。
実施例12:ベイズ手法:低頻度変異の検出
【0863】
多くの日常の臨床検体は、関連性のある珍しい変異を含有する。
図3は、100個を超
える臨床癌試料における変異頻度を示す。試料は、主に結腸および肺癌のFFPE生検、
外科的切除物、または細針吸引物であった。一連の臨床試料において見られる既知の変異
の頻度スペクトルが表12に示される。
【表12】
実施例13A.個別に合成されたオリゴヌクレオチド捕捉プローブを用いた高性能の溶液
ベースの標的選択
【0864】
溶液ベースのゲノム標的選択技術の可用性は、標的とされた配列決定適用の迅速な開発
を可能にしており、それらのうちのいくつかは、臨床配列決定試験の導入をもたらした。
商品化されたハイブリダイゼーション捕捉試薬は、アレイ合成オリゴヌクレオチドに基づ
き、それは、ビオチン化DNAまたはRNAプローブ(「ベイト」)に変換される。しか
しながら、プローブのこれらの複雑なプールを生成する方法は、性能上の課題、例えば、
高いGC含量標的の捕捉に直面する。
【0865】
57個の臨床的に関連し、かつ実用的な癌関連遺伝子を表す約130kbの標的領域を
捕捉するために個別に合成された5’-ビオチン化オリゴヌクレオチド(「オリゴベイト
」)を用いた代替の手法が本明細書に記載される。24時間のハイブリダイゼーション手
順でこれらのオリゴベイトを用いて選択されたインデックス付き配列決定ライブラリは、
5,000倍の標的濃縮をもたらした。50Mの49×49対合末端読み取りは、568
倍(27%)の標準偏差で2100倍の平均標的対象範囲を生成した。99.95%の標
的化塩基が500倍超で対象範囲とされ、すべての標的を対象範囲とすることに成功した
。さらに、標的対象範囲は、実質的にGCバイアスを有しなかった。70%を超えるGC
含量を有する標的は、平均して1,975倍の対象範囲となり、35%未満のGC含量を
有する標的は、平均して1,996倍の対象範囲になった。
【0866】
さらにより短いハイブリダイゼーション時間を用いて高性能を維持した:99.3%の
標的化塩基が2.5時間のハイブリダイゼーション後に500倍超で対象範囲とされた。
【0867】
SSPE(Salmon Sperm,PE)/デンハルト液の使用は、TEACl、
TMACl、および/または硫酸デキストランを含有するハイブリッド/洗浄緩衝液より
も優れていた。
【0868】
オリゴベイトをアレイ由来のベイトプール内にスパイクして、別の方法では捕捉するの
が困難な(例えば、高GC含量の)領域の対象範囲を増加させるか、または新たな遺伝子
含量を迅速に付加することができる。この手法は、高性能の標的化臨床配列決定試験を開
発する非常に効果的かつ拡張可能な方法を提供する。
実施例13B:ベイトの捕捉を最適化する方法
【0869】
3つのベイトセットを試験した。結果は
図5に要約される。ベイトセットは以下のもの
であった:
ベイトセット1は、個別に合成された5’-ビオチン化DNAオリゴヌクレオチドベイ
トのみからなる。
ベイトセット2は、個別に合成された5’-ビオチン化DNAオリゴヌクレオチドベイ
トでスパイクされたアレイ由来のビオチン化RNAベイトを含む。
ベイトセット3は、アレイ由来のビオチン化RNAベイトのみからなる。
【0870】
すべての個別に合成された5’-ビオチン化DNAオリゴヌクレオチドは、5’ビオチ
ンを有する120個の塩基であった。
【0871】
図5は、ベイトセット3と比較した、ベイトセット1およびベイトセット2で検出され
た対象範囲の均一性を比較する対象範囲ヒストグラムである。ベイトセットは、
図5にお
いて1、2、および3で示される。
図5に示されるように、高GC含量に相当するベイト
セット3を用いたときに対象範囲におけるいくつかのギャップが存在したが、対応する領
域は、ベイトセット1および2を用いたときに深く対象範囲とされた。
図5において、「
GC_密度_標的...」とラベル付けされた左側のパネルは、標的内の局所GC含量を
示す。線は、65%のGC含量を表し、その線を超える任意の値は、より高いGC含量を
表す。ヒストグラムに示されるように、高GC含量の領域におけるベイトセット3の対象
範囲が最も低い。
図5の「IDT_ベイト...」とラベル付けされた一番下のパネルは
、示される標的を対象範囲とするオリゴの配置を示す。
【0872】
アレイ由来のベイトセットのみまたは個別に合成されたベイトでスパイクされたベイト
を用いた標的の数および対象範囲の変化を示すグラフが
図4に示される。より具体的には
、
図4は、対象範囲ヒストグラムの線形表示である。標的の数(Y軸)は、対象範囲の関
数(X軸)として示される。線1は、個別に合成された5’-ビオチン化DNAオリゴヌ
クレオチドベイト(
図4において「ベイトセット1」と称される)でスパイクされたアレ
イ由来の5’-ビオチン化RNAオリゴヌクレオチドベイトを含むベイトセットを用いた
対象範囲を表す。線2は、アレイ由来のビオチン化RNAオリゴヌクレオチドベイトのみ
(
図4において「ベイトセット2」と称される)を含むベイトセットを用いて得られた対
象範囲を表す。ベイトセット2を用いたときの全体の平均対象範囲が924であった一方
で、ベイトセット2を用いたときの高GC含量(約68%)の領域における対象範囲は7
3であった。対照的に、ベイトセット1を使用したとき、全体の対象範囲は、ベイトセッ
ト1と同様であった(約918)が、高GC含量の領域における対象範囲は、183に改
善された。
実施例13C:ベイトセットを評価するための例となる実験条件
【0873】
ベイトセットAは、個別に合成された5’-ビオチン化DNAオリゴヌクレオチドベイ
トのみからなる。最初のセットは、133kbの標的テリトリーを対象範囲とする100
0個のオリゴ(本明細書で「ラージセット」、「ベイトセットA」、または「DNAオリ
ゴベイト」と称される)であった。
【0874】
「スパイクイン」実験において、最初の1000個のDNAオリゴセット(「ラージセ
ット」)を、アレイ由来のビオチン化RNAオリゴヌクレオチドベイトからなるベイトセ
ット(この実施例において「ベイトセットB」または「RNAベイト」と称される)に添
加した。ベイトセットAとは異なる比率のDNAオリゴベイトをベイトセットB由来のR
NAベイトと混合した。具体的には、1:10比のDNAオリゴベイト:RNAベイトを
使用した(合計10ngのDNAオリゴベイト:合計100ngのRNAベイト)。ハイ
ブリダイゼーションおよび洗浄条件を、RNAベイトにとって最も理想的な条件に適合し
た(RNAベイトの最適な洗浄温度は約70Cであるが、DNAオリゴベイトにおいては
約50Cであることが主な相違点である)。
【0875】
低タイリング密度で、対象範囲の強度の周期性がベイト配置に一致したDNAオリゴベ
イトを用いたときに検出された。加えて、低タイリング密度は、インデルを有する対立遺
伝子の捕捉をより困難にし得る。したがって、ベイトセットを表13に示される異なるタ
イリング密度でMAP3K1のために設計した。以下の混合物において、6個の癌関連遺
伝子(DAXX、TRRAP、CREBBP、GRIN2A、SPOP、GNA11)の
エクソンを捕捉するように設計された個別に合成された5’-ビオチン化DNAオリゴベ
イトを含有する混合物1を、アレイ由来のRNAオリゴヌクレオチドベイトのみ(ベイト
セットB)内にスパイクした。DAXX、TRRAP、CREBBP、GRIN2A、お
よびSPOPは、RNAベイトセット中に存在しなかった。混合物2~4をベイトセット
A(DNAオリゴベイトのラージセット)内にスパイクして、異なるタイリング密度(混
合物2の密度が最も高い)のMAP3K1のエクソンの捕捉ベイトを試験した。RNAベ
イトセットのみが約1MBの配列を対象範囲とした。
【表13】
【0876】
2μgのプールされた細胞株DNAライブラリを捕捉物に入れた。2μgのライブラリ
をブロッキング混合物(表14)と混合し、乾燥させ、9μLの水中に再懸濁させた。そ
の後、この混合物をプレートに入れ、サイクラーに移し、98℃で5分間、続いて68℃
で2分間実行した。その後、プレートを開封し、68℃の11μLのDNAベイト/ハイ
ブリッド緩衝液混合物を添加した。68℃のDNAベイト/ハイブリッド混合物は、10
μLのハイブリッド緩衝液+1μLのベイト(10ng、50ng、または100ngの
ベイトを含有する)であった。
【0877】
DNAベイトのみ(例えば、ベイトセットA)での捕捉の場合、68℃でハイブリダイ
ゼーションを行い、50℃で洗浄を行った。ベイトを、(2ugの入力ライブラリにつき
)5ng、10ng、100ng、1000ng、および2000ngで試験した。24
時間のハイブリダイゼーションの場合、5~10ng条件が理想的であり、100ng条
件も許容可能であった。2.5時間のハイブリダイゼーションの場合、100ngが最も
良好に作用した。
【0878】
低性能/高GC領域をレスキューするためにRNA-アレイベイトセット(b)内にス
パイクされる大きいDNAベイトセット(100kb)での捕捉の場合、68℃でハイブ
リダイゼーションを行い、70℃で洗浄を行った。ベイトセットを1:10のDNAオリ
ゴ:RNAベイトで試験した(すなわち、合計質量10ngのオリゴベイトおよび合計質
量100ngのRNAベイト)。
【0879】
RNAベイトセット内にスパイクされる遺伝子に焦点を当てた小さいDNAベイトセッ
トでの捕捉の場合、68℃でハイブリダイゼーションを行い、洗浄温度の範囲を試験した
(62℃、64℃、66℃、68℃、70℃、および72℃)。
【0880】
混合物1(6個の新たな遺伝子を添加した)を、1:5、1:10、および1:20の
全オリゴDNAベイト質量:RNAベイト質量(すなわち、20ng:100ng、10
ng:100ng、および5ng:100ng)の比率で試験した。
【0881】
混合物5(経路低対象範囲に対するSTK11のエクソン3を表す3個のオリゴ)を1
:500、1:1000、および1:2000のDNAオリゴ:RNAオリゴで試験した
。合計100ngのRNAベイトを使用した。RNAベイトのみで捕捉したときにSTK
11が低検出性能で重要な癌標的を示すとして、STK11を試験した。STK11のエ
クソン3のDNAオリゴスパイキングは、対象範囲を平均70倍から300倍に増加させ
た。
【表14】
実施例14.低入力のホルマリン固定組織由来のDNAを用いた敏感な腫瘍プロファイリ
ングのための日常の超深度配列決定
【0882】
ハイスループットDNA配列決定技術を幅広く採用することで、癌ゲノムの急速な発達
を促進している。しかしながら、ゲノム癌診断における標準治療は、依然として個別の遺
伝子および特異的変異に焦点を当てた試験を含む。臨床的に実用的な変異の数が増加する
と、特に組織検体が概して生検と同様に限定的であるときに、1試験パラダイム当たりの
この単一の変異は実現不可能になる。腫瘍試料の包括的ゲノムプロファイリングの臨床的
必要性に対処するために、我々は、200個を超える癌関連遺伝子の大規模並列配列デー
タを送達する臨床試験を開発した。さらに、この試験は、臨床的に関連性があると示され
ており、超深部配列決定データを最低で50ngのDNA入力を有するホルマリン固定パ
ラフィン包埋(FFPE)組織試料および最長で11年齢の試料から生成する。
【0883】
多種多様の試料上でこの試験の性能を評価するために、DNAを経年したブロックセッ
ト由来の96個のFFPE検体から単離し、1、3、5、7、9、および11年齢にわた
ってそれぞれの組織に均一に分布された乳房、結腸、肺、および腎臓組織のそれぞれに由
来する12個の腫瘍組織/正常な組織の対を含んだ。200ngおよび/または50ng
の入力DNAを用いて、インデックス付き配列決定ライブラリを構築し、その後、これを
溶液ベースのハイブリッド捕捉方法を用いて200個を超える癌関連遺伝子に濃縮し、I
llumina HiSeq(商標)2000プラットフォーム上で配列決定した。
【0884】
ライブラリ構築のために少なくとも200ngのDNAを産生する76個の試料の場合
、配列対象範囲は、PCR重複の除去後に平均して1,000倍になり、95%を超える
試料が350倍を超える平均対象範囲をもたらした。ライブラリ構築に50ngを使用し
た試料の場合、対象範囲は、平均して450倍になった。配列決定性能は、すべての試料
組織型および年齢にわたって一致した。そのような超深部配列決定は、最低で5~10%
の頻度で存在する変異の高信頼度検出を可能にする。
実施例15.循環腫瘍細胞を用いた腫瘍ゲノムのプロファイリング
【0885】
循環腫瘍細胞(CTC)は、低侵襲的な連続した様式でヒト悪性腫瘍をサンプリングす
る独自の機会を提供する。癌ゲノムの分子を特徴付けるためにCTCを使用することは、
2つの主要課題を提示する。第1に、CTCを血液から効率的に単離しなければならず、
その場合、CTCは非腫瘍細胞の数の107分の1であり得る。第2に、材料の喪失およ
びバイアスの導入を最小限に抑えながら、CTC試料中に存在する腫瘍ゲノムの限られた
数をアクセス可能な形態で捕捉しなければならない。
【0886】
以前のCTC遺伝分析は、対立遺伝子特異的PCRを使用しており、これらの方法は、
104倍以上の野生型配列のバックグラウンドにおける非常に少ないコピー数の特異的変
異の検出を可能にする。CTC存在量および捕捉効率の二重課題に対処するが、この手法
は、本来、予め指定された選択バリアントの限られた特徴付けに限定される。分子CTC
分析をゲノム時代に持ち込むために、我々は、CTCの回収を可能にする珍しい細胞のマ
イクロ流体捕捉システムと何万ではなく数百個のみの白血球のバックグラウンドを連結し
、次世代プラットフォームは、単一のCTC試料由来の200個を超える癌関連遺伝子の
再深度配列決定を可能にする。
【0887】
最大10個の癌細胞株の複合混合物を用いたとき、敏感な変異検出(10%以上の存在
量の遺伝子の場合、約94%)は、最少で合計100個の細胞を形成し、対立遺伝子頻度
を概して保存した(R2約0.90)。全血内にスパイクされる培養細胞を再捕捉するこ
とによって、10個という少ない癌細胞を含有する検体からの多遺伝子変異特性を得た。
この感度レベルは、臨床CTC試料の大半をNGS分析の届く範囲に配置する。乳癌患者
由来の一連の血液試料において、潜在的なCTC異質性を、Her2Neu陽性細胞の頻
度を体細胞変異陽性DNAの相対存在量と比較することによって調査した。
実施例16.FFPE腫瘍試料の標的化DNAおよびRNA深度配列決定の統合を介する
遺伝子発現における癌関連変異、転座、および変化の検出
【0888】
個別治療の癌への広範な適用は、腫瘍のゲノムおよびトランスクリプトームに存在する
様々な異常の包括的で敏感かつタイムリーな特徴付けを必要とする。ホルマリン固定パラ
フィン包理(FFPE)ブロックとして一般に保管される大部分の臨床癌試料由来のRN
AおよびDNAは、品質が悪く、分子プロファイリングでの使用が困難であった。新生の
次世代DNA配列決定アッセイは、損傷されたDNAとうまく機能し、多くの種類のゲノ
ム異常を検出するのに十分敏感である。現在、FFPE腫瘍試料由来のトランスクリプト
ームの包括的分析の比較可能なRNA配列決定プロトコルが存在しない。
結果:
【0889】
FFPE適合性標的化RNA配列決定ならびに200個を超える癌関連遺伝子における
変異、再編成、および発現変化の高感度検出の分析方法を開発した。プロトコルを細胞株
RNA上で検証し、50個を超えるFFPE非小細胞肺癌(NSCLC)腫瘍を研究する
ために使用した。既知の変異および遺伝子融合物(例えば、BCR-ABL1)を細胞株
中で検出した。デジタル発現プロファイリングの技術的再現性は、細胞株およびFFPE
RNAにおいて、それぞれ、R2=0.99および0.9を上回った。癌ゲノムでは予
想通り、RNA配列は、既知の癌遺伝子を伴う点変異および新規の再編成を含むゲノムに
おける以上の証拠を提供した。EGFR、FGFR3、CDH5、KIT、およびRET
を含む癌遺伝子の非常に有意な差次的発現が明らかになり、異なる腫瘍にわたって2.5
~70倍の範囲に及んだ。同一のFFPE試料上でのRNAおよびDNA配列決定データ
の組み合わせは、ゲノム変化の機能的結果を裏付け、例として、変異TP53対立遺伝子
の発現およびDNAレベルでヘテロ接合性の消失を呈した腫瘍におけるSTK11発現の
減少が挙げられる。次世代配列決定技術のFFPE RNAへの適用および現存のDNA
配列決定方法との統合が、臨床的に関連する癌生物学の理解を深め、患者ケアを改善する
ことが期待される。
方法:
【0890】
製造業者の指示に従って、Roche High Pureパラフィンキットを用いて
、RNAをFFPE組織切片、典型的には、1個または2個の10μmカールから抽出す
る。抽出したRNAを-80℃で保管する。RNAの収量および品質を、それぞれ、製造
業者の指示に従って、RiboGreen(Invitrogen)およびバイオアナラ
イザRNAピコチップ(Agilent)で評価する。典型的な収量は500ng~2μ
gであり、RINスコアは4未満である。
【0891】
相補的DNA(cDNA)の第1の鎖を、製造業者のプロトコルに従って、Super
Script III(Invitrogen)を使用して、550pmolのランダム
六量体をプライマーとして用いて、20μLの反応物中の100~600ngのFFPE
RNAから産生する。第1の鎖合成の直後に、製造業者のプロトコルに従って、60μ
LのNEBNext Second Strand Synthesis Module
(New England Biolabs)マスターミックスを添加し、16℃で15
0分間インキュベートして、完全な二本鎖cDNAを生成する第2の鎖合成を行う。二本
鎖cDNAの品質および収量を、それぞれ、PicoGreen(Invitrogen
)およびバイオアナライザ高感度チップ(Agilent)を用いて評価することができ
る。概して、全cDNA合成収量を標準のFMIライブラリ構築プロトコルへの入力とし
て使用する。
【0892】
対合末端適合性配列決定ライブラリの構築ならびにFFPE RNAから生成されるc
DNAのその後のハイブリッド選択および配列決定を、本明細書に記載のFFPE DN
Aと同様のプロトコルを用いて行うが、FFPE RNAの高度な断片化特性が剪断を不
必要にするため、末端修復ステップから直接開始する。
【0893】
当技術分野で既知の方法を用いてFFPE RNAからの配列決定データの分析を行う
ことができる。例えば、読み取り対すべてを参照ゲノム配列(hg19)および/または
参照トランスクリプトーム(既知の転写物の配列すべて、例えば、RefSeq)にマッ
ピングすることによって、FFPE RNAからの配列決定データの分析を行うことがで
きる。その後、マッピングされた読み取りは、例えば、Berger et al.(2
010)Genome Res.20(4):413-27(PMID20179022
)およびGarber et al.(2011)Nat Methods.8(6):
469-77(PMID21623353)の文献に記載されるように、遺伝子融合、遺
伝子配列における変異、選択的スプライシングを特定し、かつ遺伝子発現を定量化するた
めに使用される。Levin et al.(2009)Genome Biol.10
(10):R115(PMID19835606)によって実証されるように、標的化R
NA配列を採用して、選択された組の遺伝子における変異検出および融合発見を改善し、
かつ発現プロファイリングの定量的情報を保存することができる。
実施例17.臨床腫瘍試料の超深度配列決定による高感度かつ正確な変異呼び出し
【0894】
癌ゲノムの理解の急速な進歩および利用可能な標的療法数の増大は、包括的な腫瘍プロ
ファイリングに基づいて、効果的な癌治療の拡大する機会を提供する。研究セッティング
における次世代配列決定による腫瘍ゲノムを分析する実験的および計算的手法が著しく進
歩したが、これらの技術を診療所に拡大適用することは、重大なさらなる課題を提示する
。これらの課題の手がかりは、臨床検体の限定的な純度および異質性であり、その要件と
相まって、広範囲の臨床的に実用的な可能性のある変異に高感度および高精度を提供する
。
【0895】
この課題に対処するために、我々は、200個を超える癌関連遺伝子の超深度配列デー
タ(700倍超)を日常のFFPE腫瘍試料から生成することができる臨床試験、ならび
にこの深度を利用して低画分で存在する異なる種類の変異に高レベルの感度および精度を
提供することができる計算ツールを開発した。我々の分析パイプラインは、既知の変異頻
度を説明するマッピングされた配列データ中の短いバリアントを検出し、ブレークポイン
ト検出と局所アセンブリを合わせて代替の方法では頻繁に見逃されるより大きい挿入およ
び欠失を特定する。加えて、コピー数の変化および主要な癌遺伝子を含む再編成を特定す
る。
【0896】
我々が新たに開発した方法の分析性能を検証するために、我々は、異種DNAにおける
珍しい事象のモデルとして20個の正常なHapMap細胞株および28個の個別に特徴
付けられた癌細胞株を含む試料混合物の広範囲な研究を設計および実行した。我々は、混
合物の10%超に存在する置換に対して100%の感度および1~50bpのインデルに
対して90%を超える感度を報告し、両方ともに、PPVが99%を超える。我々の試験
の227個の黒色腫、前立腺、乳房、結腸、および肺腫瘍試料のコホートへの適用は、4
27個の既知の見込みのある体細胞ドライバ変異を示し、そのうちの40%は、20%お
よび18%未満、10%未満の試料画分に存在し、高感度の変異呼び出しの重要性を強調
した。
実施例18.切除縁における癌変異の検出
【0897】
腫瘍の縁の組織が組織学的に正常な場合でも、癌関連変異を検出することができること
が見出されている。過形成性結腸ポリープに関連した組織試料を三連構造としてBioS
erve(Beltsville,MD)から購入した。その三連構造は、末梢血液白血
球由来のゲノムDNA、正常な組織FFPE(ホルマリン固定パラフィン包埋)、および
腫瘍組織FFPEを含んだ。
【0898】
例えば、
増分的に試験した過形成性結腸ポリープの縁から単離された正常な結腸試料由来の6個
の切片において、ポリープから最も遠位の切片(切片1)ではKRAS変異は観察されな
かった。ポリープから2番目に遠位の切片(切片2)の細胞の1%、ポリープから3番目
に遠位の切片(切片3)の細胞の2%、ポリープから4番目に遠位の切片(切片4)の細
胞の3%、ポリープから5番目に遠位の切片(切片5)の細胞の4%、およびポリープに
最も近い切片(切片6)の細胞の5%においてKRAS p.G13D変異が観察された
。ポリープの縁由来の切片から単離された細胞の6%において変異が観察された。
【0899】
切片1、3、および5由来の組織試料のH&E染色から、癌組織の組織学的証拠は確認
されなかった。切片6由来の組織のH&E染色から、ポリープの存在が確認された。
【0900】
腫瘍の異質性が、遠位直腸由来の適度に分化した浸潤性の腺癌の切片で検出された。具
体的には、増分的に試験した切片1~6は、それぞれ、変異BRAF p.V600E、
TP53 p.R213X、BRCA1 c.2105delG、APC c.5541
insG、およびAPC c.6463delAを含んだ。
【0901】
これらの実験の結果は、切除縁での組織の遺伝子検査が癌組織または前癌組織の検出に
より敏感であることを示した。したがって、切除縁で組織の遺伝子検査を行うことによっ
て、例えば、本明細書に記載の配列決定方法によって、医療関係者は、より情報に基づい
てさらなる治療過程について提言することができる。例えば、遺伝子検査の結果に応じて
、さらなる治療を提言するか、またはそれ以上の治療を行わないことについて提言するこ
とができる。さらなる治療には、遺伝子検査によって特定された変異に基づいて、例えば
、化学治療もしくは放射線、またはそれら両方、あるいは化学治療の場合、特定の薬物も
しくは薬物の組み合わせ、または特定の投与レジメンが含まれ得る。
参照による組み込み
【0902】
本明細書で言及されるすべての出版物、特許、および特許出願は、それぞれの個別の出
版物、特許、または特許出願が参照により組み込まれると具体的かつ個別に示されるかの
ように、参照によりそれらの全体が本明細書に組み込まれる。矛盾が生じる場合、本明細
書における任意の定義を含めて、本出願が優先される。
【0903】
ワールドワイドウエブ上のtigr.orgにおいてゲノム研究期間(The Ins
titute for Genomic Research:TIGR)によって、およ
び/またはワールドワイドウエブ上のncbi.nlm.nih.govにおいて国立生
物工学情報センター(National Center for Biotechnol
ogy Information:NCBI)によって維持される公開データベース等の
公開データベースのエントリと相関する受入番号を参照する任意のポリヌクレオチドおよ
びポリペプチド配列も、参照によりそれらの全体が組み込まれる。
等価物
【0904】
当業者であれば、本明細書に記載の本発明の特定の実施形態に対する多くの等価物を理
解するか、または日常の実験のみを用いて確かめることができる。そのような等価物は、
以下の特許請求の範囲によって包含されるよう意図される。
【0905】
本発明は以下のものを含む。
[項1]
腫瘍試料を分析する方法であって、
(a)複数の腫瘍メンバーを含むライブラリを腫瘍試料から取得することと、
(b)前記ライブラリを複数のベイトセットと接触させて選択されたメンバーを提供し
、それによって、ライブラリ捕獲物を提供することと、
(c)サブゲノム間隔についての読み取りを前記ライブラリまたはライブラリ捕獲物か
らの腫瘍メンバーから取得することと、
(d)前記読み取りをアライメントすることと、
(e)事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド値を
複数のサブゲノム間隔のそれぞれにおいて割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
X個のヌクレオチド位置はそれぞれ、ステップ(b)、(c)、(d)、もしくは(e
)のうちの1つまたはそれらの組み合わせについて一意の組の条件下で分析され、Xは、
少なくとも10、20、30、40、50、100、200、300、もしくは500で
あり、一意とは、他のX-1個の組の条件とは異なることを意味する、
方法。
[項2]
第1のヌクレオチド位置が、第1の組のベイト条件、第1のアライメント方法、および
第1の変異呼び出し方法で分析され、
第2のヌクレオチド位置が、前記第1の組のベイト条件、第2のアライメント方法、お
よび前記第1の変異呼び出し方法で分析され、
第3のヌクレオチド位置が、前記第1の組のベイト条件、前記第1のアライメント方法
、および第2の変異呼び出し方法で分析され、
他の2つと比較して、それぞれ一意の条件下で分析された3個のヌクレオチド位置を提
供する、
請求項1に記載の方法。
[項3]
前記条件は、
第1のベイトセットが前記第1のサブゲノム間隔のために使用され、第2のベイトセッ
トが前記第2のサブゲノム間隔のために使用されること、
第1のアライメント方法が前記第1のサブゲノム間隔についての読み取りに適用され、
第2のアライメント方法が第2のサブゲノム間隔についての読み取りに適用されること、
または
第1の変異呼び出し方法が前記第1のサブゲノム間隔のヌクレオチド位置に適用され、
第2の変異呼び出し方法が前記第2のサブゲノム間隔のヌクレオチド位置に適用されるこ
と、
のうちの1つ以上を含む、請求項1に記載の方法。
[項4]
少なくとも2つのサブゲノム間隔におけるヌクレオチド位置が異なるベイトセットで分
析されること、
少なくとも2つのサブゲノム間隔におけるヌクレオチド位置が異なるアライメント方法
で分析されること、または
少なくとも2つのサブゲノム間隔におけるヌクレオチド位置が異なる変異呼び出し方法
で分析されること
のうちの1つ以上をさらに含む、請求項1に記載の方法。
[項5]
X個のヌクレオチド位置のそれぞれについて、前記ヌクレオチド位置で生じる事前選択
された変化の特性に応答して、前記ヌクレオチド位置は、一意の組の条件下で分析される
(一意とは、他のX-1個の組の条件とは異なることを意味し、Xは、少なくとも10、
20、30、40、50、100、200、300、または500である)、
請求項1に記載の方法。
[項6]
前記特性は、
(i)前記サブゲノム間隔に存在する変化の種類、
(ii)評価される前記ヌクレオチド位置の前記ヌクレオチド位置における配列または
その付近の配列が、前記サブゲノム間隔の予想される誤アライメント傾向に影響を及ぼし
得る配列を含むこと、
(iii)事前選択された腫瘍型の変化を示す読み取りを観察する先行予想、
(iv)塩基呼び出しエラーのみによる前記変化を示す読み取りを観察する確率、
(v)前記変化の検出に所望される事前選択された配列決定深度、または
(vi)(a)癌遺伝子もしくは腫瘍抑制遺伝子、または(b)事前選択された変化を
特徴とする遺伝子もしくは遺伝子型のうちの1つ以上から選択され得る、前記変化が位置
する遺伝子もしくは遺伝子型
のうちの1つ以上から選択され得る、請求項5に記載の方法。
[項7]
前記方法は、保存された腫瘍試料上で、少なくとも10、20、50、もしくは100
個のサブゲノム間隔におけるヌクレオチド位置に対して95、98、もしくは99%の感
度または特異性を可能にする条件下で行われる、請求項1に記載の方法。
[項8]
腫瘍試料を分析する方法であって、
(a)複数のメンバーを含むライブラリを腫瘍試料から取得することと、
(b)前記ライブラリを複数のベイトセットと接触させることによって事前選択された
配列の前記ライブラリを濃縮して、選択されたメンバーを提供し、それによって、ライブ
ラリ捕獲物を産生することと、
(c)サブゲノム間隔についての読み取りを次世代配列決定方法を用いて前記ライブラ
リまたはライブラリ捕獲物からの腫瘍メンバーから取得することと、
(d)前記読み取りをアライメント方法を用いてアライメントすることと、
(e)前記事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド
値を割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
X個の一意のサブゲノム間隔のそれぞれからの読み取りが、一意のアライメント方法で
アライメントされ、Xは、少なくとも2であり、
一意のサブゲノム間隔とは、他のX-1個のサブゲノム間隔とは異なることを意味し、
一意のアライメント方法とは、他のX-1個のアライメント方法とは異なることを意味す
る、
方法。
[項9]
Xは、少なくとも10、15、20、30、50、100、500、または1,000
である、請求項8に記載の方法。
[項10]
表1もしくは表1Aにおいて優先順位が1のアノテーションを有する少なくともX個の
遺伝子由来のサブゲノム間隔は、一意のアライメント方法でアライメントされ、Xは、1
0、15、20、または30に相当する、請求項8に記載の方法。
[項11]
a)第1の一意のアライメント方法を第1のゲノム間隔に適用することであって、前記
第1のゲノムのバリアントが腫瘍表現型に関連し、前記バリアントが表6の点変異である
ことと、
b)第2の一意のアライメント方法を第2のゲノム間隔に適用することであって、前記
第2のゲノムのバリアントが腫瘍表現型に関連し、前記バリアントが、表5の欠失、挿入
、または転座から選択される再編成であることと、
c)バリアントが前記試料の腫瘍表現型または前記腫瘍型に関連しないゲノム間隔を含
む第3のゲノム間隔に第3の一意のアライメント方法を適用することと、
を含む、請求項8に記載の方法。
[項12]
分析されるサブゲノム間隔は、再編成を有するヌクレオチド位置を含み、
事前選択された再編成とアライメントするように事前選択され、かつ前記ゲノム再編成
と同一ではない再編成参照配列を読み取りとのアライメントのために選択することと、
読み取りを前記事前選択された再編成参照配列と比較することと、
前記読み取りが、事前選択されたレベル未満のミスマッチまたはギャップを有する前記
事前選択された再編成参照に対するアライメントであるという、所定のアライメント基準
を満たすかを決定することと、を含むアライメント方法を用いることを含み、
それによって、読み取りを分析する、
請求項8に記載の方法。
[項13]
第1のアライメント方法は、マッチリワード、ミスマッチペナルティ、ギャップペナル
ティ、予想閾値、語長、フィルタ、またはマスクの値が第2のアライメント方法とは異な
る、請求項8に記載の方法。
[項14]
腫瘍試料を分析する方法であって、
(a)複数のメンバーを含むライブラリを腫瘍試料から取得することと、
(b)前記ライブラリを複数のベイトセットと接触させることによって事前選択された
配列の前記ライブラリを濃縮して、選択されたメンバーを提供し、それによって、ライブ
ラリ捕獲物を提供することと、
(c)サブゲノム間隔についての読み取りを前記ライブラリまたはライブラリ捕獲物か
らの腫瘍メンバーから取得することと、
(d)前記読み取りをアライメント方法を用いてアライメントすることと、
(e)前記事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド
値を割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
X個の一意のサブゲノム間隔においてそれぞれのヌクレオチド位置に対して割り当てら
れたヌクレオチド値は、一意の呼び出し方法を用いて割り当てられ、Xは、少なくとも2
であり、
一意のサブゲノム間隔とは、他のX-1個のサブゲノム間隔とは異なることを意味し、
一意の呼び出し方法とは、他のX-1個の呼び出し方法とは異なることを意味する、
方法。
[項15]
前記呼び出し方法は、第1のベイズ先行の関数である第1のヌクレオチド位置に適用さ
れる第1の呼び出し方法および第2のベイズ先行の関数である第2のヌクレオチド位置に
適用される第2の呼び出し方法から選択される異なるベイズ先行値に依存するという点で
異なり得る、請求項14に記載の方法。
[項16]
前記ヌクレオチド値の割り当ては、腫瘍型における前記事前選択されたヌクレオチド位
置で事前選択されたバリアント、例えば、変異を示す読み取りを観察する先行(例えば、
文献)予想であるか、またはそれを表す値の関数である、請求項14に記載の方法。
[項17]
前記方法は、少なくともX個(Xは、10、20、40、50、60、70、80、9
0、もしくは100である)の事前選択されたヌクレオチド位置に対するヌクレオチド値
を割り当てることを含み、それぞれの割り当ては、腫瘍型における前記事前選択されたヌ
クレオチド位置で事前選択されたバリアントを示す読み取りを観察する先行予想であるか
、またはそれを表す(他のX-1個の割り当ての値ではなく)一意の値の関数である、請
求項14に記載の方法。
[項18]
前記ヌクレオチド値の割り当ては、前記バリアントが前記試料中に10%未満の頻度で
存在する場合、および/または前記バリアントが不在である場合、前記事前選択されたヌ
クレオチド位置で前記事前選択されたバリアントを示す読み取りを観察する確率を表す一
組の値の関数である、請求項14に記載の方法。
[項19]
腫瘍試料の配列を分析する方法であって、
(a)サブゲノム間隔の複数の重複を取得することと、
(b)前記複数の重複のそれぞれについての読み取りを取得して、複数の重複読み取り
を提供することと、
(c)前記複数の重複読み取りにおけるそれぞれの第1のヌクレオチド位置での前記ヌ
クレオチド値を比較することと、
(d)前記複数の重複読み取りにおけるそれぞれの第2のヌクレオチド位置での前記ヌ
クレオチド値を比較することと、
(この場合において、前記ヌクレオチド位置の一方では、前記複数の読み取りがそれぞ
れ同一のヌクレオチド値を有さず、前記ヌクレオチド位置の他方では、前記複数の読み取
りがそれぞれ同一のヌクレオチド値を有する)
(e)品質スコアまたは重複調節されたヌクレオチド値を有する第1の分類子を、前記
ヌクレオチド値に前記複数の読み取りのすべてにおいて同一のヌクレオチド値を有しない
前記位置で割り当てることと、
(f)品質スコアまたは重複調節されたヌクレオチド値を有する第2の分類子を、前記
ヌクレオチド値に前記複数の読み取りのそれぞれにおいて同一のヌクレオチド値を有する
前記位置で割り当てることと、を含み、
前記第1の分類子は、それが割り当てられる前記ヌクレオチド値が正しいという第1の
レベルの品質または信頼度を示し、前記第2の分類子は、それが割り当てられる前記ヌク
レオチド値が正しいという第2のレベルの品質または信頼度を示し、前記第1のレベルは
、事前選択された基準以下である、
方法。
[項20]
腫瘍試料を分析する方法であって、
複数の腫瘍メンバーを含むライブラリを腫瘍試料から取得することとであって、選択さ
れたメンバーは、それによって、ライブラリ捕獲物を提供することと、
サブゲノム間隔についての読み取りを次世代配列決定方法を用いて前記ライブラリまた
はライブラリ捕獲物からの腫瘍メンバーから取得することと、
前記読み取りをアライメントすることと、
事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド値を複数の
サブゲノム間隔のそれぞれにおいて割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
前記方法は、
a)第1のサブゲノム間隔を配列決定して約500倍以上の配列決定深度を提供し、そ
れによって、前記試料由来の5%を超えない細胞に存在する変異を検出すること、
b)第2のサブゲノム間隔を配列決定して約200倍~約500倍の配列決定深度を提
供し、それによって、前記試料由来の10%を超えない細胞中に存在する変異を検出する
こと、
c)第3のサブゲノム間隔を配列決定して約10~100倍の配列決定深度を提供する
こと(この場合において、前記サブゲノム間隔は、a)異なる薬物を代謝する患者の能力
を見分ける薬理ゲノム(PGx)単一ヌクレオチド多型(SNP)、またはb)患者を一
意に特定するゲノムSNPのうちの1つ以上から選択される)、
d)第4のサブゲノム間隔を配列決定して約5~50倍の配列決定深度を提供し、構造
ブレークポイントを検出すること、あるいは
e)第5のサブゲノム間隔を配列決定して約100~300倍の配列決定深度を提供し
、コピー数の変化を検出する、例えば、ゲノムDNAのコピー数の獲得/喪失またはヘテ
ロ接合性の消失(LOH)を評価するために使用されるゲノムSNP/遺伝子座を検出す
ること
のうちの1つ、もしくは2、3、4、もしくは5つを含む、方法。
[項21]
腫瘍試料を分析する方法であって、
(a)複数の腫瘍メンバーを含むライブラリを腫瘍試料から取得することと、
(b)前記ライブラリをベイトセットと接触させて選択されたメンバーを提供し、それ
によって、ライブラリ捕獲物を提供することと、
(c)サブゲノム間隔についての読み取りを次世代配列決定方法を用いて前記ライブラ
リまたはライブラリ捕獲物からの腫瘍メンバーから取得することと、
(d)前記読み取りをアライメント方法を用いてアライメントすることと、
(e)前記事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド
値を割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
前記方法は、前記ライブラリを少なくとも2つ、3つ、4つ、または5つのベイトセッ
トと接触させることを含み、前記複数のベイトセットはそれぞれ、(前記複数の他のベイ
トセットではなく)一意の事前選択されたその標的選択効率を有する、
方法。
[項22]
前記複数のベイトセットのうちの第1のベイトセットの前記選択効率は、前記複数のベ
イトセットのうちの第2のベイトセットの前記効率とは少なくとも2倍異なる、請求項2
1に記載の方法。
[項23]
ある実施形態において、前記第1および第2のベイトセットは、少なくとも2倍異なる
配列決定深度を提供する。
[項24]
以下のうちの1つもしくは複数のベイトセットを前記ライブラリと接触させることを含
む、請求項21に記載の方法:
a)細胞のゲノムにおける前記試料由来のある変化を持つ前記細胞の約5%以下の頻度
で出現する前記変化を有するサブゲノム間隔を含む、1つ以上の腫瘍メンバーから選択さ
れる高レベルの標的を選択する第1のベイトセット、
b)細胞のゲノムにおける前記試料由来のある変化を持つ前記細胞の約10%という、
より高い頻度で出現する前記変化を有するサブゲノム間隔を含む、1つ以上の腫瘍メンバ
ーから選択される中間レベルの標的を選択する第2のベイトセット、
c)a)異なる薬物を代謝する患者の能力を見分ける薬理ゲノム(PGx)単一ヌクレ
オチド多型(SNP)、b)患者を一意に特定するゲノムSNP、c)ゲノムDNAのコ
ピー数の獲得/喪失およびヘテロ接合性の消失(LOH)を評価するために使用されるゲ
ノムSNP/遺伝子座のうちの1つ以上から選択されるサブゲノム間隔を含む1つ以上の
PGxメンバーから選択される低レベルの標的を選択する第3のベイトセット、
d)構造ブレークポイントを検出するイントロン配列を含むメンバーを選択する第4の
ベイトセット、または
e)いくつかの末端エクソンの1コピー欠失を選択する第5のベイトセット。
[項25]
前記選択効率値は、
(i)異なるベイトセットの差次的表示、
(ii)ベイトサブセットの差次的オーバーラップ、
(iii)差次的ベイトパラメータ、
(iv)異なるベイトセットを異なるモル比で混合して、相対標的対象範囲深度を強化
するか、または減少させること、
(v)異なる種類のオリゴヌクレオチドベイトを用いること、
のうちの1つ以上によって修正される、請求項21に記載の方法。
[項26]
異なる種類のオリゴヌクレオチドベイトは、
(a)1つ以上の化学的に(非酵素的に)個別に合成されたベイト、
(b)アレイで合成された1つ以上のベイト、
(c)1つ以上の生体外で転写されたベイト、
(d)(a)、(b)、および/もしくは(c)の任意の組み合わせ、
(e)1つ以上の自然発生もしくは非自然発生のDNAオリゴヌクレオチド、
(f)1つ以上の自然発生もしくは非自然発生のRNAオリゴヌクレオチド、
(g)(e)および(f)の組み合わせ、または
(h)上記の任意の組み合わせ
のうちの1つ以上から選択され得る、請求項25に記載の方法。
[項27]
前記異なる種類のオリゴヌクレオチドベイトは、1:1、1:2、1:3、1:4、1
:5、1:10、1:20、1:50、1:100、または1:1000から選択される
比率で混合される、請求項26に記載の方法。
[項28]
化学的に合成されたベイトとアレイで生成されたベイトの比率は、1:5、1:10、
または1:20から選択される、請求項27に記載の方法。
[項29]
前記非自然発生のDNAもしくはRNAオリゴヌクレオチドは、ロックド核酸(LNA
)、ペプチド核酸(PNA)、低GC領域を捕捉するように修飾されたDNAもしくはR
NAオリゴヌクレオチド、二環式核酸(BNA)、架橋オリゴヌクレオチド、修飾された
5-メチルデオキシシチジン、または2,6-ジアミノプリンのうちの1つ以上から選択
される、請求項26に記載の方法。
[項30]
以下のベイトパラメータのうちの1つ以上が修正される、請求項21に記載の方法:
(i)ベイト表示またはオーバーラップの増加/減少が、同一のカテゴリー内の他の標
的と比較して不十分に/過度に対象とされる腫瘍メンバーの対象範囲を強化する/減少さ
せるために使用され得ること、
(ii)標的配列(高GC含量配列を含む)を捕捉するのが困難な低対象範囲の場合、
隣接配列を対象範囲とするベイトセットで標的化すること、
(iii)ベイト配列の修正が、前記ベイトの二次構造を減少させ、かつその選択効率
を強化するために行われ得ること、
(iv)ベイト長の修正が、同一のカテゴリー内の異なるベイトの融解ハイブリダイゼ
ーション動態を均等化するために使用されること、
(v)同一の標的領域(順方向鎖および逆方向鎖)に対して異なる配向を有するベイト
の修正が、異なる結合効率を有し得ること、
(vi)それぞれのベイト上に存在する結合実体の量の修正が、その結合効率に影響を
及ぼし得ること、特定の標的を標的化するベイトのタグレベルの増加/減少が、相対的な
標的の対象範囲を強化する/減少させるために使用され得ること、
(vii)異なるベイトに使用されるヌクレオチドの前記種類の修正が、前記標的に対
する結合親和性に影響を及ぼし、かつ相対的な標的の対象範囲を強化する/減少させるよ
うに変更され得ること、または
(viii)より安定した塩基対合を有する修飾されたオリゴヌクレオチドベイトが、
高GC含量と比較して低いか、もしくは標準的なGC含量の領域間の融解ハイブリダイゼ
ーション動態を均等化するために使用され得ること。
[項31]
前記ベイトセットは、以下のA~Mのうちの1、2、3、4、5、6、7、8、9、1
0、11、12個、もしくはすべてから選択される、請求項21に記載の方法:
A.癌表現型に関連した単一ヌクレオチド変化を含むエクソン配列を選択するベイトセ
ット、
B.参照ヌクレオチド配列由来の1、2、3、4、5、6、7、8、9、10、11、
12、13、14、15、16、17、18、19、20個、またはそれ以上のコドンの
インフレーム欠失を選択するベイトセット、
C.遺伝子内欠失を選択するベイトセット、
D.遺伝子内挿入を選択するベイトセット、
E.全遺伝子の欠失を選択するベイトセット、
F.逆位を選択するベイトセット、
G.染色体間転座を選択するベイトセット、
H.タンデム重複を選択するベイトセット、
I.非反復隣接配列に隣接する目的とするヌクレオチド配列を選択するベイトセット、
J.融合配列に対応する1つ以上のサブゲノム間隔を選択するベイトセット、
K.高GC含量のヌクレオチド配列または1つ以上の反復要素および/もしくは逆位反
復を含むヌクレオチド配列から選択される望ましくない特徴を含むヌクレオチド配列に隣
接したサブゲノム間隔を選択するベイトセット、
L.5’もしくは3’-UTR由来のイントロン配列を含むゲノム再編成を選択するベ
イトセット、あるいは
M.癌関連遺伝子融合体に隣接してエクソンを含むサブゲノム間隔を選択するベイトセ
ット。
[項32]
前記ベイトセットは、約100ヌクレオチド長~300ヌクレオチド長の複数のオリゴ
ヌクレオチドを含む、請求項31に記載の方法。
[項33]
前記サブゲノム間隔は、単一ヌクレオチド位置;遺伝子内領域もしくは遺伝子間領域;
エクソンもしくはイントロン、またはそれらの断片、典型的には、エクソン配列またはそ
の断片;コード領域もしくは非コード領域、例えば、プロモーター、エンハンサー、5’
非翻訳領域(5’UTR)もしくは3’非翻訳領域(3’UTR)、またはそれらの断片
;cDNAまたはその断片;SNP;体細胞変異、生殖細胞変異、もしくはそれら両方;
変化、例えば、点変異もしくは単一変異;欠失変異;インフレーム欠失、遺伝子内欠失、
全遺伝子欠失;挿入変異;遺伝子内挿入;逆位変異;染色体内逆位;連鎖変異;連鎖され
た挿入変異;逆位重複変異;タンデム重複;染色体内タンデム重複;転座;染色体転座、
非相反転座;再編成;ゲノム再編成;1つ以上のイントロンもしくはその断片の再編成;
再編成されたイントロン(5’-もしくは3’-UTRを含む);あるいはそれらの組み
合わせのうちの1つ以上を含むか、またはそれらからなる、請求項1~32のいずれかに
記載の方法。
[項34]
前記腫瘍メンバーは、癌に関連付けられるか、または抗癌治療に対する応答性を予測す
る1つ以上の変化を含む、請求項1~32のいずれかに記載の方法。
[項35]
前記変化は、正常かつ健康な組織または細胞と比較して、癌組織または癌細胞における
ヌクレオチド配列の変化、アミノ酸配列の変化、染色体転座、染色体内逆位、コピー数の
変化、発現レベルの変化、タンパク質レベルの変化、タンパク質活性の変化、またはメチ
ル化状態の変化を含む、請求項34に記載の方法。
[項36]
前記変化は、癌の危険性、癌進行、癌治療、もしくは癌治療に対する耐性;癌の遺伝的
危険因子;正の治療応答予測因子;負の治療応答予測因子;正の予後因子;負の予後因子
;または診断因子のうちの1つ以上に関連する(または関連しない)、請求項34に記載
の方法。
[項37]
前記腫瘍試料は、1つ以上の前悪性もしくは悪性細胞;固形腫瘍、軟組織腫瘍、もしく
は転移病巣由来の細胞;切除縁由来の組織もしくは細胞;組織学的に正常な組織;1つ以
上の循環腫瘍細胞(CTC);正常な隣接組織(NAT);前記腫瘍を有するか、または
有する危険性のある同一の対象由来の血液試料を含む、請求項1~32のいずれかに記載
の方法。
[項38]
前記腫瘍試料は、FFPE試料である、請求項37に記載の方法。
[項39]
前記方法は、腫瘍試料から取得されたRNA由来のcDNAの配列決定を含む、請求項
1~32のいずれかに記載の方法。
[項40]
DNA配列決定ステップおよびRNA配列決定ステップを行うことをさらに含む、請求
項39に記載の方法。
[項41]
前記変化を含む遺伝子または遺伝子産物のレベルの変化を検出すること、標的RNAに
ついて試料を濃縮すること、または前記試料から、ある程度高い存在量のRNAを枯渇さ
せることのうちの1つ以上から選択されるステップをさらに含む、請求項40に記載の方
法。
[項42]
(i)前記核酸試料をフィンガープリントすること、
(ii)遺伝子もしくは遺伝子産物の存在量を定量化すること、
(iii)前記試料中の転写物の相対存在量を定量化すること、
(iv)特定の対象に属するとして前記核酸試料を特定すること、
(v)対象の遺伝的構成、民族性、人種、もしくは家族性形質のうちの1つ以上を含む
前記核酸試料の遺伝形質を特定すること、
(vi)前記核酸試料の倍数性を決定すること、
(vii)前記核酸試料におけるヘテロ接合性の消失を決定すること、
(viii)前記核酸試料における遺伝子重複事象の存在もしくは不在を決定すること
、
(ix)前記核酸試料における遺伝子増幅事象の存在もしくは不在を決定すること、ま
たは
(x)前記核酸試料中の腫瘍/正常な細胞混合物のレベルを決定すること、
のうちの1つ以上をさらに含む、請求項20~32のいずれかに記載の方法。
[項43]
前記試料由来の少なくとも5、6、7、8、9、10、15、20、25、30個、も
しくはそれ以上の遺伝子または遺伝子産物由来のサブゲノム間隔を配列決定することを含
み、前記遺伝子または遺伝子産物は、ABL1、AKT1、AKT2、AKT3、ALK
、APC、AR、BRAF、CCND1、CDK4、CDKN2A、CEBPA、CTN
NB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FL
T3、HRAS、JAK2、KIT、KRAS、MAP2K1、MAP2K2、MET、
MLL、MYC、NF1、NOTCH1、NPM1、NRAS、NTRK3、PDGFR
A、PIK3CA、PIK3CG、PIK3R1、PTCH1、PTCH2、PTEN、
RB1、RET、SMO、STK11、SUFU、またはTP53から選択される、請求
項1~32のいずれかに記載の方法。
[項44]
以下うちの少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13
個、もしくはすべてから選択されるサブゲノム間隔を配列決定することを含む、請求項1
~32のいずれかに記載の方法:
A)ABL1、AKT1、AKT2、AKT3、ALK、APC、AR、BRAF、C
CND1、CDK4、CDKN2A、CEBPA、CTNNB1、EGFR、ERBB2
、ESR1、FGFR1、FGFR2、FGFR3、FLT3、HRAS、JAK2、K
IT、KRAS、MAP2K1、MAP2K2、MET、MLL、MYC、NF1、NO
TCH1、NPM1、NRAS、NTRK3、PDGFRA、PIK3CA、PIK3C
G、PIK3R1、PTCH1、PTCH2、PTEN、RB1、RET、SMO、ST
K11、SUFU、もしくはTP53のうちの少なくとも5つ以上から選択される変異ま
たは野生型遺伝子もしくは遺伝子産物由来の少なくとも5、6、7、8、9、10、15
、20、25、30個、もしくはそれ以上のサブゲノム間隔、
B)ABL2、ARAF、ARFRP1、ARID1A、ATM、ATR、AURKA
、AURKB、BAP1、BCL2、BCL2A1、BCL2L1、BCL2L2、BC
L6、BRCA1、BRCA2、CBL、CARD11、CBL、CCND2、CCND
3、CCNE1、CD79A、CD79B、CDH1、CDH2、CDH20、CDH5
、CDK6、CDK8、CDKN2B、CDKN2C、CHEK1、CHEK2、CRK
L、CRLF2、DNMT3A、DOT1L、EPHA3、EPHA5、EPHA6、E
PHA7、EPHB1、EPHB4、EPHB6、ERBB3、ERBB4、ERG、E
TV1、ETV4、ETV5、ETV6、EWSR1、EZH2、FANCA、FBXW
7、FGFR4、FLT1、FLT4、FOXP4、GATA1、GNA11、GNAQ
、GNAS、GPR124、GUCY1A2、HOXA3、HSP90AA1、IDH1
、IDH2、IGF1R、IGF2R、IKBKE、IKZF1、INHBA、IRS2
、JAK1、JAK3、JUN、KDM6A、KDR、LRP1B、LRP6、LTK、
MAP2K4、MCL1、MDM2、MDM4、MEN1、MITF、MLH1、MPL
、MRE11A、MSH2、MSH6、MTOR、MUTYH、MYCL1、MYCN、
NF2、NKX2-1、NTRK1、NTRK2、PAK3、PAX5、PDGFRB、
PKHD1、PLCG1、PRKDC、PTPN11、PTPRD、RAF1、RARA
、RICTOR、RPTOR、RUNX1、SMAD2、SMAD3、SMAD4、SM
ARCA4、SMARCB1、SOX10、SOX2、SRC、TBX22、TET2、
TGFBR2、TMPRSS2、TNFAIP3、TNK、TNKS2、TOP1、TS
C1、TSC2、USP9X、VHL、もしくはWT1のうちの少なくとも5つ以上から
選択される変異または野生型遺伝子もしくは遺伝子産物由来の少なくとも5、6、7、8
、9、10、15、20、25、30、35、40、45、50、55、60、65、7
0、75、80、85、90、95、100、105、110、115、120個、もし
くはそれ以上のサブゲノム間隔、
C)表1、1A、2、3、もしくは4に記載の遺伝子または遺伝子産物由来の少なくと
も5、6、7、8、9、10、15、20個、もしくはそれ以上のサブゲノム間隔、
D)ABL1、AKT1、ALK、AR、BRAF、BRCA1、BRCA2、CEB
PA、EGFR、ERBB2、FLT3、JAK2、KIT、KRAS、MET、NPM
1、PDGFRA、PIK3CA、RARA、AKT2、AKT3、MAP2K4、NO
TCH1、およびTP53のうちの1つ以上から選択される遺伝子または遺伝子産物由来
の少なくとも5、6、7、8、9、10、15、20個、もしくはそれ以上のサブゲノム
間隔、
E)前記ABL1遺伝子のコドン315;APCのコドン1114、1338、145
0、もしくは1556;BRAFのコドン600;CTNNB1のコドン32、33、3
4、37、41、もしくは45;EGFRのコドン719、746~750、768、7
90、858、もしくは861;FLT3のコドン835;HRASのコドン12、13
、もしくは61;JAK2のコドン617;KITのコドン816;KRASのコドン1
2、13、もしくは61;PIK3CAのコドン88、542、545、546、104
7、もしくは1049;PTENのコドン130、173、233、もしくは267;R
ETのコドン918;TP53のコドン175、245、248、273、もしくは30
6のうちの1つ以上から選択される変異コドンまたは野生型コドンを含む少なくとも5、
6、7、8、9、10個、もしくはそれ以上のサブゲノム間隔、
F)ABCB1、BCC2、ABCC4、ABCG2、C1orf144、CYP1B
1、CYP2C19、CYP2C8、CYP2D6、CYP3A4、CYP3A5、DP
YD、ERCC2、ESR2、FCGR3A、GSTP1、ITPA、LRP2、MAN
1B1、MTHFR、NQO1、NRP2、SLC19A1、SLC22A2、SLCO
1B3、SOD2、SULT1A1、TPMT、TYMS、UGT1A1、もしくはUM
PSから選択される変異または野生型遺伝子もしくは遺伝子産物由来の少なくとも5、6
、7、8、9、10、15、20、25、30個、もしくはそれ以上のサブゲノム間隔、
G)(i)薬物で治療された癌患者のより良好な生存率、(ii)パクリタキセル代謝
、(iii)薬物毒性、もしくは(iv)薬物の副作用のうちの1つ以上に関連した変異
または野生型PGx遺伝子もしくは遺伝子産物由来の少なくとも5、6、7、8、9、1
0、15、20、25、30個、もしくはそれ以上のサブゲノム間隔、
H)表3に記載の少なくとも5、10、15、20、25、30、35、40、45、
50、75、110個、もしくはそれ以上の遺伝子または遺伝子産物の転座変化、
J)表3に明記される前記癌型由来の固形腫瘍試料における、表3に記載の少なくとも
5、10、15、20、25、30、35、40、45、50、75、110個、もしく
はそれ以上の遺伝子または遺伝子産物の転座変化、
K)表4に記載の少なくとも5、10、15、20、25、30、35、40、45、
50、75、100、150、200個、もしくはそれ以上の遺伝子または遺伝子産物の
転座変化、
L)表4に明記される前記癌型由来のヘム腫瘍試料における、表4に記載の少なくとも
5、10、15、20、25、30、35、40、45、50、75、100、150、
200個、もしくはそれ以上の遺伝子または遺伝子産物の転座変化、
M)対立遺伝子変異が事前選択された腫瘍型に関連し、前記対立遺伝子変異が前記腫瘍
型の前記細胞の5%未満に存在する、表1、表1A-4から選択される少なくとも5個の
遺伝子もしくは遺伝子産物、
N)GCが豊富な領域に埋め込まれる表1、表1A-4から選択される少なくとも5個
の遺伝子もしくは遺伝子産物、あるいは
O)BRCA1、BRCA2、EGFR、HRAS、KIT、MPL、ALK、PTE
N、RET、APC、CDKN2A、MLH1、MSH2、MSH6、NF1、NF2、
RB1、TP53、VHL、もしくはWT1のうちの1つ以上から選択される癌を発現さ
せる遺伝因子を示す少なくとも5個の遺伝子もしくは遺伝子産物。
[項45]
以下のA~Mのうちの1、2、3、4、5、6、7、8、9、10、11、12個、も
しくはすべてから選択される、複数のベイトセット:
A.癌表現型に関連した単一ヌクレオチド変化を含むエクソン配列を選択するベイトセ
ット、
B.参照ヌクレオチド配列由来の1、2、3、4、5、6、7、8、9、10、11、
12、13、14、15、16、17、18、19、20個、もしくはそれ以上のコドン
のインフレーム欠失を選択するベイトセット、
C.遺伝子内欠失を選択するベイトセット、
D.遺伝子内挿入を選択するベイトセット、
E.全遺伝子の欠失を選択するベイトセット、
F.逆位を選択するベイトセット、
G.染色体間転座を選択するベイトセット、
H.タンデム重複を選択するベイトセット、
I.非反復隣接配列に隣接する目的とするヌクレオチド配列を選択するベイトセット、
J.融合配列に対応する1つ以上のサブゲノム間隔を選択するベイトセット、
K.高GC含量ヌクレオチド配列または1つ以上の反復要素および/もしくは逆位反復
を含むヌクレオチド配列から選択される望ましくない特徴を含むヌクレオチド配列に隣接
したサブゲノム間隔を選択するベイトセット、
L.5’もしくは3’-UTR由来のイントロン配列を含むゲノム再編成を選択するベ
イトセット、あるいは
M.癌関連遺伝子融合物に隣接してエクソンを含むサブゲノム間隔を選択するベイトセ
ット。
[項46]
請求項45に記載のベイトセットを作製する方法であって、
前記サブゲノム間隔に対応する1つ以上の腫瘍ベイトオリゴヌクレオチド配列を選択す
ることと、
腫瘍ベイトオリゴヌクレオチド配列のプールを得ることと、
を含む、方法。
[項47]
癌表現型と正もしくは負に関連した変化の存在または不在を決定するための方法であっ
て、
(a)複数の腫瘍メンバーを含むライブラリを腫瘍試料から取得することと、
(b)前記ライブラリを複数のベイトセットと接触させることによって事前選択された
配列の前記ライブラリを濃縮して、選択されたメンバーを提供することと、
(c)サブゲノム間隔についての読み取りを次世代配列決定方法を用いて前記ライブラ
リからの腫瘍メンバーから取得することと、
(d)前記読み取りをアライメント方法を用いてアライメントすることと、
(e)前記事前選択されたヌクレオチド位置に対する前記読み取りからのヌクレオチド
値を割り当てることと、を含み、
それによって、前記腫瘍試料を分析し、
前記方法は、前記試料由来の少なくとも20、25、30個、もしくはそれ以上の遺伝
子または遺伝子産物由来のサブゲノム間隔を配列決定することを含み、前記遺伝子または
遺伝子産物は、ABL1、AKT1、AKT2、AKT3、ALK、APC、AR、BR
AF、CCND1、CDK4、CDKN2A、CEBPA、CTNNB1、EGFR、E
RBB2、ESR1、FGFR1、FGFR2、FGFR3、FLT3、HRAS、JA
K2、KIT、KRAS、MAP2K1、MAP2K2、MET、MLL、MYC、NF
1、NOTCH1、NPM1、NRAS、NTRK3、PDGFRA、PIK3CA、P
IK3CG、PIK3R1、PTCH1、PTCH2、PTEN、RB1、RET、SM
O、STK11、SUFU、またはTP53から選択される、
方法。
[項48]
電子形態、ウェブベース形態、または書面形態で、報告書を、前記患者、または別の人
物もしくは事業体、介護人、医師、癌専門医、病院、診療所、第三者支払人、保険会社、
または官庁に提供することをさらに含む、請求項1~32のいずれかに記載の方法。
[項49]
前記報告書は、前記方法からの出力を含み、ヌクレオチド値の特定、前記試料の前記腫
瘍型に関連したサブゲノム間隔における変化、変異、または野生型配列の存在もしくは不
在の指標を含む、請求項48に記載の方法。
[項50]
前記報告書は、疾患における配列、変化、変異、または野生型配列の役割に関する情報
を含み、前記情報は、予後、耐性、または可能性のある治療選択肢もしくは推奨される治
療選択肢に関する情報を含む、請求項48に記載の方法。
[項51]
前記報告書は、試験で特定され、かつ実施形態において、前記報告書で特定された治療
選択肢の見込みのある有効性、治療選択肢の容認性、または配列、変化、もしくは変異を
有する患者への前記治療選択肢の適用の推奨度に関する情報を含む、請求項48に記載の
方法。
[項52]
前記報告書は、薬物の投与、他の薬物と組み合わせた事前選択された投与量または事前
選択された治療レジメンでの前記患者への投与に関する情報もしくは提言を含み得る、請
求項48に記載の方法。
[項53]
前記方法で特定されたすべての変異が前記報告書で特定されるわけではなく、前記報告
書は、事前選択された治療選択肢を用いて、治療される前記癌の発生、予後、病期、また
は感受性と事前選択されたレベルの相関関係を有する遺伝子における変異に限定され得る
、請求項48に記載の方法。
[項54]
前記報告書は、前記方法を実践する事業体が前記試料を受領してから7、14、もしく
は21以内に前記患者または別の人物もしくは前記事業体に提供される、請求項48に記
載の方法。
【配列表】
【外国語明細書】