【実施例】
【0072】
標的DNAの配列決定を行うための新規アプローチを以下に提示する。本方法は、標的DNA捕捉デバイスとしての役割を果たすように、固相支持体上で汎用プライマー
叢(lawn)(すなわち、ランダムに分布された少なくとも2つのプライマーを含有する
叢)を修飾し、サンプルを大幅に操作することなく、捕捉されたDNAの直接的な配列決定を可能にすることに基づく。本方法は、関連する流体プラットフォームを用いて、標的DNAの捕捉と配列決定実験のシームレスな統合を可能にする。このアプローチは、その配列決定の可能性を維持しながら、固相支持体上でDNA捕捉基質としての役割を果たす普遍的プライマー
叢を使用する。本方法は、配列決定のための鋳型として未処理の天然DNAを使用することができる。この方法を使用した配列決定は、必ずしも研究施設に依存するわけではない。さらに、サンプル処理の間に導入されるあらゆるバイアスが回避され、他の方法と比較してより少ない時間および低コストで実質的により小さなサンプルを分析することができる。本方法は、一本鎖および二本鎖の鋳型を分析するために使用することができる。一本鎖DNA鋳型を分析する能力は、病理学アーカイブからのホルマリン固定パラフィン包埋サンプルを使用するいくつかの配列決定用途にとって重要であり得る。同様に、一本鎖DNA鋳型による配列決定を可能にすることにより、本方法は、複雑な核酸抽出ステップ、およびDNAの二本鎖編成を保存するように設計された高価な断片化機器を必要としない。むしろ、廉価かつ効率的な溶解および加熱による断片化によってサンプルを調製することができる。単純な捕捉・配列決定アッセイは、ヒトゲノムDNAに限定されず、細菌およびウイルスのDNAおよびRNA等の他の核酸基質も分析することができる。トランスクリプトーム、非翻訳領域、およびmiRNAも、捕捉および配列決定することができる。また、ヌクレオチド配列の捕捉および配列決定、他の遺伝子特性およびエピジェネティックな特性(DNAメチル化、大きなゲノムの再編成、および遺伝子発現等)も調べることができる。本方法は、集団から合成DNAを選択するためにも用いることができる。
【0073】
一般的に、配列決定は、DNAサンプルが、配列決定システム上での分析を促進するように構造的に修飾されるプロセスとして見なされてきた。以下に記載する方法は、配列決定システムを修飾するため、サンプルを修飾して大規模に調製する必要がない。合成DNAを使用して汎用プライマー
叢を官能基化することにより、未処理サンプルの標的遺伝子のオリゴヌクレオチドライブラリーを直接的にアッセイすることができる。非特異的捕捉を減少させるために、ブリッジ構造の形成において用いられる配列を提供する特異的DNA構成要素を経時的に導入すると、プライマー
叢自体が修飾される。あらゆる種類のシーケンサーのための配列決定用ライブラリーの調製は、特異的二本鎖アダプター配列をDNA鋳型に付加することに依存する。捕捉オリゴヌクレオチドが固体支持体上に固定化されたアダプターとしての役割を果たしたため、アッセイのためのライブラリーの調製は、単一アダプターの付加を必要とするだけであった。これによって、サンプル処理が実質的に短縮され、クローン増幅またはゲル電気泳動に基づくサイズ分別が不要となる。特定の場合において、固体支持体上で捕捉された鋳型に第2のアダプターが付加されてもよい。本方法の特定の実施形態は、配列決定用の鋳型としての粗DNAの使用を可能にする。
【0074】
ハイスループットな再配列決定を行うためのいくつかの現在の方法は、標的DNAを捕捉することおよび配列決定することを別個の方法として含む。これは、特定の場合において、以下を含む複数の問題を引き起こす可能性がある:i)大幅な労働集約的および時間集約的なDNA材料の操作、ii)複雑な実験プロトコルに伴う誤差、iii)選択および分子増幅プロセスによって生じるバイアス、ならびにiv)大量の出発材料の必要性。以下に記載する方法は、事前のサンプル操作をほとんどまたは全く伴わず、完全に自動化可能であり、拡張性が高いため、これらの問題のうちの多くの源を排除すると考えられる。
【0075】
概念実証として、アッセイは再現性があり、ゲノムの特異的領域を捕捉および配列決定するために使用することができることを示すために、ヒトゲノム中の10個の癌遺伝子の全てのエクソンが配列決定された。このアッセイ技術は、Illumina社のGenome Analyzerを用いて証明したが、このアプローチは、固相支持体を使用するいずれのシーケンサーにも広く適用可能であることに留意されたい。
【0076】
以下に記載する方法(それらの原則のうちのいくつかを
図1に例示する)は、任意の標的DNA配列を効率的に捕捉するために使用することができ、捕捉されたゲノム断片の直接的な配列決定を可能にする。単純な加熱による断片化ステップによってゲノムDNAサンプルを配列決定のために調製することができ、アッセイ全体を完全に自動化して固体支持体上で行うことが可能である。捕捉およびその後の反応は、流体システムによって媒介することができる。
【0077】
追加の実施形態は、断片化DNAを鋳型として使用すること、および流体システムを使用して、捕捉されたDNA断片に配列決定アダプターを付加することにより、固体支持体上での配列決定のためにDNA断片の調製を可能にする方法を提供する。概念実証として、Illumina社の次世代DNAシーケンサーを使用してこれらのアプローチを開発した。プライマー
叢の修飾およびヒトゲノム中の366ヶ所の標的部位を使用した、統合された捕捉および配列決定調製反応の結果を提示する。25分間の加熱による断片化を除いて、全てのステップをIllumina社のフローセルの固相支持体上で行うことができる。
【0078】
以下に記載するデータは、アッセイのロバスト性、ならびに捕捉基質としての普遍的プライマー
叢および流体システムの適用性を証明するものである。本方法がロバストに作用することを可能にする、プライマー
叢の修飾の特有のパラメータを同定した。複雑な真核生物のゲノムに加えて、本方法は、真菌および他の微生物のゲノム、ウイルスのDNAおよびRNA、異なる源のトランスクリプトーム、ならびに合成DNAを捕捉するためにも適用できる。さらに、流体システムの固体支持体上に固定化された未変性のプライマー
叢を「プログラミング」して、特異的な用途を実行するという概念を導入して立証した。
【0079】
材料および方法
ゲノムDNAサンプル Coriell InstituteからNA18507のゲノムDNAを得た。結腸直腸癌患者から新鮮な冷凍組織サンプルを得た。Stanford Cancer Centerからインフォームドコンセントとともに患者材料を得、試験はStanford University School of Medicineの治験審査委員会(IRB)によって承認された。冷凍組織片を調製し、ヘマトキシリン・エオシン染色を行い、病理学的検査により各サンプルの腫瘍組成を決定した。細胞組成がそれぞれ90%腫瘍であるかまたは純粋に正常である領域から腫瘍組織および正常組織を代表するサンプルを切除した。E.Z.N.A SQ DNA/RNA Protein Kit(Omega Bio−Tek、Norcross,GA)を使用してゲノムDNAを抽出した。SNP6.0アレイ(Affymetrix、Santa Clara,CA)を使用してサンプルを分析するために、DNAの調製、アレイハイブリダイゼーション、および走査のための標準プロトコルを使用した。Genotyping ConsoleソフトウェアおよびBirdseed V2アルゴリズム(Affymetrix)を使用してデータ分析を行った。SNPコールの品質を評価するために、試験サンプルと合わせて13個の追加のマイクロアレイデータセットを分析した。P値の閾値0.01を用いてSNP6.0アレイデータをフィルタリングした。
【0080】
標的選択およびコンピュータによるOS−Seqオリゴヌクレオチドの設計 CCDS Build Release 20090902、NCBIのヒトゲノムBuild37
−hg19、およびdbSNP Build ID131を多型参照データセットとして使用した。遺伝子選択のために、GeneRankerアノテーションデータベースを使用して、重要性によって優先順位をつけた344個の癌遺伝子を選択した。オリゴヌクレオチドの標的特異的配列を検索するために、候補遺伝子のためのエクソンの定義をCCDSから採択した。標的エクソン(500bp未満)のほとんどにおいて、40−mer標的特異的配列が、エクソン境界の5’末端の10塩基外側にあった(
図3a)。個々のプライマー・プローブを使用してエクソンの両方の鎖を標的とした。OS−Seq−366は、エクソンの隣接領域のみを覆っていた。OS−Seq−11kアッセイにおいて、エクソン領域全体が覆われるまで標的特異的配列をタイリングすることにより、500bpよりも大きいエクソンを処理した(
図3b)。OS−Seq−11kのオンターゲット特異性を向上させるために、Repbaseを使用して反復性の高い配列を標的とするオリゴヌクレオチド配列を同定し、排除した。
【0081】
オリゴヌクレオチドの合成 オリゴヌクレオチドの合成には2つのストラテジーを適用した。OS−Seq−366の場合、366個の101−merオリゴヌクレオチドを設計し(
図5a)、次いでカラム合成を行った(Stanford Genome Technology Center、Stanford,CA)(
図4a)。オリゴヌクレオチドを定量化し、等モル濃度でプールした。OS−Seq−11kの場合、インサイツのマイクロアレイ合成(LC Sciences、Houston)アプローチを使用して、11,742個の前駆体オリゴヌクレオチドを合成した(
図5b)。標的特異的オリゴヌクレオチドの配列を下の表2に示す。
【0082】
マイクロアレイ合成を行ったオリゴヌクレオチドの増幅 前駆体80−merオリゴヌクレオチドの3つの25μlサブプールを使用した(587、638、および415nM)(
図5b)。PCRアプローチを用いて前駆体である低濃度オリゴヌクレオチドを増幅した(
図4b)。アレイ合成オリゴヌクレオチドのサブプールを10fM/オリゴに希釈し、PCR増幅のための鋳型として使用した。標準的な反応条件でTaq DNAポリメラーゼ(NEB)およびdNTP(1mM dATP、1mM dCTP、1mM cGTP、500nM dTTP、および500nM dUTP)を使用してPCRを行った。95℃で30分間変性させた後、20回の増幅サイクル(95℃で30秒、55℃で30秒、68℃で30秒)を行った。増幅プライマー1は、3’末端にウラシルを含有し、増幅プライマー2には追加の機能配列を組み込んだ(
図5b)。増幅したオリゴヌクレオチドを精製して余分なプライマーを除去し(Fermentas)、次いで、0.1U/μlのUracil−DNA Excision Mix(Epicentre、Madison,WI)を使用して37℃で45分間処理して普遍的増幅プライマー部位を剥離し、オリゴヌクレオチドの成熟101−merコード鎖を切断した。プライマー・プローブ固定化の間に標的特異的部位を正確に伸長させるために、オリゴヌクレオチドの5’末端は、機能的であり、かつ遊離していなければならない。熱ショックによる酵素の不活性化(65℃、10分)の後、オリゴヌクレオチド調製物を精製した(Fermentas)。最後に、3つのオリゴヌクレオチドのサブプールを定量化し、各サブプールが等モル濃度の単一プールを作製した。
【0083】
フローセルプライマー
叢の修飾によるOS−Seqプライマー・プローブの合成 Illumina社のGenome Analyzer IIx(Illumina、San Diego)システムにおいて、固相支持体(すなわち、フローセル)は、ポリアクリルアミド層上に極めて高密度でランダムに固定化された2つのプライマー(「C」および「D」)を有する。OS−Seq実験のために、Illumina社のCluster Stationを使用して「D」プライマーのサブセットを特異的に修飾した。NGSプライマー修飾の前に、133nMオリゴヌクレオチドのプールを95℃で5分間熱変性させた。熱ショック(95℃で5分間)を用いてOS−Seqオリゴヌクレオチドのコード鎖を遊離させた。第2の鎖はフローセル上で不活性であり、ハイブリダイゼーション後に洗浄されたため、さらなる鎖の精製は必要なかった。変性オリゴヌクレオチドを4xハイブリダイゼーションバッファー(20xSSC、0.2%Tween−20)で希釈した。得られた100nMオリゴヌクレオチドをフローセル修飾実験に使用した。30μlのオリゴヌクレオチド混合物をフローセルの各レーンに分注した。温度勾配(18分間で96℃から40℃)の間に、オリゴヌクレオチドは、固定化プライマー「D」に特異的にアニールした。次いで、アニールしたオリゴヌクレオチドを鋳型として「D」プライマーを伸長させるためにDNAポリメラーゼを使用した。伸長後、元のオリゴヌクレオチド鋳型を伸長させた「D」プライマーから変性させ、固相支持体から洗浄した。伸長、洗浄、および変性ステップには標準的なIllumina社のv4試薬を使用した。プライマー「D」の修飾によって、プライマー・プローブの固定化がもたらされた。
【0084】
配列決定用ライブラリーの調製 OS−Seq配列決定用ライブラリーの調製において用いられるゲノムDNA断片化、末端修復、A−テーリング、アダプターライゲーション、およびPCRの概略的スキームを
図2に要約する。NA18507からのゲノムDNA1μgおよび瞬間冷凍した直腸結腸癌サンプルを出発材料として使用した。Covaris E210R(Covaris、Woburn,MA)を使用してゲノムDNAを断片化し、平均断片サイズ500bpを得た(デューティサイクル5%、強度3、200サイクル/バースト、および80秒)。0.25UのKlenow Large Fragment(New England Biolabs、Ipswich,MA)、7.5UのT4 DNAポリメラーゼ(NEB)、400μMの各dNTP(NEB)、25UのT4ポリヌクレオチドキナーゼ(NEB)、およびATP(NEB)を含むT4 DNAリガーゼバッファーを50μlの反応体積で45分間室温で使用して、ランダムに断片化したDNAを末端修復した。末端修復後、3.2UのTaq DNAポリメラーゼ(NEB)、100μM dATP(Invitrogen)、および1.5mM MgCl2を含むTaqバッファーを80ulの反応で15分間72℃で使用して、鋳型DNAの3’末端にアデニンを付加した。アダプターライゲーションの前に、PCR Purification Kit(Fermentas)を使用して反応物を精製した。
【0085】
OS−Seqのためのインデックスシステムを開発した。配列決定用ライブラリーアダプターは、任意選択的な6塩基インデックス配列、配列決定プライマー1部位、およびプライマー「C」のハイブリダイゼーションのための12−mer配列を含有する(上の表2、
図5c)。設計した16個のインデックスアダプターを設計した。Stanford Genome Technology Centerでアダプターオリゴヌクレオチドを合成した。ライゲーションの前に、温度勾配が下降する間にアダプターオリゴヌクレオチドをアニールした。NA18507の標的再配列決定のために、「AACCTG」タグを有するシングルプレックス用アダプターおよびマルチプレックス用アダプターの両方を使用した。マッチする正常・腫瘍サンプルをインデックスするために、正常組織には「TGCTAA」バーコードを使用し、腫瘍サンプルは「AGGTCA」でタグ化した。2,000UのT4 DNAリガーゼ(NEB)およびT4 DNAリガーゼバッファーを室温で1時間使用して、T−オーバーハングを有する二本鎖DNAアダプターをA−テーリングした鋳型にライゲートした。アダプターライゲーションの後、PCR Purification Kit(Fermentas)を使用して反応物を精製し、PCRを使用してライブラリーを増幅した。1UのPhusion Hot Start DNA Polymerase(Finnzymes、Finland)、1μMライブラリー増幅プライマー(付録の表1)、Phusion HFバッファー、および200μMの各dNTP(NEB)の50ulの反応物を調製した。反応物を98℃で30秒間変性させた。その後、22回のPCRサイクルを行い(98℃で10秒、65℃で30秒、および72℃で30秒)、続いて、72℃で7分および4℃で行った。その後、PCR Purification Kit(Fermentas)を使用してPCR反応物を精製し、定量化した。マルチプレックス化したライブラリーを等しい濃度でプールした。
【0086】
プライマー・プローブを使用した標的の捕捉 OS−Seqプライマー・プローブを使用してフローセル上で標的を捕捉した(
図1bおよび下のオリゴヌクレオチド配列)。30ulのゲノム配列決定用ライブラリー(30〜42ng/ul)をフローセルに注入した。配列決定用ライブラリーをフローセル内で65℃で20時間インキュベートすることによって、標的DNAをプライマー・プローブとハイブリダイズさせた。ゲノムDNAライブラリーのハイブリダイゼーションおよびその後の伸長の間、フローセルを65℃で一定に保った。Illumina社のCluster Stationを使用してプライマー・プローブのハイブリダイゼーションおよび伸長ステップを実行した。プライマー・プローブへのハイブリダイゼーションの前に、22.5μlの配列決定用ライブラリー(40〜56.6ng/μl)を95℃で5分間変性させた。熱ショックの後、4xハイブリダイゼーションバッファーを使用してゲノムDNAライブラリーを合計体積30μlに希釈した。配列決定用ライブラリーの最終DNA濃度は、30〜41.7ng/μlの範囲であった。配列決定用ライブラリーの濃度が高いことに起因して、ハイブリダイゼーション体積は最小限に保たれた。したがって、再現性のある低体積のハイブリダイゼーションを可能にするために、専用のCluster Stationプログラムを開発した。Illumina社のv4試薬を使用して以下の伸長、洗浄、および変性ステップを行った。
【0087】
フローセル処理および配列決定 標的の捕捉後、フローセルの温度を30分間40℃まで下げ、捕捉されたゲノムDNAライブラリー断片の3’末端にある12塩基をプライマー「C」とハイブリダイズさせた(
図1bおよび下のオリゴヌクレオチド配列)。ブリッジ形成において、DNAポリメラーゼを使用してライブラリー断片およびプライマー「C」を伸長させ、捕捉されたDNA断片を完成させ、複製した。その後、ブリッジPCRを実行し、クローン的に増幅された配列決定用クラスターを作製した。標準版の4つの配列決定試薬およびレシピ(Illumina)を使用して、Illumina社のGenome Analyzer IIx上で40×40(OS−Seq−366)または60×60(OS−Seq−11k)のペアエンドサイクルを用いてサンプルを配列決定した。SCS2.8およびRTA2.8ソフトウェア(Illumina)を使用して画像解析およびベースコールを行った。
【0088】
配列解析およびバリアントの検出 Burrows−Wheeler Aligner(BWA)
19を使用して、配列リードをヒトゲノム版のNCBIのHuman Genome Build 37−hg19とアラインした。アライメント後、オンターゲットのリード(リード1)は、プライマー・プローブの5’末端の1kb以内にあると定義された。オフターゲットのリードは、プライマー・プローブの5’末端の1kb外側にアライメントするとして、または関連付けられたプライマー・プローブの位置から異なる染色体上のマッピングとして定義される。インデックスしたレーンの逆多重化のために、perlスクリプトを使用して、ベースコールファイルを使用する7塩基タグのインデックスを作成した。このインデックスファイルおよび別のperlスクリプトを使用して、組み合わせたベースコールファイル(更なる処理のための別個のfastqファイルを作成できるように)またはアラインされたファイルのいずれかを逆多重化した。
【0089】
バリアントコールのためのあらゆる合成プライマー・プローブ配列を排除するために、メートペア上のインサートのサイズによるフィルタリングを適用した。インサートのサイズは、対になった配列リードのアライメントを比較することによって決定した。バリアントコールために、抽出された配列は、[40+リード1の長さ]よりも大きなインサートサイズを有する必要があった。インサートのサイズによるフィルタリング後、SAMtoolsおよびBCFtoolsを使用してバリアントコールを行った。マッピング品質閾値50でSAMtools mpileupを使用して、ヒトゲノム(hg19)に対する配列のpileupを行った。BCFtools viewを使用して塩基位置の遺伝子型を決定し、SAMtoolsパッケージ内に提供されるバリアントフィルタperlスクリプトvcfutils.plを使用してデータをフィルタリングした。vcfutils varFilterの条件は、i)10以上のカバレッジ、ii)鎖バイアスフィルタの除去(OS−Seqは、鎖特異的捕捉法であるため)、iii)スクリプトに基準位置および非基準位置の両方を出力するよう強制することである。基準コールおよび非基準コールをAffymetrix SNP6.0アレイデータとの比較に用いた。遺伝子型を決定した位置をフィルタリングし、50を超えるPhred様品質スコアを得た。BEDtools intersectBedを使用して、各プライマー・プローブの標的領域、およびプローブがそれらの標的内で重複する組み合わせを定義した。
【0090】
バリアントの比較 抽出したバリアントの品質評価のために、NA18507データのバリアントコールを、完全ゲノム配列解析
3から同定されたバリアントのコールおよびHapmap遺伝子型決定データ(
www.hapmap.org)と比較した。perlスクリプトを使用してOS−SeqデータとAffymetrix SNP 6.0アレイデータの比較を行った。SNPのアノテーションにはdbSNP131を使用した。
さらなるオリゴヌクレオチド配列
0) オリゴヌクレオチド
OS−Seqオリゴヌクレオチド:
5’−NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAGACCGATCTCGTATGCCGTCTTCTGCTTG−3’(汎用捕捉オリゴヌクレオチド、N=特有の40−mer配列、配列番号37)
Ad_top_FC_capture_A_tail:
5’−CGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT−3’(配列番号38)
Ad_bot_FC_capture_A_tail:
5’−GATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’(配列番号39)
フローセルプライマー「C」:
5’−PS−TTTTTTTTTTAATGATACGGCGACCACCGAGAUCTACAC−3’(U=2−デオキシウリジン)(配列番号40)
フローセルプライマー「D」:
5’−PS−TTTTTTTTTTCAAGCAGAAGACGGCATACGAGoxoAT−3’, (Goxo=8−オキソグアニン) (配列番号41)
配列決定プライマー1:
5’−ACACTCTTTCCCTACACGACGCTCTTCCGATCT−3’(配列番号42)
配列決定プライマー2:
5’−CGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT−3’(配列番号43)
1) フローセルの修飾
アニール
3’ −GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN−5’(OS−Seqオリゴヌクレオチド)(配列番号44)
FC−CAAGCAGAAGACGGCATACGAGAT−3’(フローセルプライマー「D」)(配列番号45)
伸長
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN−5’(OS−Seqオリゴヌクレオチド)(配列番号46)
FC −CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN−3’(プライマー・プローブ)(配列番号47)
変性
FC −CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN−3’(プライマー・プローブ)(配列番号48)
2)ライブラリーの調製
断片化、末端修復
5’−NNNNNNNNNNNNNNNNNNNNNN−3’(ゲノムDNA)
3’−NNNNNNNNNNNNNNNNNNNNNN−5’(ゲノムDNA)
A−テーリング
5’−NNNNNNNNNNNNNNNNNNNNNNA−3’(A−テーリング後のゲノムDNA)
3’−ANNNNNNNNNNNNNNNNNNNNNN−5’(A−テーリング後のゲノムDNA)
アダプターライゲーション
OS−Seq dsアダプター
5’−GATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’ (Ad_bot_FC_capture_A_tail) (配列番号49)
3’−TCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’ (Ad_top_FC_capture_A_tail) (配列番号50)
OS−Seq dsAdライブラリー(これはOS−Seq−アダプターライブラリーの構造である, N=断片化によって定義されるランダムなゲノムDNA配列)
5’−CGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’(配列番号51)
3’−GCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’(配列番号52)
ライブラリーPCR
OS−Seqアダプターライブラリー増幅(Ad_top_FC_capture_A_tail、単一プライマーPCRを使用してアダプターライブラリーを増幅する)
5’−CGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT−3’
(Ad_top_FC_capture_A_tail) (配列番号53)
3’−GCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’ (OS−Seqライブラリー断片)(配列番号54)
5’−CGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’ (OS−Seqライブラリー断片)(配列番号55)
3’−TCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’ (Ad_top_FC_capture_A_tail) (配列番号56)
5’−CGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’(増幅したOS−Seqライブラリー断片) (配列番号57)
3’−GCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’(増幅したOS−Seq ライブラリー断片) (配列番号58)
3)捕捉
アニール
OS−Seqアダプターライブラリーのアニーリング(N=40−mer特異的捕捉部位)
3’− GCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGAgenomicdna (配列番号59)
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’(増幅したOS−Seq ライブラリー断片) (配列番号60)
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN−3’ (プライマー・プローブ)(配列番号61)
伸長
OS−Seq捕捉
3’−GCTCTAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGAgenomicdna (配列番号62)
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGC−5’(増幅したOS−Seq ライブラリー断片) (配列番号63)
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’(捕捉されたDNA) (配列番号64)
変性
OS−Seqライブラリー
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’(捕捉されたDNA) (配列番号65)
4)アダプターの完成
40Cでのハイブリダイゼーション
OS−Seq_ライブラリー(OS−SeqアダプターとOligo−Cの間には12−merの相同性が存在する)
FC −CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCG−3’ (捕捉されたDNA)(配列番号66)
3’ −CACATCTAGAGCCACCAGCGGCATAGTAA−FC (オリゴ「C」)(配列番号67)
伸長
FC −CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’(完成したDNA) (配列番号68)
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC (完成したDNA) (配列番号69)
変性
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’(完成したDNA) (配列番号70)
3’ −GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC (完成したDNA) (配列番号71)
5) クラスターの作製
アニール
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’ (完成したDNA) (配列番号72)
3’−CACATCTAGAGCCACCAGCGGCATAGTAA−FC (オリゴ「C」)(配列番号73)
FC−CAAGCAGAAGACGGCATACGAGAT−3’ (配列番号74)
(オリゴ「D」)
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC (完成したDNA) (配列番号75)
伸長
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’ (完成したDNA) (配列番号76)
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC(完成したDNA) (配列番号77)
変性
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’(クラスター化されたDNA)(配列番号78)
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC(クラスター化されたDNA)(配列番号79)
6)配列決定
FC−CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT−3’(クラスター化されたDNA)(配列番号80)
3’− <−−−−TCTAGCCTTCTCGCAGCACATCCCTTTCTCACA−5’(配列決定プライマー1)(配列番号81)
5’− CGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT−−−−> (配列決定プライマー 2) (配列番号82)
3’−GTTCGTCTTCTGCCGTATGCTCTAGCCAGAGCCGTAAGGACGACTTGGCGAGAAGGCTAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNgenomicdnaTCTAGCCTTCTCGCAGCACATCCCTTTCTCACATCTAGAGCCACCAGCGGCATAGTAA−FC (クラスター化されたDNA) (配列番号83)
【0091】
結果
この項では、標的再配列決定アプローチに見られる限界の多くを解決する、オリゴヌクレオチド選択的配列決定(OS−Seq)と称される標的再配列決定のための新規アプローチについて記載する。他の方法とは概念的に異なり、OS−Seqは、ゲノム標的の捕捉と配列決定の両方がIllumina社のフローセル等の(
図1a)NGS固相支持体上で行われる統合化アプローチである。OS−Seqの調製のために、ゲノムDNAから単一アダプター配列決定用ライブラリーを調製し、標的特異的オリゴヌクレオチドを合成してフローセル上のプライマー・プローブを構築するために使用する。次いで、フローセル上の固定化プライマー・プローブを使用して、単一アダプターゲノムDNAライブラリーから単一分子標的を捕捉する。
【0092】
OS−Seqの処理は3つのステップを伴う:Illumina社の配列決定システムを、標的特異的プライマー・プローブを含むように修飾し、単一アダプターライブラリーから標的を捕捉し、固定化された断片を配列決定のために完成させる(
図1b)。捕捉基質を調製するために、既存のプライマー
叢のサブセットを標的特異的プライマー・プローブになるように修飾することにより、Illumina社のフローセルを分子的に再設計する。これらのプライマー・プローブを作製するために、オリゴヌクレオチドの複雑なプールの3’普遍的配列をフローセル上でその補体とハイブリダイズさせ、DNAポリメラーゼ伸長反応を使用して固定化プライマーを伸長させる。ランダムに配置された標的特異的プライマー・プローブのセットが得られ、フローセル表面上に固定される。65℃の高温インキュベーションの間に、プライマー・プローブは、単一アダプターゲノムDNAライブラリー内の標的相補的配列に特異的にハイブリダイズする:ハイブリダイゼーション後、次いで、プライマー・プローブは、別のDNAポリメラーゼ伸長反応のためのプライマーとして機能する。伸長ステップは、標的配列を効率的に捕捉する。伸長後、変性ステップを行い、次いで、40℃の低温ハイブリダイゼーションにより配列決定用ライブラリーアダプターをフローセル上でその補体に安定化させ、ブリッジ構造を作製する。第3のDNAポリメラーゼ伸長反応により、3’末端に追加の配列を組み込み、固相増幅が可能な2つの分子を作製する。OS−Seqに特異的な3つのステップの後、捕捉された分子をブリッジ増幅し、処理し、Illumina社のNGSシステムからの標準的な配列決定プロトコルを使用して配列決定する。OS−Seqにおける分子生物学的ステップの詳細な説明は、上記に示され、Illumina社のOS−Seq用Cluster Stationプログラムはそれに応じて変更される。
【0093】
原理の実証の証拠として、2つの捕捉アッセイを開発した。最初に、10個の癌遺伝子のエクソンに隣接する366個のOS−Seqプライマー・プローブ(OS−Seq−366)を設計した(
図3)。このアッセイは、OS−Seqの方法をテストすることを企図するものであって、決定的なエクソンカバレッジをテストすることを企図するものではなかった。カラムに基づく方法を使用してOS−Seq−366オリゴヌクレオチドを合成した。次に、拡張性を証明するために、344個の癌遺伝子のエクソンを捕捉するための11,742個のプライマー・プローブを設計および合成した(OS−Seq−11k)。これらのプライマー・プローブは、エクソンカバレッジの向上のために、反復を避けて大きなエクソンにわたってタイリングした。OS−Seq−11kのハイスループットな産生のために、プログラム可能なマイクロアレイ上でオリゴヌクレオチドを合成した。これらのアレイ合成オリゴヌクレオチドは、処理のためおよびOS−Seqに十分な材料を得るために増幅を必要とする(
図4)。処理後、OS−Seqオリゴヌクレオチドは、標的領域の5’末端に相補的な標的特異的40−merを含有する(
図5)。また、これらのオリゴヌクレオチドは、ペアエンド配列決定プライマーのアニーリングおよびフローセル上の固定化プライマー
叢へのハイブリダイゼーションに必要な配列を含有する。
【0094】
OS−Seq−366およびOS−Seq11kアッセイの捕捉性能を評価するために、以前に配列決定されたヨルバ人の個体由来のDNAを調製した(NA18507)。全ての標的アッセイに対してペアエンド配列決定を行った。第1のリード(リード1)は標的ゲノムDNAに由来し、第2のリード(リード2)は合成標的特異的プライマー・プローブに由来する(
図1a)。GAIIxでの実行において、単一レーン上でOS−Seq−366を実行した。我々のインデックススキームに基づいて、OS−Seq−11kの各サンプルを1.3レーンの均等物上で実行した。サンプルをタグ化するために、特有のバーコード配列(
図5c)を有するアダプターを使用してインデックススキームを開発した。バーコードは、リード1の最初の7個の塩基に由来する。全体で、適切なバーコードを含有するOS−Seq−366リードの87.6%およびOS−Seq−11kリードの91.3%をヒトゲノム基準にマッピングした(表1)。それと比較して、以前に報告されたハイブリッド選択方法を使用して得られたリードの58%をヒトゲノム基準にマッピングすることができた。
【表1】
【0095】
各プライマー・プローブの全体的なカバレッジを評価するために、プライマー・プローブの3’末端から1kb以内に属するリード1のデータに由来するリードの数を決定した。OS−Seqプライマー・プローブは、鎖特異的であり、DNA標的の5’末端のみを捕捉する(
図6)。一例として、OS−Seq−366における全てのプライマー・プローブのカバレッジプロファイルの中央値(
図1a)は、プライマー・プローブから1kb下流までどのように配列が捕捉されるかを例示している。概して、より小さいインサートのサイズに向かってバイアスが検出され、OS−Seq−366では、標的リードの50%がプライマー・プローブから283塩基以内にマッピングされた。両方のアッセイにおいて、1kb間隔を超えるリードおよび1.7kbまで離れた追加のリードを同定した。1kbを超える配列リードは、任意の所与のプライマー・プローブからの捕捉分布の末端を表し、OS−Seq−366およびOS−Seq−11kの両方とも全体の配列データの0.15%未満であった。また、カバレッジ分布の特徴は、ライブラリー作製の間に導入された断片サイズと相関しており、ブリッジ形成および固相PCRに固有のサイズの制約によるものであることも観察された(
図6)。また、より高いモル濃度の単一アダプターライブラリーを導入すること、追加のレーンを配列決定すること、またはより長いリードを使用することにより、標的に沿ったカバレッジを増加させることができる。
【0096】
オンターゲットのリードは、プライマー・プローブの1kb以内にマッピングするリード1配列であると定義された。これらのオンターゲットカバレッジ基準を用いると、OS−Seq−366内の40塩基リードの86.9%およびOS−Seq−11k内の53塩基リードの93.3%がオンターゲットであった(表1)。コンピュータによるプライマー・プローブの設計を改良しようとする試みを考慮すると、OS−Seq−11kは特異性の向上を示した。具体的には、OS−Seq−11kのコンピュータによるプライマー・プローブ選択には、反復マスキングフィルタが使用され、より少ないオフターゲットのリードをもたらす結果となった。比較すると、公開されたハイブリッド選択方法において、76塩基リードの89%および36塩基リードの50%がプローブの近位にマッピングされ、方法間での同様のオンターゲット特異性が示唆され、より長いリードに向かって移動するようにそれを傾斜させることにより、OS−Seqのオンターゲット特異性を向上させることができる。OS−Seqのエクソン上での特異性も、公開されたハイブリッド選択方法と同様であった。OS−Seq−11Kを使用して、リードの42.7%がエクソン内にマッピングされたことが観察され(表1)、ハイブリッド選択捕捉技術では、エクソンにマッピングされたのはリードの42%であると報告された。
【0097】
典型的な遺伝子カバレッジプロファイルの一例として、KRAS遺伝子に関する捕捉配列データを
図1cに示す。エクソン標的は、オフターゲット隣接領域と比較して高い倍数のカバレッジで配列決定される。以前に述べたように、OS−Seq−366は、エクソンに隣接するように設計されており、より大きな領域にわたってタイリングされていない。エクソンの平均倍数カバレッジを表1に、カバレッジクラスの詳細な内訳(すなわち、10X、20X)を表2に示す。全体として、OS−Seq−366内のエクソン塩基の83.9%が少なくとも1つのリードでカバーされており、残りの部分は、このパイロットアッセイでは意図的に標的としなかった。同様に、OS−Seq−11kで分析した3つのサンプル間では、エクソン塩基の94〜95.6%が少なくとも1つのリードでカバーされた。OS−Seq−366の設計に優るプライマー・プローブの設計の改善により、具体的には、OS−Seq−11kの設計は、500塩基よりも大きなエクソンにわたってプライマー・プローブをタイリングしたことにより、OS−Seq−366と比較して、OS−Seq−11kアッセイは、エクソン上での配列カバレッジの増加を示した
【0098】
リード1のデータをその関連付けられたプライマー・プローブによりビニングし、その標的とアラインするリードを数えることによって、アッセイの標的選択均一性についても評価した。観察された捕捉収率に基づいてOS−Seqプライマー・プローブをソートし、OS−Seq−366およびOS−Seq−11k内の分布を
図1dにオーバーレイ方式で表した。OS−Seq−366では、プライマー・プローブの100%が1つの配列リードの最少収量を有し、プライマー・プローブの89.6%の収量が10倍の範囲内であったことが観察された観察された。同様に、OS−Seq−11kの場合、プライマー・プローブの95.7%が1つの配列リードの最少収量を有し、プライマー・プローブの54%が10倍の範囲内に収率を有していた。OS−Seq−366オリゴヌクレオチドをカラム合成し、プーリング前に別々に定量化することで、プライマー・プローブ構築ステップにおいて各標的特異的配列が確実に等モル濃度になるようにした。OS−Seq−11kのプライマー・プローブ収量におけるより高い分散は、プライマー・プローブ作製のために使用されたマイクロアレイ合成オリゴヌクレオチドのPCRの間に導入された増幅バイアスによる可能性が最も高い。
【0099】
OS−Seq−11kアッセイからの個々のプライマー・プローブの配列収量を比較することにより、OS−Seqの技術的再現性を評価した(
図7)。マルチプレックスライブラリー(NA18507、正常および腫瘍)をプールし、2つの独立したIllumina社のGAIIxのレーン上で捕捉および配列決定を行った。各個々のプライマー・プローブの配列収量を技術的複製間で比較し、相関係数を算出した:R
2=0.986。生物学的再現性の評価では、2つの異なるマルチプレックス配列決定用ライブラリーを同じレーン内で実行した。生物学的複製の相関係数は、R
2=0.90であった。OS−Seqの高い再現性は、NGSシステムを使用した固有の自動化、単一の反応体積で捕捉および配列決定ステップを行う能力、ならびに捕捉後にPCRを適用しなくてもよいことに関連する可能性が高い。
【0100】
OS−Seq−366およびOS−Seq−11kアッセイのバリアントコーリング性能を評価するために、完全ゲノム配列決定分析を受けたヨルバ人の個体NA18507について標的配列決定分析を行った。いずれかのOS−Seqアッセイを用いたSNVコーリングのために、遺伝子型品質スコアが50を超え、最低10Xカバレッジのオンターゲット位置のみを分析した(表1)。OS−Seq−366およびOS−Seq−11kデータでは、合計でそれぞれ191kbおよび1,541kbがこれらの基準を満たした。これらの高品質な標的位置から、OS−Seq−336から105個のSNV、OS−Seq−11kから985個のSNVをコールした(表1)。公開されたNA18507のSNV、およびこれらの同じ高品質領域で生じることが報告された他のSNPを抽出した。比較すると、OS−Seq−366の97%およびOS−Seq−11kの95.7%が、以前に報告されていた(表1)。OS−Seq−366およびOS−Seq−11kについて、バリアント検出の感度は、報告されたSNPに基づいて、それぞれ0.97および0.95であった(下の表3)。
【表3】
【0101】
OS−Seq−11kの分析を、マッチする正常‐直腸結腸癌ペアに由来するゲノムDNAにも適用した。NA18507の分析と同じ品質基準およびカバレッジ基準を用いて、正常サンプルから同定された871個のSNVを同定し、腫瘍から727個を同定した(表4)。比較のために、Affymetrix SNP 6.0アレイを用いて2つのサンプルの遺伝子型を決定した。以前の分析によれば、Affymetrix SNP 6.0アレイおよびBirdseedアルゴリズムを使用した遺伝子型決定の正確性は高く、SNPの良好な平均コール率は99.47%であり、コールされたSNPは、他のプラットフォームからのHapMap遺伝子型と99.74%の一致を有する。OS−Seq SNVをAffymetrix SNPと比較すると、正常サンプルで99.8%、腫瘍サンプルで99.5%の高い一致が観察された。正常組織バリアントをフィルタリングし、カバレッジが40よりも大きい新規癌特異的バリアントを考慮することにより、SMAD4(S144*)の明らかな病原性ナンセンス変位を同定および確認した。この遺伝子は、直腸結腸癌において頻繁に突然変異することが多い、大腸癌ドライバー遺伝子である。
【表4】
【0102】
OS−Seq−366およびOS−Seq−11kアッセイにおける個々のプライマー・プローブの捕捉効率を調べ、各プライマー・プローブの性能を評価した。OS−Seqの特有の特徴は、ペアエンドを用いて配列決定した場合に、捕捉されたゲノム配列をそれらのプライマー・プローブとマッチさせることができることである。リード1は、捕捉された標的の3’末端に由来し、リード2はOS−Seqプライマー・プローブ合成配列から始まる。よって、リード1は、常に捕捉されたゲノムDNA配列を表し、リード2は、個別のプライマー・プローブのための分子バーコードとして機能的役割を果たす。これにより、標的化を媒介した正確なOS−Seqプライマー・プローブの同定が可能となり、個別のプライマー・プローブの性能の評価を促進する。例えば、プライマー・プローブのGC含量と標的配列の収量との間に強い関係が観察された(データは図示せず)。極度に低いGC含量(20%未満)または高いGC含量(>70%)は、プライマー・プローブのその標的配列捕捉の不良の増加と関連していた(
図8)。捕捉性能を直接的に評価する能力は、有用なプライマー・プローブの品質管理手段であると考えられる。
【0103】
OS−Seq技術は、合理的かつ拡張性の高い標的再配列決定のために開発された。配列決定前に標的を濃縮する従来の捕捉方法から離れ、OS−Seqは、NGSシステムの固相支持体上のハイブリダイゼーションおよび選択を介して、標的DNAの捕捉および配列決定を統合する。原理の実証試験は、OS−Seqアッセイが、良好な均一性および高い特異性を伴って、効率的かつ再現性よく標的ゲノム領域を捕捉することを示している。NA18507参照ゲノムのバリアント解析によって、SNVの決定のための高い特異性および低い偽発見率が証明された。マッチする結腸直腸腫瘍サンプルと正常サンプルの標的再配列決定により、癌ゲノムのハイスループットな遺伝子解析に対するOS−Seqの適応性が証明された。
【0104】
OS−Seq技術により、専用の標的再配列決定アッセイを作製することができる。プライマー・プローブオリゴヌクレオチドの設計および生成は、比較的単純であり、標的領域は、平衡の取れたGCおよび非反復配列を使用して単純に選択することができる。専用の複雑なオリゴヌクレオチドライブラリーをまとめて作製するために、プログラム可能なマイクロアレイ合成源を使用することができる。同様に、より小さな標的遺伝子セットのための専用アッセイを作製するために、従来のオリゴヌクレオチド合成方法が使用されてもよい。我々の最も大規模な標的アッセイは、344個の遺伝子のエクソンおよび隣接する配列を網羅したが、OS−Seqは、より多くの標的含量まで大幅にスケールアップすることができると考える。OS−Seq−366データから、フローセル内のハイブリダイゼーション混合物の標的断片と比較して、2,000倍を超える過剰なプライマー・プローブが存在すると推定した。20時間のハイブリダイゼーションの間に、ライブラリー内の全ての潜在的な標的の4.9%が配列決定のために捕捉されたことが推定される。クラスター形成を犠牲にすることなく、オリゴヌクレオチドの濃度を少なくとも10倍増加させることができ、配列決定用ライブラリーの濃度を5倍増加させることができること(データは図示せず)も調べた。
【0105】
OS−Seqサンプルの調製は単純である:1日で完了可能であり、容易に自動化される(
図9)。労働に関しては、OS−Seqを使用することは、ショットガン配列決定実験を実行することに好ましく匹敵する。捕捉中は、残存するアダプターがフローセルとハイブリダイズしていないため、OS−Seqライブラリーは、物理的分離方法による限定されたサイズの精製の必要性なく、様々なサイズのDNA断片を用いることができる。ゲノムDNA断片の5’末端に単一アダプターを付加するだけでよい。単一アダプターの設計も、分子バーコードの導入を伴うインデックスに容易に役立つ。この特徴は、配列決定アッセイの単純なサンプル多重化を可能にし、多くの潜在的用途を有する。例えば、マッチする正常・腫瘍分析は、バイアスを減少させることができる同じ捕捉反応において行われる。
【0106】
「個別化医療」における関心の増加を考慮すると、ヒトゲノム再配列決定の迅速かつ単純なアプローチを開発する明らかな必要性がある。これには、癌ゲノムに見られる生殖系列バリアントおよび体細胞突然変異の分析が含まれる。候補遺伝子のハイスループットな分析、および臨床的に使用可能な標的領域の同定を可能にすることにより、OS−Seqは、標的再配列決定のための実践的かつ効率的なアプローチとして、翻訳試験および臨床診断に特に有用である。
【0107】
上記方法にはIllumina社のGenome Analyzerを使用した。しかしながら、このシステムは、いずれの平行配列決定プラットフォームにも広く適用可能であると考えられる。