IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ブルースター ジェノミクス, インコーポレイテッドの特許一覧

特表2022-504078単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析
<>
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図1
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図2
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図3
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図4
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図5
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図6
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図7
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図8
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図9
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図10
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図11
  • 特表-単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-01-13
(54)【発明の名称】単一の生物学的サンプル由来のタンパク質、ヌクレオソームおよび無細胞核酸のシーケンシングベースの同時分析
(51)【国際特許分類】
   C12Q 1/6804 20180101AFI20220105BHJP
   C12Q 1/6813 20180101ALI20220105BHJP
   C12Q 1/686 20180101ALI20220105BHJP
   C12N 15/10 20060101ALI20220105BHJP
   C12Q 1/6869 20180101ALI20220105BHJP
   C12Q 1/6876 20180101ALI20220105BHJP
【FI】
C12Q1/6804 Z ZNA
C12Q1/6813 Z
C12Q1/686 Z
C12N15/10 100Z
C12Q1/6869 Z
C12Q1/6876 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021518090
(86)(22)【出願日】2019-10-03
(85)【翻訳文提出日】2021-05-18
(86)【国際出願番号】 US2019054582
(87)【国際公開番号】W WO2020072829
(87)【国際公開日】2020-04-09
(31)【優先権主張番号】62/741,473
(32)【優先日】2018-10-04
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】520306875
【氏名又は名称】ブルースター ジェノミクス, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】アレンスドルフ, パトリック エー.
(72)【発明者】
【氏名】スペイセック, ダメク
(72)【発明者】
【氏名】エリソン, クリストファー イー.
(72)【発明者】
【氏名】レヴィ, サミュエル
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA18
4B063QQ79
4B063QR08
4B063QR32
4B063QR48
4B063QS24
4B063QS33
4B063QX02
(57)【要約】
本発明は、合理化された組み合わせワークフローでサンプルを分析し、得られた複数種類の情報を決定する方法を提供し、あらゆる情報がシーケンシングベースの分析で得られる。情報は、血液サンプル中の特定の血漿タンパク質の存在および濃度;同サンプルから得られた無細胞DNAと会合したヒストン修飾の数、位置およびタイプ;無細胞DNAサンプル中のcfRNA/cfDNAの配列;無細胞DNAに関するエピジェネティック情報、例えば、ヒドロキシメチル化およびメチル化のプロファイル、即ち、それぞれ5-ヒドロキシメチルシトシン(5hmC)/5-メチルシトシン(5mC)残基の分布を含む。本発明はさらに、生物学的サンプルを分析してそのサンプルの1以上の非古典的な配列特徴を決定する古典的なシーケンシングベースの方法に関する。切断型シーケンシングアダプターをバーコード化PCRプライマーと併せて用いる実施形態も提供される。
【特許請求の範囲】
【請求項1】
第1の近接プローブおよび第2の近接プローブをそれぞれが含む複数のプローブ対を提供することであって、ここで、各プローブ対は、特定のタンパク質分析物を標的にすること、および対応するタンパク質分析物の存在下において各プローブ対の前記プローブ間で二本鎖DNA(dsDNA)セグメントを生成することによって、生物学的サンプル中の複数のタンパク質分析物を識別するための改善された近接伸長アッセイであって、前記改善された近接伸長アッセイは、
(a)タンパク質識別子バーコードとして供されるタンパク質特異的核酸配列を前記dsDNAセグメントに組み込み、それによって、タンパク質バーコード化dsDNAテンプレート分子を形成する工程;
(b)前記タンパク質バーコード化dsDNAテンプレート分子を増幅し、かつシーケンシングする工程;および
(c)工程(b)において生成された配列リードにおいて観察される前記タンパク質識別子バーコードから前記生物学的サンプル中の前記タンパク質分析物を識別する工程
を含む、改善された近接伸長アッセイ。
【請求項2】
各タンパク質特異的核酸配列が、アダプター内に含められ、工程(a)が、前記アダプターを前記dsDNAセグメントに末端結合することを含む、請求項1に記載の改善された近接伸長アッセイ。
【請求項3】
工程(a)が、5hmC残基を含むキャプチャー配列を前記dsDNAセグメントに組み込み、それによって、前記キャプチャー配列を含むタンパク質バーコード化dsDNAテンプレート分子を形成する工程をさらに含む、請求項1に記載の改善された近接アッセイ。
【請求項4】
前記キャプチャー配列および前記タンパク質識別子バーコードが、前記dsDNAセグメントに末端結合された少なくとも1つのアダプター内に含められている、請求項3に記載の改善された近接伸長アッセイ。
【請求項5】
分子バーコードとして供されるために、ランダムな核酸配列を各dsDNAテンプレート分子に組み込む工程を工程(b)の前にさらに含む、請求項1~4のいずれか1項に記載の改善された近接伸長アッセイ。
【請求項6】
少なくとも1つのタンパク質濃度コントロール組成物を前記dsDNAテンプレート分子と合わせる工程を工程(b)の前にさらに含む、請求項5に記載の改善された近接伸長アッセイ。
【請求項7】
各タンパク質分析物が、前記生物学的サンプル中に元の濃度で存在し、前記アッセイが、(d)特定のタンパク質分析物を示唆する配列リードを、前記タンパク質濃度コントロール組成物によって生成された配列リードと比較することによって、前記サンプル中の少なくとも1つのタンパク質分析物の元の濃度を決定する工程をさらに含む、請求項6に記載の改善された近接伸長アッセイ。
【請求項8】
複数の生物学的サンプルの各々における前記複数のタンパク質分析物を並行して検出する工程をさらに含む、請求項1~6のいずれかに記載の改善された近接伸長アッセイ。
【請求項9】
複数の生物学的サンプルの各々における前記複数のタンパク質分析物を並行して検出する工程をさらに含む、請求項7に記載の改善された近接伸長アッセイ。
【請求項10】
前記複数の生物学的サンプルが、少なくとも300個の生物学的サンプルを含む、請求項9に記載の改善された近接伸長アッセイ。
【請求項11】
前記複数の生物学的サンプルが、少なくとも500個の生物学的サンプルを含む、請求項10に記載の改善された近接伸長アッセイ。
【請求項12】
前記複数の生物学的サンプルが、少なくとも1000個の生物学的サンプルを含む、請求項11に記載の改善された近接伸長アッセイ。
【請求項13】
前記複数の生物学的サンプルが、384または1536個の生物学的サンプルを含み、前記アッセイが、マイクロプレートの個々のウェルにおける各生物学的サンプルを用いて実施される、請求項9に記載の改善された近接伸長アッセイ。
【請求項14】
DNAシーケンシングベースの技術を用いて生物学的サンプル中の複数のタンパク質分析物を識別するための方法であって、前記方法は、
(a)それぞれが、特定のタンパク質分析物を標的にし、第1の末端にタンパク質結合ドメイン、反対側の第2の末端に核酸結合ドメインおよびそれらの間に非ハイブリダイズ核酸領域を含む、複数のプローブ対を提供する工程であって、ここで、(i)前記第1および第2の近接プローブの前記タンパク質結合ドメインは、同じタンパク質分析物上の異なる結合部位に同時に結合することができ、(ii)前記第1および第2の近接プローブが、両方とも前記タンパク質に結合しており、ハイブリダイゼーションが生じるのに十分近接しているとき、前記プローブの前記核酸結合ドメインは、互いに相補的であり、ハイブリダイズして、dsDNAセグメントを形成する、工程;
(b)(i)プローブ対内の各近接プローブの前記タンパク質結合ドメインが対応するタンパク質分析物に結合すること、および(ii)前記核酸結合ドメインが互いにハイブリダイゼーションして、前記第1の近接プローブを起源とする5’末端および前記第2の近接プローブを起源とする3’末端を有するdsDNAセグメントを形成すること、を促進するのに効果的な条件下において前記生物学的サンプルまたはその一部を前記プローブ対とインキュベートする工程;
(c)ポリメラーゼおよびdNTP混合物を添加することによって、前記第1の近接プローブの5’末端を前記第2の近接プローブに沿って伸長して、タンパク質識別子バーコードとして供されるタンパク質特異的核酸配列および5hmC残基を含むキャプチャー配列を組み込むdsDNAセグメントを前記プローブの間に生成する工程であって、ここで、(i)前記第1のプローブ、前記第2のプローブ、または前記第1のプローブと第2のプローブの両方の前記核酸結合領域が、前記キャプチャー配列、前記タンパク質識別子バーコード、または前記キャプチャー配列と前記タンパク質識別子バーコードの両方を含み;(ii)前記dNTP混合物は、少なくとも1つの5hmC残基を含み;かつ/または(iii)ポリメラーゼ伸長後に前記dsDNAセグメントの末端にアダプターがライゲートされ、ここで、少なくとも1つのアダプターが、前記キャプチャー配列、前記タンパク質識別子バーコードまたは前記キャプチャー配列と前記タンパク質識別子バーコードの両方を含み、それによって、それぞれがキャプチャー配列を含むタンパク質バーコード化dsDNAテンプレート分子が形成される、工程;
(d)キャプチャー配列を含む前記タンパク質バーコード化dsDNAテンプレート分子を増幅し、かつシーケンシングする工程;および
(e)工程(b)において生成された配列リードにおいて観察される前記タンパク質識別子バーコードから前記生物学的サンプル中の前記タンパク質分析物を識別する工程
を含む、方法。
【請求項15】
各タンパク質結合ドメインが、抗原を含み、各結合部位が、エピトープを含む、請求項14に記載の方法。
【請求項16】
前記生物学的サンプルが、血液サンプルを含み、工程(b)が、前記血液サンプルの一部に対して実施される、請求項14または請求項15に記載の方法。
【請求項17】
工程(b)が、前記血液サンプルから得られた血漿に対して実施される、請求項16に記載の方法。
【請求項18】
前記生物学的サンプルから得られた無細胞核酸サンプルに関する情報を取得する工程をさらに含む、請求項1~17のいずれか1つの請求項に記載の方法。
【請求項19】
前記情報が、前記無細胞核酸サンプル中のヌクレオソーム内の1またはそれを超えるヒストン修飾の存在、同一性または量を含む、請求項18に記載の方法。
【請求項20】
前記1またはそれを超えるヒストン修飾が、共有結合による翻訳後修飾(PTM)を含む、請求項19に記載の方法。
【請求項21】
前記PTMが、遺伝子発現に影響を与えるヒストン構造の変化を含む、請求項20に記載の方法。
【請求項22】
前記少なくとも1つのPTMが、アセチル化、メチル化、プロピオニル化、ブチリル化、クロトニル化、2-ヒドロキシイソブチリル化、マロニル化、スクシニル化、ホルミル化、ユビキチン化、シトルリン化、リン酸化、ヒドロキシル化、SUMO化、O-GlcNAc化、ADPリボシル化またはそれらの組み合わせを含む、請求項20に記載の方法。
【請求項23】
前記1またはそれを超えるヒストン修飾が、被験体における病状を評価するためのヒストン修飾バイオマーカーを含む、請求項19に記載の方法。
【請求項24】
前記情報が、前記無細胞核酸サンプル中の無細胞DNA(cfDNA)の少なくとも1つの配列を含む、請求項18に記載の方法。
【請求項25】
前記情報が、前記無細胞核酸サンプル中のcfDNAの少なくとも1つの配列をさらに含む、請求項19~23のいずれか1項に記載の方法。
【請求項26】
前記情報が、前記無細胞核酸サンプル中の無細胞RNA(cfRNA)の少なくとも1つの配列を含む、請求項18に記載の方法。
【請求項27】
前記情報が、前記無細胞核酸サンプル中のcfRNAの少なくとも1つの配列をさらに含む、請求項19~23のいずれか1項に記載の方法。
【請求項28】
前記情報が、前記無細胞核酸サンプル中のcfRNAの少なくとも1つの配列をさらに含む、請求項24に記載の方法。
【請求項29】
前記情報が、前記無細胞核酸サンプル中のcfRNAの少なくとも1つの配列をさらに含む、請求項25に記載の方法。
【請求項30】
前記情報が、エピジェネティックデータを含む、請求項18に記載の方法。
【請求項31】
前記情報が、DNAヒドロキシメチル化に関する、請求項30に記載の方法。
【請求項32】
前記情報が、DNAメチル化に関する、請求項30に記載の方法。
【請求項33】
前記情報が、さらにDNAメチル化に関する、請求項31に記載の方法。
【請求項34】
無細胞核酸サンプルを調製して、DNAシーケンシングベースの技術を用いて、前記無細胞核酸サンプルに含まれているヌクレオソームにおける少なくとも1つのヒストン修飾の識別を可能にするための方法であって、前記方法は、
(a)ヒストンコアの周囲に巻き付いたcfDNA分子をそれぞれが含む複数のヌクレオソームを含む無細胞核酸サンプルを提供する工程;
(b)末端ハイブリダイズ領域を含むアダプターを前記cfDNA分子の末端にライゲートし、それによって、それぞれがヒストンコアの周囲に巻き付いたアダプター結合cfDNA分子を含む修飾された無細胞核酸サンプルを提供する工程;
(c)第1の末端に、目的のヒストン修飾に特異的に結合するヒストン修飾結合ドメイン;第2の末端に、末端ハイブリダイズ領域に相補的な核酸結合ドメイン;およびそれらの間に、前記目的のヒストン修飾に対応し、それによって、ヒストン修飾バーコードとして供される、核酸配列を含む非ハイブリダイズ領域、を含む近接プローブを提供する工程であって、ここで、前記近接プローブは、前記ヒストン修飾結合ドメインが前記目的のヒストン修飾に結合することと、前記相補的な核酸結合ドメインが前記ハイブリダイズ核酸領域とハイブリダイゼーションすることとが同時に起きることを可能にするような寸法である、工程;
(d)(i)前記ヒストン修飾結合ドメインが前記ヒストン修飾に結合すること、および(ii)前記相補的な核酸結合ドメインが前記ハイブリダイズ核酸領域とハイブリダイゼーションして、前記無細胞DNAを起源とする5’末端および前記近接プローブを起源とする3’末端を有し、かつ前記ヒストン修飾バーコードを含むdsDNAセグメントを形成すること、を促進するのに効果的な条件下において前記修飾された無細胞核酸サンプルを前記近接プローブとインキュベートする工程;および
(e)ポリメラーゼおよびdNTP混合物を添加することによって、前記dsDNAセグメントの5’末端を前記近接プローブの前記非ハイブリダイズ領域および前記ヒストン修飾バーコードに沿って伸長し、それによって、増幅用およびシーケンシング用の、ヒストン修飾バーコード化dsDNAテンプレート分子を提供する工程
を含む、方法。
【請求項35】
工程(c)が、それぞれが異なるヒストン修飾を標的にする複数の近接プローブを提供することを含む、請求項34に記載の方法。
【請求項36】
前記ヒストン修飾バーコード化dsDNAテンプレート分子を増幅する工程をさらに含む、請求項35に記載の方法。
【請求項37】
前記増幅されたヒストン修飾バーコード化dsDNAテンプレート分子をシーケンシングする工程、および生成された配列リードにおいて観察されるヒストン修飾バーコードからヒストン修飾のタイプおよび位置に関する情報を決定する工程をさらに含む、請求項36に記載の方法。
【請求項38】
無細胞核酸サンプルから抽出するためにcfDNAを調製するための方法であって、前記方法は、
(a)5hmC残基を含むキャプチャー配列を含むDNAアダプターを前記無細胞核酸サンプル中の平滑末端DNAの末端にライゲートして、アダプター結合DNAを提供する工程;および
(b)タグ付けされたcfDNAを選択的に取り出すことを可能にするアフィニティータグで前記5hmC残基を官能化する工程
を含む、方法。
【請求項39】
前記アフィニティータグが、ビオチンから構成され、工程(b)が、前記少なくとも1つの5hmC残基をビオチン化して、ビオチン化されたアダプター結合cfDNAを形成することを含む、請求項38に記載の方法。
【請求項40】
前記5hmC残基が、化学選択的基を前記5hmC残基に共有結合させ、次いで前記化学選択的基を官能化ビオチン部分と反応させることによってビオチン化される、請求項39に記載の方法。
【請求項41】
前記化学選択的基がクリックケミストリー反応において前記官能化ビオチンと反応するように、前記化学選択的基が、UDPグルコース-6-アジドであり、前記官能化ビオチン部分が、アルキン官能化ビオチンである、請求項37に記載の方法。
【請求項42】
前記アダプターが、固有特性識別子(UFI)配列をさらに含む、請求項38に記載の方法。
【請求項43】
前記アダプターが、少なくとも2つのUFI配列を含む、請求項42に記載の方法。
【請求項44】
前記少なくとも2つのUFI配列が、ソース識別子バーコード、ならびに分子バーコード、鎖識別子バーコードおよびヒストン修飾バーコードから選択される少なくとも1つの追加のUFI配列を含む、請求項43に記載の方法。
【請求項45】
シーケンシングベースの同時識別のために単一の無細胞核酸サンプル中のDNAおよびRNAを調製するための方法であって、前記方法は、
(a)少なくとも1つのUFI配列を含む第1のアダプター配列を含むDNAアダプターを前記無細胞サンプル中の平滑末端DNAの末端にライゲートして、アダプター結合DNAを提供する工程であって、ここで、前記少なくとも1つのUFI配列は、ソース識別子バーコードを含む、工程;
(b)前記アダプター結合DNAおよびRNAを精製して、アダプター結合DNAおよびRNAの無細胞混和物を提供する工程;
(c)前記RNAからcDNAの第1鎖を合成する工程;
(d)前記第1鎖に相補的なcDNAの第2鎖を合成して、cDNA二重鎖を提供する工程;および
(e)前記ソース識別子バーコードおよびRNAインジケーターバーコードを含む第2のアダプター配列を含むcDNAアダプターをリガーゼの非存在下において前記cDNA二重鎖の少なくとも1つの末端に共有結合させ、それによって、前記アダプター結合DNAも含む無細胞混和物中にアダプター結合cDNAを提供する工程
を含む、方法。
【請求項46】
前記少なくとも1つのUFI配列が、分子バーコード、鎖識別子バーコード、ヒストン修飾バーコードまたはそれらの組み合わせをさらに含む、請求項45に記載の方法。
【請求項47】
単一の無細胞核酸サンプルから複数の種類のデータを抽出するための組み合わせワークフロープロセスであって、前記プロセスは、
(a)少なくとも1つのUFI配列を含む第1のアダプター配列を含むDNAアダプターを前記サンプル中の平滑末端cfDNAの末端にライゲートして、アダプター結合DNAを提供する工程であって、ここで、前記少なくとも1つのUFI配列は、ソース識別子バーコードを含む、工程;
(b)前記サンプル中のRNAからcDNAを合成し、前記ソース識別子バーコードおよびRNAインジケーターバーコードを含むcDNAアダプターを前記cDNAの少なくとも1つの末端に共有結合させ、それによって、前記アダプター結合DNAも含む無細胞混和物中にアダプター結合cDNAを提供する工程;
(c)前記無細胞サンプルから5hmC含有DNAを選択的に取り出すことを可能にするアフィニティータグで前記サンプル中の5hmC残基を官能化する工程;
(d)前記サンプル中に残っているタグ付けされていないDNAおよびアダプター結合cDNAとともに、前記5hmC含有DNAを前記無細胞サンプルから取り出す工程;
(e)前記5hmC含有DNAに5hmCプロセスバーコードを付加する工程;および
(f)前記5hmC含有DNA、前記タグ付けされていないDNAおよび前記アダプター結合cDNAを増幅し、かつシーケンシングする工程
を含む、組み合わせワークフロープロセス。
【請求項48】
前記少なくとも1つのUFI配列が、分子バーコード、鎖識別子バーコード、ヒストン修飾バーコードまたはそれらの組み合わせをさらに含む、請求項47に記載の方法。
【請求項49】
工程(e)において提供された前記5hmC含有DNAが、増幅の前に、前記タグ付けされていないDNAおよびアダプター結合cDNAとともにプールされる、請求項47または請求項48に記載のプロセス。
【請求項50】
単一の無細胞核酸サンプルから複数の種類のデータを抽出するための組み合わせワークフロープロセスであって、前記プロセスは、
(a)ソース識別子バーコードを含む少なくとも1つのUFI配列を含む第1のアダプター配列を含むDNAアダプターを前記サンプル中の平滑末端cfDNAの末端にライゲートして、アダプター結合DNAを提供する工程;
(b)前記サンプル中のRNAからcDNAを合成し、前記ソース識別子バーコードおよびRNAインジケーターバーコードを含むcDNAアダプターを前記cDNAの少なくとも1つの末端に共有結合させ、それによって、アダプター結合cDNAを提供する工程;
(c)前記無細胞サンプルから5hmC含有DNAを選択的に取り出すことを可能にする第1のアフィニティータグで前記サンプル中の5hmC残基を官能化する工程;
(d)前記サンプル中に残っているタグ付けされていない5mC含有DNA、タグ付けされていない未修飾のDNAおよびアダプター結合cDNAとともに、前記タグ付けされた5hmC含有DNAを取り出す工程;
(e)前記タグ付けされた5hmC含有DNAに5hmCプロセスバーコードを付加する工程;および
(f)前記残りのサンプル中のメチルシトシン残基を酸化されたメチルシトシン残基に変換する工程;
(g)前記サンプルから前記官能化種を選択的に取り出すことを可能にする第2のアフィニティータグで前記酸化されたメチルシトシン残基を官能化する工程;
(h)前記サンプル中に残っているタグ付けされていないDNAおよびアダプター結合cDNAとともに、前記タグ付けされた5mC含有DNAを取り出す工程;
(i)前記タグ付けされた5mC含有DNAに5mCプロセスバーコードを付加する工程;および
(j)前記タグ付けされた5hmC含有DNA、前記タグ付けされた5mC含有DNA、前記タグ付けされていないDNAおよび前記アダプター結合cDNAを増幅し、かつシーケンシングする工程
を含む、組み合わせワークフロープロセス。
【請求項51】
前記少なくとも1つの分子バーコードが、フラグメント識別子配列、鎖識別子配列、またはフラグメント識別子配列と鎖識別子配列との両方をさらに含む、請求項50に記載のプロセス。
【請求項52】
前記前記タグ付けされた5hmC含有DNAおよび前記タグ付けされた5mC含有DNAが、シーケンシングの前に、前記前記タグ付けされていないDNAおよび前記アダプター結合cDNAとともにプールされる、請求項50または請求項51に記載のプロセス。
【請求項53】
単一の無細胞核酸サンプルから少なくとも2種類のデータを抽出するための組み合わせワークフロープロセスであって、前記プロセスは、
(a)ソース識別子バーコードを含む少なくとも1つの分子バーコードを含む第1のアダプター配列を含むDNAアダプターを前記サンプル中の平滑末端cfDNAの末端にライゲートして、アダプター結合DNAを提供する工程;
(b)前記サンプル中のRNAからcDNAを合成し、5hmC残基、前記ソース識別子バーコードおよびRNAインジケーターバーコードを含むcDNAアダプターを前記cDNAの少なくとも1つの末端に共有結合させ、それによって、バーコード化アダプター結合cDNAを提供する工程;
(c)前記無細胞サンプルから5hmC含有種を選択的に取り出すことを可能にするアフィニティータグで前記サンプル中の5hmC残基を官能化する工程;
(d)前記5hmC含有DNAおよび前記バーコード化アダプター結合cDNAを前記無細胞サンプルから取り出す工程;および
(e)前記5hmC含有DNAおよび前記バーコード化アダプター結合cDNAのプールされた混和物を増幅し、かつシーケンシングして、DNAヒドロキシメチル化および同じサンプル中のcfRNAに関するデータを提供する工程
を含む、組み合わせワークフロープロセス。
【請求項54】
単一の無細胞核酸サンプルから複数の種類のデータを抽出するための組み合わせワークフロープロセスであって、
(a)ハイブリダイズ核酸領域を含むアダプターをヌクレオソーム会合DNAの各末端にライゲートし、それによって、アダプター結合DNAと会合したヌクレオソームを含む修飾された無細胞核酸サンプルを提供する工程;
(b)第1の末端に、ヒストン修飾結合ドメイン、反対側の第2の末端に、前記ハイブリダイズ核酸領域に相補的な核酸結合ドメイン、およびそれらの間に、特定のヒストン修飾に対応し、それによってヒストン修飾バーコードとして供されるように選択された核酸配列を含む非ハイブリダイズ領域を含む、近接プローブを提供する工程であって、ここで、前記近接プローブは、前記ヒストン修飾結合ドメインが前記ヒストン修飾に結合することと、前記相補的な核酸結合ドメインが前記ハイブリダイズ核酸領域とハイブリダイゼーションすることとが同時に起きることを可能にするような寸法である、工程;
(c)(i)前記ヒストン修飾結合ドメインが前記ヒストン修飾に結合すること、および(ii)前記相補的な核酸結合ドメインが前記ハイブリダイズ核酸領域とハイブリダイゼーションして、前記無細胞DNAを起源とする5’末端および前記近接プローブを起源とする3’末端を有するdsDNAセグメントを形成すること、を促進するのに効果的な条件下において前記修飾された無細胞核酸サンプルを前記近接プローブとインキュベートする工程;および
(d)ポリメラーゼおよびdNTP混合物を添加することによって、前記セグメントの5’末端を前記近接プローブの前記非ハイブリダイズ領域および前記ヒストン修飾バーコードに沿って伸長し、それによって、さらなる処理用およびシーケンシング用の、ヒストン修飾バーコード化dsDNAテンプレート分子を提供する工程;
(e)前記サンプル中の核酸を精製して、ヒストン修飾バーコード化dsDNAおよびDNAを含む組成物を提供する工程;
(f)前記サンプル中のRNAからcDNAの第1鎖を合成する工程;
(g)前記第1鎖に相補的なcDNAの第2鎖を合成して、cDNA二重鎖を提供する工程;および
(h)ソース識別子バーコードおよびRNAインジケーターバーコードを含む配列を含むcDNAアダプターをリガーゼの非存在下において前記cDNA二重鎖の少なくとも1つの末端に共有結合させ、それによって、アダプター結合cDNAおよび前記ヒストン修飾バーコード化dsDNAテンプレート分子を含む核酸組成物を提供する工程
を含む、組み合わせワークフロープロセス。
【請求項55】
(i)前記ヒストン修飾バーコード化dsDNAテンプレート分子および前記アダプター結合cDNAを増幅し、かつシーケンシングする工程
をさらに含む、請求項54に記載のプロセス。
【請求項56】
工程(d)の後に、追加のバーコードを含むアダプターを、前記ヒストン修飾バーコード化dsDNAにライゲートする、請求項55に記載のプロセス。
【請求項57】
前記追加のバーコードが、ソース識別子配列を含む、請求項56に記載のプロセス。
【請求項58】
前記追加のバーコードが、フラグメント識別子配列、鎖識別子配列、またはフラグメント識別子配列と鎖識別子配列との両方をさらに含む、請求項57に記載のプロセス。
【請求項59】
(i)5hmC含有種を選択的に取り出すことを可能にする第1のアフィニティータグで、前記核酸組成物中の5hmC残基を官能化する工程;
(j)残っているタグ付けされていないDNAおよびアダプター結合cDNAとともに、前記タグ付けされた5hmC含有DNAを前記組成物から取り出す工程;および
(k)前記タグ付けされた5hmC含有DNAに5hmCプロセスバーコードを付加する工程
をさらに含む、請求項54、56、57および58のいずれか1項に記載のプロセス。
【請求項60】
(l)前記5hmC含有DNA、前記タグ付けされていないDNAおよび前記アダプター結合cDNAを増幅し、かつシーケンシングする工程
をさらに含む、請求項59に記載のプロセス。
【請求項61】
工程(k)において提供された前記バーコード化5hmC含有DNAが、シーケンシングの前に、前記タグ付けされていないDNAおよびアダプター結合cDNAとともにプールされる、請求項60に記載のプロセス。
【請求項62】
(l)前記残りのサンプル中のメチルシトシン残基を酸化されたメチルシトシン残基に変換する工程;
(m)前記サンプルから前記官能化種を選択的に取り出すことを可能にする第2のアフィニティータグで前記酸化されたメチルシトシン残基を官能化する工程;
(n)残っているタグ付けされていないDNAおよびアダプター結合cDNAとともに、前記タグ付けされた5mC含有DNAを取り出す工程;および
(o)前記タグ付けされた5mC含有DNAに5mCプロセスバーコードを付加する工程
をさらに含む、請求項59に記載のプロセス。
【請求項63】
(p)前記タグ付けされた5hmC含有DNA、前記タグ付けされた5mC含有DNA、前記タグ付けされていないDNAおよび前記アダプター結合cDNAを増幅し、かつシーケンシングする工程
をさらに含む、請求項62に記載のプロセス。
【請求項64】
前記前記タグ付けされた5hmC含有DNAおよび前記タグ付けされた5mC含有DNAが、シーケンシングの前に、前記前記タグ付けされていないDNAおよび前記アダプター結合cDNAとともにプールされる、請求項63に記載のプロセス。
【請求項65】
前記無細胞核酸サンプルが、血液サンプルから得られる、請求項54に記載のプロセス。
【請求項66】
前記血液サンプルの一部に対して血漿タンパク質分析を実施する工程をさらに含む、請求項65に記載のプロセス。
【請求項67】
血漿タンパク質が、タンパク質分析物に対応するタンパク質識別子バーコードを含むdsDNAテンプレート分子を生成することによって分析される、請求項66に記載のプロセス。
【請求項68】
前記ヒストン修飾バーコード化dsDNAテンプレート分子、前記アダプター結合cDNAおよび前記タンパク質バーコード化dsDNAテンプレート分子を増幅し、かつシーケンシングする工程をさらに含む、請求項67に記載のプロセス。
【請求項69】
前記ヒストン修飾バーコード化dsDNAテンプレート分子、前記アダプター結合cDNAおよび前記タンパク質バーコード化dsDNAテンプレート分子が、シーケンシングの前にプールされる、請求項68に記載のプロセス。
【請求項70】
前記無細胞核酸サンプルが、血液サンプルから得られる、請求項59に記載のプロセス。
【請求項71】
前記血液サンプルの一部に対して血漿タンパク質分析を実施する工程をさらに含む、請求項70に記載のプロセス。
【請求項72】
血漿タンパク質が、タンパク質分析物に対応するタンパク質識別子バーコードを含むdsDNAテンプレート分子を生成することによって分析される、請求項71に記載のプロセス。
【請求項73】
前記5hmC含有DNA、前記タグ付けされていないDNAおよび前記アダプター結合cDNAを増幅し、かつシーケンシングする工程をさらに含む、請求項72に記載のプロセス。
【請求項74】
前記5hmC含有DNA、前記タグ付けされていないDNAおよび前記アダプター結合cDNAが、シーケンシングの前にプールされる、請求項73に記載のプロセス。
【請求項75】
前記無細胞核酸サンプルが、血液サンプルから得られる、請求項62に記載のプロセス。
【請求項76】
前記血液サンプルに対して血漿タンパク質分析を実施する工程をさらに含む、請求項75に記載のプロセス。
【請求項77】
血漿タンパク質が、タンパク質分析物に対応するタンパク質識別子バーコードを含むdsDNAテンプレート分子を生成することによって分析される、請求項76に記載のプロセス。
【請求項78】
前記5hmC含有DNA、前記5mC含有DNA、前記タグ付けされていないDNAおよび前記アダプター結合cDNAを増幅し、かつシーケンシングする工程をさらに含む、請求項77に記載のプロセス。
【請求項79】
前記5hmC含有DNA、前記5mC含有DNA、前記タグ付けされていないDNAおよび前記アダプター結合cDNAが、シーケンシングの前にプールされる、請求項78に記載のプロセス。
【請求項80】
核酸テンプレート分子の非古典的な配列特徴を決定するためのシーケンシングベースの方法であって、
前記テンプレート分子の特定の非配列特徴を指定する固有特性識別子配列を前記核酸テンプレート分子に付加する工程;
前記核酸テンプレート分子および前記付加された識別子配列を増幅して、前記付加された識別子配列をそれぞれが含む複数のアンプリコンを得る工程;および
前記アンプリコンをシーケンシングし、得られた配列リードから前記非配列特徴を決定する工程
を含む、シーケンシングベースの方法。
【請求項81】
前記核酸テンプレート分子が、複数の異なる核酸テンプレート分子を含む組成物に含まれており、各テンプレート分子の特定の非古典的な配列特徴を指定する少なくとも1つの識別子配列が、前記核酸テンプレート分子に付加されている、請求項80に記載の方法。
【請求項82】
前記非古典的な配列特徴が、前記核酸テンプレート分子と会合したタンパク質の一態様を含む、請求項80または請求項81に記載の方法。
【請求項83】
前記タンパク質が、ヒストンである、請求項82に記載の方法。
【請求項84】
前記態様が、ヒストン修飾を含む、請求項83に記載の方法。
【請求項85】
前記ヒストン修飾が、共有結合による翻訳後修飾(PTM)を含む、請求項84に記載の方法。
【請求項86】
前記PTMが、遺伝子発現に影響を与えるヒストン構造の変化を含む、請求項85に記載の方法。
【請求項87】
前記少なくとも1つのPTC修飾が、アセチル化、メチル化、プロピオニル化、ブチリル化、クロトニル化、2-ヒドロキシイソブチリル化、マロニル化、スクシニル化、ホルミル化、ユビキチン化、シトルリン化、リン酸化、ヒドロキシル化、O-GlcNAc化、ADPリボシル化またはそれらの組み合わせを含む、請求項85に記載の方法。
【請求項88】
前記1またはそれを超えるヒストン修飾が、被験体における病状を評価するためのヒストン修飾バイオマーカーを含む、請求項85に記載の方法。
【請求項89】
前記非古典的な配列特徴が、近接伸長法において前記核酸テンプレートが由来したタンパク質分析物を含む、請求項80または請求項81に記載の方法。
【請求項90】
前記非古典的な配列特徴が、エピジェネティック修飾を含む、請求項80または請求項81に記載の方法。
【請求項91】
前記非古典的な配列特徴が、前記核酸テンプレート分子をゲノムDNAまたはcDNAとして識別することを含む、請求項80または請求項81に記載の方法。
【請求項92】
前記組成物が、無細胞核酸サンプルを含む、請求項81に記載の方法。
【請求項93】
前記非古典的な配列特徴が、前記核酸テンプレート分子を無細胞DNAフラグメントまたは無細胞RNAに由来するcDNAとして識別することを含む、請求項92に記載の方法。
【請求項94】
近接伸長法における既知のタンパク質分析物に由来する核酸配列を含み、それによって、タンパク質識別子バーコードとして供される、二本鎖DNAテンプレート分子。
【請求項95】
前記分子の末端にライゲートされたアダプターをさらに含む、請求項94に記載のDNAテンプレート分子。
【請求項96】
それぞれが前記分子の末端にライゲートされた2つのアダプターを含む、請求項95に記載のDNAテンプレート分子。
【請求項97】
5hmC残基をさらに含む、請求項94に記載のDNAテンプレート分子。
【請求項98】
5hmC残基をさらに含む、請求項95に記載のDNAテンプレート分子。
【請求項99】
前記5hmC残基が、前記アダプター内に含まれている、請求項98に記載のDNAテンプレート分子。
【請求項100】
5hmC残基をさらに含む、請求項96に記載のDNAテンプレート分子。
【請求項101】
前記アダプターのうちの少なくとも1つが、5hmC残基を含む、請求項100に記載のDNAテンプレート分子。
【請求項102】
前記近接プローブが、同じタンパク質分析物に結合されたとき、タンパク質分析物に由来する前記核酸配列が、2つの近接プローブの間に形成するハイブリダイズした核酸領域内に核酸配列を含む、請求項94に記載のDNAテンプレート分子。
【請求項103】
無細胞RNAに由来するcDNA、およびそれに付加された5hmC残基を含む核酸配列を含む、無細胞核酸組成物。
【請求項104】
前記核酸配列が、アダプターを含む、請求項103に記載の組成物。
【請求項105】
前記核酸配列が、ソース識別子バーコードをさらに含む、請求項103または104に記載の組成物。
【請求項106】
前記核酸配列が、RNAインジケーターバーコードをさらに含む、請求項102~104のいずれかに記載の組成物。
【請求項107】
前記核酸配列が、RNAインジケーターバーコードをさらに含む、請求項105に記載の組成物。
【請求項108】
単一の血液サンプルに由来するアダプター結合バーコード化二本鎖DNAテンプレート分子をそれぞれが含む、サンプル画分の組み合わせであって、前記組み合わせは、
(a)少なくとも1つのタンパク質関連dsDNAテンプレート分子を含む血漿由来サンプル画分であって、前記タンパク質関連dsDNAテンプレート分子のそれぞれが、特定のタンパク質分析物に対応するタンパク質特異的核酸配列を含み、それによって、タンパク質識別子バーコードとして供される、血漿由来サンプル画分;および
(b)前記血液サンプルから抽出された無細胞核酸サンプルから得られた二本鎖cfDNAテンプレート分子を含む少なくとも1つのcfDNA由来サンプル画分であって、ここで、前記cfDNAテンプレート分子は、ソース識別子バーコード、フラグメント識別子バーコード、鎖識別子バーコード、ヒストン修飾バーコード、ランダムバーコードおよびそれらの組み合わせから選択される固有特性識別子を含むアダプターのセットに末端結合されている、少なくとも1つのcfDNA由来サンプル画分
を含む、組み合わせ。
【請求項109】
前記タンパク質関連dsDNAセグメントが、5hmC残基を含む、請求項108に記載の組み合わせ。
【請求項110】
前記アダプターの第1のセットにおける少なくとも1つのアダプターが、5hmC残基を含む、請求項109に記載の組み合わせ。
【請求項111】
前記5hmC残基が、結合対の第1のメンバーに共有結合されている、請求項109または110に記載の組み合わせ。
【請求項112】
前記結合対の第1のメンバーが、前記結合対の第2のメンバーに結合されている、請求項111に記載の組み合わせ。
【請求項113】
前記結合対の第2のメンバーが、固体支持体表面に付着されている、請求項112に記載の組み合わせ。
【請求項114】
前記結合対の第1のメンバーが、ビオチンであり、前記結合対の第2のメンバーが、アビジンまたはストレプトアビジンである、請求項112または請求項113に記載の組み合わせ。
【請求項115】
(a)において、cfDNAテンプレートのセグメントが、5hmC残基を含む、請求項108~114のいずれか1項に記載の組み合わせ。
【請求項116】
少なくとも2つのcfDNA由来サンプル画分を含み、各画分は、アダプター結合バーコード化二本鎖cfDNAテンプレート分子を含み、少なくとも1つの画分は、5mC、5hmCおよびそれらの組み合わせから選択される修飾されたシトシン残基を含む、請求項108~115のいずれか1項に記載の組み合わせ。
【請求項117】
(a)第1のcfDNA由来サンプル画分が、アフィニティータグ付けされた5hmC残基を含む第1のcfDNAテンプレートセグメントを含み;
(b)第2のcfDNA由来サンプル画分が、アフィニティータグ付けされた5mC残基を含むが5hmC残基を実質的に含まない第2のcfDNAテンプレートセグメントを含み;必要に応じて、
(c)第3のcfDNA由来サンプル画分が、修飾されたシトシン残基を実質的に含まない第3のcfDNAテンプレートを含む、
請求項116に記載の組み合わせ。
【請求項118】
各cfDNAテンプレートセグメントが、ソース識別子バーコード、ならびにフラグメント識別子バーコード、鎖識別子バーコードおよびヌクレオソーム位置識別子バーコードから選択される少なくとも1つの追加の識別子バーコードを含む、請求項108~117のいずれか1項に記載の組み合わせ。
【請求項119】
各cfDNAテンプレートセグメントが、ソース識別子バーコード、フラグメント識別子バーコードおよび鎖識別子バーコードを含む、請求項118に記載の組み合わせ。
【請求項120】
各cfDNAテンプレートセグメントが、ヒストン修飾バーコードをさらに含む、請求項119に記載の組み合わせ。
【請求項121】
前記無細胞核酸サンプル中のcfRNAに由来するアダプター結合cDNA分子をさらに含む、請求項108に記載の組み合わせ。
【請求項122】
請求項108~121のいずれかに記載の組み合わせを合わせ、増幅し、かつシーケンシングすることによって調製された、DNAシーケンシングの準備が整っている、プールされた混合物。
【請求項123】
識別子バーコードをdsDNA分子に付加するための方法であって、
(a)2塩基対~50塩基対の範囲である二本鎖セグメントおよびそれぞれが2塩基~25塩基の範囲である2つの一本鎖セグメントを有するY構築物の形態のシーケンシングアダプターを提供する工程;
(b)前記シーケンシングアダプターをAテール化平滑末端dsDNAテンプレート分子にライゲートする工程;
(c)少なくとも1つのバーコード化プライマーを用いるPCRプロセスにおいて前記アダプター結合dsDNAテンプレート分子を増幅する工程であって、ここで、前記バーコード化プライマーは、(i)前記アダプターの中のいずれの配列にも相補的でなく、識別子バーコードを含む、第1の領域;および(ii)前記アダプターの一本鎖セグメントに十分に相補的であり、それにハイブリダイズする第2の領域を含み、その結果、ポリメラーゼの存在下における前記バーコード化プライマーの伸長によって、前記プライマーの第2の領域と前記アダプターの一本鎖セグメントとの二本鎖複合体が生じ、ここで、前記識別子バーコードを含む前記第1の領域は、前記二本鎖複合体の末端を超えて一本鎖オリゴヌクレオチドテールとして伸長する、工程
を含む、方法。
【請求項124】
前記二本鎖セグメントが、5塩基対~35塩基対の範囲であり、前記2つの一本鎖セグメントがそれぞれ、約5塩基~25塩基の範囲である、請求項123に記載の方法。
【請求項125】
前記二本鎖セグメントが、5塩基対~25塩基対の範囲であり、前記2つの一本鎖セグメントがそれぞれ、約5塩基~20塩基の範囲である、請求項124に記載の方法。
【請求項126】
前記DNAアダプターが、2塩基対~50塩基対の範囲である二本鎖セグメントおよびそれぞれが2塩基~25塩基の範囲である2つの一本鎖セグメントを有するY構築物の形態である、請求項38、45、47、50および53に記載の方法。
【請求項127】
前記二本鎖セグメントが、5塩基対~35塩基対の範囲であり、前記2つの一本鎖セグメントがそれぞれ、約5塩基~25塩基の範囲である、請求項126に記載の方法。
【請求項128】
前記二本鎖セグメントが、5塩基対~25塩基対の範囲であり、前記2つの一本鎖セグメントがそれぞれ、約5塩基~20塩基の範囲である、請求項127に記載の方法。
【請求項129】
dsDNAテンプレート分子を増幅し、かつシーケンシングするためのキットであって、
(a)2塩基対~50塩基対の範囲である二本鎖セグメントおよびそれぞれが2塩基~25塩基の範囲である2つの一本鎖セグメントを有するY構築物の形態のシーケンシングアダプター;
(b)(i)前記アダプターの中のいずれの配列にも相補的でなく、識別子バーコードを含む、第1の領域;および(ii)前記アダプターの一本鎖セグメントに十分に相補的であり、それにハイブリダイズする、第2の領域を含む、バーコード化プライマー;および
(c)ポリメラーゼ
を備える、キット。
【請求項130】
前記二本鎖セグメントが、5塩基対~35塩基対の範囲であり、前記2つの一本鎖セグメントがそれぞれ、約5塩基~25塩基の範囲である、請求項129に記載のキット。
【請求項131】
前記二本鎖セグメントが、5塩基対~25塩基対の範囲であり、前記2つの一本鎖セグメントがそれぞれ、約5塩基~20塩基の範囲である、請求項130に記載の方法。
【請求項132】
標的化配列に対してシーケンスベースの富化工程を実施する工程をさらに含む、請求項38、45、47、50および53のいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
技術分野
本発明は、一般に、エピジェネティック分析に関し、より具体的には、単一の生物学的サンプルから複数の種類の情報を取得するための組み合わされたワークフロー方法に関する。本発明は、ゲノミクス、医学、診断およびエピジェネティック研究の分野において有用性を見出す。
【背景技術】
【0002】
背景
微量の分析物を含む比較的少ない生物学的サンプルからかなりの量の情報を取得することは、他に類を見ない難題である。例えば、無細胞DNA(cfDNA)サンプルは、血漿1mLあたりほんの数ナノグラムのDNAしか含まないのが通常である。結果的に、無細胞DNAサンプルの1つより多い特徴または2つの特徴、例えば、DNA配列情報および/またはメチル化データを評価することは難しく、多くの場合、各々に対して別個のワークフローが使用され、すでに量の少ないDNAサンプルがインプットとして分割され、同じ出発分子に関して知ることができる情報量が制限される(例えば、単一の出発cfDNAフラグメントテンプレートが、メチル化されたサイトカインとヒドロキシメチル化されたサイトカインとの両方を含む場合)。それにもかかわらず、1つのcfDNAサンプルから様々な種類の情報を取得するための方法が提案されてきた。例えば、DNAフラグメントにおける5-メチルシトシン(5mC)および5-ヒドロキシメチルシトシン(5hmC)残基の存在および位置をはじめとした、無細胞DNAの単一サンプルにおける種々のエピジェネティック特徴を検出するための方法であって、異なって処理されたDNAフラグメントを最終的にプールし、一緒にシーケンシングして、所望の情報を取得する方法を記載している、“Methods for the Epigenetic Analysis of DNA,Particularly Cell-Free DNA”(Bluestar Genomics,Inc.)という2018年2月14日出願のArensdorfらの米国特許仮出願第62/630,798号;および無細胞DNA中の5mCおよび5hmCに異なる標識を結合させた後、それらの標識から生成されるシグナルを検出および分析することを記載している、“Simultaneous Single-Molecule Epigenetic Imaging of DNA Methylation and Hydroxymethylation”(The Board of Trustees of the Leland Stanford Junior University)というSongらの米国特許出願公開第2017/0298422A1号を参照のこと。単一の生物学的サンプルからRNAとDNAの両方を増幅し、かつシーケンシングするための方法に関する、“Simultaneous Sequencing of RNA and DNA from the Same Sample”というReuterらの米国特許出願公開第2018/0080021号も参照のこと。
単一の少量の生物学的サンプルから、DNA配列、DNAエピジェネティック修飾、RNA配列、ヌクレオソームの構造およびポジショニング、ヒストン修飾、ならびに核酸に会合した血漿タンパク質と核酸を含まない血漿タンパク質の両方に関する情報を含むがこれらに限定されないはるかに多い情報を取得することができるならば、極めて有用であるだろう。さらに、そのような包括的なデータセットが、並列処理、追加のサンプル材料または複数の情報生成方法を必要とせずに、単一の少量の生物学的サンプルから、本質的に同じ様式で、かつ組み合わせワークフローの状況の中で生成できるならば、理想的であるだろう。最後に、そのような非配列情報が、同じテンプレート核酸内に一緒にコードされ得(例えば、配列内ではあるが、標準的な未修飾の核塩基を使用して)、元の親テンプレート配列とともに、後の工程で処理にかけることができるならば、既存の研究ワークフローおよび次世代シーケンシングライブラリー調製法との適合性が高まるだろう。特に、そのような非配列情報を弱め得るかまたは関連配列から分離し得る抽出、増幅および検出の技術の使用が可能になるだろう。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】米国特許出願公開第2017/0298422号明細書
【特許文献2】米国特許出願公開第2018/0080021号明細書
【発明の概要】
【課題を解決するための手段】
【0004】
発明の要旨
本発明は、当該分野における上述のニーズに応えるものであり、1つの実施形態において、多くの独立した分析工程、複数のデータ生成様式または大量のサンプルを必要とすることなく、生物学的サンプルを分析して、それらから得た複数の種類の情報を決定するための組み合わせワークフロー方法を提供する。患者の血液サンプルから取得され得る情報の種類としては、例えば、特定の血漿タンパク質の存在および濃度;cfDNA(例えば、血液サンプルの無細胞画分由来のDNA)と会合したヒストン修飾の数、位置およびタイプ;その画分中のcfRNAおよびcfDNAの配列;ならびに無細胞DNAに関するエピジェネティック情報、例えば、ヒドロキシメチル化およびメチル化のプロファイル、すなわち、それぞれ5-ヒドロキシメチルシトシン(5hmC)および5-メチルシトシン(5mC)残基の分布が挙げられる。
【0005】
本発明はさらに、生物学的サンプルを分析して、そのサンプルの1またはそれを超える非古典的な配列特徴を決定するための古典的なシーケンシングベースの方法に関し、ここで、「非古典的な配列特徴」は、サンプル中の核酸分子の4種の基本塩基(すなわち、DNAの場合はアデニン、シトシン、グアニンおよびチミン、RNAの場合は、アデニン、シトシン、グアニンおよびウラシル)の同一性および順序以外の特徴を指す。すなわち、本方法は、目的の非古典的な配列特徴を導き出すことができる古典的な核酸配列情報の解明を含む。その非古典的な配列特徴は、核酸の組成に関する情報、例えば、修飾されたシトシン残基、例えば、5hmCまたは5mCの分布であってもよいし、核酸の組成と無関係であってもよく、その代わりに、血液サンプル中の血漿タンパク質の存在および濃度、血液サンプルの無細胞ヌクレオソーム画分において観察されるヒストン修飾などに関する。本方法は、生物学的サンプルの単一の非古典的な配列特徴、生物学的サンプルの1つより多い非古典的な配列特徴、または古典的な配列情報と1またはそれを超える非古典的な配列特徴との組み合わせを決定するために実行され得る。その分析は、目的の非古典的な配列特徴(例えば、血漿タンパク質の同一性、血漿タンパク質の濃度、ヒストン修飾の数、位置および種類、核酸のヒドロキシメチル化プロファイル(例えば、生物学的サンプルの無細胞核酸画分中の無細胞DNAの5hmCプロファイル)、または核酸のメチル化プロファイル(例えば、生物学的サンプルの無細胞核酸画分中の無細胞DNAの5mCプロファイル))から古典的な配列データへの変換を含む。得られた古典的な配列データは、固有特性識別子(UFI)配列として供される、約4~約36塩基対長の範囲の少なくとも1つの特定の核酸配列を含み、ここで、そのUFIは、生物学的サンプル中の目的の分析物に由来する二本鎖DNA(dsDNA)分子に組み込まれる。その古典的な配列データは、cDNA配列も含むので、生物学的サンプルの無細胞核酸画分中の無細胞RNAなどのRNAテンプレート分子の対応する配列に関する情報も提供され得る。
【0006】
第1の実施形態において、本発明は、第1の近接プローブおよび第2の近接プローブをそれぞれが含む複数のプローブ対を提供すること(ここで、各プローブ対は、特定のタンパク質分析物を標的にする)および対応するタンパク質分析物の存在下において各プローブ対のプローブ間で二本鎖DNA(dsDNA)セグメントを生成することによって、生物学的サンプル中の複数のタンパク質分析物を識別するための改善された近接伸長アッセイを提供し、その改善は、以下を含む。
【0007】
(a)タンパク質識別子バーコードとして供されるタンパク質特異的核酸配列を二本鎖DNAセグメントに組み込み、それによって、タンパク質バーコード化dsDNAテンプレート分子を形成する工程;
【0008】
(b)タンパク質バーコード化dsDNAテンプレート分子を増幅し、かつシーケンシングする工程;および
【0009】
(c)生成された配列リードにおいて観察されるタンパク質識別子バーコードから生物学的サンプル中のタンパク質分析物を識別する工程。
【0010】
いくつかの実施形態において、各タンパク質特異的核酸配列は、アダプター内に含められ、工程(a)は、アダプターをdsDNAセグメントに末端結合することによって実施される。
【0011】
関連の実施形態において、第1の近接プローブおよび第2の近接プローブをそれぞれが含む複数のプローブ対を提供すること(ここで、各プローブ対は、特定のタンパク質分析物を標的にする)および対応するタンパク質分析物の存在下において各プローブ対のプローブ間でdsDNAセグメントを生成することによって、生物学的サンプル中の複数のタンパク質分析物を識別するための改善された近接伸長アッセイが提供され、その改善は、以下を含む。
【0012】
(a)(i)タンパク質識別子バーコードとして供されるタンパク質特異的核酸配列、および(ii)5hmC残基を含むキャプチャー配列を二本鎖DNAセグメントに組み込み、それによって、そのキャプチャー配列を含むタンパク質バーコード化dsDNAテンプレート分子を形成する工程;
【0013】
(b)タンパク質バーコード化dsDNAテンプレート分子を増幅し、かつシーケンシングする工程;および
【0014】
(c)生成された配列リードにおいて観察されるタンパク質識別子バーコードから生物学的サンプル中のタンパク質分析物を識別する工程。
【0015】
いくつかの実施形態において、工程(a)は、タンパク質特異的核酸配列およびキャプチャー配列をそれぞれが含むアダプターとdsDNAセグメントを末端結合することによって実施される。
【0016】
実際には、キャプチャー配列における1またはそれを超える5hmC残基を官能化することにより、サンプル、サンプルの一部、または複数の生体分子を含む混和物からdsDNAテンプレート分子を取り出すことを促進することができる。これは、複数の種類の情報が抽出される単一の生物学的サンプルの組み合わせワークフロー分析の状況において特に有用である。
【0017】
別の実施形態において、第1の近接プローブおよび第2の近接プローブをそれぞれが含む複数のプローブ対を提供すること(ここで、各プローブ対は、特定のタンパク質分析物を標的にする)および対応するタンパク質分析物の存在下において各プローブ対のプローブ間でdsDNAセグメントを生成することによって、生物学的サンプル中の複数のタンパク質分析物を識別するための改善された近接伸長アッセイが提供され、その改善は、以下を含む。
【0018】
(a)(i)タンパク質識別子バーコードとして供されるタンパク質特異的核酸配列、(ii)分子バーコードとして供されるランダム核酸配列、および必要に応じて(iii)5hmC残基を含むキャプチャー配列を二本鎖DNAセグメントに組み込み、それによって、そのキャプチャー配列を必要に応じて含むタンパク質バーコード化dsDNAテンプレート分子を形成する工程;
【0019】
(b)タンパク質バーコード化dsDNAテンプレート分子を増幅し、かつシーケンシングする工程;および
【0020】
(c)生成された配列リードにおいて観察されるタンパク質識別子バーコードから生物学的サンプル中のタンパク質分析物を識別する工程。
【0021】
関連の実施形態において、上記近接伸長アッセイは、工程(b)の前に、少なくとも1つのタンパク質濃度コントロール組成物をdsDNAテンプレート分子と合わせる工程をさらに含む。そのコントロール組成物は分子バーコードと一緒になって、特定のタンパク質分析物を示唆する配列リードの数を、タンパク質濃度コントロール組成物によって生成された配列リードと比較することによって、サンプル中の少なくとも1つのタンパク質分析物の元の濃度を測定することを可能にする。
【0022】
別の実施形態において、複数の生物学的サンプルの各々における複数のタンパク質分析物を識別するための改善された近接伸長アッセイが提供され、ここで、各生物学的サンプルに対して、このアッセイは、第1の近接プローブおよび第2の近接プローブをそれぞれが含む複数のプローブ対を提供する工程(ここで、各プローブ対は、特定のタンパク質分析物を標的にする)および対応するタンパク質分析物の存在下において各プローブ対のプローブ間でdsDNAセグメントを生成する工程を含み、この改善は、以下を含む。
【0023】
(a)(i)タンパク質識別子バーコードとして供されるタンパク質特異的核酸配列、必要に応じて(ii)分子バーコードとして供されるランダム核酸配列、および必要に応じて(iii)5hmC残基を含むキャプチャー配列を二本鎖DNAセグメントに組み込み、それによって、必要に応じてキャプチャー配列を含むタンパク質バーコード化dsDNAテンプレート分子を形成する工程;
【0024】
(b)タンパク質バーコード化dsDNAテンプレート分子を増幅し、かつシーケンシングする工程;
【0025】
(c)生成された配列リードにおいて観察されるタンパク質識別子バーコードから生物学的サンプル中のタンパク質分析物を識別する工程;および
【0026】
(d)少なくとも100個の生物学的サンプルに対して工程(a)、(b)および(c)を並行して実施する工程。
【0027】
例えば、工程(a)、(b)および(c)は、少なくとも300個の生物学的サンプル、少なくとも500個の生物学的サンプルまたは少なくとも1500個の生物学的サンプルに対して同時に実施され得る。
【0028】
関連の実施形態において、本発明は、DNAシーケンスベースの技術を用いて生物学的サンプル中の複数のタンパク質分析物を識別するための方法を提供し、その方法は、以下を含む。
【0029】
(a)それぞれが、特定のタンパク質分析物を標的にし、第1の末端にタンパク質結合ドメイン、反対側の第2の末端に核酸結合ドメインおよびそれらの間に非ハイブリダイズ核酸領域を含む、複数のプローブ対を提供する工程であって、ここで、(i)プローブ対の第1および第2の近接プローブのタンパク質結合ドメインは、同じタンパク質分析物上の異なる結合部位に同時に結合することができ、(ii)第1および第2の近接プローブが、両方ともそのタンパク質に結合しており、ハイブリダイゼーションが生じるのに十分近接しているとき、それらのプローブの核酸結合ドメインは、互いに相補的であり、ハイブリダイズして、dsDNAセグメントを形成する、工程;
【0030】
(b)(i)プローブ対内の各近接プローブのタンパク質結合ドメインが対応するタンパク質分析物に結合すること、および(ii)核酸結合ドメインが互いにハイブリダイゼーションして、第1の近接プローブを起源とする5’末端および第2の近接プローブを起源とする3’末端を有するdsDNAセグメントを形成すること、を促進するのに効果的な条件下において生物学的サンプルまたはその一部をプローブ対とインキュベートする工程;
【0031】
(c)ポリメラーゼおよびdNTP混合物を添加することによって、第1の近接プローブの3’末端を第2の近接プローブに沿って伸長して、タンパク質識別子バーコードとして供されるタンパク質特異的核酸配列および5hmC残基を含むキャプチャー配列を組み込むdsDNAセグメントをプローブの間に生成する工程であって、ここで、(i)第1のプローブ、第2のプローブ、または第1のプローブと第2のプローブの両方の核酸結合領域が、キャプチャー配列、タンパク質識別子バーコード、またはキャプチャー配列とタンパク質識別子バーコードの両方を含み;(ii)dNTP混合物は、少なくとも1つの5hmC残基を含み;かつ/または(iii)ポリメラーゼ伸長後にdsDNAセグメントの末端にアダプターがライゲートされ、ここで、少なくとも1つのアダプターが、キャプチャー配列、タンパク質識別子バーコードまたはキャプチャー配列とタンパク質識別子バーコードの両方を含み、それによって、それぞれがキャプチャー配列を含むタンパク質バーコード化dsDNAテンプレート分子が形成される、工程;
【0032】
(d)キャプチャー配列を含むタンパク質バーコード化dsDNAテンプレート分子を増幅し、かつシーケンシングする工程;および
【0033】
(e)工程(b)において生成された配列リードにおいて観察されるタンパク質識別子バーコードから生物学的サンプル中のタンパク質分析物を識別する工程。
【0034】
上述の実施形態の1つの態様において、上記方法は、生物学的サンプルの一部、典型的には、血液サンプルから得られる血漿に対して実施される。
【0035】
追加の実施形態では、1またはそれを超える生物学的サンプル中のタンパク質分析物を、上記の実施形態のいずれかに関して示されたように分析し、同じ生物学的サンプル由来の無細胞核酸サンプルも同様に分析する、組み合わせワークフロー方法が提供される。
【0036】
本明細書に提供される組み合わせワークフロー方法の第1の実施形態において、無細胞核酸サンプルに対して得られる情報は、その無細胞核酸サンプル中のヌクレオソーム内の1またはそれを超えるヒストン修飾の存在または量に関する。そのヒストン修飾は、共有結合による翻訳後修飾(PTM)、遺伝子発現に影響を与えるヒストン構造の変化であり得る。この実施形態の1つの態様において、目的の特定のヒストン修飾は、被験体における病状を評価するためのヒストン修飾バイオマーカーであり、被験体における病状を評価するためのヒストン修飾バイオマーカーも含み得る。
【0037】
本明細書に提供される組み合わせワークフロー方法の別の実施形態において、無細胞核酸サンプルに対して得られる情報は、その無細胞核酸サンプル中のcfDNAの少なくとも1つの配列を含む。
【0038】
本明細書に提供される組み合わせワークフロー方法の別の実施形態において、無細胞核酸サンプルに対して得られる情報は、無細胞核酸サンプル中のcfRNAの少なくとも1つの配列を含む。
【0039】
本明細書に提供される組み合わせワークフロー方法の別の実施形態において、無細胞核酸サンプルに対して得られる情報は、cfDNAヒドロキシメチル化に関するエピジェネティックデータを含む。
【0040】
本明細書に提供される組み合わせワークフロー方法の別の実施形態において、無細胞核酸サンプルに対して得られる情報は、cfDNAメチル化に関するエピジェネティックデータを含む。
【0041】
さらなる実施形態では、1またはそれを超える生物学的サンプル中のタンパク質分析物を、上に記載されたように分析し、同じ生物学的サンプル由来の無細胞核酸サンプルを、ヒストン修飾;cfDNA配列;cfRNA配列;cfDNAヒドロキシメチル化;およびcfDNAメチル化のうちの少なくとも2つに関して分析する、組み合わせワークフロー方法が提供される。
【0042】
別の実施形態において、本発明は、無細胞核酸サンプルを調製して、DNAシーケンシングベースの技術を用いて、無細胞核酸サンプルに含まれているヌクレオソームにおける少なくとも1つのヒストン修飾の識別を可能にするための方法を提供する。その方法は、以下を含む。
【0043】
(a)ヒストンコアの周囲に巻き付いたcfDNA分子をそれぞれが含む複数のヌクレオソームを含む無細胞核酸サンプルを提供する工程;
【0044】
(b)末端ハイブリダイズ領域を含むアダプターをcfDNA分子の末端にライゲートし、それによって、それぞれがヒストンコアの周囲に巻き付いたアダプター結合cfDNA分子を含む修飾された無細胞核酸サンプルを提供する工程;
【0045】
(c)第1の末端に、目的のヒストン修飾に特異的に結合するヒストン修飾結合ドメイン;第2の末端に、末端ハイブリダイズ領域に相補的な核酸結合ドメイン;およびそれらの間に、目的のヒストン修飾に対応し、それによって、ヒストン修飾バーコードとして供される、核酸配列を含む非ハイブリダイズ領域、を含む近接プローブを提供する工程であって、ここで、その近接プローブは、ヒストン修飾結合ドメインが目的のヒストン修飾に結合することと、相補的な核酸結合ドメインがハイブリダイズ核酸領域とハイブリダイゼーションすることとが同時に起きることを可能にするような寸法である、工程;
【0046】
(d)(i)ヒストン修飾結合ドメインがヒストン修飾に結合すること、および(ii)相補的な核酸結合ドメインがハイブリダイズ核酸領域とハイブリダイゼーションして、無細胞DNAを起源とする5’末端および近接プローブを起源とする3’末端を有し、かつヒストン修飾バーコードを含むdsDNAセグメントを形成すること、を促進するのに効果的な条件下において、修飾された無細胞核酸サンプルを近接プローブとインキュベートする工程;および
【0047】
(e)ポリメラーゼおよびdNTP混合物を添加することによって、dsDNAセグメントの5’末端を近接プローブの非ハイブリダイズ領域およびヒストン修飾バーコードに沿って伸長し、それによって、増幅用およびシーケンシング用の、ヒストン修飾バーコード化dsDNAテンプレート分子を提供する工程。
【0048】
関連の実施形態において、工程(c)は、それぞれが異なるヒストン修飾を標的にする複数の近接プローブを提供する工程を含む。
【0049】
別の関連の実施形態において、上記方法は、ヒストン修飾バーコード化dsDNAテンプレート分子を増幅する工程をさらに含む。
【0050】
追加の関連の実施形態において、上記方法は、増幅されたヒストン修飾バーコード化dsDNAテンプレート分子をシーケンシングする工程、および生成された配列リードにおいて観察されるヒストン修飾バーコードからヒストン修飾のタイプおよび位置に関する情報を決定する工程も含む。
【0051】
本発明の別の実施形態は、無細胞核酸サンプルから抽出するためのcfDNAの調製において少なくとも1つの5hmC残基を含むアダプターを使用するための方法に関する。その方法は、(a)5hmC残基を含むキャプチャー配列を含むDNAアダプターを無細胞核酸サンプル中の平滑末端DNAの末端にライゲートして、アダプター結合DNAを提供する工程;および(b)タグ付けされたcfDNAを選択的に取り出すことを可能にするアフィニティータグで5hmC残基を官能化する工程を含む。そのアフィニティータグは、ビオチン自体などのビオチン部分、またはより典型的には、反応性部位を含むように共有結合的に修飾されたビオチンであり得る。その後、ビオチン化5hmC部位を用いることにより、アビジンでコーティングされたまたはストレプトアビジンでコーティングされた支持体との反応によるサンプルからの抽出が可能になる。
【0052】
上述の実施形態の1つの態様において、アダプターは、UFI配列、通常、無細胞核酸配列におけるcfDNAの非配列特徴、すなわち特性をそれぞれが示す少なくとも2つのUFI配列をさらに含む。増幅およびシーケンシングの後、目的の非配列特徴が、配列リードにおいて観察されるUFI配列から明らかにされ得る。
【0053】
別の実施形態において、本発明は、シーケンシングベースの同時分析のために単一の無細胞核酸サンプル中の無細胞DNAおよび無細胞RNAを調製するための方法を提供する。その方法は、(a)少なくとも1つのUFI配列を含む第1のアダプター配列を含むDNAアダプターを無細胞サンプル中の平滑末端DNAの末端にライゲートして、アダプター結合DNAを提供する工程であって、ここで、その少なくとも1つのUFI配列は、ソース識別子バーコードを含む、工程;(b)アダプター結合DNAおよびRNAを精製して、アダプター結合DNAおよびRNAの無細胞混和物を提供する工程;(c)RNAからcDNAの第1鎖を合成する工程;(d)第1鎖に相補的なcDNAの第2鎖を合成して、cDNA二重鎖を提供する工程;および(e)ソース識別子バーコードおよびRNAインジケーターバーコードを含む第2のアダプター配列を含むcDNAアダプターをリガーゼの非存在下においてcDNA二重鎖の少なくとも1つの末端に共有結合させ、それによって、アダプター結合DNAも含む無細胞混和物中にアダプター結合cDNAを提供する工程を含む。
【0054】
本発明のさらなる実施形態では、シーケンシングベースの分析を用いて単一の無細胞核酸サンプルから複数の種類のデータを抽出するための組み合わせワークフロープロセスが提供され、ここで、そのデータは、サンプル中のcfDNAのヒドロキシメチル化プロファイル、ならびにcfRNAに対する配列情報を含む。そのデータは、DNA配列情報も含み得る。そのプロセスは、(a)少なくとも1つのUFI配列を含む第1のアダプター配列を含むDNAアダプターを無細胞核酸サンプル中の平滑末端DNAの末端にライゲートして、アダプター結合DNAを提供する工程であって、ここで、その少なくとも1つのUFI配列は、ソース識別子バーコードを含む、工程;(b)サンプル中のRNAからcDNAを合成し、ソース識別子バーコードおよびRNAインジケーターバーコードを含むcDNAアダプターをcDNAの少なくとも1つの末端に共有結合させ、それによって、アダプター結合DNAも含む無細胞組成物中にアダプター結合cDNAを提供する工程;(c)その無細胞組成物から5hmC含有DNAを選択的に取り出すことを可能にするアフィニティータグで無細胞組成物中の5hmC残基を官能化する工程;(d)残っているタグ付けされていないDNAおよびアダプター結合cDNAとともに、5hmC含有DNAを無細胞組成物から取り出す工程;(e)5hmC含有DNAに5hmCプロセスバーコードを付加する工程;および(f)バーコード化5hmC含有DNA、タグ付けされていないDNAおよびアダプター結合cDNAをプールし、増幅し、かつシーケンシングする工程を含む。
【0055】
上述の実施形態の1つの態様において、工程(e)は、5hmCプロセスバーコードをDNAアダプターに組み込むことによって実施される。
【0056】
本発明の関連の実施形態では、シーケンシングベースの分析を用いて単一の無細胞核酸サンプルから複数の種類のデータを抽出するための組み合わせワークフロープロセスが提供され、ここで、そのデータは、上記のように、サンプル中のcfDNAのヒドロキシメチル化プロファイル、cfRNA配列情報、および必要に応じてDNA配列情報を含み、サンプル中のcfDNAのメチル化プロファイルをさらに含む。そのプロセスは、(a)少なくとも1つのUFI配列を含む第1のアダプター配列を含むDNAアダプターを無細胞核酸サンプル中の平滑末端DNAの末端にライゲートして、アダプター結合DNAを提供する工程であって、ここで、その少なくとも1つのUFI配列は、ソース識別子バーコードを含む、工程;(b)サンプル中のRNAからcDNAを合成し、ソース識別子バーコードおよびRNAインジケーターバーコードを含むcDNAアダプターをcDNAの少なくとも1つの末端に共有結合させ、それによって、アダプター結合DNAも含む無細胞組成物中にアダプター結合cDNAを提供する工程;(c)その無細胞組成物から5hmC含有DNAを選択的に取り出すことを可能にするアフィニティータグで無細胞組成物中の5hmC残基を官能化する工程;(d)残っているタグ付けされていないDNAおよびアダプター結合cDNAとともに、無細胞組成物から5hmC含有DNAを取り出す工程;(e)5hmC含有DNAに5hmCプロセスバーコードを付加する工程;(f)残りのサンプル中のメチルシトシン残基を酸化されたメチルシトシン残基に変換する工程;(g)サンプルから官能化種を選択的に取り出すことを可能にする第2のアフィニティータグで、酸化されたメチルシトシン残基を官能化する工程;(h)サンプル中に残っているタグ付けされていないDNAおよびアダプター結合cDNAとともに、タグ付けされた5mC含有DNAを取り出す工程;(i)タグ付けされた5mC含有DNAに5mCプロセスバーコードを付加する工程;および(j)タグ付けされた5hmC含有DNA、タグ付けされた5mC含有DNA、タグ付けされていないDNAおよびアダプター結合cDNAを増幅し、かつシーケンシングする工程を含む。
【0057】
本発明の別の関連の実施形態では、シーケンシングベースの分析を用いて単一の無細胞核酸サンプルから少なくとも2種類のデータを抽出するための組み合わせワークフロープロセスが提供され、ここで、そのデータは、サンプル中のcfDNAのヒドロキシメチル化プロファイル、cfRNA配列情報、および必要に応じてDNA配列情報を含む。このプロセスは、(a)ソース識別子バーコードを含む少なくとも1つの分子バーコードを含む第1のアダプター配列を含むDNAアダプターをサンプル中の平滑末端DNAの末端にライゲートして、アダプター結合DNAを提供する工程;(b)サンプル中のRNAからcDNAを合成し、5hmC残基、ソース識別子バーコードおよびRNAインジケーターバーコードを含むcDNAアダプターをcDNAの少なくとも1つの末端に共有結合させ、それによって、バーコード化アダプター結合cDNAを提供する工程;(c)無細胞サンプルから5hmC含有種を選択的に取り出すことを可能にするアフィニティータグでサンプル中の5hmC残基を官能化する工程;(d)5hmC含有DNAおよびバーコード化アダプター結合cDNAを無細胞サンプルから取り出す工程;および(e)5hmC含有DNAおよびバーコード化アダプター結合cDNAのプールされた混和物を増幅し、かつシーケンシングして、DNAヒドロキシメチル化および同じサンプル中のcfRNAに関するデータを提供する工程を含む。
【0058】
本発明の追加の関連の実施形態では、シーケンシングベースの分析を用いて単一の無細胞核酸サンプルから少なくとも2種類のデータを抽出するための組み合わせワークフロープロセスが提供され、ここで、そのデータは、無細胞核酸サンプル中のヌクレオソーム内の1またはそれを超えるヒストン修飾の存在または量、およびサンプル中のcfRNAに対する配列情報を含む。このプロセスは、単一の無細胞核酸サンプルから複数の種類のデータを抽出するための組み合わせワークフロープロセスを含み、このプロセスは、(a)ハイブリダイズ核酸領域を含むアダプターをヌクレオソーム会合DNAの各末端にライゲートし、それによって、アダプター結合DNAと会合したヌクレオソームを含む修飾された無細胞核酸サンプルを提供する工程;(b)第1の末端に、ヒストン修飾結合ドメイン、反対側の第2の末端に、ハイブリダイズ核酸領域に相補的な核酸結合ドメイン、およびそれらの間に、特定のヒストン修飾に対応し、それによってヒストン修飾バーコードとして供されるように選択された核酸配列を含む非ハイブリダイズ核酸領域を含む、近接プローブを提供する工程であって、ここで、その近接プローブは、ヒストン修飾結合ドメインがヒストン修飾に結合することと、相補的な核酸結合ドメインがハイブリダイズ核酸領域とハイブリダイゼーションすることとが同時に起きることを可能にするような寸法である、工程;(c)(i)ヒストン修飾結合ドメインがヒストン修飾に結合すること、および(ii)相補的な核酸結合ドメインがハイブリダイズ核酸領域とハイブリダイゼーションして、無細胞DNAを起源とする5’末端および近接プローブを起源とする3’末端を有するdsDNAセグメントを形成すること、を促進するのに効果的な条件下において、修飾された無細胞核酸サンプルを近接プローブとインキュベートする工程;および(d)ポリメラーゼおよびdNTP混合物を添加することによって、セグメントの5’末端を近接プローブの非ハイブリダイズ領域およびヒストン修飾バーコードに沿って伸長し、それによって、さらなる処理用およびシーケンシング用の、ヒストン修飾バーコード化dsDNAテンプレート分子を提供する工程;(e)サンプル中の核酸を精製して、ヒストン修飾バーコード化dsDNAおよびDNAを含む組成物を提供する工程;(f)サンプル中のRNAからcDNAの第1鎖を合成する工程;(g)その第1鎖に相補的なcDNAの第2鎖を合成して、cDNA二重鎖を提供する工程;および(h)ソース識別子バーコードおよびRNAインジケーターバーコードを含む配列を含むcDNAアダプターをリガーゼの非存在下においてcDNA二重鎖の少なくとも1つの末端に共有結合させ、それによって、アダプター結合cDNAおよびヒストン修飾バーコード化dsDNAテンプレート分子を含む核酸組成物を提供する工程を含む。この実施形態において、このプロセスは、(i)ヒストン修飾バーコード化dsDNAテンプレート分子およびアダプター結合cDNAを増幅し、かつシーケンシングする工程をさらに含み、ここで、そのヒストン修飾バーコード化dsDNAテンプレート分子およびアダプター結合cDNAは、通常、プールされた混和物中で一緒に増幅され、シーケンシングされる(sequence)。
【0059】
上述の実施形態の1つの態様において、上記プロセスは、サンプル中のcfDNAの分析を組み込んで、そのヒドロキシメチル化プロファイルを決定する工程をさらに含む。このプロセスは、上述の実施形態の工程(a)~(h)を実施する工程、次いで、(i)5hmC含有種を選択的に取り出すことを可能にする第1のアフィニティータグで核酸組成物中の5hmC残基を官能化する工程;(j)残っているタグ付けされていないDNAおよびアダプター結合cDNAとともに、タグ付けされた5hmC含有DNAをその組成物から取り出す工程;(k)タグ付けされた5hmC含有DNAに5hmCプロセスバーコードを付加する工程;および(l)5hmC含有DNA、タグ付けされていないDNA(工程(d)において生成されたヒストン修飾バーコード化dsDNAテンプレート分子を含む)およびアダプター結合cDNAを増幅し、かつシーケンシングする工程であって、ここで、増幅およびシーケンシングは、通常、様々な種のプールされた混和物を用いて実施される、工程を含む。
【0060】
上記実施形態の別の態様では、上記プロセスは、サンプル中のcfDNAのメチル化プロファイルを決定することをさらに含む。そのプロセスは、上で説明した工程(a)~(k)を実施する工程、次いで、(l)残りのサンプル中のメチルシトシン残基を酸化されたメチルシトシン残基に変換する工程;(m)サンプルからの官能化種を選択的に取り出すことを可能にする第2のアフィニティータグで、酸化されたメチルシトシン残基を官能化する工程;(n)残っているタグ付けされていないDNAおよびアダプター結合cDNAとともに、タグ付けされた5mC含有DNAを取り出す工程;(o)タグ付けされた5mC含有DNAに5mCプロセスバーコードを付加する工程;および(p)タグ付けされた5hmC含有DNA、タグ付けされた5mC含有DNA、タグ付けされていないDNA(前述同様に、ヒストン修飾バーコード化dsDNAテンプレート分子を含む)およびアダプター結合cDNAを増幅し、かつシーケンシングする工程であって、ここで、増幅およびシーケンシングは、再度、典型的には、様々な種のプールされた混和物を用いて実施される、工程を含む。
【0061】
本発明のさらなる実施形態では、血液サンプルに対する血漿タンパク質分析と、その血液サンプルの無細胞核酸画分の分析との両方を実施するための組み合わせワークフロープロセスが提供される。その血漿タンパク質分析は、近接伸長アッセイ用いたタンパク質バーコード化dsDNAテンプレート分子の生成、ならびに最終的には、そのdsDNAテンプレート分子を、無細胞核酸サンプルの分析において生成された1またはそれを超える様々なDNAテンプレート分子、すなわち、ヒストン修飾バーコード化dsDNAテンプレート、タグ付けされた5hmC含有DNA、タグ付けされた5mC含有DNA、タグ付けされていないDNAおよびアダプター結合cDNAとともにプールすることを含む。
【0062】
別の実施形態において、本発明は、核酸テンプレート分子の非古典的な配列特徴を決定するためのシーケンシングベースの方法を提供し、その方法は、テンプレート分子の特定の非配列特徴を指定する識別子配列を核酸テンプレート分子に付加する工程;核酸テンプレート分子および付加された識別子配列を増幅して、付加された識別子配列をそれぞれが含む複数のアンプリコンを得る工程;およびそれらのアンプリコンをシーケンシングし、得られた配列リードから非配列特徴を決定する工程を含む。
【0063】
本発明のさらなる実施形態は、近接伸長アッセイにおける既知のタンパク質分析物から導き出されたタンパク質特異的核酸配列を含み、それによって、タンパク質識別子バーコードとして供される、二本鎖DNAテンプレート分子に関する。
【0064】
本発明のなおも別の実施形態は、単一の血液サンプルに由来するアダプター結合バーコード化二本鎖DNAテンプレート分子をそれぞれが含む、サンプル画分の組み合わせを提供し、その組み合わせは、(a)少なくとも1つのタンパク質関連dsDNAテンプレート分子を含む血漿由来サンプル画分であって、そのタンパク質関連dsDNAテンプレート分子のそれぞれが、特定のタンパク質分析物に対応するタンパク質特異的核酸配列を含み、それによって、タンパク質識別子バーコードとして供される、血漿由来サンプル画分;および(b)血液サンプルから得られた無細胞核酸サンプルから得られた二本鎖cfDNAテンプレート分子を含む少なくとも1つのcfDNA由来サンプル画分であって、ここで、そのcfDNAテンプレート分子は、ソース識別子バーコード、フラグメント識別子バーコード、鎖識別子バーコード、ヒストン修飾バーコード、ランダムバーコードおよびそれらの組み合わせから選択されるUFI配列を含むアダプターのセットに末端結合されている、cfDNA由来サンプル画分を含む。
【0065】
本発明のなおもさらなる実施形態において、サンプル画分の上述の組み合わせは、サンプル画分のプールされた混和物を含み、ここで、その混和物中のDNAテンプレート分子は、同時に増幅され、シーケンシングされ得る。
【0066】
本発明の別の実施形態では、アダプターのライゲーション効率を改善し、ひいてはDNAをシーケンシングするためのプロセスを改善するための方法および組成物が提供される。無細胞サンプル中のDNA濃度がすでに非常に低ければ、本発明の上述の方法および組成物は、cfDNAの分析において特に有用であることが理解されるであろう。さらに、それらの方法および組成物は、5mC含有DNAおよび5hmC含有DNAのシーケンシングおよび定量化において特に有用である。なぜなら、これらの修飾されたシトシン残基は、比較的まれにしか存在せず、それぞれ全DNA塩基の約1%および0.1%しか占めないからである。ゆえに、5mCおよび5hmC、特に5hmCを検出するためのいずれの方法も、特定される全5hmC残基の割合に関して高効率を示す必要があり、また、高選択性を示す必要もある。この高選択性は、5mCと特定される実質的にすべての残基が、実際に5mC残基であるはずであることを意味し、同様に、5hmCと特定される実質的にすべての残基が、5hmC残基であるはずであることを意味する。
【0067】
さらなる実施形態において、本発明は、cfDNA、例えば、5mC残基、5hmC残基または5mC残基と5hmC残基の両方を含むcfDNAをシーケンシングするための改善された方法および組成物を提供し、ここで、その改善は、アダプター結合cfDNAが、増幅、例えば、PCR増幅したときだけ、サンプル別にインデックスが付されるような、単一のテンプレートライゲーション反応を促進する切断型シーケンシングアダプターの使用を含む。
【0068】
別の実施形態では、識別子バーコードをdsDNA分子に付加するための方法が提供され、その方法は、以下を含む。
【0069】
(a)2塩基対~50塩基対の範囲である二本鎖セグメントおよびそれぞれが2塩基~25塩基の範囲である2つの一本鎖セグメントを有するY構築物の形態のシーケンシングアダプターを提供する工程;
【0070】
(b)そのシーケンシングアダプターをAテール化平滑末端dsDNAテンプレート分子にライゲートする工程;
【0071】
(c)少なくとも1つのバーコード化プライマーを用いるPCRプロセスにおいてアダプター結合dsDNAテンプレート分子を増幅する工程であって、ここで、そのバーコード化プライマーは、(i)アダプターの中のいずれの配列にも相補的でなく、識別子バーコードを含む、第1の領域;および(ii)アダプターの一本鎖セグメントに十分に相補的であり、それにハイブリダイズする第2の領域を含み、その結果、ポリメラーゼの存在下におけるバーコード化プライマーの伸長によって、プライマーの第2の領域とアダプターの一本鎖セグメントとの二本鎖複合体が生じ、ここで、識別子バーコードを含む第1の領域は、その二本鎖複合体の末端を超えて一本鎖オリゴヌクレオチドテールとして伸長する、工程。
【0072】
関連の実施形態において、本発明は、dsDNAテンプレート分子を増幅し、かつシーケンシングするためのキットを提供し、そのキットは、以下を備える。
【0073】
(a)2塩基対~50塩基対の範囲である二本鎖セグメントおよびそれぞれが2塩基~25塩基の範囲である2つの一本鎖セグメントを有するY構築物の形態のシーケンシングアダプター;
【0074】
(b)(i)アダプターの中のいずれの配列にも相補的でなく、識別子バーコードを含む、第1の領域;および(ii)アダプターの一本鎖セグメントに十分に相補的であり、それにハイブリダイズする、第2の領域を含むバーコード化プライマー;および
【0075】
(c)ポリメラーゼ。
【図面の簡単な説明】
【0076】
図1図1は、近接伸長アッセイおよびタンパク質UFI配列を用いて生物学的サンプル中のタンパク質分析物に関する情報を古典的な配列情報に変換する流れを概略的に示している。
【0077】
図2図2は、近接プローブおよびヒストン修飾UFI配列を用いてヌクレオソームにおけるヒストン修飾に関する情報を古典的な配列情報に変換するために無細胞ChIP(cfChIP)法を用いる流れを概略的に示している。
【0078】
図3図3は、本発明の包括的な組み合わせワークフロープロセスを概略的に示している。
【0079】
図4図4は、cfRNA分析を省略した本発明の別の組み合わせワークフロープロセスを概略的に示している。
【0080】
図5図5は、血漿プロテオミクスを含まない本発明の追加の組み合わせワークフロープロセスを概略的に示している。
【0081】
図6図6は、識別子配列(この図における「[インデックス]」)の付加において用いられる先行技術のテンプレート/アダプター/プライマー構築物を示している。
【0082】
図7図7は、本発明の切断型アダプターをバーコード化プライマーと組み合わせて用いている対応する構築物を示している。
【0083】
図8図8は、PCRプロセスにおいてインデックス付きプライマーおよび切断型アダプターを用いる流れを概略的に示している。
【0084】
図9図9は、実施例2のパート(a)に記載されるようなDNA断片化の後に得られたサイズ分布プロファイルを示している。
【0085】
図10図10は、投入アダプターの濃度に対するライブラリー濃度(ng/μL)のプロット、およびMT群のホールゲノムシーケンシング(WGS)である。
【0086】
図11図11は、推定PCR効率に対するサンプリングされたテンプレートの割合のプロットとして、アダプターの直接比較の結果を示している。
【0087】
図12図12は、実施例3に記載されるような、切断型アダプターの効率と標準的なアダプターの効率とを横に並べた比較を提供している。
【発明を実施するための形態】
【0088】
1.用語および概要:
【0089】
別段の定めがないかぎり、本明細書で使用される全ての技術的および科学的用語は、本発明が属する技術分野の当業者によって通常理解される意味を有する。本発明を説明するために特に重要な特定の用語は、以下に定義する。その他の関連用語は、国際特許出願公開WO2017/176630(Quakeら、発明の名称「Noninvasive Diagnostics by Sequencing 5-Hydroxymethylated Cell-Free DNA」)に定義されている。本明細書で参照されている上記の特許公報ならびに他の全ての特許文献および刊行物は、参照により明示的に援用される。
【0090】
本明細書および添付の特許請求の範囲において、単数形「a」、「an」および「the」は、文脈が明確に反対の意味を指示しなければ、複数表記を含む。したがって、例えば、「アダプター(an adapter)」は、単一のアダプターだけでなく、同じであってもまたは異なってもよい2つまたはそれを超えるアダプターも指し、「テンプレート分子(a template molecule)」は、単一のテンプレート分子のみならず、複数のテンプレート分子を指すなど。
【0091】
数値範囲には、その範囲を規定している数値が含まれる。別段の定めがないかぎり、それぞれ、核酸は、5’から3’の方向に、左から右に記述され;アミノ酸配列は、アミノ末端からカルボキシ末端の方向に、左から右に記述される。
【0092】
本明細書に示される見出しは、本発明の種々の態様または実施形態を限定するものではない。したがって、このすぐ後に定義されている用語は、明細書を全体として参照することによって、より完全に定義される。
【0093】
別段定義されない限り、本明細書において使用されるすべての専門用語および科学用語は、本発明が属する分野の当業者が通常理解している意味と同じ意味を有する。Singletonら、Dictionary of Microbiology and Molecular Biology,2d Ed.(New York:John Wiley and Sons,1994)およびHale & Markham,The Harper Collins Dictionary of Biology(New York:Harper Perennial,1991)は、本明細書において使用される用語の多くの一般的な意味を当業者に提供している。それにもかかわらず、明確にするためおよび参照しやすくするために、特定の用語を下記に定義する。
【0094】
本明細書において使用される用語「サンプル」は、1またはそれを超える目的の分析物を含む、典型的には液状であるが必ずしもそうではない、材料または材料の混合物に関する。
【0095】
本明細書において使用される用語「生物学的サンプル」は、タンパク質、ペプチド、脂質、核酸などをはじめとした生体分子の混合物を含む、ヒト被験体の生体液、細胞、組織または臓器に由来するサンプルに関する。一般に、サンプルは、必ずではないが、全血サンプル、血清サンプルまたは血漿サンプルなどの血液サンプルである。
【0096】
用語「核酸サンプル」は、本明細書で用いられる場合、核酸を含有する生物学的サンプルを指す。核酸サンプルは、ヌクレオソームを含む無細胞核酸サンプルであってもよく、その場合、核酸サンプルは、本明細書において、「ヌクレオソームサンプル」と呼ばれることがある。核酸サンプルは、サンプル中にヒストンおよび他のタンパク質を実質的に含まない無細胞DNAから構成されていてもよく、例えば無細胞DNA精製後の場合があてはまるであろう。核酸サンプルは、本明細書において、無細胞RNAも含んでいてもよい。
【0097】
「サンプルフラクション」は、元の生物学的サンプルのサブセットを指し、血液サンプルを複数の等しいフラクションに分けた場合のように、その生物学的サンプルの組成的に等しい部分であってもよい。あるいは、サンプルフラクションは、組成的に異なっていてもよく、例えば、生物学的サンプルのある特定の成分を除去した場合(無細胞核酸の抽出がその一例である)があてはまるであろう。
【0098】
本明細書で用いられる場合、用語「無細胞核酸」は、無細胞DNAと無細胞RNAの両方を包含し、この無細胞DNAおよび無細胞RNAは、体液を含む生物学的サンプルの無細胞フラクション中に存在していてもよい。前記体液は、全血、血清、もしくは血漿を含む血液であってもよく、または尿、嚢胞液、もしくは別の体液であってもよい。多くの例において、生物学的サンプルは血液サンプルであり、無細胞核酸サンプルは、それらのサンプルから、当業者に知られている、および/または関連する書籍および文献に説明されている、現在普通に用いられている手段で抽出され、無細胞核酸抽出を行うためのキットは市販されている(例えば、AllPrep(登録商標)DNA/RNA MiniキットおよびQIAmp DNA Blood Miniキット(両方ともQiagen社から入手できる)、またはMagMAX無細胞全核酸キット(Cell-Free Total Nucleic acid Kit)およびMagMAX DNA単離キット(DNA Isolation Kit)(Thermo Fisher Scientific社から入手できる))。例えば、Huiら、Fongら(2009)Clin.Chem.55(3):587-598も参照のこと。
【0099】
用語「ヌクレオチド」は、知られているプリンおよびピリミジン塩基だけではなく、他の修飾された複素環塩基も含有するような部分を含むことを意図している。このような修飾は、メチル化プリンまたはピリミジン、アシル化プリンまたはピリミジン、アルキル化リボース、または他のアルキル化複素環を含む。また、用語「ヌクレオチド」は、ハプテンまたは蛍光標識を含有し、通常のリボース糖およびデオキシリボース糖だけではなく、他の糖も含有するような部分を含む。修飾ヌクレオシドまたはヌクレオチドには、糖部位の修飾も含まれ、糖部位の修飾においては、例えば、1またはそれを超えるヒドロキシル基が、ハロゲン原子または脂肪族基で置換されているか、エーテル、アミンなどとして官能基化されている。本明細書において特に重要なものは、5-メチルシトシンおよびその酸化形態(例えば、5-ヒドロキシメチルシトシン、5-ホルミルシトシン、および5-カルボキシメチルシトシン)を含む、修飾シトシン残基である。
【0100】
用語「核酸」および「ポリヌクレオチド」は、本明細書において、ヌクレオチド、例えばデオキシリボヌクレオチドまたはリボヌクレオチドからなる、任意の長さ、例えば、約2塩基超、約10塩基超、約100塩基超、約500塩基超、1000塩基超、および最長で約10,000またはそれを超える塩基数のポリマーを記述するために、互換的に用いられる。核酸は、酵素的に生成されたものでもよく、化学的に合成したものでもよく、天然に生じたものでもよい。
【0101】
用語「オリゴヌクレオチド」は、本明細書で用いる場合、長さが約2~200ヌクレオチド、最長で500ヌクレオチドの、ヌクレオチドの一本鎖マルチマーを表す。
【0102】
オリゴヌクレオチドは、合成でも、酵素的に合成してもよく、いくつかの実施形態において、長さは30~150ヌクレオチドである。オリゴヌクレオチドは、リボヌクレオチドモノマーを含んでいてもよく(すなわち、オリゴリボヌクレオチドであってもよい)、および/またはデオキシリボヌクレオチドモノマーを含んでいてもよい。オリゴヌクレオチドは、例えば、長さが10~20、21~30、31~40、41~50、51~60、61~70、71~80、80~100、100~150、または150~200ヌクレオチドである。
【0103】
用語「ハイブリダイゼーション」は、当該技術分野で知られているように、塩基対形成によって核酸鎖を相補鎖と接合させるプロセスを指す。ある核酸と参照核酸配列が、中程度から高いストリンジェンシーのハイブリダイゼーションおよび洗浄条件において、互いに特異的にハイブリダイズする場合、その核酸は、前記参照核酸配列と「選択的にハイブリダイズできる」ものとみなされる。中程度から高いストリンジェンシーのハイブリダイゼーション条件は知られている(例えば、Ausubelら、Short Protocols in Molecular Biology,3rd ed.,Wiley & Sons 1995、およびSambrookら、Molecular Cloning:A Laboratory Manual,Third Edition,2001 Cold Spring Harbor,N.Y.を参照のこと)。
【0104】
用語「二本鎖(duplex)」および「二重化した(duplexed)」は、本明細書において、塩基対を形成した、すなわち互いにハイブリダイズした2つの相補的ポリヌクレオチドを記述するために、互換的に用いられる。DNA二本鎖は、本明細書において、「二本鎖DNA」または「dsDNA」と呼ばれ、インタクトな分子または分子のセグメントでありうる。例えば、本明細書において、バーコード化およびアダプター結合と呼ばれるdsDNAは、インタクトな分子であるのに対し、近接伸長アッセイにおける各近接プローブの核酸末端配列間に形成されるdsDNAは、dsDNAセグメントである。
【0105】
用語「鎖(strand)」は、本明細書で用いる場合、共有結合、例えばホスホジエステル結合によって互いに共有結合したヌクレオチドからなる核酸の1本の鎖を指す。細胞において、DNAは、たいてい二本鎖形態で存在し、それ自体は、本明細書において「トップ」および「ボトム」鎖と呼ばれる2つの相補鎖を有する。ある特定のケースにおいて、染色体領域の相補鎖は、「プラス」および「マイナス」鎖、「ポジティブ」および「ネガティブ」鎖、「第1」および「第2」鎖、「コード」および「非コード」鎖、「ワトソン」および「クリック」鎖、または「センス」および「アンチセンス」鎖と呼ばれることがある。ある鎖をトップまたはボトム鎖のどちらと定めるかは任意であり、何らかの特定の向き、機能、または構造を意味するものではない。いくつかの例示的な哺乳類の染色体領域(例えば、BAC、アセンブリー、染色体など)の第1鎖のヌクレオチド配列が知られており、例えばNCBIのGenbankデータベース中に存在することがある。
【0106】
用語「プライマー」は、ポリヌクレオチドテンプレートと二重鎖を形成したとき、核酸合成の開始点として作用することができ、その3’末端からテンプレートに沿って伸長されて、伸長された二重鎖を形成することができる、合成オリゴヌクレオチドを指す。伸長プロセス中に付加されるヌクレオチドの配列は、テンプレートポリヌクレオチドの配列によって決まる。通常、プライマーは、DNAポリメラーゼによって伸長される。プライマーは、一般に、プライマー伸長産物の合成におけるそれらの使用に適合する長さであり、通常、8~100ヌクレオチド長、例えば、10~75、15~60、15~40、18~30、20~40、21~50、22~45、25~40などの範囲である。典型的なプライマーは、10~50ヌクレオチド長、例えば、15~45、18~40、20~30、21~25などの範囲であり得、述べた範囲の間の任意の長さであり得る。いくつかの実施形態において、プライマーは、通常、長くとも約10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65または70ヌクレオチド長である。
【0107】
DNA複製反応を引き起こすために用いられる「プライマー」のように、「アダプター」も、生物学的分析において特定の目的を果たす短い合成オリゴヌクレオチドである。アダプターは、一本鎖または二本鎖であり得るが、本明細書における好ましいアダプターは、二本鎖である。1つの実施形態において、アダプターは、ヘアピンアダプター(すなわち、それ自体と塩基対形成して、二本鎖ステムおよびループを有する構造を形成する1つの分子であって、ここで、その分子の3’および5’末端は、それぞれ二本鎖DNA分子の5’および3’末端にライゲートする)であり得る。別の実施形態において、アダプターは、Yアダプターであり得る。別の実施形態において、アダプターはそれ自体が、互いと塩基対形成した2つの異なるオリゴヌクレオチド分子から構成され得る。明らかであるように、アダプターのライゲート可能な末端は、制限酵素による切断によって生成されるオーバーハングと適合性であるようにデザインされてもよいし、平滑末端または5’Tオーバーハングを有してもよい。用語「アダプター」は、二本鎖分子ならびに一本鎖分子を指す。アダプターは、DNAもしくはRNAまたはそれら2つの混合物であり得る。RNAを含むアダプターは、RNase処理またはアルカリ加水分解によって切断可能であり得る。アダプターは、15~100塩基、例えば、50~70塩基であり得るが、この範囲外のアダプターも想定される。
【0108】
用語「アダプター結合」は、本明細書で用いられる場合、アダプターに結合した核酸を指す。アダプターは、核酸分子の5’末端および/または3’末端に結合しうる。本明細書で用いられる場合、用語「アダプター配列付加」は、アダプターを、サンプル中のフラグメントの末端に付加する行為を指す。これは、ポリメラーゼを用いてフラグメントの末端を充填すること、末端A配列を付加すること、次いでこの末端A配列を有するフラグメントにT突出を含むアダプターを結合させることによって行われうる。アダプターは、通常、リガーゼを用いてDNA二本鎖に結合されるが、RNAでは、cDNA二本鎖の少なくとも1つの末端に、好ましくはリガーゼ不存在下で、共有結合または他の形で結合される。
【0109】
用語「非対称アダプター」は、本明細書で用いられる場合、二本鎖核酸フラグメントの両末端に結合された場合に、3’末端のタグ配列と同じではない、または相補的ではない5’タグ配列を含むトップ鎖を生じさせるであろうアダプターを指す。非対称アダプターの例は、米国特許第5,712,126号および第6,372,434号(Weissmanら)、および国際特許出願公開WO2009/032167(Bignellら)に記載されている。非対称にタグがつけられたフラグメントは、2つのプライマー、すなわち鎖の3’末端に付加された第1のタグ配列とハイブリダイズする第1のプライマー;およびもう一方の、鎖の5’末端に付加された第2のタグ配列の相補鎖とハイブリダイズする第2のプライマーによって増幅されうる。Y字アダプターおよびヘアピンアダプター(ヘアピンアダプターは、ライゲーション後に切断することによって、「Y字アダプター」を生じうる)は、非対称アダプターの例である。
【0110】
用語「Y字アダプター」は、二本鎖領域と、対向する配列が相補的ではない一本鎖領域とを含むアダプターを指す。二本鎖領域の末端は、例えばライゲーションまたはトランスポザーゼ触媒反応によって、ゲノムDNAの二本鎖フラグメントなどの標的分子に結合できる。Y字アダプターに結合した、アダプタータグがついた二本鎖DNAのそれぞれの鎖は、一方の末端にY字アダプターの一方の鎖の配列を有し、他方の末端にY字アダプターの他方の鎖の配列を有するという点で、非対称にタグがつけられている。両方の末端がY字アダプターに結合した核酸分子を増幅することによって、非対称にタグがつけられた核酸、すなわち、あるタグ配列を含む5’末端と、別のタグ配列を含む3’末端とを有する核酸が生じる。
【0111】
用語「ヘアピンアダプター」は、ヘアピン形状のアダプターを指す。一実施形態において、ライゲーション後に、ヘアピンループを切断し、各末端に非相補タグを有する鎖を生じさせることができる。いくつかのケースにおいて、ヘアピンアダプターのループは、ウラシル残基を含んでいてもよく、そのようなループは、他の方法も知られているが、ウラシルDNAグリコシラーゼおよびエンドヌクレアーゼVIIIによって切断することができる。
【0112】
本明細書において使用される用語「アダプター連結サンプル」は、アダプターに結合しているサンプルを指す。上記の定義を考慮すれば理解されるであろうが、非対称アダプターに結合したサンプルは、5’および3’末端に非相補配列を有する鎖を含む。
【0113】
本明細書において使用される用語「増幅する」は、任意の適切な核酸増幅技術、例えば、PCR(ポリメラーゼ連鎖反応)増幅(ネステッドPCRおよびマルチプレックスPCRを含む)、RCA(ローリングサークル増幅)、NASBA(核酸配列ベース増幅)、TMA(転写物媒介増幅)およびSDA(鎖置換増幅)などの技術を用いて実施され得るような、テンプレート核酸の1またはそれを超えるコピー、つまり「アンプリコン」を生成することを指す。特定の状況においては、例えば、マルチプレックスPCRとRCAとの併用(例えば、Gongら、(2018)RSC Adv.8:27375を参照のこと)、RCAと定量的PCR(qPCR)との併用(例えば、Liuら、(2016)Anal Sci.32:963-968を参照のこと)など、増幅技術の組み合わせが有益に使用され得ることが理解されるであろう。
【0114】
用語「富化する」および「富化」は、ある特定の特徴を有するテンプレート分子(例えば、5-ヒドロキシメチルシトシンを含む核酸)を、そのような特徴を持たない分析対象物(例えば、ヒドロキシメチルシトシンを含まない核酸)から部分精製することを指す。富化は、典型的には、前記の特徴を有する分析対象物の濃度を、前記特徴を持たない分析対象物に対して、少なくとも2倍、少なくとも5倍、または少なくとも10倍高める。富化後、サンプル中の分析対象物の少なくとも10%、少なくとも20%、少なくとも50%、少なくとも80%、または少なくとも90%が、富化に用いた特徴を有しうる。例えば、富化した組成物中の核酸分子の少なくとも10%、少なくとも20%、少なくとも50%、少なくとも80%、または少なくとも90%は、キャプチャータグを含むように修飾された1またはそれを超えるヒドロキシメチルシトシンを有する鎖を含んでいてもよい。
【0115】
用語「シーケンシング」は、本明細書で用いられる場合、その方法によって、ポリヌクレオチドの少なくとも10個の連続したヌクレオチドが識別される(例えば、少なくとも20、少なくとも50、少なくとも100、もしくは少なくとも200、またはそれを超える連続したヌクレオチドが識別される)ような方法を指す。
【0116】
用語「次世代シーケンシング(NGS、next-generation sequencing)」または「ハイスループットシーケンシング」は、本明細書で用いられる場合、現在Illumina社、Life Technologies社、Roche社などによって採用されている、いわゆるパラレルSBS(sequencing-by-synthesis)またはSBL(sequencing-by-ligation)プラットフォームを指す。次世代シーケンシング法としては、Oxford Nanopore Technologies社によって商業化された方法などのナノポアシーケンシング法、Life Technologies社によって商業化されたIon Torrent技術などの電子的検出方法、およびPacific Biosciences社によって商業化された方法などの単分子蛍光に基づく方法などもあげられうる。
【0117】
用語「読み取りデータ(read)」は、本明細書で用いられる場合、シーケンシングシステム(例えば、超並列シーケンシングなど)の生の出力または加工された出力を指す。いくつかの実施形態において、本明細書に記載されている方法の出力は、読み取りデータである。いくつかの実施形態において、それらの読み取りデータは、トリミング、フィルター、およびアライメントが必要であることがあり、結果として、生の読み取りデータ、トリミングされた読み取りデータ、アライメントされた読み取りデータが得られる。
【0118】
「UFI」は、核酸分子群を特徴付ける固有特性識別子である。UFIは、時折、「バーコード」と呼ばれる(本明細書において時折、「UFI配列」または「UFIバーコード」と呼ばれる)ものにおける特定の核酸配列であり得るか、またはグリコシル化、ビオチン化などによって生じ得るような化学タグであり得る。UFIは、特定の特徴、例えば、付加された部分または組み込まれた部分が存在しないことでもあり得る。例えば、UFIは、特定のバーコードが存在しないこと、またはグリコシル化部分もしくはビオチン化部分が存在しないことなどであり得る。UFI配列は、典型的には、核酸分子の特徴を識別するように働く比較的短い核酸配列である。UFIを含む核酸テンプレート分子およびそのアンプリコンは時折、「バーコード化」テンプレート分子またはアンプリコンと本明細書において呼ばれる。UFI配列のタイプの例としては、以下が挙げられるがこれらに限定されない。
【0119】
「分子UFI配列」(または「分子バーコード」)は、そのUFI配列が十分な長さである場合に、各核酸テンプレート分子が、ユニークなUFI配列に付着されるように、サンプル中の各核酸テンプレート分子に付加される短い核酸配列である。分子UFI配列は、通常、一続きのランダムヌクレオチドとしてデザインされるか、部分的に縮重のヌクレオチドとしてデザインされるか、またはいくつかの場合、すなわち、限定された数のテンプレート分子の場合は、定義されたヌクレオチドとしてデザインされる。当該分野で公知であるように、分子UFI配列を用いることにより、増幅エラーおよび配列分析装置エラーを説明および相殺することができ、ユーザーが複製物を追跡することおよびそれらを下流の分析から除去することを可能にでき、分子の計数、ひいては分析物の濃度測定を可能にできる。例えば、Casbonら、(2011)Nuc.Acids Res.39(12):1-8を参照のこと。
【0120】
「サンプルUFI配列」(または「サンプルバーコード」または「インデックス付きUFI」)は、複数のサンプルが組み合わされ、処理され、一緒にシーケンシングされ得るように、サンプル中の各核酸テンプレート分子に付加される核酸配列であり、ここで、そのサンプルUFI配列は、読み取りデータをサンプル別にソーティングおよびグルーピングすること(すなわち、脱多重化(de-multiplexing))を可能にする。サンプルUFI配列は、サンプルを得た個体を識別する。
【0121】
「ソース識別子配列」(または「ソースUFI」または「ソースバーコード」)は、ソース起源を識別する。ソースUFIは、通常、サンプルUFIであり得る。しかしながら、特定の場合において、例えば、様々な種類のサンプルが、同じ個体から得られるとき(例えば、血液サンプル、嚢胞液など)、ソースUFIは、サンプルを得た患者ではなく、そのサンプルの生理学的起源を指摘し得る。単一の個体から得られた2またはそれを超えるサンプルタイプを含む複数のサンプルが組み合わされるときは、サンプルバーコードとソースバーコードの両方を用いるべきである。
【0122】
「フラグメント識別子配列」(または「フラグメントUFI」または「フラグメントバーコード」):核酸が、多くのフラグメントの集団(無細胞DNAに天然に存在するような)を含むか、または複数の公知の断片化技術(例えば、物理的、超音波処理、酵素的など)によって操作され得る、核酸サンプルにおいては、サンプル中の各フラグメントに、対応するフラグメント識別子配列でバーコードが付けられる。非重複フラグメント識別子配列を有する配列リードは、さまざまな元の核酸テンプレート分子に相当し、同じフラグメント識別子配列または実質的に重複するフラグメント識別子配列を有する読み取りデータは、同じテンプレート分子のフラグメントに相当する可能性がある。ここで特定されるユニークな特徴は、フラグメントが由来するテンプレート核酸分子である。
【0123】
「鎖識別子配列」(または「鎖UFI」もしくは「鎖バーコード」)によって、DNA二本鎖の2つの鎖がそれぞれ独立してタグづけされ、それによって読み取りデータの起源である鎖が判定できる(すなわち、WストランドまたはCストランドとして判定できる)。
【0124】
「タンパク質識別子配列」(または「タンパク質UFI」または「タンパク質バーコード」)は、近接プローブが特異的に結合する対応するタンパク質の存在下において近接プローブ対の核酸テールの間で形成されたハイブリダイズ領域内に、ハイブリダイズ領域に隣接して、またはハイブリダイズ領域の近くに、含められる。ゆえに、タンパク質識別子配列は、読み出されたとき、近接プローブ対によって標的化にれたタンパク質分析物の存在を識別する。
【0125】
「ヒストン修飾識別子配列」(または「ヒストン修飾UFI」または「ヒストン修飾バーコード」)は、ヌクレオソームにおいて特定されたヒストン修飾を識別するために、本明細書に記載されている無細胞クロマチン免疫沈降(cfChIP)技術において用いられる。ヒストン修飾識別子配列は、プローブの核酸テール、すなわち、プローブの第1の末端と、ヒストンの周囲に巻き付いたDNAの末端との間で形成されたハイブリダイズ領域内に、ハイブリダイズ領域に隣接して、またはハイブリダイズ領域の近くに、含められる。プローブの他方の末端は、目的のヒストン修飾に結合する。したがって、ヒストン修飾識別子配列は、読み出されたとき、ヒストン修飾の存在を識別する。
【0126】
「5hmC識別子配列」(または「5hmCバーコード」)によって、サンプル中の5hmC含有無細胞DNAテンプレート分子を起源とするDNAフラグメント、すなわち「ヒドロキシメチル化」DNAが識別される。
【0127】
「5mC識別子配列」(または「5mCバーコード」)によって、5hmCを含まない5mC含有無細胞DNAテンプレート分子を起源とするDNAフラグメントが識別される。
【0128】
「無細胞RNA識別子配列」(または「cfRNA UFI」)は、cDNAフラグメントがcfRNAテンプレート分子を起源とすると識別する。
【0129】
これらのおよび他のUFIは、非古典的な配列特徴(例えば、血漿タンパク質の存在および濃度、ヒストン修飾の位置および種類、ヒドロキシメチル化プロファイル、メチル化プロファイルなど)を、その非古典的な配列特徴を導き出すことができる古典的な配列データに変換するための根拠を提供する。その適用は、上述のタイプのUFIに限定されず、他のタイプのUFIも想定される。例えば、多くの種類の「プロセス識別子配列」または「プロセスUFI」が、増幅されていないテンプレートDNAフラグメントの初期プールを非配列特徴に基づいて分割するために用いられるいくつかのプロセスのいずれか1つを識別するために使用され得る。ヒストン修飾UFI、タンパク質UFIおよびエピジェネティックUFI(5hmC UFIおよび5mC UFIを含む)(これらのすべてがプロセスUFIとして特徴付けられ得る)に加えて、テンプレート分子の配列の外側の隣接するゲノム領域(例えば、ゲノム全長にわたるCTCF結合部位)の存在または同一性を指摘するUFIをはじめ、本発明とともに有益に用いることができる他のタイプのUFIもある。
【0130】
いくつかの実施形態において、UFIは、1~約35ヌクレオチド、例えば、2~30ヌクレオチド、4~30ヌクレオチド、4~24ヌクレオチド、4~16ヌクレオチド、4~12ヌクレオチド、6~20ヌクレオチド、6~16ヌクレオチド、6~12ヌクレオチドなどの範囲の長さを有し得る。特定の場合では、上で述べたように、UFIは、エラー検出性および/またはエラー訂正性であり得、これは、たとえエラーがあったとしても(例えば、分子バーコード配列の決定に至るまでの様々な処理工程のいずれかの間に、分子バーコードの配列が、誤って合成されるか、誤って読まれるか、または歪められた場合でも)、そのコードを正しく解釈できることを意味する。エラー訂正性配列の使用は、文献(例えば、Hamatiらの米国特許出願公開第2010/0323348号およびBravermanらの同第2009/0105959号(これらの両方が参照により本明細書に援用される))に記載されている。
【0131】
本明細書におけるUFI配列として働くオリゴヌクレオチドは、任意の有効な方法によってDNA分子中に組み込まれてもよく、「~の中に組み込まれる(incorporated into)」は、本明細書において、前記UFIがDNA分子の末端、DNA分子の末端付近、またはDNA分子内に設けられるかぎり、「~に付加される(added to)」および「~に追加される(appended to)」と互換的に用いられる。例えば、複数のUFIが、選ばれたリガーゼを用いてDNAの末端に結合されてもよく、この場合、最後に結合されたUFIだけが分子の「末端」に存在する。さらに、以下で詳述されている近接伸長アッセイおよびヒストン修飾法において、UFIは、近接プローブの核酸テール内に、近接プローブの核酸テールの末端に、またはタンパク質標的にプローブが結合すると生成されるハイブリダイズした領域内に含まれ得る。
【0132】
本明細書において使用される用語「タンパク質分析物」は、オリゴペプチド、ポリペプチドおよびタンパク質をはじめとした複数のペプチド種を包含し、ここで、分析物として、目的の種は、特定のサンプル中に存在してもよいし、存在しなくてもよい。したがって、本明細書におけるサンプル中の分析物の「検出」は、分析物の有無の検出、分析物が存在する可能性の確認、検出された分析物の濃度の確認などを含み得る。
【0133】
より一般的には、用語「検出」は、任意の形態の測定を指し、あるエレメントが存在するか否かを判定することを含む、用語「決定する」、「測定する」、「評価する(evaluating)」、「評価する(assessing)」、「アッセイする」および「分析する」と交換可能に使用される。これらの用語は、定量的および/または定性的な決定の両方を含む。評価は、相対的であっても絶対的であってもよい。ゆえに、「存在の評価」には、存在する部分の量の決定、ならびに存在するかまたは存在しないかの判定が含まれる。
【0134】
「ヒドロキシメチル化レベル」または「ヒドロキシメチル化状態」は、目的の遺伝子座内におけるヒドロキシメチル化の程度である。ヒドロキシメチル化の程度は、通常、ヒドロキシメチル化密度、例えば、ある核酸領域内の全シトシン(修飾されたものと未修飾のものの両方)に対する5hmC残基の比として測定される。他のヒドロキシメチル化密度の尺度も考えられ、例えば、ある核酸領域における全ヌクレオチドに対する5hmC残基の比である。
【0135】
「ヒドロキシメチル化プロファイル」または「ヒドロキシメチル化シグネチャ」は、複数のヒドロキシメチル化遺伝子座の各々におけるヒドロキシメチル化レベルを含むデータセットを指す。
【0136】
2.タンパク質分析物の検出:
【0137】
第1の実施形態において、生物学的サンプル中のタンパク質分析物を検出するための方法が提供され、その方法は、タンパク質分析物の存在の検出、ならびに定量化、すなわち、分析物の量または濃度の決定を含み得る。本明細書に記載されている他の方法と同様に、得ようとするおよび得られる情報は、適切にバーコードが付けられた核酸テンプレート分子によって生成される配列リードに由来する。その方法は、下記に記載されるように、サンプル中の複数のタンパク質分析物の各々の検出にまで及ぶことが理解されるであろう。
【0138】
近接ライゲーションアッセイ(PLA)および近接伸長アッセイ(PEA)は、複雑な生物学的サンプル中のタンパク質の検出および定量化のために用いられる確立された方法である。PLAは、DNA鎖と結合した抗体である2つの「近接プローブ」にタンパク質分析物を結合することを含む。それらの鎖が十分に近接するとき(この近接は、プローブが標的分析物に結合しているときに生じる)、それらは、DNAリガーゼ酵素によって一体化される。次いで、そのライゲーション産物は、定量的PCR(qPCR)に対するテンプレートとしての役割を果たし、存在するタンパク質分析物の量を反映する。タンパク質分析物の検出および定量化においては、PEA法も知られており、特に、複雑な生物学的サンプルにおいて、PLAが著しい回収損失をもたらす限り、PEA法は、PLAに対する有意な改善点を提供する。例えば、Lundbergら、(2011)Nuc.Acids.Res.39(15):1-8を参照のこと。PLAのように、PEAも、それぞれが本質的にDNA鎖に結合した抗体である、2つの近接プローブを使用することに頼っている。PEAでは、プローブ対の一方のプローブのDNA「テール」が、その対の他方のプローブのDNAテールにハイブリダイズし、その結果、それらのプローブの間で二本鎖DNA(dsDNA)セグメントが形成され、ここで、5’末端は、その対の第1の近接プローブを起源とする。次いで、ポリメラーゼおよびdNTP混合物を用いて、そのdsDNAセグメントの5’末端を第2の近接プローブに沿って伸長する。次いで、PLAアッセイと同様に、近接伸長産物を従来のタンパク質アッセイにおいてqPCRのテンプレートとして使用して、目的の分析物を定量化する。
【0139】
本発明は、定量的PCRの必要を無くし、その代わりにシーケンシング、典型的にはNGSを用いて、生物学的サンプル中の少なくとも1つのタンパク質分析物を検出し、定量化する。本発明の改善された近接伸長アッセイを用いて生成されたシーケンシングされる核酸産物は、増幅されたタンパク質バーコード化dsDNAテンプレート分子、すなわち、タンパク質特異的UFI配列を含むdsDNAアンプリコン(またはPCR産物)である。そのタンパク質バーコード化アンプリコンをシーケンシングし、配列リードをデコンボリューションして、配列リードにおいて観察されるタンパク質UFI配列からタンパク質分析物の存在および量を決定する。
【0140】
1つの態様において、本発明は、第1の近接プローブおよび第2の近接プローブをそれぞれが含む複数のプローブ対を提供すること(ここで、各プローブ対は、特定のタンパク質分析物を標的にする)および対応するタンパク質分析物の存在下において各プローブ対のプローブ間でdsDNAセグメントを生成することによって生物学的サンプル中の複数のタンパク質分析物を識別するための改善された近接伸長アッセイを提供し、ここで、その改善は、以下を含む:タンパク質特異的UFI配列をプローブ対のプローブ間で生成されたdsDNAセグメントに組み込み、それによって、タンパク質バーコード化dsDNAテンプレート分子を形成する工程;タンパク質バーコード化dsDNAテンプレート分子を増幅し、かつシーケンシングする工程;および生成された配列リードにおいて観察されるタンパク質特異的UFIから生物学的サンプル中のタンパク質分析物を識別する工程。典型的には、タンパク質特異的UFIは、セグメントの少なくとも1つの末端へのUFI含有アダプターの末端結合によってdsDNAセグメントに組み込まれる。この方法は、図1に概略的に示されている。
【0141】
最適には、上述のプロセスにおいて生成されたタンパク質バーコード化dsDNAテンプレート分子は、5hmC残基を含むキャプチャー配列とともに提供される。そのキャプチャー配列は、単一の5hmC残基であり得るか、または単一の5hmC残基を含む短いオリゴヌクレオチド配列、または2もしくはそれを超える5hmC残基を含む短いオリゴヌクレオチド配列配列であり得る。5hmC残基が存在することにより、その5hmCをビオチンなどのアフィニティータグで官能化することによる捕捉が可能になり、そしてアビジンまたはストレプトアビジン表面を用いて、サンプルまたはその一部からビオチン化種を取り出すことが可能になる。
【0142】
異なるプローブ対によって生成された各dsDNAテンプレート分子は、そのプローブ対によって標的化されるタンパク質分析物に対応するユニークなタンパク質UFI配列を有するが、タンパク質バーコード化dsDNAテンプレート分子はすべて、同じキャプチャー配列を有し得ることが理解されるであろう。タンパク質特異的UFI配列およびキャプチャー配列は、単一のオリゴヌクレオチド配列またはアダプターとして、プローブ間で生成されたdsDNAテンプレートに同時に付加され得る。あるいは、タンパク質特異的UFI配列がまず付加された後、キャプチャー配列が付加され得る。複製物を追跡するため、分子の計数を可能にするため、ならびに増幅エラーおよび配列分析装置エラーを相殺するために、近接伸長アッセイによって生成された各dsDNAテンプレート分子に、タンパク質特異的UFIおよび自由選択の5hmC含有キャプチャー配列とともに分子UFI配列も付加され得る。
【0143】
生物学的サンプル中のタンパク質分析物の濃度を決定するために、上で説明した改善された近接伸長アッセイは、タンパク質濃度コントロール組成物の使用をさらに含む。特定のタンパク質分析物を示唆する配列リードを、最初に生物学的サンプルに組み込まれていたタンパク質濃度コントロール組成物によって生成された配列リードと比較する。タンパク質濃度コントロール組成物は、当該分野で公知であり、それらとしては、既知濃度のタンパク質を処理の前にサンプルに添加するスパイクイン(spike-in)コントロールが例として挙げられる。いくつかの実施形態において、そのスパイクインコントロールを、ある濃度範囲全体にわたってさまざまな濃度を有するコントロール組成物を含む濃度ラダーと併せて用いる。
【0144】
タンパク質バーコード化dsDNAテンプレートの配列リードからタンパク質分析物を決定する本方法の利点は、多数の生物学的サンプル、例えば、血液サンプルまたはその一部(例えば、血漿サンプルまたは血清サンプル)を同時に処理できる点である。少なくとも50個、少なくとも100個、少なくとも300個、少なくとも500個、少なくとも1000個または少なくとも1500個またはそれを超える生物学的サンプルを容易に同時に処理できる。96ウェル、384ウェルまたは1536ウェルプレートなどの市販のマイクロウェルプレートの個々のウェルにおいて処理されるように各サンプルを提供することが好都合であり得る。別の利点は、同じサンプルに対して他のタイプの分析を実施できる点、および下記で詳細に説明されるような、シーケンシングを介してさらなる情報を取得することもできる点である。
【0145】
上記の実施形態のバリエーションでは、DNAシーケンシングベースの技術を用いて生物学的サンプル中の複数のタンパク質分析物を識別するための関連方法が提供され、その方法は、以下を含む。
【0146】
(a)それぞれが、特定のタンパク質分析物を標的にし、第1の末端にタンパク質結合ドメイン、反対側の第2の末端に核酸結合ドメインおよびそれらの間に非ハイブリダイズ核酸領域を含む、複数のプローブ対を提供する工程であって、ここで、(i)第1および第2の近接プローブのタンパク質結合ドメインは、同じタンパク質分析物上の異なる結合部位に同時に結合することができ、(ii)第1および第2の近接プローブが、両方ともそのタンパク質に結合しており、ハイブリダイゼーションが生じるのに十分近接しているとき、プローブの核酸結合ドメインは、互いに相補的であり、ハイブリダイズして、dsDNAセグメントを形成する、工程;
【0147】
(b)(i)プローブ対内の各近接プローブのタンパク質結合ドメインが対応するタンパク質分析物に結合すること、および(ii)核酸結合ドメインが互いにハイブリダイゼーションして、第1の近接プローブを起源とする5’末端および第2の近接プローブを起源とする3’末端を有するdsDNAセグメントを形成すること、を促進するのに効果的な条件下において生物学的サンプルまたはその一部をプローブ対とインキュベートする工程;
【0148】
(c)ポリメラーゼおよびdNTP混合物を添加することによって、第1の近接プローブの5’末端を第2の近接プローブに沿って伸長して、タンパク質識別子バーコードとして供されるタンパク質特異的核酸配列および5hmC残基を含むキャプチャー配列を組み込むdsDNAセグメントをプローブの間に生成する工程であって、ここで、(i)第1のプローブ、第2のプローブ、または第1のプローブと第2のプローブの両方の核酸結合領域が、キャプチャー配列、タンパク質識別子バーコード、またはキャプチャー配列とタンパク質識別子バーコードの両方を含み;(ii)dNTP混合物は、少なくとも1つの5hmC残基を含み;かつ/または(iii)ポリメラーゼ伸長後にdsDNAセグメントの末端にアダプターがライゲートされ、ここで、少なくとも1つのアダプターが、キャプチャー配列、タンパク質識別子バーコードまたはキャプチャー配列とタンパク質識別子バーコードの両方を含み、それによって、それぞれがキャプチャー配列を含むタンパク質バーコード化dsDNAテンプレート分子が形成される、工程;
【0149】
(d)キャプチャー配列を含むタンパク質バーコード化dsDNAテンプレート分子を増幅し、かつシーケンシングする工程;および
【0150】
(e)工程(b)において生成された配列リードにおいて観察されるタンパク質識別子バーコードから生物学的サンプル中のタンパク質分析物を識別する工程。
【0151】
言及される種類の近接プローブにおいて、各タンパク質結合ドメインが抗原を含み、各結合部位がエピトープを含むことを当業者は理解するだろう。
【0152】
上述の方法の好ましいバージョンでは、前述同様に、生物学的サンプルは通常、血液サンプルであり、タンパク質分析は、血液サンプルの一部(例えば、サンプル由来の血清または血漿、典型的には血漿)に対して行われることにも留意すべきである。
【0153】
3.タンパク質アッセイと無細胞サンプル分析との組み合わせ:
【0154】
1つの実施形態において、生物学的サンプルは、血液サンプルであり、タンパク質分析物の検出は、そのサンプルの一部、典型的には、血漿画分に対して実施され、所望であれば、他のタイプの分析が、同じサンプルの無細胞画分に対して実施される。これは、図1に概略的に示されている。このような場合、増幅されたタンパク質バーコード化dsDNAテンプレート分子は、無細胞サンプル画分の分析によって生成された他のタイプの増幅されたバーコード化dsDNAテンプレート分子とともに、単一のプールにおいてシーケンシングされ得る。無細胞サンプル画分の処理に由来するこれらの他のdsDNAテンプレート分子には、例えば、ヒストン修飾UFI、5hmC関連UFI、5mC関連UFI、無細胞RNAに由来するcDNAとしてDNA二重鎖を指摘するUFIなどを有するテンプレート分子が含まれ得る。様々な種類のバーコード化dsDNAテンプレート分子が、増幅の前にプールされ、単一のランで一緒に増幅され得るか、またはそれらのバーコード化dsDNAテンプレート分子は、シーケンシングの前に増幅され得る。後者の方法は、珍しい特徴を有するがゆえに他のテンプレート分子よりも有意に低い濃度で存在するテンプレート分子の場合など、1種類のテンプレート分子を別のテンプレート分子よりも大きい程度にまで増幅するとき、有用である。例えば、5hmC含有dsDNAテンプレート分子は、他のテンプレート分子よりも有意に低い濃度で存在する。テンプレート分子群の事前増幅の後、プールし、すべてのテンプレート分子を単一のランで増幅することは、同じ状況において適切なもう1つの方法である。事前増幅は、バーコードが付けられた特徴を共有するテンプレート分子群を生物学的サンプルまたはテンプレート分子の混和物から分離した後、残りのテンプレート分子と再度合わせ、同時に増幅することを含む。
【0155】
前述のセクションに記載されたような近接伸長法と組み合わせて、タンパク質分析物を含む同じ生物学的サンプルから抽出された無細胞核酸サンプルから得られる情報には、無細胞核酸サンプル中のヌクレオソーム内の1またはそれを超えるヒストン修飾の存在、同一性、位置または量(またはそれらの組み合わせ)の検出が含まれ得る。ヒストン修飾には、翻訳後修飾(PTM)が含まれ、その多くは、クロマチン構造を変化させるかまたは他の手段によって遺伝子発現を制御すると証明されている。本明細書における特定の目的のヒストン修飾は、被験体における病状を評価するためのヒストン修飾バイオマーカーを含むヒストン修飾である。本発明のこの実施形態および他の実施形態に従ってヒストン修飾を検出するための方法は、次のセクションに記載される。
【0156】
無細胞サンプルから得られる他の情報としては、無細胞DNAの少なくとも1つの配列;無細胞RNAの少なくとも1つの配列;DNAメチル化データ;DNAヒドロキシメチル化データ;および前述のもののうちのいずれかに関係してもよいし関係しなくてもよい他の情報が挙げられ得る。前述の情報を取得するための適切な方法および好ましい方法に関する詳細な情報は、下記に含まれる。
【0157】
4.無細胞ChIP(cfChIP)を用いたヒストン修飾の検出:
【0158】
本発明の別の実施形態において、(1)無細胞核酸サンプルを調製して、シーケンシングベースの技術を用いて、無細胞核酸サンプルに含まれているヌクレオソームにおける少なくとも1つのヒストン修飾の識別を可能にするための方法、および(2)インタクトなヌクレオソームを含む無細胞核酸サンプル中のヒストン修飾を検出するための方法が提供され、ここで、そのヒストン修飾の存在、同一性、位置もしくは量またはそれらの組み合わせが検出される。両方の方法が、血液サンプルなどの生物学的サンプルから抽出された無細胞核酸サンプルの分析を含み、ここで、その無細胞核酸サンプルは、インタクトなヌクレオソームを含む。
【0159】
ヌクレオソームは、クロマチン構造の基本単位であり、コアヒストンH2A、H2B、H3およびH4を2コピーずつ含む、高度に保存された8つのコアヒストンのタンパク質複合体から構成される。およそ146塩基対のDNAが、このヒストン八量体の周囲に巻き付いて、ヌクレオソーム「コア」を形成する。それらのコア粒子は、最大約80塩基対長の一続きのリンカーDNAによって接続され、これは、H1、H5またはそれらのアイソフォームなどのリンカーヒストンとともに密集してクロマチンを形成するまで、「ひもでつながったビーズ」のように見える(Kollerら、(1979)J.Cell Biol.83(2 Pt 1):403-427)。
【0160】
ヌクレオソームの位置およびヌクレオソームの構造(構成ヒストンタンパク質バリアントと翻訳後修飾すなわちPTMとの両方に関して)も、エピジェネティックなシグナル伝達を媒介すると知られている。ヒストンPTMは、転写、DNA複製およびDNA損傷をはじめとした種々のプロセスと関連がある。PTMは、典型的には、コアヒストンのテールに位置し、PTMとしては、アセチル化、メチル化、ジメチル化、トリメチル化、プロピオニル化、ブチリル化、クロトニル化、2-ヒドロキシ-イソブチリル化、マロニル化、スクシニル化、ホルミル化、ユビキチン化、シトルリン化、リン酸化、ヒドロキシル化、SUMO化、O-GlcNAc化およびADPリボシル化が挙げられ、より一般的な修飾としては、リジン残基のアセチル化、メチル化またはユビキチン化、ならびにアルギニン残基のメチル化およびセリン残基のリン酸化が挙げられる。機能が相当十分に証明されたPTMの包括的なリストは、Zhaoら、(2015),“Appendix 2-Comprehensive catalog of currently documented histone modifications,”Cold Spring Harbor perspectives in biology.2015;7(9):a025064(この開示は本明細書において参照により援用される)に示されており;すぐ参照できるようなヒストン修飾マップを提供している、Reaction Biology Corpから入手可能なHistone Modification Poster[2018年8月5日にwww.reactionbiology.com/webapps/site/から読み出された]も参照のこと。
【0161】
モノヌクレオソームおよびオリゴヌクレオソームは、Salgameら、(1997)Nuc.Acids.Res.25(3):680-1およびvan Nieuwenhuijzeら、(2003)Ann.Rheum.Dis.62(1):10-14に報告されているように、ELISAによって検出された。そのようなアッセイは、典型的には、抗ヒストン抗体(例えば、抗H2B、抗H3または抗H1、H2A、H2B、H3およびH4)を捕捉抗体として、および抗DNAまたは抗H2A-H2B-DNA複合抗体を検出抗体として用いる。しかしながら、これらの方法および開発されてきた他の方法は、信頼性が限定的である傾向がある。
【0162】
「無細胞クロマチン免疫沈降」(cfChIP)アッセイである本方法は、現在の従来型ChIP方法とは異なり、その従来型ChIP方法は、生細胞または生組織におけるDNAとクロマチンにおける関連タンパク質とを架橋し、架橋された複合体を超音波処理または消化によって剪断し、生じる架橋されたタンパク質-DNAフラグメントを免疫沈降し、それらのフラグメントを精製し、シーケンシングし、配列リードから、その細胞におけるタンパク質とDNAとの相互作用に関する情報を決定することによって、タンパク質とDNAとの細胞内相互作用を分析する。この基本的な手順に対するいくつかの変法が、様々な用途を念頭に置いて開発され、それらとしては、とりわけ、ネイティブChIP(NChIP)、ビーズフリーChIP、キャリアChIP(CChIP)、高速ChIP(qChIP)、迅速かつ定量的ChIP(QChIP)、マイクロChIP(μChIP)、マトリックスChIP、病理学-ChIP(PAT-ChIP)が挙げられる。
【0163】
1つの実施形態において、本発明は、無細胞核酸サンプルを調製して、DNAシーケンシングベースの技術を用いて、無細胞核酸サンプルに含まれているヌクレオソームにおける少なくとも1つのヒストン修飾の識別を可能にするための方法を提供し、ここで、その方法は、ヒストンコア、すなわち、4つのコアヒストンの各対から構成されるヒストン八量体の周囲に巻き付いたcfDNA分子をそれぞれが含む複数のヌクレオソームを含む無細胞核酸サンプルから開始する工程を含む。末端ハイブリダイズ領域を含むアダプター(例えば、Yアダプター)が、各ヒストン会合cfDNA分子の末端にライゲートされる。それらのアダプターは、本明細書で前述したようなサンプルUFI配列および分子UFI配列を含み得る。アダプターのライゲーションは、図2の上部に示されており、それぞれがヒストンコアの周囲に巻き付いたアダプター結合cfDNA分子を含む修飾された無細胞核酸サンプルをもたらす。
【0164】
上記方法の次の工程では、図2にも示されているように、第1の末端に、目的のヒストン修飾に特異的に結合するヒストン修飾結合ドメイン;および第2の末端に、アダプターによって提供される末端ハイブリダイズ領域の1つに相補的な核酸結合ドメインを含む近接プローブを用いる。ヒストン修飾結合ドメインと核酸結合ドメインとの間の非ハイブリダイズ領域は、目的のヒストン修飾に対応するように選択された核酸配列を含み、この核酸配列は、ヒストン修飾UFI(またはヒストン修飾「バーコード」)として供される。この近接プローブは、プローブのヒストン修飾結合ドメインが目的のヒストン修飾に結合することと、プローブの相補的な核酸結合ドメインがハイブリダイズ核酸領域にハイブリダイゼーションすることとが同時に起きることを可能にするような寸法である。同時の結合をもたらすために、(i)プローブのヒストン修飾結合ドメインがヒストン修飾に結合すること、および(ii)プローブの相補的な核酸結合ドメインがハイブリダイズ核酸領域にハイブリダイゼーションすることを促進するのに効果的な条件下において、修飾された無細胞核酸サンプルを近接プローブとインキュベートする。これにより、無細胞DNAを起源とする5’末端および近接プローブを起源とする3’末端を有し、かつヒストン修飾バーコードを含む、dsDNAセグメントが形成される。
【0165】
dsDNAセグメントが形成された後、そのdsDNAセグメントの5’末端は、このセクションのパート(2)において近接伸長アッセイについて記載した様式と類似の様式で、ポリメラーゼおよびdNTP混合物を添加することによって近接プローブの非ハイブリダイズ領域およびヒストン修飾UFIに沿って伸長される。ポリメラーゼ伸長によって、ヒストン修飾バーコード化dsDNAテンプレート分子、典型的には、上で述べたように、サンプルUFI配列および分子UFI配列でもバーコード化されたdsDNAテンプレート分子が提供され、次いでこれは、増幅およびシーケンシングに供され得る。
【0166】
通常、上述のcfChIPプロセスは、異なるヒストン修飾をそれぞれが標的にする複数の近接プローブの使用を含み、その結果、最後の工程において取得される配列リードをデコンボリューションすることにより、ヒストンPTMなどの複数のヒストン修飾に関する情報を推定することができる。
【0167】
別の関連の実施形態では、インタクトなヌクレオソームを含む無細胞核酸サンプル中のヒストン修飾を検出するためのシーケンシングベースの方法が提供され、ここで、ヒストン修飾の存在、同一性、位置もしくは量またはそれらの組み合わせが検出される。その方法は、無細胞核酸サンプルを調製して、DNAシーケンシングベースの技術を用いて少なくとも1つのヒストン修飾の識別を可能にするための上記方法を実施した後、ヒストン修飾バーコード化dsDNAテンプレート分子を増幅し、得られたアンプリコンをシーケンシングし、配列リードにおいて観察されるヒストン修飾UFIからヒストン修飾の種類および位置に関する情報を決定する工程を含む。
【0168】
5.5hmC含有キャプチャー配列を有するアダプター:
【0169】
いくつかの実施形態において、少なくとも1つの5hmC残基を含むキャプチャー配列を含むアダプターの使用について言及する。これは、本明細書における実施形態の多くの自由選択の特徴であり、特定のアダプター結合dsDNAテンプレート分子をサンプルまたはdsDNAテンプレート分子の混合物から捕獲し、次いで、残りの構成成分を、取り出されたdsDNAテンプレートの非存在下において処理する、組み合わせワークフロー方法において特に有用である。捕獲されたテンプレート分子は、残りのサンプルを化学的処理に供している間に、別々に増幅され得るか、または単に取りおかれ得、最終的には、単一のサンプルから生成されたすべてのdsDNAテンプレート分子が、プールされ、一緒にシーケンシングされる。アダプターによってdsDNAテンプレート分子に組み込まれたキャプチャー配列は、サンプルからのdsDNAテンプレート分子の捕獲または取り出しを促進する。
【0170】
キャプチャー配列は、5hmC残基を含み、その配列は、単一の5hmC残基、単一の5hmC残基を含む短い核酸配列、または2もしくはそれを超える5hmC残基を含む短い核酸配列であり得る。
【0171】
1つの実施形態において、5hmC含有キャプチャー配列を含むアダプターは、dsDNAテンプレート分子の少なくとも1つの末端にライゲートされるか、またはcfRNA、分析では、リガーゼフリーの化学作用を介して、cDNA分子の少なくとも1つの末端に付着される。アダプター結合dsDNAテンプレート分子が捕獲されるとき、それらのアダプターにおける5hmC残基は、アフィニティータグ付けされたテンプレートを選択的に取り出すことを可能にするアフィニティータグで官能化される。1つの実施形態において、そのアフィニティータグは、ビオチン、デスチオビオチン、オキシビオチン、2-イミノビオチン、ジアミノビオチン、ビオチンスルホキシド、ビオシチンなどのビオチン部分から構成される。ビオチン部分をアフィニティータグとして使用することにより、アビジンまたはストレプトアビジン表面、例えば、ストレプトアビジンビーズ、ストレプトアビジン磁気ビーズなどを用いた手軽な取り出しが可能になる。
【0172】
5hmC残基をビオチン部分または他のアフィニティータグでタグ付けすることは、アダプターにおける5hmC残基への化学選択的基の共有結合によって達成され、ここで、その化学選択的基は、アフィニティータグを5hmC残基に連結するように、官能化されたアフィニティータグと反応を起こすことができる。1つの実施形態において、化学選択的基は、UDPグルコース-6-アジドであり、これは、Robertsonら、(2011)Biochem.Biophys.Res.Comm.411(1):40-3、Heらの米国特許第8,741,567号およびQuakeらのWO2017/176630に記載されているように、アルキン官能化ビオチン部分と自発的な1,3-付加環化反応を起こす。ゆえに、アルキン官能化ビオチン部分の付加によって、各5hmC残基にビオチン部分が共有結合する。このような反応の例は、本明細書で参照により援用されるHeらの米国特許第8,741,567号の図5Bに示されている。
【0173】
次いで、アフィニティータグ付けされたdsDNAテンプレート分子は、上で述べたように、アビジンまたはストレプトアビジン表面を用いて捕獲され、後の処理および分析のために取りおかれ得る。アフィニティータグ付けされたフラグメントを取り出した後に残った上清は、その内部配列または付加されたアダプターに5hmCを含まないdsDNAテンプレート分子を含む。その残りのdsDNAテンプレート分子は、引き続き化学的処理に供され得、最後にシーケンシングに向けて、捕獲されたテンプレート分子とともに再度プールされ得る。
【0174】
本発明は、5hmC含有アダプターに結合したcfDNAテンプレート分子を新規組成物として包含し、ここで、それらのアダプターは、少なくとも1つの5hmC残基に加えて、本明細書で前述したような、ソースUFI配列、分子UFI配列、鎖識別子UFI配列またはヒストン修飾UFI配列などのUFI配列を含み得る。
【0175】
6.無細胞RNAの分析:
【0176】
主にアポトーシス小体およびエキソソームに由来する無細胞RNAは、一般に、高度に分解されており、半減期が非常に短く、非常に低い濃度で無細胞サンプル中に存在する。ゆえに、cfRNAの完全性が低いせいで、標準的なRNA-Seq法をcDNAライブラリーの調製に用いる可能性が無くなる限り、cfRNAからcDNAシーケンシングライブラリーを調製することは、難易度が高い。本明細書における使用に適応できる方法は、増幅に必要なアダプターがリガーゼの必要なくcDNAに共有結合される、ライゲーションフリーのcDNA合成およびライブラリー調製法を用いる方法である。
【0177】
そのような方法の1つでは、RNaseを用いて調製され得るcfRNA、好ましくはrRNA枯渇RNAからcDNAを合成するために、ランダムプライマーを用いる。Sooknananの米国特許第9,745,570号(この開示は、本明細書において参照により援用される)を参照のこと。増幅およびバーコード付与(すなわち、cDNAへのcfRNA UFI配列の付加)のための5’および3’リンカータグが、任意の効果的な末端タグ化手順、例えば、Sooknananの米国特許第8,304,183号(これもまた参照により援用される)に記載されている手順を用いて導入され得る。このプロセスは、市販のキット、例えば、Epicentre Biotechnologies(Illumina,Inc.)から入手可能なScriptSeq(商標)v2 RNA-Seq Library Preparation Kitを用いて実施され得る。ScriptSeq cDNAライブラリー調製とともに使用される材料、試薬およびプロセスのさらなる説明は、ScriptSeq(商標)v2 RNA-Seq Library Preparation Guide[2018年8月16日にsupport.illumina.comから読み出された]に見出すことができる。
【0178】
アダプターライゲーションなしにcfRNAからcDNAライブラリーを調製する別の方法では、アダプター配列を含むdTプライマーを用いた3’-ポリアデニル化RNAの第1鎖cDNA合成において、選択された逆転写酵素のターミナルトランスフェラーゼ活性を利用するテンプレートスイッチ法を用いる。RNAの5’末端に到達したら、非テンプレートヌクレオチドの短い配列(例えば、CCC)が、cDNAの第1鎖を伸長させ、その付加された配列に相補的な短い配列(例えば、GGG)およびフォワードPCRプライマーとして供される第2のアダプター配列を含むテンプレートスイッチオリゴヌクレオチドが、第1鎖伸長物にハイブリダイズし、PCRを介した第2鎖の合成および増幅を可能にする。Bettsらの米国特許出願公開第2017/0198285A1号;Zhuら、(2001)Biotechniques 30(4):892-897;および“Tech Note:A SMARTer Approach to Small RNA Sequencing,”ウェブ文書リプリント[2018年8月16日にhttps://www.takarabio.com/learning-centers/next-generation-sequencing/technical-notes/full-length-small-rna-librariesから読み出された](これらの開示は、その全体が参照により本明細書に援用される)を参照のこと。
【0179】
本発明の状況において、上に記載された技術のうちの1つなどのリガーゼフリーの方法を用いることにより、生物学的サンプル中のcfRNAからアダプター結合cDNAが合成され、ここで、そ(れら)のアダプターは、dsDNAテンプレート分子をcfRNA由来cDNAと識別するためのcfRNA UFI配列を含む。それらのアダプターは、本明細書で前述したような、ソースUFI配列、分子UFI配列、鎖識別子UFI配列またはヒストン修飾UFI配列などの少なくとも1つの追加のUFI配列も含む。次いで、アダプター結合cDNAを増幅し、かつシーケンシングすることができ、配列リードのデコンボリューションによって、生物学的サンプル中のcfRNAに関する情報を取得することができる。
【0180】
cfRNAは、mRNA、またはタンパク質に翻訳されないRNA、すなわち、非コードRNA(ncRNA)、例えば、tRNA;rRNA;低分子RNA、例えば、マイクロRNA(miRNA)、siRNA、piRNA、snoRNA、snRNA、exRNAおよびscaRNA;ならびに長鎖nRNA、例えば、XistおよびHOTAIRであり得る。このセクションの前のほうに要約したScriptSeq法は、rRNAが除去された無細胞RNAサンプルとともに使用するために最適であり、Clontech SMARTアプローチは、低分子ncRNAとともに使用する際に特に有用である。
【0181】
アダプター結合cDNAは、この時点において増幅し、かつシーケンシングしてもよいし、拡大された組み合わせワークフロープロセスの状況においてさらなる分析を実施してもよい。特に興味深いのは、セクション8に説明されるようなdsDNAのヒドロキシメチル化分析および/またはメチル化分析である。
【0182】
7.組み合わせワークフローにおける無細胞RNAおよび無細胞DNAの分析:
【0183】
1つの実施形態において、シーケンシングベースで同時に識別するために単一の無細胞核酸サンプルにおいてcfDNAおよびcfRNAを調製するための組み合わせワークフロープロセスが提供される。ここでの最初の工程は、生物学的サンプルから無細胞核酸サンプルを抽出した後、選択されたアダプターをcfDNAにライゲーションすることである。それらのアダプターは、無細胞核酸サンプル中のcfDNAフラグメントの末端にライゲートされて、アダプター結合dsDNAテンプレート分子が形成され得る。標準的なライゲーション条件および市販のリガーゼを用いることができる。
【0184】
cfDNAフラグメントへのライゲーションのために選択されるアダプターは、サンプルUFI配列、および好ましくは、少なくとも1つの追加のUFI配列(例えば、分子UFI配列および鎖識別子UFI配列)を含む。次いで、アダプター結合cfDNAを、従来の核酸精製技術を用いてcfRNAとともに精製して、cfRNAとアダプター結合DNAテンプレート分子との無細胞混和物を提供する。
【0185】
本方法は、cDNA合成前またはcDNA合成中にアダプター結合cfDNAを取り出す必要を無くすので、組み合わせワークフローにおける次の工程では、アダプター結合cfDNAをなおも含む無細胞混和物中のcfRNAを処理する。当該分野で公知であるように、cfRNAからcDNAの第1鎖を合成した後、その第1鎖に相補的なcDNAの第2鎖を合成して、cDNA二重鎖を形成する。cDNAの合成は、リガーゼを必要とすることなくcDNAにアダプターを付着するように、前述のセクションに記載されたように実施される。前述同様に、cDNAアダプターは、ソース識別子UFIおよびおよびRNAインジケーターUFIを含み、それによって、アダプター結合DNAも含む無細胞混和物中にアダプター結合cDNAが提供される。
【0186】
この時点において、アダプター結合dsDNAテンプレート分子およびcDNAテンプレート分子を増幅し、かつシーケンシングすることもできるし、以下のセクションで説明されるような、dsDNAのヒドロキシメチル化分析および/またはメチル化分析を含む拡大された組み合わせワークフロープロセスの状況では、さらなる分析を実施してもよい。
【0187】
8.ヒドロキシメチル化分析および/またはメチル化分析を伴う組み合わせワークフロー:
【0188】
細胞における遺伝子発現のエピジェネティック制御は、DNAのシトシンメチル化状態およびシトシンヒドロキシメチル化状態をはじめとした、DNAヌクレオチドに対する修飾によって部分的に媒介される。しばらくの間、DNAは、シトシンヌクレオチドの5位においてメチル化されて、5-メチルシトシンを形成し得ることが、当該分野で公知であった。5-メチルシトシンの形態のメチル化DNAは、そのDNA配列内の、シトシンヌクレオチドがグアニンヌクレオチドの隣に出現する位置に出現すると報告されている。これらの位置は、省略形として「CpG」と呼ばれており、高比率のCpG部位を含むゲノム領域は、「CpGアイランド」と呼ばれることが多く、ヒトの遺伝子プロモーター配列の大部分が、このようなCpGアイランドを伴っている。活発な遺伝子では、これらのCpGアイランドは、通常、低メチル化されている。遺伝子プロモーター配列のメチル化は、安定的な遺伝子不活性化に関連する。
【0189】
癌細胞において観察されるDNAメチル化パターンは、健康な細胞のそれとは異なる。反復性エレメント、特に動原体周囲の領域辺りの反復性エレメントは、健康な細胞と比べて癌では低メチル化されていると報告されているが、特定の遺伝子のプロモーターは、癌では高メチル化されていると報告されている。癌細胞では、これらの2つの作用のバランスが、全体的なDNA低メチル化をもたらすと報告されている。全体的なDNAメチル化は、免疫組織化学(IHC)法ならびに他のいくつかの方法を用いて細胞において研究されているが、これらの方法の多くが、労働集約的であり、かつ/または品質の良い大量の抽出DNAを必要とするので、都合が悪い。
【0190】
全体的なDNAメチル化を検出するための現行の方法は、そのDNAの抽出または精製を必要とし、迅速かつハイスループットであり、低コストかつ侵襲性が最小の診断方法に適していない。同様に、他の修飾塩基または稀な塩基(例えば、ウラシル、イノシン、キサンチンおよびヒポキサンチン)についてのDNAの分析も、実質的に純粋なまたは抽出されたDNAの分析によってしか調査できない。そのような分析は、組織溶解産物、血液、血漿または血清などの複雑な生物学的媒質中では直接実施できない。
【0191】
エピジェネティクス分野が発展するにつれて、5位においてヒドロキシメチル化されたシトシン(5hmC)という別のDNA修飾の検出が、5mCの検出と同程度に重要である可能性があることが判明してきた。5mC修飾は、一般にCpGジヌクレオチド内に存在するが、天然の5hmC残基は、他の位置に出現する傾向がある。5hmCの出現頻度は、5mCのそれよりもかなり低く、組織タイプにもよるが典型的には10:1と近似される比であり(Nestorら、(2012)Genome Biology 13:R84を参照のこと)、5mCが、全DNA塩基の約1%を占め、5hmCが、全塩基の約0.01%を占める。5hmCの分子機能は、理解され始めたばかりであるが、5hmCは、転写、DNA脱メチル化、および異常な5hmCパターンの場合は腫瘍形成をはじめとした種々のプロセスに関与していることが証明されている。Tahilianiら、(2009)Science 324(5929):930-035(2009);Guoら、(2011)Cell 145:423-434;Wuら、(2011)Genes & Development 25:679-684;Koら、(2010)Nature 468:839-843;およびRobertsonら、(2011)Biochem.Biophys.Res.Comm.411(1):40-3を参照のこと。また、5hmCは、Ten-Eleven Translocation(TET)酵素、例えば、TET1による5mCの触媒的酸化から形成される安定性のDNA修飾であることも知られている。
【0192】
バイサルファイトシークエンスは、5mCと5hmCとを区別しないので、5mC残基と5hmC残基とを個別に検出するための他の方法が必要である。上で述べたように、5hmCの出現頻度は、5mCよりもはるかに低いため、特定されたすべての5hmC残基の画分に関して高効率を示すために、ならびに5hmCと特定された実質的にすべての残基が実際に5hmC残基であるはずであることを意味する高選択性を示すためには、5hmCを検出するための何らかの方法が必要である。β-グルコシルトランスフェラーゼ(β-GT)であるT4バクテリオファージ酵素は、5mCを修飾せずに5hmCを選択的にグルコシル化するので、この酵素によるグルコシル化を含む、DNAにおける5hmCを検出するための方法がいくつか報告されている。
【0193】
本発明の背景において、組み合わせワークフロー方法は、好ましくは、無細胞DNAにおける修飾されたシトシン残基、すなわち、5mC、5hmC、または5mCと5hmCとの両方を検出するためのシーケンシングベースのプロセスを含む。ヒドロキシメチル化分析が、メチル化分析とともに実施される場合、以下のプロセスフローの説明から理解されるように、ヒドロキシメチル化が最初の焦点であるべきであり、その後、メチル化が続く。
【0194】
無細胞核酸サンプルがすでに生物学的サンプルから抽出されており、cfDNAがアダプター結合に続いて、cfRNA処理を受けることにより、アダプター結合cDNAを得ていると仮定すると(セクション7に記載されたように)、組み合わせワークフロープロセスは、cfDNAのヒドロキシメチル化プロファイルに関する情報を提供するように続けられる。この「ヒドロキシメチル化プロファイル」は、ヒドロキシメチル化密度、例えば、ある核酸領域内の修飾シトシンと未修飾シトシンとの両方である全シトシンに対する5hmC残基の比であり得る。他の5hmC密度の尺度、例えば、ある遺伝子座における全ヌクレオチドに対する5hmC残基の比も想定される。
【0195】
ヒドロキシメチル化プロファイルは、5hmC密度に加えて、ヒドロキシメチル化パターン、ある核酸領域内の全5hmC残基、ある核酸領域内の5hmC残基の位置、ある核酸領域内の5hmC残基の相対的な位置、および/またはヘミヒドロキシメチル化部位または完全ヒドロキシメチル化部位としてのヒドロキシメチル化部位の特定などのヒドロキシメチル化情報も含み得る。
【0196】
核酸のヒドロキシメチル化プロファイルを検出するための1つの好ましい方法は、国際特許出願公開WO2017/176630(Quakeら)に記載されており、その全体が参照により本明細書に援用される。この方法は、シーケンシングスキームの過程のうちで、無細胞DNA中の5-ヒドロキシメチルシトシンパターンの検出に関わる。アフィニティータグは、無細胞DNAのサンプル中の5hmC残基に付加され、このタグがつけられたDNA分子は、次いで富化およびシーケンシングされ、5hmCの位置が識別される。この方法の例は、Quakeらの文献に記載されているように、まず無細胞サンプル中の末端が平滑で、アダプターが結合した二本鎖DNAフラグメントを修飾して、アフィニティータグとしてビオチンを5hmC残基に共有結合で結合することを含む。これは、6位においてアジド部分で官能化されたウリジン二リン酸(UDP)グルコースで5hmC残基を選択的にグルコシル化することによって実行され得、この工程の後に、アダプター中の5hmC含有キャプチャー配列に関して、セクション5で前述したように、「クリックケミストリー」反応によるアルキン官能化ビオチンとの自発的な1,3-環化付加反応が起こる。これらのビオチン化5hmC残基を含むDNAフラグメントは、次いで「富化」工程においてストレプトアビジンビーズによって捕獲することができるアダプター連結dsDNAテンプレート分子である。
【0197】
本組み合わせワークフロープロセスでは、5hmC UFI配列が、捕獲されたアダプター結合dsDNAテンプレート分子の末端に付加されるため、増幅、プールおよびシーケンシングの後、得られた配列リードから、ヒドロキシメチル化プロファイルに関する情報を推定することができる。すなわち、配列リードを分析して、cfDNAの中のいずれの配列がヒドロキシメチル化されているかを定量的に判断する。これは、例えば、配列リードをカウントすること、あるいは、断片化の切断点に基づいて、および/または同じ分子UFIを含むか否かに基づいて元の出発分子の数を増幅前にカウントすることによって、行われ得る。
【0198】
無細胞核酸サンプル(cell-free nucleic sample)中のDNAのヒドロキシメチル化プロファイルを確認する他の方法は、2018年2月14日出願の“Methods for the Epigenetic Analysis of DNA,particularly Cell-Free DNA”というArensdorfらの米国特許仮出願第62/630,798号およびSongらの米国特許出願公開第2017/0298422号に記載されており、これらはいずれも参照により本明細書に援用される。これらの参考文献は、本組み合わせワークフロープロセスがcfDNAヒドロキシメチル化プロファイルに加えてcfDNAメチル化プロファイルの検出をさらに含む本発明の実施形態と併用しても有用である。
【0199】
Arensdorfの方法は、本組み合わせワークフロープロセスの状況では、以下のように実行され得る。
【0200】
デュアルビオチン技術:無細胞核酸サンプルが生物学的サンプルから抽出され、cfDNAがアダプター結合に続いて、cfRNA処理を受けることにより、アダプター結合cDNAを得た後(セクション7に記載されたように)、cfDNA中の5hmC残基は、アフィニティータグ、例えば、本明細書で前述したようなビオチン部分で選択的に標識される。ビオチン化は、前述のように、βGTによって触媒されるウリジンジホスホグルコース-6-アジドでのグルコシル化、これに続く、アルキン官能化ビオチン部分を共有結合させるためのクリックケミストリー反応による5hmC残基の選択的官能化によって実施することができる。次に、アビジンまたはストレプトアビジン表面(例えば、ストレプトアビジンビーズの形態の)を使用して、5hmC位置でビオチン化されたすべてのdsDNAテンプレート分子を取り出し、次いで、増幅中にUFI配列を付着させるために別の容器に入れる。上清中の残存するdsDNAテンプレート分子は、5mC残基を有するまたは修飾を有さないフラグメントである(後者のグループにはcfRNAから生成されたcDNAが含まれる)。次に、TETタンパク質を使用して、上清中の5mC残基を5hmCに酸化し、この場合には、5mCの酸化がヒドロキシル化を超えて進行しないようにするために、TET変異体タンパク質が使用される。この目的に適したTET変異体タンパク質は、参照により本明細書に援用されるLiuら、(2017)Nature Chem.Bio.13:181-191に記載されている。次いで、βGTによって触媒されるグルコシル化とそれに続くビオチン官能化が繰り返される。このようにマークされた(元の5mC位置のそれぞれにおいてビオチン化された)フラグメントは、ストレプトアビジンビーズで捕獲される。次に、ビーズに結合したDNAフラグメントは、増幅中に、第1の工程において使用されたもの、すなわち5mC UFI配列ではなくUFI配列でバーコードが付けられる。未修飾のDNAフラグメント、つまり修飾されたシトシン残基を含有しないフラグメントは、この時点で、上清中に残存する。所望であれば、メチル化されていないDNA鎖にハイブリダイズさせるために、配列特異的プローブを使用することができる。その結果生じるハイブリダイズした複合体は、前述のように、増幅の間に取り出され、さらなるUFI配列でタグ付けすることができる。
【0201】
Pic-Borane法:これはデュアルビオチン技術の代替手段であり、同じくアダプター連結DNAフラグメント中の5hmC残基のビオチン化から始まり、アビジンまたはストレプトアビジン捕獲が続く。しかしながら、この技術では、上清中に残存する未修飾の5mC残基を含有するDNAは、5hmCを超えて5caCおよび/または5fC残基まで酸化される。酸化は、触媒的に活性なTETファミリー酵素を使用して酵素的に実施し得る。本明細書で使用される「TETファミリー酵素」または「TET酵素」という用語は、米国特許第9,115,386号において定義されているとおりの触媒的に活性な「TETファミリータンパク質」または「TET触媒活性フラグメント」を指し、その開示は、参照により本明細書に援用される。この文脈において好ましいTET酵素はTET2であり、Itoら、(2011)Science 333(6047):1300-1303を参照されたい。酸化は、化学的酸化剤を使用して、化学的に実施することもできる。適切な酸化剤の例としては、過ルテニウム酸カリウム(KRuO)などの過ルテニウム酸金属塩、過ルテニウム酸テトラプロピルアンモニウム(TPAP)および過ルテニウム酸テトラブチルアンモニウム(TBAP)などの過ルテニウム酸テトラアルキルアンモニウム塩、およびポリマー支持過ルテニウム酸塩(PSP)を含む、無機または有機過ルテニウム酸塩の形態の過ルテニウム酸陰イオン;ならびにペルオキソタングスタートまたは過塩素酸銅(II)/TEMPOの組み合わせなどの無機ペルオキソ化合物および組成物が挙げられるが、これらに限定されない。この過程の次の工程において、5fC残基と5caC残基の両方がジヒドロウラシル(DHU)に変換される限り、この時点で5fC含有フラグメントを5caC含有フラグメントから分離することは必要でない。
【0202】
すなわち、5mC残基を5fCおよび5caCに酸化した後、酸化された5mC残基を還元し、脱アミノ化し、脱炭酸または脱ホルミル化するために有機ボランが添加される。得られたdsDNAテンプレート分子は、元の5mC残基の代わりにDHUを含有し、同じサンプルに由来する他のdsDNAテンプレート分子とともに、増幅し、プールし、配列決定することができる。
【0203】
有機ボランは、ボランと、窒素複素環および第三級アミンから選択される窒素含有化合物との複合体として特徴付けることができる。窒素複素環は、単環式、二環式または多環式であり得るが、典型的には、窒素ヘテロ原子と、必要に応じてN、OおよびSから選択される1またはそれを超える追加のヘテロ原子とを含有する5員または6員環の形態の単環式である。窒素複素環は、芳香族または脂環式であり得る。本明細書における好ましい窒素複素環には、2-ピロリン、2H-ピロール、1H-ピロール、ピラゾリジン、イミダゾリジン、2-ピラゾリン、2-イミダゾリン、ピラゾール、イミダゾール、1,2,4-トリアゾール、1,2,4-トリアゾール、ピリダジン、ピリミジン、ピラジン、1,2,4-トリアジンおよび1,3,5-トリアジンが含まれ、これらのいずれもが、非置換であり得るか、または1もしくはそれを超える非水素置換基で置換され得る。典型的な非水素置換基は、アルキル基、特にメチル、エチル、n-プロピル、イソプロピル、n-ブチル、イソブチル、t-ブチルなどの低級アルキル基である。例示的な化合物には、ピリジンボラン、2-メチルピリジンボラン(2-ピコリンボランとも呼ばれる)および5-エチル-2-ピリジンが含まれる。これらの有機ボランおよび酸化された5mC残基をDHUに変換するためのそれらの反応に関するさらなる情報は、上記で引用されたArensdorfの特許出願、米国特許仮出願第62/630,798号(すでに参照により本明細書に援用されている)に見出すことができる。
【0204】
ビオチン/ネイティブ5mC富化法:これはデュアルビオチン技術の代替手段であり、アダプター連結DNAフラグメント中の5hmC残基のビオチン化から始まり、アビジンまたはストレプトアビジン捕獲が続く。ただし、ここでは、ネイティブ5mC含有フラグメントを捕捉および捕獲するために、上清中に残存するメチル化DNAを修飾することに代えて、抗5mC抗体またはMBDタンパク質を使用する。この技術は、同じサンプルに由来する他のdsDNAテンプレート分子とともに増幅、プールおよび配列決定することができるdsDNAテンプレート分子の生成をもたらさない限り、本明細書ではあまり好ましくない。
【0205】
ゆえに、生成されたバーコード化アダプター結合dsDNAテンプレート分子は、5hmCを含むdsDNA、および5mCを含むが5hmCは含まず、必要に応じて、修飾されたシトシン残基を含まないdsDNAをさらに含む、dsDNAである。これらのテンプレート分子は、以下のうちの少なくとも1つとともに増幅され、プールされ、シーケンシングされる。
【0206】
セクション2におけるプロセスによって生成されるヒストン修飾バーコード化dsDNAテンプレート分子;
【0207】
セクション6に記載されたようなcfRNA処理に由来するアダプター結合cDNA;および
【0208】
セクション2に記載されたプロセスによって同じ生物学的サンプル(例えば、血液サンプル)から生成されるタンパク質バーコード化dsDNAテンプレート分子。
【0209】
ゆえに、上述の混和物を単一のランでシーケンシングすることにより、ヌクレオソームに関する情報、特に、ヒストン修飾;cfRNA配列;タンパク質分析物の同一性および濃度;cfDNAヒドロキシメチル化プロファイル;およびcfDNAメチル化プロファイルが提供され得る。
【0210】
一本鎖cfDNA:
【0211】
上記および本明細書の他の箇所に記載された方法は、一本鎖cfDNA分析において実施されるように、例えば、メチル化プロファイル、ヒドロキシメチル化プロファイルなどを決定するようにも適応され得る。選択されたUFI配列、例えば、分子UFI配列、サンプルUFI配列、プロセスUFI配列(上記で説明したような、5hmC UFI配列および5mC UFI配列を含む)が、当業者に公知の、かつ/または関連文書および文献に記載されているRCA法の状況において、RCAプライマーを用いて一本鎖cfDNAに組み込まれ得る。あるいは、一本鎖cfDNAの場合、相補鎖を生成し、次いで、本明細書中の他の箇所に記載されているようにdsDNA分子に対して本プロセスを実施することができる。
【0212】
9.包括的な組み合わせワークフロー方法:
【0213】
ゆえに、本発明は、単一の生物学的サンプルの様々な特徴を指定するようにタグ付けされたdsDNAテンプレート分子のアンプリコンをプールし、単一のランでシーケンシングすることによってその生物学的サンプルから複数の種類の情報を取得する、組み合わせワークフロー方法を提供する。このプロセスの最も包括的なバージョンが、図3に概略的に示されており、それは、以下の工程を含む。
【0214】
(1)セクション2に記載されたような近接伸長アッセイを用いて、複数のタンパク質分析物を含む、被験体から得られた生物学的サンプル(例えば、血液サンプル)の一部からタンパク質バーコード化dsDNAテンプレート分子を生成する工程であって、ここで、特定のタンパク質UFI配列を有する各dsDNAテンプレート分子が、そのサンプル中のその特定のタンパク質の存在に対応する、工程;
【0215】
(2)生物学的サンプルの残りの中のヌクレオソームをインタクトな状態で維持する様式で、その生物学的サンプルの残りから無細胞核酸サンプルを抽出する工程;
【0216】
(3)核酸サンプル中の無細胞DNAにアダプターをライゲートする工程であって、ここで、それらのアダプターは、そのDNAの起源またはサンプルを識別するソース識別子UFI、各cfDNAフラグメントをサンプル中の元の分子として識別する「ランダム」分子識別子UFI、および必要に応じて、各cfDNAフラグメントの鎖をCまたはWとして識別する「鎖」識別子UFIを含む、工程;
【0217】
(4)その核酸サンプルのいかなる構成成分も分離または単離することなく、セクション4に記載された近接伸長cfChIP法を実施して、近接プローブを用いて特定されたヒストン修飾に対応するdsDNAテンプレート分子を生成する工程であって、ここで、そのように提供されたdsDNAテンプレート分子は、特定のヒストン修飾に対応するヒストン修飾UFI配列を有する、工程;
【0218】
(5)従来の手段を用いて核酸サンプルの核酸構成成分を精製/抽出する工程(その結果、ヌクレオソームのヒストン構成成分および他の任意の非核酸種が失われる);
【0219】
(6)cfRNAバーコード化dsDNAテンプレート分子を、セクション6に記載されたように、その中にcfRNA UFI配列が組み込まれた少なくとも1つのアダプターに結合したcDNA二重鎖の形態で生成する工程;
【0220】
(7)セクション8に記載されたように、5hmC残基を含むcfDNA、および別に、5mC残基を含むが5hmCを含まないcfDNAに対応するdsDNAテンプレート分子を生成する工程;
【0221】
(8)上で生成されたすべてのdsDNAテンプレート分子を増幅し、プールする工程であって、ここで、増幅は、プールする前またはプールした後に実施され得る、工程;
【0222】
(9)得られたアンプリコン混和物をシーケンシングする工程;および
【0223】
(10)配列リードをデコンボリューションして、(a)タンパク質分析物の同一性および濃度、(b)ヒストン修飾の同一性および位置、(c)cfRNA配列情報、(d)cfDNAのヒドロキシメチル化パターン;および(e)cfDNAのメチル化パターンを含む、元の生物学的サンプルに関する複数の種類の情報を決定する工程。
【0224】
1つまたは2つのより少ない分析を伴う本発明の組み合わせワークフロー方法が、図4および5に概略的に示されている。
【0225】
10.組み合わせワークフロープロセスにおけるUFI配列の重要性:
【0226】
本発明の重要な利点は、古典的なシーケンシングベースの技術を使用して、生物学的サンプルの1またはそれを超える非古典的な配列特徴を決定することにあることが理解されるであろう。ここで、「非古典的な配列特徴」は、サンプル中の核酸分子の基本塩基(すなわち、DNAの場合はアデニン、シトシン、グアニンおよびチミン、RNAの場合はアデニン、シトシン、グアニンおよびウラシル)の同一性および順序以外の特徴を指す。最終的な配列リードにおいて得られる古典的な配列情報に「コードされる」、目的の非古典的な配列特徴は、核酸の組成に関係する情報(例えば、修飾されたシトシン残基、例えば、5hmCまたは5mCの分布)であってもよいし、核酸の組成とは無関係であってもよく、その代わりに、上で詳細に議論したような、血液サンプル中の血漿タンパク質の存在および濃度、血液サンプルの無細胞ヌクレオソーム画分において観察されるヒストン修飾などに関係する。
【0227】
すなわち、上記分析は、目的の非古典的な配列特徴(例えば、血漿タンパク質の同一性、血漿タンパク質の濃度、ヒストン修飾の数、位置および種類、核酸のヒドロキシメチル化プロファイル、または核酸のメチル化プロファイル)から古典的な配列データへの変換を含む。得られる古典的な配列データとしては、少なくとも1つのUFI、すなわち、約4~約36塩基対長の範囲の特定の核酸配列が挙げられ、ここで、そのUFIは、dsDNAテンプレート分子内に組み込まれており、生物学的サンプルの特定の特徴、すなわち、上で説明したような目的の非古典的な配列特徴に関する。
【0228】
したがって、さらなる実施形態において、本発明は、核酸テンプレート分子の非古典的な配列特徴を決定するためのシーケンシングベースの方法を提供し、その方法は、以下を含む。
【0229】
テンプレート分子の特定の非配列特徴を指定する固有特性識別子配列を核酸テンプレート分子に付加する工程;
【0230】
その核酸テンプレート分子および付加された識別子配列を増幅して、付加された識別子配列をそれぞれが含む複数のアンプリコンを得る工程;および
【0231】
アンプリコンをシーケンシングし、得られた配列リードから非配列特徴を決定する工程。
【0232】
通常、核酸テンプレート分子は、複数の異なる核酸テンプレート分子を含む組成物内に含まれており、各テンプレート分子の特定の非古典的な配列特徴を指定する少なくとも1つの識別子配列が、その核酸テンプレート分子に付加されている。非古典的な配列特徴は、ある時点において核酸テンプレート分子と会合していたタンパク質の一態様、例えば、ヒストンを含み得る。非古典的な配列特徴は、生物学的サンプル中の特定のタンパク質の存在または濃度でもあり得、その特徴から古典的な配列への変換は、セクション2に記載された近接伸長アッセイを用いて実施される。他の目的の非古典的な配列特徴としては、cfDNAヒドロキシメチル化プロファイルおよびcfDNAメチル化プロファイルが例として挙げられる。
【0233】
11.切断型アダプター:
【0234】
本発明はさらに、切断型シーケンシングアダプター、ならびにそれらをdsDNAテンプレート分子の増幅およびシーケンシングにおいて使用することに関する。特定のプライマー構築物と併せて使用されるこの切断型アダプターは、PCR増幅中に識別子バーコードをdsDNAテンプレート分子に付加する際に有用である。切断型シーケンシングアダプターは、2塩基対~50塩基対の範囲である二本鎖セグメントおよびそれぞれが2塩基~25塩基の範囲である2つの一本鎖セグメントを有するY構築物の形態である。典型的には、その二本鎖セグメントは、5塩基対~35塩基対の範囲であり、それらの2つの一本鎖セグメントは、それぞれ、約5塩基~25塩基の範囲、例えば、それぞれ5塩基対~25塩基対の範囲および約5塩基~20塩基の範囲である。
【0235】
識別子バーコードをdsDNAテンプレート分子に付加するための方法では、まず、切断型シーケンシングアダプターを、従来の手段を用いてAテール化平滑末端dsDNAテンプレート分子にライゲートする。次いで、そのように提供されたアダプター結合dsDNAテンプレート分子を、少なくとも1つのバーコード化プライマーを用いるPCRプロセスにおいて増幅し、ここで、そのバーコード化プライマーは、(i)アダプターの中のいずれの配列にも相補的でなく、1またはそれを超える識別子バーコードを含む、第1の領域;および(ii)アダプターの一本鎖セグメントに十分に相補的であり、それにハイブリダイズする第2の領域を含み、その結果、ポリメラーゼの存在下におけるバーコード化プライマーの伸長によって、プライマーの第2の領域とアダプターの一本鎖セグメントとの二本鎖複合体が生じ、ここで、識別子バーコードを含む第1の領域は、その二本鎖複合体の末端を超えて一本鎖オリゴヌクレオチドテールとして伸長する。
【0236】
切断型アダプターの使用は、本明細書の実験のセクションに例証されている。アダプターとDNAテンプレート分子との比は、変動し得るが、その比は、一般に、約1:5~約250:1(w/w)、例えば、5:1~200:1、10:1~150:1または20:1~100:1の範囲である。
【0237】
本発明は、dsDNAテンプレート分子を増幅し、かつシーケンシングするためのキットも提供し、このキットは、以下を備える。
【0238】
(a)2塩基対~50塩基対の範囲である二本鎖セグメントおよびそれぞれが2塩基~25塩基の範囲である2つの一本鎖セグメントを有するY構築物の形態のシーケンシングアダプター;
【0239】
(b)(i)アダプターの中のいずれの配列にも相補的でなく、識別子バーコードを含む、第1の領域;および(ii)アダプターの一本鎖セグメントに十分に相補的であり、それにハイブリダイズする、第2の領域を含む、バーコード化プライマー;および
【0240】
(c)ポリメラーゼ。
【0241】
切断型アダプターを使用するための方法は、本明細書の実施例に詳細に記載されている。代表的な切断型アダプターが図7に示されており、図6に示された標準的な先行技術アダプターと比較されてもよい。PCRプロセスにおけるインデックス付きプライマーおよび切断型アダプターの使用が、図8に概略的に示されている。
【0242】
切断型アダプターアプローチは、増幅およびシーケンシングの前にdsDNAテンプレート分子へのDNAアダプターのライゲーションを含む、本明細書に記載されている本発明のいずれかの方法と組み合わされ得る。
【0243】
12.他の方法による実行:
【0244】
著しいことに、本明細書に詳細に記載されるような本発明の方法は、生物学的サンプルのシーケンシングを含む従来の技術と組み合わせることができる。例えば、本方法は、例えば、特定の遺伝子または「ホットスポット」を選択的に捕捉する(すなわち、ハイブリッドキャプチャーを用いて)および/または選択的に増幅する(例えば、マルチプレックスPCRアンプリコンまたは複数のRCAプライマーを用いて)とき、配列ベースの富化を含む従来の(または今後、発見または開発される)リキッドバイオプシー法と組み合わせることができる。例えば、ターゲットシーケンシングの状況における、配列ベースの富化工程または配列ベースの複数の富化工程は、組み合わされるシーケンシング工程の前に、バーコード化テンプレート分子またはその増幅産物の1またはそれを超える群を配列に基づいて分離し、その群を分析し、必要に応じて、その群を他の核酸画分と再度組み合わせるかまたはその群を他の核酸画分とともにプールすることによって、本方法のいずれかと併せて実施することができる。
【0245】
すなわち、本方法およびその態様は、より離れた数の標的化にれた遺伝子座の分析において、例えば、マルチプレックスPCRおよびアレイを用いて(ハイブリダイゼーションプローブが、プロセスバーコードおよび/または他のUFI配列を組み込むことにより、直接的なシーケンシングなしに、特定の遺伝子座におけるマークの区別が可能になる)、非ショットガンシーケンシング法と組み合わせることができる。本方法またはその態様と組み合わされ得るターゲットシーケンシングアプローチの例としては、Soら、(2018)Genomic Medicine 3:2;上で引用したGongら;Stahlbergら、(2016)Nuc Acids Res 44(11;e105)1-7;Mamanovaら、(2010)Nature Methods 7(2):111-118などに記載されているものが挙げられる。上述の刊行物は、参照により本明細書に援用される。
【0246】
実験:
本発明の5hmC富化のワークフローとホールゲノムシーケンシング(WGS)のワークフローとを完全比較する。実施例1~3では、5hmC富化またはWGSに等分され、PCR増幅の際にのみサンプル別にインデックスが付けられ得る単一のテンプレートライゲーション反応を可能にする従来とは違うシーケンシングアダプター構築物を評価する。これらの従来とは違うアダプターは、修飾されたインデックス付きPCR配列と対形成する「切断型」アダプター(約6塩基~約30塩基長の範囲の一本鎖テールを有する)である。実施例1には、アダプター配列のデザインおよびアダプター構築物の生成を含むカスタムアダプターの調製が記載され、実施例2には、実施例1において調製されたアダプターによるライブラリー調製物の最適化が記載され、実施例3には、標準的な市販の「Y」アダプターで見られる富化性能と比べた、カスタムアダプターを用いたときの少なくとも等価な5hmC富化性能の検証が提供される。
【0247】
図6(先行技術)は、Illumina Yアダプター構築物の標準的なアダプターの配置を示しており、この図に見られ得るように、サンプルインデックスバーコード([インデックス]と示されている)は、Yアダプター内に含められている。図7は、増幅プライマー内にサンプルインデックスバーコード([インデックスRC]と示されている)を有する本発明の切断型アダプターの配置を示している。両方の図において、増幅プライマーが強調されている。本発明に従って切断型アダプターおよびインデックス付きプライマーを用いてインデックス付きライブラリーを生成する流れが、図8に概略的に示されている。
【0248】
5hmC富化、ライブラリー生成およびハイスループットシーケンシングのプロトコル:
【0249】
被験体の登録時に、通例の静脈切開によって得られた全血検体から血漿を単離した。製造者のプロトコル(Streck,La Vista,NE)(https://www.streck.com/collection/cell-free-dna-bct/)に従って、Cell-Free DNA BCT(登録商標)チューブに全血を収集した。チューブを15℃~25℃で維持し、静脈切開の24時間以内にRTでの10分間の1600×gによる全血の遠心分離によって血漿分離を行った後、血漿層を新しいチューブに移し、16,000×gで10分間、遠心分離した。血漿をその後のcfDNA単離または-80℃での貯蔵に向けて等分した。
【0250】
核酸を収集する前に、4mlの血漿体積を30分間溶解し;すべてのcfDNA溶出液を60μl緩衝液の体積に収集した。QIAamp Circulating Nucleic Acid Kit(Qiagen,Germantown MD)を製造者のプロトコルに従って用いて、cfDNAを単離した。全血ゲノムDNAを、DNA Mini Kit(Qiagen)を用いて抽出し、dsDNA Fragmentase(NEB)を用いて断片化した。Bioanalyzer dsDNA High Sensitivity assay(Agilent Technologies Inc,Santa Clara,CA)およびQubit dsDNA High Sensitivity Assay(Thermo Fisher Scientific,Waltham,MA)によって、DNAを定量化した。
【0251】
スパイクインアンプリコンの調製:スパイクインコントロールを生成するために、ラムダDNAをTaq DNAポリメラーゼ(NEB)によってPCR増幅し、dATP/dGTP/dTTPのカクテルおよび以下のうちの1つ:dCTP、dmCTPまたは10%dhmCTP(Zymo)/90%dCTPを用いて、非重複の約180bpアンプリコンとして、AMPureXPビーズ(Beckman Coulter)によって精製した。プライマー配列は、以下のとおりである。dCTP FW-5’-CGTTTCCGTTCTTCTTCGTC-3’、RV-5’-TACTCGCACCGAAAATGTCA-3’;dmCTP FW-5’-GTGGCGGGTTATGATGAACT-3’、RV-5’-CATAAAATGCGGGGATTCAC-3’;10%dhmCTP/90%dCTP FW-5’-TGAAAACGAAAGGGGATACG-3’、RV-5’-GTCCAGCTGGGAGTCGATAC-3’。
【0252】
5-ヒドロキシメチルシトシンアッセイ富化:シーケンシングライブラリーの調製および5hmCの富化を、以前に記載されているように(Songら、(2017)Cell Research 27:1231-1242)(参照により本明細書に援用される)、行った。cfDNAを、各アッセイに対する10ngの総投入量に対して正規化し、シーケンシングアダプターにライゲートした。5hmC塩基を、2工程の化学作用を介してビオチン化し、続いて、Dynabeads M270 Streptavidin(Thermo Fisher Scientific,Waltham,MA)に結合することによって富化した。すべてのライブラリーをBioanalyzer dsDNA High Sensitivity assay(Agilent Technologies Inc,Santa Clara,CA)およびQubit dsDNA High Sensitivity Assay(Thermo Fisher Scientific,Waltham,MA)によって定量化し、シーケンシングに向けた調製において正規化した。
【0253】
DNAシーケンシングおよびアラインメント:DNAシーケンシングを製造者の推奨に従って、NextSeq550装置をバージョン2試薬化学(Illumina,San Diego,CA)とともに用いる75塩基対のペアードエンドシーケンシングによって行った。1フローセルあたり24個のライブラリーをシーケンシングし、生データの処理および脱多重化(demultiplexing)を、Illumina BaseSpace Sequence Hubを用いて行って、サンプル特異的FASTQ出力を生成した。シーケンシング読み取りデータを、デフォルトのパラメータを用いるBWA-MEM(Li & Durbin(2010),“Fast and accurate long-read alignment with Burrows-Wheeler transform,”Bioinformatics 26:589-595)を使用してhg19参照ゲノムとアラインメントした。
【0254】
ピークの検出:BWA-MEM読み取りデータアラインメントを用いて、CpG内容物におけるヒドロキシメチル化されたシトシン残基の位置をマークする、読み取りデータが高密度に蓄積した領域またはピークを特定した。ピークを識別する前に、アラインメントされた読み取りデータの位置を含むBAMファイルを、マッピングが不十分な(MAPQ<30)読み取りデータおよび適切に対形成されなかった読み取りデータについてフィルタリングした。5hmCピークのコールを、p値カットオフ=1.00e-5を用いるMACS2(https://github.com/taoliu/MACS)を使用して実施した。他の箇所
【0255】
(https://sites.google.com/site/anshulkundaje/projects/blacklists)で定義されるような「ブラックリスト領域」に存在する特定された5hmCピーク、ならびにX染色体、Y染色体およびミトコンドリアゲノム上の読み取りデータ(read date)も除去した。ゲノム特徴富化重複5hmCピークの計算を、デフォルトのパラメータを用いるHOMERソフトウェア(http://homer.ucsd.edu/homer/)を使用して行った。
【実施例
【0256】
実施例1
アダプター配列のデザインおよびアダプター構築物の作製:
【0257】
表1におけるカスタムオリゴヌクレオチド(IDT,Integrated DNA Technologies,Coralville,IAから入手した)は、3つのサブセット:(1)ハイブリダイゼーションおよびアダプター構築物作製のための切断型アダプターオリゴヌクレオチド;(2)アダプターライゲート産物の増幅およびサンプルインデクシングの組み込みのためのインデクシングPCRオリゴヌクレオチド;および(3)任意のインデックスモチーフを含むライブラリーを再増幅するためのユニバーサルPCRオリゴヌクレオチドを含んだ。
【0258】
最初の試験に向けて、24個のユニークなインデックスを作製した。インデックスは、市販のインデックスセットに由来し、インデックス付きPCRオリゴヌクレオチドプライマー(インデックス1_プライマー=CAAGCAGAAGACGGCATA
【0259】
CGAGATGTCGGTAAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC*T...
インデックスX_プライマー=CAAGCAGAAGACGGCATACGAGATAGGTCACTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC*T;同じ方法を用いて追加のインデックス付きプライマーを調製した)における配列の逆相補鎖として検出された。
【0260】
【表1-1】
【表1-2】
【0261】
再構成された200μMのP5_切断型およびP7_切断型アダプターオリゴヌクレオチドを、以下のとおりハイブリダイズした。
【0262】
STE緩衝液中の切断型アダプターオリゴヌクレオチドのマスターミックスを1.5mlエッペンドルフチューブにおいて生成し、3本の肉厚の薄い0.2mlPCRチューブに等分した(各40μl)。
【表2】
【0263】
以下の条件において、加熱蓋(ブロック温度が>40℃の場合105℃、その他の場合、外界温度)を有するEppendorf Mastercycler Proにおいてオリゴヌクレオチドをハイブリダイズした。
【表3】
【0264】
ハイブリダイズしたアダプターを、単一の1.5mlエッペンドルフチューブにプールし、検証中は、4℃で貯蔵した(長期間の貯蔵は、-20℃での貯蔵が推奨される)。アダプターを1×STE緩衝液で1:250希釈し、Bioanalyzer High Sensitivityチップにおいて評価した。アダプターの電気泳動図に、ハイブリダイゼーションの成功を示す単一の大きなピークが見られた。
【0265】
上記の手順は、インデックス配列の作製に広く応用可能であり、当業者に明らかであるように、1またはそれを超える方法で改変され得る。
【0266】
実施例2
ライブラリー調製の最適化:
【0267】
この実施例では、実施例1に記載されたように調製された切断型アダプターを用いたライブラリー調製の最適化を記載する。
【0268】
(a)カスタムアダプターを評価するためのテンプレートDNAの調製:
【0269】
テンプレートDNAは、実際には限られたものであるので、切断型アダプターを最適化および検証する目的では、断片化されたゲノムDNAが、重要で均一なDNAテンプレートを入手するための最良の解決法であると考えられた。この目的のためにKAPA(登録商標)HyperPlus Kit(Roche)を用いた。このHyperPlus Kitは、典型的には、断片化とライブラリー調製(アダプターライゲーションを含む)との組み合わせを行うために用いられるが、断片化の部分だけをこの実施例に使用した。
【0270】
ストックの脳ゲノムDNAおよび脾臓ゲノムDNAを、緩衝液Tris-HCl(pH8.0)溶液において35μlあたり500ngに希釈した。組織タイプ1つにつき合計1μgのゲノムDNAに対して、各組織の2つの反復調製物を調製した。脳gDNAと脾臓gDNAの両方について、濃度および反応体積は、以下のとおりであった:ストック濃度、250ng/μl;最終濃度、10.7ng/μl;反応体積、1.5μl;緩衝液EB、33.5μl。
【0271】
断片化の緩衝液および酵素を氷上で解凍し、肉厚の薄い0.2mlPCRチューブ内の各ゲノムDNAサンプルに添加した。断片化反応ミックス中の濃度および1×反応体積は、以下のとおりであった:dsDNAのストック濃度、10.7ng/μl;dsDNAの反応濃度、7.5ng/μl;dsDNAの1×反応体積、35μl;断片化緩衝液のストック濃度、10×;断片化緩衝液の反応濃度、1×;断片化緩衝液の1×反応体積、5μl;断片化酵素のストック濃度、5×;断片化酵素の反応濃度、1×;断片化酵素の1×反応体積、10μl。
【0272】
次いで、上記ゲノムDNAサンプルを、以下の条件下のEppendorf Mastercycler Pro(加熱蓋は外した状態で)において断片化した:4℃で1分間の冷却;37℃で35分間の断片化。
【0273】
断片化サンプルを直ちにサーマルサイクラーから取り出し、下記に記載される2×比のAMPureXPビーズプロトコルを用いて精製した:
【0274】
精製の前に、少なくとも30分間、AMPureXPビーズを室温に加温した。
【0275】
4mlの超高純度エタノールを1ml分子グレードの水と混合することによって、80%エタノール溶液を調製した。
【0276】
各断片化サンプルの全体積を、適切にラベルされた1.5mlチューブに移した。
【0277】
各サンプルに100μlのAMPureXPビーズを添加し、軽くボルテックスして混合した。
【0278】
室温で10分間、DNAをビーズに結合させた。
【0279】
>1分間、チューブを磁気ラックに置いてビーズをペレットにした後、上清を除去し、廃棄した。
【0280】
チューブを磁気ラックに置いたまま、各サンプルに500μlの80%エタノールを添加し、磁気ラックにおいて30秒間インキュベートした後、上清を除去し、廃棄した。
【0281】
室温で5分間、サンプルチューブの蓋をとってビーズペレットを乾燥させた。
【0282】
各サンプルに52μlの緩衝液EBを添加し、上下にピペッティングして、ビーズペレットを完全に溶解させた。
【0283】
時々混合して、室温で5分間、サンプルを溶液に溶出させた。
【0284】
>1分間、チューブを磁気ラックに置いてビーズをペレットにした。
【0285】
50μlの上清を、適切にラベルされた1.5mlチューブに慎重に移した。
【0286】
残りのチューブおよびビーズを廃棄した。
【0287】
Qubit dsDNAアッセイを用いて、断片化されたDNAを定量化した。1μlの各サンプルを評価した。断片化されたDNAサンプルを、Bioanalyzer High Sensitivityチップにおいてサイズ分布について評価した。得られたサイズ分布プロファイルは、図9に示されている。
【0288】
ゲノムDNAサンプルの断片化は成功し、脳gDNA調製物よりも脾臓gDNA調製物における収率がわずかに高かった。観察されたフラグメントサイズは、標準的なcfDNAサイズ分布の範囲内であり、167bpに集中していた。断片化されたgDNAの収率は、(1)ライブラリー調製物に投入されるアダプターの力価、および(2)標準的なアダプターに対する切断型アダプターの直接評価にとって十分であった。
【0289】
(b)アダプターの力価およびライゲーション:
【0290】
アダプターを、WGSライブラリー調製物に入れて、およそ5倍からおよそ500倍のアダプター対テンプレートDNAの比(5:1;20:1;50:1;100:1;250:1;および500:1)に及ぶ50倍の範囲にわたって脳(10ngの投入量)および脾臓(20ngの投入量)の断片化cfDNAテンプレートに対して力価測定した。
【0291】
断片化されたDNAを、50μl体積における10ng(脳)または20ng(脾臓)に対して正規化した。末端修復酵素とAテール化酵素とのミックスを調製し、断片化されたゲノムDNAを、以下の条件を用いてEppendorf Mastercycler Pro(加熱蓋を付けた状態で)において末端修復し、Aテール化した:20℃で30分間の末端修復;65℃で30分間の熱失活;および4℃で保持。
【0292】
9nM、36nM、91nM、182nMまたは455nMの濃度を有する1.5μlのアダプター希釈物を、末端修復した各サンプルに添加し、ライゲーションマスターミックスを添加する前に混合した。
【0293】
以下の構成成分を有するライゲーションマスターミックスを調製した:
【表4】
【0294】
末端修復された断片化gDNAサンプルを、室温で30分間、アダプターにライゲートし、ライゲート産物を、標準的な1.2×比のAMPureXPビーズプロトコルを用いて精製した。
【0295】
(c)増幅および検証:
【0296】
10:1:1:2:6体積比で以下の構成成分を含むPCRマスターミックスを調製した:2×KAPA HiFi HotStart Ready Mix;10μMユニバーサルプライマー;10μMインデックスプライマー(1~10);ライゲートしたDNA;およびHPLC水。PCRサイクリング条件は、以下のとおりであった:最初の変性、98℃、45秒;変性、98℃、15秒;アニール、60℃、30秒。増幅産物を、前述同様に、標準的な1.2×比のAMPureXPビーズプロトコルを用いて精製した。
【0297】
PCR増幅されたライブラリーを緩衝液EBで25×希釈し、Bioanalyzer High SensitivityチップにおいてQubit High Sensitivity dsDNAアッセイを用いて評価した。データを下記に示す。
【0298】
切断型アダプター力価ライブラリー濃度:
【表5】
【0299】
WGSライブラリー濃度(ng/μL)を、投入したアダプターの濃度に対してプロットした。これは、MT群のWGSとともに、図10に示されている。
【0300】
このデータは、(1)予想通り、アダプター濃度に伴ってライブラリー濃度が大きく上昇すること、および(2)この実験では、ライゲーション反応において、182nMのアダプター濃度のときまたは濃縮アダプターストックの6倍希釈のとき、ライブラリー濃度が最適になることを示している。しかしながら、各データポイントに対して1回しか反復を行わなかったので、分散は不明である。以前は、WGSのために処理されたサンプルを10ngのcfDNAから調製していた。この実験では、20ngのgDNAを準備したが、20%しかホールゲノム分析に使用されず、つまり標準的なYアダプターを用いる既存のプロセスのWGS投入DNAの40%に相当する量しか使用されなかった。図10に示された参照値はすべて、この40%投入量調整について補正されたWGSライブラリー濃度を反映している。これらのデータの意味は、20ngの投入DNAを用いた切断型アダプターライゲーションが、既存の化学よりもテンプレート分子を効率的にサンプリングするということである。これらの分析に基づくと、濃縮アダプターストックの6倍希釈が最適である。
【0301】
実施例3
アダプターの性能の直接比較:
【0302】
(a)ライブラリーの定量化:
【0303】
最初の評価に基づいて、切断型アダプター 対 標準的な(Bioo)アダプターの直接評価を行った。この実験のために、20ngの断片化された脳gDNAおよび20ngの脾臓gDNAをそれぞれ2つ組で、上に記載されたように調製した。しかしながら、アダプターにライゲートしたgDNA産物の残りの80%は、5hmC富化プロトコルによって処理した。比較として、WGSおよび5hmC富化のための10ngの各DNAタイプを、標準的なプロトコル(Biooアダプター)を用いて調製した。すべてのサンプルを、比較分析のために同じフローセル上でシーケンシングした。インデックスは、Biooインデックスおよびカスタムサンプルインデックスにおいて8bpインデクシングによって読んだとき、ハミング距離が>2になるように選択されなければならなかった。
【0304】
・切断型アダプターを用いて生成されたライブラリーのサイズプロファイルは、脳サンプルおよび脾臓サンプル由来の断片化されたゲノムDNAのサイズプロファイルに基づく予想に非常に近かった。
【0305】
・クリーンアップ中に用いられた他と異なるAMPureXPビーズ比におそらく起因して、Biooアダプター調製物のサイズプロファイルは、切断型アダプターから生成されたサイズプロファイルよりも有意に大きかった(Biooアダプター調製物に対しては、アダプターのライゲーションとPCRの両方の後に0.8×というAMPureXPビーズ比を用い、既存のBiooアダプタープロトコルに対する注釈なしの変更では、ライゲーション後に0.8×というビーズ比、およびPCR後に1×というビーズ比を用いたことに注意されたい)。
【0306】
・BiooアダプタープロトコルにおけるAMPureXPビーズのクリーンアップ条件に起因して、かなりのライブラリーが失われた可能性が高い。さらに、失われたフラグメントサイズは、おそらく100~150bpの範囲に富化されている可能性があり、シグナルが豊富である可能性がある。
【0307】
ライブラリーの定量化データを下記に要約する。
【表6】
【0308】
(b)シーケンシング:
【0309】
すべてのライブラリーを、平均フラグメントサイズに基づいて2nM濃度に対して正規化した。ライブラリーを、NextSeq 550装置において単一の8bpサンプルインデクシングによってペアードエンド(2×75bp)でシーケンシングした。高レベルの配列データを下記に要約する。1つのサンプル(S8)は、操作者のエラーに起因して、このサンプルシートにおけるインデックスによって誤ってタグ付けされ、この実験では正しく脱多重化しなかったことに注意されたい。
【表7】
【0310】
配列データにおいて観察されたフラグメントサイズの分布は、Bioanalyzerにおいて観察されたものとほぼ同じであり、ここで、WGSライブラリーでは、有意なサイズのシフトが観察された(Biooプロトコルの使用に対して選択された小さいフラグメントを用いたとき)が、プロトコルを実践的なAMPureXP SPRIビーズ条件に修正した後は、有意差がなくなった。
【0311】
(c)分析:
【0312】
16個のライブラリーの各々に対する遺伝子の数をRPKM値に変換した。RPKM値を、WGSおよび5hmC調製物に対する処置にわたって比較した。比較全体でいくらかのノイズがあったにもかかわらず、概して調製物は、互いに比較的類似していた。注目すべきことに、脳ゲノムDNAからの5hmC調製物は、特に複製調製物間で、互いに顕著に類似していた。
【0313】
RPKM値のヒストグラムを各ライブラリーについて構築した。WGSデータに対するRPKM分布は、予想通り、最頻値が1に近づくにつれて分布が狭くなり(読み取りデータのランダム分布)、2次分布は、これらの男性サンプルにおいて50%量を有するX染色体遺伝子本体に対応する0.5に近似した。WGSライブラリーのRPKM分布は、脳gDNAからの5hmCライブラリーのRPKM分布と同様に、おおむね一致している。しかしながら、脾臓gDNAからの5hmCライブラリーのRKPM分布では、有意なばらつきが観察された。注目すべきことに、2つのライブラリーは、5hmC調製物ではなくWGS調製物に近似するとみられたことから、これらのライブラリーに対する富化プロセスにおけるバックグラウンドノイズの可能性が示唆される。
【0314】
(d)テンプレート分子サンプリング効率の見積もり(WGSのみ):
【0315】
この実験において観察されたWGSライブラリー濃度は、切断型アダプターが、試験された条件下でのテンプレートDNAサンプリングのおよそ3倍高い効率を有することを示唆する(平均値2.99×、中央値3.19×)。サンプリング効率の見積もりは、投入したテンプレートの濃度、出力されたライブラリー濃度およびPCR増幅効率に依存しており、前の2つの値だけしか既知でなく、完全な100%増幅効率の保存的(この目的の場合)な見積もりは、切断型アダプターがテンプレートのおよそ25%をサンプリングし、Biooアダプターが、テンプレートのおよそ8.5%をサンプリングすることを示唆していることに注意されたい。アダプターの直接比較の結果は、推定PCR効率に対する、サンプリングされたテンプレートの割合のプロットである、図11に示されている。
【0316】
実施例4
切断型アダプターの機能:
【0317】
切断型アダプターおよびインデックス付きPCRプライマーの相対的な機能は、単一のテンプレートから調製されたホールゲノムライブラリーの収率を、限られたPCRサイクルを用いる代替のアダプターストラテジーと比較することによって見積もることができる。この場合、高いホールゲノムライブラリー濃度は、全体的により効率的なプロセスを示唆する、テンプレート分子のより効率的なサンプリングを反映していると推定される。市販のアダプター(KAPA、BIOO)と比べて、切断型アダプターは、上に記載された条件下におけるテンプレートDNA分子のサンプリングにおいておよそ1.5×~2×より効率的である。ここで観察された値は、>10%(BIOOアダプター)に対して>18%(切断型アダプター)という、テンプレートDNAからライブラリーへの変換効率の改善を示唆する。アダプターの効率を隣り合わせで比較した結果が、図12に示されている。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
【手続補正書】
【提出日】2021-06-02
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】配列表
【補正方法】追加
【補正の内容】
【配列表】
2022504078000001.app
【国際調査報告】