(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-09-01
(45)【発行日】2022-09-09
(54)【発明の名称】RNAおよびDNAからの核酸ライブラリーの作製
(51)【国際特許分類】
C40B 40/06 20060101AFI20220902BHJP
C12Q 1/6869 20180101ALI20220902BHJP
C12Q 1/6827 20180101ALI20220902BHJP
【FI】
C40B40/06
C12Q1/6869 Z
C12Q1/6827 Z
(21)【出願番号】P 2019568775
(86)(22)【出願日】2019-03-20
(86)【国際出願番号】 US2019023114
(87)【国際公開番号】W WO2019183188
(87)【国際公開日】2019-09-26
【審査請求日】2020-02-10
(32)【優先日】2018-03-22
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】500358711
【氏名又は名称】イルミナ インコーポレイテッド
(74)【代理人】
【識別番号】100106518
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100138911
【氏名又は名称】櫻井 陽子
(72)【発明者】
【氏名】ホンシア・シュイ
(72)【発明者】
【氏名】ダン・ツァオ
(72)【発明者】
【氏名】アレックス・アラバニス
【審査官】松原 寛子
(56)【参考文献】
【文献】国際公開第2018/005811(WO,A1)
【文献】Nature Biotechnology,2015年,vol.33,p.285-289
(58)【調査した分野】(Int.Cl.,DB名)
C40B 40/06
C12Q 1/6869
C12Q 1/6827
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
(a)複数のポリヌクレオチドを、複数の、ランダムヘキサマー配列およびタグを含むプライマーとハイブリダイズすること;ここで、該複数のポリヌクレオチドはRNAおよびDNAを含む;
(b)該ハイブリダイズしたプライマーを逆転写酵素を用いて伸長させて、該RNAポリヌクレオチドから伸長されたプライマーを得ること;
(c)該伸長したプライマーおよび該DNAを含む核酸ライブラリーを形成すること;および
(d)前記核酸ライブラリーをシーケンスすること
を含む、該複数のポリヌクレオチドから核酸ライブラリーを作製する方法。
【請求項2】
(e)前記タグを含むポリヌクレオチド配列を同定し、それによって、前記複数のポリヌクレオチドの前記RNAポリヌクレオチドから誘導された配列を同定すること、および/または前記タグを欠くポリヌクレオチド配列を同定し、それによって、前記複数のポリヌクレオチドの前記DNAポリヌクレオチドから誘導された配列を同定すること
をさらに含む、請求項1に記載の方法。
【請求項3】
前記複数のプライマーが異なる配列を含み、各プライマーがそれぞれ異なる配列を含んでいてよい、請求項1または2に記載の方法。
【請求項4】
前記複数のプライマーが、10000を超える異なる配列を含み、該複数のプライマーが、100000を超える異なる配列を含んでいてよい、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記複数のプライマーが同じタグを含む、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記逆転写酵素がDNA依存性ポリメラーゼ活性を欠き、該逆転写酵素が、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、モロニーマウス白血病ウイルス(MMLV)逆転写酵素、ヒト免疫ウイルス(HIV)逆転写酵素、ウマ伝染性貧血ウイルス(EIAV)逆転写酵素、ラウス(Rous)随伴ウイルス-2(RAV2)逆転写酵素、C. hydrogenoformans DNAポリメラーゼ、T. thermus DNAポリメラーゼ、T. flavus DNAポリメラーゼ、およびそれらの機能性バリアントからなる群から選択されてよい、請求項1から5のいずれか一項に記載の方法。
【請求項7】
(b)が前記DNAポリヌクレオチドの存在下で行われる、請求項1から6のいずれか一項に記載の方法。
【請求項8】
(b)が、前記伸長したプライマーから二本鎖cDNAを生成することを含む、請求項1から7のいずれか一項に記載の方法。
【請求項9】
(c)が、前記伸長したプライマーおよびDNAポリヌクレオチドを、キナーゼ、リガーゼ、トランスポゾン、ポリメラーゼおよびシーケンシングアダプターからなる群から選択される試薬と接触させることを含む、請求項1から8のいずれか一項に記載の方法。
【請求項10】
前記複数のポリヌクレオチドがセルフリー(cell-free)であり、ここで、該複数のポリヌクレオチドは、血清、間質液、リンパ、脳脊髄液、唾液、尿、乳汁、汗および涙液からなる群から選択されるサンプルから得られるものであってよい、請求項1から9のいずれか一項に記載の方法。
【請求項11】
(i)請求項1~10のいずれかに記載の方法によって核酸サンプルか
ら核酸ライブラリー
を作製し、前記核酸ライブラリーからポリヌクレオチド配列
のデータを得ること;および
(ii)タグを含むポリヌクレオチド配列を同定し、それによって、前記複数のポリヌクレオチドのRNAポリヌクレオチドから誘導された配列を同定すること、
を含む、核酸サンプル中の核酸を同定する方法。
【請求項12】
(iii)前記タグを含むポリヌクレオチド配列におけるバリアントを同定すること、ここで、該バリアントは、一塩基多型(SNP)、欠失、挿入、置換、重複、転位、および遺伝子融合からなる群から選択されるものであってよい、および
前記タグを含むポリヌクレオチド配列における逆転写エラーを同定すること
をさらに含む、請求項11に記載の方法。
【請求項13】
前記タグを含むポリヌクレオチドを参照配列と比較すること;ここで、該参照配列は、前記核酸ライブラリーのDNAポリヌクレオチドから誘導されるものであってよい、
をさらに含む、請求項11または12に記載の方法。
【請求項14】
前記RNAポリヌクレオチドが、mRNA、tRNA、リボソームRNA、ノンコーディングRNA、piRNA、siRNA、長鎖ノンコーディングRNA(lncRNA)、shRNA、snRNA、miRNA、snoRNA、ウイルスRNA、細菌RNA、およびリボザイムからなる群から選択されるRNAである、請求項11から13のいずれかに記載の方法。
【請求項15】
前記RNAポリヌクレオチドがlncRNAである、請求項14に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、引用によりその全体が本書の一部とされる、2018年3月22日に出願された“PREPARATION OF NUCLEIC ACID LIBRARIES FROM RNA AND DNA”と題する米国仮出願第62/646487号に基づく優先権を主張する。
【0002】
発明の分野
本発明の方法および組成物のいくつかの態様は、RNAおよびDNAから誘導される核酸ライブラリーの作製および使用に関する。いくつかの態様において、核酸ライブラリーは、RNAから誘導されるポリヌクレオチドにタグを付けることによって作製することができる。
【背景技術】
【0003】
組織サンプルの全ゲノムシーケンシング、ジェノタイピング、ターゲット・リシーケンシング、および遺伝子発現解析は、患者における疾患バイオマーカーの同定、疾患の正確な診断および予後診断、ならびに適切な処置の選択のために極めて重要でありうる。例えば、患者から採取した腫瘍組織の核酸配列解析によって、体細胞バリアント、構造再構成(structural rearrangement)、点変異、欠失、挿入といった特定の遺伝子バイオマーカーの存否、および/または特定遺伝子の存否を決定することができる。配列解析のために、セルフリー(cell-free)サンプルを用いて核酸ライブラリーを作製することができる。しかしながら、そのようなライブラリーにおいて、疾患バイオマーカーを含む核酸は稀であり得、検出が困難でありうる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
したがって、疾患バイオマーカー検出の感度を高めることが望まれる。
【課題を解決するための手段】
【0005】
いくつかの態様は、
(a)複数のポリヌクレオチドを、複数の、タグを含むプライマーとハイブリダイズすること;ここで、該複数のポリヌクレオチドはRNAおよびDNAを含む;
(b)該ハイブリダイズしたプライマーを逆転写酵素を用いて伸長すること;および
(c)該伸長したプライマーおよび該DNAから、核酸のライブラリーを形成すること
を含む、核酸ライブラリーを作製する方法を含む。いくつかの態様は、(d)該核酸ライブラリーをシーケンスすることをも含む。いくつかの態様は、(e)該タグを含むポリヌクレオチド配列を同定し、それによって、該複数のポリヌクレオチドの該RNAポリヌクレオチドから誘導された配列を同定することをも含む。いくつかの態様は、該タグを欠くポリヌクレオチド配列を同定し、それによって、該複数のポリヌクレオチドの該DNAポリヌクレオチドから誘導された配列を同定することをも含む。
【0006】
いくつかの態様において、複数のプライマーは異なる配列を含む。いくつかの態様において、各プライマーはそれぞれ異なる配列を含む。いくつかの態様において、複数のプライマーは、10000を超える異なる配列を含む。いくつかの態様において、複数のプライマーは、100000を超える異なる配列を含む。いくつかの態様において、複数のプライマーは、ランダムヘキサマー配列を含む。いくつかの態様において、複数のプライマーは、同じタグを含む。
【0007】
いくつかの態様において、逆転写酵素はDNA依存性ポリメラーゼ活性を欠く。いくつかの態様において、逆転写酵素は、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、モロニーマウス白血病ウイルス(MMLV)逆転写酵素、ヒト免疫ウイルス(HIV)逆転写酵素、ウマ伝染性貧血ウイルス(EIAV)逆転写酵素、ラウス(Rous)随伴ウイルス-2(RAV2)逆転写酵素、C. hydrogenoformans DNAポリメラーゼ、T. thermus DNAポリメラーゼ、T. flavus DNAポリメラーゼ、およびそれらの機能性バリアントからなる群から選択される、
【0008】
いくつかの態様において、(b)は、前記DNAポリヌクレオチドの存在下に行われる。いくつかの態様において、(b)は、前記伸長したプライマーから二本鎖cDNAを生成することを含む。いくつかの態様において、(c)は、前記伸長したプライマーおよびDNAポリヌクレオチドを、キナーゼ、リガーゼ、トランスポゾン、ポリメラーゼおよびシーケンシングアダプターからなる群から選択される試薬と接触させることを含む。
【0009】
いくつかの態様において、複数のポリヌクレオチドはセルフリーである。いくつかの態様において、複数のポリヌクレオチドは、血清、間質液、リンパ、脳脊髄液、唾液、尿、乳汁、汗および涙液からなる群から選択されるサンプルから得る。
【0010】
いくつかの態様は、
(a)複数のポリヌクレオチドを複数のプライマーとハイブリダイズすること;ここで、該複数のポリヌクレオチドはRNAおよびDNAを含む;
(b)該ハイブリダイズしたプライマーを逆転写酵素を用いて伸長すること;および
(c)該伸長したプライマーおよび該DNAから、核酸のライブラリーを形成すること
を含む、核酸ライブラリーを作製する方法を含む。
【0011】
いくつかの態様において、複数のポリヌクレオチドはセルフリーである。いくつかの態様において、複数のポリヌクレオチドは、血清、間質液、リンパ、脳脊髄液、唾液、尿、乳汁、汗および涙液からなる群から選択されるサンプルから得る。
【0012】
いくつかの態様において、複数のプライマーは異なる配列を含む。いくつかの態様において、各プライマーはそれぞれ異なる配列を含む。いくつかの態様において、複数のプライマーは、10000を超える異なる配列を含む。いくつかの態様において、複数のプライマーは、100000を超える異なる配列を含む。いくつかの態様において、複数のプライマーは、ランダムヘキサマー配列を含む。
【0013】
いくつかの態様において、逆転写酵素はDNA依存性ポリメラーゼ活性を欠く。いくつかの態様において、逆転写酵素は、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、モロニーマウス白血病ウイルス(MMLV)逆転写酵素、ヒト免疫ウイルス(HIV)逆転写酵素、ウマ伝染性貧血ウイルス(EIAV)逆転写酵素、ラウス随伴ウイルス-2(RAV2)逆転写酵素、C. hydrogenoformans DNAポリメラーゼ、T. thermus DNAポリメラーゼ、T. flavus DNAポリメラーゼ、およびそれらの機能性バリアントからなる群から選択される。
【0014】
いくつかの態様において、(b)は、前記DNAポリヌクレオチドの存在下に行われる。いくつかの態様において、(b)は、前記伸長したプライマーから二本鎖cDNAを生成することを含む。いくつかの態様において、(c)は、前記伸長したプライマーおよびDNAポリヌクレオチドを、キナーゼ、リガーゼ、トランスポゾン、ポリメラーゼおよびシーケンシングアダプターからなる群から選択される試薬と接触させることを含む。
【0015】
いくつかの態様は、
(i)前記方法のいずれか1つによって核酸サンプルから作製された核酸ライブラリーから、配列データを得ること;および
(ii)タグを含むポリヌクレオチド配列を同定し、それによって、前記複数のポリヌクレオチドのRNAポリヌクレオチドから誘導された配列を同定すること
を含む、核酸サンプル中の核酸を同定する方法を含む。いくつかの態様は、(iii)タグを含むポリヌクレオチド配列におけるバリアントを同定することをも含む。いくつかの態様において、該バリアントは、一塩基多型(SNP)、欠失、挿入、置換、転位、重複、および遺伝子融合からなる群から選択される。いくつかの態様は、タグを含むポリヌクレオチド配列中の逆転写エラーを同定することをも含む。いくつかの態様は、タグを含むポリヌクレオチドを参照配列と比較することをも含む。いくつかの態様において、参照配列は、該核酸ライブラリーのDNAポリヌクレオチドから誘導される。いくつかの態様において、前記サンプルはセルフリー核酸を含む。いくつかの態様において、RNAポリヌクレオチドは、mRNA、tRNA、リボソームRNA、ノンコーディングRNA、piRNA、siRNA、lncRNA、shRNA、snRNA、miRNA、snoRNA、ウイルスRNA、細菌RNA、およびリボザイムからなる群から選択されるRNAである。
【0016】
いくつかの態様は、
逆転写酵素;および
複数の、タグを含むプライマー;ここで各プライマーは異なる
を含む、核酸ライブラリーを作製するためのキットを含む。いくつかの態様において、複数のプライマーは同じタグを含む。いくつかの態様は、キナーゼ、RNアーゼ、リガーゼ、トランスポゾン、ポリメラーゼおよびシーケンシングアダプターかからなる群から選択される成分をも含む。いくつかの態様において、逆転写酵素は、DNA依存性ポリメラーゼ活性を欠く。いくつかの態様において、逆転写酵素は、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、モロニーマウス白血病ウイルス(MMLV)逆転写酵素、ヒト免疫ウイルス(HIV)逆転写酵素、ウマ伝染性貧血ウイルス(EIAV)逆転写酵素、ラウス随伴ウイルス-2(RAV2)逆転写酵素、C. hydrogenoformans DNAポリメラーゼ、T. thermus DNAポリメラーゼ、T. flavus DNAポリメラーゼ、およびそれらの機能性バリアントからなる群から選択される。
【図面の簡単な説明】
【0017】
【
図1】
図1は、RNAおよびDNAから核酸ライブラリーを作製し、それをシーケンスする態様を示す図である。
【
図2】
図2は、複数の患者からのサンプルにおける特定の核酸の濃度のグラフである。
【
図3】
図3は、逆転写ステップを含む(RTカウント)、または含まない(mock RTカウント)方法により作製されたライブラリーから得た、特定の配列の数のグラフである。
【
図4】
図4は、NSCLC V1パネルにおいて試験された、逆転写ステップを含む方法で作製されたライブラリー(RT)と、逆転写ステップを含まない方法で作製されたライブラリー(mock RT)との、特定の遺伝子領域のカバーの比を示すグラフである。
【
図5】
図5は、逆転写ステップを行って作製されたライブラリーにおいて増加した頻度で見られた変異の数のグラフである。
【
図6】
図6は、逆転写酵素を用いるか(A)、または逆転写酵素を用いずに(B)、タグ付けされたランダムヘキサマーを用いて作製されたライブラリーからの、読み取りの数を示すグラフである。
【発明を実施するための形態】
【0018】
本発明の方法および組成物の態様は、RNAおよびDNAから誘導される核酸ライブラリーの作製および使用に関する。いくつかの態様において、核酸ライブラリーは、RNAから誘導されるポリヌクレオチドにタグを付けることによって作製することができる。
【0019】
体液、例えば血清、涙液、尿および汗は、セルフリー核酸を含む。そのような核酸は、疾患バイオマーカーを含みうる。しかしながら、そのような液体におけるそのようなバイオマーカーの頻度または濃度は、極めて低くありうる。いくつかの態様は、RNAおよびDNAから、疾患バイオマーカーを包含する特定の核酸の検出感度を高める核酸ライブラリーを作製することを含む。
【0020】
いくつかの態様は、RNAを、タグを含むプライマーを用いて逆転写して、該タグの配列を、該RNAから誘導されるポリヌクレオチドに組み込むことによって、核酸ライブラリーを作製することを含む。したがって、該RNAから誘導された配列を、タグによって同定することができる。いくつかの態様において、核酸配列のソースを識別することは、バリアントが、ライブラリー作製、例えば逆転写ステップの結果でありうるかを決定するために有用でありうる。いくつかの態様において、核酸配列のソースを識別することは、スプライスバリアント、組織特異的バリアント、ノンコーディングRNA、および特定の遺伝子融合を同定するために有用でありうる。ノンコーディングRNA、例えば長鎖ノンコーディングRNA(lncRNA)は、特定の癌タイプを同定し特徴付けるために有用でありうる。例えば、Yan, X., et al., (2015)“Comprehensive Genomic Characterization of Long Non-coding RNAs across Human Cancers”, Cancer Cell 28:529-540を参照されたい(その全体を引用により本書の一部とする)。セルフリーlncRNAは、他のRNA、例えばタンパク質をコードするRNAよりも、二次構造の故に血漿中でより安定でありうる。
【0021】
本書において、「ポリヌクレオチド」とは、デオキシリボヌクレオチドおよび/またはリボヌクレオチドを含む、任意の長さのポリマー形態のヌクレオチド、およびそのアナログをさしうる。ポリヌクレオチドは、任意の3次元構造を有することができ、既知または未知の任意の機能を示しうる。また、ポリヌクレオチドの構造の記載は、5’または3’末端によることがあるが、これはポリヌクレオチドの方向性を示すものである。一本鎖ポリヌクレオチドにおいて、隣接ヌクレオチドどうしは典型的には、3’炭素と5’炭素の間のホスホジエステル結合によって連結される。しかしながら、例えばメチレン結合、ホスホラミデート結合等を包含する結合のような、異なるヌクレオチド間結合も用いられうる。このことは、5’および3’末端と称されうるポリヌクレオチドのいずれかの端において、対応する5’または3’炭素が暴露されうることを意味する。5’および3’末端はそれぞれ、該末端に結合している化学基から、ホスホリル(PO4)およびヒドロキシル(OH)末端とも称される。用語ポリヌクレオチドはまた、二本鎖および一本鎖のいずれの分子をもさす。ポリヌクレオチドの例は、遺伝子および遺伝子断片、ゲノムDNA、ゲノムDNA断片、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、ノンコーディングRNA(ncRNA)、例えばPIWI相互作用RNA(PIWI-interacting RNA;piRNA)、低分子干渉RNA(siRNA)、および長鎖ノンコーディングRNA(lncRNA)、低分子ヘアピン型RNA(shRNA)、核内低分子RNA(snRNA)、マイクロRNA(miRNA)、核小体低分子RNA(snoRNA)およびウイルスRNA、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブ、プライマー、または前記のいずれかの増幅されたコピーを包含する。ポリヌクレオチドは、修飾されたヌクレオチド、例えばメチル化ヌクレオチドおよびヌクレオチドアナログ、例えば非天然の塩基を含むヌクレオチド、修飾された天然塩基(例えばアザ-またはデアザ-プリン)を含むヌクレオチドを包含しうる。ポリヌクレオチドは、アデニン(A)、シトシン(C)、グアニン(G)およびチミン(T)の4種のヌクレオチド塩基の、ある特定の配列からなりうる。ウラシル(U)も、例えば、ポリヌクレオチドがRNAであり場合にチミンの天然代替物として存在しうる。ウラシルはDNAにおいても用いられうる。したがって、用語「配列」とは、天然および非天然の塩基を含む、ポリヌクレオチドまたは任意の核酸分子を、アルファベットで表したものをさす。
【0022】
本書において、「RNA分子」またはリボ核酸分子は、デオキシリボース糖よりもむしろリボース糖、および典型的にはピリミジン塩基の1つとしてチミンよりもむしろウラシルを有するポリヌクレオチドをさしうる。RNA分子は通常、一本鎖であるが、2本鎖でもありうる。RNAサンプルからのRNA分子については、RNA分子は、細胞核、ミトコンドリア、クロロプラストまたは細菌細胞においてDNAから転写された一本鎖分子を包含し得、これは、転写元のDNA鎖に相補的なヌクレオチド塩基の線状配列を有する。
【0023】
本書において、「ハイブリダイゼーション」、「ハイブリダイズする」またはその文法上の変化形は、1つまたはそれ以上のポリヌクレオチドが反応して複合体を形成する反応をさし得、ここで、該複合体は、少なくとも部分的に、ヌクレオチド残基の塩基間の水素結合によって形成される。該水素結合は、ワトソン-クリック塩基対形成によって、フーグスティーン(Hoogstein)結合によって、または他の任意の配列特異的な様式で生じうる。該複合体は、二重鎖構造を形成する2本の鎖、多重鎖複合体を形成する3本またはそれ以上の鎖、単一の自己ハイブリダイズ鎖、またはそれらの任意の組み合わせを有しうる。鎖はまた、水素結合に加えて他の力によって、架橋または他の様式で連結しうる。
【0024】
本書において、「伸長する」、「伸長」またはその文法上の変化形は、伸長酵素、例えばポリメラーゼによる、プライマー、ポリヌクレオチドまたは他の核酸分子へのdNTPの付加をさしうる。例えば、本書に開示するいくつかの方法において、生成する伸長されたプライマーは、RNAの配列情報を含む。伸長を、ポリメラーゼ、例えばDNAポリメラーゼ、または逆転写酵素を用いて行うものとして、いくつかの態様を説明するが、伸長は、当分野で周知の任意の他の方法で行うこともできる。例えば、伸長は、短いランダムオリゴヌクレオチドどうし、例えば関心のある鎖にハイブリダイズされているオリゴヌクレオチドどうしをライゲートすることにより行うことができる。
【0025】
本書において、「逆転写」とは、RNA分子のヌクレオチド配列をDNA分子にコピーするプロセスをさしうる。逆転写は、鋳型RNAを、逆転写酵素としても知られるRNA依存性DNAポリメラーゼと接触させることによってなされうる。逆転写酵素は、一本鎖RNAを一本鎖DNAに転写するDNAポリメラーゼである。用いられるポリメラーゼによっては、該逆転写酵素は、後で鋳型RNAを分解するためのRNアーゼH活性をも有しうる。
【0026】
本書において、「相補的DNA」または「cDNA」とは、逆転写酵素の作用によってRNAから逆転写された合成DNAをさしうる。cDNAは、一本鎖または二本鎖であり得、RNA配列の一部と実質的に同じ配列、またはRNA配列の一部に対する相補配列の、一方または両方を有する鎖を含むことができる。
【0027】
本書において、「cDNAライブラリー」とは、RNA配列から生成されたDNA配列のコレクションをさしうる。cDNAライブラリーは、該RNAの抽出元のサンプル中に存在するRNAを表すことができる。いくつかの態様において、cDNAライブラリーは、セルフリー核酸サンプル中に存在するRNAを表すことができる。いくつかの態様において、cDNAライブラリーは、1つの細胞または細胞集団において産生されるメッセンジャーRNA(mRNA)、リボソームRNA(rRNA)、トランスファーRNA(tRNA)および他のノンコーディングRNA(ncRNA)を包含する、ある特定の細胞または細胞集団のトランスクリプトームのすべてまたは一部を表すことができる。
【0028】
本書において、「ライゲーション」もしくは「ライゲートする」またはその文法上の変化形は、2つのヌクレオチド鎖をホスホジエステル結合によって連結することをさしうる。そのような反応は、リガーゼによって触媒されうる。リガーゼとは、この反応をATPまたは同様のトリホスフェートの加水分解を伴って触媒する酵素群をさす。
【0029】
本書において、核酸の配列に関して用いられる「誘導された」という表現は、その核酸を得たソースについて述べるものでありうる。例えば、配列を、サンプル中のRNA分子から誘導された核酸から得ることができる。さらに、ある特定のソースまたは源から誘導された核酸分子は、それとは別に、続いてコピーまたは増幅させうる。得られるコピーまたはアンプリコンの配列を、前記ソースまたは源から誘導されたもの、ということができる。
【0030】
核酸ライブラリーの作製
いくつかの態様は、核酸ライブラリーの作製方法を含む。そのような態様のいくつかは、
RNAおよびDNAを含む複数のポリヌクレオチドを含むサンプルを入手すること;
該複数のポリヌクレオチドを複数のプライマーとハイブリダイズすること;および
該ハイブリダイズしたプライマーを逆転写酵素を用いて伸長すること
を含みうる。そのような態様のいくつかにおいて、プライマーはタグを含む。いくつか態様は、該伸長したプライマーおよび該DNAから核酸ライブラリーを形成することをも含む。
【0031】
いくつかの態様において、サンプルは、セルフリーの核酸、例えばRNAおよびDNAを含みうる。本書において核酸に関していう「セルフリー」とは、インビボで細胞から放出されている核酸のことをさしうる。該核酸放出は、壊死またはアポトーシスのような自然のプロセスでありうる。セルフリー核酸は、血液またはその画分、例えば血清から得ることができる。セルフリー核酸は、他の体液または体組織から得ることもでき、その例には、間質液、リンパ、脳脊髄液、唾液、尿、乳汁、汗および涙が包含される。
【0032】
いくつかの態様は、プライマーの使用を含む。本書において「プライマー」とは、サンプル中に存在する標的または鋳型ポリヌクレオチドにハイブリダイズすることによって結合し、その後伸長を促進して、該標的または鋳型に相補的なポリヌクレオチドを形成する、通常は遊離3’-OH基を有する、短いポリヌクレオチドをさしうる。プライマーは、5~1000ヌクレオチドまたはそれ以上の範囲のポリヌクレオチドを含みうる。いくつかの態様において、プライマーは、少なくとも4ヌクレオチド、5ヌクレオチド、10ヌクレオチド、15ヌクレオチド、20ヌクレオチド、25ヌクレオチド、30ヌクレオチド、35ヌクレオチド、40ヌクレオチド、45ヌクレオチド、50ヌクレオチド、60ヌクレオチド、70ヌクレオチド、80ヌクレオチド、90ヌクレオチド、100ヌクレオチドの長さ、または前記長さの任意の2つの範囲内の長さを有する。
【0033】
プライマーは、ランダムヌクレオチド配列を含みうる。本書において「ランダムヌクレオチド配列」とは、ポリヌクレオチド集団において、他のランダムヌクレオチド配列と組み合わされたとき、ある与えられた長さのヌクレオチドの、すべてまたは実質的にすべての可能なヌクレオチド組み合わせを表す、さまざまな配列のヌクレオチドをさしうる。例えば、ある与えられた位置において存在することが可能なヌクレオチドは4種であるから、2個のランダムヌクレオチドの長さの配列は16の可能な組み合わせを有し、3個のランダムヌクレオチドの長さの配列は64の可能な組み合わせを有し、4個のランダムヌクレオチドの長さの配列は265の可能な組み合わせを有する。ランダムヌクレオチド配列は、サンプル中の任意の標的ポリヌクレオチドにハイブリダイズする可能性を有する。プライマーにおけるランダム配列は、複数の連続したヌクレオチドを含むことができ、少なくとも4ヌクレオチド、5ヌクレオチド、10ヌクレオチド、15ヌクレオチド、20ヌクレオチド、25ヌクレオチド、30ヌクレオチド、35ヌクレオチド、40ヌクレオチド、45ヌクレオチド、50ヌクレオチド、60ヌクレオチド、70ヌクレオチド、80ヌクレオチド、90ヌクレオチド、100ヌクレオチドの長さ、または前記長さの任意の2つの範囲内の長さを有することができる。いくつかの態様において、複数のプライマーは、異なるランダム配列を含むプライマーを含みうる。いくつかの態様は、複数のプライマーの使用を含む。いくつかの態様において、各プライマーは、それぞれ異なる配列を含む。いくつかの態様において、複数のプライマーは、少なくとも1000、10000、100000、1000000、10000000、100000000の異なる配列、または前記数の任意の2つの間の範囲の数の異なる配列を含む。
【0034】
プライマーはタグを含むことができる。本書において、「タグ」とは、プライマーもしくはプローブに付加されるか、またはポリヌクレオチド内部に組み込まれるヌクレオチド配列で、方法またはプロセスの後続の反応またはステップにおいて該付加されたプライマー、プローブまたはポリヌクレオチドの同定、追跡または単離を可能にするものをさす。タグのヌクレオチド組成はまた、相補的なプローブ、例えばアレイ表面のような固体支持体上のプローブへのハイブリダイゼーション、または標的配列の選択的増幅のために用いられる相補的プライマーへのハイブリダイゼーションを可能にするように選択することができる。タグは、複数の連続するヌクレオチドを含むことができ、少なくとも3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、10ヌクレオチド、15ヌクレオチド、20ヌクレオチド、25ヌクレオチド、30ヌクレオチド、35ヌクレオチド、40ヌクレオチド、45ヌクレオチド、50ヌクレオチドの長さ、または前記長さの任意の2つの間の範囲内の長さを有しうる。タグは、プライマーの5’末端における配列、プライマーの3’末端における配列、またはプライマー内部における配列であってよい。いくつかの態様において、タグは、プライマーの3’末端における配列である。いくつかの態様において、複数のプライマーがそれぞれ異なるタグを有することができる。いくつかの態様において、複数のプライマーのそれぞれが同じタグを有することができる。
【0035】
いくつかの態様は、逆転写酵素の使用を含む。逆転写酵素は、RNA依存性DNAポリメラーゼを包含する。逆転写酵素の例には、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、モロニーマウス白血病ウイルス(MMLV)逆転写酵素、ヒト免疫ウイルス(HIV)逆転写酵素、ウマ伝染性貧血ウイルス(EIAV)逆転写酵素、ラウス随伴ウイルス-2(RAV2)逆転写酵素、C. hydrogenoformans DNAポリメラーゼ、T. thermus DNAポリメラーゼ、T. flavus DNAポリメラーゼ、およびそれらの機能性バリアントが包含される。いくつかの態様において、逆転写酵素は、DNA依存性ポリメラーゼ活性を欠くことができる。いくつかの態様において、逆転写酵素は、DNAの存在下または不存在下にRNAにハイブリダイズしたプライマーを伸長させることができる。RNAにハイブリダイズしたプライマーの伸長によって、一本鎖cDNAが生成する。したがって、核酸サンプル中のRNAからcDNAライブラリーを形成することができる。また、いくつかの態様は、伸長したプライマーから、DNA依存性DNAポリメラーゼおよびヌクレオチドを用いて、二本鎖cDNAを生成することを含む。
【0036】
いくつかの態様は、タグを含む伸長されたプライマーを含む標的核酸から核酸ライブラリーを形成することを含む。そのような態様のいくつかにおいて、標的核酸は、タグを含む伸長されたプライマー、およびDNA、例えばセルフリーDNAを含むこともできる。標的核酸から核酸ライブラリーを形成する方法の一例は、タグメンテーションを含む。本書において、「タグメンテーション」とは、標的核酸にトランスポゾンを挿入して、トランスポゾンが、標的核酸を切断して、切断された標的核酸の末端にアダプター配列を付加するようにすることをさしうる。タグメンテーション方法の例が、米国特許第9115396号、同第9080211号、同第9040256号、米国特許出願公開第2014/0194324号に開示されており、これら各文献の全体を引用により本書の一部とする。方法の他の一例は、リガーゼによる、標的核酸の末端へのアダプター配列のライゲーションを含む。ライゲーションに基づくライブラリー作製方法は、しばしば、シーケンシングプライマー部位、増幅プライマー部位、および/またはインデックス配列を初期ライゲーションステップで組み込むことができるアダプター設計を利用し、しばしば、シングルリードシーケンシング、ペアエンドシーケンシング、およびマルチプレックスシーケンシングのためのサンプルの調製に使用されうる。例えば、標的核酸は、フィルイン反応、エキソヌクレアーゼ反応またはそれらの組み合わせによって末端修復されうる。いくつかの態様において、得られる修復された平滑末端核酸を、次いで、アダプター/プライマーの3’末端上の1ヌクレオチドのオーバーハングに相補的な1ヌクレオチドで伸長させることができる。この伸長/オーバーハングヌクレオチドには、任意のヌクレオチドを使用することができる。いくつかの態様において、核酸ライブラリー作製は、アダプターオリゴヌクレオチドをライゲートすることを含む。アダプターオリゴヌクレオチドは、しばしば、フローセルアンカーに相補的であり、しばしば、核酸ライブラリーを固体支持体に固定するために利用される。いくつかの態様において、アダプターオリゴヌクレオチドは、アイデンティファイアー(identifier)、1つまたはそれ以上のシーケンシングプライマーハイブリダイゼーション部位、例えばユニバーサルシーケンシングプライマー、シングルエンドシーケンシングプライマー、ペアエンドシーケンシングプライマー、マルチプレックスシーケンシングプライマー等に相補的な配列、またはそれらの組み合わせを含み、例えばアダプター/シーケンシング、アダプター/アイデンティファイアー、アダプター/アイデンティファイアー/シーケンシングである。
【0037】
いくつかの態様において、核酸ライブラリーまたはその一部を、アダプター配列中の増幅プライマー部位を用いて増幅することができる。核酸ライブラリーの増幅を、PCRに基づく方法、または等温増幅方法によって行うことができる。異なる種類の増幅方法の例には、以下のものが包含される:マルチプレックスPCR、デジタルPCR(dPCR)、ダイヤルアウト(dial-out)PCR、アレル特異的PCR、非対称PCR、ヘリカーゼ依存増幅、ホットスタートPCR、ライゲーション仲介PCR、ミニプライマー(miniprimer)PCR、マルチプレックスライゲーション依存プローブ増幅(MLPA)、ネストPCR、定量PCR(qPCR)、逆転写PCR(RT-PCR)、固相PCR、リガーゼ連鎖反応、鎖置換増幅(SDA)、転写仲介増幅(TMA)、および核酸配列ベース増幅(NASBA)(米国特許第8003354号に記載され、該文献の全体を引用により本書の一部とする)。いくつかの態様において、増幅を、固相に結合された増幅プライマーを用いて行うことができる。表面に結合された2種類のプライマーを用いるフォーマットは、しばしば、ブリッジ増幅と称されるが、これは、コピー元の鋳型配列に隣接する2種類の表面結合プライマーの間に二本鎖アンプリコンがブリッジ様構造を形成するからである。ブリッジ増幅に用いることができる試薬および条件の例が、米国特許第5641658号、米国特許出願公開第2002/0055100号、米国特許第7115400号、米国特許出願公開第2004/0096853号、米国特許出願公開第2004/0002090号、米国特許出願公開第2007/0128624号、および米国特許出願公開第2008/0009420号に記載されており、これら各文献を引用により本書の一部とする。他の核酸増幅方法としては、オリゴヌクレオチド伸長およびライゲーション、ローリングサークル増幅(RCA)およびオリゴヌクレオチドライゲーションアッセイ(OLA)を挙げることができる。例えば、米国特許第7582420号、同第5185243号、同第5679524号、および同第5573907号を参照されたい。これら各文献の全体を引用により本書の一部とする。関心のある核酸を増幅するために特異的に設計することができるプライマー伸長およびライゲーション用のプライマーの例が、米国特許第7582420号および同第7611869号に記載されており、これら各文献の全体を引用により本書の一部とする。等温増幅方法の例は、Dean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002)に開示される多置換増幅(MDA)、および米国特許第6214587号に開示される等温鎖置換核酸増幅を包含し、これら各文献の全体を引用により本書の一部とする。増幅反応、条件およびコンポーネントの詳細な説明は、米国特許第7670810号の開示においてもなされており、該文献の全体を引用により本書の一部とする。
【0038】
いくつかの態様は、核酸をシーケンスすることを含みうる。シーケンシング技術の例には、1塩基合成(SBS)が包含される。SBSにおいては、鋳型核酸に沿った核酸プライマーの伸長をモニターすることにより、鋳型のヌクレオチドの配列を決定する。基本となる化学プロセスは、重合でありうる。ある特定のポリメラーゼをベースとするSBSの態様においては、鋳型に依存する様式でプライマーを伸長するように、蛍光標識したヌクレオチドを付加し、プライマーに付加されたヌクレオチドの順序および種類を検出することで、鋳型の配列を決定することができる。1つまたはそれ以上の増幅核酸を、SBS、または複数のサイクルで試薬を繰り返しデリバーする他の検出技術に付すことができる。例えば、最初のSBSサイクルを開始するために、1つまたはそれ以上の標識ヌクレオチド、DNAポリメラーゼ等を、1つまたはそれ以上の増幅核酸分子を含むヒドロゲルビーズ中に、または該ヒドロゲルビーズを通して、流すことができる。プライマー伸長によって標識ヌクレオチドの取り込みが起こる部位を検出することができる。場合により、該ヌクレオチドは、一旦ヌクレオチドがプライマーに付加されたら、さらなるプライマー伸長を停止する、可逆的停止特性をさらに含むことができる。例えば、可逆的ターミネーター部分を有するヌクレオチドアナログをプライマーに付加することによって、停止解除剤がデリバーされて該部分が除去されるまで、さらなる伸長が起こり得ないようにすることができる。したがって、可逆的停止を用いる態様において、検出を行う前または検出を行った後に、停止解除試薬をフローセルにデリバーすることができる。さまざまなデリバリーの、ステップとステップの間に、洗浄を行うことができる。そして、プライマーをn個のヌクレオチド分伸長するために、上記サイクルをn回繰り返し、それによって長さnの配列を検出することができる。
【0039】
SBSのいくつかの態様は、ヌクレオチドが伸長産物に取り込まれる際に遊離するプロトンを検出することを含む。例えば、遊離プロトンの検出に基づくシーケンシングには、市販の電気的検出器と関連技術を利用することができる。そのようなシーケンシングシステムの例には、パイロシーケンシング、例えばRocheの子会社454 Life Sciencesからの市販プラットフォーム;γ-ホスフェート標識ヌクレオチドを用いるシーケンシング、例えばPacific Biosciencesからの市販プラットフォーム;およびプロトン検出によるシーケンシング、例えばLife Technologiesの子会社Ion Torrentからの市販プラットフォームがある。
【0040】
パイロシーケンシングは、生成する核酸鎖に特定のヌクレオチドが取り込まれる際の、無機ピロリン酸(PPi)の放出を検出する。パイロシーケンシングにおいて、放出されるPPiは、検出が可能となるように、ATPスルフリラーゼによりアデノシン三リン酸(ATP)に直ちに変換され、生成したATPのレベルは、ルシフェラーゼにより産生される光子によって検出することができる。すなわち、シーケンシング反応を、発光検出システムによってモニターすることができる。パイロシーケンシングには、蛍光に基づく検出システムに用いられるような励起光源は必要ない。
【0041】
いくつかの態様は、DNAポリメラーゼ活性のリアルタイムモニタリングを伴う方法を利用することができる。例えば、ヌクレオチドの取り込みを、フルオロフォアを含むポリメラーゼとγ-ホスフェート標識ヌクレオチドとの間の蛍光共鳴エネルギー移動(FRET)相互作用によって、またはゼロモード導波路(ZMW)を用いて検出することができる。別の有用なシーケンシング技術は、ナノポアシーケンシングである。ナノポアのいくつかの態様において、標的核酸、または標的核酸から取り出された個々のヌクレオチドが、ナノポアを通過する。核酸またはヌクレオチドがナノポアを通過する際のポアの電気伝導度の変化を測定することによって、各ヌクレオチド種を同定することができる。
【0042】
いくつかの態様は、さまざまな試薬を用いる、核酸の単離、増幅およびシーケンシングを含むことができる。そのような試薬の例には、例えばリゾチーム;プロテイナーゼK;ランダムヘキサマー;ポリメラーゼ、例えばΦ29DNAポリメラーゼ、Taqポリメラーゼ、Bsuポリメラーゼ;トランスポザーゼ、例えばTn5;プライマー、例えばP5およびP7アダプター配列;リガーゼ;デオキシヌクレオチド三リン酸;緩衝剤;または二価陽イオン、例えばマグネシウム陽イオンが包含される。アダプターは、シーケンシングプライマー部位、増幅プライマー部位、およびインデックスを含むことができる。本書において、「インデックス」は、核酸にタグを付けるため、および/または核酸のソースを同定するための、分子アイデンティファイアーおよび/またはバーコードとして使用することができるヌクレオチドの配列を包含しうる。いくつかの態様において、インデックスは、単一の核酸または核酸の亜集団を同定するために使用されうる。
【0043】
図1は、核酸ライブラリー作製方法の例示態様を示す。
図1に示すように、セルフリーRNAおよびセルフリーDNAを含むサンプルを用意する。該RNAに、ランダムヘキサマー配列およびタグ配列を含むプライマーをハイブリダイズする。ハイブリダイズしたプライマーを逆転写酵素を用いて伸長して、第1のcDNA鎖を生成する。第1のcDNA鎖から第2のcDNA鎖を合成して、二本鎖cDNAを生成することができる。前記ステップは、前記セルフリーDNAの存在下に行うことができる。該二本鎖cDNAおよび該セルフリーDNAから、核酸ライブラリーを形成することができる。ステップは、核酸分子の末端修復、核酸分子のAテーリング、アダプターのライゲーション、ライブラリーのPCRによる増幅、およびライブラリーのシーケンシングを含むことができる。セルフリーRNAから誘導された配列は、タグ配列を含むことによって、同定可能である。セルフリーDNAから誘導された配列は、タグ配列を欠くことによって、同定可能である。
【0044】
いくつかの態様は、核酸のサンプル中の核酸を同定することを含む。そのような態様のいくつかは、本発明の方法により核酸サンプルから作製された核酸ライブラリーから配列データを得ること、およびタグを含むポリヌクレオチド配列を同定すること、したがってRNAポリヌクレオチドから誘導された配列を同定することを含みうる。いくつかの態様は、タグを含むポリヌクレオチド配列中のバリアントを同定することをも含みうる。バリアントの例には、一塩基多型(SNP)、欠失、挿入、置換、転位、重複、および遺伝子融合が包含される。いくつかの態様は、タグを含むポリヌクレオチド配列における逆転写エラーを同定することをも含みうる。例えば、逆転写酵素は、cDNA中にエラーをもたらしうる。したがって、配列のソースの同定は、バリアントが逆転写の結果でありうるかを決定するために有用でありうる。いくつかの態様において、RNAから誘導されたポリヌクレオチド配列を、参照配列、例えばその核酸ライブラリーのDNAポリヌクレオチドの配列と比較することができる。
【0045】
キット
本発明のいくつかの態様は、キットを含む。キットは、RNAを含むサンプルから核酸ライブラリーを作製するための試薬を含みうる。そのようなキットは、逆転写酵素、および複数の、タグを含むプライマーを含みうる。キットはまた、二本鎖cDNAを合成するための試薬、例えばDNAポリメラーゼおよびヌクレオチドを含みうる。キットはまた、キナーゼ、RNアーゼ、リガーゼ、トランスポゾン、ポリメラーゼ、およびシーケンシングアダプターのような試薬を含みうる。
本発明の態様を、以下、さらに記載する:
[項1]
(a)複数のポリヌクレオチドを、複数の、タグを含むプライマーとハイブリダイズすること;ここで、該複数のポリヌクレオチドはRNAおよびDNAを含む;
(b)該ハイブリダイズしたプライマーを逆転写酵素を用いて伸長すること;および
(c)該伸長したプライマーおよび該DNAから、核酸のライブラリーを形成すること、
を含む、核酸ライブラリーを作製する方法。
[項2]
(d)前記核酸ライブラリーをシーケンスすることをさらに含む、上記項1に記載の方法。
[項3]
(e)前記タグを含むポリヌクレオチド配列を同定し、それによって、前記複数のポリヌクレオチドの前記RNAポリヌクレオチドから誘導された配列を同定することをさらに含む、上記項2に記載の方法。
[項4]
前記タグを欠くポリヌクレオチド配列を同定し、それによって、前記複数のポリヌクレオチドの前記DNAポリヌクレオチドから誘導された配列を同定することをさらに含む、上記項3に記載の方法。
[項5]
前記複数のプライマーが異なる配列を含む、上記項1~4のいずれかに記載の方法。
[項6]
各プライマーがそれぞれ異なる配列を含む、上記項1~5のいずれかに記載の方法。
[項7]
前記複数のプライマーが、10000を超える異なる配列を含む、上記項1~6のいずれかに記載の方法。
[項8]
前記複数のプライマーが、100000を超える異なる配列を含む、上記項1~7のいずれかに記載の方法。
[項9]
前記複数のプライマーがランダムヘキサマー配列を含む、上記項1~8のいずれかに記載の方法。
[項10]
前記複数のプライマーが同じタグを含む、上記項1~9のいずれかに記載の方法。
[項11]
前記逆転写酵素がDNA依存性ポリメラーゼ活性を欠く、上記項1~10のいずれかに記載の方法。
[項12]
前記逆転写酵素が、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、モロニーマウス白血病ウイルス(MMLV)逆転写酵素、ヒト免疫ウイルス(HIV)逆転写酵素、ウマ伝染性貧血ウイルス(EIAV)逆転写酵素、ラウス(Rous)随伴ウイルス-2(RAV2)逆転写酵素、C. hydrogenoformans DNAポリメラーゼ、T. thermus DNAポリメラーゼ、T. flavus DNAポリメラーゼ、およびそれらの機能性バリアントからなる群から選択される、上記項1~11のいずれかに記載の方法。
[項13]
(b)が前記DNAポリヌクレオチドの存在下に行われる、上記項1~12のいずれかに記載の方法。
[項14]
(b)が、前記伸長したプライマーから二本鎖cDNAを生成することを含む、上記項1~13のいずれかに記載の方法。
[項15]
(c)が、前記伸長したプライマーおよびDNAポリヌクレオチドを、キナーゼ、リガーゼ、トランスポゾン、ポリメラーゼおよびシーケンシングアダプターからなる群から選択される試薬と接触させることを含む、上記項1~14のいずれかに記載の方法。
[項16]
前記複数のポリヌクレオチドがセルフリー(cell-free)である、上記項1~15のいずれかに記載の方法。
[項17]
前記複数のポリヌクレオチドが、血清、間質液、リンパ、脳脊髄液、唾液、尿、乳汁、汗および涙液からなる群から選択されるサンプルから得られる、上記項16に記載の方法。
[項18]
(a)複数のポリヌクレオチドを複数のプライマーとハイブリダイズすること;ここで、該複数のポリヌクレオチドはRNAおよびDNAを含む;
(b)該ハイブリダイズしたプライマーを逆転写酵素を用いて伸長すること;および
(c)該伸長したプライマーおよび該DNAから、核酸のライブラリーを形成すること、
を含む、核酸ライブラリーを作製する方法。
[項19]
前記複数のポリヌクレオチドがセルフリーである、上記項18に記載の方法。
[項20]
前記複数のポリヌクレオチドが、血清、間質液、リンパ、脳脊髄液、唾液、尿、乳汁、汗および涙液からなる群から選択されるサンプルから得られる、上記項18または19に記載の方法。
[項21]
前記複数のプライマーが異なる配列を含む、上記項18~20のいずれかに記載の方法。
[項22]
各プライマーがそれぞれ異なる配列を含む、上記項18~21のいずれかに記載の方法。
[項23]
前記複数のプライマーが、10000を超える異なる配列を含む、上記項18~22のいずれかに記載の方法。
[項24]
前記複数のプライマーが、100000を超える異なる配列を含む、上記項18~23のいずれかに記載の方法。
[項25]
前記複数のプライマーがランダムヘキサマー配列を含む、上記項18~24のいずれかに記載の方法。
[項26]
前記逆転写酵素がDNA依存性ポリメラーゼ活性を欠く、上記項18~25のいずれかに記載の方法。
[項27]
前記逆転写酵素が、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、モロニーマウス白血病ウイルス(MMLV)逆転写酵素、ヒト免疫ウイルス(HIV)逆転写酵素、ウマ伝染性貧血ウイルス(EIAV)逆転写酵素、ラウス随伴ウイルス-2(RAV2)逆転写酵素、C. hydrogenoformans DNAポリメラーゼ、T. thermus DNAポリメラーゼ、T. flavus DNAポリメラーゼ、およびそれらの機能性バリアントからなる群から選択される、上記項18~26のいずれかに記載の方法。
[項28]
(b)が前記DNAポリヌクレオチドの存在下に行われる、上記項18~27のいずれかに記載の方法。
[項29]
(b)が、前記伸長したプライマーから二本鎖cDNAを生成することを含む、上記項18~28のいずれかに記載の方法。
[項30]
(c)が、前記伸長したプライマーおよびDNAポリヌクレオチドを、キナーゼ、リガーゼ、トランスポゾン、ポリメラーゼおよびシーケンシングアダプターからなる群から選択される試薬と接触させることを含む、上記項18~29のいずれかに記載の方法。
[項31]
(i)上記項1~30のいずれかに記載の方法によって核酸サンプルから作製された核酸ライブラリーから、配列データを得ること;および
(ii)タグを含むポリヌクレオチド配列を同定し、それによって、前記複数のポリヌクレオチドのRNAポリヌクレオチドから誘導された配列を同定すること、
を含む、核酸サンプル中の核酸を同定する方法。
[項32]
(iii)前記タグを含むポリヌクレオチド配列におけるバリアントを同定することをさらに含む、上記項31に記載の方法。
[項33]
前記バリアントが、一塩基多型(SNP)、欠失、挿入、置換、重複、転位、および遺伝子融合からなる群から選択される、上記項32に記載の方法。
[項34]
前記タグを含むポリヌクレオチド配列における逆転写エラーを同定することさらに含む、上記項31~33のいずれかに記載の方法。
[項35]
前記タグを含むポリヌクレオチドを参照配列と比較することをさらに含む、上記項31~34のいずれかに記載の方法。
[項36]
前記参照配列が、前記核酸ライブラリーのDNAポリヌクレオチドから誘導される、上記項35に記載の方法。
[項37]
前記サンプルがセルフリー核酸を含む、上記項31~36のいずれかに記載の方法。
[項38]
前記RNAポリヌクレオチドが、mRNA、tRNA、リボソームRNA、ノンコーディングRNA、piRNA、siRNA、lncRNA、shRNA、snRNA、miRNA、snoRNA、ウイルスRNA、細菌RNA、およびリボザイムからなる群から選択されるRNAである、上記項31~37のいずれかに記載の方法。
[項39]
逆転写酵素;および
複数の、タグを含むプライマー;ここで各プライマーは異なる、
を含む、核酸ライブラリーを作製するためのキット。
[項40]
前記複数のプライマーが同じタグを含む、上記項39に記載のキット。
[項41]
キナーゼ、RNアーゼ、リガーゼ、トランスポゾン、ポリメラーゼおよびシーケンシングアダプターからなる群から選択される成分をさらに含む、上記項39または40に記載のキット。
[項42]
前記逆転写酵素がDNA依存性ポリメラーゼ活性を欠く、上記項39~41のいずれかに記載のキット。
[項43]
前記逆転写酵素が、トリ骨髄芽球症ウイルス(AMV)逆転写酵素、モロニーマウス白血病ウイルス(MMLV)逆転写酵素、ヒト免疫ウイルス(HIV)逆転写酵素、ウマ伝染性貧血ウイルス(EIAV)逆転写酵素、ラウス随伴ウイルス-2(RAV2)逆転写酵素、C. hydrogenoformans DNAポリメラーゼ、T. thermus DNAポリメラーゼ、T. flavus DNAポリメラーゼ、およびそれらの機能性バリアントからなる群から選択される、上記項39~42のいずれかに記載のキット。
【実施例1】
【0046】
血清中のRNA/DNA分子
ドロップレットデジタルPCR(ddPCR)を用いて、癌患者および対照対象からの血清において、ホスファチジルイノシトール-4,5-ビスホスフェート3-キナーゼ触媒サブユニットα(PIK3CA)およびB-Raf(BRAF)をコードする核酸の濃度を測定した。増幅に先立ち、核酸を、逆転写ステップを行うか、または行わないで処理して、DNAを含むか、またはDNAおよび逆転写されたRNA(cDNA)を含むサンプルを調製した。PIK3CA解析のために、PIK3CAのエクソン20の79ntアンプリコン(dHsaCP2506262)をFAMで標識したものを用いた(BIO-RAD, Hercules, CA)。BRAF解析のためには、HEXで標識したBRAFの66ntエクソンアンプリコン(dHsaCP2500366)を用いた(BIO-RAD, Hercules, CA)。
【0047】
PIK3CAおよびBRAFエクソンをコードするDNA分子の数、ならびにPIK3CAおよびBRAFエクソンをコードするDNAおよびRNA両分子の数について、初期血清中濃度を測定した。
図2は、癌患者(癌1、2および3)および対照対象(正常1、2および3)からの血清中の、PIK3CAおよびBRAFをコードする核酸の濃度を示すグラフである。初期エクソン濃度を算出するのに、逆転写ステップを行って処理された核酸サンプルは、「DNA+RNA」として示す。初期エクソン濃度を算出するのに、逆転写ステップを行わずに処理された核酸サンプルは、「DNA」として示す。
【0048】
図2に示す結果は、サンプル中でBRAFのRNAレベルがPIK3CAのレベルよりも顕著に高いこと、および、DNA:RNAの相対濃度が個体間で異なること示している。
【実施例2】
【0049】
RTステップを行って作製したライブラリーを用いる全ゲノムシーケンシング
DNAおよびRNAを含むセルフリー核酸サンプルから、逆転写ステップを行う場合と、行わない場合とで、核酸ライブラリーを作製した。ライブラリーを、Truseq RNA Access ライブラリーキット(Illumina, San Diego, CA)を使用して、濃縮を行わずに作製した。ライブラリーをシーケンスし、配列を全トランスクリプトームに対してアラインした。
図3は、既知の遺伝子とアラインされた配列の数は、逆転写ステップを行って作製されたライブラリーからの配列(RT配列)では、逆転写ステップを行わずに作製されたライブラリーからの配列(mock RT配列)と比較して、有意に多かったことを示している。さらに、エクソン、例えばGNAQ遺伝子のエクソン4および5ならびにLINC00152ノンコーディング遺伝子のエクソンとアラインされた配列の数は、RT配列ではmock RT配列と比較して有意に多かった(データを示さず)。
【実施例3】
【0050】
RTステップを行って作製されたライブラリーを用いるターゲットシーケンシング
癌患者からのDNAおよびRNAを含むセルフリー核酸サンプルから、逆転写ステップを行う場合と、行わない場合とで、核酸ライブラリーを作成した。ライブラリーを、Truseq RNA Access ライブラリーキット(Illumina, San Diego, CA)を使用して作製し、非小細胞肺癌(NSCLC)V1パネルから設計されたプローブを用いて濃縮を行った。配列を、該NSCLC V1パネルに含まれる標的遺伝子に対してアラインした。
図4は、逆転写ステップを行った方法(RT)と逆転写ステップを行わなかった方法(mock RT)とで作製されたライブラリーの、該NSCLC V1パネルの試験された特定の遺伝子領域のカバレッジの比を示すグラフである。
図4は、該NSCLC V1パネルの少なくとも12の遺伝子のカバレッジが、RT配列においてはmock RT配列の2倍を超えたことを示している。少なくとも12の遺伝子の検出感度が、ライブラリー作製に逆転写を含めた場合に有意に高められた。
【0051】
シーケンシングデータをさらに、BRAF遺伝子バリアント、およびCD44-FGFR2遺伝子融合バリアントについて解析した。各バリアントについての解析結果をそれぞれ表1および表2に示す。両バリアントについて、検出感度は、逆転写ステップを行って作製されたライブラリーからの解析されたRT配列において、逆転写ステップを行わずに作製されたライブラリーからの解析されたmock RT配列と比較して有意に高かった。
【表1】
【表2】
【実施例4】
【0052】
RTステップを行って作製されたライブラリーにおいてのみ検出された変異
15名の癌患者由来のDNAおよびRNAを含むセルフリー核酸サンプルから、逆転写ステップを行う場合と行わない場合とで、核酸ライブラリーを作製した。ライブラリーを、Truseq RNA Access ライブラリーキット(Illumina, San Diego, CA)を使用して作製し、NSCLC V1パネルから設計されたプローブを用いて濃縮を行った。ライブラリーを、ターゲットシーケンシングによってシーケンスし、配列を標的遺伝子パネルに対してアラインした。
図5は、逆転写ステップを行って作製されたライブラリーにおいて高められた頻度で見られた変異の数を示すグラフである。
【実施例5】
【0053】
RNAから誘導されたcDNAのみにタグを付けたライブラリーの作製
DNAおよびRNAを含むセルフリー核酸サンプルから、タグ付けしたランダムヘキサマーの存在下、および逆転写酵素の存在下または不存在下に、核酸ライブラリーを作製した。ライブラリーを、Truseq RNA Access ライブラリーキット(Illumina, San Diego, CA)を使用して作製し、NSCLC V1パネルから設計されたプローブを用いて濃縮を行った。ライブラリーをシーケンスし、各ライブラリーについて、タグ付けされた配列のリードの数を調べた。
図6は、タグ付けされたランダムヘキサマーを用い、逆転写酵素を用いるか(A)、または逆転写酵素を用いずに(B)作製されたライブラリーからのリードの数を示すグラフである。
図6は、逆転写酵素を用いて作製されたライブラリーにおいて、タグ付けされた配列が存在し、逆転写酵素を用いずに作製されたライブラリーにおいては、タグ付けされた配列が僅かなバックグラウンドレベルで検出されたことを示している。このことは、RNAから誘導されるcDNAの配列が、タグによって容易に同定可能であり、タグ付けされていない配列から識別可能であることを示している。
【0054】
本書において、用語「を含む」は、「を包含する」、「を含有する」または「によって特徴付けられる」と同義であり、包括的またはオープンエンドであって、記載されていない更なる要素または方法ステップを排除するものではない。
【0055】
上記説明は、本発明のいくつかの方法および材料を開示するものである。本発明には、該方法および材料における改変、ならびに該構成方法および資材における変更が可能である。そのような改変は、本開示の考慮、または本書に開示される発明の実施によって、当業者に明らかとなりうる。したがって、本発明は、本書に開示される特定の態様に限定されることを意図するものではなく、本発明は、本発明の真の範囲および精神の範囲内のいずれの改変および変更をも包含する。
【0056】
公開された、および未公開の、出願、特許、および参考文献を包含するがそれに限定されない、本書において引用される参照物はいずれも、その全体が引用により本書に組み込まれ、本書の一部とされるものとする。引用により組み込まれる刊行物および特許または特許出願が、本明細書に含まれる開示と矛盾する限りにおいて、そのような矛盾材料について本明細書が優先し、および/または優位となることを意図する。