(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-25
(45)【発行日】2024-10-03
(54)【発明の名称】サンプルにおいて生きている微生物と死んでいる微生物とを区別するための方法
(51)【国際特許分類】
C12Q 1/04 20060101AFI20240926BHJP
C12Q 1/6869 20180101ALI20240926BHJP
【FI】
C12Q1/04
C12Q1/6869 Z
(21)【出願番号】P 2020570854
(86)(22)【出願日】2019-06-20
(86)【国際出願番号】 EP2019066374
(87)【国際公開番号】W WO2019243517
(87)【国際公開日】2019-12-26
【審査請求日】2022-05-26
(32)【優先日】2018-06-20
(33)【優先権主張国・地域又は機関】EP
(32)【優先日】2019-04-03
(33)【優先権主張国・地域又は機関】EP
(73)【特許権者】
【識別番号】518238193
【氏名又は名称】パスクエスト
(74)【代理人】
【識別番号】100114775
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100208580
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100191086
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】エロイト,マーク
(72)【発明者】
【氏名】ブールドレー,パスカル
(72)【発明者】
【氏名】クリュベイエ,ステファン
【審査官】市島 洋介
(56)【参考文献】
【文献】国際公開第2004/101825(WO,A1)
【文献】Eur. J. Clin. Microbiol. Infect. Dis.,2010年,Vol. 29,pp.823-834
【文献】J. Oral Pathol. Med.,2018年,Vol. 47,pp.18-24
【文献】J. Virol.,2010年,Vol. 84, No. 1,pp.666-670
【文献】Nat. Methods,2017年,Vol. 14,pp.1198-1204
【文献】Nat. Methods,2018年,Vol. 15, No. 3,pp.171-172
【文献】Matsushima W. et al,SLAM-ITseq: Sequencing cell type-specific transcriptomes without cell sorting,bioRxiv,2017年,doi: https://doi.org/10.1101/235093
【文献】PLOS Pathog.,2012年,Vol. 8, Issue 9, e1002908
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00-3/00
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
サンプルにおいて生きている微生物と死んでいる微生物とを区別するためのin vitroの方法であって、前記サンプルにおいて転写的に活性な微生物の核酸配列と転写的に不活性な微生物の核酸配列を区別することを含み、前記方法が、
(a)前記サンプルから抽出されたRNAのセットをシーケンシングすることによって、配列リードのセットを得るステップであって、前記RNAのセットは、4-チオウリジンの存在下で前記サンプルを培養することによって、さらには、抽出されたRNAを、ヌクレオチド置換を可能にする条件に供することによって、取得される、ステップと、
(b)i.配列リードまたは
そのコンティグを、微生物の核酸配列を含むデータベース上にアライメントするステップ、
ii.
前記配列リードまたは
そのコンティグ
の少なくとも1つに対してマッピングされた少なくとも1つの微生物の核酸配列のヒットを同定するステップ、および
iii.
前記データベースの微生物
の核酸配
列にマッピングされ
た配列リードか
ら、コンセンサスな微生物の核酸配列を決定するステップ
を介して微生物
の核酸配列のヒットを同定するステップと、
(c)ステップ(b)(ii)
で微生物の核酸配列のヒット
にマッピングされた前記配列リードのセットにおける置換されたヌクレオチドの数および/または比率を、ステップ(b)(iii)で決定されたコンセンサスな微生物の核酸配列と比較して決定する、ステップと、
(d)ステップ(b)(ii)
で微生物の核酸配列のヒット
にマッピングされた前記配列リードのセットにおける、チミジン(T)からシチジン(C)への置換の数および/または比率が、同じ配列リードにおける全ての他のヌクレオチドへの置換の平均の数および/または比率よりも多い場合に、前記コンセンサスな微生物の核酸配列が生きている微生物に属すると結論付ける、ステップと、
を含
み、
前記コンティグは、重複する配列リードを指す、
in vitroの方法。
【請求項2】
前記ヌクレオチド置換を可能にする条件が、RNAを化学的に修飾すること、さらに前記化学的に修飾したRNAを逆転写することを含む、請求項1に記載のin vitroの方法。
【請求項3】
前記ヌクレオチド置換を可能にする条件が、アルキル化、酸化的芳香族求核置換反応、またはオスミウム介在性形質転換により、RNAを化学的に修飾すること、さらに前記化学的に修飾したRNAを逆転写することを含む、請求項1~2のいずれか1項に記載のin vitroの方法。
【請求項4】
前記ヌクレオチド置換を可能にする条件が、アルキル化によりRNAを化学的に修飾すること、さらに前記化学的に修飾したRNAを逆転写することを含む、請求項1~3のいずれか1項に記載のin vitroの方法。
【請求項5】
前記ヌクレオチド置換を可能にする条件が、ヨードアセトアミド、ヨード酢酸、N-エチルマレイミド、および4-ビニルピリジンを含む群から選択されるアルキル化剤を使用するアルキル化を含む、請求項1~4のいずれか1項に記載のin vitroの方法。
【請求項6】
前記ヌクレオチド置換を可能にする条件が、ヨードアセトアミドを使用するアルキル化を含む、請求項1~5のいずれか1項に記載のin vitroの方法。
【請求項7】
前記RNAをシーケンシングするステップが、
(i)RNAを逆転写することにより、cDNAライブラリーを得るステップと、
(ii)前記cDNAライブラリーをシーケンシングするステップと、
を含む、請求項1~6のいずれか1項に記載のin vitroの方法。
【請求項8】
前記cDNAライブラリーのシーケンシングが、次世代シーケンシング(NGS)、ディープシーエンシング、またはカスタム配列のターゲットシーケンシングにより行われる、請求項7に記載のin vitroの方法。
【請求項9】
前記微生物が、ウイルス、細菌、古細菌、真菌、および原虫を含む群から選択される、請求項1~8のいずれか1項に記載のin vitroの方法。
【請求項10】
生きている微生
物を検出するためのin vitroの方法であって、
対象から
のサンプルについて請求項1~9のいずれか1項に記載のin vitroの方法を行うことを含み、
少なくとも1つの同定した微生物の核酸配列のヒットが生きている微生物に属することが、
前記サンプルにおいて生きている微生物が存在することを示す、
in vitroの方法。
【請求項11】
微生物感染症を罹患した対象を処置する方法における使用のための、少なくとも1つの抗菌剤を含む医薬組成物であって、前記方法が、
(a)前記対象からのサンプルを準備するステップと、
(b)前記サンプルについて請求項1~9のいずれか1項に記載のin vitroの方法を行うステップと、
(c)少なくとも1つの同定した微生物の核酸配列のヒットが生きている微生物に属する場合、前記対象が微生物感染症を有すると診断するステップと、
(d)前記対象がステップc)で微生物感染症を有すると診断された場合、前記対象に医薬組成物を投与するステップと、
を含む、医薬組成物。
【請求項12】
サンプルにおける微生物混入のリスクを評価するための方法であって、
前記サンプルについて請求項1~9のいずれか1項に記載のin vitroの方法を行うことを含み、
少なくとも1つの同定した微生物の核酸配列のヒットが生きている微生物に属することが、前記サンプルが微生物混入しているリスクがあることを示す、
方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、サンプルにおいて転写的に活性な微生物の核酸配列と転写的に不活性な微生物の核酸配列を区別することにより、サンプルにおいて生きている微生物と死んでいる微生物とを区別するための方法に関する。特に、本発明に係る方法は、RNA標識化剤の存在下で培養したサンプルでのヌクレオチド置換のレベルの比較に基づく。
【0002】
さらに本発明は、本発明に係る区別するための方法を行う、対象での微生物感染症の診断方法、およびサンプルのコンタミネーションのリスクを評価する方法に関する。
【背景技術】
【0003】
細胞においてウイルス、より一般的には微生物を検出するための特質は、診断の分野で多くの用途があり、これは、たとえば疾患をもたらす感染性病原体の同定;実験結果の解釈を条件づける生物医学的な研究;または混入された可能性のあるサンプルの安全性の評価;または生物工学的なプロセスで使用される微生物のバイアビリティに有用であることが証明されている。
【0004】
微生物に特異的な核酸配列の増幅に依存する現在の標準的な検出技術の域を越えて、潜在性ウイルスを含む活性(または複製的)な微生物と死んでいる微生物を区別することが不可能である増幅のみに基づく技術の深刻な限定を回避するための技術がいくつか出現している。生体サンプルのスクリーニングの状況下では、この区別を確立するための特性は、活性の微生物の病原体の存在が、死んでいるかおよび/または不活性の微生物、特にウイルスの存在下に関連する病原体とは異なる結果を有し得る。
【0005】
これら技術は、複製したウイルスに特異的な配列;DNAウイルスの場合はRNAの存在、一本鎖マイナス鎖RNAウイルスの場合ではマイナス鎖RNAと比較して正の化学量論、一本鎖プラス鎖RNAウイルスの場合はマイナス鎖RNA(アンチゲノム)の存在、ならびにレトロウイルスの場合ではDNAおよびプラス鎖のスプライシングされたRNAの存在の検出に基づき得る。これら技術は、たとえばRT-PCRなどの逆補体鎖の増幅または高スループットシーケンシング法でのRNAシーケンシング(RNA-seq、全トランスクリプトームショットガンシーケンシングとも呼ばれる)、特に標準的なRNA-seq技術に基づく。
【0006】
現在の技術は、依然としていくつかの限定を有する:まず第1に、現在の技術は、サンプル中の活性のウイルス粒子などの活性の微生物の存在とは無関係に存在する複製中間体などの混入しているRNAと、サンプル中のウイルスなどの複製している微生物の存在と関連しているRNAとを区別することが可能ではない。複製している二本鎖RNAウイルスの検出における当該技術の効率は、依然として例証が待たられている。一本鎖プラス鎖RNAウイルスの場合、産生される少数のマイナス鎖RNA種が、利用可能な検出技術の感受性を妨げている。一本鎖マイナス鎖RNAウイルスの場合、プラス鎖アンチゲノムと特異的な転写物との間の区別は困難であり、ウイルス種に特異的なバイオインフォマティクス解析を必要とする。
【0007】
複製しているウイルス(およびより包括的には複製している微生物)の存在と関連するRNA種の別の特徴は、これらが、潜在的に混入しているRNAとは対照的に、合成のプロセスの中(すなわちウイルスの場合は宿主細胞の中;または他の微生物の場合では、細菌、真菌、もしくは他の微生物の中に直接)おかれていることである。新生の転写物を標識および精製するためのいくつかの技術(RNA代謝標識技術とも称される)が記載されている。たとえば、4-チオウリジン(4sU)または他の種類のウリジン類縁体(BudR)の組み込みが、新生の真核生物のmRNA転写物を精製し、および/または転写ネットワークの動態を調査するために使用されている(Herzog et al., 2017. Nat Methods. 14(12):1198-1204; Tani et al., 2012. RNA Biol. 9(10):1233-8)。
【0008】
ここで、本発明者らは、代謝標識を使用して生体サンプルの細胞の中のウイルスRNA合成の検出に基づき、新規のウイルス株/種を含むウイルスに感染した細胞を検出するための方法を、設計、最適化、および検証した。さらに本発明者らは、本明細書において、この方法が、代謝標識を使用するサンプル中の微生物RNA合成の検出に基づく場合、いずれの転写的に活性な微生物の検出をも容易に実行可能にすることを示した。これらは、たとえば、ウイルス、細菌、古細菌、真菌、もしくは原生動物の感染症、または生きている微生物による混入、および死んでいる微生物のキャリーオーバーとの差別化の検出を含む。
【発明の概要】
【0009】
本発明は、サンプルにおいて生きている微生物と死んでいる微生物とを区別するためのin vitroの方法であって、前記サンプルにおいて転写的に活性な微生物の核酸配列と転写的に不活性な微生物の核酸配列を区別することを含み、前記方法は、
(a)前記サンプルから抽出されたRNAの第1のセットをシーケンシングすることによって配列リードの第1のセットを得るステップであって、前記RNAの第1のセットは、RNA標識化剤の存在下で前記サンプルを培養することによって、さらには、抽出されたRNAを、ヌクレオチド置換を可能にする条件に供することによって、取得される、ステップと、
(b)少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第1のセットにおける置換されたヌクレオチドの数を対照配列と比較するステップと、
(c)前記配列リードの第1のセットにおける前記少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードにおける置換されたヌクレオチドの数が、前記対照配列においてランダムに置換されたヌクレオチドの数よりも多い場合に、前記少なくとも1つの微生物の核酸配列のヒットが生きている微生物に属すると結論付けるステップと
を含む、方法に関する
【0010】
一実施形態では、サンプルにおいて生きている微生物と死んでいる微生物とを区別するためのin vitroの方法は、前記サンプルにおいて転写的に活性な微生物の核酸配列と転写的に不活性な微生物の核酸配列を区別することを含み、前記方法は、
(a)前記サンプルから抽出されたRNAの第1のセットをシーケンシングすることによって配列リードの第1のセットを得るステップであって、前記RNAの第1のセットは、RNA標識化剤の存在下で前記サンプルを培養することによって、さらには、抽出されたRNAを、ヌクレオチド置換を可能にする条件に供することによって、取得される、ステップと、
(b)少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第1のセットにおける置換されたヌクレオチドの数を対照配列と比較するステップと、
(c)前記配列リードの第1のセットにおける前記少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードにおける置換されたヌクレオチドの数が、前記対照配列においてランダムに置換されたヌクレオチドの数よりも多い場合に、前記少なくとも1つの微生物の核酸配列のヒットが生きている微生物に属すると結論付けるステップと
を含み、
前記対照配列は、前記少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第2のセットではなく、前記配列リードの第2のセットは、RNA標識化剤の非存在下で前記サンプルを培養することにより得られるRNAの第2のセットをシーケンシングすることにより得られる。
【0011】
一実施形態では、対照配列は、
少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第2のセットであって、前記配列リードの第2のセットが、RNA標識化剤の非存在下で前記サンプルを培養することにより得られるRNAの第2のセットをシーケンシングすることにより得られる、第2のセット、
少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第2のセットであって、前記配列リードの第2のセットが、RNA標識化剤の存在下で前記サンプルを培養することによって、ただし抽出されたRNAを、ヌクレオチド置換を可能にする条件に供することなく、得られるRNAの第2のセットをシーケンシングすることにより得られる、第2のセット、
少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第1のセットの配列リードまたはコンティグから得られるコンセンサスな微生物の核酸配列、
核酸配列のデータベースにおいて同定された最も近い微生物株で見出される同じ微生物の核酸配列のヒットに対応する配列、および/または
核酸配列のデータベースにおいて同定された同じ微生物の核酸配列のヒットに対応する類似の配列
から選択される。
【0012】
一実施形態では、対照配列は、
前記少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第2のセットであって、前記配列リードの第2のセットが、RNA標識化剤の存在下で前記サンプルを培養することによって、ただし抽出されたRNAを、ヌクレオチド置換を可能にする条件に供することなく、得られるRNAの第2のセットをシーケンシングすることにより得られる、第2のセット、
少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第1のセットの配列リードまたはコンティグから得られるコンセンサスな微生物の核酸配列、
核酸配列のデータベースにおいて同定された最も近い微生物株で見出される同じ微生物の核酸配列のヒットに対応する配列、および/または
核酸配列のデータベースにおいて同定された同じ微生物の核酸配列のヒットに対応する類似の配列
から選択される。
【0013】
一実施形態では、本発明のin vitroの方法は、
(a)前記サンプルから抽出されたRNAの第1および第2のセットをシーケンシングするステップであって、前記RNAの第1および第2のセットが、RNA標識化剤の存在下でサンプルを培養することにより標識したRNAを得ることにより得られ、
前記RNAの第1のセットが、ヌクレオチド置換を可能する条件に供される標識したRNAの第1のフラクションから得られ、前記RNAの第2のセットが、ヌクレオチド置換を可能する条件に供されない標識したRNAの第2のフラクションから得られ、これにより、配列リードの第1および第2のセットを得る、ステップと、
(b)少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第1のセットでの置換されたヌクレオチドの数を、前記少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第2のセットでの置換されたヌクレオチドの数と比較するステップと、
(c)前記配列リードの第1のセットにおける少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードでの置換されたヌクレオチドの数が、配列リードの第2のセットでの置換されたヌクレオチドの数よりも多い場合、前記少なくとも1つの微生物の核酸配列のヒットが、生きている微生物に属すると結論付けるステップと
を含む。
【0014】
一実施形態では、in vitroの方法が、細胞サンプルにおいて感染性ウイルスの核酸配列と非感染性ウイルスの核酸配列とを区別するためのものであり、
(a)前記細胞サンプルから抽出されたRNAの第1および第2のセットをシーケンシングするステップであって、前記RNAの第1のセットが、RNA標識化剤の存在下で細胞サンプルを培養することにより得られ、前記RNAの第2のセットが、RNA標識化剤の非存在下で細胞サンプルを培養することにより得られ、これにより、配列リードの第1および第2のセットを得る、ステップと、
(b)配列リードの第1のセットの少なくとも1つの配列リードに対してマッピングされた少なくとも1つのウイルスの核酸配列のヒットを同定するステップと、
(c)配列リードの第1および第2のセットにおいて少なくとも1つの同定されたウイルスの核酸配列のヒットをマッピングした配列リードでの置換されたヌクレオチドの数を比較するステップと、
(d)配列リードの第1のセットにおける少なくとも1つの同定されたウイルスの核酸配列のヒットをマッピングした配列リードでの置換されたヌクレオチドの数が、配列リードの第2のセットでの置換されたヌクレオチドの数よりも多い場合、少なくとも1つのウイルスの核酸配列のヒットが、感染性ウイルスに属すると結論付けるステップと
を含む。
【0015】
一実施形態では、サンプルにおいて生きている微生物と死んでいる微生物とを区別するためのin vitroの方法は、
(a)前記サンプルから抽出されたRNAの第1および第2のセットをシーケンシングするステップであって、前記RNAの第1のセットが、RNA標識化剤の存在下でサンプルを培養することにより得られ、前記RNAの第2のセットが、RNA標識化剤の非存在下でサンプルを培養することにより得られ、これにより、配列リードの第1および第2のセットを得る、ステップと、
(b)少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第1のセットでの置換されたヌクレオチドの数を、少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第2のセットでの置換されたヌクレオチドの数と比較するステップと、
(c)配列リードの第1のセットにおける少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードでの置換されたヌクレオチドの数が、配列リードの第2のセットにおける置換された数よりも多い場合、少なくとも1つの微生物の核酸配列のヒットが、生きている微生物に属すると結論付けるステップと
を含む。
【0016】
一実施形態では、RNAの第1のセットは、RNA標識化剤の存在下でサンプルを培養し、これにより標識化したRNAを入手し、さらに上記標識したRNAをヌクレオチド置換に供することにより得られる。
【0017】
一実施形態では、サンプルにおいて生きている微生物と死んでいる微生物とを区別するためのin vitroの方法は、
(a)前記サンプルから抽出されたRNAの第1および第2のセットをシーケンシングするステップであって、前記RNAの第1および第2のセットが、RNA標識化剤の存在下でサンプルを培養することにより標識したRNAを得ることにより得られ、
前記RNAの第1のセットが、ヌクレオチド置換に供される標識したRNAの第1のフラクションから得られ、RNAの第2のセットが、ヌクレオチド置換に供されない標識したRNAの第2のフラクションから得られ
これにより、配列リードの第1および第2のセットを得る、ステップと、
(b)少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第1のセットでの置換されたヌクレオチドの数を、少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードの第2のセットでの置換されたヌクレオチドの数と比較するステップと、
(c)配列リードの第1のセットにおける少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードでの置換されたヌクレオチドの数が、配列リードの第2のセットでの置換されたヌクレオチドの数よりも多い場合、少なくとも1つの微生物の核酸配列のヒットが生きている微生物に属すると結論付けるステップと
を含む。
【0018】
一実施形態では、RNA標識化剤は、チオール標識したRNA前駆体である
【0019】
一実施形態では、チオール標識したRNA前駆体は、4-チオウリジン、2-チオウリジン、2,4-ジチオウリジン、2-チオ-4-デオキシウリジン、5-カルベトキシ-2-チオウリジン、5-カルボキシ-2-チオウリジン、5-(n-プロピル)-2-チオウリジン、6-メチル-2-チオウリジン、および6-(n-プロピル)-2-チオウリジンを含む群から選択され、これによりチオウリジン標識したRNAを入手する。
【0020】
一実施形態では、チオール標識したRNA前駆体は、好ましくは、4-チオウリジンである。
【0021】
一実施形態では、ヌクレオチド置換は、好ましくはアルキル化、酸化的芳香族求核置換反応、またはオスミウム介在性形質転換;より好ましくはアルキル化により、RNAを化学的に修飾し、さらに前記化学的に修飾したRNAを逆転写することを含む。
【0022】
一実施形態では、RNAの第2のセットは、RNAの標識化剤の存在下で細胞サンプルを培養することにより、標識したRNAを入手し、上記標識したRNAをさらにアルキル化することにより得られる。
【0023】
一実施形態では、標識したRNAは、ヨードアセトアミド、ヨード酢酸、N-エチルマレイミド、および4-ビニルピリジンを含む群から選択されるアルキル化剤を使用してアルキル化される。
【0024】
一実施形態では、アルキル化剤は、好ましくは、ヨードアセトアミドである。
【0025】
一実施形態では、細胞サンプルから抽出されたRNAをシーケンシングするステップは、
(i)RNAを逆転写することにより、cDNAライブラリーを得るステップと、
(ii)任意選択で、前記cDNAライブラリーを増幅するステップと、
(iii)好ましくは次世代シーケンシング(NGS)、ディープシーケーシング、またはカスタム配列のターゲットシーケンシングにより、前記cDNAライブラリーをシーケンシングするステップと
を含む。
【0026】
一実施形態では、細胞サンプルから抽出されたRNAをシーケンシングするステップは
(i)総RNAを逆転写することにより、総cDNAライブラリーを得るステップと、
(ii)任意選択で、前記総cDNAライブラリーを増幅するステップと、
(iii)次世代シーケンシング(NGS)により、前記総cDNAライブラリーをシーケンシングするステップと
を含む。
【0027】
一実施形態では、RNAを逆転写するステップは、サンプルをRNA標識化剤の存在下で培養した場合、および/または標識したRNAをヌクレオチド変換に供する場合、ウリジン(U)をチミジン(T)へ変換する代わりにウリジン(U)をシチジン(C)へ変換する。
【0028】
一実施形態では、総RNAを逆転写するステップは、細胞サンプルをRNA標識化剤の存在下で培養した場合、ウリジン(U)をチミジン(T)へ変換する代わりにウリジン(U)をシチジン(C)へ変換する。
【0029】
一実施形態では、サンプルをRNA標識化剤、好ましくはチオール標識したRNA前駆体の存在下で培養した場合、および/または標識したRNAを、ヌクレオチド置換を可能にする条件に供する場合、RNAは、第1の鎖の合成においてアデニン(A)-グアノシン(G)置換、第2の鎖の合成においてチミジン(T)-シチジン(C)の置換を経る。
【0030】
一実施形態では、配列リードの第1のセットの少なくとも1つの配列リードに対してマッピングした少なくとも1つのウイルスの核酸配列のヒットを同定するステップは、
(i)任意選択で、配列リードの第1のセットをフィルタリングするステップと、
(ii)任意選択で、配列リードをコンティグにアセンブリするステップと、
(iii)ウイルスの核酸配列を含むデータベース上に配列リードまたはコンティグをアライメントするステップと、
(iv)少なくとも1つの配列リードまたはコンティグに対してマッピングした少なくとも1つのウイルスの核酸配列のヒットを同定するステップと、
(v)任意選択で、ステップ(iv)で同定されたウイルスの核酸配列のヒットに前記配列リードまたはコンティグを再度アライメントすることにより、コンセンサスなウイルスの核酸配列を決定することにより、少なくとも1つのコンセンサスなウイルスの核酸配列を同定するステップと
を含む。
【0031】
一実施形態では、少なくとも1つの微生物の核酸配列のヒットは、
(i)任意選択で、配列リードの第1および/または第2のセットをフィルタリングすること、
(ii)任意選択で、前記配列リードをコンティグにアセンブリすることと、
(iii)前記配列リードまたはコンティグを、微生物の核酸配列を含むデータベース上にアライメントすること、
(iv)少なくとも1つの配列リードまたはコンティグに対してマッピングされた少なくとも1つの微生物の核酸配列のヒットを同定すること、および
(v)任意選択で、ステップ(iv)で同定された微生物の核酸配列のヒットに前記配列リードまたはコンティグを再度アライメントすることにより、コンセンサスな微生物の核酸配列を決定すること
を介して同定され、
前記コンセンサスな微生物の核酸配列は、前記微生物の核酸配列のヒットに対応する。
【0032】
一実施形態では、少なくとも1つの微生物の核酸配列のヒットは、
前記配列リードの第1のセットにおける少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードでのT→C置換の数および/もしくは比率が、前記対照配列におけるT→C置換の数および/もしくは比率よりも多い場合、ならびに/または
前記配列リードの第1のセットにおける少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードでのT→C置換の数および/もしくは比率が、同じ配列リードでのT→A置換および/もしくはT→G置換の数および/もしくは比率よりも多い場合、
生きている微生物に属する。
【0033】
一実施形態では、少なくとも1つのウイルスの核酸配列のヒットは、配列リードの第1のセットにおける少なくとも1つの同定されたウイルスの核酸配列のヒットに対してマッピングした配列リードでのT→C置換の数が、配列リードの第2のセットにおける置換の数よりも多い場合、感染性ウイルスに属する。
【0034】
一実施形態では、少なくとも1つの微生物の核酸配列のヒットは、
前記配列リードの第1のセットにおける少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードでの第2の鎖の合成におけるT→C置換の数および/もしくは比率が、前記対照配列における第2の鎖の合成におけるT→C置換の数および/もしくは比率よりも多い場合、ならびに/または
前記配列リードの第1のセットにおける少なくとも1つの微生物の核酸配列のヒットに対してマッピングした配列リードでの第2の鎖の合成におけるT→C置換の数および/もしくは比率が、同じ配列リードにおける第2の鎖の合成におけるT→A置換および/または第2の鎖の合成におけるT→G置換の数および/もしくは比率よりも多い場合、
生きている微生物に属する
【0035】
一実施形態では、本発明に係るin vitroの方法は、
(1)(i)細胞サンプルから抽出された標識されていない総RNAをシーケンシングするステップであって、標識されていない総RNAが、RNA標識化剤の非存在下で細胞サンプルを培養することにより得られ、これにより複数の配列リードを得る、ステップと、
(ii)配列リードに対してマッピングした少なくとも1つのウイルスの核酸配列のヒットを同定するステップと、
(iii)同定された少なくとも1つのウイルスの核酸配列のヒットをマッピングした配列リードでの置換されたヌクレオチドの数を決定するステップと、
(2)(i)細胞サンプルから抽出された標識した総RNAをシーケンシングするステップであって、標識した総RNAが、標識化剤の存在下で細胞サンプルを培養することにより得られ、これにより複数の配列リードを得る、ステップと、
(ii)同定された少なくとも1つのウイルスの核酸配列のヒットをマッピングした前記配列リードでの置換されたヌクレオチドの数を決定するステップと、
(3)(1)(iii)および2(iii)で決定した置換されたヌクレオチドの数を比較するステップと、
(4)2(ii)で決定した置換されたヌクレオチドの数が(1)(iii)で決定した置換されたヌクレオチドの数より多い場合、ウイルスの核酸配列のヒットが感染性ウイルスに属すると結論付けるステップと
を含む。
【0036】
一実施形態では、微生物は、ウイルス、細菌、古細菌、真菌、および原虫を含む群から選択される。
【0037】
また本発明は、対象で微生物感染症を診断するためのin vitroの方法であって、
(a)前記対象からのサンプルを準備するステップと、
(b)前記サンプルで生きている微生物と死んでいる微生物を区別するためのin vitroの方法を行うステップと、
(c)前記少なくとも1つの同定した微生物の核酸配列のヒットが生きている微生物に属する場合、前記対象が微生物感染症を有すると診断するステップと
を含む、方法に関する。
【0038】
また本発明は、対象でウイルス感染症を診断するためのin vitroの方法であって、
(a)前記対象からの細胞サンプルを準備するステップと、
(b)前記細胞サンプルで本発明に係る細胞サンプルにおいて感染性ウイルスの核酸配列と非感染性ウイルスの核酸配列を区別するためのin vitroの方法を行うステップと、
(c)少なくとも1つの同定したウイルスの核酸配列のヒットが感染性ウイルスに属する場合、前記対象がウイルス感染症を有すると診断するステップと
を含む、方法に関する。
【0039】
また本発明は、微生物感染症を罹患した対象を処置する方法であって、
(a)前記対象からのサンプルを準備するステップと、
(b)前記サンプルで生きている微生物と死んでいる微生物を区別するためのin vitroの方法を行うステップと、
(c)前記少なくとも1つの同定した微生物の核酸配列のヒットが生きている微生物に属する場合、前記対象が微生物感染症を有すると診断するステップと、
(d)前記対象がステップc)で微生物感染症を有すると診断された場合、前記対象を処置するステップと
を含む、方法に関する。
【0040】
また本発明は、サンプルにおける微生物混入のリスクを評価するための方法であって、
(a)サンプルを準備するステップと、
(b)前記サンプルで生きている微生物と死んでいる微生物を区別するためのin vitroの方法を行うステップと、
(c)前記少なくとも1つの同定した微生物の核酸配列のヒットが生きている微生物に属する場合、前記サンプルが微生物混入しているリスクがあると結論付けるステップと
を含む、方法に関する。
【発明を実施するための形態】
【0041】
定義
本発明では、以下の用語は以下の意味を有する。
【0042】
「約(aboutまたはapproximately)」は、本明細書中使用される場合、値をどのように測定または決定するか、すなわち測定システムの限定に部分的に応じて変化する、当業者により決定される特定の値の許容可能な誤差の範囲内の値を意味し得る。たとえば、「約」は、当該分野の実務あたり1以上の標準偏差の範囲内を意味する。あるいは、ある数字に先行する「約」は、当該数字の値の±10%を意味する。あるいは、特に生体系または生体プロセスに関しては、この用語は、値の5倍以内、より好ましくは2倍以内の大きさの尺度の範囲内を意味する。特定の値が本出願および特許請求の範囲に記載されている場合、他の意味が記載されない限りは、特定の値に対する許容可能な誤差の範囲内を意味する用語「約」が想定される。
【0043】
「増幅」は、本明細書中使用される場合、所望のテンプレート配列の複数のコピー、すなわち少なくとも2つのコピーを作製するプロセスを表す。核酸を増幅させるための技術は、当業者によく知られており、特定の増幅方法およびランダムな増幅方法を含む。
【0044】
「生体サンプル」は、本明細書中使用される場合、対象から得られるか、対象から入手可能であるか、または対象に由来するいずれかのサンプルを表す。「生体サンプル」は、「固形組織サンプル」および「流体サンプル」を包有する。用語「固形組織サンプル」は、本明細書において、身体のいずれかの場所から単離された固形組織のサンプルを表す。組織サンプルは、脱凝集しておらず、大きなクラスターで現れる細胞を含む。組織サンプルの例として、限定するものではないが、生検検体または剖検検体が挙げられる。用語「流体サンプル」は、本明細書において、身体のいずれかの場所から単離された流体のサンプルを表す。流体サンプルの例として、限定するものではないが、血清、血漿、全血、尿、唾液、母乳、涙、汗、滑液、脳脊髄液、リンパ液、痰、粘液、骨盤液、関節液、体腔洗浄液(body cavity washes)、眼の擦過、皮膚擦過、頬側スワブ、膣スワブ、パップスメア、直腸スワブ、吸引液、精液、膣液、腹水、および羊水が挙げられる。好ましい実施形態では、「生体サンプル」は、細胞サンプル、すなわち少なくとも1つの細胞を含む本明細書中記載されるいずれかの生体サンプルである。
【0045】
「cDNAライブラリー」は、本明細書中使用される場合、mRNAから逆転写された相補性DNAから構成されるライブラリーを表す。
【0046】
「コンティグ」は、本明細書中使用される場合、重複する配列リードを表す。通常、コンティグは、次世代シーケンシングにより作製される小さなDNAフラグメントの再アセンブリからもたらされる連続的な核酸配列(配列リード)である。実際に、アセンブリソフトウェアが、重複する配列リードの対を検索する。任意選択で、アセンブリソフトウェアが、「アライメントおよび確認」を行うために核酸またはアミノ酸のデータベースにアクセスし、これにより配列リードのアセンブリを検証することができる。重複する配列リードの対から配列をアセンブリすることは、シーケンスしたDNAのより長い連続したリード(コンティグ)をもたらす。このプロセスを複数回反復することにより、最初に短い配列リードの対を用いて、次に以前のアセンブリの結果である次第により長い対を使用することにより、より長いコンティグが決定され得る。
【0047】
「ディープシーケンシング」は、本明細書中使用される場合、各塩基を、独立した核酸分子から複数回読み取ることを可能にし(たとえば多数のテンプレート分子が配列の長さに対してシーケンスされる)、同時に数千の分子のシーケンシングを可能にすることにより、核酸分子の複合体のプールを特徴付け、配列の正確性を増大させることを可能にする深度での核酸シーケンシングを表す。RNA-Seqとしても知られているトランスクリプトームのディープシーケンシングは、特定のサンプルにおいていずれかの特定の時間に存在する含有されているRNA分子種の配列および頻度の両方を提供する。
【0048】
「期待値」または「e値」は、本明細書中使用される場合、特定の大きさのデータベース上で配列リードまたはコンティグをアライメントする際に「偶然」見ることが予測され得る、配列ヒットの数を説明するパラメータを表す。e値は、一致のスコアが増加するにつれて指数関数的に減少する。本質的に、e値は、ランダムなバックグラウンドノイズを説明する。たとえば、ヒットに割り当てられた1のe値は、現在の大きさのデータベースにおいて、偶然単純に同様のスコアで1つの一致をみることが予測され得ることを意味すると解釈され得る。e値が低いかまたは0に近い場合、一致はより「有意」である。
【0049】
「生きている微生物」は、本明細書中使用される場合、転写的に活性である、すなわち、それ自体でRNAを合成できるか(たとえば細菌、古細菌、真菌、もしくは原虫の場合)、または宿主細胞に感染した後にRNAを合成できる(たとえばウイルスの場合)のいずれかの微生物を表す。生きている微生物は、潜在性の微生物、すなわち再活性化し得る休止状態の微生物を含む。休止状態ではあるが、潜在性微生物は、基底の転写活性を呈することに留意されたい。対照的に「死んでいる微生物」は、転写的に活性ではない、すなわち、転写された遺伝子を検出することができない微生物を表す。本発明の文脈では、本方法は、生きている微生物の核酸配列と、サンプルに遊離しているかまたはいわゆる死んでいる微生物の中に含まれている、不活性な微生物の核酸配列を区別することを目的とする。
【0050】
「ライセート」は、本明細書中使用される場合、溶解の手法の後の液体または固体の物質の集合を表す。
【0051】
「溶解(名詞)」または「溶解する(動詞)」は、本明細書中使用される場合、他の方法ではアクセスできない物質にアクセスするための、生体サンプルの破壊(または破壊作用)を表す。生体サンプルが細胞である場合、溶解は、細胞の中身を漏出させる、細胞の細胞膜の破壊を表す。溶解方法は、当業者によく知られており、限定するものではないが、タンパク質分解による溶解、化学的な溶解、熱的な溶解、機械的な溶解、および浸透圧による溶解を含む。
【0052】
「核酸配列プライマー」または「プライマー」は、本明細書中使用される場合、適切なバッファーおよび適切な温度において、ヌクレオシド三リン酸、およびDNAポリメラーゼもしくはRNAポリメラーゼまたは逆転写酵素などの重合のための酵素の存在などの適切な条件下で、核酸配列とハイブリダイズまたはアニーリングし、ヌクレオチド重合の開始部位として作用できるオリゴヌクレオチドを表す。
【0053】
「オリゴヌクレオチド」は、本明細書中使用される場合、ヌクレオチドのポリマー、全般的にヌクレオチドの一本鎖ポリマーを表す。一部の実施形態では、オリゴヌクレオチドは、2~500ヌクレオチド、好ましくは10~150ヌクレオチド、好ましくは20~100ヌクレオチドを含む。オリゴヌクレオチドは、合成的であり得るか、または酵素により作製され得る。一部の実施形態では、オリゴヌクレオチドは、リボヌクレオチドモノマー、デオキシリボヌクレオチドモノマー、または両者の混合物を含み得る。
【0054】
「微生物(microbeまたはmicroorganism)」は、本明細書中使用される場合、限定するものではないが、サンプルに感染もしくは混入し得るか、および/または対象に疾患をもたらすか、伝達もしくは輸送し得る可能性のある、ウイルス、細菌、古細菌、真菌、または原虫などの生物を表す。
【0055】
「ポリメラーゼ連鎖反応」または「PCR」は、本明細書中使用される場合、アレルに特異的なPCR、非対称PCR、ホットスタートPCR、配列間に特異的なPCR、メチル化に特異的なPCR、ミニプライマーPCR、MPLA(multiplex ligation-dependent probe amplification)、マルチプレックスPCR、nested PCR1 定量的PCR、逆転写PCR、および/またはタッチダウンPCRを含む方法を包有する。核酸を増幅させるために適切なDNAポリメラーゼ酵素は、限定するものではないが、Taqポリメラーゼ Stoffelフラグメント、Taqポリメラーゼ、Advantage DNAポリメラーゼ、AmpliTaq、AmpliTaq Gold、Titanium Taqポリメラーゼ、KlenTaq DNAポリメラーゼ、Platinum Taqポリメラーゼ、Accuprime Taqポリメラーゼ、Pfuポリメラーゼ、Pfuポリメラーゼ turbo、Ventポリメラーゼ、Vent exo-ポリメラーゼ、Pwoポリメラーゼ、9 Nm DNAポリメラーゼ、Therminator、Pfx DNAポリメラーゼ、Expand DNAポリメラーゼ、rTth DNAポリメラーゼ、DyNAzyme-EXT ポリメラーゼ、Klenowフラグメント、DNAポリメラーゼI、T7ポリメラーゼ、SequenaseTM、Tfiポリメラーゼ、T4DNAポリメラーゼ、Bstポリメラーゼ、Bcaポリメラーゼ、BSUポリメラーゼ、phi-29DNAポリメラーゼ、およびDNAポリメラーゼBeta、またはそれらの修飾されたバージョンを含む。一実施形態では、DNAポリメラーゼは、3’-5’プルーフリーディング、すなわちエキソヌクレアーゼの活性を有する。一実施形態では、DNAポリメラーゼは、5’-3’プルーフリーディング、すなわちエキソヌクレアーゼ活性を有する。一実施形態では、DNAポリメラーゼは、鎖置換活性を有し、すなわちDNAポリメラーゼは、テンプレートに依存する核酸合成と組み合わせ、この近くで、5’から3’への方向で相補鎖からの対の核酸の解離をもたらす。DNAポリメラーゼ、たとえば大腸菌DNAポリメラーゼI、DNAポリメラーゼIのKlenowフラグメント、T7またはT5バクテリオファージDNAポリメラーゼ、およびHIVウイルス逆転写酵素は、ポリメラーゼ活性および鎖置換活性の両方を有する酵素である。ヘリカーゼなどの作用物質が、鎖置換作用、すなわち同じ配列の核酸の合成に対して結合した核酸の置換をもたらすために、鎖置換活性を有さない誘導性作用物質と併用して使用され得る。同様に、大腸菌または別の生物由来のRec Aまたは一本鎖結合タンパク質などのタンパク質が、他の誘導性作用物質と組み合わせて、鎖置換をもたらすまたは促進させるために使用され得る(Kornberg & Baker (1992). Chapters 4-6. In DNA replication (2nd ed., pp. 113-225). New York: W.H. Freeman)。
【0056】
「ランダムな増幅技術」は、本明細書中使用される場合、その配列とは無関係な、生体サンプルに存在するいずれかの核酸配列の増幅を意味する。これは、限定するものではないが、MDA(multiple displacement amplification)、ランダムPCR、RAPD(random amplification of polymorphic DNA)、またはMALBAC(multiple annealing and looping based amplification cycles)を含む。
【0057】
「転写的に活性の微生物の核酸配列」は、本明細書中使用される場合、生きている微生物、すなわち微生物が潜在性である場合であっても微生物の遺伝子を発現する微生物に属する核酸配列を表す。対照的に、「不活性な微生物の核酸配列」は、本明細書中使用される場合、不活性な微生物、すなわち死んでいる微生物に属する核酸配列を表す。さらに用語「不活性なウイルスの核酸配列」は、遊離する核酸配列、すなわちインタクトかまたは分解/断片化されているかどうかに関わらないが、いずれの場合でも活性ではない、ウイルスの外側にある核酸配列を表す。
【0058】
「転写的に活性なウイルスの核酸配列」は、本明細書中使用される場合、活性のウイルス、すなわち、ウイルス周期が頓挫性、すなわちウイルス粒子の形成をもたらさない場合(たとえば潜在性ウイルスの場合など)であってもウイルスの遺伝子を発現する、生きているウイルスに属する核酸配列を表す。対照的に、「不活性なウイルスの核酸配列」は、本明細書中使用される場合、不活性なウイルス、すなわち死んでいるウイルスまたはウイルス粒子に関連しない核酸に属する核酸配列を表す。
【0059】
「逆転写」は、本明細書中使用される場合、DNAの相補鎖(「cDNA」)を産生させるためのRNA依存性DNAポリメラーゼ(逆転写酵素、「RT」と略される)を使用したRNAの複製を表す。RNAの逆転写は、逆転写酵素、および4 デオキシリボヌクレオチド3リン酸(dNTP)、すなわちデオキシアデノシン三リン酸(dATP)、デオキシシチジン三リン酸(dCTP)、デオキシグアノシン三リン酸(dGTP)、および(デオキシ)チミジン三リン酸(dTTP)の混合物を使用して、当業者によく知られている技術により行われ得る。一部の実施形態では、RNAの逆転写は、第1の鎖のcDNA合成の第1のステップを含む。第1の鎖のcDNA合成のための方法は、当業者によく知られている。第1のcDNA合成反応は、配列に特異的なプライマー、オリゴ(dT)プライマー、またはランダムプライマーの組み合わせを使用し得る。逆転写酵素の例として、限定するものではないが、M-MLV逆転写酵素、SuperScript II(Invitrogen)、SuperScript III(Invitrogen)、SuperScript IV(Invitrogen)、Maxima(ThermoFisher Scientific)、ProtoScript II(New England Biolabs)、PrimeScript(ClonTech)が挙げられる。
【0060】
「配列リード」は、本明細書中使用される場合、シーケンサーにより決定される、ヌクレオチド塩基の配列、言い換えると核酸配列におけるモノマーの順序を意味する配列またはデータを表す。
【0061】
「シーケンサー」または「シークエネーター」は、核酸またはタンパク質などの生物学的なポリマーにおける構成要素の順序を決定するために使用される装置を表す。好ましくは、シーケンサーは、本発明の意味においては、次世代シーケンサーを表す。「次世代シーケンサー」は、たとえばIlluminaシーケンシング、Roche 454シーケンシング、Ion torrentシーケンシング、SOLiDシーケンシングなどの異なる技術に基づく多くの異なるシーケンサーを含み得る。
【0062】
「対象」は、本明細書中使用される場合、哺乳類、好ましくはヒトを表す。一実施形態では、対象は、限定するものではないが、イヌ、ネコ、モルモット、ハムスター、ラット、マウス、フェレット、ウサギ、トリ、または両生類を含むペットである。一実施形態では、対象は、「患者」、すなわち、医療の受診を待機しているかまたは医療を受診しているか、または過去/現在/将来に医療の対象であった/ある/となり得るか、または疾患、障害、もしくは病態、特にウイルス、細菌、古細菌、真菌、もしくは原虫の感染症の発達に関してモニタリングされている、雌性または雄性、成年または小児の「患者」である。
【0063】
「テンプレート」または「テンプレート配列」は、本明細書中使用される場合、増幅が望まれる核酸配列を表す。テンプレートは、DNAまたはRNAを含み得る。一実施形態では、テンプレート配列は既知である。一実施形態では、テンプレート配列は既知ではない。
【0064】
本明細書中使用される技術用語は、単に特定の事例を説明する目的のためにあり、限定されることを意図してはいない。本明細書中使用される場合、単数形「a」、「an」、および「the」は、文脈が他の意味を明記しない限り、同様に複数形をも含むことが意図されている。さらに、用語「含んでいる(including)」、「含む(includes)」「有している(having)」、または「有する(has)」、「伴う(with)」、またはそれらのバリアントは、詳細な説明および/または特許請求の範囲で使用される限り、当該用語は、用語「含む(comprising)」と同様の意味で包有されるように意図されている。
【0065】
詳細な説明
本発明は、サンプル、好ましくは細胞サンプルにおいて生きている微生物と死んでいる微生物を区別するための方法に関する。特に、本発明に係る方法は、サンプル、好ましくは細胞サンプルにおいて転写的に活性な微生物の核酸配列と転写的に不活性な核酸配列の区別に基づく。
【0066】
本発明の方法は、(i)ウイルス、細菌、古細菌、真菌、または原虫などの死んでいる微生物、および不活性な微生物配列と、(2)ウイルス、細菌、古細菌、真菌、または原虫などの活性な(または転写的に活性)な微生物および潜在性の微生物とを区別するために特に有用である。
【0067】
よって、本方法は、任意の種の微生物の検出、および生きている微生物と死んでいる微生物との間の区別に容易に適用可能であることを理解されたい。
【0068】
一実施形態では、微生物は、ウイルス、細菌、古細菌、真菌、および原生動物から選択される。
【0069】
一実施形態では、微生物はウイルスである。
【0070】
ウイルスは、生きている生物の中で複製し、全ての種の生命体に感染する小さな感染性の病原体である。
【0071】
ウイルスのボルティモア分類は、mRNA産生の機構に基づく。ウイルスは、自身のゲノムからmRNAを産生して、タンパク質を産生し、自身を複製しなければならないが、各ウイルス科でこれを達成するために異なる機構が使用される。ウイルスのゲノムは、一本鎖(ss)または二本鎖(ds)、RNAまたはDNAであり得、逆転写酵素を使用し得るかまたは使用することができない場合がある。さらに、ssRNAウイルスは、センス(+)またはアンチセンス(-)であり得る。この分類は、ウイルスを、7つのグループ:
I.dsDNAウイルス(たとえばアデノウイルス、ヘルペスウイルス、またはポックスウイルスなど)、
II.(+)ssDNAウイルス(たとえばアネロウイルス科(Anelloviridae)、ビドナウイルス科科(bidnaviridae)、サーコウイルス科、ジェミニウイルス科、ゲノモウイルス科(genomoviridae)、イノウイルス科、ミクロウイルス科、ナノウイルス科、パルボウイルス科、スマコウイルス科(smacoviridae)、またはスピラウイルス科(spiraviridae)など)、
III.dsRNAウイルス(たとえばレオウイルスなど)、
IV.(+)ssRNAウイルス(たとえばピコルナウイルスまたはトガウイルスなど)、
V.(-)ssRNAウイルス(たとえばオルソミクソウイルス、ラブドウイルスなど)、
VI.(+)生活環におけるDNA中間体を有するssRNA-RTウイルス(たとえばレトロウイルスなど)、
VII.生活環におけるRNA中間体を有するdsDNA-RTウイルス(たとえばヘパドナウイルスなど)
に置く。
【0072】
一実施形態では、本発明に係る方法は、dsDNAウイルス、(+)ssDNAウイルス、dsRNAウイルス、(+)ssRNAウイルス、(-)ssRNAウイルス、(+)ssRNA-RTウイルス、およびdsDNA-RTウイルスを含むかまたはからなる群から選択されるウイルスに属する転写的に活性なウイルスの核酸配列および不活性なウイルスの核酸配列を含む、サンプル、好ましくは細胞サンプルを区別するためのものである。
【0073】
一実施形態では、本発明に係る方法は、国際ウイルス分類委員会(ICTV)のデータベース、好ましくは全体が本明細書中参照により組み込まれているICTV Master Species List 2018b.v2 of May 31, 2019 (MSL#34)に開示されるものから選択されるウイルスに属する転写的に活性なウイルスの核酸配列および不活性なウイルスの核酸配列を含む、サンプル、好ましくは細胞サンプルを区別するためのものである。
【0074】
一実施形態では、微生物は細菌である。
【0075】
一実施形態では、本発明に係る方法は、細菌に属する転写的に活性な細菌の核酸配列および転写的に不活性な細菌の核酸配列を含む、サンプル、好ましくは細胞サンプルを区別するためのものである。
【0076】
細菌の例として、限定するものではないが、それらの下位分類群を含む、アシドバクテリウム門、アクチノバクテリア門、アクウィフェクス門、バクテロイデス門、クラミジア門、クロロビウム門、クロロフレクサス門、クリシオゲネス門、シアノバクテリア門、デフェリバクター門、デイノコックス・テルムス門、ディクチオグロムス門、フィブロバクテル門、フィルミクテス門、フソバクテリウム門、ゲンマティモナス門、ニトロスピラ門、プランクトミケス門、プロテオバクテリア門、スピロヘータ門、サーモデスルフォバクテリア門、テルモミクロビウム綱、テルモトガ門、およびウェルコミクロビウム門に属する細菌が挙げられる。
【0077】
好ましい実施形態では、細菌は、フィルミクテス門、好ましくはバチルス網、より好ましくはモリクテス亜綱、さらにより好ましくはマイコプラズマ属である。
【0078】
一実施形態では、微生物は、古細菌である。
【0079】
一実施形態では、本発明に係る方法は、古細菌に属する転写的に活性な古細菌の核酸配列および転写的に不活性な古細菌の核酸配列を含む、サンプル、好ましくは細胞サンプルを区別するためのものである。
【0080】
古細菌の例として、限定するものではないが、それらの下位分類群を含むAenigmarchaeota門、Aigarchaeota門、Altiarchaeia門、Archaeoglobi門、Asgardarchaeota門、Bathyarchaeota門、Crenarchaeota門、Diapherotrites門、Geoarchaeota門、Halobacteria門、Korarchaeota門、Methanobacteria門、Methanococci門、Methanomicrobia門、Methanopyri門、Nanoarchaeota門、Nanohaloarchaea門、Parvarchaeota門、Thalassoarchaeia門、Thaumarchaeota門、Thermococci門、Thermoplasmata門、およびWoesearchaeota門に属する古細菌が挙げられる。
【0081】
一実施形態では、微生物は真菌である。
【0082】
真菌は、それら細胞壁にキチンを含むことを特徴とする、酵母およびカビを含む真核生物である。
【0083】
一実施形態では、本発明に係る方法は、真菌に属する転写的に活性な真菌の核酸配列および転写的に不活性な真菌の核酸配列を含む、サンプル、好ましくは細胞サンプルを区別するためのものである。
【0084】
真菌の例として、限定するものではないが、それらの下位分類群を含むAscomycota門、Basidiomycota門、Entorrhizomycota門、Glomeromycota門、Mucoromycota門、Calcarisporiellomycota門、Mortierellomycota門、Kickxellomycota門、Entomophthoromycota門、Olpidiomycota門、Basidiobolomycota門、Neocallimastigomycota門、Chytridiomycota門、およびBlastocladiomycota門に属する真菌が挙げられる。
【0085】
一実施形態では、微生物は、原虫である。
【0086】
一実施形態では、本発明に係る方法は、原虫に属する転写的に活性な原虫の核酸配列および転写的に不活性な原虫の核酸配列を含む、サンプル、好ましくは細胞サンプルを区別するためのものである。
【0087】
原虫の例として、限定するものではないが、それらの下位分類群を含む、Euglenozoa門、Amoebozoa門、Choanozoa門、Microsporidia門、およびSulcozoa門が挙げられる。
【0088】
一実施形態では、サンプルは、生体サンプルである。適切な生体サンプルの例として、限定するものではないが、固形組織サンプルおよび流体サンプルが挙げられる。
【0089】
一実施形態では、生体サンプルは、過去/現在、最小限に侵襲的または非侵襲的な手法によるサンプリングを介して得た/得られる。
【0090】
一実施形態では、生体サンプルは、以前に対象から入手しており、すなわち本発明に係る方法は、in vitroの方法である。
【0091】
一実施形態では、生体サンプルは細胞サンプルである。「細胞サンプル」は、少なくとも1つの細胞を含む本明細書中記載のいずれかの生体サンプルを意味する。
【0092】
一実施形態では、生体サンプルは培養される。よって、用語「生体サンプル」の下、細胞または組織の培養物、好ましくはin vitroでの細胞または組織の培養物、たとえば細胞診サンプル、組織サンプル、または生体液サンプルから単離された細胞または組織の培養物が包有される。
【0093】
一実施形態では、本発明に係る方法は、サンプル、好ましくは細胞サンプルを培養、好ましくはin vitroの細胞サンプルを培養する最初のステップを含む。
【0094】
細胞サンプルの培養、特に細胞診サンプル、組織サンプル、または生体液サンプルから単離された細胞または組織の培養は、当業者によく知られている。
【0095】
一実施形態では、細胞サンプルは、指数関数的な増殖を可能にする密度で播種される。一実施形態では、生体サンプルは、約50%~約80%の培養密度で播種される。
【0096】
サンプルを培養する最初のステップは、(1)サンプルにおける潜在的な微生物(ウイルス、細菌、古細菌、真菌、または原虫など)に、RNAを転写させる(生きている微生物と死んでいる微生物を区別するための本方法で使用される重要な生体プロセスである)ため、および(2)代謝標識のために必要とされる。検出される微生物が自己複製する微生物ではない場合(たとえばウイルスまたは一部の細菌、たとえばマイコプラズマなど)、サンプルは、潜在的な微生物が上記細胞に感染し複製することを可能にする細胞サンプルであるべきである。微生物が自己複製する微生物である場合(すなわち微生物は自身の細胞を含むかまたは細胞自体である;通常細菌、古細菌、真菌、または原虫など)、サンプルは細胞サンプルであることは必須ではない。
【0097】
一実施形態では、サンプルは生体サンプルではない。この場合、サンプルは、例えば、水、土壌、空気などの環境上のサンプルであり得る。非生体サンプルの他の例として、食物サンプルが挙げられる。非生体サンプルの他の例として、保存培地が挙げられる。
【0098】
一実施形態では、サンプル、好ましくは細胞サンプルにおいて生きているか死んでいる微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫を区別するための方法であって、サンプル、好ましくは細胞サンプルにおいて転写的に活性であるか転写的に不活性である微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列を区別するステップを含み、
(a)サンプル、好ましくは細胞サンプルから抽出したRNAの第1のセットをシーケンシングするステップであって、前記RNAの第1のセットを、RNA標識化剤の存在下で前記サンプル、好ましくは細胞サンプルを培養し、さらにヌクレオチド置換を可能にする条件に抽出されたRNAを供することにより入手し、これにより配列リードの第1のセットを得る、ステップと、
(b)少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第1のセットでの置換されたヌクレオチドの数を、対照配列と比較するステップと、
(c)配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでの置換されたヌクレオチドの数が、前記対照配列においてランダムに置換されたヌクレオチドの数よりも多い場合に、前記少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けるステップと
を含む。
【0099】
一実施形態では、本発明の方法は、逆転写のコンセンサスな標準的な方法を参照することにより、逆転写酵素に、検出および比較され得る誤りをもたらさせる(すなわち不対合形成されたヌクレオチドを組み込ませる)条件下で行われる。このような条件は、逆転写されるRNAでの、チオール標識などの標識および/またはヌクレオチド置換技術によるヌクレオチド修飾の存在を含む。例示的な条件は、以下でさらに詳述される。
【0100】
本明細書中使用される場合、「不対合形成されたヌクレオチド」は、ワトソン-クリックの塩基対形成の形式ではなく組み込まれているヌクレオチドを表す。
【0101】
一実施形態では、逆転写酵素の誤りの比率は、逆転写酵素のフィデリティーと関連していない。
【0102】
本明細書中使用される場合、逆転写酵素に関する用語「フィデリティー」は、RNAからのDNAの合成の間に酵素により維持される配列の正確性を表す。フィデリティーは、逆転写の誤りの比率と逆相関している。
【0103】
一実施形態では、本発明に係る方法は、サンプル、好ましくは細胞サンプルから抽出したRNAの第1のセットをシーケンシングするステップを含む。一実施形態では、本発明に係る方法は、サンプル、好ましくは細胞サンプルから抽出した総RNAの第1のセットをシーケンシングするステップを含む。一実施形態では、本発明に係る方法は、サンプル、好ましくは細胞サンプルから抽出した総メッセンジャーRNA(mRNA)の第1のセットをシーケンシングするステップ
【0104】
一実施形態では、サンプル、好ましくは細胞サンプルから抽出したRNAの第1のセットをシーケンシングするステップは、RNAを標識するサブステップ、細胞を溶解するサブステップ、RNAを抽出するサブステップ、標識したRNAでヌクレオチドを置換するサブステップ、cDNAライブラリーを作製するサブステップ、cDNAライブラリーを増幅させるサブステップ、およびcDNAライブラリーをシーケンシングするサブステップのうちの1つ以上または全てを含む。
【0105】
RNAを標識することは、通常、RNA転写物に組み込まれている標識を培養培地へ添加することによって標識したRNAを得ることにより、in vitroでの転写の間、培養物で行われる。あるいはまたはさらに、RNAを標識することはまた、以下にさらに詳述されるように、RNAがすでに抽出されたサンプルが当該標識を含む場合に、RNA転写物に組み込まれた標識を添加することなく、培養物で行われ得る。
【0106】
「RNA転写物」は、いずれかの新たに合成された(neosynthesized)RNA分子を意味する。
【0107】
RNA転写物の標識は、当業者によく知られている技術により行われ得る。このような技術として、限定するものではないが、Schulz & Rentmeister (2014. Chembiochem. 15(16):2342-7)、Huang & Yu (2013. Curr Protoc Mol Biol. Chapter 4:Unit4.15)、およびLiu et al. (2016. Bioessays. 38(2):192-200)に記載されるものが挙げられる。
【0108】
好ましくは、RNAの代謝標識は、ワトソンクリックの塩基対形成を変更し、標識したRNAの逆転写によりヌクレオチドを置換、すなわち非ワトソンクリックのヌクレオチドと標識したヌクレオチドを対形成させる。たとえば、標識したウリジンは、第1の鎖の合成の間にアデニンの代わりにグアノシンと対形成され得る。結果的に、シトシンは、第2の鎖の合成の間に組み込まれ、最終的に、最初の核酸配列に対してチミジン(T)-シトシン(C)の置換をもたらす。
【0109】
一実施形態では、RNA転写物の代謝標識は、チオール標識により行われる。チオール標識は、当該分野でよく知られている技術であり、チオール標識した前駆体の新規に合成されたRNAへの組み込みを含む。このような技術として、限定するものではないが、Cleary et al. (2005. Nat Biotechnol. 23(2):232-7)、Miller et al. (2009. Nat Methods. 6(6):439-41)、Garibaldi et al. (2017. Methods Mol Biol. 1648:169-176)、Russo et al. (2017. Methods. 120:39-48)、およびHerzog et al. (2017. Nat Methods. 14(12):1198-1204)に記載されるものがあげられる。
【0110】
適切なチオール標識したRNA前駆体の例として、限定するものではないが、4-チオウリジン、2-チオウリジン、2,4-ジチオウリジン、2-チオ-4-デオキシウリジン、5-カルベトキシ-2-チオウリジン、5-カルボキシ-2-チオウリジン、5-(n-プロピル)-2-チオウリジン、6-メチル-2-チオウリジン、6-(n-プロピル)-2-チオウリジン、6-チオグアノシン、6-メチルチオグアノシン、6-チオイノシン、および6-メチルチオイノシンが挙げられる。
【0111】
一実施形態では、チオール標識したRNA前駆体は、好ましくは4-チオウリジン(4sU)、2-チオウリジン(2sU)、2,4-ジチオウリジン(2,4sU)、2-チオ-4-デオキシウリジン、5-カルベトキシ-2-チオウリジン、5-カルボキシ-2-チオウリジン、5-(n-プロピル)-2-チオウリジン、6-メチル-2-チオウリジン、および6-(n-プロピル)-2-チオウリジンを含むかまたはからなる群から選択されるチオウリジン誘導体である。
【0112】
好ましい実施形態では、チオール標識したRNA前駆体は、4-チオウリジン(場合により「4sU」または「s4U」と略される)である。
【0113】
一実施形態では、チオール標識したRNA前駆体は、培養培地から、サンプル、好ましくは細胞サンプルへ供給される。一実施形態では、チオール標識したRNA前駆体は、培養培地に添加される。
【0114】
チオール標識したRNA前駆体は、培養培地に添加される場合、「受動拡散型ヌクレオシド輸送体」と称される特定の輸送体を介して、サンプル、好ましくは細胞サンプルの細胞(ウイルスまたは微生物、たとえば細胞を含むかそれ自体が細胞である微生物、たとえば細菌、真菌、または原虫が感染した細胞)に組み込まれ得る。これら輸送体は、後生動物において準ユビキタス(quasi-ubiquitous)である。特に、4-チオウリジンは、SLC29A1遺伝子によりヒトでコードされる受動拡散型ヌクレオシド輸送体1(ENT1)を介して細胞に組み込まれ得る。
【0115】
一実施形態では、未処理のチオール標識したRNA前駆体が、1時間ごと、2時間ごと、3時間ごと、4時間ごと、6時間ごと、またはそれ以上の時間ごとに、培養物に添加される。
【0116】
一実施形態では、サンプル、好ましくは細胞サンプルは、約2時間~約15時間、好ましくは約4時間~約12時間、好ましくは約6時間~約10時間の範囲の時間の間、チオール標識したRNA前駆体を含む培養培地で培養される。
【0117】
一実施形態では、サンプル、好ましくは細胞サンプルは、第1の期間および第2の期間
の間に、チオール標識したRNA前駆体を含む培養培地で培養され、これは、第1の期間と第2の期間との間での未処理のチオール標識したRNA前駆体の添加を含む。一実施形態では、第1の期間は、約1時間~約10時間、好ましくは約2時間~約8時間、好ましくは約4時間~約6時間の範囲にあり、好ましくは約6時間である。一実施形態では、第2の期間は、約1時間~約6時間、好ましくは約2時間~約5時間、好ましくは約3時間~約4時間の範囲にあり、好ましくは約3時間である。
【0118】
好ましくは、チオール標識したRNA前駆体は、細胞、好ましくは細胞サンプルに対して毒性ではない。
【0119】
一実施形態では、チオール標識したRNA前駆体は、細胞のバイアビリティを損なわない濃度で、サンプル、好ましくは細胞サンプルに供給される。一実施形態では、「細胞のバイアビリティを損なわない濃度」は、最終約1μM~約2mM、好ましく最終約10μM~約1.5mM、好ましくは最終約100μM~約1mM、好ましくは最終約250μM~約1mM、好ましくは最終約500μM~約1mM、好ましくは最終約700μM~約900μM、好ましくは最終約800μMのチオール標識したRNA前駆体の範囲にある。
【0120】
一実施形態では、チオール標識したRNA前駆体は、微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫から直接、サンプル、好ましくは細胞サンプルに供給される。一実施形態では、チオール標識したRNA前駆体は、培養培地に添加されない。
【0121】
特定の微生物は、限定するものではないが4-チオウリジンシンテターゼ(ThiI)(Mueller et al., 1998. Nucleic Acids Res. 26(11):2606-10)または2-チオウリジンシンテターゼ(MnmA)(Kambampati & Lauhon, 2003. Biochemistry. 42(4):1109-1; Black & Dos Santos, 2015. J Bacteriol. 197(11):1952-62)などの酵素を使用して、チオール標識したRNA前駆体の生合成を触媒することができる。
【0122】
サンプルがチオール標識したRNA前駆体の生合成を触媒できる微生物を含む具体的な実施形態では、培養培地から、サンプル、好ましくは細胞サンプルにチオール標識したRNA前駆体をさらに供給することが好適であり得る。
【0123】
この実施形態では、培養培地からさらに供給されるチオール標識したRNA前駆体は、微生物が供給したチオール標識したRNA前駆体と同じであってもよくまたは異なるものであってもよい。
【0124】
この実施形態では、培養培地からさらに供給されるチオール標識したRNA前駆体は、(限定するものではないが、未処理のチオール標識したRNA前駆体の添加、濃度、期間などに関して)本明細書中上述されるように供給され得る。
【0125】
チオール標識したRNA前駆体およびチオール標識したRNAは、光感受性であり、酸化する傾向がある。よって一実施形態では、RNA標識は、暗室または少なくとも光から保護されて行われる。一実施形態では、RNA標識は、還元剤の存在下で行われる。適切な還元剤の例として、限定するものではないが、β-メルカプトエタノール、ジチオトレイトール(DTT)、トリス(2-カルボキシエチル)ホスフィン(TCEP)、システイン、N-アセチルシステイン、システアミン、2-メルカプトエタンスルホン酸ナトリウム塩、ジチオエリスリトール(DTE)、およびビス(2-メルカプトエチル)スルホン)が挙げられる。
【0126】
通常、サンプル、好ましくは細胞サンプルの細胞を溶解することは、細胞の中身、特にそのRNAを放出することを目的とする。一実施形態では、サンプルの細胞の溶解は、細胞のRNAの中身がすでにサンプルで放出されている場合などにおいて、任意選択であり得る。
【0127】
一実施形態では、細胞は、化学的な溶解、機械的な溶解、タンパク質分解による溶解、熱的溶解、および/または浸透圧による溶解により溶解される。これら細胞溶解技術は、当業者によく知られている。
【0128】
一実施形態では、細胞は、適切な溶解溶液で溶解される。溶解溶液は、塩、バッファー、界面活性剤、還元剤、プロテアーゼ阻害剤、ヌクレアーゼ阻害剤、グリセロール、糖などを含む様々な成分を含み得る。当業者は、溶解溶液における知識を有し、溶解する細胞の種類に応じて適切な溶解溶液を容易に設計および/または選択することができる。
【0129】
一実施形態では、細胞溶解は、リボヌクレアーゼ(RNase)阻害剤の存在下で行われる。RNaseは、場合により、細胞溶解の細胞から放出され得るか、または単離されたRNAと同時に精製され、よって、下流での適用を損なわせる場合がある。このようなRNaseの混入はまた、手法で使用されるチップ、チューブ、および他の試薬を介して誘導され得る。RNase阻害剤は、市販されている。
【0130】
チオール標識したRNAは光感受性であり、酸化する傾向があるため、一実施形態では、細胞溶解は、暗室または少なくとも光から保護されて行われる。一実施形態では、細胞溶解は、還元剤の存在下で行われる。適切な還元剤の例として、限定するものではないが、β-メルカプトエタノール、ジチオトレイトール(DTT)、トリス(2-カルボキシエチル)ホスフィン(TCEP)、システイン、N-アセチルシステイン、システアミン、2-メルカプトエタンスルホン酸ナトリウム塩、ジチオエリスリトール(DTE)、およびビス(2-メルカプトエチル)スルホン)が挙げられる。
【0131】
RNAを抽出することは、当業者によく知られている技術により行われ得る。このような技術として、限定するものではないが、クロロホルム-イソアミルアルコール抽出、フェノール-クロロホルム抽出、アルカリ性物質抽出、グアニジウム チオシアネート-フェノール-クロロホルム抽出、陰イオン交換樹脂、シリカマトリックス、ガラス粒子、珪藻土、異なる合成ポリマーから作製された磁性粒子、バイオポリマー、多孔性ガラスでの結合、および無機磁性に基づく技術が挙げられる。
【0132】
好ましくは、RNAの抽出は、例えば、クロロホルム:イソアミルアルコール 24:1を使用する、クロロホルム-イソアミルアルコール抽出により行われる。
【0133】
一実施形態では、抽出したRNAは、さらに沈殿される。RNAを沈殿することは、当業者によく知られている技術により行われ得る。このような技術として、イソプロパノールエタノール沈殿、トリゾール法(Chomczynski, 1993. Biotechniques. 15(3):532-4, 536-7)、およびPine Tree法(Chang et al., 1993. Plant Mol Biol Report. 11(2):113-116)が挙げられる。
【0134】
好ましくは、RNA沈殿は、イソプロパノールエタノール沈殿により行われる。
【0135】
チオール標識したRNAは光感受性であり、酸化する傾向があるため、一実施形態では、RNAの抽出は、暗室または少なくとも光から保護されて行われる。一実施形態では、RNAの抽出は、還元剤の存在下で行われる。適切な還元剤の例として、限定するものではないが、β-メルカプトエタノール、ジチオトレイトール(DTT)、トリス(2-カルボキシエチル)ホスフィン(TCEP)、システイン、N-アセチルシステイン、システアミン、2-メルカプトエタンスルホン酸ナトリウム塩、ジチオエリスリトール(DTE)、およびビス(2-メルカプトエチル)スルホン)が挙げられる。
【0136】
一実施形態では、標識したRNAは、ヌクレオチド置換を経る。一実施形態では、標識したRNAは、ヌクレオチド置換を可能にする条件に供される。
【0137】
以下において、用語「置換」、「変換」、「形質転換」は、不対合形成されたヌクレオチドの組み合わせを表すように互換可能に使用され得る。
【0138】
標識したRNAのヌクレオチド置換は、標識したRNAを化学的に修飾し、さらに上記化学的に修飾したRNAを逆転写することにより行われ得る。よって、ヌクレオチド置換を可能にする条件は、標識したRNAの化学的修飾、および上記化学的に標識したRNAの逆転写を含む。
【0139】
好ましくは、ヌクレオチド変換の方法は、標識したRNAでワトソンクリックの対形成を変えることを可能にし、cDNA合成の間の標識したRNAの逆転写により、不対合形成ヌクレオチドを組み込む、すなわち非ワトソンクリックヌクレオチドと標識したヌクレオチドを対形成する。
【0140】
たとえば、標識したウリジン(チオール標識したウリジンなど)は、cDNAの第1の鎖の合成の間にアデニン(A)の代わりにグアノシン(G)と対形成され得る。結果的に、シトシンは、第2の合成の間に組み込まれ、最終的に、最初の核酸配列に対してチミジン(T)-シトシン(C)の置換をもたらす。
【0141】
よってヌクレオチド置換は、同等の第1の鎖の合成におけるヌクレオチド置換(すなわち第1の鎖の合成の後に起こるヌクレオチド置換);または同等の第2の鎖合成におけるヌクレオチド置換(すなわち第2の鎖の合成の後に起こるヌクレオチド置換)として定義され得る。
【0142】
一実施形態では、標識したRNAは、第1の鎖の合成におけるA-G(A→G)置換を経る。一実施形態では、標識したRNAは、第2の鎖の合成におけるT-C(T→C)置換を経る。よってこれら実施形態では、標識したRNAにおける標識したウリジン(U)は、対応するcDNAにおいてチミジン(T)の代わりにシトシン(C)に変換される。
【0143】
他の意味が明記されていない限り、本明細書中列挙されるヌクレオチド置換は、第2の鎖の合成におけるヌクレオチド置換に対応する。
【0144】
標識したRNAの適切な化学的修飾として、限定するものではないが、アルキル化、酸化的芳香族求核置換反応、オスミウム介在性形質転換、または当業者に知られている他のいずれかの方法が挙げられる。
【0145】
標識したRNAをアルキル化することは、当業者によく知られている技術により行われ得る。このような技術として、限定するものではないが、Herzog et al.(2017. Nat Methods. 14(12):1198-1204)に記載されるものが、挙げられる。
【0146】
好ましくは、標識したRNAのアルキル化は、本明細書中詳述されるRNAの抽出の後に行われる。
【0147】
一実施形態では、標識したRNAのアルキル化は、アルキル化剤を使用して行われる。適切なアルキル化剤の例として、限定するものではないが、ヨードアセトアミド、ヨード酢酸、N-エチルマレイミド、および4-ビニルピリジンが挙げられる。
【0148】
好ましい実施形態では、アルキル化剤は、ヨードアセトアミドである。
【0149】
標識したRNAのアルキル化処理の非限定的な例として、
100%のエタノールにおいて最終約1mM~最終約20mM、好ましくは最終約5mM~最終約15mM、好ましくは最終約10mMのヨードアセトアミド、
最終約10mM~最終約100mM、好ましくは最終約25mM~最終約75mM、好ましくは最終約50mMの、pH8のバッファー(たとえばリン酸ナトリウム(NaPO4)バッファーなど)、
約25v/v(%)~約75v/v(%)、好ましくは約40v/v(%)~約60v/v(%)、好ましくは約50v/v(%)のDMSO
を、標識したRNAに添加することを含む。
【0150】
チオール標識したRNAは光感受性であるため、一実施形態では、RNAのアルキル化は、暗室または少なくとも光から保護されて行われる。
【0151】
一実施形態では、RNAアルキル化は、還元剤の存在下で行われない。
【0152】
一実施形態では、RNAアルキル化は、アルキル化処理の終了時に、クエンチ、すなわち停止される。
【0153】
アルキル化処理のクエンチは、当業者によく知られている技術により行われ得る。
【0154】
一実施形態では、RNAアルキル化のクエンチングは、還元剤を使用して行われる。
【0155】
適切な還元剤の例として、限定するものではないが、β-メルカプトエタノール、ジチオトレイトール(DTT)、トリス(2-カルボキシエチル)ホスフィン(TCEP)、システイン、N-アセチルシステイン、システアミン、2-メルカプトエタンスルホン酸ナトリウム塩、ジチオエリスリトール(DTE)、およびビス(2-メルカプトエチル)スルホン)が挙げられる。
【0156】
RNAアルキル化のクエンチングの非限定的な例は、最終約1mM~約100mM、好ましくは最終約10mM~最終約50mM、好ましくは最終約10mM~最終約30mM、好ましくは最終約20mMのジチオトレイトール(DTT)をアルキル化したRNAに添加することを含む。
【0157】
標識したRNAの酸化的芳香族求核置換反応は、当業者によく知られている技術により行われ得る。このような技術として、限定するものではないが、Schofield et al. (2018. Nat Methods. 15(3):221-225)に記載されるものが挙げられる。
【0158】
好ましくは、標識したRNAの酸化的芳香族求核置換反応は、本明細書中上記で詳述されるRNAの抽出の後に行われる。
【0159】
一実施形態では、標識したRNAの酸化的芳香族求核置換反応は、酸化剤および求核剤を使用して行われる。
【0160】
適切な酸化剤の例として、限定するものではないが、過ヨウ素酸ナトリウム(NaIO4)、メタクロロ過安息香酸(mCPBA)、ヨウ素酸ナトリウム(NaIO3)、および過酸化水素(H2O2)が挙げられる。
【0161】
好ましい実施形態では、アルキル化剤は、過ヨウ素酸ナトリウム(NaIO4)である。
【0162】
適切な求核剤の例として、限定するものではないが、2,2,2-トリフルオロエタンアミン(TFEA)、ヒドラジン、ベンジルアミン、アンモニア、メトキシアミン、1,1-ジメチルエチレンジアミン、アニリン、および4-(トリフルオロメチル)ベンジルアミンが挙げられる
【0163】
好ましい実施形態では、求核剤は、2,2,2-トリフルオロエタンアミン(TFEA)である。
【0164】
チオール標識したRNAは、光感受性であるため、一実施形態において、RNAの酸化的芳香族求核置換反応は、暗室または少なくとも光から保護されて行われる。
【0165】
一実施形態では、RNAの酸化的芳香族求核置換反応は、還元剤の存在下で行われない。
【0166】
一実施形態では、RNAの酸化的芳香族求核置換反応は、酸化的芳香族求核置換反応の処理の終了時に、クエンチ、すなわち停止される。
【0167】
酸化的芳香族求核置換反応の処理のクエンチは、当業者によく知られている技術により行われ得る。
【0168】
標識したRNAのオスミウム介在性形質転換は、当業者によく知られている技術により行われ得る。このような技術として、限定するものではないが、Riml et al. (2017. Angew Chem Int Ed Engl. 56(43):13479-13483)に記載されるものが挙げられる。
【0169】
好ましくは、標識したRNAのオスミウム介在性形質転換は、本明細書中上記に詳述されるRNAの抽出の後に行われる。
【0170】
一実施形態では、標識したRNAのオスミウム介在性形質転換は、四酸化オスミウム(OsO4)およびアンモニアを使用して行われる。
【0171】
チオール標識したRNAは、光感受性であるため、一実施形態において、RNAの酸化的芳香族求核置換反応は、暗室または少なくとも光から保護されて行われる。
【0172】
一実施形態では、RNAのオスミウム介在性形質転換は、還元剤の存在下で行われない。
【0173】
一実施形態では、RNAのオスミウム介在性形質転換は、酸化的芳香族求核置換反応の処理の終了時に、クエンチ、すなわち停止される。
【0174】
RNAのオスミウム介在性形質転換の処理のクエンチは、当業者によく知られている技術により行われ得る。
【0175】
特にシーケンシングする目的のためのcDNAライブラリーの作製は、当業者の知識の一部である。限定するものではないが、SMARTer Stranded Total RNA-Seq Kit(ClonTech)、QuantSeq 3’mRNA-Seq Library Prep Kit(Lexogen)、Nextera XT DNA Library Prep Kit (Illumina)、TruSeq Nano DNA Library Prep Kit(Illumina)、NEBNext DNA Library Prep Master Mix(New England Biolabs)、NEBNext Ultra DNA Library Prep Kit(New England Biolabs)、およびJetSeq DNA Library Preparation Kit(Bioline)を含む、cDNAライブラリー作製のためのキットが市販されている。
【0176】
一実施形態では、cDNAライブラリーを作製することは、以下の:
第1の鎖のcDNAを合成する(ことにより、二本鎖の混合したRNA-cDNAライブラリーを得る)サブステップと、
任意選択でRNAのテンプレートを除去する(ことにより、一本鎖のcDNAライブラリーを得る)サブステップと、
第2の鎖のcDNAを合成する(ことにより、二本鎖のcDNAライブラリーを得る)サブステップ
を含むRNA逆転写のサブステップ、および
任意選択で、二本鎖のcDNAライブラリーを精製するサブステップ
のうちの一部または全てを含む。
【0177】
RNAの逆転写は、逆転写酵素、および4 デオキシリボヌクレオチド3リン酸(dNTPs)、すなわちデオキシアデノシン三リン酸(dATP)、デオキシシチジン三リン酸(dCTP)、デオキシグアノシン三リン酸、(dGTP)、および(デオキシ)チミジン三リン酸(dTTP)の混合物を使用して、当業者によく知られている技術により行われる。
【0178】
特に、第1の鎖のcDNA合成のための方法は、当業者によく知られている。第1の鎖のcDNA合成反応は、配列に特異的なプライマー、オリゴ(dT)、またはランダムプライマーの組み合わせを使用し得る。一実施形態では、第1の鎖のcDNA合成反応は、オリゴ(dT)プライマーを使用する。一実施形態では、第1の鎖のcDNA合成反応は、配列に特異的なプライマーを使用する。一実施形態では、第1の鎖のcDNA合成反応は、ランダムプライマーを使用する。
【0179】
一実施形態では、第1の鎖のcDNA合成に使用されるプライマーは、定型の核酸配列(たとえばシーケンシングに使用されるアダプターおよび/または指標を含む)および(RNAテンプレートに相補的な)プライミング核酸配列を含む。一実施形態では、第1の鎖のcDNA合成に使用されるプライマーは、定型の5’末端配列およびプライミング3’末端配列を含む。一実施形態では、第1の鎖のcDNA合成に使用されるプライマーは、定型の3’末端配列およびプライミング5’末端配列を含む。
【0180】
特に、RNAテンプレートを除去するための方法は、当業者によく知られている。RNAテンプレートの除去は、たとえば二本鎖の混合したRNA-cDNAライブラリーをRNase Hとインキュベートすることにより行われ得る。
【0181】
cDNAライブラリーを作製するためのRNAの逆転写は、ランダムな方法、すなわちランダムプライマーを使用することにより、RNAの全体または主な部分を逆転写することにより、行われ得る。あるいは、cDNAライブラリーを作製するためのRNAの逆転写は、特定の方法、すなわち特異的なプライマーを使用することにより、カスタム配列のみのcDNAライブラリーを作製することにより、行われ得る。
【0182】
一実施形態では、特にRNAを逆転写する際に、cDNAライブラリーを作製することは、ヌクレオチド置換をもたらす。このようなヌクレオチド置換は、化学的修飾の非存在下で、いずれかの逆転写されたRNA上でランダムに少数起こる。しかしながら、このような置換の激増が、以前に標識され、さらに本明細書中上述されるアルキル化、酸化的芳香族求核置換反応、オスミウム介在性形質転換などの技術により化学的に修飾されたRNAの逆転写の間に観察される。この置換の激増は、以下の「実施例」のセクションにおいてさらに示される。
【0183】
cDNAライブラリーを増幅させることは、当業者によく知られている方法により行われ得る。
【0184】
cDNAライブラリーの増幅は、ランダムな方法、すなわちランダムプライマーを使用することによりcDNAライブラリーの全体または主な一部を増幅させることにより、行われ得る。あるいは、cDNAライブラリーの増幅は、特定の方法、すなわち特異的なプライマーを使用することにより、cDNAライブラリーのカスタム配列のみを増幅させることにより、行われ得る。
【0185】
cDNAライブラリーをシーケンシングすることは、当業者によく知られている方法により行われ得る。一実施形態では、cDNAライブラリーのシーケンシングは、次世代シーケンシング(NGS)、ディープシーケーシング、またはカスタム配列のターゲットシーケンシングにより行われる。
【0186】
NGSに関する方法は、当業者に知られており、限定するものではないが、ペアエンドシーケンシング、SBS(sequencing by synthesis)、シングルリードシーケンシングを含む。
【0187】
NGSのためのプラットフォームが利用可能であり、限定するものではないが、Illumina MiSeq(Illumina)、Ion Torrent PGM(ThermoFisher Scientific)、PacBio RS(PacBio)、Illumina GAIIx(Illumina)、Illumina HiSeq 2000(Illumina)を含む。
【0188】
cDNAライブラリーをシーケンシングするステップは、市販のキット、たとえばMiSeq reagent kit v2(Illumina)を使用して行われ得る。
【0189】
一実施形態では、cDNAライブラリーをシーケンシングすることは、配列リードのセットをもたらす。
【0190】
一実施形態では、本発明に係る方法は、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第1のセットでの置換されたヌクレオチドの数を、対照配列と比較するステップを含む。
【0191】
「置換されたヌクレオチド」は、微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに関して、ヌクレオチドが別のヌクレオチドに置き換えられていることを意味する。通常、いずれかのヌクレオチドが他のいずれかのヌクレオチドで置き換えられ得、たとえばチミジンはシトシン(T→C)、アデニン(T→A)、またはグアニン(T→G)に置き換えられる。同じことが、アデニン(A)、シトシン(C)、およびグアニン(G)が他の3つのヌクレオチドのいずれかに置き換わる場合にも当てはまる。
【0192】
このような置換は、特に逆転写のステップの間、ランダムに少数で起こる。しかしながら本発明は、RNAが以前に標識されており、さらにアルキル化、酸化的芳香族求核置換反応、オスミウム介在性形質転換などの化学的な修飾法に供した場合の当該置換の激増に基づくものである。
【0193】
一実施形態では、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第1のセットでの置換されたヌクレオチドの総数は、対照配列での置換されたヌクレオチドの総数と比較される。
【0194】
一実施形態では、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第1のセットでのT→C置換の数は、対照配列でのT→C置換の数と比較される。
【0195】
一実施形態では、少なくとも1つの同定された微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第1のセットでのヌクレオチド置換の比率は、対照配列でのヌクレオチド置換の比率と比較される。
【0196】
一実施形態では、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第1のセットでのT→C置換の比率は、対照配列でのT→C置換の比率と比較される。
【0197】
「置換の比率」は、本明細書中使用される場合、置換の総数で除算された1つまたは複数の所定のヌクレオチド置換(たとえばT→C置換または本明細書中上記に定義される他のヌクレオチド置換)の数として計算される。あるいは、「置換の比率」は、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでのヌクレオチドの総数で除算された1つまたは複数の所定のヌクレオチド置換の数として計算され得る。
【0198】
一実施形態では、配列リードの第1のセットおよび対照配列での少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの間のT→C置換の比率と、配列リードの第1のセットおよび対照配列での少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの間の他の全てのヌクレオチドの置換(すなわちT→C以外)の比率の平均とが、比較される。
【0199】
一実施形態では、本方法は、少なくとも1つの配列リードに対してマッピングした少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットを同定することを含む。
【0200】
一実施形態では、少なくとも1つの配列リードに対してマッピングした少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットの同定は、リードのセットをフィルタリングするサブステップと、配列リードをコンティグにアセンブリするサブステップと、データベース上に配列リードまたはコンティグをアライメントするサブステップと、少なくとも1つの配列リードまたはコンティグに対してマッピングされた少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットを同定するサブステップと、微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒット上に配列リードまたはコンティグを再度アライメントするサブステップとを含む。
【0201】
配列リードのセットをフィルタリングすることは、当業者の知識を一部である。
【0202】
一実施形態では、配列リードのセットをフィルタリングすることは、限定するものではないが、配列リードの重複を抑制すること、低質な配列リードを抑制すること、配列リードのホモポリマーを抑制すること、配列リードから定型の核酸配列(たとえばシーケンシングに使用されるアダプターおよび/または指標など)を除去すること、内因性の配列リード(すなわち対象の細胞に属する核酸配列をマッピングした配列リード)を廃棄すること、望ましくない配列リード(たとえばrRNAの配列リードなど)を廃棄することなどを含み得る。
【0203】
このようなフィルタリングは、当業者が容易に利用できるソフトウェアを使用して行われ得る。
【0204】
配列リードのセットをコンティグにアセンブリすることは、当業者の知識の一部である。
【0205】
このような配列リードのコンティグへのアセンブリは、当業者が容易に利用できるソフトウェアを使用して行われ得る。
【0206】
任意選択で、配列リードまたはコンティグは、アミノ酸配列へと翻訳され得る。
【0207】
配列リードまたはコンティグのセットをアライメントすることは、当業者の知識の一部である。このような配列リードまたはコンティグのアライメントは、当業者が容易に利用できるソフトウェアを使用して行われ得る。
【0208】
一実施形態では、配列リードまたはコンティグは、微生物のデータベース、すなわち微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列またはアミノ酸配列(配列リードまたはコンティグがアミノ酸配列に翻訳された場合)を含むデータベースにアライメントされる。このようなデータベースは、たとえばEMBL Nucleotide Sequence Databaseからダウンロードされ得る。
【0209】
少なくとも1つの配列リードまたはコンティグに対してマッピングされた少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒット(または配列リードまたはコンティグがアミノ酸配列に翻訳された場合はアミノ酸配列のヒット)を同定することは、当業者の知識の一部である。
【0210】
データベース上での配列リードまたはコンティグのセットのアライメントの後に、上記データベースからヒット配列が同定され得る。
【0211】
一実施形態では、少なくとも1つのヒット配列が、配列リードまたはコンティグでアライメントした後に得られる閾値の期待値(e値)に基づき同定(よって選択)される。一実施形態では、配列ヒットは、少なくとも1つの配列リードまたはコンティグでの上記配列ヒットのアライメント後に得られるe値が、10-2未満、好ましくは5.10-3未満、好ましくは10-3未満である場合、同定される。
【0212】
以前に同定(よって選択)された少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒット(または配列リードまたはコンティグがアミノ酸配列に翻訳された場合はアミノ酸配列のヒット)上で配列リードまたはコンティグを再度アライメントすることは、当業者の知識の一部である。
【0213】
このような配列リードまたはコンティグの再アライメントは、当業者が容易に利用できるソフトウェアを使用して行われ得る。
【0214】
一実施形態では、再アライメントの後、以前に同定(よって選択)された少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒット(または配列リードまたはコンティグがアミノ酸配列に翻訳された場合はアミノ酸配列のヒット)の少なくとも1つの最終的なコンセンサス配列が決定される。
【0215】
一実施形態では、対照配列は、
少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第2のセットであって、前記配列リードの第2のセットが、RNA標識化剤の非存在下でサンプル、好ましくは細胞サンプルを培養することにより得られるRNAの第2のセットをシーケンシングすることにより得られる、第2のセット、
少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第2のセットであって、前記配列リードの第2のセットが、RNA標識化剤の存在下ではあるが、ヌクレオチド置換を可能にする条件に前記抽出したRNAを供することなく、サンプル、好ましくは細胞サンプルを培養することにより得られるRNAの第2のセットをシーケンシングすることにより得られる、第2のセット、
少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、もしくは原虫の核酸配列のヒットに対してマッピングした配列リードの第1のセットの配列リードもしくはコンティグから得られるコンセンサスな微生物、好ましくはウイルス、細菌、古細菌、真菌、もしくは原虫の核酸配列、
核酸配列のデータベースにおいて同定された最も近い微生物、好ましくはウイルス、細菌、古細菌、真菌、もしくは原虫の菌株で見出される同じ微生物、好ましくはウイルス、細菌、古細菌、真菌、もしくは原虫の核酸配列のヒットに対応する配列、および/または
核酸配列のデータベースにおいて同定された同じ微生物、好ましくはウイルス、細菌、古細菌、真菌、もしくは原虫の核酸配列のヒットに対応する類似の配列
から選択される。
【0216】
一実施形態では、対照配列は、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第2のセットであって、配列リードの第2のセットは、RNA標識化剤の非存在下で、サンプル、好ましくは細胞サンプルを培養することにより得られるRNAの第2のセットをシーケンシングすることにより得られる。
【0217】
この実施形態では、本発明に係る方法は、
(a)サンプル、好ましくは細胞サンプルから抽出されたRNAの第1および第2のセットをシーケンシングするステップであって、前記RNAの第1のセットが、RNA標識化剤の存在下でサンプル、好ましくは細胞サンプルを培養することにより得られ、前記RNAの第2のセットが、RNA標識化剤の非存在下でサンプル、好ましくは細胞サンプルを培養することにより得られ、これにより、配列リードの第1および第2のセットを得る、ステップと、
(b)少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第1のセットでの置換されたヌクレオチドの数を、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第2のセットでの置換されたヌクレオチドの数と比較するステップと、
(c)配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでの置換されたヌクレオチドの数が、配列リードの第2のセットでの置換されたヌクレオチドの数よりも多い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けるステップと
を含む。
【0218】
好ましくは、RNAの第1のセットは、RNA標識化剤の存在下で、サンプル、好ましくは細胞サンプルを培養することにより標識したRNAを入手し、さらに標識したRNAを本明細書中上記で詳述されるヌクレオチド置換に供することにより、得られる。
【0219】
一実施形態では、本発明に係る方法は、
(a)サンプル、好ましくは細胞サンプルから抽出されたRNAの第1および第2のセットをシーケンシングするステップであって、前記RNAの第1のセットが、RNA標識化剤の存在下でサンプル、好ましくは細胞サンプルを培養することにより得られ、前記RNAの第2のセットが、RNA標識化剤の非存在下でサンプル、好ましくは細胞サンプルを培養することにより得られ、これにより、配列リードの第1および第2のセットを得る、ステップと、
(b)配列リードの第1のセットの少なくとも1つの配列リードに対してマッピングした少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットを同定するステップと、
(c)配列リードの第1および第2のセットにおいて少なくとも1つの同定された微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットをマッピングした配列リードでの置換されたヌクレオチドの数を比較するステップと、
(d)配列リードの第1のセットにおける少なくとも1つの同定された微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットをマッピングした配列リードでの置換されたヌクレオチドの数が、配列リードの第2のセットでの置換されたヌクレオチドの数よりも多い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている活性の微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属していると結論付けるステップと
を含む。
【0220】
この実施形態では、本方法は、サンプル、好ましくは細胞サンプルから抽出されたRNAの第1のセットをシーケンシングするステップを含む。この実施形態では、サンプル、好ましくは細胞サンプルは、RNA標識化剤の存在下で培養された。
【0221】
この実施形態では、サンプル、好ましくは細胞サンプルから抽出されたRNAの第1のセットをシーケンシングするステップは、RNAを標識するサブステップ、細胞を溶解するサブステップ、RNAを抽出するサブステップ、標識したRNAでヌクレオチドを置換するサブステップ、cDNAライブラリーを作製するサブステップ、cDNAライブラリーを増幅させるサブステップ、およびcDNAライブラリーをシーケンシングするサブステップのうちの1つ以上または全てを含む。
【0222】
これらサブステップは、本明細書中上記に定義および詳述されており、RNAの第1のセットのシーケンシングに適用される。
【0223】
この実施形態では、本方法は、サンプル、好ましくは細胞サンプルから抽出されたRNAの第2のセットをシーケンシングするさらなるステップを含む。この実施形態では、サンプル、好ましくは細胞サンプルは、RNA標識化剤の非存在下で培養された。
【0224】
この実施形態では、サンプル、好ましくは細胞サンプルから抽出されたRNAの第2のセットをシーケンシングするステップは、細胞を溶解するサブステップ、RNAを抽出するサブステップ、cDNAライブラリーを作製するサブステップ、cDNAライブラリーを増幅させるサブステップ、およびcDNAライブラリーをシーケンシングするサブステップを含む。
【0225】
これらサブステップは、本明細書中上記に定義および詳述されており、RNAの第2のセットのシーケンシングに適用される。
【0226】
一実施形態では、対照配列は、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第2のセットであって、配列リードの第2のセットは、RNAの標識化剤の存在下であるが、ヌクレオチド置換を可能にする条件に抽出したRNAを供することなく、サンプル、好ましくは細胞サンプルを培養することにより得られるRNAの第2のセットをシーケンシングすることにより得られる。
【0227】
この実施形態では、本発明に係る方法は、
(a)前記サンプル、好ましくは細胞サンプルから抽出されたRNAの第1および第2のセットをシーケンシングするステップであって、前記RNAの第1および第2のセットが、RNA標識化剤の存在下でサンプル、好ましくは細胞サンプルを培養することにより標識したRNAを得ることにより得られ、
前記RNAの第1のセットが、ヌクレオチド置換に供される標識したRNAの第1のフラクションから得られ、RNAの第2のセットが、ヌクレオチド置換に供されない標識したRNAの第2のフラクションから得られ、これにより配列リードの第1および第2のセットを得る、ステップと、
(b)少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第1のセットでの置換されたヌクレオチドの数を、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第2のセットでの置換されたヌクレオチドの数と比較するステップと、
(c)配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでの置換されたヌクレオチドの数が、配列リードの第2のセットでの置換されたヌクレオチドの数よりも多い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けるステップと
を含む。
【0228】
一実施形態では、対照配列は、コンセンサスな微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列であり得る。一実施形態では、コンセンサスな微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列は、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードの第1のセットの複数の配列リードから入手され得る。このようなコンセンサス配列は、全ての目的のヌクレオチドがヌクレオチド置換の手法の後にチオ標識されておらずかつ/または置換されていないことが観察されているため、容易に決定され得る。実際に、十分な数の目的のヌクレオチドが、本発明の方法に係る区別を可能にするように置換されているが、この数は、コンセンサス配列を確立するためには依然として十分低いままである。
【0229】
一実施形態では、対照配列は、同じ微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対応しているが、核酸配列のデータベースで同定された最も近い微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の菌株で見出される核酸配列であり得る。
【0230】
一実施形態では、対照配列は、ヌクレオチド核酸配列のデータベースで同定された、同じ微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対応する類似の配列であり得る。
【0231】
一実施形態では、本発明に係る方法は、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属しているかどうかを結論付けるステップを含む。
【0232】
一実施形態では、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫は、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットの分類学的な割り当てにより特徴づけられる。
【0233】
一実施形態では、配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングされた配列リードでのヌクレオチド置換の総数が、対照配列でのヌクレオチド置換の総数より多い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けられる。
【0234】
一実施形態では、配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでのT→C置換の数が、対照配列でのT→C置換の数よりも多い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けられる。
【0235】
一実施形態では、配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでの置換の数が、対照配列での置換の数よりも2倍多い、好ましく3倍多い、より好ましくは4、5、6、7、8、9、10、15、20、50、100倍多い場合、「配列リードの第1セットにおける「...」置換の数「...」が、対照配列における「...」置換の数「...」より多い」。
【0236】
一実施形態では、配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでのヌクレオチド置換の比率が、対照配列でのヌクレオチド置換の比率よりも多い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けられる。
【0237】
一実施形態では、配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでのT→C置換の比率が、対照配列でのT→C置換の比率よりも高い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けられる。
【0238】
本明細書中使用される場合、「T→C置換率」は、以下の式:
T→C置換率=Tが予測された際に同定されるCヌクレオチドの数/予測されるTの総数
で定義され得る。
【0239】
一実施形態では、配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでの置換率が、対照配列での置換率よりも2倍高い、好ましく3倍高い、より好ましくは4、5、6、7、8、9、10、15、20、50、100倍高い場合、「配列リードの第1セットにおける[...]置換率[...]が、対照配列における[...]置換率[...]より高い」。
【0240】
一実施形態では、配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでのT→C置換率が、他の全てのヌクレオチドの平均置換比率よりも高い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けられる。
【0241】
一実施形態では、T→C置換率が、他の全てのヌクレオチドの平均置換比率より2倍高い、好ましくは3倍高い、より好ましくは4、5、6、7、8、9、10、15、20、50、100倍高い場合、「T→C置換率は、他の全てのヌクレオチドの平均置換比率よりも高い」。
【0242】
「他の全てのヌクレオチドの平均置換比率」は、A→C、A→G、A→T、C→A、C→G、C→T、T→A、T→G、G→A、G→C、およびG→Tの置換比率の平均を意味する。
【0243】
一実施形態では、配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでのT→C置換率が、T→AおよびT→Gの平均置換比率よりも高い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けられる。
【0244】
一実施形態では、T→C置換比率が、T→AおよびT→Gの平均置換比率よりも2倍高い、好ましくは3倍高い、より好ましくは4、5、6、7、8、9、10、15、20、50、100倍高い場合、「T→C置換率は、T→AおよびT→Gの平均置換比率よりも高い」。一実施形態では、配列リードの第1のセットおよび対照配列における少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リード間のT→C置換率が、配列リードの第1のセットおよび対照配列における少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リード間の他の全てのヌクレオチドの平均置換比率の比率よりも高い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けられる。
【0245】
一実施形態では、配列リードの第1のセットおよび対照配列における少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リード間のT→C置換率が、配列リードの第1のセットおよび対照配列における少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リード間のT→AおよびT→Gの平均置換比率の比率よりも高い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けられる。
【0246】
一実施形態では、配列リードの第1のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでのT→C置換指標が、閾値より高い場合、少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属すると結論付けられる。この実施形態では、閾値は、実験により決定され得る。一実施形態では、閾値は、配列リードの第2のセットにおける少なくとも1つの微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットに対してマッピングした配列リードでのT→C置換指標よりも高い。一実施形態では、閾値は、少なくとも2、好ましくは少なくとも2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、11、12、13、14、15、16、17、18、19、20、またはそれ以上である。
【0247】
本明細書中使用される場合、用語「T→C置換指標」は、以下の式:
T→C置換指標=「T→C」比率/平均(「T→A」、「T→G」の比率)
で定義され得る。
【0248】
サンプル、好ましくは細胞サンプルにおいて、生きているか死んでいる微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫を区別するための方法であって、本発明により、サンプル、好ましくは細胞サンプルにおける転写的に活性かまたは転写的に不活性な微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列を区別するステップを含む方法は、多くの異なる適用に有用である。
【0249】
実際に、微生物、特にウイルス、細菌、古細菌、真菌、または原虫の混入のリスクは、生物製品にとって主要な懸念のテーマである。これは、GMP(医薬品及び医薬部外品の製造管理及び品質管理の基準)の施設および最終的な薬物製品の異物混入のリスクの両方を含む。生の物質、細胞、ウイルス、種、マスター/ワーキングバンク、ワクチン化用の血清バッチなどのウイルス試験は、薬物製品の安全性にとって重要である。これは、生のワクチン、遺伝子療法ウイルスベクター、細胞療法薬物製品に特に重要であり、これはそれらの生産が、下流でのウイルスを排除するステップを含まないためである。結果として、これら製品の安全性は、作製プロセスの間のウイルス試験に著しく依存している。
【0250】
以前に報告されている細胞培養物に基づく製品の異物混入の全ては、生の物質または産生細胞のウイルス試験の間に同定されなかった予測できない動物性ウイルスによるものであった。実際に、従来のウイルス試験は、多くのウイルスがin vitro試験で使用される細胞株またはin vivo試験に使用されるげっ歯類もしくはタマゴで増殖しないため、限定される。
【0251】
本発明の方法は、異物混入に関してサンプルを正確に試験し、潜在性微生物を含む生きた微生物と不活性な微生物の核酸フラグメント(たとえばγ線照射による不活性化後の断片化された微生物の核酸)の無害な混入を区別するための代替的な手法を提供する。
【0252】
これに基づき、多くの産業上の応用が予測できる。
【0253】
ワクチンの分野では、不活性化したワクチンの制御は、通常、現在では、不活性化であるとみなされるワクチンを培養し、次に活性な微生物の存在を探索することにより行われる。本発明の方法は、不活性化されていることにより無害である不活性な微生物の核酸配列のバックグラウンドノイズと生きている微生物を区別することを可能にするであろう。
【0254】
同様に、本発明に係る方法は、生の物質(たとえばワクチンの場合は血清バッチ)、細胞、マスター/ワーキングバンクなどの生体サンプルにおいてではあるが、同様に診断のために使用される血液培養物および他の種類の生体サンプルにおいて、生きている微生物を伴う混入を検出するために容易に行われ得る。たとえば、対象での抗菌剤による処置の後、残存する生きている微生物の存在の有無に関して対象を試験することにより、潜在的な処置に耐性のある微生物を同定することが企図され得る。
【0255】
ウイルス療法の分野では、本発明に係る方法は、ウイルスベクター、たとえば遺伝子療法で使用されるウイルスベクターなどにおける複製的な復帰突然変異株のウイルス(replicative revertant virus)の存在の有無に関して試験するために行われ得る。
【0256】
また保存培地を、微生物のコンタミネーションに供することができ、本発明に係る方法は、サンプルを保存物と接触させる前に当該コンタミネーションに関して試験するために容易に使用され得る。
【0257】
また分野の可能性は、非生体サンプルまで広がる。たとえば、食物の安全性は、主要な関心事である。衛生に関するスキャンダルならびに質および安全性に焦点を当てた食品の需要の出現は、微生物混入を探索する食品の試験と共鳴する。本発明の方法は、食品サンプルに生きている微生物が混入しているかどうかに関する実務的かつ明確な回答を提供することによりこの問題を解決し得る。
【0258】
また環境上のサンプルも試験され得る。たとえば水および/または空気調節された回路は、潜在的に微生物を保有することが知られている。本発明に係る方法は、当該生きている微生物の存在の有無を確認するために実施され得る。
【0259】
本発明の別の目的は、対象において微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の感染症の診断方法、好ましくはin vitroでの診断方法である。
【0260】
一実施形態では、本発明に係る診断方法は、対象からサンプル、好ましくは細胞サンプルを準備するステップを含む。
【0261】
一実施形態では、本発明に係る診断方法は、本発明により、サンプル、好ましくは細胞サンプルにおいて転写的に活性か転写的に不活性な微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列を区別するための方法のいずれかを行うステップをさらに含む、
【0262】
一実施形態では、本発明に係る診断方法は、少なくとも1つの同定した微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属している場合、対象が微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の感染症を有すると診断するステップをさらに含む。
【0263】
本発明の別の目的は、対象において微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の感染症を処置する方法である。
【0264】
一実施形態では、本発明に係る微生物感染症を処置する方法は、本発明に係る診断方法を行う(carrying)ステップと、上記対象が、微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の感染症を有すると診断された場合に対象を処置するステップとを含む。
【0265】
微生物感染症を処置する手段および方法は、当業者によく知られており、限定するものではないが、少なくとも1つの抗ウイルス剤、抗細菌剤、抗真菌剤、抗原虫剤を対象に投与することを含む。
【0266】
抗ウイルス剤の適切な例として、限定するものではないが、ATC分類(解剖治療化学分類法)の治療に関する下位群J05(therapeutic subgroup J05)に分類されるものが挙げられる。さらなる例として、限定するものではないが、アセマンナン、アシクロビル、アシクロビルナトリウム、アダマンタンアミン、アデホビル、アデニンアラビノシド、アロブジン、アルビルセプトスドトックス、アマンタジン塩酸塩、アラノチン、アリルドン、アテビルジンメシル酸塩、アブリジン、シドホビル、シパムフィリン、塩酸シタラビン、BMS 806、C31G、カラゲナン、亜鉛塩、硫酸セルロース、シクロデキストリン、ダピビリン(dapivirine)、デラビルジンメシル酸塩、デスシクロビル、デキストリン 2-スルファート、ジダノシン、ジソキサリル、ドルテグラビル、エドクスジン、エンビラデン、エンビロキシム(envirozime)、エトラビリン、ファムシクロビル、塩酸ファモチン、フィアシタビン、フィアルリジン、フォサリレート(Fosarilate)、ホスカルネットナトリウム、ホスホネットナトリウム、FTC、ガンシクロビル、ガンシクロビルナトリウム、GSK 1265744、9-2-ヒドロキシ-エトキシメチルグアニン、イバリズマブ、イドクスウリジン、インターフェロン、5-ヨード-2’-デオキシウリジン、IQP-0528、ケトキサール、ラミブジン、ロブカビル、マラビロク、メモチンピロダビル(memotine pirodavir)、ペンシクロビル、ラルテグラビル、リバビリン、リマンタジン塩酸塩、リルピビリン(TMC-278)、サキナビルメシル酸塩、SCH-C、SCH-D、ソマンタジン塩酸塩、ソリブジン、スタトロン、スタブジン、T20、チロロン二塩酸塩、TMC120、TMC125、トリフルリジン、トリフルオロチミジン、テノホビル、テノホビル・アラフェナミド、テノホビルジソプロキシルフマル酸塩、テノホビルのプロドラッグ、UC-781、UK-427、UK-857、バラシクロビル、バラシクロビル塩酸塩、ビダラビン、ビダラビンリン酸、ビダラビンナトリウムリン酸塩、ビロキシム(Viroxime)、ザルシタビン、ジドブジン、ジンビロキシム、およびそれらの組み合わせが挙げられる。
【0267】
抗細菌剤の適切な例として、限定するものではないが、ATC分類の治療に関する下位群J01に分類されるものが挙げられる。さらなる例として、限定するものではないが、アミノグリコシド(たとえばアミカシン、ゲンタマイシン、カナマイシン、ネオマイシン、ネチルマイシン、ストレプトマイシン、トブラマイシン、パロモマイシン(paromycin)など)、アンサマイシン(たとえばゲルダナマイシン、ハービマイシンなど)、カルバセフェム(たとえばロラカルベフなど)、カルバペネム(たとえば.エルタペネム(ertapenum)、ドリペネム、イミペネム、シラスタチンメロペネムなど)、第1世代セファロスポリン(たとえばセファドロキシル、セファゾリン、セファロチン、セファレキシンなど)、第2世代セファロスポリン(たとえばセファクロル(cefaclor)、セファマンドール、セフォキシチン、セフプロジル、セフロキシムなど)、第3世代セファロスポリン(たとえばセフィキシム、セフジニル、セフジトレン、セフォペラゾン、セフォタキシム、セフポドキシム、セフタジジム、セフチブテン、セフチゾキシム、セフトリアキソンなど)、第4世代セファロスポリン(たとえばセフェピムなど)、第5世代セファロスポリン(たとえばセフトビプロールなど)、グリコペプチド系(たとえばテイコプラニン、バンコマイシンなど)、マクロライド系(たとえばアジスロマイシン(axithromycin)、クラリスロマイシン、ジリスロマイシン(dirithromycine)、エリスロマイシン、ロキシスロマイシン、トロレアンドマイシン、テリスロマイシン、スペクチノマイシンなど)、モノバクタム系(たとえばアズトレオナムなど)、ペニシリン系(penicilins)(たとえばアモキシシリン、アンピシリン、アズロシリン(axlocillin)、カルベニシリン、クロキサシリン、ジクロキサシリン、フルクロキサシリン、メズロシリン、メチシリン、ナフシリン(nafcilin)、オキサシリン、ペニシリン、ピペラシリン(peperacillin)、チカルシリンなど)、抗菌性ポリペプチド(たとえばバシトラシン、コリスチン、ポリミキシンBなど)キノロン(たとえばシプロフロキサシン、エノキサシン、ガチフロキサシン、レボフロキサシン、レメフロキサシン、モキシフロキサシン、ノルフロキサシン、オルフロキサシン(orfloxacin)、トロバフロキサシンなど)、スルホンアミド(たとえばマフェニド、プロントジル、スルファセタミド、スルファメチゾール、スルファニルアミド、スルファサラジン、スルフイソキサゾール、トリメトプリム、トリメトプリム・スルファメトキサゾール合剤など)、テトラサイクリン系(たとえばデメクロサイクリン、ドキシサイクリン、ミノサイクリン、オキシテトラサイクリン、テトラサイクリンなど)、他の抗生剤(たとえばアルスフェナミン、クロラムフェニコール、クリンダマイシン、リンコマイシン、エタンブトール、ホスホマイシン、フシジン酸、フラゾリドン、イソニアジド、リネゾリド、メトロニダゾール、ムピロシン、ニトロフラントイン、プラテンシマイシン、ピラジナミド、キヌプリスチン/ダルホプリスチン、リファンピン/リファンピシン、チニダゾールなど)、およびそれらの組み合わせが挙げられる。
【0268】
抗真菌剤の適切な例として、限定するものではないが、ATC分類の治療に関する下位群J02に分類されるものが挙げられる。さらなる例として、限定するものではないが、アバフンジン(abafungin)、アルバコナゾール、アモロルフィン、アンホテリシンB、アニデュラファンギン、アトバコン、ビアフンギン(biafungin)、ビホナゾール、ブロモクロロサリチルアニリド、ブテナフィン、ブトコナゾール、カスポファンギン、クロルミダゾール、クロロフェノール(chlorophetanol)、クロルフェネシン、シクロピロクス、シロフンギン、コウスイガヤ油、クロトリマゾール、クロコナゾール、クリスタルバイオレット、ダプソン、ジマゾール、エベルコナゾール、エコナゾール、エフィナコナゾール、エチルパラベン、フェンチコナゾール、フルコナゾール、フルオロシトシン、フルトリマゾール、ホスフルコナゾール、グリセオフルビン、ハロプロジン、ハマイシン、ヘキサコナゾール、イサブコナゾール、イソコナゾール、イトラコナゾール、ケトコナゾール、レモングラス、レモンマートル、ルリコナゾール、ミカファンギン、ミコナゾール、ナフチフィン、ナタマイシン、ネチコナゾール、ニスタチン、オモコナゾール、オレンジオイル、オキシコナゾール、パチョリ、ペンタミジン、ポリノキシリン、ポサコナゾール、ヨウ化カリウム、ラブコナゾール、サリチル酸、セレン(IV)ジスルフィド、セルタコナゾール、チオ硫酸ナトリウム、スルベンチン、スルコナゾール、タウロリジン、タバボロール、ティーツリーオイル、テルビナフィン、テルコナゾール、チクラトン、チオコナゾール、トルシクラート、トルナフタート、トリブロモメタクレゾール、ウンデシレン酸、ボリコナゾール、ホイットフィールド軟膏、およびそれらの組み合わせが挙げられる。
【0269】
抗原虫剤の適切な例として、限定するものではないが、ATC分類の治療に関する下位群P01に分類されるものが挙げられる。さらなる例として、限定するものではないが、アルベンダゾール、アモジアキン、アンホテリシンB、アルスチノール、アーテメータ、アルテミシニン、アルテモチル、アルテロラン、アーテスネート、アトバコン、アザニダゾール、ベンズニダゾール、ブロキシキノリン、カルニダゾール、キニオホン、クロルヘキシジン、クロロキン、クロルプログアニル、クロルキナルドール、クレファミド、クリンダマイシン、クリオキノール、デヒドロエメチン、ジフェタルソン、ジヒドロアルテミシニン、ジヨードヒドロキシキノリン、ジロキサニド、ドキシサイクリン、エフロルニチン、エメチン、エトファミド、フェキシニダゾール、フマギリン、フラゾリドン、グリコビアルソル、ハロファントリン、ヒドロキシクロロキン、ヨードキノール、ルメファントリン、メフロキン、アンチモン酸メグルミン、メラルソプロール、メパクリン、メトロニダゾール、ミルテホシン、ニフルチモックス、ニモラゾール、ニタゾキサニド、オルニダゾール、パマキン、パロモマイシン、ペンタミジン、ファンキノン、ピペラキン、プリマキン、プログアニル、プロパミジン、プロペニダゾール、ピリメタミン、ピロナリジン(pyronaridine)、キナクリン、キニジン、キニーネ、セクニダゾール、スチボグルコン酸ナトリウム、スルファジアジン、スルファドキシン、スルファレン、スルファメトキサゾール、スラミン、タフェノキン、テクロザン、テノニトロゾール、テトラサイクリン、チルブロキノール、チニダゾール、トリメトプリム、トリメトレキサート、およびそれらの組み合わせが挙げられる。
【0270】
本発明の別の目的は、サンプルにおける微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫のコンタミネーションのリスクを評価するための方法である。
【0271】
一実施形態では、本発明に係る微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫のコンタミネーションのリスクを評価するための方法は、サンプルを準備するステップを含む。一実施形態では、サンプルは、生体サンプルまたは非生体サンプルであり得る。
【0272】
一実施形態では、本発明に係る微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫のコンタミネーションのリスクを評価するための方法は、本発明に係るサンプルにおいて転写的に活性であるか転写的に不活性な微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列を区別するための方法のいずれかを行うステップを含む。
【0273】
一実施形態では、本発明に係る微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫のコンタミネーションのリスクを評価するための方法は、少なくとも1つの同定された微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫の核酸配列のヒットが、生きている微生物、好ましくはウイルス、細菌、古細菌、真菌、または原虫に属する場合、サンプルが微生物混入しているリスクがあると結論付けるステップを含む。
【図面の簡単な説明】
【0274】
【
図1A】
図1は、Tヌクレオチドの置換率および置換指標を示す2つのグラフのセットである。
図1A:Tの合計に対する置換されたTの比率として表されるTヌクレオチドの置換率。
図1B:「T-A」+「T-G」置換率の平均に対する「T-C」置換率として表される置換指標。[T:TBEV;S:SMRV;C:細胞性RNA]。
【
図2】
図2は、現在の条件のデータから構築されたTBEVのコンセンサス配列を微生物の核酸配列のヒットとして使用した、4sUで処理しアルキル化したサンプルにおけるTヌクレオチドのC、G、またはAへの置換率(%)を示すグラフである。
【
図3】
図3は、現在の条件のデータから構築されたSMRVのコンセンサス配列を微生物の核酸配列のヒットとして使用した、4sUで処理しアルキル化したサンプルにおけるTヌクレオチドのC、G、またはAへの置換率(%)を示すグラフである。
【
図4】
図4は、LC5_ALAID_CNS参照ゲノムの再構築の候補として選択された662のコンティグのGC含有量の分布を示すグラフである。
【
図5】
図5は、LC5の実験条件のリードの最初のアセンブリから選択された662のコンティグを有するA. laidlawii str. PG8Aゲノムのタイリングを示すグラフである。一致するコンティグ(フォワードは黒色、リバースは灰色)が、それらの類似性の現実のパーセンテージで報告されており(上部)、カバー度および容易な可視化を平板化するために10%の類似性で正規化されている。
【
図6A】
図6は、異なる試験条件に関する、LC5_ALAID_CNS参照配列に沿ったTヌクレオチドのC、G、またはAへの置換率(または変換比率)(%)を示す7つのグラフのセットである。著しく確信的なイベントのみ(>20倍の深度)が、解析で選択されている。
図6A:CTRL5tag条件、
図6B:LC5条件、
図6C:LC5tag条件、
図6D:40倍希釈したLC5tag条件、
図6E:HC_HK5tag条件;
図6F:HC_HK5tag条件、
図6G:HC_G5tag条件。
【実施例】
【0275】
実施例
本発明の上記および他の態様および性質を、以下の実施例によりさらに例示する。これら実施例は、単なる例であり、限定を意図するものではない。
【0276】
実施例1:培養されたベロ細胞での複製するダニ媒介性脳炎ウイルス(TBEV)の検出
材料および方法
材料
ベロ細胞を、2%のウシ胎仔血清(FBS)を補充した最小必須培地(MEM)で増殖させた。感染に使用したウイルスは、平均の大きさが10kbであるssRNA(+)ゲノムからなる、フラビウイルス科のメンバーであるダニ媒介性脳炎ウイルス(TBEV)である。
【0277】
方法
ウイルス感染
ベロ細胞を、MW6プレートの3つのウェルに400 000個の細胞/ウェルでプレーティングして、24時間後に106個の細胞/ウェルにした。
【0278】
次に、細胞を、1のMOI(感染多重度)でTBEVに感染させ、氷上で撹拌しながら1時間インキュベートした。
【0279】
1つのウェルでは、インキュベーションの直後に培地を除去し、細胞を、1mLのTRIzolで溶解し、RNA抽出まで-80℃で保存した(条件1)。
【0280】
他の2つのウェル(条件2および3)では、培地を除去し、MEM+2%のFBSと交換し、37℃で一晩インキュベートした。
【0281】
4sU標識
このステップは、SLAMseq Kinetic kit-Anabolic Kinetics Module(Lexogen, Cat. No. 061)を使用して行った。
【0282】
細胞培養の間の細胞培養培地での4-チオウリジン(4sU)の組み込みは、4sUヌクレオチドを新規に合成されるRNAへ組み込ませる。
【0283】
800μMの4sUを含む培地を、992μLのMEMにおいて100nMの4sUを8μl添加することにより調製した。
【0284】
ウイルス感染の翌日に、培地を除去し、1つのウェルでは4sUを含まない培地(条件2)または最後のウェルでは4sUを含む培地(800μm)(条件3)と交換した。6時間後に、培地を除去し、条件2では4sUを含まない未処理の培地と交換し、条件3では未処理の4sUを含む培地(800μM)と交換した。
【0285】
3時間後に、培地を3つのウェルから除去し、細胞を、1mlのTRIzolで溶解し、RNA抽出まで-80℃で保存した。
【0286】
RNAサンプリング
このステップは、SLAMseq Kinetic kit-Anabolic Kinetics Module(Lexogen, Cat. No. 061)を使用して行った。
【0287】
RNA抽出を、暗室において、クロロホルム:イソアミルアルコール混合物24:1(Sigma Aldrich, Cat. No. 25666)を使用して行い、次いでイソプロパノール/エタノール沈殿を行った。抽出の間、還元剤(RA)を使用して、4SUで処理したサンプルを還元条件下に維持した。
【0288】
単離された総RNAは、既存の(非標識の)RNAおよび新規に合成された(標識された)RNAの両方を含む。
【0289】
アルキル化
このステップは、SLAMseq Kinetic kit-Anabolic Kinetics Module(Lexogen, Cat. No. 061)を使用して行った。
【0290】
条件3の抽出された総RNAを、ヨードアセトアミド(IAA)と混合し、カルボキシアミドメチル基の付加を介して4sUを含むヌクレオチドの4-チオール基を修飾させた。次にRNAを、エタノール沈殿を使用して精製した後、ライブラリー調製に進ませた。
【0291】
ライブラリー調製
SMARTer Stranded Total RNA-Seq Kit-Pico Input Mammalian(ClonTech)を、10ngのRNAで開始する直接的なライブラリーの構築に使用した。このキットで使用したワークフローは、哺乳類のrRNAおよび一部のミトコンドリアRNAに特異的なプローブを使用してリボソームcDNAを枯渇させる所有権のある技術(PathoQuest, Paris, France)を組み込んでいる。
【0292】
シーケンシング
シーケンシングは、NextSeq 500/550 High Output kit v2(FC-404-2002, Illumina)を使用してNextSeq instrument(Illumina)で行った。
【0293】
シーケンシングは、150ヌクレオチドのリード長でシングルリードし、サンプルあたり約1億2500万のリードを作製した。
【0294】
概要
以下の表1は、異なる条件(1、2、および3)で使用されたプロトコルをまとめている。
【表1】
【0295】
バイオインフォマティクス解析-TBEVゲノム解析
この試験の第1の目的は、参照として使用されるこの単離物の完全なTBEVゲノム配列を得ることであった。この解析は、0日目に、4sU処理を行っていない感染させたサンプルで行った。
【0296】
生のリードのフィルタリング
最初に、生のデータのリードをフィルタリングし、高品質かつ関連のあるリードを選択した。
【0297】
生のデータを、重複物、低質のリード、およびホモポリマーを抑制または切断するように選別した(所有権のあるソフトウェア)。Illumina(登録商標)ライブラリー調製の間導入された配列(アダプター、プライマー)を、Skewer(Jiang et al., 2014. BMC Bioinformatics. 15:182)で除去した。
【0298】
最終的に、ヒトのゲノム(参照GRCh37/hg19)にアライメントした内因性霊長類のリード(ベロ細胞由来)または細菌性rRNAにアライメントしたリードを、廃棄した。
【0299】
ローカルアライメントを、BWA(Li et al., 2009. Bioinformatics. 25(14):1754-60)で行った。
【0300】
ヒトゲノムは、UCSC Genome Browser(2002. Genome Res. 12(6):996-1006)からダウンロードした。細菌性rRNAのデータは、EMBL-EBI ENA rRNAのデータベースからダウンロードし、さらに内部で配列のクリーニングおよびクラスタリングプロセスを行った。
【0301】
これらフィルタリングしたリードを、目的の配列とみなした。
【0302】
De novoでのアセンブリ
次に、残存し関連するリードのセットを、コンティグと称されるより長い配列にアセンブリした。このde novoでのアセンブリのステップは、CLC assembly cell solution(Qiagen)を用いて行った。
【0303】
不可知論的なウイルスの同定
結果得られるコンティグおよびアセンブリされていないリード(シングルトン)を、BLASTアライメント(Altschul et al., 1990. J Mol Biol. 215(3):403-10)を使用して、ウイルスおよび総合的なデータベースにアライメントした。最初に、コンティグおよびシングルトンを、ウイルスのヌクレオチドのデータベースにアライメントした。10-3未満のe値を有するヒットを、総合的なヌクレオチドのデータベースにアライメントした。それらの最良のヒットが依然としてウイルスの分類にあった場合、ヒットを報告した。
【0304】
ヌクレオチドのウイルスのデータベースおよび総合的なデータベースは、EMBL-EBIヌクレオチド配列データベースSTDから2017年11月にダウンロードした。所有権のあるソフトウェアを、重複物を除去し(短すぎる、複数の分類、低質の関連するキーワードなどのため)低い信頼度の配列を除去するように開発した。
【0305】
ウイルスのヌクレオチドのヒットを全く含まないコンティグを、同様に引き続き、ウイルスおよび総合的なタンパク質のデータベースにアライメントして、より明確に異なるウイルスのヒットを確認した。
【0306】
タンパク質のウイルスおよび総合的なデータベースは、Uniref100データベースから2017年11月にダウンロードした。Uniref100データベースは、すでに冗長ではないが、最終的なデータベースを作成するために分類学的なクリーニングプロセスを行った。
【0307】
分類学的な割り当ては、最良のヒットの結果を報告した。これら2ラウンドのアライメント後に割り当てられなかったコンティグは、未知のウイルスまたは非ウイルス種と分類した。
【0308】
【0309】
TBEVの最終的なコンセンサスな編集
このプロセスは、完全なTBEVゲノム配列を包有するコンティグを同定した。
【0310】
次に、全てのリードを、CLC assembly cell solution(Qiagen)を用いてこの配列に再度アライメントし、最終的なコンセンサス配列を抽出した。この配列を、この試験で「TBEV REFERENCE」と命名した。
【0311】
バイオインフォマティクス解析-ヌクレオチド置換率の試験
この目的は、「T-C」置換率が、4sU+アルキル化サンプル(条件3)で有意に高いかどうかを確認するために、異なるサンプル由来のリードを比較することであった。
【0312】
ダニ媒介性脳炎ウイルスのバンクの作製
「TBEV REFERENCE」配列を使用して、ブラストバンク(blast bank)を作製した。
【0313】
非常に高い「T-C」置換率を有する見込みのある配列を検出するために、参照配列も同様に、全てのTをCで置換することにより修飾した。この配列は、「TBEV T-C REFERENCE」と命名した。「TBEV REFERENCE」および「BEV T-C REFERENCE」の配列をまとめて混合し、単一の「TBEV BLAST」バンクを作製した。
【0314】
生のリードのフィルタリング
初めに、質のフィルタリングのプロセスを行い、低質なリードを除去または調整(trim)した(所有権のあるソフトウェア)。
【0315】
次に、Illuminaのライブラリー調製の間に導入された配列(アダプター、プライマー)を、Skewer(Jiang et al., 2014. BMC Bioinformatics. 15:182)を用いて除去した。
【0316】
全ての解析のバイアスを回避するために、重複したリードは除去しなかった。
【0317】
TBEVブラストバンクでフィルタリングされたリードのブラスト
次に、残存し関連するリードのセットを、BLAST(Altschul et al., 1990. J Mol Biol. 215(3):403-10)により、以前に設計した「TBEV BLAST」バンクにアライメントした。最大e値を、10-8に設定した。
【0318】
アライメントした全てのリードは、TBEV陽性とみなし、解析の次のステップのため選択した。
【0319】
TBEVの完全なゲノム上での選択されたリードのマッピング
次に、TBEV陽性のリードを、「TBEV REFERENCE」配列上でCLC assembly cell solution(Qiagen)を用いてマッピングすることにより再度アライメントした。クオリティコントロールを、blastにより選択されたリードの少なくとも99%が参照に正に再アライメントされることを確保するように設定した。
【0320】
以下の表3は、各条件で得られたマッピングされたセンスのリードおよびアンチセンスのリードの数、ならびに結果得られる配列のカバー度をまとめている。
【表3】
【0321】
置換率の推定
CLCプログラム「clc_find_variations」を使用して、TBEV試験参照の各位置の全てのミスマッチを検出した。次に、全体的なバリエーションのプロファイルを、所有権のあるスクリプトにより解析し、各ヌクレオチドの置換率を定義した。置換されたヌクレオチドの比を、アライメントされたヌクレオチドの総数と比較した。通常、「T-C」置換率は、以下の式:
Tが予測された際に同定されるCヌクレオチドの数/アライメントされたヌクレオチドの総数
を使用して計算した。
【0322】
TBEV鎖(Stranded)解析
目的の鎖の解析を、TBEVの同定されたリードで行った。この解析は、よりストリンジェントなフィルタリングされたリードのマッピングアライメントを行う。このアライメントは、詳細な水平のゲノムのカバー度および深度のプロファイルを提供する。
【0323】
ローカルアライメントは、BWA(Li et al., 2009. Bioinformatics. 25(14):1754-60)で行った。
【0324】
サンプルのライブラリーはSMARTer Stranded RNA-Seq Kitを使用して調製したため、RNA鎖の情報は、保持された。よって、マッピングアライメント解析により、各鎖(親鎖に対してセンスまたはリバース)の親鎖の情報が提供された。
【0325】
転写物のカバー度により、細胞サンプルにおけるウイルスの複製のシグネチャーに関して結論付けることができた。
【0326】
結果および結論
条件3においてTBEV参照ゲノムでマッピングしたミスマッチで計算された「T-C」置換率の、条件1においてTBEV参照ゲノムでマッピングしたミスマッチで計算されたT-C置換率に対する比率は、7.86:1に相当する(表4)。
【0327】
これは、組み込まれた4sUを有するTBEV RNA種の産生の増大を表し、よって、4sUを含む培地における9時間のベロ細胞のインキュベーション中でのウイルスRNAの新規合成を表している。
【0328】
よって、ここで例証された方法は、代謝標識を使用して、複製する(+)ssRNAウイルス、TBEVの検出を可能にする。
【表4】
【0329】
実施例2:培養したベロ細胞での複製するリスザルレトロウイルス(SMRV)の検出
実施例1での不可知論的なウイルス同定の後に、最良のヒットの結果は、リスザルレトロウイルスに割り当てられたコンティグを示した。このウイルスは、内因性であり、一部のサル種に完全に統合されていることが知られている。特に、この試験で使用されるベロ細胞は、様々なサル内因性D型レトロウイルス配列、特にSMRV配列を有することが記載されている(Sakuma et al., 2018. Sci Rep. 8(1):644)。
【0330】
この知識に基づき、上記の表2に示される結果の観点から、同じバイオインフォマティクスの手法を行い、SMRV配列のヒットを同定し、この配列ヒットでのヌクレオチドの置換率を試験した。
【0331】
以下の表5は、各条件で得られたマッピングされたセンスおよびアンチセンスのリードの数、ならびに得られた配列のカバー度をまとめている。
【表5】
【0332】
条件3においてSMRV参照ゲノムでマッピングしたミスマッチで計算された「T-C」置換率の、条件1においてSMRV参照ゲノムでマッピングしたミスマッチで計算されたT-C置換率に対する比率は、41.86:1に相当する(表6)。
【0333】
これは、組み込まれた4sUを有するSMRV RNA種の産生の増大を表し、よって、4sUを含む培地における9時間のベロ細胞のインキュベーション中でのウイルスRNAの新規合成を表している。
【0334】
よって、ここで例証された方法は、代謝標識を使用して、複製する(+)ssRNAウイルス、SMRVの検出を可能にする。
【0335】
【0336】
実施例3:
材料および方法
細胞およびウイルス
ベロ細胞(ATCC-CCL-81, batch #62488537, Molsheim, France)のバイアルを、第3継代(passage 3)で凍結し、次にBSL-3の研究室で解凍し、細胞を、10%のFBSを補充したMEMで増殖させた。細胞は、第18継代で使用した。
【0337】
ベロ細胞(batch #70005907)の第2のバイアルが、同じ供給源からもたらされ、PCR試験に直接使用された。
【0338】
ダニ媒介性脳炎ウイルス(TBEV)は、ssRNA(+)ゲノムからなるフラビウイルス科のメンバーである。Hypr株(Wallner et al., 1996. J Gen Virol. 77(Pt 5):1035-42)が、Sarah Moutailler, ANSES, Maisons-Alfort, France)の厚意により供給された。
【0339】
ベロ細胞のTBEV感染の同定
ベロ細胞を、MW6プレートの3つのウェルに400 000個の細胞/ウェルでプレーティングして、24時間後に106個の細胞/ウェルにした。次に、細胞を、1のMOI(感染多重度)でHypr株のTBEVに感染させ、氷上で撹拌しながら1時間インキュベートした。
【0340】
1つのウェルでは、培地をインキュベーションの直後に除去し、細胞を、1mLのTRIzolで溶解し、RNA抽出まで-80℃で保存した(条件「D0-4SUなし」)。
【0341】
他の2つのウェル(条件2、3、および4)では、培地を除去し、MEM+10%のFBSと交換し、37℃で一晩インキュベートした。
【0342】
4sU標識およびRNA抽出
4-チオウリジンを細胞培養培地へ添加することにより、4sUヌクレオチドを新規に合成したRNAに組み込ませることが可能である。4sUの逆転写は、特定のパーセンテージの、cDNAでのT>Cの移行をもたらす誤取り込みを呈し、これはシーケンシングにより同定され得る(Herzog et al., 2017. Nat Methods. 14(12):1198-1204)。
【0343】
800μMの4sUを含む培地を、MEM992μLにおいて100nMの4sUを8μL添加することにより調製した。ウイルス感染の翌日に、培地を除去し、1つのウェルでは4sUを含まない培地(条件「D1-4sUなし」)または他のウェルでは4sUを含む培地(800nM)(条件「D1-4sUあり」)のいずれかと交換した。
【0344】
6時間後に、培地を除去し、条件「D1-4sUなし」では4sUを含まない未処理の培地と交換し、または条件「D1-4sUあり」では未処理の4sUを含む培地と交換した。
【0345】
3時間後に、培地を3つのウェルから除去し、細胞を1mLのTrizolで溶解し、RNA抽出まで-80℃で保存した。
【0346】
RNA抽出を、暗室において、クロロホルム:イソアミルアルコール混合物24:1(Sigma Aldrich, Cat. No. 25666)を使用して行い、次いでイソプロパノール/エタノール沈殿を行った、抽出の間、還元剤(RA)を使用して、4SUで処理したサンプルを還元条件下に維持した。
【0347】
アルキル化を、条件「D1-4sU」の1つのパートのみで、SLAMseq Kinetic kit-Anabolic Kinetics Module(Lexogen, Cat. No. 061, Vienna, Austria)を使用して行った。抽出した総RNAを、ヨードアセトアミド(IAA)と混合して、カルボキシアミドメチル基の付加を介して4sUを含むヌクレオチドの4-チオール基を修飾し、条件「D1-4sU+アルキル化」をもたらした。このアルキル化は、逆転写の間にT>Cの誤取り込みの頻度を増幅させる。他のパートを、「D1-4sUありアルキル化なし」と称した。
【0348】
次に、RNAを、エタノール沈殿を使用して精製した後、ライブラリー調製に進ませた。
【0349】
ライブラリー調製およびシーケンシング
SMARTer Stranded Total RNA-Seq Kit-Pico Input Mammalian(ClonTech, Mountain View, USA)を、10ngのRNAで開始する直接的なライブラリーの構築で使用した。このキットで使用されるワークフローは、哺乳類のrRNAおよび一部のミトコンドリアRNAに特異的なプローブを使用してリボソームcDNAを枯渇させる所有権のある技術(PathoQuest, Paris, France)を組み込んでいる。シーケンシングは、NextSeq 500/550 High Output kit v2(FC-404-2002, Illumina)を使用してNextSeq instrument(Illumina, San Diego, United States)で行った。シーケンシングは、150ヌクレオチドのリード長でシングルリードし、サンプルあたり約1億2500万のリードを作製した。
【0350】
不可知論的なバイオインフォマティクス解析
生のデータのリードをフィルタリングし、高品質かつ関連のあるリードを選択した。生のデータは、重複物、低質のリード、およびホモポリマーを抑制または切断するように選別した(PathoQuestの所有権のあるソフトウェア)。
【0351】
Illuminaライブラリーの調製の間に導入される配列(アダプター、プライマー)は、Skewer(Jiang et al., 2014. BMC Bioinformatics. 15:182)を用いて除去した。
【0352】
ヒトのゲノム(参照GRCh37/hg19)にアライメントした霊長類のリード(ベロ細胞由来)または細菌性rRNAにアライメントしたリードを、廃棄した。ローカルアライメントを、BWA(Li et al., 2009. Bioinformatics. 25(14):1754-60)で行った。ヒトゲノムは、UCSC Genome Browser(Kent et al., 2002. Genome Res. 12(6):996-1006)からダウンロードした。細菌性rRNAデータベースは、最初に、EMBL-EBI ENA rRNAデータベース(ebi.ac.uk/pub/databases/ena/rRNA/release)からダウンロードし、次いで、内部でさらに配列のクリーニングおよびクラスタリングのプロセスを行った。これらフィルタリングされたリードを、目的の配列とみなし、CLC assembly cell solution(Qiagen Hilden, Germany)で「コンティグ」と称されるより長い配列にアセンブリした。得られたコンティグおよびアセンブリされていないリード(シングルトン)を、ウイルスのデータベースおよび総合的なデータベース上にBLASTアライメント(Altschul et al., 1990. J Mol Biol. 215(3):403-10)を使用してアライメントした。コンティグおよびシングルトンを、まず、ウイルスのヌクレオチドデータベースにアライメントした。10-3未満のe値を有するヒットを、総合的なヌクレオチドデータベースにアライメントした。最良のヒットが依然としてウイルスの分類であった場合、ヒットを報告した。
【0353】
ヌクレオチドのウイルスデータベースおよび総合的なデータベースは、EMBL-EBIヌクレオチド配列データベースから2017年11月にダウンロードした。所有権のあるソフトウェア(PathoQuest, Paris, France)を、重複を除去し低い信頼度の配列(たとえば短すぎる、複数の分類、低質の関連するキーワード)を除去するように開発した。ウイルスのヌクレオチドのヒットを全く含まないコンティグを、同様に引き続き、ウイルスおよび総合的なタンパク質のデータベースにアライメントし、より明確に異なるウイルスのヒットを確認した。タンパク質のウイルスおよび総合的なデータベースは、Uniref100データベース(https://www.uniprot.org)から2017年11月にダウンロードした。Uniref100データベースは、すでに冗長ではないが、本発明者らは、最終的なデータベースを作成するために分類学的なクリーニングプロセスを利用した。分類学的な割り当ては、最良のヒットの結果を報告した。これら2ラウンドの割り当て後に割り当てられなかったコンティグは、未知のウイルスまたは非ウイルス種と分類した。
【0354】
上記のプロセスは、完全なTBEVゲノム配列を包有するコンティグを同定した(「結果」を参照)。次に、全てのリードを、この配列上にCLC assembly cell solution(Qiagen, Hilden, Germany)を用いて再度アライメントし、最終的なコンセンサス配列を抽出した。条件「D0-4sUなし」から回収したデータは、TBEVおよびSMRVの全ゲノムをカバーするコンティグを同定することを可能にし、得られた配列は、それぞれ「TBEV REFERENCE」および「SMRV REFERENCE」と命名した。
【0355】
T>C置換率の推定
非常に高い「T-C」置換率を有するウイルスの配列を検出するために、各参照配列を、同様に、全てのTをCで置換することにより修飾した。これら配列は、「TBEV T-C REFERENCE」および「SMRV-T-C REFERENCE」と命名した。「TBEV REFERENCE」および「TBEV T-C REFERENCE」ならびに「SMRV REFERENCE」および「SMRV T-C REFERENCE」を、まとめて融合し、「TBEV BLAST」および「SMRV BLAST」と称される2つのバンクを形成した。次に、質をフィルタリングしたリードのセットを、これらの以前に設計された「BLAST」バンクを使用してBLASTによりアライメントを行った。最大e値を、10-8に設定した。アライメントされたリードのみを、解析の次のステップに選択した。
【0356】
CLCプログラム「clc_find_variations」を使用して、TBEV試験参照の各位置の全てのミスマッチを検出した。次に、グローバルなバリエーションのプロファイルを、所有権のあるスクリプト(PathoQuest, Paris, France)により解析し、各ヌクレオチド置換率を定義した。置換されたヌクレオチドの比率を、アライメントされたヌクレオチドの総数と比較した。たとえば、「T-C」置換率は、以下の式:
T→C置換率=Tが予測された際に同定されるCヌクレオチドの数/予測されるTの総数
を使用して計算した。
【0357】
各時点での置換率は、以下の置換指標:
T→C置換指標=「T→C」の比率/平均(「T→A」、「T→G」の比率)
で正規化した。
【0358】
標識化のクオリティコントロールのため、本発明者らは、参照としての標識されていない細胞を使用してエキソンのセットの平均置換指標を確認した。エキソンは、以下のEisenberg & Levanon(2013. Trends Genet. 29(10):569-74)(RefSeq accession number)により記載されるヒト遺伝子:C1orf43(NM_015449)、CHMP2A(NM_014453)、EMC7(NM_020154)、GPI(NM_000175)から使用した。
【0359】
本発明者らは、これらヒトのエキソンを使用して、ベロ細胞由来の、Cholorcebus sabeusのゲノムにおいてそれらの等価物を同定した。Chlorocebus sabeus(Accession number GCF_000409795.2)の完全なアセンブリは、NCBIのアセンブリデータベース(https://www.ncbi.nlm.nih.gov/assembly/)から回収した。選択したヒトのエキソンを、minimap2(Li, 2018. Bioinformatics. 34(18):3094-3100)を使用してC.sabeusのアセンブリ上にマッピングし、結果得られた.bam fileを、BEDTools utility(Quinlan & Hall, 2010. Bioinformatics. 26(6):841-2)からのbamtobed moduleを使用して.bed fileに変換した。30超のマッピングクオリティを有するヒットのみを保持し(41エクソン)、対応する配列を、BEDTools utilityからのgetfasta moduleを使用してC. sabeusのアセンブリから抽出し、さらなる解析のため指標をつけた。標識化は、置換指標が10超である場合、良好とみなした。
【0360】
鎖の解析
目的の鎖の解析を、同定されたTBEVのリードで行った。この解析は、よりストリンジェントなフィルタリングされたリードのマッピングアライメントに基づくものであり、このアライメントは、詳細な水平のゲノムのカバー度および深度のプロファイルを提供する。ローカルアライメントは、BWAで行った。サンプルのライブラリーはSMARTer Stranded RNA-Seq Kitを使用して調製したため、RNA鎖の情報は、同様に保持された。結果としてマッピングアライメント解析により、各鎖(親鎖に対してセンスまたはリバース)の親鎖の情報を提供することができた。
【0361】
結果
ベロ細胞での不可知論的なRNA-Seqによる外来性(adventitious)ウイルスの同定
最初にベロ細胞を、+4℃で高用量のTBEVと接触させた(D0)。この温度では、細胞受容体に結合するウイルスのみが出現し、ウイルスの侵入は阻害される。よって、この実験的な状況は、複製しないウイルスのキャリーオーバーを模倣している。RNAを抽出し、DNAまたはRNAウイルス感染症のマーカーとしてシーケンシングした。不可知論的な解析の結果、ならびに不可知論的な解析により見出される2つの主なウイルス(TBEVおよびSMRV)のヒットに対するリードのマッピングの結果を、それぞれ表7および表8に示す。
【0362】
【0363】
【0364】
D0で検出された主なウイルス種は、予測されるようにTBEVであったがまた予測外なことに、SMRVであった(表7)。合計約1億5000万の生のリードから160,000超のTBEVのリード(表8)が同定され、これは全ゲノムをカバーする。次に、ベロ細胞を、ウイルスを侵入させるために37℃にシフトし、次に、回収前に1日間インキュベートした。リードの数は、520万から640万へと記録されるTBEVのリードを著しく増大させた。さらに、SMRV-H(ヒトのリンパ系細胞株から同定されたSMRV(Oda et al., 1988. Virology. 167(2):468-76)))に対してマッピングした160万~180万のリードも同様に、回収の日とは無関係に同定された。これは、SMRVの転写物が、TBEVによる実験的な感染とは全く関係なく細胞により発現されたことを意味している。
【0365】
また本発明者らは、多くの他のヒットを同定した(表8)。主なさらなるヒットは、ベロ細胞の既知の内因性ウイルスである、ヒヒ内因性ウイルスであった(Ma et al., 2011. J Virol. 85(13):6579-88)。内因性ヒトレトロウイルスに対してマッピングした数百のリードが、同様に報告された。本発明者らの実験では、この知見は、霊長類/ヒトの細胞株で高頻度である。また本発明者らは、ガンマ線照射されたウシ血清の使用と通常関連する、数個のBVDVのリードを見出した。また本発明者らは、異なるヘルペスウイルスに対する数個のリード(<50)を同定し、バックグラウンドノイズとみなした。
【0366】
不活性な配列の細胞感染症対キャリーオーバーの区別
本発明者らの主な目的は、細胞の早期感染を検出するためHTSの特質を試験しながら、細胞感染とキャリーオーバーを区別するため困難な条件を模倣することであったため、本発明者らは、+4℃でウイルスの複製を阻害された高用量のTBEVと接触させた細胞の結果を、感染から24時間後の同じ用量のウイルスで感染させた細胞の結果と比較した。前者はウイルスを不活性化させた細胞または遊離する核酸を模倣し、後者は、バンクへ預ける直前に感染した細胞を模倣していた。TBEVはプラス鎖ssRNAウイルスであるため、マイナス鎖センスRNAを、ウイルス複製のマーカーとして使用した。D1で試験した3つの条件(4uSなし、4sU+アルキル化、4sUありアルキル化なし)は、D0での0.27%と比較して0.32~0.36%のリードがマイナス鎖であり、非常に小さいが著しく有意な差(カイ二乗検定、p<0.0001)であったことを示した。この種の比較解析は、転写がマトリックスとしてDNAプロウイルスを使用し、主にプラス鎖ではあるが同様にマイナス鎖のRNAをもたらすレトロウイルスの、SMRVによる細胞の慢性的な感染に適切ではない(Manghera et al., 2017. Virol J. 14(1):9)。
【0367】
次に、本発明者らは、新規に合成したRNAの4sUにより代謝標識した後の「T-C」置換のTBEVの比率を試験した(表9および
図1)。
【0368】
【0369】
D1で、代謝標識の非存在下において、「T-C」の比率は、非常に低く(0.13%)、「T-A」または「T-G」の比率(0.04-0.13%)と同様であり、1.68の計算されたバックグラウンドの置換指標をもたらした。同様の結果がD0から得られ、これは置換のバックグラウンドの良好な再現性を表している。
【0370】
上記とは明確に異なり、D1での標識しアルキル化されたTBEVのRNAの「T-C」置換率は高く(0.79%)、バックグラウンドと比較して3.8倍の、6.4の置換指標をもたらした。標識しアルキル化したSMRV細胞のD1での置換指標は、24.16であり、バックグラウンドと比較して10.7倍であった。
【0371】
代謝標識したRNAと標識されていないRNAの比較は、2つの培養条件を必要とする。結果として、本発明者らはまた、RNAのアルキル化を伴うかまたは伴わない、4sUで標識した培養物に関してD1で得たTMEVおよびSMRVの置換指標を比較した。これは、1つの培養条件のみを必要とし、次いでRNA抽出およびアルキル化を行うか、または処理を行わない。RNAを4sUで標識しアルキル化していない細胞での低レベルの置換は、潜在的なウイルスのヒットのblast解析による検出を損なうものではなかった(表8)。表9および
図1Bに示されるように、4sUで標識しアルキル化していないRNAの置換指標は依然として低く、標識していない条件の指標と近かった(TBEVおよびSMRVではそれぞれ1.71および2.27、アルキル化の条件ではそれぞれ4.0倍および10.6倍増大する)。これは、同じ細胞培養物から抽出されたアルキル化されていないRNAが、置換率を計算するために使用される参照のコンセンサスなウイルスバンクを確立するために使用され得ることを示唆している。よって、本発明者らの結果は、細胞の4sU標識化の後のRNA-seqが、高いシグナル-バックグラウンドノイズ比で新規に合成されるウイルスのRNAを特異的に同定できたことを示している。
【0372】
最後に、本発明者らはまた、TBEV(
図2)およびSMRV(
図3)で、4sU標識化しアルキル化した細胞でのT→C置換率と同じ細胞で観察されるT→AおよびT→G置換の間の比率を比較した。
【0373】
これら比率を、表10に提供する。1超の置換率は、サンプルにおいて活性な転写を表す。よってこれら結果は、本発明の方法が、単一の条件(D1-4sU+アルキル化)で異なるヌクレオチドの置換率を比較することにより生きているTMEVおよびSMRVを区別および検出できることを明確に示している。
【0374】
【0375】
実施例4:
材料および方法
細胞およびモリクテス
A549(ATCC_CCL-185)細胞を、混入前に、DMEM-ダルベッコ改変イーグル培地において、6ウェルプレートで約70%のコンフルエンスまで増殖させた。
【0376】
アコレプラズマ・ライドラウィー(Acholeplasma laidlawii)は、A549細胞に感染させるために選択されたモリクテス綱の代表である。
【0377】
A549細胞のAcholeplasma laidlawii感染
約70%のコンフルエンスで、A549細胞の培養培地を、7%のウシ胎仔血清および1%のグルタミンを補充し、抗菌剤を含まないMEM-Earle培地と交換した。0日目に、細胞を、様々な感染用量のAcholeplasma laidlawiiで感染させた(表11)。5日目に、4-チオウリジン(4sU)(800μM)を、上清を回収する9時間前、6時間前、および3時間前に培養培地に添加した。37℃で5日間インキュベートした後に2mLの培養培地を除去し、200gで5分間遠心分離することにより清澄した。清澄した上清1mlを、10分間15000~20000gで遠心分離し、900μLの上清を除去し、ペレットを、残りの100μLの上清にホモジナイズした。次に、サンプルを、核酸抽出の前に凍結した。
【0378】
4-チオウリジン(4sU)を細胞培養培地に添加することにより、4sUヌクレオチドを新規に合成されるRNAに組み込ませることができる。4sUの逆転写は、特定のパーセンテージの、cDNAでのT→Cの移行をもたらす誤取り込みを呈し、これは、シーケンシングにより同定され得る(Herzog et al., 2017. Nat Methods. 14(12):1198-1204)。
【0379】
【0380】
CTRL5Tagは、対照サンプルであり、Acholeplasma laidlawiiで感染されておらず、5日目に4SUで標識されている。
【0381】
LC5は、5日目に低濃度のAcholeplasma laidlawiiに感染させたサンプルである。
【0382】
LC5Tagは、低濃度のAcholeplasma laidlawiiに感染させ5日目に4SUで標識したサンプルである。
【0383】
HC_HK5tagは、感染前に加熱殺菌した高濃度のAcholeplasma laidlawiiに感染させ、5日目に4SUで標識したサンプルである。
【0384】
HC_G5tagは、感染前にゲンタマイシンで処理した高用量のAcholeplasma laidlawiiに感染させ、5日目に4SUで標識したサンプルである。
【0385】
RNA抽出
RNA抽出を、暗室において、クロロホルム:イソアミルアルコール混合物24:1(Sigma Aldrich, Cat. No. 25666, Saint Louis, USA)を使用して行い、次いでイソプロパノール/エタノール沈殿を行った。抽出の間、還元剤を使用して、4sUで処理したサンプルを還元条件下に維持した。
【0386】
アルキル化を、条件「D1-4sU」の1つのパートのみでSLAMseq Kinetic kit-Anabolic Kinetics Module (Lexogen, Cat. No. 061, Vienna, Austria)を使用して行った。抽出した総RNAを、ヨードアセトアミド(IAA)と混合して、カルボキシアミドメチル基の付加を介して4sUを含むヌクレオチドの4-チオール基を修飾し、条件「D1-4sU+アルキル化」をもたらした。このアルキル化は、逆転写の間T>Cの誤取り込みの頻度を増幅させる。他のパートは、「D1-4sUありアルキル化なし」と称した。
【0387】
次に、RNAを、エタノール沈殿を使用して精製した後に、ライブラリー調製に進ませた。
【0388】
ライブラリー調製およびシーケンシング
SMARTer Stranded Total RNA-Seq Kit-Pico Input Mammalian(ClonTech, Mountain View, USA)を、10ngのRNAで開始する直接的なライブラリーの構築のために使用した。細菌起源のリボソームRNA(16Sおよび23S)の枯渇は、Ribominus Bacteria Transcriptome analysis kit(thermoFisher)を使用して総RNAで行った。哺乳類のrRNAおよび一部のミトコンドリアRNAに特異的なプローブを使用したリボソームcDNAの枯渇も同様に行った(SMARTer Stranded Total RNA-Seq kitに含まれる、製造者の推奨(ClonTech)を使用しライブラリー調製の前)。シーケンシングを、NextSeq mid output flow cell(FC-404-1001, Illumina)を使用してNext Seq instrument(Illumina, San Diego, United States)で行った。シーケンシングを、150ヌクレオチドのリード長でシングルリードし、サンプルあたり約1億2500万のリードを作製した。
【0389】
不可知論的なバイオインフォマティクス解析
生のデータのリードをフィルタリングし、高品質かつ関連のあるリードを選択した。生のデータは、重複物、低質のリード、およびホモポリマーを抑制または切断するように選別した(PathoQuestの所有権のあるソフトウェア)。
【0390】
Illuminaライブラリーの調製の間に導入された配列(アダプター、プライマー)は、Skewer(Jiang et al., 2014. BMC Bioinformatics. 15:182)を用いて除去した。
【0391】
最初に、LC5条件のフィルタリングしたリードを、目的の配列とみなした。この条件は、高い含有量の目的の生物の標識されていない配列を含む可能性が非常に高いため、これは、目的の生物(Acholeplasama laidlawii)のゲノムの再構築を可能にする。よって、LC5のリードを、Megahit(Li et al., 2015. Bioinformatics. 31(10):1674-1676)で「コンティグ」と称されるより長い配列にアセンブリした。次に、得られたコンティグを、Acholeplasma laidlawii株のPG8Aゲノム(RefSeq AccNum CP000896.1)上にminimap2(Li, 2018. Bioinformatics. 34(18):3094-3100)で逆にマッピング(mapped back)した。次に、正のヒットを、Mummer 3(Kurtz et al., 2004. Genome Biol. 5(2):R12)を使用してAcholeplasma laidlawii株のPG8Aゲノムにタイル表示させ、
1.A. laidlawiiとして潜在的に検出されるコンティグの同一性を確認し、
2.新規に構築される配列の完全性を確保した。
【0392】
コンティグの同一性が評価され、タイリングが検証された後、コンティグを、.fasta fileにプールし、さらなる解析のための参照ゲノム(本明細書中以降でLC5_ALAID_CNSと呼ばれる)として提供した。
【0393】
T>C置換率の推定
非常に多数のT→C置換を有するA. laidlawii配列を検出するために、質によりフィルタリングされたリードのセットを、non-multimap mode(Li, 2018. Bioinformatics. 34(18):3094-3100)にてminimap2で、LC5_ALAID_CNSに対して逆にマッピングした。次に、htsbox software(https://github.com/lh3/htsbox)のpileup moduleを使用して、LC5_ALAID_CNS配列の全ての位置の全てのミスマッチ(少なくとも30に相当するベースクオリティを有する)を検出した。次に、全体的なバリエーションのプロファイルを、所有権のあるスクリプト(PathoQuest, Paris, France)を使用して解析し、各ヌクレオチドの置換率を定義した。置換されたヌクレオチドの比率を、アライメントされたヌクレオチドの総数と比較した。たとえば、T→C置換率は、以下の式:
T→C置換率=Tが予測された際に同定されるCヌクレオチドの数/予測されるTの総数
を使用して計算した。
【0394】
各時点での置換率は、以下の置換指標:
T→C置換指標=「T→C」比率/平均(「T→A」、「T→G」の比率)
で正規化した。
【0395】
結果
シーケンシングのスループット
シーケンシングランのスループットを、表12に報告する。ほぼ全ての条件で、1000万超のシングルエンドリードがもたらされている。各条件では、リードの90%超が、フィルタリングステップの後に保持されており、シーケンシングのランが高品質であり、よってその後の解析に適していることを表している。
【0396】
【0397】
参照ゲノムの再構築
LC5のリードのアセンブリプロセスは、877のコンティグのセットの作製を可能にしたト(累積長 1,374,213、最小長=201;平均長=1,566.9;最大長=15,043)。A.laidlawii PG8A(CP000896.1)ゲノム配列上への再マッピングは、LC5_ALAID_CNSの再構築の候補として662のコンティグの明確な選択を可能にした(累積長 1,287,020;最小長=301;平均長=1,944.1;最大長=15,043)。最初の確認として、GC含有量分布および統計を、コンティグのセットにおける生物の可能性のある混合を証明するために調査した(
図4)。
【0398】
図4にみられるように、GC含有量の分布は単峰性であり、コンティグのセットにおいていくつかの生物を代表するコンティグが存在する可能性が低いことを示唆している。さらに、このセットの平均GC含有量は、予測と有意に異なるものではない(A. laidlawii str. PG8Aでは32.01%vs31.93%)。
【0399】
本発明者らがA. laidlawii str. PG8A近縁の全ゲノム(または少なくとも有意な一部)を再構築できたことを確かにするために、本発明者らは、LC5実験条件のリードの最初のアセンブリから選択されたコンティグで後者を「タイル表示させた(tiled)」。この結果を
図5に提示する。
【0400】
図5に示されるように、662のコンティグのセットは、高い類似性(全ての場合で99%超、データ不図示)でほぼ全てのA. laidlawii str. PG8Aをカバーしており、再構築されたLC5_ALAID_CNSが、A. laidlawii str. PG8Aの非常に近い近縁であることを強力に示唆している。
【0401】
結論として、本発明者らは、
1.A. laidlawiiに対応するコンティグの明確なセットを選択でき
2.近縁(A. laidlawii str. PG8A)の完全なゲノムをカバーできた。
【0402】
よってこのプロセスは、さらなる解析のため本発明者らの参照配列LC5_ALAID_CNSを立証している。
【0403】
置換率および指標
低くカバーされた位置は、良好にカバーされたものと同じ重みで説明されるため、比率の推定でバイアスを誘導し得る。実際にある位置が3回のみカバーされ、1度がT→C置換である場合、この位置のT→C置換率は、これが真の置換であり得るかまたはシーケンシング/アセンブリの誤りであり得るかのいずれかという事実にも関わらず、33%である。したがって、置換率、よって置換指標の過大評価を回避するために、本発明者らは、全ての検出されたイベントを最初に選択し(すなわち少なくとも1回カバーされている(1X))、次に、少なくとも20回(すなわち20X)カバーされたイベントを選択する解析を行い、この後者を、著しく確信的なイベントとみなした。
【0404】
置換率および指標が表13に報告されている。全体的に、本発明者らはここで、移行T→Cの比率が、トランスバージョン後に従来の変異パターンの好ましい移行として予測される、トランスバージョンT→AおよびT→Gの比率よりも常に高いことを示している。
【0405】
さらに、T→C置換率は、イベントの選択レベルが何であっても、他の全て条件(高充填の不活性化されたサンプル(HC_HK5Tag)を含む)と比較してLC5tagおよび40倍希釈したLC5tag条件で有意に高い。さらに、この解析で低くカバーされた位置の包含は、観察された比率が1Xおよび20Xの閾値で有意に異なるものではなく、さらに後者はバックグラウンドノイズを限定するため、結果にほとんど影響しなかった。同じ傾向が、置換指標で観察可能である。
【0406】
【0407】
結論として、報告された結果は、A.laidlawiiによりスパイクされおよび4sUにより標識されると予測される実験がこのように検出されたことを示した。
【0408】
位置分析
本発明者らは、置換率および置換指標の全体的な増加を報告している。これら増加が、置換のホットスポットからもたらされているかどうかを調査するために、本発明者らは、LC5_ALAID_CNS参照配列に沿って置換率を評価する位置分析を行った(
図6A~G)。
【0409】
本発明者らは、一部のピークがこの条件を介して可視できるCTRL5tagの実験条件におけるA.laidlawiiのリードの存在が、Acholeplasma laidlawiiでスパイクしていないことに気づいた(
図6A)。ほとんどの比率は100%に達し、これら置換が実際に現実のSNPであることが示唆される。この知見は、実験的なレベルでのコンタミネーションまたはサンプルをマルチプレックスする際のシーケンシングの段階の間の交差指標コンタミネーション(いわゆるindex hopping)のいずれかを示唆した。にもかかわらず、これはきわめて限定された数の位置に関するものであるため、この分析を損なうものではなかった。
【0410】
図6Bは、全てのゲノムの位置が良好にカバーされている(すなわちカバー度の穴がない)LC5条件での置換のかなり低いバックグラウンドを示している。現実のドミナントな置換のタイプが可視できず、これは全体的な尺度の解析と一致している。対照的に、LC5tagおよび40倍に希釈したLC5tagの条件では、バックグラウンドから出現する大きなT→Cのピークを区別でき、標識の成功、よってA. laidlawiiにおける活性の転写が表されている(
図6Cおよび6D)。
【0411】
図6Eおよび6Fは、A. laidlawii細胞が熱により殺滅されている実験条件(HC_HK5tagおよび4°HC_HK5tag)の4sU標識の結果を示す。両方の事例において、本発明者らは、LC5tagおよび40X_LC5tagの条件と比較して少数のピーク(特にT→Cピーク)を観察し、加熱後培地において少数の生きている細菌が残存しているため少数の抽出されたRNAが確認された。
【0412】
同様に、ゲンタマイシン処理は、同じ効果(HC_G5条件;
図6G)があったが、HC_HK5tag実験条件(
図6Eおよび6F)での熱の効果と比較して明らかに中程度であった。さらに、4sU標識は未だ可視でき、中程度の置換指標で全体的な解析を確認した(表13)。
【0413】
実施例5
材料および方法
細胞およびモリテクス
A549(ATCC_CCL-185)細胞を、コンタミネーション前に、DMEM-ダルベッコ改変イーグル培地において、6ウェルプレートで約70%のコンフルエンスまで増殖させた。
【0414】
A549細胞のAcholeplasma種またはマイコプラズマ種の感染
約70%のコンフルエンスで、A549細胞の培養培地を、7%のウシ胎仔血清および1%のグルタミンを補充し、抗菌剤を含まないMEM-Earle培地と交換した。細胞を、様々な感染用量のAcholeplasma laidlawii種またはマイコプラズマ種で感染させた
【0415】
CTRL5Tag:Acholeplasma laidlawii種またはマイコプラズマ種に感染させておらず、5日目に、4-SUで標識した対照サンプル
LC5:低濃度のAcholeplasma laidlawii種またはマイコプラズマ種に感染させたサンプル;
LC5Tag:低濃度のAcholeplasma laidlawii種またはマイコプラズマ種で感染させ、5日目に、4-SUで標識したサンプル;
HC_HK5tag:感染前に加熱殺菌した高濃度のAcholeplasma laidlawii種またはマイコプラズマ種に感染させ、5日目に、4-SUで標識したサンプル;
HC_G5tag:感染前にゲンタマイシンで処理した高濃度のAcholeplasma laidlawii種またはマイコプラズマ種に感染させ、5日目に、4-SUで標識したサンプル
である、いくつかの条件が試験される。
【0416】
5日目に、4-チオウリジン(4sU)(800μM)を、細胞の回収の9時間前、6時間前、および3時間前に培養培地に添加する。37℃、5日間のインキュベーションの後、培養培地を除去し、細胞をペレット状にし、RNA抽出前に凍結した。
【0417】
4-チオウリジン(4sU)を細胞培養培地に添加することにより、4sUヌクレオチドを新規に合成されるRNAに組み込ませることができる。4sUの逆転写は、特定のパーセンテージのcDNAのT>Cの移行をもたらす誤取り込みを呈し、これはシーケンシングにより同定され得る(Herzog et al., 2017. Nat Methods. 14(12):1198-1204)。
【0418】
RNA抽出
RNA抽出を、暗室において、クロロホルム:イソアミルアルコール混合物24:1(Sigma Aldrich, Cat. No. 25666)を使用して行い、次いでイソプロパノール/エタノール沈殿を行う。抽出の間、還元剤(RA)を使用して、4SUで処理したサンプルを還元条件下に維持する。
【0419】
アルキル化を、条件「D1-4sU」の1つのパートのみでSLAMseq Kinetic kit-Anabolic Kinetics Module(Lexogen, Cat. No. 061, Vienna, Austria)を使用して行う。抽出した総RNAを、ヨードアセトアミド(IAA)と混合して、カルボキシアミドメチル基の付加を介して4sUを含むヌクレオチドの4-チオール基を修飾し、条件「D1-4sU+アルキル化」をもたらす。このアルキル化は、逆転写の間T>Cの誤取り込みの頻度を増大させる。
【0420】
次に、RNAを、エタノール沈殿を使用して精製した後、ライブラリー調製に進ませる。
【0421】
ライブラリー調製およびシーケンシング
SMARTer Stranded Total RNA-Seq Kit-Pico Input Mammalian(ClonTech, Mountain View, USA)を、10ngのRNAで開始する直接的なライブラリーの構築のために使用する。細菌起源のリボソームRNA(16Sおよび23S)の枯渇は、Ribominus Bacteria Transcriptome analysis kit(thermoFisher)を使用して総RNAで行った。哺乳類のrRNAおよび一部のミトコンドリアRNAに特異的なプローブを使用したリボソームcDNAの枯渇も同様に行った(SMARTer Stranded Total RNA-Seq kitに含まれる、製造者の推奨(ClonTech)を使用しライブラリー調製の前)。シーケンシングを、NextSeq 500/550 High Output kit v2(FC-404-2002, Illumina)を使用してIllumina instrument(Illumina, San Diego, United States)で行う。シーケンシングを、150ヌクレオチドのリード長でペアエンドを行い、サンプルあたり約1億のリードを作製する。
【0422】
不可知論的なバイオインフォマティクス解析
生のデータのリードをフィルタリングし、高品質かつ関連のあるリードを選択する。生のデータは、重複物、低質のリード、およびホモポリマーを抑制または切断するように選別する((PathoQuestの所有権のあるソフトウェア)。
【0423】
Illuminaライブラリーの調製の間に導入される配列(アダプター、プライマー)は、Skewer(Jiang et al., 2014. BMC Bioinformatics. 15:182)を用いて除去する。
【0424】
陰性対照条件(標識されていないか、不活性化されているか、またはその両方)のフィルタリングしたリードを、最初に目的の配列と企図する。これら条件は、目的の生物の配列の著しい充填を含む可能性が非常に高いため、これは、目的の生物(Acholeplasma種またはマイコプラズマ種)のゲノムの再構築を可能にする。よってこれらリードは、Megahit(Li et al., 2015. Bioinformatics. 31(10):1674-1676)で「コンティグ」と呼ばれるより長い配列にアセンブリされる。次に、得られたコンティグを、Acholeplasma 種またはマイコプラズマ種の菌株のPG8Aのゲノム(RefSeq AccNum CP000896.1)上にminimap2 Li, 2018. Bioinformatics. 34(18):3094-3100)で逆にマッピングする。次に、正のヒットを、Mummer 3(Kurtz et al., 2004. Genome Biol. 5(2):R12)を使用してAcholeplasma種またはマイコプラズマ種の上に「タイル表示」させて、
1.Acholeplasma種またはマイコプラズマ種として潜在的に検出されるコンティグの同一性を確認し、
2.新規に構築された配列(本明細書中以降でALAID_CNSと称される)の完全性を確保する。
【0425】
T>C置換率の推定
非常に多数のT→C置換を有するAcholeplasma種またはマイコプラズマ種を検出するために、質でフィルタリングされたリードのセットを、non-multimap modeのminimap2(Li, 2018. Bioinformatics. 34(18):3094-3100)でALAID_CNSに逆にマッピングする。次に、htsbox software(https://github.com/lh3/htsbox)のpileup moduleを使用して、ALAID_CNS配列の全ての位置の全てのミスマッチ(少なくとも30に相当するベースクオリティを有する)を検出する。次に、全体的なバリエーションのプロファイルを、所有権のあるスクリプト(PathoQuest, Paris, France)を使用して解析し、各ヌクレオチドの置換率を定義する。置換されたヌクレオチドの比率を、アライメントしたヌクレオチドの総数と比較する。たとえば、T→C置換率は、以下の式:
T→C置換率=Tが予測された際に同定されるCヌクレオチドの数/予測されるTの総数
を使用して計算する。
【0426】
各時点での置換率は、以下の置換指標:
T→C置換指標=「T→C」比率/平均(「T→A」、「T→G」の比率)
で正規化する。