IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ビケンバイオミクスの特許一覧

特許7421800検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法
<>
  • 特許-検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法 図1
  • 特許-検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法 図2
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-17
(45)【発行日】2024-01-25
(54)【発明の名称】検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法
(51)【国際特許分類】
   C12Q 1/6888 20180101AFI20240118BHJP
【FI】
C12Q1/6888 Z
【請求項の数】 6
(21)【出願番号】P 2020096551
(22)【出願日】2020-06-03
(65)【公開番号】P2021185866
(43)【公開日】2021-12-13
【審査請求日】2022-08-03
【新規性喪失の例外の表示】特許法第30条第2項適用 令和1年7月9日にEmerging Microbes & Infections 第8巻 第1号 第1043~1053頁にて発表
(73)【特許権者】
【識別番号】515316517
【氏名又は名称】株式会社ビケンバイオミクス
(74)【代理人】
【識別番号】100121728
【弁理士】
【氏名又は名称】井関 勝守
(74)【代理人】
【識別番号】100165803
【弁理士】
【氏名又は名称】金子 修平
(72)【発明者】
【氏名】中村 昇
(72)【発明者】
【氏名】中村 昇太
(72)【発明者】
【氏名】松本 悠希
(72)【発明者】
【氏名】金城 武士
【審査官】吉門 沙央里
(56)【参考文献】
【文献】KIM, Si Hyun et al.,J Clin Lab Anal,2018年,vol.32, e22184,p.1-6
【文献】LUO, Liulin, et al.,Medicine,2016年,vol. 95, no.3,p. 1-11
【文献】WUZINSKI, Michelle et al.,International Journal of Mycobacteriology,2019年,vol. 8, issue 3,p. 273-280
【文献】HASHEMI-SHAHRAKI, Abdolrazagh et al.,Infection, Genetics and Evolution,2013年,vol. 20,p. 312-324
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00-3/00
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
MLST(multi-locus sequence typing)法によって検体中に存在する非結核性抗酸菌(Non-Tuberculous Mycobacteria:NTM)の種又は亜種を同定するためのシステムであって、
前記検体中に存在するNTMのゲノム配列のうち複数の遺伝子の配列情報を得るためのシーケンシング装置と、
既知のNTMにおける複数の遺伝子の配列情報を格納するデータベースと、
前記シーケンシング装置により得られた複数の遺伝子の配列情報と、前記データベースに格納された前記複数の遺伝子の配列情報とを比較して、前記データベースに格納された前記既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するソフトウェアとを備え、
前記複数の遺伝子は、rpsA、rpsB、rpsC、rpsD、rpsE、rpsF、rpsG、、rpsH、rpsI、rpsJ、rpsK、rpsL、rpsM、rpsN、rpsO、rpsP、rpsQ、rpsR、rpsS、rpsT、rpsU、rplA、rplB、rplC、rplD、rplE、rplF、rplL、rplI、rplJ、rplK、rplM、rplN、rplO、rplP、rplQ、rplR、rplS、rplT、rplU、rplV、rplW、rplX、rpmA、rpmB、rpmC、rpmD、rpmE、rpmF、rpmG、rpmH、rpmI、rpmJ、Rv0440、Rv0667、rrs、rrl、Rv0005、Rv0006、Rv1484、Rv1694、Rv1908c、Rv1988、Rv2043c、Rv2416c、Rv3795、Rv3614c、Rv3615c、Rv3616c、Rv3849、Rv3862c、Rv3864、Rv3865、Rv3866、Rv3867、Rv3868、Rv3869、Rv3870、Rv3871、Rv3872、Rv3873、Rv3874、Rv3875、Rv3876、Rv3877、Rv3878、Rv3879c、Rv3880c、Rv3881c、Rv3882c、Rv3883c、Rv3884c、Rv3885c、Rv3886c、Rv3887c、Rv3889c、Rv3890c、Rv3891c、Rv3892c、Rv3893c、Rv3894c、Rv3895c、Rv0282、Rv0283、Rv0284、Rv0285、Rv0286、Rv0287、Rv0288、Rv0289、Rv0290、Rv0291、Rv0292、Rv3444c、Rv3445c、Rv3447c、Rv3448、Rv3449、Rv3450c、Rv1782、Rv1783、Rv1785c、Rv1787、Rv1788、Rv1789、Rv1790、Rv1791、Rv1793、Rv1795、Rv1796、Rv1797、Rv1798、Rv2430c、Rv2431c、Rv3097c、Rv0176、Rv0177、Rv0167、Rv0168、Rv0169、Rv0170、Rv0171、Rv0172、Rv0173、Rv0174、Rv0589、Rv0591、Rv0592、Rv0593、Rv0594、Rv1966、Rv1967、Rv1968、Rv1969、Rv1970、Rv1971、Rv3494c、Rv3495c、Rv3496c、Rv3497c、Rv3498c、Rv3499c、Rv0754、Rv0834c、Rv0978c、Rv1169c、Rv1818c、Rv2396、Rv3508、Rv3511、Rv3514、Rv3746c、Rv3812、Rv0638、Rv0732、Rv1008、Rv1224、Rv1821、Rv2093c、Rv2094c、Rv2586c、Rv2587c、Rv2588c、及びRv3240cの184種の遺伝子から選択され且つ少なくとも30SリボソームS1~S21(rpsA~U)、50SリボソームL1~L36(rplA~F、I~U、rpmA~J)、5SリボソームRNA(rrf)、16SリボソームRNA(rrs)、23SリボソームRNA(rrl)、rpoB、groEL2、gyrB、inhA、tlyA、katG、pncA、erm、eis及びembBを含むことを特徴とするシステム。
【請求項2】
前記データベースは、https://github.com/ymatsumoto/mlstverse.Mycobacterium.dbのURLからアクセス可能なデータベース(2019年3月25日公開時の情報)であることを特徴とする請求項1に記載のシステム。
【請求項3】
前記ソフトウェアは、https://github.com/ymatsumoto/mlstverseのURLからアクセス可能なソフトウェア(2019年4月15日更新時の情報)であることを特徴とする請求項1又は2に記載のシステム。
【請求項4】
MLST(multi-locus sequence typing)法によって検体中に存在する非結核性抗酸菌(Non-Tuberculous Mycobacteria:NTM)の種又は亜種を同定する方法であって、
前記検体中に存在するNTMに対して、シーケンシングを行って前記NTMのゲノム配列のうち複数の遺伝子の配列情報を得るステップと、
前記得られた配列情報を、所定のデータベースに格納された既知のNTMにおける前記複数の遺伝子の配列情報と比較するステップと、
前記複数の遺伝子の配列情報の比較の結果、前記データベースに格納された既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するステップとを備え、
前記複数の遺伝子は、rpsA、rpsB、rpsC、rpsD、rpsE、rpsF、rpsG、、rpsH、rpsI、rpsJ、rpsK、rpsL、rpsM、rpsN、rpsO、rpsP、rpsQ、rpsR、rpsS、rpsT、rpsU、rplA、rplB、rplC、rplD、rplE、rplF、rplL、rplI、rplJ、rplK、rplM、rplN、rplO、rplP、rplQ、rplR、rplS、rplT、rplU、rplV、rplW、rplX、rpmA、rpmB、rpmC、rpmD、rpmE、rpmF、rpmG、rpmH、rpmI、rpmJ、Rv0440、Rv0667、rrs、rrl、Rv0005、Rv0006、Rv1484、Rv1694、Rv1908c、Rv1988、Rv2043c、Rv2416c、Rv3795、Rv3614c、Rv3615c、Rv3616c、Rv3849、Rv3862c、Rv3864、Rv3865、Rv3866、Rv3867、Rv3868、Rv3869、Rv3870、Rv3871、Rv3872、Rv3873、Rv3874、Rv3875、Rv3876、Rv3877、Rv3878、Rv3879c、Rv3880c、Rv3881c、Rv3882c、Rv3883c、Rv3884c、Rv3885c、Rv3886c、Rv3887c、Rv3889c、Rv3890c、Rv3891c、Rv3892c、Rv3893c、Rv3894c、Rv3895c、Rv0282、Rv0283、Rv0284、Rv0285、Rv0286、Rv0287、Rv0288、Rv0289、Rv0290、Rv0291、Rv0292、Rv3444c、Rv3445c、Rv3447c、Rv3448、Rv3449、Rv3450c、Rv1782、Rv1783、Rv1785c、Rv1787、Rv1788、Rv1789、Rv1790、Rv1791、Rv1793、Rv1795、Rv1796、Rv1797、Rv1798、Rv2430c、Rv2431c、Rv3097c、Rv0176、Rv0177、Rv0167、Rv0168、Rv0169、Rv0170、Rv0171、Rv0172、Rv0173、Rv0174、Rv0589、Rv0591、Rv0592、Rv0593、Rv0594、Rv1966、Rv1967、Rv1968、Rv1969、Rv1970、Rv1971、Rv3494c、Rv3495c、Rv3496c、Rv3497c、Rv3498c、Rv3499c、Rv0754、Rv0834c、Rv0978c、Rv1169c、Rv1818c、Rv2396、Rv3508、Rv3511、Rv3514、Rv3746c、Rv3812、Rv0638、Rv0732、Rv1008、Rv1224、Rv1821、Rv2093c、Rv2094c、Rv2586c、Rv2587c、Rv2588c、及びRv3240cの184種の遺伝子から選択され且つ少なくとも30SリボソームS1~S21(rpsA~U)、50SリボソームL1~L36(rplA~F、I~U、rpmA~J)、5SリボソームRNA(rrf)、16SリボソームRNA(rrs)、23SリボソームRNA(rrl)、rpoB、groEL2、gyrB、inhA、tlyA、katG、pncA、erm、eis及びembBを含むことを特徴とする方法。
【請求項5】
前記データベースは、https://github.com/ymatsumoto/mlstverse.Mycobacterium.dbのURLからアクセス可能なデータベース(2019年3月25日公開時の情報)であることを特徴とする請求項に記載の方法。
【請求項6】
前記得られた配列情報を、所定のデータベースに格納された既知のNTMにおける前記複数の遺伝子の配列情報と比較するステップ、及び前記複数の遺伝子の配列情報の比較の結果、前記データベースに格納された既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するステップは、https://github.com/ymatsumoto/mlstverseのURLからアクセス可能なソフトウェア(2019年4月15日更新時の情報)により行われることを特徴とする請求項4又は5に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検体中に存在する非結核性抗酸菌の種又は亜種を同定するためのシステム及び方法に関する。
【背景技術】
【0002】
従来からマイコバクテリウム属細菌はさまざまな感染症を引き起こすことが知られており、大きく分けて結核を引き起こす結核菌、ハンセン病の原因となるらい菌、そしてそれら以外の非結核性抗酸菌(Non-Tuberculous Mycobacteria:NTM)の3つに分類される。
【0003】
上記結核やハンセン病については予防法や治療法が確立されている一方で、NTMにより主に引き起こされる呼吸器感染症(NTM症)については、予防法や治療法が未だ十分に確立されていない。このため、NTM症は、公衆衛生上、重要な感染症に位置付けられている。また、近年、NTM症の罹患率の増大が報告されている(例えば非特許文献1等を参照。)。
【0004】
NTM症の治療方針を立てる上でまず重要なことは原因菌種・亜種を同定することであり、そのために、従来は抗酸染色法や質量分析法などが用いられていた。近年では、上記同定のために、特に、検体における複数のハウスキーピング遺伝子のDNAシーケンシングを行い、データベースに登録されたDNA配列と比較するMLST(multi-locus sequence typing)法が利用されている(例えば非特許文献2、3等を参照。)。ゲノム情報に基づいたいくつかの方法では、リボソーム遺伝子やコアゲノム及び全ゲノム情報を利用して菌種の亜種レベルの同定を成功している(例えば非特許文献4~6等を参照)。
【先行技術文献】
【非特許文献】
【0005】
【文献】Namkoong H. et al. Emerg Infect Dis. 2016, 22, 1116-1117.
【文献】Stackebrandt E. et al. Int J Syst Evol Microbiol. 1994, 44, 846-849.
【文献】Enright MC. et al. Trends Microbiol. 1999, 7, 482-487.
【文献】Maiden MCJ. et al. Nat Rev Microbiol. 2013, 11, 728-736.
【文献】Zolfo M. et al. Nucleic Acid Res. 2016, 1, 1-10.
【文献】Jolley KA. et al. BMC Bioinformatics. 2010, 11, 595.
【発明の概要】
【発明が解決しようとする課題】
【0006】
MLST法を用いる場合、上記の通り、検体のDNA配列とデータベースに登録された菌種のDNA配列とを比較する必要があるが、既存のデータベースは、登録されているゲノム情報が未だ十分ではなく、同定できる菌種に限りがある。また、MLSTのための検体のシーケンシング及び配列比較などのプロセスは、高価なシーケンシング装置や演算装置を使用してもかなりの時間を必要とする。従って、上記NTM症の診断のために、複数の検体に対して原因菌種・亜種を同定するためには膨大な時間を必要とし、未だ実用化が困難である。
【0007】
本発明は、前記の問題に鑑みてなされたものであり、その目的は、NTMを含む検体に対して、その検体に含まれるNTMの菌種及び亜種を正確且つ迅速に同定できるようにすることにある。
【課題を解決するための手段】
【0008】
本発明者らは、鋭意検討を行った結果、MLST法を利用して正確且つ迅速にNTMの菌種及び亜種の同定をする際の指標として有効に用いられ得る遺伝子を見出して、本発明を完成した。
【0009】
具体的に、本発明に係るシステムは、MLST(multi-locussequence typing)法によって検体中に存在するNTMの種又は亜種を同定するためのシステムであって、前記検体中に存在するNTMのゲノム配列のうち複数の遺伝子の配列情報を得るためのシーケンシング装置と、既知のNTMの配列情報を格納するデータベースと、前記シーケンシング装置により得られた複数の遺伝子の配列情報と、前記データベースに格納された前記複数の遺伝子の配列情報とを比較して、前記データベースに格納された既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択する演算装置とを備え、前記複数の遺伝子は、表1に示す184種の遺伝子から選択されることを特徴とする。
【0010】
本発明に係るシステムによると、MLST法を用いて数多くのNTMの種又は亜種を同定するために必要且つ十分な複数の遺伝子として、上記した複数の遺伝子の配列情報を用いてMLST法により所望のNTMの種又は亜種を同定するため、極めて正確且つ迅速に所望のNTMの種又は亜種を同定することができる。
【0011】
本発明に係るシステムにおいて、前記複数の遺伝子は、30SリボソームS1~S21(rpsA~U)、50SリボソームL1~L36(rplA~F、I~U、rpmA~J)、5SリボソームRNA(rrf)、16SリボソームRNA(rrs)、23SリボソームRNA(rrl)、rpoB、groEL2、gyrB、inhA、tlyA、katG、pncA、erm、eis及びembBを含むことが好ましい。
【0012】
本発明に係るシステムにおいて、前記データベースは、mlstdb.NTM(https://github.com/ymatsumoto/mlstverse.Mycobacterium.db)であることが好ましい。
【0013】
本発明に係るシステムにおいて、前記ソフトウェアは、mlstverse(https://github.com/ymatsumoto/mlstverse)であることが好ましい。
【0014】
本発明に係る方法は、MLST(multi-locus sequence typing)法によって検体中に存在するNTMの種又は亜種を同定する方法であって、前記検体中に存在するNTMに対して、シーケンシングを行って前記NTMのゲノム配列のうち複数の遺伝子の配列情報を得るステップと、前記得られた配列情報を、所定のデータベースに格納された既知のNTMにおける前記複数の遺伝子の配列情報と比較するステップと、前記複数の遺伝子の配列情報の比較の結果、前記データベースに格納された既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するステップとを備え、前記複数の遺伝子は、表1に示す184種の遺伝子から選択されることを特徴とする。
【0015】
本発明に係る方法によると、前記本発明に係るシステムと同様に、MLST法を用いて数多くのNTMの種又は亜種を同定するために必要且つ十分な複数の遺伝子として、上記した複数の遺伝子の配列情報を用いてMLST法により所望のNTMの種又は亜種を同定するため、極めて正確且つ迅速に所望のNTMの種又は亜種を同定することができる。
【0016】
本発明に係る方法において、30SリボソームS1~S21(rpsA~U)、50SリボソームL1~L36(rplA~F、I~U、rpmA~J)、5SリボソームRNA(rrf)、16SリボソームRNA(rrs)、23SリボソームRNA(rrl)、rpoB、groEL2、gyrB、inhA、tlyA、katG、pncA、erm、eis及びembBを含むことが好ましい。
【0017】
本発明に係る方法において、前記データベースは、mlstdb.NTM(https://github.com/ymatsumoto/mlstverse.Mycobacterium.db)であることが好ましい。
【0018】
本発明に係る方法において、前記ソフトウェアは、mlstverse(https://github.com/ymatsumoto/mlstverse)であることが好ましい。
【発明の効果】
【0019】
本発明に係る検体中に存在するNTMの種又は亜種を同定するためのシステム及び方法によると、種々のNTMを含む検体に対して、その検体に含まれるNTMの菌種及び亜種を正確且つ迅速に同定することができる。
【図面の簡単な説明】
【0020】
図1】本発明の一実施形態に係る検体中に存在するNTMの種又は亜種を同定するためのシステムで用いられるソフトウェアのワークフローを示す図である。
図2】本実施例において臨床検体から単離した29種のサンプルの写真を示している。
【発明を実施するための形態】
【0021】
以下、本発明を実施するための形態を説明する。以下の好ましい実施形態の説明は、本質的に例示に過ぎず、本発明、その適用方法或いはその用途を制限することを意図するものではない。
【0022】
本発明の一実施形態に係る検体中に存在するNTMの種又は亜種を同定するためのシステムは、MLST(multi-locus sequence typing)法を利用するものであって、検体中に存在するNTMのゲノム配列のうち複数の遺伝子の配列情報を得るためのシーケンシング装置と、既知のNTMにおける複数の遺伝子の配列情報を格納するデータベースと、前記シーケンシング装置により得られた複数の遺伝子の配列情報と、前記データベースに格納された前記複数の遺伝子の配列情報とを比較して、前記データベースに格納された前記既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するソフトウェアとを備えている。また、前記複数の遺伝子は、後に説明する表1に示す184種の遺伝子から選択されることを特徴とする。
【0023】
また、本発明の一実施形態に係る検体中に存在するNTMの種又は亜種を同定するための方法は、MLST(multi-locus sequence typing)法によって検体中に存在する非結核性抗酸菌(Non-Tuberculous Mycobacteria:NTM)の種又は亜種を同定する方法であって、前記検体中に存在するNTMに対して、シーケンシングを行って前記NTMのゲノム配列のうち複数の遺伝子の配列情報を得るステップと、前記得られた配列情報を、所定のデータベースに格納された既知のNTMにおける前記複数の遺伝子の配列情報と比較するステップと、前記複数の遺伝子の配列情報の比較の結果、前記データベースに格納された既知のNTMのうち前記検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するステップとを備えている。前記複数の遺伝子は、後に説明する表1に示す184種の遺伝子から選択されることを特徴とする。
【0024】
MLST法とは、細菌等の分類を行うために用いられる方法であって、対象の細菌の複数の遺伝子のDNA塩基配列を決定し、その塩基配列を既知の細菌における複数の遺伝子の塩基配列情報を格納するデータベースと照合することにより、対象の細菌を分類及び同定する方法である。一般には、上記複数の遺伝子として複数のハウスキーピング遺伝子等の必須遺伝子が用いられることが多い。この方法において、例えば7つの遺伝子を用いた場合、対象の7つの必須遺伝子の塩基配列が、所定の細菌種の遺伝子型(sequence type:ST)における7つの必須遺伝子の塩基配列と100%マッチすれば同一の遺伝子型として当該細菌種に分類される。また、7つの遺伝子の塩基配列のうち1つでも異なればそれは亜型であるとして別の種に分類される。
【0025】
本実施形態において、検体とは、以下のものに限られないが、例えばヒトや動物から得られた血液やリンパ液等の体液を含む生物学的サンプルが用いられる。検体は、前記生物学的サンプルから精製され、所定の媒体にNTMが含有されたNTM含有溶液であってもよい。特に、検体は、希釈平板法等の周知の細菌単離方法を利用して単離された1種のNTMのみを含む溶液であることが好ましい。
【0026】
本実施形態において、検体中に存在するNTMのゲノム配列のうち複数の遺伝子の配列情報を得る前に、検体のゲノムDNAを抽出する。ゲノムDNAの抽出方法は、当業者に周知であって、検体によって最適な方法が当業者に適宜選択される。また得られたゲノムDNAは、シーケンシング装置により配列決定できるように断片化等の当業者に周知の前処理がなされる。
【0027】
本実施形態において、検体中に存在するNTMのゲノム配列のうち複数の遺伝子の配列情報を得るためのシーケンシング装置は、塩基配列を決定できる装置であれば特に限定されないが、より高速かつ正確に塩基配列を決定できる装置であることが好ましい。例えば複数の検体の塩基配列を同時に決定できるシーケンシング装置や、リアルタイムで塩基配列の決定結果が得られるシーケンシング装置であることが好ましい。シーケンシング装置として、例えばイルミナ社のMiSeqやオックスフォードナノポアテクノロジーズ社のMinION等が好適に用いられる。
【0028】
本実施形態において、既知のNTMにおける複数の遺伝子の配列情報を格納するデータベースは、多くのNTMの種の塩基配列情報を含む公開されたMLSTデータベースであれば特に限定されないが、特に、本発明者らが構築したmlstdb.NTM(https://github.com/ymatsumoto/mlstverse.Mycobacterium.db)が好適に用いられる。mlstdb.NTMには、175種のNTMのゲノム情報から構築されたものであり、リボソームタンパク質、リボソームRNA遺伝子、抗生物質耐性遺伝子及び病原遺伝子等に関する184種の遺伝子の配列情報が格納されている。具体的には、NTMのそれぞれの種又は亜種に対応する184種の遺伝子の配列の配列型が格納されている。なお、ここでいう184種の遺伝子は下記表1に示す通りである。
【0029】
【表1】
【0030】
本実施形態において、MLST法に利用される上記複数の遺伝子は、表1に示す遺伝子のうち少なくとも30SリボソームS1~S21(rpsA~U)、50SリボソームL1~L36(rplA~F、I~U、rpmA~J)、5SリボソームRNA(rrf)、16SリボソームRNA(rrs)、23SリボソームRNA(rrl)、rpoB、groEL2、gyrB、inhA、tlyA、katG、pncA、erm、eis及びembBを含むことが好ましい。同定するNTMによっては、これらの遺伝子に加えて当該NTMにおいて特徴的な遺伝子を追加することができ、そうすることにより同定の精度を向上することができる。
【0031】
本実施形態において、データベースに格納された既知のNTMのうち検体中のNTMの配列情報に最も近い配列情報を有するNTMの種又は亜種を選択するソフトウェアは、図1に示すようなワークフローを行うことができるソフトウェアであれば限定されないが、特に本発明者らにより開発されたmlstverse(https://github.com/ymatsumoto/mlstverse)が好適に用いられ得る。図1に示すように当該ソフトウェアは、まず、上記データベースから184種の遺伝子アセンブリがマップ化された配列情報を読み込む。上述の通り、データベースにはNTMのそれぞれの種又は亜種に対応する184種の遺伝子の配列の配列型が格納されており、図1ではN個の配列型が示されている。また、ソフトウェアは、上記シーケンシング装置により得られた配列情報を読み込み、上記各配列型のそれぞれの配列と比較する。ソフトウェアは、比較する配列同士をアライメントしてそれぞれの配列の被覆率(cover ratio)及び平均深度(mean depth)を算出する。続いて、図1の3.に示す数式によって、MLSTスコアを算出する。その後、得られたデータに対して統計的仮説検定を行い、例えば図1に示すように、コルモゴロフ‐スミルノフ検定を行うことにより得られた結果の分散を確認する。そして、ソフトウェアは、ST~STの配列型のうち最も高いMLSTスコアの配列型を決定し、その配列型に対応するNTMの種又は亜種を出力する。このときに、複数のNTMの種又は亜種とそれらに対応するMLSTスコアとをリストとして出力してもよい。
【0032】
以上のようにして、当該ソフトウェアが、シーケンシング装置から得られた配列情報から、検体中のNTMの種又は亜種を出力する。なお、上記説明では184種の遺伝子の配列情報を全て用いたが、これに限定されず、それらの遺伝子の中から用いる遺伝子を適宜選択することもできる。
【実施例
【0033】
以下に、本発明に係る検体中に存在するNTMの種又は亜種を同定するためのシステム及び方法を詳細に説明するための実施例を示す。本実施例では、29検体の臨床サンプルに対して、従来の16SリボソームRNA遺伝子配列を利用した方法と、本発明に係る方法とを用いて、サンプル中のNTMの種及び亜種の同定を行い、それぞれの方法で得られた結果を比較した。以下にその方法及び結果を示す。また、本実施例に係る方法については、Emerging Microbes & Infections, Vol.8 (1), p1043-1053を参照することができる。
【0034】
(サンプル)
サンプルは、琉球大学病院の複数の患者から得られた臨床検体から常法により単離された29種のサンプルを用いた(図2)。サンプルは2%小川培地に播種し、35℃で培養した。
【0035】
(菌株の培養及びDNAの抽出)
上記のようにして得られたサンプル(菌株)を固形培地(19gのMiddlebrook 7H10アガー(BD Difco)、5.0mlのグリセロール、895mlの蒸留水、100mlのMiddlebrook OADC Enrichment(BD BBL)、Rアガー(10.0gのバクトペプトン,BD Difco)、5.0gの酵母エキス(BD Difco)、5.0gの麦芽エキス(BD Difco)、5.0gのカザミノ酸(BD Difco)、2.0gの牛肉エキス(BD Difco)2.0gのグリセロール、50.0mgのTween80、1.0gのMgSO・7HO)を用いて、インキュベートオーブン(PIC-100(アズワン))中において25℃、30℃、37℃又は45℃で3日~7週間培養した。
【0036】
その後、各菌株のゲノムDNAを、DNeasy PowerSoil Kit(Qiagen)を用いて各細菌のコロニーから抽出した。
【0037】
(ライブラリの作製及びシーケンス)
抽出DNAに対して、Oxford Nanopore Technologies社が提供するRapid Barcoding Kitを用いたライブラリ作製を行った。当該キット内の指示書に従って実験操作を行い、ゲノムDNA分子の断片化、サンプル識別のためのバーコーディング、シーケンスのためのアダプタ付与を行い、MinIONシーケンサー(Oxford Nanopore Technologies)用のライブラリを作製した。ライブラリをMinIONにロード後にランを行い、接続されたコンピュータ上に、シーケンスデータを生データであるfast5形式で保存した。
【0038】
(ソフトウェアによる解析)
出力されたfast5データを高性能計算サーバにアップロードし、塩基配列情報であるfastq形式へ変換するベースコール処理を行う。ベースコールされた配列ファイルに対してmlstverseによる処理を行い、菌種同定を行う。該当菌種ごとの種名とMLSTスコア、統計値が得られ、最も高いMLSTスコアを持つ種を同定結果として採用する。
【0039】
(16SリボソームRNA配列を用いた解析及びその結果)
本発明の方法により得られた結果と比較するために、従来の16SリボソームRNA配列を用いた菌種の同定方法を以下の通りに行った。
【0040】
まず、上記の通りに各サンプルから抽出したゲノムDNAを鋳型としてポリメラーゼ連鎖反応(PCR)により16SリボソームRNAを増幅させた。プライマーは以下の配列を用いた。
27F:5’-AGAGTTTGATCMTGGCTCAG-3’)
1492R:5’-TACGGYTACCTTGTTACGACTT-3’)
337F:5’-GACTCCTACGGGAGGCWGCAG-3’)
1391R:5’-GACGGGCGGTGTGTRCA-3’)
【0041】
PCRは、2×KAPA HiFi HotStart ReadyMix(Roche)及び0.3μMの上記プライマーを用いて、95℃で3分の後、98℃で20秒、60℃で15秒及び72℃で30秒を30サイクル行った。その後、72℃で1分間の最終伸長反応を行った。得られた生成物である16SリボソームRNAの配列決定を行い、当該配列と、SILVAデータベース中のMycobacterium属の参照配列とを、blastn(blast.ddbj.nig.ac.jp/blastn?lang=ja)を利用して比較した。その結果、98.7%以上の配列同一性を示すMycobacterium属の菌種を表2に示す。
【0042】
【表2】
【0043】
表2に示すように、従来の方法では、29種のサンプルのうちほとんどのサンプルが98.7%以上の極めて高い配列同一性を示す菌種が複数該当することとなった。すなわち、従来の方法では、サンプルに含まれる菌種を単一の菌種に同定することが困難であることが明らかとなった。
【0044】
(本発明を利用した解析結果)
次に、上記本発明の方法に従って、上記29種のサンプルから抽出したゲノムDNAを用いて、上記説明の通りライブラリ作製、シーケンス及びソフトウェア解析を行った結果を表3に示す。表3は、上記ソフトウェア解析により得られた各サンプルにおいて高いMLSTスコアが得られた該当菌種とそのスコアを示している。
【0045】
【表3】
【0046】
表3に示すように、29種のサンプルのそれぞれの最も高いMLSTスコアの平均値として0.90といった高い値が得られた。その次に高いスコアの平均値は0.50以下であり、大きな差が見られた。従って、最も高いスコアが得られた菌種を、サンプル中の菌種として同定することが可能といえる。さらに、例えばサンプルNo.2~5のように、亜種(subsp.)ことでもMLSTスコアの差が得られ、従って、各菌株の亜種も同定することが可能といえる。
【0047】
以上のように、本発明によると、種々のNTMを含む検体に対して、その検体に含まれるNTMの菌種及び亜種を正確に同定することができる。
図1
図2