特開2024-100144 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 独立行政法人産業技術総合研究所の特許一覧

特開2024-100144ゲノムまたはメタゲノム解析のための内部標準核酸

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
2C
2D
3A
3B
4
5A
5B
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024100144

(43)【公開日】2024-07-26

(54)【発明の名称】ゲノムまたはメタゲノム解析のための内部標準核酸

(51)【国際特許分類】

C12N 15/11 20060101AFI20240719BHJP

C12Q 1/6869 20180101ALN20240719BHJP

【ＦＩ】

C12N15/11 Z ZNA

C12Q1/6869 Z

【審査請求】未請求

【請求項の数】6

【出願形態】ＯＬ

(21)【出願番号】P 2023003917

(22)【出願日】2023-01-13

(71)【出願人】

【識別番号】301021533

【氏名又は名称】国立研究開発法人産業技術総合研究所

(74)【代理人】

【識別番号】100099623

【弁理士】

【氏名又は名称】奥山尚一

(74)【代理人】

【識別番号】100125380

【弁理士】

【氏名又は名称】中村綾子

(74)【代理人】

【識別番号】100142996

【弁理士】

【氏名又は名称】森本聡二

(74)【代理人】

【識別番号】100166268

【弁理士】

【氏名又は名称】田中祐

(74)【代理人】

【識別番号】100180231

【弁理士】

【氏名又は名称】水島亜希子

(72)【発明者】

【氏名】関口勇地

(72)【発明者】

【氏名】トゥールース，ディーター

(72)【発明者】

【氏名】大橋明子

【テーマコード（参考）】

4B063

【Ｆターム（参考）】

4B063QA13

4B063QQ42

4B063QR32

(57)【要約】

【課題】ゲノム／メタゲノム解析のための内部標準核酸を提供する。
【解決手段】（１）天然に存在しない配列（ａ）～（ｐ）をコードする人工遺伝子の各１コピー；（２）それぞれ独立して、天然に存在しない１０～６０ヌクレオチド長のランダムな配列からなる、前記人工遺伝子を連結するための人工遺伝子間配列；ならびに（３）それぞれ独立して、天然に存在しない２００～４００ヌクレオチド長のランダムな配列からなる先端スペーサー配列および終端スペーサー配列からなる人工核酸配列および／もしくはその相補配列またはそれらの部分断片配列を含んでなる核酸分子。
【選択図】なし

【特許請求の範囲】

【請求項1】

（１）天然に存在しない以下の配列（ａ）～（ｐ）をコードする人工遺伝子の各１コピー：
（ａ）配列番号１のアミノ酸配列および終止コドン、
（ｂ）配列番号２のアミノ酸配列および終止コドン、
（ｃ）配列番号３のアミノ酸配列および終止コドン、
（ｄ）配列番号４のアミノ酸配列および終止コドン、
（ｅ）配列番号５のアミノ酸配列および終止コドン、
（ｆ）配列番号６のアミノ酸配列および終止コドン、
（ｇ）配列番号７のアミノ酸配列および終止コドン、
（ｈ）配列番号８のアミノ酸配列および終止コドン、
（ｉ）配列番号９のアミノ酸配列および終止コドン、
（ｊ）配列番号１０のアミノ酸配列および終止コドン、
（ｋ）配列番号１１のアミノ酸配列および終止コドン、
（ｌ）配列番号１２のアミノ酸配列および終止コドン、
（ｍ）配列番号１３のアミノ酸配列および終止コドン、
（ｎ）配列番号１４のアミノ酸配列および終止コドン、
（ｏ）配列番号１５のアミノ酸配列および終止コドン、ならびに
（ｐ）配列番号１６のアミノ酸配列および終止コドン；
（２）それぞれ独立して、天然に存在しない１０～６０ヌクレオチド長のランダムな配列からなる、前記人工遺伝子を連結するための人工遺伝子間配列；ならびに
（３）それぞれ独立して、天然に存在しない２００～４００ヌクレオチド長のランダムな配列からなる、先端スペーサー配列および終端スペーサー配列
からなる人工核酸配列および／もしくはその相補配列またはそれらの部分断片配列を含んでなる核酸分子。

【請求項2】

前記人工核酸配列のＧＣ含量が３０～６０％である、請求項１に記載の核酸分子。

【請求項3】

前記人工核酸配列が、配列番号１７～２２からなる群から選択される、請求項１に記載の核酸分子。

【請求項4】

前記部分断片配列が少なくとも３００ヌクレオチド長である、請求項１～３のいずれか１項に記載の核酸分子。

【請求項5】

配列番号２３の人工核酸配列および／もしくはその相補配列またはそれらの部分断片配列を含んでなる核酸分子。

【請求項6】

前記部分断片配列が少なくとも３００ヌクレオチド長である、請求項５に記載の核酸分子。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ゲノムまたはメタゲノム解析のための内部標準核酸に関する。

【背景技術】

【0002】

土壌や海洋などの自然環境、動物の腸内、住宅などの人間の生活空間といったあらゆる環境中に、多様な微生物が生息している。多くの場合、それらはそれぞれの環境において固有の構成を保って定着しており、このような微生物の集合は微生物叢と呼ばれる。微生物叢の解析には、次世代シーケンシング（ＮＧＳ）による１６ＳｒＲＮＡ遺伝子解析または全ゲノムショットガンメタゲノム解析が用いられている。１６ＳｒＲＮＡ遺伝子解析は、微生物叢中の１６ＳｒＲＮＡ遺伝子を増幅したＰＣＲ産物を網羅的に配列決定するのに対し、全ゲノムショットガンメタゲノム解析は、微生物叢中の全ゲノムＤＮＡを網羅的に配列決定し、その結果、微生物叢中に存在する機能遺伝子を包括的に解析することができ、微生物叢全体の持つ機能を明らかにすることができる。

【0003】

全ゲノムショットガンメタゲノム解析は、微生物叢から全ゲノムＤＮＡ抽出し、全ゲノムＤＮＡをランダムに断片化し、断片を配列決定し、得られた断片配列（配列リード）を一つながりの連続配列（コンティグ）へとアセンブルし、アセンブリにより推定されたゲノム配列に対してリードをマッピングする工程を含み、それにより微生物叢中の遺伝子の相対量を定量化する。しかし、この定量結果は相対的なものに過ぎず、検出された微生物群や機能遺伝子の絶対量を推定することはできない。さらに、上記工程には技術的バイアスを伴うため、正しい結果を得るためには、そのようなバイアスを正確に把握し、補正する必要がある。

【0004】

絶対定量および精度管理のために、試料中に存在しない配列を有する外因性核酸（スパイクインコントロール）を内部標準として測定値を補正する手法が知られており、天然に存在しない人工核酸配列からなる標準核酸が開発されている（特許文献１、非特許文献１）。しかし、ＣｈｅｃｋＭ（Ｐａｒｋｓｅｔａｌ．，ＧｅｎｏｍｅＲｅｓｅａｒｃｈ，２０１５，２５（７）：１０４３－５５）に代表されるアセンブリの品質を評価するためのバイオインフォマティクスツールは、通常、アセンブルされたコンティグ内の特定のシングルコピーマーカー遺伝子の有無に基づいてゲノムの完全性（コンプリートネス）と汚染度（コンタミネーション）の正確な推定値を提供するため、上記のような遺伝子配列を含まない標準核酸のアセンブリの品質を評価することができない。また、ＧＣ含量はシーケンシングのカバレッジを変動させ、アセンブリの精度を低下させることが知られており（ＧＣバイアス）、ＧＣバイアスを厳密に評価するための標準核酸も望まれている。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】国際公開第２０１７／１６５８６４

【非特許文献】

【0006】

【非特許文献1】Ｈａｒｄｗｉｃｋｅｔａｌ．，２０１８，ＮａｔｕｒｅＣｏｍｍｕｎｉｃａｔｉｏｎｓ，Ｖｏｌ．９，ＡｒｔｉｃｌｅＮｏ：３０９６

【発明の概要】

【発明が解決しようとする課題】

【0007】

本発明は、ゲノムまたはメタゲノム解析におけるアセンブリの品質を評価するための内部標準核酸を提供することを目的としてなされたものである。

【課題を解決するための手段】

【0008】

本発明者らは、鋭意研究の結果、アセンブリの品質を精密に評価することができる人工核酸を作出することに成功した。

【0009】

すなわち、本発明は、一実施形態によれば、（１）天然に存在しない以下の配列（ａ）～（ｐ）をコードする人工遺伝子の各１コピー：（ａ）配列番号１のアミノ酸配列および終止コドン、（ｂ）配列番号２のアミノ酸配列および終止コドン、（ｃ）配列番号３のアミノ酸配列および終止コドン、（ｄ）配列番号４のアミノ酸配列および終止コドン、（ｅ）配列番号５のアミノ酸配列および終止コドン、（ｆ）配列番号６のアミノ酸配列および終止コドン、（ｇ）配列番号７のアミノ酸配列および終止コドン、（ｈ）配列番号８のアミノ酸配列および終止コドン、（ｉ）配列番号９のアミノ酸配列および終止コドン、（ｊ）配列番号１０のアミノ酸配列および終止コドン、（ｋ）配列番号１１のアミノ酸配列および終止コドン、（ｌ）配列番号１２のアミノ酸配列および終止コドン、（ｍ）配列番号１３のアミノ酸配列および終止コドン、（ｎ）配列番号１４のアミノ酸配列および終止コドン、（ｏ）配列番号１５のアミノ酸配列および終止コドン、ならびに（ｐ）配列番号１６のアミノ酸配列および終止コドン；（２）それぞれ独立して、天然に存在しない１０～６０ヌクレオチド長のランダムな配列からなる、前記人工遺伝子を連結するための人工遺伝子間配列；ならびに（３）それぞれ独立して、天然に存在しない２００～４００ヌクレオチド長のランダムな配列からなる、先端スペーサー配列および終端スペーサー配列からなる人工核酸配列および／もしくはその相補配列またはそれらの部分断片配列を含んでなる核酸分子を提供するものである。

【0010】

前記人工核酸配列のＧＣ含量は、３０～６０％であることが好ましい。

【0011】

前記人工核酸配列は、配列番号１７～２２からなる群から選択されるものであることが好ましい。

【0012】

前記部分断片配列は、少なくとも３００ヌクレオチド長であることが好ましい。

【0013】

また、本発明は、一実施形態によれば、配列番号２３の人工核酸配列および／もしくはその相補配列またはそれらの部分断片配列を含んでなる核酸分子を提供するものである。

【0014】

前記部分断片配列は、少なくとも３００ヌクレオチド長であることが好ましい。

【発明の効果】

【0015】

本発明に係る核酸分子は、一実施形態によれば、天然に存在しない人工核酸配列から構成されながら、ＣｈｅｃｋＭなどのツールによって認識可能な人工遺伝子配列を有する。そのため、本発明に係る核酸分子によれば、現在一般的に採用されているシングルコピーマーカー遺伝子の有無に基づくアセンブリの品質評価が可能となる。

【0016】

また、本発明に係る核酸分子は、一実施形態によれば、ＧＣ含量が厳密に制御された人工核酸配列を有する。そのため、本発明に係る核酸分子によれば、アセンブリに対するＧＣバイアスの影響を厳密に評価することが可能となる。

【0017】

また、本発明に係る核酸分子を用いることにより、微生物叢中に存在する遺伝子の絶対定量が可能となる。

【図面の簡単な説明】

【0018】

【図1】図１は、ｓｅｑＨＭＭ３５０１を例として、人工ＣＤＳを含む人工核酸配列の生成手順を示す概略図である。

【図2A】図２Ａは、ｓｅｑＨＭＭ３５０１、ｓｅｑＨＭＭ５００１、ｓｅｑＨＭＭ５００２、ｓｅｑＨＭＭ５００３、ｓｅｑＨＭＭ６００１およびｓｅｑＨＭＭ０４における１６個の人工ＣＤＳのレイアウトを示す図である。

【図2B】図２Ｂは、ｓｅｑＨＭＭ３５０１、ｓｅｑＨＭＭ５００１、ｓｅｑＨＭＭ５００２、ｓｅｑＨＭＭ５００３、ｓｅｑＨＭＭ６００１およびｓｅｑＨＭＭ０４におけるＧＣ含量を示す図である。

【図2C】図２Ｃは、ｓｅｑＲＡＮＤＯＭ０１におけるＧＣ含量を示す図である。

【図2D】図２Ｄは、ｓｅｑＨＭＭ５００２およびｓｅｑＨＭＭ５００３のペアワイズ配列同一性を示す図である。

【図3A】図３Ａは、ｓｅｑＨＭＭ３５０１、ｓｅｑＨＭＭ５００１、ｓｅｑＨＭＭ５００２、ｓｅｑＨＭＭ５００３、ｓｅｑＨＭＭ６００１、ｓｅｑＨＭＭ０４およびｓｅｑＲＡＮＤＯＭ０１を個別に解析した場合における、アセンブリにより回収された人工核酸配列の割合とカバレッジ深度の関係を示す図である。

【図3B】図３Ｂは、ｓｅｑＨＭＭ３５０１、ｓｅｑＨＭＭ５００１、ｓｅｑＨＭＭ５００２、ｓｅｑＨＭＭ５００３、ｓｅｑＨＭＭ６００１、ｓｅｑＨＭＭ０４およびｓｅｑＲＡＮＤＯＭ０１を個別に解析した場合における、アセンブリにより回収された人工核酸配列から検出されたマーカー遺伝子の数とカバレッジ深度の関係を示す図である。

【図4】図４は、ｓｅｑＨＭＭ３５０１、ｓｅｑＨＭＭ５００１、ｓｅｑＨＭＭ５００２、ｓｅｑＨＭＭ５００３、ｓｅｑＨＭＭ６００１、ｓｅｑＨＭＭ０４およびｓｅｑＲＡＮＤＯＭ０１の等モル混合物を解析した場合における、アセンブリの完全性を示す図である。

【図5A】図５Ａは、ｓｅｑＨＭＭ０４およびｓｅｑＲＡＮＤＯＭ０１中の位置に沿った相対カバレッジおよびＧＣ含量を示すプロットである。

【図5B】図５Ｂは、ｓｅｑＨＭＭ０４およびｓｅｑＲＡＮＤＯＭ０１中の位置に沿った相対カバレッジとＧＣ含量との関係を示す散布図である。

【図6】図６は、ｓｅｑＨＭＭ３５０１、ｓｅｑＨＭＭ５００１、ｓｅｑＨＭＭ５００２、ｓｅｑＨＭＭ５００３、ｓｅｑＨＭＭ６００１、ｓｅｑＨＭＭ０４およびｓｅｑＲＡＮＤＯＭ０１を異なる比率で含む２種類の混合物における、各人工核酸の存在量（実測値と推定値）を示すプロットである。

【図7】図７は、ヒト糞便微生物叢ＤＮＡ試料中に添加された人工核酸の、ヒト糞便微生物叢ＤＮＡに対する相対比率（実測値と推定値）を示すプロットである。

【発明を実施するための形態】

【0019】

以下、本発明を詳細に説明するが、本発明は本明細書中に説明した実施形態に限定されるものではない。

【0020】

本発明は、第一の実施形態によれば、（１）天然に存在しない以下の配列（ａ）～（ｐ）をコードする人工遺伝子の各１コピー：（ａ）配列番号１のアミノ酸配列および終止コドン、（ｂ）配列番号２のアミノ酸配列および終止コドン、（ｃ）配列番号３のアミノ酸配列および終止コドン、（ｄ）配列番号４のアミノ酸配列および終止コドン、（ｅ）配列番号５のアミノ酸配列および終止コドン、（ｆ）配列番号６のアミノ酸配列および終止コドン、（ｇ）配列番号７のアミノ酸配列および終止コドン、（ｈ）配列番号８のアミノ酸配列および終止コドン、（ｉ）配列番号９のアミノ酸配列および終止コドン、（ｊ）配列番号１０のアミノ酸配列および終止コドン、（ｋ）配列番号１１のアミノ酸配列および終止コドン、（ｌ）配列番号１２のアミノ酸配列および終止コドン、（ｍ）配列番号１３のアミノ酸配列および終止コドン、（ｎ）配列番号１４のアミノ酸配列および終止コドン、（ｏ）配列番号１５のアミノ酸配列および終止コドン、ならびに（ｐ）配列番号１６のアミノ酸配列および終止コドン；（２）それぞれ独立して、天然に存在しない１０～６０ヌクレオチド長のランダムな配列からなる、前記人工遺伝子を連結するための人工遺伝子間配列；ならびに（３）それぞれ独立して、天然に存在しない２００～４００ヌクレオチド長のランダムな配列からなる、先端スペーサー配列および終端スペーサー配列からなる人工核酸配列および／もしくはその相補配列またはそれらの部分断片配列を含んでなる核酸分子である。

【0021】

本実施形態の核酸分子における人工核酸配列は、構成要素（１）として、以下の配列（ａ）～（ｐ）をコードする人工遺伝子を各１コピー含む。式中、Ｘは任意のアミノ酸残基を表す。
（ａ）ＭＸＸＫＩＫＸＧＤＸＶＸＶＩＸＧＫＸＫＧＸＸＧＸＶＸＸＶＸＸＸＸＸＸＶＩＶＥＧＶＸＸＸＫＫＸＸＫＸＸＸＸＸＸＸＸＧＸＸＸＸＸＥＸＰＩＸＸＳＮＶＸＸＸＸＸＸＸＸＸＸＸＸＶＸＸＲＸＸＸＸＸＸＫＸＲＸＸＸＸＸＧＸＸＩ（配列番号１）および終止コドン
（ｂ）ＭＸＸＸＩＸＸＬＸＸＸＸＸＸＸＸＸＸＸＸＦＸＸＧＸＸＶＸＶＸＸＸＩＸＥＧＸＸＸＲＸＱＸＦＸＧＸＶＩＸＸＸＸＸＧＸＸＸＸＸＸＶＸＫＸＸＸＧＸＧＶＥＲＸＦＸＸＸＸＸＸＩＸＸＩＸＶＸＸＸＧＸＶＸＲＡＸＬＸＹＬＲＸＸＸＧＫＸＸＫＩＫＸＸＸ（配列番号２）および終止コドン
（ｃ）ＭＭＡＸＸＸＲＸＸＲＶＸＸＸＩＸＸＸＩＸＸＸＬＸＸＸＩＸＤＸＸＸＸＸＸＸＶＸＸＶＥＸＳＸＤＬＸＸＸＸＶＦＶＸＸＬＸＤＸＸＸＸＸＸＸＶＸＸＬＸＸＡＸＧＦＩＸＸＸＬＸＸＸＸＸＬＸＸＸＰＸＬＸＦＸＸＤＸＳＬＸＸＸＸＲＩＸＸＬＩＸＸＬＸＸＸ（配列番号３）および終止コドン
（ｄ）ＭＸＸＸＦＸＸＸＰＬＸＸＧＸＧＸＴＬＧＸＸＬＲＲＶＬＬＸＸＩＸＧＸＡＩＸＸＸＸＩＸＸＸＸＸＥＦＸＸＸＸＧＶＸＥＤＶＸＸＩＩＸＮＬＫＸＬＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＡＸＸＸＸＸＸＸＸＸＶＥＶＸＸＸＸＸＸＩＸＸＬＸＸＸＸＸＬＸＩＸＬＸＶＸＸＧＸＧＹＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＩＸＶＤＡＸＦＸＰＶＸＸＶＸＹＸＶＸＸＸＸＸＸＸＸＸＸＸＤＸＬＸＬＸＩＸＴＸＸＸＸＸＸＸＸＡＬＸＸＡＸＸＸＬＸＸＸＬＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＩＸＸＬＤＬＳＸＲＸＸＮＣＬＸＸＸＸＩＸＸＬＸＥＬＶＸＸＸＸＸＸＬＸＸＸＸＮＬＧＸＫＳＸＸＥＩＸＸＸＬＸＸＸＸＬＸＬＸＸＸ（配列番号４）および終止コドン
（ｅ）ＭＦＸＤＸＸＸＸＸＶＸＸＧＸＧＧＸＧＸＸＸＸＸＸＥＸＹＸＸＸＧＧＰＸＧＧＸＧＧＸＧＧＸＶＸＸＸＸＸＸＸＸＸＸＬＸＸＸＸＸＸＸＸＸＸＡＸＸＧＸＸＧＸＸＸＸＸＸＧＸＸＸＸＸＸＸＩＸＶＰＸＧＸＸＶＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＧＧＸＸＧＸＧＮＸＸＦＸＸＸＸＸＸＸＰＸＸＸＸＸＧＸＸＸＸＸＸＸＬＸＬＸＬＸＸＬＡＤＶＧＬＶＧＸＸＸＸＧＫＳＸＬＬＸＸＸＸＸＸＸＸＸＩＸＸＹＸＦＸＴＸＸＰＸＬＧＸＸＸＸＸＸＸＸＸＸＸＸＡＤＩＰＧＬＩＸＸＸＸＸＧＸＧＬＧＸＸＦＬＸＨＩＸＸＸＸＸＬＸＸＬＩＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＬＸＸＹＸＸＸＬＸＸＸＸＸＸＸＸＸＸＫＸＤＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸ（配列番号５）および終止コドン
（ｆ）ＭＸＸＶＡＩＬＧＸＸＮＸＧＫＳＴＬＬＮＸＬＸＸＸＸＸＸＩＸＳＸＸＸＸＴＴＸＸＸＩＸＧＸＸＸＸＸＸＸＱＸＩＦＩＤＴＰＧＬＸＸＸＫＸＸＸＸＸＬＬＸＫＸＩＸＸＡＬＸＸＶＤＬＩＬＦＶＶＸＸＸＸＸＸＸＸＤＸＸＬＸＸＸＬＸＸＸＸＸＸＸＸＬＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＩＶＸＩＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＬＸＸＸＸＸＸＸＰＸＤＸＶＸＤＸＸＸＸＦＸＩＸＥＸＩＲＥＫＩＬＸＸＸＸＸＥＩＰＹＸＶＸＶＸＩＸＸＸＸＸＸＸＸＸＸＸＸＩＸＸＸＩＸＶＸＲＸＳＱＫＸＩＩＩＧＸＸＧＸＸＩＫＸＩＧＸＸＸＲＸＸＬＸＸＸＸＸＸＸＶＸＬＸＬＸＶＫ（配列番号６）および終止コドン
（ｇ）ＭＸＸＰＫＸＸＸＸＸＫＸＸＸＸＸＸＸＧＸＸＸＸＸＸＸＶＸＦＧＸＹＸＬＸＸＸＸＸＸＸＩＸＸＸＸＩＸＸＸＸＸＡＬＸＲＸＶＸＸＸＸＸＬＷＸＲＩＸＸＸＸＸＸＸＸＫＰＸＸＸＲＭＧＸＧＫＧＸＸＥＸＷＸＸＸＶＸＸＧＸＶＬＦＥＬＸＧＶＸＸＸＸＸＸＸＡＬＸＸＡＸＸＫＬＰＸ（配列番号７）および終止コドン
（ｈ）ＭＸＬＬＶＡＶＳＧＧＸＤＳＸＸＬＬＸＸＬＸＸＸＸＸＸＸＸＸＸＸＸＡＡＸＶＤＨＸＸＲＸＸＳＸＸＸＸＸＸＶＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＡＲＸＸＲＹＸＸＬＸＸＸＸＸＸＸＸＸＸＸＩＬＴＡＨＨＸＤＤＸＩＥＴＩＬＸＸＬＸＲＧＸＸＸＸＧＬＸＧＬＸＸＸＸＸＸＸＸＸＸＸＩＸＲＰＬＬＸＸＸＫＸＥＩＸＸＸＸＸＸＸＸＬＸＸＸＸＤＸＴＮＸＸＸＸＹＸＲＮＸＩＲＸＸＬＬＰ（配列番号８）および終止コドン
（ｉ）ＭＩＮＸＸＩＸＸＸＥＶＸＸＩＸＸＸＧＸＸＸＸＩＸＸＸＸＥＡＬＸＸＡＸＸＸＸＬＤＬＶＸＩＳＸＸＸＸＸＰＶＸＫＩＬＤＹＧＫＹＸＹＸＸＸＫＸＸＫＸＸＫＫＸＱＸＸＩＸＶＫＥＶＸＬＸＸＸＩＸＸＸＤＸＸＸＫＸＸＸＸＸＸＦＬＸＸＧＸＸＶＫＸＸＶＸＸＸＧＲＸＸＸＸＸＸＬＸＸＸＶＬＸＸＶＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＬＬＸＰＸＸＸ（配列番号９）および終止コドン
（ｊ）ＭＸＶＸＬＸＸＬＸＸＸＸＸＸＸＧＸＸＸＸＸＸＸＰＸＸＸＸＦＩＸＸＸＲＸＸＸＸＸＩＸＬＸＸＸＸＸＸＬＸＸＸＸＸＸＶＸＸＸＸＸＸＸＸＸＩＬＦＶＧＴＫＸＸＸＸＸＸＶＸＸＸＡＸＸＸＸＸＸＹＶＸＸＲＷＬＧＧＸＬＸＮＸＸＴＩＸＸＸＩＸＸＬＸＸＬＸＸＸＸＸＸＸＸＸＸＸＸＸＫＫＥＸＸＸＸＸＸＸＸＸＸＬＸＸＸＬＸＧＩＸＸＬＸＸＸＰＸＸＬＸＶＸＤＸＸＸＥＸＸＡＶＸＥＡＸＸＬＸＩＰＶＶＡＸＸＤＸＮＸＸＰＸＸＶＤＸＸＩＰＸＮＸＸＸＸＸＸＸＸＬＸＸＸＸＸＸＸＸＶＸＸＸＸＸＸ（配列番号１０）および終止コドン
（ｋ）ＭＸＸＬＸＬＸＸＸＤＸＸＸＸＸＸＸＮＸＸＹＲＸＸＤＸＸＴＤＶＬＳＦＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＧＤＬＸＩＳＸＸＸＶＸＸＸＡＸＸＸＸＸＸＸＸＸＸＸＸＸＬＸＸＨＧＸＬＨＬＸＧＹＤＨＸＸＸＸＸＸＸＸＭＸＸＸＥＸＸＩＬＸＸＸＸ（配列番号１１）および終止コドン
（ｌ）ＭＸＸＸＸＸＸＸＸＸＸＸＲＸＷＸＸＶＤＡＸＸＸＸＬＧＲＬＡＸＸＶＡＸＸＬＸＧＫＸＫＸＸＹＸＰＸＸＤＸＧＤＸＶＩＶＩＮＡＸＸＶＸＬＸＧＸＫＸＸＸＫＸＹＸＸＸＳＸＸＸＧＸＸＸＸＸＸＸＸＸＬＸＸＸＸＸＸＸＸＬＸＸＡＶＸＧＸＬＰＸＸＸＬＸＸＸＸＸＸＸＬＸＶＹＸＧＸＸＸＸＸＸＡＸＸＰＸＸＸＸＸ（配列番号１２）および終止コドン
（ｍ）ＭＸＸＸＫＸＸＲＸＸＸＸＲＸＸＬＬＲＸＸＸＸＸＬＬＸＸＸＸＩＸＴＴＸＸＫＸＸＸＸＸＸＸＶＥＸＬＩＴＸＡＫＸＸＸＸＸＸＸＲＸＶＸＸＸＬＸＸＸＸＸＸＸＸＬＦＸＸＩＸＸＸＹＸＸＲＸＧＧＹＴＲＩＬＫＸＸＸＲＸＧＤＸＡＸＸＡＸＬＥＬＶＤ（配列番号１３）および終止コドン
（ｎ）ＭＸＸＸＸＸＸＸＸＶＫＸＬＲＸＸＴＸＡＸＸＸＤＣＫＸＡＬＸＸＸＸＸＤＬＸＸＡＸＸＸＬＲＸＸＧＸＸＸＡＸＫＫＸＸＸＸＡＸＥＧＸＶＸＸＸＸＸＸＸＸＸＸＬＶＸＩＸＸＸＴＤＦＶＡＸＸＸＸＦＸＸＬＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＬＸＸＸＸＡＸＸＸＥＸＩＸＶＲＲＩＸＸＸＸＸＸＸＸＸＸＩＸＸＹＸＨＸＸＸＲＩＧＶＬＶＸＸＸＸＸＸＸＸＸＸＸＸＸＬＡＭＨＶＡＡＸＸＰＸＸＬＸＸＸＸＶＸＸＸＸＶＸＸＸＸＸＩＸＸＸＸＸＸＸＸＸＸＰＸＸＩＸＸＸＸＶＸＧＲＬＸＫＸＸＸＸＩＸＬＸＸＱＸＦＶＸＸＸＸＸＸＶＸＸＸＬＸＸＸＸＸＸＶＸＸＦＸＸＸＸＶＧＥＧＩＸＫＸＸＸＸＦＸＸＥＶＸＸＸＸＸＸ（配列番号１４）および終止コドン
（ｏ）ＭＭＫＶＩＬＸＥＸＶＸＸＬＧＸＸＧＤＸＸＥＶＫＸＧＹＡＸＮＦＬＩＸＫＸＸＡＸＸＸＴＸＸＸＩＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＬＸＩＸＸＫＸＸＤＸＧＸＬＦＧＸＩＸＸＸＸＩＸＤＸＶＸＸＸＸＸＸＬＸＫＸＸＩＸＬＸＸＸＸＸＸＸＸＧＸＸＸＶＸＬＸＬＸＸＥＶＸＡＸＬＸＶＸＶＸＸＸ（配列番号１５）および終止コドン
（ｐ）ＭＸＬＸＸＬＸＸＸＸＸＸＸＸＸＸＸＸＶＧＲＧＸＧＳＧＸＧＸＴＸＧＸＧＸＫＧＸＸＡＲＸＸＸＸＸＸＸＸＦＥＧＧＸＸＰＬＸＸＲＬＰＸＸＧＸＸＸＸＸＸＸＸＸＸＸＶＸＶＸＸＸＸＸＸＸＸＸＸＸＸＶＸＸＸＸＬＸＸＸＸＸＩＸＸＸＸＸＸＶＫＶＬＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸＸ（配列番号１６）および終止コドン

【0022】

以下、配列（ａ）～（ｐ）をコードする人工遺伝子を「人工遺伝子（ａ）～（ｐ）」と記載する。

【0023】

本実施形態における人工遺伝子（ａ）～（ｐ）は、保存アミノ酸が維持されている限り任意のコーディング配列からなってよいが、原核生物におけるコドン偏位、ホモポリマー長およびＧＣ含量が考慮されることが好ましい。また、保存アミノ酸に対応するコドンが複数ある場合には、いずれのコドンが選択されてもよく、原核生物におけるコドン偏位、ホモポリマー長およびＧＣ含量を考慮して適切なコドンが選択され得る。同様に、終止コドンは、オーカーコドン（ＴＡＡ）、アンバーコドン（ＴＡＧ）またはオパールコドン（ＴＧＡ）のいずれであってもよいが、原核生物におけるコドン偏位を考慮すると、オーカーコドンであることが好ましい。

【0024】

本実施形態の核酸分子において、人工遺伝子（ａ）～（ｐ）は任意の順番で配置されてよく、例えば、５’→３’方向に、人工遺伝子（ａ）、人工遺伝子（ｂ）、人工遺伝子（ｃ）のようにアルファベット順に配置されてもよいし、人工遺伝子（ｆ）、人工遺伝子（ａ）、人工遺伝子（ｋ）のように順不同で配置されてもよい。

【0025】

本実施形態の核酸分子における人工核酸配列は、構成要素（２）として、人工遺伝子（ａ）～（ｐ）を連結するための人工遺伝子間配列を含む。人工遺伝子間配列は、天然に存在しない１０～６０ヌクレオチド長、好ましくは３０～５０ヌクレオチド長のランダムな配列からなる。人工遺伝子間配列は、遺伝子間領域ごとにそれぞれ独立してランダムな配列からなり、長さもそれぞれ異なってよい。人工遺伝子間配列は、ランダムであるが、ホモポリマー長およびＧＣ含量が考慮されることが好ましい。

【0026】

本実施形態の核酸分子における人工核酸配列は、構成要素（３）として、先端スペーサー配列および終端スペーサー配列を含む。具体的には、人工遺伝子間配列により連結された人工遺伝子（ａ）～（ｐ）の上流に先端スペーサー配列、下流に終端スペーサー配列が付加される。先端スペーサー配列および終端スペーサー配列は、天然に存在しない２００～４００ヌクレオチド長、好ましくは２５０～３００ヌクレオチド長のランダムな配列からなる。先端スペーサー配列および終端スペーサー配列は、それぞれ独立してランダムな配列からなり、長さもそれぞれ異なってよい。先端スペーサー配列および終端スペーサー配列は、ランダムであるが、ホモポリマー長およびＧＣ含量が考慮されることが好ましい。

【0027】

上記構成要素（１）～（３）からなる人工核酸配列のＧＣ含量は、３０～６０％であることが好ましい。この際、ＧＣ含量は、人工核酸配列の全長にわたって一貫していてもよいし、変化してもよい。例えば、人工核酸配列は、全長にわたって約３０％のＧＣ含量であってもよいし、ＧＣ含量が約３０％の領域と約６０％領域とを有してもよい。

【0028】

上記人工核酸配列の好ましい具体例としては、配列番号１７～２２の核酸配列を挙げることができる。配列番号１７～２２の核酸配列は、人工遺伝子（ａ）～（ｐ）を５’→３’方向にアルファベット順に含み、各遺伝子間にそれぞれ独立してランダムな配列からなる４２ヌクレオチド長の人工遺伝子間配列を含み、それぞれ独立してランダムな配列からなる２７１ヌクレオチド長の先端スペーサー配列および終端スペーサー配列を含む。

【0029】

本実施形態の核酸分子は、上記人工核酸配列および／またはその相補配列を含んでなる。すなわち、本実施形態の核酸分子は、１本鎖または２本鎖のいずれであってもよい。また、本実施形態の核酸分子は、ＤＮＡにより構成されることが好ましいが、例えば末端などに１～３塩基対程度の修飾核酸を含んでもよい。

【0030】

本実施形態の核酸分子は、上記人工核酸配列および／またはその相補配列の全長を含むものであってもよいし、部分断片配列を含んでなるものであってもよい。部分断片配列は、例えば、少なくとも３００ヌクレオチド長、好ましくは１，０００ヌクレオチド長以上、より好ましくは３，０００ヌクレオチド長以上であってよい。言い換えれば、部分断片配列は、例えば、少なくとも１個、好ましくは５個以上、より好ましくは８個以上の人工遺伝子を含むことが好ましい。

【0031】

本実施形態の核酸分子は、人工核酸配列および／もしくはその相補配列またはそれらの部分断片配列のみからなる核酸であってもよいし、人工核酸配列および／もしくはその相補配列またはそれらの部分断片配列のみからなる核酸がベクターにクローニングされたものであってもよい。本実施形態において使用できるベクターは、特に限定されないが、例えば、ｐＵＣ１９、ｐＴ７ＢｌｕｅおよびｐＧＥＭなどのプラスミドベクター、フォスミドベクター、ＢＡＣベクターなどであってよい。

【0032】

本実施形態の核酸分子は、従来公知の任意の核酸合成法により容易に調製され得る。

【0033】

本実施形態の核酸分子は、解析対象の試料に適切なタイミングで添加して用いればよい。例えば、本実施形態の核酸分子は、核酸を抽出する前の試料に添加されてよく、この場合には、ゲノムＤＮＡの抽出からアセンブリまでの解析全体の精度管理が可能となる。あるいは、本実施形態の核酸分子は、微生物叢試料から抽出された核酸溶液に添加することができ、この場合には、アセンブリのみの品質評価が可能となる。本実施形態の核酸分子の特定の１種類または配列の異なる多種類を組み合わせて試料に添加することができる。

【0034】

解析対象の試料は、任意の細胞、組織、微生物叢などを含むものであってよいが、好ましくは微生物叢を含む。微生物叢とは、ある特定の環境中に存在する複数の微生物の集まりであり、例えば、少なくとも１００種類、３００種類、５００種類、７００種類、１，０００種類、またはそれ以上の種類の微生物から構成され得る。微生物叢を構成する微生物の種類は特に限定されず、細菌、真菌、原生生物、ウイルスなどの任意の分類の微生物であってよく、既知の微生物のみならず、未知の微生物も含まれてよい。

【0035】

本実施形態の核酸分子は、ＣｈｅｃｋＭに代表される、シングルコピーマーカー遺伝子情報に基づく一般的なアセンブリ性能評価ツールに対応した標準核酸であり、（メタ）ゲノム解析における精密なアセンブリ性能評価のために有用である。

【0036】

本発明は、第二の実施形態によれば、配列番号２３の人工核酸配列および／もしくはその相補配列またはそれらの部分断片配列を含んでなる核酸分子である。

【0037】

本実施形態の核酸分子も、第一の実施形態の核酸分子と同様に、１本鎖または２本鎖のいずれであってもよい。また、本実施形態の核酸分子も、第一の実施形態の核酸分子と同様、ＤＮＡにより構成されることが好ましいが、例えば末端などに１～３塩基対程度の修飾核酸を含んでもよい。

【0038】

本実施形態の核酸分子も、第一の実施形態の核酸分子と同様に、上記人工核酸配列および／もしくはその相補配列の全長または部分断片配列のみからなる核酸であってもよいし、それらがベクターにクローニングされたものであってもよい。部分断片配列は、例えば、少なくとも３００ヌクレオチド長、好ましくは１，０００ヌクレオチド長以上、より好ましくは３，０００ヌクレオチド長以上であってよい。

【0039】

本実施形態の核酸分子は、第一の実施形態の核酸分子と同様にして調製されてよく、かつ、使用されてよい。

【0040】

本実施形態の核酸分子は、ＧＣ含量が厳密に制御された人工核酸配列を有する標準核酸であり、（メタ）ゲノム解析における精密なアセンブリ性能評価、特に、アセンブリ性能に対するＧＣバイアスの影響の評価のために有用である。

【実施例0041】

以下に実施例を挙げ、本発明についてさらに説明する。なお、これらは本発明を何ら限定するものではない。

【0042】

＜１．人工核酸配列の設計および合成＞
（１－１）人工ＣＤＳを含む人工核酸配列（配列番号１７～２２）の設計
ＣｈｅｃｋＭなどのバイオインフォマティクスツールは、原核生物に普遍的な、１ゲノムに１コピーのみ存在する遺伝子（シングルコピー遺伝子）のセットをマーカーとして用い、推定されたゲノム配列におけるマーカーの有無に基づいてアセンブルの品質を評価する。そのため、本実施例では、以下の表１に示す１６種類のマーカー遺伝子から、Ｐｒｏｄｉｇａｌ（Ｈｙａｔｔｅｔａｌ．，ＢＭＣＢｉｏｉｎｆｏｒｍａｔｉｃｓ，２０１０，１１：１１９）のような一般的な遺伝子推定アルゴリズムで認識可能な人工コーディング配列（ＣＤＳ）を生成した。

【0043】

表１．人工ＣＤＳの生成に用いたマーカー遺伝子

【表1】

【0044】

各マーカー遺伝子から、隠れマルコフモデル（ＨＭＭ）に基づいて抽出されたコンセンサス配列における保存アミノ酸残基を検索し、対応するＤＮＡ配列（３ヌクレオチドコドン）に逆翻訳した。各マーカー遺伝子におけるそれ以外の部分をランダムなアミノ酸残基をコードするＤＮＡ配列により置換し、保存アミノ酸残基をコードするＤＮＡ配列と組み合わせ、開始コドン（ＡＴＧ）および停止コドン（ＴＡＡ）を付加し、人工ＣＤＳを得た。人工ＣＤＳをランダムなＤＮＡ配列（遺伝子間領域）により連結することにより、１０ｋヌクレオチド長の人工核酸配列を生成した。人工核酸配列の生成手順の概略を図１に示す。

【0045】

人工ＣＤＳの並び順および人工ＣＤＳがコードする保存アミノ酸残基（配列番号１～１６参照）が共通し、それ以外の部分（ランダム配列）が異なる６種類の人工核酸配列ｓｅｑＨＭＭ３５０１、ｓｅｑＨＭＭ５００１、ｓｅｑＨＭＭ５００２、ｓｅｑＨＭＭ５００３、ｓｅｑＨＭＭ６００１およびｓｅｑＨＭＭ０４を生成した。

【0046】

ｓｅｑＨＭＭ３５０１（配列番号１７）

【化1A】

【化1B】

【化1C】

【化1D】

【0047】

ｓｅｑＨＭＭ５００１（配列番号１８）

【化2A】

【化2B】

【化2C】

【化2D】

【0048】

ｓｅｑＨＭＭ５００２（配列番号１９）

【化3A】

【化3B】

【化3C】

【化3D】

【0049】

ｓｅｑＨＭＭ５００３（配列番号２０）

【化4A】

【化4B】

【化4C】

【化4D】

【0050】

ｓｅｑＨＭＭ６００１（配列番号２１）

【化5A】

【化5B】

【化5C】

【化5D】

【0051】

ｓｅｑＨＭＭ０４（配列番号２２）

【化6A】

【化6B】

【化6C】

【化6D】

【0052】

上記人工核酸配列における１６個の人工ＣＤＳのレイアウトを図２Ａに、各配列におけるＧＣ含量を図２Ｂに示す。ｓｅｑＨＭＭ０４は、領域ごとにＧＣ含量が異なるように設計された。ｓｅｑＨＭＭ５００２とｓｅｑＨＭＭ５００３は、近縁種間の配列異質性を模倣するために、互いの配列類似度が変化する領域を含むように設計された。ｓｅｑＨＭＭ５００２およびｓｅｑＨＭＭ５００３のペアワイズ配列同一性を図２Ｄに示す。

【0053】

（１－２）ＧＣ含量が厳密に制御された人工核酸配列（配列番号２３）の設計
アセンブリにおけるＧＣバイアスの影響を正確に評価するために、人工ＣＤＳを含まない完全ランダム配列からなり、ＧＣ含量が厳密に制御された人工核酸配列ｓｅｑＲＡＮＤＯＭ０１を生成した。人工核酸配列ｓｅｑＲＡＮＤＯＭ０１におけるＧＣ含量を図２Ｃに示す。

【0054】

ｓｅｑＲＡＮＤＯＭ０１（配列番号２３）

【化7A】

【化7B】

【化7C】

【化7D】

【0055】

配列番号１７～２３のすべての人工核酸配列は、ＮＣＢＩなどの公開データベース中に登録の塩基配列と無視できるほどの類似性しか有しないことを確認した（ＢＬＡＳＴによる期待値（Ｅ－ｖａｌｕｅ）が０．１以上の類似度を示す配列は検出されなかった）。

【0056】

配列番号１７～２３の配列からなる人工核酸をジェンスクリプトジャパン株式会社に委託して化学的に合成した。人工核酸をプラスミドベクター（ｐＵＣ５７）に挿入し、プラスミドを通常の手順により増幅し、精製した。人工核酸配列の末端に導入された制限酵素部位を切断し、アガロースゲル電気泳動により人工核酸を分離し、精製した。

【0057】

＜２．人工核酸のアセンブリ性能（１）＞
ＴｒｕＳｅｑＤＮＡＮａｎｏｋｉｔ（イルミナ）を用いて、配列番号１７～２３の配列からなる人工核酸のそれぞれについて個別にシーケンスライブラリを作製し、ＭｉＳｅｑシステム（イルミナ）でシーケンシングを行った（２×２５１ｂｐシーケンシングリード）。ｆａｓｔｐ（Ｃｈｅｎｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２０１８，３４：ｉ８８４－ｉ８９０）を用いたクオリティコントロールの後、カバレッジに変化を持たせるようにシークエンシングリードをランダムにサンプリングし、２つのアセンブラ：ＭＥＧＡＨＩＴ（Ｌｉｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２０１５，３１：１６７４－１６７６）およびＳＰＡｄｅｓ（Ｂａｎｋｅｖｉｃｈｅｔａｌ．，Ｊ．Ｃｏｍｐｕｔ．Ｂｉｏｌ．，２０１２，１９：４５５－４７７）のデフォルト設定によりアセンブルした。

【0058】

アセンブリにより回収された人工核酸配列の割合を図３Ａに示す。ＭＥＧＡＨＩＴ（左）およびＳＰＡｄｅｓ（右）のいずれの結果も、カバレッジ深度とアセンブリの完全性との間にシグモイド関係があることを示し、また、最小限のカバレッジ（１０×）でも完全なアセンブルが達成されたことを示した。

【0059】

ＱＵＡＳＴ（Ｇｕｒｅｖｉｃｈｅｔａｌ．，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２０１３，２９：１０７２－１０７５）およびＣｈｅｃｋＭにより検出された、アセンブリにより回収された人工核酸配列中のマーカー遺伝子の数を図３Ｂに示す。なお、ｓｅｑＲＡＮＤＯＭ０１はＣｈｅｃｋＭ解析から省略された。最小限のカバレッジ（１０×）でも１６遺伝子すべてが検出されており、この結果からも、完全なアセンブルが達成されたことが示された。

【0060】

これらの結果から、配列番号１７～２３の配列からなる人工核酸がアセンブリの完全性の評価に有用であることが確認された。

【0061】

＜３．人工核酸のアセンブリ性能（２）＞
ＤＮＡＰｒｅｐｋｉｔ（イルミナ）を用いて、配列番号１７～２３の配列からなる人工核酸の等モル混合物についてシーケンスライブラリを作製し、ＮｅｘｔＳｅｑシステム（イルミナ）でシーケンシングを行った（２×１５１ｂｐシーケンシングリード）。ｆａｓｔｐを用いたクオリティコントロールおよびシークエンシングリードのサンプリングに続いて、ＳＰＡｄｅｓのデフォルト設定によりリードをアセンブルした。

【0062】

結果を図４に示す。図中、グレーの濃淡はアセンブルされた人工配列と予想される人工配列との配列同一性を表し、９９．９％以上の同一性を有する領域が黒の実線により強調されている。配列が相互に類似しないｓｅｑＨＭＭ３５０１、ｓｅｑＨＭＭ５００１、ｓｅｑＨＭＭ６００１、ｓｅｑＨＭＭ０４およびｓｅｑＲＡＮＤＯＭ０１はいずれも、単一コンティグとしてアセンブルされた。この結果から、これらの配列がアセンブリ性能の評価に適していることが示された。一方、ｓｅｑＨＭＭ５００２およびｓｅｑＨＭＭ５００３は、高い配列類似性のために共アセンブルし、断片化されたアセンブリとなった。この結果から、ｓｅｑＨＭＭ５００２およびｓｅｑＨＭＭ５００３は、アセンブリ性能に対する配列類似性を評価するために有用であることが示された。

【0063】

＜４．人工核酸によるＧＣバイアスの評価＞
領域ごとにＧＣ含量が異なるように設計された人工核酸ｓｅｑＨＭＭ０４（配列番号２２）およびｓｅｑＲＡＮＤＯＭ０１（配列番号２３）のそれぞれについて、上記３と同様の手順によりシーケンスライブラリを作製し、シーケンシングを行った。シークエンシングリードをもとに、ＢＢＭａｐ（ｈｔｔｐｓ：／／ｗｗｗ．ｏｓｔｉ．ｇｏｖ／ｂｉｂｌｉｏ／１２４１１６６）によりカバレッジを算出した。

【0064】

ｓｅｑＨＭＭ０４およびｓｅｑＲＡＮＤＯＭ０１中の位置に沿った相対カバレッジ（黒線）とＧＣ含量（灰色線）のプロットを図５Ａに示す。また、図５Ｂは、図５Ａにおける相対カバレッジおよびＧＣ含量を散布図で提示する。シーケンシングのカバレッジとＧＣ含量との間には強い相関があり、ＧＣ含量の高い領域のカバレッジは少なく見積もられることが明らかになった。この結果から、ｓｅｑＨＭＭ０４およびｓｅｑＲＡＮＤＯＭ０１はＧＣバイアスを評価するために有用であることが示された。

【0065】

＜５．人工核酸の定量性能＞
配列番号１７～２３の配列からなる人工核酸を異なる比率で含む２種類の混合物を調製し、上記３と同様の手順により、シーケンスライブラリを作製し、シーケンシングを実施し、シークエンシングリードをサンプリングした。

【0066】

結果を図６に示す。Ｘ軸は、推定された各人工核酸の存在量（相対値）、Ｙ軸は、測定された各人工核酸の存在量（相対値）を示す。人工核酸からのリード数を定量したところ、いずれの混合物においても、推定存在量と実測存在量との間に優れた一致が見られた。

【0067】

次いで、ヒト糞便微生物叢ＤＮＡ試料に、配列番号１７～２３の配列からなる人工核酸の等モル混合物を異なる質量比（０．３％、１％、３％、３１％）において添加し、上記３と同様の手順により、シーケンスライブラリを作製し、シーケンシングを実施し、シークエンシングリードをサンプリングした。ヒト糞便微生物叢ＤＮＡは、既報論文（Ｔｏｕｒｌｏｕｓｓｅｅｔａｌ．，Ｍｉｃｒｏｂｉｏｍｅ，２０２１，９：９５）を参考に、ヒト糞便からＩＳＯＳＰＩＮＦｅｃａｌＤＮＡｋｉｔ（株式会社ニッポンジーン）を用いて調製した。

【0068】

結果を図７に示す。Ｘ軸は、濃度計算に基づくヒト糞便微生物叢ＤＮＡに対する人工核酸の推定された相対比率、Ｙ軸は、実測値に基づくヒト糞便微生物叢ＤＮＡに対する人工核酸の相対比率を示す。実測値に基づく相対比率は、計算に基づく推定値と一致した。これらの結果から、配列番号１７～２３の配列からなる人工核酸が、微生物量の精密な絶対定量のための信頼できる内部標準として利用できるものであることが示された。

【図1】