特許7444488 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 独立行政法人農業・食品産業技術総合研究機構の特許一覧

特許7444488混入検出法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-02-27

(45)【発行日】2024-03-06

(54)【発明の名称】混入検出法

(51)【国際特許分類】

C12Q 1/6895 20180101AFI20240228BHJP

C12Q 1/6844 20180101ALI20240228BHJP

C12Q 1/686 20180101ALI20240228BHJP

C12Q 1/6862 20180101ALI20240228BHJP

C12Q 1/6827 20180101ALI20240228BHJP

C12N 15/11 20060101ALN20240228BHJP

【ＦＩ】

C12Q1/6895 Z ZNA

C12Q1/6844 Z

C12Q1/686 Z

C12Q1/6862 Z

C12Q1/6827 Z

C12N15/11 Z

【請求項の数】 4

(21)【出願番号】P 2022183439

(22)【出願日】2022-11-16

(62)【分割の表示】P 2019010617の分割

【原出願日】2019-01-24

(65)【公開番号】P2023015312

(43)【公開日】2023-01-31

【審査請求日】2022-11-16

【新規性喪失の例外の表示】特許法第３０条第２項適用平成３０年１１月３０日第４１回日本分子生物学会年会にてポスター発表

【新規性喪失の例外の表示】特許法第３０条第２項適用平成３０年１１月９日第４１回日本分子生物学会年会の要旨集にて発表

【新規性喪失の例外の表示】特許法第３０条第２項適用平成３０年１２月１１ＧｉｔＨｕｂでのソースコードの公開（ＵＲＬ＜ｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ａｋｉｏｍｉｙａｏ／ｐｅｄ＞）

(73)【特許権者】

【識別番号】501203344

【氏名又は名称】国立研究開発法人農業・食品産業技術総合研究機構

(74)【代理人】

【識別番号】100136629

【弁理士】

【氏名又は名称】鎌田光宜

(74)【代理人】

【識別番号】100080791

【弁理士】

【氏名又は名称】高島一

(74)【代理人】

【識別番号】100118371

【弁理士】

【氏名又は名称】▲駒▼谷剛志

(72)【発明者】

【氏名】宮尾安藝雄

【審査官】鈴木崇之

(56)【参考文献】

【文献】特開２０１２－０５５２５４（ＪＰ，Ａ）

【文献】J. Integra. Plant Biol.，2015年，Vol. 57, Issue 11，pp. 980-991

【文献】Plant Cell Physiol.，2011年，Vol. 52, No. 2，pp. 274-282

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｃ１２Ｑ１／００－３／００

Ｃ１２Ｎ１５／００－１５／９０

Ａ０１Ｈ１／００－１７／００

ＣＡｐｌｕｓ／ＭＥＤＬＩＮＥ／ＥＭＢＡＳＥ／ＢＩＯＳＩＳ（ＳＴＮ）

ＧｅｎＢａｎｋ／ＥＭＢＬ／ＤＤＢＪ／ＧｅｎｅＳｅｑ

(57)【特許請求の範囲】

【請求項1】

イネ品種の集団に対する他のイネ品種の集団の混入物を検出するための検出剤であって、イネ参照配列IRGSP1.0のchr1-4033600-4033859もしくはchr2-3897342-3908645の配列、またはその部分配列を含む核酸を検出することができる、検出剤を含む、あきだわらに対する混入米の検出のためのキット。

【請求項2】

イネ参照配列IRGSP1.0のchr1-4033600-4033859またはchr2-3897342-3908645の配列の少なくとも一部に特異的に結合することができる分子を含む、請求項１に記載のキット。

【請求項3】

前記検出剤が、ＰＣＲ用のプライマー、Ｌｉｇａｓｅｃｈａｉｎｒｅａｃｔｉｏｎ（ＬＣＲ）法用のプライマー、Ｌｏｏｐ－ＭｅｄｉａｔｅｄＩｓｏｔｈｅｒｍａｌＡｍｐｌｉｆｉｃａｔｉｏｎ（ＬＡＭＰ）法用のプライマー、またはハイブリダイゼーションのためのプローブである、請求項１に記載のキット。

【請求項4】

前記プライマーが、配列番号３１および３２；配列番号９および１０；配列番号１９および２０；配列番号２５および、２６、２７もしくは２８；ならびに配列番号２９および３０からなる群から選択される、請求項３に記載のキット。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、生物産品における品質管理に関する。

【背景技術】

【0002】

農業技術を含めた生物産品に関する産業においては、人為的に新たな遺伝的背景を有する分類群（新品種）を作出することが広く行われている。しかしながら、品種の普及の過程で種子等の混入が発生すると、その後の作出工程において大きな影響が生じる。そのため、混入の有無を事前に確認することは重要であり、混入を簡易かつ迅速に確認できる技術についての必要性が生じている。

【発明の概要】

【課題を解決するための手段】

【0003】

本発明において、分類群の集団の中で、１つの分類群についてユニークな配列を同定する方法が提供される。ユニークな配列には、例えば、分類群の集団の中で１つの分類群でのみ欠失している配列が含まれ得る。これは、ゲノム全体で、大きなサイズの欠失も含めた多型を網羅的に同定することによって、可能となったものである。ゲノム全体の多型を同定しない場合、ある分類群における多型が、集団における他の分類群に対してユニークであるかを判断できないからである。ユニークな配列は、ある分類群に対する他の分類群の混入を検出する際に利用することができる。本発明の１つの局面は、分類群の集団の中で、１つの分類群についてユニークな配列を同定することを含む、混入を検出するための検出剤の作製方法である。

【0004】

本発明の１つの実施形態において、参照配列に対する多型を網羅的に同定するステップは、対象配列（例えば、シーケンサーからのリード）の両末端付近の配列の、コントロール配列（例えば、ゲノム配列）上の位置を決めて、内側に向かって両方向からアラインすること（双方向アラインメント）を含む方法（「双方向アライン法」）によって行われ得る。

【0005】

本発明の別の実施形態においては、ある分類群について見いだされたユニーク配列に基づく、混入を検出するための検出剤、またはそれを含むキットが提供され得る。

【0006】

本発明の実施形態の例として、以下の項目が挙げられる。
（項目Ａ１）対象となる分類群の集団を特定するステップと、
各分類群における、参照配列に対する多型を網羅的に同定するステップと、
該集団の中で、ある分類群でユニークな配列を選択するステップと、
必要に応じて該ユニークな配列から該品種内の変異を除去するステップと
を含む、ユニークな配列の同定方法。
（項目Ａ２）前記ユニークな配列が、前記集団の中で前記分類群に存在する欠失である、前記項目に記載の方法。
（項目Ａ３）前記参照配列に対する多型を網羅的に同定するステップが、
ａ）対象配列データの配列中の少なくとも２ヶ所の部分配列の、参照配列上の位置を特定することと、
ｂ）対象配列データにおける該部分配列間の位置関係と、参照配列上の該部分配列間の位置関係とを比較することと、
ｃ）対象配列データにおける該部分配列間の位置関係と、参照配列上の該部分配列間の位置関係とが異なっている場合、目的とする多型があると判定し、該対象配列データにおける該部分配列部位間の文字を、対応するコントロール配列上の文字と、該部分配列部位を始点として順次比較して不一致となる部位を検出することと
を包含する、前記項目のいずれかに記載の方法。
（項目Ａ４）前記ある分類群でユニークな配列を選択するステップが、ある分類群に存在する多型の位置の中から、前記分類群の集団の中の他の分類群に存在する多型の位置に含まれていない位置を抽出することを含む、前記項目のいずれかに記載の方法。
（項目Ａ５）前記対象となる分類群の集団が、品種の集団である、前記項目のいずれかに記載の方法。
（項目Ａ６）前記品種の集団が、イネ品種の集団である、前記項目のいずれかに記載の方法。
（項目Ａ７）生物産品に対する混入物を検出するための検出剤の作製方法であって、前記項目のいずれかに記載の方法によってある分類群の集団におけるある分類群でユニークな配列を同定するステップと、
該ユニークな配列を有する配列または該ユニークな配列を有しない配列を検出することができる検出剤を作製する工程と
を含む、方法。
（項目Ａ８）前記項目のいずれかに記載の方法によって特定された、前記分類群におけるユニークな配列を検出することができる検出剤。
（項目Ｂ１）イネ参照配列IRGSP1.0のchr1-4033600-4033859もしくはchr2-3897342-3908645の配列、またはその部分配列を含む核酸を検出することができる検出剤。
（項目Ｂ２）イネ参照配列IRGSP1.0のchr1-4033600-4033859またはchr2-3897342-3908645の配列の少なくとも一部に特異的に結合することができる分子を含む、前記項目に記載の検出剤。
（項目Ｂ３）前記検出剤が、ＰＣＲ用のプライマー、Ｌｉｇａｓｅｃｈａｉｎｒｅａｃｔｉｏｎ（ＬＣＲ）法用のプライマー、Ｌｏｏｐ－ＭｅｄｉａｔｅｄＩｓｏｔｈｅｒｍａｌＡｍｐｌｉｆｉｃａｔｉｏｎ（ＬＡＭＰ）法用のプライマー、またはハイブリダイゼーションのためのプローブである、前記項目のいずれかに記載の検出剤。
（項目Ｂ４）前記プライマーが、配列番号３１および３２（PB1269とPB1270）；配列番号９および１０（PB1229とPB1230）；配列番号１９および２０（PB1239とPB1240）；配列番号２５および、２６、２７もしくは２８（PB1245とPB1246、PB1247、PB1248）ならびに配列番号２９および３０（PB1249とPB1250）からなる群から選択される、前記項目のいずれかに記載の検出剤。
（項目Ｂ５）あきだわらに対する混入米の検出のための前記項目のいずれかに記載の検出剤を含むキット。
（項目Ｃ１）イネ参照配列IRGSP1.0のchr2-20251314-20251315、chr3-28656481-28656478 、chr4-33262896-33263007もしくはchr9-9974386-9975667の配列、またはその部分配
列を含む核酸を検出することができる検出剤。
（項目Ｃ２）イネ参照配列IRGSP1.0のchr2-20251314-20251315、chr3-28656481-28656478 、chr4-33262896-33263007またはchr9-9974386-9975667の配列の少なくとも一部に特
異的に結合することができる分子を含む、前記項目に記載の検出剤。
（項目Ｃ３）前記検出剤が、ＰＣＲ用のプライマー、Ｌｉｇａｓｅｃｈａｉｎｒｅａｃｔｉｏｎ（ＬＣＲ）法用のプライマー、Ｌｏｏｐ－ＭｅｄｉａｔｅｄＩｓｏｔｈｅｒｍａｌＡｍｐｌｉｆｉｃａｔｉｏｎ（ＬＡＭＰ）法用のプライマー、またはハイブリダイゼーションのためのプローブである、前記項目のいずれかに記載の検出剤。
（項目Ｃ４）前記プライマーが、配列番号１および２（PB1221とPB1222）；配列番号５および６（PB1225とPB1226）、配列番号７および８（PB1227とPB1228）ならびに配列番号３５および３６（PB1321とPB1322）からなる群から選択される、前記項目のいずれかに記載の検出剤。
（項目Ｃ５）コシヒカリに対する混入米の検出のための、前記項目のいずれかに記載の検出剤を含むキット。
（項目Ｄ１）イネ参照配列IRGSP1.0のchr2-24169949-24170099の配列またはその部分配列を含む核酸を検出することができる検出剤。
（項目Ｄ２）イネ参照配列IRGSP1.0のchr2-24169949-24170099の配列の少なくとも一部に特異的に結合することができる分子を含む、前記項目に記載の検出剤。
（項目Ｄ３）前記検出剤が、ＰＣＲ用のプライマー、Ｌｉｇａｓｅｃｈａｉｎｒｅａｃｔｉｏｎ（ＬＣＲ）法用のプライマー、Ｌｏｏｐ－ＭｅｄｉａｔｅｄＩｓｏｔｈｅｒｍａｌＡｍｐｌｉｆｉｃａｔｉｏｎ（ＬＡＭＰ）法用のプライマー、またはハイブリダイゼーションのためのプローブである、前記項目のいずれか１に記載の検出剤。
（項目Ｄ４）前記プライマーが、配列番号１５および１６（PB1235とPB1236）である、前記項目のいずれかに記載の検出剤。
（項目Ｄ５）とよめきに対する混入米の検出のための、前記項目のいずれかに記載の検出剤を含むキット。
（項目Ｅ１）イネ参照配列IRGSP1.0のchr11-2817224-2817245の配列またはその部分配
列を含む核酸を検出することができる検出剤。
（項目Ｅ２）イネ参照配列IRGSP1.0のchr11-2817224-2817245の配列の少なくとも一部
に特異的に結合することができる分子を含む、前記項目に記載の検出剤。
（項目Ｅ３）前記検出剤が、ＰＣＲ用のプライマー、Ｌｉｇａｓｅｃｈａｉｎｒｅａｃｔｉｏｎ（ＬＣＲ）法用のプライマー、Ｌｏｏｐ－ＭｅｄｉａｔｅｄＩｓｏｔｈｅｒｍａｌＡｍｐｌｉｆｉｃａｔｉｏｎ（ＬＡＭＰ）法用のプライマー、またはハイブリダイゼーションのためのプローブである、前記項目のいずれかに記載の検出剤。
（項目Ｅ４）前記プライマーが、配列番号２１および２２（PB1241とPB1242）である、前記項目のいずれかに記載の検出剤。
（項目Ｅ５）ほしじるしに対する混入米の検出のための、前記項目のいずれかに記載の検出剤を含むキット。
（項目Ｆ１）イネ参照配列IRGSP1.0のchr3-6633622-6633640の配列またはその部分配列を含む核酸を検出することができる検出剤。
（項目Ｆ２）イネ参照配列IRGSP1.0のchr3-6633622-6633640の配列の少なくとも一部に特異的に結合することができる分子を含む、前記項目に記載の検出剤。
（項目Ｆ３）前記検出剤が、ＰＣＲ用のプライマー、Ｌｉｇａｓｅｃｈａｉｎｒｅａｃｔｉｏｎ（ＬＣＲ）法用のプライマー、Ｌｏｏｐ－ＭｅｄｉａｔｅｄＩｓｏｔｈｅｒｍａｌＡｍｐｌｉｆｉｃａｔｉｏｎ（ＬＡＭＰ）法用のプライマー、またはハイブリダイゼーションのためのプローブである、前記項目のいずれかに記載の検出剤。
（項目Ｆ４）前記プライマーが、配列番号２３および２４（PB1243とPB1244）である、前記項目のいずれかに記載の検出剤。
（項目Ｆ５）やまだわらに対する混入米の検出のための、前記項目のいずれかに記載の検出剤を含むキット。
（項目Ｇ１）混入が疑われる試料における混入を検出する方法であって、
混入が疑われる試料から核酸試料を得る工程と、
該核酸試料においてユニーク配列の有無を調べる工程と
を含む、方法。
（項目Ｇ２）前記ユニーク配列の有無を調べる工程が、前記項目のいずれかに記載される検出剤を用いて行われる、前記項目に記載の方法。
（項目Ｇ３）前記ユニーク配列が、ユニークな欠失である、前記項目のいずれかに記載の方法。

【0007】

本発明において、上記１または複数の特徴は、明示された組み合わせに加え、さらに組み合わせて提供されうることが意図される。本発明のなおさらなる実施形態および利点は、必要に応じて以下の詳細な説明を読んで理解すれば、当業者に認識される。

【発明の効果】

【0008】

本発明によって、生物産品における混入を高い精度で検出することができる。また、ごく微量の混入も検出可能である。本発明において、所望の生物産品における混入を検出するための欠失の特定方法、それを用いた検出剤の作製方法、ならびにそれによって作製された検出剤またはそれを用いて混入を検出する方法も提供される。

【図面の簡単な説明】

【0009】

【図1】図１は、実施例２－１におけるプライマーPB1229およびPB1230と、プライマーPB1239およびPB1240とを用いて、示される供試品種について増幅反応を行った結果を示す図である。

【図2】図２は、実施例２－２におけるプライマーPB1235およびPB1236を用いて、示される供試品種について増幅反応を行った結果を示す図である。

【図3】図３は、実施例２－３におけるプライマーPB1241およびPB1242を用いて、示される供試品種について増幅反応を行った結果を示す図である。

【図4】図４は、実施例２－４におけるプライマーPB1243およびPB1244を用いて、示される供試品種について増幅反応を行った結果を示す図である。

【図5】図５は、実施例３におけるプライマーPB1227およびPB1228を用いて示される供試品種について増幅反応を行った結果を示す図である。

【図6】図６は、実施例３－１におけるプライマー対（PB1227およびPB1228）を用いて、コシヒカリgenome DNA溶液に、段階的な濃度の日本晴genome DNAを添加し、検出増幅反応を行った結果を示す図である。

【図7】図７は、実施例４におけるプライマーセットを用いて、核酸クロマトグラフィーによる増幅反応の検出を行った結果を示す図である。

【図8】図８は、本発明のシステムの実施形態を模式的に示した図である。

【図9】図９は、本発明のシステムのさらなる実施形態を模式的に示した図である。

【発明を実施するための形態】

【0010】

以下、本発明を最良の形態を示しながら説明する。本明細書の全体にわたり、単数形の表現は、特に言及しない限り、その複数形の概念をも含むことが理解されるべきである。従って、単数形の冠詞（例えば、英語の場合は「ａ」、「ａｎ」、「ｔｈｅ」など）は、特に言及しない限り、その複数形の概念をも含むことが理解されるべきである。また、本明細書において使用される用語は、特に言及しない限り、当該分野で通常用いられる意味で用いられることが理解されるべきである。したがって、他に定義されない限り、本明細書中で使用される全ての専門用語および科学技術用語は、本発明の属する分野の当業者によって一般的に理解されるのと同じ意味を有する。矛盾する場合、本明細書（定義を含めて）が優先する。

【0011】

（定義）
以下に本明細書において特に使用される用語の定義および／または基本的技術内容を適宜説明する。

【0012】

本明細書において、「生物産品」とは、生物に由来する成分を含む物品を指す。生物産品としては、生物自体（農産物、水産物、畜産物など）も含み、また、何らかの加工が行われた物品（加工食品など）も含む。生物産品の例としては、例えば、農産物、畜産物、水産物、医療製品、昆虫、食品、繊維、皮革、微生物、ウイルス、血液などが挙げられる。

【0013】

本明細書において、「ユニークな配列」とは、ある分類群の集団の中で、１つの分類群についてのみ存在するか、または存在しない配列を指す。例えば、品種Ａ、ＢおよびＣの集団Ｐにおいて、Ａについてのみ存在する配列はＰにおいてＡに「ユニークな配列」ということができる。あるいは、ＢおよびＣに存在するにもかかわらず、Ａにのみ存在しない配列について、ＰにおいてＡに「ユニークな配列」と称する場合があることに留意されたい。

【0014】

配列がユニークであるかの判断に際して、集団における分類群のそれぞれの配列についてアライメントを行うことができる。アライメントした場合に、存在しない（ギャップ）となる部分について、その配列に空白を示す記号（Ｎｕｌｌ）が含まれていると考えることができる。そのため、ある分類群についてのみ、他の分類群には存在しないＮｕｌｌを含む配列が存在するということから、ユニークな欠失についてもユニークな配列として捉えることが可能である。ある分類群に存在するユニークな欠失に対応する位置において、他の分類群に存在する配列は必ずしも同一である必要はない。

【0015】

本明細書において、「分類群」とは、一定の遺伝的背景を有するものとして画定される任意の生物の集団を指す。本明細書における「分類群」は、分類学上の分類群（目、科、属、種）であってもよく、品種、亜種、変種なども含み得る。また、必要に応じて、同一品種内の地域ごとの個体群も含み得る。分類学上の単系統群である必要はなく、必要に応じて、複数の品種をまとめて分類群としてもよい。

【0016】

本明細書において、「配列」とは、各々が何らかの値を取る複数の変数であって、それら複数の変数の順序の情報をさらに含むものをいう。代表的には文字列で表示される。

【0017】

本明細書において、「対象配列」とは、多型を検出しようとする任意の配列をいい、本明細書においては、「ターゲット」、「ターゲット配列」、「ｔａｒｇｅｔ」とも表記する場合がある。

【0018】

本明細書において、「コントロール配列」とは、その配列との差異を多型として検出するための基準として用いられる任意の配列をいい、本明細書においては、「コントロール」、「参照配列」、「比較配列」、「ｃｏｎｔｒｏｌ」とも表記する場合がある。

【0019】

本明細書において、「多型（ｐｏｌｙｍｏｒｐｈｉｓｍ）」とは、対象配列中においてコントロール配列と異なっている任意の部分を指す。本明細書において、「変異」も同様の意味で使用することができる。

【0020】

本明細書において、「リファレンス（ｒｅｆｅｒｅｎｃｅ）配列」とは、対象配列および／またはコントロール配列の全長の配列として扱うことができる配列を指す。いかなる配列を全長配列とするかは、対象配列および／またはコントロール配列として用いる配列に応じて適宜決定されるものであり、例示されるものに限定されないが、例えば、ウェブ上のデータベース等に存在する、全ゲノム配列、染色体全長配列、遺伝子全長配列、プラスミド全長配列、エクソン全長配列、タンパク質全長配列などをリファレンス配列として用いることができる。

【0021】

本明細書において、「配列データ」とは、ある配列についての情報を与えるデータをいう。代表的には、配列そのものも配列データということができ、また、配列の一部について情報を与えるデータ（例えば、ゲノム配列に対するシーケンシングによる解析データ）も配列データとして包含される。

【0022】

本明細書において、ある配列の「部分配列」とは、その配列に含まれる任意の配列をいう。

【0023】

本明細書において、「サブセット」とは、配列の集合と、それらの配列の部分配列の集合とを合わせた集合の任意の部分集合をいう。

【0024】

本明細書において、「次世代シーケンシング」とは、配列決定プロセスを並列化し、一度のランで数千万から数億の配列データを生成するシーケンシング技法である。「次世代シーケンサー」とは、次世代シーケンシングを行うための機器を指す。

【0025】

「偶然同一を排除する」とは、ある配列と、偶然に同一の配列が出現する期待値を１未満にすることをいう。

【0026】

本明細書において、「カバレッジ」とは、配列データの量が、配列全長の何倍に相当しているかを指す。「カバー率」、「～倍の読み」などと称される場合もある。

【0027】

本明細書において、「配列構造体」とは、配列中における、物理的に分離された一連の配列をいう。例えば、ゲノム配列の文脈では、染色体のそれぞれは配列構造体ということができる。

【0028】

本明細書において、「転座」とは、複数の配列構造体を有する配列中で、ある配列構造体上の部分配列が、他の配列構造体上に移動している多型をいう。

【0029】

本明細書において、「ジャンクション」とは、一部が同一である２つの配列について、同一である部分と同一でない部分の境界を指す。

【0030】

本明細書において、「識別子」とは、ある多型を他の多型と区別するために付される名称を指す。一般的には、多型の開始位置と型で記載されることが多いが、本明細書において記載される識別子を用いることができる。

【0031】

本明細書において、「エッジ」とは、配列において多型を含む部分の末端をさす。

【0032】

（特定方法）
本発明の１つの実施形態において、分類群の集団の中で、１つの分類群についてユニークな配列を同定する方法が提供される。この方法は、対象となる分類群の集団を特定するステップと、各分類群における、参照配列に対する多型を網羅的に同定するステップと、該集団の中で、ある分類群でユニークな配列を選択するステップとを含み得る。特に、ユニークな配列として、集団の中である分類群にのみ存在する欠失が挙げられる。このような欠失部位は、検出剤の設計に資する。とりわけ、大きなサイズの欠失（例えば、シークエンサーのショートリード（100bp～150bp）より長い欠失）を含めて網羅的に多型を同定することによって、ユニークな欠失の同定が可能となる。

【0033】

分類群の集団は、任意のものを特定することができるが、一例としては、ある生物種における複数の品種を挙げて特定することができる。例えば、イネについて、こしひかり、あきたこまちなどの品種の集団を特定することができる。混入の検出剤の設計という観点からは、ある程度近しい分類群の集団を特定することが一般的と考えられるが、原理上は幅広い遺伝的背景に由来する分類群の集団を特定してもよい。分類群の集団の例としては、複数のイネ品種の集団、複数のムギ品種の集団、複数のダイズ品種の集団、複数のトウモロコシ品種の集団、複数のアズキ品種の集団が挙げられる。

【0034】

ある分類群でユニークな配列を選択するステップは、ある分類群に存在する多型の位置の中から、分類群の集団の中の他の分類群に存在する多型の位置に含まれていない位置を抽出することを含み得る。特定の品種のみに存在する挿入・欠失を検出するためには、目的の品種以外の対象となる集団「枠」のすべての挿入・欠失部位の染色体番号と位置を記憶し、次に目的とする品種の挿入・欠失の位置情報の中から、すでに記憶された位置に含まれない染色体番号と位置を抽出することで達成できる。

【0035】

また、方法は、必要に応じてユニークな配列から品種内の変異を除去するステップを含み得る。これは、各品種から一個体のみの配列情報をもとに解析すると品種内の個体内変異に関しても検出されてしまうため、個体内変異の場合は、同一品種であっても、異種であると判定される可能性があるからである。この問題を解決するためには、目的の品種の複数の個体の配列情報を取得して、目的の品種のみに共通に存在する挿入・欠失配列を検出することで達成できる。

【0036】

あるいは、それぞれの品種から複数の個体の配列情報を得るのはコストがかかるため、一個体のみの配列情報から個体内変異ではない品種特異的な挿入・欠失変異を得るためには、当該品種の複数個体のＤＮＡから個体別にＰＣＲを行い、その品種の個体内ですべて同一の増幅産物が得られる、あるいは、得られないことを確認すればよい。

【0037】

本発明のさらなる実施形態においては、生物産品に対する混入物を検出するための検出剤の作製方法であって、上述の特徴を備える方法によってある分類群の集団におけるある分類群でユニークな配列を同定するステップと、ユニークな配列を有する配列またはユニークな配列を有しない配列を検出することができる検出剤を作製する工程とを含む、方法が提供され得る。加えて、そのような方法によって特定された、前記分類群におけるユニークな配列を検出することができる検出剤、またはそれを含むキットも提供され得る。

【0038】

（双方向アラインメント）
次世代シーケンサーによる全ゲノム配列が比較的容易に得られるようになり、イネ品種・個体の多型情報が比較的容易に得られるようになってきている。多型の検出には、ｂｗａによるリファレンスゲノムへのマッピングに続いてＳａｍｔｏｏｌｓやＧＡＴＫを用いた多型の検出を行うのが一般的であるが、大きな欠失の検出は困難である。そのため、本発明においては、多型の検出において、アラインメントを工夫することにより、大きな欠失も検出できる以下に詳述するような多型検出系を用いることが有利な場合がある。

【0039】

置換、挿入、欠失、逆位または転座を検出するのに有用なプロセスとしては、対象配列データの配列中の少なくとも２ヶ所の部分配列の、コントロール配列上の位置を特定する工程を含むプロセスがある。ここで、部分配列は、ｋ長の部分配列を用いることができる。好ましくは、コントロール配列は、配列上の位置情報が特定できる配列であり、より好ましくは、コントロール配列はリファレンス配列である。このようなプロセスについて、国際出願ＰＣＴ／ＪＰ２０１８／０２７５３６に詳述されており、その内容は、その全体が本明細書において参考として援用される。

【0040】

プロセスは、対象配列データにおける部分配列間の位置関係と、コントロール配列上の部分配列間の位置関係とを比較する工程を含み得る。ここで、対象配列データにおける部分配列間の位置関係と、コントロール配列上の部分配列間の位置関係とが異なっている場合、目的とする多型があると判定することができる。例えば、部分配列が、コントロール配列の異なる配列構造体上に存在する場合、転座が生じていると判定すること、部分配列が、コントロール配列の同一の配列構造体上に存在し、かつ、向きが対象配列データ上のものと異なっている場合、逆位が存在すると判定すること、部分配列が、コントロール配列の同一の配列構造体上に存在し、向きが対象配列データ上のものと同一であり、部分配列の距離が、コントロール配列上で対象配列データ上の距離より短い場合、欠失が存在すると判定すること、および／または部分配列が、コントロール配列の同一の配列構造体上に存在し、向きが対象配列データ上のものと同一であり、部分配列の距離が、コントロール配列上で対象配列データ上の距離より長い場合、挿入が存在すると判定することを含み得る。位置関係が異ならない場合、処理を終了してもよく、目的とする多型はないと判定してもよく、対象配列データにおける部分配列部位間の文字を、対応するコントロール配列上の文字と比較して不一致となる部位を検出する工程をさらに行い、不一致となる部位が存在する場合、置換が存在すると判定してもよい。

【0041】

プロセスは、位置関係が異なっている場合、目的とする多型があると判定し、対象配列データにおける部分配列部位間の文字を、対応するコントロール配列上の文字と、部分配列部位を始点として順次比較して不一致となる部位を検出する工程を含み得る。かかる工程により、検出した多型の境界塩基を検出することができる。

【0042】

（配列）
本発明の対象配列、コントロール配列および／またはリファレンス配列としては、多型が生じ得る任意の配列を用いることができる。なお、コントロール配列として、リファレンス配列を用いることが可能である。代表的な実施形態では、対象配列、コントロール配列および／またはリファレンス配列は、生物学的配列であり、例えば、塩基配列（ＤＮＡ、ＲＮＡ、およびそれらのアナログ等の配列が包含される）、アミノ酸配列、または糖鎖配列等である。生物学的配列の例としては、例えば、ゲノム配列、染色体配列、遺伝子配列、プラスミド配列、エクソン配列、タンパク質配列等が挙げられる。

【0043】

対象配列データおよびコントロール配列データは、限定されるものではないが、多型を検出する上では、一定の共通性を持つ配列についての配列データであることが望ましい。しかしながら、配列の取得方法については各々同一でも異なっていてもよく、シーケンシングによって得られたデータ間での比較を行うことも、データベース等から得られたデータ間での比較を行うことも、シーケンシングによって得られたデータとデータベース等から得られたデータとの間での比較を行うことも可能である。

【0044】

１つの実施形態では、対象配列データが、個体から得られた配列データであり、コントロール配列データが、該個体と同種の別の個体、またはデータベースから得られた配列データである。１つの実施形態では、対象配列データが、個体の組織試料から得られた配列データであり、コントロール配列データが、該個体の別の組織、またはデータベースから得られた配列データである。１つの実施形態では、対象配列データが、細胞試料から得られた配列データであり、コントロール配列データが、別の細胞、またはデータベースから得られた配列データである。

【0045】

１つの実施形態では、本発明の方法で用いる対象配列データおよび／またはコントロール配列データは、シーケンシングによって得られた塩基配列データである。シーケンシングの手法としては、サンガー法、マクサム・ギルバード法、単一分子リアルタイムシーケンシング（例えば、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ、ＭｅｎｌｏＰａｒｋ、Ｃａｌｉｆｏｒｎｉａ）、イオン半導体シーケンシング（例えば、ＩｏｎＴｏｒｒｅｎｔ、ＳｏｕｔｈＳａｎＦｒａｎｃｉｓｃｏ、Ｃａｌｉｆｏｒｎｉａ）、パイロシーケンシング（例えば、４５４、Ｂｒａｎｆｏｒｄ、Ｃｏｎｎｅｃｔｉｃｕｔ）、ライゲーションによるシーケンシング（例えば、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ、Ｃａｒｌｓｂａｄ、ＣａｌｉｆｏｒｎｉａのＳＯＬｉＤシーケンシング）、合成および可逆性ターミネーターによるシーケンシング（例えば、Ｉｌｌｕｍｉｎａ、ＳａｎＤｉｅｇｏ、Ｃａｌｉｆｏｒｎｉａ）、透過型電子顕微鏡法などの核酸イメージング技術、ナノポアシーケンシングなどがある。

【0046】

１つの実施形態では、本発明の方法で用いる対象配列データおよび／またはコントロール配列データは、次世代シーケンシングによって得られた配列データであり得る。次世代シーケンシングとしては、シーケンシングバイシンセシス、パイロシーケンシング、ライゲーションによるシーケンシング、イオン半導体シーケンシング、ナノポアシーケンシングが挙げられる。次世代シーケンシングデータからの多型の検出においては、リファレンスへのマッピングやアセンブリによって精度が制限されていたため、本発明の方法を用いた場合に大きな利益が得られると考えられる。

【0047】

１つの実施形態では、本発明の方法で用いる対象配列データおよび／またはコントロール配列データは、ジニトロフェニル化法、ヒドラジン分解法、カルボキシペプチダーゼ法、エドマン法もしくはそれらの方法を自動化する装置（ペプチドシーケンサーあるいはプロテインシーケンサー）を用いる方法、質量分析（例えば、タンデム質量分析計（ＭＳ／ＭＳ））を用いた方法（例えば、シーケンスタグ法）等から得られたアミノ酸配列データである。

【0048】

本発明の対象配列データおよび／またはコントロール配列データの由来となる生物種としては、生物学的配列を有するものである以上は何ら制限されない。一部を例示すると、動物としては、ヒトもしくは非ヒト哺乳動物（例えば、マウス、ラット、ウサギ、ヒツジ、ブタ、ウシ、ウマ、ネコ、イヌ、サル、チンパンジー）、鳥類、爬虫類、両生類、魚類等の脊椎動物、無脊椎動物、例えば、昆虫、線形動物などを挙げることができる。植物としては、イネ、ムギ、ダイズ、アズキ、コムギ、トウモロコシ、ジャガイモ、オオムギ、サツマイモ、ソバ、シロイヌナズナ、ミヤコグサ、トマト、キュウリ、キャベツ、白菜、ナス、サトウキビ、ソルガム、リンゴ、ミカン、バナナ、桃、ポプラ、松、杉、被子植物、裸子植物、シダ、コケ、藻類などを挙げることができる。その他、真菌、細菌、ウイルス等でもよい。

【0049】

さらに、これらの生物の一部分、例えば、組織、細胞等に由来する対象配列データおよび／またはコントロール配列データを解析し、多型を検出することも可能である。

【0050】

（標的配列）
生物産品において、所望の生物以外の生物またはそれに由来する成分が含まれているかを検出する方法が本発明において提供される。生物は、それぞれ固有の遺伝情報を有しており、その違いを検出することによって所望の生物以外の生物の混入を検出することができる。例えば、対象とする分類群についてのみ存在しないが、その他の分類群に存在する配列を検出できる検出剤を用いれば、対象分類群しか含まれない生物産品に由来する試料ではシグナルが検出されないが、対象分類群以外の分類群が含まれた生物産品に由来する試料においてシグナルが検出され、混入を知ることができる。

【0051】

とりわけ、ある集団において、ある分類群においてのみ欠失している配列が、標的配列として好適である。当該標的配列に対する検出剤により、当該分類群に対する他の分類群の混入を検出できるからである。標的配列は、ある集団における参照配列（例えば、参照ゲノム配列）上の配列であり得る。

【0052】

「双方向アライン法」を用いて、各品種の多型情報を得る。混入を検知したい目的の品種に特異的な、挿入、あるいは、欠失変異を抽出し、変異部分に対応する野生型側の配列よりプライマーを作成する。対象の品種のみを含むＤＮＡではプライマーはアニールできないので増幅できないが、ごく微量でも他品種のＤＮＡが混入すると、プライマーがアニールして増幅産物が得られるので、容易に混入を判別することができる。次世代シーケンサーで解析した全ゲノム配列の比較により品種特異的な多型部位を検出し、多型部分にＰＣＲプライマーを設定する。目的の品種（試料）のみ配列が異なり、他の品種では共通の配列を持つ部分を特定して設定することで、微量の混入でも増幅産物が得られるので、高感度で混入を検知できる。

【0053】

本明細書においては、配列を、参照ゲノム配列における染色体番号および位置で示す場合がある。例えば、イネIRGSP1.0の配列を基準として配列を示す場合がある。当業者は、ある参照ゲノム配列について、染色体番号、始点の位置および終点の位置が決定されれば、示される配列について理解することが可能である。例えば、形式として、ある参照配列の「chr〇〇-●●-△△」と示した場合には、第〇〇染色体の●●から△△までの配列を
示す。なお、ジャンクションの部分が繰り返し配列の場合は、繰り返しが終わった部分をジャンクションとして検出するため、上流側と下流側の位置の差と欠失サイズは一致していない場合があることに留意されたい。このジャンクションの間の一部の配列、または、このジャンクション部分を含む配列を標的配列とすることができる。例えば、ジャンクションの間の一部の配列、または、このジャンクション部分を含む配列を有するプライマーを少なくとも１つは使用した場合に、配列の相違が増幅結果に反映され得る。

【0054】

本発明の１つの実施形態は、ユニークな欠失配列またはその部分配列を含む核酸を検出することができる検出剤である。ユニークな欠失配列は、本明細書に記載される任意のユニーク欠失配列であってよい。ユニークな欠失配列の部分配列は、偶然同一を排除する長さの部分配列であり得る。例えば、ユニークな欠失配列の部分配列は、少なくとも８塩基の長さを有していてもよい。

【0055】

あきだわらは、日本晴イネ参照配列（IRGSP1.0）におけるchr1-4033600-4033859またはchr2-3897342-3908645に対応する位置に、それぞれ266bpおよび11309bpの欠失を有していることが見出されたが、この欠失は、本明細書に記載される主要なイネ品種の集団において、あきだわらにしか存在していないユニークな配列である。当該領域の配列を有する核酸の有無を検出することにより、あきだわらに対する他の品種の混入を検出することができる。

【0056】

コシヒカリは、日本晴イネ参照配列（IRGSP1.0）におけるchr2-20251314-20251315、chr3-28656481-28656478、chr4-33262896-33263007またはchr9-9974386-9975667に対応する位置に、それぞれ3bp、21bpおよび1287bpの欠失を有していることが見出されたが、この
欠失は、本明細書に記載される主要なイネ品種の集団において、コシヒカリにしか存在していないユニークな配列である。当該領域の配列を有する核酸の有無を検出することにより、コシヒカリに対する他の品種の混入を検出することができる。

【0057】

とよめきは、日本晴イネ参照配列（IRGSP1.0）におけるchr2-24169949-24170099に対応する位置に、153bpの欠失を有していることが見出されたが、この欠失は、本明細書に記
載される主要なイネ品種の集団において、とよめきにしか存在していないユニークな配列である。当該領域の配列を有する核酸の有無を検出することにより、とよめきに対する他の品種の混入を検出することができる。

【0058】

ほしじるしは、日本晴イネ参照配列（IRGSP1.0）におけるchr11-2817224-2817245に対
応する位置に、24bpの欠失を有していることが見出されたが、この欠失は、本明細書に記載される主要なイネ品種の集団において、ほしじるしにしか存在していないユニークな配列である。当該領域の配列を有する核酸の有無を検出することにより、ほしじるしに対する他の品種の混入を検出することができる。

【0059】

やまだわらは、日本晴イネ参照配列（IRGSP1.0）におけるchr3-6633622-6633640に対応する位置に、20bpの欠失を有していることが見出されたが、この欠失は、本明細書に記載される主要なイネ品種の集団において、やまだわらにしか存在していないユニークな配列である。当該領域の配列を有する核酸の有無を検出することにより、やまだわらに対する他の品種の混入を検出することができる。

【0060】

この他の本明細書において開示されるユニークな欠失配列についても、同様に当該領域の配列を有する核酸の有無を検出することにより、当該ユニークな欠失を有する品種に対する他の品種の混入を検出することができる。

【0061】

（検出剤）
本明細書において、「検出剤」とは、対象の分子の存在についての情報を提供し得る任意の剤を指す。検出剤は、例えば、ある分子に結合することができる分子であり得る。

【0062】

１つの実施形態では、ある配列の検出剤として、ある配列の少なくとも一部に特異的に結合することができる分子を含むものが挙げられる。

【0063】

本明細書において核酸の「検出」または「定量」は、例えば、マーカー検出剤への結合または相互作用を含む、ｍＲＮＡの測定および免疫学的測定方法を含む適切な方法を用いて達成され得る。分子生物学的測定方法としては、例えば、ノーザンブロット法、ドットブロット法またはＰＣＲ法などが例示される。免疫学的測定方法としては、例えば、方法としては、マイクロタイタープレートを用いるＥＬＩＳＡ法、ＲＩＡ法、蛍光抗体法、発光イムノアッセイ（ＬＩＡ）、免疫沈降法（ＩＰ）、免疫拡散法（ＳＲＩＤ）、免疫比濁法（ＴＩＡ）、ウェスタンブロット法、免疫組織染色法などが例示される。また、定量方法としては、ＥＬＩＳＡ法またはＲＩＡ法などが例示される。アレイ（例えば、ＤＮＡアレイ、プロテインアレイ）を用いた遺伝子解析方法によっても行われ得る。ＤＮＡアレイについては、（秀潤社編、細胞工学別冊「ＤＮＡマイクロアレイと最新ＰＣＲ法」）に広く概説されている。そのようなさらなる分析方法は、例えば、ゲノム解析実験法・中村祐輔ラボ・マニュアル、編集・中村祐輔羊土社（２００２）などに記載されており、本明細書においてそれらの記載はすべて参考として援用される。

【0064】

具体的な検出剤としては、ＰＣＲ用のプライマー、Ｌｉｇａｓｅｃｈａｉｎｒｅａｃｔｉｏｎ（ＬＣＲ）法用のプライマー、Ｌｏｏｐ－ＭｅｄｉａｔｅｄＩｓｏｔｈｅｒｍａｌＡｍｐｌｉｆｉｃａｔｉｏｎ（ＬＡＭＰ）法用のプライマー、またはハイブリダイゼーションのためのプローブである。検出剤は、例えば、蛍光分子、ビオチンタグなどの検出を促進する任意の部分と組み合わせられ得る。

【0065】

（キット）
本発明において、混入を検出するための、検出剤を含むキットが提供され得る。検出剤は、本明細書の他の箇所に記載される特徴を備えるものであり得る。キットは、さらに、検出剤による、核酸の検出または増幅を補助する任意の手段をさらに含み得る。例えば、キットは、検出剤が、PCR用のプライマーである場合、当該プライマーを用いたPCR反応において用いられ得る任意の要素（ポリメラーゼ、バッファー、反応器、ｄNTPなど）や、
増幅産物を確認する任意の手段（電気泳動装置、核酸クロマトグラフィーキットなど）をさらに含み得る。その他、マイクロアレイ、ドットブロットハイブリダイゼーション、サザンハイブリダイゼーション、質量分析等を行うための手段が含まれ得る。

【0066】

（検出方法）
本発明の１つの実施形態として、混入を検出する方法が提供され得る。方法においては、混入が疑われる試料から核酸試料を得る工程と、当該核酸試料に対して、本明細書に記載される検出剤を用いてユニーク配列の有無を調べる工程とが含まれ得る。当業者は、調査対象とする分類群に対して、本明細書の記載に基づいて適切な検出剤を選択することができる。検出の方法としては、ＰＣＲ、Ｌｉｇａｓｅｃｈａｉｎｒｅａｃｔｉｏｎ（ＬＣＲ）法、Ｌｏｏｐ－ＭｅｄｉａｔｅｄＩｓｏｔｈｅｒｍａｌＡｍｐｌｉｆｉｃａｔｉｏｎ（ＬＡＭＰ）法、またはハイブリダイゼーションなどが挙げられる。

【0067】

検出の一例は、PCRによる特定配列の増幅である。増幅配列の有無を、電気泳動によっ
て検出するか、または、核酸クロマトグラフィーによって検出することができる。その他、検出に用いられる技法として、マイクロアレイ、ドットブロット、ハイブリダイゼーション、サザンハイブリダイゼーション、質量分析などが挙げられる。

【0068】

（プログラム、記録媒体およびシステム）
１つの実施形態において、ユニークな配列の同定方法をコンピュータに実行させるためのプログラムであって、該方法は、
ａ）対象となる分類群の集団における各分類群における、参照配列に対する多型を網羅的に得るステップ（新たに比較して得てもよく、既存のデータを受け取ってもよい）と、
該集団の中で、ある分類群でユニークな配列を選択するステップと、
必要に応じて該ユニークな配列から該品種内の変異を除去するステップと
を包含する、プログラムが提供される。プログラムはどのような言語で記述されてもよい。

【0069】

別の実施形態において、ユニークな配列の同定方法をコンピュータに実行させるためのプログラムであって、を格納する記録媒体であって、該方法は、
ａ）対象となる分類群の集団における各分類群における、参照配列に対する多型を網羅的に得るステップ（新たに比較して得てもよく、既存のデータを受け取ってもよい）と、
該集団の中で、ある分類群でユニークな配列を選択するステップと、
必要に応じて該ユニークな配列から該品種内の変異を除去するステップと
を包含する、記録媒体が提供される。プログラムはどのような言語で記述されてもよい。１つの実施形態では、記録媒体は、内部に格納され得るＲＯＭやＨＤＤ、磁気ディスク、ＵＳＢメモリ等のフラッシュメモリなどの外部記憶装置でありうる。

【0070】

別の実施形態において、ユニークな配列を同定するためのシステムであって、該システムは、
ａ）対象となる分類群の集団における各分類群における、参照配列に対する多型を網羅的に（新たに比較して得てもよく、既存のデータを受け取ってもよい）コンピュータに提供するように構成された、配列データ提供部と、
該集団の中で、ある分類群でユニークな配列を選択する、配列データ計算部と
を備える、システムが提供される。

【0071】

次に、図８の機能ブロック図を参照して、本発明のシステム１の構成を説明する。なお、本図においては、単一のシステムで実現した場合を示しているが、複数のシステムで実現される場合も本発明の範囲に包含されることが理解される。

【0072】

本発明のシステム１０００は、コンピュータシステムに内蔵されたＣＰＵ１００１にシステムバス１０２０を介してＲＡＭ１００３、ＲＯＭやＨＤＤ、磁気ディスク、ＵＳＢメモリ等のフラッシュメモリなどの外部記憶装置１００５及び入出力インターフェース（Ｉ／Ｆ）１０２５が接続されて構成される。入出力Ｉ／Ｆ１０２５には、キーボードやマウスなどの入力装置１００９、ディスプレイなどの出力装置１００７、及びモデムなどの通信デバイス１０１１がそれぞれ接続されている。外部記憶装置１００５は、情報データベース格納部１０３０とプログラム格納部１０４０とを備えている。何れも、外部記憶装置１００５内に確保された一定の記憶領域である。

【0073】

このようなハードウェア構成において、入力装置１００９を介して各種の指令（コマンド）が入力されることで、又は通信Ｉ／Ｆや通信デバイス１０１１等を介してコマンドを受信することで、この記憶装置１００５にインストールされたソフトウェアプログラムがＣＰＵ１００１によってＲＡＭ１００３上に呼び出されて展開され実行されることで、ＯＳ（オペレーションシステム）と協働して本発明の対象配列データにおいてコントロール配列データに対する多型を検出する方法の機能を奏するようになっている。もちろん、このような協働する場合以外の仕組みでも本発明を実装することは可能である。

【0074】

本発明の実装において、各分類群由来の多型を特定する工程を行う際に、データは、入力装置１００９を介して入力され、あるいは、通信Ｉ／Ｆや通信デバイス１０１１等を介して入力されるか、あるいは、データベース格納部１０３０に格納されたものであってもよい。特定されたデータは、出力装置１００７を通じて出力されるかまたは情報データベース格納部１０３０等の外部記憶装置１００５に格納されてもよい。次に、ユニークな配列を選択する工程は、プログラム格納部１０４０に格納されたプログラム、または、入力装置１００９を介して各種の指令（コマンド）が入力されることで、又は通信Ｉ／Ｆや通信デバイス１０１１等を介してコマンドを受信することで、この外部記憶装置１００５にインストールされたソフトウェアプログラムによって実行することができる。比較結果は、出力装置１００７を通じて出力されるかまたは情報データベース格納部１０３０等の外部記憶装置１００５に格納されてもよい。

【0075】

データベース格納部１０３０には、これらのデータや計算結果、もしくは通信デバイス１０１１等を介して取得した情報が随時書き込まれ、更新される。各入力配列セット中の各々の配列、参照データベースの各遺伝子情報ＩＤ等の情報を各マスタテーブルで管理することにより、蓄積対象となるサンプルに帰属する情報を、各マスタテーブルにおいて定義されたＩＤにより管理することが可能となる。

【0076】

データベース格納部１０３０には、上記計算結果は、配列に関する情報、例えば、生物学的情報、生化学的情報、医学的情報、例えば疾患、障害、生体情報等の既知の情報と関連付けて格納されてもよい。このような関連付けは、ネットワーク（インターネット、イントラネット等）を通じて入手可能なデータをそのまままたはネットワークのリンクとしてなされてもよい。

【0077】

また、プログラム格納部１０４０に格納されるコンピュータプログラムは、コンピュータを、上記した処理システム、例えば、配列データの提供、部分配列サブセットの提供、位置データの算出、位置データの比較、多型の検出、多型の確認などの処理を実施するシステムとして構成するものである。これらの各機能は、それぞれが独立したコンピュータプログラムやそのモジュール、ルーチンなどであり、上記ＣＰＵ１００１によって実行されることでコンピュータを各システムや装置として構成させるものである。なお、本発明の例示においては、それぞれのシステムにおける各機能が協働してそれぞれのシステムを構成しているものとするが、この処理のためのプログラムもまた、それぞれ外部記憶装置または通信デバイスまたは入力装置を介して提供されうる。

【0078】

また、図９に示されるように、クラスター構造を有する計算システムによって本発明の方法を実装してもよい。１つの実施形態では、システムはクラスター構成であり、ヘッドとノードからなる。ノードは検索の高速化を図るため、主記憶装置にＳＳＤを用いることができる。１つの実施形態では、ヘッド１台に対して複数のノード（例えば１２台）で運用することができる。１つの実施形態では、計算システムはクラスター構造を持ち、主コンピュータ（クラスターヘッド）に大容量記憶装置（ＨＤＤ）を搭載して解析データおよび結果を保存する。クラスターヘッドより、分割したデータを各ノードに送り計算を実行し、結果をクラスターヘッドに集約する。クラスターヘッド、ノード共に、中央制御素子（ＣＰＵ）、メモリ（ＲＡＭ）を搭載し、通信インターフェース（ＮＩＣ）を介してデータの通信を行い得る。ノードには高速での検索処理をするため、ソリッドステートドライブ（ＳＳＤ）を主記憶装置とすることができる。各ノードに搭載されるＣＰＵ、ＲＡＭ、ＳＳＤ等は、他のノードと共有されてもよく、物理的に分離していてもよい。

【0079】

（一般技術）
本明細書において用いられる分子生物学的手法、生化学的手法、微生物学的手法、バイオインフォマティクスは、当該分野において公知であり、周知でありまたは慣用される任意のものが使用され得る。

【0080】

本明細書において「または」は、文章中に列挙されている事項の「少なくとも１つ以上」を採用できるときに使用される。「もしくは」も同様である。本明細書において「２つの値」の「範囲内」と明記した場合、その範囲には２つの値自体も含む。

【0081】

本明細書において引用された、科学文献、特許、特許出願などの参考文献は、その全体が、各々具体的に記載されたのと同じ程度に本明細書において参考として援用される。

【0082】

以上、本発明の理解を容易にするために好ましい実施形態を示して説明してきた。以下に、実施例に基づいて本発明を説明するが、上述の説明および以下の実施例は、例示の目的のみに提供され、本発明を限定する目的で提供したのではない。従って、本発明の範囲は、本明細書に具体的に記載された実施形態にも実施例にも限定されず、特許請求の範囲によってのみ限定される。

【実施例】

【0083】

以下に実施例を記載する。本実施例で使用した試薬類としては具体的には実施例中に記載した製品を使用したが、他メーカー（Sigma－Aldrich、和光純薬、ナカライ、R&D Systems、USCN Life Science INC、クラボウ等）の同等品でも代用可能である。また、本実施例で使用した計算機等の情報処理装置は、具体的には実施例中のものを使用したが、他の情報処理装置を用いてもよいことが理解される。
（実施例１：ユニーク欠失の同定）
（材料）
イネ品種を対象として、ユニーク欠失の同定を行った。「枠」の集団として、以下のイネ品種を用いた。

【0084】

現在日本に流通している主要な品種として：あいちのかおり、あさひの夢、はえぬき、ハナエチゼン、ハツシモ、ヒノヒカリ、ひとめぼれ（ＳＲＲ１０１６４６３、ＳＲＲ１０１６４６４、ＳＲＲ１０１６４６５、ＳＲＲ１０１６４６６）、キヌヒカリ、きらら３９７、コシヒカリ、こしいぶき、まっしぐら、ななつぼし、おぼろづき、彩のかがやき、ササニシキ（ＳＲＲ１０１６４７０、ＳＲＲ１０１６４７１）、つがるロマン、および、ゆめぴりか。国立研究開発法人農業・食品産業技術総合研究機構で育成した品種として：あきだわら（ＤＲＲ０９２４９８）、ほしじるし、たちあおば（ＤＲＲ０１８３５８）、とよめき、および、やまだわら。インディカ種のイネとして：ＩＲ８（ＳＲＲ９２１４９８）およびＩＲ６４（ＳＲＲ５４６４２０）（国際稲研究所（ＩＲＲＩ）で育成された品種）。遺伝解析によく用いられるジャバニカ種として：カサラス（ＤＲＲ０５６２２４）。

【0085】

各品種から次世代シーケンサーを用いたゲノムの塩基配列データを取得した。National
Center for Biotechnology Information(NCBI)のSequence Read Archive (SRA)
に登録され、公開済みのデータに関しては、fastq形式でダウンロードして取得した。公
開データが入手できない品種に関しては、各品種の個体由来の葉からCTAB法でゲノムDNA
を精製し、次世代シーケンサー(Illumina社 Hiseq 2000)で配列の解析データを取得し
た。

【0086】

あいちのかおり、あさひの夢、はえぬき、ハナエチゼン、ハツシモ、ヒノヒカリ、キヌヒカリ、きらら３９７、コシヒカリ、こしいぶき、まっしぐら、ななつぼし、おぼろづき、彩のかがやき、つがるロマン、ゆめぴりか、あきだわら（ＤＲＲ０９２４９８）、ほしじるし、とよめきおよびやまだわらについて、それぞれ、ゲノムの40倍程度のデータを取得した。

【0087】

得られたデータを日本晴リファレンス（参照）ゲノム配列（IRGSP1.0）と比較して、挿入・欠失が存在する部分のリファレンスゲノム上の位置を決めた。挿入・欠失の検出には、PCT/JP2018/027536（当該出願の内容全体は、本明細書において参考として援用される
）において記載されている挿入・欠失・逆位・転座・置換検出法を用いた。

【0088】

挿入・欠失・逆位・転座・置換検出法は、
ａ）対象配列データの配列中の少なくとも２ヶ所の部分配列の、参照配列上の位置を特定することと、
ｂ）対象配列データにおける該部分配列間の位置関係と、参照配列上の該部分配列間の位置関係とを比較することと、
ｃ）対象配列データにおける該部分配列間の位置関係と、参照配列上の該部分配列間の位置関係とが異なっている場合、目的とする多型があると判定し、該対象配列データにおける該部分配列部位間の文字を、対応するコントロール配列上の文字と、該部分配列部位を始点として順次比較して不一致となる部位を検出することと
を包含する。より詳細には、https://github.com/akiomiyao/pedにおいて提供されるプログラムを用いて検出を行った。検出される多型から、8塩基以上、1000000塩基以下のサイズの欠失変異を選択した。また、対象配列の参照型リード数が4以下のものを多型として
確認した。これは、リファレンス配列から欠失部分を除いた配列に対して、完全にマッチする対象配列のショートリードの数をカウントしているが、欠失部分を除いても末端部分の数塩基が欠失前と同じ配列に偶然なっていることがあり、その場合参照型と分類されてしまうことがあるためである。

【0089】

特定の品種のみに存在する挿入・欠失を検出するためには、目的の品種以外の対象となる集団「枠」のすべての挿入・欠失部位の染色体番号と位置を記憶し、次に目的とする品種の挿入・欠失の位置情報の中から、すでに記憶された位置に含まれない染色体番号と位置を抽出することで達成できる。

【0090】

ただし、各品種から一個体のみの配列情報をもとに解析すると品種内の個体内変異に関しても検出されてしまう。個体内変異の場合は、同一品種であっても、異種であると判定される可能性がある。

【0091】

この問題を解決するためには、目的の品種の複数の個体の配列情報を取得して、目的の品種のみに共通に存在する挿入・欠失配列を検出することで達成できる。

【0092】

（結果）
以下の欠失が各品種についてのユニーク欠失として同定された。
あいちのかおりにおけるユニーク欠失：

【表1】

あきだわらにおけるユニーク欠失：

【表2-1】

【表2-2】

あきたこまちにおけるユニーク欠失：

【表3】

あさひの夢におけるユニーク欠失：

【表4】

はえぬきにおけるユニーク欠失：

【表5】

ハナエチゼンにおけるユニーク欠失：

【表6-1】

【表6-2】

【表6-3】

【表6-4】

【表6-5】

ハツシモにおけるユニーク欠失：

【表7-1】

【表7-2】

ヒノヒカリにおけるユニーク欠失：

【表8】

ひとめぼれにおけるユニーク欠失：

【表9】

ほしじるしにおけるユニーク欠失：

【表10】

キヌヒカリにおけるユニーク欠失：

【表11】

きらら３９７におけるユニーク欠失：

【表12-1】

【表12-2】

コシヒカリにおけるユニーク欠失：

【表13】

こしいぶきにおけるユニーク欠失：

【表14】

まっしぐらにおけるユニーク欠失：

【表15】

ななつぼしにおけるユニーク欠失：

【表16-1】

【表16-2】

【表16-3】

おぼろづきにおけるユニーク欠失：

【表17-1】

【表17-2】

彩のかがやきにおけるユニーク欠失：

【表18-1】

【表18-2】

【表18-3】

【表18-4】

【表18-5】

【表18-6】

【表18-7】

【表18-8】

ササニシキにおけるユニーク欠失：

【表19】

たちあおばにおけるユニーク欠失：

【表20-1】

【表20-2】

【表20-3】

【表20-4】

【表20-5】

とよめきにおけるユニーク欠失：

【表21】

つがるロマンにおけるユニーク欠失：

【表22】

やまだわらにおけるユニーク欠失：

【表23-1】

【表23-2】

【表23-3】

ゆめぴりかにおけるユニーク欠失：

【表24】

【0093】

これらのユニーク欠失は、いずれも、混入検出において標的とすることができると考えられる。なお、ＩＲ８、ＩＲ６４およびカサラスについては、示していないが、多数のユニーク欠失が特定された。

【0094】

（実施例２：ユニーク欠失を利用した混入の検出）
実施例１で同定したユニーク欠失を利用し、ある品種を他の品種と区別できるかを試験した。

【0095】

（材料および方法）
実施例１で同定したユニーク欠失のうちのいくつかに対し、対応する部分を標的とするプライマーの対を設計した。複数のイネ品種の試料からDNA抽出を行い、抽出されたDNAのそれぞれをtemplate DNAとして、設計したプライマー対を用いてPCR反応を行った。反応後、核酸の増幅が生じたかを、アガロースゲルを用いた電気泳動によって確認した。

【0096】

（ＰＣＲ反応）
それぞれのPCR反応は、以下の組成の反応液にて行った。

【表25】

【0097】

それぞれのPCR反応は、以下の熱サイクル条件にて行った。

【表26】

【表27-1】

【表27-2】

【表27-3】

【表27-4】

【0098】

（実施例２－１：Akidawara 11309bp deletion chr2 3897342-3908645およびAkidawara 266bp deletion chr1 4033600-4033859）
（１）プライマーPB1229およびPB1230（Akidawara 11309bp deletion chr2 3897342-3908645の欠失に対応）と、（２）プライマーPB1239およびPB1240（Akidawara 266bp
deletion chr1 4033600-4033859の欠失に対応）を用いて、上記の条件で、図１に示される供試品種について、増幅反応を行った。結果は図１に示される。（１）のプライマー対では、IR64を除く26品種の混入の検出が可能であった。また、（２）のプライマー対では、27品種の混入の検出が可能であった。

【0099】

（実施例２－２：Toyomeki 153bp deletion chr2 24169949-24170099）
プライマーPB1235およびPB1236を用いて、上記の条件で、図２に示される供試品種について、増幅反応を行った。結果は図２に示される。当該プライマーを用いることによって、きらら397、ゆめぴりかを除く25品種の混入の検出が可能であった。

【0100】

（実施例２－３：Hoshijirushi 24bp deletion chr11 2817224-2817245）
プライマーPB1241およびPB1242を用いて、上記の条件で、図３に示される供試品種について、増幅反応を行った。結果は図３に示される。当該プライマーを用いることによって、27品種の混入の検出が可能であった。

【0101】

（実施例２－４：Yamadawara 20bp deletion chr3 6633622-6633640）
プライマーPB1243およびPB1244を用いて、上記の条件で、図４に示される供試品種について、増幅反応を行った。結果は図４に示される。当該プライマーを用いることによって、山田錦を除く26品種の混入の検出が可能であった。

【0102】

（実施例３：品種内でのバリエーションを考慮した検出）
（概要）
日本晴、あいちのかおり、あきたこまち、ヒノヒカリ、ひとめぼれ、キヌヒカリには存在しないコシヒカリ特異的な挿入欠失変異を、実施例１と同様に検索した。ここで、コシヒカリとして、コシヒカリ１とコシヒカリ２の２種類のコシヒカリを使用した。

【0103】

コシヒカリ１は、実施例１と同様に、発明者らによってシークエンシングを行い、配列情報を入手した。コシヒカリ２は名古屋大がＮＣＢＩのＳＲＡに登録公開したＤＲＲ０５４１９８の遺伝情報を利用した。

【0104】

（結果）
５座位に関して双方のコシヒカリで共通の欠失であることがわかった。欠失について、以下の表に示される。
コシヒカリ１で検出された欠失：

【表28】

コシヒカリ２で検出された欠失：

【表29】

【0105】

なお、日本晴、あいちのかおり、あきたこまち、ヒノヒカリ、ひとめぼれ、キヌヒカリに存在しない欠失のうち、コシヒカリ１とコシヒカリ２の配列で共通に存在する欠失について、それぞれの座位でその欠失を持つ品種を以下の表に挙げる。第9染色体の座位が、
混入を検出する目的では最も良いと考えられる。この座位を標的として用いると、単独ではササニシキとやまだわらの混入の検出はできないものの、第4染色体の33262896の座位
の欠失と組み合わせれば、ササニシキ、やまだわらの混入の検出も可能となると考えられる。

【表30】

【0106】

これに基づき、上記のプライマーPB1227およびPB1228の対を用いて、以下の条件で増幅反応を行った。それぞれのPCR反応は、以下の組成の反応液にて行った。

【表31】

【0107】

それぞれのPCR反応は、以下の熱サイクル条件にて行った。

【表32】

【0108】

図５に示される供試品種について、増幅反応を行った。結果は図５に示される。当該プライマーを用いることによって、ササニシキを除く２２品種の混入が検出可能であった。

【0109】

（実施例３－１：検出限界）
検出限界について調べるため、上記のプライマー対（PB1227およびPB1228）を用いて、コシヒカリgenome DNA溶液に、段階的な濃度の日本晴genome DNAを添加し、検出が可能であるかを検証した。各系列におけるテンプレート濃度は、図６に示される。

【表33】

【0110】

それぞれのPCR反応は、以下の熱サイクル条件にて行った。

【表34】

【0111】

結果は図６に示される。１％程度の混入も検出可能であった。ＰＣＲのサイクル数を増やせばさらに高感度の検出も可能であると考えられる。コシヒカリに別の品種が混入しているかどうかが本方法で簡単に判別ができ、感度も非常に高い。実用上の利用価値は非常に高いと考えられる。

【0112】

（実施例４：電気泳動を用いない検出）
上記実施例で設計したプライマー配列を、倉敷紡績株式会社で製造・販売している核酸クロマト（ＰＡＳ）システムに適用して、電気泳動を行わずに多型の判定をできる系について検討した。このような系は、安価で手軽に、混入の判定ができ、利用価値は高いと考えている。

【0113】

（材料および方法）
（核酸クロマトグラフィー）
核酸クロマトグラフィーの詳細については、例えば、ＷＯ２０１４／００７２８９（本明細書においてその内容は参考として援用される）等において詳述されている。核酸クロマトグラフィー法は、標的核酸を含む液体を、その液体がキャピラリー現象により拡散する多孔質性の固相担体上を展開させて、固相担体上の特定の領域に予め固定した検出用プローブとのハイブリダイズ産物を形成させる技術であり、ハイブリダイズ産物の検出は、展開に先だってあるいは展開の際に、標的核酸に対して付与したシグナル要素に基づいている。すなわち、特定した領域におけるシグナル要素あるいは当該シグナル要素に基づく二次的シグナルを検出する。

【0114】

本実施例においては、下記条件にてPCRを行った後、1.5mlエッペンドルフチューブにPCR産物を含む溶液10μlを移し、PASカラーリング buffer (blue) 30μlと混合した。その後、固相担体であるC-PAS（F4）をチューブに挿入した。５０℃のインキュベーターに
入れ、担体に液体が吸い上げられるまで40分間静置した。その後、バンドの確認により、増幅産物の確認を行った。プライマー名の前のF2、F3はクロマト紙にハイブリダイズするタグの名称であり、Bioはビオチンを示す。ビオチンとアビジン修飾した青色色素が結合
するようになっている。これによって、クロマトグラフィーで展開された増幅産物に特異的に呈色したバンドが生じる。

【0115】

試料として、あきだわら単独のものと、あきだわらに微量の他品種由来のDNAを混入さ
せたものとについて、増幅が検出されるかを試験した。品種の内訳は、図７に示されている。Ｎは品種ＤＮＡの代わりに水を加えた結果である。

【表35】

【表36】

【表37】

【0116】

（結果）
結果を図７に示した。クラボウの核酸クロマトの系では１／１０００の混入でも混入を十分検出できることがわかった。ＩＲ６４以外は１／４０００でも混入の検出が可能であった。

【0117】

（実施例５：キット）
本実施例では、混入を検出するためのキットを生産する。
本実施例で提供されるキットは、ある分類群の集団において目的の分類群にユニークな欠失部分に対応するＰＣＲプライマーを含む。ＰＣＲプライマーは上記実施例のいずれかに記載されるものであってよく、本明細書の開示に従って新たに製造してもよい。このようなＰＣＲプライマーは、Sigma－Aldrichまたは他の製造業者などから入手または注文して作製してもよく、当該分野で公知の任意の手法を用いて製造することもできる。
本実施例で提供するキットは必要に応じて、ＰＣＲ反応を行うための構成要素、例えば、反応チューブ、酵素、dNTPミックス、バッファーなどを含むキットとして提供する。このようなキットの構成要件は、Sigma－Aldrichまたは他の製造業者などから入手または注文して作製してもよく、当該分野で公知の任意の手法を用いて製造することもできる。
本実施例で提供するキットは、さらに、増幅が生じたか否かを判定するための手段を含むキットとしてもよい。判定手段の一例としては、核酸クロマトグラフィー担体であり得、この手段はクラボウなどから入手することができる。核酸クロマトグラフを利用する場合、さらに検出用プローブと、標的核酸に対してシグナル要素を付与するための構成要素を含んでよい。このようなプローブおよびシグナル要素を付与する構成要素もまた、クラボウなどから入手することができる。

【産業上の利用可能性】

【0118】

本発明は、生物産品に関する任意の産業において混入の検出に利用可能である。特に、食品（例えば、イネ）における混入の検出に有用である。

【配列表フリーテキスト】

【0119】

配列番号１：PB1221プライマー
配列番号２：PB1222プライマー
配列番号３：PB1223プライマー
配列番号４：PB1224プライマー
配列番号５：PB1225プライマー
配列番号６：PB1226プライマー
配列番号７：PB1227プライマー
配列番号８：PB1228プライマー
配列番号９：PB1229プライマー
配列番号１０：PB1230プライマー
配列番号１１：PB1231プライマー
配列番号１２：PB1232プライマー
配列番号１３：PB1233プライマー
配列番号１４：PB1234プライマー
配列番号１５：PB1235プライマー
配列番号１６：PB1236プライマー
配列番号１７：PB1237プライマー
配列番号１８：PB1238プライマー
配列番号１９：PB1239プライマー
配列番号２０：PB1240プライマー
配列番号２１：PB1241プライマー
配列番号２２：PB1242プライマー
配列番号２３：PB1243プライマー
配列番号２４：PB1244プライマー
配列番号２５：PB1245プライマー
配列番号２６：PB1246プライマー
配列番号２７：PB1247プライマー
配列番号２８：PB1248プライマー
配列番号２９：PB1249プライマー
配列番号３０：PB1250プライマー
配列番号３１：PB1269プライマー
配列番号３２：PB1270プライマー
配列番号３３：PB1285プライマー
配列番号３４：PB1286プライマー
配列番号３５：PB1321プライマー
配列番号３６：PB1322プライマー

【図1】