特表2021-532834(P2021-532834A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ リマグレン、ヨーロッパの特許一覧

<>
  • 特表2021532834-種子ロットの品質管理方法 図000010
  • 特表2021532834-種子ロットの品質管理方法 図000011
  • 特表2021532834-種子ロットの品質管理方法 図000012
  • 特表2021532834-種子ロットの品質管理方法 図000013
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】特表2021-532834(P2021-532834A)
(43)【公表日】2021年12月2日
(54)【発明の名称】種子ロットの品質管理方法
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20211105BHJP
   C12Q 1/686 20180101ALI20211105BHJP
   C12N 15/09 20060101ALN20211105BHJP
【FI】
   C12Q1/6869 Z
   C12Q1/686 Z
   C12N15/09 Z
【審査請求】未請求
【予備審査請求】未請求
【全頁数】30
(21)【出願番号】特願2021-529517(P2021-529517)
(86)(22)【出願日】2019年7月29日
(85)【翻訳文提出日】2021年3月29日
(86)【国際出願番号】EP2019070386
(87)【国際公開番号】WO2020025554
(87)【国際公開日】20200206
(31)【優先権主張番号】1857115
(32)【優先日】2018年7月30日
(33)【優先権主張国】FR
(81)【指定国】 AP(BW,GH,GM,KE,LR,LS,MW,MZ,NA,RW,SD,SL,ST,SZ,TZ,UG,ZM,ZW),EA(AM,AZ,BY,KG,KZ,RU,TJ,TM),EP(AL,AT,BE,BG,CH,CY,CZ,DE,DK,EE,ES,FI,FR,GB,GR,HR,HU,IE,IS,IT,LT,LU,LV,MC,MK,MT,NL,NO,PL,PT,RO,RS,SE,SI,SK,SM,TR),OA(BF,BJ,CF,CG,CI,CM,GA,GN,GQ,GW,KM,ML,MR,NE,SN,TD,TG),AE,AG,AL,AM,AO,AT,AU,AZ,BA,BB,BG,BH,BN,BR,BW,BY,BZ,CA,CH,CL,CN,CO,CR,CU,CZ,DE,DJ,DK,DM,DO,DZ,EC,EE,EG,ES,FI,GB,GD,GE,GH,GM,GT,HN,HR,HU,ID,IL,IN,IR,IS,JO,JP,KE,KG,KH,KN,KP,KR,KW,KZ,LA,LC,LK,LR,LS,LU,LY,MA,MD,ME,MG,MK,MN,MW,MX,MY,MZ,NA,NG,NI,NO,NZ,OM,PA,PE,PG,PH,PL,PT,QA,RO,RS,RU,RW,SA,SC,SD,SE,SG,SK,SL,SM,ST,SV,SY,TH,TJ,TM,TN,TR,TT
(71)【出願人】
【識別番号】521045254
【氏名又は名称】リマグレン、ヨーロッパ
【氏名又は名称原語表記】LIMAGRAIN EUROPE
(74)【代理人】
【識別番号】100091487
【弁理士】
【氏名又は名称】中村 行孝
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100120617
【弁理士】
【氏名又は名称】浅野 真理
(74)【代理人】
【識別番号】100126099
【弁理士】
【氏名又は名称】反町 洋
(72)【発明者】
【氏名】ナタリー、リビエール
(72)【発明者】
【氏名】ジョルディ、コマンドラン
(72)【発明者】
【氏名】サンドラ、コンタマン
(72)【発明者】
【氏名】ジャン−ピエール、マルチナン
(72)【発明者】
【氏名】ギョーム、コランジュ
(72)【発明者】
【氏名】オーレリアン、オード
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA18
4B063QQ04
4B063QQ42
4B063QQ53
4B063QR08
4B063QR32
4B063QR62
4B063QS25
4B063QX02
(57)【要約】
本発明は、種子のサブロットを分析することによる種子ロットの品種純度の品質管理のための方法に関し、前記管理は、目的の遺伝子を配列決定することによって行われる。
【特許請求の範囲】
【請求項1】
目的の種の種子ロットに存在する少なくとも1つの目的の遺伝子座における混入物の量を決定する方法であって、
a)種子ロットからの種子が少なくとも10個の種子のサブロットにグループ化され、そのようにして得られたサブロットの数が10以上であり、
b)少なくとも目的の遺伝子座を含む種子ゲノムの領域の標的配列決定が各サブロットに対して行われ、
c)配列決定された各ゲノム領域で予想される対立遺伝子に代わる対立遺伝子が検出された場合(予想される対立遺伝子の有無)、各サブロットについて混入物の存在が定性的に決定され、
d)ロット全体の混入物の量が、すべてのサブロットで得られる定性的な結果をまとめることによって決定される、
前記方法。
【請求項2】
前記工程b)の配列決定が、サブロットに存在する種子から抽出されたDNAに対して行われ、目的の遺伝子座を含む種子ゲノムの領域が任意に増幅される、請求項1に記載の方法。
【請求項3】
前記工程b)、c)およびd)が、目的のいくつかの遺伝子座に対応するゲノムのいくつかの領域に対して行われる、請求項1または2に記載の方法。
【請求項4】
前記目的の遺伝子座のサブセットが、目的の種を識別するのに十分である、請求項3に記載の方法。
【請求項5】
予想される対立遺伝子に代わる対立遺伝子が単一の目的の遺伝子座で観察される場合、ロットが混入物を含むと判断される、請求項4に記載の方法。
【請求項6】
予想される対立遺伝子に代わる対立遺伝子が複数の目的の遺伝子座で観察される場合、ロットが混入物を含むと判断される、請求項4に記載の方法。
【請求項7】
少なくとも1つの目的の遺伝子座が目的の形質に関連している、請求項1〜6のいずれか一項に記載の方法。
【請求項8】
遺伝子座の組み合わせが目的の複数の特性(形質)に関連している、請求項3に記載の方法。
【請求項9】
遺伝子座の組み合わせが目的の単一の特性(形質)に関連している、請求項3に記載の方法。
【請求項10】
少なくとも1つの目的の遺伝子座がバッチの種子に先天的に存在しない特定の形質に連結されて、該形質の偶然の存在が検出される、請求項1〜9のいずれか一項に記載の方法。
【請求項11】
前記形質の頻度が種子ロットにおいて10%を超える場合、そのロットが非適合性であると見なされる、請求項10に記載の方法。
【請求項12】
請求項1〜11のいずれか一項に記載の方法であって、
i)サブロットの種子からRNAが抽出され、工程b)の前にcDNAに逆転写され、
ii)前記cDNAの配列決定が、前記種子の農学的特性に関連する遺伝子に特異的なプライマーを用いて、工程b)の配列決定と同時に行われ、
iii)前記配列決定工程(ii)(cDNAの有無)において種子の農学的特性の特定の遺伝子に関連するcDNAが検出される場合、農学的特性を有する種子の存在が各サブロットについて定性的に決定され、
iv)ロット全体における前記農学的特性を有する種子の量が、(iii)のすべてのサブロットについて得られる定性的結果を編集することによって決定される、
前記方法。
【請求項13】
前記種子の農学的特性が、種子の休眠状態、プライミング品質、発芽能力、成長力および生存能力から選択される、請求項12に記載の方法。
【請求項14】
請求項1〜13のいずれか一項に記載の方法であって、
i)前記サブロットのDNA配列決定が、前記サブロットに存在する種子の種とは異なる1つ以上の種に特異的なプライマーを用いて、工程b)の配列決定と同時に行われ、
ii)前記種に属する遺伝子が検出された場合(他の種に固有の遺伝子の有無)、異なる種の種子の存在が各サブロットについて定性的に決定され、
iii)ロット全体の外性の種子の量が、ii)のすべてのサブロットで得られた定性的結果を編集することによって決定される、
前記方法。
【請求項15】
少なくとも1つの異なる種が雑草である、請求項14に記載の方法。
【請求項16】
請求項1〜15のいずれか一項に記載の方法であって、
i)病原性種特異的プライマーを使用したサブロットに含まれるDNAまたはcDNAの配列決定が、工程b)の配列決定と同時に行われ、
ii)前記病原性種のDNAの有無が、それらの病原性種に属する配列が検出された場合、各サブロットについて決定され、
iii)ロットの混入に関する結論が、前記病原性種に属する配列の存在に基づいている、
前記方法。
【請求項17】
前記病原性種が、細菌、真菌、ウイルスまたは昆虫である、請求項16に記載の方法。
【請求項18】
請求項1〜17のいずれか一項に記載の方法であって、
工程b)の前に、
i)DNAが種子の各サブロットから抽出され、
ii)RNAが各種子サブロットから抽出され、cDNAに逆転写され、
iii)i)で抽出されたDNAとii)で得られたcDNAとが混合され、
iv)必要に応じて、特定の遺伝子座に特異的、または非特異的に、iii)で得られたDNAに対して増幅が行われ、
v)iii)で得られたDNAまたはiv)で得られた増幅産物が、シーケンシング工程のテンプレートとして使用される、
前記方法。
【請求項19】
工程iv)が、有無が確認されるべき他の生物の特定の配列を増幅することによって行われる、請求項18に記載の方法。
【請求項20】
工程iv)が、サブロットの種子の特定の農学的特性を決定することを可能にする特定の配列を増幅することによって行われる、請求項18または19に記載の方法。
【請求項21】
前記種子の少なくとも1つの農学的特性が、種子の休眠状態、プライミング品質、発芽能力、活力および生存能力から選択される、請求項20に記載の方法。
【請求項22】
工程a)で調製された各サブロットにおける種子の量が80〜120の間である、請求項1から21のいずれか一項に記載の方法。
【請求項23】
工程a)で調製された各サブロットにおける種子の量が15〜25の間である、請求項1から22のいずれか一項に記載の方法。
【請求項24】
請求項1〜23のいずれか一項に記載の方法であって、
混入された各サブロットの混入物の識別も、
i)混入されたサブロットで観察されたプロファイルと混入物の非存在下で予想されるプロファイルとを比較することにより、混入されたサブロット内の混入物の分子プロファイルが推測され、
ii)i)で得られたプロファイルが参照データベースのプロファイルと比較される
ことよって行われる、前記方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、種子および品種の純度の分野における品質管理方法に関する。
【従来技術】
【0002】
種子の販売は、その純度の管理の影響を受ける。その割合は種ごとに固有であるが、98重量%以上でなければならず(穀物種子の販売に関する指令66/402/EEC)、この基準は、基本種子、プレ基本種子(pre-basic seed)の生産、認証された種子の生産または雑種の生産のために販売される種子にも適用される。この品種の純度は、主に野外検査によってチェックされ、雄性不稔親との雑種種子生産の場合、その親の純度レベルはさらに高くなければならない(トウモロコシの場合は99.9%)。
【0003】
実地検査に代わる品質管理ソリューションの利用可能性は、表現型評価に必要な植物の発達を待たずに、特に迅速な評価を行う必要があるため、種子企業にとって興味深いものである。
【0004】
さらに、これらの企業にとって、品種の純度の管理は上記の工程に限定されず、基本的な種子生産の上流の各工程は、品種の純度のこの要求に関係している。品種の純度率は、品種の説明に合致している、ロットからの植物の割合として定義されることに注意されたい。この割合は、種子の重量で表される。
【0005】
雑種種子生産では、商業用種子生産に使用される基本種子ロット(雑種生産に使用される親系統)の遺伝的純度を検証することにより、農学的種子生産の品質の向上が達成される。この純度は、親種子のサンプルバッチ内の混入種子の検出と識別によって評価される。
【0006】
混入物は、同じ種の種子であるが、検討中のロットの種子に期待される遺伝子型と比較して、ゲノム内のいくつかの遺伝子座に遺伝的変異を有する。種子ロットの生産方法では、上流の生産工程での警戒、栽培慣行、精製、分離、および方法全体で行われる管理によって、混入物の存在が減少する。したがって、ロット内のほぼすべての種子は同じ遺伝子型を有し、混入物は一般的に低い割合で存在し、実際、販売されるためにロットで許容されるレベルは2%未満でなければならない。
【0007】
目的の遺伝的形質の特定は、種子の商品化においても重要であり、実際、例えば除草剤や病原体(たとえば、ヒマワリの晩生枯病)に対する耐性を保証するいくつかの形質は、種子ロットに特定の付加価値をもたらし、品種がその形質のキャリアとして商品化される際に、種子ロット内のその形質の存在の検証は興味深い。形質とは、表現型の形質に関連する遺伝子座の対立遺伝子型を意味する。
【0008】
同様の問題は、GMOまたはゲノム内の他の変更の偶発的な存在に関するものである。非GMO植物の商業化には、GMOが存在しないこと、または規制によって決定された割合よりも低い率で存在することの証明が必要である。対照的に、一部の国の規制では、耐虫性などの特定のGMO形質について、昆虫の避難場所(refuge zone)を提供するために、GMOを有する種子を一定の割合でGMO形質を持たない種子とともに販売することが義務付けられている。
【0009】
SNP(単一ヌクレオチド多型)マーカーおよび高効率な遺伝子型決定技術の大規模な開発により、マーカー支援育種が開発されている。遺伝子決定は通常、様々なテクノロジーを使用して、PCR(Kasp−LGC Genomics、Taqman−Life Technologies)またはDNAチップでのハイブリダイゼーション(Axiom−Life Technologies、Infinium−Illumina)のいずれかによって行われる。
【0010】
Taqman定量PCR技術が今日、非GMO植物の混合物中のGMO植物の偶発的な存在を検出するための参照と見なされる場合、それは特定の配列の存在/非存在型の多型の検出に基づいており、SNPの異なる対立遺伝子型間の多型に基づくものではない。したがって、GMO検出のこの特定のケースでは、多型は、増幅することができ、したがって、簡単に識別できる形質(アンプリコン)の存在に関連する。
【0011】
GMO形質が存在しないと理解される種子ロットの純度の推定は、Remund(Seed Science Research(2001)11,101−119)によって研究され、これらの著者によって2つの解決策が特定され、それらの検証、特にプールでの分析に必要なリソースが制限された。彼らは、この方法が特定の個体の不在を探索する場合に効果的である一方で、純度レベルが求められる場合には、種子ごとに作業することが好ましいことを示す。これらの著者は、プールの数とバッチあたりの趣旨の数とを調整することによって定量的アプローチを可能にするツールSeedcalcを開発し、この方法は、リアルタイムPCRに特に適している(Laffont,Seed Science Research(2005)15,197−204)。
【0012】
しかしながら、種子プールを使用して品種の純度を確認する例がある。出願WO2015/110472は、1つ以上の種子から決定されたサンプル量の手動または半自動サンプリングによって種子ロットを分析することを提案し、この量は、種子の少なくとも1つの構成要素の分析を可能にするように決定される。いくつかの種子から採取された組織は、識別された追跡可能なウェルに配置され、次いで、ウェルの内容物に対して前記成分の分析が行われる。このバルク構成の方法により、品種の純度を高めることができる(実施例6)。この純度は、5および10個の種子のバルクからKaspar法(KBioscience)によって評価され、これらのバルク内の混入物の存在は、ヘテロ接合クラスターの存在によって特徴付けられるが、著者は、このクラスターがホモ接合クラスターに近いこと、そして、10個の種子のバルクよりも5個の種子のバルクの方が識別しやすいことを示唆している。
【0013】
高効率の配列決定技術(NGS(Next Generation Sequencing))の開発により、ゲノミクスの世界に革命が起こり、特定の種の系統間でSNPマーカーを大規模に発見できるようになった。これらの技術により、1回の実験で多数の配列を読み取ることが可能である。
【0014】
配列決定深度(sequencing depth)により、個々のプールの対立遺伝子型を特定する場合に、弱く表現された対立遺伝子を特定できます。また、同じ遺伝子座に対して2つを超える対立遺伝子型の数を特定するためにも使用できる。したがって、アンプリコンの配列決定により、目的の遺伝子座の標的化された研究、SNPの同定、および個体または個体の混合物の対立遺伝子組成の特徴付けが可能になる。研究への応用は、突然変異を起こした集団におけるまれな突然変異の検出である(TILLING,Targeting Induced Local Lesions in Genomes)。これらの応用では、プール内のまれな対立遺伝子の識別を、個々の2Dまたは3Dプールと組み合わせて、分析するプールの数を減らすことができる(Tsai et al., Plant Physiol. 2011 Jul;156(3):1257−68; Taheri et al., Mol Breeding (2017) 37:40; Gupta et al., The Plant Journal (2017) 92, 495−508)、WO2014134729、EP2200424)。このアプローチは、遺伝子編集法による突然変異の同定にも適用することができる(Kumar et al., Mol Breeding (2017) 37:14)。しかしながら、これらのアプローチは依然として定性的であり、定量的な考慮はなされていない。
【0015】
プールされた配列遺伝子決定を使用する可能性は、Gautier(Mol. Ecol. 2013 Jul;22(14):3766−79)によって集団の対立遺伝子頻度の同定のために評価された。しかしながら、このアプローチは、多数のSNPにわたる大規模な集団の分析に特に適しており、まれな対立遺伝子(通常、5%未満)の検出には適していないと思われる。
【0016】
まれな対立遺伝子の頻度は配列決定エラー率に近いため、まれな対立遺伝子を見つけることの難しさの1つは結果の信頼性である。
【0017】
種子ロットの品質管理の場合、目標は混入物の存在を検出し、分析されたサンプルが由来する種子ロット内の混入物の割合を正確に推定し、好ましくはその遺伝的プロファイルを決定してその起源をよりよく理解することである。検出は、対象とする遺伝物質およびそれを混入する可能性のある遺伝物質に関する当業者の知識に従って、当業者によって選択された関心のある遺伝子座の分析によって行うことができる。
【0018】
したがって、Chen et al.(2016、PLOS ONE 11(6))は、トウモロコシに関し、品質管理用の2セットのSNPを開発した:種子パッケージまたはプロットのラベリングにおける潜在的なエラーを特定するための少ない数のSNPs(50〜100)を用いた迅速な管理のためのマーカーセット、および遺伝物質のより細かい特性の評価および識別に用いられるより大きなマーカーセット。この例では、個別に分析された192の個体をサンプリングすることにより、ロット内の5%の混入を検出する確率は100%に近くなるが、この確率は1%の混入では90%未満になる。
【0019】
基本種子ロットの品質管理の場合、期待される遺伝的純度は、推定の望ましい精度と同様に高く、サンプリングされた(試験された)種子の数および基本種子ロットの種子の数の両方に依存する。例えば、200個の種子が試験され、不純物レベルが0%の場合、この値の信頼区間は0%〜1.49%の範囲になる。したがって、200個の粒子のみを分析するだけでは、分析される数が少なすぎるため、十分なレベルの純度を保証できない。一方、2000個の粒子を分析する場合、0%の不純物レベルの信頼区間は0%〜0.15%である。しかしながら、遺伝子決定のコストが大幅に削減されたとしても、そのようなサンプリングを植物間処理と組み合わせると、品質管理のために経済的に実施可能ではない。
【0020】
Genia(Montevideo、ウルグアイ)は、10,000の種子のユニークな混合物を分析し、約350のSNPをターゲットとするアンプリコンを配列決定することにより、系統のバッチの遺伝的純度を決定し、混入物を特定する方法を提供する。この企業は、0.8%の感度と99%の信頼区間で品種の純度を決定すると主張している。このアプローチは、Gautierらによって開発されたものと類似しており、多数(350)のSNPの対立遺伝子頻度を推定するための統計モデルに基づいており、そこから混合物に存在する様々な遺伝的プロファイルの頻度が推定される。しかしながら、このようなアプローチでは、特定のSNPのまれな対立遺伝子を確実に検出することはできず、特定の形質の混入を検索するために必要である。
【0021】
したがって、特定の種子ロット、特に高い純度を有する種子ロットの遺伝的純度を正確に決定するために、多数の個体の分析を可能にする費用効果の高い方法が必要とされる。
【0022】
本明細書の方法は、サンプルのいくつかのサブロットの二元的な定性的分析(混入物の有無)に基づく種子ロットの純度の推定に基づくものである。各サブロットの分析は、アンプリコンを配列決定することにより、目的の1つ以上の遺伝子座で代替対立遺伝子の存在を検出することで構成される。サブロットの数、および各サブロットのサイズは、予想される純度レベル(オペレーターによって推定される)および求められる精度に応じて、好ましくは特定のサブロットで最大1つの混入物を発見する統計的確率が存在するように定義される。これは、テストに使用された所定の数の種子から、少なくとも推定される数の混入物と同じ数のサブロット、好ましくは推定される数の混入物と正確に同じ数のサブロットが形成されることを意味する。さらに、いくつかのサブロットの分析により、この方法によれば、異なるサブロットの混入プロファイルを比較することにより、ハイブリッドによる混入(分離)と系統による混入(分離なし)とを区別することができる。
【0023】
しかしながら、この方法はこの二元的アプローチに限定されず、実際、配列決定を用いることにより、この方法を2つの対立遺伝子型の識別に限定することなく、この文脈において、検討対象の対立遺伝子のヘテロ接合体である種子ロット内の混入物であって、この個体の対立遺伝子型とは異種である混入物がその個体を形成する混入物の識別も可能になる。
【0024】
したがって、本発明は、目的の様々な種子ロットに存在する、少なくとも1つの目的の遺伝子座における混入物の量を決定するための方法であって、
(a)種子ロットからの種子が少なくとも10個の種子のサブロットにグループ化され、そのようにして得られたサブロットの数が10以上であり、
(b)少なくとも目的の遺伝子座を含む種子ゲノムの領域の標的配列決定が各サブロットに対して行われ、
(c)配列決定された各ゲノム領域で予想される対立遺伝子に代わる対立遺伝子が検出された場合(特に、種子が雑種植物の種子である場合、単一の遺伝子座においていくつかの予想される対立遺伝子が存在していてもよい)、混入物の存在が各サブロットについて定性的に決定され(代替対立遺伝子の有無)、
(d)ロット全体の混入物の量が、すべてのサブロットで得られる定性的な結果をまとめることによって決定される方法に関する。
【0025】
必要に応じて優先的に、そして配列決定を行うために、工程a)と工程b)との間に目的の遺伝子座に対応する領域がPCRによって増幅される。この増幅工程は、各サブロットのすべての種子に対して直接行われる。あるいは、工程b)の配列決定は、サブロットに存在する種子から抽出されたDNAに対して行われ、目的の遺伝子座を有する種子ゲノムの領域は、任意に増幅される。別の実施形態では、種子ロットに存在するRNAも抽出され、逆転写が行われて相補的DNA(cDNA)が得られ、任意に、得られたcDNAに対して、そのcDNAの目的の遺伝子座の増幅、および目的の遺伝子座の配列決定(好ましくは増幅される)も行われる。
【0026】
バッチの不純物の推定値
は、次の式に従って得られる:
【数1】
式中、nはプールの数であり;mはプール内の粒子の数であり;dは、混入物が特定されたプールの数である。
【0027】
これは、Remund(2001、op. cit.)によって提案された公式であり、特に、混入物の調査が種子ロットのサンプルに対してのみ行われるという事実を考慮し、したがって、このサンプリングによって潜在的に誘導されるバイアスを考慮することができる。
【0028】
したがって、このプロセスにより、種子ロット内の混入物の割合(したがって、種子ロットの純度:
)を計算することができる。
【0029】
混入物は、そのシードバッチで指定された目的の遺伝子座で予想される対立遺伝子とは異なる対立遺伝子を持つ種子である。しかしながら、方法が目的の複数の遺伝子座について行われる場合、予期しない対立遺伝子がそのロット内の複数の遺伝子座、例えば2または3個の遺伝子座で観察された場合にのみ、ロットに混入があると判断される場合がある。
【0030】
好ましくは、工程a)において、最大数の種子が使用され、最大で1つの混入物が各種子サンプル(サブロット)に統計的に存在するように計算される。工業的な生産方法では、99%以上の純度レベルが一般的に観察される。したがって、約100個のシード、例えば80〜120個の種子を使用すると、主に1つの混入種子が検出されることが期待される。上記の方法は、実際に、均質な種子ロット、すなわち、少なくとも95%、好ましくは少なくとも96%、より好ましくは少なくとも97%、より好ましくは少なくとも98%、より好ましくは少なくとも99%の種子が同じ遺伝子型を有する種子ロットに対して行われる。種子ロットの推定純度に応じて、サブロットには最大20、または最大50、または最大80、または最大100、または最大200、または2000の種子が含まれる。期待される純度が少なくとも90%、それぞれ少なくとも95%のオーダーである特性(種子の発芽特性等)を評価する場合、工程a)で準備された各サブロットの種子の量は10のオーダー、それぞれ20、すなわち15〜25の間になる。
【0031】
方法の工程b)は、混入物の存在が探索される目的の遺伝子座を有する少なくとも1つのゲノム領域の標的配列決定で構成される。
【0032】
この配列決定工程が核酸に対して行われることは明らかである。したがって、バッチのDNAは、例えば、種子を粉砕して小麦粉を使用するか、小麦粉からDNAを分離することによって調製される。これらの方法は、当技術分野で知られている。上記のように、cDNAを調整することもできる。。
【0033】
この配列決定工程は、好ましくは、高効率配列決定(HTS)によって行われる。様々な技術(Illumina(登録商標)、Roche 454、Ion torrent:Proton/PGM(ThermoFisher)またはSOLiD(Applied BioSystems))。
【0034】
要約すると、これらのHTS技術には2つの共通の工程がある:
−PCRによる増幅工程、
−配列決定工程、この工程は、使用される技術に応じて異なるアプローチで行われる。
【0035】
イルミナ(登録商標)技術は、クローン増幅および合成配列決定(SBS)を使用する。二本鎖DNAライブラリーは、PCR増幅および末端での特定のアダプターの追加によって分析されるサンプルから生成され、次いで、DNAが一本鎖に変性され、一本鎖の末端がランダムに、固相ブリッジPCRが行われるフローセルの表面に付着する(フラグメントが増幅される高密度クラスターの作製)。
【0036】
配列決定は、4つの標識された可逆ターミネーター、プライマーおよびDNAポリメラーゼを追加することによって行われ、次いで、各クラスターによって放出された蛍光が読み取られ、最初の塩基の決定が可能になる。次いで、配列全体を読み取るためにいくつかのサイクルが行われる。
【0037】
454技術を行うために、3’および5’末端に特定のアダプターを追加し、各DNA鎖をビーズに固定化した一本鎖DNAテンプレートライブラリーを得る(1つのDNAフラグメント=1つのビーズ)。次いで、これらのビーズは、水−油エマルジョン中で増幅産物と統合され、単一のビーズを含む「マイクロリアクター」(油中の水滴ごと)が作製される。PCRはこのエマルジョンについて行われ、バンク全体が並行して増幅され、ビーズあたり数百万のコピーが取得される。
【0038】
次いで、ビーズを精製し、ウェルの直径が一度に1つのビーズのみが入ることができるようにフラグメントをプレートに充填する。配列決定酵素が添加され、個々の標識ヌクレオチドが順次に送信される。配列検出は、発光シグナルに基づいてCCDカメラによって行われる。
【0039】
SOLiD技術の場合、454法と同様に、バンクが準備され、アダプターが追加され、エマルジョンでPCRが行われる。次いで、増幅されたビーズが濃縮され、DNAの3’末端が改変されてスライド上に共有結合的に固定され、ビーズをスライド上に沈着させる。配列決定をライゲーションによって行う:プライマーはマトリックス上に存在するアダプターにハイブリダイズさせる。4個の蛍光標識された2塩基プローブのセットがプライマーに関連付けられる。2塩基プローブの特異性は、各ライゲーション反応の1番目と2番目の塩基で行われる。ライゲーション、検出、切断が数サイクル行われる。このプロセスでは、2つの異なるプライマーを使用した2つの独立したライゲーション反応によって各塩基が検出される。2つの塩基での読み取りのコーディングシステムにより、結果の読み取りの非常に高い忠実度が可能になる。この方法により、配列決定エラーと実際のバリアント(SNP、挿入および欠失)を区別することができる。
【0040】
IonTorrent技術の場合、バンクが準備され、アダプターが追加される。エマルジョンPCRが行われる。配列決定は、CCD光学センサーによるヌクレオチドまたはその重合残基の蛍光の検出に基づくものではなく、DNA重合中に放出されるHイオンを検出するCMOSセンサーを使用する。CMOSセンサーは、各ウェルのpHを測定し、これは、分析対象のDNAに組み込まれた1つ以上の塩基の存在を示す。塩基は順次添加され、どれが統合されたかが検出され、次いで、すすがれ、この方法が繰り返される。
【0041】
Oxford Nanopore TechnologiesによるMinION技術(https://nanoporetech.com/products#minion、Mikheyev and Tin (2014), Molecular Ecology Resources, 14(6):1097−102)、またはPacific bioscienceによるPac Bio(https://www.pacb.com/products-and-services/pacbio-systems/)等の他の配列決定技術も存在する。
【0042】
本明細書に記載の方法によれば、NGS配列決定のこれらの方法が、各技術において固有の配列決定エラー率に起因して表示される可能性がある偽陽性(代替対立遺伝子の存在を誤って結論付ける)または偽陰性(代替対立遺伝子の不在を誤って結論する)を検出するリスクを制限することが可能となる。実際に、工程c)は、サンプルについて、配列決定産物における予期しない配列の有無を決定することからなる。そのような予期しない配列が存在(混入物の存在に対応)する場合、予期される配列(種子ロット内の種子の正しい配列に対応)の量と比較して予期しない配列の量を定量化する必要はない。したがって、検出は定性的(すなわち、二元的:予想される対立遺伝子の代替対立遺伝子の配列の有無)のみである。種子のサブロットを使用することにより、各配列決定反応が調査される種子の数を増や、コストを抑えながら十分な種子サンプルを得ることもできる。
【0043】
代替対立遺伝子のそのような配列の存在は、その対立遺伝子の混入物の存在を示す。
【0044】
この分析は、分析された各ゲノム領域に対して、すなわち、当業者によって事前に決定された目的の各遺伝子座に対して行われ、種子ロットを特徴づけることを可能にする。
【0045】
実際、各サブロット内の種子の数が、そのサブロット内に(統計的に)1つの混入物のみが存在するように選択される場合、代替対立遺伝子の存在は、単一の混入物の存在を結論付けるのに十分である。
【0046】
方法の次の工程は、種子ロット内の混入物の実際の割合の計算である。これは、すべてのサブロットで得られた定性的な結果をまとめることによって行われる。
【0047】
次に、混入があるサブロットの数、分析されたサブロットの総数、および各サブロットの数を考慮して、種子ロットの純度レベルが推定される。
【0048】
バッチの不純物の推定値
は、次の式に従って得られる:
【数2】
式中、nはプールの数であり;mはプール内の粒子の数であり;dは、混入物が特定されたプールの数である。
【0049】
この推定の信頼区間は、Remund(2001)で説明されているように、ISTA(International Seed Test Association)のフレームワークで使用されるSeedCalツールで適用されるF分布を含む適切な統計手法によっても決定することができる。
【数3】
【0050】
好ましい実施のモードでは、工程b)は、いくつかの目的の遺伝子座を有するゲノムのいくつかの領域の標的配列決定を含む。これにより、各サンプルに存在するシードの同一性をより正確に保証し、混入物の存在をより詳細に検出することができます。
【0051】
したがって、標的化された方法で、少なくとも2個、好ましくは少なくとも5個、好ましくは少なくとも10個、より好ましくは少なくとも100個、50個、40個、15個の目的の遺伝子座、あるいは少なくとも20の目的の遺伝子座を配列決定することができる。評価することができる目的の遺伝子座の数に上限はないが、対象遺伝子座の数を制限することが好ましい。実際には、限られた数の(遺伝子座特異的)マーカー(15〜20個)で品種を特徴付け、このマーカーのセットを使用して、この品種の植物を他の植物から区別することが可能である。品種は、同じ遺伝的背景を有する植物のセットとして理解され、品種は商品化された品種であってもよく、カタログにまだ登録されていない系統、基本系統、プレ基本系統、または繁殖中の系統であってもよい。
【0052】
目的の遺伝子座の最適な数は、検討される植物材料に応じて当業者によって定義されるだけでなく、任意の所望の品種のペアを識別する遺伝子座の最小数を設定することによっても定義される。したがって、品種の任意のペアを識別する遺伝子座の最小数を3に設定して、実際の混入と実験的な誤検出を混同するリスクを制限することができる。判別マーカーのセットを選択するために、Rosenberg et al.(Journal of Computational Biology 12(9), 2005, 1183−1201)によって様々なアルゴリズムが説明されている。
【0053】
これらのアルゴリズムは、選択されたマーカーの品質等の他の基準を考慮に入れるように改善または変更することができる(品質とは、増幅され、明確に識別される能力を指す)。マーカーのグループまたはカテゴリを識別して、特定のグループまたは異なるグループからのマーカーを優先的に含むマーカーのサブグループを定義することができる。このようにして、使用したいマーカーのセットを定義することができる。
【0054】
アルゴリズムは、識別マーカーの最小数として定義されるこれらのマーカーの統計的品質を考慮に入れて、個体のペアを異なるものとして決定することもできる。この基準から、マーカーのセットの識別品質は、このセットが識別できる個体のペアの数、理想的には生産者によって管理される個体の全体によって評価することができる。
【0055】
本発明の文脈において、この方法は、好ましくは、目的の遺伝子座に対して行われ、目的の品種を識別し(植物間の遺伝的背景の一貫性および一致を確実にし)、(特に、目的の形質に関連する)他の遺伝子座の有無を特定することを可能にする。
【0056】
この実施形態では、すなわち、ゲノムのいくつかの領域の配列決定を行う場合、バッチ内の複数の目的の遺伝子座について予期しない配列の存在が観察される場合にのみ、混入物がバッチに存在すると見なすことができる。換言すれば、単一の代替対立遺伝子(ゲノムの単一領域で予期しない配列、他の領域で得られた配列は予想される配列)が特定のバッチで観察された場合、混入物が証明されるとは見なされない。
【0057】
したがって、本明細書に記載の方法は、特に工業生産プロセスにおける品種の純度を制御するために、種子ロット内の混入物の存在を決定することを可能にする。
【0058】
この方法は、種子ロット中でホモ接合状態で求められる形質の純度レベルをチェックするためにも行うことができる。この方法では、モニターされる対象の特定の形質を有するゲノムの領域のみが優先的に評価される。各特性に特異的なマーカーを使用して、複数の形質を同時に制御することができる。
【0059】
形質は、特定の遺伝子座に特異的な対立遺伝子型として理解され、本文脈において、この対立遺伝子型はネイティブであり、TillingまたはEcotillingによって識別される突然変異、転移因子の刷り込みにリンクする突然変異、遺伝子編集または他の方法によって得られる突然変異とリンクし得る。本文脈において、それが点突然変異であろうと、挿入であろうと、欠失であろうと、突然変異は限られた数の塩基を有する。この方法はヘテロ接合形質にも適用することができ、混入物はこの個体で予想される対立遺伝子型の代替型に対応する。
【0060】
好ましい実施形態では、(単一の対立遺伝子または複数の対立遺伝子にリンクし得る)形質は、植物に目的の表現型形質(干ばつ耐性、生物的ストレスに対する耐性、窒素欠乏に対する耐性、収量の増加等)を提供する。
【0061】
形質が、GMO形質、転移因子の挿入によって得られる突然変異、または遺伝子編集によって得られる突然変異等の大きな挿入を伴う突然変異に関連している場合、この方法は、考慮される挿入または突然変異を有さない対立遺伝子型の存在を探索することによって行うことができる。この対立遺伝子型の存在は、種子ロットにおけるホモ接合型の突然変異に関連する形質の存在が完全に保証されていないことを示す。この方法は、例えば、突然変異が別の種からのDNA断片の遺伝子移入に対応する場合に用いることができ、この特定の状況は、例えば菜種における稔性回復系統の純度を確認するために発生する。
【0062】
この方法によれば、形質の偶然の存在を探索することもでき、偶然の存在が探索される形質は、GMO、遺伝子編集にリンクする突然変異、または異種である種に由来するフラグメントの遺伝子移入であり得、この探索は、T−DNAまたは挿入の特定の領域の増幅およびそれに次ぐ配列決定により行われる。ひいては、この方法は、変異対立遺伝子型の存在下で領域を特異的に増幅するプライマーを定義することができれば、小さな変異関連の形質に適用することができる。プロトコル、バッチ数、およびバッチあたりの種子数を適合させることにより、プロトコルを拡張して、最大10%の頻度で形質の存在を特定することができ、本文脈においては、例えば、GMO種子のバッチ(安全な領域に関する法律)中の野生種子の10%の存在を確認することができる。これらの適用はGMOに限定されず、この方法に従う形質は、別の種からの断片の系統への遺伝子移入、例えば菜種の大根からの稔性回復遺伝子座の存在であり得る。同様に、検証により、この遺伝子移入がホモ接合状態にあることを検証することができる。
【0063】
あるいは、この方法を用いて、種子ロットにおいて、偶発的な(望ましくない)GMOまたは有意なサイズのフラグメントの挿入に関連する他の突然変異の存在を検出することができる。この突然変異は、転移因子の存在、または特に遺伝子編集によって得られる挿入に関連している可能性がある。この実施形態では、特定の導入遺伝子または挿入の特定のプライマー(特定の混入が疑われる場合)または異なるジェネリックプライマーを使用して、事前に異なる導入遺伝子を検出する。
【0064】
品種の純度の場合、これらの形質に関連するマーカーを、品種を特徴づけるために用いられるマーカーのリストに追加することもできる。
【0065】
したがって、好ましい実施形態では、工程b)、c)およびd)は、複数の目的の遺伝子座を有するゲノムの複数の領域に対して行われる。
【0066】
この実施形態では、いくつかの遺伝子座のサブセットが、様々な目的の品種を判別または識別することを可能にする場合に好ましい。上述したように、この遺伝子座の数は可変であり、これらの遺伝子座は、特に(上記で引用した)Rosenbergの教示に従って、当業者によって決定することができる。本発明の特定の実施形態では、当業者は、特定の制御および手段を含む生産計画に関する情報を含めることができる:隔離距離、境界ゾーン、去勢(castration)、これは、混入のリスクが制限され、種子ロットが先天的に混入を有するか、または若干の混入を有することを示唆する。さらに、これらの手段により、混入は既知の混入物、特に基本種子およびプレ基本種子の生産に関与する親系統を含む親系統から発生する可能性が最も高い。この特定の文脈において、系統の純度を識別するためのマーカーの数は非常に少なく、特に20個以下であり得る。
【0067】
上記のように、一つの実施形態では、予想される対立遺伝子の代替対立遺伝子が単一の目的の遺伝子座について観察される場合、ロットは混入物を含むと判断される。別の実施形態において、予想される対立遺伝子の代替対立遺伝子が2つ以上の目的の遺伝子座(特に2個または3個の遺伝子座)について観察される場合、バッチは混入物を含むと判断される。
【0068】
一つの実施形態では、少なくともまたは正確に1個の目的の遺伝子座が、目的の特性(形質)に関連している。別の実施形態では、それは、目的の特性(形質)に関連しているのは遺伝子座の組み合わせである。
【0069】
一つの実施形態では、少なくとも1つの目的の遺伝子座が、ロットの種子に先天的に存在しない特定の形質に関連している。この実施形態では、この形質の偶然の存在が探索される。したがって、形質がないことを確認するためにマーカーが追加される。この実施形態では、この方法は本質的に定性的である。請求項のプロトコルへのこれらのマーカーの組み込みは、単一の実験で他の場所における必要な追加の制御を行うことを可能にする。
【0070】
一般に、種子ロットで不要な形質の頻度が10%を超える場合、ロットは非対応と見なされる。
【0071】
好ましい生産の態様では、工程a)で調製された各サブロットの種子の量は、80〜120の間である。
【0072】
本明細書に記載の方法はまた、ロットに存在する種子の固有の農学的特性を決定するために用いることもできる。したがって、望ましくない種子特性をもたらす遺伝子(例えば、発現した場合、種子の非発芽のマーカーである休眠マーカー遺伝子)の発現を決定することができる。ロットの種子におけるこれらの遺伝子の発現を決定するために、RNAが抽出され、逆転写が行われる。したがって、上記の方法には、以下の工程も含まれる場合がある:
i)サブロットの種子からRNAがさらに抽出され、工程b)の前にcDNAに逆転写され、
ii)休眠遺伝子に特異的なプライマーを使用したこのcDNAの配列決定が、工程b)の配列決定が行われるのと同時に行われ、
iii)休眠遺伝子に関連するcDNAが配列決定工程(ii)で検出された場合(cDNAの有無)、非発芽種子の存在は各サブロットについて定性的に決定され、
iv)ロット全体における休眠種子の量が、(iii)のすべてのサブロットで得られた定性的結果を編集することによって決定される。
【0073】
工程iii)およびiv)は、上記と同じ方法で行われる。ロット内の種子は一般に休眠形質を示さず、サブロット内の種子の数を適切に選択することにより、iii)の定性的情報を使用して定量的情報を得ることができる。例えば、種子の5%以下が休眠特性を示すことがわかっている場合(種子の少なくとも95%が適切に発芽する、市販の種子ロットで一般的に観察される状況)、20個(15〜25個の種子)のオーダーの種子を含むサブロットが用いられる。
【0074】
この休眠の問題は、ヒマワリ、小麦、イネの種子にとって特に重要である。
【0075】
種子RNAから得られたcDNAを配列決定することによって発現が評価される休眠マーカー遺伝子は、当技術分野で知られている遺伝子から優先的に選択され、そのいくつかを以下に記載する。
【0076】
別の実施形態では、形質は、マーカー遺伝子の発現レベルに対応し得る。例えば、種子ロットの発芽品質は重要な特性であり、この品質は種子の貯蔵中に変化する可能性がある。
【0077】
発芽条件(温度および湿度)が良好な状態で種子が発芽しない状態を休眠状態という。休眠は、植物種の環境条件への適応を反映している(植物の発達に有利な条件がない場合に潜在状態に身を置く能力)。したがって、ヒマワリ、米またはソルガムは休眠を示し、その解除は低温での発芽の改善を伴うが、小麦、大麦またはオーツ麦の場合、それは高温での発芽の改善である(Baskin and Baskin, Seed Science Research (2004)14,1−16)。
【0078】
この特性は、栽培種にとって特に重要であり、その目的は、播種後に迅速かつ均一に発芽する能力を備えた種子ロットを生産および販売することにある。したがって、種子ロットの休眠レベルを特徴づけることができることが重要であり、そのような分析は、発芽試験を通じて工場で日常的に行われ、これらの試験には特に休眠を解除する能力を有するEthrelが用いられる。しかしながら、これらの分析は長く、労力を要するため、分子分析に置き換えることができるという関心がある。
【0079】
異なる種で行われた研究により、発現レベルが種子の休眠状態または非休眠状態と相関する遺伝子が特定された。Bassel et al.(PNAS June 7, 2011 108 (23) 9709−9714; Trends in Plant Science, June 2016, Vol.21, No.6, 498−505)は、シロイヌナズナ(Arabidopsis thaliana)の休眠または非休眠状態に従って特異的に共発現する遺伝子のセットを特定している。例えば、DOG1(Delay Of Germination 1)遺伝子は、シロイヌナズナの低温での休眠維持に関与しており、この遺伝子の役割は、レタス(Huo et al., PNAS April 12,2016 113(15) E2199−E2206)または小麦(Ashikawa et al., Transgenic Res (2014) 23:621)等の種間で保存されていると考えられている。ヒマワリでは、Layat et al.(New Phytologist (2014) 204:864−872)は、休眠および非休眠胚のポリソーム画分に関連するRNA存在量を分析し、HSP(HSP70、HSP101)およびストレス応答遺伝子等の休眠状態に関連する遺伝子、または休眠の維持に関連するホルモンであるアブシジン酸(ABA)のシグナル伝達経路に関与する遺伝子を特定した。逆に、αチューブリン等の他の遺伝子は、休眠していない種子で特異的に発現する(Layat et al., op. cit)。
【0080】
したがって、休眠状態に特異的な遺伝子の発現の分析は、種子のバッチの発芽品質を特徴づけることを可能にする。発芽能力についてロットを認定することを目的とし、休眠状態の特定の遺伝子の発現の分析により、半定量分析によって、非休眠ロット内の休眠種子の割合を決定することができる。高い休眠率、特に>1%の場合、休眠状態に特異的な遺伝子および非休眠状態に特異的な遺伝子の共同分析により、これら2つの遺伝子の相対的な存在量を計算することにより、休眠率が表される。同様に、種子の生理学的状態の他の評価を行うことができ、したがって、実験室で実施される試験に代えることができる。配列決定試験のこのフェーズのタイミングに基づいて、適切なマーカー遺伝子を選択することができる。これらの試験は、例えば、商品化のために種子を包装する直前に行うことができる。この評価としては、プライミングの品質、発芽能力、種子の活力および生存率が挙げられる。発芽能力は、特に出願WO2018/015495に記載されている。
【0081】
上記の方法はまた、種子ロットの特定の純度、すなわち、種子ロット内の種子の種以外の種からの種子の有無(および定量化)を決定するために用いられ得る。このような分析は、現在、不要な種の種子の有無を視覚的に判断するオペレーターによって日常的に行われている(ISTA(Internatioinal Seed Testing Association)規則第4章)。
【0082】
したがって、上記のようなプロセスを実施することができ、その特徴は次のとおりである
i)サブロットのDNA配列決定が、サブロットの種子とは異なる1つ以上の種に特異的なプライマーを用いて、工程(b)の配列決定と同時に行われ、
ii)前記種に属する遺伝子が検出された場合(他の種に固有の遺伝子の有無)、異なる種の種子の存在が各サブロットについて定性的に決定され、
iii)ロット全体の外性の種子の量が、ii)のすべてのサブロットで得られた定性的結果を編集することによって決定される。
【0083】
この方法では、特に異なる種としての雑草の存在が探索される。特に、Aeginetia、Alectra、OrobancheおよびStrigaの種子の存在が探索される。菌核の存在も定期的に探索される。
【0084】
工程ii)およびiii)は、上記と同じ方法で行われる。ロット内の種子は一般に他種の種子が多くないため、上記のロット内の種子数を適切に選択することにより、iii)の定性的情報を用いて定量的情報を得ることができる。例えば、存在する種子の1%以下が、目的の種以外の種からのものであることがわかっている場合(これは通常、種子の少なくとも99%が目的の種である商業的種子ロットである)、100のオーダーの種子(80〜120個の種子)のサブロットが使用される。
【0085】
上記の方法は、種子ロット内の病原体の存在(混入)を検出するためにも用いることができる(ISTA(International Seed Testing Association)規則の第7章を参照)。例えば、ヒマワリの種子のロットの販売で許容されるボトリチスが混入したヒマワリの種子の量は5%である。
【0086】
上記の方法は、以下の工程を追加で行うことによっても実施することができる:
i)病原性種特異的プライマーを使用したサブロットに含まれるDNAまたはcDNAの配列決定が、工程b)の配列決定と同時に行われ、
ii)前記病原性種のDNAの有無が、それらの病原性種に属する配列が検出された場合、各サブロットについて決定され、
iii)ロットの混入に関する結論が、前記病原性種に属する配列の存在に基づいている。
【0087】
細菌、真菌、ウイルスまたは昆虫等の病原体に由来する遺伝子の配列を決定することができる。この方法は、アブラナ属ISTA種子中のXanthomonas campestris pv. campestrisの存在を検出するのに特に適している(規則7−019a:アブラナ属の種子におけるXanthomonas campestris pv. campestrisの検出)またはBerg(Plant Pathology (2005) 54, 416−427)。ヒマワリのべと病を同定するために、種子上の病原体を同定するためのPCR試験が存在する(Ioos et al., Plant Pathology (2007) 56, 209−218)。種子上の病原体を検出するという利点があるのに対し、種子上のこの病原体の存在は、特に求められる非常に低いレベルでは、症状を引き起こさない。このプロトコルはプライマーを示しており、ゲルの暴露ではなく配列決定を行うという事実により、より高い精度が得られる。トマトのclavibacter michiganensisの同定も行うことができる(Hadas et al., Plant Pathology (2005) 54, 643−649)。
【0088】
上記の方法を実施するために、工程b)の前に以下の工程を行うことができる。
i)DNAが種子の各サブロットから抽出され、
ii)RNAが各種子サブロットから抽出され、cDNAに逆転写され、
iii)i)で抽出されたDNAとii)で得られたcDNAとが混合され、
iv)必要に応じて、特定の遺伝子座に特異的、または非特異的に、iii)で得られたDNAに対して増幅が行われ、
v)iii)で得られたDNAまたはiv)で得られた増幅産物が、配列決定工程のテンプレートとして使用される。
【0089】
一つの実施形態では、工程i)工程ii)を同時に行うことができ、DNAおよびRNAの抽出は、特にMacherey−Nagelの全DNA、RNAおよびタンパク質単離NucleoSpin(登録商標)TriPrepキットを用いて行うことができる。
【0090】
したがって、好ましい実施形態では、工程iv)は、その有無が検証されることが望まれる遺伝子の特定の配列(特に他の生物からのもの)を増幅することによって行われる。その目的は、これらの他の生物が商業化の許容レベルを下回る量で存在するかどうかを判断することである。したがって、特に、ウイルス配列の存在を検出することができる。ゲノムのDNA全体の非特異的増幅も行うことができる。
【0091】
別の実施形態では、工程iv)はまた、特定の配列を増幅することによって行うことができ、サブロットの種子の特定の農学的特性、休眠状態の中から選択される種子の少なくとも1つの農学的特性、具体的には、プライミングの質、発芽の適性、種子の活力および生存率の決定を可能にする。
【0092】
一つの実施形態では、方法は以下の工程を含む:
i)DNAの単離に加えて、サブロットの種子からのRNAの抽出、およびそのRNAのcDNAへの逆転写も工程b)の前に行われ、
ii)そのcDNAの配列決定が、種子の農学的特性に関連する遺伝子に特異的なプライマーを用いて、工程b)の配列決定と同時に行われ、
iii)配列決定工程(ii)で種子の農学的特性の特定の遺伝子に関連するcDNAが検出された場合(cDNAの有無)、農学的特性を有する種子の存在が各サブロットについて定性的に決定され、
iv)ロット全体におけるこの農学的特性を備えた種子の量が、(iii)のすべてのサブロットについて得られた定性的結果を編集することによって決定される。
【0093】
一般に、種子の農学的特性は、種子のプライミング品質、発芽能力、活力および生存能力を含む休眠状態から選択される。適切な遺伝子を配列決定することにより、いくつかの農学的特性を探索することもできる。
【0094】
種子の生理学的状態および農学的特性のマーカー遺伝子は、種子において、望ましくない農学的特性(休眠、活力の欠如等)と同時に発現される遺伝子の中から選択される。したがって、この遺伝子の発現がないことが望ましく、この遺伝子の発現が種子ロットの種子の10%を超えて存在しないことが一般に望ましい。
【0095】
好ましい実施形態において、および品種純度分析の実施において(種子は、目的の遺伝子座に混入物(すなわち、望ましくない対立遺伝子)を提示する)、種子ロットに存在する混入物を特定することができる。
【0096】
各サブサンプルについて、目的の各遺伝子座のデータの編集に対応する分子プロファイルを定義することができる。次いで、各サブサンプルのプロファイルが予想される分子プロファイルと比較され、混入物の分子プロファイルを減算によって推定することができる。したがって、代替対立遺伝子を有さない目的の遺伝子座は、予想される品種と混入物との間の遺伝子座と同一であると見なされ、代替対立遺伝子を有する遺伝子座は、代替対立遺伝子に対して潜在的にホモ接合であるか、予想される対立遺伝子/代替代替遺伝子としてヘテロ接合であると定義される。
【0097】
次いで、これらの混入物の分子プロファイルが参照データベースと比較され、混入物の性質、および場合によっては生産サイクルに入った瞬間が特定される。
【0098】
したがって、混入物の識別プロセスが想定され、これは、上記の方法を実施し、以下の工程も含む
i)混入された各サブバッチで観察されたプロファイルと、混入物がない場合に予想されるプロファイルとを比較することにより、混入された各サブバッチの混入物の分子プロファイルが定義され、
ii)i)で得られたプロファイルを参照データベースと比較する。
【0099】
あるいは、混入物の識別が、混入された各サブロットに対しても行われることを特徴とする、上記で定義された純度の程度を決定するための方法が考慮される
i)混入されたサブロットで観察されたプロファイルと混入物の非存在下で予想されるプロファイルとを比較することにより、混入されたサブロット内の混入物の分子プロファイルが推測され、
ii)i)で得られたプロファイルが参照データベースのプロファイルと比較される。
【0100】
したがって、各混入されたサブロットの混入物の合計に対応する、最初の種子ロットの1つ以上の混入物プロファイルが取得される。
【0101】
したがって、上記の方法は、いくつかの異なる形質(品種の純度、特定の純度、農学的特性、病原体による混入)について、単一の工程で、いくつか不要な形質または混入物の存在を定量化することによって、種子ロットの品質管理を行うことを可能にする。さらに、これらの方法によれば、簡単に使用できる正確な情報を提供する配列決定を使用することにより、存在する混入物の性質を詳細に決定でき、また、他の方法(プローブ、増幅、DNAチップ)では検出されないSNP(一塩基多型)の存在を決定することもできる。したがって、これらの方法は、試験された種子ロットの特性評価に高い精度をもたらす。また、迅速かつ簡単に実施することができるため、時間を節約し、種子ロット分析のコストを削減できる。したがって、これらの方法は、現在、オペレーターによって面倒な方法で行われている特定の純度の分析を簡素化する。それらはまた、病原体の潜在的な成長によって現在行われている、多数の病原体の迅速な検査および検出を可能にする(そしてまた、配列決定された遺伝子にしたがってそれらの遺伝子型を特徴づける)。ロットの農学的特性(発芽および活力に関連するすべてを含む)は、種子サンプルの発芽によってではなく、むしろ好ましくない遺伝子の発現の存在によって決定できるため、時間とリソースを節約することができる。
【0102】
したがって、記載されている方法は、特にそれらが組み合わされた場合に、種子ロット管理の精度を向上させる。
【0103】
これらの同じ方法を転置して、苗の形で販売されている植物、栄養繁殖のある種の適合性の研究に用いることもでき、評価された材料は、植物組織サンプルで構成され、その量はある植物から別の植物へ、この植物組織は、とりわけ、葉のディスクであり得る。
【図面の簡単な説明】
【0104】
図1】SNPがホモ接合型(A、B)またはヘテロ接合型(C)のトウモロコシサンプルで、蛍光色素FAMおよびVICによってそれぞれ検出された2つの対立遺伝子型を含むSNPのTaqman分析結果。A:FAMで検出された対立遺伝子型のホモ接合サンプル。B:VICで検出された対立遺伝子型のホモ接合サンプル。C:FAMおよびVICで検出された対立遺伝子型のヘテロ接合サンプル。
図2】SNP10の代替対立遺伝子の各サブロットにおける相対頻度。サブロット3、14および16は、代替対立遺伝子のかなりの頻度を示す。
図3】定性的プロファイル(混入対立遺伝子の有無)。16個のサブロット(列)内の17個のマーカー(行)(16個の識別マーカーと特性に関連付けられた1個のマーカー)の代替対立遺伝子の存在のプロファイル。代替対立遺伝子の存在は、サブロット3、14および16の少なくとも3つのSNPで検出される。これらのサブロットは、混入されていると判断される。残りの13個のサブロットは混入されていないと判断される。
図4】分析された16個のサブロットから得られた17のSNP(16の識別マーカーと特性に関連する1つのマーカー)で得られた分子プロファイル。最初の行のプロファイルはメインプロファイルに対応し、後続のプロファイルはそれぞれロット3、14および16で観察された混入プロファイルに対応する。
【実施例】
【0105】
実施例1:Taqmanによる混入物の検出
本実施例では、Taqman(Applied Biosystem)技術を用いた遺伝子型決定により、トウモロコシ種子のサブロット内の混入種子を検出する可能性を評価した。
【0106】
図1は、SNPがホモ接合またはヘテロ接合であるトウモロコシサンプルにおいて蛍光色素FAMおよびVICによってそれぞれ検出された2つの対立遺伝子型を含む、SNPのTaqman分析の結果を示し、VIC対立遺伝子(B)についてホモ接合であるサンプルにおけるFAMプローブを用いたシグナル、すなわち、偽陽性シグナルをサンプル中の実際の混入に関連するシグナルと区別しない非特異的シグナルの存在を強調している。
【0107】
これらの結果は、Taqman法が混入物を確実に検出しないことを示している。
【0108】
実施例2:チップ上の遺伝子型決定による混入物の検出
本実施例では、系統Bからの10%、20%、30%、40%、および最大90%の混入物を含むラインAからの200個の種子のバッチを準備し、このバッチからの15個の種子のサンプルを、混入を特定する可能性を評価するために、Infinium(Illumina)チップ上で遺伝子型決定によって分析した。10%を超える混入が検出されたが、10%の混入を含む混合物は、混入されていないコントロールと区別できなかった。さらに強い理由から、それほど重要ではない混入は検出できなかった。
【0109】
実施例3:マーカーのセットに対する本発明による方法の実施
本実施例では、16個の識別マーカー(SNP)のセットが用いられ、予想されたもの以外の様々な存在の明確な識別が可能になった。この16個のマーカーのセットは、対象の品種の数千個のマーカーに関する参照遺伝子型決定から定義され、少なくとも3つの識別マーカーによって各品種を他の品種と区別することができた。この場合、各品種の同一性を決定するのは、16個のマーカーの全体的な分子プロファイルである。各マーカーは、目的の遺伝子座に固有であった。
【0110】
制御された混入条件下での実験では、純粋なL1系統の24個の種子が純粋なL2系統の2376個の種子のバッチに導入され、こうして得られたバッチの純度レベルは99%で、種子は24個の100粒のサブロットにランダムに分散された(すなわち、2400個の粒が分析された)。このようにして得られた種子の各バッチを独立して粉砕し、粉砕した種子からDNAを抽出した。したがって、各バッチに平均1つの混入物が存在し:サブロットの数は、実際には、完全な種子バッチに存在する混入物の数と同じであった。しかしながら、統計的なランダム分布により、サブロットを形成することによるサンプリングにより、一部のサブロットには混入物が含まれず、他のサブロットにはいくつかの混入物が含まれることが知られている。
【0111】
16個のマーカーのそれぞれについて、70〜120bpのアンプリコンが定義され、16個のマーカーがマルチプレックスPCRによって同時増幅された。各DNAサンプルに特有のインデックス(TAG)が用いられ、すべてのアンプリコンの配列決定と、取得された配列の元のバッチへの帰属が可能になった。
【0112】
アンプリコンは、MiniseqシーケンサーのIliumina技術よって配列決定された。75塩基のペア配列が生成され、逆多重化工程によって元のDNAに割り当てられた。アダプター配列と低品質の塩基(Q30しきい値)を除去した後、配列の各ペアを1つの配列に再構築し、参照トウモロコシゲノム(RefGenV4)にアラインメントした。各SNPについて、メイン対立遺伝子および代替対立遺伝子の相対的な対立遺伝子頻度が計算され、これは、各対立遺伝子の読み取り値の合計に対する目的の対立遺伝子を含む読み取り値の数に対応した。
【0113】
サブロットで、テストされた品種で予想される対立遺伝子の配列ではない対立遺伝子型の配列がバックグラウンドよりも大きいと思われる場合、SNPマーカーで混入が発生したと見なされた。
【0114】
代替対立遺伝子が検出されたSNPが少なくとも3つ含まれている場合、サンプルは混入されていると判断された。したがって、これらの24個のサブロットのうち、13個は混入されていると見なされ、11個は純粋であると見なされた。
【0115】
混入されたサブロットの数は、分析されたロットの品種純度を推定するために使用された。この計算は、Remund(2001)の式を使用するSeed Calcソフトウェアを用いて行われた。本実施例では、推定純度は99.22%(98.64%−99.6%)であり、制御された真の純度は99%であった。
【0116】
バッチの不純物の推定値
は、次の式に従って得られた:
【数4】
式中、nはプールの数であり;mはプール内の粒子の数であり;dは、混入物が特定されたプールの数である。
【0117】
上記の場合:1−(1−13/24)0.01=1−0.9922=0.0078または純度99.22であった。信頼区間も、Remund2001に記載されている手順に従って計算された。
【0118】
実施例4:混入物の特定
本実施例では、実施例3と同じアプローチを用いて、トウモロコシの基本種子ロットを分析した。1つのロットに対して、100種子の16個のサブロットが形成された。
【0119】
各サブロットの種子を粉砕し、DNAを抽出した。16個の識別SNP(予想されるもの以外の品種の存在の明確な識別を可能にする)および形質に関連する1個のマーカーを含む17個のマーカーのセットが識別された。各マーカーについて、70〜120bpのアンプリコンが定義され、17個のマーカーがマルチプレックスPCRで同時増幅された。各DNAサンプルに特有のインデックス(Tag)が用いられ、すべてのアンプリコンの配列決定と、取得した配列の元のバッチへの帰属が可能になった。
【0120】
アンプリコンは、MiniseqシーケンサーのIliumina技術を用いて配列決定された。75塩基のペア配列が生成され、逆多重化工程によって元のDNAに割り当てられた。アダプター配列と低品質の塩基(Q30しきい値)を除去した後、配列の各ペアを1つの配列に再構築し、参照トウモロコシゲノム(RefGenV4)にアラインメントした。各SNPについて、メイン対立遺伝子と代替対立遺伝子の相対的な対立遺伝子頻度が計算され、これは、各対立遺伝子の読み取り値の合計に対する目的の対立遺伝子を含む読み取り値の数に対応した。
【0121】
図2は、SNP(SNP10)について、各サブロットにおける代替対立遺伝子の頻度(すなわち、代替対立遺伝子配列の発生頻度)を示している。本実施例では、サブロット3、14および16は、代替対立遺伝子の有意な存在を示している(水平線で表されるバックグラウンドノイズの上)。この分析は各SNPに対して行われ、図3は、各サブロットにおいて各SNPについて得られた定性的プロファイル(代替対立遺伝子の有無)を示している。代替対立遺伝子の存在は、サブロット3、14および16の少なくとも3つのSNPで確認されてた。これらの3つのサブロットは混入されていると判断される。残りの13のサブロットは混入されていないと判断される。SeedCalcで推定された品種の純度は99.79%であった(95%信頼区間:99.39%−99.96%)。
【0122】
並行して、同じバッチが558個の個別の種子で分析された。各種子について、パンチにより胚をパンチすることによって断片を採取し、次いでDNAを抽出し、16個の識別マーカーを用いてKASP技術(LGC Genomics)により遺伝子型を決定した。この分析では、99.46%の純度が推定された(95%信頼区間:98.42%−99.89%)。
【0123】
マーカーSNP17は個別に分析され、関連する形質の純度を推定することができた。
【0124】
図3は、サブロット3および16が代替対立遺伝子のかなりの頻度を示したことを示している。これらの2つのサブロットは混入されていると判断され、99.87%のライン純度推定値が導かれた(95%信頼区間:99.52−99.98%)。
【0125】
混入されていないサブロットで特定された分子プロファイルはまず、分析された品種の予想されるプロファイルとの適合性をチェックするために用いられた(前の工程においてバッチの品種の純度が確認され、この工程において特定された品種が実際に予想されるものであることが確認される)。次いで、混入を示すサブロット3、14および16で、予想されるプロファイルを差し引くことにより、観察された分子プロファイルから混入物の分子プロファイルを推定した。混入を示す各SNPマーカーについて、観察された2つの対立遺伝子が報告されまた(図4)。したがって、混入物は、少数の対立遺伝子に対してホモ接合性であるか、またはヘテロ接合性であり得た。
【0126】
次いで、各混入物の分子プロファイルを参照データベースと比較して、それを特定した。この遺伝子型が既知のアクセッションに対応する場合、潜在的な混入物として提案され、そうでない場合、混入物の遺伝子型は識別不能と判断される。
【0127】
この参照データベースは、生産計画に従って改良することができ、特に、このデータベースには、ラインの生産部門で栽培されているすべての品種が優先的に含まれる。そして、本文脈において、この参照データベースに表示されない混入物は、収穫後のプロセスに関連する混入物として認定されます。
【0128】
実施例5:種子ロットの品種純度および発芽品質を同時に評価する方法の実施
本実施例では、100個の種子の16個のサブロットが形成されるため、1600個の種子のサンプルで種子ロットが評価された。各サブロットから、DNAとRNAが共抽出された。
【0129】
この目的のために、各サブロットはステンレス鋼ビーズを添加することによって機械的にチューブに粉砕された。核酸、特にRNAの完全性を維持するために、チューブおよび粉砕サポートは事前に液体窒素で冷却された。DNAおよびRNAの共抽出が、Macherey−Nagelの全DNA、RNAおよびタンパク質の単離NucleoSpin(登録商標)TriPrepキットを用いて行われた。最初の工程では、溶解バッファーが粉砕された材料に添加され、細胞構造の破壊およびRNase等の酵素の同時不活化を可能にする。次いで、溶解物を、DNAおよびRNA分子が付着するシリカメンブレンを含むカラムに沈着させた。特定のバッファーにおける最初の溶出では、RNAをシリカメンブレンに付着させたままDNAが溶出された。DNAse分解DNA残基で処理した後、RNAを洗浄し、RNAseを含まない水で溶出した。
【0130】
各サブロットについて、逆転写が行われ、オリゴdTオリゴヌクレオチドでプライミングされて、各サンプル中に存在するメッセンジャーRNAに相補的な二本鎖DNAが合成された。次いで、抽出されたゲノムDNAとRNA画分から合成されたcDNAで構成されるDNA混合物が、各サブロットに対して構成された。
【0131】
マルチプレックスPCRは、70〜120bpのアンプリコンの形で目的のターゲットを特異的に増幅するために、各DNAサンプルについて行われた。これらのアンプリコンは、一方では品種同定分子プロファイルを決定するための目的のゲノム領域に対応し(判別SNPのセット)、他方では種子休眠状態のマーカーであるDOG1遺伝子に対応する。各DNAサンプルに特有のインデックス(TAG)が用いられ、すべてのアンプリコンの配列決定と、取得された配列の元のサブロットへの帰属が可能になった。アンプリコンはIliumin技術を用いて配列決定され、それぞれ75塩基のペア配列を生成した。次いで、これらの配列は、逆多重化工程によって元のDNAに割り当てられ、アダプター配列および低品質の塩基(Q30しきい値)の除去からなる様々な処理を受けた。各配列のペアは、最終的に単一の配列にアセンブルされ、参照ゲノム配列とアラインメントされた。
【0132】
各SNPについて、メイン対立遺伝子および代替対立遺伝子の相対的な対立遺伝子頻度が計算され、これは、各対立遺伝子の読み取り値の合計に対する目的の対立遺伝子を含む読み取り値の数に対応した。サブロットで、テストされた品種で予想される対立遺伝子の配列ではない対立遺伝子型の配列がバックグラウンドよりも大きいと思われる場合、SNPマーカーで混入が発生したと見なされた。代替対立遺伝子が検出されたSNPが少なくとも3つ含まれている場合、サンプルは混入されていると判断された。混入されたサブロットの数は、テストされたロットの品種の純度を推定するために用いられた。この計算は、Remund(2001)の式を用いるSeedCalcソフトウェアによって行われた。
【0133】
DOG1遺伝子に関して、この遺伝子の特定の転写配列がバックグラウンドとは大幅に異なる量で検出された場合、サブロットは休眠種子を含むと見なされ、この遺伝子の発現は非休眠種子では無視できた。この有意性のしきい値は、従来は標準範囲を使用して決定されていた。次いで、従来使用された計算方法を用いて、DOG1遺伝子発現が検出されたサブロットの数を数えることによって休眠率が推定された。
図1
図2
図3
図4
【国際調査報告】