(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-01
(45)【発行日】2024-07-09
(54)【発明の名称】コムギの収量予測方法
(51)【国際特許分類】
G01N 27/62 20210101AFI20240702BHJP
【FI】
G01N27/62 V
(21)【出願番号】P 2021168110
(22)【出願日】2021-10-13
【審査請求日】2023-03-29
(31)【優先権主張番号】P 2020172821
(32)【優先日】2020-10-13
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000000918
【氏名又は名称】花王株式会社
(74)【代理人】
【識別番号】110000084
【氏名又は名称】弁理士法人アルガ特許事務所
(72)【発明者】
【氏名】前田 春香
(72)【発明者】
【氏名】藤松 輝久
(72)【発明者】
【氏名】遠藤 圭二
【審査官】吉田 将志
(56)【参考文献】
【文献】中国特許出願公開第107356569(CN,A)
【文献】米国特許出願公開第2015/0168419(US,A1)
【文献】特表2012-510062(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 27/62
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
コムギから採取された葉サンプルから、
LC/MSによる質量分析により提供される精密質量(m/z)
と保持時間(分)で規定された、下記表1a~1
sに記載の成分から選ばれる1種以上の成分の分析データを取得し、当該データとコムギ収量との相関性を利用してコムギの収量を予測する、コムギの収量予測方法。
【表1a】
【表1b】
【表1c】
【表1d】
【表1e】
【表1f】
【表1g】
【表1h】
【表1i】
【表1j】
【表1k】
【表1l】
【表1m】
【表1n】
【表1o】
【表1p】
【表1q】
【表1r】
【表1s】
【請求項2】
前記1
種以上の成分の分析データをpooled QC法により補正する、請求項1に記載の方法。
【請求項3】
成分が、前記表1a~1
sに記載の成分No.1、5、7、12、14、17、20、24、27、29、34、41、46、47、48、52、58、60、61、64、68、70、71、72、74、83、84、85、90、92、98、101、106、107、109、110、111、115、117、118、125、129、131、132、133、136、143、144、145、155、160、162、163、164、169、170、171、172、178、179、180、181、183、184、186、189、191、192、193、196、198、199、203、204、206、210、214、216、218、225、227、231、233、235、237、244、250、255、256、264、266、271、282、283、286、291、292、294、297、298、308、310、312、315、318、323、329、330、331、334、338、345、346、348、349、355、357、358、360、361、373、374、381、384、385、386、388、392、393、395、399、406、408、411、412、422、428、429、431、436、437、439、440、444、449、454、455、457、461、468、470、482、497、501、502、505、507、509、513、517、521、526、528、530、531、535、541、542、543、545、546、547、548、554、562、565、568、571、574、584、586、588、589、591、592、596、599、601、607、609、610、612、616、619、623、625、627、631、634、637、638、640、642、643、644、646、648、649、651、653、654、655、656、660、662、665、671、672、674、675、680、683、684、686、690、698、701、708、710、711、713、716、717、718、720、722、723、726、731、732、736、740、742、743、745、749、750、753、757、760、761、763、764、765、768、774、777、778、781、783、784、785、786、787、788、792、793、795、796、801、803、805、808、809、815、817、819、823、824、825、826、834、835、845、846、853、854、856、857、862、864、865、869、874、875、876、877、879、886、888、893、898、899、901、902、904、905、909、916、922、924、925、929、932、933、934、935、937、938、939、941、942、945、947、950、951、957、958、961、963、967、968、970、971、974、978、979、983、987、988、989、991、994、995、998、1005、1007、1008、1009、1010、1013、1017、1018、1021、1026、1027、1029、1031、1035、1038、1039、1040、1041、1043、1046、1047、1052、1060、1061、1064、1067、1068、1069、1072、1074、1076、1077、1085、1087、1094、1096、1103、1106、1110、1114、1116、1121、1123、1126、1127、1130、1132、1134、1142、1143、1146、1147、1148、1149、1153、1157、1159、1177、1179、1181、1182、1183、1184、1185、1186、1188、1193、1194、1195、1198、1199、1200、1206、1209、1210、1213、1215、1217、1218、1219、1226、1227、1232、1237、1238、1239、1240、1242、1244、1246、1249、1250、1251、1254、1257、1262、1264、1274、1275、1278、1279、1281、1284、1287、1292、1295、1296、1308、1312、1314、1315、1318、1320、1328、1330、1331、1334、1335、1336、1337、1338、1339、1342、1344、1345、1346、1349、1350、1351、1354、1355、1362、1370、1381、1396、1400、1403、1406、1408、1409、1410、1411、1413、1414、1415、1417、1418、1419、1423、1441、1442、1444、1445、1446及び1450から選ばれる1種以上である請求項1又は2に記載の方法。
【請求項4】
成分が、前記表1a~1
sに記載の成分No.1、12、17、20、34、48、52、58、60、61、68、71、72、74、83、84、85、90、92、101、107、109、110、115、117、118、129、132、133、136、143、160、164、170、171、172、178、179、181、184、189、191、193、196、198、203、206、210、218、235、237、249、255、257、282、283、291、294、297、298、310、312、315、318、330、331、345、346、348、355、360、361、362、373、384、386、388、392、395、406、408、411、412、440、444、449、452、454、455、457、461、470、482、501、505、513、521、530、535、541、542、546、548、565、571、574、579、589、607、610、612、616、634、646、648、656、660、662、701、708、710、716、731、732、740、743、749、750、753、757、760、761、767、768、774、777、783、785、787、788、792、794、795、803、808、809、815、823、824、825、835、845、846、853、854、856、862、863、864、865、869、874、875、876、877、879、886、888、893、895、904、905、909、916、921、922、929、933、934、938、939、942、945、947、951、966、967、968、970、971、983、987、988、994、995、998、1003、1005、1008、1009、1010、1013、1017、1018、1021、1027、1031、1035、1038、1039、1040、1047、1052、1061、1067、1068、1069、1072、1077、1085、1094、1096、1106、1118、1121、1126、1127、1132、1134、1143、1153、1159、1181、1183、1186、1194、1198、1199、1209、1213、1217、1218、1232、1237、1238、1239、1242、1244、1254、1264、1275、1278、1279、1284、1292、1295、1308、1312、1314、1315、1318、1320、1330、1331、1334、1337、1338、1339、1345、1346、1350、1355、1362、1408、1412、1415、1418、1419、1442、1444及び1446から選ばれる1種以上である請求項1又は2に記載の方法。
【請求項5】
成分が、前記表1a~1
sに記載の成分No.12、20、34、48、58、61、85、101、109、115、132、133、172、184、193、198、206、255、282、283、312、330、331、346、348、355、361、386、449、461、482、505、542、589、662、731、760、761、783、785、787、815、824、825、874、875、886、929、934、994、1005、1009、1039、1040、1067、1068、1085、1143、1181、1183、1186、1209、1232、1244、1279、1284、1337、1346、1350及び1355から選ばれる1種以上である請求項1又は2に記載の方法。
【請求項6】
成分が、ピログルタミン酸、L-アスパラギン、クロクサチンG、ククルビン酸及び5-アミノイミダゾールリボヌクレオチドから選ばれる1種以上を含む、請求項1又は2に記載の方法。
【請求項7】
葉サンプルが、出芽期から出穂期のコムギから採取される、請求項1~6のいずれか1項に記載の方法。
【請求項8】
葉サンプルが、5葉齢期から幼穂形成期のコムギから採取される、請求項1~6のいずれか1項に記載の方法。
【請求項9】
分析データが、質量分析データである請求項1~8のいずれか1項に記載の方法。
【請求項10】
葉サンプルから取得された成分の分析データを、前記表1a~1
sに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位500個の中から少なくとも1個の成分の分析データを用いて構築された収量予測モデルと照合する工程を含む、請求項1~9のいずれか1項に記載の方法。
【請求項11】
収量予測モデルが、前記表1a~1
sに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位500個の中から少なくとも5個を用いる、請求項10に記載の方法。
【請求項12】
収量予測モデルが、前記表1a~1
sに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位500個の中から少なくとも10個を用いる、請求項10に記載の方法。
【請求項13】
収量予測モデルが、前記表1a~1
sに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位10個の中から少なくとも1個を用いる、請求項10に記載の方法。
【請求項14】
収量予測モデルが、前記表1a~1
sに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位10個の中から少なくとも5個を用いる、請求項10に記載の方法。
【請求項15】
収量予測モデルが、前記表1a~1
sに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位10個の中から少なくとも8個を用いる、請求項10に記載の方法。
【請求項16】
収量予測モデルが、前記表1a~1
sに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位10個の中から少なくとも9個を用いる、請求項10に記載の方法。
【請求項17】
収量予測モデルが、前記表1a~1
sに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位500個を用いる、請求項10に記載の方法。
【請求項18】
収量予測モデルが、OPLS法を用いて構築されたモデルである請求項10~17のいずれか1項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はコムギの収量を早期に予測する方法に関する。
【背景技術】
【0002】
コムギは、トウモロコシ、イネと並んで三大穀物と称される重要な穀物であり、日本を始め世界中で広く食されている。重要な穀物の1つとして広く栽培され、また収量を増加させる技術の開発が行われている。
コムギの生育期間は、品種や栽培条件によって若干異なるが、通常、播種から収穫まで3~6か月という長期間を要する。よって、コムギの収量を増加させる技術の開発において、収量評価を行うには栽培に多くの時間を必要とすることから、早期に収量を予測する方法が求められてきた。また、実際の生産場面において、早期に収量を予測することができれば、生産者は安定した収量確保のために費用コストのかかる追加技術を投入すべきかどうかの判断を容易に下すことができる。
【0003】
これまでにも気象データ、圃場の画像や生育情報を利用した早期に収量性を評価する方法が種々検討されている。例えば、非特許文献1では、播種前に積算降水量・積算平均気温等の気象データを用いて国レベルでの生産量を予測するモデルの構築が行われている。非特許文献2及び3では、気象条件から生育や収量性を評価する試みが開示されている。非特許文献4では、圃場の画像からNDVI(正規化植生指標)を推定し、圃場単位での収量を簡易的に予測する技術が開示されている。また、特許文献1では、葉身窒素量、葉色又はクロロフィル量を測定し、生育や収量性を評価し、施肥量を決定する試みもなされている。
【0004】
しかしながら、非特許文献1のモデルは、播種前から予測された気象データを用いてコムギの収量を予測するモデルであるが、予測できる単位が国単位であり、個体毎の予測因子と収量とを対応させたい場合の評価には向いていない。非特許文献2、3及び4並びに特許文献1の方法は、非破壊で簡易的な測定であるといえるが、予測時期が幼穂形成期以降、すなわち生育期間の半分が経過した後での予測となる。さらに、圃場単位での予測を行うため、個体レベルでの収量を予測する技術ではない。
【0005】
このほかイネにおいて、播種後15日程度の地上部から抽出される代謝物をGC-MSにより網羅的に測定し、それらのデータを用いてハイブリッドライス収量予測モデルを作成したことが報告されているが(非特許文献5)、この報告では、通常の予測モデル構築の際に行われるクロスバリデーションというモデルの予測性評価が行われておらず、検証が十分とは云えない。また、侵襲的であり、個体毎の予測因子と収量とを対応させたい場合の評価には向いていない。
【先行技術文献】
【特許文献】
【0006】
【非特許文献】
【0007】
【文献】Iizumi,T. et al., Climate Services, 2018, vol. 11, p.13-23
【文献】箕田豊尚、日本作物学会紀事、2010年、第79巻、第1号、p.62-68、「埼玉県の畑作試験圃場におけるコムギ「農林61号」の収量に対する気象条件の影響」
【文献】Marletto, V. et al., Agricultural and Forest Meteorology, 2007, vol. 147, p. 71-79
【文献】池田順一ら、日本土壌肥料學雑誌、2001年、第72巻、第6号、p.786-789、「高解像度衛星IKONOSの画像データによるコムギ収量の予測」
【文献】Dan,Z. et al., Scientific Reports, 2016, 6, 21732
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明は、コムギの収量を早期に精度よく予測する方法を提供することに関する。
【課題を解決するための手段】
【0009】
本発明者らは、コムギの収量性評価について種々検討した結果、葉中に含まれる代謝物にはその存在量が収量と相関する成分があること、そして、播種後1か月程度という早期にコムギ展開葉から一部を採取し、葉中に含まれる成分を分析し、解析することで最終的な収量を個体レベルで評価できることを見出した。
【0010】
すなわち、本発明は、コムギから採取された葉サンプルから1以上の成分の分析データを取得し、当該データとコムギ収量との相関性を利用してコムギの収量を予測する、コムギの収量予測方法、を提供する。
【発明の効果】
【0011】
本発明の方法によれば、コムギの収量を早期に予測できる。これにより、例えば、収量確保のための追加技術投入の判断が容易となるほか、収量増加技術の開発の大幅な効率化を図ることができる。
【図面の簡単な説明】
【0012】
【
図1】全23データを用いて構築されたOPLSモデルによる収量の予測値と実測値との関係を示す図。
【
図2】
図1のモデルにおけるVIP値11位以下500位までのすべての成分の分析データ、21位以下500位までのすべての成分の分析データ、31位以下500位までのすべての成分の分析データ・・・及び61位以下500位までのすべての成分の分析データを用いてOPLS法により構築した各々のモデルのR
2(図中ではR2Yと表示)値及びQ
2(図中ではQ2と表示)値を示す図。
【
図3】
図1のモデルにおけるVIP値上位1位から10位までの成分の分析データの内、任意の8個の組み合わせ(45通り)についてOPLS法により構築した各々のモデルのR
2(図中ではR2Yと表示)値及びQ
2(図中ではQ2と表示)値を示す図。
【
図4】
図1のモデルにおけるVIP値上位1位から10位までの成分の分析データの内、任意の9個の組み合わせ(10通り)についてOPLS法により構築した各々のモデルのR
2(図中ではR2Yと表示)値及びQ
2(図中ではQ2と表示)値を示す図。
【発明を実施するための形態】
【0013】
本発明において、コムギとは、イネ科の一年生植物であり、コムギ属(学名Triticum)に属する植物全般を意味する。コムギ属に属する種は全18種あり、Triticum aegilopoides、T. thaoudar、T. monococcum、T. dicoccoides、T. dicoccum、T. pyromidale、T. orientale、T. durum、T. turgidum、T. polonicum、T. persicum、T. aestivum、T. spelta、T. compactum、T. sphaerococcum、T. maha、T. vavilovii、T. timopheeviが挙げられる。代表的な種のひとつにはT. aestivumが挙げられ、その品種は、きたほなみ、ゆめちから、キタノカオリ、つるきち、きたさちほ、春よ恋、はるきらり、ハルユタカ、農林61号等がある。また、他の代表的な種にはT. dicoccumが挙げられ、その品種にはAbruzzo、Molise、Umbria等が含まれる。さらにT. durumの品種例はセトデュール等が挙げられる。このようにコムギ属に含まれる品種は、多岐にわたるが、本発明においてはそれに限定されるものではない。
【0014】
コムギの出芽から開花期までの生育ステージは、出芽期(播種後7日前後)、5葉齢期(播種後15日前後)、茎立期(播種後30日前後)、幼穂形成期(播種後40日前後)、止め葉期(播種後50日前後)、出穂期(播種後60日前後)、開花期(播種後65日前後)に分けられる。本発明において、コムギの葉サンプルの採取は、葉が採取可能な出芽期から出穂期までの間に行われればよく、該採取時期としては、好ましくは5葉齢期~出穂期、より好ましくは播種後5葉齢期日~止め葉期、好ましくは播種後20日~止め葉期、さらに好ましくは播種後20日~幼穂形成期が挙げられる。尚、上記各生育ステージにおける前後の日数幅は5日間以内が好適である。
或いは、コムギの葉の採取時期は、播種後7日以上、好ましくは15日目以上、より好ましくは20日目以上で、且つ好ましくは播種後60日より前、より好ましくは50日より前、さらに好ましくは40日目より前であり得る。また、播種後7~60日目、好ましくは15~50日目、より好ましくは20~40日目であり得る。例えば、播種後27日±3~5日目のコムギから葉を採取するのが好適である。
ここで、播種後日数とは、春まきコムギを栽培した場合の日数を表す。秋まきコムギでは、各生育ステージの播種後日数は上記日数と相違するが、当業者であれば、秋まきコムギ栽培条件を考慮して各生育ステージの播種後日数を理解できるので、上記採取時期に相当する時期に葉サンプルを採取すればよい。
【0015】
本発明において、収量とは、個体あたりのコムギの子実質量、または個体あたりの粒数を意味する。質量については、特に限定されないが、乾燥質量が好ましい。これらのうち、個体あたりのコムギの乾燥子実質量が特に好ましい。本発明における乾燥子実質量とは、90℃にて72時間乾燥させた後の子実に含まれる水分率が7%以下に減少した状態で測定した質量を意味する。乾燥子実質量は、電子天秤などの校正機能つきの天秤ばかりによって測定されることが好ましい。
【0016】
葉サンプルの採取部位は、特に限定されないが、例えば、株の根本から葉を4~7枚程度切断して採取することが挙げられる。
【0017】
本発明において、取得される成分の分析データとしては、高速液体クロマトグラフィー(HPLC)、ガスクロマトグラフィー(GC)、イオンクロマトグラフィー、質量分析(MS)、近赤外分光分析(NIR)、フーリエ変換赤外分光分析(FT-IR)、核磁気共鳴分析(NMR)、フーリエ変換核磁気共鳴分析(FT-NMR)、誘導結合プラズマ質量分析計(ICP-MS)、液体クロマトグラフと質量分析とを組合せたLC/MS等の機器分析手段を用いて分析・測定されたデータが挙げられるが、好ましくは質量分析データであり、より好ましくはLC/MSによる質量分析データである。
質量分析データとしては、精密質量(「m/z値」)、イオン強度、保持時間等が挙げられるが、好ましくは精密質量の情報である。
【0018】
葉サンプルを、上記機器分析手段に適用するためには、分析手段に応じて適宜前処理されるが、通常、採取した葉はアルミホイルで包み直ちに液体窒素中で凍結して代謝反応を停止させ、凍結乾燥にかけて乾燥した後、抽出操作に供される。
抽出は、凍結乾燥した葉サンプルを、ビーズ粉砕機等を用いて粉砕した後、抽出溶媒を添加して撹拌することにより行われる。ここで用いられる抽出溶媒としては、メタノール、エタノール、ブタノール、アセトニトリル、クロロホルム、酢酸エチル、ヘキサン、アセトン、イソプロパノール、水等及びそれらを混合したものが挙げられる。分析手段としてLC/MSを用いる場合には、内部標準物質を添加した80v/v%メタノール水溶液等が好適に使用される。
【0019】
本発明において、分析される葉中の成分としては、LC/MSによって分離検出されるコムギの代謝物質が挙げられる。好ましくは、質量分析により提供される精密質量(m/z)が104~1178である成分が挙げられる。より好ましくは、質量分析により提供される精密質量(m/z値)で規定された、下記表1a~1jに記載された1,450成分が挙げられる。尚、LC/MSによる分離検出の過程において、代謝物質から部分分解物及びアダクト(M+H、M+Na等)の異なる分子イオンピークが生じる場合、検出された部分分解物は、元の代謝物質とは別の成分とした。
【0020】
【0021】
【0022】
【0023】
【0024】
【0025】
【0026】
【0027】
【0028】
【0029】
【0030】
当該1,450成分はコムギの代謝物質から選択抽出されたものであり、その選択方法は詳細には実施例に示すとおりであるが、概略すると、1)施肥条件を変えてコムギ(春まきコムギ)を栽培し、2)それぞれ播種後1ヶ月程度に葉を4~7枚採取して葉サンプルを得、3)80v/v%メタノールを用いて成分抽出を行った後、4)LC/MS分析を行って分子イオン情報(精密質量,m/z)とフラグメントに由来する構造情報を取得し、5)成分由来ピークを抽出し、次いで各ピークを各サンプル間で整列化させるアラインメント処理、同位体ピークの除去、サンプル間のピーク強度補正、ノイズの除去、を行って1,450成分の分析データを取得する、というものである。尚、サンプル間のピーク強度補正の方法は特に限定されないが、pooled QC法を用いた補正が挙げられる。pooled QC法は、同一バッチ内の全てのサンプルから一定量を混合したpooled QCと呼ばれるサンプルを作製し、各サンプルの合間に一定の頻度(5~9回に1回程度)でpooled QCの分析を実施することにより、「各サンプルを分析していた際にQCサンプルを分析していたと仮定するとそれぞれのピーク強度はどうなるか」という推定値を計算し、その値で補正するという処理を行って各サンプル間の感度の補正を行うものである。なお、データの補正方法が収量との相関性および予測モデルの性能に大きく影響することはない。
【0031】
また、取得した1,450成分の分析データと対応する収量データ(乾燥子実質量)との相関解析を行った結果(各成分の分析データのピーク面積と収量との単相関係数r及び無相関の検定によりp値を算出)、一定の成分は収量と有意に相関することが示された(後記表4a~4s参照)。
【0032】
したがって、1,450成分のうち、本発明における分析対象成分としては、収量との相関が有意(p<0.05)かつ相関係数の絶対値|r|>0.51である成分、すなわち成分No.1、12、17、20、34、48、52、58、60、61、68、71、72、74、83、84、85、90、92、101、107、109、110、115、117、118、129、132、133、136、143、160、164、170、171、172、178、179、181、184、189、191、193、196、198、203、206、210、218、235、237、249、255、257、282、283、291、294、297、298、310、312、315、318、330、331、345、346、348、355、360、361、362、373、384、386、388、392、395、406、408、411、412、440、444、449、452、454、455、457、461、470、482、501、505、513、521、530、535、541、542、546、548、565、571、574、579、589、607、610、612、616、634、646、648、656、660、662、701、708、710、716、731、732、740、743、749、750、753、757、760、761、767、768、774、777、783、785、787、788、792、794、795、803、808、809、815、823、824、825、835、845、846、853、854、856、862、863、864、865、869、874、875、876、877、879、886、888、893、895、904、905、909、916、921、922、929、933、934、938、939、942、945、947、951、966、967、968、970、971、983、987、988、994、995、998、1003、1005、1008、1009、1010、1013、1017、1018、1021、1027、1031、1035、1038、1039、1040、1047、1052、1061、1067、1068、1069、1072、1077、1085、1094、1096、1106、1118、1121、1126、1127、1132、1134、1143、1153、1159、1181、1183、1186、1194、1198、1199、1209、1213、1217、1218、1232、1237、1238、1239、1242、1244、1254、1264、1275、1278、1279、1284、1292、1295、1308、1312、1314、1315、1318、1320、1330、1331、1334、1337、1338、1339、1345、1346、1350、1355、1362、1408、1412、1415、1418、1419、1442、1444及び1446から選ばれる1種以上を含むのが好ましい。なお、上記成分は、後述のVIP値が概ね0.69以上であり、1.20以上であれば、相関係数の絶対値|r|>0.51であった。
【0033】
さらに1,450成分のうち、本発明における分析対象成分としては、収量との相関が有意(p<0.05)かつ相関係数の絶対値|r|>0.66である成分、すなわち成分No.12、20、34、48、58、61、85、101、109、115、132、133、172、184、193、198、206、255、282、283、312、330、331、346、348、355、361、386、449、461、482、505、542、589、662、731、760、761、783、785、787、815、824、825、874、875、886、929、934、994、1005、1009、1039、1040、1067、1068、1085、1143、1181、1183、1186、1209、1232、1244、1279、1284、1337、1346、1350及び1355から選ばれる1種以上を含むのが好ましい。
【0034】
表1a~1jでは、1,450の成分を質量分析により得られる精密質量で規定しているが、これらの精密質量データから化合物の組成式を推定することができる。また、分析時に同時に取得しているMS/MSデータからは、化合物の部分構造情報が得られる。よって、組成式と部分構造情報から、対象の成分を推定することができ、更に試薬との比較が可能なものについては同定することができる。
【0035】
例えば、解析の結果、No.12は組成式C5H7NO3のピログルタミン酸、No.20は組成式C4H8N2O3のL-アスパラギン、No.48は組成式C12H16、No.132は組成式C12H20O2のクロクサチンG、No.184は組成式C12H20O3のククルビン酸、No.210は組成式C13H18O3、No.346は組成式C16H12O4、No.355は組成式C12H14O7、No.386は組成式C14H20N4O2、No.461は組成式C8H14N3O7Pの5-アミノイミダゾールリボヌクレオチド、No.731は組成式C22H24O5、No.886は組成式C18H25N5O6、No.929は組成式C17H22O12、No.1183は組成式C31H33NO7であると推定した。
【0036】
このうち、本発明における分析対象成分として、好ましくは、例えピログルタミン酸、L-アスパラギン、クロクサチンG、ククルビン酸、5-アミノイミダゾールリボヌクレオチド等が挙げられる。
【0037】
コムギの収量の予測手段としては、上記1,450の成分、好ましくは収量との相関が有意(p<0.05)かつ相関係数の絶対値|r|>0.51である成分、より好ましくは有意(p<0.05)かつ相関係数の絶対値|r|>0.66である成分の存在量(例えば相関係数が-0.801である精密質量m/z277.1657のピーク面積)を、予測したいコムギ葉サンプルについても測定し、既知の収量と測定したピーク面積との相関関係から収量を予測することが挙げられる。
【0038】
また、上記1,450成分の分析データから複数を使用し、多変量解析手法を用いて構築された収量予測モデルと照合することにより、収量を予測することができる。
すなわち、播種から所定期間経過後のコムギの葉サンプルを採取し、分析サンプルを得、該分析サンプルを機器分析に供して機器分析データを得、該機器分析データを、収量予測モデルと照合することにより、当該コムギの収量を予測することができる。
【0039】
収量予測モデルは、説明変数に各精密質量をもった補正済みの成分の分析データのピーク面積値を、また目的変数に収量値を用いた回帰分析を行うことにより構築できる。回帰分析法としては、例えば主成分回帰分析、PLS(Partial least squares projection to latent structures)回帰分析、OPLS(Orthogonal projections to latent structures)回帰分析、一般化線形回帰分析の他、バギング、サポートベクターマシン、ランダムフォレスト、ニューラルネットワーク回帰分析等の機械学習・回帰分析手法等の多変量回帰分析手法が挙げられる。このうち、PLS法、PLS法の改良版であるOPLS法、或いは機械学習・回帰分析手法を用いるのが好ましい。OPLS法は、PLS法に比べ予測性は同じだが、解釈のための視覚化がより容易になる点が今回のような目的においては優れている。PLS法及びOPLS法は、共に高次元のデータから情報を集約し少数の潜在変数に置き換え、その潜在変数を用いて目的変数を表現する方法である。潜在変数の数を適切に選ぶことが重要であり、潜在変数の数を決めるのによく利用されるのがクロスバリデーション(交差検証)である。すなわち、モデル構築用データをいくつかのグループに分割し、あるグループをモデル検証に、その他のグループをモデル構築に用いて予測誤差を見積り、この作業を、グループを入れ替えながら繰り返して、予測誤差の合計が最小となる潜在変数の数が選ばれる。
【0040】
予測モデルの評価は、主に2つの指標で判断される。1つは予測精度を表すR2、もう1つは予測性を表すQ2である。R2は予測モデル構築に使用したデータの実測値とモデルで計算した予測値との相関係数の2乗であり、1に近いほど予測精度が高いことを示している。一方、Q2は、上記クロスバリデーションの結果であり、実測値と、繰り返し実施したモデル検証の結果である予測値との相関係数の2乗を表している。本発明のコムギ収量予測モデルにおいては、Q2>0.50をモデル評価の基準とするのが好ましい。なお、常にR2>Q2となるため、Q2>0.50は同時にR2>0.50を満たすこととなる。
以下に、上記1,450成分の分析データのピーク面積値と、子実収量を用いた種々のコムギ収量予測モデルを作成しその精度を検証した結果を示す。
【0041】
(1)全ての成分情報を用いた収量予測モデルの構築
1データ当り1,450個の成分の分析データのピーク面積値と収量値を持つ全23個のデータマトリックスからOPLSモデルを構築した。なお、構築の際は、各成分の分析データのピーク面積値及び収量データはオートスケーリングにより平均0、分散1に変換した。
上記モデルではVIP(Variable Importance in the Projection,投影における変数重要性)値とよばれる各成分に与えられるモデル性能への寄与度が算出される。
VIP値は、下記式1により求められる。
【0042】
【0043】
VIP値はその値が大きいほどモデルへの寄与度が大きく、相関係数の絶対値とも相関する。VIP値上位500位までのリストを後記表5a~5gに示す。
【0044】
(2)VIP値を指標としたモデル構築
(2-1)VIP値上位500位までの成分の分析データを用いたモデル
VIP値上位500位までのすべての成分を選択し、1データ当り該500個の成分の分析データのピーク面積値と収量値を持つ全23個のデータマトリックスからOPLSモデルを構築した。なお、構築の際は、各成分の分析データのピーク面積値及び収量データはオートスケーリングにより平均0、分散1に変換した。R2=0.59、Q2=0.503であり、高い予測性を持つモデルといえる。
【0045】
(2-2)VIP値上位500位までの成分のうちVIP値が下位の成分の分析データを用いたモデル
VIP値11位以下500位までのすべての成分の分析データ、21位以下500位までのすべての成分の分析データ、31位以下500位までのすべての成分の分析データ・・・及び61位以下500位までのすべての成分の分析データを用いてOPLS法によりモデル(
図2)を構築した。
Q
2>0.5を満たすのは11位以下500位までのすべての成分の分析データ~31位以下500位までのすべての成分の分析データを用いたモデルである。VIP値41位以下500位までのすべての成分の分析データを用いてもQ
2>0.50とはならない。
【0046】
(2-3)VIP値上位10位までの成分の分析データを8個用いたモデル
VIP値上位1位から10位までの成分の分析データの内、任意の8個の組み合わせ(45通り)についてOPLS法によりモデル(
図3)を構築した。
いずれのモデルにおいてもQ
2>0.50を満たす。
【0047】
(2-4)VIP値上位10位までの成分の分析データを9個用いたモデル
VIP値上位1位から10位までの成分の分析データの内、任意の9個の組み合わせ(10通り)についてOPLS法によりモデル(
図4)を構築した。
いずれのモデルにおいてもQ
2>0.50を満たす。
【0048】
予測に用いる成分数は、簡便に予測を行う場合には、成分数が少ない方が好適であり、例えば、10個以下であり、好ましくは5個以下、より好ましくは3個以下、最も好ましくは1個である。また、精度を高めたい場合には、成分数が多い方が好適であり、例えば、11個以上、好ましくは20個以上、より好ましくは50個以上、さらに好ましくは90個以上、最も好ましくは150個以上である。少ない成分数にて予測する場合は、VIP値上位の成分または相関係数のより高い成分を予測に用いることが好ましい。
【0049】
VIP値上位の成分は、例えば、VIP値上位500個から選択される少なくとも1個の成分であり、好ましくはVIP値上位500個から選択される少なくとも5個の成分であり、より好ましくはVIP値上位500個から選択される少なくとも10個の成分であり、さらに好ましくはVIP値上位10個から選択される少なくとも1個の成分であり、さらに好ましくはVIP値上位10個から選択される少なくとも5個の成分であり、さらに好ましくはVIP値上位10個から選択される少なくとも8個の成分であり、さらに好ましくはVIP値上位10個から選択される少なくとも9個の成分であり、さらに好ましくはVIP値上位500個の成分である。
【0050】
本発明の態様及び好ましい実施態様を以下に示す。
<1>コムギから採取された葉サンプルから1以上の成分の分析データを取得し、当該データとコムギ収量との相関性を利用してコムギの収量を予測する、コムギの収量予測方法。
<2>前記1以上の成分の分析データをpooled QC法により補正する、<1>に記載の方法。
<3>前記成分が、質量分析により提供される精密質量(m/z)が104~1178である成分から選ばれる1種以上である、<1>又は<2>に記載の方法。
<4>前記成分が、質量分析により提供される精密質量(m/z)で規定された、前記表1a~1iに記載の成分から選ばれる1種以上である、<1>又は<2>に記載の方法。
<5>成分が、前記表1a~1jに記載の成分No.1、5、7、12、14、17、20、24、27、29、34、41、46、47、48、52、58、60、61、64、68、70、71、72、74、83、84、85、90、92、98、101、106、107、109、110、111、115、117、118、125、129、131、132、133、136、143、144、145、155、160、162、163、164、169、170、171、172、178、179、180、181、183、184、186、189、191、192、193、196、198、199、203、204、206、210、214、216、218、225、227、231、233、235、237、244、250、255、256、264、266、271、282、283、286、291、292、294、297、298、308、310、312、315、318、323、329、330、331、334、338、345、346、348、349、355、357、358、360、361、373、374、381、384、385、386、388、392、393、395、399、406、408、411、412、422、428、429、431、436、437、439、440、444、449、454、455、457、461、468、470、482、497、501、502、505、507、509、513、517、521、526、528、530、531、535、541、542、543、545、546、547、548、554、562、565、568、571、574、584、586、588、589、591、592、596、599、601、607、609、610、612、616、619、623、625、627、631、634、637、638、640、642、643、644、646、648、649、651、653、654、655、656、660、662、665、671、672、674、675、680、683、684、686、690、698、701、708、710、711、713、716、717、718、720、722、723、726、731、732、736、740、742、743、745、749、750、753、757、760、761、763、764、765、768、774、777、778、781、783、784、785、786、787、788、792、793、795、796、801、803、805、808、809、815、817、819、823、824、825、826、834、835、845、846、853、854、856、857、862、864、865、869、874、875、876、877、879、886、888、893、898、899、901、902、904、905、909、916、922、924、925、929、932、933、934、935、937、938、939、941、942、945、947、950、951、957、958、961、963、967、968、970、971、974、978、979、983、987、988、989、991、994、995、998、1005、1007、1008、1009、1010、1013、1017、1018、1021、1026、1027、1029、1031、1035、1038、1039、1040、1041、1043、1046、1047、1052、1060、1061、1064、1067、1068、1069、1072、1074、1076、1077、1085、1087、1094、1096、1103、1106、1110、1114、1116、1121、1123、1126、1127、1130、1132、1134、1142、1143、1146、1147、1148、1149、1153、1157、1159、1177、1179、1181、1182、1183、1184、1185、1186、1188、1193、1194、1195、1198、1199、1200、1206、1209、1210、1213、1215、1217、1218、1219、1226、1227、1232、1237、1238、1239、1240、1242、1244、1246、1249、1250、1251、1254、1257、1262、1264、1274、1275、1278、1279、1281、1284、1287、1292、1295、1296、1308、1312、1314、1315、1318、1320、1328、1330、1331、1334、1335、1336、1337、1338、1339、1342、1344、1345、1346、1349、1350、1351、1354、1355、1362、1370、1381、1396、1400、1403、1406、1408、1409、1410、1411、1413、1414、1415、1417、1418、1419、1423、1441、1442、1444、1445、1446及び1450から選ばれる1種以上である<4>に記載の方法。
<6>成分が、前記表1a~1jに記載の成分No.1、12、17、20、34、48、52、58、60、61、68、71、72、74、83、84、85、90、92、101、107、109、110、115、117、118、129、132、133、136、143、160、164、170、171、172、178、179、181、184、189、191、193、196、198、203、206、210、218、235、237、249、255、257、282、283、291、294、297、298、310、312、315、318、330、331、345、346、348、355、360、361、362、373、384、386、388、392、395、406、408、411、412、440、444、449、452、454、455、457、461、470、482、501、505、513、521、530、535、541、542、546、548、565、571、574、579、589、607、610、612、616、634、646、648、656、660、662、701、708、710、716、731、732、740、743、749、750、753、757、760、761、767、768、774、777、783、785、787、788、792、794、795、803、808、809、815、823、824、825、835、845、846、853、854、856、862、863、864、865、869、874、875、876、877、879、886、888、893、895、904、905、909、916、921、922、929、933、934、938、939、942、945、947、951、966、967、968、970、971、983、987、988、994、995、998、1003、1005、1008、1009、1010、1013、1017、1018、1021、1027、1031、1035、1038、1039、1040、1047、1052、1061、1067、1068、1069、1072、1077、1085、1094、1096、1106、1118、1121、1126、1127、1132、1134、1143、1153、1159、1181、1183、1186、1194、1198、1199、1209、1213、1217、1218、1232、1237、1238、1239、1242、1244、1254、1264、1275、1278、1279、1284、1292、1295、1308、1312、1314、1315、1318、1320、1330、1331、1334、1337、1338、1339、1345、1346、1350、1355、1362、1408、1412、1415、1418、1419、1442、1444及び1446から選ばれる1種以上である<4>に記載の方法。
<7>成分が、前記表1a~1jに記載の成分No.12、20、34、48、58、61、85、101、109、115、132、133、172、184、193、198、206、255、282、283、312、330、331、346、348、355、361、386、449、461、482、505、542、589、662、731、760、761、783、785、787、815、824、825、874、875、886、929、934、994、1005、1009、1039、1040、1067、1068、1085、1143、1181、1183、1186、1209、1232、1244、1279、1284、1337、1346、1350及び1355から選ばれる1種以上である<4>に記載の方法。
<8>成分が、ピログルタミン酸、L-アスパラギン、クロクサチンG、ククルビン酸及び5-アミノイミダゾールリボヌクレオチドから選ばれる1種以上を含む、<4>に記載の方法。
<9>葉サンプルが、出芽期から出穂期のコムギから採取される、<1>~<8>のいずれかに記載の方法。
<10>葉サンプルが、5葉齢期から幼穂形成期のコムギから採取される、<1>~<8>のいずれかに記載の方法。
<11>分析データが、質量分析データである<1>~<10>のいずれかに記載の方法。
<12>葉サンプルから取得された成分の分析データを、前記表1a~1jに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位500個の中から少なくとも1個の成分の分析データを用いて構築された収量予測モデルと照合する工程を含む、<4>~<11>のいずれかに記載の方法。
<13>収量予測モデルが、前記表1a~1iに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位500個の中から少なくとも5個を用いる、<12>に記載の方法。
<14>収量予測モデルが、前記表1a~1iに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位500個の中から少なくとも10個を用いる、<12>に記載の方法。
<15>収量予測モデルが、前記表1a~1iに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位10個の中から少なくとも1個を用いる、<12>に記載の方法。
<16>収量予測モデルが、前記表1a~1iに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位10個の中から少なくとも5個を用いる、<12>に記載の方法。
<17>収量予測モデルが、前記表1a~1jに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位10個の中から少なくとも8個を用いる、<12>に記載の方法。
<18>収量予測モデルが、前記表1a~1jに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位10個の中から少なくとも9個を用いる、<12>に記載の方法。
<19>収量予測モデルが、前記表1a~1jに記載の成分情報を用いて構築された収量予測モデルから算出されたVIP値の上位500個を用いる、<12>に記載の方法。
<20>収量予測モデルが、OPLS法を用いて構築されたモデルである<12>~<19>のいずれかに記載の方法。
<21>精密質量が小数点以下4桁以上の精度にて測定されたものである<1>~<20>のいずれかに記載の方法。
【実施例】
【0051】
1.栽培試験
2019年に実施した屋内ポット栽培試験データについて詳述する。
中期肥効型培土(タキイ含水セル培土、タキイ種苗株式会社)とバーミキュライト(あかぎ園芸株式会社)を体積比1:1で混合し、当該土壌をポリポット(直径10.5cm、高さ9cm)に充填した。栽培は屋内で行い、栽培条件は、明期12時間、25℃、LED光源、光量400~440μmol/m2/sとし、一般的な春まきコムギの栽培に相当する条件で栽培を行った。播種から14日後に、1ポットあたり1植物となるように間引きを行った。水やりは、ポットの下に置いたバットの水がなくなった後に、新たにポットの下部5cm程度が浸かる量の水をバットに加えることで行った。
ポットあたり1gを基本施肥量と設定し、窒素、リンおよびカリウムを肥料成分として含む化成肥料(商品名「化成肥料14号」株式会社サンアンドホープ)を土壌に混和した。上記基本施肥量1/2倍量及び2倍量、4倍量の条件も設定することで、計4種類の施肥条件での栽培を行った。各施肥条件6ポットずつ、計24ポットを用意した。2019年10月30日に3粒播きで各ポット内2カ所に播種した(1ポットあたり6粒使用)。なお、品種は、「農林61号」を用いた。播種14日後に1ヵ所につき1本に間引きし、各ポット2株立てとした。サンプリングは11月27日に行った。収穫は2020年1月8日に実施した(播種後70日)。なお、1個体が欠株したため、収量予測には計23個体を用いた。
【0052】
2.葉のサンプリング
葉のサンプリングは、播種後27日後となる日の日中に実施した(おおむね13時―15時)。この際のコムギの生育ステージは、個体により若干異なるが概ね個体あたりの葉の数が12-15枚程度であり、生育ステージでは茎立期に相当した。葉のサンプリングは、株の根元から葉を4-7枚切断することによって採取した。採取時には株全体から偏りなく採取するようにした。採取した葉はアルミホイルで包み直ちに液体窒素中で凍結し、代謝反応を停止させた。凍結サンプルは凍結状態を維持したまま実験室へ持ち帰り、凍結乾燥にかけて乾燥させた。この乾燥したサンプルを後述の抽出操作に供試した。
【0053】
3.最終的な子実収量の測定
播種後70日である2020年1月8日に収穫を行った。栽培試験後の各個体から全子実を回収し、90℃にて3日間乾燥させた。収量データとして、乾燥子実質量(mgDW/個体)を測定した。後述する各成分の分析データと収量との単相関解析及び予測モデルの構築には乾燥子実質量(gDW/個体)を用いた。乾燥子実質量のデータは、表2に示すように最小で0.4gDW/個体、最大で4.9gDW/個体であった。
【0054】
【0055】
4.採取した葉の成分の抽出
凍結乾燥した葉サンプルは、スパーテルを用いて手作業にて可能な限り粉砕をおこなった。粉砕後、2mLのチューブ(セーフロックチューブ,エッペンドルフ)に10mgを秤量し、直径5mmのジルコニア製ボール1つをチューブに加えて、ビーズ粉砕機(MM400,Retsch)にて25Hzで1分間粉砕した。抽出溶媒は、内部標準としてリドカイン(和光純薬工業,♯120-02671)を500ng/mLとなるように加えた80v/v%メタノール水溶液を用いた。粉砕後のチューブに調製した抽出溶媒を1mL添加し、同ビーズ粉砕機にて、20Hzで5分間ホモジナイズ抽出をおこなった。抽出終了後、2,000×g程度の卓上遠心機(チビタン)にて、30秒程度遠心し、0.45μmの親水性PTFEフィルター(DISMIC-13HP 0.45μm syringe filter,ADVANTEC)でろ過し、分析サンプルを得た。
【0056】
5.LC/MSによる葉サンプルの分析
葉抽出サンプルの分析は、Agilent社製HPLCシステム(Infinity1260シリーズ)をフロントとし、AB SCIEX社製Q-TOFMS装置(TripleTOF4600)を検出器として用いてLC/MS分析をおこなった。HPLCにおける分離カラムには、(株)資生堂社製のコアシェルカラムCapcell core C18(2.1mm I.D.×100mm,粒子計2.7μm)及びガードカラム(2.1mm I.D.×5mm, 粒子計2.7μm)を使用し、カラム温度は40℃に設定した。オートサンプラーは分析中5℃を保持した。分析サンプルは5μLを注入した。溶離液にはA:0.1v/v%ギ酸水溶液及びB:0.1v/v%ギ酸アセトニトリル溶液を用いた。グラジエント溶出条件は、0分~0.1分は1v/v%B(99v/v%A)で保持し、0.1分~13分の間に1v/v%Bから99.5v/v%Bまで溶離液Bの比率を上昇させ、13.01分~16分まで99.5v/v%Bで保持した。流速は0.5mL/minとした。
【0057】
質量分析装置条件は、イオン化モードをポジティブモードとし、イオン化法はESIを用いた。本分析系では、溶出してくるイオンをTOFMSにより0.1秒間スキャンし、その中の強度の大きいイオンを10個選択し、それぞれを0.05秒間MS/MSにかけるというサイクルを繰り返しながら、TOFMSスキャンによる分子イオン情報(精密質量, m/z)とMS/MSスキャンにより生じるフラグメントに由来する構造情報を取得した。質量測定範囲はTOFMSがm/z 100-1,250、MS/MSがm/z 50-1,250に設定した。各スキャンのパラメータはTOFMSスキャンについては、GS1=50、GS2=50、CUR=25、TEM=450、ISVF=5500、DP=80及びCE=10に設定し、MS/MSスキャンについては、GS1=50、GS2=50、CUR=25、TEM=450、ISVF=5500、DP=80、CE=30、CES=15、IRD=30及びIRW=15に設定した。
【0058】
6.データ行列の作成
データ処理は下記の通りおこなった。まず、MarkerViewTM Software(AB SCIEX)を用いてピークの抽出をおこなった。ピーク抽出条件(「peak finding option」)は、保持時間0.5分~16分に該当するピークとし、「Enhance Peak Finding」の項目におけるSubtraction offsetを20スキャン、Minimum spectral peak
widthを5ppm、Subtraction multi. Factorを1.2、Minimum RT peak widthを10スキャン、Noise thresholdを5に設定し、「More」の項目におけるAssign charge stateにチェックを入れた。その結果、31,649のピーク情報を得た。
【0059】
次に、検出したピークを分析した各サンプル間で整列化させるアラインメント処理をおこなった。アラインメントの処理条件(「Alighmment & Filtering」)は、「Alignment」の項目におけるRetention time toleranceを0.20分及びMass toleranceを10.0ppmに設定した。また「Filtering」の項目におけるIntensity thresholdを10、Retention time filteringにチェックを入れ、Remove peaks in<3サンプルとし、Maximum number of peaksを50,000に設定した。「Internal standards」の項目においてリドカインのピークを用いて保持時間の補正をおこなった。
【0060】
次に同位体ピークの除去をおこなった。同位体ピークはピーク抽出の時点でソフトウェアが自動で認識し、ピークリスト上で「isotopic」のラベルが付けられているため、「isotopic」でソートして該当ピークを削除した。その結果、ピークは25,895ピークに減少した。
【0061】
次に、サンプル間のピーク強度補正をおこなった。今回の分析では、サンプルの他に、すべてのサンプルから一定量を混合したpooled QCと呼ばれるサンプルを作製し、6回に1回の頻度でpooled QCの分析を実施した。これらの全QC分析結果から、「各サンプルを分析していた際にQCサンプルを分析していたと仮定するとそれぞれのピーク強度はどうなるか」という推定値を計算し、その値で補正するという処理を実施し、同一バッチ内における各サンプル間の感度の補正をおこなった。なお、本処理は、理研が提供しているフリーソフト(LOWESS-Normalization-Tool)を用いた。最後に、測定した8個のQC分析データを用いて10,895ピークの相対標準偏差(RSD)を計算し、RSD>30%となるばらつきの大きいピークを除去し、最終的に1,450のピークデータ、すなわち1,450成分の分析データを得た。得られた分析データを表3a~3sに示す。これらのデータを用いて、以降の解析をおこなった。
【0062】
【0063】
【0064】
【0065】
【0066】
【0067】
【0068】
【0069】
【0070】
【0071】
【0072】
【0073】
【0074】
【0075】
【0076】
【0077】
【0078】
【0079】
【0080】
【0081】
7.相関解析
取得した23個体分の葉中1,450成分の分析データと対応する収量データ(乾燥子実質量)、すなわち23×1,450のマトリックスデータを用いて相関解析をおこなった。各成分の分析データと収量データとの単相関係数r及び無相関の検定によりp値を算出した。結果を表4a~4sに示す。なお、表中の「成分No.」は1,450個の成分を質量順に並べた際に質量数が小さい方から番号を付けた便宜的なものである。また、分析結果には質量情報とともに保持時間の情報も含まれるが、特開2016-57219号公報によれば、少数点以下4桁以上の精密質量数を用いれば、保持時間によらず複数の質量分析用試料間で質量分析データの比較及び解析が可能であることが示されている。よって、保持時間の情報は除去し、精密質量情報のみを記載した。
【0082】
【0083】
【0084】
【0085】
【0086】
【0087】
【0088】
【0089】
【0090】
【0091】
【0092】
【0093】
【0094】
【0095】
【0096】
【0097】
【0098】
【0099】
【0100】
【0101】
相関解析で得られた結果により、一定の相関係数を持つ成分は収量と有意に相関することが示された。相関係数の絶対値|r|>0.51となる成分は281個、|r|>0.66となる成分は70個であることがわかった。
【0102】
8.モデル構築・評価
2つ以上の複数の成分の分析データを用いた収量予測モデルの構築には多変量解析手法を用い、解析ツールとしてSIMCA ver.14(Umetrics)を用いた。予測モデルは、説明変数に各精密質量をもった補正済みの成分の分析データのピーク面積値を、また目的変数に収量値を用いた回帰分析をおこなった。回帰分析はPLS法の改良版であるOPLS法でおこなった。
【0103】
予測モデルの評価方法は、主に2つの指標で判断される。1つは予測精度を表すR2、もう1つは予測性を表すQ2である。R2は予測モデル構築に使用したデータの実測値とモデルで計算した予測値との相関係数の2乗であり、1に近いほど予測精度が高いことを示している。一方、Q2は、上記クロスバリデーションの結果であり、実測値と繰り返し実施したモデル検証の結果である予測値との相関係数の2乗を表している。予測の観点から、少なくともQ2>0.50であれば、そのモデルは良好な予測性を持つとされていることから(Triba, M. N. et al., Mol. BioSyst. 2015, 11, 13-19.)、Q2>0.50をモデル評価の基準とした。なお、常にR2>Q2となるため、Q2>0.50は同時にR2>0.50を満たすこととなる。
【0104】
8-1.全データを用いたモデルの構築・評価
1データ当り1,450個の成分の分析データのピーク面積値と収量値を持ち、全23個のデータマトリックスから、収量を予測するOPLSモデルを構築した。構築の際、各成分の分析データのピーク面積値及び収量データはオートスケーリングにより平均0、分散1に変換した。モデル構築の結果、予測精度を示すR2=0.931、予測性を示すQ2=0.344であり、Q2>0.50の基準を満たさなかった。
【0105】
8-2.VIP値の算出
8-1で構築したモデルではVIP(Variable Importance in
the Projection,投影における変数重要性)値とよばれる各成分に与えられるモデル性能への寄与度が算出される。VIP値はその値が大きいほどモデルへの寄与度が大きく、相関係数の絶対値とも相関する。VIP値上位500位までのリストを表5a~5gに示す。
【0106】
【0107】
【0108】
【0109】
【0110】
【0111】
【0112】
【0113】
8-3.VIP値を指標としたモデル構築
8-1で構築したモデルへの各成分の寄与度であるVIP値のランキング(表5a~5g)を基に複数の成分でモデルを構築した。特に限定されるわけではないが、モデル性能の基準を便宜上Q2>0.50とした。
【0114】
8-3-1.VIP値が上位500位までの成分の分析データを用いたモデル
VIP値上位500位までのすべての成分を選択し、1データ当り該500個の成分の分析データのピーク面積値と収量値を持ち、全23個のデータマトリックスから、収量を予測するOPLSモデルを構築した。構築の際、各成分の分析データのピーク面積値及び収量データはオートスケーリングにより平均0、分散1に変換した。モデル構築の結果、予測精度を示すR
2=0.59、予測性を示すQ
2=0.50であった。結果を
図1に示す。この予測モデルにより、栽培1カ月程度の葉に含まれる成分組成を用いることで、高い予測性を持つモデルが構築でき、早期収量予測が可能であることが示された。
【0115】
8-3-2.VIP値上位500位までの成分のうちVIP値が下位の成分の分析データを用いたモデル
VIP値11位以下500位までのすべての成分の分析データ、21位以下500位までのすべての成分の分析データ、31位以下500位までのすべての成分の分析データ・・・及び61位以下500位までのすべての成分の分析データを用いてそれぞれOPLSモデルの構築をおこなった。その結果、Q
2>0.5を満たすのは11位以下500位までのすべての成分の分析データ~31位以下500位までのすべての成分の分析データを用いたモデルであり、より詳細に検討したところ、VIP値41位以下500位までのすべての成分の分析データを用いてもQ
2>0.50とはならないことがわかった(
図2)。
【0116】
8-3-3.VIP値上位10位までの成分の分析データを8個用いたモデル
VIP値上位1位から10位までの成分の分析データの内、任意の8個の組み合わせ(45通り)についてOPLSモデルの構築をおこなった。その結果、いずれのモデルにおいてもQ
2>0.50を満たすことがわかった。このことからVIP値上位10位までの代謝物を8個含んでいれば、一定の予測性を持つモデルが構築できることが示された(
図3)。
【0117】
8-3-4.VIP値上位10位までの成分の分析データを9個用いたモデル
VIP値上位1位から10位までの成分の分析データの内、任意の9個の組み合わせ(10通り)についてOPLSモデルの構築をおこなった。その結果、いずれのモデルにおいてもQ
2>0.50を満たすことがわかった。このことからVIP値上位10位までの代謝物を9個含んでいれば、一定の予測性を持つモデルが構築できることが示された(
図4)。