IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アピール テクノロジー インコーポレイテッドの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-12-23
(54)【発明の名称】植物生産物における感染の予測
(51)【国際特許分類】
   C12Q 1/6851 20180101AFI20221216BHJP
   C12Q 1/6869 20180101ALI20221216BHJP
   C12Q 1/686 20180101ALI20221216BHJP
   G06N 20/00 20190101ALI20221216BHJP
   G06N 3/02 20060101ALI20221216BHJP
   G16B 40/20 20190101ALI20221216BHJP
   C12N 15/29 20060101ALN20221216BHJP
【FI】
C12Q1/6851 Z
C12Q1/6869 Z
C12Q1/686 Z
G06N20/00
G06N3/02
G16B40/20
C12N15/29 ZNA
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022524917
(86)(22)【出願日】2020-11-05
(85)【翻訳文提出日】2022-06-23
(86)【国際出願番号】 US2020059215
(87)【国際公開番号】W WO2021092251
(87)【国際公開日】2021-05-14
(31)【優先権主張番号】62/930,999
(32)【優先日】2019-11-05
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】516027797
【氏名又は名称】アピール テクノロジー,インコーポレイテッド
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】ヴィルド,コーディ
(72)【発明者】
【氏名】ブレーデン,サバンナ
(72)【発明者】
【氏名】カールシューアー,マシュー
(72)【発明者】
【氏名】ペレス,ルイス
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA19
4B063QQ04
4B063QQ09
4B063QQ42
4B063QQ52
4B063QR08
4B063QR32
4B063QR35
4B063QR55
4B063QR63
4B063QS25
4B063QS32
4B063QX02
4B063QX10
(57)【要約】
同じソースの植物生産物の集合における感染尤度を予測する方法が開示される。植物生産物の部分集合が、植物生産物の集合から選択される。部分集合の各植物生産物について1つ又は複数の感染バイオマーカの発現レベル及び任意選択的に1つ又は複数のハウスキーピングバイオマーカの発現レベルが特定される。植物生産物の部分集合についてのバイオマーカ発現統計の集合が、部分集合の各植物生産物についての1つ又は複数の感染バイオマーカの特定された発現レベル及び任意選択的に1つ又は複数のハウスキーピングバイオマーカの発現レベルに基づいて特定される。次いで少なくとも部分的に植物生産物の部分集合の特定されたバイオマーカ発現統計の集合に基づいて、植物生産物の集合における感染尤度が予測される。
【特許請求の範囲】
【請求項1】
n個の同じソースの植物生産物の集合における感染尤度を予測する方法であって、nは10よりも大きい整数であり、前記方法は、
前記植物生産物の集合からm個の植物生産物の部分集合を選択することであって、mは1よりも大きく且つn/2よりも小さい整数である、選択することと、
前記部分集合の各植物生産物について1つ又は複数の感染バイオマーカの発現レベルを特定することと、
少なくとも前記部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの前記発現レベルに基づいて、前記植物生産物の部分集合についてのバイオマーカ発現統計の集合を特定することと、
少なくとも部分的に前記植物生産物の部分集合の前記バイオマーカ発現統計の集合に基づいて、前記植物生産物の集合における前記感染尤度を予測することと、
前記植物生産物の集合における前記予測感染尤度を返すことと、
を含む、方法。
【請求項2】
前記部分集合のうちの各植物生産物についての1つ又は複数のハウスキーピングバイオマーカの発現レベルを特定することを更に含み、前記植物生産物の部分集合についての前記バイオマーカ発現統計の集合は、少なくとも、前記部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの前記発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルに基づいて特定される、請求項1に記載の方法。
【請求項3】
前記植物生産物の集合における前記感染尤度を予測することは、
前記植物生産物の部分集合の前記バイオマーカ発現統計の集合を機械学習感染予測モデルに入力すること
を含み、前記機械学習感染予測モデルは、
少なくとも部分的に、複数のトレーニングサンプルを含むトレーニングデータセットに基づいて識別される複数のパラメータであって、各トレーニングサンプルは、同じソースの植物生産物の遡及集合と関連付けられ、
前記植物生産物の遡及集合からの植物生産物の部分集合のバイオマーカ発現統計の集合であって、前記バイオマーカ発現統計の集合は、前記植物生産物の部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの発現レベルに基づく、前記植物生産物の遡及集合からの植物生産物の部分集合のバイオマーカ発現統計の集合及び
前記植物生産物の遡及集合における既知の感染率
を含む、複数のパラメータと、
前記植物生産物の部分集合についての前記バイオマーカ発現統計の集合及び前記トレーニングデータセットに少なくとも部分的に基づいて識別される前記複数のパラメータに基づいて、前記機械学習感染予測モデルへの入力として受信される前記植物生産物の部分集合についての前記バイオマーカ発現統計の集合と前記機械学習感染予測モデルの出力として生成される前記植物生産物の集合における前記予測感染尤度との間の関係を表す関数と、
を含む、請求項2に記載の方法。
【請求項4】
前記部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの前記発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルに基づいて、前記植物生産物の部分集合についての前記バイオマーカ発現統計の集合を特定することは、
前記植物生産物の部分集合のうちの各植物生産物について、
前記1つ又は複数の感染バイオマーカの前記発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルに基づいて、前記1つ又は複数の感染バイオマーカの正規化発現レベルを特定することと、
前記1つ又は複数の感染バイオマーカの前記正規化発現レベルに基づいて、前記1つ又は複数の感染バイオマーカの特徴スケーリング発現レベルを特定することと、
前記部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの前記特徴スケーリング発現レベルに基づいて、前記植物生産物の部分集合についての前記バイオマーカ発現統計の集合を特定すること、
を含む、請求項2に記載の方法。
【請求項5】
前記1つ又は複数の感染バイオマーカの前記発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルに基づいて、前記1つ又は複数の感染バイオマーカの正規化発現レベルを特定することは、前記1つ又は複数の感染バイオマーカの前記発現レベルと前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルとの比率を特定することを含む、請求項4に記載の方法。
【請求項6】
前記1つ又は複数の感染バイオマーカの前記正規化発現レベルに基づいて、前記1つ又は複数の感染バイオマーカの特徴スケーリング発現レベルを特定することは、前記1つ又は複数の感染バイオマーカの前記正規化感染レベルの最小最大正規化及び対数変換のうちの少なくとも一方を実行することを含む、請求項4に記載の方法。
【請求項7】
前記部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの前記特徴スケーリング発現レベルに基づいて、前記植物生産物の部分集合についての前記バイオマーカ発現統計の集合を特定することは、
前記1つ又は複数の感染バイオマーカの前記特徴スケーリング発現レベルの平均、メジアン、最小、最大、標準偏差、5パーセンタイル、10パーセンタイル、15パーセンタイル、20パーセンタイル、25パーセンタイル、50パーセンタイル、75パーセンタイル、80パーセンタイル、90パーセンタイル、95パーセンタイル、及び99パーセンタイルの少なくとも1つを特定することと、
前記植物生産物の部分集合のうちの各植物生産物について、前記1つ又は複数の感染バイオマーカの少なくとも1つと前記特徴スケーリング発現レベルの前記1つ又は複数の感染バイオマーカの他の少なくとも1つの前記特徴スケーリング発現レベルとの比率及び前記1つ又は複数の感染バイオマーカの少なくとも1つの前記特徴スケーリング発現レベルと前記1つ又は複数の感染バイオマーカの他の少なくとも1つの前記特徴スケーリング発現レベルとの積を特定すること、
を含む、請求項4に記載の方法。
【請求項8】
n個の同じソースの植物生産物の集合における感染尤度を予測する方法であって、nは10よりも大きい整数であり、前記方法は、
前記植物生産物の集合からm個の植物生産物の部分集合を選択することであって、mは1よりも大きく且つn/2よりも小さい整数である、選択することと、
前記部分集合の前記m個の植物生産物をp個のサブグループに分割することであって、pは1よりも大きく且つmよりも小さい整数であり、前記p個のサブグループの各々は、前記部分集合のうちの前記植物生産物の少なくとも1つを含む、分割することと、
p個のサブグループの各々について、前記サブグループのうちの前記植物生産物の各々からの植物体を組み合わせて、プール植物体のグループを形成することであって、前記プール植物体のp個のグループは、プール植物体グループの集まりを形成する、植物体を組み合わせてグループを形成することと、
前記p個のプール植物体グループの各々について、1つ又は複数の感染バイオマーカの発現レベルを特定することと、
前記植物体グループの集まりの各プール植物体グループについての前記1つ又は複数の感染バイオマーカの前記発現レベルに基づいて、前記グループ植物体グループの集まりについてのバイオマーカ発現統計の集合を特定することと、
少なくとも部分的に前記プール植物体グループの集まりについての前記バイオマーカ発現統計の集合に基づいて、前記植物生産物の集合における前記感染尤度を予測することと、
前記植物生産物の集合における前記予測感染尤度を返すこと、
を含む、方法。
【請求項9】
前記p個のプール植物体グループの各々についての1つ又は複数のハウスキーピングバイオマーカの発現レベルを特定することを更に含み、前記p個のプール植物体グループの各々についての前記バイオマーカ発現統計の集合は、少なくとも部分的に、前記プール植物体グループの各々についての前記1つ又は複数の感染バイオマーカの前記発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルに基づいて特定される、請求項8に記載の方法。
【請求項10】
前記部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの前記発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルに基づいて、前記プール植物体グループの集まりについての前記バイオマーカ発現統計の集合を特定することは、
前記プール植物体グループの各々について、
前記1つ又は複数の感染バイオマーカの前記発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルに基づいて、前記1つ又は複数の感染バイオマーカの正規化発現レベルを特定することと、
前記1つ又は複数の感染バイオマーカの前記正規化発現レベルに基づいて、前記1つ又は複数の感染バイオマーカの特徴スケーリング発現レベルを特定することと、
前記プール植物体グループの各々についての前記1つ又は複数の感染バイオマーカの前記特徴スケーリング発現レベルに基づいて、前記プール植物体グループの集まりについての前記バイオマーカ発現統計の集合を特定すること、
を含む、請求項9に記載の方法。
【請求項11】
前記植物生産物の集合における前記感染尤度を予測することは、
前記プール植物体グループの集まりについての前記バイオマーカ発現統計の集合を機械学習感染予測モデルに入力すること
を含み、前記機械学習感染予測モデルは、
少なくとも部分的に、複数のトレーニングサンプルを含むトレーニングデータセットに基づいて識別される複数のパラメータであって、各トレーニングサンプルは、同じソースの植物生産物の遡及集合と関連付けられ、
前記植物生産物の遡及集合からの植物生産物の部分集合から形成されるプール植物体グループの集まりについてのバイオマーカ発現統計の集合であって、前記バイオマーカ発現統計の集合は、前記プール植物体グループの集まりの各プール植物体グループについての前記1つ又は複数の感染バイオマーカの発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの発現レベルに基づく、前記プール植物体グループの集まりについてのバイオマーカ発現統計の集合及び
前記植物生産物の遡及集合における既知の感染率
を含む、複数のパラメータと、
前記プール植物体グループの集まりについての前記バイオマーカ発現統計の集合及び前記トレーニングデータセットに少なくとも部分的に基づいて識別される前記複数のパラメータに基づいて、前記機械学習感染予測モデルへの入力として受信される前記プール植物体グループの集まりについての前記バイオマーカ発現統計の集合と前記機械学習感染予測モデルの出力として生成される前記植物生産物の集合における前記予測感染尤度との間の関係を表す関数と、
を含む、請求項9に記載の方法。
【請求項12】
前記機械学習感染予測モデルは、バイナリロジスティック回帰モデル、ロジスティックモデルツリー、ランダムフォレスト分類器、L2正則化、部分最小二乗分類、ナイーブベイズ分類器、多変量スパイン、1つ又は複数のニューラルネットワーク、及びk最近傍分類からなる群から選択される、請求項3又は11に記載の方法。
【請求項13】
前記機械学習感染予測モデルは、k最近傍分類及びランダムフォレスト分類器の一方を含み、前記機械学習感染予測モデルは、少なくとも90%の正解率、少なくとも80%の再現率、及び少なくとも80%の適合率の1つを有する少なくとも5%の閾値よりも大きいものとして、前記植物生産物の集合における前記感染尤度を予測する、請求項12に記載の方法。
【請求項14】
前記1つ又は複数の感染バイオマーカは表1から選択される、請求項1~13のいずれか1項に記載の方法。
【請求項15】
前記1つ又は複数のハウスキーピングバイオマーカは表2から選択される、請求項1~14のいずれか1項に記載の方法。
【請求項16】
前記1つ若しくは複数の感染バイオマーカ又は前記1つ若しくは複数のハウスキーピングバイオマーカの絶対発現レベルは、真正濃度標準、内部標準、又は既知の濃度の準備標準曲線を使用して特定される、請求項1~15のいずれか1項に記載の方法。
【請求項17】
前記植物生産物の集合における前記感染尤度を予測することは、6時間未満を要する、請求項1~16のいずれか1項に記載の方法。
【請求項18】
前記感染は真菌感染を含む、請求項1~17のいずれか1項に記載の方法。
【請求項19】
前記感染は、コレトトリカム属(Colletotrichum)(即ちC.グロエオスポリオイデス(C. gloeosporioides)、C.アキュテータム(C. acutatum))、ドチオレラ属(Dothiorella)(即ちD.イベリカ(D. iCerica)、D.グレガリア(D. gregaria)、D.アロマティカ(D. aromatica))、ネオフシコッカム属(Neofusicoccum)(即ちN.ルテウム(N. luteum)、N.パルバム(N. parvum)、N.アウストラーレ(N. australe))、ジアポルテ属(Diaporthe)(即ちD.ネオテイコラ(D. neotheicola)、D.シナモミ(D. cinnamomi))、ラシオディプロディア属(Lasiodiplodia)(即ちL.プセウドテオブロマ(L. pseudotheoCromae)、L.テオブロマ(L. theoCromae)、ディプロディア属(Diplodia)(即ちD. mutila, D. pseuodoseriata、D.セリアタ(D. seriata))、及びボトリスファエリア科(Cotryosphaeria)(即ちC.ドシデア(C. dothidea))からなる群から選択される1つ又は複数の病原体に起因する、請求項1~18のいずれか1項に記載の方法。
【請求項20】
前記感染は、軸腐病、かび病、又は導管/内部褐変症として現れる、請求項1~19のいずれか1項に記載の方法。
【請求項21】
前記植物生産物は収穫されている、請求項1~20のいずれか1項に記載の方法。
【請求項22】
前記植物生産物は未熟である、請求項1~21のいずれか1項に記載の方法。
【請求項23】
前記植物生産物は前記感染の可視症状を呈さない、請求項1~22のいずれか1項に記載の方法。
【請求項24】
前記植物生産物は、アボカド、ザクロ、カキ、リンゴ、ナシ、ブドウ、柑橘類、パパイヤ、サクランボ、メロン、グァバ、マンゴー、又は核果類を含む、請求項1~23のいずれか1項に記載の方法。
【請求項25】
植物生産物についてのバイオマーカの発現レベルを特定することは、前記植物生産物の外果皮、中果皮、及び内果皮の1つ又は複数から材料を抽出し、前記抽出された材料に対してバイオマーカ解析を実行し、前記バイオマーカの前記発現レベルを特定することを含む、請求項1~24のいずれか1項に記載の方法。
【請求項26】
各バイオマーカは小分子であり、各バイオマーカの前記発現レベルは、前記対応する小分子の定量化量を含む、請求項1~25のいずれか1項に記載の方法。
【請求項27】
各バイオマーカは遺伝子であり、各バイオマーカの前記発現レベルは、前記遺伝子に関連付けられたRNA配列の発現レベルを含む、請求項1~26のいずれか1項に記載の方法。
【請求項28】
前記遺伝子に関連付けられた前記RNA配列の前記発現レベルは、前記遺伝子に関連付けられた前記RNA配列のコピー数を含む、請求項27に記載の方法。
【請求項29】
1つ又は複数のバイオマーカの前記発現レベルは、qPCR、PCR、RT-PCR、リボ核酸(RNA)シーケンシング(RNA-seq)、タグ-seq、シーケンシングを使用したトランスポゼースアクセス可能クロマチンアッセイ(ATAC-esq)、CyTOF/SCoP、E-MS/ACseq、miRNA-seq、CITE-seq、質量分析(MS)、ガスクロマトグラフィ質量分析(GC-MS)、包括的二次元ガスクロマトグラフィ(GCxGC)、GCxGCと併せた固相マイクロ抽出(SPME)(SPME-GCxGC)、マトリックス支援レーザ脱離/イオン化(MALDI)、及びMALDI-TOFからなる群から選択される1つ又は複数の解析を実行することによって特定される、請求項1~28のいずれか1項に記載の方法。
【請求項30】
前記感染の予測尤度を返すことは、前記感染の予測尤度を閲覧ユーザに自動的に提示することを含む、請求項1~29のいずれか1項に記載の方法。
【請求項31】
前記感染の予測尤度に基づいて感染リスクがある前記同じソースの植物生産物の集合の1つ又は複数の植物生産物を識別することを更に含む請求項1~30のいずれか1項に記載の方法。
【請求項32】
前記感染の予測尤度に基づいて、前記同じソースの植物生産物の集合に対して抗菌剤投与を提供又は抗菌剤投与処理を処方することを更に含む請求項1~31のいずれか1項に記載の方法。
【請求項33】
前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合を選択的に収穫することを更に含む請求項1~32のいずれか1項に記載の方法。
【請求項34】
前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合についての品質保証を特定することを更に含む請求項1~33のいずれか1項に記載の方法。
【請求項35】
前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合についての消費者及び地理的行先の少なくとも一方を識別することを更に含む請求項1~34のいずれか1項に記載の方法。
【請求項36】
前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合へのエチレン処理を保留又は処方することを更に含む請求項1~35のいずれか1項に記載の方法。
【請求項37】
前記エチレン処理は、外因性エチレンの適用、エチレンブロッカーの適用、又はエチレン阻害剤の適用を含む、請求項36に記載の方法。
【請求項38】
前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合についての1つ又は複数の貯蔵条件を識別することを更に含み、前記貯蔵条件は貯蔵温度及び貯蔵湿度の少なくとも一方を含む、請求項1~37のいずれか1項に記載の方法。
【請求項39】
前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合に対して収穫後処理を提供することを更に含む請求項1~38のいずれか1項に記載の方法。
【請求項40】
前記方法は、前記感染の予測尤度に基づいてユーザに指示を提供することを更に含み、前記指示は、前記ユーザに請求項33~39のいずれか1項に記載のステップの1つ又は複数を実行するように指示する、請求項33~39のいずれか1項に記載の方法。
【請求項41】
コンピュータプログラム命令を記憶した非一時的コンピュータ可読記憶媒体であって、前記命令は、コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、
n個の同じソースの植物生産物の集合における感染尤度を予測すること
を行わせ、nは10よりも大きい整数であり、前記予測することは、
前記植物生産物の集合からm個の植物生産物の部分集合を選択することであって、mは1よりも大きく且つn/2よりも小さい整数である、選択することと、
前記部分集合の各植物生産物について1つ又は複数の感染バイオマーカの発現レベルを特定することと、
少なくとも前記部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの前記発現レベルに基づいて、前記植物生産物の部分集合についてのバイオマーカ発現統計の集合を特定することと、
少なくとも部分的に前記植物生産物の部分集合の前記バイオマーカ発現統計の集合に基づいて、前記植物生産物の集合における前記感染尤度を予測することと、
前記植物生産物の集合における前記予測感染尤度を返すこと、
を行うことによって行われる、非一時的コンピュータ可読記憶媒体。
【請求項42】
前記感染尤度を予測することは、前記部分集合のうちの各植物生産物についての1つ又は複数のハウスキーピングバイオマーカの発現レベルを特定することを更に含み、前記植物生産物の部分集合の前記バイオマーカ発現統計の集合は、少なくとも部分的に、前記部分集合のうちの各々についての前記1つ又は複数の感染バイオマーカの前記発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルに基づいて特定される、請求項41に記載の非一時的コンピュータ可読記憶媒体。
【請求項43】
前記植物生産物の集合における前記感染尤度を予測することは、
前記植物生産物の部分集合の前記バイオマーカ発現統計の集合を機械学習感染予測モデルに入力すること
を含み、前記機械学習感染予測モデルは、
少なくとも部分的に、複数のトレーニングサンプルを含むトレーニングデータセットに基づいて識別される複数のパラメータであって、各トレーニングサンプルは、同じソースの植物生産物の遡及集合と関連付けられ、
前記植物生産物の遡及集合からの植物生産物の部分集合のバイオマーカ発現統計の集合であって、前記バイオマーカ発現統計の集合は、前記植物生産物の部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの発現レベルに基づく、前記植物生産物の遡及集合からの植物生産物の部分集合のバイオマーカ発現統計の集合及び
前記植物生産物の遡及集合における既知の感染率
を含む、複数のパラメータと、
前記植物生産物の部分集合についての前記バイオマーカ発現統計の集合及び前記トレーニングデータセットに少なくとも部分的に基づいて識別される前記複数のパラメータに基づいて、前記機械学習感染予測モデルへの入力として受信される前記植物生産物の部分集合についての前記バイオマーカ発現統計の集合と前記機械学習感染予測モデルの出力として生成される前記植物生産物の集合における前記予測感染尤度との間の関係を表す関数と、
を含む、請求項42に記載の非一時的コンピュータ可読記憶媒体。
【請求項44】
前記機械学習感染予測モデルは、バイナリロジスティック回帰モデル、ロジスティックモデルツリー、ランダムフォレスト分類器、L2正則化、部分最小二乗分類、ナイーブベイズ分類器、多変量スパイン、1つ又は複数のニューラルネットワーク、及びk最近傍分類からなる群から選択される、請求項43に記載の非一時的コンピュータ可読記憶媒体。
【請求項45】
前記機械学習感染予測モデルは、k最近傍分類及びランダムフォレスト分類器の一方を含み、前記機械学習感染予測モデルは、少なくとも90%の正解率、少なくとも80%の再現率、及び少なくとも80%の適合率の1つを有する少なくとも5%の閾値よりも大きいものとして、前記植物生産物の集合における前記感染尤度を予測する、請求項44に記載の非一時的コンピュータ可読記憶媒体。
【請求項46】
前記部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの前記発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルに基づいて、前記植物生産物の部分集合についての前記バイオマーカ発現統計の集合を特定することは、
前記植物生産物の部分集合のうちの各植物生産物について、
前記1つ又は複数の感染バイオマーカの前記発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルに基づいて、前記1つ又は複数の感染バイオマーカの正規化発現レベルを特定することと、
前記1つ又は複数の感染バイオマーカの前記正規化発現レベルに基づいて、前記1つ又は複数の感染バイオマーカの特徴スケーリング発現レベルを特定することと、
前記部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの前記特徴スケーリング発現レベルに基づいて、前記植物生産物の部分集合についての前記バイオマーカ発現統計の集合を特定すること、
を含む、請求項42~45のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項47】
前記1つ又は複数の感染バイオマーカの前記発現レベル及び前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルに基づいて、前記1つ又は複数の感染バイオマーカの正規化発現レベルを特定することは、前記1つ又は複数の感染バイオマーカの前記発現レベルと前記1つ又は複数のハウスキーピングバイオマーカの前記発現レベルとの比率を特定することを含む、請求項46に記載の非一時的コンピュータ可読記憶媒体。
【請求項48】
前記1つ又は複数の感染バイオマーカの前記正規化発現レベルに基づいて、前記1つ又は複数の感染バイオマーカの特徴スケーリング発現レベルを特定することは、前記1つ又は複数の感染バイオマーカの前記正規化感染レベルの最小最大正規化及び対数変換のうちの少なくとも一方を実行することを含む、請求項46に記載の非一時的コンピュータ可読記憶媒体。
【請求項49】
前記部分集合のうちの各植物生産物についての前記1つ又は複数の感染バイオマーカの前記特徴スケーリング発現レベルに基づいて、前記植物生産物の部分集合についての前記バイオマーカ発現統計の集合を特定することは、
前記1つ又は複数の感染バイオマーカの前記特徴スケーリング発現レベルの平均、メジアン、最小、最大、標準偏差、5パーセンタイル、10パーセンタイル、15パーセンタイル、20パーセンタイル、25パーセンタイル、50パーセンタイル、75パーセンタイル、80パーセンタイル、90パーセンタイル、95パーセンタイル、及び99パーセンタイルの少なくとも1つを特定することと、
前記植物生産物の部分集合のうちの各植物生産物について、前記1つ又は複数の感染バイオマーカの少なくとも1つと前記特徴スケーリング発現レベルの前記1つ又は複数の感染バイオマーカの他の少なくとも1つの前記特徴スケーリング発現レベルとの比率及び前記1つ又は複数の感染バイオマーカの少なくとも1つの前記特徴スケーリング発現レベルと前記1つ又は複数の感染バイオマーカの他の少なくとも1つの前記特徴スケーリング発現レベルとの積を特定すること、
を含む、請求項46に記載の非一時的コンピュータ可読記憶媒体。
【請求項50】
前記植物生産物の集合における前記感染尤度を予測することは、6時間未満を要する、請求項42~49のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項51】
前記感染は真菌感染を含む、請求項42~50のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項52】
前記感染は、コレトトリカム属(Colletotrichum)(即ちC.グロエオスポリオイデス(C. gloeosporioides)、C.アキュテータム(C. acutatum))、ドチオレラ属(Dothiorella)(即ちD.イベリカ(D. iCerica)、D.グレガリア(D. gregaria)、D.アロマティカ(D. aromatica))、ネオフシコッカム属(Neofusicoccum)(即ちN.ルテウム(N. luteum)、N.パルバム(N. parvum)、N.アウストラーレ(N. australe))、ジアポルテ属(Diaporthe)(即ちD.ネオテイコラ(D. neotheicola)、D.シナモミ(D. cinnamomi))、ラシオディプロディア属(Lasiodiplodia)(即ちL.プセウドテオブロマ(L. pseudotheoCromae)、L.テオブロマ(L. theoCromae)、ディプロディア属(Diplodia)(即ちD. mutila, D. pseuodoseriata、D.セリアタ(D. seriata))、及びボトリスファエリア科(Cotryosphaeria)(即ちC.ドシデア(C. dothidea))からなる群から選択される1つ又は複数の病原体に起因する、請求項42~51のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項53】
前記感染は、軸腐病、かび病、又は導管/内部褐変症として現れる、請求項42~52のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項54】
前記植物生産物は収穫されている、請求項42~53のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項55】
前記植物生産物は未熟である、請求項42~54のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項56】
前記植物生産物は前記感染の可視症状を呈さない、請求項42~55のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項57】
前記1つ又は複数の感染バイオマーカは表1から選択される、請求項42~56のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項58】
前記1つ又は複数のハウスキーピングバイオマーカは表2から選択される、請求項42~57のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項59】
前記植物生産物は、アボカド、ザクロ、カキ、リンゴ、ナシ、ブドウ、柑橘類、パパイヤ、サクランボ、メロン、グァバ、マンゴー、又は核果類を含む、請求項42~58のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項60】
植物生産物についてのバイオマーカの発現レベルを特定することは、前記植物生産物の外果皮、中果皮、及び内果皮の1つ又は複数から材料を抽出し、前記抽出された材料に対してバイオマーカ解析を実行し、前記バイオマーカの前記発現レベルを特定することを含む、請求項42~59のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項61】
各バイオマーカは小分子であり、各バイオマーカの前記発現レベルは、前記対応する小分子の定量化量を含む、請求項42~60のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項62】
各バイオマーカは遺伝子であり、各バイオマーカの前記発現レベルは、前記遺伝子に関連付けられたRNA配列の発現レベルを含む、請求項42~61のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項63】
前記遺伝子に関連付けられた前記RNA配列の前記発現レベルは、前記遺伝子に関連付けられた前記RNA配列のコピー数を含む、請求項62に記載の非一時的コンピュータ可読記憶媒体。
【請求項64】
1つ又は複数のバイオマーカの前記発現レベルは、qPCR、PCR、RT-PCR、リボ核酸(RNA)シーケンシング(RNA-seq)、タグ-seq、シーケンシングを使用したトランスポゼースアクセス可能クロマチンアッセイ(ATAC-esq)、CyTOF/SCoP、E-MS/ACseq、miRNA-seq、CITE-seq、質量分析(MS)、ガスクロマトグラフィ質量分析(GC-MS)、包括的二次元ガスクロマトグラフィ(GCxGC)、GCxGCと併せた固相マイクロ抽出(SPME)(SPME-GCxGC)、マトリックス支援レーザ脱離/イオン化(MALDI)、及びMALDI-TOFからなる群から選択される1つ又は複数の解析を実行することによって特定される、請求項42~63のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項65】
前記感染の予測尤度を返すことは、前記感染の予測尤度を閲覧ユーザに自動的に提示することを含む、請求項42~64のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項66】
前記記憶されたコンピュータプログラム命令は、前記コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、前記感染の予測尤度に基づいて感染リスクがある前記同じソースの植物生産物の集合の1つ又は複数の植物生産物を識別する命令を返すことを更に行わせる、請求項42~65のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項67】
前記記憶されたコンピュータプログラム命令は、前記コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、前記感染の予測尤度に基づいて、前記同じソースの植物生産物の集合に対して抗菌剤投与を提供又は抗菌剤投与処理を処方する命令を返すことを更に行わせる、請求項42~66のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項68】
前記記憶されたコンピュータプログラム命令は、前記コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合を選択的に収穫する命令を返すことを更に行わせる、請求項42~67のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項69】
前記記憶されたコンピュータプログラム命令は、前記コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合についての品質保証を特定することを更に行わせる、請求項42~68のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項70】
前記記憶されたコンピュータプログラム命令は、前記コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合についての消費者及び地理的行先の少なくとも一方を識別することを更に行わせる、請求項42~69のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項71】
前記記憶されたコンピュータプログラム命令は、前記コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合へのエチレン処理を保留又は処方する命令を返すことを更に行わせる、請求項42~70のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項72】
前記エチレン処理は、エチレンブロッカー又は阻害剤の適用を含む、請求項71に記載の非一時的コンピュータ可読記憶媒体。
【請求項73】
前記記憶されたコンピュータプログラム命令は、前記コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合についての1つ又は複数の貯蔵条件を識別することを更に行わせ、前記貯蔵条件は貯蔵温度及び貯蔵湿度の少なくとも一方を含む、請求項42~72のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項74】
前記記憶されたコンピュータプログラム命令は、前記コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、前記感染の予測尤度に基づいて前記同じソースの植物生産物の集合に対して収穫後処理を提供する命令を返すことを更に行わせる、請求項42~73のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項75】
前記記憶されたコンピュータプログラム命令は、前記コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、前記感染の予測尤度に基づいてユーザに指示を提供することを更に行わせ、前記指示は、前記ユーザに請求項68~74のいずれか1項に記載のステップの1つ又は複数を実行するように指示する、請求項42~74のいずれか1項に記載の非一時的コンピュータ可読記憶媒体。
【請求項76】
植物生産物の潜伏感染を識別する方法であって、
1つ又は複数のコンピュータにより、植物生産物における1つ又は複数の感染バイオマーカの発現レベルを記述するデータを取得することと、
前記1つ又は複数のコンピュータにより、機械学習モデルに入力するために前記取得されたデータをデータ構造に符号化することと、
前記1つ又は複数のコンピュータにより、前記符号化データ構造の処理に基づいて前記植物生産物が潜伏感染を有する尤度を示す出力データを生成するようにトレーニングされた前記機械学習モデルへの入力として、符号化データ構造を提供することと、
前記1つ又は複数のコンピュータにより、前記植物生産物が潜伏感染を有する尤度を示す前記生成された出力データを取得することと、
前記1つ又は複数のコンピュータにより、前記生成された出力データに基づいて前記植物生産物が潜伏感染を有すると判断することと、
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行すること、
を含む方法。
【請求項77】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、1つ又は複数の他の同じソースの植物生産物に対して抗菌処理を処方すべきであると判断することを含む、請求項76に記載の方法。
【請求項78】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、1つ又は複数の同じソースの植物生産物に抗菌処理を投与することを含む、請求項76に記載の方法。
【請求項79】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、1つ又は複数の他の同じソースの植物生産物を輸送している車両を異なる行先にルート変更すべきであると判断することを含む、請求項76に記載の方法。
【請求項80】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、ユーザデバイスによって処理されたとき、前記ユーザデバイスに、前記車両を異なる行先にルート変更すべきであることを前記ユーザデバイスのユーザに通知するアラートを出力させるアラートメッセージを生成することと、
前記1つ又は複数のコンピュータにより、前記生成されたアラートを前記ユーザデバイスに送信すること、
を含む、請求項76に記載の方法。
【請求項81】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記出力データに基づいて、前記出力データに基づいて、ユーザデバイスにより処理されたとき、前記ユーザデバイスのユーザに、1つ又は複数の他の同じソースの植物生産物通知するアラートを出力させるアラートメッセージを生成することと、
前記1つ又は複数のコンピュータにより、前記アラートメッセージを前記ユーザデバイスに送信すること、
を含む、請求項76に記載の方法。
【請求項82】
前記植物生産物における1つ又は複数の感染バイオマーカの発現レベルを記述するデータは、1つ又は複数のバリアントのリストを含み、前記1つ又は複数のバリアントは、前記植物生産物のリード配列と健康な植物生産物の基準ゲノムとの間の差を記述する、請求項76に記載の方法。
【請求項83】
前記機械学習モデルは、バイナリロジスティック回帰モデル、ロジスティックモデルツリー、ランダムフォレスト分類器、L2正則化、部分最小二乗の1つ又は複数を含む、請求項76に記載の方法。
【請求項84】
前記植物生産物は、感染のいかなる可視兆候も含まない、請求項76に記載の方法。
【請求項85】
前記方法は、
前記1つ又は複数のコンピュータにより、前記植物生産物の集合からm個の植物生産物の部分集合を選択することであって、mは1よりも大きく且つn/2よりも小さい整数である、選択することと、
前記部分集合の各植物生産物について、前記1つ又は複数のコンピュータにより、1つ又は複数の感染バイオマーカの発現レベルを特定することと、
を更に含み、
前記1つ又は複数のコンピュータにより、植物生産物における1つ又は複数のバイオマーカの発現レベルを記述するデータを取得することは、
前記1つ又は複数のコンピュータにより、前記部分集合の各植物生産物について、前記1つ又は複数の感染バイオマーカの前記特定された発現レベルを記述するデータを取得することを含み、
前記1つ又は複数のコンピュータにより、機械学習モデルに入力するために前記取得されたデータをデータ構造に符号化することは、
前記機械学習モデルに入力するために、前記1つ又は複数のコンピュータにより、前記1つ又は複数の感染バイオマーカの前記特定された発現レベルを記述する、前記取得されたデータを1つ又は複数のデータ構造に符号化することを含む、請求項76に記載の方法。
【請求項86】
植物生産物の潜伏感染を識別するシステムであって、
1つ又は複数のコンピュータと、命令を記憶した1つ又は複数の記憶装置とを備え、前記命令は、前記1つ又は複数のコンピュータによって実行されると、前記1つ又は複数のコンピュータに、
前記1つ又は複数のコンピュータにより、植物生産物における1つ又は複数の感染バイオマーカの発現レベルを記述するデータを取得することと、
前記1つ又は複数のコンピュータにより、機械学習モデルに入力するために前記取得されたデータをデータ構造に符号化することと、
前記1つ又は複数のコンピュータにより、前記符号化データ構造の処理に基づいて前記植物生産物が潜伏感染を有する尤度を示す出力データを生成するようにトレーニングされた前記機械学習モデルへの入力として、符号化データ構造を提供することと、
前記1つ又は複数のコンピュータにより、前記植物生産物が潜伏感染を有する尤度を示す前記生成された出力データを取得することと、
前記1つ又は複数のコンピュータにより、前記生成された出力データに基づいて前記植物生産物が潜伏感染を有すると判断することと、
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行すること、
を含む動作を実行させる、システム。
【請求項87】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、1つ又は複数の他の同じソースの植物生産物に対して抗菌処理を処方すべきであると判断することを含む、請求項86に記載のシステム。
【請求項88】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、1つ又は複数の同じソースの植物生産物に抗菌処理を投与することを含む、請求項86に記載のシステム。
【請求項89】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、1つ又は複数の他の同じソースの植物生産物を輸送している車両を異なる行先にルート変更すべきであると判断することを含む、請求項86に記載のシステム。
【請求項90】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、ユーザデバイスによって処理されたとき、前記ユーザデバイスに、前記車両を異なる行先にルート変更すべきであることを前記ユーザデバイスのユーザに通知するアラートを出力させるアラートメッセージを生成することと、
前記1つ又は複数のコンピュータにより、前記生成されたアラートを前記ユーザデバイスに送信すること、
を含む、請求項86に記載のシステム。
【請求項91】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記出力データに基づいて、前記出力データに基づいて、ユーザデバイスにより処理されたとき、前記ユーザデバイスのユーザに、1つ又は複数の他の同じソースの植物生産物通知するアラートを出力させるアラートメッセージを生成することと、
前記1つ又は複数のコンピュータにより、前記アラートメッセージを前記ユーザデバイスに送信すること、
を含む、請求項86に記載のシステム。
【請求項92】
前記植物生産物における1つ又は複数の感染バイオマーカの発現レベルを記述するデータは、1つ又は複数のバリアントのリストを含み、前記1つ又は複数のバリアントは、前記植物生産物のリード配列と健康な植物生産物の基準ゲノムとの間の差を記述する、請求項86に記載のシステム。
【請求項93】
前記機械学習モデルは、バイナリロジスティック回帰モデル、ロジスティックモデルツリー、ランダムフォレスト分類器、L2正則化、部分最小二乗の1つ又は複数を含む、請求項86に記載のシステム。
【請求項94】
前記植物生産物は、感染のいかなる可視兆候も含まない、請求項86に記載のシステム。
【請求項95】
前記動作は
前記1つ又は複数のコンピュータにより、前記植物生産物の集合からm個の植物生産物の部分集合を選択することであって、mは1よりも大きく且つn/2よりも小さい整数である、選択することと、
前記部分集合の各植物生産物について、前記1つ又は複数のコンピュータにより、1つ又は複数の感染バイオマーカの発現レベルを特定することと、
を更に含み、
前記1つ又は複数のコンピュータにより、植物生産物における1つ又は複数のバイオマーカの発現レベルを記述するデータを取得することは、
前記1つ又は複数のコンピュータにより、前記部分集合の各植物生産物について、前記1つ又は複数の感染バイオマーカの前記特定された発現レベルを記述するデータを取得することを含み、
前記1つ又は複数のコンピュータにより、機械学習モデルに入力するために前記取得されたデータをデータ構造に符号化することは、
前記機械学習モデルに入力するために、前記1つ又は複数のコンピュータにより、前記1つ又は複数の感染バイオマーカの前記特定された発現レベルを記述する、前記取得されたデータを1つ又は複数のデータ構造に符号化することを含む、請求項86に記載のシステム。
【請求項96】
1つ又は複数のコンピュータによって実行可能な命令を含むソフトウェアを記憶した非一時的コンピュータ可読媒体であって、そのような実行は、前記1つ又は複数のコンピュータに、
前記1つ又は複数のコンピュータにより、植物生産物における1つ又は複数の感染バイオマーカの発現レベルを記述するデータを取得することと、
前記1つ又は複数のコンピュータにより、機械学習モデルに入力するために前記取得されたデータをデータ構造に符号化することと、
前記1つ又は複数のコンピュータにより、前記符号化データ構造の処理に基づいて前記植物生産物が潜伏感染を有する尤度を示す出力データを生成するようにトレーニングされた前記機械学習モデルへの入力として、符号化データ構造を提供することと、
前記1つ又は複数のコンピュータにより、前記植物生産物が潜伏感染を有する尤度を示す前記生成された出力データを取得することと、
前記1つ又は複数のコンピュータにより、前記生成された出力データに基づいて前記植物生産物が潜伏感染を有すると判断することと、
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することと、
を含む動作を実行させる、コンピュータ可読媒体。
【請求項97】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、1つ又は複数の他の同じソースの植物生産物に対して抗菌処理を処方すべきであると判断することを含む、請求項96に記載のコンピュータ可読媒体。
【請求項98】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、1つ又は複数の同じソースの植物生産物に抗菌処理を投与することを含む、請求項96に記載のコンピュータ可読媒体。
【請求項99】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、1つ又は複数の他の同じソースの植物生産物を輸送している車両を異なる行先にルート変更すべきであると判断することを含む、請求項96に記載のコンピュータ可読媒体。
【請求項100】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記1つ又は複数のコンピュータにより、前記出力データに基づいて、ユーザデバイスによって処理されたとき、前記ユーザデバイスに、前記車両を異なる行先にルート変更すべきであることを前記ユーザデバイスのユーザに通知するアラートを出力させるアラートメッセージを生成することと、
前記1つ又は複数のコンピュータにより、前記生成されたアラートを前記ユーザデバイスに送信すること、
を含む、請求項96に記載のコンピュータ可読媒体。
【請求項101】
前記1つ又は複数のコンピュータにより、前記植物生産物における前記潜伏感染を軽減するための1つ又は複数の動作を実行することは、
前記出力データに基づいて、前記出力データに基づいて、ユーザデバイスにより処理されたとき、前記ユーザデバイスのユーザに、1つ又は複数の他の同じソースの植物生産物通知するアラートを出力させるアラートメッセージを生成することと、
前記1つ又は複数のコンピュータにより、前記アラートメッセージを前記ユーザデバイスに送信すること、
を含む、請求項96に記載のコンピュータ可読媒体。
【請求項102】
前記植物生産物における1つ又は複数の感染バイオマーカの発現レベルを記述するデータは、1つ又は複数のバリアントのリストを含み、前記1つ又は複数のバリアントは、前記植物生産物のリード配列と健康な植物生産物の基準ゲノムとの間の差を記述する、請求項96に記載のコンピュータ可読媒体。
【請求項103】
前記機械学習モデルは、バイナリロジスティック回帰モデル、ロジスティックモデルツリー、ランダムフォレスト分類器、L2正則化、部分最小二乗の1つ又は複数を含む、請求項96に記載のコンピュータ可読媒体。
【請求項104】
前記植物生産物は、感染のいかなる可視兆候も含まない、請求項96に記載のコンピュータ可読媒体。
【請求項105】
前記動作は
前記1つ又は複数のコンピュータにより、前記植物生産物の集合からm個の植物生産物の部分集合を選択することであって、mは1よりも大きく且つn/2よりも小さい整数である、選択することと、
前記部分集合の各植物生産物について、前記1つ又は複数のコンピュータにより、1つ又は複数の感染バイオマーカの発現レベルを特定すること、
を更に含み、
前記1つ又は複数のコンピュータにより、植物生産物における1つ又は複数のバイオマーカの発現レベルを記述するデータを取得することは、
前記1つ又は複数のコンピュータにより、前記部分集合の各植物生産物について、前記1つ又は複数の感染バイオマーカの前記特定された発現レベルを記述するデータを取得することを含み、
前記1つ又は複数のコンピュータにより、機械学習モデルに入力するために前記取得されたデータをデータ構造に符号化することは、
前記機械学習モデルに入力するために、前記1つ又は複数のコンピュータにより、前記1つ又は複数の感染バイオマーカの前記特定された発現レベルを記述する、前記取得されたデータを1つ又は複数のデータ構造に符号化することを含む、請求項96に記載のコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
[0001] 本願は、全体的に参照により本明細書に援用される2019年11月5日付けで出願された米国仮特許出願第62/930,999号の利益を主張するものである。
【背景技術】
【0002】
背景
[0002] 多くの植物生産物、例えば果物は、高い感染率を有する。植物生産物の収穫前感染は、植物生産物が生長中に病原体に感染した場合、生じる。例えば、アボカド果樹園のアボカドの木ひいてはアボカドの木が生産するアボカドの概ね20~40%が炭疽病に感染していると推定されてきた。未熟の収穫前植物生産物は、そのような感染の無症状期であることが多い。しかしながら、植物生産物が収穫され、老化を経た後、植物生産物に症状が現れる。感染の症状は、軸腐病、かび病、導管/内部褐変症、及び植物生産物の品質の有害低下を生じさせる他の特徴を含むことができる。
【0003】
[0003] 植物生産物感染は、感染症状を示している植物生産物によって高度伝染性である。さらに、収穫後処理では、異なる取り扱い方法及び貯蔵条件により、植物生産物は植物生産物表面への攻撃に弱い。感染及びそれに関連する症状は、消費者に提供される植物生産物の品質に大きく影響する。その結果、感染した植物生産物は廃棄されることが多く、植物生産物の生物的攻撃は収穫後植物生産物の高廃棄率の大きな原因となっている。洗浄及び殺虫剤を含む多くの様々な技術が、感染からの植物生産物ロスを軽減するために開発されてきたが、供給者が植物生産物の収穫前感染に起因するロスを阻止ことは難しいままである。
【0004】
[0004] 植物生産物感染によって生じるこれらの問題の結果として、感染植物生産物が症状を現し、感染を他の植物生産物に伝染させる前に、感染植物生産物を識別する必要がある。感染植物生産物の早期検出は、感染植物生産物を処理し、非感染植物生産物から分離できるようにし、それにより、感染の拡大を低減し、植物生産物の廃棄を低減し、顧客による受納を改善する。植物生産物の廃棄を低減し、顧客による信頼を改善することにより、供給者はより高品質の植物生産物を保証することができ、それにより供給者は、市場における他の供給者との差別化を図ることが可能となる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
[0005] 未熟で無症状の植物生産物の感染を識別する現在の方法は、感染を生じさせる病原体のバイオマーカ(例えばDNA、RNA等)を定量化することによって感染を直接検出することを含む1-4。しかしながら、感染を生じさせた病原体は一般に植物生産物内に微量で存在するため、病原体バイオマーカの定量化を介した植物生産物の感染の直接検出は難しく、信頼性が低いことがある。
【課題を解決するための手段】
【0006】
概要
[0006] 一態様では、本開示は、n個の同じソースの植物生産物の集合における感染尤度を予測する方法を提供し、nは10よりも大きい整数である。本方法は、植物生産物の集合からm個の植物生産物の部分集合を選択することを含み、mは1よりも大きく及びn/2よりも小さい整数である。次いで、選択された植物生産物の部分集合の各植物生産物について1つ又は複数の感染バイオマーカの発現レベルが特定される。選択された植物生産物の部分集合について、バイオマーカ発現統計の集合が、部分集合のうちの各植物生産物についての1つ又は複数の感染バイオマーカの特定された発現レベルに基づいて特定される。少なくとも部分的に植物生産物の部分集合に特定されたバイオマーカ発現統計の集合に基づいて、植物生産物の集合における感染尤度が予測される。最後に、植物生産物の集合における予測感染尤度が返される。
【0007】
[0007] 別の態様では、本開示は、n個の同じソースの植物生産物(similarly sourced plant product)の集合における感染尤度を予測する別の方法を提供し、nは10よりも大きい整数である。本方法は、植物生産物の集合からm個の植物生産物の部分集合を選択することを含み、mは1よりも大きく及びn/2よりも小さい整数である。次いで部分集合のm個の植物生産物は、p個のサブグループに分割され、pは1よりも大きく及びmよりも小さい整数であり、p個のサブグループの各々は、部分集合のうちの植物生産物の少なくとも1つを含む。次に、p個のサブグループの各々について、サブグループのうちの植物生産物の各々からの植物体が組み合わせられて、プール植物体のグループが形成され、プール植物体のp個のグループは、プール植物体グループの集まりを形成する。次に、グループ植物体グループの集まりについて、植物体グループの集まりの各プール植物体グループについての1つ又は複数の感染バイオマーカの発現レベルに基づいて、バイオマーカ発現統計の集合が特定される。少なくとも部分的にプール植物体グループの集まりについてのバイオマーカ発現統計の集合に基づいて、植物生産物の集合における感染尤度が予測される。最後に、植物生産物の集合における予測感染尤度が返される。
【0008】
[0008] 本明細書に記載の任意の方法は、以下のステップ又は特徴の1つ又は複数を単独で又は互いと組み合わせて含むことができる。本方法は、部分集合の各植物生産物について又はプール植物体グループの各々についての1つ又は複数のハウスキーピングバイオマーカの発現レベルを特定することを更に含むことができ、植物生産物の部分集合又はプール植物体グループの集まりについてのバイオマーカ発現統計の集合は、少なくとも、部分集合のうちの各植物生産物についての1つ又は複数の感染バイオマーカの発現レベル及び1つ又は複数のハウスキーピングバイオマーカの発現レベルに基づいて特定される。1つ又は複数の感染バイオマーカは表1から選択することができる。1つ又は複数のハウスキーピングバイオマーカは表2から選択することができる。各バイオマーカは小分子であることができ、各バイオマーカの発現レベルは、対応する小分子の定量化量を含むことができ、又は定量化量である。
【0009】
[0009] 植物生産物の集合における感染尤度は、機械学習感染予測モデルによって予測することができる。機械学習感染予測モデルは、複数のパラメータ及び関数を含む。部分的に機械学習感染予測モデルを構成する関数は、機械学習感染予測モデルへの入力として受信される植物生産物の部分集合について又はプール植物生産物グループの集まりについてのバイオマーカ発現統計の集合と、機械学習感染予測モデルの出力として生成される1組の植物生産物における予測感染尤度との間の関係を表す。
【0010】
[0010] 機械学習感染予測モデルを使用して、植物生産物の集合における感染尤度を予測する前、機械学習感染予測モデルのパラメータは、1つ又は複数のトレーニングフェーズ中、学習される。具体的には、トレーニング中、感染予測モデルのパラメータは、少なくとも部分的に、複数のトレーニングサンプルを含むトレーニングデータセットに基づいて識別される。トレーニングデータセット内の各トレーニングサンプルは、同じソースの植物生産物の遡及集合と関連付けられ、同じソースの植物生産物の遡及集合からの植物生産物の部分集合について又はプール植物体グループの集まりについてのバイオマーカ発現統計の集合を含む。上述したように、バイオマーカ発現統計の集合は、植物生産物の遡及集合からの植物生産物の部分集合について又はプール植物体グループの集まりの各プール植物体グループについての1つ又は複数の感染バイオマーカの発現レベル及び任意選択的に1つ又は複数のハウスキーピングバイオマーカの発現レベルに基づく。さらに、トレーニングデータセット内の各トレーニングサンプルは、植物生産物の各集合における実際の既知の感染率を更に含む。トレーニングデータセットを使用した感染予測モデルのトレーニングについて更に詳細に以下考察する。
【0011】
[0011] 機械学習感染予測モデルのトレーニング、そして幾つかの実施態様では検証に続き、感染予測モデルを先に述べたように使用して、植物生産物の集合における感染尤度を予測することができる。植物生産物の集合における感染尤度を予測するために、植物生産物の部分集合について又はプール植物体グループの集まりについてのバイオマーカ発現統計の集合は、機械学習感染予測モデルに入力される。次いで植物生産物の集合における予測感染尤度が、少なくとも部分的に、植物生産物の部分集合又はプール植物体グループの集まりについてのバイオマーカ発現統計の集合と、少なくともトレーニングデータセットに基づくトレーニング中に識別された複数のパラメータとに基づいて、機械学習感染予測モデルによって出力される。
【0012】
[0012] 同じソースの植物生産物の集合における感染尤度が機械学習感染予測システムによって予測される実施態様では、機械学習感染予測システムの関数は、バイナリロジスティック回帰モデル、ロジスティックモデルツリー、ロジスティックモデルリグレッサ、ランダムフォレスト分類器、ロジスティックモデルリグレッサ、L2正則化、部分最小二乗分類、ナイーブベイズ分類器、多変量スパイン、1つ又は複数のニューラルネットワーク、及びk最近傍分類の1つ又は複数を含むことができる。機械学習感染予測モデルの関数がk最近傍分類及びランダムフォレスト分類器の一方を含む実施態様では、機械学習感染予測モデルは、少なくとも90%の正解率、少なくとも80%の再現率、及び少なくとも80%の適合率の1つと共に少なくとも5%(例えば少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、又は95%)の閾値よりも大きい植物生産物の集合における感染尤度を予測することが可能である。
【0013】
[0013] 植物生産物の部分集合についてのバイオマーカ発現統計の集合を特定することは、植物生産物の部分集合の各植物生産物について又はプール植物体グループの集まりの各プール植物体グループについて、1つ又は複数の感染バイオマーカの正規化発現レベルを特定し、1つ又は複数の感染バイオマーカの特徴スケーリング発現レベルを特定することを含むことができる。植物生産物について又はプール植物体グループについての1つ又は複数の感染バイオマーカの正規化発現レベルは、1つ又は複数の感染バイオマーカの発現レベル及び任意選択的に1つ又は複数のハウスキーピングバイオマーカの発現レベルに基づくことができる。例えば、幾つかの実施態様では、植物生産物について又はプール植物体グループについての1つ又は複数の感染バイオマーカの正規化発現レベルを特定することは、1つ又は複数の感染バイオマーカの発現レベルと1つ又は複数のハウスキーピングバイオマーカの発現レベルとの比率を特定することを含むことができる。そして植物生産物について又はプール植物体グループについての1つ又は複数の感染バイオマーカの特徴スケーリング発現レベルは、植物生産物について又はプール植物体グループについての1つ又は複数の感染バイオマーカの正規化発現レベルに基づく。幾つかの実施態様では、植物生産物について又はプール植物体グループについての1つ又は複数の感染バイオマーカの特徴スケーリング発現レベルを特定することは、植物生産物について又はプール植物体グループについての1つ又は複数の感染バイオマーカの正規化発現レベルの最小最大正規化及び対数変換の少なくとも一方を実行することを含むことができる。
【0014】
[0014] 植物生産物について又はプール植物体グループについてのバイオマーカ発現統計の集合は、部分集合における各植物生産物について又はプール植物体グループの集まりにおける各プール植物体グループについての1つ又は複数の感染バイオマーカの特徴スケーリング発現レベルに基づくことができる。例えば、幾つかの実施態様では、植物生産物の部分集合について又はプール植物体グループの集まりについてのバイオマーカ発現統計の集合は、植物生産物の部分集合のうちの植物生産物について又はプール植物体グループの集まりのうちのプール植物体グループについての1つ又は複数の感染バイオマーカの特徴スケーリング発現レベルの平均、メジアン、最小、最大、標準偏差、5パーセンタイル、10パーセンタイル、15パーセンタイル、20パーセンタイル、25パーセンタイル、50パーセンタイル、75パーセンタイル、80パーセンタイル、90パーセンタイル、95パーセンタイル、及び99パーセンタイルの少なくとも1つ及び植物生産物の部分集合における各植物生産物について又は各プール植物体グループについての1つ又は複数の感染バイオマーカのうちの少なくとも1つの感染バイオマーカの特徴スケーリング発現レベルと1つ又は複数の感染バイオマーカのうちの少なくとも1つの他の感染バイオマーカの特徴スケーリング発現レベルとの比率及び/又は植物生産物の部分集合における各植物生産物について又は又はプール植物体グループの集まりにおける各プール植物体グループについての1つ又は複数の感染バイオマーカのうちの少なくとも1つの感染バイオマーカの特徴スケーリング発現レベルと1つ又は複数の感染バイオマーカのうちの少なくとも1つの他の感染バイオマーカの特徴スケーリング発現レベルとの積を特定することによって特定される。
【0015】
[0015] 特定の実施態様では、感染は真菌感染を含む。そのような実施態様では、感染は、コレトトリカム属(Colletotrichum)(即ちC.グロエオスポリオイデス(C.gloeosporioides)、C.アキュテータム(C.acutatum))、ドチオレラ属(Dothiorella)(即ちD.イベリカ(D.iCerica)、D.グレガリア(D.gregaria)、D.アロマティカ(D.aromatica))、ネオフシコッカム属(Neofusicoccum)(即ちN.ルテウム(N.luteum)、N.パルバム(N. parvum)、N.アウストラーレ(N.australe))、ジアポルテ属(Diaporthe)(即ちD.ネオテイコラ(D.neotheicola)、D.シナモミ(D.cinnamomi))、ラシオディプロディア属(Lasiodiplodia)(即ちL.プセウドテオブロマ(L.pseudotheoCromae)、L.テオブロマ(L.theoCromae)、ディプロディア属(Diplodia)(即ちD.mutila,D.pseuodoseriata、D.セリアタ(D.seriata))、及びボトリスファエリア科(Cotryosphaeria)(即ちC.ドシデア(C.dothidea))からなる群から選択される1つ又は複数の病原体に起因する。感染はとりわけ、例えば軸腐病、かび病、及び/又は導管/内部褐変症として現れることができる。
【0016】
[0016] 感染尤度が予測される同じソースの植物生産物の集合は、収穫された又は未収穫の植物生産物である。さらに、感染尤度が予測される同じソースの植物生産物の集合は、熟した又は未熟の植物生産物であることができる。幾つかの場合、植物生産物は感染の可視症状を呈さない。植物生産物はとりわけ、例えばアボカド、ザクロ、カキ、リンゴ、ナシ、ブドウ、柑橘類、パパイヤ、サクランボ、メロン、グァバ、マンゴー、又は核果類を含むことができる。
【0017】
[0017] 植物生産物におけるバイオマーカの発現レベルを特定するために、植物生産物の外果皮、中果皮、及び内果皮の1つ又は複数から材料を抽出することができ、抽出された材料に対してバイオマーカ解析を実行して、バイオマーカの発現レベルを特定することができる。さらに、バイオマーカの発現レベルの特定は例えば、qPCR、PCR、RT-PCR、リボ核酸(RNA)シーケンシング(RNA-seq)、タグ-seq、シーケンシングを使用したトランスポゼースアクセス可能クロマチンアッセイ(ATAC-esq)、CyTOF/SCoP、E-MS/Abseq、miRNA-seq、CITE-seq、質量分析(MS)、ガスクロマトグラフィ質量分析(GC-MS)、包括的二次元ガスクロマトグラフィ(GCxGC)、GCxGCと併せた固相マイクロ抽出(SPME)(SPME-GCxGC)、マトリックス支援レーザ脱離/イオン化(MALDI)、及びMALDI-TOFからなる群から選択される1つ又は複数の解析を実行することによって特定することができる。
【0018】
[0018] バイオマーカは、例えば遺伝子であることができる。バイオマーカが遺伝子である実施態様では、バイオマーカの発現レベルは、上記遺伝子に関連付けられたRNA配列の発現レベルに対応することができる。そのような実施態様では、上記遺伝子に関連付けられたRNA配列の発現レベルは、上記遺伝子に関連付けられたRNA配列のコピー数を更に含むことができる。
【0019】
[0019] 本明細書に開示される任意の方法において、植物生産物の集合における感染尤度を予測することは、6時間未満(例えば5時間未満、4時間未満、3時間未満、2時間未満、又は1時間未満)を要し得る。植物生産物の集合における感染尤度の予測に続き、予測感染尤度は、予測感染尤度を閲覧ユーザに自動的に提示することによって返すことができる。さらに、同じソースの植物生産物の集合は、同じソースの植物生産物の集合について予測された感染尤度に基づいて処理を受けることができる。具体的には、感染の予測尤度に基づいて、感染リスクがある同じソースの植物生産物の集合の1つ又は複数の植物生産物を識別することができる。
【0020】
[0020] 本明細書に開示される任意の方法において、感染の予測尤度に基づいて、同じソースの植物生産物の集合に対して抗菌剤投与を提供又は抗菌剤投与処理を処方することができる。感染の予測尤度に基づいて同じソースの植物生産物の集合を選択的に収穫することができる。本明細書に開示される任意の方法において、感染の予測尤度に基づいて同じソースの植物生産物の集合についての品質保証を特定することができる。さらに、感染の予測尤度に基づいて同じソースの植物生産物の集合についての消費者及び地理的行先の少なくとも一方を識別することができる。さらに、感染の予測尤度に基づいて同じソースの植物生産物の集合へのエチレン処理を保留又は処方することができる。エチレン処理は例えば、外因性エチレンの適用、エチレンブロッカーの適用、又は化学的エチレン阻害剤(即ち1-MCP)の適用を含むことができる。幾つかの場合、感染の予測尤度に基づいて同じソースの植物生産物の集合についての1つ又は複数の貯蔵条件を識別することができる。貯蔵条件は例えば、貯蔵温度及び貯蔵湿度の少なくとも一方を含むことができる。さらに、感染の予測尤度に基づいて同じソースの植物生産物の集合に対して収穫後処理を提供することができる。さらに、感染の予測尤度に基づいて、予測感染尤度に基づく上記植物処理方法のいずれか1つを実行するようにユーザに指示する指示を提供することができる。
【0021】
[0021] 別の態様では、本開示は、コンピュータプログラム命令を記憶した非一時的コンピュータ可読記憶媒体を提供し、命令は、コンピュータプロセッサによって実行されると、コンピュータプロセッサに、上記方法ステップの任意の組合せを実行することによって同じソースの植物生産物の集合における感染尤度を予測させる。
【0022】
[0022] 別の態様では、本開示は、植物生産物の潜伏感染を識別する方法を含むことができる。幾つかの実施態様では、本方法は、1つ又は複数のコンピュータにより、植物生産物における1つ又は複数の感染バイオマーカの発現レベルを記述するデータを取得する動作と、1つ又は複数のコンピュータにより、機械学習モデルに入力するために取得されたデータをデータ構造に符号化する動作と、1つ又は複数のコンピュータにより、符号化データ構造の処理に基づいて植物生産物が潜伏感染を有する尤度を示す出力データを生成するようにトレーニングされた機械学習モデルへの入力として、符号化データ構造を提供する動作と、1つ又は複数のコンピュータにより、植物生産物が潜伏感染を有する尤度を示す生成された出力データを取得する動作と、1つ又は複数のコンピュータにより、生成された出力データに基づいて植物生産物が潜伏感染を有すると判断する動作と、1つ又は複数のコンピュータにより、植物生産物における潜伏感染を軽減するための1つ又は複数の動作を実行する動作とを含むことができる。
【0023】
[0023] 他の態様は、コンピュータ可読記憶装置に符号化された命令によって定義される、本明細書に開示される方法の行為を実行するためのシステム、装置、及びコンピュータプログラムを含む。
【0024】
[0024] これら及び他の態様は任意選択的に、以下の特徴の1つ又は複数を含み得る。幾つかの実施態様では、1つ又は複数のコンピュータにより、植物生産物における潜伏感染を軽減するための1つ又は複数の動作を実行することは、1つ又は複数のコンピュータにより、出力データに基づいて、1つ又は複数の他の同じソースの植物生産物に対して抗菌処理を処方すべきであると判断することを含むことができる。
【0025】
[0025] 幾つかの実施態様では、1つ又は複数のコンピュータにより、植物生産物における潜伏感染を軽減するための1つ又は複数の動作を実行することは、1つ又は複数のコンピュータにより、出力データに基づいて、1つ又は複数の同じソースの植物生産物に抗菌処理を投与することを含むことができる。
【0026】
[0026] 幾つかの実施態様では、1つ又は複数のコンピュータにより、植物生産物における潜伏感染を軽減するための1つ又は複数の動作を実行することは、1つ又は複数のコンピュータにより、出力データに基づいて、1つ又は複数の他の同じソースの植物生産物を輸送している車両(vehicle)を異なる行先にルート変更すべきであると判断することを含むことができる。
【0027】
[0027] 幾つかの実施態様では、1つ又は複数のコンピュータにより、植物生産物における潜伏感染を軽減するための1つ又は複数の動作を実行することは、1つ又は複数のコンピュータにより、出力データに基づいて、ユーザデバイスによって処理されたとき、ユーザデバイスに、車両を異なる行先にルート変更すべきであることをユーザデバイスのユーザに通知するアラートを出力させるアラートメッセージを生成することと、1つ又は複数のコンピュータにより、生成されたアラートをユーザデバイスに送信することとを含むことができる。
【0028】
[0028] 幾つかの実施態様では、1つ又は複数のコンピュータにより、植物生産物における潜伏感染を軽減するための1つ又は複数の動作を実行することは、出力データに基づいて、出力データに基づいて、ユーザデバイスにより処理されたとき、ユーザデバイスのユーザに、1つ又は複数の他の同じソースの植物生産物通知するアラートを出力させるアラートメッセージを生成することと、1つ又は複数のコンピュータにより、アラートメッセージをユーザデバイスに送信することとを含むことができる。
【0029】
[0029] 幾つかの実施態様では、植物生産物における1つ又は複数の感染バイオマーカの発現レベルを記述するデータは、1つ又は複数のバリアントのリストを含むことができ、1つ又は複数のバリアントは、植物生産物のリード配列と健常な植物生産物の基準ゲノムとの間の差を記述する。
【0030】
[0030] 幾つかの実施態様では、機械学習モデルは、バイナリロジスティック回帰モデル、ロジスティックモデルツリー、ランダムフォレスト分類器、L2正則化、部分最小二乗の1つ又は複数を含むことができる。
【0031】
[0031] 幾つかの実施態様では、植物生産物は、感染のいかなる可視兆候も含まない。
【0032】
[0032] 幾つかの実施態様では、本方法は、1つ又は複数のコンピュータにより、植物生産物の集合からm個の植物生産物の部分集合を選択することであって、mは1よりも大きく及びn/2よりも小さい整数である、選択することと、部分集合の各植物生産物について、1つ又は複数のコンピュータにより、1つ又は複数の感染バイオマーカの発現レベルを特定することとを含むことができる。そのような実施態様では、1つ又は複数のコンピュータにより、植物生産物における1つ又は複数のバイオマーカの発現レベルを記述するデータを取得することは、1つ又は複数のコンピュータにより、部分集合の各植物生産物について、1つ又は複数の感染バイオマーカの特定された発現レベルを記述するデータを取得することを含むことができいる。同様に、そのような実施態様では、1つ又は複数のコンピュータにより、機械学習モデルに入力するために取得されたデータをデータ構造に符号化することは、機械学習モデルに入力するために、1つ又は複数のコンピュータにより、1つ又は複数の感染バイオマーカの特定された発現レベルを記述する、取得されたデータを1つ又は複数のデータ構造に符号化することを含むことができる。
【0033】
図面の簡単な説明
[0033] 本発明のこれら及び他の特徴、態様、及び利点は、以下の説明及び添付図面に関連してよりよく理解されるようになる。
【図面の簡単な説明】
【0034】
図1】同じソースの植物生産物の集合における感染尤度を予測する方法のフローチャートである。
図2A】植物生産物の集合における感染尤度の予測に使用する植物生産物の部分集合が、植物生産物の集合から選択されるシステム環境のブロック図である。
図2B】同じソースの植物生産物の感染尤度が予測されるシステム環境のブロック図である。
図2C】[0037]植物生産物の部分集合についてのバイオマーカ発現統計の集合が特定されるシステム環境のブロック図である。
図2D】[0038]植物生産物の部分集合についてのバイオマーカ発現統計の集合が特定されるシステム環境のブロック図である。
図3】[0039]同じソースの植物生産物の集合における感染尤度を予測するように構成された感染予測システムのシステム環境のブロック図である。
図4】[0040]同じソースの植物生産物の集合における感染尤度を予測するように構成された感染予測システムのアーキテクチャのブロック図である。
図5A】[0041]感染予測システムがトレーニング、検証、使用されるシステム環境のブロック図である。
図5B】[0042]感染予測システムがトレーニングされるシステム環境のブロック図である。
図5C】[0043]感染予測システムが検証されるシステム環境のブロック図である。
図5D】[0044]感染予測システムが使用されるシステム環境のブロック図である。
図6】[0045]感染した複数のアボカド及び複数のコントロールアボカドについての各感染バイオマーカ候補の平均正規化された発現レベルを示すグラフである。
図7A】[0046]アボカドの各ロットA~K中の軸腐病の発生率を示すグラフである。
図7B】[0047]アボカドの各ロットからテストされた6個のアボカドのうちの各アボカドでのPAL遺伝子の正規化発現レベルを、そのアボカドのロット内の軸枯病発生率と比較したグラフである。
図8】[0048]アボカドのMX28ロット及びMX29ロットの両方での梱包後7日~12日の各日でテストされた6個のアボカドの各々のPAL遺伝子の正規化発現レベルを示すグラフである。
図9】[0049]感染予測システムの予測性能を示すグラフである。
図10A】[0050]感染予測システムをトレーニング、検証、テストする例示的なデータパイプラインの全体図のブロック図である。
図10B】[0051]同じソースの植物生産物の集合が5%を超える感染尤度を有するか、それとも5%未満の感染尤度を有するかを予測するように構成された感染予測システムをトレーニング、検証、テストする例示的なデータパイプラインのブロック図である。
図10C】[0052]感染予測システムの性能をテストし査定する例示的な方式のブロック図である。
図11】[0053]図1に示す方法を実施するコンピュータ例を示す。
図12】[0054]同じソースの植物生産物の集合における感染尤度を予測する方法のフローチャートである。
図13】[0055]同じソースの植物生産物の集合の感染尤度が予測されるシステム環境のブロック図である。
【発明を実施するための形態】
【0035】
詳細な説明
[0056] 本開示は、植物の潜伏感染を検出するシステム、方法、及びコンピュータプログラムに関する。一態様では、本開示は、植物生産物の特徴を表す入力データの機械学習モデル処理に基づいて、植物生産物が潜伏感染を有する尤度を示す出力データを生成することができるトレーニング済み機械学習モデルに関する。幾つかの実施態様では、植物生産物の特徴は、植物生産物サンプル内で検出される1つ又は複数のバイオマーカの発現レベルを表すデータを含むことができる。本開示は、生成された出力データに基づいて、植物生産物が潜伏感染を有すると判断する場合、検出された潜伏感染を軽減するように設計された1つ又は複数の動作を実行させることができる。
【0036】
[0057] 本開示は多くの技術的利点を提供する。例えば、幾つかの実施態様では、本開示は、同じソースの植物生産物の集合の部分集合のみをサンプリングすることにより、同じソースの植物生産物の集合における潜伏感染を検出するために破壊する必要がある植物生産物量を低減することができる。これら又は他の実施態様では、本開示は、潜伏感染を検出し、1つ又は複数の治療対策を開始して、感染が現れる前に潜伏感染を軽減、さらにはなくし、それにより、植物生産物を販売できるようにすることで、植物生産物を節減する利点も提供する。
【0037】
I.定義
[0058] 一般に、特許請求の範囲及び本明細書で使用される用語は、当業者によって理解される明白な意味を有するものとして解釈されることが意図される。特定の用語を以下に定義して、更なる明確性を提供する。明白な意味と提供される定義とが競合する場合、提供される定義が使用されるべきである。
【0038】
[0059] 本明細書で直接定義されない任意の用語は、本開示の技術分野内で理解されるように、一般にそれらの用語に関連付けられる意味を有すると理解されるものとする。特定の用語は本明細書において、本開示の態様の構成要素、デバイス、方法等及びそれらの使用方法を説明するに当たり実施者に追加の指針を提供するために考察される。同じことを2つ以上の方法で言うことができることが理解されよう。したがって、本明細書で考察される用語の任意の1つ又は複数に代替の用語及び同義語が使用され得る。用語が本明細書で述べられる又は考察されるか否かは重要ではない。幾つかの同義又は置換可能な方法、材料等が提供される。1つ又は少数の同義語又は均等物の記載は、明確に述べられる場合を除き、他の同義語又は均等物の使用を除外しない。用語例を含む例の使用は、例示のみを目的とし、本明細書における本開示の態様の範囲及び意味を限定しない。
【0039】
[0060] 本明細書で参照されるように、「植物生産物」という用語は、植物によって生産される任意の産物を指す。植物生産物は、例えば、果物、野菜、種子、花、塊茎、球根、及び植物の任意の他の産物を含む。例えば、幾つかの実施態様では、植物生産物は、アボカド、ザクロ、カキ、リンゴ、ナシ、ブドウ、柑橘類、パパイヤ、サクランボ、メロン、グァバ、マンゴー、又は核果類を含み得る。
【0040】
[0061] 先に触れたように、本開示は、同じソースの植物生産物の集合における感染予測を考察する。同じソースの植物生産物の集合は、複数(即ち2つ以上)の植物生産物を含む。先に手短に触れたように、植物生産物に関する「同じソース」という用語は、同じ地理的エリアにある複数の植物生産物を指す。地理的エリアの境界は様々であり得る。例えば先に考察したように、同じソースの植物生産物の集合は、同じ果樹園で育った植物生産物を含み得る。別の例では、同じソースの植物生産物の集合は、同じトラックで輸送された植物生産物の集合を含むことができる。更に別の例では、同じソースの植物生産物の集合は、同じ食料品店で販売された植物生産物を含み得る。別の例では、同じソースの植物生産物の集合は、同じ商業ロットに属する植物生産物の集合を含むことができる。同じソースの植物生産物のこの地理的定義のベースは、植物生産物の収穫前又は収穫後のいずれかで同じ感染にかかる可能性がある植物生産物を一緒にまとめることである。
【0041】
[0062] 本明細書で参照するように、同じソースのn個の植物生産物の集合からの植物生産物のサンプリングに関する「部分集合」という用語は、m個の植物生産物の代表的なサンプルを指し、nは10よりも大きい整数であり、mは1よりも大きく及びn/2よりも小さい整数である。この部分集合は、部分集合の測定されるバイオマーカ統計が集合に一般化可能であるように、植物生産物の集合からランダムに選択される。
【0042】
[0063] 本明細書で使用される場合、「植物体」という用語は、例えば果物(植物学的意味では果皮及び果肉を含む)、野菜、葉、茎、樹皮、種子、花、皮、ナッツ、核、葉肉、又は根を含め、植物の任意の部分を指す。植物体は、例えば収穫された果物及び野菜、収穫された根及び液果類、及び摘まれた花を含め、収穫前の植物又はその部分並びに収穫後の植物又はその部分を含む。
【0043】
[0064] 本明細書で参照される場合、植物生産物に関する「感染」という用語は、植物生産物に存在する任意の病原性感染を指す。幾つかの実施態様では、植物生産物感染は、感染植物生産物が感染の可視症状を呈さないような潜伏感染であることができる。代替の実施態様では、植物生産物感染は、後述するものを含め、可視症状を示すことができる。
【0044】
[0065] 植物生産物感染は、任意の病原体によって生じ得、例えば、細菌感染、ウイルス感染、真菌感染、及び卵菌感染、又はそれらの任意の組合わせを含むことができる。植物生産物感染が真菌感染を含む実施態様では、真菌感染は例えば、コレトトリカム属(Colletotrichum)(即ちC.グロエオスポリオイデス(C.gloeosporioides)、C.アキュテータム(C.acutatum))、ドチオレラ属(Dothiorella)(即ちD.イベリカ(D.iberica)、D.グレガリア(D. gregaria)、D.アロマティカ(D.aromatica))、ネオフシコッカム属(Neofusicoccum)(即ちN.ルテウム(N.luteum)、N.パルバム(N.parvum)、N.アウストラーレ(N.australe))、ジアポルテ属(Diaporthe)(即ちD.ネオテイコラ(D.neotheicola)、D.シナモミ(D.cinnamomi))、ラシオディプロディア属(Lasiodiplodia)(即ちL.プセウドテオブロマ(L. pseudotheobromae)、L.テオブロマ(L.theobromae)、ディプロディア属(Diplodia)(即ちD.mutila,D.pseuodoseriata、D.セリアタ(D.seriata))、及びボトリスファエリア科(Botryosphaeria)(即ちB.ドシデア(B.dothidea))、及び任意の他の真菌病原体からなる群から選択される病原に起因し得る。
【0045】
[0066] 植物生産物感染は、いかなる形でも現れ得る。例えば、幾つかの実施態様では、植物生産物感染は、軸腐病、かび病、及び/又は導管/内部褐変症として現れ得る。具体例として、幾つかの実施態様では、感染はアボカド、リンゴ、ナシ、及び/又は核果類において導管/内部褐変症として現れ得る。別の例として、幾つかの実施態様では、感染はアボカド及び/又はマンゴーにおいて軸腐病として現れ得る。
【0046】
[0067] 先に考察したように、植物生産物感染は、感染植物生産物が長期間にわたり感染の可視症状を呈さないような潜伏感染であり得る。この潜伏期間が終わると、植物生産物感染は、軸腐病、かび病、及び/又は導管/内部褐変症の1つとして現れ得る。具体例として、幾つかの実施態様では、コレトトリカム属(Colletotrichum)からの真菌の潜伏感染はアボカド及び/又はマンゴーにおいて軸腐病として現れ得る。
【0047】
[0068] 本明細書で参照される場合、1つ又は複数の植物生産物に関する「感染尤度」という用語は、1つ又は複数の植物生産物における感染尤度の予測を指す。逆に、本明細書で参照される場合、1つ又は複数の植物生産物に関する「感染率」という用語は、1つ又は複数の植物生産物における感染の実際の既知の発生率を指す。更に詳細に以下考察するように、植物生産物における感染率は部分的に、他の植物生産物における感染尤度を予測するように感染予測モデルをトレーニングするのに使用することができる。
【0048】
[0069] 本明細書に記載の任意の実施態様では、植物生産物の感染尤度は、植物生産物のライフサイクルの任意の段階での同じソースの植物生産物の集合について予測することができる。例えば、感染尤度は、収穫された又はまだ収穫されていない植物生産物の集合について予測することができる。別の例として、感染尤度は、熟した又は未熟の植物生産物の集合について予測することができる。未熟の植物生産物についての感染予測は、感染は多くの場合、未熟の植物生産物では潜伏であり、植物生産物が熟すまで視覚的に検出することができないため、特に有用であることができる。したがって、未熟の植物生産物における感染予測は、感染が視覚的に検出可能になる前に感染を暴露することができる。
【0049】
[0070] 本明細書で参照される場合、植物生産物に関する用語「バイオマーカ」は、植物生産物に存在する任意の分子を指す。例えば、バイオマーカは、DNA、修飾(例えばメチル化)DNA、cDNA、及びコーディング(例えばmRNA、tRNA)RNA及びノンコーディングRNA(例えばsncRNA、miRNA、piRNA、IncRNA)を含むRNAを含む核酸、転写後修飾タンパク質(例えばリン酸化、グリコシル化、ミリストイル化等のタンパク質)を含むタンパク質、環状アデノシン一リン酸(cAMP)及び環状グアノシン一リン酸(cGMP)等の環状ヌクレオチドを含むヌクレオチド(例えばアデノシン三リン酸(ATP)、アデノシン二リン酸(ADP)、及びアデノシン一リン酸(AMP))、生物学的ADC、酸化型及び還元型のニコチンアミドアデニンジヌクレオチド(NADP/NADPH)等の小分子、揮発性化合物、並びにそれらの任意の組合せを含み得る。
【0050】
[0071] 本明細書で参照されるように、バイオマーカに関する「発現レベル」という用語は、バイオマーカの発現の代理として機能する任意の物質の尺度を指す。尺度は定量的、定性的、絶対、及び/又は相対であることができる。例えば、バイオマーカが遺伝子を含む実施態様では、バイオマーカの発現レベルは、遺伝子に関連付けられたRNA転写物の定量化を含むことができる。バイオマーカ発現レベルの特定について更に詳細に後述する。
【0051】
[0072] 本明細書で使用される場合、「感染バイオマーカ」という用語は、非感染植物生産物と比較して感染植物生産物において差次的に発現することが特定されているバイオマーカを含め、植物生産物における感染尤度を予測するのに適した任意のバイオマーカを指す。換言すれば、植物生産物における感染尤度の予測に適した感染バイオマーカは、植物生産物の感染と相関することが特定されているバイオマーカを含む。感染バイオマーカは例えば、非感染植物生産物と比較して感染植物生産物で閾値割合によって差次的に発現するバイオマーカを含むことができる。例えば、感染バイオマーカは、少なくとも0.1倍率変化(例えば少なくとも0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、10、又は20倍率変化)分、非感染植物生産物と比較して感染植物生産物で差次的に発現することが特定されているバイオマーカを含むことができる。表1は、例示的な感染バイオマーカの例のリストを含む。
【0052】
[0073] 本明細書で使用される場合、「ハウスキーピングバイオマーカ」は、植物生産物の感染と相関しないことが特定されている、植物生産物に適したバイオマーカを指す。換言すれば、ハウスキーピングバイオマーカ発現は、感染植物生産物及び非感染植物生産物の両方にわたって均一である(例えば、0.5、0.4、0.3、0.2、又は0.1未満の倍率変化を示す)。
【0053】
[0074] 本明細書で使用される場合、植物生産物に関する「エチレン処理」という用語は、収穫後植物生産物におけるエチレンの組成、消費、又は検出を変更するか、又は変更を目的とする任意の産物の適用又は使用を指す。幾つかの実施態様では、エチレン処理は、外因性ガスエチレンを収穫後植物生産物に適用して、成熟速度をコントロールすることを含む。他の実施態様では、エチレン処理は、エチレン阻害剤、エチレンブロッカー、又はエチレン吸収剤(例えば1-メチルシクロプペン、本明細書では「1-MCP」)を収穫後植物生産物に適用して、植物生産物の成熟率をコントロールし、又は日持ちをよくすることを含む。
【0054】
II.方法概説
[0075] 図1は、同じソースの植物生産物の集合における感染尤度を予測する例示的な方法100のフローチャートである。幾つかの実施形態では、植物生産物の閾値数よりも多い同じソースの植物生産物の彼集合。例えば、幾つかの実施態様では、植物生産物の閾値数は10よりも多い数であり得る。しかしながら、本開示はそのような閾値数に限定されず、同じソースの植物生産物の集合は10未満の植物生産物を含んでもよい。特定のステップは特定の順序で行われるように示されているが、方法のステップは幾つかの場合、図1と併せて説明されるものとは異なる順序で実行されてもよい。さらに、幾つかの場合、特定のステップは省略してもよく及び/又は他のステップで置換されてもよく、及び/又は追加のステップを追加してもよい。
【0055】
[0076] 図1に示すように、同じソースの植物生産物の集合における感染尤度を予測するために、植物生産物の部分集合が、同じソースの植物生産物の集合から選択される(101)。部分集合は典型的には、少なくとも2つ及び同じソースの植物生産物の集合における産物の総数の1/2未満の植物生産物を含む。同じソースの植物生産物の集合からの植物生産物の部分集合の選択101について図2Aに関して以下に更に詳細に考察する。
【0056】
[0077] 少なくとも1つの感染バイオマーカ及び任意選択的に少なくとも1つのハウスキーピングバイオマーカの発現レベルが、植物生産物の選択された部分集合の各植物生産物について特定される(102)。植物生産物における感染尤度の予測に適した感染バイオマーカ及びハウスキーピングバイオマーカの識別について以下更に詳細に考察する。しかしながら、手短に、植物生産物における感染尤度の予測に適した感染バイオマーカは、非感染植物生産物と比較して感染植物生産物において差次的に発現することが特定されているバイオマーカを含む。換言すれば、植物生産物における感染尤度の予測に適した感染バイオマーカは、植物生産物の感染と相関することが特定されているバイオマーカを含む。好ましい実施態様では、感染バイオマーカは例えば、非感染植物生産物と比較して感染植物生産物で閾値割合によって差次的に発現するバイオマーカを含む。例えば、感染バイオマーカは、少なくとも0.1倍率変化(例えば少なくとも0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、10、又は20倍率変化)分、非感染植物生産物と比較して感染植物生産物で差次的に発現することが特定されているバイオマーカを含むことができる。
【0057】
[0078] 植物生産物における感染尤度の予測に適したハウスキーピングバイオマーカは、植物生産物の感染と相関しないことが特定されているバイオマーカを含む。換言すれば、ハウスキーピングバイオマーカ発現は、感染植物生産物及び非感染植物生産物の両方にわたって均一である(例えば、0.5、0.4、0.3、0.2、又は0.1未満の倍率変化を示す)。詳細に以下考察するように、ハウスキーピングバイオマーカ発現は、感染植物生産物と非感染植物生産物との間で感染バイオマーカ発現を正規化するのに使用することができる。
【0058】
[0079] 幾つかの実施態様では、植物生産物でのバイオマーカ発現レベルは、植物生産物におけるバイオマーカ発現レベルを検出するように構成されたアレイ及び/又はキットを使用して植物生産物をテストすることによって特定することができる。幾つかの更なる実施態様では、植物生産物におけるバイオマーカ発現レベルを特定することは、バイオマーカ解析に向けて植物生産物を準備することを含むこともできる。例えば、植物生産物におけるバイオマーカ発現レベルを特定することは、バイオマーカ解析に向けて植物生産物から材料を抽出することを含むことができる。バイオマーカ解析に向けた植物生産物の準備について詳細に以下考察する。
【0059】
[0080] 次に、植物生産物の部分集合についてのバイオマーカ発現統計の集合が、部分集合中の各植物生産物についての少なくとも1つの感染バイオマーカの特定された発現レベル及び任意選択的に少なくとも1つのハウスキーピングバイオマーカの特定された発現レベルに基づいて特定される(103)。図2Cに関して詳細に以下考察するように、幾つかの実施態様では、植物生産物の部分集合についての2組のバイオマーカ発現統計は、植物生産物の部分集合中の各植物生産物についての少なくとも1つの感染バイオマーカの特徴スケーリング発現レベルに基づいて特定され、そして特徴スケーリング発現レベルは、植物生産物の部分集合中の各植物生産物についての少なくとも1つの感染バイオマーカの正規化発現レベルに基づいて特定される。さらに、図2Dに関して詳細に以下考察するように、植物生産物の部分集合についてのバイオマーカ発現統計の集合は、少なくとも1つの感染バイオマーカの特徴スケーリング発現レベルの平均、メジアン、最小、最大、標準偏差、5パーセンタイル、10パーセンタイル、15パーセンタイル、20パーセンタイル、25パーセンタイル、50パーセンタイル、75パーセンタイル、80パーセンタイル、90パーセンタイル、95パーセンタイル、及び99パーセンタイル、植物生産物の部分集合の各植物生産物についての少なくとも1つの感染バイオマーカのうちの少なくとも1つの感染バイオマーカの特徴スケーリング発現レベルと少なくとも1つの感染バイオマーカのうちの少なくとも1つの他の感染バイオマーカの特徴スケーリング発現レベルとの比率、並びに植物生産物の部分集合の各植物生産物についての少なくとも1つの感染バイオマーカのうちの少なくとも1つの感染バイオマーカの特徴スケーリング発現レベルと少なくとも1つの感染バイオマーカのうちの少なくとも1つの他の感染バイオマーカの特徴スケーリング発現レベルとの積の少なくとも1つを含むことができる。
【0060】
[0081] 最後に、同じソースの植物生産物の集合における感染尤度が、少なくとも部分的に植物生産物の部分集合について特定されたバイオマーカ発現統計の集合に基づいて予測される(104)。幾つかの実施態様では、図3図5Dに関して詳細に以下考察するように、同じソースの植物生産物の集合における感染尤度は、機械学習感染予測システムを使用して、少なくとも部分的に植物生産物の部分集合について特定されたバイオマーカ発現統計の集合に基づいて予測することができる。特定の実施態様では、同じソースの植物生産物の集合における感染尤度の予測は、6時間未満で完了することができる。
【0061】
[0082] 同じソースの植物生産物の集合における予測された感染尤度が次いで返され、幾つかの実施態様では、同じソースの植物生産物の集合の意図的な処理に利用される。例えば、同じソースの植物生産物の集合における、予測された潜伏感染尤度を使用して、植物生産物の集合をいつどこで販売するかを決定することができる。感染予測に基づく植物生産物処理の更なる実施態様について詳細に以下考察する。
【0062】
III.バイオマーカ解析する植物生産物の選択
[0083] 図2Aを参照すると、図2Aは、植物生産物の集合201から、植物生産物の集合201における感染尤度の予測に使用する植物生産物の部分集合202が選択される例示的なシステム環境200Aのブロック図である。
【0063】
[0084] 幾つかの実施態様では、同じソースの植物生産物の集合は合計でn個の植物生産物を含み、nは10よりも大きい整数である。例えば、図2Aに示すように、感染尤度が予測される植物生産物の集合201は、16の個々の植物生産物を含み、個々の各植物生産物は正方形で表されている。しかしながら、代替の実施態様では、同じソースの植物生産物の集合は任意の数量の個々の植物生産物を含むことができる。
【0064】
[0085] 更なる実施態様では、同じソースの植物生産物の集合から選択された植物生産物の部分集合は、m個の植物生産物を含むことができ、mは1よりも大きく及びn/2よりも小さい整数である。幾つかの実施態様では、同じソースの植物生産物の集合から選択された植物生産物の部分集合は、ランダムに選択することができる。例えば、図2Aに示すように、植物生産物の部分集合202は、同じソースの植物生産物の集合201からランダムに選択され、4つの個々の植物生産物を含む。しかしながら、代替の実施態様では、同じソースの植物生産物の集合から選択される植物生産物の部分集合は、任意の数量の個々の植物生産物を含むことができる。
【0065】
[0086] 同じソースの植物生産物の集合201からのm個の植物生産物の代表的な部分集合202を解析して(mは1よりも大きく及びn/2よりも小さい整数である)、n個の植物生産物の集合全体における感染尤度を予測することにより、n個の植物生産物の集合における感染を予測するのにかかる時間及びリソースが少なくなる。例えば、m個の植物生産物の部分集合を解析することにより、この予測を行うために犠牲になる植物生産物の数が少なくなり、それによりより高い生産物の品質で、なおかつ高い生産物の収率を実現することが可能となる。
【0066】
IV.バイオマーカ解析に向けた植物生産物の準備
[0087] 先に示唆したように、同じソースの植物生産物の集合から植物生産物の部分集合が選択された後、植物生産物の集合における感染尤度を予測するために、植物生産物の部分集合のうちの個々の各植物生産物における感染バイオマーカ及び任意選択的にハウスキーピングバイオマーカの発現が特定される。しかしながら、これもまた先に示唆したように、幾つかの場合、部分集合中の各植物生産物でのバイオマーカ発現レベルを特定する前に、部分集合の各植物生産物はバイオマーカ解析に向けて準備される。
【0067】
[0088] バイオマーカ解析に向けた植物生産物の準備は、測定される特定のバイオマーカに依存することができる。測定される特定のバイオマーカに応じて、植物生産物におけるバイオマーカ発現を多くの様々な方法に従って特定することができる。例えば、バイオマーカ発現は、ポリメラーゼ連鎖反応(PCR)、定量的ポリメラーゼ連鎖反応(qPCR)、逆転写ポリメラーゼ連鎖反応(RT-PCR)、逆転写定量的ポリメラーゼ連鎖反応(RT-qPCR)、リボ核酸(RNA)シーケンシング(RNA-seq)、Tag-seq、シーケンシングを使用したトランスポゼースアクセス可能クロマチンアッセイ(ATAC-seq)、CyTOF/SCoP、E-MS/Abseq、miRNA-seq、CITE-seq、質量分析(MS)、ガスクロマトグラフィ質量分析(GC-MS)、包括的二次元ガスクロマトグラフィ(GCxGC)、GCxGCと併せた固相マイクロ抽出(SPME)(SPME-GCxGC)、マトリックス支援レーザ脱離/イオン化(MALDI)、MALDI-TOF、及びそれらの任意の組合せによって測定することができる。測定方法は、測定されるバイオマーカに基づいて選択することができる。例えば、PCR及びqPCRはDNA発現を測定する。RT-PCR、RT-qPCR、RNA-seq、タグ-seq、及びmiRNA-seqはRNA発現を測定する。具体的には、RT-PCR、RT-qPCR、及びRNA-seqはRNA転写物の発現を測定し、タグ-seqは希少mRNA種の検出を可能にし、miRNA-seqはマイクロRNAの発現を測定する。CyTOF/SCoP及びE-MS/Abseqはタンパク質発現を測定する。CITE-seqは核酸発現及びタンパク質発現の両方を同時に測定する。そしてATAC-seqはクロマチン立体配座を測定する。
【0068】
[0089] 植物生産物は、測定されているバイオマーカ及びバイオマーカ測定方法に従ってバイオマーカ解析に向けて準備することができる。より具体的には、標的バイオマーカ及び標的バイオマーカ測定方法に基づいて、バイオマーカ測定のための材料(例えば植物生産物)を植物生産物から抽出することができる。例えば、バイオマーカが遺伝子を含み、RT-qPCRが植物生産物の遺伝子のRNA発現の定量化に使用される場合、RT-qPCRを使用してシーケンシングする前、1つ又は複数のRNA抽出方法を使用して植物生産物からRNAを抽出することができる。
【0069】
[0090] さらに、バイオマーカ解析を受けている植物生産物のタイプに応じて、バイオマーカ測定のために植物体材料を植物生産物の特定の部分から抽出することができる。例えば、幾つかの実施態様では、バイオマーカ測定のために、材料は植物生産物の外果皮、中果皮、及び内果皮の1つ又は複数から抽出することができる。
【0070】
V.植物生産物のバイオマーカ解析
[0091] 次に図2Bを参照すると、図2Bは、同じソースの植物生産物の集合についての感染尤度206が予測されるシステム環境200Bのブロック図である。図2B図2Aの拡張である。具体的には、図2Bに示される植物生産物の部分集合202は、図2Aにおける同じソースの植物生産物の集合201から選択された植物生産物の部分集合202である。したがって、図2Bは、図2Aの同じソースの植物生産物の集合についての感染尤度206が予測されるシステム環境200Bのブロック図である。
【0071】
[0092] 図2Bに示すように、明確にするために、植物生産物の部分集合202の個々の各植物生産物は、植物生産物202A、植物生産物202B、植物生産物202C、及び植物生産物202Dの1つとして記される。さらに、植物生産物の部分集合202における各植物生産物についての少なくとも1つの感染バイオマーカの発現レベル及び任意選択的に少なくとも1つのハウスキーピングバイオマーカの発現レベルが特定される。具体的には、植物生産物202Aについての感染バイオマーカ発現203A及び任意選択的にハウスキーピングバイオマーカ発現204Aが特定され、植物生産物202Bについての感染バイオマーカ発現203B及び任意選択的にハウスキーピングバイオマーカ発現204Bが特定され、植物生産物202Cについての感染バイオマーカ発現203C及び任意選択的にハウスキーピングバイオマーカ発現204Cが特定され、植物生産物202Dについての感染バイオマーカ発現203D及び任意選択的にハウスキーピングバイオマーカ発現204Dが特定される。
【0072】
[0093] 簡単に上述したように、バイオマーカの発現は、任意の測定方法に従ってバイオマーカの発現の代理として機能する任意の物質を測定することによって特定することができる。例えば、バイオマーカが遺伝子を含む場合、その遺伝子のRNA転写物のコピー数がその遺伝子の発現の代理であることができ、RT-qPCRを使用して、その遺伝子のRNA転写物のコピー数を定量化することができる。幾つかの更なる実施態様では、バイオマーカ発現は、バイオマーカ発現を検出するように構成されたアレイ及び/又はキットを使用して特定することができる。したがって、植物生産物の部分集合202の各植物生産物202A~Dについての少なくとも1つの感染バイオマーカ及び任意選択的に少なくとも1つのハウスキーピングバイオマーカの発現レベルは、任意の適した測定方法を使用してバイオマーカ発現の代理として機能する任意の物質を測定することによって特定される。各植物生産物で発現レベルが測定される少なくとも1つの感染バイオマーカ及び任意選択的に少なくとも1つのハウスキーピングバイオマーカの識別について詳細に以下考察する。
【0073】
[0094] 簡単に図2Bの例を参照すると、植物生産物202A~Dについての感染バイオマーカ発現203A~D及び任意選択的にハウスキーピングバイオマーカ発現の特定に続き、植物生産物の部分集合202についてのバイオマーカ発現統計の集合205が、植物生産物の部分集合202中の各植物生産物202A~Dについての感染バイオマーカ発現203A~D及び任意選択的にハウスキーピングバイオマーカ発現204A~Dに基づいて特定される。先に触れたように、植物生産物の部分集合202についてのバイオマーカ発現統計の集合205の特定について図2C及び図2Dに関して詳細に以下考察する。
【0074】
[0095] 最後に、図2Bに示すように、少なくとも部分的に植物生産物の部分集合202について特定されたバイオマーカ発現統計の集合205に基づいて,図2Aの同じソースの植物生産物の集合201についての感染尤度206が予測される。先に触れたように、感染尤度206の予測について図3図5Dに関して更に詳細に以下考察する。
【0075】
[0096] 植物生産物の集合の部分集合についてのバイオマーカ発現データ(例えばバイオマーカ発現レベル)、植物生産物の集合の部分集合のバイオマーカ発現統計の集合、及び植物生産物の集合の感染尤度は各々、場所の任意の組合せで特定することができる。一例として、植物生産物の集合の部分集合についてのバイオマーカ発現データ(例えばバイオマーカ発現レベル)、植物生産物の集合の部分集合についてのバイオマーカ発現統計の集合、及び植物生産物の集合の感染尤度は全て、植物生産物の場所で特定することができる。別の例では、植物生産物の集合の部分集合についてのバイオマーカ発現データ(例えばバイオマーカ発現レベル)は植物生産物の場所で特定することができ、次いで別の場所(例えばリモート計算システム)に送信されて、植物生産物の集合の部分集合についてのバイオマーカ発現統計の集合及び植物生産物の集合の感染尤度を特定することができる。代替の実施態様では、植物生産物の集合における感染尤度の予測は、場所の任意の代替の組合せで特定することができる。
【0076】
V.A.感染バイオマーカ
[0097] 本開示全体を通して考察するように、同じソースの植物生産物の集合から選択された植物生産物の部分集合のうちの各植物生産物における感染バイオマーカ及びハウスキーピングバイオマーカの発現レベルは、植物生産物の集合における感染尤度を予測するのに使用される。これもまた図に関して手短に先に考察したように、感染バイオマーカは、非感染植物生産物と比較して感染植物生産物において差次的に発現すると特定されているバイオマーカを含む。そして更に好ましい実施態様では、感染バイオマーカは、非感染植物生産物と比較して感染植物生産物において閾値パーセント分、差次的に発現するバイオマーカを含む。例えば、好ましい実施態様では、感染バイオマーカは、非感染植物生産物と比較して感染植物生産物において少なくとも0.1倍分、差次的に発現すると特定されているバイオマーカを含む。
【0077】
[0098] 以下示すように、表1は、差次的表現のこの基準を満たす例示的な1組のバイオマーカを示す。具体的には、表1は、感染植物生産物における発現が、非感染植物生産物での発現と比較して異なる1組の遺伝子を示す。さらに、幾つかの実施態様では、表1に列記された遺伝子は、感染植物生産物と非感染植物生産物との間での少なくとも0.1倍という閾値割合による差次的発現の好ましい基準も満たす。表1は、各遺伝子の経路/応答及び簡略表記も示す。遺伝子の経路/応答は、遺伝子が寄与する代謝経路又は遺伝子発現の下流への影響を示す。遺伝子の簡略表記は、遺伝子名の頭字語を示す。表1に列記された感染バイオマーカは、同じソースの植物生産物の集合における感染尤度を予測するために、単独で又はハウスキーピングバイオマーカと一緒に使用することができる。
【0078】
【表1】
【0079】
【表2】
【0080】
[0099] 実施例1において以下に更に詳細に考察するように、植物生産物間のバイオマーカ発現のばらつきを考慮に入れるために、感染バイオマーカ及びハウスキーピングバイオマーカの発現レベル又は感染バイオマーカ及び別の感染バイオマーカの発現レベルに基づいて、感染バイオマーカの正規化発現レベルを特定することができる。ハウスキーピングバイオマーカの発現又は別の感染バイオマーカの発現に対して感染バイオマーカ発現を正規化することにより、植物生産物間のベースライン感染バイオマーカ発現のばらつきをコントロールすることができる。
【0081】
[00100] 幾つかの実施態様では、特定の植物生産物についての表1の感染バイオマーカの特定の部分集合の発現レベルを検出し得る。例えば、潜伏感染について評価する植物又は植物の部分集合がアボカドを含む場合、表1中の感染バイオマーカの第1の特定の部分集合の発現レベルは、潜伏感染の存在を示し得る。幾つかの実施態様では、感染バイオマーカの第1の特定の部分集合は、PAL、GST、COMT、WRKY75、F3H、PR6、PR5、LOX、Prbl-2、又はカタラーゼ遺伝子の1つ又は複数を含むことができる。別の例として、潜伏感染について評価する植物又は植物の部分集合が、アプリケーションを含む場合、表1中の感染バイオマーカの第2の特定の部分集合の発現レベルの検出は、潜伏感染の有無を示し得る。幾つかの実施態様では、表1中の感染バイオマーカの第2の部分集合は、αファルネセン、FAハイパーオキシドリアーゼ、エチレン応答センサ1、エチレン応答転写因子1、TINY、ACシンターゼ、ACオキシダーゼ、PR10、レセプター様タンパク質キナーゼ7キチンエリシタ、リンゴ酸デヒドロゲナーゼ、ピュルビン酸デカルボキシラーゼ、フマル酸リアーゼ、PAL、又はC4Hの1つ又は複数を含むことができる。他の実施態様では、表1中の感染バイオマーカの第2の部分集合は、植物U-box29、キタナーゼ、シンタキシン121、フェルラ酸5-ヒドロキシラーゼ1、シンナマート-4-ヒドロキシラーゼ、フェニルアラニンアンモニアリアーゼ、エクスパンシンA8、9-cis-エポキシカロテノイドジオキシゲナーゼ9、WRKY31、LOX5、ACS1、ACO5、又はAP2の1つ又は複数を含むことができる。
【0082】
[00101] 表1中の感染バイオマーカのリスト及びバイオマーカの上記部分集合は非網羅的である。具体的には、非感染植物生産物と比較して感染植物生産物での異なる発現の基準を満たす追加のバイオマーカを表1に含めることができる。
【0083】
[00102] 幾つかの実施態様では、非感染植物の遺伝子の発現と異なる感染植物生産物の遺伝子の集合は、核酸シーケンサによって生成されたリード配列に対してバリアントコール解析を実行することによって識別することができる。例えば、核酸配列を使用して、植物生産物の集合から取得したサンプルをシーケンシングすることができる。取得されたサンプルに基づいて核酸シーケンサによって生成されたリード配列は、健康な植物の基準配列とアライメントすることができる。次いで、アライメントされたリード配列と基準配列との間のバリアント又は差を取得することができ、これは、非感染植物の遺伝子集合の発現と異なる感染植物の遺伝子集合の発現として機能する。
【0084】
V.B.ハウスキーピングバイオマーカ
[00103] 次に、図1に関して手短に先に考察したように、植物生産物における感染尤度の予測に使用されるハウスキーピングバイオマーカを参照すると、ハウスキーピングバイオマーカは、植物生産物における感染と相関しないと特定されているバイオマーカを含む。換言すれば、ハウスキーピングバイオマーカ発現の変化は、感染及び非感染植物生産物において0.5、0.4、0.3、0.2、又は0.1倍未満である。したがって、ハウスキーピングバイオマーカ発現を使用して、感染植物生産物と非感染植物生産物との間で感染バイオマーカ発現を正規化することができる。具体的には、ハウスキーピングバイオマーカ発現は、植物生産物間のベースライン代謝活性のばらつきをコントロールするのに使用することができる。
【0085】
[00104] 多くの植物生産物ハウスキーピングバイオマーカが当業者に既知である。以下の表2は、植物生産物においてハウスキーピングバイオマーカであることが知られており、感染植物生産物と非感染植物生産物との間で感染バイオマーカ発現を正規化するのに使用することができる遺伝子の集合を示す。表2は、各遺伝子の経路/応答及び簡略表記も示す。遺伝子の経路/応答は、遺伝子が寄与する代謝経路又は遺伝子発現の下流への影響を示す。遺伝子の簡略表記は、遺伝子名の頭字語を示す。
【0086】
【表3】
【0087】
[00105] 表2に列記した既知のハウスキーピングバイオマーカに加えて、任意の他のハウスキーピングバイオマーカが、本開示全体を通して考察される植物生産物における感染予測に使用することができる。追加のハウスキーピングバイオマーカを識別する方法も当業者に既知である。例えば、以下の公開物は、植物生産物におけるハウスキーピング遺伝子を識別する既知の方法について考察している:Chandna R,Augustine R,Bisht NC(2012)Evaluation of Candidate Reference Genes for Gene Expression Normalization in Brassica juncea Using Real Time Quantitative RT-PCR.PLoS ONE 7(5):e36918.https//doi.org/10.1371/journal.pone.0036918。この公開物は、同様の公開物と共に、植物生産物における感染予測に使用するための、表2に列記されたものとは別の追加のハウスキーピングバイオマーカを識別するのに使用することができる。
【0088】
[00106] 表2に列記されたハウスキーピングバイオマーカ及び既知の方法に従って識別された追加のハウスキーピングバイオマーカは、上記考察した感染バイオマーカと一緒に使用して、同じソースの植物生産物の集合における感染尤度を予測することができる。
【0089】
VI.バイオマーカ発現の統計解析
[00107] 同じソースの植物生産物の集合から選択された植物生産物の部分集合のうちの各植物生産物における少なくとも1つの感染バイオマーカ及び任意選択的に少なくとも1つのハウスキーピングバイオマーカの発現レベルの特定に続き、これらのバイオマーカ発現レベルの統計解析が実行される。具体的には、図2Bに関して手短に先に考察したように、植物生産物の部分集合202についてのバイオマーカ発現統計の集合205が、植物生産物の部分集合202中の各植物生産物202A~Dについての感染バイオマーカ発現203A~D及び任意選択的にハウスキーピングバイオマーカ発現204A~Dに基づいて特定される。このバイオマーカ発現統計の集合205を使用して、図3図5Dに関して詳細に以下考察するように、同じソースの植物生産物の集合における感染尤度206を予測する。
【0090】
[00108] 代替的には、幾つかの実施態様において、1つ又は複数のバイオマーカの絶対定量は、例えば、真正濃度標準、内部標準、又は既知の濃度の準備標準曲線の使用を採用して特定される。これらの場合、ハウスキーピングバイオマーカ発現は特定する必要がないことがある。
【0091】
VI.A.バイオマーカ発現統計の集合
[00109] 図2Cは、植物生産物の部分集合についてのバイオマーカ発現統計の集合が特定される例示的なシステム環境200Cのブロック図である。図2Cは、植物生産物の部分集合のうちの各植物生産物についての1つ又は複数のハウスキーピングバイオマーカの発現が測定される図2A及び図2Bの適用の拡張である。具体的には、図2Cに示されている植物生産物の部分集合202並びに植物生産物の部分集合202のうちの各植物生産物202A~Dについて特定された関連する感染バイオマーカ発現203A~D及びハウスキーピングバイオマーカ発現204A~Dは、図2Bから持ち越されている。したがって、図2Cは、図2A及び図2Bの植物生産物の部分集合202についてのバイオマーカ発現統計の集合205が特定されるシステム環境200Cのブロック図である。
【0092】
[00110] 図2Cに示すように、幾つかの実施態様では、植物生産物の部分集合202のバイオマーカ発現統計の集合205は、植物生産物の部分集合202の各202A~Dについての少なくとも1つの感染バイオマーカの正規化発現レベルを特定し、次いで植物生産物の部分集合202の各植物生産物202A~Dについての少なくとも1つの感染バイオマーカの特徴スケーリング発現レベルを特定することによって特定される。具体的には、図2Cに示す例示的な実施態様では、植物生産物の部分集合202の各植物生産物202A~Dについての少なくとも1つの感染バイオマーカの正規化発現レベル207A~Dは、各植物生産物202A~Dについて特定された感染バイオマーカ発現203A~D及びハウスキーピングバイオマーカ発現204A~Dに基づいて特定される。特に、植物生産物202Aについての少なくとも1つの感染バイオマーカの正規化発現レベル207Aは、植物生産物202Aについての感染バイオマーカ発現203A及びハウスキーピングバイオマーカ発現204Aに基づいて特定される。同様に、植物生産物202Bについての少なくとも1つの感染バイオマーカの正規化発現レベル207Bは、植物生産物202Bについての感染バイオマーカ発現203B及びハウスキーピングバイオマーカ発現204Bに基づいて特定される。植物生産物202Cについての少なくとも1つの感染バイオマーカの正規化発現レベル207Cは、植物生産物202Cについての感染バイオマーカ発現203C及びハウスキーピングバイオマーカ発現204Cに基づいて特定される。そして最後に、植物生産物202Dについての少なくとも1つの感染バイオマーカの正規化発現レベル207Dは、植物生産物202Dについての感染バイオマーカ発現203D及びハウスキーピングバイオマーカ発現204Dに基づいて特定される。
【0093】
[00111] 特定の実施態様では、植物生産物の感染バイオマーカの正規化発現レベルは、植物生産物における感染バイオマーカの発現レベルとハウスキーピングバイオマーカの発現レベルとの比率を特定することによって特定することができる。例えば、感染バイオマーカが表1に示されるPAL遺伝子を含み、ハウスキーピングバイオマーカが表2に示されるアクチン遺伝子を含む一実施態様では、植物生産物のPAL遺伝子の正規化発現レベルは、植物生産物におけるPAL遺伝子の発現レベルと植物生産物におけるアクチン遺伝子の発現レベルとの比率を含むことができる。先に手短に考察したように、ハウスキーピングバイオマーカに対して感染バイオマーカの発現レベルを正規化することにより、植物生産物間のベースライン代謝活性のばらつきをコントロールすることができる。
【0094】
[00112] 植物生産物の部分集合202の各植物生産物202A~Dについての少なくとも1つの感染バイオマーカの正規化発現レベル207A~Dの特定後、植物生産物の部分集合202の各植物生産物202A~Dについての少なくとも1つの感染バイオマーカの特徴スケーリング発現レベル208A~Dを特定することができる。具体的には、図2Cに示す実施態様では、植物生産物の部分集合202の各植物生産物202A~Dについての少なくとも1つの感染バイオマーカの特徴スケーリング発現レベル208A~Dは、各植物生産物202A~Dについての少なくとも1つの感染バイオマーカの正規化発現レベル207A~Dに基づいて特定される。特に、植物生産物202Aについての少なくとも1つの感染バイオマーカの特徴スケーリング発現レベル208Aは、植物生産物202Aについての少なくとも1つの感染バイオマーカの正規化発現レベル207Aに基づいて特定される。同様に、植物生産物202Bについての少なくとも1つの感染バイオマーカの特徴スケーリング発現レベル208Bは、植物生産物202Bについての少なくとも1つの感染バイオマーカの正規化発現レベル207Bに基づいて特定される。植物生産物202Cについての少なくとも1つの感染バイオマーカの特徴スケーリング発現レベル208Cは、植物生産物202Cについての少なくとも1つの感染バイオマーカの正規化発現レベル207Cに基づいて特定される。そして最後に、植物生産物202Dについての少なくとも1つの感染バイオマーカの特徴スケーリング発現レベル208Dは、植物生産物202Dについての少なくとも1つの感染バイオマーカの正規化発現レベル207Dに基づいて特定される。
【0095】
[00113] 一般に、植物生産物についての感染バイオマーカの特徴スケーリング発現レベルは、例えば、植物生産物の感染バイオマーカの正規化発現レベルの最小最大正規化及び対数変換のうちの少なくとも一方を実行することによって特定することができる。
【0096】
[00114] 最後に、図2Cに示すように、植物生産物の部分集合202についてのバイオマーカ発現統計の集合205が、各植物生産物202A~Dの少なくとも1つの感染バイオマーカの特徴スケーリング発現レベル208A~Dに基づいて特定される。バイオマーカ発現統計の集合205のこの特定の一実施態様について図2Dに関して示し考察する。
【0097】
[00115] 図2Dは、植物生産物の部分集合についてのバイオマーカ発現統計の集合が特定される例示的なシステム環境200Dのブロック図である。図2D図2A図2Cの拡張である。具体的には、図2Dに示される植物生産物202A~Dについての少なくとも1つの感染バイオマーカの特徴スケーリング発現レベル208A~Dは、図2Cから持ち越されている。したがって、図2Dは、図2A図2Dの植物生産物の部分集合202についてのバイオマーカ発現統計の集合205が特定されるシステム環境200Dのブロック図である。
【0098】
[00116] 図2Dに示し、図2Cに関して先に考察したように、幾つかの実施態様では、植物生産物の部分集合202についてのバイオマーカ発現統計の集合205は、各植物生産物202A~Dの少なくとも1つの感染バイオマーカの特徴スケーリング発現レベル208A~Dに基づいて特定される。さらに、図2Dに示す実施態様では、植物生産物の部分集合202について特定されるバイオマーカ発現統計の集合205は、少なくとも1つの感染バイオマーカの特徴スケーリング発現レベル208A~Dの平均、メジアン、最小、最大、標準偏差、5パーセンタイル、10パーセンタイル、15パーセンタイル、20パーセンタイル、25パーセンタイル、50パーセンタイル、75パーセンタイル、80パーセンタイル、90パーセンタイル、95パーセンタイル、及び99パーセンタイル(図2Dにおける209)、植物生産物の部分集合202の各植物生産物202A~Dについての少なくとも1つの感染バイオマーカのうちの少なくとも1つの感染バイオマーカの特徴スケーリング発現レベルと少なくとも1つの感染バイオマーカのうちの少なくとも1つの他の感染バイオマーカの特徴スケーリング発現レベルとの比率210、及び植物生産物の部分集合202の各植物生産物202A~Dについての少なくとも1つの感染バイオマーカのうちの少なくとも1つの感染バイオマーカの特徴スケーリング発現レベルと少なくとも1つの感染バイオマーカのうちの少なくとも1つの他の感染バイオマーカの特徴スケーリング発現レベルとの積210の少なくとも1つを含む。
【0099】
[00117] 例えば、感染バイオマーカが表1に示されるPAL遺伝子及びF3H遺伝子を含む図2Dの一実施態様では、植物生産物の部分集合202のバイオマーカ発現統計の集合205は、PAL遺伝子の特徴スケーリング発現レベル208A~Dの平均209、F3H遺伝子の特徴スケーリング発現レベル208A~Dの平均209、植物生産物202AでのPAL遺伝子の特徴スケーリング発現レベル208AとF3H遺伝子の特徴スケーリング発現レベル208Aとの比率210、植物生産物202BでのPAL遺伝子の特徴スケーリング発現レベル208BとF3H遺伝子の特徴スケーリング発現レベル208Bとの比率210、植物生産物202CでのPAL遺伝子の特徴スケーリング発現レベル208CとF3H遺伝子の特徴スケーリング発現レベル208Cとの比率210、及び植物生産物202DでのPAL遺伝子の特徴スケーリング発現レベル208DとF3H遺伝子の特徴スケーリング発現レベル208Dとの比率210を含むことができる。
【0100】
[00118] 代替の実施態様では、植物生産物の部分集合202についてのバイオマーカ発現統計の集合205は、植物生産物202A~Dの感染バイオマーカ発現203A~D及びハウスキーピングバイオマーカ発現204A~D及び/又は植物生産物202A~Dの少なくとも1つの感染バイオマーカの特徴スケーリング発現208A~Dに基づく任意の統計を含むことができる。
【0101】
[00119] 更なる実施態様では、植物生産物の部分集合202についてのバイオマーカ発現統計の集合205は、植物生産物202A~Dの感染バイオマーカ発現203A~D及びハウスキーピングバイオマーカ発現204A~Dに基づく統計、植物生産物202A~Dについての少なくとも1つの感染バイオマーカの特徴スケーリング発現208A~Dに基づく統計、及び/又は例えば内部標準又は既知の濃度の準備標準曲線を使用して特定される絶対発現値に基づく統計の組合せを含むことができる。
【0102】
[00120] 最後に、図2Dに示すように、植物生産物の部分集合202についてのバイオマーカ発現統計の集合205を使用して、同じソースの植物生産物の集合201についての感染尤度206を予測する。感染尤度206のこの予測について図3図5Dに関して詳細に以下考察する。
【0103】
VIII.追加の方法の概説
[00121] 同じソースの植物生産物の集合における感染尤度を予測する別の方法1200を図12のフローチャートに概略的に示す。同じソースの植物生産物の集合は典型的には、本明細書に記載の解析方法を統計学的に有効することができるように十分に大きな数の植物生産物(例えば10を超える植物生産物)を含む。特定のステップが特定の順序で行われるように示されているが、幾つかの場合、方法のステップは、図12と併せて説明したものとは異なる順序で実行することができる。さらに、幾つかの場合、特定のステップは省略されてもよく、及び/又は他のステップで置換されてもよく、及び/又は追加のステップを追加してもよい。
【0104】
[00122] 図12に示すように、同じソースの植物生産物の集合における感染尤度を予測するために、植物生産物の部分集合が、同じソースの植物生産物の集合から選択される(1201)。部分集合は典型的には、少なくとも3つ及び同じソースの植物生産物の集合における産物の総数の1/2未満の植物生産物を含む。同じソースの植物生産物の集合からの植物生産物の部分集合の選択1201は、図1の方法100を参照して先に考察したプロセスと同じプロセスを辿ることができる。次いで、部分集合の植物生産物はサブグループに分割され、各サブグループは、部分集合の植物生産物の1つ又は複数を含む(ステップ1202)。次いで、各サブグループについて、サブグループの各植物生産物からの植物体が組み合わせられて、プール植物体のグループを形成する(ステップ1203)。サブグループの各植物生産物からの植物体を組み合わせることは、例えば、サブグループの全ての植物生産物をブレンダーに一緒に入れ、それらをブレンドしてプール植物体のグループを形成することを含むことができる。
【0105】
[00123] 次いで、各プール植物体グループについての少なくとも1つの感染バイオマーカ及び任意選択的に少なくとも1つのハウスキーピングバイオマーカの発現レベルが特定される(ステップ1204)。バイオマーカ解析に向けた植物体の準備並びに植物生産物における感染尤度の予測に適した感染バイオマーカ及びハウスキーピングバイオマーカの識別は、図1の方法100を参照して先に説明したものと同じプロセスを辿ることができる。
【0106】
[00124] 次に、プール植物体グループの集まりについてのバイオマーカ発現統計の集合が、各プール植物体グループについての少なくとも1つの感染バイオマーカ及び任意選択的に少なくとも1つのハウスキーピングバイオマーカの特定された発現レベルに基づいて特定される(ステップ1205)。詳細に上述した方法100におけるバイオマーカ発現統計の集合の特定に使用されるものと同じ方法及びメトリックが、図12の方法1200と併用可能である。
【0107】
[00125] 最後に、同じソースの植物生産物の集合における感染尤度が、少なくとも部分的に、プール植物体グループの集まりについて特定されたバイオマーカ発現統計の集合に基づいて予測される(ステップ1206)。同じソースの植物生産物の集合における感染尤度の予測は、図1の方法100を参照して上述したものと同じプロセス及びメトリックに従うことができる。次いで、同じソースの植物生産物の集合における予測感染尤度を返すことができ、幾つかの実施態様では、それを利用して、同じソースの植物生産物の集合を意図的に処理することができる。例えば、同じソースの植物生産物の集合における予測潜伏感染尤度を使用して、植物生産物の集合をいつどこで販売するかを決定することができる。
【0108】
[00126] 図13は、図12の方法1200に基づいて、同じソースの植物生産物の集合の感染尤度1306が予測されるシステム環境1300のブロック図である。具体的には、図13に示される植物生産物の部分集合1302は、図12のステップ1201において同じソースの植物生産物の集合から選択される植物生産物の部分集合に対応する。図13に示すように、明確にするために、植物生産物の部分集合1302の個々の各植物生産物は、植物生産物1302A、植物生産物1302B、植物生産物1302C、及び植物生産物1302Dの1つとして記される。図13における植物生産物の部分集合1302は4つの植物生産物を含んで示されているが、部分集合は3、4、又は5以上の植物生産物を含むことができる。
【0109】
[00127] なお図13を参照すると、図12のステップ1202に対応して、植物生産物1302A及び1302Bは次いで第1のサブグループ1308Aにグループ化され、植物生産物1302C及び1302Dは次いで第2のサブグループ1308Bにグループ化される。図13では、各サブグループは同数の植物生産物を含むが、一般に、サブグループは同数の植物生産物を有する必要はなく、各サブグループは、部分集合1302のうちの少なくとも1つの植物生産物を含むべきである。図12におけるステップ1203に対応して、各サブグループ(例えば1308A及び1308B)について、サブグループ内の各植物生産物からの植物体が次いで組み合わせられて、プール植物体のグループ1310A及び1310Bをそれぞれ形成する。例えば、サブグループ1308Aの植物生産物1302A及び1302Bはブレンダーに配置され、ブレンドされてプール植物体グループ1310Aを形成することができ、サブグループ1308Bの植物生産物1302C及び1302Dは別のブレンダーに配置され、ブレンドされてプール植物体グループ1310Bを形成することができる。
【0110】
[00128] 次に、図12のステップ1204に対応して、プール植物体グループ1310A及び1310Bの各々について、少なくとも1つの感染バイオマーカの発現レベル及び任意選択的に少なくとも1つのハウスキーピングバイオマーカの発現レベルが特定される。具体的には、プール植物体グループ1310Aについての感染バイオマーカ発現1303A及び任意選択的なハウスキーピングバイオマーカ発現1304Aが特定され、プール植物体グループ1310Bについての感染バイオマーカ発現1303B及び任意選択的なハウスキーピングバイオマーカ発現1304Bが特定される。先に考察したように、バイオマーカの発現は、任意の測定方法により、バイオマーカの発現の代理として機能する任意の物質を測定することによって特定することができる。例えば、バイオマーカが遺伝子を含む場合、遺伝子のRNA転写物のコピー数が遺伝子の発現の代理であることができ、RT-qPCRを使用して、遺伝子のRNA転写物のコピー数を定量化することができる。幾つかの更なる実施態様では、バイオマーカ発現は、バイオマーカ発現を検出するように構成されたアレイ及び/又はキットを使用して特定することができる。したがって、各プール植物体グループ1310A及び1310Bについての少なくとも1つの感染バイオマーカ及び任意選択的に少なくとも1つのハウスキーピングバイオマーカの発現レベルは、任意の適した測定方法を使用して、バイオマーカの発現の代理として機能する任意の物質を測定することによって特定される。
【0111】
[00129] プール植物体グループ1310A及び1310Bについての感染バイオマーカ発現1303A及び1303B並びに任意選択的なハウスキーピングバイオマーカ発現1304A及び1304Bの特定に続き、図12におけるステップ1205に対応して、プール植物体グループの集まりについてのバイオマーカ発現統計の集合1305が、感染バイオマーカ発現1303A及び1303B並びに任意選択的にハウスキーピングバイオマーカ発現1304A及び1304Bに基づいて特定される。最後に、図12におけるステップ1206に対応して、少なくとも部分的に、植物生産物の部分集合1302について特定されたバイオマーカ発現統計の集合1305に基づいて、部分集合1302の植物生産物が選択された同じソースの植物生産物の集合の感染尤度1306が予測される。
【0112】
IX.感染予測システム
[00130] 先に触れたように、同じソースの植物生産物の集合における感染尤度は、機械学習感染予測システムを使用して、同じソースの植物生産物の集合から選択された植物生産物の部分集合についてのバイオマーカ発現統計の集合に基づいて予測することができる。図3は、同じソースの植物生産物の集合における感染尤度303を予測するように構成された感染予測システム302のシステム環境300のブロック図である。図4に関して更に詳細に以下考察するように、感染予測システム302は少なくとも部分的に機械学習感染予測モデルを含む。代替の構成では、異なる構成要素及び/又は追加の構成要素がシステム環境300に含まれ得る。
【0113】
[00131] 図3に示すように、感染予測システム302は、同じソースの植物生産物の集合から選択された植物生産物の部分集合についてのバイオマーカ発現統計の集合301の入力を受信する。バイオマーカ発現統計の集合は、上述した実施態様の1つに従って特定することができる。
【0114】
[00132] 幾つかの実施態様では、感染予測システム302を含む感染予測モデルにバイオマーカ発現統計の集合301を入力する前、バイオマーカ発現統計の集合301は符号化される。具体的には、幾つかの実施態様では、感染予測システム302に入力される前、バイオマーカ発現統計の集合301は符号化される。代替の実施態様では、感染予測システム302は符号化モジュールを含み、バイオマーカ発現統計の集合301は、感染予測システム302への入力後であるが、感染予測システム302の感染予測モデルに入力される前、符号化モジュールによって符号化される。幾つかの実施態様では例えば、バイオマーカ発現統計の集合301は、ビットアレイを含むデータ構造に符号化することができる。例えば、200,000コピーというある遺伝子のRNA転写物のメジアン特徴スケーリング発現レベルを含むバイオマーカ発現統計の集合は、[110000110101000000]としてビットアレイに符号化することができる。感染予測システム302の感染予測モデルに入力される前、バイオマーカ発現統計の集合301を符号化する代替の方法が使用されてもよい。
【0115】
[00133] バイオマーカ発現統計の集合301の入力は、感染予測システム302によって処理されて、同じソースの植物生産物の集合における感染尤度303を生成、出力する。感染予測システム302によって出力される感染尤度303は、同じソースの植物生産物の集合における感染尤度の予測を含む。幾つかの実施態様では、感染予測システム302によって出力される感染尤度は、同じソースの植物生産物の集合における感染尤度のバイナリ予測を含む。例えば、感染予測システム302によって出力される感染尤度は、同じソースの植物生産物の集合が感染している旨のバイナリ予測を表す「1」であるか、又は同じソースの植物生産物の集合が感染していない旨のバイナリ予測を表す「0」であることができる。
【0116】
[00134] 代替の実施態様では、感染予測システム302によって出力される感染尤度は、同じソースの植物生産物の集合の感染植物生産物の割合の予測を含む。例えば、感染予測システム302によって出力される感染尤度は、0.27であることができ、植物生産物の集合における植物生産物の27%が感染しているとの予測を表す。
【0117】
[00135] 幾つかの実施態様では、感染予測システム302によって出力される感染尤度は、同じソースの植物生産物の集合の閾値割合が感染している尤度(例えばパーセント尤度)の予測を含む。例えば、感染予測システム302によって出力される感染尤度は、植物生産物の集合における植物生産物の少なくとも1/5(即ち20%)が感染している旨の0.25(即ち25%)であることができる。
【0118】
[00136] 更なる実施態様では、感染予測システム302によって出力される感染尤度は、同じソースの植物生産物の集合における感染尤度の任意の他の予測を含むことができる。
【0119】
IX.A.感染予測システムアーキテクチャ
[00137] 次に図4を参照すると、図4は、同じソースの植物生産物の集合における感染尤度を予測するように構成された感染予測システム400のアーキテクチャのブロック図である。感染予測システム400は、トレーニングモジュール401、データストア402、データ管理モジュール403、及び感染予測モデル404を含む。感染予測モデル404は、関数405及びパラメータセット406を更に含む。他の実施態様では、感染予測システム400は、種々の用途で追加、より少数、又は異なる構成要素を含み得る。同様に、関数は、本明細書に記載されるものとは異なる様式でモジュール間に分散することができる。ネットワークインターフェース、セキュリティ機能、負荷平衡器、ファイルオーバサーバ、管理及びネットワーク動作コンソール等の従来の構成要素は、システムアーキテクチャの詳細を曖昧にしないように示されていない。
【0120】
IX.A.1.トレーニングモジュール
[00138] トレーニングモジュール401は、トレーニングデータセットに基づいて感染予測モデル404を構築する。一般に、感染予測モデル404は、独立変数(例えばバイオマーカ発現統計の集合)間の関係を捕捉する関数405と、損失関数が最小化されるようなトレーニングデータセット中の従属変数(例えば感染率)とを含む。
【0121】
[00139] トレーニングデータセットを使用して感染予測モデル404を構築するには、トレーニングデータセットからの各トレーニングサンプルiが感染予測モデル404に入力される。感染予測モデル404は、まるでモデルが同じソースの植物生産物の集合における感染尤度を生成するのに日常的に使用されているかのようにこれらの入力を処理する。しかしながら、感染予測モデル404の日常的な使用とは異なり、感染予測モデル404のトレーニング中、トレーニングデータセットからの遡及感染率もモデルに入力される。具体的には、トレーニング中、同じソースの植物生産物の集合について正確であることが既知である遡及感染率もモデルに入力される。
【0122】
[00140] トレーニングデータセット中のトレーニングサンプルiを使用して感染予測モデル404を各々反復した後、モデルは、同じソースの植物生産物の集合における予測感染尤度と同じソースの植物生産物の集合における実際の遡及感染率との間の差を特定する。次いで、感染予測モデル404はこの差を最小化しようとする。具体的には、モデルは、同じソースの植物生産物の集合における予測感染尤度と同じソースの植物生産物の集合における実際の遡及感染率との間の差を最小化しようとする。
【0123】
[00141] この差を最小化するために、感染予測モデル404は、感染予測モデル404の損失関数を最小化する。損失関数
は、トレーニングデータS中の1つ又は複数のトレーニングサンプルiについての従属変数uの値(例えば既知の遡及感染率)とモデル404によって生成されるトレーニングサンプルiについての従属変数yi∈Sの値(例えば予測感染尤度)との間の不一致を表す。簡単に言えば、損失関数は、モデル404によって出力される予測感染尤度とトレーニングデータセットにおける既知の遡及感染率との間の差を表す。当業者に既知の複数の損失関数があり、予測感染モデル404の生成に当たりこれらの損失関数の任意の1つを利用することができる。
【0124】
[00142] θに関して損失関数を最小化することにより、パラメータセットθの値を特定することができる。幾つかの実施態様では、感染予測モデル404は、パラメータセットθがパラメータ406を含み、独立変数(例えばバイオマーカ発現統計の集合)と従属変数(例えば感染率)との間の依存性を指定するように関数405を変更するパラメトリックモデルであることができる。換言すれば、損失関数を最小化することによって特定されるパラメータセットθは、パラメータセット406を含むことができ、感染予測モデル404の正解率が最適化されるように感染予測モデル404の関数405を変更するのに使用することができる。典型的には、損失関数を最小化するパラメトリック型モデルのパラメータは、バッチ勾配アルゴリズム、確率勾配等の勾配ベースの数値最適化アルゴリズムを通して特定される。代替的には、感染予測モデル404は、モデル構造がトレーニングデータセットから決定され、厳密には固定パラメータセットに基づかない非パラメトリックモデルであり得る。
【0125】
[00143] 感染予測モデル404がパラメトリックモデルを含む実施態様では、モデルは一般に、
y=f(x;θ) (1)
として表すことができ、式中、yは、感染予測モデル404によって特定される同じソースの植物生産物の集合における感染尤度を示し、xは、同じソースの植物生産物の部分集合についてのバイオマーカ発現統計の集合を示し、θは、θに関して損失関数を最小化することによって特定されるパラメータセット406を示し、f(・)は関数405を示す。幾つかの実施態様では、バイオマーカ発現統計xは、関数f(・)に入力される前に組み合わせられる。代替の実施態様では、バイオマーカ発現統計xは、関数f(・)に入力される前に組み合わせられない。
【0126】
[00144] 関数405は任意の関数であることができる。例えば、幾つかの実施態様では、関数405は、バイナリロジスティック回帰モデル、ロジスティックモデルツリー、ランダムフォレスト分類器、L2正則化、部分最小二乗分類、ナイーブベイズ分類器、多変量適応回帰スパイン、1つ又は複数のニューラルネットワーク、及びk最近傍分類の1つを含むことができる。
【0127】
[00145] 代替の実施態様では、感染予測モデル404は、バイオマーカ発現統計の集合x中の各バイオマーカ発現統計に別個の関数405及び別個のパラメータセット406を含む。例えば、先に考察したように、バイオマーカ発現統計の集合xは、少なくとも1つの感染バイオマーカの特徴スケーリング発現レベル又は絶対発現レベルの平均、メジアン、最小、最大、標準偏差、5パーセンタイル、10パーセンタイル、15パーセンタイル、20パーセンタイル、25パーセンタイル、50パーセンタイル、75パーセンタイル、80パーセンタイル、90パーセンタイル、95パーセンタイル、及び99パーセンタイルの2つ以上、少なくとも1つの感染バイオマーカの特徴スケーリング発現レベルと少なくとも1つの他の感染バイオマーカの特徴スケーリング発現レベルとの比率、並びに少なくとも1つの感染バイオマーカの特徴スケーリング発現レベルと少なくとも1つの他の感染バイオマーカの特徴スケーリング発現レベルとの積を含むことができる。さらに、バイオマーカ発現統計の集合xは、2つ以上の感染バイオマーカを記述する統計を含むことができる。そのような実施態様では、各バイオマーカ発現統計及び/又は各感染バイオマーカに別個のパラメータセットθを特定することができる。例えば、バイオマーカ発現統計の集合xが独立変数x、即ち感染バイオマーカA特徴スケーリング発現レベルと、x、即ち感染バイオマーカAの特徴スケーリング発現レベルと感染バイオマーカBの特徴スケーリング発現レベルとの比率を含む一実施態様では、各独立変数x及びxにそれぞれ別個のパラメータセットθ及びθを特定することができる。パラメータセットθの値は、θに関して損失関数を最小化することによって特定され、パラメータセットθの値は、θに関して損失関数を最小化することによって特定される。次いでパラメータセットθを使用して、第1の関数f(x;θ)を変更し、パラメータセットθを使用して、第2の関数f(x;θ)を変更する。最後に、別個のパラメータセットによって変更されたこれらの別個の関数を組み合わせて、同じソースの植物生産物の集合における感染尤度を生成することができる。そのような実施態様では、感染予測モデル404は、
y=f(x;θ)+f(x;θ) (2)
として表すことができ、式中、yは、感染予測モデル404によって特定される同じソースの植物生産物の集合における感染尤度を示し、xは第1の独立変数(例えば、感染バイオマーカA特徴スケーリング発現レベルの25パーセンタイル)を示し、xは第2の独立変数(例えば、感染バイオマーカAの特徴スケーリング発現レベルと感染バイオマーカBの特徴スケーリング発現レベルとの比率)を示し、θは、θに関して損失関数を最小化することによって特定される第1のパラメータセット406を示し、θは、θに関して損失関数を最小化することによって特定される第2のパラメータセット406を示し、f(・)は関数405である。式1に関して先に考察したように、関数f(・)は任意の関数であることができる。さらに、式2に示されるf(・)関数は同じ関数である必要はない。
【0128】
[00146] 感染予測モデル404が閾値レベルの予測精度を達成する場合(例えば損失関数が十分に最小化される場合)、モデルは使用可能な状態にある。感染予測モデル404が、使用に十分な閾値レベルの予測精度を達成した場合を判断するために、感染予測モデル404の検証を実行することができる。感染予測モデル404の検証について図5Cに関して更に詳細に以下考察する。
【0129】
[00147] 感染予測モデル404が、使用に十分な閾値レベルの予測精度を達成したと検証されると、幾つかの実施態様では、これはモデルをトレーニングの継続から除外しない。実際には、好ましい実施態様では、検証に拘わらず、損失関数が低下し続け、モデルの精度が改善し続けるようにモデルのパラメータセット406が連続更新されるよう感染予測モデル404はトレーニングを継続する。
【0130】
IX.A.2.データストア
[00148] 幾つかの実施態様では、データストア402は、トレーニングモデル401に関して先に考察したように、感染予測モデル404をトレーニングするのに使用されるトレーニングデータセットを記憶する。トレーニングデータセットは複数のトレーニングサンプルを含む。トレーニングデータセットからの各トレーニングサンプルiは、同じソースの植物生産物の遡及集合と関連付けられる。具体的には、トレーニングデータセットからの各トレーニングサンプルiは、実際の既知の感染率が既知である同じソースの植物生産物の遡及集合と関連付けられる。各トレーニングサンプルiは、同じソースの植物生産物の遡及集合の部分集合についてのバイオマーカ発現統計の集合と、同じソースの植物生産物の遡及集合における実際の既知の感染率とを含む。特定の実施態様では、トレーニング中、感染予測モデル404に入力される同じソースの植物生産物の遡及集合における実際の既知の感染率は、感染予測モデル404に入力されたバイオマーカ発現統計の集合の符号化に関して先に考察したように符号化される。
【0131】
[00149] 図5A及び図5Cに関して詳細に以下考察する幾つかの実施態様では、トレーニングデータセットからの1つ又は複数のトレーニングサンプルは、トレーニング外に保持することができ、感染予測モデル404の検証に使用することができる。
【0132】
IX.A.3.データ管理モジュール
[00150] データ管理モジュール403は、感染予測モデル404のトレーニングに使用されるトレーニングデータセットを生成する。先に触れたように、トレーニングデータセットからの各トレーニングサンプルiは、同じソースの植物生産物の遡及集合及び同じソースの植物生産物の遡及集合における実際の既知の感染率と関連付けられる。したがって、トレーニングデータセットを生成するためにデータ管理モジュール403によって使用されるデータは、遡及データソースから調達することができる。
【0133】
[00151] トレーニングデータセットがデータストア402によって記憶される実施態様では、データ管理モジュール403は、生成されたトレーニングデータセットをデータストア402に記憶する。感染予測モデル404も検証される実施態様では、データ管理モジュール403は、感染予測モデル404の検証に使用するために、トレーニングデータセットからのトレーニングサンプルを外に保持することもできる。
【0134】
IX.A.4.感染予測モデル
[00152] 感染予測モデル404は、同じソースの植物生産物の集合から選択された植物生産物の部分集合についてのバイオマーカ発現統計の集合の入力を受け取り、同じソースの植物生産物の集合における感染尤度を予測するように構成された機械学習モデルである。先に考察したように、一般に、感染予測モデル404は、トレーニングデータセット中の独立変数(例えばバイオマーカ発現統計の集合)と従属変数(例えば感染率)との間の関係を正確に捕捉するようにパラメータセット406によって変更された関数405を含む。先に考察したように、幾つかの実施態様では、関数405は、バイナリロジスティック回帰モデル、ロジスティックモデルツリー、ランダムフォレスト分類器、L2正則化、部分最小二乗分類、ナイーブベイズ分類器、多変量適応回帰スパイン、1つ又は複数のニューラルネットワーク、及びk最近傍分類の1つを含む。
【0135】
[00153] 幾つかの実施態様では、感染予測モデル404は、同じソースの植物生産物の集合における感染尤度を予測するように構成された単一モデルを含む。しかしながら、代替の実施態様では、感染予測モデル404は、各々が特定のタスクを実行するように構成された複数の別個のモデルを含むことができる。例えば、一実施態様では、感染予測モデル404は、各々が特定のタイプの感染の尤度を予測するように構成された複数のモデルを含むことができる。
【0136】
X.感染予測システムのトレーニング、検証、及び使用
[00154] 図5Aは、感染予測システムがトレーニング、検証、使用されるシステム環境500Aのブロック図を示す。図5Aは、トレーニングフェーズ501、検証フェーズ502、使用フェーズ503、遡及データ記憶504、及び将来(prospective)データ記憶505を含む。したがって、図5Aは、感染予測システムをトレーニング、検証、テストするために、遡及データ及び将来データがいかに使用されるかを示す。
【0137】
[00155] 図4に関して先に考察したように、感染予測システムの使用前、システムはトレーニングされる。図5Aに示すように、感染予測システムのトレーニングは、遡及データソース504から受信された遡及データを使用して達成される。遡及データソース504は、図4のデータストア402に関して先に考察したように、トレーニングデータサンプルを含むトレーニングデータセットを含む。換言すれば、遡及データソース504は、同じソースの植物生産物の集合における過去感染率を記述するデータを含む。遡及データソース504に含まれるデータは、プライベートデータ、公開利用可能データ、商業的に利用可能なデータ、使用フェーズ503において感染予測モデル404を使用したテストを経た後にリサイクルされたテストデータ、及び/又は任意の他の遡及データソースを含むことができる。
【0138】
[00156] トレーニングに続き又はトレーニングと併せて、幾つかの実施態様では、感染予測システムは検証フェーズ502における検証を経て、システムが閾値レベルの予測精度を達成し、使用可能な状態であるか否かを判断することもできる。先に手短に考察したように、感染予測システムが検証される実施態様では、遡及データソース504からの1つ又は複数のトレーニングサンプルは、トレーニングフェーズ501外に保持することができ、感染予測システムの検証に使用することができる。
【0139】
[00157] 感染予測システムが、使用に十分な閾値レベルの予測精度を達成したと検証されると、システムは使用フェーズ503への準備ができる。しかしながら、幾つかの実施態様では、これはシステムを継続したトレーニングから除外しない。実際には、好ましい実施態様では、検証にも拘わらず、システムが連続更新され、システムの精度が改善し続けるように、感染予測システムはトレーニングを受け続ける。
【0140】
[00158] 使用フェーズ503を参照すると、感染予測システムを使用して、将来データソース505から受信した将来データと関連付けられた同じソースの植物生産物の集合における感染尤度を予測する。将来データソース505は、感染尤度が予測される同じソースの植物生産物の集合の部分集合についての独立変数(例えばバイオマーカ発現統計の集合)を記述するデータを含む。将来データソース505に含まれるデータは、公開利用可能データ、商業的に利用可能なデータ、プライベートエンティティ(例えば植物生産物生産者)から受信したデータ、及び/又は任意の他の将来データソースを含むことができる。
【0141】
[00159] 使用フェーズ503中、感染予測システムを使用して、同じソースの植物生産物の集合における感染尤度を予測した後、使用フェーズ503中、将来データソース505から感染予測システムによって受信した独立変数(例えばバイオマーカ発現統計の集合)及び同じソースの植物生産物の集合における実際の遡及感染率を遡及データとして使用して、システムをトレーニング又は検証することができる。換言すれば、使用フェーズ503中、感染予測システムによって使用される将来データ505は、トレーニングフェーズ501又は検証フェーズ502のそれぞれの間、感染予測システムのトレーニング又は検証に使用される遡及データ504になることができる。このようにして、感染予測システムは連続してトレーニング及び検証することができる。
【0142】
X.A.トレーニング
[00160] 図5Bは、感染予測システム508がトレーニングされるシステム環境500Bのブロック図である。図5Bに示すように、感染予測システム508をトレーニングするために、同じソースの植物生産物の遡及集合の部分集合についてのバイオマーカ表現統計の遡及集合506及び同じソースの植物生産物の遡及集合における実際の遡及感染率507は、感染予測システム508に入力される。
【0143】
[00161] バイオマーカ発現統計の遡及集合506及び実際の遡及感染率507が感染予測システム508に入力された後、感染予測システム508は、バイオマーカ発現統計の遡及集合506及び実際の遡及感染率507に基づいて、同じソースの植物生産物の集合における感染尤度509を特定し出力する。感染予測システム508によって出力される同じソースの植物生産物の集合における感染尤度509は、感染予測システム508に入力される実際の遡及感染率507に基づかない。むしろ、感染予測システム508によって特定され出力される感染尤度509は、実際の遡及感染率507と比較される。
【0144】
[00162] 感染予測システム508によって特定され出力された感染尤度509と実際の遡及感染率507とのこの比較は、感染予測システム508が、図4に関して先に詳細に考察したように、感染予測システム508の精度を最適化するパラメータを決定できるようにする。換言すれば、この比較は、感染予測システム508のトレーニングを可能にする。
【0145】
X.B.検証
[00163] 先に考察したように、幾つかの実施態様では、トレーニングに続き又はトレーニングと併せて、感染予測システム508は検証を経て、システムが閾値レベルの予測精度を達成したか否か及び使用可能な状態であるか否かを判断することもできる。図5Cは、感染予測システム508が検証されるシステム環境500Cのブロック図である。
【0146】
[00164] 先に手短に考察したように、感染予測システム508のトレーニング中、1つ又は複数のトレーニングサンプルはトレーニング外に保持され、感染予測システムの検証に使用することができる。具体的には、図5Cに示すように、感染予測システム508を検証するために、同じソースの植物生産物の遡及集合の部分集合についてのバイオマーカ発現統計の遡及集合を含む、外に保持されたトレーニングサンプルは、感染予測システム508に入力される。しかしながら、トレーニングとは異なり、同じソースの植物生産物の集合における実際の遡及感染率は、感染予測システム508に入力されない。
【0147】
[00165] バイオマーカ発現統計の遡及集合506を感染予測システム508に入力した後、感染予測システム508は、バイオマーカ発現統計の遡及集合に基づいて同じソースの植物生産物の集合における感染尤度509を特定し出力する。次いで、感染予測システム508によって出力された感染尤度509は、感染予測システム508に入力されなかった同じソースの植物生産物の集合における実際の遡及感染率と比較される。
【0148】
[00166] 感染予測システム508によって特定され出力された感染尤度509と実際の遡及感染率507との比較は、感染予測システム508が閾値レベルの予測精度を達成したか否かを判断できるようにする。この比較に基づいて感染予測システム508が閾値レベルの予測精度を達成したと判断される場合、感染予測システム508は有効であると見なすことができ、使用可能な状態である。幾つかの実施態様では、感染予測システム508の検証は、感染予測システム508のトレーニングの終了に繋がる。しかしながら、代替の好ましい実施態様では、感染予測システム508の検証は、感染予測システム508をトレーニングから除外せず、感染予測システム508は、その使用全体を通して引き続きトレーニングを受ける。
【0149】
[00167] 比較に基づいて感染予測システム508が閾値レベルの予測精度を達成していないと判断される実施態様では、感染予測システム508は使用前に更にトレーニングすることができる。
【0150】
X.C.使用
[00168] 感染予測システム508が閾値レベルの予測精度を達成したとして検証されると、システムは使用可能な状態である。図5Dは、感染予測システム508が使用されるシステム環境500Dのブロック図である。図5Dに示し、先に詳細に考察したように、感染予測システム508を使用するために、同じソースの植物生産物の集合の部分集合についてのバイオマーカ発現統計の集合510は、感染予測システム508に入力される。トレーニング及び検証とは異なり、バイオマーカ発現統計の集合510は、同じソースの植物生産物の遡及集合についての遡及データではない。むしろ、バイオマーカ発現統計の集合510は、実際の遡及感染率がまだ既知ではない同じソースの植物生産物の集合の部分集合についてのものである。
【0151】
[00169] バイオマーカ発現統計の集合510が感染予測システム508に入力された後、感染予測システム508は、バイオマーカ発現統計の集合510に基づいて同じソースの植物生産物の集合における感染尤度509を特定し出力する。使用中、この感染尤度509は同じソースの植物生産物の集合における実際の遡及感染率と比較されず、その理由は、同じソースの植物生産物の実際の遡及感染率がまだ既知ではないためである。その代わり、感染予測システム508によって出力された感染尤度509は、感染予測システム508の先のトレーニング及び検証に基づいて十分に正確であると仮定される。
【0152】
[00170] しかしながら、図5Aに関して先に考察したように、同じソースの植物生産物の集合における実際の遡及感染率が既知になると、同じソースの植物生産物の集合における実際の遡及感染率及び感染予測システム508によって出力された感染尤度509を使用して、システムをトレーニング及び/又は検証することができる。このようにして、感染予測システム508は使用全体を通して連続してトレーニング及び検証することができる。
【0153】
XI.感染予測に基づく植物生産物の処理
[00171] 同じソースの植物生産物の集合における感染尤度の予測に続き、予測感染尤度は任意の形態で提供することができる。幾つかの実施態様では、感染尤度は閲覧ユーザに自動的に提示される(例えばデジタル表示される)。更なる実施態様では、感染尤度は自動的及び電子的に記憶、自動的にリモートシステムに無線送信、及び/又は任意の他の方法によって返すことができる。
【0154】
[00172] 幾つかの実施態様では、感染尤度が予測される同じソースの植物生産物の集合は、予測感染尤度に基づいて処理を受けることができる。例えば、一実施態様では、予測感染尤度に基づいて、感染リスクが高い同じソースの植物生産物の集合を識別することができる。
【0155】
[00173] 別の実施態様では、予測感染尤度に基づいて、同じソースの植物生産物の集合への抗菌剤処理を提供又は抗菌剤処理の投与を処方することができる。具体的には、感染の進行を阻止するために、予測感染尤度が相対的に高い植物生産物の集合に抗菌剤処理を提供又は処方することができる。代替的には、予測感染尤度が相対的に低い植物生産物の集合には低量の抗菌剤処理投与を処方することができ、又は抗菌剤処理投与を処方しなくてよく、したがって、資源を最適化し、抗菌剤の全体使用を潜在的に低下させることができる。
【0156】
[00174] 幾つかの実施態様では、本開示の趣旨は、植物貯蔵倉庫等の第1の場所から別の植物貯蔵倉庫、他の流通センター、又は市場等の第2の場所に車両を使用した輸送中の植物を評価するのに使用することができる。そのような実施態様では、閾値レベルを超える感染が検出される場合、第2の場所よりも車両の現在場所に地理的により近い第3の場所に車両を方向変更させるアラートを生成することができる。幾つかの実施態様では、これは、車両(例えばトラック、飛行機、又はボート)の運転者、パイロット、又は船長に第3の場所にナビゲートするように通知することを含むことができる。そのような方向変更は、例えば、検出された感染の進行を遅くしようとして1つ又は複数の感染した植物をより素早く冷蔵することができるように行われ得る。幾つかの実施態様では、これは、潜伏感染により1つ又は複数の感染した植物が軸枯等のように腐る前に、1つ又は複数の感染した植物を救うことができる。しかしながら、本開示はそのように限定されない。代わりに、他の実施態様では、第3の場所は、車両が第2の場所に向かい続けるのを許可する前に、上述したように抗菌剤処理を用いて1つ又は複数の感染した植物を処理できるようにする抗菌剤処理施設であり得る。代替的には、1つ又は複数の植物閾値レベル未満の感染が検出されたと判断される場合、車両を方向変更するアラートは生成されず、車両は現在の航路に沿って継続することが許される。
【0157】
[00175] 同じソースの植物生産物の集合がまだ収穫されていない一実施態様では、植物生産物の集合は、予測感染尤度に基づいて選択的に収穫することができる。例えば、一実施態様では、植物生産物の収穫時は、植物生産物の集合の予測感染尤度に基づいて決定し得る。別の例示的な実施態様では、植物生産物の集合の予測感染尤度に基づいて、植物生産物の集合を収穫する方法を決定し得る。
【0158】
[00176] 別の実施態様では、予測感染尤度に基づいて、同じソースの植物生産物の集合の品質保証を決定することができる。例えば、品質保証は、予測感染尤度が特定の閾値を下回る同じソースの植物生産物の集合に対して決定することができる。例えば、品質保証は、予測感染尤度が5%、10%、15%、20%、又は25%未満である同じソースの植物生産物の任意の集合に対して決定することができる。
【0159】
[00177] 別の実施態様では、予測感染尤度に基づいて、同じソースの植物生産物の集合の消費者及び地理的行先の少なくとも一方を識別することができる。例えば、予測感染尤度が相対的に高い植物生産物の集合は、長距離輸送にわたる感染の進行を裂けるために、近くの地理的行先の消費者に送ることができる。同様に、予測感染尤度が相対的に高い植物生産物の集合は、産物基準が相対的に低い顧客に送ることができる。
【0160】
[00178] 別の実施態様では、予測感染尤度に基づいて、同じソースの植物生産物の集合に対してエチレン処理を差し控え、又はエチレン処理投与を提供若しくは処方することができる。具体的には、エチレン処理を使用して、植物生産物の成熟速度を変更する。しかしながら、外因性エチレンの適用又はエチレンブロッカー/経路阻害剤の適用は例えば、幾つかの植物生産物の幾つかの感染の進行を変更することもある。したがって、予測感染尤度が相対的に高い植物生産物の集合では、エチレン処理を避けることができ、又は代替的には植物生産物での感染進行の加速を阻止するように提供若しくは適宜処方することができる。
【0161】
[00179] 別の実施態様では、植物生産物における予測感染尤度に基づいて、同じソースの植物生産物の集合についての1つ又は複数の貯蔵条件を識別することができる。貯蔵条件は貯蔵温度及び/又は貯蔵湿度を含むことができる。例えば、予測感染尤度が相対的に高い植物生産物の集合では、植物生産物の集合は、植物生産物の感染進行を遅くするために、低温及び/又は低湿で貯蔵することができる。
【0162】
[00180] 更に別の実施態様では、植物生産物の集合における予測感染尤度に基づいて、収穫後処理を同じソースの植物生産物の集合に提供することができる。例えば、収穫後処理は、予測感染尤度が高い同じソースの植物生産物の集合に提供することができる。収穫後処理は、Apeel処理及び任意の他の収穫後処植物生産物処理を含むことができる。
【0163】
[00181] 上述した感染予測後処理ステップに加えて、同じソースの植物生産物の集合は、その植物生産物の集合に対して特定された予測感染尤度に基づいて任意のタイプの処理を受けることができる。さらに、予測感染尤度の提供に加えて、本明細書に開示される方法は、予測感染尤度に基づいて植物生産物処理指示をユーザに提供することを含むこともできる。これらの指示は、先に触れた植物処理ステップのいずれかを含め、任意の植物生産物処理ステップを実行するようにユーザに指示することができる。更なる実施態様では、同じソースの植物生産物の集合における予測感染尤度に基づく植物処理ステップは自動的に実行することができる。
【0164】
XII.例1-アボカドにおけるC.グロエオスポリオイデス(C.gloeosporioides)感染の予測
[00182] 以下の例は、先に紹介した感染予測方法を検証する。より具体的には、以下の例は、同じソースのアボカドの集合におけるC.グロエオスポリオイデス(C.gloeosporioides)感染の尤度予測について説明する。
【0165】
XII.A.外部感染したアボカドにおける感染バイオマーカの識別
[00183] 先に考察したように、植物生産物における感染バイオマーカは、非感染植物生産物と比較して感染植物生産物で差次的に発現するバイオマーカを含む。さらに、感染バイオマーカは、例えば少なくとも0.1倍率変化という閾値により、非感染植物生産物と比較して感染植物生産物で差次的に発現すると特定されているバイオマーカを含むことができる。アボカドにおけるC.グロエオスポリオイデス(C.gloeosporioides)感染バイオマーカ(例えばC.グロエオスポリオイデス(C.gloeosporioides)に感染していないアボカドと比較してC.グロエオスポリオイデス(C.gloeosporioides)に感染したアボカドで差次的に発現するアボカドバイオマーカ)を識別するために、PAL、GST、COMT、WRKY75、F3H、PR6、PR5、ChiB、ChiA、LOX、Prbl-2、及びCat遺伝子をスクリーニングに選択した。感染バイオマーカとしてスクリーニングに選択されたこれらの遺伝子は、本明細書では「感染バイオマーカ候補」と呼ばれる。
【0166】
[00184] 複数の30個のアボカドの各々にC.グロエオスポリオイデス(C.gloeosporioides)の胞子100個を外部から接種し、複数の30個のアボカドの各々に水を外部から接種した。水を接種したアボカドは実験コントロールとして機能した。48時間後、各アボカドの芯を抜き、RNAを抽出した。次いでRT-pPCRを使用して、複数の感染したアボカドの各アボカドについて及び複数のコントロールアボカドの各アボカドについて、各感染バイオマーカ候補の発現レベルを特定した。複数の感染したアボカドの各アボカドについて及び複数のコントロールアボカドの各アボカドについて、ハウスキーピングバイオマーカ、即ちアクチン遺伝子の発現レベルもRT-qPCRを使用して特定した。PAL及びアクチン遺伝子プローブ配列並びにqPCRを実行してPAL及びアクチン遺伝子の発現レベルをそれぞれ特定するために使用された関連付けられたフルオロフォアを以下の表3に示す。感染バイオマーカ、即ちACS1及びACO1遺伝子についてのプローブ配列及び関連付けられたqPCRフルオロフォアも以下の表3に示す。
【0167】
【表4】
【0168】
[00185] 図2Cに関して上述したように、感染バイオマーカ候補及びアクチン遺伝子の発現レベルに基づいて、複数の感染したアボカドの各アボカド及び複数のコントロールアボカドの各アボカドにおける各感染バイオマーカ候補の正規化発現レベルを特定した。具体的には、各アボカドについて、アボカドにおける感染バイオマーカ候補のlog10発現レベルとアボカドにおけるアクチン遺伝子のlog10発現レベルとの比率を特定することにより、各感染バイオマーカ候補の正規化発現レベルを特定した。最後に、複数の感染したアボカド及び複数のコントロールアボカドでの各感染バイオマーカ候補の平均正規化発現レベルを特定した。図6は、複数の感染したアボカド及び複数のコントロールアボカドでの各感染バイオマーカ候補の平均正規化発現レベルを示すグラフ600である。
【0169】
[00186] 複数の感染したアボカドでの感染バイオマーカ候補の平均正規化発現レベルを複数のコントロールアボカドでの感染バイオマーカ候補の平均正規化発現レベルと比較することにより、コントロールアボカドと比較して感染したアボカドで差次的に発現したバイオマーカを識別した。具体的には、各感染バイオマーカ候補は、コントロールアボカドと比較して少なくとも0.1倍率、感染したアボカドで差次的発現を示すと特定された(即ち、感染したアボカドでの各感染バイオマーカ候補の発現は、コントロール(非感染)アボカドの少なくとも1.1倍であった)。したがって、PAL、GST、COMT、WRKY75、F3H、PR6、PR5、ChiB、ChiA、LOX、Prbl-2、及びCat遺伝子を含む感染バイオマーカ候補は、アボカドでの真の感染バイオマーカとして識別された。
【0170】
[00187] さらに、フェニルプロパノイド経路での2つの遺伝子(PAL及びGST)並びに3つの病原体応答遺伝子(PR6、PR5、及びChiB)は、コントロールアボカドと比較して、感染したアボカドで少なくとも1倍率差次的に発現するとして識別された(即ち感染したアボカドでのこれらの各遺伝子の発現は、コントロール(非感染)アボカドでの発現の少なくとも2倍であった)。換言すれば、識別された感染バイオマーカのうち、PAL、GST、PR6、PR5、及びChiB遺伝子は、早期時点(接種後24時間又は48時間)でアボカドにおいて少なくとも1倍率の好ましい閾値差次的発現を示すと特定された。即ち、感染したアボカドにおけるこれらの遺伝子の少なくとも1倍率(即ち100%)の発現増大は多くの場合、接種後50時間未満、40時間未満、30時間未満、又は25時間未満で検出することができた。
【0171】
[00188] この例で識別された感染バイオマーカのように、この例で記載したものと同様の方法を使用して追加の感染バイオマーカを識別し、表1に列記することができる。同様に、この例で記載したものと同様の方法を使用して、アボカド以外の例での感染植物生産物と非感染植物生産物との間の少なくとも0.1倍率変化の差次的発現を示す追加の感染バイオマーカを識別し、表1に列記することができる。
【0172】
XII.B.内部感染したアボカドにおける感染バイオマーカの識別
[00189] 外部感染したアボカドにおける感染バイオマーカの識別に加えて、先に識別された感染バイオマーカは、内部感染したアボカドにおける感染とも相関することが確認された。具体的には、先に感染バイオマーカとして識別されたPAL遺伝子の、内部感染率の高いアボカドでの発現を内部感染率の低いアボカドでの発現と比較して、PAL遺伝子の発現増大が、アボカドでの高内部感染率と相関することが確かめられた。
【0173】
[00190] PAL遺伝子の発現増大がアボカドでの高内部感染率と相関することを確かめるために、アボカドの11のロットA~K(例えば同じ梱包色相番号を有する同じソースのアボカドの集合)を11週間にわたって研究した。具体的には、アボカドの1ロットを各週研究した。各ロットから、30個のアボカドを成熟のために取り置いた。成熟すると、これらの30個のアボカドを軸枯病として呈された感染について検査した。この検査に基づいて、アボカド30個の各集合について、軸枯病発生率を特定し、30個のアボカドの元のロットに外挿した。図7Aは、アボカドの各ロットA~Kでの軸枯病発生率を示すグラフ700Aである。アボカドの各ロットA~Kを高軸枯病発生率(例えば5%超、10%超、若しくは15%超)又は低軸枯病発生率(例えば5%未満、10%未満、若しくは15%未満)の何れかを有するものとして更に分類した。高軸枯病発生率(この場合、15%)を有するアボカドのロットは、図7Aでは斜線で埋められたバーによって示されている。逆に、低軸枯病発生率を有するアボカドのロットは、図7Aではパターンで埋められていないバーによって示されている。
【0174】
[00191] 成熟後、軸枯病について各ロットA~Kからの30個のアボカドを検査することに加えて、成熟前、各ロットからの6個の未熟なアボカドの芯を取り、RNAを抽出した。次いでRT-qPCRを使用して、各アボカドでのPAL遺伝子の発現レベルを特定した。具体的には、各ロットA~Kからの6個のアボカドの各々について、PAL遺伝子と関連付けられたRNA転写物のコピー数を特定した。ハウスキーピングバイオマーカ、即ちアクチン遺伝子の発現レベルも、各アボカドについてRT-qPCRを使用して特定した。具体的には、各ロットA~Kからの6個のアボカドの各々について、アクチン遺伝子と関連付けられたRNA転写物のコピー数を特定した。PAL及びアクチン遺伝子プローブ配列並びにqPCRを実行してPAL及びアクチン遺伝子の発現レベルを特定するために使用された関連付けられたフルオロフォアを表3において先に示した。
【0175】
[00192] PAL遺伝子及びアクチン遺伝子の発現レベルに基づいて、各アボカドのPAL遺伝子の正規化発現レベルを特定した。具体的には、各アボカドについて、アボカドにおけるPAL遺伝子の発現レベルとアボカドにおけるアクチン遺伝子の発現レベルとの比率を特定することにより、PAL遺伝子の正規化発現レベルを特定した。
【0176】
[00193] 図7Bは、アボカドの各ロットからテストされた6個のアボカドの各アボカドでのPAL遺伝子の正規化発現レベルを、それらのアボカドの元のロット内の軸枯病発生率と比較するグラフ700Bである。PAL遺伝子の正規化発現レベルが特定された各アボカドは、図7Bにおいて点として表されている。
【0177】
[00194] 図7Bに示すように、一般に、高軸枯病発生率を有すると分類されたアボカドのロットからのアボカドにおけるPAL遺伝子の正規化発現レベルは、低軸枯病発生率を有すると分類されたアボカドのロットからのアボカドよりも高かった。具体的には、図7Bに表される66個のアボカドのうちの61個(例えば92.4%)は、高軸枯病発生率及び1よりも大きいPAL正規化発現レベル又は低軸枯病発生率及び1未満のPAL正規化発現レベルのいずれかを示した。したがって、図7Bは、PAL遺伝子発現レベルの増大がアボカドでの高外部感染率と相関することを確認する。
【0178】
XII.C.アボカドにおける老化依存感染バイオマーカ
[00195] 結果を図8に示す続く実験では、アボカドが老化するにつれてPAL遺伝子がアボカドでますます大きく発現することが特定された。実験では、アボカドの2つの別個のロットを評価した。「MX28」と記され、図8において中実グレー色で示されているアボカドの第1のロットは、低感染発生率(5%)を有した。「MX29」と記され、図8においてチェックパターンで示されているアボカドの第2のロットは、高感染発生率(17%)を有した。これらの感染発生率は、図7Aに関して上述したように、ロットの成熟後、軸枯病についてアボカドのロットを検査することによって特定された。
【0179】
[00196] 成熟後、軸枯病について2つのロットからのアボカドを検査することに加えて、アボカドの梱包(例えば収穫)に続く7~12日の各日でPAL遺伝子発現について各ロットからの6個のアボカドをテストした。換言すれば、梱包後7~12日の各日で、アボカドの2つのロットMX28及びMX29の各々からの6個のアボカドの芯を取り、RNAを抽出した。次いでRT-qPCRを使用して、各アボカドでのPAL遺伝子の発現レベルを特定した。具体的には、各アボカドについて、PAL遺伝子と関連付けられたRNA転写物のコピー数を特定した。各アボカドについて、RT-qPCRを使用してハウスキーピングバイオマーカ、即ちアクチン遺伝子の発現レベルも特定した。具体的には、各アボカドについて、アクチン遺伝子と関連付けられたRNA転写物のコピー数を特定した。PAL及びアクチン遺伝子プローブ配列並びにqPCRを実行してPAL及びアクチン遺伝子の発現レベルを特定するために使用された関連付けられたフルオロフォアを表3において先に示す。
【0180】
[00197] PAL遺伝子及びアクチン遺伝子の発現レベルに基づいて、各アボカドのPAL遺伝子の正規化発現レベルを特定した。具体的には、各アボカドについて、アボカドにおけるPAL遺伝子の発現レベルとアボカドにおけるアクチン遺伝子の発現レベルとの比率を特定することにより、PAL遺伝子の正規化発現レベルを特定した。
【0181】
[00198] 図8は、アボカドのMX28ロット及びMX29ロットの両方での梱包後7~12日にテストした6個のアボカドの各々におけるPAL遺伝子の正規化発現レベルを示すグラフ800である。図8に示すように、アボカドのMX28ロット及びMX29ロットの両方で、梱包後7日と12日との間の時間にわたってPAL遺伝子の発現レベルは上がった。換言すれば、アボカドのPAL遺伝子の発現レベルは、アボカドが老化するにつれて経時増大した。しかしながら、これも図8に示されるように、PAL遺伝子の発現レベルは平均で、アボカドのMX28ロット(例えば感染発生率が低いアボカドのロット)からのアボカドよりもアボカドのMX29ロット(例えば感染発生率が高いアボカドのロット)からのアボカドにおいてより大きく経時増大した。さらに、PAL遺伝子の発現レベルは平均で、アボカドのMX28ロット(例えば感染発生率が低いアボカドのロット)からのアボカドよりもアボカドのMX29ロット(例えば感染発生率が高いアボカドのロット)からのアボカドにおいてより早く増大した。
【0182】
[00199] PAL遺伝子等の幾つかの感染バイオマーカの発現が、植物生産物間の感染バイオマーカ発現のばらつきを考慮に入れて、感染発生率が低いアボカドと比較して感染発生率が高い熟しつつあるアボカドでより早く及びより大きく経時増大するというこの観測に基づいて、幾つかの実施態様では、感染バイオマーカの正規化発現レベルは、感染バイオマーカの発現レベル及び別の感染バイオマーカの発現レベルに基づいて特定することができる。具体的には、幾つかの実施態様では、所与の植物生産物について、ある感染バイオマーカの正規化発現レベルは、その感染バイオマーカの発現レベルと別の感染バイオマーカの発現レベルとの比率及び/又はその感染バイオマーカの発現レベルと別の感染バイオマーカの発現レベルとの積を計算することによって特定することができる。別の感染バイオマーカに対して感染バイオマーカの発現を正規化することにより、植物生産物間のベースライン感染バイオマーカ発現のばらつきをコントロールすることができる。
【0183】
XII.D.感染予測システムに向けたトレーニングデータセット生成の最適化
[00200] 感染尤度を正確に予測するように上記感染予測システムを十分にトレーニングするためには、ロバストなトレーニングデータセットが必要である。感染予測システムを十分にトレーニングするためのそのようなロバストなトレーニングデータを生成するために、トレーニングデータセットのトレーニングサンプルを生成する方法が最適化された。特に、バイオマーカ解析に向けて植物生産物を準備する方法を上述したように最適化した。
【0184】
[00201] バイオマーカ解析に向けて植物生産物を準備する方法を最適化することで、感染予測システムをトレーニングするに当たり使用するための大きなトレーニングデータセットを効率的に生成できるようになる。具体的には、上述した植物産物準備最適化方法を利用することにより、植物生産物でのバイオマーカの発現レベルは、本明細書に記載の植物生産物準備最適化方法が使用されない場合の1~2日とは対照的に、6時間で特定することができる。植物生産物でのバイオマーカ発現レベルの特定に必要な時間の長さを1~2日から6時間に短縮することにより、日中の時点中に植物生産物サンプルの再テストを複数回実行することができ、この増殖性データを使用して、感染予測システム用に大きなトレーニングデータセットを素早く生成することができる。
【0185】
[00202] 例えば、アボカドにおける感染尤度を予測するように構成された感染予測システム用のトレーニングデータで使用するために、植物生産物でのバイオマーカ発現レベルの特定に必要な時間の長さ短縮に起因して、0日目の時点で62ロットからの384個のアボカドを感染バイオマーカ発現レベルについて再テストし、各アボカドでの感染バイオマーカ発現を、アボカドの元のロットでの感染発生率と相関付けた。具体的には、RT-qPCRを使用して、0日目の時点で384個のアボカドをPAL、アクチン、ACS1、及びACO1遺伝子発現についてテストした。PAL、アクチン、ACS1、及びACO1遺伝子と関連付けられたRNA転写物のコピー数を各アボカドで特定した。PAL、アクチン、ACS1、及びACO1遺伝子プローブ配列並びにqPCRの実行に使用された関連付けられたフルオロフォアは先に表3及び表4に示されている。
【0186】
[00203] 各アボカドについて、PAL、アクチン、ACS1、及びACO1遺伝子並びにアクチン遺伝子の発現レベルに基づいて、PAL、アクチン、ACS1、及びACO1遺伝子の正規化発現レベルを特定した。具体的には、各アボカドについて、アボカドにおけるPAL、アクチン、ACS1、及びACO1遺伝子の発現レベルとアボカドにおけるアクチン遺伝子の発現レベルとの比率を特定することにより、PAL、アクチン、ACS1、及びACO1遺伝子の正規化発現レベルを特定した。次いで各アボカドについて、PAL、アクチン、ACS1、及びACO1遺伝子の正規化発現レベルの最小最大正規化及び対数変換を実行することにより、PAL、アクチン、ACS1、及びACO1遺伝子の特徴スケーリング発現レベルを特定した。次に、各アボカドでのPAL、アクチン、ACS1、及びACO1遺伝子の特徴スケーリング発現レベルの比率並びに各アボカドでのPAL、アクチン、ACS1、及びACO1遺伝子の特徴スケーリング発現レベルの積を特定することにより、384個のテストされたアボカドについてのバイオマーカ発現統計の集合を特定した。さらに、384個のアボカドの成熟に続き、軸枯病として現れた実際の感染発生率をアボカドの各トレーニングロットで特定した。
【0187】
[00204] 384個の各アボカドでのPAL、ACS1、及びACO1遺伝子の特徴スケーリング発現レベルと384個のアボカドの元の各ロットの実際の感染発生率との比率及び積を使用して、個々のアボカドにおける感染尤度を予測するようにバイナリロジスティック回帰モデルを含む感染予測システムをトレーニングするためのトレーニングデータセットを作成した。
【0188】
[00205] 感染予測システムのトレーニングの間、感染予測システムは、各アボカドでのPAL、ACS1、及びACO1遺伝子の特徴スケーリング発現レベルの比率及び積に基づいて、トレーニングデータセットと関連付けられた384個のアボカドの各々における感染尤度を予測した。次いでトレーニングデータセットからの各アボカドについて、感染予測システムによって特定された予測感染尤度を、アボカドの元のロットの実際の感染発生率と比較した。トレーニングデータセットでの各アボカドの予測感染尤度と実際の感染発生率とのこの比較を図9に示し、更に詳細に以下考察する。
【0189】
[00206] 384個のアボカドに基づくトレーニングデータセットを用いた感染予測システムのトレーニングに続き、感染予測システムは、上述したものと同様の方法に従ってテストアボカドの12ロット中の各アボカドをテストした。より具体的には、感染予測システムのトレーニングに続き、感染予測システムはテストアボカドの各々の感染尤度を予測した。テストされたアボカドが熟したことに続き、アボカドの各テストロットでの、軸枯病として現れた実際の感染発生率を特定した。
【0190】
[00207] トレーニングデータセットにおけるアボカドのように、テストデータセットからの各アボカドについて、感染予測システムによって特定される予測感染尤度をアボカドの元のロットの実際の感染発生率と比較した。テストデータセットにおける各アボカドについての予測感染尤度と実際の感染発生率とのこの比較を図9に示す。
【0191】
[00208] 図9は、感染予測システムの予測性能を示すグラフ900である。図9では、黒い点はトレーニングデータからのアボカドを表し、グレーの点はテストデータセットからのアボカドを表す。図9は、感染予測システムによって予測された各アボカドの感染尤度をアボカドの元のロットの実際の感染発生率と比較する。図9を通して描かれた破線水平線は予測感染尤度50%を示し、図9を通して描かれた破線垂直線は5%の感染発生率閾値を示す。
【0192】
[00209] 感染予測システムは、トレーニングデータセットからの未熟アボカドが、熟したときに5%よりも高い軸枯病発生率を有するアボカド(同じソース)に属するか否かを少なくとも85%精度で予測することが可能であった。さらに、感染予測システムは、テストデータセットからの未熟アボカドが、熟したときに5%よりも高い軸枯病発生率を有するアボカド(同じソース)に属するか否かを少なくとも85%精度で予測することが可能であった。
【0193】
XII.E.感染予測システムの最適化
[00210] 上述したように感染予測システムに向けてトレーニングデータを生成する方法を最適化することに加えて、感染予測システム自体も、各感染予測システムをトレーニング、検証、そしてテストする効率的なデータパイプラインを使用して多様な異なる感染予測システムを互いと比較することによって最適化した。感染予測システムのトレーニング、検証、及びテストに使用されるデータパイプラインは、本開示全体を通して、特に先の図1図5Dに関して説明される。さらに、図10A図10Cは、感染予測システムをトレーニング、検証、そしてテストする、異なる粒度のデータパイプライン例を示す。
【0194】
[00211] 図10Aは、感染予測システムをトレーニング、検証、そしてテストするデータパイプライン例の全体図1000Aのブロック図である。図10Aに示す実施態様では、同じソースの植物生産物の74個の集合(例えばアボカドのロット)を使用して、感染予測システムをトレーニング、検証、そしてテストする。図10Bに関して更に詳細に以下考察するように、図10Aに示す実施態様では、同じソースの植物生産物の集合の80%は、感染予測システムをトレーニングし検証するのに選択され、一方、同じソースの植物生産物の集合の20%は、感染予測システムをテストするのに選択される。したがって、同じソースの植物生産物の74個の集合のうちの62個は、感染予測システムをトレーニングし検証するのに選択され、同じソースの植物生産物の74個の集合のうちの12個は、感染予測システムをテストするのに選択される。
【0195】
[00212] 感染予測システムのトレーニングされた及び検証に使用される同じソースの植物生産物の62個の集合のうち、51個は感染予測システムのトレーニングに使用され、同じソースの植物生産物の62個の集合のうちの5個は、感染予測システムの検証に使用される。図10Aに示すように、感染予測システムの検証は5分割交差検証として実行され、感染予測システムが合計25倍率のデータにわたって検証されることを意味する。
【0196】
[00213] 感染予測システムのトレーニング及び検証に続き、感染予測システムは、上述したように選択された12のテストデータセットを使用してテストされる。図10Cに関して詳細に以下考察するように、これらのテストデータセットでの感染予測システムの性能を特定し、それを使用して、将来の使用のために性能が最良の感染予測システムを識別することができる。
【0197】
[00214] 次に図10Bを参照すると、図10Bは、同じソースの植物生産物の集合の感染尤度が5%よりも大きいか、それとも5%未満であるかを予測するように構成された感染予測システムをトレーニング、検証、そしてテストするための例示的なデータパイプライン1000Bのブロック図である。図10Bに示す実施態様では、感染予測システムのデータパイプラインは、開始入力及び5つの別個のステップを含む。図10Bに示される実施態様ではまた、植物生産物はアボカドを含み、同じソースの植物生産物の集合はアボカドのロットを含む。しかしながら、代替の実施態様では、図10Bのステップは任意の代替の植物生産物に適用することができる。
【0198】
[00215] 図10Bに示すように、開始入力は、同じソースのアボカドのロットからのアボカドを含む。開始入力は、アボカドにおける1つ又は複数の感染バイオマーカ及び1つ又は複数のハウスキーピングの発現レベルも含む。図10Bにおけるデータパイプラインの実施態様では、PAL、ACO、及びACS遺伝子が1つ又は複数の感染バイオマーカであり、アクチン遺伝子が1つ又は複数のハウスキーピングバイオマーカである。幾つかの実施態様では、遺伝子の発現レベルは、その遺伝子と関連付けられたRNA転写物のコピー数を含むことができる。特に、図10Bでは、アボカドでのアクチン、PAL、ACO、及びACS遺伝子の発現レベルは、アボカドでのそれらの遺伝子と関連付けられたRNA転写物のコピー数を含む。
【0199】
[00216] 感染予測システムのデータパイプラインのステップ1は、感染バイオマーカ及びハウスキーピングバイオマーカの発現レベルに基づいて、アボカドにおける各感染バイオマーカの正規化発現レベルを特定することを含む。より具体的には、ステップ1において、アボカドにおける各感染バイオマーカの正規化発現レベルが、アボカドにおける感染倍マーカと関連付けられたRNA転写物のコピー数とアボカドにおけるハウスキーピングバイオマーカと関連付けられたRNA転写物のコピー数との比率を特定することによって特定される。したがって、図10Bに示すように、PAL遺伝子と関連付けられたRNA転写物のコピー数とアクチン遺伝子と関連付けられたRNA転写物のコピー数との比率(例えばPAL/アクチン)が特定され、ACO遺伝子と関連付けられたRNA転写物のコピー数とアクチン遺伝子と関連付けられたRNA転写物のコピー数との比率(例えばACO/アクチン)が特定され、ACS遺伝子と関連付けられたRNA転写物のコピー数とアクチン遺伝子と関連付けられたRNA転写物のコピー数との比率(例えばACS/アクチン)が特定される。
【0200】
[00217] 次に、図10Bに示されるデータパイプラインのステップ2において、ステップ1において特定された各感染バイオマーカの正規化発現レベルの特徴スケーリング発現レベルが特定される。感染バイオマーカの正規化発現レベルの特徴スケーリング発現レベルを特定するために、数学的正規化関数が感染バイオマーカの正規化発現レベルに適用される。例えば、特定の実施態様では、感染バイオマーカの正規化発現レベルの特徴スケーリング発現レベルは、感染バイオマーカの正規化発現レベルの最小最大正規化及び対数変換の少なくとも一方を実行することによって特定される。ステップ2において、PAL、ACO、及びACS遺伝子の正規化発現レベルの特徴スケーリング発現レベルが特定される。
【0201】
[00218] 次いでステップ3において、上述したようにステップ1及び2を経た個々のアボカドは、元のロットに従って一緒にグループ化される。換言すれば、同じソースのアボカドの共通集合からの個々のアボカドの部分集合が一緒にグループ化される。次いで、部分集合の各アボカドについて特定された各感染バイオマーカの特徴スケーリング発現レベルに基づいて、アボカドの各部分集合のバイオマーカ発現統計の集合が特定される。幾つかの実施態様では、アボカドの部分集合についてのバイオマーカ発現統計の集合は、部分集合中のアボカドに特定された各感染バイオマーカの特徴スケーリング発現レベルの平均、メジアン、最小、最大、標準偏差、5パーセンタイル、10パーセンタイル、15パーセンタイル、20パーセンタイル、25パーセンタイル、50パーセンタイル、75パーセンタイル、80パーセンタイル、90パーセンタイル、95パーセンタイル、及び99パーセンタイルの少なくとも1つ、アボカドの部分集合の各アボカドについての各感染バイオマーカの特徴スケーリング発現レベルと他の各感染バイオマーカの特徴スケーリング発現レベルとの比率、アボカドの部分集合の各アボカドについての各感染バイオマーカの特徴スケーリング発現レベルと他の各感染バイオマーカの特徴スケーリング発現レベルとの積を含む。
【0202】
[00219] 最後に、ステップ3において、アボカドの部分集合が取られた元の同じソースのアボカドの集合の成熟に続き、同じソースのアボカドの集合は、軸枯病として現れた感染について検査される。この検査に基づいて、同じソースのアボカドの集合での軸枯病の実際の感染率が特定され、同じソースのアボカドの各集合は、例えば、5%よりも大きい軸枯病発生率を有するもの又は5%未満の軸枯病発生率を有するものとして分類される。
【0203】
[00220] 次にステップ4を参照すると、バイオマーカ発現統計の集合及び軸枯病発生率が特定されたアボカドの部分集合が、感染予測システムをトレーニングするため又は感染予測システムをテストするためにランダムに選択される。図10Bに示す実施態様では、ステップ3において処理されたアボカドの部分集合の80%は、感染予測システムをトレーニングするのに選択され、一方、ステップ3において処理された植物生産物の部分集合の20%は、感染予測システムをテストするのに選択される。
【0204】
[00221] 最後に、図10Bに示されるデータパイプラインのステップ5において、感染予測システムは、ステップ4において選択されたトレーニングデータセットを使用してトレーニングされる。図4及び図5Bに関して詳細に先に考察したように、感染予測システムをトレーニングすることは、損失関数を最小化するようにシステムのパラメータを最適化することを含む。ステップ5において感染予測システムをトレーニングすることに加えて、感染予測システムは、図5C及び図10Aに関して詳細に先に考察したように、外に置かれていたトレーニングデータサンプルを使用した検証も受ける。ステップ5における感染予測システムのトレーニング及び検証に続き、図10Cに関して以下考察するように、感染予測システムはステップ4において選択されたテストデータセットを使用してテスト可能な状態になる。
【0205】
[00222] 図10Cを参照すると、図10Cは、図10Bの感染予測システムの性能をテストし査定するための例示的な方式1000Cのブロック図である。図10Cに示すように、図10Bからの、トレーニングされ検証された感染予測システムは、図10Bのデータパイプラインのステップ4において選択されたテストデータセットを使用して、図5Dに関して詳細に先に考察したようにテストされる。具体的には、テストデータセットに含まれるアボカドの各部分集合について、図10Bのステップ3において部分集合に特定されたバイオマーカ発現統計が感染予測システムに入力される。次いで感染予測システムは、アボカドの部分集合が取られた同じソースのアボカドの集合の感染尤度が、例えば5%よりも大きいか、それとも5%よりも小さいかの予測を出力する。
【0206】
[00223] 最後に、テストされたアボカドの各部分集合について、アボカドの部分集合が取られた同じソースのアボカドの集合における感染尤度の感染予測システムによる予測が、図10Bのステップ3において特定された同じソースのアボカドの集合における既知の感染発生率と比較される。この比較に基づいて、感染予測システムの正解率、適合率、及び再現率を特定することができる。
【0207】
[00224] 異なる感染予測システムの性能を比較して、将来の感染予測への使用に最良のシステムを選択することができる。換言すれば、図10A図10Cにおいて上述したデータパイプラインにより、効率的で再現可能な感染予測システムの開発、比較、及び最適化が可能になる。例えば、上述したデータパイプラインは、バイナリロジスティック回帰モデル(BLM)、ロジスティックモデルツリー(LMT)、ランダムフォレスト分類器(RF)、L2正則化(L2)、ナイーブベイズ分類器(NB)、多変量適応回帰スパイン(MARS)、1つ又は複数のニューラルネットワーク、及びk最近傍分類(KNN)を含め、多様な異なる感染予測システムの開発及び評価を促進した。以下の表4は、これらの異なる感染予測システムの各々についての図10Bに関して記載したトレーニングデータセットでの平均検証精度と、図10A及び図10Bに関して記載したテストデータセットでの平均正解率、適合率、及び再現率を示す。
【0208】
【表5】
【0209】
[00225] 表4に示すように、最も正確な感染予測システムはRF及びKNNベースのシステムを含む。RF及びKNN感染予測システムを含む感染予測システムは両方とも、図10Cに関して上述したようにテストデータセットを使用してテストされた場合、92%の平均正解率を達成する。
【0210】
XIII.コンピュータ例
[00226] 図11は、図1に記載の方法を実施するための一例のコンピュータ1100を示す。コンピュータ1100は、チップセット1104に結合された少なくとも1つのプロセッサ1102を含む。チップセット1104は、メモリコントローラハブ1120及び入出力(I/O)コントローラハブ1122を含む。メモリ1106及びグラフィックスアダプタ1112はメモリコントローラハブ1120に結合され、ディスプレイ1118はグラフィックスアダプタ1112に結合される。記憶装置1108、入力デバイス1114、及びネットワークアダプタ1116は、I/Oコントローラハブ1122に結合される。コンピュータ1100の他の実施態様は異なるアーキテクチャを有する。
【0211】
[00227] 記憶装置1108は、ハードドライブ、コンパクトディスク読み取り専用メモリ(CD-ROM)、DVD、又は固体状態メモリデバイス等の非一時的コンピュータ可読記憶媒体である。メモリ1106は、プロセッサ1102によって使用される命令及びデータを保持する。入力インターフェース1114はタッチスクリーンインターフェース、マウス、トラックボール、若しくは他のタイプのポインティングデバイス、キーボード、又はそれらの何らかの組合せであり、データをコンピュータ1100に入力するのに使用される。幾つかの実施態様では、コンピュータ1100は、ユーザからのジェスチャを介して入力インターフェース1114から入力(例えばコマンド)を受信するように構成し得る。グラフィックスアダプタ1112は、画像及び他の情報をディスプレイ1118に表示する。ネットワークアダプタ1116は、コンピュータ1100を1つ又は複数のコンピュータネットワークに結合する。
【0212】
[00228] コンピュータ1100は、本明細書に記載の機能を提供するコンピュータプログラムモジュールを実行するように構成される。本明細書で使用される場合、「モジュール」という用語は、指定された機能を提供するのに使用されるコンピュータプログラム論理を指す。したがって、モジュールはハードウェア、ファームウェア、及び/又はソフトウェアで実施することができる。一実施態様では、プログラムモジュールは記憶装置1108に記憶され、メモリ1106にロードされ、そしてプロセッサ1102によって実行される。
【0213】
[00229] 図1の方法の実施に使用されるコンピュータ1100のタイプは、実施及び/又はエンティティによって要求される処理能力に応じて様々であることができる。例えば、提示識別システム160は単一のコンピュータ1100で実行されてもよく、又はサーバファーム等においてネットワークを通して互いと通信する複数のコンピュータ1100で実行されてもよい。コンピュータ1100は、グラフィックスアダプタ1112及びディスプレイ1118等の上述した構成要素の幾つかを欠いてもよい。
【0214】
XIV.追加の考慮事項
[00230] 本明細書及び添付の特許請求の範囲で使用される場合、単数形「a」、「an」、及び「the」は、文脈により別段のことが示される場合を除き、複数の指示対象を含むことに留意されたい。
【0215】
[00231] 本明細書の本文内で引用された全ての引用文献、発行特許、及び特許出願は全体的に参照により本明細書に援用される。
【0216】
[00232] 本開示の実施態様の上記説明は例示を目的として提示されており、網羅的である意図はなく、即ち開示された厳密な形態に本開示を限定する意図はない。上記開示に鑑みて多くの改変及び変形が可能であることを当業者ならば理解することができる。
【0217】
[00233] この説明の幾つかの部分は、情報に対する動作のアルゴリズム又は象徴的表現に関して本開示の実施態様を説明している。これらのアルゴリズム的説明及び表現は一般に、作業の本質を他の当業者に効率的に伝えるためにデータ処理分野の当業者によって使用される。これらの動作は、機能的、計算的、又は論理的に説明されるが、コンピュータプログラム又は同等の電気回路、マイクロコード等によって実施されると理解される。
【0218】
[00234] 本明細書に記載の任意のステップ、動作、又はプロセスは、1つ又は複数のハードウェア又はソフトウェアモジュールを用いて単独で又は他のデバイスと組み合わせて実行又は実施し得る。一実施態様では、ソフトウェアモジュールは、コンピュータプロセッサによって実行されて、機作されたステップ、同さ、又はプロセスのいずれか又は全てを実行することができるコンピュータプログラムコードを含むコンピュータ可読非一時的媒体を含むコンピュータプログラム製品を用いて実施される。
【0219】
[00235] 実施態様は、本明細書における動作を実行する装置に関することもできる。この装置は、必要とされる目的に向けて特に構築されてもよく、及び/又はコンピュータに記憶されたコンピュータプログラムによって選択的にアクティブ化又は際億世される汎用計算デバイスを含んでもよい。そのようなコンピュータプログラムは、非一時的有形コンピュータ可読記憶媒体又はコンピュータシステムバスに結合し得る電子命令の記憶に適した任意のタイプの媒体に記憶し得る。さらに、本明細書で参照される任意の計算システムは、単一のプロセッサを含んでもよく、又は計算容能力を上げるためにマルチプロセッサ設計を利用したアーキテクチャであってもよい。
【0220】
[00236] 本開示の実施態様は、本明細書に記載の計算プロセスによって生成される製品に関することもできる。そのような製品は計算プロセスから生じた情報を含み得、情報は非一時的有形コンピュータ可読記憶媒体に記憶され、コンピュータプログラム製品の任意の実施態様又は本明細書に記載の他のデータ組合せを含み得る。
【0221】
[00237] 最後に、本明細書で使用される言葉は主に、読みやすさ及び教授を目的として選択されており、本発明の趣旨を線引き又は制限するように選択されていない。したがって、本開示の範囲がこの詳細な説明によって制限されず、むしろ、本明細書に基づく出願で発行される任意の特許請求の範囲によって制限されることが意図される。したがって、本開示の実施態様の開示は、本開示の範囲が例示的であることを意図し、限定を意図しない。
図1
図2A
図2B
図2C
図2D
図3
図4
図5A
図5B
図5C
図5D
図6
図7A
図7B
図8
図9
図10A
図10B
図10C
図11
図12
図13
【配列表】
2022553570000001.app
【国際調査報告】