(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-15
(45)【発行日】2024-05-23
(54)【発明の名称】作物規格予測方法及び作物規格予測プログラム
(51)【国際特許分類】
G06Q 50/02 20240101AFI20240516BHJP
G06Q 10/04 20230101ALI20240516BHJP
【FI】
G06Q50/02
G06Q10/04
(21)【出願番号】P 2021104940
(22)【出願日】2021-06-24
【審査請求日】2023-12-15
【早期審査対象出願】
(73)【特許権者】
【識別番号】501203344
【氏名又は名称】国立研究開発法人農業・食品産業技術総合研究機構
(74)【代理人】
【識別番号】100087480
【氏名又は名称】片山 修平
(72)【発明者】
【氏名】王 蕊
(72)【発明者】
【氏名】筧 雄介
(72)【発明者】
【氏名】東出 忠桐
(72)【発明者】
【氏名】礒▲崎▼ 真英
【審査官】星野 浩一
(56)【参考文献】
【文献】特開2020-024703(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 50/02
G06Q 10/04
(57)【特許請求の範囲】
【請求項1】
収穫された作物の規格を決定するための作物情報と、収穫された前記作物の生育環境に関する情報と、を取得し、
前記作物情報に基づいて、収穫された前記作物の規格を決定し、
決定された前記作物の規格
ごとの収穫割合を目的変数とし、前記生育環境に関する情報
を説明変数とするデータセットを用いて、所定の生育環境下で収穫できる作物の規格
ごとの収穫割合を予測するための予測モデルを生成し、
所定の収穫日までの環境情報を取得し、取得した前記環境情報と、前記予測モデルと、に基づいて、前記収穫日に収穫できる作物の規格
ごとの収穫割合を予測する、
処理をコンピュータが実行することを特徴とする作物規格予測方法。
【請求項2】
前記作物情報は、収穫された前記作物の大きさ、及び収穫された前記作物の長さと重量の比率のいずれかである、ことを特徴とする請求項1に記載の作物規格予測方法。
【請求項3】
前記生成する処理では、前記生育環境に関する情報の中から、前記作物が収穫された日より前の所定期間における所定種類の環境情報である環境特徴量を抽出し、抽出した前記環境特徴量
を説明変数として含むデータセットを用いて、前記予測モデルを生成し、
前記予測する処理では、所定の収穫日までの環境情報を取得し、取得した前記環境情報の中から、前記所定の収穫日より前の所定期間における所定種類の環境情報である環境特徴量を抽出し、該環境特徴量と前記予測モデルとに基づいて、前記収穫日に収穫できる作物の規格
ごとの収穫割合を予測する、
ことを特徴とする請求項1又は2に記載の作物規格予測方法。
【請求項4】
前記環境特徴量は複数種類ある、ことを特徴とする請求項3に記載の作物規格予測方法。
【請求項5】
前記環境特徴量は、前記作物の規格との相関が所定の基準を満たす、前記作物が収穫された日より前の所定期間における所定種類の環境情報である、ことを特徴とする請求項3又は4に記載の作物規格予測方法。
【請求項6】
前記予測モデルは、決定木モデルであることを特徴とする請求項1~
5のいずれか一項に記載の作物規格予測方法。
【請求項7】
収穫された作物の規格を決定するための作物情報と、収穫された前記作物の生育環境に関する情報と、を取得し、
前記作物情報に基づいて、収穫された前記作物の規格を決定し、
決定された前記作物の規格
ごとの収穫割合を目的変数とし、前記生育環境に関する情報
を説明変数とするデータセットを用いて、所定の生育環境下で収穫できる作物の規格
ごとの収穫割合を予測するための予測モデルを生成し、
所定の収穫日までの環境情報を取得し、取得した前記環境情報と、前記予測モデルと、に基づいて、前記収穫日に収穫できる作物の規格
ごとの収穫割合を予測する、
処理をコンピュータに実行させることを特徴とする作物規格予測プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、作物規格予測方法及び作物規格予測プログラムに関する。
【背景技術】
【0002】
生産された農作物の多くは集出荷場に集約され、そこから地方や都市の市場に出荷される。集出荷場では、農作物の大きさ、重さ、長さ、色、障害の有無、内部品質(糖度酸度など)などによって、いくつかのグループに分類され、出荷される。なお、このグループは、一般的に、「規格」や「等級」と呼ばれるが、以下においては、「規格」と記述する。
【0003】
農作物の単価は規格によって大きく異なる。例えば、トマトのサイズ別の規格ではM玉、L玉は高価格であり、その他は低価格である。また、糖度が高いトマトの果実は、通常の果実と比べて2~3倍の価格で販売されている。
【0004】
生産者においては、出荷前にあらかじめ収穫される農作物の規格別割合や規格別の収量が予測できることが好ましい。これらを予測できれば、出荷先を事前に調整したり、出荷先と価格を交渉することが可能となり、有利な取引が可能となるからである。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
最近においては、収穫量を予測することについての研究開発は進められているものの、作物の規格を予測する研究は進んでいない。
【0007】
本発明は、作物の規格を精度よく予測することが可能な作物規格予測方法及び作物規格予測プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の作物規格予測方法は、収穫された作物の規格を決定するための作物情報と、収穫された前記作物の生育環境に関する情報と、を取得し、前記作物情報に基づいて、収穫された前記作物の規格を決定し、決定された前記作物の規格ごとの収穫割合を目的変数とし、前記生育環境に関する情報を説明変数とするデータセットを用いて、所定の生育環境下で収穫できる作物の規格ごとの収穫割合を予測するための予測モデルを生成し、所定の収穫日までの環境情報を取得し、取得した前記環境情報と、前記予測モデルと、に基づいて、前記収穫日に収穫できる作物の規格ごとの収穫割合を予測する、処理をコンピュータが実行する作物規格予測方法である。
【発明の効果】
【0009】
本発明の作物規格予測方法及び作物規格予測プログラムは、作物の規格を精度よく予測することができるという効果を奏する。
【図面の簡単な説明】
【0010】
【
図1】一実施形態に係る農業システムの構成を示す図である。
【
図2】
図1の制御装置のハードウェア構成を示す図である。
【
図4】予測モデル生成部による予測モデル生成処理を示すフローチャートである。
【
図5】作目ごとに定められている分割数を示す図である。
【
図6】予測部による規格ごとの収穫割合予測処理を示すフローチャートである。
【
図9】実施例1のラベリング変換について説明するための図である。
【
図10】実施例1における気象特徴量の決定方法について説明するための図である。
【
図11】実施例1における予測モデル生成のための学習データを示す図である。
【
図12】実施例1の機械学習アルゴリズムを示す図である。
【
図13】サポートベクターマシン、多層パーセプトロン、勾配ブースティング、決定木それぞれの平均誤差率を比較したグラフである。
【
図14】実施例1において用いた気象特徴量1,2,3を示す図である。
【
図15】実施例1において予測した規格別の収穫割合と実際の規格別の収穫割合を比較した結果を示すグラフである。
【
図16】実施例2で用いた収穫データを示す図である。
【
図18】実施例2において予測モデルを生成する際に用いた学習データセットを示す図である。
【
図19】実施例2において予測に用いたデータを示す図である。
【
図20】実施例2における乾物重量/全長の予測値及び実測値、これらの値から得られる予測ラベル及び実測ラベルを示す図である。
【
図21】
図21(a)は、比較例を示す図であり、
図21(b)は、実施例2と比較例の正解率を示す図である。
【発明を実施するための形態】
【0011】
以下、一実施形態について、
図1~
図21に基づいて詳細に説明する。
図1には、一実施形態に係る農業システム100の構成が概略的に示されている。本実施形態の農業システム100は、トマトやパプリカ、キュウリ、ホウレンソウなどの作物を栽培する施設(例えば温室)において、収穫可能な規格を予測したり、作物の規格ごとの収穫割合を予測して、出力するシステムである。
【0012】
農業システム100は、
図1に示すように、制御装置10と、屋外センサ12と、温室18内に設置された温室内センサ14と、温室18内の環境を調整する環境制御機器(以下、制御対象機器と呼ぶ)16と、を備える。制御装置10、屋外センサ12、温室内センサ14、及び制御対象機器16は、インターネットなどのネットワークを介して接続されており、各装置間において情報のやり取りが可能となっている。
【0013】
制御装置10は、温室18内で作物を栽培する作業者が利用可能な情報処理装置であり、屋外センサ12や温室内センサ14において取得される環境データや、作業者が入力した情報に基づいて、予測対象日における作物の規格ごとの収穫割合を予測し、出力(表示等)する。また、制御装置10は、制御対象機器16を制御することもできる。なお、制御装置10の構成や処理の詳細については後述する。
【0014】
屋外センサ12は、温室18の外の気温を検出する温度センサや日射を検出する日射センサを含み、検出結果を制御装置10に対して入力する。
【0015】
温室内センサ14は、温室18内の気温を検出する温度センサ、温室18内の日射を検出する日射センサ、温室18内のCO2濃度を検出するCO2濃度センサを含み、検出結果を制御装置10に対して入力する。
【0016】
制御対象機器16は、ヒートポンプ、換気窓、暖房機、CO2施用機、遮光・保温カーテン等を含む。ヒートポンプは、温室18内の温度を下げる機器であり、換気窓は、温室18内に外気を取り入れる窓である。暖房機は、温室18内の温度を上げる機器であり、CO2施用機は、温室18内のCO2濃度を調整する機器である。また、遮光・保温カーテンは、温室18内の日射や温度を調整するカーテンである。制御対象機器16は、制御装置10の指示に応じた動作を実行することが可能であるものとし、制御対象機器16の動作により温室18内の環境が調整される。
【0017】
ここで、制御装置10の構成や処理について詳細に説明する。
図2には、制御装置10のハードウェア構成が概略的に示されている。
図2に示すように、制御装置10は、CPU90、ROM92、RAM94、記憶部(ここではHDD)96、ネットワークインタフェース97、表示部93、入力部95、及び可搬型記憶媒体用ドライブ99等を備えている。表示部93は、液晶ディスプレイ等を含み、入力部95は、キーボードやマウス、タッチパネル等を含む。これら制御装置10の構成各部は、バス98に接続されている。制御装置10では、ROM92あるいはHDD96に格納されているプログラム(作物規格予測プログラムを含む)、或いは可搬型記憶媒体用ドライブ99が可搬型記憶媒体91から読み取ったプログラムをCPU90が実行することにより、
図3に示す各部の機能が実現される。なお、
図3の各部の機能は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
【0018】
図3には、制御装置10の機能ブロック図が示されている。制御装置10においては、CPU90がプログラムを実行することにより、
図3に示すように、入力受付部30、環境情報取得部32、情報管理部34、予測モデル生成部36、予測部38、出力部40としての機能が実現されている。
【0019】
入力受付部30は、作業者が入力部95を介して入力した実際の収穫データ(定植日、収穫日、収穫日における作物の収穫量、作物がトマトの場合、トマト果実の直径(サイズ)ごとの収穫割合)を取得して、情報管理部34に送信する。また、入力受付部30は、作業者が入力部95を介して入力した操作情報(例えば予測開始指示や予測項目の入力情報)を取得して、予測部38に送信する。
【0020】
環境情報取得部32は、屋外センサ12や温室内センサ14の検出結果を取得し、情報管理部34に送信する。また、環境情報取得部32は、将来の環境データとして、過去のデータ(平年値等)及び予測データ(気象予測メッシュ等)を外部サーバなどから取得し、予測部38に送信する。なお、予測データとして、平年値に所定温度(α℃)を加算した値を用いてもよい。αの値は、ユーザが適宜設定してもよいし、環境情報取得部32が、気象庁の長期予報等に基づいて、αを自動的に設定してもよい。
【0021】
情報管理部34は、入力受付部30から入力された実際の収穫データと、収穫データが得られた収穫日に対応する環境データ(収穫日から遡った所定期間における環境データ)を対応付けて、過去データDB50において管理する。環境データは、例えば各日の平均気温、各日の平均日射量、各日の平均CO2濃度であるものとする。
【0022】
予測モデル生成部36は、作物がトマト等の場合、過去データDB50に格納されているデータを用いて、所定の予測対象日において収穫可能な作物の規格ごとの割合(規格ごとの収穫割合)を予測するための予測モデルを生成する。また、予測モデル生成部36は、作物がホウレンソウ等である場合、所定の予測対象日において収穫可能な作物の規格(収穫規格)を予測するための予測モデルを生成する。なお、予測モデルの生成方法の詳細については後述する。
【0023】
予測部38は、予測モデル生成部36が生成した予測モデルに、予測対象日に対応する環境データを入力することで、予測対象日における規格ごとの収穫割合や、収穫作物の規格を予測する。なお、規格ごとの収穫割合の予測方法や収穫作物の規格の予測方法の詳細については後述する。
【0024】
出力部40は、予測部38が予測した結果を表示部93上に表示する。また、出力部40は、制御対象機器16に対して、制御情報を出力する。
【0025】
(制御装置10の処理について)
次に、制御装置10の処理について、
図4、
図6のフローチャートに沿って、詳細に説明する。
図4の処理は、予測モデル生成部36による予測モデルを生成する処理を示すフローチャートである。なお、
図4の予測モデルは、規格ごとの収穫割合を予測するモデルであるものとする。
図6の処理は、予測部38による規格ごとの収穫割合の予測処理を示すフローチャートである。
【0026】
(予測モデル生成処理)
図4の処理の前提として、情報管理部34は、入力受付部30に入力された実際の収穫データと、当該収穫データに含まれる定植日と収穫日との間の期間の環境データを対応付けて、過去データDB50に格納しているものとする。なお、生成する予測モデルの対象が1つの温室の場合には、収穫データに対応付ける環境データは、温室内の環境データである。一方、生成する予測モデルの対象が一地方の複数施設を対象とする場合(すなわち、対象が「産地」の場合)には、収穫データに対応付ける環境データは、屋外の環境データである。
【0027】
図4の処理では、まず、ステップS10において、予測モデル生成部36が、1つの作目を特定し、過去データDB50を参照して、特定した作目についての過去の収穫データと、当該過去の収穫データに対応する定植日と収穫日との間の期間における環境データを取得する。収穫データは、例えば、
図7に示すように、栽培年、定植日、収穫日、収穫量、サイズごとの収穫割合等の情報を含んでいる。
図7の収穫データに含まれる「サイズごとの収穫割合」は、サイズごとの収穫個数や、収穫重量であってもよい。環境データは、例えば各日の平均気温、各日の平均日射量、各日の平均CO
2濃度であるものとする。なお、環境データには、その他のデータ、例えば肥料濃度、地温、灌水量などが含まれていてもよい。
【0028】
ここで、予測モデル生成部36は、定植日と収穫日との間の期間における環境データに代えて、作目ごとに定められた収穫日から遡った期間における環境データを取得してもよい。この期間は、例えば、キュウリであれば収穫日から積算気温300℃遡った期間、ホウレンソウであれば収穫日から積算気温600℃遡った期間、トマトであれば収穫日から積算気温1200℃遡った期間、パプリカであれば収穫日から積算気温1400℃遡った期間とすることができる。なお、所定期間は、積算気温に基づいて定められていなくてもよい。例えば、所定期間は、収穫日から所定日数遡った日までの期間であってもよい。また、作目以外に、地域や季節ごとに所定期間が定められていてもよい。
【0029】
次いで、ステップS12では、予測モデル生成部36は、ステップS10で取得した収穫データを規格データにラベリング変換する。例えば、予測モデル生成部36は、
図7の収穫データを、果実の直径別分類を示す規格(2L,L,M,S,2S)でラベリング変換し、
図7に示すような規格データを生成する。予測モデル生成部36は、生成した規格データを学習データの目的変数とする。
【0030】
次いで、ステップS14では、予測モデル生成部36が、環境データを取得した所定期間を、特定した作目に対応する分割数nで分割して、n個のステージを設定する。分割数nは、過去の知見などから定められており、
図5に示すように、例えば、キュウリはn=3、ホウレンソウはn=1、トマトはn=6、パプリカはn=7と定められているものとする。したがって、トマトの場合には、トマトの定植日から収穫日までの期間をST1~ST6に分割する。なお、予測モデル生成部36は、積算気温に基づいて期間を分割してもよいし、日数に基づいて期間を分割してもよい。また、作業者等の知見に基づいて、所定期間を不均等に分割してもよい。
【0031】
ここで、予測モデル生成部36は、予め、各ステージの各環境データと、収穫データとの相関を算出し、算出した相関に基づいて、気象特徴量(環境特徴量)を特定しているものとする。この気象特徴量は、収穫データ(規格ごとの収穫割合)との相関が所定以上高い環境データである。気象特徴量は、ある期間(ステージ)のある種類の環境データ(例えば開花期の積算温度、桃熟期の平均温度)というように特定される。なお、この処理の詳細については後述する。
【0032】
次いで、ステップS16では、予測モデル生成部36は、ステップS10において取得した環境データから、気象特徴量を抽出し、学習データの説明変数とする。
【0033】
次いで、ステップS18では、予測モデル生成部36は、説明変数と目的変数とを合わせて学習データセットとする。
【0034】
次いで、ステップS20では、予測モデル生成部36は、学習データセットを用いて、決定木モデルなどの予測モデルを生成する。そして、予測モデル生成部36は、生成した予測モデルを予測モデル格納部52に格納する。なお、学習モデルとしては、他の学習モデル(ランダムフォレスト、SVM(Support Vectors Machine,、artificial neural networkなど)を利用してもよい。また、機械学習のアルゴリズムとしては、ディープラーニング以外のアルゴリズムを用いてもよい。
【0035】
以上により、
図4の全処理が終了する。なお、予測モデルを生成すべき作目がそのほかにも存在する場合には、予測モデル生成部36は、
図4の処理を繰り返し実行すればよい。また、予測モデル生成部36は、
図4の処理を、所定時間ごと又は新たな収穫量のデータや環境データが所定数以上入力されるごとに行い、予測モデルを随時更新するようにしてもよい。これにより、最新のデータによって予測モデルが更新されるため、予測モデルの予測精度を向上させることができる。
【0036】
(規格毎の収穫割合予測処理)
次に、予測部38による処理について、
図6のフローチャートに沿って説明する。なお、
図6のフローチャートが開始される前提として、作業者が入力部95を介して、収穫割合を予測する作目を入力しているものとする。
【0037】
図6の処理が開始されると、まず、ステップS50において、予測部38は、入力された作目を取得し、取得した作目に対応する予測モデルを予測モデル格納部52から取得する。
【0038】
次いで、ステップS52では、予測部38は、作業者が入力部95を介して入力する予測項目を取得する。予測項目は、例えば、収穫日(予測対象日)であるものとする。なお、作業者が予測対象日における特定の規格の収穫割合を知りたい場合には、予測項目として、収穫日と規格を入力することもできるものとする。
【0039】
次いで、ステップS54では、予測部38は、予測モデルに入力するための環境データを取得する。具体的には、予測部38は、収穫日に対応する環境データ、例えば作目ごとに予め定められた、収穫日から所定期間遡った期間の環境データを取得する。
【0040】
次いで、ステップS56では、予測部38は、取得した環境データから気象特徴量を取得する。本ステップS56における気象特徴量は、ステップS16の気象特徴量と同様である。
【0041】
次いで、ステップS58では、予測部38は、気象特徴量を入力とし、ステップS52において取得した予測モデルを用いて、各規格の収穫割合を予測する。
【0042】
次いで、ステップS60では、予測部38は、出力部40を介して、ステップS58の予測結果を表示部93上に表示する。これにより、作業者は、入力した収穫日(予測対象日)における、規格ごとの収穫割合の予測結果を確認することができる。
【0043】
【実施例】
【0044】
次に、実施例1、2について説明するが、本発明はこれらに限定されるものではない。
【0045】
(実施例1)
以下、作目がトマトである場合の実施例について説明する。
【0046】
実施例1は、トマトの果実サイズ(直径)に対応する規格ごとの収穫割合を予測するための予測モデルを作成し、作成した予測モデルを用いて規格ごとの収穫割合を予測した例である。この実施例1において用いたデータは、2016年から2018年の実験圃場における週単位の収穫データ、その栽培時の環境データである。実験圃場では、毎年8月中旬にトマトの苗を定植し、10月上旬から収穫を始め、翌年6月中旬に栽培を終了する。
【0047】
(収穫データ及び環境データ:ステップS10)
図7には、本実施例1で用いた収穫データの一部が示されている。
図7からは、例えば、2016年8月10日に定植した苗から、10月12日の週にトマトを200kg収穫できたことがわかる。また、
図7からは、10月12日の週に収穫できたトマトに、果実の直径が8cm以上のものが4%、果実の直径が7-8cmのものが20%、果実の直径が6-7cmのものが34%、果実の直径が5-6cm以上のものが23%、果実の直径が5cm以下のものが19%含まれていたことがわかる。
図4のステップS10においては、この
図7に示すような収穫データと、収穫データの各行の定植日と収穫日との間の期間の環境データを取得する。
【0048】
(規格データ:ステップS12)
図8には、
図7の収穫果実の直径別分類を規格に変換(ラベリング変換)して得られた規格データが示されている。例えば、2016年10月12日の週に収穫された規格Lの割合は全果実数量の20%である。ここでの2L~2Sの区分は、一般的選果場における果実選別規格に基づいて定義したものである。本実施例1では、トマト果実を5つの規格(2L~2S)に区分したが、作物の種類や出荷形態に応じて、これより粗く、あるいは細かく区分してもよい。
【0049】
図8に示す2016年10月12日の週に収穫されたトマトの規格は、{2L,L,M,S,2S}={4,20,34,23,19}の確率分布に従う。このような複数の変数を同時に取り扱うため、次式(1)のように、確率変数を組み合わせたベクトルとして考える。Xはn次元確率ベクトルである。
【0050】
【0051】
ここで、確率関数としては、fX(x)=P(X=x)が定義され、次式(2)のように表される。
【0052】
【0053】
本実施例1では、各規格の分布関数は次式(3)のように表される。
【0054】
【数3】
なお、(x
1,x
2,x
3,x
4,x
5)は各規格トマト割合の確率を組み合わせたベクトルである。実施例1では、トマト各規格割合の合計x
1+x
2+x
3+x
4+x
5は100%である。
【0055】
本実施例1では、
図9に示すように、果実規格ごとのラベルを確率変数で表し、学習特徴データとそのデータに付与されたラベルとの組を学習データとして、学習処理を行い、ラベルを推定するモデルを生成した。そして、当該モデルを用いて、トマトの規格毎の収穫割合を、規格ごとの分布に変換した。また、数年分の規格ごとの収穫割合についても同様に変換し、確率分布に従ってデータを発生させて、ラベルを付けた。変換後の規格データは、学習データの目的変数とした。
【0056】
(期間の分割:ステップS14)
本実施例1では、トマトの開花から果実の収穫までの期間(
図5のST6を除く期間)を、開花期(ER)、緑熟期(TR)、催色期(TC)、桃熟期(ET)、完熟期(TEM)とした。
【0057】
(気象特徴量:ステップS16)
事前に、各ステージの各環境データと、収穫データとの相関を算出し、気象特徴量を決定しておく必要がある。
【0058】
本実施例1では、ステージごとに、果実の規格ごとの収穫割合と各種環境データとの相関を計算した。例えば、環境データが平均温度の場合、開花期(ER)、緑熟期(TR)、催色期(TC)、桃熟期(ET)、完熟期(TEM)のそれぞれにおける平均温度を縦軸、各規格の収穫個数を横軸とした2次元座標上にプロットし、相関係数R
2を調べた。その結果、
図10に示すような相関係数R
2が得られた。
【0059】
本実施例1では、2L~2Sの相関係数R
2のうち1つ以上が0.2以上である期間の平均温度を気象特徴量とした。例えば、
図10に示すように開花期(ER)に関しては、各規格(2L、L、M、S、2S)の相関係数R
2は、それぞれ0.946、0.395、-0.31、-0.05、-0.398であり、2Lの0.946とLの0.395が0.2より大きい。したがって、開花期(ER)の平均温度を気象特徴量として選択した。また、緑熟期(TR)に関しては、各規格(2L、L、M、S、2S)の相関係数は、それぞれ0.0026、0.006、-0.0035、-0.0021、-0.0321であり、すべてが0.2未満であるため、緑熟期(TR)の平均温度を気象特徴量として選択しなかった。本実施例1では、気象特徴量1として、開花期(ER)の平均温度、気象特徴量2として桃熟期(ET)の平均温度、気象特徴量3として完熟期(TEM)の平均温度を選択した。ただし、本実施例1では、気象特徴量1として、開花期(ER)における日平均温度の7日分の積算値、気象特徴量2として桃熟期(ET)の日平均温度の7日分の積算値、気象特徴量3として完熟期(TEM)の日平均温度の7日分の積算値を用いることとした。気象特徴量としてこのような7日分の積算値を用いたのは、(1)生産現場においてトマトの出荷量予測を行う場合、週単位で予測することが多いため、出荷量予測の時間帯と規格の予測の時間帯を合わせることで処理が簡素化すること、(2)果実の成長と成熟の過程と気象の関係を表す場合、積算値を用いる方が適切であること、などに基づく。なお、平均温度以外の環境データについても同様にして相関を計算したが、気象特徴量となるものはなかった。
【0060】
なお、選定方法としては種々の方法が考えられるが、例えば、相関係数R2が0.5以上の環境データ(ステージと種類の組み合わせ)を選定するとともに、相関係数R2が0.5未満のうち、相関係数R2が高い順に所定数の環境データ(ステージと種類の組み合わせ)を選定する、などの方法がある。
【0061】
(学習データ:ステップS18)
本実施例1における、予測モデル生成のための学習データは、
図11に示すようなデータである。各収穫日に対応する気象特徴量が、説明変数であり、各収穫日に対応する規格毎の収穫割合(Pm
(k))が目的変数である。各収穫日には、データ番号nが割り振られており、当該データ番号nに紐づく形で気象特徴量と収穫割合が関連付けられている。
【0062】
(学習モデルの生成:ステップS20)
上述した学習データ(目的変数と説明変数)を用いて学習モデルを生成した。
【0063】
機械学習アルゴリズムとしては、
図12に示すようなアルゴリズムを用いた。
【0064】
本実施例1では、樹木状のモデルを作成する分析方法である決定木モデルを用いた。決定木モデルは、入力に対して、予め学習データを使って設定した条件式を繰り返し適用し、最終的にたどり着いた地点(葉ノード)に設定されている情報を予測結果として出力するアルゴリズムである。
【0065】
なお、前述のように、学習モデルとしては、様々なものを採用することが可能であるが、サポートベクターマシン、多層パーセプトロン、勾配ブースティング、決定木について、平均誤差率を確認したところ、
図13に示すように決定木モデルが最も誤差が小さいことが分かったため、本実施例1では決定木モデルを採用した。
【0066】
(予測処理:
図6)
本実施例1では、予測モデルの効果を検証するため、2019年8月~2020年5月までの規格ごとの収穫割合を予測した。予測項目として、収穫週の日付け、予測期間内の環境データを作成した予測モデルに入力した。
【0067】
また、本実施例1では、収穫日より2週間前からの1週間ごとの規格別の収穫割合を予測した。例えば、10月10日に2週間後の10月24日の収穫週の果実規格を予測する場合、まず、収穫週の日付けとして「10月24日」、定植日として「8月15日」を入力し、定植日と収穫日との間の実際の環境データを入力した(S52、S54)。環境データからは、気象特徴量1~3を以下のようにして取得した(S56)。
(1)気象特徴量1として、トマトの収穫日から遡った積算温度1100度の日を決めて、その日から所定日数(ここでは、49日)の間の日平均温度を計算し、それを7日分積算してt1_2とした。
(2)気象特徴量2として、収穫日10月24日の前1週間(10月17日-24日)の日平均温度を計算し、それを7日分積算してt2_2とした。
(3)気象特徴量3として、収穫日10月24日の週間(10月24日-31日)の日平均温度を計算し、それを7日分積算してt3_2とした。
【0068】
なお、本実施例1における気象特徴量1、2、3の具体的な数値は、
図14において太線枠で示す通りである。気象特徴量t1_2、t2_2、t3_2を予測モデルに入力することで、予測を実行して、10月24日の週に予測される各規格別割合を出力した。
【0069】
上述したような予測を行った結果、10月24日の週の予測された規格割合は、2L=5%、L=18%、M=32%、S=32%、2S=10%であった。一方、10月24日の週の実際の規格割合は、2L=6%、L=25%、M=33%、S=29%、2S=9%であった。
【0070】
図15には、2019年10月~2020年5月までの期間において、予測した規格別の収穫割合と実際の規格別の収穫割合を比較した結果が示されている。
図15に示すように、1週間の収穫量の2S~2Lの規格別の収穫割合を精度よく予測することができた。
【0071】
(実施例2)
実施例2では、ホウレンソウについて、2019年~2020年8月まで水耕栽培圃場で得られた収穫データを用いて予測モデルを作成した。また、その予測モデルを用いて、2020年9月~12月に収穫される規格を予測し、実際の規格と比較することで検証した。なお、本実施例2では、収穫週に収穫されるホウレンソウが規格内であるか規格外であるかを予測することとしている。
【0072】
(収穫データ:ステップS10)
図16には、2019年~2020年8月までホウレンソウの定植日、収穫日、規格情報(全長、乾物重量)が示されている。本実施例2では、
図16のデータを過去の収穫データとして用いた。
【0073】
(ラベリング変換:ステップS12)
本実施例2では、ホウレンソウの規格区分を「規格内」と「規格外」の2種類に区分した。その判断基準としては、乾物重量/全長を用い、
乾物重量/全長≧0.06
であれば、規格内であり、ラベル「1」とし、
乾物重量/全長<0.06
であれば、規格外であり、ラベル「0」とした。
【0074】
図17には、ラベリング変換後の規格データが示されている。本実施例2においては、
図17の規格データを、学習データの目的変数とした。
【0075】
なお、本実施例2では、株の全長と乾物重量の比率を判断基準としたが、この他に、葉色、新鮮重などを判断基準としてもよい。また、規格区分として、規格内と規格外の2種類だけでなく、3種類以上の区分を適用してもよい。
【0076】
(気象特徴量の抽出:ステップS16)
ホウレンソウの葉の成長と、毎日の環境データとの相関を確認したところ、定植日から収穫日までの日平均温度の積算温度と、定植日から収穫日までの積算日射が、葉の成長と相関が高かった。このため、気象特徴量1として、「定植日から収穫日までの日平均温度の積算温度」を採用し、気象特徴量2として、「定植日から収穫日までの積算日射」を採用し、学習データの説明変数とした。
【0077】
(学習データセット:ステップS18)
図18は、予測モデルを生成する際に用いた学習データセットを示している。
【0078】
(予測モデルの生成:ステップS20)
本実施例2で用いる学習アルゴリズムは、実施例1と同様、決定木モデルであり、データに対する応答を予測するように分類木を学習させた。応答を予測する際、ツリーのルート(開始)ノードから葉ノードの方向に意思決定を行った。葉ノードには応答が含まれており、予測は最上位のノードから始まる。各決定では、予測子の値をチェックして、どの分岐に進むかを決定する。分岐が葉ノードに達すると、データは「0」または「1」のタイプに分類される。
【0079】
(予測処理:
図6)
予測モデルの効果を検証するため、上述したようにして生成した予測モデルを用いて、2020年9月~12月までに栽培されたホウレンソウの規格を予測した。規格の予測は、
図6に示す予測処理のフローに従った。予測項目として定植日、収穫日を入力し(
図6のS52)、定植日から収穫日までの環境データを入力した(
図6のS54)。
図19には、予測に利用したデータが示されている。
図19には、作番号1~16までのデータが入力されている。また、
図19の気象特徴量1は、上述したように「定植日から収穫日までの毎日の積算温度」であり、気象特徴量2は「定植日から収穫日までの毎日の積算日射」である。
【0080】
例えば、
図19の作番号1についての予測においては、収穫日(2020年9月22日)の2週間前の9月7日時点で、9月22日に収穫予定のホウレンソウの規格を予測した。その他の作番号2~16についても同様である。予測モデルに、
図19の気象特徴量1,2それぞれを入力することで、各作番号の収穫時の規格を予測し、予測結果を得た(
図6のS58、S60)。
【0081】
図20には、乾物重量/全長の予測値及び実測値、これらの値から得られる予測ラベル及び実測ラベルが示されている。
図20に示すように、例えば、9月22日収穫のホウレンソウの予測結果(予測ラベル)は規格内(ラベル「1」)であり、実測ラベルと一致した。
図20に示す16作分の予測ラベルと実測ラベルについては、正解率は100%であり、ホウレンソウの規格を精度よく予測することができた。
【0082】
(比較例)
図21(a)には、SVM学習方法のモデルを用いて予測した結果が示されている。この比較例においては、実施例2で用いた収穫データ及び環境データと同一のデータを用いた。比較例の場合、正解が9、不正解が7となった。
図21(b)には、決定木モデルによる予測の結果と、SVMによる予測の結果が示されている。
図21(b)に示すように、実施例2(決定木モデル)では、正解率が100%となったのに対し、比較例(SVM)では、正解率が56.3%となった。
図21(b)より、決定木モデルによる予測精度が高いことが示された。
【0083】
以上詳細に説明したように、本実施形態によると、予測モデル生成部36は、収穫された作物の規格を決定するための作物情報(収穫データ)と、収穫された作物の生育環境に関する情報(環境データ)を取得する。また、予測モデル生成部36は、収穫データに基づいて、収穫された作物の規格を決定し、規格と環境データとに基づいて予測モデルを生成する。そして、予測部38は、予測対象の収穫日までの環境データを取得し、取得した環境データと予測モデルとに基づいて、収穫日に収穫できる作物の規格を予測する。これにより、本実施形態では、過去に収穫された作物の規格と、その生育環境とに基づいて生成された予測モデルを用いて、精度よく作物の規格を予測することができる。規格を精度よく予測できることで、生産者は出荷先を事前に調整したり、出荷先と価格を交渉することが可能となり、有利な取引が可能となる。
【0084】
また、実施例1のように、予測モデルは、収穫できる作物の規格ごとの割合を予測するモデルとすることができるため、規格ごとの割合を精度よく予測することができる。
【0085】
また、本実施形態では、予測モデル生成部36は、規格との相関が所定以上である期間と環境データの種類を特定して、気象特徴量とし、環境データから抽出した気象特徴量を用いて予測モデルを生成する。そして、予測部38は、生成した予測モデルに予測したい収穫日に対応する気象特徴量を入力することで収穫日に収穫可能な作物の規格を予測する。これにより、規格との関連性の高い環境データを用いて、精度よく作物の規格を予測することができる。
【0086】
なお、上記実施形態では、予測モデル生成部36は、予測モデルの生成に用いる環境データ(気象特徴量:ステージと種類の組み合わせ)を、収穫データとの相関に基づいて特定する場合について説明したが、これに限られるものではない。例えば、予測モデル生成部36は、生理学的に環境影響の大きい重要なステージの情報が予めわかっている場合には、その情報を考慮して、予測モデルの生成に用いる気象特徴量を特定してもよい。例えば、作目ごとに重要なステージが決まっている場合には、そのステージの環境データを無条件で(相関の大小にかかわらず)気象特徴量として用いるようにしてもよい。また、重要なステージの環境データを優先的に予測モデルの生成に用いてもよい。この場合、例えば、重要なステージの環境データの相関(決定係数R2)に、所定数を加算するなどすることができる。
【0087】
なお、上記実施形態では、規格がトマトの果実サイズや、乾物重量/全長に基づくものである場合について説明したが、これに限らず、規格は、糖度などのその他の品質に基づくものであってもよい。
【0088】
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、処理装置が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記憶媒体(ただし、搬送波は除く)に記録しておくことができる。
【0089】
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD(Digital Versatile Disc)、CD-ROM(Compact Disc Read Only Memory)などの可搬型記憶媒体の形態で販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
【0090】
プログラムを実行するコンピュータは、例えば、可搬型記憶媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記憶媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
【0091】
上述した実施形態は本発明の好適な実施の例である。但し、これに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
【符号の説明】
【0092】
10 制御装置
30 入力受付部
32 環境情報取得部
34 情報管理部
36 予測モデル生成部
38 予測部
40 出力部
100 農業システム