(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024064151
(43)【公開日】2024-05-14
(54)【発明の名称】情報処理装置、情報処理方法、およびプログラム
(51)【国際特許分類】
G06Q 50/02 20240101AFI20240507BHJP
【FI】
G06Q50/02
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2022172522
(22)【出願日】2022-10-27
(71)【出願人】
【識別番号】501203344
【氏名又は名称】国立研究開発法人農業・食品産業技術総合研究機構
(74)【代理人】
【識別番号】100161207
【弁理士】
【氏名又は名称】西澤 和純
(74)【代理人】
【識別番号】100188558
【弁理士】
【氏名又は名称】飯田 雅人
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(72)【発明者】
【氏名】岩▲崎▼ 千沙
(72)【発明者】
【氏名】杉浦 綾
(72)【発明者】
【氏名】石原 光則
【テーマコード(参考)】
5L049
5L050
【Fターム(参考)】
5L049CC01
5L050CC01
(57)【要約】
【課題】地上でのサンプリング調査を必須とせず、所望の対象区画についての収量予測を可能とする情報処理装置、情報処理方法、およびプログラムを提供すること。
【解決手段】少なくとも、上方から農地を撮像した時系列の画像と、時系列の気象情報とを取得する取得部と、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを学習済モデルに入力することで、対象区画における作物の予想収量を導出する導出部と、を備え、前記学習済モデルは、複数の前記対象区画を含む広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように予め学習されたものである、情報処理装置。
【選択図】
図3
【特許請求の範囲】
【請求項1】
上方から農地を撮像した時系列の画像と、時系列の気象情報とを取得する取得部と、
少なくとも、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを学習済モデルに入力することで、対象区画における作物の予想収量を導出する導出部と、
を備え、
前記学習済モデルは、複数の前記対象区画を含む広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように予め学習されたものである、
情報処理装置。
【請求項2】
前記導出部は、更に、前記対象区画の土壌特性を前記学習済モデルに入力することで、前記対象区画における作物の予想収量を導出する、
請求項1記載の情報処理装置。
【請求項3】
前記学習済モデルは、単位面積当たりの予想収量を導出するものであり、
前記導出部は、前記単位面積当たりの予想収量に前記対象区画の面積、または、前記対象区画での対象作物の作付面積を乗算することで、前記対象区画における作物の予想収量を導出する、
請求項1記載の情報処理装置。
【請求項4】
前記損失関数は、前記対象区画ごとの、時系列の前記植生の状態を表すデータおよび時系列の前記気象情報に基づいてルールベースで求められる単位面積当たりの収量の見込み値と、時系列の前記植生の状態を表すデータおよび時系列の前記気象情報の特定要素を結合した値との相関関係が、得られている知見と逆相関であればペナルティが発生するペナルティ項を含む、
請求項3記載の情報処理装置。
【請求項5】
複数の前記対象区画を含む広域区画に関して、少なくとも、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを機械学習モデルに入力することで導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように、前記機械学習モデルのパラメータを学習して前記学習済モデルを生成する学習部を更に備える、
請求項1記載の情報処理装置。
【請求項6】
前記学習済モデルは、単位面積当たりの予想収量を導出するものであり、
前記導出部は、前記単位面積当たりの予想収量に前記対象区画の面積、または、前記対象区画での対象作物の作付面積を乗算することで、前記対象区画における作物の予想収量を導出し、
前記損失関数は、前記対象区画ごとの、時系列の前記植生の状態を表すデータおよび時系列の前記気象情報に基づいてルールベースで求められる単位面積当たりの収量の見込み値と、時系列の前記植生の状態を表すデータおよび時系列の前記気象情報の特定要素を結合した値との相関関係が、得られている知見と逆相関であればペナルティが発生するペナルティ項を含む、
請求項5記載の情報処理装置。
【請求項7】
情報処理装置が、
上方から農地を撮像した時系列の画像と、時系列の気象情報とを取得し、
少なくとも、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを学習済モデルに入力することで、対象区画における作物の予想収量を導出し、
前記学習済モデルは、複数の前記対象区画を含む広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように予め学習されたものである、
情報処理方法。
【請求項8】
コンピュータに、
上方から農地を撮像した時系列の画像と、時系列の気象情報とを取得させ、
少なくとも、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを学習済モデルに入力することで、対象区画における作物の予想収量を導出させるためのプログラムであって、
前記学習済モデルは、複数の前記対象区画を含む広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように予め学習されたものである、
プログラム。
【請求項9】
少なくとも、上方から農地を撮像した時系列の画像と、時系列の気象情報と、複数の対象区画を含む広域区画に関する収量データとを取得する取得部と、
少なくとも、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを入力することで、前記対象区画における作物の予想収量を導出する学習済モデルを生成する学習部と、
を備え、
前記学習部は、前記広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように、前記学習済モデルのパラメータを学習する、
情報処理装置。
【請求項10】
情報処理装置が、
少なくとも、上方から農地を撮像した時系列の画像と、時系列の気象情報と、複数の対象区画を含む広域区画に関する収量データとを取得し、
少なくとも、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを入力することで、前記対象区画における作物の予想収量を導出する学習済モデルを生成し、
前記学習済モデルを生成する際に、前記広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように、前記学習済モデルのパラメータを学習する、
情報処理方法。
【請求項11】
コンピュータに、
少なくとも、上方から農地を撮像した時系列の画像と、時系列の気象情報と、複数の対象区画を含む広域区画に関する収量データとを取得させ、
少なくとも、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを入力することで、前記対象区画における作物の予想収量を導出する学習済モデルを生成させるためのプログラムであって、
前記コンピュータに、
前記学習済モデルを生成する際に、前記広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように、前記学習済モデルのパラメータを学習させる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
農林水産省により、市町村別の作物の収量データが提供されている。非特許文献1、2に記載された技術は、いずれも市町村単位で収量を予測するものである。
【0003】
現実には、より狭域な区画(例えば圃場)ごとに収量の予測データを取得したいというニーズがある。土地利用型作物栽培では、気象や土壌などの生育環境の差や、栽培管理の差が圃場ごとに存在するため、作物の生育がバラつくことで最終的な収量にも差が生じるからである。従って、生育途中で圃場ごとに収量を予想することができれば、収量目標の設定や栽培管理の見直しに役立つ。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】「農用地調査へのリモートセンシング技術の適用性に関する研究-ランドサットMSSデータを用いた水稲冷害分布の調査法」、深山一弥、佐藤博、安田嘉純、江森康文、農業土木学会論文集1983巻(1983)105号
【非特許文献2】「ランドサットTMデータおよびMOS-1/MESSRデータを用いた水稲収量地図の作成」、志賀弘行、安積大治、日本土壌肥料学雑誌66巻(1995)6号
【非特許文献3】「多時期ASTER画像による宮城県大崎地域での農地の作付け分類」、大澤一雅、國井大輔、斎藤元也、システム農学26巻(2010)2号
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら現在知られている圃場単位での作物の収量予想方法は、学習データを用意するために地上でのサンプリング調査が必要であるため、労力が過大となっている。
【0006】
本発明は、このような事情を考慮してなされたものであり、地上でのサンプリング調査を必須とせず、所望の対象区画についての収量予測を可能とする情報処理装置、情報処理方法、およびプログラムを提供することを目的の一つとする。
【課題を解決するための手段】
【0007】
本発明の一態様である情報処理装置は、少なくとも、上方から農地を撮像した時系列の画像と、時系列の気象情報とを取得する取得部と、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを学習済モデルに入力することで、対象区画における作物の予想収量を導出する導出部と、を備え、前記学習済モデルは、複数の前記対象区画を含む広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように予め学習されたものである。
【0008】
本発明の他の態様に係る情報処理方法は、情報処理装置が、少なくとも、上方から農地を撮像した時系列の画像と、時系列の気象情報とを取得し、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを学習済モデルに入力することで、対象区画における作物の予想収量を導出し、前記学習済モデルは、複数の前記対象区画を含む広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように予め学習されたものである。
【0009】
本発明の他の態様に係るプログラムは、コンピュータに、少なくとも、上方から農地を撮像した時系列の画像と、時系列の気象情報とを取得させ、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを学習済モデルに入力することで、対象区画における作物の予想収量を導出させるためのプログラムであって、前記学習済モデルは、複数の前記対象区画を含む広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように予め学習されたものである。
【0010】
本発明の他の態様に係る情報処理装置は、少なくとも、上方から農地を撮像した時系列の画像と、時系列の気象情報と、複数の対象区画を含む広域区画に関する収量データとを取得する取得部と、少なくとも、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを入力することで、前記対象区画における作物の予想収量を導出する学習済モデルを生成する学習部と、を備え、前記学習部は、前記広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように、前記学習済モデルのパラメータを学習するものである。
【0011】
本発明の他の態様に係る情報処理方法は、情報処理装置が、少なくとも、上方から農地を撮像した時系列の画像と、時系列の気象情報と、複数の対象区画を含む広域区画に関する収量データとを取得し、少なくとも、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを入力することで、前記対象区画における作物の予想収量を導出する学習済モデルを生成し、前記学習済モデルを生成する際に、前記広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように、前記学習済モデルのパラメータを学習するものである。
【0012】
本発明の他の態様に係るプログラムは、コンピュータに、少なくとも、上方から農地を撮像した時系列の画像と、時系列の気象情報と、複数の対象区画を含む広域区画に関する収量データとを取得させ、少なくとも、前記時系列の画像から得られる時系列の植生の状態を表すデータと、前記時系列の気象情報とを入力することで、前記対象区画における作物の予想収量を導出する学 習済モデルを生成させるためのプログラムであって、前記コンピュータに、前記学習済モデルを生成する際に、前記広域区画に関して、前記導出される前記対象区画ごとの予想収量を合計した値と、前記広域区画に関して取得された収量データの示す値との誤差を含む損失関数が小さくなるように、前記学習済モデルのパラメータを学習させるものである。
【発明の効果】
【0013】
上記各態様によれば、地上でのサンプリング調査を必須とせず、所望の対象区画についての収量予測を可能とすることができる。
【図面の簡単な説明】
【0014】
【
図1】情報処理装置100の使用環境の一例を示す図である。
【
図3】情報処理装置100が実行する推論段階の処理について説明するための図である。
【
図4】導出部130の処理について説明するための図(その1)である。
【
図5】導出部130の処理について説明するための図(その2)である。
【
図6】導出部130の処理について説明するための図(その3)である。
【
図7】情報提供部140が提供する情報の一例を示す図(その1)である。
【
図8】情報提供部140が提供する情報の一例を示す図(その2)である。
【
図9】学習部150の処理について説明するための図である。
【
図10】ペナルティ関数gの特性を例示した図(その1)である。
【
図11】ペナルティ関数gの特性を例示した図(その2)である。
【発明を実施するための形態】
【0015】
以下、図面を参照し、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。なお図面においてはベクトルを太字で表しているが、明細書文中において、符号の後あるいは途中に「#」が付されたものがベクトルを表すものとする。
【0016】
[構成]
図1は、情報処理装置100の使用環境の一例を示す図である。情報処理装置100は、例えば、一以上の衛星10から衛星画像提供者サーバ20およびネットワークNWを介して衛星10が撮像した画像(衛星画像)を取得すると共に、一以上の公共情報提供サーバ30からネットワークNWを介して、筆ポリゴンデータ、収量データ、気象情報、土壌特性などの各種情報を取得する。衛星画像は、地上の農地Fを繰り返し撮像した画像である。時系列の衛星画像は、「上方から農地を撮像した時系列の画像」の一例である。衛星画像に換えて、ドローンや鉄塔に取り付けられたカメラ等によって農地Fを撮像した画像が使用されてもよい。情報処理装置100は、ネットワークNWを介して端末装置50に情報を提供する。ネットワークNWは、例えば、LAN、WAN、インターネット回線などの任意のネットワークであり、有線でも無線でもよい。なお、衛星画像の取得方法はこれに限らず、記憶媒体に格納された画像が情報処理装置100のドライブ装置に装着されることで衛星画像が取得されてもよい。また、衛星画像は情報処理装置100に渡される前に前処理が行われたものであってもよい。
【0017】
衛星10は、例えば、地球の周りの軌道上を周回しており、定期的に地上(地面)を撮像する。衛星画像提供者サーバ20は、衛星10が撮像した画像を情報処理装置100などに提供する。
【0018】
公共情報提供サーバ30は、農林水産省や気象庁などの公共機関、それらの依頼を受けたネットワーク配信者、或いは公共機関の提供する情報を二次的に提供する民間業者により運営されるサーバである。
【0019】
端末装置50は、例えば、パーソナルコンピュータやスマートフォン、タブレット端末などのコンピュータ装置である。端末装置50は、情報処理装置100とネットワークNWを介して通信し、情報処理装置100から受信した情報を表示する。
【0020】
図2は、情報処理装置100の構成図である。情報処理装置100は、例えば、ウェブサーバの機能を有する。情報処理装置100は、例えば、取得部110と、作付け分類部120と、導出部130と、情報提供部140と、学習部150と、記憶部180とを備える。記憶部180には、学習済モデル182などの情報が格納されている。記憶部180以外の構成要素は、例えば、CPU(Central Processing Unit)などのプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで記憶装置にインストールされてもよい。
【0021】
以下、
図3も参照しながら情報処理装置100の各部の機能について説明する。
図3は、情報処理装置100が実行する推論段階の処理について説明するための図である。取得部110は、図示しない通信インターフェースを用いて、前述のように衛星画像、筆ポリゴンデータ、気象情報などの情報を取得する。また、取得部110は、学習段階の処理のために収量データを取得する。取得部110は、これらの情報を自動的に取得してもよいが、必要に応じて操作者の操作を受け付けることで取得してもよい。例えば、操作者がウェブサイトからデータをダウンロードした後、そのデータを情報処理装置100の記憶部180の所定のアドレスに格納し、取得部110は、記憶部180からダウンロードされたデータを読み出すという手順で、データが取得されてもよい。
【0022】
[推論段階]
取得部110は、衛星画像と筆ポリゴンデータを用いて衛星画像を圃場単位に切り分けて圃場画像を取得する処理を行う。筆ポリゴンデータとは、農林水産省が提供している農地の区画データである。圃場単位に切り分けられた衛星画像は、以降の処理に用いられる。この圃場は「対象区画」の一例である。
【0023】
更に、取得部110は、時系列の衛星画像から、時系列の植生の状態を表すデータを生成する。植生の状態を表すデータは、植物による光の反射の特徴を示す指数のデータであり、例えば、NDVI(Normalized Difference Vegetation Index:正規化植生指標)や、反射率などのデータが含まれる。以下の説明では、植生の状態を表すデータはNDVIであるものとする。NDVIは、衛星画像における赤色光の波長帯(以下、バンド)の反射率(光の強度)RefRedと、近赤外線のバンドの反射率RefNIRを用いて式(1)により計算することができる。取得部110は、圃場画像から、作物が存在しないと推定される領域を除外する処理を行ってもよい。この場合、取得部110は、例えば、NDVIが異常値(画像全体の平均に対してプラスマイナス2σの範囲から外れる値など)を示す画素を除外する。
【0024】
NDVI=(RefNIR-RefRed)/(RefNIR+RefRed) …(1)
【0025】
作付け分類部120は、NDVI画像に対して、例えば非特許文献3に記載された手法を適用した作付け分類(どの作物が植えられているのか分類すること)を行う。なお作付け分類は操作者の入力に基づいて行われてもよい。例えば、学習済モデル182は作物ごとに用意されており、作付け分類部120の分類結果に基づいて、導出部130が学習済モデル182を選択する。
【0026】
導出部130は、時系列の衛星画像から得られる時系列のNDVIと、時系列の気象情報とを学習済モデル182に入力することで、対象区画における作物の予想収量を導出する。学習済モデル182は、複数の圃場を含む広域区画(例えば市町村であり、以下ではこれを前提とする)に関して、導出される圃場ごとの予想収量を合計した値と、市町村ごとに取得された収量データの示す値との誤差が小さくなるように予め学習されたものである。本実施形態において導出部130は、更に土壌特性を学習済モデル182に入力する。
【0027】
収量データとは、農林水産省が提供している市町村ごと、作物ごとの統計的な収量データである。情報処理装置100においては、機械学習における教師データとして扱われる。収量データは広域区画に対応するデータであるため、圃場ごとの予想収量を求めようとする場合、そのまま教師データとして扱うことができない。従って、情報処理装置100では以下の工夫により圃場ごとの予想収量を導出可能としている。土壌特性は、例えば、農業・食品産業技術総合研究機構が日本土壌インベントリーとして提供しているデータに基づくものである。
【0028】
以降の処理に用いられるパラメータを以下のように定義して説明する。圃場ごとのNDVIとは、圃場に含まれる画素から得られたNDVIについて求められた平均値、中央値、最頻値などの統計値である。ベクトルW(X,k)#の要素である気象情報wlは、スカラーであってもよいし、ベクトルであってもよい。つまり、気象情報は気温などの一つの事象のみ含んでもよいし、気温、日射量、降雨量というように複数の事象を含んでもよいし、複数の事象に対して何らかの計算を行った結果(スカラー)であってもよい。土壌特性も同様に、ある元素の含有量(または含有率)という一つの事象のみ含んでもよいし、複数の元素の含有量(または含有率)という複数の事象を含んでもよいし、複数の事象に対して何らかの計算を行った結果(スカラー)であってもよい。
【0029】
R#k
X=[r1,r2,…,rm]:X町(または市、村;以下同様)のk番目の圃場の時系列のNDVI
W#k
X=[w1,w2,…,wn]:X町のk番目の圃場の時系列の気象情報
S#k
X=[s1,s2,…,sо]:X町のk番目の圃場の土壌特性
yk
X:X町のk番目の圃場の単収(単位面積あたりの予想収量)
Yk
X:X町のk番目の圃場の収量(予想収量=圃場収量)
【0030】
図4~
図6は、導出部130の処理について説明するための図である。
図4~
図6に関連する説明では、ある圃場に着目した処理が行われるものとする。まず、導出部130は、学習済モデル182に入力する入力データの要素数を予想に適したものにし、且つ学習済モデル182の入力ノード数に合わせるための処理を行う。
図4に示すパラメータは以下の意味をもつ。
【0031】
rp
s:タイミングtpで撮像された衛星画像から得られたNDVI(p=1、2、…)
rq:サンプリングタイミングtqに対応するNDVI(q=1、2、…、m)
wl:サンプリングタイミングtlに対応する気象情報(l=1、2、…、n)
【0032】
導出部130は、
図4の上図に示すように、例えば時刻p=1~5のそれぞれで得られたNDVI値であるr
p
s(p=1~5)について観測点間を補間する処理を行って、任意の時刻に対応するNDVIを示す曲線を生成する。例えば、導出部130は、線形補間、スプライン関数、カーネル回帰等の手法によって補間する処理を行う。そして、導出部130は、補間して得られた曲線から、所望のサンプリングタイミングq=1~mに対応するNDVI値であるr
qを取得する。また、導出部130は、
図4の下図に示すように、取得された気象情報から、所望のサンプリングタイミングl=1~nに対応する気象情報であるw
lを取得する。これらをベクトル形式で表したものが、前述したR#
k
XおよびW#
k
Xとなる。
【0033】
図5に示すように、導出部130は、R#
k
X、W#
k
X、およびS#
k
Xを入力データとして学習済モデル182に入力することで、X町のk番目の圃場における単収y
k
Xを導出する。そして、導出部130は、単収y
k
Xに当該圃場の面積(筆ポリゴンデータから導出可能である)、または、当該圃場での対象作物の作付面積を乗算することで、圃場収量Y
k
Xを導出する。
【0034】
応用例として、
図6に示すように、導出部130は、X町全体の予想収量を導出してもよい。この場合、導出部130は、圃場の数Nxだけ圃場の予想収量を導出し、これらを合計することでX町全体の予想収量を導出することができる。
【0035】
情報提供部140は、導出部130の処理結果に基づく情報を端末装置50に提供する。情報提供部140は、予想収量をそのまま提供してもよいし、以下のような情報に加工して提供してもよい。
図7および
図8は、情報提供部140が提供する情報の一例を示す図である。
図7に示すように、情報提供部140は、ポテンシャル収量から圃場ごとの予想収量を差し引いて求められる、圃場ごとの収量の伸びしろを示す画像を地図に重畳させて端末装置50に表示させてもよい。
図7においてハッチングが濃いほど収量、または、収量の伸びしろが多いことを示している。ポテンシャル収量は、例えば水や養分のストレス、病害虫などの影響を受けていないときの最大収量であり、任意の作物モデルに基づいて導出される。農業・食品産業技術総合研究機構の提供する農業気象データを利用する場合、農業気象データの単位に合わせ、1km四方単位のポテンシャル収量が導出可能である。
【0036】
また、
図8に示すように、情報提供部140は、ある地域において、周辺の圃場に比して多い収量が予想された圃場におけるNDVI等の植生指標の推移、当該地域での平均的な植生指標の推移、対象圃場の植生指標の推移を比較可能に端末装置50に表示させてもよい。
【0037】
[学習段階]
以下、学習部150について説明する。本実施形態において学習部150は、情報処理装置100の一部であるものとしているが、機械学習における学習処理と推論処理を行うものは別体の装置によって実現されてもよい。従って、学習部150は、導出部130などとは別体の装置の機能であってもよい。
【0038】
図9は、学習部150の処理について説明するための図である。複数の市町村に関するデータに基づいて学習を行う。ここでは、代表してA町、B市、C村を図示している。学習段階の説明におけるパラメータを以下のように定義する。kは圃場番号である。
【0039】
E:市町村のラベル(E=A、B、C、…)
NE、:市町村Eの圃場の数
TE:市町村Eの収量データ(教師データ)
【0040】
学習部150は、互いに異なる複数の市町村(A、B,C、…)について、推論段階と同様の入力データを機械学習モデル(学習済モデル182と同じ接続構造を有し、パラメータが暫定的に定められているもの)に入力し、導出される単収から求められる圃場収量を市町村ごとに合計した予想収量YA、YB、YC、…のそれぞれと、各市町村における収量データTA、TB、TC、…との間の誤差を含む損失関数lossを小さくする(ゼロに近づける)ように、バックプロパゲーション等によって機械学習モデルのパラメータを学習し、収束条件を満たした、或いは一定回数の学習を完了した時点の機械学習モデルを学習済モデル182とする。学習済モデル182は、例えばニューラルネットワーク等のモデルである。
【0041】
損失関数lossは、例えば、式(2)のように定義される。すなわち損失関数lossは、市町村Eごとの予想収量YEと収量データTEとの間の二乗誤差を市町村間で合計した値と、ペナルティ項Gを加算したものである。
【0042】
loss=[(1/2)ΣE
A,B,C…{(YE-TE)2}]+G …(2)
【0043】
ペナルティ項Gについて説明する。ペナルティ項Gは、市町村ごとのペナルティ関数gによる値を合計したものである。市町村ごとのペナルティ関数gは、圃場ごとの入力データR#k
E、W#k
E、S#k
Eに対してルールベースで求めた、圃場ごとの単収の見込み値を結合したNE次元のベクトルy#*Eと、圃場ごとの入力データR#k
E、W#k
E、S#k
Eの特定のベクトル要素を結合したNE次元のベクトルz#Eとの相関関数rEが、正(負)であるべき場合に負(正)であれば、すなわち、単収と特定の入力の関係について得られている知見と逆相関であれば、正のペナルティ値を返す関数である。市町村ごとのペナルティ関数gは、例えばゼロ以上の値を返す関数である。rEは式(3)で、y#*E、z#Eはそれぞれ式(4)、(5)で表される。
【0044】
rE=〈y#*E,z#E〉 …(3)
y#*E=[y1
E,y2
E,…,yNE
E] …(4)
z#E=[z1
E,z2
E,…,zNE
E] …(5)
【0045】
学習部150は、ベクトルz#Eを導出するために、まず入力データR#k
E、W#k
E、S#k
Eの要素を結合したベクトルf(R#k
E,W#k
E,S#k
E)を定義する。前述したようにR#k
Eはm次元の時系列データ、W#k
Eはn次元の時系列データ、S#k
Eはо次元のデータであるため、f(R#k
E,W#k
E,S#k
E)は式(7)で表される。次に、学習部150は、予め用意された(m+n+о)次元の重みベクトルD#を、左からベクトルf(R#k
E,W#k
E,S#k
E)に乗算し、圃場ごとの単収の見込み値(スカラー)zk
Eを導出する(式(8))。重みベクトルD#は、式(9)で表される。学習部150は、このように求められた圃場ごとの単収の見込み値(スカラー)zk
Eをk=1~NEまで並べて結合することで、NE次元のベクトルz#Eを導出する。
【0046】
f(R#k
E,W#k
E,S#k
E)=[r1,r2,…,rm,w1,w2,…,wn,s1,s2,…,sо]T …(7)
zk
E=D#・f(R#k
E,W#k
E,S#k
E) …(8)
D#=[d1,d2,…,dm+n+о] …(9)
【0047】
ここで、重みベクトルD#の各要素は、知見に基づく規定値であり、学習対象では無い。例えば、生育のある段階におけるNDVIおよび気象情報が、収穫時点の収量にどの程度の影響を及ぼすのか、ある程度の予測が可能な程度には知見が得られている。従って、この知見に基づく重みベクトルD#を乗算することで、高精度では無いものの、ある程度の精度で単収の見込み値を得ることができる。そして、例えば、ある段階におけるNDVIが高い値で観測された圃場では単収が大きい傾向が見られるような場合に対し、単収の見込み値と入力のNDVIの間に正の相関が見られるべきところを、負の相関があるということは、機械学習モデルの特性が適正で無いことを表すため、学習部150は、ペナルティ項Gを損失関数loss(E)に導入することで、機械学習のロバスト性を向上させると共に処理の迅速化を実現することができる。
【0048】
市町村ごとのペナルティ関数g(r
E)は、r
Eを入力値とし、例えば
図10、11に例示する特性を示す関数である。
図10および11は、ペナルティ関数gの特性を例示した図である。ペナルティ関数gは、
図10に示すように、r
Eがゼロ未満の領域で絶対値が大きくなるにつれて単調増加する関数であってもよいし、
図11に示すように、r
Eがゼロ未満の領域で絶対値が大きくなるにつれて指数関数的に増加する関数であってもよい。
【0049】
学習部150は、式(10)で示すように、市町村ごとのペナルティ関数g(rE)による値を合計してペナルティ項Gを算出する。
【0050】
G=ΣE
A,B,C,…{g(rE)} …(10)
【0051】
係る処理を行うことで、地上でのサンプリング調査を必要とせず、衛星画像や市町村ごとの収量データを組み合わせて生成される学習済モデルを用いて、圃場単位の収量を予想することが可能となる。また、市町村ごとという比較的粗い粒度の情報に基づいて、圃場単位の詳細な予想収量を導出できる点で有用である。更に、どの市町村についても、共通する学習済モデルを用いて予想収量を導出することができる。更に、情報処理装置100の処理結果として得られる情報は、生産者が収量目標を設定するのに役立てることができ、農業の技術普及員が行っている営農指導の基盤情報として活用することもできる。
【0052】
以上説明した各実施形態によれば、地上でのサンプリング調査を必須とせず、所望の対象区画についての収量予測を可能とすることができる。
【0053】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【符号の説明】
【0054】
10 衛星
20 衛星画像提供者サーバ
30 公共情報提供サーバ
50 端末装置
100 情報処理装置
110 取得部
120 作付け分類部
130 導出部
140 情報提供部
150 学習部
180 記憶部
182 学習済モデル