IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リクルートの特許一覧

特開2023-15818情報処理装置、情報処理方法及びプログラム
<>
  • 特開-情報処理装置、情報処理方法及びプログラム 図1
  • 特開-情報処理装置、情報処理方法及びプログラム 図2
  • 特開-情報処理装置、情報処理方法及びプログラム 図3
  • 特開-情報処理装置、情報処理方法及びプログラム 図4
  • 特開-情報処理装置、情報処理方法及びプログラム 図5
  • 特開-情報処理装置、情報処理方法及びプログラム 図6
  • 特開-情報処理装置、情報処理方法及びプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023015818
(43)【公開日】2023-02-01
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20230125BHJP
   G06N 20/00 20190101ALI20230125BHJP
【FI】
G06T7/00 350B
G06N20/00
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2021119831
(22)【出願日】2021-07-20
(71)【出願人】
【識別番号】518135412
【氏名又は名称】株式会社リクルート
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100139066
【弁理士】
【氏名又は名称】伊藤 健太郎
(72)【発明者】
【氏名】塩澤 繁
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA02
5L096BA18
5L096CA02
5L096CA27
5L096DA01
5L096EA37
5L096FA15
5L096GA41
5L096KA04
5L096KA13
(57)【要約】
【課題】実際の情報とは必ずしも一致しない区画情報を利用して、可視画像中の水張領域を容易に精度よく抽出することが可能な情報処理装置、情報処理方法及びプログラムを提供する。
【解決手段】可視画像、可視画像に対応する区画情報及び数値標高モデルを取得するデータ取得部123と、可視画像、区画情報及び数値標高モデル中の対応する領域を抽出する領域抽出部124と、区画情報の領域及び数値標高モデルの領域から水張領域を抽出する水張領域抽出部であって、区画情報の領域の第1の点を数値標高モデルの領域上にプロットし、プロットした点の標高との標高差が所定範囲のピクセルの集合を水張領域として抽出する水張領域抽出部125とを備える。
【選択図】図6
【特許請求の範囲】
【請求項1】
可視画像、前記可視画像に対応する区画情報及び数値標高モデルを取得するデータ取得部と、
前記可視画像、前記区画情報及び前記数値標高モデル中の対応する領域を抽出する領域抽出部と、
前記区画情報の領域及び前記数値標高モデルの領域から水張領域を抽出する水張領域抽出部であって、前記区画情報の領域の第1の点を前記数値標高モデルの領域上にプロットし、プロットした点の標高との標高差が所定範囲のピクセルの集合を水張領域として抽出する水張領域抽出部と
を備える情報処理装置。
【請求項2】
前記可視画像から得られる色情報と前記数値標高モデルから得られる標高情報とを有する、前記抽出した領域に属するピクセルを分類手法を用いて分類し、分類したピクセル群から畦畔領域を抽出する畦畔領域抽出部をさらに備える、請求項1に記載の情報処理装置。
【請求項3】
前記畦畔領域抽出部は、前記領域抽出部が抽出した区画情報の領域を所定条件に従って拡張し、前記拡張した区画情報の領域に属するピクセルを分類手法を用いて分類する、請求項2に記載の情報処理装置。
【請求項4】
前記水張領域抽出部が抽出した前記水張領域に対応する可視画像をヒストグラム分析し、分析結果の特徴に基づいて非水田と決定される領域を水張領域から除去する非水田除去部をさらに備える、請求項1又は2に記載の情報処理装置。
【請求項5】
前記特徴は、曲線の尖度及びなめらかさを含む、請求項4に記載の情報処理装置。
【請求項6】
可視画像中の水張領域及び畦畔領域を示すラベル付けが行われた学習データを生成する学習データ生成部をさらに備える、請求項1~5のいずれか1項に記載の情報処理装置。
【請求項7】
前記第1の点は重心点である、請求項1~6のいずれか1項に記載の情報処理装置。
【請求項8】
可視画像、前記可視画像に対応する区画情報及び数値標高モデルを取得する工程と、
前記可視画像、前記区画情報及び前記数値標高モデル中の対応する領域を抽出する工程と、
前記区画情報の領域及び前記数値標高モデルの領域から水張領域を抽出する工程であって、前記区画情報の領域の第1の点を前記数値標高モデルの領域上にプロットし、プロットした点の標高との標高差が所定範囲のピクセルの集合を水張領域として抽出する工程と
を含む方法。
【請求項9】
1又は複数のコンピュータに、
可視画像、前記可視画像に対応する区画情報及び数値標高モデルを取得する処理と、
前記可視画像、前記区画情報及び前記数値標高モデル中の対応する領域を抽出する処理と、
前記区画情報の領域及び前記数値標高モデルの領域から水張領域を抽出する処理であって、前記区画情報の領域の第1の点を前記数値標高モデルの領域上にプロットし、プロットした点の標高との標高差が所定範囲のピクセルの集合を水張領域として抽出する処理と
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
近年、様々な分野に機械学習の技術が活用されており、農業分野への活用も期待されている。農地が水田である場合、生産計画を立てるためには水張領域と畦畔領域を把握してその面積等に見合ったコストを見積もる必要がある。しかし、水張領域や畦畔領域を把握するための測量には多くの時間と労力がかかり、広大な地域にわたって人手による測量を行うことは現実的でない。
【0003】
一方、機械学習技術の活用には、学習モデルを構築するための学習データの準備が欠かせない。学習モデルを構築するためには一般的に大量のデータが必要であり、このデータに正解となる答えをラベル付けする作業には多くの時間と労力がかかる。特許文献1では、画像から対象物体を識別したり対象物体を検出する装置の学習に用いられる学習データを低コストで大量に生成するための技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2014-178957号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
画像から水張領域及び畦畔領域を識別するための学習モデルを構築するための学習データを生成するために、一般に公表されているデータの活用を検討する。農林水産省は、衛星画像等をもとに作成された農地の区画情報である筆ポリゴンを公表している。また、国土地理院は、地表面を等間隔の正方形に区切り、それぞれの正方形に中心点の標高値を持たせた標高データの集合である数値標高モデル(DEM)を公表している。
【0006】
筆ポリゴンは農地に関する基盤情報として非常に有用である。一方で、筆ポリゴンは衛星画像等から農地の有無を判断しているので、画像の撮影時期等により実際の情報とは必ずしも一致しない。また、筆ポリゴンの作成に使用される衛星画像は太陽光が地表面で反射した可視光線を宇宙空間から撮影、加工し製造される。地形の起伏や標高の影響等を補正してはいるものの、撮影時の衛星の位置や姿勢の誤差、補正に使用する地形データの誤差等によるズレやゆがみを完全には修正できないので、対応する背景画像と筆ポリゴンとがずれている場合がある。さらに、多くのポリゴンには水張領域と畦畔領域とが含まれているが、一部、畦畔領域を含まないポリゴンも存在する。
【0007】
そこで、本発明は、実際の情報とは必ずしも一致しない区画情報を利用して、可視画像中の水張領域を容易に精度よく抽出することが可能な情報処理装置、情報処理方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の一態様に係る情報処理装置は、可視画像、可視画像に対応する区画情報及び数値標高モデルを取得するデータ取得部と、可視画像、区画情報及び数値標高モデル中の対応する領域を抽出する領域抽出部と、区画情報の領域及び数値標高モデルの領域から水張領域を抽出する水張領域抽出部であって、区画情報の領域の第1の点を数値標高モデルの領域上にプロットし、プロットした点の標高との標高差が所定範囲のピクセルの集合を水張領域として抽出する水張領域抽出部とを備える。
【0009】
この態様によれば、可視画像に対応する区画情報と数値標高モデルの情報を利用して、可視画像中の水張領域を容易に抽出することができる。
【0010】
上記情報処理装置は、可視画像から得られる色情報と数値標高モデルから得られる標高情報とを有する、抽出した領域に属するピクセルを分類手法を用いて分類し、分類したピクセル群から畦畔領域を抽出する畦畔領域抽出部をさらに備えてもよい。この態様によれば、可視画像中の水張領域だけでなく可視画像中の畦畔領域についても容易に抽出することができる。
【0011】
上記情報処理装置において、畦畔領域抽出部は、領域抽出部が抽出した区画情報の領域を所定条件に従って拡張し、拡張した区画情報の領域に属するピクセルを分類手法を用いて分類してもよい。この態様によれば、拡張した領域に属するピクセルを用いることで、区画情報中の畦畔領域を含まない一部の領域についても、畦畔領域を効果的に抽出することができる。
【0012】
上記情報処理装置は、水張領域抽出部が抽出した水張領域に対応する可視画像をヒストグラム分析し、分析結果の特徴に基づいて非水田と決定される領域を水張領域から除去する非水田除去部をさらに備えてもよい。この態様によれば、実際の情報とは必ずしも一致しない区画情報を用いた場合であっても、非水田を確実に除去して実際の情報と一致させることができる。
【0013】
上記情報処理装置において、特徴は、曲線の尖度及びなめらかさを含んでもよい。この態様によれば、ヒストグラム分析の曲線の尖度及びなめらかさを利用して、容易に非水田領域を決定することができる。
【0014】
上記情報処理装置は、可視画像中の水張領域及び畦畔領域を示すラベル付けが行われた学習データを生成する学習データ生成部をさらに備えてもよい。この態様によれば、可視画像、区画情報、及び数値標高モデルを用いることで、可視画像中の水張領域及び畦畔領域を示すラベル付けが行われた学習データを容易に生成することができる。
【0015】
上記情報処理装置において、第1の点は重心点であってもよい。この態様によれば、水張領域の抽出を、水張領域の周囲に存在し得る畦畔領域等から確実に区別可能な点を用いることができる。
【0016】
本発明の他の態様に係る方法は、可視画像、可視画像に対応する区画情報及び数値標高モデルを取得する工程と、可視画像、区画情報及び数値標高モデル中の対応する領域を抽出する工程と、区画情報の領域及び数値標高モデルの領域から水張領域を抽出する工程であって、区画情報の領域の第1の点を数値標高モデルの領域上にプロットし、プロットした点の標高との標高差が所定範囲のピクセルの集合を水張領域として抽出する工程とを含む。
【0017】
本発明の他の態様に係るプログラムは、1又は複数のコンピュータに、可視画像、可視画像に対応する区画情報及び数値標高モデルを取得する処理と、可視画像、区画情報及び数値標高モデル中の対応する領域を抽出する処理と、区画情報の領域及び数値標高モデルの領域から水張領域を抽出する処理であって、区画情報の領域の第1の点を数値標高モデルの領域上にプロットし、プロットした点の標高との標高差が所定範囲のピクセルの集合を水張領域として抽出する処理とを実行させる。
【発明の効果】
【0018】
本発明によれば、実際の情報とは必ずしも一致しない区画情報を利用して、可視画像中の水張領域を容易に精度よく抽出することが可能な情報処理装置、情報処理方法及びプログラムを提供することができる。
【図面の簡単な説明】
【0019】
図1】本発明の一実施形態に係る情報処理装置の処理を説明する概略図である。
図2】本発明の一実施形態に係る情報処理装置のブロック図である。
図3】抽出された可視画像、筆ポリゴン、DEM中の対応する領域を例示する図である。
図4】水田と非水田のヒストグラムを例示する図である。
図5】可視画像から得られる色情報とDEMから得られる標高情報とを有する、領域のピクセルの散布図を例示する図である。
図6】本発明の一実施形態に係る学習データ生成処理を示すフローチャートである。
図7】本発明の一実施形態に係る水張領域抽出処理を示すフローチャートである。
【発明を実施するための形態】
【0020】
添付図面を参照して、本発明の実施形態について説明する。なお、以下の実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。また、本発明は、その要旨を逸脱しない限り、さまざまな変形が可能である。さらに、当業者であれば、以下に述べる各要素を均等なものに置換した実施形態を採用することが可能であり、係る実施形態も本発明の範囲に含まれる。
【0021】
(システム構成)
【0022】
図1を用いて、本発明の概要について説明する。図1は、本発明の一実施形態に係る情報処理装置の処理を説明する概略図である。
【0023】
情報処理装置100は、画像から水張領域及び畦畔領域を識別するための学習モデルを構築するための学習データを生成する装置である。図1に示すように、情報処理装置100は、可視画像Iと、筆ポリゴンPと、数値標高モデルMとを用いて、所望の学習データを生成する。一実施形態では、情報処理装置100は、可視画像と、可視画像中の水張領域及び畦畔領域で構成されるマスク画像とを含む学習データを生成する。
【0024】
筆ポリゴンPは、衛星画像等をもとに作成された農地の区画情報である。数値標高モデルEは、地表面を等間隔の正方形に区切り、それぞれの正方形に中心点の標高値を持たせた標高データの集合である。
【0025】
情報処理装置100は、学習データを生成する地域の可視画像I、この可視画像に対応する筆ポリゴンP及び数値標高モデルMを取得して、可視画像Iが有する色情報と筆ポリゴンPが有する農地の区画情報と、数値標高モデルMが有する標高情報とを利用することで、画像から水張領域及び畦畔領域を識別するための学習モデルを構築するための高精度の学習データを生成することができる。
【0026】
(機能構成)
【0027】
図2は、本発明の一実施形態に係る情報処理装置のブロック図である。なお、図2では、単一の情報処理装置100を想定し、必要な機能構成だけを示しているが、情報処理装置100を、複数のコンピュータシステムによる多機能の分散システムの一部として構成することもできる。
【0028】
情報処理装置100は、入力部110と、制御部120と、記憶部130と、通信部140とを備えている。
【0029】
入力部110は、情報処理装置100の管理者からの操作を受け付けるように構成され、キーボードやマウス、タッチパネル等によって実現することができる。
【0030】
制御部120は、CPUやMPU等の演算処理部121及びRAM等のメモリ122を備えている。演算処理部121は、各種入力に基づき、記憶部130に記録されたプログラムを実行することで、各種機能部を動作させるものである。このプログラムは、CD-ROM等の記録媒体に記憶され、若しくはネットワークを介して配布され、コンピュータにインストールされるものであってもよい。メモリ122は、各種プログラムにおいて処理の実行中に、演算等に必要な各種データを、一時的に記憶するためのものである。
【0031】
記憶部130は、ハードディスク等の記憶装置によって構成され、制御部120における処理の実行に必要な各種プログラムや、各種プログラムの実行に必要なデータ等を記録しておくものである。本実施形態では、記憶部130は、画像記憶部131、筆ポリゴン記憶部132、数値標高モデル(DEM)記憶部133及び学習データ記憶部134を有していることが望ましい。
【0032】
画像記憶部131には、水田を含む可視画像が保存されている。
【0033】
筆ポリゴン記憶部132には、衛星画像等をもとに作成された農地の区画情報が保存されている。一実施形態では、農地の区画情報として、農林水産省が公表している筆ポリゴンが用いられる。
【0034】
DEM記憶部133には、地表面を等間隔の正方形に区切り、それぞれの正方形に中心点の標高値を持たせた標高データの集合が保存されている。一実施形態では、標高データの集合として、国土地理院が公表している基盤地図情報中の数値標高モデルが用いられる。
【0035】
学習データ記憶部134には、可視画像中の水張領域及び畦畔領域を示すラベル付けが行われた学習データが保存される。一実施形態では、学習データ記憶部134には、可視画像と、可視画像中の水張領域及び畦畔領域で構成されるマスク画像とを含む学習データが保存されることが望ましい。
【0036】
通信部140は、情報処理装置100をネットワークに接続するように構成される。例えば、通信部140は、LANカード、アナログモデム、ISDNモデム等、及びこれらをシステムバス等の伝送路を介して処理部と接続するためのインタフェースから実現することができる。
【0037】
さらに、図2に示すように、演算処理部121は、機能部として、データ取得部123、領域抽出部124、水張領域抽出部125、非水田除去部126、畦畔領域抽出部127、学習データ生成部128及び出力部129を備えている。
【0038】
データ取得部123は、学習データを生成する地域の可視画像、この可視画像に対応する筆ポリゴン及びDEMを取得する。本実施形態では、データ取得部123は、画像記憶部131、筆ポリゴン記憶部132、DEM記憶部133からそれぞれデータを取得する。
【0039】
領域抽出部124は、取得した可視画像、筆ポリゴン、DEM中の対応する所定形状の領域を抽出する。本実施形態では、領域抽出部124は、可視画像、筆ポリゴン、DEMを重ね合わせて筆ポリゴン中の1の領域を選択し、選択した領域が十分に含まれる領域を可視画像及びDEMから抽出する。図3に、領域抽出部124により抽出された可視画像、筆ポリゴン、DEM中の対応する領域を示す。図3(a)は筆ポリゴン、図3(b)は可視画像、図3(c)はDEMを例示する図である。
【0040】
水張領域抽出部125は、抽出した筆ポリゴンの領域及びDEMの領域から、標高情報に基づいて水張領域を抽出する。本実施形態では、水張領域抽出部125は、筆ポリゴンの領域の重心点をDEMの領域上にプロットし、プロットした点の標高との標高差が所定範囲のピクセルの集合を水張領域として抽出する。具体的には、水張領域抽出部125は、まず、重心点ピクセルxijの周辺の16個のピクセルxi+1j-1、xi+1j、xi+1j+1、xij-1、xij+1、xi-1j-1、xi-1j、xi-1j+1、xi+4j-4、xi+4j、xi+4j+4、xij-4、xij+4、xi-4j-4、xi-4j、xi-4j+4のうち、重心点ピクセルxijとの標高差が±0.1998m以内に収まるピクセルを水張領域として抽出する。水張領域抽出部125はさらに、既に水張領域として抽出したピクセルとの標高差が±0.1998m以内に収まる、隣接するピクセルを水張領域として抽出し、この処理を繰り返すことで水張領域を抽出する。
【0041】
なお、水張領域の抽出に用いた標高差の範囲は例示のものであり、他の適切な標高差の範囲を用いて水張領域の抽出をすることができ、さらに、水張領域の抽出に用いる点(第1の点)は重心点に限られることなく、中心点や、水張領域の周囲に存在し得る畦畔領域等から区別可能な内側の任意の点を用いることができる。水張領域抽出部125は、水路等のノイズを除去するために、例えばモルフォロジー変換を行ってもよい。なお、ノイズを除去する手法はモルフォロジー変換に限られることなく、他の任意の手法を用いることができる。
【0042】
非水田除去部126は、可視画像の色情報に基づいて、非水田の領域を除去する。本実施形態では、非水田除去部126は、水張領域抽出部125が抽出した水張領域に対応する可視画像をヒストグラム分析し、分析結果の特徴に基づいて非水田と決定される領域を水張領域から除去する。
【0043】
図4の上段に示すように、水田のヒストグラムは、同図下段の非水田のヒストグラムと比べて尖度が大きく、より滑らかな曲線を示す。非水田除去部126は、曲線の尖度及びなめらかさ、すなわち曲線を微分したときにY軸の0を通過する回数に基づいて、非水田領域を決定する。
【0044】
畦畔領域抽出部127は、水張領域及び畦畔領域を含む領域を可視画像の色情報とDEMの標高情報とに基づいて分類して、畦畔領域を抽出する。本実施形態では、畦畔領域抽出部127は、領域抽出部124が抽出した筆ポリゴンの領域を所定条件に従って拡張し、可視画像から得られる色情報とDEMから得られる標高情報とを有する、拡張した筆ポリゴンの領域に属するピクセルをK-meansを用いて分類する。例えば、畔領域抽出部127は、モルフォロジー変換を行って筆ポリゴンの領域を拡張してもよい。本実施形態では、30×30サイズのカーネルを用いてモルフォロジー変換を行うが、他の任意のカーネルサイズを用いることができる。
【0045】
次に、畦畔領域抽出部127は、分類したピクセル群が水張領域、畦畔領域、その他の領域のいずれに属するのかを推定し、畦畔領域を抽出する。例えば、畦畔領域抽出部127は、分類したピクセル群の面積や色の分布を用いて、水張領域、畦畔領域、その他の領域のいずれに属するのかを推定することができる。
【0046】
図5に示す散布図中の各点はピクセルを意味しており、点の色は標高を表し、点の位置は色情報を表している。
【0047】
このように、筆ポリゴンの領域を拡張することで、筆ポリゴン中の畦畔領域を含まない一部のポリゴンについても、畦畔領域を効果的に抽出することができる。なお、分類に用いる手法はK-meansに限られることなく、他の分類手法を用いることができる。また、本実施形態では、Lab色空間の色情報を用いているが、分類に用いる色情報はLab色空間に限られることなく、他の色空間を用いることができる。
【0048】
学習データ生成部128は、可視画像中の水張領域及び畦畔領域を示すラベル付けが行われた学習データを生成する。本実施形態では、学習データ生成部128は、水張領域抽出部125が抽出した水張領域及び畦畔領域抽出部127が抽出した畦畔領域で構成されるマスク画像を生成して、生成したマスク画像と対応する可視画像とを学習データ記憶部134に保存する。
【0049】
出力部129は、学習データ記憶部134に保存された学習データを出力する。
【0050】
(学習データ生成処理)
【0051】
図6を参照して、本発明の実施形態に係る学習データ生成処理を詳細に説明する。本実施形態では、図6で説明される学習データ生成処理を行う前に、情報処理装置100の管理者の管理の下、画像記憶部131、筆ポリゴン記憶部132及びDEM記憶部133に各データが格納されているものとする。
【0052】
ステップS601において、情報処理装置100のデータ取得部123は、学習データを生成する地域の可視画像、この可視画像に対応する筆ポリゴン及びDEMを取得する。本実施形態では、データ取得部123は、画像記憶部131、筆ポリゴン記憶部132、DEM記憶部133からそれぞれデータを取得する。
【0053】
ステップS602において、情報処理装置100の領域抽出部124は、取得した可視画像、筆ポリゴン、DEM中の対応する所定形状の領域を抽出する。本実施形態では、領域抽出部124は、可視画像、筆ポリゴン、DEMを重ね合わせて筆ポリゴン中の1の領域を選択し、選択した領域が十分に含まれる領域を可視画像及びDEMから抽出する。図3に、領域抽出部124により抽出された可視画像、筆ポリゴン、DEM中の対応する領域を示す。図3(a)は筆ポリゴン、図3(b)は可視画像、図3(c)はDEMを例示する図である。
【0054】
ステップS603において、情報処理装置100の水張領域抽出部125は、抽出した筆ポリゴンの領域及びDEMの領域から、標高情報に基づいて水張領域を抽出する。詳細については図7を用いて後述する。
【0055】
ステップS604において、情報処理装置100の非水田除去部126は、可視画像の色情報に基づいて、非水田の領域を除去する。本実施形態では、非水田除去部126は、水張領域抽出部125が抽出した水張領域に対応する可視画像をヒストグラム分析し、分析結果の特徴に基づいて非水田と決定される領域を水張領域から除去する。
【0056】
図4の上段に示すように、水田のヒストグラムは、同図下段の非水田のヒストグラムと比べて尖度が大きく、より滑らかな曲線を示す。非水田除去部126は、曲線の尖度及びなめらかさ、すなわち曲線を微分したときにY軸の0を通過する回数に基づいて、非水田領域を決定する。
【0057】
ステップS605において、情報処理装置100の畦畔領域抽出部127は、水張領域及び畦畔領域を含む領域を可視画像の色情報とDEMの標高情報とに基づいて分類して、畦畔領域を抽出する。本実施形態では、畦畔領域抽出部127は、領域抽出部124が抽出した筆ポリゴンの領域をモルフォロジー変換を行って拡張し、可視画像から得られる色情報とDEMから得られる標高情報とを有する、拡張した筆ポリゴンの領域に属するピクセルをK-meansを用いて分類する。本実施形態では、30×30サイズのカーネルを用いてモルフォロジー変換を行うが、他の任意のカーネルサイズを用いることができる。
【0058】
図5に示す散布図中の各点はピクセルを意味しており、点の色は標高を表し、点の位置は色情報を表している。拡張した領域に水張領域及び畦畔領域のみが含まれる場合、畦畔領域抽出部127は、ピクセルを2つのクラスに分類する。一方、拡張した領域に水張領域及び畦畔領域以外の他の領域、例えばビニールハウスや道路等が含まれる場合、畦畔領域抽出部127は、ピクセルを3つのクラスに分類する。
【0059】
次に、畦畔領域抽出部127は、分類したピクセル群が水張領域、畦畔領域、その他の領域のいずれに属するのかを推定し、畦畔領域を抽出する。例えば、畦畔領域抽出部127は、分類したピクセル群の面積や色の分布を用いて、水張領域、畦畔領域、その他の領域のいずれに属するのかを推定することができる。
【0060】
このように、筆ポリゴンの領域を拡張することで、筆ポリゴン中の畦畔領域を含まない一部のポリゴンについても、畦畔領域を効果的に抽出することができる。なお、分類に用いる手法はK-meansに限られることなく、他の分類手法を用いることができる。また、本実施形態では、Lab色空間の色情報を用いているが、分類に用いる色情報はLab色空間に限られることなく、他の色空間を用いることができる。
【0061】
ステップS606において、情報処理装置100の学習データ生成部128は、可視画像中の水張領域及び畦畔領域を示すラベル付けが行われた学習データを生成する。本実施形態では、学習データ生成部128は、水張領域抽出部125が抽出した水張領域及び畦畔領域抽出部127が抽出した畦畔領域で構成されるマスク画像を生成して、生成したマスク画像と対応する可視画像とを学習データ記憶部134に保存する。
【0062】
以上、本実施形態によれば、情報処理装置100は、画像から水張領域及び畦畔領域を識別するための学習モデルを構築するための学習データを、筆ポリゴンを用いて生成することができる。既存の筆ポリゴンを活用することで、データの収集からラベル付けに至る学習データの準備にかかる時間と労力を削減することができる。特に、学習データを生成する地域が平地であり、長方形の水田が並んでいる場合に好適である。
【0063】
(水張領域抽出処理)
【0064】
図7を参照して、ステップS603の水張領域抽出処理を詳細に説明する。図7は、本発明の一実施形態に係る水張領域抽出処理を示すフローチャートである。
【0065】
ステップS701において、水張領域抽出部125は、筆ポリゴンの領域の重心を求める。次に、ステップS702において、水張領域抽出部125は筆ポリゴンの領域の重心点をDEMの領域上にプロットし、ステップS703において、プロットした点の標高との標高差が所定範囲のピクセルを塗りつぶす。
【0066】
具体的には、水張領域抽出部125は、まず、重心点ピクセルxijの周辺の16個のピクセルxi+1j-1、xi+1j、xi+1j+1、xij-1、xij+1、xi-1j-1、xi-1j、xi-1j+1、xi+4j-4、xi+4j、xi+4j+4、xij-4、xij+4、xi-4j-4、xi-4j、xi-4j+4のうち、重心点ピクセルxijとの標高差が±0.1998m以内に収まるピクセルを水張領域として抽出する。水張領域抽出部125はさらに、既に水張領域として抽出したピクセルとの標高差が±0.1998m以内に収まる、隣接するピクセルを水張領域として抽出し、この処理を繰り返すことで水張領域を抽出する。
【0067】
なお、水張領域の抽出に用いた標高差の範囲は例示のものであり、他の適切な標高差の範囲を用いて水張領域の抽出をすることができ、さらに、水張領域の抽出に用いる点は重心点に限られることなく、中心点や、水張領域の周囲に存在し得る畦畔領域等から区別可能な内側の任意の点を用いることができる。
【0068】
ステップS704において、水張領域抽出部125は、モルフォロジー変換を行って水路等のノイズを除去し、水張領域を抽出する。なお、ノイズを除去する手法はモルフォロジー変換に限られることなく、他の任意の手法を用いることができる。
【符号の説明】
【0069】
100…情報処理装置、110…入力部、120…制御部、121…演算処理部、122…メモリ、123…データ取得部、124…領域抽出部、125…水張領域抽出部、126…非水田除去部、127…畦畔領域抽出部、128…学習データ生成部、129…出力部、130…記憶部、131…画像記憶部、132…筆ポリゴン記憶部、133…DEM記憶部、134…学習データ記憶部、140…通信部、I…可視画像、P…筆ポリゴン、M…標高モデル
図1
図2
図3
図4
図5
図6
図7