IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インクリメント・ピー株式会社の特許一覧

特許7514669推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体
<>
  • 特許-推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体 図1
  • 特許-推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体 図2
  • 特許-推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体 図3
  • 特許-推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体 図4
  • 特許-推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体 図5
  • 特許-推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体 図6
  • 特許-推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体 図7
  • 特許-推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体 図8
  • 特許-推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体 図9
  • 特許-推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-03
(45)【発行日】2024-07-11
(54)【発明の名称】推論装置、推論方法、推論プログラム、およびコンピュータにより読み取り可能な記憶媒体
(51)【国際特許分類】
   G09B 29/00 20060101AFI20240704BHJP
   G06T 7/00 20170101ALI20240704BHJP
【FI】
G09B29/00 Z
G06T7/00 350C
【請求項の数】 7
(21)【出願番号】P 2020112536
(22)【出願日】2020-06-30
(65)【公開番号】P2022011411
(43)【公開日】2022-01-17
【審査請求日】2023-04-24
(73)【特許権者】
【識別番号】321011767
【氏名又は名称】ジオテクノロジーズ株式会社
(74)【代理人】
【識別番号】110000637
【氏名又は名称】弁理士法人樹之下知的財産事務所
(72)【発明者】
【氏名】竹田 淳一
【審査官】安田 明央
(56)【参考文献】
【文献】国際公開第2006/137438(WO,A1)
【文献】国際公開第2020/066755(WO,A1)
【文献】国際公開第2020/022110(WO,A1)
【文献】国際公開第2019/198634(WO,A1)
【文献】米国特許出願公開第2009/0136090(US,A1)
【文献】特開2019-003565(JP,A)
【文献】特開2020-016597(JP,A)
【文献】特開2015-125498(JP,A)
【文献】国際公開第2020/012564(WO,A1)
【文献】国際公開第2020/012563(WO,A1)
【文献】特開2019-091393(JP,A)
【文献】特開2019-200734(JP,A)
【文献】特開2018-102916(JP,A)
【文献】国際公開第2021/261547(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G09B 29/00
G06T 7/00
G01C 11/06
(57)【特許請求の範囲】
【請求項1】
地図画像と、前記地図画像の領域に対応した前記地図画像を更新するための空中撮像画像とを入力する入力部と、
前記地図画像と前記空中撮像画像とを重畳した重畳画像を生成する生成部と、
学習用地図画像と、前記学習用地図画像の領域に対応した学習用空中撮像画像と、を重畳させた学習用重畳画像を入力データとし、前記学習用重畳画像が表す領域における変化域を教師データとして機械学習して得られた学習済みモデルを前記重畳画像に適用して、前記重畳画像が表す領域における変化域を推論する推論部とを備え
前記推論部は、前記学習済みモデルから出力された前記重畳画像の画素が変化域に含まれる点であるかの確率に基づいて前記変化域を推論する
ことを特徴とする推論装置。
【請求項2】
前記学習済みモデルは、前記学習用重畳画像における新設、解体、変更のそれぞれに対応する建物外形を前記教師データとして機械学習しており、
前記推論部は、前記空中撮像画像における新設、解体、変更のそれぞれに対応する前記変化域を推論する、
ことを特徴とする請求項1に記載の推論装置。
【請求項3】
前記重畳画像は、RGBフォーマットのうちRチャネルとGチャネルに前記空中撮像画像のデータ、Bチャネルに前記地図画像のデータをそれぞれ設定することで構成され、
前記学習用重畳画像は、RGBフォーマットのうちRチャネルとGチャネルに前記学習用空中撮像画像のデータ、Bチャネルに前記学習用地図画像のデータをそれぞれ設定することで構成されていることを特徴とする請求項1または請求項2に記載の推論装置。
【請求項4】
前記教師データは、前記変化域の特性に対応したラベル情報が画素ごとに設定された画像であることを特徴とする請求項1から請求項3のいずれか一項に記載の推論装置。
【請求項5】
機械学習して得られた学習済みモデルに基づいて推論をする推論装置で実行される推論方法であって、
地図画像と、前記地図画像の領域に対応した前記地図画像を更新するための空中撮像画像とを入力する入力工程と、
前記地図画像と前記空中撮像画像とを重畳した重畳画像を生成する生成工程と、
学習用地図画像と、前記学習用地図画像の領域に対応した学習用空中撮像画像と、を重畳させた学習用重畳画像を入力データとし、前記学習用重畳画像が表す領域における変化域を教師データとして機械学習して得られた学習済みモデルを前記重畳画像に適用して、前記重畳画像が表す領域における変化域を推論する推論工程と、
を含む推論方法であって、
前記推論工程では、前記学習済みモデルから出力された前記重畳画像の画素が変化域に含まれる点であるかの確率に基づいて前記変化域を推論する
ことを特徴とする推論方法。
【請求項6】
請求項に記載の推論方法をコンピュータにより実行させることを特徴とする推論プログラム。
【請求項7】
請求項に記載の推論プログラムを格納したことを特徴とするコンピュータにより読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習して得られた学習済みモデルに基づいて推論をする推論装置に関する。
【背景技術】
【0002】
地図上の家形変化点検出や家屋異動判読の自動化はこれまで画像処理により行われていた。例えば特許文献1に記載の家屋異動判読支援装置は、異動候補検出部が、新/旧の2時期におけるDSMデータ及び空中撮影画像からなる空間情報計測データに基づいて2時期間での家屋異動を検出し当該異動が検出された場所を候補領域として抽出し、実体視画像生成部が、空間情報計測データに基づいて対象領域の実体視画像を生成する。そして、表示画面生成部が、平面視画像取得部による平面視画像上に異動候補検出部による検出結果を示した画像と実体視画像生成部による実体視画像とを表示部の画面に表示する。このようにすることにより、判読作業者は画面に表示された実体視画像を観察することで、判定対象領域における高さの情報を立体画像から容易に把握することができ、新築や滅失等の高さ変化を伴う家屋の異動を効率的に判定することができる。
【0003】
特許文献1に記載したような画像処理による方法は、形や色などの特徴から建物の形状を特定し、地図データ等と差分を取る事で変化点を検出するものである。しかしながら、画像処理だけでは汎化性・ロバスト性が低く、未知の建物や撮影条件などによっては検出精度が低下するという問題があった。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2012-146050号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
近年の機械学習、深層学習技術の検出性能向上に伴い、深層学習を用いた家形変化点検出や家屋異動判読等の地図の更新作業の自動化が試みられている。深層学習では建物の形状や周辺の状況を膨大な教師データから学習し、高い汎化性が得られることが知られている。変化点の検出は、推論された建物の形状と更新前の地図データとの差分をとることで実現している。
【0006】
しかしながら、深層学習により建物の形状を推論し、更新前の地図データとの差分を取る方法では以下のような問題がある。まず、深層学習により推論した建物の形状が、大きい、小さい、歪んでいるといったように不安定となる。そのため、推論した形状と地図データとの差分をとっても、その差分が正しいか否かを判断する基準がルールベースとなり汎化性が落ちる。したがって、地図画像の更新の精度が低下してしまう。特に、建物の変更(2棟が1棟、L字建物が四角等)には正確な建物の形状を推論する必要があり、従来の方法では検出が困難であった。
【0007】
本発明が解決しようとする課題としては、家形変化点検出や家屋異動判読等の地図画像の更新を行う際により精度良く更新することが一例として挙げられる。
【課題を解決するための手段】
【0008】
上記課題を解決するために、請求項1に記載の発明は、地図画像と、前記地図画像の領域に対応した前記地図画像を更新するための空中撮像画像とを入力する入力部と、前記地図画像と前記空中撮像画像とを重畳した重畳画像を生成する生成部と、学習用地図画像と、前記学習用地図画像の領域に対応した学習用空中撮像画像と、を重畳させた学習用重畳画像を入力データとし、前記学習用重畳画像が表す領域における変化域を教師データとして機械学習して得られた学習済みモデルを前記重畳画像に適用して、前記重畳画像領域における変化域を推論する推論部と、を備えることを特徴としている。
【0009】
請求項6に記載の発明は、機械学習して得られた学習済みモデルに基づいて推論をする推論装置で実行される推論方法であって、地図画像と、前記地図画像の領域に対応した前記地図画像を更新するための空中撮像画像とを入力する入力工程と、前記地図画像と前記空中撮像画像とを重畳した重畳画像を生成する生成工程と、学習用地図画像と、前記学習用地図画像の領域に対応した学習用空中撮像画像と、を重畳させた学習用重畳画像を入力データとし、前記学習用重畳画像が表す領域における変化域を教師データとして機械学習して得られた学習済みモデルを前記重畳画像に適用して、前記重畳画像が表す領域における変化域を推論する推論工程と、を含むことを特徴としている。
【0010】
請求項7に記載の発明は、請求項6に記載の推論方法を推論プログラムとしてコンピュータにより実行させることを特徴としている。
【0011】
請求項8に記載の発明は、請求項7に記載の推論プログラムをコンピュータにより読み取り可能な記憶媒体へ格納したことを特徴としている。
【図面の簡単な説明】
【0012】
図1】本発明の一実施例にかかる推論装置として機能するコンピュータの概略構成図である。
図2図1に示されたコンピュータが機能する推論装置の機能構成図である。
図3】重畳画像の生成についての説明図である。
図4】本実施例にかかる学習済みモデルを生成する学習装置の機能構成図である。
図5】学習済みモデルに形成されるニューラルネットワークの例である。
図6図4に示された学習装置の動作のフローチャートである。
図7】教師データの生成についての説明図である。
図8図2に示された推論装置の動作のフローチャートである。
図9】入力する重畳画像と、当該重畳画像に対応する教師データと、学習後の学習済みモデルを用いて行った推論結果を示した図である。
図10図2に示された推論装置と従来技術との比較をした表である。
【発明を実施するための形態】
【0013】
以下、本発明の一実施形態にかかる推論装置を説明する。本発明の一実施形態にかかる推論装置は、入力部に、地図画像と、地図画像の領域に対応した地図画像を更新するための空中撮像画像とが入力され、生成部が、地図画像と空中撮像画像とを重畳した重畳画像を生成する。そして、推論部が、学習用地図画像と、学習用地図画像の領域に対応した学習用空中撮像画像と、を重畳させた学習用重畳画像を入力データとし、学習用重畳画像が表す領域における変化域を教師データとして機械学習して得られた学習済みモデルを重畳画像に適用して、重畳画像が表す領域における変化域を推論する。このようにすることにより、地図画像と空中撮像画像とを重畳した重畳画像から、対象領域の変化域が学習された学習済みモデルによって変化域を推論することができるので、従来のように、建物の形状を推論する必要がなく、推論した形状の不安定さによる汎化性の低下が抑えられる。したがって、家形変化点検出や家屋異動判読等の地図画像の更新を行う際により精度良く更新することができる。
【0014】
また、学習済みモデルは、学習用重畳画像における新設、解体、変更のそれぞれに対応する建物外形を教師データとして機械学習しており、推論部は、空中撮像画像における新設、解体、変更のそれぞれに対応する変化域を推論してもよい。このようにすることにより、地図における建物の新設、解体、変更を推論することが可能となる。
【0015】
また、推論部は、学習済みモデルから出力された重畳画像の画素毎の変化点である確率に基づいて変化域を推論してもよい。このようにすることにより、画素毎に出力された確率に所定の閾値等を設定することで、例えば、建物の新設、解体、変更といった変化域を推論することができるようになる。
【0016】
また、重畳画像は、RGBフォーマットのうちRチャネルとGチャネルに空中撮像画像のデータ、Bチャネルに地図画像のデータをそれぞれ設定することで構成され、学習用重畳画像は、RGBフォーマットのうちRチャネルとGチャネルに学習用空中撮像画像のデータ、Bチャネルに学習用地図画像のデータをそれぞれ設定することで構成されていてもよい。このようにすることにより、RGBフォーマットを利用して重畳画像等を構成することができる。また、Bチャネルを地図画像や学習用地図画像とすることで、重畳画像を人間が観察した場合であっても空中撮像画像や学習用空中撮像画像との識別が容易となる。
【0017】
また、教師データは、変化域の特性に対応したラベル情報が画素ごとに設定された画像であってもよい。このようにすることにより、教師データを画像とすることで、入力データとフォーマットを合わせることができ、学習効率や処理効率を向上させることができる。
【0018】
また、本発明の一実施形態にかかる推論方法は、入力工程において、地図画像と、地図画像の領域に対応した地図画像を更新するための空中撮像画像とが入力され、生成工程で、地図画像と空中撮像画像とを重畳した重畳画像を生成する。そして、推論工程で、学習用地図画像と、学習用地図画像の領域に対応した学習用空中撮像画像と、を重畳させた学習用重畳画像を入力データとし、学習用重畳画像が表す領域における変化域を教師データとして機械学習して得られた学習済みモデルを重畳画像に適用して、重畳画像が表す領域における変化域を推論する。このようにすることにより、地図画像と空中撮像画像とを重畳した重畳画像から、対象領域の変化域が学習された学習済みモデルによって変化域を推論することができるので、従来のように、建物の形状を推論する必要がなく、推論した形状の不安定さによる汎化性の低下が抑えられる。したがって、家形変化点検出や家屋異動判読等の地図画像の更新を行う際により精度良く更新することができる。
【0019】
また、上述した推論方法を、推論プログラムとしてコンピュータにより実行させてもよい。このようにすることにより、コンピュータを用いて、地図画像と空中撮像画像とを重畳した重畳画像から、対象領域の変化域が学習された学習済みモデルによって変化域を推論することができるので、従来のように、建物の形状を推論する必要がなく、推論した形状の不安定さによる汎化性の低下が抑えられる。したがって、家形変化点検出や家屋異動判読等の地図画像の更新を行う際により精度良く更新することができる。
【0020】
また、上述した推論プログラムをコンピュータ読み取り可能な記憶媒体に格納してもよい。このようにすることにより、当該プログラムを機器に組み込む以外に単体でも流通させることができ、バージョンアップ等も容易に行える。
【実施例
【0021】
本発明の一実施例にかかる推論装置を図1図10を参照して説明する。図1は、本実施例にかかる推論装置として機能するコンピュータ10の概略構成図である。
【0022】
図1に示したように、コンピュータ10は、演算部11と、主記憶部12と、通信部13と、補助記憶部14と、を備えている。そして、演算部11と、主記憶部12と、通信部13と、補助記憶部14と、はバスBにより互いに接続されている。
【0023】
演算部11は、CPU(Central Processing Unit)、MPU(Micro-Processing Unit)、GPU(Graphics Processing Unit)等の演算処理装置を有し、補助記憶部14に記憶されたプログラム等を読み出して実行することにより、コンピュータ10に係る種々の情報処理、制御処理等を行う。
【0024】
主記憶部12は、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)等の一時記憶領域であり、演算部11が演算処理を実行するために必要なデータを一時的に記憶する。
【0025】
通信部13は、通信に関する処理を行うための通信モジュールであり、外部と情報の送受信を行う。
【0026】
補助記憶部14は大容量メモリ、ハードディスク等であり、演算部11が処理を実行するために必要なプログラムや、その他のデータ等を記憶している。また、補助記憶部14は、学習済みモデル4aを記憶している。学習済みモデル4aは、地図上の変更域を推論するためのモデルであり、機械学習により生成された学習済みモデルである。
【0027】
なお、コンピュータ10は、上記した構成要素の他にUSB(Universal Serial Bus)等の外部インターフェースや、キーボード、マウス、ディスプレイ等を必要に応じて備えていてもよい。
【0028】
図2に、上述したコンピュータ10が機能する推論装置1の機能構成図を示す。図2に示したように、推論装置1は、入力部2と、生成部3と、推論部4と、を備えている。
【0029】
入力部2は、例えば通信部13が機能し、地図画像MPおよび航空写真APが入力される。本実施例における地図画像とは、道路や建物等を上空から平面視した状態で表現された地図の画像である。また、本実施例における航空写真は、周知のように、飛行中の飛行体からカメラにより地表面を撮影した写真をいう。また、航空写真は、地形に起因して生じる歪みを補正したオルソ画像を用いるのが好ましいが、歪み補正をしなくてもよい。また、本実施例では、空中撮像画像として航空写真で説明するが衛星写真でもよい。あるいは空中撮像画像として航空機から地上に向けてレーザ光を放射状に照射し、地上から反射されるレーザ光の時間差で地形等を計測する航空ライダにより得られた画像等であってもよい。
【0030】
生成部3は、入力部2に入力された地図画像MPと航空写真APとを重畳し、重畳画像SIを生成する。ここで、重畳画像SIの生成について図3を参照して説明する。
【0031】
図3において地図画像MPは、更新前の地図画像であり、本実施例ではベクタデータ(ポリゴン画像)となっている。航空写真APは、本実施例ではRGBフォーマットのカラー画像となっている。また、地図画像MPと航空写真APとは、同じ領域(地域)を示すものとなっている。即ち、航空写真APは、地図画像MPの領域に対応した地図画像MPを更新するための空中撮像画像である。
【0032】
航空写真APは、RGBの各成分に分解される。航空写真APのうちR(赤)成分を符号APrとし、航空写真APのうちG(緑)成分を符号APgとし、航空写真APのうちB(青)成分を符号APbとする。そして、R成分画像APrとG成分画像APgを合成してRG成分画像APrgを生成する。そして、RG成分画像APrgをR成分、B成分画像APbをG成分、地図画像MPをB成分にそれぞれ設定したRGBフォーマットの画像を重畳画像SIとして生成する。
【0033】
このようにして生成された重畳画像SIは、人間の目には地図画像MPによる建物等の家形は青系の色に見え、航空写真APの部分は黄系の色に見える。これは、人間の網膜を構成する視細胞の青錐体、緑錐体、赤錐体が感応する波長特性の差によるものである。具体的に、青錐体は約430nmの波長、つまり青に一番強く感応し、緑錐体は約530nmの波長、つまり緑に一番強く感応し、赤錐体は約560nmの波長、つまり赤に一番強く感応することが知られている。したがって、B成分に地図画像MPを挿入することで、地図画像MPが青系の色に視認できる。
【0034】
推論部4は、学習済みモデル4aを重畳画像SIに適用して、重畳画像SIが表す領域における変化域を推論する。ここで、推論とは、AI(Artificial Intelligence)の分野で周知のように、学習して生成された推論(学習済み)モデルに当てはめて、その結果を導くことである。
【0035】
学習済みモデル4aは、学習用地図画像と、当該学習用地図画像の領域に対応した学習用空中撮像画像と、を重畳させた学習用重畳画像を入力データとし、学習用重畳画像が表す領域における変化域を教師データとして機械学習して得られたものである。即ち、学習済みモデル4aは、教師データに基づいて学習して推論可能となったものである。
【0036】
ここで、学習済みモデル4aについて説明する。本実施例にかかる学習済みモデル4aは、例えば図4に示したような機能構成を有する学習装置20によって生成される。学習装置20は、入力部22と、生成部23と、学習部24と、を備えている。また、学習装置20は、図1に示したコンピュータ10を機能させることで実現できる。
【0037】
入力部22は、例えば通信部13が機能し、学習用地図画像MPLおよび学習用航空写真APLが入力される。生成部23は、入力部22に入力された学習用地図画像MPLと学習用航空写真APLとを重畳し、学習用重畳画像SILを生成する。入力部22及び生成部23は、基本的に入力部2及び生成部3と同様の動作をする。なお、学習用地図画像MPLは地図画像MPと用途が異なるのみで、データフォーマット等に違いはない。学習用航空写真APLも同様に航空画像APと用途が異なるのみで、データフォーマット等に違いはない。
【0038】
学習部24は、生成部23が生成した学習用重畳画像SILを入力データとし、学習用地図画像MPLと学習用航空写真APLとが示す領域における変化域を教師データとして機械学習して学習済みモデル4aを得る。変化域とは、本実施例では、後述するように建物の新設、解体、変更といった建物外形の更新された領域を示す。
【0039】
学習装置20は、学習済みモデル4aとして、学習用航空写真における学習用地図画像からの変化域(新設、解体、変更といった更新領域)を学習する深層学習(ディープラーニング)を行うことで、重畳画像SIを入力とし、変化域を出力するとするニューラルネットワークを構築(生成)する。例えばニューラルネットワークはCNN(Convolution Neural Network)であり、重畳画像SIの入力を受け付ける入力層と、変化域を示す情報を出力する出力層と、特徴量を抽出する中間層とを有する(図5を参照)。
【0040】
なお、本実施例では学習済みモデル4aがCNNであるものとして説明するが、学習済みモデル4aはCNNに限定されず、CNN以外のニューラルネットワーク、セマンティックセグメンテーション、インスタンスセグメンテーションなど、他の学習アルゴリズムで構築された学習済みモデルであってよい。
【0041】
学習装置20における動作(学習方法)を図6のフローチャートを参照して説明する。まず、教師データを生成する(ステップS11)。教師データの生成について図7を参照して説明する。
【0042】
まず、予察を行って、編集前の地図データBEと編集後の地図データAEとに建物の新設、解体、変更の属性を付与する。予察とは、編集前の地図データBEと編集後の地図データAEとを作業者が比較して属性を付与する対象を抽出することである。
【0043】
予察を行って、属性を付与された地図データからは、新設データA、解体データD、変更データCがそれぞれ生成される。図7に示した新設データA、解体データD、変更データCは、地図データのおける対象となる領域内の新設、解体、変更のそれぞれの建物等の領域を白抜きで示している。つまり、同一の範囲において、新設された建物等が新設データAに示され、解体された建物等が解体データDに示され、変更された建物等が変更データCに示されている。ここで、変更とは、例えば2棟が1棟、L字建物が四角といったように建物等の形状が変更されたことを示す。
【0044】
そして、新設データA、解体データD、変更データCを合成してラベル画像Lが生成される。ラベル画像Lは、新設、解体、変更のそれぞれの領域に対応する画素に予め定めた画素値がラベル情報として設定された画像である。図7の例では変更なしが画素値“0”、解体が画素値“1”、変更が画素値“2”、新設が画素値“3”がそれぞれ設定された8ビットグレースケール画像である。そのため、ラベル画像Lを人間が視認しても各ラベルを識別するには困難であるがデータとして識別可能であるので問題はない。このようにして、生成されたラベル画像Lが教師データとなる。即ち、教師データは、変化域の特性に対応したラベル情報が画素ごとに設定された画像である。そして、学習済みモデル4aは、学習用重畳画像SILにおける新設、解体、変更のそれぞれに対応する建物外形を教師データとして機械学習している。
【0045】
この教師データを生成するのは、コンピュータ10で行ってもよいし、他のコンピュータ等で行ってもよい。コンピュータ10で行う場合は図4に示した入力部22に予察を行った編集前の地図データと編集後の地図データを入力して、生成部23でラベル画像Lを生成すればよい。
【0046】
図6のフローチャートに戻り、入力部22に学習用地図画像MPLと学習用航空写真APLとを入力する(ステップS12)。このステップで入力される学習用地図画像MPLと学習用航空写真APLは、ステップS11で生成した教師データ(ラベル画像L)に対応した領域を示すものである。
【0047】
次に、生成部23で学習用重畳画像SILを生成する(ステップS13)。そして、学習用重畳画像SILと教師データにより学習を行う(ステップS14)。以上の動作を、学習用地図画像MPL、学習用航空写真APL及び教師データを変更して繰り返し、学習済みモデル4aを生成する。
【0048】
即ち、学習装置20は、学習用地図画像MPLと、学習用地図画像MPLの領域に対応した学習用地図画像MPLを更新するための学習用航空写真APL(学習用空中撮像画像)とを入力する入力部22と、学習用地図画像MPLと学習用地図画像MPLの領域に対応した学習用航空写真APL(学習用空中撮像画像)とを重畳した学習用重畳画像SILを生成する生成部23と、学習用重畳画像SILを入力データとし、学習用地図画像MPLの領域における変化域を教師データとして機械学習して学習済みモデル4aを得る学習部24と、を備えている。
【0049】
上述した学習装置20によって、学習用地図画像MPLと学習用空中撮像画像APLとを重畳した学習用重畳画像SILにより、対象領域の変化域を直接学習することができるので、従来のように、建物の形状を推論する必要がなく、推論した形状の不安定さによる汎化性の低下が抑えられる。
【0050】
次に、図2に示された推論装置1の動作(推論方法)を図8のフローチャートを参照して説明する。図8のフローチャートは、コンピュータ10で実行されるプログラム(推論プログラム)として構成することができる。また、当該推論プログラムをメモリカード等の記録媒体に格納してもよい。
【0051】
まず、入力部2に地図画像MPと航空写真APとを入力する(ステップS21)。次に、生成部3で重畳画像SIを生成する(ステップS22)。そして、推論部4が、学習済みモデル4aにより新設、解体、変更のいずれかに対応する領域を推論する(ステップS23)。学習済みモデル4aからは、例えば重畳画像SIの画素ごとに新設、解体、変更のいずれかに該当するかの確率が出力される。つまり、重畳画像の画素毎の変化点である確率が出力される。つまり、対象画像が変化域に含まれる点(画像)であるかの確率が出力される。
【0052】
即ち、ステップS21が入力工程、ステップS22が生成工程、ステップS23が推論工程として機能する。
【0053】
そして、推論部4は、出力された確率に応じて当該領域が新設、解体、変更のいずれかを判定する。この判定は、予め確率に閾値を設け、その閾値以上となったことで行えばよい。例えば、新設と判定する閾値を50%とした場合、学習済みモデル4aから出力された新設の確率が50%以上の値となった領域が新設された建物の領域であると判定する。つまり、本実施例にかかる推論装置1は、建物の形状を推論するのではなく、変化した領域を直接推論するものである。
【0054】
最後に上述した構成の推論装置1で推論を行った実験結果を示す。図9は、入力する重畳画像SIと、当該重畳画像SIに対応する教師データ(Ground Truth)と、学習後の学習済みモデル4aを用いて行った推論結果を示したものである。
【0055】
学習データとしては、8Tile×8Tileで構成された1km四方のメッシュを6つ(384Tile)用いた。学習時においては、Iterations=250,000、Batch size=8、Start Loss=0.43、End Loss=0.06、Training Time=26hとなった。
【0056】
図9に示したように、本実施例にかかる推論装置1により、教師データで示された領域に対応する領域を推論結果として略出力できていることが明らかとなった。
【0057】
図10は、上述した構成の推論装置1を用いた場合と、従来技術のように、推論された建物の形状と地図データ等との差分をとる方法と、におけるPrecision(正解率)とRecall(適合率)との比較である。図10(a)は本実施例にかかる推論装置1、図10(b)は従来技術である。なお、推論装置1の学習等の条件は図9と同じである。
【0058】
図10に示したように、推論装置1の方が、新設、解体の場合のいずれもPrecisionとRecallが高い数値となった。特にPrecisionについては、著しい改善が見られた。なお、変更は、推論装置1のみが推論可能である。これは、従来技術では建物の形状を推論しているが、その形状が不安定なため変更したか否かの判定ができないからである。
【0059】
本実施例によれば、推論装置1は、入力部2に、地図画像MPと、地図画像MPの領域に対応した地図画像MPを更新するための航空写真APとが入力され、生成部3が、地図画像MPと地図画像MPの領域に対応した航空写真APとを重畳した重畳画像SIを生成する。そして、推論部4が、学習用地図画像と、学習用地図画像の領域に対応した学習用航空写真と、を重畳させた学習用重畳画像を入力データとし、学習用地図画像の領域における変化域を教師データとして機械学習して得られた学習済みモデル4aを重畳画像SIに適用して、前記した領域における変化域を推論する。このようにすることにより、地図画像MPと航空写真APとを重畳した重畳画像SIから、対象領域の変化域が学習された学習済みモデル4aによって変化域を推論することができるので、従来のように、建物の形状を推論する必要がなく、推論した形状の不安定さによる汎化性の低下が抑えられる。したがって、家形変化点検出や家屋異動判読等の地図画像の更新を行う際により精度良く更新することができる。
【0060】
また、学習済みモデル4aは、学習用重畳画像における新設、解体、変更のそれぞれに対応する建物外形を教師データとして機械学習しており、推論部4は、航空写真APにおける新設、解体、変更のそれぞれに対応する変化域を推論している。このようにすることにより、地図における建物の新設、解体、変更を推論することが可能となる。
【0061】
また、推論部4は、学習済みモデル4aから出力された重畳画像SIの画素毎の変化点である確率に基づいて変化域を推論している。このようにすることにより、画素毎に出力された確率に所定の閾値等を設定することで、例えば、建物の新設、解体、変更といった変化域を推論することができるようになる。
【0062】
また、重畳画像SIは、RGBフォーマットのうちRチャネルとGチャネルに航空写真APのデータ、Bチャネルに地図画像MPのデータをそれぞれ設定することで構成され、学習用重畳画像SILは、RGBフォーマットのうちRチャネルとGチャネルに学習用航空写真SPLのデータ、Bチャネルに学習用地図画像MPLのデータをそれぞれ設定することで構成されていてもよい。このようにすることにより、RGBフォーマットを利用して重畳画像SI等を形成することができる。また、Bチャネルを地図画像MPや学習用地図画像MPLとすることで、重畳画像SIを人間が観察した場合であっても空中撮像画像APや学習用空中撮像画像APLとの識別が容易となる。
【0063】
また、教師データは、変化域の特性(新設、解体、変更)に対応したラベル情報が画素ごとに設定されたラベル画像Lである。このようにすることにより、教師データを画像とすることで、入力データとフォーマットを合わせることができ、学習効率や処理効率を向上させることができる。
【0064】
なお、上述した実施例では、重畳画像は、RGBフォーマットを利用していたが、カラー写真(RGB)に地図画像を重畳した4チャネルの画像としてもよい。
【0065】
また、本発明は上記実施例に限定されるものではない。即ち、当業者は、従来公知の知見に従い、本発明の骨子を逸脱しない範囲で種々変形して実施することができる。かかる変形によってもなお本発明の推論装置を具備する限り、勿論、本発明の範疇に含まれるものである。
【符号の説明】
【0066】
1 推論装置
2 入力部
3 生成部
4 推論部
4a 学習済みモデル
MP 地図画像
AP 航空写真(空中撮像画像)
SI 重畳画像
MPL 学習用地図画像
APL 学習用航空写真(空中撮像画像)
SIL 学習用重畳画像
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10