IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国際航業株式会社の特許一覧

特開2024-101111学習データバンクシステム、及び学習データ提供方法
<>
  • 特開-学習データバンクシステム、及び学習データ提供方法 図1
  • 特開-学習データバンクシステム、及び学習データ提供方法 図2
  • 特開-学習データバンクシステム、及び学習データ提供方法 図3
  • 特開-学習データバンクシステム、及び学習データ提供方法 図4
  • 特開-学習データバンクシステム、及び学習データ提供方法 図5
  • 特開-学習データバンクシステム、及び学習データ提供方法 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024101111
(43)【公開日】2024-07-29
(54)【発明の名称】学習データバンクシステム、及び学習データ提供方法
(51)【国際特許分類】
   G06V 10/774 20220101AFI20240722BHJP
   G06T 7/00 20170101ALI20240722BHJP
【FI】
G06V10/774
G06T7/00 350B
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023004850
(22)【出願日】2023-01-17
(71)【出願人】
【識別番号】390023249
【氏名又は名称】国際航業株式会社
(74)【代理人】
【識別番号】110001335
【氏名又は名称】弁理士法人 武政国際特許商標事務所
(72)【発明者】
【氏名】鈴木 久美子
(72)【発明者】
【氏名】横山 亮
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096BA18
5L096FA14
5L096FA15
5L096JA11
5L096KA04
(57)【要約】
【課題】本願発明の課題は、従来の問題を解決することであり、すなわち、学習済みモデルの生成に利用可能な学習データを提供することができる学習データバンクシステムと、これを用いた学習データ提供方法を提供することである。
【解決手段】本願発明の学習データバンクシステムは、ユーザからの照会に応じて特定学習データを提供するシステムであって、学習データ記憶手段と学習データ検出手段を備えたものである。このうち学習データ検出手段は、既存学習データから特定学習データを検出する手段である。また学習データ検出手段は、新規計測データと新規計測データに関連付けられたメタデータを受け付けると、新規計測データ及びメタデータに基づいて特定学習データを検出するとともに、ユーザに特定学習データを提供する。
【選択図】図5
【特許請求の範囲】
【請求項1】
ユーザからの照会に応じて、該ユーザに特定学習データを提供するシステムであって、
過去に地物を計測して得られた既存計測データに基づく既存学習データを記憶する学習データ記憶手段と、
前記学習データ記憶手段に記憶された前記既存学習データから、前記特定学習データを検出する学習データ検出手段と、を備え、
前記既存学習データは、前記既存計測データを構成する分割領域ごとに特徴量及び属性情報が付与されたデータであって、該既存計測データに関するメタデータが関連付けられており、
前記学習データ検出手段は、新たに地物を計測して得られた新規計測データと、該新規計測データに関連付けられた前記メタデータと、を受け付けると、受け付けた該新規計測データ及び該メタデータに基づいて前記特定学習データを検出するとともに、前記ユーザに該特定学習データを提供する、
ことを特徴とする学習データバンクシステム。
【請求項2】
前記ユーザに提供された前記特定学習データを機械学習することによって、学習済みモデルを生成するモデル生成手段を、さらに備えた、
ことを特徴とする請求項1記載の学習データバンクシステム。
【請求項3】
前記モデル生成手段は、前記特定学習データと、前記新規計測データを構成する分割領域ごとに前記特徴量及び前記属性情報が付与された新規学習データと、を機械学習することによって、前記学習済みモデルを生成する、
ことを特徴とする請求項2記載の学習データバンクシステム。
【請求項4】
前記メタデータには、計測に関する情報及び地物に関する情報が含まれる、
ことを特徴とする請求項1記載の学習データバンクシステム。
【請求項5】
空中写真計測によって得られた前記既存計測データ及び前記新規計測データに付与される前記特徴量は、色情報又は濃淡情報に基づいて得られる値である、
ことを特徴とする請求項1記載の学習データバンクシステム。
【請求項6】
レーザー計測によって得られた前記既存計測データ及び前記新規計測データに付与される前記特徴量は、反射強度に基づいて得られる値である、
ことを特徴とする請求項1記載の学習データバンクシステム。
【請求項7】
学習データバンクシステムを用いて、ユーザからの照会に応じて特定学習データを提供する方法であって、
前記学習データバンクシステムは、過去に地物を計測して得られた既存計測データに基づく既存学習データを記憶する学習データ記憶手段と、該学習データ記憶手段に記憶された該既存学習データから前記特定学習データを検出する学習データ検出手段と、を有し、
前記既存学習データは、前記既存計測データを構成する分割領域ごとに特徴量及び属性情報が付与されたデータであって、該既存計測データに関するメタデータが関連付けられており、
新たに地物を計測して新規計測データを取得する計測工程と、
前記新規計測データに関する前記メタデータを、該新規計測データに関連付けるメタデータ付与工程と、
前記新規計測データと前記メタデータを、前記学習データバンクシステムに送信する計測データ送信工程と、
前記学習データ検出手段によって、前記特定学習データを検出する学習データ検出工程と、
前記特定学習データを、前記ユーザに送信する学習データ送信工程と、を備え、
前記学習データ検出工程では、前記計測データ送信工程で送信された前記新規計測データと前記メタデータを受け付けると、受け付けた該新規計測データ及び該メタデータに基づいて前記特定学習データを検出する、
ことを特徴とする学習データ提供方法。
【発明の詳細な説明】
【技術分野】
【0001】
本願発明は、地物を計測して得られた計測データから目的の情報を推論する技術に関するものであり、より具体的には、推論するための学習済みモデルを生成するにあたって適当な学習データを提供する学習データバンクシステムと、これを用いて学習データを提供する方法に関するものである。
【背景技術】
【0002】
地図の作成や、地物の分類、土地利用の分類を行う場合、空中写真が利用される。具体的には、空中写真を判読することによって、建物や農地、道路などを読み取って地図を作成し、あるいは地物や土地利用の分類を行うわけである。なおここでいう「地物」とは、橋梁やオフィスビルといった人工物や、河川や海、森林といった自然物をはじめとする地形、あるいはコンクリート構造物のひび割れなど、地上に存在するあらゆる「物」の総称である。
【0003】
空中写真は、航空写真とも称され、地上の状態を忠実に再現するため上空から撮影される画像である。空中写真を取得するにあたっては、飛行機やヘリコプターを使用して上空から撮影したり、衛星から撮影したり、あるいはクレーン車や気球などを使用して撮影されることもある。そして地図作成などを目的とするケースでは、専用のカメラによって鉛直下方を撮影した垂直写真が取得される。なお、土地の利用は年々変化するため、定期的に同じ地域の空中写真が取得され、例えば国土地理院では平野部について5~10年周期で撮影している。
【0004】
上記したとおり空中写真を判読することによって、建物や農地といった種々の地物が抽出される。従来この写真判読は、オペレータの目視によって行われるのが主流であった。しかしながら、空中写真は広範囲を撮影したものであり、目視による写真判読はオペレータにとって相当に負担がかかる作業であり、また誤判読などいわゆるヒューマンエラーを完全に排除することは難しかった。
【0005】
そこで近年では、画像認識の技術を利用して地物の種類を選別する処理が行われることも増えてきた。つまり、ソフトウェアに係る処理をコンピュータが実行することによって、空中写真から地物の種類を自動抽出するわけである。このように自動抽出された地物の種類を最終判断として取り扱うこともあるし、その結果は一次的な判断としたうえで(つまり、スクリーニング処理としたうえで)最終的にオペレータが目視判断することもある。
【0006】
また、空中写真から地物の種類を自動抽出するにあたっては、機械学習(ML:Machine Learning)に関する技術が利用されることもある。この機械学習は、人工知能(AI:Artificial Intelligence)を支える技術の1つであり、学習用データを機械学習する(例えば、ディープラーニングなど)ことによって、目的の情報を出力することができるモデル(学習済みモデル)を生成するものである。例えば特許文献1では、空中写真を所定サイズで切り出して窓画像を作成するとともに、その窓画像をクラス分類したうえで学習データとして格納する技術について提案している。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2019-204258号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
特許文献1に開示される技術は、建物の状況に応じた学習データを作成する技術であり、すなわち1の空中写真を複数に切り分けた窓画像ごとにクラス分類(例えば、Sサイズの建物占有率が高い窓画像など)したうえで、それぞれクラスごとの学習データセットを格納するものである。そして、Sサイズの建物占有率が高い地域では、Sサイズの建物占有率が高いクラスの窓画像を学習し、Lサイズの建物占有率が高い地域では、Lサイズの建物占有率が高いクラスの窓画像を学習することとなる。
【0009】
ところで、機械学習によって学習済みモデルを生成するには数多くの学習データを学習することが望ましい。例えば、特許文献1に示すように地形のうち建物に関する情報を推論する場合、1の空中写真に基づいて複数種類の学習データを作成するより、多時期に撮影された異なる空中写真に基づいて複数種類の学習データを作成する方が望ましい。地物計測用の空中写真は、同じ地域を撮影したとしても、撮影する時期(季節)によって、撮影する日の天候によって、あるいは使用する撮影機器の違いによって、画像の特徴が異なるからである。例えば、RGBの3バンドによって構成される空中写真では、たとえ同じ場所を撮影したものであっても、撮影時期や天候によってその色属性(色彩、明度、彩度)が著しく異なることもある。そのため、1時期(あるいは少ない時期)に撮影された空中写真に基づいて学習データを作成し、この学習データを学習した学習済みモデルでは、適切な推論を実行できないおそれもある。
【0010】
上記したとおり、機械学習によって学習済みモデルを生成するには数多くの学習データを用意することが望ましいものの、1個人あるいは1企業では用意できる学習データは限定的である。特に地物に関する情報を推論する場合、数多くの学習データを用意するには多時期で地物計測を行う必要があることから、より大きな負担がかかることとなる。そのため、地物に関する情報を推論するための学習済みモデルを生成する際に、適切かつ多数の学習データが提供される仕組みが望まれていた。
【0011】
本願発明の課題は、従来の問題を解決することであり、すなわち、学習済みモデルの生成に利用可能な学習データを提供することができる学習データバンクシステムと、これを用いた学習データ提供方法を提供することである。
【課題を解決するための手段】
【0012】
本願発明は、既存の学習データを記憶する学習データ記憶手段を備えるとともに、計測データとこの計測データに関するメタデータとを手掛かりとして学習データ記憶手段から適切な学習データを選出する、という点に着目したものであり、従来にはなかった発想に基づいてなされた発明である。
【0013】
本願発明の学習データバンクシステムは、ユーザからの照会に応じて特定学習データを提供するシステムであって、学習データ記憶手段と学習データ検出手段を備えたものである。このうち学習データ記憶手段は、過去に地物を計測して得られた既存計測データに基づく既存学習データを記憶する手段であり、学習データ検出手段は、学習データ記憶手段に記憶された既存学習データから特定学習データを検出する手段である。なお既存学習データは、既存計測データを構成する分割領域(画像における画素に相当)ごとに特徴量及び属性情報が付与されたデータであって、既存計測データに関するメタデータが関連付けられたものである。ここで「特徴量」とは、例えば画像の場合は画像特徴量、また点群の場合は点群特徴量であり、分割領域ごとの特徴を表す値の総称である。そして学習データ検出手段は、新たに地物を計測して得られた新規計測データと、新規計測データに関連付けられたメタデータを受け付けると、受け付けた新規計測データ及びメタデータに基づいて特定学習データを検出するとともに、ユーザに特定学習データを提供する。
【0014】
本願発明の学習データバンクシステムは、モデル生成手段をさらに備えたものとすることもできる。このモデル生成手段は、ユーザに提供された特定学習データを機械学習することによって学習済みモデルを生成する手段である。
【0015】
本願発明の学習データバンクシステムは、モデル生成手段が特定学習データと新規学習データを機械学習することによって学習済みモデルを生成するものとすることもできる。なお新規学習データは、新規計測データを構成する分割領域ごとに特徴量及び属性情報が付与されたものである。
【0016】
本願発明の学習データバンクシステムは、「計測に関する情報」と「地物に関する情報」がメタデータに含まれたものとすることもできる。
【0017】
本願発明の学習データバンクシステムは、既存計測データや新規計測データが空中写真計測によって得られた場合、それぞれの分割領域に付与される特徴量を色情報や濃淡情報に基づいて得られる値としたものとすることもできる。
【0018】
本願発明の学習データバンクシステムは、既存計測データや新規計測データがレーザー計測によって得られた場合、それぞれの分割領域に付与される特徴量を反射強度に基づいて得られる値としたものとすることもできる。
【0019】
本願発明の学習データ提供方法は、本願発明の学習データバンクシステムを用いてユーザからの照会に応じて特定学習データを提供する方法であって、計測工程とメタデータ付与工程、計測データ送信工程、学習データ検出工程、学習データ送信工程を備えた方法である。このうち計測工程では、新たに地物を計測して新規計測データを取得し、メタデータ付与工程では、新規計測データに関するメタデータを新規計測データに関連付け、計測データ送信工程では、新規計測データとメタデータを学習データバンクシステムに送信する。また学習データ検出工程では、学習データ検出手段によって特定学習データを検出し、学習データ送信工程では、特定学習データをユーザに送信する。なお学習データ検出工程では、計測データ送信工程で送信された新規計測データとメタデータを受け付けたときに、受け付けた新規計測データ及びメタデータに基づいて特定学習データを検出する。
【発明の効果】
【0020】
本願発明の学習データバンクシステム、及び学習データ提供方法には、次のような効果がある。
(1)地物に関する情報を推論するための学習済みモデルを生成するにあたって、従来技術に比べて多くの学習データを容易に入手することができる。
(2)新規計測データと、この新規計測データに関連付けられたメタデータを手掛かりとして選出された学習データを入手することができ、さらに新規計測データを入力用データとすることから、従来技術に比べてより適切に推論することができる。
(3)同じ場所において多時期で地物計測を行うことなく、多数かつ適当な学習データを容易に入手することができる。この結果、学習データの生成にかかる手間とコストを大幅に軽減することができる。
【図面の簡単な説明】
【0021】
図1】本願発明の学習データバンクシステムを構成する主な装置を模式的に示すモデル図。
図2】本願発明の学習データバンクシステムの主な構成を示すブロック図。
図3】複数の分割領域によって構成される地形モデルを模式的に示すモデル図。
図4】メタデータの例を説明するモデル図。
図5】本願発明の学習データバンクシステムの主な処理の流れの一例を示すフロー図。
図6】本願発明の学習データ提供方法の主な工程の流れの一例を示すフロー図。
【発明を実施するための形態】
【0022】
本願発明の学習データバンクシステム、及び学習データ提供方法の実施形態の一例を、図に基づいて説明する。
【0023】
1.全体概要
本願発明は、地物を計測して得られたデータ(以下、「計測データ」という。)から、その計測データに含まれる種々の情報を把握するための技術であって、機械学習によって生成されるモデル(以下、「学習済みモデル」という。)に計測データを入力することで目的とする情報を推論するための技術である。より詳しくは、学習済みモデルを生成するにあたって、すなわち機械学習を実行するにあたって必要な学習用のデータ(以下、「学習データ」という。)を提供するものである。なお本願発明が対象とする地物データは、空中写真計測によって得られる「空中写真(オルソ画像)」のほか、レーザー計測によって得られる「点群データ」など、従来用いられている種々の計測によって得られるデータである。また本願発明では、過去の計測によって得られた計測データに加え、新たに得られた(今回計測した)計測データを利用する。そこで便宜上ここでは、過去の計測に係る計測データのことを「既存計測データ」、新規の計測に係る計測データのことを「新規計測データ」ということとし、さらに既存計測データに基づいて作成される学習データのことを「既存学習データ」、新規計測データに基づいて作成される学習データのことを「新規学習データ」ということとする。
【0024】
上記したとおり本願発明は、計測データに含まれる種々の情報を推論するための技術である。そして推論しようとする情報は、本願発明を実施する者が任意に設定することができる。例えば、計測データのうちの地盤と非地盤(地物)の領域を推論したり、地物の種別(建物、田畑、道路、河川、橋梁など)を推論したり、土地の利用状況(商業地区、工業地区、農地、山林など)を推論したり、構造物の面積や高さを推論したり、建物の密集度から居住者数や人口密度を推論したりするために利用することができる。
【0025】
2.学習データバンクシステム
本願発明の学習データバンクシステムについて説明する。なお、本願発明の学習データ提供方法は、本願発明の学習データバンクシステムを用いて学習データを提供する方法である。したがって、まずは本願発明の学習データバンクシステムについて説明し、その後に本願発明の学習データ提供方法について説明することとする。
【0026】
本願発明の学習データバンクシステム100は、図1に示すように中央装置(以下、「学習データバンク200」という。)を備えたものであり、さらに1又2以上(図では4つ)の端末装置300を備えたものとすることもできる。それぞれの端末装置300は、無線(あるいは有線)通信手段によって学習データバンク200に接続されており、相互に種々の情報(データ)を送受信することができる。
【0027】
図2に示すように学習データバンク200は、学習データ記憶手段201と学習データ検出手段202を含んで構成される。一方の端末装置300は、モデル生成手段301を含んで構成され、さらに推論手段302を含んで構成することもできる。
【0028】
学習データ検出手段202とモデル生成手段301、推論手段302は、専用のものとして製造することもできるし、汎用的なコンピュータ装置を利用することもできる。すなわち、所定のプログラムによってコンピュータ装置に演算処理を実行させることで、それぞれの手段特有の処理を行うわけである。このコンピュータ装置は、CPU等のプロセッサ、ROMやRAMといったメモリを具備しており、さらにマウスやキーボード等の入力手段やディスプレイを含むものもあり、例えばパーソナルコンピュータ(PC)やサーバなどによって構成することができる。なお、図1に示すように学習データバンク200と端末装置300はそれぞれ別の装置とし、すなわち学習データ検出手段202を構成するコンピュータ装置と、モデル生成手段301と推論手段302を構成するコンピュータ装置とは異なるものとすることができる。あるいは、1のコンピュータ装置に、学習データ検出手段202とモデル生成手段301、推論手段302を構成することもできる。
【0029】
また、学習データ記憶手段201は、汎用的コンピュータ(例えば、パーソナルコンピュータ)の記憶装置を利用することもできるし、データベースサーバに構築することもできる。データベースサーバに構築する場合、ローカルなネットワーク(LAN:Local Area Network)に置くこともできるし、インターネット経由で保存するクラウドサーバとすることもできる。
【0030】
以下、本願発明の学習データバンクシステム100を構成する主な要素ごとに詳しく説明する。
【0031】
(学習データ記憶手段)
学習データ記憶手段201は、既存計測データに基づいて作成された学習データ、すなわち既存学習データを記憶する手段である。なお学習データ記憶手段201には、複数の(できれば数多くの)既存学習データが記憶される。ここで、学習データバンクシステム100に用いられる学習データ(既存学習データと新規学習データ)について詳しく説明する。
【0032】
学習データの基礎となる計測データは、図3に示すように計測範囲が複数(図では12×15)の小領域(以下、「分割領域PX」という。)に分割されたもので、換言すれば複数の分割領域PXによって形成されたものである。また計測データには、「メタデータ」が関連付けられている。このメタデータは、計測に関するデータであり、種々の情報を採用することができる。例えば図4では、「空中写真計測に関する情報(計測に関する情報)」と「地物に関する情報」、「計測業務に関する情報」をメタデータとして採用しており、空中写真計測に関する情報と地物に関する情報、計測業務に関する情報それぞれの具体例を示している。もちろん、計測に関する情報と地物に関する情報、計測業務に関する情報のうちいずれか1つ(あるいは2つ)の情報を採用することもできるし、これらの情報に限らず他の情報をメタデータとして採用することもできる。また、図4で例示した具体的な情報(撮影時期や解像度など)のうち複数の情報を組み合わせて採用することもできるし、いずれか1つの情報を採用することもできる。
【0033】
学習データは、計測データを構成するそれぞれの分割領域PXに、計測データから得られる「特徴量」と教師データである「属性情報」が付与されることで作成される。ここで特徴量とは、文字どおり分割領域PXごとの特徴を示す物理量である。例えば、空中写真計測によって得られた計測データ(例えば、オルソ画像)を利用する場合は、色情報や濃淡情報、3次元座標などを特徴量とすることができ、またレーザー計測によって得られた計測データ(点群データ)を利用する場合は、反射強度や3次元座標などを特徴量とすることができる。
【0034】
なお色情報とは、色をモデル化したときの値であり、このモデル化としては赤(Red)・緑(Green)・青(Blue)の3色を基本色とするRGB、シアン(Cyan)・マゼンタ(Magenta)・イエロー(Yellow)・ブラック(Key color)の4色を基本色とするCMYK、黄・赤・青・緑・黒・白の6色を基本色とするNCSやオストワルト表色系などのモデルを用いるとよい。また濃淡情報とは、いわゆる「グレースケール」のことであり、白から黒まで複数の段階に分けるモデルにおいて、濃淡の程度を特定する値である。さらに反射強度とは、地物で反射したレーザーパルスの反射波をセンサで受信したときの強度(直接的には電圧として計測される値)であり、いわば受信した反射波のエネルギーの大きさである。
【0035】
また属性情報とは、推論しようとする情報のことであり、いわば正解となるタグ情報のことである。例えば、地盤と非地盤(地物)を推論する場合は分割領域PXごとに地盤あるいは非地盤が付与され、地物の種別を推論する場合は分割領域PXごとに建物や田畑、道路などを付与するわけである。なお推論するにあたっては、分割領域PXごと推論する仕様とすることもできるし、点や線、ポリゴン単位で推論する仕様とすることもできる。
【0036】
既述したとおり、学習データのうち既存学習データは既存計測データに基づいて作成され、学習データのうち新規学習データは新規計測データに基づいて作成される。そして計測データには、メタデータが関連付けられている。すなわち既存学習データと新規学習データは、それぞれ分割領域PXごとに特徴量と属性情報が付与されたデータであって、メタデータが関連付けられたデータである。
【0037】
(学習データ検出手段)
学習データ検出手段202は、学習データ記憶手段201に記憶された複数の既存学習データの中から、新規計測データとそのメタデータに基づいて、より適当な既存学習データ(以下、特に「特定学習データ」という。)を検出する手段である。以下、学習データ検出手段202が特定学習データを検出する手順について説明する。
【0038】
まずは学習データバンク200が、例えば端末装置300によって送信された新規計測データと、その新規計測データに関連付けられたメタデータを受け取る。このとき、新規計測データとメタデータに加えて、検索クエリ(例えば、建物密集率50%以上など)を受け取る仕様とすることもできる。そして学習データ検出手段202は、新規計測データとメタデータ(あるいは、検索クエリ)を手掛かりとして探索し、学習データ記憶手段201から特定学習データを検出する。具体的には、受け取った新規計測データの諸元(対称地域や計測範囲など)と近似する既存学習データであって、受け取ったメタデータと類似する(あるいは同一の)既存学習データを、特定学習データとして検出する。特定学習データとして検出するにあたっては、「Bag of Visual Words」や「T-SNE」など従来用いられている種々の技術を利用することができる。ただし、特定学習データは機械学習を実行するためのデータであるため、複数の特定学習データ(以下、複数のデータという意味で「特定学習データセット」という。)が検出される。ここで検出された特定学習データセットは、新規計測データとメタデータを送信した端末装置300に送信される。
【0039】
(モデル生成手段)
モデル生成手段301は、学習データバンク200から送信された特定学習データセットを機械学習することによって学習済みモデルを生成する手段である。あるいは、特定学習データセットに加え、新規計測データに基づいて作成された新規学習データも機械学習することによって学習済みモデルを生成する仕様としてもよい。なお本願発明では、学習済みモデルを生成するための機械学習技術として、深層学習(deep learning)をはじめとする種々の技術を採用することができる。
【0040】
(処理の流れ)
以下、図5を参照しながら本願発明の学習データバンクシステム100の主な処理について詳しく説明する。図5は、本願発明の学習データバンクシステムの主な処理の流れの一例を示すフロー図であり、左側に学習データバンク200による処理を示し、右側に端末装置300による処理を示している。
【0041】
事前の処理として、学習データバンク200の学習データ記憶手段201に数多くの既存学習データが記憶される(図5のStep411)。ここで記憶される既存学習データは、学習データバンク200側で作成したもののほか、それぞれの端末装置300から提供された既存学習データも含めることができる。
【0042】
端末装置300を用いて推論しようとする者(以下、単に「ユーザ」という。)が、空中写真計測やレーザー計測によって得られた新規計測データを取得すると、その新規データにメタデータを関連付けるとともに、新規計測データとメタデータ(以下、「検出用データ」という。)を学習データバンク200に送信する(図5のStep421)。このとき、検出用データとして検索クエリを含めたうえで送信してもよい。
【0043】
学習データバンク200が検出用データを受信すると(図5のStep412)、学習データ検出手段202がその検出用データを手掛かりとして学習データ記憶手段201に記憶された多数の既存学習データの中から複数の特定学習データ(特定学習データセット)を検出する(図5のStep413)。ここで検出された特定学習データセットは、端末装置300に送信される(図5のStep414)。
【0044】
端末装置300が特定学習データセットを受信すると(図5のStep423)、この特定学習データセットを機械学習することによってモデル生成手段301が学習済みモデルを生成する(図5のStep424)。このとき、ユーザが新規計測データに基づいて新規学習データを作成する(図5のStep422)とともに、この新規学習データと特定学習データセットを機械学習することによって学習済みモデルを生成することもできる。なお、ユーザが新規学習データを作成する場合は、その新規学習データを学習データバンク200に提供して学習データ記憶手段201に記憶させるとよい。
【0045】
学習済みモデルを生成すると、新規計測データに基づいて入力用データを作成するとともに、この入力用データを学習済みモデルに入力すると推論手段302が目的の情報(例えば、地物の種別)を推論する(図5のStep425)。なお入力用データは、新規計測データを構成するそれぞれの分割領域PXに「特徴量」が付与されることで作成される。あるいは、分割領域PXごとの特徴量に加えて、メタデータを関連付けたものを入力用データとしてもよい。
【0046】
3.学習データ提供方法
続いて、本願発明の学習データ提供方法について図6を参照しながら説明する。なお、本願発明の学習データ提供方法は、ここまで説明した学習データバンクシステム100を用いて学習データを提供する方法であり、したがって学習データバンクシステム100で説明した内容と重複する説明は避け、本願発明の学習データ提供方法に特有の内容のみ説明することとする。すなわち、ここに記載されていない内容は、「2.学習データバンクシステム」で説明したものと同様である。
【0047】
図6は、本願発明の学習データ提供方法の主な工程の流れを示すフロー図である。この図に示すように、まずユーザ側で空中写真計測やレーザー計測を実施することによって新規計測データを取得する(図6のSte501)。新規計測データを取得すると、その新規データにメタデータを関連付ける(図6のSte502)とともに、新規計測データとメタデータ(検出用データ)を学習データバンク200に送信し、学習データバンク200がこれを受信する(図6のSte503)。このとき、検出用データとして検索クエリを含めたうえで送信してもよい。
【0048】
学習データバンク200が検出用データを受信すると、その検出用データを手掛かりとして学習データ記憶手段201に記憶された多数の既存学習データの中から特定学習データセットを検出する(図6のSte504)。ここで検出された特定学習データセットは端末装置300に送信され、端末装置300がこれを受信する(図6のSte505)。
【0049】
端末装置300が特定学習データセットを受信すると、この特定学習データセットを機械学習することによって学習済みモデルを生成する(図6のSte506)。学習済みモデルを生成すると、新規計測データに基づいて入力用データを作成するとともに、この入力用データを学習済みモデルに入力して目的の情報(例えば、地物の種別)を推論する(図6のSte507)。
【産業上の利用可能性】
【0050】
本願発明の学習データバンクシステム、及び学習データ提供方法は、建物の抽出のほか、道路や鉄道域の抽出、種別ごとの農地の抽出、種別ごとの樹木の抽出など、地物に関する種々の情報の推論に利用することができる。本願発明によれば、地物に関する種々の情報を様々な地域で把握することができるため、社会インフラストラクチャーの計画や防災計画などに有効活用することができ、産業上利用できるばかりでなく社会的にも大きな貢献を期待し得る発明である。
【符号の説明】
【0051】
100 本願発明の学習データバンクシステム
200 (学習データバンクシステムの)学習データバンク
201 (学習データバンクの)学習データ記憶手段
202 (学習データバンクの)学習データ検出手段
300 (学習データバンクシステムの)端末装置
301 (端末装置の)モデル生成手段
302 (端末装置の)推論手段
PX 分割領域
図1
図2
図3
図4
図5
図6