IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 学校法人早稲田大学の特許一覧

特開2024-2745情報処理装置、領域区分方法、及びプログラム
<>
  • 特開-情報処理装置、領域区分方法、及びプログラム 図1
  • 特開-情報処理装置、領域区分方法、及びプログラム 図2
  • 特開-情報処理装置、領域区分方法、及びプログラム 図3
  • 特開-情報処理装置、領域区分方法、及びプログラム 図4
  • 特開-情報処理装置、領域区分方法、及びプログラム 図5
  • 特開-情報処理装置、領域区分方法、及びプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024002745
(43)【公開日】2024-01-11
(54)【発明の名称】情報処理装置、領域区分方法、及びプログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20231228BHJP
   G06V 10/82 20220101ALI20231228BHJP
   G06N 3/04 20230101ALI20231228BHJP
【FI】
G06T7/00 350C
G06V10/82
G06N3/04
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022102136
(22)【出願日】2022-06-24
(71)【出願人】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(71)【出願人】
【識別番号】899000068
【氏名又は名称】学校法人早稲田大学
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100124844
【弁理士】
【氏名又は名称】石原 隆治
(72)【発明者】
【氏名】オウ ショウ
(72)【発明者】
【氏名】中野 雄介
(72)【発明者】
【氏名】王 ▲ゆ▼博
(72)【発明者】
【氏名】大谷 淳
(72)【発明者】
【氏名】長谷川 克也
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096BA04
5L096CA02
5L096FA02
5L096HA11
5L096JA11
5L096JA22
5L096KA04
(57)【要約】      (修正有)
【課題】空中写真の画像から、道路における渋滞の領域を区分することを可能とする情報処理装置、領域区分方法及びプログラムを提供する。
【解決手段】情報処理装置において、上空から撮影された画像を取得する空中写真収集部10と、ニューラルネットワークのモデルを用いて、画像から道路領域と渋滞領域を同時に区分するアルゴリズム計算部120と、アルゴリズム計算部120により得られた区分結果を出力する出力処理部130と、モデルに空中写真の画像を入力し、モデルからの出力と正解との誤差が最小になるように、モデルのパラメータを調整する学習部140と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
上空から撮影された画像を取得する取得部と、
ニューラルネットワークのモデルを用いて、前記画像から道路領域と渋滞領域を同時に区分する計算部と、
前記計算部により得られた区分結果を出力する出力処理部と
を備える情報処理装置。
【請求項2】
前記モデルは、
前記画像から得られた複数の特徴マップを用いて、前記画像における道路領域と渋滞領域を区分する第1モジュールと、
前記複数の特徴マップのうちの特定の特徴マップを用いて、前記第1モジュールにより得られた渋滞領域を強化する第2モジュールと
を備える請求項1に記載の情報処理装置。
【請求項3】
前記複数の特徴マップは、前記モデルに含まれる特徴ピラミッドネットワークにより生成され、前記特定の特徴マップは、前記複数の特徴マップのうちの最上位レベルの特徴マップである
請求項2に記載の情報処理装置。
【請求項4】
前記第2モジュールは、
前記特定の特徴マップから大域的なコンテキストを生成するコンテキスト生成器と、
前記大域的なコンテキストと、前記第1モジュールにより得られた渋滞領域とを用いて、当該渋滞領域よりも精度の高い渋滞領域を生成するアテンション計算ブロックと
を備える請求項2に記載の情報処理装置。
【請求項5】
情報処理装置が実行する領域区分方法であって、
上空から撮影された画像を取得する取得ステップと、
ニューラルネットワークのモデルを用いて、前記画像から道路領域と渋滞領域を同時に区分する計算ステップと、
前記計算ステップにより得られた区分結果を出力する出力ステップと
を備える領域区分方法。
【請求項6】
コンピュータを、請求項1ないし4のうちいずれか1項に記載の情報処理装置における各部として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、空中写真の画像から道路情報を抽出する技術に関連するものである。
【背景技術】
【0002】
空中写真の画像から交通渋滞を検知したり、交通密度を推定したりすることで、リアルタイムの交通状態情報を都市モニタリングシステムや運転者に提供することができる。このような交通状態情報により、例えば、適切な走行経路を決定することができる。
【0003】
渋滞を検知する従来技術である非特許文献2に開示された技術では、交差点に設置したカメラで撮影した画像から交通密度を推定することにより、渋滞検知を分類問題として扱う技術が開示されている。
【0004】
また、非特許文献3に開示された技術では、LTA(Land Transport Authority(陸上交通庁))が提供するオープンソースのアプリケーションプログラミングインタフェース(API) を使ってデータを収集し、交通密度を推定するためのCNN(畳み込みニューラルネットワーク)を提案している。
【0005】
しかし、非特許文献2、3で使用された画像は交通カメラ(交差点等に設置されたカメラ)で撮影されたものであるため、非常に小さなエリアの道路状況情報しか提供できない。
【0006】
また、セマンティックセグメンテーションに基づいて、空中写真の画像から道路を抽出するための多くの方法が提案されている。例えば非特許文献1には、道路抽出を、相互に関連する3つのサブタスク、すなわち、道路表面セグメンテーション、道路エッジ検出、および道路中心線抽出に分解して行う技術が開示されている。しかし、道路網を抽出できるものの、空中写真の画像から交通渋滞の領域をセグメント化(分割)することはできていない。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】Y. Liu, J. Yao, X. Lu, M. Xia, X. Wang, and Y. Liu. RoadNet: Learning to Comprehensively Analyze Road Networks in Complex Urban Scenes from High-Resolution Remotely Sensed Images. IEEE Transactions on Geoscience and Remote Sensing, 57(4):2043-2056, 2019.
【非特許文献2】J. Nubert, N. G. Truong, A. Lim, H. I. Tanujaya, L. Lim, M. A. Vu, "Traffic Density Estimation using a Conbolutional Neural Network," arXiv preprint arXiv : 1809.01564, 2018.
【非特許文献3】M. Hasan, S. Das and M. N. T. Akhand, "Estimating Traffic Density on Roads using Convolutional Neural Network with Batch Normalization," 2021 5th International Conference on Electrical Engineering and Information Communication Technology (ICEEICT), 2021, pp. 1-6, doi: 10.1109/ICEEICT53905.2021.9667860.
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明は上記の点に鑑みてなされたものであり、空中写真の画像から、道路における渋滞の領域を区分することを可能とする技術を提供することを目的とする。
【課題を解決するための手段】
【0009】
開示の技術によれば、上空から撮影された画像を取得する取得部と、
ニューラルネットワークのモデルを用いて、前記画像から道路領域と渋滞領域を同時に区分する計算部と、
前記計算部により得られた区分結果を出力する出力処理部と
を備える情報処理装置が提供される。
【発明の効果】
【0010】
開示の技術によれば、空中写真の画像から、道路における渋滞の領域を区分することを可能とする技術が提供される。
【図面の簡単な説明】
【0011】
図1】本発明の実施の形態における情報処理装置の構成図である。
図2】処理の流れを説明するためのフローチャートである。
図3】コンテキスト強化交通セグメンテーションモデルの全体構成を示す図である。
図4】オリジナル交通モジュールの構成を示す図である。
図5】アテンション計算ブロックの構成を示す図である。
図6】装置のハードウェア構成例を示す図である。
【発明を実施するための形態】
【0012】
以下、図面を参照して本発明の実施の形態(本実施の形態)を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。
【0013】
なお、本明細書及び請求の範囲において、「分割」、「セグメント化」、「抽出」、「区分」、「分類」、「セグメンテーション」は、互いに同義に使用されてもよい。つまり、明細書あるいは請求の範囲に記載された、「分割」、「セグメント化」、「抽出」、「区分」、「分類」、及び「セグメンテーション」はそれぞれ、これらのうちの他のいずれかに置き換えてもよい。
【0014】
また、「空中写真」を「航空写真」に言い換えてもよい。空中写真の画像を「空中画像」あるいは「航空画像」と言い換えてもよい。空中写真/航空写真は、上空にある飛行体から地上を撮影した写真であり、当該飛行体は、特定のものに限定されない。例えば、飛行体は飛行機であってもよいし、衛星であってもよいし、ドローンであってもよい。
【0015】
また、「強化する(enhanceする)」とは、例えば、渋滞領域の区分の精度を高めること、あるいは、渋滞領域と渋滞以外の領域との境界を明確化すること、などの意味を有する。
【0016】
(装置構成例、動作例)
図1に本実施の形態における情報処理装置100の構成例を示す。図1に示すように、情報処理装置100は、空中写真収集部110、アルゴリズム計算部120、出力処理部130、学習部140を有する。なお、空中写真収集部110を取得部と呼んでもよい。また、アルゴリズム計算部120を計算部と呼んでもよい。
【0017】
図2のフローチャートを参照して、情報処理装置100による推論時(テスト時)の処理の流れを説明する。S101において、空中写真収集部110が、ドローン、衛星、あるいは航空機などが撮影した写真あるいはビデオ(動画)を取得する。これら写真とビデオを総称して「空中写真」と呼ぶことにする。空中写真収集部110により取得された空中写真の画像はアルゴリズム計算部120に入力される。
【0018】
アルゴリズム計算部120は、後述するニューラルネットワークのモデル(エンドツーエンドのモデル)を有している。ここではモデルは学習済みであるとする。S102において、アルゴリズム計算部120は、モデルに空中写真の画像を入力することで、モデルからの出力として、道路領域と渋滞領域(道路領域における渋滞領域と渋滞領域以外を区分したもの)が分割(区分)された画像を取得する。
【0019】
S103において、出力処理部130は、アルゴリズム計算部120に得られた画像(道路領域と渋滞領域とが分割された画像)をそのまま出力してもよいし、当該画像に対する処理を行って、処理後の画像を出力してもよい。例えば、出力処理部130は、アルゴリズム計算部120により得られた画像から、道路上の渋滞領域のみを抽出して出力することも可能である。
【0020】
モデルの学習時においては、大量の空中写真の画像と、そのラベルデータ(例えば、画像に道路、渋滞、渋滞以外をラベル付けしたデータ)を用いる。学習部140は、モデルに空中写真の画像を入力し、モデルからの出力と正解との誤差が最小になるように、モデルのパラメータ(重み)を調整する。
【0021】
なお、学習を行う装置(学習部140を備える装置)と、推論を行う装置とが別々の装置であってもよい。この場合、学習を行う装置を学習装置と呼んでもよい。以降、アルゴリズム計算部120の構成と動作を詳細に説明する。また、推論を行う装置は学習部140を備えなくてもよい。
【0022】
アルゴリズム計算部120は、ニューラルネットワークのモデルを有する。このモデルにより、空中写真の画像上で道路表面と、道路表面における渋滞領域を同時に分割(セグメント化)することが可能である。
【0023】
空中写真の画像において、上空から見た車両の大きさ(スケール)は、上空から見た道路表面の大きさよりも小さいことから、車両のセグメント化は一般に非常に難しい。これは、スケール変動問題と呼ばれる。そのため、従来技術においては、渋滞領域と渋滞ではない領域との境界を正確にセグメント化することは非常に難しい。
【0024】
本実施の形態に係るアルゴリズム計算部120を構成するモデルは、上記の課題を解決し、空中写真の画像から渋滞領域を精度良くセグメント化することが可能である。
【0025】
以下、本実施の形態におけるコンテキスト強化交通セグメンテーションモデルの構成と動作を詳細に説明する。以下、記載の便宜上、コンテキスト強化交通セグメンテーションモデルを「モデル」と呼ぶ場合がある。
【0026】
(モデルの全体構成)
図3に、コンテキスト強化交通セグメンテーションモデルの全体構成例を示す。図3に示すように、本モデルは、特徴ピラミッドネットワーク(FPN:Feature Pyramid Network)210、オリジナル交通モジュール(Original Traffic Module)220、コンテキストアテンションモジュール230を有する。
【0027】
コンテキストアテンションモジュール230は、グローバルコンテキスト生成器(Global Context Generator)240、アテンション計算ブロック(Attention Computation Block)250を有する。
【0028】
マルチレベル予測はスケール変動問題に効果的であることから、まず、空中写真の画像が、マルチレベル予測を行う特徴ピラミッドネットワーク210に入力される。特徴ピラミッドネットワーク210は、入力画像から、異なるスケールの5つの特徴マップ(P2~P6)からなる特徴ピラミッドを生成する。P6の特徴マップは、最高(最上位)レベルの意味情報を含む。
【0029】
5つの特徴マップ(P2~P6)は、オリジナル交通モジュール220に入力され、オリジナル交通モジュール220は、道路表面(Road Surface)と交通渋滞(Original Traffic Jam)のセグメンテーション結果を生成する。
【0030】
また、P6の特徴マップがグローバルコンテキスト生成器240に入力され、グローバルコンテキスト生成器240は、P6の特徴マップからグローバルコンテキスト特徴(Global Context Feature)を生成する。
【0031】
グローバルコンテキスト特徴とオリジナル渋滞セグメンテーション結果がアテンション計算ブロック250に入力され、アテンション計算ブロック250は、強化された(質が高められた)渋滞セグメンテーション(渋滞している領域)を出力する。
【0032】
強化された渋滞セグメンテーションと、オリジナル交通モジュール220により得られた道路表面のセグメンテーションを結合することで、最終的な出力を得ることができる。
【0033】
(オリジナル交通モジュール220)
次に、オリジナル交通モジュール220について説明する。道路上で渋滞領域を分割(セグメント化)するには、道路上で車両群をセグメント化する必要がある。しかし、上空から見た場合、道路に対する車両のスケールは小さく、スケール変動問題を引き起こす。オリジナル交通モジュール200は、この問題に対処するためにマルチスケール特徴融合ネットワークの構成を有する。
【0034】
図4に、オリジナル交通モジュール220の構成例を示す。図4に示すように、オリジナル交通モジュール220は、畳み込み層(Convolution layers)221、融合層(Fusion Layer)222を含む。畳み込み層(Convolution layers)221は、特徴マップごとに、3つの連続する3×3畳み込み層を含む。
【0035】
図4に示すように、各特徴マップP∈R256×H×W(サイズ:256×H×W)が畳み込み層221に入力される。各特徴マップに対し、同じ畳み込み処理が行われる。畳み込み処理により、新たな特徴マップP∈R1×H×Wが生成される。なお、本明細書のテキストにおいて、記載の便宜上、文字の頭に記載される記号を、文字の前に記載している。「P」はその例である。
【0036】
次に、バイリニア補間により、各特徴マップをオリジナルの入力Rh×wのスケールにサイズ変更する。その後、5つの特徴マップを連結により融合し、融合した特徴マップを1つの3×3畳み込み層(融合層222)に入力することで、交通渋滞マップA∈R1×h×wと道路表面マップB∈R1×h×wを有するオリジナルのセグメンテーション結果を取得する。
【0037】
(コンテキストアテンションモジュール230)
次に、コンテキストアテンションモジュール230について説明する。
【0038】
一般に、空中写真の画像において、道路上の渋滞領域とその他の領域との境界はあいまいであるため、渋滞領域と通行可能道路領域を明示的に分けることは困難である。コンテキストアテンションモジュール230は、この課題を解決し、渋滞領域と他の領域との境界を明確にする。コンテキストアテンションモジュール230は、グローバルコンテキスト特徴マップを用いることで、オリジナル交通モジュール220により得られたオリジナルの渋滞マップを改良して、上記境界を明確にする。
【0039】
グローバルコンテキストモジュール240は、ピラミッドプーリングモジュール(PPM)を含む。前述したとおり、特徴マップP6は、最も強力な意味情報を有しており、グローバルコンテキストモジュール240は、特徴マップP6を入力とする。
【0040】
すなわち、まず、グローバルコンテキストモジュール240が、P6の特徴マップにピラミッドプーリングモジュール(PPM)を適用して、領域表現とコンテキスト依存関係をさらに活用している。グローバルコンテキストモジュール240により、グローバルコンテキスト特徴マップC∈R1×h×wを取得する。
【0041】
なお、ピラミッドプーリングモジュールにおいては、ピラミッド状のサイズ階層を有する複数グリッドを用いて、入力に対してプーリングを実施することで、どのグリッドに各クラスの特徴がどのくらい含まれているかを示した大域的(グローバル)な大まかなコンテキスト情報を得ることができる。
【0042】
グローバルコンテキスト特徴マップとオリジナル渋滞マップはアテンション計算ブロック250に入力される。
【0043】
図5に、アテンション計算ブロック250の処理構成を示す。この処理が可能なようにニューラルネットワークが構成されている。
【0044】
図5に示すように、最初にオリジナル渋滞マップAとグローバルコンテキスト特徴マップCをそれぞれダウンサンプリングして、{A,C}∈R1×h/4×w/4を取得する。次に、これらをリシェープ(変形)して、2つの新たな特徴マップ{A,C}∈R1×nを得る。ここで、nはn=h/4×w/4であり、特徴マップのおけるピクセル数を示す。
【0045】
図5及び下記の式(1)に示すように、Aと、転置したCとの間で行列乗算を行い、ソフトマックス層によってコンテキストアテンションマップS∈Rn×nを計算する。
【0046】
S=Softmax(×A) (1)
コンテキスト情報を用いて渋滞領域を強化(明確化)するために、図5及び下記の式(2)に示すように、コンテキストアテンションマップSをAに乗算し、その積をR1×h/4×w/4にリシェープする。そして、Aを加えて、コンテキストにより強化された渋滞マップ∈R1×h/4×w/4を取得する。ここで、αは、0として初期化される学習可能な重みパラメータである。
【0047】
=α(Reshape(A×S))+A (2)
そして、をサイズ変更して、最終的な強化された渋滞セグメンテーションの結果A∈R1×h×wを得る。
【0048】
以上がコンテキストアテンションモジュール230の処理である。最後に、強化された渋滞セグメンテーションと、オリジナルの道路表面セグメンテーションとを結合(組み合わせ)し、それを3×3の畳み込み層に入力し、最終的な渋滞セグメンテーション結果を生成する。最終的な渋滞セグメンテーション結果において、例えば、空中写真の画像上で、道路領域が区分されて示されるととともに、その道路領域における渋滞領域及び渋滞以外の領域が区分して示される。
【0049】
(コンテキスト強化交通セグメンテーションモデルのまとめ)
以上説明したように、本実施の形態では、コンテキスト強化交通セグメンテーションモデルが、エンドツーエンドの手法で、空中写真の画像から交通渋滞と道路表面を分割(区分)する。「コンテキスト強化交通セグメンテーションモデル」は、コンテキストにより性能を強化した交通セグメンテーションモデルである。
【0050】
本実施の形態におけるモデルは、明示的に交通渋滞と道路表面を分割することを可能にする2つのモジュール(オリジナル交通モジュール220とコンテキストアテンションモジュール230)から構成されている。
【0051】
オリジナル交通モジュール220は、空中写真の画像におけるスケール変動問題を解決するためのモジュールである。すなわち、このモジュールでは、特徴ピラミッドに基づくマルチスケール特徴マップを利用して、畳み込み層221により更なる特徴を抽出する。そじて、融合層222によって異なるスケールの複数の特徴を融合し、交通渋滞と道路表面のオリジナル(初期)のセグメンテーションを得る。
【0052】
コンテキストアテンションモジュール230は、交通渋滞の境界を強化する。コンテキストアテンションモジュール230は、アテンション計算ブロック250とそれに対応するグローバルコンテキスト生成器240から成る。特徴ピラミッドの最上位レベルの特徴マップは、最も強い意味情報を含んでいる。そこで、それをグローバルコンテキスト生成器240に入力し、ピラミッドプーリング演算を介してグローバルコンテキストマップを得る。その後、アテンション計算ブロック250において、グローバルコンテキストマップと交通渋滞のオリジナルセグメンテーションとの間のアテンションマップを計算する。最後に、アテンションマップを用いて交通渋滞の境界を強め(境界を明確化し)、最終的な交通渋滞セグメンテーション結果を得る。
これにより、道路表面と渋滞領域を同時にかつ正確に区分できる。また、空中写真の画像では、車両のスケールが空中から見た道路表面のスケールよりも小さく、車両のセグメント化が非常に困難であるというスケールの問題を解決する。
【0053】
(ハードウェア構成例)
情報処理装置100は、例えば、コンピュータにプログラムを実行させることにより実現できる。このコンピュータは、物理的なコンピュータであってもよいし、クラウド上の仮想マシンであってもよい。
【0054】
すなわち、情報処理装置100は、コンピュータに内蔵されるCPUやメモリ等のハードウェア資源を用いて、情報処理装置100で実施される処理に対応するプログラムを実行することによって実現することが可能である。上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メール等、ネットワークを通して提供することも可能である。
【0055】
図6は、上記コンピュータのハードウェア構成例を示す図である。図6のコンピュータは、それぞれバスBSで相互に接続されているドライブ装置1000、補助記憶装置1002、メモリ装置1003、CPU1004、インタフェース装置1005、表示装置1006、入力装置1007、出力装置1008等を有する。
【0056】
当該コンピュータでの処理を実現するプログラムは、例えば、CD-ROM又はメモリカード等の記録媒体1001によって提供される。プログラムを記憶した記録媒体1001がドライブ装置1000にセットされると、プログラムが記録媒体1001からドライブ装置1000を介して補助記憶装置1002にインストールされる。但し、プログラムのインストールは必ずしも記録媒体1001より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置1002は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
【0057】
メモリ装置1003は、プログラムの起動指示があった場合に、補助記憶装置1002からプログラムを読み出して格納する。CPU1004は、メモリ装置1003に格納されたプログラムに従って、情報処理装置100に係る機能を実現する。インタフェース装置1005は、ネットワークや各種計測装置、運動介入装置等に接続するためのインタフェースとして用いられる。表示装置1006はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置1007はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。出力装置1008は演算結果を出力する。
【0058】
(実施の形態の効果)
本実施の形態に係る技術により、従来のように人の目で画像から道路と渋滞の情報を抽出するのではなく、自動的に道路の領域及び渋滞領域を出力することができる。また、従来の画像上のスケース変動問題(車が小さい、道路が大きいなど)を考慮して、高精度で画像から領域を分割できる。また、領域間を分割する境界線の部分も円滑に表示することができる。
【0059】
また、本実施の形態に係る技術で得られるセグメンテーションマップにより、視覚的に、渋滞の場所と、渋滞している領域が占める道路領域に対する割合を把握できる。また、渋滞があっても通過可能な場所を把握できるので、例えば緊急車両が通過可能かどうかを判断できる。このような点は、従来技術における渋滞検知や密度推定よりも優れた点である。
【0060】
(付記)
以上の実施形態に関し、更に以下の付記項を開示する。
(付記項1)
メモリと、
プロセッサと、を備え、
前記プロセッサは、
上空から撮影された画像を取得し、
ニューラルネットワークのモデルを用いて、前記画像から道路領域と渋滞領域を同時に区分し、
得られた区分結果を出力する
情報処理装置。
(付記項2)
前記モデルは、
前記画像から得られた複数の特徴マップを用いて、前記画像における道路領域と渋滞領域を区分する第1モジュールと、
前記複数の特徴マップのうちの特定の特徴マップを用いて、前記第1モジュールにより得られた渋滞領域を強化する第2モジュールと
を備える付記項1に記載の情報処理装置。
(付記項3)
前記複数の特徴マップは、前記モデルに含まれる特徴ピラミッドネットワークにより生成され、前記特定の特徴マップは、前記複数の特徴マップのうちの最上位レベルの特徴マップである
付記項2に記載の情報処理装置。
(付記項4)
前記第2モジュールは、
前記特定の特徴マップから大域的なコンテキストを生成するコンテキスト生成器と、
前記大域的なコンテキストと、前記第1モジュールにより得られた渋滞領域とを用いて、当該渋滞領域よりも精度の高い渋滞領域を生成するアテンション計算ブロックと
を備える付記項2又は3に記載の情報処理装置。
(付記項5)
情報処理装置が実行する領域区分方法であって、
上空から撮影された画像を取得する取得ステップと、
ニューラルネットワークのモデルを用いて、前記画像から道路領域と渋滞領域を同時に区分する計算ステップと、
前記計算ステップにより得られた区分結果を出力する出力ステップと
を備える領域区分方法。
(付記項6)
コンピュータを、付記項1ないし4のうちいずれか1項に記載の情報処理装置における各部として機能させるためのプログラムを記憶した非一時的記憶媒体。
【0061】
以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【符号の説明】
【0062】
100 情報処理装置
110 空中写真収集部
120 アルゴリズム計算部
130 出力処理部
140 学習部
210 特徴ピラミッドネットワーク
220 オリジナル交通モジュール
221 畳み込み層
222 融合層
230 コンテキストアテンションモジュール
240 グローバルコンテキスト生成器
250 アテンション計算ブロック
1000 ドライブ装置
1001 記録媒体
1002 補助記憶装置
1003 メモリ装置
1004 CPU
1005 インタフェース装置
1006 表示装置
1007 入力装置
1008 出力装置
図1
図2
図3
図4
図5
図6