(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-05-27
(45)【発行日】2022-06-06
(54)【発明の名称】リモートセンシング画像認識方法、装置、記憶媒体及び電子機器
(51)【国際特許分類】
G06T 7/00 20170101AFI20220530BHJP
G01W 1/08 20060101ALN20220530BHJP
【FI】
G06T7/00 350C
G06T7/00 640
G01W1/08 P
(21)【出願番号】P 2020535252
(86)(22)【出願日】2018-12-26
(86)【国際出願番号】 CN2018123807
(87)【国際公開番号】W WO2019129032
(87)【国際公開日】2019-07-04
【審査請求日】2020-08-12
(31)【優先権主張番号】201711436470.2
(32)【優先日】2017-12-26
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】516158932
【氏名又は名称】ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】李▲聡▼
【審査官】小池 正彦
(56)【参考文献】
【文献】特開2006-107462(JP,A)
【文献】米国特許第06944342(US,B1)
【文献】特表2015-513754(JP,A)
【文献】特開2006-011967(JP,A)
【文献】衛星画像の意味的インデクス付けと知識発見,第41回 人工知能基礎論研究会資料 (SIG-FAI-A001),2000年07月13日
【文献】Mojtaba Seyedhosseini, Mehdi Sajjadi, and Tolga Tasdizen,Image Segmentation with Cascaded Hierarchical Models and Logistic Disjunctive Normal Networks,2013 IEEE International Conference on Computer Vision,米国,IEEE,2013年12月01日,pp.2168-2175,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6751380
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G01W 1/08
(57)【特許請求の範囲】
【請求項1】
リモートセンシング画像
を認識
する方法であって、
前記方法は、
認識対象リモートセンシング画像に対して解像度低減処理を行って、解像度低減処理後のリモートセンシング画像を得るステップと、
前記解像度低減処理後のリモートセンシング画像から、少なくとも1つのリモートセンシング画像ブロックを分割するステップと、
前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するステップと、
ニューラルネットワークを介して前記処理対象リモートセンシング画像ブロックの画素の分類確率情報を取得するステップと、
前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するステップ
と
を含
み、
前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するステップは、
1回目以外での解像度低減処理を実行する場合、処理対象リモートセンシング画像ブロックの数が現在分割されているリモートセンシング画像ブロックの数以下であること、及び/又は、前記認識対象リモートセンシング画像の、今回の解像度低減処理後の画像解像度が前回の解像度低減処理後の画像解像度よりも低いことを含む、方法。
【請求項2】
前記認識対象リモートセンシング画像に対して解像度低減処理を行うステップは、
縮小率集合内の未使用の縮小値に基づいて認識対象リモートセンシング画像に対して解像 度低減処理を行うステップを含む
、請求項1に記載の方法。
【請求項3】
前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するステップは、
縮小率集合に未使用の縮小値が存在しないこと、又は
、前記少なくとも1つのリモートセンシング画像ブロックに処理対象リモートセンシング画像ブロックが存在しないと確定したことに応答して、前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するステップを含む
、請求項2に記載の方法。
【請求項4】
前記縮小率集合は、少なくとも2つの異なる縮小値を含み、且つ
、小さな縮小値は大きな縮小値よりも先に使用される
、請求項2~3のいずれか1項に記載の方法。
【請求項5】
前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するステップは、
1回目での解像度低減処理を実行する場合、すべてのリモートセンシング画像ブロックを処理対象リモートセンシング画像ブロックとするステップを含む
、請求項1~4のいずれか1項に記載の方法。
【請求項6】
1回目以外での解像度低減処理を実行する場合、認識対象リモートセンシング画像の画素の現在の信頼度に基づいて、前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定する
、請求項
1に記載の方法。
【請求項7】
前記認識対象リモートセンシング画像の画素の現在の信頼度に基づいて、前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するステップは、
認識対象リモートセンシング画像に含まれる複数の画素内の少なくとも1つの画素の現在の分類確率情報に基づいて、前記少なくとも1つの画素の現在の信頼度を特定するステップと、
リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域内の、前記少なくとも1つの画素の現在の信頼度が所定信頼度に達した画素数を統計するステップと、
所定信頼度に達した画素数が所定要件を満たさない前記リモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定するステップ
と
を含む
、請求項
6に記載の方法。
【請求項8】
所定信頼度に達した画素数が所定要件を満たさない前記リモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定するステップは、
ある一つのリモートセンシング画像ブロックの所定信頼度に達した画素数と、当該リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域の前記少なくとも1つの画素の数との比が所定比率未満である場合、当該リモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定するステップを含む
、請求項
7に記載の方法。
【請求項9】
前記認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報の取得方式は、
1回目での解像度低減処理を実行する場合、ニューラルネットワークから出力された各処理対象リモートセンシング画像ブロック内の少なくとも1つの画素の分類確率情報を認識対象リモートセンシング画像にマッピングして、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得することを含み、
前記認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報とする
、請求項
7~
8のいずれか1項に記載の方法。
【請求項10】
前記認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報の取得方式は、
1回目以外での解像度低減処理を実行する場合、ニューラルネットワークから出力された各処理対象リモートセンシング画像ブロック内の少なくとも1つの画素の分類確率情報を認識対象リモートセンシング画像にマッピングして、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得することと、
今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新すること
と
を含む
、請求項
7~
9のいずれか1項に記載の方法。
【請求項11】
今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新することは、
今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報と認識対象リモートセンシング画像の対応する画素の現在の分類確率情報との平均値を計算することと、
算出した平均値を利用して、認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新すること
と
を含む
、請求項
10に記載の方法。
【請求項12】
前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するステップは、
認識対象リモートセンシング画像のある一つの画素に対して、当該画素の現在の分類確率情報内の、各カテゴリに属する確率値内の最も大きな確率値を決定し、当該最も大きな確率値及び当該最も大きな確率値に対応するカテゴリを当該画素の認識結果とするステップを含む
、請求項
11に記載の方法。
【請求項13】
前記ニューラルネットワークをトレーニングするリモートセンシング画像サンプルの解像度は、縮小率集合内の各縮小値に基づいてそれぞれリモートセンシング画像に対して解像度低減処理を行って得られた各リモートセンシング画像の解像度を含む
、請求項2~
12のいずれか1項に記載の方法。
【請求項14】
リモートセンシング画像
を認識
する装置であって、
前記装置は、
認識対象リモートセンシング画像に対して解像度低減処理を行って、解像度低減処理後のリモートセンシング画像を得るように構成される解像度低減モジュールと、
前記解像度低減処理後のリモートセンシング画像から、少なくとも1つのリモートセンシング画像ブロックを分割するように構成されるリモートセンシング画像分割モジュールと、
前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するように構成される画像ブロック選択モジュールと、
ニューラルネットワークを介して前記処理対象リモートセンシング画像ブロックの画素の分類確率情報を取得するように構成される分類処理モジュールと、
前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するように構成される認識結果特定モジュール
と
を備え
、
1回目以外での解像度低減処理を実行する場合、前記画像ブロック選択モジュールで決定される処理対象リモートセンシング画像ブロックの数は、前記リモートセンシング画像分割モジュールで現在分割されているリモートセンシング画像ブロックの数以下であり、及び/又は、前記解像度低減モジュールで現在実行している解像度低減の値は、前回に実行した解像度低減の値よりも低い、装置。
【請求項15】
電子機器であって、
前記電子機器は、
コンピュータプログラムを記憶するように構成されるメモリと、
前記メモリに記憶されたコンピュータプログラムを実行
するように構成されるプロセッサ
と
を備え
、
前記プロセッサは、前記コンピュータプログラムが実行されると
、請求項1~
13のいずれか1項に記載の方法を実現するように構成される
、電子機器。
【請求項16】
コンピュータプログラムが記憶されているコンピュータ
読み取り可能な記憶媒体であって
、前記コンピュータプログラムがプロセッサによって実行されると
、請求項1~
13のいずれか1項に記載の方法が実現される
、コンピュータ
読み取り可能な記憶媒体。
【請求項17】
コンピュータプログラムであって、前記コンピュータプログラム
は、機器のプロセッサで実行されると
、請求項1~
13のいずれか1項に記載の方法が実現される、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本願は、2017年12月26日に中国特許庁に出願された、出願番号がCN201711436470.2であり、発明の名称が「リモートセンシング画像認識方法、装置、記憶媒体及び電子機器」である中国特許出願に基づいて優先権を主張し、当該出願の全ての内容をここに援用する。
【0002】
本願はコンピュータ視覚技術に関し、特にリモートセンシング画像認識方法、リモートセンシング画像認識装置、コンピュータ可読記憶媒体及び電子機器に関する。
【背景技術】
【0003】
画像認識、ターゲット検出及び画像分割などの面において、深層学習技術が画期的に進歩し、それに伴い、畳み込みニューラルネットワークはリモートセンシング画像認識の分野で適用されている。
【0004】
リモートセンシング画像認識の過程で、1つの画素の予測結果は通常、当該画素の周辺の一定の領域内にある他の画素によって決められ、当該領域は、畳み込みニューラルネットワークのニューロンの受容野と呼ばれている。
【0005】
畳み込みニューラルネットワークのニューロンの受容野は通常限られており(例えば、数百画素)、それに対してリモートセンシング画像のサイズは通常大きく(例えば、リモートセンシング画像の長さと幅は数千、ひいては数万画素にも達する)、したがって、ニューロンの限られる受容野の原因で十分な環境情報を取得できることがなく、畳み込みニューラルネットワークによるリモートセンシング画像の画素を誤認することに繋がる。
【0006】
如何にニューラルネットワークの計算量が大幅に上昇せずに、できるだけリモートセンシング画像の認識精度を向上させるかは、注目される技術的課題となっている。
【発明の概要】
【発明が解決しようとする課題】
【0007】
本願の実施形態はリモートセンシング画像認識の技術案を提供する。
【課題を解決するための手段】
【0008】
本願の実施形態の一態様によれば、リモートセンシング画像認識方法を提供し、当該方法は主に、認識対象リモートセンシング画像に対して解像度低減処理を行って、解像度低減処理後のリモートセンシング画像を得るステップと、前記解像度低減処理後のリモートセンシング画像から、少なくとも1つのリモートセンシング画像ブロックを分割するステップと、前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するステップと、ニューラルネットワークを介して前記処理対象リモートセンシング画像ブロックの画素の分類確率情報を取得するステップと、前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するステップと、を含む。
【0009】
本願の実施形態の別の態様によれば、リモートセンシング画像認識装置を提供し、当該装置は、認識対象リモートセンシング画像に対して解像度低減処理を行って、解像度低減処理後のリモートセンシング画像を得るように構成される解像度低減モジュールと、前記解像度低減処理後のリモートセンシング画像から、少なくとも1つのリモートセンシング画像ブロックを分割するように構成されるリモートセンシング画像分割モジュールと、前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するように構成される画像ブロック選択モジュールと、ニューラルネットワークを介して前記処理対象リモートセンシング画像ブロックの画素の分類確率情報を取得するように構成される分類処理モジュールと、前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するように構成される認識結果特定モジュールと、を備える。
【0010】
本願の実施形態のさらに別の態様によれば、コンピュータプログラムを記憶するように構成されるメモリと、前記メモリに記憶されたコンピュータプログラムを実行し、且つ前記コンピュータプログラムが実行されるとき、本願のいずれかの実施形態に記載の方法を実現するように構成されるプロセッサと、を備える電子機器を提供する。
【0011】
本願の実施形態のさらに別の態様に係るコンピュータ可読記憶媒体であって、コンピュータプログラムが記憶されており、当該コンピュータプログラムがプロセッサによって実行されるとき、本願のいずれかの実施形態に記載の方法が実現される。
【0012】
本願の実施形態のさらに別の態様に係るコンピュータプログラムであって、当該コンピュータプログラムが機器のプロセッサによって実行されるとき、本願のいずれかの実施形態に記載の方法が実現される。
例えば、本願は以下の項目を提供する。
(項目1)
リモートセンシング画像認識方法であって、
認識対象リモートセンシング画像に対して解像度低減処理を行って、解像度低減処理後のリモートセンシング画像を得るステップと、
前記解像度低減処理後のリモートセンシング画像から、少なくとも1つのリモートセンシング画像ブロックを分割するステップと、
前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するステップと、
ニューラルネットワークを介して前記処理対象リモートセンシング画像ブロックの画素の分類確率情報を取得するステップと、
前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するステップと、を含むことを特徴とする
リモートセンシング画像認識方法。
(項目2)
前記認識対象リモートセンシング画像に対して解像度低減処理を行うステップは、
縮小率集合内の未使用の縮小値に基づいて認識対象リモートセンシング画像に対して解像度低減処理を行うステップを含むことを特徴とする
項目1に記載の方法。
(項目3)
前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するステップは、
縮小率集合に未使用の縮小値が存在しないこと、又は前記少なくとも1つのリモートセンシング画像ブロックに処理対象リモートセンシング画像ブロックが存在しないと確定したことに応答して、前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するステップを含むことを特徴とする
項目2に記載の方法。
(項目4)
前記縮小率集合は、少なくとも2つの異なる縮小値を含み、且つ小さな縮小値は大きな縮小値よりも先に使用されることを特徴とする
項目2~3のいずれか1項に記載の方法。
(項目5)
前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するステップは、
1回目での解像度低減処理を実行する場合、すべてのリモートセンシング画像ブロックを処理対象リモートセンシング画像ブロックとするステップを含むことを特徴とする
項目1~4のいずれか1項に記載の方法。
(項目6)
前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するステップは、
1回目以外での解像度低減処理を実行する場合、処理対象リモートセンシング画像ブロックの数が現在分割されているリモートセンシング画像ブロックの数以下であること、及び/又は、前記認識対象リモートセンシング画像の、今回の解像度低減処理後の画像解像度が前回の解像度低減処理後の画像解像度よりも低いことを含むことを特徴とする
項目1~5のいずれか1項に記載の方法。
(項目7)
1回目以外での解像度低減処理を実行する場合、認識対象リモートセンシング画像の画素の現在の信頼度に基づいて、前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定することを特徴とする
項目6に記載の方法。
(項目8)
前記認識対象リモートセンシング画像の画素の現在の信頼度に基づいて、前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するステップは、
認識対象リモートセンシング画像に含まれる複数の画素内の少なくとも1つの画素の現在の分類確率情報に基づいて、前記少なくとも1つの画素の現在の信頼度を特定するステップと、
リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域内の、前記少なくとも1つの画素の現在の信頼度が所定信頼度に達した画素数を統計するステップと、
所定信頼度に達した画素数が所定要件を満たさない前記リモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定するステップと、を含むことを特徴とする
項目7に記載の方法。
(項目9)
所定信頼度に達した画素数が所定要件を満たさない前記リモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定するステップは、
ある一つのリモートセンシング画像ブロックの所定信頼度に達した画素数と、当該リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域の前記少なくとも1つの画素の数との比が所定比率未満である場合、当該リモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定するステップを含むことを特徴とする
項目8に記載の方法。
(項目10)
前記認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報の取得方式は、
1回目での解像度低減処理を実行する場合、ニューラルネットワークから出力された各処理対象リモートセンシング画像ブロック内の少なくとも1つの画素の分類確率情報を認識対象リモートセンシング画像にマッピングして、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得することを含み、
前記認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報とすることを特徴とする
項目8~9のいずれか1項に記載の方法。
(項目11)
前記認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報の取得方式は、
1回目以外での解像度低減処理を実行する場合、ニューラルネットワークから出力された各処理対象リモートセンシング画像ブロック内の少なくとも1つの画素の分類確率情報を認識対象リモートセンシング画像にマッピングして、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得することと、
今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新することと、を含むことを特徴とする
項目8~10のいずれか1項に記載の方法。
(項目12)
今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新することは、
今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報と認識対象リモートセンシング画像の対応する画素の現在の分類確率情報との平均値を計算することと、
算出した平均値を利用して、認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新することと、を含むことを特徴とする
項目11に記載の方法。
(項目13)
前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するステップは、
認識対象リモートセンシング画像のある一つの画素に対して、当該画素の現在の分類確率情報内の、各カテゴリに属する確率値内の最も大きな確率値を決定し、当該最も大きな確率値及び当該最も大きな確率値に対応するカテゴリを当該画素の認識結果とするステップを含むことを特徴とする
項目12に記載の方法。
(項目14)
前記ニューラルネットワークをトレーニングするリモートセンシング画像サンプルの解像度は、縮小率集合内の各縮小値に基づいてそれぞれリモートセンシング画像に対して解像度低減処理を行って得られた各リモートセンシング画像の解像度を含むことを特徴とする
項目2~13のいずれか1項に記載の方法。
(項目15)
リモートセンシング画像認識装置であって、
認識対象リモートセンシング画像に対して解像度低減処理を行って、解像度低減処理後のリモートセンシング画像を得るように構成される解像度低減モジュールと、
前記解像度低減処理後のリモートセンシング画像から、少なくとも1つのリモートセンシング画像ブロックを分割するように構成されるリモートセンシング画像分割モジュールと、
前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定するように構成される画像ブロック選択モジュールと、
ニューラルネットワークを介して前記処理対象リモートセンシング画像ブロックの画素の分類確率情報を取得するように構成される分類処理モジュールと、
前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するように構成される認識結果特定モジュールと、を備えることを特徴とする
リモートセンシング画像認識装置。
(項目16)
前記解像度低減モジュールは、
縮小率集合内の未使用の縮小値に基づいて認識対象リモートセンシング画像に対して解像度低減処理を行うように構成されることを特徴とする
項目15に記載の装置。
(項目17)
前記認識結果特定モジュールは、
縮小率集合に未使用の縮小値が存在しないこと、又は前記少なくとも1つのリモートセンシング画像ブロックに処理対象リモートセンシング画像ブロックが存在しないと確定したことに応答して、前記処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定するように構成されることを特徴とする
項目16に記載の装置。
(項目18)
前記縮小率集合は、少なくとも2つの異なる縮小値を含み、且つ小さな縮小値は大きな縮小値よりも先に使用されることを特徴とする
項目16~17のいずれか1項に記載の装置。
(項目19)
前記画像ブロック選択モジュールは、
1回目での解像度低減処理を実行する場合、すべてのリモートセンシング画像ブロックを処理対象リモートセンシング画像ブロックとするように構成されることを特徴とする
項目15~18のいずれか1項に記載の装置。
(項目20)
1回目以外での解像度低減処理を実行する場合、画像ブロック選択モジュールで決定される処理対象リモートセンシング画像ブロックの数は、リモートセンシング画像分割モジュールで現在分割されているリモートセンシング画像ブロックの数以下であり、且つ解像度低減モジュールで現在実行している解像度低減の値は、前回に実行した解像度低減の値よりも大きいことを特徴とする
項目15~19のいずれか1項に記載の装置。
(項目21)
1回目以外での解像度低減処理を実行する場合、画像ブロック選択モジュールは、認識対象リモートセンシング画像の画素の現在の信頼度に基づいて、前記少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定することを特徴とする
項目20に記載の装置。
(項目22)
前記画像ブロック選択モジュールは、
認識対象リモートセンシング画像に含まれる複数の画素内の少なくとも1つの画素の現在の分類確率情報に基づいて、前記少なくとも1つの画素の現在の信頼度を特定するように構成される第1ユニットと、
リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域内の、前記少なくとも1つの画素の現在の信頼度が所定信頼度に達した画素数を統計するように構成される第2ユニットと、
所定信頼度に達した画素数が所定要件を満たさない前記リモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定するように構成される第3ユニットと、を備えることを特徴とする
項目21に記載の装置。
(項目23)
前記第3ユニットは、ある一つのリモートセンシング画像ブロックの所定信頼度に達した画素数と、当該リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域の前記少なくとも1つの画素の数との比が所定比率未満である場合、当該リモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定するように構成されることを特徴とする
項目22に記載の装置。
(項目24)
前記画像ブロック選択モジュールは、
1回目での解像度低減処理を実行する場合、ニューラルネットワークから出力された各処理対象リモートセンシング画像ブロック内の少なくとも1つの画素の分類確率情報を認識対象リモートセンシング画像にマッピングして、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得するように構成される第4ユニットをさらに備え、
前記認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報とすることを特徴とする
項目22~23のいずれか1項に記載の装置。
(項目25)
前記画像ブロック選択モジュールは、
1回目以外での解像度低減処理を実行する場合、ニューラルネットワークから出力された各処理対象リモートセンシング画像ブロック内の少なくとも1つの画素の分類確率情報を認識対象リモートセンシング画像にマッピングして、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得するように構成される第5ユニットと、
今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新するように構成される第6ユニットと、をさらに備えることを特徴とする
項目22~23のいずれか1項に記載の装置。
(項目26)
前記第6ユニットは、
今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報と認識対象リモートセンシング画像の対応する画素の現在の分類確率情報との平均値を計算し、
算出した平均値を利用して、認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新する、ように構成されることを特徴とする
項目25に記載の装置。
(項目27)
前記認識結果特定モジュールは、
認識対象リモートセンシング画像のある一つの画素に対して、当該画素の現在の分類確率情報内の、各カテゴリに属する確率値内の最も大きな確率値を決定し、当該最も大きな確率値及び当該最も大きな確率値に対応するカテゴリを当該画素の認識結果とするように構成されることを特徴とする
項目26に記載の装置。
(項目28)
前記装置は、
リモートセンシング画像サンプルを利用してトレーニング対象ニューラルネットワークをトレーニングするように構成されるトレーニングモジュールをさらに備え、
前記リモートセンシング画像サンプルの解像度は、縮小率集合内の各縮小値に基づいてそれぞれリモートセンシング画像に対して解像度低減処理を行って得られた各リモートセンシング画像の解像度を含むことを特徴とする
項目16~27のいずれか1項に記載の装置。
(項目29)
電子機器であって、
コンピュータプログラムを記憶するように構成されるメモリと、
前記メモリに記憶されたコンピュータプログラムを実行し、且つ前記コンピュータプログラムが実行されるとき、項目1~15のいずれか1項に記載の方法を実現するように構成されるプロセッサと、を備える、電子機器。
(項目30)
コンピュータ可読記憶媒体であって、コンピュータプログラムが記憶されており、当該コンピュータプログラムがプロセッサによって実行されるとき、上記項目1~15のいずれか1項に記載の方法が実現される、コンピュータ可読記憶媒体。
(項目31)
コンピュータプログラムであって、前記コンピュータプログラムが機器のプロセッサで実行されるとき、上記項目1~15のいずれか1項に記載の方法が実現される、コンピュータプログラム。
【発明の効果】
【0013】
本願に係るリモートセンシング画像認識方法、リモートセンシング画像認識装置、電子機器、コンピュータプログラム及びコンピュータ可読記憶媒体によれば、本願は、解像度低減処理後のリモートセンシング画像からリモートセンシング画像ブロックを選択して、ニューラルネットワークに入力することで、解像度低減処理ごとに、分割したすべてのリモートセンシング画像ブロックをニューラルネットワークに入力することによりニューラルネットワークの計算量が多くなるという現象を回避する。
【0014】
以下、図面及び実施形態によって、本願の技術案をさらに詳細に説明する。
【図面の簡単な説明】
【0015】
【
図1】本願に係るリモートセンシング画像認識方法の一実施形態のフローチャートである。
【
図2】本願に係るリモートセンシング画像認識方法の別の実施形態のフローチャートである。
【
図3】本願に係る認識対象リモートセンシング画像の画素の現在の信頼度に基づいてリモートセンシング画像ブロックを選択する一実施形態のフローチャートである。
【
図4】本願に係る認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報をメンテナンスする一実施形態のフローチャートである。
【
図5】本願に係るリモートセンシング画像認識装置の一実施形態の模式図である。
【
図6】本願の実施形態を実現する例示的な機器のブロック図である。
【発明を実施するための形態】
【0016】
明細書の一部を構成する図面は、本願の実施形態を説明し、その説明とともに本願の原理を解釈するために用いられる。
【0017】
図面を参照して、以下の詳細な説明から本願をより明確に理解することができる。
【0018】
ここで、図面を参照して本願の様々な例示的な実施形態を詳細に説明する。なお、特に断らない限り、これらの実施形態に記載の部材及びステップの相対的な配置、数値表現及び数値は本願の範囲を制限しない。
【0019】
また、説明の便宜上、図面に示される各部分のサイズが実際の縮尺関係で描かれていないことは理解されるべきである。
【0020】
少なくとも1つの例示的な実施形態の以下の説明は、例示的なものに過ぎず、本願及びその応用又は使用を制限するためのものではない。
【0021】
当業者に知られている技術、方法及び機器は詳細に検討されないかもしれないが、適切な場合、前記技術、方法及び機器は明細書の一部と見なされるべきである。
【0022】
なお、以下の図面では、同様の符号及び文字は同様のものを示し、したがって、あるものがある図面で定義されると、以降の図面でさらに検討する必要はない。
【0023】
本願の実施形態は、多くの他の汎用又は専用コンピューティングシステム環境又は構成とともに操作できる端末機器、コンピュータシステム、サーバなどの電子機器に適用され得る。端末機器、コンピュータシステム、サーバなどの電子機器との使用に適した周知のコンピューティングシステム、環境及び/又は構成の例は、パーソナルコンピュータシステム、サーバコンピュータシステム、シンクライアント、シッククライアント、ハンドヘルド又はラップトップ機器、マイクロプロセッサベースのシステム、セットトップボックス、プログラマブルコンシューマエレクトロニクス、ネットワークパーソナルコンピュータ、小型コンピュータシステム、大型コンピュータシステム、及び上記いずれかのシステムを含む分散型クラウドコンピューティング技術環境などを含むが、それらに限定されない。
【0024】
端末機器、コンピュータシステム、サーバなどの電子機器は、コンピュータシステムによって実行されるコンピュータシステム実行可能命令(例えば、プログラムモジュール)の一般的な言語環境において説明できる。通常、プログラムモジュールは、ルーチン、プログラム、ターゲットプログラム、コンポーネント、ロジック及びデータ構造などを含んでもよく、それらは特定のタスクを実行するか又は特定の抽象データ型を実現する。コンピュータシステム/サーバは分散型クラウドコンピューティング環境で実施することができ、分散型クラウドコンピューティング環境では、タスクは通信ネットワークを介してリンクされた遠隔処理機器によって実行される。分散型クラウドコンピューティング環境では、プログラムモジュールは、記憶機器を含むローカル又はリモートコンピューティングシステムの記憶媒体に配置してもよい。
【0025】
例示的な実施例
本願に係るリモートセンシング画像認識を実現するための技術案は、シングルチップマイクロコンピュータ、FPGA(FieldProgrammable Gate Array:フィールドプログラマブルゲートアレイ)、マイクロプロセッサ、スマート携帯電話、ノートパソコン、タブレットパソコン、デスクトップコンピュータ又はサーバなどのコンピュータプログラム(プログラムコードとも呼称される)を実行できる電子機器によって実現でき、当該コンピュータプログラムは、フラッシュメモリ、キャッシュ、ハードディスク又は光ディスクなどのコンピュータ可読記憶媒体に記憶できる。
【0026】
以下、
図1~
図7を参照しながら本願に係るリモートセンシング画像認識を実現するための技術案を説明する。
【0027】
図1は本願に係るリモートセンシング画像認識方法の一実施形態のフローチャートである。
図1に示すように、本実施形態のリモートセンシング画像認識方法は主に、操作S100、操作S110、操作S120、操作S130及び操作S140を含む。以下、本願の各操作を詳細に説明する。
【0028】
S100、認識対象リモートセンシング画像に対して解像度低減処理を行って、解像度低減処理後のリモートセンシング画像を得る。
【0029】
選択可能な例では、本願は複数の方式で認識対象リモートセンシング画像に対して解像度低減処理を行うことができ、例えば、本願では縮小率集合が予め設定されており、当該縮小率集合は、少なくとも2つの異なる縮小値を含み、本願は、縮小率集合から1つの未使用の縮小値を選択し、選択した縮小値に基づいて、認識対象リモートセンシング画像に対して解像度低減処理を行ってもよい。また、本願は未使用の縮小値を選択するとき、通常、未使用の最も小さな縮小値を優先に選択する。さらに、本願はプーリング処理又はダウンサンプリング処理などの方式で認識対象リモートセンシング画像に対して解像度低減処理を行ってもよい。本願は認識対象リモートセンシング画像に対して解像度低減処理を行う実現方式を制限しない。
【0030】
選択可能な例では、S100は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する解像度低減モジュール500によって実行されてもよい。
【0031】
S110、解像度低減処理後のリモートセンシング画像から、少なくとも1つのリモートセンシング画像ブロックを分割する。
【0032】
選択可能な例では、本願は、通常、ニューラルネットワークの入力画像サイズにする要求に応じて、解像度低減処理して得られたリモートセンシング画像を複数のリモートセンシング画像ブロックに分割し、分割されたすべてのリモートセンシング画像ブロックのサイズは通常、完全に同じである。分割された各リモートセンシング画像ブロックはそれぞれ認識対象リモートセンシング画像の1つの領域に対応し、異なるリモートセンシング画像ブロックは異なる領域に対応する。リモートセンシング画像ブロックに対応する領域のサイズは、通常、縮小値及びニューラルネットワークの入力画像サイズにする要求に関係しており、一例としては、ニューラルネットワークの入力画像サイズにする要求が561×561であり、且つ解像度低減処理が解像度を半分低減するという処理である場合、本願が分割したリモートセンシング画像ブロックに対応する認識対象リモートセンシング画像の領域のサイズは1122×1122であり、例えば、分割された1番目のリモートセンシング画像ブロックは認識対象リモートセンシング画像の左上隅1122×1122サイズの領域に対応し、分割された最後のリモートセンシング画像ブロックは認識対象リモートセンシング画像の右下隅1122×1122サイズの領域に対応する。本願は、分割されたリモートセンシング画像ブロックの数及びリモートセンシング画像ブロックのサイズを制限しない。
【0033】
選択可能な例では、S101は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行するリモートセンシング画像分割モジュール510によって実行されてもよい。
【0034】
S120、少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定する。
【0035】
選択可能な例では、1回目での解像度低減処理を実行する場合、本願は、すべてのリモートセンシング画像ブロックを処理対象リモートセンシング画像ブロックとし、1回目以外での解像度低減処理を実行する場合、決定した処理対象リモートセンシング画像ブロックの数は、通常、現在分割しているすべてのリモートセンシング画像ブロックの数未満である。
【0036】
選択可能な例では、1回目以外での解像度低減処理を実行する場合、本願は、認識対象リモートセンシング画像の画素の現在の信頼度に基づいて、分割した少なくとも1つのリモートセンシング画像ブロックを選択し、選択したリモートセンシング画像ブロックは、処理対象リモートセンシング画像ブロックである。選択可能な例では、本願は、まず、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報に基づいて、少なくとも1つの画素の現在の信頼度を特定し、例えば、認識対象リモートセンシング画像のある画素に対して、当該画素の最も大きな分類確率値と2番目大きな分類確率値との比を計算し、算出した当該比率を当該画素の現在の信頼度とし、当該処理によって認識対象リモートセンシング画像のすべての画素の現在の信頼度を取得することができる。次に、リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域で画素の現在の信頼度が所定信頼度に達した画素数を統計し、所定信頼度に達した画素数が所定要件を満たさないリモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定し、例えば、ある一つのリモートセンシング画像ブロックの所定信頼度に達した画素数と、当該リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域のすべての画素の数との比が所定比率未満である場合、当該リモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定することができる。
【0037】
選択可能な例では、本願は、下記2つの方式で認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報を取得することができる。
【0038】
方式1、1回目での解像度低減処理を実行する場合、ニューラルネットワークから出力された各処理対象リモートセンシング画像ブロック内の少なくとも1つの画素の分類確率情報を認識対象リモートセンシング画像にマッピングして、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得する。本願は、現在得られた認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報とすることができる。
【0039】
方式2、1回目以外での解像度低減処理を実行する場合、ニューラルネットワークから出力された各処理対象リモートセンシング画像ブロック内の少なくとも1つの画素の分類確率情報を認識対象リモートセンシング画像にマッピングして、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得し、今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報に基づいて、認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新し、例えば、今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報と認識対象リモートセンシング画像の対応する画素の現在の分類確率情報との平均値を計算し、算出した平均値を利用して、認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新する。更新処理後に、本願は、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報を得る。
【0040】
選択可能な例では、S102は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する画像ブロック選択モジュール520によって実行されてもよい。
【0041】
S130、ニューラルネットワークを介して処理対象リモートセンシング画像ブロックの画素の分類確率情報を取得する。
【0042】
選択可能な例では、本願のニューラルネットワークは畳み込みニューラルネットワークであってもよく、本願はニューラルネットワークの表現形態を制限しない。本願は、認識対象リモートセンシング画像に対して解像度低減処理を行って、解像度低減処理後のリモートセンシング画像内の処理対象画像ブロックをニューラルネットワークに入力することで、ニューラルネットワークのニューロンの受容野を向上させるのに有利であり、それにより、ニューラルネットワークによるリモートセンシング画像の画素の誤認を回避するのに有利である。
【0043】
選択可能な例では、本願のニューラルネットワークは複数の異なる解像度を有するリモートセンシング画像サンプルを利用してトレーニングして得られたものである。例えば、すべてのリモートセンシング画像サンプルの各自の解像度は、縮小率集合内の各縮小値にそれぞれ対応する解像度に属する。一例としては、縮小率集合が第1縮小値、第2縮小値及び第3縮小値を含み、第1縮小値が第1解像度に対応し、第2縮小値が第2解像度に対応し、第3縮小値が第3解像度に対応するとした場合、本願は、第1解像度を有するリモートセンシング画像サンプル、第2解像度を有するリモートセンシング画像サンプル及び第3解像度を有するリモートセンシング画像サンプルを利用して、トレーニング対象ニューラルネットワークをトレーニングすることができ、トレーニングに成功したニューラルネットワークは、本願のリモートセンシング画像認識に使用できる。
【0044】
選択可能な例では、S103は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する分類処理モジュール530によって実行されてもよい。
【0045】
S140、処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、認識対象リモートセンシング画像の認識結果を特定する。
【0046】
選択可能な例では、本願は、縮小率集合に未使用の縮小値が存在しないこと、又は少なくとも1つのリモートセンシング画像ブロックから、処理対象リモートセンシング画像ブロックを決定できないことに応答して、処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、認識対象リモートセンシング画像の認識結果を特定するという操作を実行し、例えば、認識対象リモートセンシング画像のある一つの画素に対して、当該画素の現在の分類確率情報内の、各カテゴリに属する確率値内の最も大きな確率値を決定し、当該最も大きな確率値及び当該最も大きな確率値に対応するカテゴリを当該画素の認識結果とする。
【0047】
選択可能な例では、S104は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する認識結果特定モジュール540によって実行されてもよい。
【0048】
図2は本願に係るリモートセンシング画像認識方法の別の実施形態のフローチャートである。
【0049】
図2に示すように、本実施形態のリモートセンシング画像認識方法は主に、操作S200、操作S210、操作S220及び操作S230を含む。
【0050】
S200、縮小率集合内の未使用の最も小さな縮小値に基づいて、認識対象リモートセンシング画像に対して解像度低減処理を行う。
【0051】
選択可能な例では、縮小率集合は複数の縮小値からなり、各縮小値の値はいずれも0より大きく且つ1以下である。通常、縮小率集合は少なくとも2つの縮小値を含み、選択可能な例では、Sr=[0.25、0.5、1.0]とし、Srは縮小率集合を示し、0.25、0.5及び1は縮小率集合内の縮小値であり、0.25は、認識対象リモートセンシング画像の解像度を元の解像度の4分の1に低減させることを示し、0.5は、認識対象リモートセンシング画像の解像度を元の解像度の2分の1に低減させることを示し、1は、認識対象リモートセンシング画像の解像度を示す。本実施例では、1は特別な縮小値であり、例えば、認識対象リモートセンシング画像を元の解像度に維持する縮小値と見なされる。本願は、縮小率集合に含まれる縮小値の大きさ及び含まれる縮小値の数を制限しない。
【0052】
選択可能な例では、本願は小から大の順で縮小値を並べ、毎回縮小率集合から1つの縮小値を選択し、選択した縮小値に基づいて認識対象リモートセンシング画像に対して解像度低減処理を行う。選択された縮小値は使用済みの縮小値になる。
【0053】
選択可能な例では、S200は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する解像度低減モジュール500によって実行されてもよい。
【0054】
S210、解像度低減処理後のリモートセンシング画像を少なくとも1つのリモートセンシング画像ブロックに分割する。
【0055】
選択可能な例では、本願は、通常、ニューラルネットワークの入力画像サイズにする要求に応じて、解像度低減処理して得られたリモートセンシング画像を複数のリモートセンシング画像ブロックに分割し、分割されたすべてのリモートセンシング画像ブロックのサイズは通常、完全に同じである。分割された各リモートセンシング画像ブロックはそれぞれ認識対象リモートセンシング画像の1つの領域に対応し、異なるリモートセンシング画像ブロックは異なる領域に対応する。リモートセンシング画像ブロックに対応する領域のサイズは通常、縮小値及びニューラルネットワークの入力画像サイズにする要求に関係しており、一例としては、ニューラルネットワークの入力画像サイズにする要求が561×561であり、且つ解像度低減処理が解像度を半分低減させるという処理である場合、本願が分割したリモートセンシング画像ブロックに対応する認識対象リモートセンシング画像の領域のサイズは1122×1122であり、例えば、分割された1番目のリモートセンシング画像ブロックは認識対象リモートセンシング画像の左上隅1122×1122サイズの領域に対応し、分割された最後のリモートセンシング画像ブロックは認識対象リモートセンシング画像の右下隅1122×1122サイズの領域に対応する。本願は、分割されたリモートセンシング画像ブロックの数及びリモートセンシング画像ブロックのサイズを制限しない。
【0056】
選択可能な例では、S201は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行するリモートセンシング画像分割モジュール510によって実行されてもよい。
【0057】
S220、認識対象リモートセンシング画像の画素の現在の信頼度に基づいて、少なくとも1つのリモートセンシング画像ブロックからリモートセンシング画像ブロックを選択し、ニューラルネットワークを介して、選択した各リモートセンシング画像ブロックの少なくとも1つの画素の分類確率情報を取得する。選択したリモートセンシング画像ブロックは上記処理対象リモートセンシング画像ブロックである。
【0058】
選択可能な例では、1回目での解像度低減処理を実行する場合、本願は通常、分割したすべてのリモートセンシング画像ブロックを、選出するリモートセンシング画像ブロックとする。本願では、1回目での解像度低減処理を実行する場合、認識対象リモートセンシング画像の画素の現在の信頼度が0に初期化されていると見なすことが可能であり、したがって、分割されたすべてのリモートセンシング画像ブロックが選択され、それぞれニューラルネットワークに入力され、それにより、ニューラルネットワークを介して、今回分割したすべてのリモートセンシング画像ブロックのすべての画素の分類確率情報を取得することができ、今回取得したすべてのリモートセンシング画像ブロックのすべての画素の分類確率情報は、認識対象リモートセンシング画像の画素の現在の信頼度を更新することに使用できる。選択可能な例では、本願のニューラルネットワークがC個のカテゴリに対して分類処理を行うことができるとし、各リモートセンシング画像ブロックがそれぞれニューラルネットワークを経由した後、本願は、すべてのリモートセンシング画像ブロックのすべての画素がそれぞれC個のカテゴリに対する分類確率情報を取得することができる。
【0059】
選択可能な例では、1回目以外での解像度低減処理を実行する場合、本願は通常、認識対象リモートセンシング画像の画素の現在の信頼度に基づいて、今回分割したすべてのリモートセンシング画像ブロックからリモートセンシング画像ブロックを選択する。なお、今回選択したリモートセンシング画像ブロックは、今回分割したリモートセンシング画像ブロックの全てである可能性があり、今回分割したすべてのリモートセンシング画像ブロック内のリモートセンシング画像ブロックの一部である可能性もあり、勿論、今回分割したすべてのリモートセンシング画像ブロックから、いずれかのリモートセンシング画像ブロックを選出することができない可能性もある。
【0060】
本願は、認識対象リモートセンシング画像に対して解像度低減処理を行い、解像度低減処理後のリモートセンシング画像の画像ブロックをニューラルネットワーク(例えば、畳み込みニューラルネットワーク)に入力することで、ニューラルネットワーク(例えば、畳み込みニューラルネットワーク)のニューロンの受容野を向上させるのに有利であり、それにより、ニューラルネットワークによるリモートセンシング画像の画素の誤認を回避するのに有利である。
【0061】
選択可能な例では、S202は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する画像ブロック選択モジュール520及び分類処理モジュール530によって実行されてもよい。
【0062】
本願が認識対象リモートセンシング画像の画素の現在の信頼度に基づいてリモートセンシング画像ブロック(即ち、処理対象リモートセンシング画像ブロック)を選択する選択可能な例は、
図3に示される。
【0063】
図3では、300、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報に基づいて、少なくとも1つの画素の現在の信頼度を特定する。
【0064】
選択可能な例では、本願において認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報は、過去数回に入力された少なくとも1つのリモートセンシング画像ブロックに対してニューラルネットワークが出力したリモートセンシング画像ブロックの少なくとも1つの画素の分類確率情報に基づき、形成されたものである。本願は、毎回の解像度低減処理の実行過程で、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報をメンテナンスする必要がある(例えば、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報を更新する)。本願が認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報をメンテナンスする方式は、下記
図4の説明を参照できる。
【0065】
選択可能な例では、認識対象リモートセンシング画像のいずれかの画素(i,j)に対して、本願は、認識対象リモートセンシング画像の当該画素(i,j)の現在の分類確率情報に基づいて当該画素(i,j)の現在信頼度を特定する方式は、以下の通りである。ニューラルネットワークがリモートセンシング画像からC個のカテゴリを認識できると設定し、画素(i,j)の現在の分類確率情報がC個の確率値を含むことができ、本願は、このC個の確率値から、最も大きな確率値と2番目大きな確率値(即ち、2番目大きな確率値)を選択し、選択した最も大きな分類確率値と2番目大きな分類確率値との比を計算し、本願は当該比率を当該画素(i,j)の現在信頼度とすることができる。本願は、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報に基づいて、他の方式で認識対象リモートセンシング画像の少なくとも1つの画素の現在の信頼度を特定してもよく、本願は認識対象リモートセンシング画像の少なくとも1つの画素の現在の信頼度を特定する方式を制限しない。
【0066】
選択可能な例では、S300は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する第1ユニットによって実行されてもよい。
【0067】
310、リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域内の、少なくとも1つの画素の現在の信頼度が所定信頼度に達した画素数を統計する。
【0068】
選択可能な例では、本願の所定信頼度の大きさは実際の必要に応じて設定することができ、例えば、所定信頼度は4として設定することができる。前の例に続き、リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像の領域のサイズが1122×1122である場合、1つのリモートセンシング画像ブロックに対しては、本願は、1122×1122個の画素の現在の信頼度に対してそれぞれ所定信頼度に達したか否かの判断を行うことができ、それにより、所定信頼度に達した画素数を統計することができる。
【0069】
選択可能な例では、S301は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する第2ユニットによって実行されてもよい。
【0070】
320、所定信頼度に達した画素数が所定要件を満たさないリモートセンシング画像ブロックを、選出するリモートセンシング画像ブロックとする。
【0071】
選択可能な例では、いずれかのリモートセンシング画像ブロックに対して言えば、当該リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域内の所定信頼度に達した画素数と、当該領域の少なくとも1つの画素の数との比が所定比率に達しない場合、当該リモートセンシング画像ブロックを、選出するリモートセンシング画像ブロックとして、ニューラルネットワークに入力することができ、それにより、当該ニューラルネットワークを介して当該リモートセンシング画像ブロックの少なくとも1つの画素の分類確率情報を取得する。上記比が所定比率に達する場合、当該リモートセンシング画像ブロックをニューラルネットワークに入力する必要がない。本願の所定比率は実際の必要に応じて設定することができ、例えば、当該所定比率は0.97などとして設定することができる。
【0072】
また、本願は他の方式で所定要件を満たさないリモートセンシング画像ブロックを特定してもよく、例えば、当該リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域内の所定信頼度に達した画素数と当該領域内の所定信頼度に達しない画素数との差が所定差に達すると判断した場合、当該リモートセンシング画像ブロックを、選出するリモートセンシング画像ブロックとして、ニューラルネットワークに入力することができ、そうでない場合は、当該リモートセンシング画像ブロックをニューラルネットワークに入力する必要がない。また例えば、当該リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域内の所定信頼度に達した画素数と当該領域内の所定信頼度に達しない画素数との比が所定比率に達しないと判断した場合、当該リモートセンシング画像ブロックを、選出するリモートセンシング画像ブロックとして、ニューラルネットワークに入力することができ、そうでない場合は、当該リモートセンシング画像ブロックをニューラルネットワークに入力する必要がない。本願は所定要件を満たさないリモートセンシング画像ブロックを特定する実現方式を制限しない。
【0073】
選択可能な例では、S302は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する第3ユニットによって実行されてもよい。
【0074】
本願が認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報をメンテナンスする例は、
図4に示される。
【0075】
図4では、S400、本願のリモートセンシング画像認識方法を開始する。選択可能に、本願は、リモートセンシング画像認識方法の開始時に、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報を初期化することができ、例えば、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報をいずれも0として設定する。勿論、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報に対して初期化操作を実行しないことも完全に可能である。
【0076】
本願の1回目での解像度低減処理を実行する場合、操作S410の実行をトリガーする。
【0077】
本願の解像度低減処理の実行が1回目でなく、2回目又は3回目などである場合、操作S440の実行をトリガーする。
【0078】
S410、今回解像度低減処理後のリモートセンシング画像から分割されたすべてのリモートセンシング画像ブロックをニューラルネットワークに入力し、それにより、分割されたすべてのリモートセンシング画像に対してニューラルネットワークがそれぞれ各リモートセンシング画像ブロックの少なくとも1つの画素の分類確率情報を出力する。操作S420に進む。
【0079】
S420、ニューラルネットワークから出力された各リモートセンシング画像ブロックの少なくとも1つの画素の分類確率情報をそれぞれ認識対象リモートセンシング画像にマッピングし、それにより、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得する。操作S430に進む。
【0080】
選択可能な例では、本願の1回目での解像度低減処理を実行する場合、ニューラルネットワークから出力された各リモートセンシング画像ブロックのすべての画素の分類確率情報に基づいて得られた認識対象リモートセンシング画像のいずれかの画素(i,j)の分類確率情報
【0081】
【0082】
として示すことができる。
【0083】
ただし、
【0084】
【0085】
の上付き文字の1は解像度低減処理の実行が1回目であることを示し、Cはニューラルネットワークが分類するカテゴリ数を示し、
【0086】
【0087】
は1回目での解像度低減処理を実行する場合、認識対象リモートセンシング画像のいずれかの画素(i,j)が第1カテゴリに属する分類確率情報を示し、
【0088】
【0089】
は1回目での解像度低減処理を実行する場合、認識対象リモートセンシング画像のいずれかの画素(i,j)が第2カテゴリに属する分類確率情報を示し、
【0090】
【0091】
は1回目での解像度低減処理を実行する場合、認識対象リモートセンシング画像のいずれかの画素(i,j)が第Cカテゴリに属する分類確率情報を示す。
【0092】
S430、今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を、認識対象リモートセンシング画像の対応する画素の現在の分類確率情報とし、例えば、認識対象リモートセンシング画像のいずれかの画素(i,j)の現在の分類確率情報は、
【0093】
【0094】
である。
【0095】
選択可能な例では、S420及びS430は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する第4ユニットによって実行されてもよい。
【0096】
S440、今回解像度低減処理後のリモートセンシング画像から分割されたすべてのリモートセンシング画像ブロックから、リモートセンシング画像ブロックを選択し、選択したリモートセンシング画像ブロックをニューラルネットワークに入力する。操作S450に進む。
【0097】
本願がリモートセンシング画像ブロックを選択する過程の例は上記
図3の説明を参照でき、ここで繰り返し説明しない。
【0098】
S450、ニューラルネットワークから出力された各リモートセンシング画像ブロックの少なくとも1つの画素の分類確率情報をそれぞれ認識対象リモートセンシング画像にマッピングし、それにより、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得する。操作S460に進む。
【0099】
選択可能な例では、本願の解像度低減処理の実行がn回目(nが1より大きい)である場合、ニューラルネットワークから出力された各リモートセンシング画像ブロックのすべての画素の分類確率情報に基づいて得られた認識対象リモートセンシング画像のいずれかの画素(i,j)の分類確率情報
【0100】
【0101】
として示すことができる。
【0102】
ただし、
【0103】
【0104】
の上付き文字のnは解像度低減処理の実行がn回目であることを示し、Cはニューラルネットワークが分類するカテゴリ数を示し、
【0105】
【0106】
は解像度低減処理の実行がn回目である場合、認識対象リモートセンシング画像のいずれかの画素(i,j)が第1カテゴリに属する分類確率情報を示し、
【0107】
【0108】
は解像度低減処理の実行がn回目である場合、認識対象リモートセンシング画像のいずれかの画素(i,j)が第2カテゴリに属する分類確率情報を示し、
【0109】
【0110】
は解像度低減処理の実行がn回目である場合、認識対象リモートセンシング画像のいずれかの画素(i,j)が第Cカテゴリに属する分類確率情報を示す。なお、認識対象リモートセンシング画像の画素(i,j)が、今回解像度低減処理過程で選択したリモートセンシング画像ブロックの、認識対象リモートセンシング画像の領域にマッピングする画素に属する場合、
【0111】
【0112】
はニューラルネットワークから出力された対応する画素の分類確率情報であるが、画素(i,j)が、今回解像度低減処理過程で選択したリモートセンシング画像ブロックの、認識対象リモートセンシング画像の領域にマッピングする画素に属しない場合、本願は
【0113】
【0114】
を0として設定することができる。
【0115】
選択可能な例では、S450は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する第5ユニットによって実行されてもよい。
【0116】
S460、今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を利用して、認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新する。
【0117】
選択可能な例では、解像度低減処理の実行が1回目でなく、2回目又は3回目などである場合、本願は、過去数回にそれぞれ取得した各処理対象リモートセンシング画像ブロック内のすべての画素の分類確率情報を累積することで、認識対象リモートセンシング画像のすべての画素の現在の分類確率情報を得る。
【0118】
1回目での解像度低減処理を実行する場合、本願が取得した認識対象リモートセンシング画像のいずれかの画素(i,j)の分類確率情報が
【0119】
【0120】
であるとし、それにより、本願は、
【0121】
【0122】
を、認識対象リモートセンシング画像のいずれかの画素(i,j)の現在の分類確率情報
【0123】
【0124】
として記録する。
【0125】
解像度低減処理の実行が2回目である場合、本願がニューラルネットワークに基づき取得した認識対象リモートセンシング画像のいずれかの画素(i,j)の分類確率情報は、
【0126】
【0127】
として示すことができ、認識対象リモートセンシング画像の画素(i,j)が、2回目の解像度低減処理過程で選択したリモートセンシング画像ブロックの、認識対象リモートセンシング画像の領域にマッピングする画素に属する場合、
【0128】
【0129】
はニューラルネットワークから出力された対応する画素の分類確率情報であるが、認識対象リモートセンシング画像の画素(i,j)が、2回目の解像度低減処理過程で選択したリモートセンシング画像ブロックの、認識対象リモートセンシング画像の領域にマッピングする画素に属しない場合、
【0130】
【0131】
は0であり、本願は、0でない
【0132】
【0133】
に対して、
【0134】
【0135】
との平均値を計算し、算出した平均値を利用して、認識対象リモートセンシング画像の対応する画素(i,j)の現在の分類確率情報
【0136】
【0137】
を更新する。
【0138】
解像度低減処理の実行が3回目である場合、本願がニューラルネットワークに基づき取得した認識対象リモートセンシング画像のいずれかの画素(i,j)の分類確率情報は、
【0139】
【0140】
として示すことができ、認識対象リモートセンシング画像の画素(i,j)が3回目の解像度低減処理過程で選択したリモートセンシング画像ブロックの、認識対象リモートセンシング画像の領域にマッピングする画素に属する場合、
【0141】
【0142】
はニューラルネットワークから出力された対応する画素の分類確率情報であるが、認識対象リモートセンシング画像の画素(i,j)が、3回目の解像度低減処理過程で選択したリモートセンシング画像ブロックの、認識対象リモートセンシング画像の領域にマッピングする画素に属しない場合、
【0143】
【0144】
は0であり、本願は0でない
【0145】
【0146】
に対して 、
【0147】
【0148】
と、
【0149】
【0150】
との平均値を計算し、算出した平均値を利用して、認識対象リモートセンシング画像の対応する画素(i,j)の現在の分類確率情報
【0151】
【0152】
を更新する。
【0153】
このように類推すると、解像度低減処理の実行が2回目及び3回目である場合に認識対象リモートセンシング画像のすべての画素の現在の分類確率情報を更新する上記過程から分かるように、解像度低減処理の実行が1回目でなく、4回目又は5回目(n回目)である場合、認識対象リモートセンシング画像のすべての画素の現在の分類確率情報を更新する過程は、過去数回の分類確率情報を融合することであり、例えば、
【0154】
【0155】
を融合して、更新した認識対象リモートセンシング画像のすべての画素の現在の分類確率情報を形成する。ただし、本願がニューラルネットワークに入力する必要があるリモートセンシング画像ブロックを選択するとき、根拠とする認識対象リモートセンシング画像のすべての画素の現在の分類確率情報は、過去数回の分類確率情報を融合した結果、例えば、
【0156】
【0157】
を融合した結果である。
【0158】
選択可能な例では、S460は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する第6ユニットによって実行されてもよい。
【0159】
S230、縮小率集合に未使用の最も小さな縮小値が存在しない又は少なくとも1つのリモートセンシング画像ブロックからリモートセンシング画像ブロックを選択できない場合、選択した各リモートセンシング画像ブロックの少なくとも1つの画素の分類確率情報によって形成された認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報に基づいて、認識対象リモートセンシング画像の認識結果を特定し、そうでない場合は、上記S200に戻る。
【0160】
選択可能な例では、縮小率集合に未使用の最も小さな縮小値が存在しない場合、本願は、認識対象リモートセンシング画像のすべての画素の現在の分類確率情報に基づいて、認識対象リモートセンシング画像の認識結果を特定することができ、即ち、本願は、
【0161】
【0162】
を融合して、
【0163】
【0164】
を取得し 、
【0165】
【0166】
内の最も大きな確率値を認識対象リモートセンシング画像の画素(i,j)の認識結果とする。
【0167】
選択可能な例では、少なくとも1つのリモートセンシング画像ブロックからリモートセンシング画像ブロックを選択できない場合、本願は、認識対象リモートセンシング画像のすべての画素の現在の分類確率情報に基づいて、認識対象リモートセンシング画像の認識結果を特定することができ、即ち、本願は、
【0168】
【0169】
を融合して、
【0170】
【0171】
を取得し 、
【0172】
【0173】
内の最も大きな確率値を認識対象リモートセンシング画像の画素(i,j)の認識結果とする。
【0174】
選択可能な例では、S230は、プロセッサがメモリに記憶された対応する命令を呼び出すことによって実行されてもよく、プロセッサが実行する認識結果特定モジュール540によって実行されてもよい。
【0175】
選択可能な例では、本願がニューラルネットワークをトレーニングするときに使用するリモートセンシング画像サンプルは、通常、複数の解像度を含むリモートセンシング画像サンプルであり、且つ異なる解像度の数は、通常、縮小率集合内の縮小値の数と関連し、例えば、縮小率集合が3つの縮小値を含む場合、サンプルデータ集合には、この3つの縮小値に対応する解像度のリモートセンシング画像サンプルが少なくとも含まれ、各リモートセンシング画像サンプルはいずれもラベル情報(例えば、マスクラベル情報など)を有する。通常、サンプルデータ集合では、異なる解像度のリモートセンシング画像サンプルの数はほぼ同じである。本願は、サンプルデータ集合内の異なる解像度を有するリモートセンシング画像サンプルを利用してニューラルネットワークをトレーニングすることで、入力された処理対象リモートセンシング画像ブロックに対してニューラルネットワークが出力する分類確率情報の精度を向上させるのに有利であり、それにより、ニューラルネットワークによるリモートセンシング画像認識の精度を向上させるのに有利である。
【0176】
リモートセンシング画像は通常、伝統的な意味の写真又はピクチャ又はビデオフレームなどの画像とは異なり、リモートセンシング画像のサイズは通常大きく、例えば、リモートセンシング画像の長さと幅は数千、ひいては数万画素に達し、ニューラルネットワークを利用して認識対象リモートセンシング画像を直接認識処理すれば、ニューロンの限られる受容野のため認識結果の信頼性に悪影響を与えるおそれがある一方、ニューラルネットワークの計算コスト及び時間コストが高くなるおそれがある。本願は、認識対象リモートセンシング画像に対して解像度低減処理を行い、ニューラルネットワークが解像度低減処理後のリモートセンシング画像を処理することで、ニューラルネットワークの計算コスト及び時間コストの低減に有利である。本願は、解像度低減処理後のリモートセンシング画像からリモートセンシング画像ブロックを選択し、ニューラルネットワークに入力することで、ニューラルネットワークが解像度低減処理後のリモートセンシング画像の対応する局所領域に対して認識処理を行う時の計算量を低減させるのに有利である。本願は解像度低減処理過程で、認識対象リモートセンシング画像の画素の現在の信頼度に基づいてリモートセンシング画像ブロックを選択することができ、それにより、認識対象リモートセンシング画像のいくつかの認識しやすい画像領域に対しては、ニューラルネットワークによる認識の精度が高いため、毎回解像度低減処理後に、ニューラルネットワークがこのような画像領域に対して分類処理を繰り返し行い、その結果、当該画像領域の最終的な分類結果の精度にはあまり寄与しないが、認識対象リモートセンシング画像のいくつかの認識しにくい複雑な画像領域に対しては、ニューラルネットワークがこのような画像領域に対して分類処理を繰り返し行い、その結果、当該画像領域の最終的な分類結果の精度には寄与する。また、複数回の解像度低減の過程で、先の解像度低減処理後のリモートセンシング画像の解像度を後の解像度低減処理後のリモートセンシング画像の解像度より小さくすることで、先の解像度低減処理後のある画像ブロックの認識結果の精度が要件を満たす場合、本願は、後の解像度低減処理後の対応する領域の画像ブロックを認識処理しなくてもよく、それにより、ニューラルネットワークの計算量及び処理時間を大幅に低減させることができる。よって、本願に係る技術案は、リモートセンシング画像認識の精度を確保するとともに、ニューラルネットワークの時間及び計算コストを低減させ、ニューラルネットワークによるリモートセンシング画像認識の効率を向上させるのに有利である。
【0177】
実際の検証過程で、209枚の高分1号(GF-1)衛星のPMS(Panchromatic and Multispectral Scanners:パンクロマティック及びマルチスペクトルスキャナー)によるリモートセンシング画像認証集合において、本願の技術案を使用することで、縮小率集合内の縮小値が0.5及び1.0である場合、従来技術のリモートセンシング画像認識に比べて、計算量が略35%減少し、認識精度がやや向上し、例えば、mIoUが0.8366から0.8383まで向上する。
【0178】
本願実施例に係るいずれかのリモートセンシング画像認識は、データ処理能力を有する任意の適切な機器によって実行することができ、当該機器は、端末機器及びサーバなどを含むが、それらに限定されない。又は、本願実施例に係るいずれかのリモートセンシング画像認識方法は、プロセッサによって実行することができ、例えば、プロセッサはメモリに記憶された対応する命令を呼び出すことによって本願実施例に記載のいずれかのリモートセンシング画像認識方法を実行する。以下では繰り返し説明しない。
【0179】
当業者は、上記方法実施例のすべて又は一部の操作の実現がプログラムによって関連するハードウェアを命令して完了することができ、上記プログラムがコンピュータ可読記憶媒体に記憶され、当該プログラムが実行されるとき、上記方法実施例を含む操作が実行され、上記記憶媒体がROM、RAM、磁気ディスク又は光ディスクなどのプログラムコードを記憶できる少なくとも1つの媒体を含むことを理解できる。
【0180】
図5は本願に係るリモートセンシング画像認識装置の一実施例の構造模式図である。
図5に示すように、当該実施例の装置は主に、解像度低減モジュール500、リモートセンシング画像分割モジュール510、画像ブロック選択モジュール520、分類処理モジュール530及び認識結果特定モジュール540を備える。選択可能に、当該装置は、トレーニングモジュール550をさらに備えてもよい。
【0181】
解像度低減モジュール500は主に、認識対象リモートセンシング画像に対して解像度低減処理を行って、解像度低減処理後のリモートセンシング画像を得るように構成される。例えば、解像度低減モジュール500は、縮小率集合内の未使用の縮小値に基づいて認識対象リモートセンシング画像に対して解像度低減処理を行うように構成される。当該縮小率集合は、少なくとも2つの異なる縮小値を含み、且つ小さな縮小値は、大きな縮小値よりも優先に解像度低減モジュール500により使用される。解像度低減モジュール500による操作は、上記
図1のS100及び
図2のS200の説明を参照でき、ここで繰り返し説明しない。
【0182】
リモートセンシング画像分割モジュール510は主に、解像度低減モジュール500による解像度低減処理後のリモートセンシング画像から、少なくとも1つのリモートセンシング画像ブロックを分割するように構成される。リモートセンシング画像分割モジュール510による操作は、上記
図1のS110及び
図2のS210の説明を参照でき、ここで繰り返し説明しない。
【0183】
画像ブロック選択モジュール520は主に、リモートセンシング画像分割モジュール510が分割したリモートセンシング画像ブロックから処理対象リモートセンシング画像ブロックを決定するように構成される。選択可能に、本願の装置による1回目での解像度低減処理を実行する場合、画像ブロック選択モジュール520は、リモートセンシング画像分割モジュール510が分割したすべてのリモートセンシング画像ブロックを処理対象リモートセンシング画像ブロックとすることができる。本願の装置による1回目以外での解像度低減処理を実行する場合、画像ブロック選択モジュール520が選択した処理対象リモートセンシング画像ブロックの数はリモートセンシング画像分割モジュールが現在分割しているリモートセンシング画像ブロックの数以下である。例えば、1回目以外での解像度低減処理を実行する場合、画像ブロック選択モジュール520は認識対象リモートセンシング画像の画素の現在の信頼度に基づいて、リモートセンシング画像分割モジュール510が分割したリモートセンシング画像ブロックから処理対象リモートセンシング画像ブロックを選択することができる。
【0184】
選択可能な例では、画像ブロック選択モジュール520は、第1ユニット、第2ユニット及び第3ユニットを備える。第1ユニットは主に、認識対象リモートセンシング画像に含まれる複数の画素内の少なくとも1つの画素の現在の分類確率情報に基づいて、少なくとも1つの画素の現在の信頼度を特定するように構成され、第2ユニットは主に、リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域内の、少なくとも1つの画素の現在の信頼度が所定信頼度に達した画素数を統計するように構成され、第3ユニットは主に、所定信頼度に達した画素数が所定要件を満たさないリモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定するように構成される。例えば、ある一つのリモートセンシング画像ブロックの所定信頼度に達した画素数と、当該リモートセンシング画像ブロックに対応する認識対象リモートセンシング画像領域の少なくとも1つの画素の数との比が所定比率未満である場合、第3ユニットは、当該リモートセンシング画像ブロックを、処理対象リモートセンシング画像ブロックとして特定する。第1ユニットによる操作は、上記
図3のS300の説明を参照でき、第2ユニットによる操作は、上記
図3のS310の説明を参照でき、第3ユニットによる操作は、上記
図3のS320の説明を参照でき、ここで繰り返し説明しない。
【0185】
選択可能な例では、画像ブロック選択モジュール520は第4ユニット、第5ユニット及び第6ユニットをさらに備える。第4ユニットは主に、1回目での解像度低減処理を実行する場合、ニューラルネットワークから出力された各処理対象リモートセンシング画像ブロック内の少なくとも1つの画素の分類確率情報を認識対象リモートセンシング画像にマッピングして、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得するように構成される。認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を、認識対象リモートセンシング画像の少なくとも1つの画素の現在の分類確率情報とする。第5ユニットは主に、1回目以外での解像度低減処理を実行する場合、ニューラルネットワークから出力された各処理対象リモートセンシング画像ブロック内の少なくとも1つの画素の分類確率情報を認識対象リモートセンシング画像にマッピングして、認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報を取得するように構成される。第6ユニットは主に、今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新するように構成される。例えば、第6ユニットは、今回取得した認識対象リモートセンシング画像の少なくとも1つの画素の分類確率情報と認識対象リモートセンシング画像の対応する画素の現在の分類確率情報との平均値を計算し、算出した平均値を利用して、認識対象リモートセンシング画像の対応する画素の現在の分類確率情報を更新するように構成される。第4ユニットによる操作は、上記
図4のS420及びS430の説明を参照でき、第5ユニットによる操作は、上記
図4のS450の説明を参照でき、第6ユニットによる操作は、上記
図4のS460の説明を参照でき、ここで繰り返し説明しない。
【0186】
分類処理モジュール530は主に、ニューラルネットワークを介して処理対象リモートセンシング画像ブロックの画素の分類確率情報を取得するように構成される。分類処理モジュール530による操作は、上記
図1のS130及び
図2のS220の関連説明を参照でき、ここで繰り返し説明しない。
【0187】
認識結果特定モジュール540は主に、処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、認識対象リモートセンシング画像の認識結果を特定するように構成される。例えば、認識結果特定モジュール540は、縮小率集合に未使用の縮小値が存在しないこと、又はリモートセンシング画像分割モジュール510が分割したリモートセンシング画像ブロックに処理対象リモートセンシング画像ブロックが存在しないと確定したことに応答して、処理対象リモートセンシング画像ブロックの画素の分類確率情報に基づいて、前記認識対象リモートセンシング画像の認識結果を特定する。例えば、認識対象リモートセンシング画像のある一つの画素に対して、認識結果特定モジュール540は、当該画素の現在の分類確率情報内の、各カテゴリに属する確率値内の最も大きな確率値を決定し、当該最も大きな確率値及び当該最も大きな確率値に対応するカテゴリを当該画素の認識結果とする。認識結果特定モジュール540による操作は、上記
図1のS140及び
図2のS230の説明を参照でき、ここで繰り返し説明しない。
【0188】
トレーニングモジュール550は主に、リモートセンシング画像サンプルを利用してニューラルネットワークをトレーニングするように構成される。リモートセンシング画像サンプルの解像度は、縮小率集合内の各縮小値に基づいてそれぞれリモートセンシング画像に対して解像度低減処理を行って得られた各リモートセンシング画像の解像度を含む。例えば、縮小率集合が第1縮小値、第2縮小値及び第3縮小値を含み、第1縮小値が第1解像度に対応し、第2縮小値が第2解像度に対応し、第3縮小値が第3解像度に対応するとすると、トレーニングモジュール550は、第1解像度を有するリモートセンシング画像サンプル、第2解像度を有するリモートセンシング画像サンプル及び第3解像度を有するリモートセンシング画像サンプルを利用して、トレーニング対象ニューラルネットワークをトレーニングすることができ、トレーニングに成功したニューラルネットワークは、本願のリモートセンシング画像認識に使用できる。
【0189】
例示的な機器
図6は本願の実現に適する例示的な機器600を示し、機器600は、自動車に配置される制御システム/電子システム、移動端末(例えば、スマート携帯電話など)、パーソナルコンピュータ(PC、例えば、デスクトップコンピュータ又はノートパソコンなど)、タブレットパソコン及びサーバなどであってもよい。
図6では、機器600は、1つ又は複数のプロセッサ、通信部などを備え、前記1つ又は複数のプロセッサは、1つ又は複数の中央処理ユニット(CPU)601、及び/又は、ニューラルネットワークを利用してリモートセンシング画像認識を行う1つ又は複数の加速ユニット613などであってもよく、加速ユニット613は、GPU、FPGA、他のタイプの専用プロセッサなどを含むが、それらに限定されない。プロセッサは、読み出し専用メモリ(ROM)602に記憶された実行可能命令又は記憶部608からランダムアクセスメモリ(RAM)603にロードされた実行可能命令によって様々な適切な動作及び処理を実行することができる。通信部612はネットワークカードを含むが、それに限定されず、前記ネットワークカードはIB(Infiniband)ネットワークカードを含むが、それに限定されない。プロセッサは、読み出し専用メモリ602及び/又はランダムアクセスメモリ603と通信して実行可能命令を実行し、バス604を介して通信部612と接続され、通信部612を介して他のターゲット機器と通信することで、本願の対応する操作を完了する。
【0190】
上記各命令による操作は上記方法実施例の関連説明を参照でき、ここで詳細に説明しない。
【0191】
また、RAM603には、装置の操作に必要な様々なプログラム及びデータが記憶されてもよい。CPU601又は加速ユニット613、ROM602及びRAM603はバス604を介して互いに接続される。RAM603を有する場合、ROM602は選択可能なモジュールである。RAM603は実行可能命令を記憶するか、又は動作時にROM602に実行可能命令を書き込み、実行可能命令によってプロセッサに上記方法に対応する操作を実行させる。入力/出力(I/O)インタフェース605もバス604に接続される。通信部612は、統合的に設置されてもよく、複数のサブモジュール(例えば、複数のIBネットワークカード)を有し、それぞれバスに接続されるように設置されてもよい。
【0192】
キーボード、マウスなどを含む入力部606と、陰極線管(CRT)、液晶ディスプレイ(LCD)など及びスピーカなどを含む出力部607と、ハードディスクなどを含む記憶部608と、LANカード、モデムなどのネットワークインタフェースカードを含む通信部609とがI/Oインタフェース605に接続されている。通信部609はインターネットなどのネットワークを介して通信処理を実行する。ドライバ610も必要に応じてI/Oインタフェース605に接続される。磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどのリムーバブル媒体611は、必要に応じてドライバ610に装着され、そこから読み出されたコンピュータプログラムは必要に応じて記憶部608にインストールされる。
【0193】
なお、
図6に示される構造は、選択可能な実現方式に過ぎず、具体的な実施過程では、実際の必要に応じて上記
図6の部材の数及び種類を選択、削除、追加又は置換することができ、異なる機能部材の設置については、分離設置又は統合設置などの実現方式を使用でき、例えば、加速ユニット613とCPU601を分離設置してもよく、また例えば、加速ユニット613をCPU601に統合してもよく、通信部612は分離設置してもよく、CPU601又は加速ユニット613に統合的に設置してもよい。これらの置換可能な実施形態はいずれも本願の保護範囲に属する。
【0194】
特に、本願の実施形態によれば、以下でフローチャートを参照して説明される過程はコンピュータソフトウェアプログラムとして実現され得る。例えば、本願の実施形態は、機械可読媒体に有形に含まれるコンピュータプログラムを含むコンピュータプログラム製品を含み、コンピュータプログラムは、フローチャートに示される操作を実行するためのプログラムコードを含み、プログラムコードは本願に係る操作を実行するための対応する命令を含む。
【0195】
このような実施形態では、当該コンピュータプログラムは、通信部609を介してネットワークからダウンロードされてインストールされてもよく、及び/又はリムーバブル媒体611からインストールされてもよい。当該コンピュータプログラムが中央処理ユニット(CPU)601により実行されるとき、本願に記載の上記命令が実行される。
【0196】
1つ又は複数の選択可能な実施形態では、本開示の実施例は、コンピュータ可読命令を記憶するためのコンピュータプログラム製品であって、前記命令が実行されるとき、上記任意の実施例に記載のリモートセンシング画像認識方法をコンピュータに実行させるコンピュータプログラム製品をさらに提供する。
【0197】
当該コンピュータプログラム製品は、具体的にハードウェア、ソフトウェア又はそれらの組み合わせによって実現され得る。選択可能な例では、前記コンピュータプログラム製品は、具体的に、コンピュータ記憶媒体として表現され、別の選択可能な例では、前記コンピュータプログラム製品は、具体的に、ソフトウェア開発キット(SDK:Software Development Kit)などのソフトウェア製品として表現される。
【0198】
1つ又は複数の選択可能な実施形態では、本開示の実施例は、別のリモートセンシング画像認識方法及びその対応する装置、電子機器、コンピュータ記憶媒体、コンピュータプログラム及びコンピュータプログラム製品をさらに提供し、ここで、方法は、第1装置が第2装置にリモートセンシング画像認識命令を送信し、当該命令によって第2装置に上記いずれかの可能な実施例のリモートセンシング画像認識方法を実行させることと、第1装置が第2装置から送信されたリモートセンシング画像認識結果を受信することとを含む。
【0199】
いくつかの実施例では、当該リモートセンシング画像認識命令は具体的に、呼び出し命令であってもよく、第1装置は、呼び出し方法によって第2装置にリモートセンシング画像認識操作を実行させ、それに対応して、呼び出し命令を受信したことに応答して、第2装置は、上記リモートセンシング画像認識方法の任意実施例の操作及び/又は流れを実行することができる。
【0200】
なお、本開示の実施例の「第1」、「第2」という用語は、区別するためのものに過ぎず、本開示の実施例を限定するためのものとして理解されるべきではない。
【0201】
なお、本開示では、「複数」は2つ又は2つ以上を示し、「少なくとも1つ」は1つ、2つ又は2つ以上を示す。
【0202】
なお、本開示に記載の任意の部材、データ又は構造は、明確に限定されない又は前後に反対の示唆が示されない場合、一般に1つ又は複数あると理解できる。
【0203】
なお、本開示の少なくとも1つの実施例の説明は、少なくとも1つの実施例間の相違点を強調し、同じ又は類似の点は互いに参照でき、簡潔さのために、繰り返し説明しない。
【0204】
本願の方法、装置、電子機器及びコンピュータ可読記憶媒体は様々な形態で実現され得る。例えば、ソフトウェア、ハードウェア、ファームウェア又はソフトウェア、ハードウェア、ファームウェアの任意の組み合わせによって本願の方法、装置、電子機器及びコンピュータ可読記憶媒体を実現することができる。方法の操作のための上記順序は説明するために用いられ、本願の方法の操作は、特に断らない限り、以上具体的に説明した順序に限定されない。また、いくつかの実施形態では、本願は記録媒体に記録されたプログラムとして実施されてもよく、これらのプログラムは、本願に係る方法を実現するための機械可読命令を含む。したがって、本願は、本願に係る方法を実行するためのプログラムを記憶する記録媒体をさらに含む。
【0205】
本願の説明は、全部でなく、一部の例示及び説明のために提示されたものであり、本願はそれらに限定されない。多くの修正や変形は、当業者にとって明らかなものである。実施形態は、本願の原理及び実際の応用をよりよく説明し、当業者が本願の実施例を理解して特定の用途に適した様々な修正を加えた様々な実施形態を設計可能にするために選択され説明されたものである。
【0206】
例示的な応用場面
図7は、本願の実施形態に基づいて実現できる応用場面を例示的に示す。
【0207】
図7では、ニューラルネットワーク700は、認識対象リモートセンシング画像を認識する(例えば、雲・雪マスク又は雲・雪・水マスクなどを形成する)ためのニューラルネットワークである。ニューラルネットワーク700をトレーニングするためのサンプルデータ集合は通常、複数のリモートセンシング画像サンプルを含み、且つすべてのリモートセンシング画像サンプルの解像度は完全に同じではない。サンプルデータ集合内の異なる解像度を有するリモートセンシング画像サンプルを利用してニューラルネットワーク700をトレーニングすることが成功になった後、トレーニングに成功したニューラルネットワーク700を利用して、衛星からの認識対象リモートセンシング画像を認識することができ、ニューラルネットワーク700の認識結果としては、雲・雪マスク又は雲・雪・水マスクなどのマスクを形成することができる。
【0208】
しかし、当業者は、本願の実施形態の適用場面が当該フレームに制限されないことを理解できる。
【0209】
本願の方法、装置、電子機器、コンピュータプログラム及びコンピュータ可読記憶媒体は様々な形態で実現され得る。例えば、ソフトウェア、ハードウェア、ファームウェア又はソフトウェア、ハードウェア、ファームウェアの任意の組み合わせによって本願の方法、装置、電子機器、コンピュータプログラム及びコンピュータ可読記憶媒体を実現することができる。方法の操作のための上記順序は説明するために用いられ、本願の方法の操作は、特に断らない限り、以上具体的に説明した順序に限定されない。また、いくつかの実施形態では、本願は記録媒体に記録されたプログラムとして実施されてもよく、これらのプログラムは、本願に係る方法を実現するための機械可読命令を含む。したがって、本願は、本願に係る方法を実行するためのプログラムを記憶する記録媒体をさらに含む。
【0210】
本願の説明は、全部でなく、一部の例示及び説明のために提示されたものであり、本願はそれらに限定されない。多くの修正や変形は、当業者にとって明らかなものである。実施形態は、本願の原理及び実際の応用をよりよく説明し、当業者が本願を理解して特定の用途に適した様々な修正を加えた様々な実施形態を設計可能にするために選択され説明されたものである。