(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024072568
(43)【公開日】2024-05-28
(54)【発明の名称】情報処理プログラム、情報処理装置、情報処理方法及びモデルの生成方法
(51)【国際特許分類】
G06T 7/60 20170101AFI20240521BHJP
G06T 7/00 20170101ALI20240521BHJP
【FI】
G06T7/60 180B
G06T7/00 610
G06T7/00 350C
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2022183469
(22)【出願日】2022-11-16
(71)【出願人】
【識別番号】000003687
【氏名又は名称】東京電力ホールディングス株式会社
(71)【出願人】
【識別番号】304021417
【氏名又は名称】国立大学法人東京工業大学
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】近藤 誠一郎
(72)【発明者】
【氏名】熊澤 逸夫
(72)【発明者】
【氏名】立野 賢登
(72)【発明者】
【氏名】ナイダンスレン ミャグマルスレン
(72)【発明者】
【氏名】ゾウ ヤーンジェンチュワン
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA09
5L096CA04
5L096CA05
5L096FA66
5L096FA76
5L096HA11
5L096JA11
5L096KA04
(57)【要約】
【課題】送配電設備及び周辺物の距離を導出する情報処理プログラム、情報処理装置、情報処理方法及びモデルの生成方法を提供すること。
【解決手段】情報処理プログラムは、ステレオカメラにより撮影され、被写体に送配電設備を含む複数の画像を取得し、複数の画像を入力した場合に、深度情報を生成するよう学習された第1モデルへ、取得した複数の画像を入力して深度情報を生成し、画像を入力した場合に、送配電設備と周辺物とを分類するように学習された第2モデルへ、取得した画像を入力して送配電設備及び周辺物の分類を取得し、取得した分類と前記深度情報に基づいて、前記送配電設備と前記周辺物との間の距離を導出する。
【選択図】
図12
【特許請求の範囲】
【請求項1】
ステレオカメラにより撮影され、被写体に送配電設備を含む複数の画像を取得し、
複数の画像を入力した場合に、深度情報を生成するよう学習された第1モデルへ、取得した複数の画像を入力して深度情報を生成し、
画像を入力した場合に、送配電設備と周辺物とを分類するように学習された第2モデルへ、取得した画像を入力して送配電設備及び周辺物の分類を取得し、
取得した分類と前記深度情報に基づいて、前記送配電設備と前記周辺物との間の距離を導出する
処理をコンピュータに実行させる情報処理プログラム。
【請求項2】
前記送配電設備と前記周辺物とが接近する2点を判定し、該2点それぞれについて、前記ステレオカメラの基線長、焦点距離及び前記深度情報に基づき、3次元座標値を求め、求めた前記2点の3次元座標値より、前記距離を導出する
請求項1に記載の情報処理プログラム。
【請求項3】
前記距離が閾値未満である場合、警告を出力する
請求項1に記載の情報処理プログラム。
【請求項4】
前記距離が閾値未満である前記周辺物、又は、前記送配電設備を強調表示する
請求項1又は請求項2に記載の情報処理プログラム。
【請求項5】
前記送配電設備は送電線若しくは配電線又は鉄塔若しくは電柱であり、前記周辺物は樹木、植物のつる、道路、地面又は看板である
請求項1又は請求項2に記載の情報処理プログラム。
【請求項6】
前記第2モデルは、取得した画像から特徴量を抽出するエンコーダと、
前記エンコーダにより抽出された特徴量に基づき前記送配電設備及び前記周辺物を特定する第1デコーダと、
前記エンコーダにより抽出された特徴量に基づき送電線又は配電線を特定する第2デコーダと、
前記エンコーダにより抽出された特徴量に基づき鉄塔又は電柱を特定する第3デコーダと
を含む請求項1又は請求項2に記載の情報処理プログラム。
【請求項7】
前記送配電設備に含まれる送電線又は配電線の特定においては、前記第1デコーダの特定結果よりも、前記第2デコーダの特定結果を優先し、
前記送配電設備に含まれる鉄塔又は電柱の特定においては、前記第1デコーダの特定結果よりも、前記第3デコーダの特定結果を優先する
請求項6に記載の情報処理プログラム。
【請求項8】
前記第1モデルは入力された画像から特徴量を抽出する抽出エンコーダと、前記特徴量を集約する集約デコーダとを含み、
前記集約デコーダは、階層化された複数のアップサンプリング層を含み、前記複数のアップサンプリング層において、最下層のみが前記集約デコーダの外部へ特徴量を出力する
請求項1又は請求項2に記載の情報処理プログラム。
【請求項9】
ステレオカメラにより撮影され、被写体に送配電設備を含む複数の画像を取得する第1取得部と、
複数の画像を入力した場合に、深度情報を生成するよう学習された第1モデルへ、取得した複数の画像を入力して深度情報を生成する生成部と、
画像を入力した場合に、送配電設備と周辺物とを分類するように学習された第2モデルへ、取得した画像を入力して送配電設備及び周辺物の分類を取得する第2取得部と、
取得した分類と前記深度情報に基づいて、前記送配電設備と前記周辺物との間の距離を導出する導出部と
を備える情報処理装置。
【請求項10】
ステレオカメラにより撮影され、被写体に送配電設備を含む複数の画像を取得し、
複数の画像を入力した場合に、深度情報を生成するよう学習された第1モデルへ、取得した複数の画像を入力して深度情報を生成し、
画像を入力した場合に、送配電設備と周辺物とを分類するように学習された第2モデルへ、取得した画像を入力して送配電設備及び周辺物の分類を取得し、
取得した分類と前記深度情報に基づいて、前記送配電設備と前記周辺物との間の距離を導出する処理を
コンピュータが行う情報処理方法。
【請求項11】
エンコーダ、並びに、該エンコーダにそれぞれ接続する第1デコーダ、第2デコーダ、及び、第3デコーダを用意し、
送電線又は配電線及び鉄塔又は電柱を含む物体の分類が注記として付された画像を取得し、
取得した画像に基づき、画像を入力した場合に、該画像に被写体として含まれる物体の分類を行う前記エンコーダ及び前記第1デコーダにより構成されるセグメンテーションモデルと、画像を入力した場合に、該画像に被写体として含まれる送電線又は配電線を分類する前記エンコーダ及び前記第2デコーダにより構成される線状物体検出モデルと、画像を入力した場合に、該画像に被写体として含まれる鉄塔又は電柱を分類する前記エンコーダ及び前記第3デコーダにより構成される電柱検出モデルとを学習により生成する
モデルの生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、送配電設備及び周辺物の距離を導出する情報処理プログラム、情報処理装置、情報処理方法及びモデルの生成方法に関する。
【背景技術】
【0002】
送配電設備、特に架空配電線が、建造物、道路、鉄道、樹木等と接近する場合に、これら周辺物が、架空配電線と接触しないように、又は、架空配電線を切断しないように、離隔距離が規定されている。しかし、架空配電線周辺の環境変化により、新たな周辺物が現れたり、離隔距離が縮まったりする場合がある。そのため、架空配電線と周辺物との離隔距離が規定されている距離以内を維持しているか、定期的に点検する必要がある。
【0003】
このような事情に関連して、特許文献1には、架空配電線の側面側よりクレーン、飛行物、樹木等が接触することにより生じる異常箇所の画像を撮影する巡視点検システムが提案されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、上記公知技術は架空配電線と周辺物とが接触しているか否かは点検できるものの、架空配電線と周辺物との離隔距離は導出できない。本発明はこのような状況に鑑みてなされたものである。その目的は、送配電設備及び周辺物の距離を導出する情報処理プログラム、情報処理装置、情報処理方法及びモデルの生成方法の提供である。
【課題を解決するための手段】
【0006】
本願の一態様に係る情報処理プログラムは、ステレオカメラにより撮影され、被写体に送配電設備を含む複数の画像を取得し、複数の画像を入力した場合に、深度情報を生成するよう学習された第1モデルへ、取得した複数の画像を入力して深度情報を生成し、画像を入力した場合に、送配電設備と周辺物とを分類するように学習された第2モデルへ、取得した画像を入力して送配電設備及び周辺物の分類を取得し、取得した分類と前記深度情報に基づいて、前記送配電設備と前記周辺物との間の距離を導出する。
【発明の効果】
【0007】
本願の一態様にあっては、送配電設備及び周辺物の距離を導出することが可能となる。
【図面の簡単な説明】
【0008】
【
図2】判定サーバのハードウェア構成例を示すブロック図である。
【
図3】ユーザ端末のハードウェア構成例を示すブロック図である。
【
図8】特徴抽出モジュールの構成例を示す説明図である。
【
図10】第1モデル生成処理の手順例を示すフローチャートである。
【
図11】第2モデル生成処理の手順例を示すフローチャートである。
【
図12】判定処理の手順例を示すフローチャートである。
【
図13】判定処理の手順例を示すフローチャートである。
【発明を実施するための形態】
【0009】
(実施の形態1)
以下実施の形態を、図面を参照して説明する。
図1は判定システムの構成例を示す説明図である。判定システム100は判定サーバ1、ユーザ端末2、ステレオカメラ3及び位置測位機4を含む。判定サーバ1とユーザ端末2とはネットワークNにより、通信可能に接続されている。ステレオカメラ3及び位置測位機4は、ユーザ端末2と通信可能に接続されている。
【0010】
送配電設備は送電設備及び配電設備を含む概念である。以下の説明では、送配電設備の中で、架空配電線を対象とするが、架空送電線も同様である。以下では、架空配電線を単に配電線ともいう。送配電設備に限らず、通信設備、特に通信線又は光ファイバを対象としてもよい。
【0011】
判定サーバ1はサーバコンピュータ、ワークステーション、PC(Personal Computer)等で構成する。また、判定サーバ1を複数のコンピュータからなるマルチコンピュータ、ソフトウェアによって仮想的に構築された仮想マシン又は量子コンピュータで構成しても良い。さらに、判定サーバ1の機能をクラウドサービスで実現してもよい。
【0012】
ユーザ端末2はエンドユーザが使用する端末である。ユーザ端末2はノートPC、タブレットコンピュータ、スマートフォン等で構成する。
図1において、ユーザ端末2は1台のみ記載しているが、2台以上でもよい。
【0013】
ステレオカメラ3は撮像素子と光学系とを含む撮像部を2つ備えたカメラである。ステレオカメラ3は、位置が異なる2つの撮像部により、被写体を同時に撮影することにより、その奥行き方向の情報も記録できるようにしたカメラである。ステレオカメラ3はユーザ端末2毎に用意する前提であるが、運用上、差支えがなければ、それに限らない。なお、ステレオカメラ3はユーザ端末2が担う機能を備えてもよい。また、ステレオカメラ3は後述する第1モデル、第2モデル等を備え、配電線とその周辺物との間の距離を導出する機能を備えてもよい。
【0014】
位置測位機4は現在位置の地理座標を計測する装置である。例えば、位置測位機4は、GPS(Global Positioning System)衛星、準天頂衛星、GLONASS(Global Navigation Satellite System)衛星、Galileo衛星等の衛星測位システムを構成する衛星からの電波を受信し、現在位置を取得する。位置計測の目的は、ステレオカメラ3が撮影する画像に撮影位置を付与するためである。位置測位機4はステレオカメラ3の筐体に納めることが望ましい。また、画像へ撮影位置の付与が可能であれば、ユーザ端末2が位置測位機4を備えていてもよい。
【0015】
図2は判定サーバのハードウェア構成例を示すブロック図である。判定サーバ1は制御部11、主記憶部12、補助記憶部13、通信部15及び読み取り部16を含む。制御部11、主記憶部12、補助記憶部13、通信部15及び読み取り部16はバスBにより接続されている。
【0016】
制御部11は、一又は複数のCPU(Central Processing Unit)、MPU(Micro-Processing Unit)、GPU(Graphics Processing Unit)等の演算処理装置を有する。制御部11は、補助記憶部13に記憶された制御プログラム1P(プログラム、プログラム製品)を読み出して実行することにより、判定サーバ1に係る種々の情報処理、制御処理等を行い、第1取得部、第2取得部、生成部、導出部等の機能部を実現する。
【0017】
主記憶部12は、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)、フラッシュメモリ等である。主記憶部12は主として制御部11が演算処理を実行するために必要なデータを一時的に記憶する。
【0018】
補助記憶部13はハードディスク又はSSD(Solid State Drive)等であり、制御部11が処理を実行するために必要な制御プログラム1Pや各種DB(Database)を記憶する。補助記憶部13は、設定DB131、撮影画像DB132、画像位置DB133、及び、判定結果DB134を記憶する。また、補助記憶部13は第1モデル141及び第2モデル142を記憶する。補助記憶部13は判定サーバ1に接続された外部記憶装置であってもよい。補助記憶部13に記憶する各種DB等を、判定サーバ1とは異なるデータベースサーバやクラウドストレージに記憶してもよい。
【0019】
通信部15はネットワークNを介して、ユーザ端末2と通信を行う。また、制御部11が通信部15を用い、ネットワークN等を介して他のコンピュータから制御プログラム1Pをダウンロードし、補助記憶部13に記憶してもよい。
【0020】
読み取り部16はCD(Compact Disc)-ROM及びDVD(Digital Versatile Disc)-ROMを含む可搬型記憶媒体1aを読み取る。制御部11が読み取り部16を介して、制御プログラム1Pを可搬型記憶媒体1aより読み取り、補助記憶部13に記憶してもよい。また、半導体メモリ1bから、制御部11が制御プログラム1Pを読み込んでもよい。
【0021】
図3はユーザ端末のハードウェア構成例を示すブロック図である。ユーザ端末2は制御部21、主記憶部22、補助記憶部23、通信部24、入力部25、表示部26及びシリアル通信部27を含む。各構成はバスBで接続されている。
【0022】
制御部21は、一又は複数のCPU、MPU、GPU等の演算処理装置を有する。制御部21は、補助記憶部23に記憶された制御プログラム2P(プログラム、プログラム製品)を読み出して実行することにより、種々の機能を提供する。
【0023】
主記憶部22は、SRAM、DRAM、フラッシュメモリ等である。主記憶部22は主として制御部21が演算処理を実行するために必要なデータを一時的に記憶する。
【0024】
補助記憶部23はハードディスク又はSSD等であり、制御部21が処理を実行するために必要な各種データを記憶する。補助記憶部23はステレオカメラ3から取得したステレオ画像や、位置測位機4から取得した位置情報を記憶してもよい。補助記憶部23はユーザ端末2に接続された外部記憶装置であってもよい。補助記憶部23に記憶する各種DB等を、データベースサーバやクラウドストレージに記憶してもよい。
【0025】
通信部24はネットワークNを介して、判定サーバ1と通信を行う。また、制御部21が通信部24を用い、ネットワークN等を介して他のコンピュータから制御プログラム2Pをダウンロードし、補助記憶部23に記憶してもよい。
【0026】
入力部25はキーボードやマウスである。表示部26は液晶表示パネル等を含む。表示部26は判定サーバ1が出力した判定結果などを表示する。また、入力部25と表示部26とを一体化し、タッチパネルディスプレイを構成してもよい。なお、ユーザ端末2は外部の表示装置に表示を行ってもよい。
【0027】
シリアル通信部27は他の機器とシリアル通信を行う通信インターフェースである。シリアル通信部27は、USB(Universal Serial Bus)規格に従った有線通信、Bluetooth(登録商標)規格等に従った無線通信を行う。シリアル通信部27は、ステレオカメラ3からステレオ画像を、位置測位機4から位置情報を取得する。
【0028】
図4は設定DBの例を示す説明図である。設定DB131は離隔距離の閾値を記憶する。設定DB131は設備列、分類列及び閾値列を含む。設備列は送電設備の分類を記憶する。分類列は周辺物の分類を記憶する。閾値列は周辺物に対する閾値を記憶する。
図4に示されている例では、建造物と配電線との離隔距離は2m以上でなくてはならないことを示している。その他に、地面と配電線との離隔距離、道路と配電線との離隔距離、配電線又は電柱とビルに設置された看板との離隔距離などの閾値を記憶する。
【0029】
撮影画像DB132(図示なし)は、ステレオカメラ3が撮影したステレオ画像を記憶する。撮影画像DB132が記憶するステレオ画像は、静止画でも動画でもよい。画像のデータ形式は特に限定されないが、左画像と右画像との対応関係が取れるデータが必要である。静止画のデータ形式は、例えばDC-006に沿った形式でもよい。DC-006はCIPA(Camera & Imaging Product Association:一般社団法人カメラ映像機器工業会)が制定したデジタルスチルカメラ用ステレオ静止画像フォーマットである。動画像の場合は、右画像と左画像とで、タイムコード同期を取って、撮影する。右動画データと左動画データとは独立したデータとして撮影画像DB132に記憶されるが、タイムコードによりフレーム単位で、対応関係のある左画像と右画像とからなる画像組、すなわちステレオ画像を取得可能である。
【0030】
図5は画像位置DBの例を示す説明図である。画像位置DB133は画像を撮影した位置の地理座標を記憶する。画像位置DB133は画像名列、タイムコード列、経度列及び緯度列を含む。画像名列は画像を特定可能な画像の名称を記憶する。画像を特定可能であれば数値でもよい。タイムコード列は画像が動画である場合、タイムコードを記憶する。画像が静止画である場合、タイムコード列の値は不定である。経度列は撮影位置の経度を記憶する。緯度列は撮影位置の緯度を記憶する。撮影位置の緯度及び経度は位置測位機4から取得する。画像位置DB133の基となるデータは、ユーザ端末2で生成する。静止画の場合、ユーザ端末2はステレオカメラ3から静止画を受け取る毎に、位置測位機4が出力した地理座標を、静止画に対応付けて記憶する。動画の場合、ユーザ端末2はステレオカメラ3から取得したタイムコードと、位置測位機4が出力した地理座標とを対応付けて記憶する。
【0031】
図6は判定結果DBの例を示す説明図である。判定結果DB134は配電設備と周辺物との離隔距離についての判定結果を記憶する。判定結果DB134は画像名列、タイムコード列、対象物ID列、対象物・分類列、配電線ID列、離隔距離列及び判定列を含む。画像名列は処理対象となった画像の名称を記憶する。タイムコード列は画像が動画である場合、判定に用いた画像のタイムコードを記憶する。タイムコード列は画像が静止画である場合、値は不定である。対象物ID列は画像に含まれ、離隔距離の判定対象となった対象物のIDを記憶する。対象物・分類列は対象物の分類を記憶する。配電線ID列は画像に含まれ、離隔距離の判定対象となった配電線のIDを記憶する。離隔距離列は導出した離隔距離を記憶する。判定列は離隔距離が閾値以上であるか否かの判定結果を記憶する。例えば、離隔距離が閾値以上であれば、判定列はOKを記憶する。離隔距離が閾値未満であれば、判定列はNGを記憶する。
【0032】
図7は第1モデルの構成例を示す説明図である。第1モデル141はステレオ画像を入力した場合に視差マップを出力するように学習された学習モデルである。第1モデル141はPSMNet(Pyramid Stereo Matching Network)を改造した学習モデルである。第1モデル141は2つ特徴抽出モジュール1411及び視差回帰モジュール1412を含む。特徴抽出モジュール1411は入力画像に含まれる物体を検出する。特徴抽出モジュール1411は右画像を処理するモジュールと左画像を処理するモジュールとがあり、モジュール間で重みを共有する。第1モデル141は2つの特徴抽出モジュール1411の出力から4次元コストボリュームを作成する。コストは、画像毎に、ステレオ画像を構成する左右の画像の一致の度合を示す。コストボリュームは、左画像に対して右画像を幅(width)方向に1ピクセルずつずらして、最大視差(Max Disparity)までずらした各画像等を結合(concat)して作成する。したがって、コストボリュームはD(深度)×H(高さ)×W(幅)×C(コスト)の4次元となる。視差回帰モジュール1412は、4次元コストボリュームから視差マップ(深度情報)を作成し、出力する。第1モデル141は
図7に示した構成に限られず、ステレオ画像を入力した場合に視差マップを出力するように学習された学習モデルであれば、他の構成でもよい。
【0033】
図8は特徴抽出モジュールの構成例を示す説明図である。特徴抽出モジュール1411は改変FPN(Feature Pyramid Networks:特徴ピラミッドネットワーク)14111、連結層14112、及びコンボリューション層14113を含む。改変FPN14111は、従来のFPNと同様に、マルチスケールCNN(Convolution Neural Network)エンコーダ(抽出エンコーダEC)と、その後半に、マルチスケール特徴ピラミッド方式の画像特徴集約を、複数スケールで行うCNNデコーダ(集約デコーダDC)とを含む。複数スケールで行うCNNデコーダにおいて、各スケールで画像特徴集約を行う層はアップサンプリング層UPである。従来のFPNでは、各スケールのCNNエンコーダとCNNデコーダとを結合するスキップ接続を含む。これにより,FPN全体では砂時計ネットワークを形成している。FPNでは各スケールで特徴量を出力する構成となっているが、改変FPN14111では最下層が出力する特徴量のみを使用する。集約デコーダDCでは最下層のアップサンプリング層BUPのみが、集約デコーダDCの外部へ特徴量を出力する。また、バックボーンはMobileNetを採用することにより、処理が軽くなるようにしてある。連結層14112はエンコーダの最下層(MobileNet)の出力と、デコーダの最下層BUPの出力と結合する。コンボリューション層14113は連結層14112が出力したデータに対して畳み込み演算を行う。特徴抽出モジュール1411は、コンボリューション層14113の出力とエンコーダの最下層の出力とを結合した特徴量を出力する。特徴抽出モジュール1411は
図8に示した構成に限られず、右画像、左画像を入力した場合に、4次元コストボリュームを作成可能な特徴量を出力するように学習された学習モデルであれば、他の構成でもよい。
【0034】
図9は第2モデルの構成例を示す説明図である。第2モデル142は複数の学習モデルを結合したモデルである。第2モデル142はエンコーダ1421、第1デコーダ1422、第2デコーダ1423、及び第3デコーダ1424を含む。
【0035】
エンコーダ1421と第1デコーダ1422とにより、U-Netを構成する。U-Netはセマンティックセグメンテーション(Semantic Segmentation)を行う学習モデルである。本実施の形態おいて、U-Netは被写体を配電線及び配電線を含む電線と、電柱と、その他の物体とに分類する。その他は、建造物、樹木、道路、歩道橋、索道等である。以降、本実施の形態におけるU-Netをセグメンテーションモデルという。セグメンテーションモデルは、U-NETに限られず、画像内の物体を分類可能な学習モデルであれば、他のモデルで構成してもよい。
【0036】
エンコーダ1421と第2デコーダ1423とにより、YOLinOを構成する。第2デコーダ1423は一部の層において、第1デコーダ1422とのスキップ接続を有する。YOLinOはリアルタイムでポリラインを検出するモデルである。本実施の形態において、YOLinOは特に、配電線を検出するために用いられる。以降、本実施の形態におけるYOLinOを線状物体検出モデルという。線状物体検出モデルは、YOLinOに限られず、画像内の線状物体を検出可能な学習モデルであれば、他のモデルで構成してもよい。
【0037】
エンコーダ1421と第3デコーダ1424とにより、Yoloを構成する。Yoloは直方体状の物体の検出に優れたモデルである。本実施の形態において、Yoloは特に、電柱を検出するために用いられる。以降、本実施の形態におけるYoloを電柱検出モデルという。電柱検出モデルはYoloに限られず、画像内において電柱のような棒状物体を検出可能な学習モデルであれば、他のモデルで構成してもよい。第2モデル142は、セグメンテーションモデル、線状物体検出モデル、及び電柱検出モデルの3モデルを必ず備えている必要はなく、セグメンテーションモデルのみの1モデル、又は、セグメンテーションモデル及び線状物体検出モデル、若しくは、セグメンテーションモデル及び電柱検出モデルの2モデルの構成でもよい。また、セグメンテーションモデル、線状物体検出モデル、及び電柱検出モデルは、エンコーダ1421を共有する構成となっているが、共有しない構成でもよい。
【0038】
セグメンテーションモデル、線状物体検出モデル、電柱検出モデルそれぞれの出力は、判別器11bに入力される。判別器11bに基づき、被写体それぞれの分類を決定する。分類の決定において、配電線の判定については、セグメンテーションモデルの判定結果よりも、線状物体検出モデルの判定結果を優先させる。また、電柱の判定については、セグメンテーションモデルの判定結果よりも、電柱検出モデルの判定結果を優先させる。判別器11bは決定した分類を付した分類済画像を出力する。分類済画像と視差マップとは導出部11cに入力される。導出部11cは分類済画像と視差マップとに基づき、配電線とその周辺物との離隔距離を導出する。判別器11bは被写体の分類と離隔距離とを対応付けた結果画像を出力する。
【0039】
次に、判定システム100で行われる情報処理について説明する。
図10は第1モデル生成処理の手順例を示すフローチャートである。第1モデル作成処理は、第1モデル141を作成する処理である。制御部11は訓練データを取得する(ステップS1)。訓練データは複数のデータレコードからなるデータセットである。制御部11は処理対象とする1レコードを選択する(ステップS2)。制御部11は学習を行う(ステップS3)。制御部11は訓練データに含まれる入力データ(ステレオ画像)を、第1モデル141へ入力する。制御部11は第1モデル141が出力したデータ(視差マップ)と、訓練データに含まれる正解データとを対照し、第1モデル141が出力したデータと、正解データとが一致するように、第1モデル141を構成するニューロン間の重み等のパラメータを最適化する。制御部11は学習を終了するか否かを判定する(ステップS4)。例えば、訓練データに含まれる全てのレコードを用いて学習をした場合、制御部11は終了すると判定する。制御部11は学習を終了しないと判定した場合(ステップS4でNO)、処理をステップS2へ戻し、学習を繰り返す。制御部11は学習を終了すると判定した場合(ステップS4でYES)、最適化されたパラメータ値等の学習結果を記憶し(ステップS5)、処理を終了する。
【0040】
第1モデル141の訓練データは、現場で撮影したステレオ画像及び、当該画像から生成した視差マップを用いる。視差マップを生成するにあったては、レーザレンジファインダ等の測距装置で測定した距離を用いて精度を確保してもよい。初期学習時の訓練データとして、一般に公開されているデータセット、例えば、Driving Stereo、KITTI_2015、Scene Flowを利用してもよい。
【0041】
図11は第2モデル生成処理の手順例を示すフローチャートである。制御部11は訓練データを取得する(ステップS11)。訓練データは複数のデータレコードからなるデータセットである。各レコードには画像内の各被写体の分類がラベル付けされている。制御部11は処理対象とする1レコードを選択する(ステップS12)。制御部11は3モデルの学習を行う(ステップS13)。3モデルは、セグメンテーションモデル、線状物体検出モデル、及び電柱検出モデルである。制御部11は、訓練データに含まれる入力画像(ラベルなし画像)を、3モデルに共通するエンコーダ1421へ入力する。制御部11はセグメンテーションモデルを構成する第1デコーダ1422、線状物体検出モデルを構成する第2デコーダ1423、電柱検出モデルを構成する第3デコーダ1424、それぞれから出力された画像を取得する。セグメンテーションモデルが出力する画像には被写体に分類が付されている。線状物体検出モデルが出力する画像には検出した線状物体が含まれている。電柱検出モデルが出力する画像には検出した電柱が含まれている。制御部11は各モデルの出力と、各被写体にラベル付けされた分類とを対照して、各モデルが正解を出力するように、エンコーダ1421、第1デコーダ1422、第2デコーダ1423、及び第3デコーダ1424を構成するニューロン間の重み等のパラメータを最適化する。制御部11は学習を終了するか否かを判定する(ステップS14)。例えば、訓練データに含まれる全てのレコードを用いて学習をした場合、制御部11は終了すると判定する。制御部11は学習を終了しないと判定した場合(ステップS14でNO)、処理をステップS12へ戻し、学習を繰り返す。制御部11は学習を終了すると判定した場合(ステップS14でYES)、最適化されたパラメータ値等の学習結果を記憶し(ステップS15)、処理を終了する。なお、ここでは3モデルを同時に学習したが、個別に学習してもよい。
【0042】
第2モデル142の訓練データは調査、障害発生時の現場写真や現場で撮影した動画に、被写体の分類を注記として付した画像を用いる。初期学習時の訓練データとして、一般に公開されているデータセット、例えば、カラー写真の教師ラベル付き画像データベースであるImageNetを利用してもよい。
【0043】
図12及び
図13は判定処理の手順例を示すフローチャートである。判定処理は入力画像の被写体として配電線が含まれる場合、当該配電線とその周辺物との離隔距離を導出し、導出した離隔距離が閾値以上であるか否かを判定する処理である。判定サーバ1の制御部11は、処理対象とする動画データを取得する(ステップS31)。動画データはステレオ動画データである。制御部11は処理対象とする1フレームを選択する(ステップS32)。制御部11は選択したフレームのステレオ画像を第1モデル141へ入力する(ステップS33)。制御部11は第1モデル141が出力する視差マップを取得する(ステップS34)。制御部11は視差マップ、右画像又は左画像を第2モデル142へ入力する(ステップS35)。第2モデル142に入力された右画像又は左画像(以下、入力画像)をエンコーダ1421に入力される。エンコーダ1421と接続されている第1デコーダ1422、第2デコーダ1423、第3デコーダ1424は画像を判別器11bへ出力する。判別器11bは3つのデコーダからの出力に基づき、入力画像における各被写体の分類を決定する。判別器11bは決定した分類を付した分類済画像を出力する。分類済画像と視差マップとは導出部11cへ入力される。導出部11cは、配電線とその周辺物との離隔距離を導出する(ステップS36)。ステレオカメラ3と被写体である配電線又は周辺物との距離は、ステレオカメラ3の基線長、各カメラの焦点距離、視差より求めることが可能である。離隔距離は、配電線と周辺物とが最も近づく点どうしの距離である。該当する2点の3次元座標値に基づいて、2点間の距離を導出可能である。離隔距離の導出は、配電線と周辺物との全ての組み合わせについて行われる。導出部11cは被写体の分類と離隔距離とを対応付けた結果画像を出力する。制御部11は結果画像において、処理対象とする周辺物を選択する(ステップS37)。制御部11は被写体に対応付けられている分類を参照して、分類が配電線や電柱ではないものを選択する。制御部11は選択した被写体に対応付けられている離隔距離を取得する(ステップS38)。制御部11は設定DB131と被写体の分類及び離隔距離とを対照して、離隔距離が閾値未満であるか否かを判定する(ステップS39)。制御部11は離隔距離が閾値未満でないと判定した場合(ステップS39でNO)、処理をステップS41へ進める。制御部11は離隔距離が閾値未満であると判定した場合(ステップS39でYES)、フラグをオンにする(ステップS40)。なお、フラグの初期状態はオフである。制御部11は結果を判定結果DB134に記憶する(ステップS41)。制御部11は終了するか否かを判定する(ステップS42)。制御部11は画像内の全ての周辺物について処理済みである場合、終了する判定し、それ以外は終了しないと判定する。制御部11は終了しないと判定した場合(ステップS42でNO)、処理をステップS37へ戻す。制御部11は終了すると判定した場合(ステップS42でYES)、フラグがオンであるか否かを判定する(
図13のステップS43)。制御部11はフラグがオンでないと判定した場合(ステップS43でNO)、処理をステップS46へ移す。制御部11はフラグがオンであると判定した場合(ステップS43でYES)、警告画面を出力する(ステップS44)。警告画面はユーザ端末2へ送信され、ユーザ端末2の表示部26に表示される。制御部11は再開するか否か判定する(ステップS45)。制御部11は警告画面を出力後、ユーザ端末2から再開指示を受信した場合、再開すると判定する。それ以外の場合、制御部11は再開しないと判定する。制御部11は再開しないと判定した場合(ステップS45でNO)、ステップS45を繰り返す。制御部11は再開すると判定した場合(ステップS45でYES)、全フレームを処理したか否かを判定する(ステップS46)。制御部11は全フレームを処理していないと判定した場合(ステップS46でNO)、処理をステップS32に戻す。制御部11は全フレームを処理したと判定した場合(ステップS46でYES)、処理を終了する。
【0044】
図14は警告画面の例を示す説明図である。警告画面d01は離隔距離が閾値未満の周辺物を検出した場合に表示される画面である。警告画面d01は画像表示領域d011、結果表示領域d012、及び再開ボタンd013を含む。画像表示領域d011は撮影画像を表示する。結果表示領域d012は判定結果を表示する。例えば、周辺物の分類、離隔距離、閾値を表示する。再開ボタンd013を選択する他のフレ-ムについての処理が再開される。
【0045】
警告画面d01の画像表示領域d011において、配電線との離隔距離が閾値未満である周辺物を検出した場合、配電線と周辺物とを強調表示してもよい。
図14に示す例では、該当する配電線d0111が太く見えるように、配電線の認識結果に基づいて、線分が重畳表示されている。同様に、周辺物d0112の輪郭が太く見えるように、線分が重畳表示されている。強調表示は線や輪郭線を太く表示するのに限らず、表示色を変えてもよい。
【0046】
本実施の形態においては、撮影画像の被写体に配電線及びそれ以外の周辺物が含まれる場合、配電線と周辺物との離隔距離を導出することが可能となる。また、離隔距離が閾値未満であること検出した場合、検出元の画像を表示するので、状況を確認することが可能である。
【0047】
上述した第1モデル生成処理、第2モデル生成処理、及び判定処理は、判定サーバ1が行うとしたが、ユーザ端末2が行ってもよい。比較的に処理寮が多い第1モデル生成処理及び第2モデル生成処理は判定サーバ1で行い、生成した第1モデル141及び第2モデル142をユーザ端末2に記憶し、判定処理をユーザ端末2で行ってもよい。
【0048】
警告画面d01において、画像表示領域d011に表示している画像を撮影した位置を示す地図を表示してもよい。制御部11は、表示している画像の名称、タイムコードから、画像位置DB133を検索し、撮影位置の経度、緯度を取得する。制御部11は取得した経度、緯度を、地図配信システムへ送信する。制御部11は地図配信システムから返信された当該経度及び緯度を含む地図画像を、警告画面d01に表示する。
【0049】
各実施の形態で記載されている技術的特徴(構成要件)はお互いに組み合わせ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。
特許請求の範囲には他の2以上のクレームを引用するクレームを記載する形式(マルチクレーム形式)を用いているが、これに限るものではない。マルチクレームを少なくとも一つ引用するマルチクレーム(マルチマルチクレーム)を記載する形式を用いて記載してもよい。
【符号の説明】
【0050】
100 判定システム
1 判定サーバ
11 制御部
11b 判別器
11c 導出部
12 主記憶部
13 補助記憶部
131 設定DB
132 撮影画像DB
133 画像位置DB
134 判定結果DB
141 第1モデル
1411 特徴抽出モジュール
14111 改変FPN
EC 抽出エンコーダ
DC 集約デコーダ
UP アップサンプリング層
14112 連結層
14113 コンボリューション層
1412 視差回帰モジュール
142 第2モデル
1421 エンコーダ
1422 第1デコーダ
1423 第2デコーダ
1424 第3デコーダ
15 通信部
16 読み取り部
1P 制御プログラム
1a 可搬型記憶媒体
1b 半導体メモリ
2 ユーザ端末
3 ステレオカメラ
4 位置測位機
B バス
N ネットワーク