IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オムロン株式会社の特許一覧

特開2024-35390学習装置、画像セグメンテーション装置、学習方法、及びプログラム
<>
  • 特開-学習装置、画像セグメンテーション装置、学習方法、及びプログラム 図1
  • 特開-学習装置、画像セグメンテーション装置、学習方法、及びプログラム 図2
  • 特開-学習装置、画像セグメンテーション装置、学習方法、及びプログラム 図3
  • 特開-学習装置、画像セグメンテーション装置、学習方法、及びプログラム 図4
  • 特開-学習装置、画像セグメンテーション装置、学習方法、及びプログラム 図5
  • 特開-学習装置、画像セグメンテーション装置、学習方法、及びプログラム 図6
  • 特開-学習装置、画像セグメンテーション装置、学習方法、及びプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024035390
(43)【公開日】2024-03-14
(54)【発明の名称】学習装置、画像セグメンテーション装置、学習方法、及びプログラム
(51)【国際特許分類】
   G06V 10/70 20220101AFI20240307BHJP
   G06T 7/00 20170101ALI20240307BHJP
【FI】
G06V10/70
G06T7/00 350B
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022139818
(22)【出願日】2022-09-02
(71)【出願人】
【識別番号】000002945
【氏名又は名称】オムロン株式会社
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(74)【代理人】
【識別番号】100139066
【弁理士】
【氏名又は名称】伊藤 健太郎
(72)【発明者】
【氏名】西本(内田) 滋穂里
(72)【発明者】
【氏名】西本 崇志
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096FA02
5L096GA34
5L096KA04
5L096KA15
(57)【要約】
【課題】線形形状の物体を、正確かつ効率的に認識する技術を提供する。
【解決手段】モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置におけるモデルを学習する学習装置であって、画像中で認識対象を識別する特徴量を評価する第1の損失関数によって計算される第1の評価値を取得する第1の評価値取得部と、画像中で識別された認識対象の連続性を評価する第2の損失関数によって計算される第2の評価値を取得する第2の評価値取得部と、第1の評価値および第2の評価値に基づいて誤差逆伝播を行うことにより、モデルを最適化する学習を行う学習実行部と、を備える。
【選択図】図4
【特許請求の範囲】
【請求項1】
モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置における前記モデルを学習する学習装置であって、
前記画像中で前記認識対象を識別する特徴量を評価する第1の損失関数によって計算される第1の評価値を取得する第1の評価値取得部と、
前記画像中で識別された前記認識対象の連続性を評価する第2の損失関数によって計算される第2の評価値を取得する第2の評価値取得部と、
前記第1の評価値および前記第2の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行う学習実行部と、を備えた学習装置。
【請求項2】
前記認識対象の輪郭を強調した特徴量を評価する第3の損失関数によって計算される第3の評価値を取得する第3の評価値取得部を備え、
前記学習実行部は、
前記第1の評価値、前記第2の評価値、および前記第3の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行う、請求項1に記載の学習装置。
【請求項3】
前記第2の評価値取得部は、
前記認識対象の正しいセグメンテーションマスクの位置を示す正解行列データと、前記正しいセグメンテーションマスクの位置を移動した行列データの各要素を掛け合わせた第1の要素積行列を計算する第1の要素積計算部と、
前記認識対象のセグメンテーションマスクの予測位置を示す予測行列データと、前記セグメンテーションマスクの予測位置を前記正しいセグメンテーションマスクと同様に移動した行列データの各要素を掛け合わせた第2の要素積行列を計算する第2の要素積計算部と、
前記第1の要素積行列と前記第2の要素積行列の差分を前記第2の損失関数として、第2の評価値を計算する評価値算出部と、を備えた請求項1に記載の学習装置。
【請求項4】
前記認識対象は線形形状の物体であり、
前記第1の要素積計算部は、前記正しいセグメンテーションマスクの位置を前記線形形状の長さ方向に移動した行列データの各要素を掛け合わせた第1の要素積行列を計算する、請求項3に記載の学習装置。
【請求項5】
モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置であって、
前記モデルは、請求項1に記載の学習装置によって学習されたモデルであり、
学習済みの前記モデルを用いて、画像中の前記認識対象のセグメンテーションを行うセグメンテーション実行部を備えた画像セグメンテーション装置。
【請求項6】
モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置における前記モデルを学習する学習方法であって、
前記画像中で前記認識対象を識別する特徴量を評価する第1の損失関数によって計算される第1の評価値を取得する工程と、
前記画像中で識別された前記認識対象の連続性を評価する第2の損失関数によって計算される第2の評価値を取得する工程と、
前記第1の評価値および前記第2の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行う工程と、を備えた学習方法。
【請求項7】
モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置における前記モデルの学習を実行するコンピュータを、
前記画像中で前記認識対象を識別する特徴量を評価する第1の損失関数によって計算される第1の評価値を取得する第1の評価値取得部と、
前記画像中で識別された前記認識対象の連続性を評価する第2の損失関数によって計算される第2の評価値を取得する第2の評価値取得部と、
前記第1の評価値および前記第2の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行う学習実行部として、機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、画像セグメンテーション装置、学習方法、及びプログラムに関する。
【背景技術】
【0002】
日常生活や産業の場面において、線形形状の物体を認識する場面は数多い。このため、近年活用されている画像認識技術の分野でも、線形形状の物体を正確に認識できる技術が求められている。
【0003】
例えば特許文献1には、画像内の全画素にラベルを付与するディープラーニングを用いたセマンティックセグメンテーションによって、線状に発生するクラックなどの認識分解能を高める方法が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2021-184163号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、従来の方法では、線形形状の物体が持つ連続性や、輪郭の不定形状などの特徴を、正確かつ効率的に評価することはできなかった。
【0006】
本発明は、線形形状の物体を、正確かつ効率的に認識する技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明は、上述した課題を解決するために、以下の構成を採用する。
本発明の一側面に係る学習装置は、モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置における前記モデルを学習する学習装置であって、前記画像中で前記認識対象を識別する特徴量を評価する第1の損失関数によって計算される第1の評価値を取得する第1の評価値取得部と、前記画像中で識別された前記認識対象の連続性を評価する第2の損失関数によって計算される第2の評価値を取得する第2の評価値取得部と、前記第1の評価値および前記第2の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行う学習実行部と、を備えたものである。
上記構成により、線形形状の物体が持つ連続性の特徴に対する評価の精度が向上するので、線形形状の物体を正確に認識するモデルを生成することができる。
【0008】
また、前記認識対象の輪郭を強調した特徴量を評価する第3の損失関数によって計算される第3の評価値を取得する第3の評価値取得部を備え、前記学習実行部は、前記第1の評価値、前記第2の評価値、および前記第3の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行うようにしてもよい。これにより、線形形状の物体が持つ不定形状輪郭の特徴に対する評価の精度が向上するので、線形形状の物体を正確に認識するモデルを生成することができる。
【0009】
また、前記第2の評価値取得部は、前記認識対象の正しいセグメンテーションマスクの位置を示す正解行列データと、前記正しいセグメンテーションマスクの位置を移動した行列データの各要素を掛け合わせた第1の要素積行列を計算する第1の要素積計算部と、前記認識対象のセグメンテーションマスクの予測位置を示す予測行列データと、前記セグメンテーションマスクの予測位置を前記正しいセグメンテーションマスクと同様に移動した行列データの各要素を掛け合わせた第2の要素積行列を計算する第2の要素積計算部と、前記第1の要素積行列と前記第2の要素積行列の差分を前記第2の損失関数として、第2の評価値を計算する評価値算出部と、を備えるようにしてもよい。これにより、線形形状の物体が持つ連続性の特徴に対する評価に適したモデルの学習を行うことができる。
【0010】
また、前記認識対象は線形形状の物体であり、前記第1の要素積計算部は、前記正しいセグメンテーションマスクの位置を前記線形形状の長さ方向に移動した行列データの各要素を掛け合わせた第1の要素積行列を計算するようにしてもよい。これにより、線形形状の物体が持つ連続性の特徴に対する評価に適したモデルの学習を行うことができる。
【0011】
本発明の一側面に係る画像セグメンテーション装置は、モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置であって、前記モデルは、上記の学習装置によって学習されたモデルであり、学習済みの前記モデルを用いて、画像中の前記認識対象のセグメンテーションを行うセグメンテーション実行部を備えたものである。これにより、線形形状の物体が持つ連続性の特徴に対する評価の精度が向上するので、線形形状の物体を正確に認識することができる。
【0012】
本発明の一側面に係る学習方法は、モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置における前記モデルを学習する学習方法であって、前記画像中で前記認識対象を識別する特徴量を評価する第1の損失関数によって計算される第1の評価値を取得する工程と、前記画像中で識別された前記認識対象の連続性を評価する第2の損失関数によって計算される第2の評価値を取得する工程と、前記第1の評価値および前記第2の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行う工程と、を備えたものである。上記構成により、線形形状の物体が持つ連続性の特徴に対する評価の精度が向上するので、線形形状の物体を正確に認識するモデルを生成することができる。
【0013】
本発明の一側面に係るプログラムは、モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置における前記モデルの学習を実行するコンピュータを、前記画像中で前記認識対象を識別する特徴量を評価する第1の損失関数によって計算される第1の評価値を取得する第1の評価値取得部と、前記画像中で識別された前記認識対象の連続性を評価する第2の損失関数によって計算される第2の評価値を取得する第2の評価値取得部と、前記第1の評価値および前記第2の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行う学習実行部として、機能させるものである。上記構成により、線形形状の物体が持つ連続性の特徴に対する評価の精度が向上するので、線形形状の物体を正確に認識するモデルを生成することができる。
【発明の効果】
【0014】
本発明によれば、線形形状の物体を、正確かつ効率的に認識する技術を提供することができる。
【図面の簡単な説明】
【0015】
図1】本発明の実施形態に係る学習装置1と画像セグメンテーション装置2の概要を示す図。
図2】本発明の実施形態に係る学習装置1と画像セグメンテーション装置2のハードウェア構成の一例を示す図。
図3】本発明の実施形態に係る学習装置1と画像セグメンテーション装置2の機能構成の一例を示す図。
図4】本発明の実施形態に係る学習装置1によるモデルの学習の手順を示すフローチャート。
図5】本発明の実施形態に係る学習装置1による第2の評価値の計算方法を説明する図。
図6】本発明の実施形態に係る画像セグメンテーション装置2によるセグメンテーションの手順を示すフローチャート。
図7】本発明の実施形態に係る線形形状の物体のセグメンテーションを説明する図。
【発明を実施するための形態】
【0016】
以下、本発明の一側面に係る実施の形態(以下「本実施形態」とも表記する)を、図面に基づいて説明する。ただし、以下で説明する実施形態は、あらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。なお、本実施形態において登場するデータを自然言語により説明しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメータ、マシン語等で指定される。
【0017】
§1 適用例
図1を用いて、本発明が適用される場面の一例について説明する。図1は、本発明による学習装置1と画像セグメンテーション装置2の概要を示す図である。画像セグメンテーション装置2は、セグメンテーション実行部201において、学習装置1によって学習が実行された学習済みモデルを用いて、画像中の認識対象のインスタンスセグメンテーションを行う。
【0018】
学習装置1によって学習が実行される学習済みモデルは、針金や電線などの線形形状の物体のセグメンテーションに適したものである。学習装置1は、第1の評価値取得部101において第1の損失関数によって計算される第1の評価値を取得し、第2の評価値取得部102において第2の損失関数によって計算される第2の評価値を取得し、学習実行部104において第1の評価値と第2の評価値に基づく誤差逆伝播により、学習を実行する。第1の評価値は画像中の認識対象を識別する特徴量を評価する値であり、第2の評価値は画像中で識別された認識対象の連続性を評価する値である。
【0019】
§2 構成例
(1.ハードウェア構成)
次に、図2を用いて、本実施形態に係る学習装置1と画像セグメンテーション装置2のハードウェア構成の一例について説明する。
図2に示すように、学習装置1は、ハードウェア資源として、プロセッサ11と、メインメモリ12と、入出力インタフェース13と、通信インタフェース14と、記憶装置15とを備えるコンピュータである。記憶装置15は、半導体メモリ(例えば、揮発性メモリや不揮発性メモリ)、またはディスク媒体(例えば、磁気記録媒体や光磁気記録媒体)などのコンピュータ読み取り可能な記録媒体である。記憶装置15には、プロセッサ11に、画像中の認識対象のセグメンテーションを行うモデルの学習を実行させるためのプログラムや、学習を行うモデル、学習に用いる画像のデータセット等が記憶されている。プログラムは、記憶装置15からメインメモリ12に読み込まれ、プロセッサ11により解釈及び実行されることにより、各種機能が実行される。
【0020】
画像セグメンテーション装置2は、ハードウェア資源として、プロセッサ21と、メインメモリ22と、入出力インタフェース23と、通信インタフェース24と、記憶装置25とを備えるコンピュータである。記憶装置25は、半導体メモリ(例えば、揮発性メモリや不揮発性メモリ)、またはディスク媒体(例えば、磁気記録媒体や光磁気記録媒体)などのコンピュータ読み取り可能な記録媒体である。記憶装置25には、プロセッサ21に、学習済みのモデルを用いて、画像中の認識対象のセグメンテーションを実行させるためのプログラムや、学習済みのモデルが記憶されている。プログラムは、記憶装置25からメインメモリ22に読み込まれ、プロセッサ21により解釈及び実行されることにより、各種機能が実行される。
【0021】
(2.機能構成)
次に、図3を用いて、本実施形態に係る学習装置1と画像セグメンテーション装置2の機能構成の一例について説明する。図3は、学習装置1のプロセッサ11と、画像セグメンテーション装置2のプロセッサ12によって実行される機能モジュールを示すブロック図である。図3に示すように、学習装置1のプロセッサ11によって実行される機能モジュールには、第1の評価値取得部101、第2の評価値取得部102、第3の評価値取得部103、学習実行部104が含まれる。第2の評価値取得部102には、第1の要素積計算部1021、第2の要素積計算部1022、評価値算出部1023が含まれる。
【0022】
また、画像セグメンテーション装置2のプロセッサ21によって実行される機能モジュールには、セグメンテーション実行部201が含まれる。
【0023】
§3 動作例
次に、本実施形態に係る学習装置1によるモデルの学習の手順について、図4のフローチャートを用いて説明する。機械学習に用いる画像のデータセットは、針金や電線のような線形形状の物体を含んでおり、機械学習では、これらの線形形状の物体を認識対象として、正しいセグメンテーションを行えるようにモデルを最適化する。
【0024】
まず、第1の評価値取得部101において、学習用の画像のインスタンスセグメンテーションを行うための特徴量を評価する損失関数(第1の損失関数)を用いて、第1の評価値を計算する(ステップS101)。損失関数としては、例えばDiscriminative Lossを用いることができる。
【0025】
次に、第2の評価値取得部102において、学習用の画像中で識別された認識対象の連続性を評価する損失関数(第2の損失関数)を用いて、第2の評価値を計算する(ステップS102)。
【0026】
第2の評価値の計算について、図5を用いて詳しく説明する。まず第1の要素積計算部1021は、画像中の認識対象に対する正しいセグメンテーションマスクの位置(図中「1」で示された要素の領域)を示した正解データ(グランドトゥルース)に対応する正解行列(GT1)と、GT1に対してセグメンテーションマスクの位置を移動させた行列(GT2)の各要素を掛け合わせた第1の要素積行列(MT1)を計算する(ステップ(1))。
【0027】
認識対象が線形形状の物体の場合、第1の要素積計算部1021は、行列GT1における正しいセグメンテーションマスクの位置を、線形形状の長さ方向に移動させた行列をGT2とすることができる。
【0028】
ここで、行列GT1(M(0,0))と、マスクの位置を縦方向にh、横方向にw移動させた行列GT2(M(Δh,Δw))の要素積行列MT1(Mk,Δh,Δw)は、下記の式で表すことができる。
【0029】
【数1】
【0030】
次に、第2の要素積計算部1022は、認識対象のセグメンテーションマスクの予測位置(図中、枠線で囲ったMSの領域)を示す予測行列(GT3)と、GT3に対してセグメンテーションマスクの位置を移動させた行列(GT4)の各要素を掛け合わせた第2の要素積行列(MT2)を計算する(ステップ(2))。
【0031】
なお、行列GT3に対するセグメンテーションマスクの位置の移動は、ステップ(1)における行列GT1に対するセグメンテーションマスクの位置の移動と同様に行う。行列GT3と、マスクの位置を縦方向にh、横方向にw移動させた行列GT4の要素積行列MT2は、下記の式で表すことができる。
【0032】
【数2】
ただし、
【数3】
は、行列GT3
【数4】
は、行列GT4
【数5】
は、要素積行列MT2である。
【0033】
次に、評価値算出部1023は、ステップ(1)で得られた第1の要素積行列MT1と、ステップ(2)で得られた第2の要素積行列MT2の差分を第2の損失関数として、第2の評価値を計算する(ステップ(3))。第2の損失関数(Lsmooth)は、下記の式で表すことができる。下記式において、A[i,j]は、行列Aのi行j列要素を表す。また、Nは学習時のバッチサイズに対応する。Lsmoothを用いることで連続性を念頭においた学習が可能になるが、一方で、認識対象の輪郭をぼやかしてしまう効果もある。そのため、次のステップでは、輪郭を強調する働きをする損失関数を利用する。
【0034】
【数6】
【0035】
次に、第3の評価値取得部103は、認識対象の輪郭を強調した特徴量を評価する損失関数(第3の損失関数)を用いて、第3の評価値を計算する(ステップS103)。第3の評価値は、認識対象のセマンティックマスクの正解データ(GT)を輪郭で重みづけしたものM’を用いて損失関数を計算することにより得られる。具体的には、例えば下記式のようにFocal Loss(Ledge)を用いることができる。
【0036】
【数7】
【0037】
M’は輪郭で重みづけされたセマンティックGTマスクであり、次式で与えられる。Fは正解データから計算したエッジ画像であり、[0,1]の範囲で正規化されている。エッジ画像上で、閾値thr以上のピクセルについてはα(例えば、α=2)倍の重みづけを行って強調する。
【0038】
【数8】
エッジが強調されたマスクM’と、モデルから出力された予測マスクのFocal Lossを計算することで、輪郭部分を強調した特徴量の学習が可能となる。
【0039】
次に、学習実行部104は、ステップS101で計算した第1の評価値と、ステップS102で計算した第2の評価値と、ステップS103で計算した第3の評価値に基づいて誤差逆伝播を行うことにより、モデルを最適化する(ステップS104)。
【0040】
次に、本実施形態に係る画像セグメンテーション装置2によるセグメンテーションの手順について、図6のフローチャートを用いて説明する。
画像セグメンテーション装置2は、セグメンテーションを実施する画像データを取得する(ステップS201)。
【0041】
次に、セグメンテーション実行部201は、学習装置1によって最適化されたモデルを用いて、画像データのインスタンスセグメンテーションを実行する(ステップS202)。
【0042】
以上のように、本実施形態によれば、既存手法であるDiscriminative Lossのような損失関数によって計算される評価値に加えて、認識対象の連続性を評価する損失関数によって計算される評価値を利用して、画像セグメンテーションを行う学習モデルを最適化するようにした。これにより、線形形状の物体が持つ連続性の特徴に対する評価に適した学習モデルを生成することができる。電線などの細長い形状の物体のセグメンテーションにおいては、実際には図7(A)に示すように2点間を繋ぐ形状を有していても、セグメンテーションによる予測を行うと、図7(B)に示すような途中で途切れた形状になってしまうことがある。本実施形態によれば、連続性を考慮したモデルの評価を行うことにより、このように途中で途切れたマスクを生成しないモデルを得ることができる。
【0043】
さらに、認識対象の輪郭で重みづけをした損失関数によって計算される評価値も加えて画像セグメンテーションを行う学習モデルを最適化するようにしたので、線形形状の物体が持つ不定形状輪郭の特徴にも適応したモデルを得ることができる。例えば、針金が組み合わされたフェンスなどの場合、重なり合った部分の輪郭の高精度な認識が難しいことがあるが、本実施形態によれば、このような場合にも精度よくマスクを生成することができる。
【0044】
本実施形態に係るセグメンテーションのモデルは、インスタンスセグメンテーションを精度よく行うことができるが、セマンティックセグメンテーションにも適用することができる。
【0045】
以上、本発明の実施の形態を詳細に説明してきたが、上述までの説明はあらゆる点において本発明の例示に過ぎない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。なお、上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
【0046】
(付記1)
モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置における前記モデルを学習する学習装置であって、
前記画像中で前記認識対象を識別する特徴量を評価する第1の損失関数によって計算される第1の評価値を取得する第1の評価値取得部と、
前記画像中で識別された前記認識対象の連続性を評価する第2の損失関数によって計算される第2の評価値を取得する第2の評価値取得部と、
前記第1の評価値および前記第2の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行う学習実行部と、を備えた学習装置。
【0047】
(付記2)
前記認識対象の輪郭を強調した特徴量を評価する第3の損失関数によって計算される第3の評価値を取得する第3の評価値取得部を備え、
前記学習実行部は、
前記第1の評価値、前記第2の評価値、および前記第3の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行う、付記1に記載の学習装置。
【0048】
(付記3)
前記第2の評価値取得部は、
前記認識対象の正しいセグメンテーションマスクの位置を示す正解行列データと、前記正しいセグメンテーションマスクの位置を移動した行列データの各要素を掛け合わせた第1の要素積行列を計算する第1の要素積計算部と、
前記認識対象のセグメンテーションマスクの予測位置を示す予測行列データと、前記セグメンテーションマスクの予測位置を前記正しいセグメンテーションマスクと同様に移動した行列データの各要素を掛け合わせた第2の要素積行列を計算する第2の要素積計算部と、
前記第1の要素積行列と前記第2の要素積行列の差分を前記第2の損失関数として、第2の評価値を計算する評価値算出部と、を備えた付記1に記載の学習装置。
【0049】
(付記4)
前記認識対象は線形形状の物体であり、
前記第1の要素積計算部は、前記正しいセグメンテーションマスクの位置を前記線形形状の長さ方向に移動した行列データの各要素を掛け合わせた第1の要素積行列を計算する、付記3に記載の学習装置。
【0050】
(付記5)
モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置であって、
前記モデルは、付記1に記載の学習装置によって学習されたモデルであり、
学習済みの前記モデルを用いて、画像中の前記認識対象のセグメンテーションを行うセグメンテーション実行部を備えた画像セグメンテーション装置。
【0051】
(付記6)
モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置における前記モデルを学習する学習方法であって、
前記画像中で前記認識対象を識別する特徴量を評価する第1の損失関数によって計算される第1の評価値を取得する工程と、
前記画像中で識別された前記認識対象の連続性を評価する第2の損失関数によって計算される第2の評価値を取得する工程と、
前記第1の評価値および前記第2の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行う工程と、を備えた学習方法。
【0052】
(付記7)
モデルを用いて画像中の認識対象のセグメンテーションを行う画像セグメンテーション装置における前記モデルの学習を実行するコンピュータを、
前記画像中で前記認識対象を識別する特徴量を評価する第1の損失関数によって計算される第1の評価値を取得する第1の評価値取得部と、
前記画像中で識別された前記認識対象の連続性を評価する第2の損失関数によって計算される第2の評価値を取得する第2の評価値取得部と、
前記第1の評価値および前記第2の評価値に基づいて誤差逆伝播を行うことにより、前記モデルを最適化する学習を行う学習実行部として、機能させるプログラム。
【符号の説明】
【0053】
1…学習装置、2…画像セグメンテーション装置、11,21…プロセッサ、12,22…メインメモリ、13,23…入出力インタフェース、14,24…通信インタフェース、15,25…記憶装置、101…第1の評価値取得部、102…第2の評価値取得部、103…第3の評価値取得部、104…学習実行部、201…セグメンテーション実行部、1021…第1の要素積計算部、1022…第2の要素積計算部、1023…評価値算出部
図1
図2
図3
図4
図5
図6
図7