IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ コイト電工株式会社の特許一覧

特開2024-107784機械学習装置、物体検出装置、物体検出システム、機械学習方法
<>
  • 特開-機械学習装置、物体検出装置、物体検出システム、機械学習方法 図1
  • 特開-機械学習装置、物体検出装置、物体検出システム、機械学習方法 図2
  • 特開-機械学習装置、物体検出装置、物体検出システム、機械学習方法 図3
  • 特開-機械学習装置、物体検出装置、物体検出システム、機械学習方法 図4
  • 特開-機械学習装置、物体検出装置、物体検出システム、機械学習方法 図5
  • 特開-機械学習装置、物体検出装置、物体検出システム、機械学習方法 図6
  • 特開-機械学習装置、物体検出装置、物体検出システム、機械学習方法 図7
  • 特開-機械学習装置、物体検出装置、物体検出システム、機械学習方法 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024107784
(43)【公開日】2024-08-09
(54)【発明の名称】機械学習装置、物体検出装置、物体検出システム、機械学習方法
(51)【国際特許分類】
   G06T 7/00 20170101AFI20240802BHJP
【FI】
G06T7/00 350B
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023011887
(22)【出願日】2023-01-30
(71)【出願人】
【識別番号】390010054
【氏名又は名称】コイト電工株式会社
(74)【代理人】
【識別番号】110003339
【氏名又は名称】弁理士法人南青山国際特許事務所
(72)【発明者】
【氏名】内山 知大
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096BA04
5L096DA02
5L096FA18
5L096FA64
5L096GA10
5L096KA04
(57)【要約】
【課題】精度よく物体を検出することができる学習パラメータを生成可能な機械学習装置などの技術を提供すること。
【解決手段】本技術に係る機械学習装置は、制御部を具備する。機械学習装置は、物体の検出領域と、前記物体の検出を規制するための第1のマスクが施された非検出領域とを含む、物体検出における検出用画像に学習パラメータによる推論を適用して物体検出を行う前段階として、学習用画像の学習により前記学習パラメータを生成する装置である。前記制御部は、前記学習用画像において、前記検出用画像における前記検出領域と、前記非検出領域との境界に対応する位置に、前記第1のマスクよりも狭い幅を有する第2のマスクを施し、前記第2のマスクを含む前記学習用画像に基づく学習を行って、前記学習パラメータを生成する。
【選択図】図8
【特許請求の範囲】
【請求項1】
物体の検出領域と、前記物体の検出を規制するための第1のマスクが施された非検出領域とを含む、物体検出における検出用画像に学習パラメータによる推論を適用して物体検出を行う前段階として、学習用画像の学習により前記学習パラメータを生成する機械学習装置であって、
前記学習用画像において、前記検出用画像における前記検出領域と、前記非検出領域との境界に対応する位置に、前記第1のマスクよりも狭い幅を有する第2のマスクを施し、前記第2のマスクを含む前記学習用画像に基づく学習を行って、前記学習パラメータを生成する制御部
を具備する機械学習装置。
【請求項2】
請求項1に記載の機械学習装置であって、
前記第2のマスクの幅は、前記物体検出におけるバウンディングボックスのサイズに関連して設定される
機械学習装置。
【請求項3】
請求項2に記載の機械学習装置であって、
前記第2のマスクの幅は、前記物体検出におけるバウンディングボックスの最小サイズに対応する大きさよりも大きい
機械学習装置。
【請求項4】
請求項1に記載の機械学習装置であって、
前記第2のマスクの幅は、可変に制御される
機械学習装置。
【請求項5】
物体の検出領域と、前記物体の検出を規制するための第1のマスクが施された非検出領域とを含む、物体検出における検出用画像に学習パラメータによる推論を適用して物体検出を行う前段階として、学習用画像の学習により前記学習パラメータを生成する機械学習装置であって、前記学習用画像において、前記検出用画像における前記検出領域と、前記非検出領域との境界に対応する位置に、前記第1のマスクよりも狭い幅を有する第2のマスクを施し、前記第2のマスクを含む前記学習用画像に基づく学習を行って、前記学習パラメータを生成する機械学習装置によって生成された前記学習パラメタメータを入力し、前記検出用画像に前記学習パラメータによる推論を適用して物体検出を行う制御部
を具備する物体検出装置。
【請求項6】
物体の検出領域と、前記物体の検出を規制するための第1のマスクが施された非検出領域とを含む、物体検出における検出用画像に学習パラメータによる推論を適用して物体検出を行う前段階として、学習用画像の学習により前記学習パラメータを生成する機械学習装置であって、前記学習用画像において、前記検出用画像における前記検出領域と、前記非検出領域との境界に対応する位置に、前記第1のマスクよりも狭い幅を有する第2のマスクを施し、前記第2のマスクを含む前記学習用画像に基づく学習を行って、前記学習パラメータを生成する機械学習装置と、
前記検出用画像に前記学習パラメータによる推論を適用して前記物体検出を行う物体検出装置と
を具備する物体検出システム。
【請求項7】
物体の検出領域と、前記物体の検出を規制するための第1のマスクが施された非検出領域とを含む、物体検出における検出用画像に学習パラメータによる推論を適用して物体検出を行う前段階として、学習用画像の学習により前記学習パラメータを生成する機械学習方法あって、
前記学習用画像において、前記検出用画像における前記検出領域と、前記非検出領域との境界に対応する位置に、前記第1のマスクよりも狭い幅を有する第2のマスクを施し、
前記第2のマスクを含む前記学習用画像に基づく学習を行って、前記学習パラメータを生成する
を具備する機械学習方法。
【発明の詳細な説明】
【技術分野】
【0001】
本技術は、物体検出に用いられる学習パラメータを生成する機械学習装置などの技術に関する。
【背景技術】
【0002】
従来から、検出用画像内に検出対象となる物体が写っているかどうかを判定する物体検出技術が広く知られている(例えば、下記特許文献1参照)。
【0003】
物体検出においては、予め、学習用画像が機械学習によって学習されることで学習パラメータが生成される。その後、検出用画像に対して学習パラメータによる推論が適用されて、物体の種類や、物体の存在確率、物体が存在している座標等が判定される。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2022-182437号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
物体検出において、精度よく物体を検出することができる学習パラメータを生成可能な機械学習装置などの技術が求められている。
【0006】
以上のような事情に鑑み、本技術の目的は、精度よく物体を検出することができる学習パラメータを生成可能な機械学習装置などの技術を提供することにある。
【課題を解決するための手段】
【0007】
本技術に係る機械学習装置は、制御部を具備する。
機械学習装置は、物体の検出領域と、前記物体の検出を規制するための第1のマスクが施された非検出領域とを含む、物体検出における検出用画像に学習パラメータによる推論を適用して物体検出を行う前段階として、学習用画像の学習により前記学習パラメータを生成する装置である。
前記制御部は、前記学習用画像において、前記検出用画像における前記検出領域と、前記非検出領域との境界に対応する位置に、前記第1のマスクよりも狭い幅を有する第2のマスクを施し、前記第2のマスクを含む前記学習用画像に基づく学習を行って、前記学習パラメータを生成する。
【0008】
この機械学習装置では、学習用画像において、検出用画像における検出領域と、非検出領域との境界に対応する位置に第2のマスクが施されているので、機械学習において、検出用画像における上記境界を予め学習させることができる。
【0009】
さらに、この機械学習装置では、学習用画像における第2のマスクは、検出用画像の第1のマスクよりも幅が狭くなっているため、機械学習において、無模様で特徴のないマスクから多くを学習してしまうことによる学習パラメータへの悪影響を低減させることができる。これにより、精度よく物体を検出することが可能な学習パラメータを生成することができる。
【0010】
上記機械学習装置において、前記第2のマスクの幅は、前記物体検出におけるバウンディングボックスのサイズに関連して設定されていてもよい。
【0011】
これにより、第2のマスクの幅を適切に設定することができ、さらに精度よく物体を検出することが可能な学習パラメータを生成することができる。
【0012】
上記機械学習装置において、前記第2のマスクの幅は、前記物体検出におけるバウンディングボックスの最小サイズに対応する大きさよりも大きくてもよい。
【0013】
これにより、第2のマスクの幅を適切に設定することができ、さらに精度よく物体を検出することが可能な学習パラメータを生成することができる。
【0014】
上記機械学習装置において、前記第2のマスクの幅は、可変に制御されてもよい。
【0015】
これにより、例えば、検出用画像の種類(例えば、検出領域、非検出領域の位置や、広さが違う)等に応じて、第2のマスクの幅を適切に設定することができ、さらに精度よく物体を検出することが可能な学習パラメータを生成することができる。
【0016】
本技術に係る物体検出装置は、制御部を具備する。
前記制御部は、物体の検出領域と、前記物体の検出を規制するための第1のマスクが施された非検出領域とを含む、物体検出における検出用画像に学習パラメータによる推論を適用して物体検出を行う前段階として、学習用画像の学習により前記学習パラメータを生成する機械学習装置であって、前記学習用画像において、前記検出用画像における前記検出領域と、前記非検出領域との境界に対応する位置に、前記第1のマスクよりも狭い幅を有する第2のマスクを施し、前記第2のマスクを含む前記学習用画像に基づく学習を行って、前記学習パラメータを生成する機械学習装置によって生成された前記学習パラメタメータを入力し、前記検出用画像に前記学習パラメータによる推論を適用して物体検出を行う。
【0017】
本技術に係る物体検出システムは、機械学習装置と、物体検出装置とを具備する。
前記機械学習装置は、物体の検出領域と、前記物体の検出を規制するための第1のマスクが施された非検出領域とを含む、物体検出における検出用画像に学習パラメータによる推論を適用して物体検出を行う前段階として、学習用画像の学習により前記学習パラメータを生成する機械学習装置であって、前記学習用画像において、前記検出用画像における前記検出領域と、前記非検出領域との境界に対応する位置に、前記第1のマスクよりも狭い幅を有する第2のマスクを施し、前記第2のマスクを含む前記学習用画像に基づく学習を行って、前記学習パラメータを生成する。
前記物体検出装置は、前記検出用画像に前記学習パラメータによる推論を適用して前記物体検出を行う。
【0018】
本技術に係る物体検出方法は、物体の検出領域と、前記物体の検出を規制するための第1のマスクが施された非検出領域とを含む、物体検出における検出用画像に学習パラメータによる推論を適用して物体検出を行う前段階として、学習用画像の学習により前記学習パラメータを生成する機械学習方法あって、前記学習用画像において、前記検出用画像における前記検出領域と、前記非検出領域との境界に対応する位置に、前記第1のマスクよりも狭い幅を有する第2のマスクを施し、前記第2のマスクを含む前記学習用画像に基づく学習を行って、前記学習パラメータを生成する。
【発明の効果】
【0019】
以上のように、本技術によれば、精度よく物体を検出することができる学習パラメータを生成可能な機械学習装置などの技術を提供することができる。
【図面の簡単な説明】
【0020】
図1】本技術の一実施形態に係る物体検出システムを示す図である。
図2】物体検出装置による物体検出処理における一連の流れを示す概略図である。
図3】物体検出処理の一例を示すフローチャートである。
図4】撮像装置によって撮像された画像の一例を示す図である。
図5】第1のマスクを含む検出用画像を示す図である。
図6】機械学習装置による機械学習処理における一連の流れを示す概略図である。
図7】機械学習処理の一例を示すフローチャートである。
図8】第2のマスクが施された学習用画像の一例を示す図である。
【発明を実施するための形態】
【0021】
以下、本技術に係る実施形態を、図面を参照しながら説明する。
【0022】
<全体構成及び各部の構成>
図1は、本技術の一実施形態に係る物体検出システム100を示す図である。図1に示すように、物体検出システム100は、撮像装置10と、物体検出装置20と、機械学習装置30とを含む。
【0023】
なお、本実施形態の説明では、物体検出装置20と、機械学習装置30が別体の装置である場合について説明するが、物体検出装置20と、機械学習装置30は、同一の1台の装置であってもよい(例えば、1台の情報処理装置(PC(Personal Computer))。この場合、1台の装置が物体検出処理と、機械学習処理を実行すればよい。
【0024】
本実施形態における物体検出システム100においては、物体検出装置20が、撮像装置10によって取得された画像に対して、機械学習装置30によって生成された学習パラメータによる推論を適用することによって物体検出を行うように構成されている。
【0025】
典型的には、本実施形態に係る物体検出システム100においては、例えば、交差点や車道等を撮像可能な位置に撮像装置10が設置され、撮像装置10からの画像が物体検出装置20へ出力される。物体検出装置20は、撮像装置10から入力された画像に対して、機械学習装置30によって生成された学習パラメータによる推論を適用することによって、検出対象となる物体(車両、歩行者等)を検出し、その種別や、存在確率、座標などを判定する。
【0026】
この判定結果は、例えば、交差点や車道に設置された信号機の点灯を制御する交通管制センタなどに送信され、信号機による点灯色の切り替えのタイミングなどが制御される。
【0027】
本実施形態において、検出対象である物体は、例えば、車道を走行する車両のほか、側道や横断歩道上の歩行者などを含む。車両には、自動車(セダン車、ワゴン車、トラック、軽車両などの種別を含む)、二輪車などが含まれる。
【0028】
なお、本実施形態においては、物体検出システム100が交通制御用途に用いられる場合について説明するが、物体検出システム100は、防犯等ための監視用途、外観不良による異常検知の用途、医療用途等、各種の用途に適用可能である。なお、検出対象となる物体は、用途に応じて変わる可能性があり、つまり、検出対象となる物体はいかなる物体であってもよい。
【0029】
撮像装置10は、例えば、撮像領域を所定のフレームレートで撮像可能なビデオカメラである。撮像装置10は、CCD(Charge Coupled Device)センサやCMOS(Complementary Metal Oxide Semiconductor)センサなどの各種の撮像デバイスや、結像レンズなどの各種の光学系を含む。撮像装置10は、信号機や、電柱、建物の屋上等、比較的に高い位置から交差点、車道を撮像可能な位置に設置され、検出対象となる物体(車両等)が写っている可能性がある画像を取得し、この画像を検出用画像(図4参照)として物体検出装置20へと出力する。
【0030】
物体検出装置20は、撮像された検出用画像内に検出対象となる物体が写っているかどうかを判定することが可能に構成されており、また、検出対象となる物体が写っている場合には、その種類(クラス)や、存在確率、座標などを判定することが可能に構成されている。
【0031】
物体検出装置20は、PC(デスクトップ型、ラップトップ型、タブレット型等)等の汎用の装置であってもよいし、専用の装置であってもよい。物体検出装置20は、制御部21と、記憶部22と、通信部23とを含む。物体検出装置20は、表示部(例えば液晶ディスプレイ)や操作部(例えばキーボード、マウス、タッチセンサ等)を含んでいてもよい。
【0032】
制御部21は、記憶部22に記憶された各種のプログラムに基づき種々の演算を実行し、物体検出装置20の各部を統括的に制御する。典型的には、制御部21は、物体検出処理(例えば、物体検出モデル YOLO)を実行する。
【0033】
物体検出処理においては、制御部21は、撮像装置10によって取得された検出用画像(図4参照)において、物体の非検出領域に第1のマスク1による加工を施し、第1のマスク1を含む検出用画像(図5参照)を生成する。そして、制御部21は、この検出用画像に対して、機械学習装置30によって生成された学習パラメータによる推論を適用することによって物体検出を行う。物体検出処理については、後に詳述する。
【0034】
制御部21は、ハードウェア、又は、ハードウェア及びソフトウェアの組合せにより実現される。ハードウェアは、制御部21の一部又は全部として構成され、このハードウェアとしては、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、VPU(Vision Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)、あるいは、これらのうち2以上の組合せなどが挙げられる。なお、これについては、機械学習装置30の制御部31においても同様である。
【0035】
記憶部22は、制御部21の処理に必要な各種のプログラムや、各種のデータが記憶される不揮発性のメモリと、制御部21の作業領域として用いられる揮発性のメモリとを含む。
【0036】
なお、上記各種のプログラムは、光ディスク、半導体メモリなどの可搬性の記録媒体から読み取られてもよいし、ネットワーク上のサーバ装置からダウンロードされてもよい。これについては、機械学習装置30において同様である。
【0037】
通信部23は、撮像装置10や、機械学習装置30、交通管制センタ等との間で通信可能に構成されている。
【0038】
機械学習装置30は、学習用画像の深層学習による機械学習が可能に構成されており、機械学習によって生成された学習パラメータを物体検出装置20に出力可能に構成されている。
【0039】
機械学習装置30は、PC等の汎用の装置であってもよいし、専用の装置であってもよい。機械学習装置30は、制御部31と、記憶部32と、通信部33とを含む。機械学習装置30は、表示部(例えば液晶ディスプレイ)や操作部(例えばキーボード、マウス、タッチセンサ等)を含んでいてもよい。
【0040】
制御部31は、記憶部32に記憶された各種のプログラムに基づき種々の演算を実行し、機械学習装置30の各部を統括的に制御する。典型的には、制御部31は、機械学習処理を実行する。
【0041】
機械学習処理においては、制御部31は、学習用画像において、検出用画像における検出領域と、非検出領域との境界に対応する位置に、検出用画像の第1のマスク1よりも狭い幅を有する第2のマスク2を施し(図8参照)、第2のマスク2を含む学習用画像に基づく学習を行って、学習パラメータを生成する。この学習パラメータは、物体検出装置20へと送信され、物体検出装置20の記憶部22に記憶される。機械学習処理については、後に詳述する。
【0042】
記憶部32は、制御部31の処理に必要な各種のプログラムや、各種のデータが記憶される不揮発性のメモリと、制御部の作業領域として用いられる揮発性のメモリとを含む。
【0043】
通信部33は、物体検出装置20等との間で通信可能に構成されている。
【0044】
<動作説明>
[物体検出処理]
次に、物体検出処理について説明する。図2は、物体検出装置20による物体検出処理における一連の流れを示す概略図である。図3は、物体検出処理の一例を示すフローチャートである。
【0045】
図2及び図3を参照して、まず、物体検出装置20(制御部21)は、撮像装置10によって撮像された画像が撮像装置10から入力される度に、その画像を記憶部に記憶させ、記憶部に記憶された画像の中から一枚の画像(最新の画像)を読み込む(ステップ101)。次に、物体検出装置20は、画像内における非検出領域(指定エリア)を同じ色及び明るさにすることによって、画像における非検出領域に第1のマスク1を施す(前処理)(ステップ102)。
【0046】
図4は、撮像装置10によって撮像された画像の一例を示す図である。図5は、第1のマスク1を含む検出用画像を示す図である。
【0047】
図5に示すように、物体検出における検出用画像は、物体の検出領域と、物体の検出を規制するための第1のマスク1が施された非検出領域とを含む。非検出領域は、物体の検出が不要である領域としてあらかじめ設定されている。図5に示す例では、両走行方向の走行車線のうち、一方向の走行車線に対応する領域が検出領域に設定されており、それ以外の領域が非検出領域に設定されている。
【0048】
物体検出装置20は、第1のマスク1を含む検出用画像を生成すると、次に、その画像のサイズを、推論のための入力画像サイズに変更する(ステップ103)。次に、物体検出装置20は、サイズが適切なサイズに変更された、第1のマスク1を含む検出用画像に対して、学習パラメータによる推論を適用することによって、検出対象となる物体(車両、歩行者等)を検出し、その種別や、存在確率、座標などを判定する(ステップ104)。この物体検出においては、検出対象となる物体を囲む矩形のバウンディングボックス等が用いられる。
【0049】
次に、物体検出装置20は、物体検出による判定結果を、例えば、交通管制センタ等に送信する(ステップ105)。判定結果は、例えば、信号機の点灯色の切り替えのタイミングの制御等に用いられる。
【0050】
判定結果を送信した後、物体検出装置20は、処理を終了するかどうかを判定し(ステップ106)、処理を継続する場合には(ステップ106のNO)、ステップ101へ戻り、処理を終了する場合には(ステップ106のYES)、処理を終了する。
【0051】
[機械学習処理]
次に、機械学習処理について説明する。図6は、機械学習装置30による機械学習処理における一連の流れを示す概略図である。図7は、機械学習処理の一例を示すフローチャートである。
【0052】
図6及び図7を参照して、まず、機械学習装置30(制御部)は、iの値をi=1に設定し(ステップ201)、予め用意された、複数の学習用画像を含む画像データセットAの中からi番目の学習用画像を記憶部から読み込む(ステップ202)。
【0053】
次に、機械学習装置30は、読み込んだ学習用画像において、指定エリアを同じ色及び明るさにすることによって、検出用画像における検出領域と、非検出領域との境界に対応する位置に、検出用画像の第1のマスク1よりも狭い幅を有する第2のマスク2を施す(ステップ203)。第2のマスク2は、典型的には、帯状の形状を有しているが、その形状は、帯状以外の形状であってもよい。なお、典型的には、学習用画像における第2のマスク2の色、明るさ及びテクスチャは、検出用画像における第1のマスク1の色、明るさ及びテクスチャと同じに設定される。
【0054】
図8は、第2のマスク2が施された学習用画像の一例を示す図である。図8に示すように、学習用画像は、典型的には、検出用画像と同じ画角から撮像された画像が用いられる。
【0055】
図8における学習用画像においては、2本の第2のマスク2が施されている。2本の第2のマスク2のうち、左側の第2のマスク2bの右側の境界線は、検出用画像における左側の第1のマスク1bの右側の境界線の位置と一致するように、その位置が設定されている。また、2本の第2のマスク2のうち、右側の第2のマスク2aの左側の境界線は、検出用画像における右側の第1のマスク1aの左側の境界線の位置と一致するように、その位置が設定されている。
【0056】
なお、典型的には、左側の第2のマスク2bの右側の境界線、右側の第2のマスク2aの左側の境界線は、それぞれ、左側の第1のマスク1bの右側の境界線、右側の第2のマスク2aの左側の境界線と一致するように設定されるが、必ずしも完全に一致している必要はない。つまり、機械学習において、第1のマスク1及び背景の境界部分を予め学習しておけばよいので、第2のマスク2及び背景の境界部分と、第1のマスク1及び背景の境界部分が同等となるように、第2のマスク2の位置が設定されていればよい。
【0057】
例えば、検出用画像において、第1のマスク1及び背景の境界部分が、路面に設定されている場合、学習用画像において、第2のマスク2及び背景の境界部分も路面に設定されていれば、第2のマスク2の位置(マスク2bの右側の境界線の位置、マスク2aの左側の境界線の位置)は、路面の範囲内で変更可能である。
【0058】
本実施形態では、学習用画像における第2のマスク2の幅は、検出用画像における第1のマスク1よりもその幅が狭くなるように設定されている。
【0059】
また、学習用画像における第2のマスク2の幅は、物体検出におけるバウンディングボックスのサイズに関連して設定されていてもよい。この場合、第2のマスク2の幅は、物体検出におけるバウンディングボックスの最小サイズ(これ以上物体が小さい場合には物体検出を行わないサイズ)に対応する大きさよりも大きくなるように設定されていてもよい。また、第2のマスク2の幅は、物体検出におけるバウンディングボックスの最小サイズに対応する大きさの5倍(あるいは、4倍、3倍、2倍等)よりも小さく設定されていてもよい。
【0060】
また、第2の学習用画像における第2のマスク2の幅は、予め1つの値が設定されていてもよいし、可変に制御されてもよい。
【0061】
なお、図8に示す例では、第2のマスク2の数が2本である場合が示されているが、第2のマスク2の数は、1本でも、3本以上でもよく、その数については特に限定されない。また、図8に示す例では、第2のマスク2の形状が直線的(あるいは、少し曲線的)である場合について説明したが、第1のマスク1の形状については、曲線、円形、多角形等、どのような形状であっても構わない。
【0062】
学習用画像に対して第2のマスク2を施すと、次に、機械学習装置30は、第2のマスク2を含む学習用画像を画像データセットBのi番目の画像として記憶部に記憶する(ステップ204)。
【0063】
次に、機械学習装置30は、iの値をi=i+1に設定し(ステップ205)、現在のiの値が、画像データセットAに含まれる学習用画像の総枚数以下の値であるかどうかを判定する(ステップ206)。
【0064】
現在のiの値が画像データセットAに含まれる学習用画像の総枚数以下である場合(ステップ206のYES)、つまり、第2のマスク2が施されていない学習用画像がまだ残っている場合、機械学習装置30は、ステップ202へ戻り、次の学習用画像に対して第2のマスク2を施す処理を実行する。
【0065】
一方、現在のiの値が画像データセットAに含まれる学習用画像の総枚数を超える場合(ステップ206のNO)、つまり、全ての学習用画像に対して第2のマスク2が施された場合、機械学習装置30は、次のステップ207へ進む。
【0066】
ステップ207では、機械学習装置30は、iの値をi=1に設定する。次に、機械学習装置30は、記憶部において画像データセットBからi番目の学習用画像(第2のマスク2を含む)を読み込む(ステップ208)。次に、機械学習装置30は、そのi番目の学習用画像(第2のマスク2を含む)を深層学習による機械学習により学習し、学習パラメータを生成(更新)する(ステップ209)。
【0067】
次に、機械学習装置30は、iの値をi=i+1に設定し(ステップ210)、現在のiの値が、画像データセットBに含まれる学習用画像の総枚数以下の値であるかどうかを判定する(ステップ211)。
【0068】
現在のiの値が画像データセットBに含まれる学習用画像の総枚数以下である場合(ステップ211のYES)、つまり、機械学習が行われていない学習用画像がまだ残っている場合、機械学習装置30は、ステップ208へ戻り、次の学習用画像(第2のマスク2を含む)を機械学習により学習する。
【0069】
一方、現在のiの値が画像データセットBに含まれる学習用画像の総枚数を超える場合(ステップ211のNO)、つまり、全ての学習用画像(第2のマスク2を含む)の機械学習が終了した場合、機械学習装置30は、学習パラメータを物体検出装置20へと送信し(ステップ212)、処理を終了する。
【0070】
なお、機械学習装置30は、学習パラメータが最適化される(例えば、物体検出のための試験用画像での検出精度が設定値以上とされる)まで、ステップ207~ステップ211の処理を繰り返してもよい(繰り返し学習は、画像データセットBの全体を繰り返しの1単位として処理を繰り返してもよく、画像データセットBにおける学習用画像の1枚を繰り返しの1単位として処理を繰り返してもよい)。また、学習の対象となる学習用画像の読み込みの順番は、ランダムであってもよい。
【0071】
<作用等>
次に、本実施形態に係る物体検出システム100の作用等について説明する。ここでの説明では、第1の比較例及び第2の比較例との比較により、本実施形態の作用について説明する。
【0072】
[第1の比較例]
まず、第1の比較例について説明する。第1の比較例においては、機械学習装置30における学習用画像として、図4に示すような、マスクが施されていない画像(例えば撮像されたそのままの画像)が用いられる。そして、機械学習装置30において、このマスクが施されていない学習用画像に基づき、機械学習が行われ、学習パラメータが生成される。
【0073】
また、第1の比較例では、物体検出装置20において、マスクが施されていない画像に基づいて生成された学習パラメータに基づき、物体検出処理が実行される。第1の比較例において、それ以外の点については、本実施形態と同様であり、例えば、物体検出が行われる検出用画像は、図5に示すような、非検出領域に第1のマスク1が施された画像である。
【0074】
第1の比較例では、検出用画像(図5参照)において、第1のマスク1が施された領域(非検出領域)及び第1のマスク1が施されていない領域(検出領域)が存在し、また、第1のマスク1が施された領域と、第1のマスク1が施されていない領域との境界などが存在するが、一方で、学習用画像には、第1のマスク1が施された領域や、上記境界などは存在しない。
【0075】
このため、第1の比較例では、学習用画像において学習していない第1のマスク1や上記境界を含む検出用画像に対して物体検出を行うことになるため、物体の検出精度が低下してしまうといった問題がある。
【0076】
[第2の比較例]
次に、第2の比較例について説明する。上述の第1の比較例において説明したように、学習用画像において学習していない対象を含む検出用画像に対して物体検出を行おうとすると物体検出の精度が低下してしまう。このため、第2比較例においては、学習用画像において物体検出用画像と同様の画像が用いられる(図5参照)。
【0077】
つまり、第2比較例では、 機械学習装置30における学習用画像として、図5に示すような、検出用画像と同様の第1のマスク1が施された画像が用いられ、この第1のマスク1が施された学習用画像に基づき、機械学習が行われ、学習パラメータが生成される。
【0078】
また、第2の比較例では、物体検出装置20において、検出用画像と同様の第1のマスク1が施された画像に基づいて生成された学習パラメータに基づき、物体検出処理が実行される。
【0079】
第2の比較例では、学習用画像において物体検出用画像と同様の画像が用いられるので、学習用画像において第1のマスク1や上記境界部分(背景として認識)が学習済みとなる。したがって、第1のマスク1や上記境界を含む検出用画像において物体検出を行う際に、物体の検出精度を向上させることができるとも考えられる。
【0080】
しかしながら、本発明者らが実際に第2の比較例による物体検出を行った結果、第1の比較例よりも物体の検出精度は向上するものの、その効果は限定的であり、その効果があまりないことが分かった。
【0081】
これは、以下の理由によるものと考えられる。まず、図5に示すような第1のマスク1を含む画像が学習用画像として用いられた場合、第1のマスク1の領域が広いので、濃淡のない平面的な第1のマスク1から多くのことを学んでしまい、これが学習パラメータに悪影響を与えていると考えられる。例えば、検出の対象となる車両が、濃淡のない平面的な部分(ボンネット、屋根等)を少しでも含んでいる場合、検出対象ではないと判断してしまう可能性がある。
【0082】
また、図5に示すような第1のマスク1を含む画像が学習用画像として用いられた場合、第1のマスク1の領域が広いので、学習の対象となる物体の数が減り、学習の効率が落ちることによって物体の検出精度が低下してしまうと考えられる。
【0083】
[本実施形態]
そこで、本実施形態においては、学習用画像において、検出用画像における検出領域と、非検出領域との境界に対応する位置に、検出用画像の第1のマスク1よりも狭い幅を有する第2のマスク2を施し、第2のマスク2を含む学習用画像に基づく学習を行って、学習パラメータを生成することとしている。
【0084】
本実施形態に係る機械学習装置30では、学習用画像において、検出用画像における検出領域と、非検出領域との境界に対応する位置に第1のマスク1が施されているので、機械学習において、検出用画像における上記境界(背景として認識)を予め学習させることができる。
【0085】
さらに、本実施形態に係る機械学習装置30では、学習用画像における第2のマスク2は、検出用画像の第1のマスク1よりも幅が狭くなっているため、機械学習において、無模様で特徴のない第1のマスク1から多くを学習してしまうことによる学習パラメータへの悪影響を低減させることができ、また、学習の対象となる物体の数を増やすことで学習の効率も向上させることもできる。これにより、精度よく物体を検出することが可能な学習パラメータを生成することができる。
【0086】
本発明者らが実際に本実施形態による物体検出を行った結果、第1の比較例及び第2の比較例よりも物体の検出精度が向上することが分かっている。
【0087】
本実施形態において、学習用画像の第2のマスク2の幅は、典型的には、検出用画像の第1のマスク1の幅よりも狭ければよいが、あまり狭すぎると、上記境界が認識されず、境界部分の学習が行われない可能性がある。このため、例えば、第2のマスク2の幅は、物体検出におけるバウンディングボックスの最小サイズ(これ以上物体が小さい場合には物体検出を行わないサイズ)に対応する大きさよりも大きくなるように設定されていてもよい。
【0088】
一方、学習用画像の第2のマスク2の幅は、あまり広すぎると、上記したような第1のマスク1からの不必要な学習などがおこなわれてしまう可能性がある。このため、例えば、第2のマスク2の幅は、物体検出におけるバウンディングボックスの最小サイズに対応する大きさの5倍(あるいは、4倍、3倍、2倍等)よりも小さく設定されていてもよい。
【0089】
また、第2の学習用画像における第2のマスク2の幅は、予め1つの値が設定されていてもよいし、可変に制御されてもよい(バウンディングボックスのサイズに関連して可変に制御することも可能)。第2のマスク2の幅が可変に制御される場合、検出用画像の種類(例えば、検出領域、非検出領域の位置や、広さが違う)等に応じて、第2のマスクの幅を適切に変更することができる。
【符号の説明】
【0090】
1…マスク
2…第2のマスク
10…撮像装置
20…物体検出装置
21…制御部
30…機械学習装置
31…制御部
100…物体検出システム
図1
図2
図3
図4
図5
図6
図7
図8