特開2023-120854 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱重工業株式会社の特許一覧 ▶ 独立行政法人産業技術総合研究所の特許一覧

特開2023-120854情報処理装置、検知装置、情報処理方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023120854

(43)【公開日】2023-08-30

(54)【発明の名称】情報処理装置、検知装置、情報処理方法及びプログラム

(51)【国際特許分類】

G06T 7/00 20170101AFI20230823BHJP

【ＦＩ】

G06T7/00 350B

【審査請求】未請求

【請求項の数】11

【出願形態】ＯＬ

(21)【出願番号】P 2022023954

(22)【出願日】2022-02-18

(71)【出願人】

【識別番号】000006208

【氏名又は名称】三菱重工業株式会社

(71)【出願人】

【識別番号】301021533

【氏名又は名称】国立研究開発法人産業技術総合研究所

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】小林周

(72)【発明者】

【氏名】松本知浩

(72)【発明者】

【氏名】杉本喜一

(72)【発明者】

【氏名】岩田健司

【テーマコード（参考）】

5L096

【Ｆターム（参考）】

5L096FA69

5L096JA03

5L096JA11

5L096KA04

(57)【要約】

【課題】学習負荷を抑制しつつ、誤検知を抑制する。
【解決手段】情報処理装置は、第１画像のデータを、学習済みの第１識別モデルに入力することで、第１画像に誤検知物が含まれるかの判断結果を出力させる第１画像解析部と、誤検知物が含まれると判断された第１画像のデータと、その第１画像に誤検知物が存在することを示す指定情報と、を教師データとして、第２識別モデルに、画像内における誤検知物の有無を機械学習させる学習部と、監視対象となる検知領域が写る第２画像のデータを、学習済みの第２識別モデルに入力することで、第２画像に前記誤検知物が含まれるかの判断結果を出力させる第２画像解析部と、誤検知物が含まれると判断された検知領域が写る第３画像のデータを教師データとして、第１識別モデルを更に学習させる再学習部と、を含む。
【選択図】図６

【特許請求の範囲】

【請求項1】

画像内における対象物の有無を機械学習させた第１識別モデルと、
画像内において前記対象物であると誤検知される誤検知物の有無を機械学習可能な第２識別モデルと、
第１画像のデータを、学習済みの前記第１識別モデルに入力することで、前記第１画像に誤検知物が含まれるかの判断結果を出力させる第１画像解析部と、
前記第１画像解析部によって前記誤検知物が含まれると判断された前記第１画像のデータと、その第１画像に前記誤検知物が存在することを示す指定情報と、を教師データとして、前記第２識別モデルに、画像内における前記誤検知物の有無を機械学習させる学習部と、
監視対象となる検知領域が写る第２画像のデータを、学習済みの前記第２識別モデルに入力することで、前記第２画像に前記誤検知物が含まれるかの判断結果を出力させる第２画像解析部と、
前記第２画像解析部によって前記誤検知物が含まれると判断された前記検知領域が写る第３画像のデータを教師データとして、前記第１識別モデルを更に学習させる再学習部と、
を含む、
情報処理装置。

【請求項2】

前記第１画像解析部は、前記第１画像のデータを、学習済みの前記第１識別モデルに入力することで、前記第１画像における前記誤検知物の位置を示す情報を出力させ、
前記学習部は、前記第１画像における前記誤検知物の位置に基づいて設定された前記誤検知物の位置を示す情報を、前記指定情報として、前記第２識別モデルに機械学習させる、請求項１に記載の情報処理装置。

【請求項3】

前記第１画像解析部は、撮像領域の少なくとも一部が重複し、かつ画像データが異なる複数の前記第１画像を、学習済みの前記第１識別モデルに入力することで、前記第１画像毎に、前記誤検知物の位置を示す情報を出力させ、
前記学習部は、前記第１画像毎の前記誤検知物の位置を示す情報に基づいて、１つの前記第１画像における前記誤検知物の位置を示す情報を、前記指定情報として設定する、請求項２に記載の情報処理装置。

【請求項4】

前記学習部は、それぞれの前記第１画像における前記誤検知物同士の位置が重ならない場合には、位置が重ならないそれぞれの前記誤検知物の位置を、前記第１画像における前記誤検知物の位置として指定して、前記指定情報を設定する、請求項３に記載の情報処理装置。

【請求項5】

前記学習部は、それぞれの前記第１画像における前記誤検知物同士の位置が重なる場合には、位置が重なるそれぞれの前記誤検知物の位置を含む領域を、前記第１画像における前記誤検知物の位置として指定して、前記指定情報を設定する、請求項３又は請求項４に記載の情報処理装置。

【請求項6】

前記学習部は、前記領域と位置が重なる前記誤検知物の数が多いほど、その領域が前記対象物として誤検知される確率が高い旨を示す重み付け指標を、教師データとして、前記第２識別モデルに機械学習させる、請求項５に記載の情報処理装置。

【請求項7】

前記第２画像解析部は、異なる検知領域が写る複数の前記第２画像のデータを、学習済みの前記第２識別モデルに入力することで、それぞれの前記第２画像について、前記誤検知物が含まれるかの判断結果を出力させ、
前記再学習部は、それぞれの前記検知領域のうちで、前記誤検知物が含まれると判断された前記検知領域が写る前記第３画像のデータで、前記第１識別モデルを更に学習させる、請求項１から請求項６のいずれか１項に記載の情報処理装置。

【請求項8】

前記再学習部は、前記誤検知物が含まれると判断された前記検知領域が写る前記第３画像のデータと、前記第３画像に前記対象物が含まれない旨を示す情報と、を教師データとして、前記第１識別モデルを更に学習させる、請求項１から請求項７のいずれか１項に記載の情報処理装置。

【請求項9】

請求項１から請求項８のいずれか１項に記載の情報処理装置の、前記再学習部により更に学習された前記第１識別モデルを用いて、検知領域における対象物の有無を検知する、検知装置。

【請求項10】

画像内における対象物の有無を機械学習させた第１識別モデルに第１画像のデータを入力することで、前記第１画像に前記対象物であると誤検知される誤検知物が含まれるかの判断結果を出力するステップと、
前記誤検知物が含まれると判断された前記第１画像のデータと、その第１画像に誤検知物が存在することを示す指定情報と、を教師データとして、第２識別モデルに、画像内において前記誤検知物の有無を機械学習させるステップと、
監視対象となる検知領域が写る第２画像のデータを、学習済みの前記第２識別モデルに入力することで、前記第２画像に前記誤検知物が含まれるかの判断結果を出力するステップと、
前記誤検知物が含まれると判断された前記検知領域が写る第３画像のデータを教師データとして、前記第１識別モデルを更に学習させるステップと、
を含む、
情報処理方法。

【請求項11】

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、情報処理装置、検知装置、情報処理方法及びプログラムに関する。

【背景技術】

【0002】

カメラ等で取得した画像を解析して、画像に含まれる対象物を検知する装置がある。例えば特許文献１には、検知対象の識別モデルを用いた検知処理により、画像から検知対象を検知する情報処理装置が記載されている。このような装置においては、特定の検知領域で検知する場合には、その検知領域で対象物が写った画像を用いて、学習させることがある。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２０－８５８６９号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかし、画像を解析して検知領域を検知する際には、対象物でない物が対象物であると検知される誤検知が発生するおそれがある。一方、検知領域の画像を、撮像条件を異ならせて多数取得して学習させることで、誤検知を抑制させることも可能であるが、検知領域の画像を多数準備する必要があるため、学習での負荷が高くなる。特に、例えば検知領域が複数ある場合には、検知領域毎に、撮像条件が異なる多数の画像が必要となり、学習負荷がより顕著に高くなる。そのため、学習負荷を抑制しつつ、誤検知を抑制することが求められている。

【0005】

本開示は、上述した課題を解決するものであり、学習負荷を抑制しつつ、誤検知を抑制可能な情報処理装置、検知装置、情報処理方法及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

本開示に係る情報処理装置は、画像内における対象物の有無を機械学習させた第１識別モデルと、画像内において前記対象物であると誤検知される誤検知物の有無を機械学習可能な第２識別モデルと、第１画像のデータを、学習済みの前記第１識別モデルに入力することで、前記第１画像に前記誤検知物が含まれるかの判断結果を出力させる第１画像解析部と、前記第１画像解析部によって前記誤検知物が含まれると判断された前記第１画像のデータと、その第１画像に前記誤検知物が存在することを示す指定情報と、を教師データとして、前記第２識別モデルに、画像内における前記誤検知物の有無を機械学習させる学習部と、監視対象となる検知領域が写る第２画像のデータを、学習済みの前記第２識別モデルに入力することで、前記第２画像に前記誤検知物が含まれるかの判断結果を出力させる第２画像解析部と、前記第２画像解析部によって前記誤検知物が含まれると判断された前記検知領域が写る第３画像のデータを教師データとして、前記第１識別モデルを更に学習させる再学習部と、を含む。

【0007】

本開示に係る検知装置は、前記情報処理装置の、前記再学習部により更に学習された前記第１識別モデルを用いて、検知領域における対象物の有無を検知する。

【0008】

本開示に係る情報処理方法は、画像内における対象物の有無を機械学習させた第１識別モデルに、第１画像のデータを入力することで、前記第１画像に前記対象物であると誤検知される誤検知物が含まれるかの判断結果を出力するステップと、前記誤検知物が含まれると判断された前記第１画像のデータと、その第１画像に前記誤検知物が存在することを示す指定情報と、を教師データとして、第２識別モデルに、画像内において前記誤検知物の有無を機械学習させるステップと、監視対象となる検知領域が写る第２画像のデータを、学習済みの前記第２識別モデルに入力することで、前記第２画像に前記誤検知物が含まれるかの判断結果を出力するステップと、前記誤検知物が含まれると判断された前記検知領域が写る第３画像のデータを教師データとして、前記第１識別モデルを更に学習させるステップと、を含む。

【0009】

本開示に係るプログラムは、画像内における対象物の有無を機械学習させた第１識別モデルに、第１画像のデータを入力することで、前記第１画像に前記対象物であると誤検知される誤検知物が含まれるかの判断結果を出力するステップと、前記誤検知物が含まれると判断された前記第１画像のデータと、その第１画像に前記誤検知物が存在することを示す指定情報と、を教師データとして、第２識別モデルに、画像内において前記誤検知物の有無を機械学習させるステップと、監視対象となる検知領域が写る第２画像のデータを、学習済みの前記第２識別モデルに入力することで、前記第２画像に前記誤検知物が含まれるかの判断結果を出力するステップと、前記誤検知物が含まれると判断された前記検知領域が写る第３画像のデータを教師データとして、前記第１識別モデルを更に学習させるステップと、を含む、情報処理方法を、コンピュータに実行させる。

【発明の効果】

【0010】

本開示によれば、学習負荷を抑制しつつ、誤検知を抑制することができる。

【図面の簡単な説明】

【0011】

【図1】図１は、第１実施形態に係る検知システムの模式図である。

【図2】図２は、検知装置の制御装置の模式的なブロック図である。

【図3】図３は、情報処理装置の模式的なブロック図である。

【図4】図４は、第１画像の例を示す模式図である。

【図5】図５は、第１画像からの対象物検知の例を示す模式図である。

【図6】図６は、第２画像からの誤検知物の検知の例を示す模式図である。

【図7】図７は、第３画像の例を示す模式図である。

【図8】図８は、情報処理装置の処理フローを説明するフローチャートである。

【図9】図９は、誤検知物の領域の設定の他の例を示す模式図である。

【発明を実施するための形態】

【0012】

以下に添付図面を参照して、本開示の好適な実施形態を詳細に説明する。なお、この実施形態により本開示が限定されるものではなく、また、実施形態が複数ある場合には、各実施形態を組み合わせて構成するものも含むものである。

【0013】

（第１実施形態）
（検知システム）
図１は、第１実施形態に係る検知システムの模式図である。第１実施形態に係る検知システム１００は、対象物Ａを検知するシステムである。検知システム１００は、検知装置１と、情報処理装置１０とを有する。検知装置１は、設備Ｗ内に配備されて、対象物Ａを検知する装置である。検知装置１は、設備Ｗ内において監視対象となる領域である検知領域ＡＲ内に、対象物Ａが存在するかを検知する。情報処理装置１０は、検知装置１が対象物Ａを検知するための識別器である第１識別モデルＭ１を設定する。第１識別モデルＭ１は、対象物Ａを検知するための処理を実行するＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）モデル、すなわち対象物Ａを検知するための処理を実行するプログラムである。情報処理装置１０や第１識別モデルＭ１については後述する。なお、設備Ｗは、例えば工場や倉庫などの屋内設備であるが、それに限られず任意の設備であってよく、例えば屋外の設備であってよい。すなわち、設備Ｗは、任意の領域を指してよい。また、対象物Ａは、本実施形態の例では人であるが、それに限られず、例えば車両など、検知対象となる任意の種類の物体であってよい。

【0014】

（検知装置）
検知装置１は、撮像装置（カメラ）Ｃ及び制御装置２を有する。検知装置１は、撮像装置Ｃにより検知領域ＡＲを撮像して、検知領域ＡＲを撮像した画像を制御装置２により解析することで、検知領域ＡＲ内に対象物Ａが存在するかを検知する。本実施形態では、検知装置１は、設備Ｗ内において異なる位置にある複数の検知領域ＡＲのそれぞれにおいて、対象物Ａが存在するかを検知する。本実施形態では、検知装置１は、自動で移動する移動体である。検知装置１は、移動しながら対象物Ａの検知を行うため、移動することにより位置が変わる検知領域ＡＲのそれぞれにおいて、対象物Ａが存在するかを検知するといえる。ただし、検知装置１は、移動体であることに限られず、設備Ｗ内で位置が固定された装置であってよい。この場合例えば、複数の撮像装置Ｃが設備Ｗの異なる位置に設けられて、それぞれの撮像装置Ｃが検知領域ＡＲを撮像する。検知装置１は、各撮像装置Ｃによるそれぞれの検知領域ＡＲの撮像画像を解析することで、それぞれの検知領域ＡＲ内に対象物Ａが存在するかを検知する。ただし、検知装置１は、複数の検知領域ＡＲでの対象物Ａの検知を行うことに限られず、位置が固定された１つの検知領域ＡＲでの対象物Ａの検知を行うものであってよい。

【0015】

図２は、検知装置の制御装置の模式的なブロック図である。制御装置２は、例えばコンピュータであり、図２に示すように、記憶部４と制御部６とを有する。記憶部４は、制御部６の演算内容やプログラムの情報や、第１識別モデルＭ１などを記憶するメモリであり、例えば、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）と、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）などの外部記憶装置とのうち、少なくとも１つ含む。記憶部４が記憶する制御部６用のプログラムや第１識別モデルＭ１は、検知装置１が読み取り可能な記録媒体に記憶されていてもよい。

【0016】

制御部６は、演算装置であり、例えばＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）などの演算回路を含む。制御部６は、画像取得部７と対象物検知部８とを含む。制御部６は、記憶部４からプログラム（ソフトウェア）を読み出して実行することで、画像取得部７と対象物検知部８とを実現して、それらの処理を実行する。なお、制御部６は、１つのＣＰＵによってこれらの処理を実行してもよいし、複数のＣＰＵを備えて、それらの複数のＣＰＵで、処理を実行してもよい。また、画像取得部７と対象物検知部８との処理の少なくとも一部を、ハードウェア回路で実現してもよい。

【0017】

画像取得部７は、撮像装置Ｃによって検知領域ＡＲが撮像された撮像画像（検知領域ＡＲを含む画像）を取得する。画像取得部７は、撮像装置Ｃを制御することで検知領域ＡＲを撮像させて、検知領域ＡＲが撮像された撮像画像を取得する。

【0018】

対象物検知部８は、機械学習済みの第１識別モデルＭ１を記憶部４から読み出して、画像取得部７によって取得された撮像画像の画像データを、読み出した第１識別モデルＭ１に入力することで、第１識別モデルＭ１から、検知領域ＡＲに対象物Ａが存在するかを示す出力データを取得する。対象物検知部８は、検知領域ＡＲに対象物Ａが存在するかを示す出力データに基づき、対象物Ａを検知する。すなわち例えば、対象物検知部８は、出力データが、検知領域ＡＲに対象物Ａが存在する旨を示す場合は、対象物Ａが存在すると判断し、出力データが、検知領域ＡＲに対象物Ａが存在しない旨を示す場合は、対象物Ａが存在しないと判断する。検知装置１が移動体である場合には、例えば対象物Ａが存在すると判断された場合には、検知装置１は停止してよい。

【0019】

なお、対象物検知部８が読み出す第１識別モデルＭ１は、後述の情報処理装置１０の再学習部３２による機械学習済みのモデルであり、検知領域ＡＲを含む画像内における対象物Ａの有無を機械学習させたモデルといえる。言い換えれば、対象物検知部８が読み出す第１識別モデルＭ１は、検知領域ＡＲ内に対象物Ａが存在する場合の画像の特徴量が、機械学習されたモデルともいえる。そのため、対象物検知部８が読み出す第１識別モデルＭ１は、検知領域ＡＲを含む画像が入力されたら、演算を行うことにより、検知領域ＡＲに対象物Ａが存在するかの判断結果を出力となっている。

【0020】

以下、情報処理装置１０の構成と共に、第１識別モデルＭ１を機械学習させる方法について説明する。なお、本実施形態では、第１識別モデルＭ１を機械学習させる情報処理装置１０と、学習済みの第１識別モデルＭ１を用いて対象物Ａを検知する検知装置１（制御装置２）とが、別のハードウェアである。ただしそれに限られず、情報処理装置１０と制御装置２とが同じハードウェアであってよく、言い換えれば、情報処理装置１０（又は制御装置２）が、第１識別モデルＭ１の機械学習と、学習済みの第１識別モデルＭ１を用いた対象物Ａの検知処理とを、実行してもよい。

【0021】

（情報処理装置）
図３は、情報処理装置の模式的なブロック図である。情報処理装置１０は、例えばコンピュータであり、図３に示すように、通信部１２と記憶部１４と制御部１６とを有する。情報処理装置１０は、情報が入力される入力部や、情報を出力する出力部（表示部など）も備えていてよい。なお、図１の例では、情報処理装置１０は、設備Ｗの外部に設けられているが、情報処理装置１０が設けられる位置は任意であってよい。

【0022】

通信部１２は、外部の装置と通信を行う通信モジュールであり、例えばアンテナやＷｉ－Ｆｉ（登録商標）モジュールなどであってよい。情報処理装置１０は、無線通信で外部の装置と通信を行うが、有線通信でもよく、通信方式は任意であってよい。

【0023】

記憶部１４は、制御部１６の演算内容やプログラムの情報や、第１識別モデルＭ１及び第２識別モデルＭなどを記憶するメモリであり、例えば、ＲＡＭと、ＲＯＭと、ＨＤＤなどの外部記憶装置とのうち、少なくとも１つ含む。記憶部１４が記憶する制御部１６用のプログラム、第１識別モデルＭ１、及び第２識別モデルＭは、情報処理装置１０が読み取り可能な記録媒体に記憶されていてもよい。

【0024】

制御部１６は、演算装置であり、例えばＣＰＵなどの演算回路を含む。制御部１６は、第１画像取得部２０と、第１画像解析部２２と、学習部２４と、第２画像取得部２６と、第２画像解析部２８と、第３画像取得部３０と、再学習部３２とを含む。制御部１６は、記憶部１４からプログラム（ソフトウェア）を読み出して実行することで、第１画像取得部２０と第１画像解析部２２と学習部２４と第２画像取得部２６と第２画像解析部２８と第３画像取得部３０と再学習部３２とを実現して、それらの処理を実行する。なお、制御部１６は、１つのＣＰＵによってこれらの処理を実行してもよいし、複数のＣＰＵを備えて、それらの複数のＣＰＵで、処理を実行してもよい。また、第１画像取得部２０と第１画像解析部２２と学習部２４と第２画像取得部２６と第２画像解析部２８と第３画像取得部３０と再学習部３２との処理の少なくとも一部を、ハードウェア回路で実現してもよい。

【0025】

（第１画像の取得）
図４は、第１画像の例を示す模式図である。情報処理装置１０は、第１画像取得部２０により、第１画像Ｐ１を取得する。第１画像Ｐ１は、後述の第２識別モデルＭ２を機械学習させるために用いる画像であり、対象物Ａを含まない画像（対象物Ａが写っていない画像）である。本実施形態では、第１画像取得部２０は、対象物Ａを含まず、かつ、設備Ｗ内や対象領域ＡＲを含まない画像（設備Ｗ内や対象領域ＡＲが写っていない画像）を、第１画像Ｐ１として取得する。ただしそれに限られず、第１画像取得部２０は、対象物Ａを含まない任意の画像を第１画像Ｐ１として取得してよく、例えば、設備Ｗの環境に近い場所が写っている画像を第１画像Ｐ１として取得してよい。設備Ｗの環境に近い場所とは、例えば設備Ｗと同じ種類の設備を指してよく、すなわち設備Ｗが倉庫の場合は、設備Ｗとは別の倉庫内の画像を第１画像Ｐ１としてよい。また例えば、第１画像Ｐ１は、対象物Ａを含まない画像であることにも限られず、対象物Ａを含む画像であってもよい。なお、第１画像取得部２０は、任意の方法で第１画像Ｐ１を取得してよく、例えば、通信部１２を介して、外部の装置（サーバ）などから、対象物Ａを含まない既存の画像を、第１画像Ｐ１として取得してよい。

【0026】

第１画像取得部２０は、取得した第１画像Ｐ１を用いて、撮像領域（画像の画角内の領域）の少なくとも一部が互いに重複し、かつ画像データが互いに異なる、複数の第１画像Ｐ１ａを生成して、第１画像Ｐ１ａを、第２識別モデルＭ２の学習用に用いてよい。すなわち、それぞれの第１画像Ｐ１ａは、同じ場所を撮像した画像であるが、撮像領域や周囲環境（例えば明るさ）などの、撮像条件が異なった画像といえる。図４では、第１画像取得部２０は、第１画像Ｐ１ａとして、第１画像Ｐ１ａ１、Ｐ１ａ２、Ｐ１ａ３を生成する例が示されている。

【0027】

なお、撮像領域の少なくとも一部が重複するとは、それぞれの第１画像Ｐ１ａ同士で、共通する撮像領域があることを指す。図４の例では、第１画像Ｐ１ａ１、Ｐ１ａ２、Ｐ１ａ３は、撮像領域の全域が重複しており、同じ場所を同じ撮像範囲で撮像した画像に相当するといえる。ただし、第１画像Ｐ１ａは、一部の撮像範囲が異なってもよく、この場合例えば、第１画像取得部２０は、取得した第１画像Ｐ１に対して、画像の切り出し範囲を異ならせることで、一部の撮像範囲が互いに異なる複数の第１画像Ｐ１ａを生成してよい。画像の切り出し範囲は、設備Ｗでの撮像装置Ｃの取り付け位置や角度の変化に基づいて設定されることが好ましい。例えば、撮像装置Ｃが移動体に装着される場合、移動体の通路と車幅の差分が、撮像装置Ｃの取付位置の変化分となる。通路幅で取り得る移動体の向きや地面の傾斜によって生じる移動体の角度変化が、カメラ角度の変化分となる。この場合例えば、設備Ｗにおいて、見積もった変化分の範囲で撮像装置Ｃを取り付け、想定される位置に目印となるマーカを配置し、網羅的に画像を撮影し、取得画像内でのマーカの位置の変化分を切り出し位置の範囲としてよい。切り出す画像のサイズやアスペクト比は、検知に用いる撮像装置Ｃで得られる画像に基づき設定されてよい。

【0028】

また、画像データの少なくとも一部が異なるとは、例えば、それぞれの第１画像Ｐ１ａの、各ピクセルの画素データ（階調値）の少なくとも一部が異なることを指し、本実施形態では、少なくとも一部のピクセルの輝度値、コントラスト、及び色相の少なくとも１つが異なることを指す。例えば、第１画像取得部２０は、取得した第１画像Ｐ１の画像データに対して、輝度値、コントラスト、及び色相の少なくとも１つを調整することにより、少なくとも一部の画像データが異なる複数の第１画像Ｐ１ａを生成してよい。輝度値、コントラスト、及び色相の少なくとも１つの調整量は、設備Ｗにおいて定点カメラを設置し、運用時間内で網羅的に取得した画像の輝度値やコントラストや色相の変化量に基づき設定されてよい。図４の例では、取得した第１画像Ｐ１と同じ輝度値の第１画像Ｐ１ａ１と、第１画像Ｐ１ａ１より輝度値が低い第１画像Ｐ１ａ２と、第１画像Ｐ１ａ２より輝度値が低い第１画像Ｐ１ａ３とが生成されている。

【0029】

第１画像取得部２０は、撮像領域が異なる複数種類の第１画像Ｐ１を取得して、取得した第１画像Ｐ１毎に、上述のように複数の第１画像Ｐ１ａを準備する。すなわち、図４では、１つの第１画像Ｐ１から、複数の第１画像Ｐ１ａ（第１画像Ｐ１ａ１、Ｐ１ａ２、Ｐ１ａ３）を準備している例が示されているが、第１画像取得部２０は、取得したそれぞれの第１画像Ｐ１毎に、複数の第１画像Ｐ１ａを準備するといえる。

【0030】

なお、第１画像Ｐ１ａの生成方法は、上述の方法に限られず任意であってよい。例えば、取得した第１画像Ｐ１を、そのまま第１画像Ｐ１ａとして用いてよい。また、図４の例では、１つの第１画像Ｐ１から、画像データが異なる３つの第１画像Ｐ１ａ（第１画像Ｐ１ａ１、Ｐ１ａ２、Ｐ１ａ３）を生成していたが、第１画像Ｐ１ａの数は３つに限られず、任意であってよい。また、第１画像取得部２０は、取得した第１画像Ｐ１に基づき、自身で複数の第１画像Ｐ１ａを生成するが、自身で生成することに限られず、予め生成された複数の第１画像Ｐ１ａを、例えば通信部１２を介して取得してもよい。

【0031】

（第１画像からの対象物の検知）
第１画像解析部２２は、記憶部１４から第１識別モデルＭ１を読み出して、第１識別モデルＭ１に第１画像Ｐ１ａのデータを入力することで、第１画像Ｐ１ａに対象物Ａが含まれているかの検知結果を取得する。第１画像解析部２２が使用する第１識別モデルＭ１は、画像内における対象物Ａの有無を機械学習させたモデルである。そのため、この第１識別モデルＭ１は、画像データが入力された場合に、演算を実行して、その画像に対象物Ａが含まれているかの判断結果を出力できる。第１識別モデルＭ１による、第１画像Ｐ１ａに対象物Ａが含まれているかの検知結果とは、第１画像Ｐ１ａに誤検知物Ｂが含まれているかの検知結果であると言い換えることができる。すなわち、第１識別モデルＭ１が第１画像Ｐ１ａ内で検知した対象物Ａは、誤検知されたもの（すなわち誤検知物Ｂ）であるといえる。なお、誤検知物Ｂとは、対象物Ａであると誤検知された物体を指す。なお、第１画像解析部２２が使用する第１識別モデルＭ１は、対象物Ａの有無を仮学習済みであるといえ、この仮学習済みの第１識別モデルＭ１を、後述のように再学習部３２によって更に学習させることで、設備Ｗ（対象領域ＡＲ）内での対象物Ａの誤検知を抑制可能な第１識別モデルＭ１が生成される。なお、第１識別モデルＭ１としては、任意のＡＩモデルが適用できるが、例えばＣＮＮ（Conventional Neural Network：畳み込みニューラルネットワーク）モデルを用いてよい。

【0032】

第１画像解析部２２は、画像内における対象物Ａの有無が予め学習されたモデルを、仮学習済みの第１識別モデルＭ１として取得してよく、例えば一般公開データセットを学習したＰｒｅ－ｔｒａｉｎｅｄモデルを取得してよい。ただし、第１画像解析部２２が、仮学習前の第１識別モデルＭ１を取得し、第１識別モデルＭ１に仮学習させてよい。この場合例えば、第１画像解析部２２は、対象物Ａを含む任意の画像と、その画像に対象物Ａが含まれていることを示す情報（ラベル）とを、教師データとして第１識別モデルＭ１に入力することで、第１識別モデルＭ１に仮学習させてよい。対象物Ａを含む画像としては、設備Ｗ内や対象領域ＡＲが含まれない画像を用いてよい。

【0033】

第１画像解析部２２は、第１画像取得部２０が取得した第１画像Ｐ１ａのデータを、仮学習済みの第１識別モデルＭ１に入力することで、仮学習済みの第１識別モデルＭ１から、第１画像Ｐ１ａに対象物Ａ（誤検知物Ｂ）が含まれるかの判断結果を出力させて、その判断結果を取得する。なお、第１画像Ｐ１ａは対象物Ａが含まれない画像なので、第１画像Ｐ１ａに対象物Ａが含まれるとの判断結果は、対象物Ａでないものを対象物Ａであると誤検知した判断結果、すなわち誤検知物Ｂが含まれるとの判断結果であるといえる。

【0034】

より詳しくは、仮学習済みの第１識別モデルＭ１は、画像に対象物Ａが含まれるかの判断結果として、対象物Ａが含まれると判断した画像内における、対象物Ａの位置情報（画像内における対象物Ａの位置を示す情報）を、すなわち画像内で対象物Ａが占めている領域の位置情報を出力するように学習されていることが好ましい。従って、第１画像解析部２２は、第１画像Ｐ１のデータを、仮学習済みの第１識別モデルＭ１に入力することで、第１識別モデルＭ１から、対象物Ａが含まれると判断された第１画像Ｐ１内における対象物Ａの位置情報を（対象物Ａが占める領域ＲＡの位置情報を）、取得することが好ましい。なお、第１識別モデルＭ１から取得した対象物Ａの位置情報は、誤検知された対象物Ａ（すなわち誤検知物Ｂ）の位置情報であるといえる。

【0035】

図５は、第１画像からの対象物検知の例を示す模式図である。第１画像解析部２２は、第１画像取得部２０によって取得されたそれぞれの第１画像Ｐ１ａのデータを、仮学習済みの第１識別モデルＭ１に入力することで、第１画像Ｐ１ａ毎に、第１画像Ｐ１ａ内における対象物Ａの位置情報を取得する。図５の例では、仮学習済みの第１識別モデルＭ１により、第１画像Ｐ１ａ１に対象物Ａが含まれると判断されており、その対象物Ａが占める領域ＲＡ１の位置情報が取得される。同様に、図５の例では、第１画像Ｐ１ａ２、Ｐ１ａ３にも対象物Ａが含まれていると判断されており、それらの対象物Ａが占める領域ＲＡ２、ＲＡ３の位置情報が取得される。それぞれの第１画像Ｐ１ａは、輝度値などの画像データが異なるため、図５の例に示すように、異なる箇所で対象物Ａが検知（誤検知）されることがある。

【0036】

上述のように、本実施形態では、撮像領域が異なる複数種類の第１画像Ｐ１毎に、複数の第１画像Ｐ１ａが準備される。第１画像解析部２２は、それら複数種類の第１画像Ｐ１毎に設定された第１画像Ｐ１ａのそれぞれについて、仮学習済みの第１識別モデルＭ１により、第１画像Ｐ１ａに対象物Ａが含まれるかの判断結果を取得する。

【0037】

（第２識別モデル用の教師データの設定）
学習部２４は、対象物Ａが含まれると判断された第１画像Ｐ１ａに対応する第１画像Ｐ１と、その第１画像Ｐ１についての指定情報とを含むデータセットを、未学習の第２識別モデルＭ２用の教師データとして設定する。指定情報とは、その第１画像Ｐ１に誤検知物Ｂが含まれるか否かを示す情報である。すなわち、学習部２４は、対象物Ａが含まれると判断された第１画像Ｐ１ａのデータと、その第１画像Ｐ１ａに対応する第１画像Ｐ１に誤検知物Ｂが含まれる旨の情報とを、第２識別モデルＭ２用の教師データとする。学習部２４は、対象物Ａが含まれないと判断された第１画像Ｐ１ａに対応する第１画像Ｐ１については、第２識別モデルＭ２用の教師データとして用いなくてよい。

【0038】

より詳しくは、学習部２４は、第１識別モデルＭ１によって示された第１画像Ｐ１ａにおける対象物Ａの位置に基づいて、その第１画像Ｐ１ａに対応する第１画像Ｐ１における誤検知物Ｂの位置を設定する。そして、学習部２４は、その第１画像Ｐ１における誤検知物Ｂの位置を示す情報を、指定情報とする。すなわち、学習部２４は、対象物Ａが含まれると判断された第１画像Ｐ１ａに対応する第１画像Ｐ１のデータと、その第１画像Ｐ１における誤検知物Ｂの位置情報とを、第２識別モデルＭ２用の教師データとする。

【0039】

本実施形態では、上述のように、同じ第１画像Ｐ１に対して、画像データが異なる複数の第１画像Ｐ１ａが設定されており、それぞれの第１画像Ｐ１ａについて、対象物Ａの位置情報が取得される。そのため、学習部２４は、同じ第１画像Ｐ１に対応した第１画像Ｐ１ａ毎の対象物の位置に基づいて、その第１画像Ｐ１における誤検知物Ｂの位置を設定して、指定情報とする。すなわち図５の例では、学習部２４は、第１画像Ｐ１ａ１における領域ＲＡ１の位置情報と、第１画像Ｐ１ａ２における領域ＲＡ２の位置情報と、第１画像Ｐ１ａ３における領域ＲＡ３の位置情報とに基づき、第１画像Ｐ１ａ１、Ｐ１ａ２、Ｐ１ａ３の元となる第１画像Ｐ１での誤検知物Ｂの位置情報（領域ＲＢの位置情報）を、指定情報として設定する。例えば、学習部２４は、それぞれの第１画像Ｐ１ａにおける対象物Ａ同士の位置が重なる場合には（対象物Ａ同士の位置が重なる第１画像Ｐ１ａがある場合には）、それらの対象物Ａの位置を含む領域を、第１画像Ｐ１における誤検知物の位置として設定する。すなわち図５の例では、第１画像Ｐ１ａにおける領域ＲＡ１と、第１画像Ｐ１ｂにおける領域ＲＡ２の位置とが、少なくとも一部の領域で位置が重なるため、学習部２４は、領域ＲＡ１と領域ＲＡ２とを含む領域ＲＢ１を、第１画像Ｐ１における誤検知物の位置として設定する。また例えば、学習部２４は、それぞれの第１画像Ｐ１ａにおける対象物Ａの位置が重ならない場合には（対象物Ａ同士の位置が重ならない第１画像Ｐ１ａがある場合には）、それぞれの対象物Ａの位置を、第１画像Ｐ１における誤検知物Ｂの位置として設定する。すなわち例えば、図５においては、領域ＲＡ３の位置は、領域ＲＡ１及び領域ＲＡ２に重なっていないため、学習部２４は、領域ＲＡ１及び領域ＲＡ２を含む領域ＲＢ１に加えて、領域ＲＡ３の位置を含む領域ＲＢ２についても、第１画像Ｐ１における誤検知物の位置として設定する。

【0040】

また、本実施形態では、撮像領域が異なる複数種類の第１画像Ｐ１毎に、複数の第１画像Ｐ１ａが準備される。学習部２４は、それら複数種類の第１画像Ｐ１毎に上述の処理を行うことで、対象物Ａが含まれると判断された第１画像Ｐ１毎に、第１画像Ｐ１のデータと指定情報とを含むデータセットを準備して、第２識別モデルＭ２用の教師データとする。

【0041】

（第２識別モデルの学習）
学習部２４は、上述のように設定した教師データ（対象物Ａが含まれると判断された第１画像Ｐ１と指定情報）を、未学習の第２識別モデルＭ２に入力することで、第２識別モデルＭ２に、画像内における誤検知物Ｂの有無を機械学習させる。これにより、第２識別モデルＭ２は、未知の画像データが入力された場合に、演算を実行することで、その画像内での誤検知物Ｂの有無の判断結果を出力可能となる。より詳しくは、学習部２４は、対象物Ａが含まれると判断された第１画像Ｐ１のデータと、その第１画像Ｐにおける誤検知物Ｂの位置を示す指定情報とを教師データとして、第２識別モデルＭ２に、画像内における誤検知物Ｂの位置を機械学習させることが好ましい。学習部２４は、撮像領域が異なる複数種類の第１画像Ｐ１毎に準備した教師データのそれぞれを、第２識別モデルＭ２に入力することで、第２識別モデルＭ２に機械学習させる。これにより、第２識別モデルＭ２は、未知の画像データが入力された場合に、誤検知物Ｂの有無の判断結果として、その画像内における誤検知物Ｂの位置情報を出力可能となる。すなわち、学習済みの第２識別モデルＭ２は、画像内における誤検知物Ｂの有無や誤検知物Ｂの位置情報を機械学習させたモデルであり、誤検知物Ｂが存在する場合の画像の特徴量が、機械学習されたモデルともいえる。なお、第２識別モデルＭ２としては、任意のＡＩモデルが適用できるが、例えばＣＮＮモデルを用いてよい。

【0042】

このように、本実施形態においては、撮像場所や撮像条件が異なる第１画像Ｐ１ａを、第２識別モデルＭ２の教師データとしている。そのため、このような教師データを用いて学習した第２識別モデルＭ２は、撮像条件や撮像場所の違いを吸収して、撮像条件や撮像場所が異なったとしても、誤検知物Ｂを高精度に検知可能となる。

【0043】

（第２画像の取得）
第２画像取得部２６は、検知領域ＡＲを含み、かつ対象物Ａを含まない第２画像Ｐ２を取得する。すなわち、第２画像Ｐ２は、対象物Ａが存在しない状態の検知領域ＡＲを撮像した画像といえる。本実施形態では、第２画像取得部２６は、複数の検知領域ＡＲのそれぞれについて、第２画像Ｐ２を取得する。すなわち例えば、検知装置１が移動体である場合には、検知装置１の移動に伴い位置が変わる検知領域ＡＲのそれぞれについての、第２画像Ｐ２を取得するといえる。第２画像取得部２６は、１つの検知領域ＡＲについて取得する第２画像Ｐ２の数を、出来るだけ少なくすることが好ましい。第２画像Ｐ２の数を少なくすることで、検知領域ＡＲが写る画像を用いた機械学習の負荷を低減できる。本実施形態では、第２画像取得部２６は、検知領域ＡＲ毎にそれぞれ１つの第２画像Ｐ２を取得するが、それに限られず、１つの検知領域ＡＲに対して２つ以上の第２画像Ｐ２を取得してもよい。また、第２画像取得部２６は、任意の方法で第２画像Ｐ２を取得してよいが、例えば、検知装置１や他の装置により撮像された設備Ｗ内の検知領域ＡＲの画像を、通信部１２を介して、第２画像Ｐ２として取得してよい。なお、第２画像Ｐ２は、対象物Ａを含まない画像であることにも限られず、対象物Ａを含んだ検知領域ＡＲ画像であってもよい。

【0044】

（第２画像での誤検知物の検知）
図６は、第２画像からの誤検知物の検知の例を示す模式図である。第２画像解析部２８は、第２画像Ｐ２のデータを、学習部２４によって学習済みの第２識別モデルＭ２に入力することで、第２識別モデルＭ２から、第２画像Ｐ２に誤検知物Ｂが含まれるかの判断結果を取得する。さらに言えば、第２画像解析部２８は、互いに異なる検知領域ＡＲが写る複数の第２画像Ｐ２のデータを、学習済みの第２識別モデルＭ２に入力する。これにより、第２画像解析部２８は、第２識別モデルＭ２から、それぞれの第２画像Ｐ２に（すなわちそれぞれの検知領域ＡＲに）誤検知物Ｂが含まれるかの判断結果を取得する。なお、第２画像解析部２８は、誤検知物Ｂが含まれるかの判断結果として、第２画像Ｐ２における誤検知物Ｂの位置情報を取得してもよい。図６の例では、検知領域ＡＲ毎の第２画像Ｐ２として、第２画像Ｐ２ａ、Ｐ２ｂが取得された場合を例にしている。この場合、第２画像解析部２８は、第２画像Ｐ２ａのデータを第２識別モデルＭ２に入力することで、第２画像Ｐ２ａに誤検知物Ｂが含まれるかの判断結果を取得し、第２画像Ｐ２ｂのデータを第２識別モデルＭ２に入力することで、第２画像Ｐ２ｂに誤検知物Ｂが含まれるかの判断結果を取得する。図６の例では、第２画像Ｐ２ａに誤検知物Ｂが含まれると判断されて、誤検知物Ｂの位置を示す領域ＲＢの位置情報が取得されており、第２画像Ｐ２ｂには誤検知物Ｂが含まれないと判断されている。なお、図６の例では第２画像Ｐ２の数は２つであるが、第２画像Ｐ２の数は２つに限られず、検知領域ＡＲの数などに応じた任意の数であってよい。

【0045】

（第３画像の取得）
第３画像取得部３０は、第２識別モデルＭ２によって誤検知物Ｂが含まれると判断された第２画像Ｐ２に基づいて、第１識別モデルＭ１を再学習させるための第３画像Ｐ３を取得する。第３画像取得部３０は、誤検知物Ｂが含まれると判断された対象領域ＡＲ（誤検知物Ｂが含まれると判断された第２画像Ｐ２に写る対象領域ＡＲ）を含む画像を、第３画像Ｐ３として取得する。本実施形態では、第３画像取得部３０は、誤検知物Ｂが含まれると判断された対象領域ＡＲを含み、かつ、対象物Ａを含まない画像を、第３画像Ｐ３として取得する。第３画像取得部３０は、誤検知物Ｂが含まれると判断された対象領域ＡＲ毎に、第３画像Ｐ３を取得する。第３画像取得部３０は、誤検知物Ｂが含まれないと判断された対象領域ＡＲについては、第３画像Ｐ３を準備しなくてよい。なお、第３画像Ｐ３は、対象物Ａを含まない画像であることに限られず、例えば、対象物Ａを含み、かつ誤検知物Ｂが含まれると判断された対象領域ＡＲの画像であってもよい。

【0046】

図７は、第３画像の例を示す模式図である。第３画像取得部３０は、誤検知物Ｂが含まれると判断された対象領域ＡＲ毎に、撮像領域の少なくとも一部が互いに重複し、かつ画像データが互いに異なる、複数の第３画像Ｐ３を取得することが好ましい。すなわち、それぞれの第３画像Ｐ３は、同じ対象領域ＡＲを撮像した画像であるが、撮像領域や周囲環境（例えば明るさ）などの、撮像条件が異なった画像といえる。図７では、第１画像取得部２０は、第３画像Ｐ３として、第３画像Ｐ３ａ、Ｐ３ｂ、Ｐ３ｃを取得する例が示されている。図７の例では、第３画像Ｐ３ａ、Ｐ３ｂ、Ｐ３ｃは、撮像領域の全域が重複しており、同じ対象領域ＡＲを同じ撮像範囲で撮像した画像に相当するといえる。ただし、それぞれの第３画像Ｐ３は、一部の撮像範囲が異なってもよい。また、図７の例では、第３画像Ｐ３ａ、第３画像Ｐ３ｂ、第３画像Ｐ３ｃの順で、輝度値が低くなっている。図７の例では、画像全体で（全ピクセルで）一様に輝度値が異なるが、それに限られず、一部のピクセルの輝度値が異なってもよい。

【0047】

第３画像取得部３０は、任意の方法で第３画像Ｐ３を取得してよい。例えば、誤検知物Ｂが含まれると判断された対象領域ＡＲを、撮像条件（例えば撮像範囲や周辺環境）を異ならせて撮像させて、第３画像取得部３０は、撮像条件を異ならせて撮像された各画像を、第３画像Ｐ３として取得してよい。また例えば、第３画像取得部３０は、誤検知物Ｂが含まれると判断された第２画像Ｐ２を、第３画像Ｐ３として取得してよい。この場合例えば、第３画像取得部３０は、誤検知物Ｂが含まれると判断された第２画像Ｐ２に対して、第１画像Ｐ１から第１画像Ｐ１ａを生成する場合と同様の処理を行うことで、複数の第３画像Ｐ３を生成してよい。

【0048】

（第１識別モデルの再学習）
再学習部３２は、第３画像Ｐ３のデータを教師データとして、仮学習済みの第１識別モデルＭ１を更に学習させて、学習済みの第１識別モデルＭ１を生成する。すなわち、再学習部３２は、第３画像Ｐ３を教師データとして、仮学習済みの第１識別モデルＭ１に、検知領域ＡＲを含む画像内における対象物Ａの有無を学習させることで、学習済みの第１識別モデルＭ１を生成する。再学習部３２は、それぞれの検知領域ＡＲのうちで、誤検知物が含まれると判断された検知領域ＡＲが写る第３画像Ｐ３のデータを教師データとして、第１識別モデルＭ１を更に学習させるといえる。

【0049】

より詳しくは、再学習部３２は、第３画像Ｐ３のデータと、第３画像Ｐ３に対象物Ａが含まれない旨を示す情報とを含むデータセットを、教師データとして、仮学習済みの第１識別モデルＭ１に入力する。再学習部３２は、誤検知物Ｂが含まれると判断された対象領域ＡＲ毎に設定された、画像データが異なる複数の第３画像Ｐ３（図７の例では第３画像Ｐ３ａ、Ｐ３ｂ、Ｐ３ｃ）のそれぞれについて、データセット（第３画像Ｐ３のデータと対象物Ａが含まれない旨を示す情報）を準備して、それぞれのデータセットを教師データとして、仮学習済みの第１識別モデルＭ１に入力する。これにより、第１識別モデルＭ１は、検知領域ＡＲが写る未知の画像データが入力された場合に、演算を実行することで、その画像内に対象物Ａが存在するかを出力可能となる。さらに言えば、第１識別モデルＭ１は、誤検知しやすい物体である誤検知物Ｂが検出された検知領域ＡＲに、実際には対象物Ａが存在していない旨を、教師データとして学習するため、誤検知を抑制しつつ、対象物Ａを高精度に検知できる。

【0050】

情報処理装置１０は、このように再学習部３２によって更に学習された第１識別モデルＭ１を、例えば通信部１２を介して、検知装置１に送信する。検知装置１は、上述のように、再学習部３２によって更に学習された第１識別モデルＭ１を用いて、対象物Ａの検知を行う。

【0051】

（処理フロー）
次に、以上説明した情報処理装置１０の処理フローを説明する。図８は、情報処理装置の処理フローを説明するフローチャートである。図８に示すように、情報処理装置１０は、第１画像解析部２２により、第１画像Ｐ１に基づき設定された第１画像Ｐ１ａを、仮学習済みの第１識別モデルＭ１に入力して、第１画像Ｐ１ａでの対象物Ａ（誤検知物Ｂ）の有無の判断結果を取得する（ステップＳ１０）。情報処理装置１０は、学習部２４により、対象物Ａが含むと判断された第１画像Ｐ１ａに対応する第１画像Ｐ１のデータと、その第１画像Ｐ１に誤検知物Ｂが含まれる旨の指定情報とを教師データとして、第２識別モデルＭに学習させる（ステップＳ１２）。そして、情報処理装置１０は、第２画像解析部２８により、検知領域ＡＲを含む第２画像Ｐ２のデータを、学習済みの第２識別モデルＭ２に入力して、第２画像Ｐ２での誤検知物Ｂの有無の判断結果を取得する（ステップＳ１４）。そして、情報処理装置１０は、誤検知物Ｂを含むと判断された検知領域ＡＲが写る第３画像Ｐ３のデータと、その第３画像Ｐ３に対象物Ａが含まない旨を示す情報とを教師データとして、仮学習済みの第１識別モデルＭ１を更に学習させる（ステップＳ１６）。

【0052】

（効果）
ここで、検知領域ＡＲ内の画像を解析して対象物Ａを検知する際には、検知領域ＡＲで対象物Ａが写った画像を用いて機械学習したＡＩモデルを用いる場合がある。このようなＡＩモデルを用いた場合、対象物でない物が対象物Ａであると誤検知されるおそれがある。一方、検知領域ＡＲ内で対象物Ａが写った画像を、撮像条件を異ならせて多数取得して学習させることで、誤検知を抑制させることも可能であるが、検知領域ＡＲ内で対象物Ａが写った画像を多数準備する必要があるため、学習での負荷が高くなる。特に、検知領域ＡＲが複数ある場合には、それぞれの検知領域ＡＲにおいて対象物Ａが写った画像を多数準備する必要があるため、学習での負荷が顕著となる。それに対して、本実施形態に係る情報処理装置１０は、仮学習済みの第１識別モデルＭ１に、任意の第１画像Ｐ１から誤検知しやすい誤検知物Ｂを抽出させる。そして、その誤検知物Ｂの特徴量を第２識別モデルＭ２に機械学習させて、その第２識別モデルＭ２により、監視対象となる検知領域ＡＲを含んだ第２画像Ｐ２から誤検知物Ｂを検知させることで、誤検知しやすい検知領域ＡＲを抽出する。そして、誤検知しやすい検知領域ＡＲを含む第３画像Ｐ３を用いて、第１識別モデルＭ１に更に学習させることで、誤検知しやすい検知領域ＡＲにおいても、誤検知を適切に抑制可能となる。さらに、誤検知しやすい検知領域ＡＲを選んで機械学習させるため、学習用に検知領域ＡＲの画像を多く準備する必要がなくなり、学習での負荷も低減できる。

【0053】

なお、本実施形態では、１つのハードウェアである情報処理装置１０が、第１識別モデルＭ１及び第２識別モデルＭ２の両方を有して、上記の処理を行ったが、情報処理装置１０が行う処理を複数のハードウェアによって実現してもよい。すなわち例えば、第１識別モデルＭ１を有して第１識別モデルＭ１を再学習させる装置と、第２識別モデルＭ２を学習させる装置とを、別の装置としてもよい。この場合、第１識別モデルＭ１を再学習させる装置は、第２識別モデルＭ２を学習させる装置から、学習済みの第２識別モデルＭ２を取得して、それを用いて第１識別モデルＭ１を再学習させてよい。

【0054】

（他の例）
第２識別モデルＭ２の教師データの設定の他の例を以下で説明する。図９は、誤検知物の領域の設定の他の例を示す模式図である。学習部２４は、仮学習済みの第１識別モデルＭ１による第１画像Ｐ１ａからの対象物Ａの検知結果に基づいて、第１画像Ｐ１において誤検知される確率が高い領域を抽出して、その領域を含む画像データを、第２識別モデルＭ２に優先的に機械学習させてよい。この場合例えば、学習部２４は、第１画像Ｐ１における誤検知物Ｂの位置を示す領域ＲＢ毎に、その領域ＲＢと位置が重なる領域ＲＡ（第１画像Ｐ１ａで検知（誤検知）された対象物Ａの位置を示す領域）の数を、算出する。そして、学習部２４は、位置が重なる領域ＲＡの数に基づいて、領域ＲＢ毎に重み付け指標を設定する。重み付け指標とは、その領域ＲＢが対象物Ａとして誤検知される確率を示す指標である。学習部２４は、位置が重なる領域ＲＡの数が多いほど、その領域ＲＢの重み付け指標が高い値になるように（対象物Ａとして誤検知される確率が高くなるように）、重み付け指標を設定する。図９の例では、領域ＲＢ１には１つの領域ＲＡ１が重なっており、領域ＲＢ２には、２つの領域ＲＡ２ａ、ＲＡ２ｂが重なっており、領域ＲＢ３には、３つの領域ＲＡ３ａ、ＲＡ３ｂ、ＲＡ３ｃが重なっている。従って、学習部２４は、領域ＲＢ１、ＲＢ２、ＲＢ３の順で、重み付け指標が高くなるように、領域ＲＢ１、ＲＢ２、ＲＢ３に対して重み付け指標を設定する。

【0055】

そして、学習部２４は、第１画像Ｐ１のデータと、その第１画像Ｐ１に含まれる誤検知物Ｂの位置情報を示す指定情報と、重み付け指標とを、教師データとして、第２識別モデルＭ２に機械学習させる。そのため、第２識別モデルＭ２は、対象物Ａであると誤検知される頻度が高かった領域と特徴量が近い領域を、誤検知物Ｂであると高精度に検知することが可能となり、結果として第１識別モデルＭ１による対象物Ａの誤検知をより適切に抑制できる。

【0056】

なお、図９の例では、位置が重なる領域ＲＡの数が多いほど、その領域ＲＢの重み付け指標が高い値になるように、重み付け指標が設定されていたが、重み付け指標の設定方法はこれに限られない。例えば、学習部２４は、領域ＲＢ内において、領域ＲＡ同士が重なっている領域の面積である重複面積を算出してもよい。この場合、学習部２４は、重複面積が大きい領域ＲＢほど、その領域ＲＢの重み付け指標が高い値になるように、重み付け指標を設定してもよい。

【0057】

（効果）
以上説明したように、本実施形態に係る情報処理装置１０は、画像内における対象物Ａの有無を仮学習させた第１識別モデルＭ１と、画像内において対象物Ａであると誤検知される誤検知物Ｂの有無を機械学習可能な第２識別モデルＭ２と、第１画像解析部２２と、学習部２４と、第２画像解析部２８と、再学習部３２とを含む。第１画像解析部２２は、対象物Ａを含まない第１画像Ｐ１ａのデータを、仮学習済みの第１識別モデルＭ１に入力することで、第１画像Ｐ１ａに対象物Ａ（誤検知物Ｂ）が含まれるかの判断結果を出力させる。学習部２４は、第１画像解析部２２によって対象物Ａ（誤検知物Ｂ）が含まれると判断された第１画像Ｐ１のデータと、その第１画像Ｐ１に誤検知物Ｂが存在することを示す指定情報と、を教師データとして、第２識別モデルＭ２に、画像内における誤検知物Ｂの有無を機械学習させる。第２画像解析部２８は、監視対象となる検知領域ＡＲが写る第２画像Ｐ２のデータを、学習済みの第２識別モデルＭ２に入力することで、第２画像Ｐ２に誤検知物Ｂが含まれるかの判断結果を出力させる。再学習部３２は、第２画像解析部２８によって誤検知物Ｂが含まれると判断された検知領域ＡＲが写る第３画像Ｐ３のデータを教師データとして、第１識別モデルＭ１を更に学習させる。

【0058】

本実施形態に係る情報処理装置１０は、仮学習済みの第１識別モデルＭ１に、画像から誤検知しやすい誤検知物Ｂを抽出させる。そして、その誤検知物Ｂの特徴量を第２識別モデルＭ２に機械学習させて、その第２識別モデルＭ２により、監視対象となる検知領域ＡＲを含んだ第２画像Ｐ２から誤検知物Ｂを検知させることで、誤検知しやすい検知領域ＡＲを抽出する。そして、誤検知しやすい検知領域ＡＲを含む第３画像Ｐ３を用いて、第１識別モデルＭ１に更に学習させることで、誤検知しやすい検知領域ＡＲにおいても、誤検知を適切に抑制可能となる。さらに、誤検知しやすい検知領域ＡＲを選んで機械学習させるため、学習用に検知領域ＡＲの画像を多く準備する必要がなくなり、学習での負荷も低減できる。

【0059】

第１画像解析部２２は、第１画像Ｐ１ａのデータを、仮学習済みの第１識別モデルＭ１に入力することで、第１画像Ｐ１ａにおける対象物Ａ（誤検知物Ｂ）の位置を示す情報を出力させることが好ましい。学習部２４は、第１画像Ｐ１ａにおける対象物Ａ（誤検知物Ｂ）の位置に基づいて設定された誤検知物Ｂの位置を示す情報を、指定情報として、第２識別モデルＭ２に機械学習させる。本開示の情報処理装置１０によると、誤検知物Ｂの位置を機械学習させることで、誤検知しやすい検知領域ＡＲにおいても、誤検知を適切に抑制可能となる。

【0060】

第１画像解析部２２は、撮像領域の少なくとも一部が重複し、かつ画像データが異なる複数の第１画像Ｐ１ａを、仮学習済みの第１識別モデルＭ１に入力することで、第１画像Ｐ１ａ毎に、対象物Ａ（誤検知物Ｂ）の位置を示す情報を出力させることが好ましい。学習部２４は、第１画像Ｐ１ａ毎の対象物Ａ（誤検知物Ｂ）の位置を示す情報に基づいて、１つの第１画像Ｐ１における誤検知物Ｂの位置を示す情報を、指定情報として設定することが好ましい。本開示の情報処理装置１０によると、撮像条件が異なる複数の第１画像Ｐ１ａを準備して、誤検知物Ｂの検知を行わせるため、撮像条件が異なる場合にも誤検知物Ｂを適切に検知することが可能となる。そのため、第１識別モデルＭ１の再学習時に、撮像条件が異なる検知領域ＡＲの画像を多数準備する必要がなくなり、誤検知を抑制しつつ学習負荷を低減できる。

【0061】

学習部２４は、それぞれの第１画像Ｐ１ａにおける対象物Ａ（誤検知物Ｂ）同士の位置が重ならない場合には、位置が重ならないそれぞれの対象物Ａ（誤検知物Ｂ）の位置を、第１画像Ｐ１における誤検知物Ｂの位置として指定して、指定情報を設定することが好ましい。本開示の情報処理装置１０によると、撮像条件が異なるそれぞれの第１画像Ｐ１ａにおいて、異なる位置で誤検知された対象物Ａを誤検知物Ｂとして指定する。そのため、撮像条件が異なる場合にも誤検知物Ｂを適切に検知することが可能となり、結果として第１識別モデルＭ１による対象物Ａの誤検知をより適切に抑制できる。

【0062】

学習部２４は、それぞれの第１画像Ｐ１における対象物Ａ（誤検知物Ｂ）同士の位置が重なる場合には、位置が重なるそれぞれの対象物Ａ（誤検知物Ｂ）の位置を含む領域ＲＢを、第１画像Ｐ１における誤検知物Ｂの位置として指定して、指定情報を設定することが好ましい。本開示の情報処理装置１０によると、撮像条件が異なるそれぞれの第１画像Ｐ１ａにおいて、同じ位置で誤検知された対象物Ａを誤検知物Ｂとして指定する。そのため、特に誤検知されやすい箇所を、誤検知物Ｂとして適切に検知することが可能となり、結果として第１識別モデルＭ１による対象物Ａの誤検知をより適切に抑制できる。

【0063】

学習部２４は、誤検知物Ｂの領域ＲＢと位置が重なる誤検知物Ｂ（領域ＲＡ）の数が多いほど、その領域ＲＢが対象物Ａとして誤検知される確率が高い旨を示す重み付け指標を、教師データとして、第２識別モデルＭ２に機械学習させることが好ましい。本開示の情報処理装置１０によると、対象物Ａであると誤検知される頻度が高かった領域と特徴量が近い領域を、誤検知物Ｂであると高精度に検知することが可能となる。そのため、結果として第１識別モデルＭ１による対象物Ａの誤検知をより適切に抑制できる。

【0064】

第２画像解析部２８は、異なる検知領域ＡＲが写る複数の第２画像Ｐ２のデータを、学習済みの第２識別モデルＭ２に入力することで、それぞれの第２画像Ｐ２について、誤検知物Ｂが含まれるかの判断結果を出力させることが好ましい。再学習部３２は、それぞれの検知領域ＡＲのうちで、誤検知物Ｂが含まれると判断された検知領域ＡＲが写る第３画像Ｐ３のデータで、第１識別モデルＭ１を更に学習させることが好ましい。本開示の情報処理装置１０によると、検知領域ＡＲ毎に誤検知物Ｂを検知して、誤検知物Ｂを含む検知領域ＡＲの第３画像Ｐ３を用いて、第１識別モデルＭ１を学習させる。そのため、第１識別モデルＭ１の再学習時に、撮像条件が異なる検知領域ＡＲの画像を多数準備する必要がなくなり、誤検知を抑制しつつ学習負荷を低減できる。

【0065】

再学習部３２は、誤検知物Ｂが含まれると判断された検知領域ＡＲが写る第３画像Ｐ３のデータと、第３画像Ｐ３に対象物Ａが含まれない旨を示す情報と、を教師データとして、第１識別モデルＭ１を更に学習させることが好ましい。本開示の情報処理装置１０によると、誤検知されやすい検知領域ＡＲの、対象物Ａが含まれない状態での第３画像Ｐ３を用いて機械学習させるため、誤検知されやすい検知領域ＡＲにおいて誤検知することを適切に抑制できる。

【0066】

本開示の検知装置１は、情報処理装置１０の再学習部３２により更に学習された第１識別モデルＭ１を用いて、検知領域ＡＲにおける対象物Ａの有無を検知する。この検知装置１は、再学習部３２により更に学習された第１識別モデルＭ１を用いることで、誤検知を抑制しつつ対象物Ａを適切に検知できる。

【0067】

以上、本開示の実施形態を説明したが、この実施形態の内容により実施形態が限定されるものではない。また、前述した構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。さらに、前述した構成要素は適宜組み合わせることが可能である。さらに、前述した実施形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換又は変更を行うことができる。

【符号の説明】

【0068】

１検知装置
１０情報処理装置
２０第１画像取得部
２２第１画像解析部
２４学習部
２６第２画像取得部
２８第２画像解析部
３０第３画像取得部
３２再学習部
Ａ対象物
ＡＲ検知領域
Ｂ誤検知物
Ｐ１、Ｐ１ａ第１画像
Ｐ２第２画像
Ｐ３第３画像

【図1】