特許7162412 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日立マクセル株式会社の特許一覧

特許7162412検知認識システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-10-20

(45)【発行日】2022-10-28

(54)【発明の名称】検知認識システム

(51)【国際特許分類】

G06T 7/00 20170101AFI20221021BHJP

G06N 20/00 20190101ALI20221021BHJP

G08B 13/196 20060101ALI20221021BHJP

G08B 25/00 20060101ALI20221021BHJP

G08B 25/04 20060101ALI20221021BHJP

H04N 5/225 20060101ALI20221021BHJP

H04N 5/232 20060101ALI20221021BHJP

H04N 7/18 20060101ALI20221021BHJP

【ＦＩ】

G06T7/00 350B

G06N20/00 130

G08B13/196

G08B25/00 510M

G08B25/04 E

H04N5/225 700

H04N5/232 250

H04N7/18 D

【請求項の数】 6

(21)【出願番号】P 2016231534

(22)【出願日】2016-11-29

(65)【公開番号】P2018088157

(43)【公開日】2018-06-07

【審査請求日】2019-08-19

【審判番号】

【審判請求日】2021-01-07

(73)【特許権者】

【識別番号】000005810

【氏名又は名称】マクセル株式会社

(74)【代理人】

【識別番号】100104547

【弁理士】

【氏名又は名称】栗林三男

(72)【発明者】

【氏名】大坪宏安

【合議体】

【審判長】五十嵐努

【審判官】畑中高行

【審判官】川崎優

(56)【参考文献】

【文献】国際公開第２０１３／１５７２６５（ＷＯ，Ａ１）

【文献】特開２０１３－２４２８２５（ＪＰ，Ａ）

【文献】特開２０１６－１９１９７３（ＪＰ，Ａ）

【文献】特開２０１２－２５２５０７（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

G06T1/00,7-00-7/90

H04N5/222-257,7/18

G08B13/194-13/196,25/00-25/04

G06N20/00

(57)【特許請求の範囲】

【請求項1】

複数のカメラと、サーバと、を備え、
前記カメラは、撮像をする撮像手段と、検知／認識手段と、を備え、
前記サーバは、サーバ側検知／認識手段と、機械学習手段と、検知／認識ファームウェア生成手段と、を備え、
前記検知／認識手段は、検知／認識ファームウェアを備え、前記撮像手段で取得した画像から前記検知／認識ファームウェアによる制御により、画像に含まれる特徴を検知して、設定された認識対象を認識するとともに、前記検知／認識ファームウェアを前記検知／認識ファームウェア生成手段で生成された新たな検知／認識ファームウェアに更新可能であり、
前記サーバ側検知／認識手段は、サーバ側検知／認識ファームウェアを備え、前記撮像手段で取得した画像から前記サーバ側検知／認識ファームウェアによる制御により、画像に含まれる特徴を検知して、設定された認識対象を認識するとともに、前記サーバ側検知／認識ファームウェアを検知／認識ファームウェア生成手段で生成された新たなサーバ側検知／認識ファームウェアに更新可能であり、
前記機械学習手段は、前記撮像手段で取得した画像を教師データとして機械学習により検知／認識アルゴリズムを生成する処理を実行し、
前記検知／認識ファームウェア生成手段は、前記検知／認識アルゴリズムから前記検知／認識手段の新たな検知／認識ファームウェアを生成する処理と、前記検知／認識アルゴリズムから前記サーバ側検知／認識手段の新たなサーバ側検知／認識ファームウェアを生成する処理と、を実行し、
前記複数のカメラは、前記撮像手段による撮像範囲および設定された認識対象のうちの少なくとも一部が重複し、
前記サーバは、前記サーバ側検知／認識手段での認識対象の認識に基づいて、所定の端末が当該端末のユーザへ認識対象を認識した旨の報知を行うための情報を、当該端末に対して出力することを特徴とする検知認識システム。

【請求項2】

前記サーバ側検知／認識手段は、前記検知／認識手段における認識対象の認識の正誤に関する判断を行うことを特徴とする請求項１に記載の検知認識システム。

【請求項3】

前記複数のカメラのうちの少なくとも１台は、音声入力手段を備え、
検知／認識手段または前記サーバ側検知／認識手段は、前記音声入力手段で取得された音声を使用して、設定された認識対象の認識を行うことを特徴とする請求項１または２に記載の検知認識システム。

【請求項4】

前記機械学習手段は、前記複数のカメラのうちの、一部のカメラが重複する認識対象を認識した場合に、前記複数のカメラのうちの、他のカメラが前記重複する認識対象を認識しなかった画像を教師データとして、機械学習をすることを特徴とする請求項１～３のいずれか１項に記載の検知認識システム。

【請求項5】

複数のカメラと、サーバと、を備え、
前記カメラは、撮像をする撮像手段と、検知／認識手段と、を備え、
前記サーバは、機械学習手段と、検知／認識ファームウェア生成手段と、を備え、
前記検知／認識手段は、検知／認識ファームウェアを備え、前記撮像手段で取得した画像から前記検知／認識ファームウェアによる制御により、画像に含まれる特徴を検知して、設定された認識対象を認識するとともに、前記検知／認識ファームウェアを前記検知／認識ファームウェア生成手段で生成された新たな検知／認識ファームウェアに更新可能であり、
前記機械学習手段は、前記撮像手段で取得した画像を教師データとして機械学習により検知／認識アルゴリズムを生成する処理を実行し、
前記検知／認識ファームウェア生成手段は、前記検知／認識アルゴリズムから前記検知／認識手段の新たな検知／認識ファームウェアを生成する処理を実行し、
前記複数のカメラは、前記撮像手段による撮像範囲および設定された認識対象のうちの少なくとも一部が重複し、
前記機械学習手段は、前記複数のカメラのうちの、一部のカメラが重複する認識対象を認識した場合に、前記複数のカメラのうちの、他のカメラが前記重複する認識対象を認識しなかった画像を教師データとして、機械学習をすることを特徴とする検知認識システム。

【請求項6】

前記複数のカメラのうちの少なくとも１台は、前記撮像手段の異なるカメラであることを特徴とする請求項１～５のいずれか１項に記載の検知認識システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、検知認識システムに関する。

【背景技術】

【0002】

従来、人や物等の物体を検知／認識するカメラが知られている（例えば、特許文献１，２参照）。このようなカメラは、例えば、監視カメラとして防犯の目的に使用され、検知／認識により異常が発見された場合に警報を発したりする。

【0003】

また、近年、画像認識等の分野において、機械学習がよく用いられるようになってきている。機械学習の手法としては、例えばディープラーニング等が知られている。ディープラーニングは、多層構造のニューラルネットワークを用いて、データの特徴を学習するものであり、これを用いることで、高精度の画像認識が可能になることが知られている。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１２－２０８８５１号公報

【文献】特開２０１０－１６０７４３号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

ところで、監視カメラ等は、設置してから長期間使用する場合も多いが、画像から物体等を検知／認識する技術は日々進歩しているので、長期間使用をしていると、そのカメラに用いられている検知／認識技術が時代遅れのものとなってしまうおそれがある。
また、検知／認識のアルゴリズムは、使用される場所等の環境や、撮影対象等によって、最適なアルゴリズムが変わってくるので、カメラの設置前からカメラにもともと備えられていた検知／認識のファームウェアに用いられている検知／認識アルゴリズムでは、十分な検知／認識が行なえない可能性がある。

【0006】

本発明は、前記事情に鑑みてなされたもので、画像に含まれる特徴を検知し、この特徴から設定された認識対象を認識する検知／認識の性能を、検知／認識のためのファームウェアを更新して向上させることができる検知認識システムを提供することを目的とする。

【課題を解決するための手段】

【0007】

前記目的を達成するために、本発明の検知認識システムは、
撮像をする撮像手段と、検知／認識手段と、サーバと、を備え、
前記検知／認識手段は、検知／認識ファームウェアを備え、前記撮像手段で取得した画像から前記検知／認識ファームウェアによる制御により、前記画像に含まれる特徴を検知して、設定された認識対象を認識するとともに、前記検知／認識ファームウェアを検知／認識ファームウェア生成手段で生成された新たな検知／認識ファームウェアに更新可能であり、
前記サーバは、前記撮像手段で取得した画像を教師データとして機械学習により検知／認識アルゴリズムを生成する機械学習手段と、前記検知／認識アルゴリズムから前記検知／認識手段の新たな検知／認識ファームウェアを生成する前記検知／認識ファームウェア生成手段と、を備えることを特徴とする。

【0008】

本発明においては、撮像手段は、撮像をする。そして、検知／認識手段は、撮像手段での撮像により得られた画像から、検知／認識ファームウェアによる制御により、画像に含まれる特徴を検知して、設定された認識対象を認識する。また、サーバの機械学習手段は、撮像手段で取得した画像を教師データとして機械学習により検知／認識アルゴリズムを生成する。そして、生成された検知／認識アルゴリズムは、サーバの検知／認識ファームウェア生成手段により、検知／認識手段に適合したファームウェア（検知／認識ファームウェア）に変換される。そして、検知／認識手段の検知／認識ファームウェアは、検知／認識ファームウェア生成手段によって生成された新たな検知／認識ファームウェアに更新される。
したがって、撮像手段で得られた画像から、機械学習により、より高精度な検知および認識が行なえる検知／認識アルゴリズムを生成し、この検知／認識アルゴリズムを、検知／認識手段に適合したファームウェアに変換し、検知／認識手段の検知／認識ファームウェアを更新することができるので、検知／認識の性能を向上させることができる。

【0009】

また、本発明の前記構成において、前記機械学習手段は、前記検知／認識手段が、前記設定された認識対象の認識を誤った際の画像を教師データとして機械学習をすることが好ましい。

【0010】

このような構成によれば、機械学習手段は、検知／認識手段が設定された認識対象の認識を誤った際の画像について、認識対象の認識を誤ることがないように、学習し、新たな検知／認識アルゴリズムを生成し、新たな検知／認識ファームウェアを生成することが可能となるので、確実に検知／認識の性能を向上させることができる。

【0011】

また、本発明の前記構成において、
少なくとも１台のカメラを備え、
前記カメラは、前記撮像手段と前記検知／認識手段とを備えることが好ましい。

【0012】

このような構成によれば、カメラとは別に検知／認識手段を備える端末等を備える必要がないので、システム全体の小型化が行なえる。また、カメラは、検知／認識手段の検知／認識ファームウェアを、サーバでの機械学習の結果作成された新たな検知／認識ファームウェアに、更新することができるので、カメラの検知／認識性能を向上させることができる。したがって、設置後のカメラ等であっても容易にカメラの検知／認識性能を向上させることができる。

【0013】

また、本発明の前記構成において、
前記撮像手段による撮像範囲および前記設定された認識対象のうちの少なくとも一部が重複する複数の前記カメラを備えることが好ましい。

【0014】

このような構成によれば、所定の範囲について複数のカメラで撮像し、検知／認識を行うことができる。したがって、同一の物体や、同一の現象について、複数のカメラで検知／認識をすることができるので、検知／認識の精度を高めることができる。

【0015】

また、本発明の前記構成において、
前記機械学習手段は、前記複数のカメラのうちの、一部のカメラが重複する認識対象を認識した場合に、前記複数のカメラのうちの、他のカメラが前記重複する認識対象を認識しなかった画像を教師データとして、機械学習をすることが好ましい。

【0016】

このような構成によれば、少なくとも１台のカメラが重複する認識対象を認識した場合に、他のカメラが重複する認識対象を認識することができなかった画像を教師データとして、機械学習をすることができる。したがって、認識対象を認識して欲しかったのに認識することができなかった可能性の高い画像を教師データとして機械学習をすることができ、機械学習の効率を高めることができる。

【0017】

また、本発明の前記構成において、前記複数のカメラのうちの少なくとも１台は、前記撮像手段が異なるカメラであることが好ましい。

【0018】

このような構成によれば、ある撮像手段により撮像した画像からでは、検知／認識をすることが困難であり、その撮像手段を備えるカメラでは認識対象を認識することができない場合でも、他の撮像手段を備えるカメラで認識対象を認識することが可能となる。これにより、認識対象を認識することができなかったことを容易に知ることができ、認識することができなかった画像を教師データとして、機械学習をすることができるので、検知／認識をすることが困難な画像からでも認識することができるように機械学習をすることができる。

【発明の効果】

【0019】

本発明によれば、画像に含まれる特徴を検知し、この特徴から設定された認識対象を認識する検知／認識の性能を、検知／認識のためのファームウェアを更新して向上させることができる。

【図面の簡単な説明】

【0020】

【図1】本発明の実施の形態を示すもので、検知認識システムを示すブロック図である。

【図2】同、検知認識システムのカメラを示すブロック図である。

【図3】同、検知認識システムのサーバを示すブロック図である。

【図4】同、検知認識システムによる検知認識ファームウェアの更新方法を説明するためのフローチャートである。

【発明を実施するための形態】

【0021】

以下、図面を参照しながら、本発明の実施の形態について説明する。
本実施の形態の検知認識システムは、例えば、カメラで撮像した画像から設定された認識対象を認識した場合に、報知をするのに用いられる。
なお、以下において、単に、画像といった場合、基本的には動画と静止画との両方を含む。

【0022】

検知認識システム１は、図１に示すように、複数のカメラ２と、サーバ３と、端末４と、を備える。また、複数のカメラ２とサーバ３と端末４とは、それぞれ有線または無線のネットワーク５により繋がれている。

【0023】

検知認識システム１は、例えば、カメラ２が監視用のカメラとしてコンビニエンストア等の建物内あるいは屋外等に設置され、カメラ２が撮影した対象を、その外形や動きから不審者であると認識した場合に、別の場所にある端末４に報知をするといったように使用することができる。また、このように不審者を認識した場合に、検知認識システム１の管理者６が持つ端末やシステム管理用の装置等に知らせるようにしてもよい。

【0024】

カメラ２は、図２に示すように、撮像手段２０と、検知／認識手段２１と、記録手段２２と、通信手段２３と、制御手段２４と、を備える。
撮像手段２０は、例えば、レンズや固体撮像素子を有し、撮像により、画像を取得する。また、検知／認識手段２１は、演算処理装置とメモリとを備え、画像認識を行う。具体的には、検知／認識手段２１のメモリに備えられた検知／認識ファームウェアによる制御により、撮像手段２０によって撮像された画像に含まれる特徴を検知し、この特徴から設定された認識対象を認識する。なお、以下で単に検知／認識といった場合には、基本的に、このように、撮像手段２０によって撮像された画像に含まれる特徴を検知し、この特徴から設定された認識対象を認識することをいう。

【0025】

また、記録手段２２は、検知／認識手段２１での検知／認識のための参照画像その他の情報や、異常時（例えば、検知／認識手段２１が設定された認識対象を認識したとき）の画像その他の情報（例えば、音声等）の記録をする。また、通信手段２３は、ネットワーク５を介してサーバ３と通信し、異常時の画像その他の情報のサーバ３への送信と、サーバ３からの命令や検知認識ファームウェアの受信をする。また、通信手段２３は、ネットワーク５を介して端末４や管理者６の持つ端末とも接続をし、異常時に、これらの端末やサーバ３にアラーム信号等を送信する。また、端末４や管理者６の持つ端末は、このアラーム信号を受信して、あるいは、アラーム信号を受信したサーバ３からのアラームを鳴らす旨の命令を受けてアラームを鳴らす等する。

【0026】

また、制御手段２４は、演算処理装置およびメモリを備え、撮像手段２０、検知／認識手段２１、記録手段２２および通信手段２３を制御する。なお、制御手段２４は、検知／認識手段２１と演算処理装置またはメモリを共有することとしてもよい。

【0027】

なお、撮像手段２０、検知／認識手段２１、記録手段２２、通信手段２３および制御手段２４の全てをカメラ２が備える構成としなくてもよい。例えば、検知認識システム１は、カメラ２と有線または無線により接続され、カメラ２の制御やカメラ２で撮影した画像の表示等ができる端末をカメラ２の外部に備え、撮像手段２０をカメラ２に配置し、検知／認識手段２１、記録手段２２、通信手段２３および制御手段２４を当該端末に設け、カメラ２に備えられた撮像手段２０で撮影した画像に対して当該端末で検知／認識をするようにしてもよい。

【0028】

カメラ２は、例えば、一般的な監視カメラと同様の構成を有するもので、例えば、カメラ２の向きに応じて、撮像手段２０が設定された画角に対応する撮像範囲を撮像する。検知認識システム１が備える複数のカメラ２には、それぞれ同種のカメラを用いてもよく、種類の異なるカメラを用いてもよい。また、それぞれのカメラ２の撮像範囲は重複していてもよく、全く異なるものであってもよい。
本実施の形態においては、カメラ２として、２台のステレオカメラ２ａと、１台の赤外線カメラ２ｂと、１台の単眼カメラ２ｃと、の計４台の種類の異なるカメラ２を用いるようになっており、４台のカメラ２の撮像範囲は互いに重複しているものとする。
カメラ２として、視差から距離、サイズまたは３Ｄ構造等を算出可能なステレオカメラ２ａを用いることで、視差から距離、サイズまたは３Ｄ構造等を算出できるので、検知／認識をするための演算処理装置等に必要な性能を低減させることができ、カメラが高性能な演算処理装置等を備えていなくても、検知／認識を容易に行うことができる。

【0029】

また、カメラ２として、赤外線カメラ（近赤外線カメラまたは遠赤外線カメラ）２ｂを用いることで、近赤外または遠赤外の画像を撮影することができ、人の目では見ることができないものも検知／認識することができる。また、夜間等、暗い環境における検知／認識も容易になる。

【0030】

また、カメラ２の種類は、これらに限られるものではない。例えば、カメラ２として、距離画像センサを用いてもよい。距離画像センサとしては、例えば、ＴＯＦ（ＴｉｍｅＯｆＦｌｉｇｈｔ）を用いることができる。ＴＯＦは、投射したレーザーが対象まで往復するのにかかる時間から、距離を計測する。

【0031】

つまり、カメラ２は、撮像手段２０が１つの２次元画像を撮像し、この画像より、検知／認識を行うものでもよく、撮像手段２０が２つの画像を撮像し、これらの画像の視差より、距離、サイズ、３Ｄ構造等を算出し、検知／認識を行うものでもよく、撮像手段２０がＴＯＦセンサ等により、３Ｄ距離画像を撮像し、この３Ｄ距離画像より、検知／認識を行うものでもよく、撮像手段２０が近赤外や遠赤外の画像を撮像し、これらの画像より、検知／認識を行うものでもよい。また、１台のカメラ２が、上記の撮像手段２０を複数備えていてもよい。すなわち、１台のカメラ２が、例えば、ステレオカメラおよび赤外線カメラの撮像機能を備えており、これらの機能により得られた画像から検知／認識を行ってもよい。

【0032】

検知／認識手段２１は、設定された認識対象を認識するものであり、認識対象は、具体的な物体（人および人以外の物も含む）の場合もあれば、抽象的な現象の場合も考えられる。つまり、認識対象が強盗犯、窃盗犯、放火犯のような人や拳銃のような物といった物体の場合もあれば、犯罪や火災といった現象等の場合もある。
例えば、認識対象として強盗犯が設定されている状態において、コンビニエンスストア内に設置されたカメラ２の撮像手段２０により、包丁や拳銃を持った人の画像が撮影された場合に、検知／認識手段２１は、この画像から、包丁や拳銃を持った人を検知したり、この人の動きを検知したりして、この人を強盗犯と認識することが考えられる。また、例えば、認識対象として火災が設定されている状態において、赤外線カメラにより得られた画像から、ある場所の温度が異常に高いことを検知し、火災が発生していると認識したりすることが考えられる。また、例えば、赤外線カメラが遠赤外線を使ったものであれば、温度を検知することができ、拳銃、ナイフ等の武器と体温との温度差により、服のポケット等に隠し持った拳銃、ナイフ等の武器を画像認識して検知することも考えられる。ただし、検知／認識手段２１の検知／認識ファームウェアは、後述する機械学習手段３０での機械学習により生成されるので、実際には、検知／認識手段２１が、このような人に理解しやすい（理解可能な）認識の仕方をするとは限らない。
つまり、検知／認識手段２１は、検知／認識ファームウェアによる制御により、撮像手段２０によって撮像された画像に含まれる特徴を検知し、この特徴から設定された認識対象を認識するものである。
なお、検知／認識手段２１は、画像だけでなく、音声も使用して検知／認識を行ってもよい。例えば、カメラ２がマイク等の音声入力手段を備えており、この音声入力手段で取得された音声を使用して検知／認識を行うことで、検知／認識の精度を高めることができる。また、後述するサーバ側検知／認識手段３２での検知／認識においても、同様に、音声を使用してもよい。

【0033】

なお、検知／認識手段２１の検知／認識ファームウェアは、後述する機械学習手段３０および検知／認識ファームウェア生成手段３１で生成された新たな検知／認識ファームウェアによって更新されるが、更新される前の、最初に検知／認識手段２１に備えられる検知／認識ファームウェアは、機械学習手段３０および検知／認識ファームウェア生成手段３１により生成されたものでもよく、他の機械学習ができる機器によって生成されたものを検知／認識手段２１に組み込んだものであってもよい。また、機械学習以外の方法により生成された検知／認識ファームウェアを最初に検知／認識手段２１に備えることとしてもよい。

【0034】

また、検知／認識手段２１で認識する対象の設定は、検知／認識ファームウェアに含まれているものとする。例えば、検知／認識ファームウェアを機械学習手段３０および検知／認識ファームウェア生成手段３１により生成する場合において、認識する対象をコンビニエンスストアでの強盗犯としたい場合、機械学習の教師データとして、例えば、コンビニエンスストアで強盗をした強盗犯が写っている複数の画像と、これらの画像が強盗犯を示す画像だという情報とを教師データとして（画像に強盗犯というタグ付けをして）機械学習手段３０に与える。すると、機械学習により、与えられた画像（教師データ）のどこに注目すれば強盗犯を認識することができるかが学習される。そして、機械学習の結果、画像から強盗犯を認識することができる確率の高い検知／認識アルゴリズムが生成される。そして、この検知／認識アルゴリズムが検知／認識ファームウェア生成手段３１により変換され、検知／認識ファームウェアが生成される。つまり、この学習により得られた検知／認識ファームウェア（検知／認識アルゴリズム）は、画像のどこに注目すれば、画像に強盗犯が含まれているかを認識することができるものであり、認識する対象として、強盗犯が設定されているといえるということである。なお、この機械学習を行う際に画像に対するタグ付けは必ずしも必要ではない。例えば、教師データとして、強盗犯が写っている画像しか与えないのであれば、それが強盗犯を示す画像だという情報がなくても、教師データとして与えられた画像と特徴が近い画像を認識するアルゴリズムを生成することで、強盗犯を認識するアルゴリズムを生成することは可能である。
なお、検知／認識ファームウェアに設定されている認識対象（検知／認識ファームウェアが認識する対象）は、１つとは限らず、複数設定されていてもよい。

【0035】

以上のように、検知／認識ファームウェアは、特定の対象を認識するものであり、検知／認識手段２１は、検知／認識ファームウェアによりこの特定の対象を認識した場合に、認識をした旨の信号等（例えば、アラーム信号）を出力する。また、この認識をした旨の信号等は、通信手段２３を介してサーバ３や端末４、管理者６の持つ端末等に送られ、これらの端末等に設定対象を認識した旨の通知がなされる。なお、この認識をした旨の信号等は、サーバ３のみに送られ、サーバ３において各カメラ２からの情報を総合的に判断した上で、サーバ３から端末４等に、認識対象を認識した旨のメールやアラームを鳴らす旨の命令等のアラーム情報等を送るようにしてもよい。

【0036】

また、４台のカメラ２は、撮像範囲が互いに重複しており、検知／認識ファームウェアに設定されている認識対象のうち重複する部分について、４台のカメラ２で同時に認識することが可能となっている。つまり、重複する認識対象として、例えば強盗犯が設定されている場合、４台のカメラで同時に、特定の強盗を行う特定の強盗犯を認識することが可能となっている。

【0037】

サーバ３は、図３に示すように、機械学習手段３０と、検知／認識ファームウェア生成手段３１と、サーバ側検知／認識手段３２と、サーバ側記録手段３３と、サーバ側通信手段３４と、サーバ側制御手段３５と、を備える。また、機械学習手段３０、検知／認識ファームウェア生成手段３１、サーバ側検知／認識手段３２およびサーバ側制御手段３５は、演算処理装置とメモリとを有するが、それぞれが個別の演算処理装置またはメモリを有していてもよく、演算処理装置またはメモリを共有するものであってもよい。

【0038】

機械学習手段３０は、例えば、ディープラーニング等の機械学習を行い検知／認識アルゴリズムを生成する。ここで、検知／認識アルゴリズムとは、カメラ２の撮像手段２０で撮像された画像から、設定された認識対象を認識するためのアルゴリズムである。

【0039】

検知／認識ファームウェア生成手段３１は、機械学習手段３０が生成した検知／認識アルゴリズムを各カメラ２で実行可能なファームウェアに変換し、検知／認識ファームウェアを生成する。各カメラ２は、撮像手段２０により取得できる画像の解像度や、検知／認識手段２１の演算処理装置の性能、検知／認識手段２１用のＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）の有無、マイク等の音声入力手段の有無、カメラの種類（ステレオカメラか、ＴＯＦセンサか等）等が異なるので、各カメラ２で実行可能なファームウェアも異なる。検知／認識ファームウェア生成手段３１により、機械学習により生成した検知／認識アルゴリズムを各カメラ２で実行可能なファームウェアに変換することで、各カメラ２に新しい検知／認識用のプログラムを実装することが可能となる。

【0040】

サーバ側検知／認識手段３２は、各カメラ２の画像や情報から総合的に状況を判断して検知／認識をする。例えば、各カメラ２の検知／認識手段２１は、そのカメラ２の撮像手段２０により取得した画像を使用して検知／認識を行うが、サーバ側検知／認識手段３２は、複数のカメラ２で取得した画像を使用して検知／認識を行う。また、各カメラ２で行うには重い処理である場合に、サーバ側検知／認識手段３２が処理の一部を行うようにしてもよい。また、サーバ側検知／認識手段３２の検知／認識ファームウェアは、サーバ側検知／認識手段３２のメモリに備えられている。また、サーバ側検知／認識手段３２の検知／認識ファームウェアも機械学習手段３０および検知／認識ファームウェア生成手段３１により生成された検知／認識ファームウェアによって、更新することが可能となっている。

【0041】

また、サーバ側検知／認識手段３２は、４台のカメラ２（カメラ２ａ，２ｂ，２ｃ）の検知／認識手段２１の認識結果から、各カメラ２における認識対象の認識が正しいものか、あるいは、各カメラ２における認識対象の認識が正しい確率等を判断してもよい。そして、この判断結果から、端末４等にアラーム情報等を送るようにしてもよい。例えば、４台のカメラ全てから設定対象（例えば強盗）を認識した旨の通知があった場合に、サーバ側検知／認識手段３２は、設定対象の認識が正しいと判断し、端末４等にアラームを鳴らすように命令してもよい。また、設定対象を認識したカメラの台数によって、アラーム情報の内容を変える等してもよい。例えば、４台のカメラ全てが設定対象を認識した場合には、認識が正しいと判断して、サーバ側検知／認識手段３２は、端末４に大きなアラーム音を鳴らすように命令するが、３台以下のカメラしか設定対象を認識しなかった場合には、認識が正しい可能性があると判断して、サーバ側検知／認識手段３２は、端末４に小さなアラーム音を鳴らすように命令するといったようにしてもよい。

【0042】

また、サーバ側検知／認識手段３２は、複数のカメラ２の検知／認識手段２１の認識結果から、カメラ２の誤認識（認識ミス）の判断を行う。例えば、４台のカメラ２のうち、３台のカメラ２から検知／認識手段２１により設定対象を認識した旨の通知があり、１台のカメラ２からは通知がなかった場合に、この１台のカメラ２は誤認識（認識ミス）をしたと判断をしたりする。また、逆に４台のカメラ２のうち、３台のカメラ２からは検知／認識手段２１により設定対象を認識した旨の通知がなかったが、１台のカメラ２からは通知があった場合に、この１台のカメラ２は誤認識（認識ミス）をしたと判断をすることとしてもよい。
なお、サーバ側検知／認識手段３２での検知／認識の結果と、各カメラ２での検知／認識の結果とを比較して、各カメラ２の誤認識（認識ミス）の判断をしてもよい。

【0043】

サーバ側記録手段３３は、機械学習手段３０で行う機械学習の教師データ等を記録する。また、サーバ側通信手段３４は、ネットワーク５を介して各カメラ２と通信をし、各カメラ２からの画像その他の情報の受信、各カメラ２への命令や検知／認識ファームウェアの送信、異常時（設定対象を認識したとき）のアラーム情報の端末４や管理者６への送信をする。

【0044】

次に、このような検知認識システム１の検知認識ファームウェアの更新方法について、図４のフローチャートを参照して説明する。
カメラ２は、撮像手段２０により画像を取得し、検知／認識手段２１の検知／認識ファームウェアによる制御により設定された認識対象の認識（検知／認識）を行う。そして、認識を誤った場合に、認識を誤った時の画像を、サーバ３に送信する（ステップＳ１）。なお、認識を誤った時の画像と同時に、認識を誤った時の音声データ等も送信してもよい。
なお、認識を誤ったかどうかの判断は、上述のように、複数のカメラ２の認識結果からサーバ側検知／認識手段３２が判断する。例えば、カメラ２が設定された認識対象（例えば、強盗犯）を認識したときは、サーバ３に認識した旨（例えば、強盗犯を認識した旨）を通知するシステムにおいて、カメラ２ａおよびカメラ２ｂからは認識した旨の通知がサーバ３にあったが、カメラ２ｃからは認識した旨の通知がなかった場合、サーバ側検知／認識手段３２はこれらの通知結果から、カメラ２ｃは認識を誤った（認識をすることができなかった）と判断する。この際、サーバ３の制御手段は、カメラ２ｃに対して、カメラ２ａおよびカメラ２ｂが認識対象を認識した画像を取得した時刻と同じ時刻またはこの前後の時刻（例えば、前後数秒から数分）にカメラ２ｃが取得した画像を、認識を誤った時の画像として、サーバ３に送信するように、カメラ２ｃに対して命令する。この命令を受けてカメラ２ｃは、認識を誤った時の画像をサーバ３に送信する。
なお、認識を誤ったかどうかは、人が判断してもよい。例えば、検知認識システム１は、カメラ２で撮影した画像を表示する表示手段とポインティングデバイスやキーボード等の入力手段を備えた端末とを備えており、カメラ２が、強盗犯を認識することができなかった場合に、人が、この端末の表示手段からカメラ２で撮影した画像を確認して、強盗犯を認識して欲しかった画像をこの端末の入力手段を用いて人が選択し、認識を誤った時の画像としてサーバ３に送信することとしてもよい。

【0045】

サーバ側制御手段３５は、カメラ２から送られた認識を誤った時の画像を、教師データ（教育データ）としてサーバ側記録手段３３に記録する。また、認識を誤った時の画像の記録と共に、検知／認識手段２１に出して欲しかった認識結果（例えば、画像から強盗犯を認識して欲しかった旨）を教師データとしてサーバ側記録手段３３に記録する。
なお、この教師データとして記録する検知／認識手段２１に出して欲しかった認識結果は、サーバ３で作り出すものであってもよく、カメラ２から送られてくるものであってもよい。例えば、認識を誤ったかどうかの判断を、複数のカメラ２の認識結果からサーバ側検知／認識手段３２がする場合、サーバ側検知／認識手段３２は、正しいであろう認識結果（検知／認識手段２１に出して欲しかった認識結果）を教師データとして作成し、この教師データをサーバ側記録手段３３に記録することとしてもよい。また、例えば、人がカメラ２で撮影した画像を確認して、認識を誤ったかどうかの判断をする場合、人が上述の端末から、強盗犯を認識して欲しかった画像を選択する際に、強盗犯を認識して欲しかった旨（画像が強盗犯を示すものである旨）もこの端末の入力手段を用いて入力し、認識を誤った時の画像と共にサーバ３に送信し、この送信されたデータを教師データとして、サーバ側制御手段３５がサーバ側記録手段３３に記録するものとしてもよい。

【0046】

機械学習手段３０は、サーバ側記録手段３３に記録された教師データを読み出す（ステップＳ２）。そして、機械学習手段３０は、この読み出した教師データに含まれる認識を誤った際の画像から、畳み込み演算により、特徴点を抽出する（ステップＳ３）。機械学習手段３０は、抽出された特徴点と、検知／認識手段２１に出して欲しかった認識結果との情報から、機械学習を行う（ステップＳ４）。そして、機械学習の結果、検知認識処理を行うニューラルネットワークである検知／認識アルゴリズムが生成される（ステップＳ５）。

【0047】

機械学習手段３０での機械学習は、カメラ２毎に検知／認識アルゴリズム（検知／認識ファームウェア）が最適化されるように行われる。各カメラ２は、カメラの種類等が違う場合もあれば、まったく同じ特性を持つカメラであっても、設置場所や使用される環境が違う場合もあるので、これらの違いによって最適なアルゴリズムが異なってくる場合もあるからである。機械学習手段３０は、元の検知／認識アルゴリズムと教師データとを基に、教師データに含まれる認識を誤った際の画像から、教師データに含まれる検知／認識手段２１に出して欲しかった認識結果を出すことができる新たな検知／認識アルゴリズムを生成する。なお、機械学習に使う元の検知／認識アルゴリズムはサーバ側記録手段３３に記録しておくものとしてもよく、カメラ２から検知／認識ファームウェアを送信してもらい、この検知／認識ファームウェアを検知／認識アルゴリズムに変換して使用してもよい。つまり、機械学習手段３０は、検知／認識を誤ったカメラ２の検知／認識ファームウェアに用いられている検知／認識アルゴリズムと教師データとから、新たな検知／認識アルゴリズムを生成する。

【0048】

検知／認識ファームウェア生成手段３１は、機械学習手段３０で生成された検知／認識アルゴリズムを各カメラ用の検知／認識ソフトである検知／認識ファームウェアに変換する（ステップＳ６）。つまり、検知／認識アルゴリズムは、検知／認識ファームウェア生成手段３１により、各カメラで実行可能な形式のソフトウェアに変換される。
サーバ側通信手段３４は、検知／認識ファームウェア生成手段３１で生成された検知／認識ソフトである検知／認識ファームウェアをカメラ２に送信する（ステップＳ７）。そして、カメラ２が検知／認識ファームウェアを受け取ると、カメラ２の制御手段２４は、検知／認識手段２１のファームウェアを、新しい検知／認識ファームウェアに更新する。

【0049】

本実施の形態の検知認識システムによれば、カメラ２の検知／認識手段２１の検知認識ファームウェアは、サーバ３の機械学習手段３０および検知／認識ファームウェア生成手段３１により生成された新しい検知／認識ファームウェアに更新することができる。
機械学習手段３０による機械学習は、カメラ２の検知／認識手段２１が、設定された認識対象の認識を誤った際の画像を教師データとして行われるので、この教師データを用いた機械学習では、その画像について設定された認識対象の認識を誤らないように検知／認識アルゴリズムが改善される。したがって、カメラ２の検知／認識の性能を向上させることができる。

【0050】

また、機械学習はサーバ３で行い、カメラ２は、サーバ３で生成された検知認識ファームウェアの実行をすればよいので、カメラ２の演算能力等がそれほど高くなくても、検知認識ファームウェアを更新して、精度の高い検知／認識を行えるようにすることができる。また、カメラが年数の経過とともに、他のカメラに比べて相対的に性能の低いものになることもなく、むしろ、使用とともに徐々に性能を向上させることが可能となる。また、カメラ２が使用される環境に適した検知／認識ができるように、カメラ２の性能を改善させていくことが可能となる。

【0051】

また、機械が自ら学習することで、人であれば気づくことができないような場合でも、設定された認識対象を認識することが可能となる。例えば、教育データとして、強盗犯が実際に強盗をしているときの画像を与えるのではなく、実際に強盗が行なわれたときよりも前の、強盗犯が写っている画像等を与えることで、実際に強盗が行なわれている場合に強盗犯を認識するようなアルゴリズムではなく、コンビニエンスストア内やコンビニエンスストアの周囲をうろつく人の挙動等から、将来的に強盗におよぶ可能性の高い人の特徴を見出し、このような人を強盗犯（強盗犯となる可能性が高い人）として認識するような検知／認識アルゴリズムを生成することも可能になる。なお、実際にどのような特徴に注目して認識を行うかは、機械学習手段３０が判断するので、挙動から強盗におよぶ可能性の高い人を認識するとは限らない。

【0052】

また、本実施の形態の検知認識システムによれば、４台のカメラ２は、撮像範囲が互いに重複しているので、検知／認識ファームウェアに設定されている認識対象のうち重複する部分について、４台のカメラ２で同時に認識することができる。したがって、４台のカメラ２のうち、数台が認識対象を認識することができなくても、４台のカメラ２のうちの他のカメラが認識対象を認識することが可能となるので、検知／認識をすることができる可能性を高め、システム全体としての検知／認識の精度を高めることができる。
また、４台のカメラ２は、ステレオカメラ２ａ、赤外線カメラ２ｂ、単眼カメラ２ｃという、撮像手段２０の種類の異なるカメラを含む。したがって、例えば、ステレオカメラ２ａでは検知／認識をすることが困難な場合でも、赤外線カメラ２ｂで検知／認識をすることができる等して、同一種類のカメラ２を用いた場合に比べ、システム全体としての検知／認識の精度を高めることができる。
なお、複数のカメラ２は、それぞれ撮像範囲が全く異なる場所に設置されていたり、全く異なる認識対象を認識するものであったりしてもよい。

【0053】

また、サーバ側検知／認識手段３２は、４台のカメラ２の検知／認識手段２１の認識結果から、各カメラ２における認識対象の認識が正しいものかを判断したり、各カメラ２における認識対象の認識が正しい確率等を判断したり、カメラ２の誤認識（認識ミス）の判断をしたりすることができる。したがって、個々のカメラ２における検知／認識の結果から、サーバ側検知／認識手段３２で認識が正しいと判断した場合にのみ、端末４等からアラーム音を発するようにしたりすることができる。
また、カメラ２の誤認識を自動で判断し、誤認識をしたカメラ２について、検知／認識の能力を改善するよう、自動で機械学習を行うようにすることができる。そして、このときに機械学習の教師データとして用いる画像には、誤認識をした際の画像を用いることができるので、この誤認識をした際の画像について認識を誤ることがないように、学習することが可能となる。したがって、誤認識を自動で判断し、カメラ２の使用とともに検知／認識の精度を高めていくことができる。

【0054】

なお、機械学習を行うタイミングは、必要に応じて適宜調整してもよい。例えば、教師データを記録手段２２やサーバ側記録手段３３に溜めておき、一定数以上溜まった場合や、一定期間経過したときに機械学習を行ってもよい。
また、機械学習は、撮像手段２０により撮像された画像以外の画像を用いて行ってもよい。撮像手段２０で撮像される画像だけでは、教師データの数や質が十分でない場合に、機械学習手段３０に、他の画像を与えることで機械学習の効果を向上させることができる。

【0055】

なお、カメラ２で認識する認識対象は、上述のものに限られず、撮像手段２０により撮像した画像から、検知／認識可能なものであれば何でもよい。

【符号の説明】

【0056】

１検知認識システム
２カメラ
２ａステレオカメラ（カメラ）
２ｂ赤外線カメラ（カメラ）
２ｃ単眼カメラ（カメラ）
３サーバ
２０撮像手段
２１検知／認識手段
３０機械学習手段
３１認識ファームウェア生成手段

【図1】

【図2】

【図3】

【図4】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版