(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024175358
(43)【公開日】2024-12-18
(54)【発明の名称】物体検出装置、物体検出システム、物体検出方法およびプログラム
(51)【国際特許分類】
G06V 10/70 20220101AFI20241211BHJP
G06T 7/00 20170101ALI20241211BHJP
【FI】
G06V10/70
G06T7/00 350B
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023093083
(22)【出願日】2023-06-06
(71)【出願人】
【識別番号】000004330
【氏名又は名称】日本無線株式会社
(74)【代理人】
【識別番号】100126561
【弁理士】
【氏名又は名称】原嶋 成時郎
(72)【発明者】
【氏名】貝瀬 未央
(72)【発明者】
【氏名】若林 那旺
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096BA18
5L096CA02
5L096DA02
5L096EA43
5L096FA16
5L096FA52
5L096FA62
5L096FA69
5L096GA30
5L096GA51
5L096HA11
(57)【要約】
【課題】例えば機械学習がされていない物体のような、識別不可能な物体を検出することを可能とする。
【解決手段】物体検出システム100の物体検出装置1は、その機能として、受け付けた画像である画像データから、画像内に撮影された物体を検出し、検出した検出結果を符号で示す検出信号を出力する検出部52と、検出した物体のうち、識別可能な物体を判定し、検出信号に対して判定結果を反映させる判定部53と、検出信号の符号を反転させた反転信号を出力する出力部54と、を備える。判定部53は、識別可能な物体であること、または識別不可能な物体であることを判定する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
画像内に撮影された物体を検出し、検出結果を符号で示す検出信号を出力する検出部と、
検出された前記物体のうち、識別可能な物体を判定し、前記検出信号に対して判定結果を反映させる判定部と、
前記判定結果が反映された前記検出信号の符号を反転させた反転信号を出力する出力部と、を備え、
前記判定部は、検出された前記物体が、前記識別可能な物体であること、または識別不可能な物体であることを判定する、
ことを特徴とする物体検出装置。
【請求項2】
前記判定部は、前記識別可能な物体として記憶されている情報に基づき、前記物体が前記識別可能な物体であること、または識別不可能な物体であることを判定する、
ことを特徴とする請求項1に記載の物体検出装置。
【請求項3】
前記判定部は、前記識別可能な物体を学習した機械学習モデルに基づき、前記識別可能な物体であること、または識別不可能な物体であることを判定する、
ことを特徴とする請求項2に記載の物体検出装置。
【請求項4】
前記判定部は、前記物体が前記識別可能な物体である確からしさを示す尤度を算出し、前記尤度が所定の閾値以上であるときに前記物体が前記識別可能な物体であると判定する、
ことを特徴とする請求項1から3のいずれか1項に記載の物体検出装置。
【請求項5】
前記判定部は、前記識別可能な物体を検出し、前記識別不可能な物体を検出しない物体検出アルゴリズムにより実行される、
ことを特徴とする請求項1に記載の物体検出装置。
【請求項6】
前記検出部は、前記識別可能な物体を遮るように前記識別不可能な物体が配置された画像から、前記物体を検出する、
ことを特徴とする請求項1に記載の物体検出装置。
【請求項7】
前記検出部は、複数の前記物体が撮影された画像から、前記物体の数量を検出し、
前記判定部は、検出された前記物体及び前記物体の数量から、前記識別可能な物体の数量を判定し、
前記識別可能な物体の数量が所定の数量以下である場合、報知情報を出力する報知出力部をさらに備える、
ことを特徴とする請求項1に記載の物体検出装置。
【請求項8】
請求項1に記載の物体検出装置と、
前記識別可能な物体、または前記識別不可能な物体を撮影する撮影部と、を備える、
ことを特徴とする物体検出システム。
【請求項9】
プロセッサと、メモリとを備えるコンピュータにより実行されるための物体検出方法であって、
前記プロセッサが、
画像内に撮影された物体を検出し、検出結果を符号で示す検出信号を出力する検出ステップと、
検出された前記物体のうち、識別可能な物体を判定し、前記検出信号に対して判定結果を反映させる判定ステップと、
前記判定結果が反映された前記検出信号の符号を反転させた反転信号を出力する出力ステップと、を実行し、
前記判定ステップにおいて、検出された前記物体が、前記識別可能な物体であること、または識別不可能な物体であることを判定する、
ことを特徴とする物体検出方法。
【請求項10】
プロセッサと、メモリとを備えるコンピュータに実行させるためのプログラムであって、
前記プロセッサに、
画像内に撮影された物体を検出し、検出結果を符号で示す検出信号を出力する検出ステップと、
検出された前記物体のうち、識別可能な物体を判定し、前記検出信号に対して判定結果を反映させる判定ステップと、
前記判定結果が反映された前記検出信号の符号を反転させた反転信号を出力する出力ステップと、を実行させ、
前記判定ステップにおいて、検出された前記物体が、前記識別可能な物体であること、または識別不可能な物体であることを判定する、
ことを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、識別不可能な物体を検出する技術に関する。
【背景技術】
【0002】
従来、カメラ等によって撮影された画像から、画像内に撮影された所定の物体を検出する技術が知られている。このとき、所定の物体を検出するため、パターン認識技術や機械学習技術を用いた物体検出モデルにより、所定の物体の形状を撮影画像から学習することで実現していることも知られている。
【0003】
物体検出モデルを学習させるためには、所定の物体が撮影された画像を教師データとして大量に用意する必要があるが、教師データを大量に用意するのは容易ではない。そのため、複数のニューラルネットワークを用いて、撮影画像から物体の位置、属性をそれぞれ識別する物体検出装置が知られている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、このような物体検出を行うためにはコンピュータによる大量の処理が必要であり、そのためには高スペックなコンピュータが必要となる。このような高スペックなコンピュータは高額であるため、コストが掛かっていた。また、例えば、多品種小ロット生産の工場、様々な梱包の物品が出入りする受入検査場では、いつも同じ対象物の物体検出をするとは限らない。このような現場では、物体検出モデルの学習の手間は、自動で物体検出を行える、という効果に見合わない、という課題があった。
【0006】
そこでこの発明は、例えば機械学習がされていない物体のような、識別不可能な物体を検出することが可能な、物体検出装置、物体検出システム、物体検出方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上述の課題を解決するために、この発明に係る物体検出装置は、画像内に撮影された物体を検出し、検出結果を符号で示す検出信号を出力する検出部と、検出された前記物体のうち、識別可能な物体を判定し、前記検出信号に対して判定結果を反映させる判定部と、前記判定結果が反映された前記検出信号の符号を反転させた反転信号を出力する出力部と、を備え、前記判定部は、検出された前記物体が、前記識別可能な物体であること、または識別不可能な物体であることを判定する、ことを特徴とする。
【0008】
この発明に係る物体検出装置は、前記判定部が、前記識別可能な物体として記憶されている情報に基づき、前記物体が前記識別可能な物体であること、または識別不可能な物体であることを判定する、ようにしてもよい。
【0009】
この発明に係る物体検出装置は、前記判定部が、前記識別可能な物体を学習した機械学習モデルに基づき、前記識別可能な物体であること、または識別不可能な物体であることを判定する、ようにしてもよい。
【0010】
この発明に係る物体検出装置は、前記判定部が、前記物体が前記識別可能な物体である確からしさを示す尤度を算出し、前記尤度が所定の閾値以上であるときに前記物体が前記識別可能な物体であると判定する、ようにしてもよい。
【0011】
この発明に係る物体検出装置は、前記判定部が、前記識別可能な物体を検出し、前記識別不可能な物体を検出しない物体検出アルゴリズムにより実行される、ようにしてもよい。
【0012】
この発明に係る物体検出装置は、前記検出部が、前記識別可能な物体を遮るように前記識別不可能な物体が配置された画像から、前記物体を検出する、ようにしてもよい。
【0013】
この発明に係る物体検出装置は、前記検出部が、複数の前記物体が撮影された画像から、前記物体の数量を検出し、前記判定部が、検出された前記物体及び前記物体の数量から、前記識別可能な物体の数量を判定し、前記識別可能な物体の数量が所定の数量以下であることを検出すると、報知情報を出力する報知出力部をさらに備える、ようにしてもよい。
【0014】
この発明に係る物体検出システムは、上記の物体検出装置と、前記識別可能な物体、または前記識別不可能な物体を撮影する撮影部と、を備える、ようにしてもよい。
【0015】
この発明に係る物体検出方法は、プロセッサと、メモリとを備えるコンピュータにより実行されるための物体検出方法であって、前記プロセッサが、画像内に撮影された物体を検出し、検出結果を符号で示す検出信号を出力する検出ステップと、検出された前記物体のうち、識別可能な物体を判定し、前記検出信号に対して判定結果を反映させる判定ステップと、前記判定結果が反映された前記検出信号の符号を反転させた反転信号を出力する出力ステップと、を実行し、前記判定ステップにおいて、検出された前記物体が、前記識別可能な物体であること、または識別不可能な物体であることを判定する、ことを特徴とする。
【0016】
また、この発明に係るプログラムは、プロセッサと、メモリとを備えるコンピュータに実行させるためのプログラムであって、前記プロセッサに、画像内に撮影された物体を検出し、検出結果を符号で示す検出信号を出力する検出ステップと、検出された前記物体のうち、識別可能な物体を判定し、前記検出信号に対して判定結果を反映させる判定ステップと、前記判定結果が反映された前記検出信号の符号を反転させた反転信号を出力する出力ステップと、を実行させ、前記判定ステップにおいて、検出された前記物体が、前記識別可能な物体であること、または識別不可能な物体であることを判定する、ことを特徴とする。
【発明の効果】
【0017】
この発明に係る物体検出装置、物体検出システム、物体検出方法およびプログラムによれば、画像内に撮影された物体を検出し、検出された物体のうち識別可能な物体を判定し、判定結果を符号で示す検出信号を出力し、検出信号の符号を反転させた反転信号を出力する。このとき、検出された物体が、識別可能な物体であること、または識別不可能な物体であることを判定する。そのため、識別可能な物体、または識別不可能な物体が撮影された画像から、識別可能な物体を検出した検出信号の符号を反転させて出力するので、識別不可能な物体が検出されたことを認識することが可能である。これにより、識別不可能な物体について新たな機械学習を行うことなく、識別不可能な物体が検出されたことを認識することが可能になる。
【0018】
この発明に係る物体検出装置によれば、識別可能な物体として記憶されている情報に基づき、物体が識別可能な物体であること、または識別不可能な物体であることを判定する。そのため、識別可能な物体を確実に検出するので、識別不可能な物体も確実に認識することが可能である。
【0019】
この発明に係る物体検出装置によれば、判定部は、識別可能な物体を学習した機械学習モデルに基づいて実行されてもよい。このとき、物体が識別可能な物体である確からしさを示す尤度を算出し、尤度が所定の閾値以上であるときに物体が識別可能な物体であると判定してもよく、識別可能な物体を検出し、識別不可能な物体を検出しない物体検出アルゴリズムにより実行されてもよい。そのため、識別不可能な物体を検出しない検出信号の符号が反転されることにより、識別不可能な物体を検出した信号(反転信号)を出力する。これにより、識別不可能な物体について新たな機械学習を行うことなく、識別不可能な物体が検出されたことを認識することが可能になる。さらに、既存の技術を応用するため、開発コストの削減が可能である。
【0020】
この発明に係る物体検出装置によれば、識別可能な物体を遮るように識別不可能な物体が配置された画像から、識別可能な物体を検出する。そのため、識別可能な物体を検出している状態から、識別可能な物体を遮るように識別不可能な物体が配置されるので、遮られた識別可能な物体を検出しなくなることにより、識別不可能な物体が配置されたことを認識することが可能である。
【0021】
この発明に係る物体検出装置によれば、複数の識別可能な物体が撮影された画像から、物体の数量を検出し、検出された物体及び物体の数量から、識別可能な物体の数量を判定し、識別可能な物体の数量が所定の数量以下であることを検出すると、報知情報を出力する。そのため、識別可能な物体の数量を検出している状態から、識別可能な物体を遮るように識別不可能な物体が配置されるので、遮られた識別可能な物体を検出しなくなることにより、識別不可能な物体が配置されたことを認識することが可能である。これにより、識別不可能な物体が所定の数量以上存在することを認識することが可能である。
【図面の簡単な説明】
【0022】
【
図1】実施の形態1に係る物体検出システム100の全体構成を示す概略図である。
【
図2】
図1の物体検出装置1を示す機能ブロック図である。
【
図3】
図2の検出部52による、識別可能な物体Xを検出する例を示す図である。
【
図4】
図2の報知出力部55による、識別可能な物体Xの個数を検出する例を示す図である。
【
図5】
図2の報知出力部55による、識別可能な物体Xの個数を検出する他の例を示す図である。
【
図6】
図1の物体検出装置1による物体検出処理を示すフローチャートである。
【
図7】実施の形態2に係るコンピュータ700を示す機能ブロック構成図である。
【発明を実施するための形態】
【0023】
以下、本発明を図示の実施の形態に基づいて説明する。以下の記載および図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略および簡略化がなされている。本発明は、他の種々の形態でも実施する事が可能である。特に限定しない限り、各構成要素は単数でも複数でも構わない。以下の説明では、同一の構成には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
【0024】
なお、以下の説明では、同一の構成には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
【0025】
(実施の形態1)
<1. 物体検出システム100の全体構成>
図1は、実施の形態1に係る物体検出システム100の全体構成を示す概略図である。
【0026】
物体検出システム100は、
図1に示すように、物体検出装置1と、カメラ(撮影部)2とを有している。物体検出装置1と、カメラ2とは、通信ケーブル3を介して相互に接続される。通信ケーブル3は、画像信号の送受信を行うための有線の通信線であり、USB(Universal Serial Bus)ケーブル、LAN(Local Area Network)ケーブル、光ケーブル等の有線インタフェースにより構成されている。なお、物体検出装置1と、カメラ2とは、Wifi(登録商標)、Bluetooth(登録商標)等の無線インタフェースにより通信可能に接続されてもよく、インターネット、イントラネット、WAN(Wide Area Network)、ワイヤレスLAN(Wireless LAN:WLAN)、ワイヤレスWAN(Wireless WAN:WWAN)、仮想プライベートネットワーク(Virtual Private Network:VPN)等を含む通信網を介して通信可能に接続されてもよい。物体検出装置1及びカメラ2は、例えば、4G、5G、LTE(Long Term Evolution)等の通信規格に対応した無線基地局、IEEE(Institute of Electrical and Electronics Engineers)802.11等の無線LAN(Local Area Network)規格に対応した通信デバイスを備え、相互に通信が行われる。
【0027】
なお、物体検出システム100は、物体検出装置1とカメラ2とが一体となった装置として構成してもよい。
【0028】
物体検出装置1は、カメラ2で撮影された画像から識別可能な物体を検出し、検出結果を示す検出信号を反転させることにより、識別不可能な物体を検出する装置である。また、物体検出装置1は、識別可能な物体の数量を検出し、識別可能な物体の数量が所定の数量以下であることを検出すると、報知情報を出力する。この物体検出装置1は、例えば通信ケーブル3に接続されたコンピュータであり、各種サービスを提供するコンピュータ(デスクトップ、ラップトップ、タブレット等)や、サーバ装置等により構成されている。なお、サーバ装置は単体で動作するサーバ装置に限られず、ネットワークを介して通信を行うことで協調動作する分散型サーバシステムや、クラウドサーバでもよい。
【0029】
カメラ2は、受光素子により光を受光して撮影を行い、撮影した画像として画像データを生成するためのデバイスであり、例えば、デジタルカメラ、ビデオカメラ、監視カメラ等により構成されている。カメラ2は、例えば、レンズ、CCD(Charge Coupled Device)、CMOS(Complementary Metal Oxide Semiconductor)等のイメージセンサ、撮影した画像をデジタル信号からなる画像データに変換するA/D変換装置、映像処理回路等を備えている。カメラ2は、例えば通信ケーブル3に接続され、撮影した画像である画像データを物体検出装置1へ送信するように構成されている。
【0030】
図1に示すように、カメラ2は、例えば検出対象となる物体Aを撮影する。カメラ2は、撮影した物体Aを含む画像データを生成し、通信ケーブル3を介して物体検出装置1へ送信する。物体検出装置1は、画像データを受信すると、物体Aが既知である(学習済データと一致する)場合、識別可能な物体として検出し、物体Aが未知である(学習済データと一致しない)場合、識別不可能な物体として検出を行わない。その後、物体検出装置1は、検出結果を示す検出信号を反転させることにより、識別不可能な物体を検出する。
【0031】
<1.1 物体検出装置1の構成>
図2は、
図1の物体検出装置1を示す機能ブロック図である。
図2に示すように、物体検出装置1は、通信部10と、操作部20と、表示部30と、記憶部40と、制御部50としての機能を発揮する。
【0032】
通信部10は、通信ケーブル3、各種インタフェース、または通信網を介してカメラ2と有線または無線で通信を行うための通信インタフェースであり、互いの通信が実行出来るのであればどのような通信プロトコルを用いてもよい。この通信部10は、TCP/IP(Transmission Control Protocol/Internet Protocol)等の通信プロトコルにより通信が行われる。
【0033】
操作部20は、物体検出システム100のユーザからの入力操作を受け付けるための機構を有する。具体的には、操作部20は、キーボード及びマウス等を含む。キーボードは、文字入力を行う装置であり、入力された文字情報を入力信号として制御部50へ出力する。マウスは、表示部30に表示されている表示物を選択等するためのポインティングデバイスであり、画面上で選択された位置情報と、ボタン押下されていることを示す情報とを入力信号として制御部50へ出力する。
【0034】
表示部30は、制御部50からの出力信号による制御に応じて、画像、動画、テキストなどのデータを表示する。具体的には、表示部30は、例えば液晶ディスプレイ(LCD:Liquid Crystal Display)、または有機EL(Electro-Luminescence)ディスプレイによって実現される。なお、操作部20及び表示部30は、例えば静電容量方式のタッチパネルを用いることによって、タッチパネルに対するユーザの接触位置を検出するタッチスクリーンとして構成してもよい。なお、表示部30は、LED(Light-Emitting Diode)等により構成され、制御部50からの制御信号により点灯/消灯するインジケータとしてもよい。
【0035】
記憶部40は、各種制御処理や制御部50内の各機能を実行するためのプログラムや入力データ等を記憶するものであり、RAM(Random Access Memory)、ROM(Read Only Memory)等を含むメモリや、HDD(Hard Disk Drive)、SSD(Solid State Drive)、DRAM(Dynamic Random Access Memory)等を含むストレージから構成される。また、記憶部40は、識別物体データベース41を記憶する。さらに、記憶部40は、カメラ2との間で通信を行った際のデータや、後述する各処理にて生成されたデータを一時的に記憶する。
【0036】
識別物体データベース41には、物体検出装置1が識別可能な物体(既知である物体)の情報が格納されている。識別可能な物体の情報とは、当該物体の外観を示す画像データでもよく、当該物体の画像データから分析された結果である形状、大きさ、色彩等の要素に分類されたデータでもよく、当該物体の特徴量を示すデータでもよい。また、識別物体データベース41には、物体の画像データ等のデータ解析を行い、物体検出という目的に応じた出力を行うための機械学習が行われた結果である、学習モデルが格納されてもよい。
【0037】
なお、識別物体データベース41にそれぞれ格納される各要素は、物理的に同一のデータベースに格納される必要はなく、各要素の情報がそれぞれ固有の識別情報によって識別され、各要素がそれぞれ識別情報に紐づけて格納されていればよい。
【0038】
制御部50は、記憶部40に記憶されているプログラムを実行することにより、物体検出装置1の全体の動作を制御するものである。制御部50の機能として、画像受付部51と、検出部52と、判定部53と、出力部54と、報知出力部55とを備えている。この画像受付部51、検出部52、判定部53、出力部54、及び報知出力部55は、記憶部40に記憶されているプログラムにより起動されて物体検出装置1にて実行される。
【0039】
画像受付部51は、カメラ2が撮影した画像である画像データが、カメラ2から通信ケーブル3、各種インタフェース、または通信網を介して送信されるので、送信された画像データを受け付ける処理を制御する。画像受付部51は、例えば識別可能な物体、または識別不可能な物体が撮影された画像データを受け付ける。画像受付部51が受け付ける画像データは、jpeg、png、bmp、tiff、gif、eps、svg等の任意のデータフォーマットでよい。
【0040】
検出部52は、画像受付部51が受け付けた画像である画像データから、画像内に撮影された物体を検出する処理を制御する。
【0041】
検出部52は、画像内に撮影された物体を遮るように識別不可能な物体が配置された場合、物体を検出するように制御してもよい。検出部52は、画像内に撮影された物体の一部がなんらかの物体に遮られた場合、その物体のうち遮られていない残りの画像から物体を検出するように制御してもよい。
【0042】
また、検出部52は、物体を検出した検出結果を、符号で示す検出信号を出力する。検出部52は、例えば、なんらかの物体を検出したバウンディングボックスBごとに、物体を検出した場合に符号「1」を、物体を検出しなかった場合に符号「0」を、検出信号として出力する。換言すると、検出部52は、検出結果を二値化した符号で出力する。
【0043】
さらに、検出部52は、画像内に撮影された物体が複数ある場合、物体の数量(例えば、物体の個数)を検出する。検出部52は、例えば、物体を検出した個数を数える。
【0044】
判定部53は、検出部52が検出した物体のうち、識別可能な物体を判定する処理を制御する。判定部53は、例えば、検出部52が検出した物体が、識別物体データベース41に格納されている識別可能な物体の情報に該当するかを、識別物体データベース41を読み込んで格納されている識別可能な物体の情報と照合することで、識別可能な物体であること、または識別不可能な物体であることを判定する。すなわち、判定部53は、検出部52が検出した物体が識別物体データベース41に格納されている物体の情報に該当する場合、識別可能な物体と判定し、該当しない場合、識別不可能な物体と判定する。
【0045】
このとき、判定部53は、検出された物体が識別可能な物体であることの確からしさを示す尤度を算出してもよい。そして、判定部53は、尤度が所定の閾値以上であるときに物体が識別可能な物体であると判定してもよい。具体的には、判定部53は、検出部52が検出した物体について、識別物体データベース41に格納されている識別可能な物体の情報(例えば、特徴量を示す情報)と照合し、検出された物体について、尤度を0%~100%の数値として算出する。そして、判定部53は、算出した尤度が所定の閾値、例えば75%以上であるときに、物体が識別可能な物体であると判定する。
【0046】
検出部52及び判定部53は、具体的には、画像内に撮影され、検出部52が検出した物体のうち、識別可能な物体を検出し、識別不可能な物体を検出しない物体検出アルゴリズムにより構成してもよく、識別可能な物体を学習した機械学習モデル(識別物体データベース41に格納されている)に基づき、検出する/しないを制御してもよい。物体検出アルゴリズムは、具体的には、領域ベースの畳み込みニューラルネットワーク(Region Based Convolutional Neural Networks:R-CNN)、YOLO(You Only Look Once)、SSD(Single Shot Multibox Detector)により構成してもよい。なお、R-CNNには、Fast R-CNN、Faster R-CNNを含んでもよい。
【0047】
図3を参照しながら、検出部52及び判定部53による識別可能な物体検出の一例について説明する。
図3は、
図2の検出部52及び判定部53による、識別可能な物体Xを検出する例を示す図である。なお、検出部52及び判定部53による物体検出のアルゴリズムの例として、YOLO(You Only Look Once)を用いて説明する。
【0048】
図3に示すように、カメラ2が撮影した画像Gには、物体Xが撮影されている。この物体Xは、識別物体データベース41に格納されており、既知であるものとする。検出部52は、画像Gに撮影されているなんらかの物体を検出すると、画像G(物体検出装置1の内部での処理として)内に撮影されているなんらかの物体に対して、
図3に示すような長方形のバウンディングボックス(Bounding Box)Bを設定する。バウンディングボックスBは、画像G内に撮影されているなんらかの物体を囲んだ部分領域であり、画像G内におけるなんらかの物体の位置推定、分析のために設定されるものである。検出部52は、画像GにおけるバウンディングボックスBの中心となる座標と、高さ、幅を取得する。
【0049】
次に、判定部53は、バウンディングボックスB内に撮影されているなんらかの物体について分析を行い、識別物体データベース41に格納されている識別可能な物体の情報と照合することで、既知であるか否かを判定する。この場合、バウンディングボックスB内に撮影されている物体Xは識別物体データベース41に格納されているため、判定部53は、物体Xを既知であるとして検出する。この時の分析は、例えば、物体Xの特徴量抽出により行われる。
【0050】
ここで、検出部52及び判定部53の物体検出アルゴリズムであるYOLOでは、画像G内のすべての領域に対して小さいバウンディングボックスBをセル状に設定し、各セル(バウンディングボックスB)について、背景であるか、特定の物体であるか、を示すクラス分けを行う。そして、識別可能な物体の情報と一致しないセルについて削除し、一致するセルのみを抽出することにより、物体検出を行う。YOLOは、このような処理をすることにより、処理速度を高速化している。
【0051】
また、判定部53は、検出部52が出力した検出信号に対して、判定結果を反映させる。判定部53は、例えば、物体を検出したバウンディングボックスBごとに、識別可能な物体と判定した場合に符号「1」を、識別不可能な物体と判定した場合に符号「0」を、検出信号として出力する。換言すると、判定部53は、検出結果について判定結果を反映させた信号を、二値化した符号で出力する。
【0052】
さらに、判定部53は、検出部52が検出した物体が複数ある場合において、識別可能な物体の数量(例えば、識別可能な物体の個数)を判定する。判定部53は、例えば、判定結果が識別可能な物体である物体の個数を数える。
【0053】
出力部54は、検出部52が出力し、判定部53による判定結果が反映された検出信号の符号を反転させた反転信号を出力する処理を制御する。出力部54は、具体的には、判定結果が反映済の検出信号である二値化した符号を反転させる。上記の例の場合、出力部54は、検出信号である符号が「1」の場合には反転信号として符号「0」を、検出信号である符号が「0」の場合には反転信号として符号「1」を、出力する。
【0054】
出力部54がこのような処理を行うことにより、検出部52が検出し、判定部53が判定した物体が既知である(学習済データと一致する)場合、検出信号は識別可能な物体として検出する。検出部52が検出した物体が未知である(学習済データと一致しない)場合、検出信号は識別不可能な物体として検出する。そして、これらの検出信号が出力部54の処理により反転することにより、識別可能な物体を検出した場合には識別不可能であった(符号が「0」)と出力し、識別不可能な物体を検出した場合には識別可能であった(符号が「1」)と出力する。これにより、識別不可能な物体を検出することを可能にしている。
【0055】
報知出力部55は、検出部52が物体の数量(例えば、物体の個数)を検出し、判定部53が識別可能な物体の数量(例えば、識別可能な物体の個数)を判定した場合、その判定結果の数量が所定の数量以下である場合、そのことを示す報知情報を出力する処理を制御する。報知出力部55は、具体的には、識別可能な物体の数量が6個であった状態から、所定の数量である3個以下になった場合、報知情報を出力する。報知出力部55は、報知信号を、例えば表示部30に表示することにより出力する。報知出力部55は、例えば、上記のような判定結果の場合に、報知情報を表示部30へ出力し、表示部30の構成例であるインジケータを点灯/消灯させてもよい。
【0056】
<1.2 数量検出の具体例>
図4及び
図5を参照しながら、報知出力部55による数量検出の一例について説明する。
図4は、
図2の報知出力部55による、識別可能な物体Xの個数を検出する例を示す図である。また、
図5は、
図2の報知出力部55による、識別可能な物体Xの個数を検出する他の例を示す図である。
【0057】
図4に示すように、カメラ2が撮影した画像Gには、6個の物体X1~X6が撮影されている。この物体X1~X6は、識別物体データベース41に格納されており、既知であるものとする。検出部52は、画像Gに撮影されている物体X1~X6を検出すると、画像G内に撮影されている物体X1~X6に対して、
図4に示すような長方形のバウンディングボックスB1~B6を設定する。また、判定部53は、画像G内に撮影された物体のうち、物体X1~X6を識別可能な物体として判定し、識別可能な物体の数量として6個と判定する。
【0058】
このとき、検出部52は、物体X1~X6の検出信号を以下のように出力する。なお、判定部53は、物体X1~X6がすべて既知であるため、判定結果は以下のままとする。
物体X1:検出信号「1」
物体X2:検出信号「1」
物体X3:検出信号「1」
物体X4:検出信号「1」
物体X5:検出信号「1」
物体X6:検出信号「1」
【0059】
出力部54は、物体X1~X6の検出信号である二値化した符号を反転させ、反転信号として出力する。このとき、出力部54は、物体X1~X6の反転信号を以下のように出力する。
物体X1:反転信号「0」
物体X2:反転信号「0」
物体X3:反転信号「0」
物体X4:反転信号「0」
物体X5:反転信号「0」
物体X6:反転信号「0」
【0060】
図4に示す状態から、
図5に示すように、カメラ2が撮影した画像Gには、3個の物体Y1,Y3,Y6が、それぞれ物体X1,X3,X6を遮るように載置された状態が撮影されたものとする。この物体Y1,Y3,Y6は、識別物体データベース41に格納されておらず、未知であるものとする。判定部53は、画像Gに撮影されている物体X1~X6のうち、物体Y1,Y3,Y6に遮られた物体X1,X3,X6を、既知の物体として判定出来なくなる。そのため、判定部53は、画像G内に撮影された物体のうち、物体X2,X4,X5を識別可能な物体として判定し、識別可能な物体の数量として3個と判定する。
【0061】
このとき、判定部53は、物体X1~X6の検出信号を以下のように反映して出力する。
物体X1:検出信号「0」
物体X2:検出信号「1」
物体X3:検出信号「0」
物体X4:検出信号「1」
物体X5:検出信号「1」
物体X6:検出信号「0」
【0062】
また、出力部54は、物体X1~X6の反転信号を以下のように出力する。
物体X1:反転信号「1」
物体X2:反転信号「0」
物体X3:反転信号「1」
物体X4:反転信号「0」
物体X5:反転信号「0」
物体X6:反転信号「1」
【0063】
報知出力部55は、検出部52が識別可能な物体の数量が所定の数量が例えば3個以下である場合、
図5に示す状態になると、識別可能な物体の数量が3個以下になったことを報知する報知情報を出力する。
【0064】
図4及び
図5に示す例は、例えば、既知の物体X1~X6が荷物の載置台であり、未知の物体Y1,Y3,Y6が任意の荷物である場合を示す例であり、ある施設において、荷物が一定以上滞留すると荷物に対する所定の処理(例えば、配送に回す、等)をする場合の例である。荷物の載置台である物体X1~X6は、ある施設に配置されたものであるため既知であるが、物体Y1,Y3,Y6は、任意の荷物であり、その都度形状は異なるため未知である。
【0065】
このような状態で、任意の荷物である物体Y1,Y3,Y6について機械学習等により形状を記憶するのは、手間が掛かる上に荷物の形状はその都度異なるため現実的ではない。このような物体Y1,Y3,Y6が一定以上滞留したことを、報知出力部55が報知することにより、荷物に対する所定の処理を報知することを可能にしている。
【0066】
なお、例えば、既知の物体X1~X6を実際の物体ではなく、撮影された物体の画像、描画された物体等を壁面や床面等に表示し、未知の物体Y1,Y3,Y6によって遮られることで上記の構成を実現してもよい。
【0067】
<2. 処理の流れ>
図6を参照しながら、物体検出システム100が実行する物体検出処理(物体検出方法)の流れの一例について説明する。
図6は、
図1の物体検出装置1による物体検出処理を示すフローチャートである。
【0068】
ステップS101の処理として、物体検出装置1の画像受付部51では、カメラ2が撮影した画像である画像データがカメラ2から送信されるので、送信された画像データを受け付ける。
【0069】
ステップS102の処理として、物体検出装置1の検出部52では、ステップS101で受け付けた画像である画像データから、画像内に撮影された物体を検出する。
【0070】
ステップS103の処理として、物体検出装置1の検出部52では、ステップS102で物体を検出した(または検出しなかった)検出結果を、符号で示す検出信号を出力する。検出部52では、例えば、物体を検出した場合に符号「1」を、物体を検出しなかった場合に符号「0」を、検出信号として出力する。
【0071】
ステップS104の処理として、物体検出装置1の判定部53では、ステップS102で検出した物体のうち、識別可能な物体を判定する。判定部53では、例えば、ステップS102で検出した物体が、識別物体データベース41に格納されている識別可能な物体の情報に該当する場合、識別可能な物体として検出する。
【0072】
また、ステップS104の処理として、物体検出装置1の判定部53では、ステップS103で出力した検出信号に対して、判定結果を反映させる。判定部53では、例えば、識別可能な物体と判定した場合に符号「1」を、識別不可能な物体と判定した場合に符号「0」を、検出信号として出力する。
【0073】
ステップS105の処理として、物体検出装置1の出力部54では、ステップS103で出力された(ステップS104で判定結果が反映された)検出信号の符号を反転させた反転信号を生成する。出力部54では、例えば、検出信号である符号が「1」の場合には反転信号として符号「0」を、検出信号である符号が「0」の場合には反転信号として符号「1」を生成する。
【0074】
ステップS106の処理として、物体検出装置1の出力部54では、ステップS105で生成した反転信号を出力する。
【0075】
<3. 効果>
実施の形態1に係る物体検出システム100及び物体検出装置1によれば、カメラ2が撮影した画像である画像データから、画像内に撮影された物体を検出し、検出した物体のうち識別可能な物体を判定し、判定結果が反映された検出結果を符号で示す検出信号を出力する。また、検出信号の符号を反転させた反転信号を出力する。そのため、識別可能な物体、または識別不可能な物体が撮影された画像から、識別可能な物体を検出した検出信号の符号を反転させて出力するので、識別不可能な物体が検出されたことを認識することが可能である。これにより、識別不可能な物体について新たな機械学習を行うことなく、識別不可能な物体が検出されたことを認識することが可能になる。
【0076】
また、物体検出装置1は、画像内に撮影された物体のうち、識別可能な物体が複数ある場合に識別可能な物体の数量(例えば、識別可能な物体の個数)を検出、すなわちカウントする。そして、識別可能な物体の数量を検出した場合、その数量が所定の数量以下である場合に、そのことを示す報知情報を出力する。そのため、識別可能な物体の数量を検出している状態から、識別可能な物体を遮るように識別不可能な物体が配置されるような場合、遮られた識別可能な物体を検出しなくなることにより、識別不可能な物体が配置されたことを認識することが可能である。これにより、識別不可能な物体が所定の数量以上存在することを認識することが可能である。
【0077】
さらに、物体検出装置1は、物体検出アルゴリズムにより、画像内に撮影された物体のうち識別可能な物体を検出し、識別不可能な物体を検出しない。このとき、物体が識別可能な物体である確からしさを示す尤度を算出し、尤度が所定の閾値以上であるときに物体が識別可能な物体であると判定し、識別可能な物体を学習した機械学習モデルに基づき、検出する/しないを制御する。そのため、識別不可能な物体を検出しない検出信号の符号が反転されることにより、識別不可能な物体を検出した信号(反転信号)を出力する。これにより、識別不可能な物体について新たな機械学習を行うことなく、識別不可能な物体が検出されたことを認識することが可能になる。さらに、既存の技術を応用するため、開発コストの削減が可能である。
【0078】
(実施の形態2(プログラム))
図7は、実施の形態2に係るコンピュータ(電子計算機)700を示す機能ブロック構成図である。コンピュータ700は、制御装置701、主記憶装置702、補助記憶装置703、インタフェース704を備える。
【0079】
ここで、実施の形態1に係る画像受付部51と、検出部52と、判定部53と、出力部54と、報知出力部55とを構成する各機能を実現するためのプログラムの詳細について説明する。これらの機能ブロックは、コンピュータ700に実装される。そして、これらの各構成要素の動作は、プログラムの形式で補助記憶装置703に記憶されている。制御装置701は、プログラムを補助記憶装置703から読み出して主記憶装置702に展開し、当該プログラムに従って上述の処理を実行する。また、制御装置701は、プログラムにしたがって、上述した記憶部に対応する記憶領域を主記憶装置702に確保する。
【0080】
当該プログラムは、具体的には、コンピュータ700において、画像内に撮影された物体を検出し、検出結果を符号で示す検出信号を出力する検出ステップと、検出された前記物体のうち、識別可能な物体を判定し、前記検出信号に対して判定結果を反映させる判定ステップと、前記判定結果が反映された前記検出信号の符号を反転させた反転信号を出力する出力ステップと、をコンピュータによって実現するプログラムである。
【0081】
制御装置701は、プログラムに記述された命令セットを実行するためのハードウェアであり、演算装置、レジスタ、周辺回路等により構成される。制御装置701は、少なくとも1以上のプロセッサにより構成され、典型的には、CPU(Central Processing Unit)のようなマイクロプロセッサであるが、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、マイクロプロセッサ(Microprocessor)、プロセッサコア(Processor core)、マルチプロセッサ(Multiprocessor)を含む他種のプロセッサでもよい。少なくとも1つのプロセッサは、シングルコアでもよいしマルチコアでもよい。また、少なくとも1つのプロセッサは、処理の一部又は全部を行うハードウェア回路(例えばFPGA(Field-Programmable Gate Array)又はASIC(Application Specific Integrated Circuit))といった広義のプロセッサでもよい。
【0082】
主記憶装置702は、プログラム、および、プログラム等で処理されるデータ等を一時的に記憶するためのものであり、例えばDRAM(Dynamic Random Access Memory)等のメモリである。主記憶装置702は、1以上のメモリであり、典型的には主記憶デバイスにより構成されてよく、少なくとも1つのメモリは、揮発性メモリであってもよいし不揮発性メモリであってもよい。
【0083】
補助記憶装置703は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース704を介して接続される磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等が挙げられる。また、このプログラムがネットワークを介してコンピュータ700に配信される場合、配信を受けたコンピュータ700が当該プログラムを主記憶装置702に展開し、上述の処理を実行してもよい。
【0084】
また、当該プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、当該プログラムは、上述した機能を補助記憶装置703に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0085】
以上、この発明の実施の形態について説明したが、具体的な構成は、上述の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更等があっても、この発明に含まれる。
【符号の説明】
【0086】
1 :物体検出装置
2 :カメラ
3 :通信ケーブル
10 :通信部
20 :操作部
30 :表示部
40 :記憶部
41 :識別物体データベース
50 :制御部
51 :画像受付部
52 :検出部
53 :判定部
54 :出力部
55 :報知出力部
100 :物体検出システム
700 :コンピュータ
701 :制御装置
702 :主記憶装置
703 :補助記憶装置
704 :インタフェース