特許7402121 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 株式会社日立製作所の特許一覧

特許7402121物体検出システムおよび物体検出方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-12-12

(45)【発行日】2023-12-20

(54)【発明の名称】物体検出システムおよび物体検出方法

(51)【国際特許分類】

G06T 7/62 20170101AFI20231213BHJP

G06T 7/00 20170101ALI20231213BHJP

H04N 7/18 20060101ALI20231213BHJP

H04N 23/66 20230101ALI20231213BHJP

【ＦＩ】

G06T7/62

G06T7/00 350C

H04N7/18 F

H04N7/18 D

H04N23/66

【請求項の数】 11

(21)【出願番号】P 2020095817

(22)【出願日】2020-06-02

(65)【公開番号】P2021189866

(43)【公開日】2021-12-13

【審査請求日】2023-02-09

(73)【特許権者】

【識別番号】000005108

【氏名又は名称】株式会社日立製作所

(74)【代理人】

【識別番号】110002365

【氏名又は名称】弁理士法人サンネクスト国際特許事務所

(72)【発明者】

【氏名】小松佑人

(72)【発明者】

【氏名】リマサンチェスシャルル

(72)【発明者】

【氏名】野中雄一

【審査官】伊知地和之

(56)【参考文献】

【文献】国際公開第２０１２／１２４２３０（ＷＯ，Ａ１）

【文献】米国特許出願公開第２０２０／０１１８４５１（ＵＳ，Ａ１）

【文献】特開２０２０－０１０２０４（ＪＰ，Ａ）

【文献】特開２０２０－０７１６６５（ＪＰ，Ａ）

【文献】特開２０２０－０４７２７６（ＪＰ，Ａ）

【文献】国際公開第２０２０／０９０２５１（ＷＯ，Ａ１）

【文献】米国特許出願公開第２０１８／００７５１６８（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ７／００－７／９０

Ｇ０６Ｖ１０／００－２０／９０

Ｇ０６Ｖ３０／４１８

Ｇ０６Ｖ４０／１６

Ｇ０６Ｖ４０／２０

Ｈ０４Ｎ２３／００

Ｈ０４Ｎ２３／４０－２３／７６

Ｈ０４Ｎ２３／９０－２３／９５９

Ｈ０４Ｎ７／１８

(57)【特許請求の範囲】

【請求項1】

所定の空間に設けられている複数のセンサの少なくとも１つのセンサで取得された前記所定の空間の環境を示す環境情報を取得する取得部と、
前記取得部により取得された環境情報をもとに、前記複数のセンサの中から、前記所定の空間の環境における物体検出に最適なセンサを選定する選定部と、
前記選定部により選定されたセンサで取得されたデータと前記センサの物体を検出するモデルとを用いて物体検出する検出部と、
を備え、
前記所定の空間には、第１のセンサと、距離を測定可能な第２のセンサとが設けられ、
前記選定部は、前記取得部により取得された環境情報をもとに、前記空間の広さを算出し、前記空間の広さが閾値以上であると判定した場合は、前記第１のセンサを選定し、
前記第２のセンサは、前記第１のセンサよりも外光の影響を受けやすいセンサであり、
前記選定部は、前記所定の空間において外光の影響があるか否かを示す外光情報に基づいて外光の影響があるか否かを判定し、前記空間の広さが前記閾値未満であると判定し、かつ、外光の影響があると判定した場合、前記第１のセンサを選定し、前記空間の広さが前記閾値未満であると判定し、かつ、外光の影響がないと判定した場合、前記第２のセンサを選定する、
物体検出システム。

【請求項2】

前記所定の空間では、第１のセンサと、距離を測定可能な第２のセンサとを備える飛行体が飛行し、
前記選定部は、前記取得部により取得された環境情報をもとに、前記飛行体の高さを算出し、前記飛行体の高さが閾値以上であると判定した場合は、前記第１のセンサを選定する、
請求項１に記載の物体検出システム。

【請求項3】

前記所定の空間には、可視光カメラとＴＯＦカメラとが設けられ、
前記取得部は、前記可視光カメラまたは前記ＴＯＦカメラから前記所定の空間を示す画像情報を取得し、
前記選定部は、前記取得部により取得された画像情報をもとに、前記空間の広さを算出し、前記空間の広さが閾値以上であると判定した場合は、前記可視光カメラを選定する、
請求項１に記載の物体検出システム。

【請求項4】

前記所定の空間には、音センサと可視光カメラとが設けられ、
前記取得部は、前記可視光カメラから前記所定の空間を示す画像情報を取得し、
前記選定部は、前記取得部により取得された画像情報をもとに、前記空間の広さを算出し、前記空間の広さが閾値以上であると判定した場合は、前記音センサを選定する、
請求項１に記載の物体検出システム。

【請求項5】

前記所定の空間には、可視光カメラと光センサとが設けられ、
前記取得部は、前記可視光カメラから前記所定の空間を示す画像情報を取得し、
前記選定部は、前記取得部により取得された画像情報をもとに、前記空間の広さを算出し、前記空間の広さが閾値以上であると判定した場合は、前記可視光カメラを選定する、
請求項１に記載の物体検出システム。

【請求項6】

前記所定の空間には、音センサとＴＯＦカメラとが設けられ、
前記取得部は、前記ＴＯＦカメラから前記所定の空間を示す画像情報を取得し、
前記選定部は、前記取得部により取得された画像情報をもとに、前記空間の広さを算出し、前記空間の広さが閾値以上であると判定した場合は、前記音センサを選定する、
請求項１に記載の物体検出システム。

【請求項7】

前記所定の空間には、ＴＯＦカメラと光センサとが設けられ、
前記取得部は、前記ＴＯＦカメラから前記所定の空間を示す画像情報を取得し、
前記選定部は、前記取得部により取得された画像情報をもとに、前記空間の広さを算出し、前記空間の広さが閾値以上であると判定した場合は、前記ＴＯＦカメラを選定する、
請求項１に記載の物体検出システム。

【請求項8】

前記所定の空間には、音センサと光センサとが設けられ、
前記取得部は、前記音センサから前記所定の空間を示す音情報を取得し、
前記選定部は、前記取得部により取得された音情報をもとに、前記空間の広さを算出し、前記空間の広さが閾値以上であると判定した場合は、前記音センサを選定する、
請求項１に記載の物体検出システム。

【請求項9】

前記複数のセンサの各々に対応した物体を検出するモデルを記憶する記憶装置を備え、
前記検出部は、前記記憶装置に記憶されている物体を検出するモデルから、前記選定部により選定されたセンサの物体を検出するモデルを特定し、前記センサで取得されたデータと前記物体を検出するモデルとを用いて物体検出する、
請求項１に記載の物体検出システム。

【請求項10】

前記選定部により選定されたセンサの学習データを用いて、深層学習により物体を検出するモデルを生成する生成部を備え、
前記検出部は、前記選定部により選定されたセンサで取得されたデータと、前記生成部により生成された物体を検出するモデルとを用いて物体検出する、
請求項１に記載の物体検出システム。

【請求項11】

取得部が、所定の空間に設けられている複数のセンサの少なくとも１つのセンサで取得された前記所定の空間の環境を示す環境情報を取得することと、
選定部が、前記取得部により取得された環境情報をもとに、前記複数のセンサの中から、前記所定の空間の環境における物体検出に最適なセンサを選定することと、
検出部が、前記選定部により選定されたセンサで取得されたデータと前記センサの物体を検出するモデルとを用いて物体検出することと、
を含み、
前記所定の空間には、第１のセンサと、距離を測定可能な第２のセンサとが設けられ、
前記選定部は、前記取得部により取得された環境情報をもとに、前記空間の広さを算出し、前記空間の広さが閾値以上であると判定した場合は、前記第１のセンサを選定し、
前記第２のセンサは、前記第１のセンサよりも外光の影響を受けやすいセンサであり、
前記選定部は、前記所定の空間において外光の影響があるか否かを示す外光情報に基づいて外光の影響があるか否かを判定し、前記空間の広さが前記閾値未満であると判定し、かつ、外光の影響があると判定した場合、前記第１のセンサを選定し、前記空間の広さが前記閾値未満であると判定し、かつ、外光の影響がないと判定した場合、前記第２のセンサを選定する、
物体検出方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、概して、環境に応じた物体を検出するモデルの選定に関する。

【背景技術】

【0002】

近年、各種のシステムにおいて、物体を検出（物体検出）する技術として、深層学習により学習された物体を検出するモデルが用いられている。

【0003】

滞在状況を表示するシステムにおいては、施設内の各エリアでの人物の滞在状況に関する情報として、人物が滞在するエリアに応じた適切な内容の情報をユーザに提示できるようにする技術が開示されている（特許文献１参照）。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１８－１８１２２１号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

近時、センサを備えるエッジデバイスが多種類設置されているマルチモーダルの環境において、当該環境に適したセンサで取得したデータを用いて物体認識したいというニーズがある。

【0006】

これまでは、一般的に、センサごとに、深層学習が行われた物体を検出するモデル生成されていた。この点は、特許文献１に記載の技術も同様である。しかしながら、マルチモーダルの環境においては、複数の物体を検出するモデルが存在するため、当該環境における物体検出に最適な物体を検出するモデルの選定が困難となっている。

【0007】

本発明は、以上の点を考慮してなされたもので、所定の空間の環境における物体検出に最適なセンサを選定し得る物体検出システム等を提案しようとするものである。

【課題を解決するための手段】

【0008】

かかる課題を解決するため本発明においては、所定の空間に設けられている複数のセンサの少なくとも１つのセンサで取得された前記所定の空間の環境を示す環境情報を取得する取得部と、前記取得部により取得された環境情報をもとに、前記複数のセンサの中から、前記所定の空間の環境における物体検出に最適なセンサを選定する選定部と、前記選定部により選定されたセンサで取得されたデータと前記センサの物体を検出するモデルとを用いて物体検出する検出部と、を設けるようにした。

【0009】

上記構成では、所定の空間に設けられているセンサの中から、所定の空間の環境に最適なセンサが選定されるので、例えば、所定の空間における物体検出を精度よく行うことができる。

【発明の効果】

【0010】

本発明によれば、物体検出の精度がよい物体検出システムを実現することができる。

【図面の簡単な説明】

【0011】

【図1】第１の実施の形態による物体検出システムに係る構成の一例を示す図である。

【図2】第１の実施の形態によるサーバ装置のハードウェア構成に係る一例を示す図である。

【図3】第１の実施の形態によるサーバ装置のソフトウェア構成に係る一例を示す図である。

【図4】第１の実施の形態による条件情報の一例を示す図である。

【図5】第１の実施の形態によるモデルの生成に係る処理の一例を示す図である。

【図6】第１の実施の形態によるモデルの利用に係る処理の一例を示す図である。

【図7】第２の実施の形態によるモデルの生成に係る処理の一例を示す図である。

【図8】第２の実施の形態によるモデルの利用態様の一例を示す図である。

【図9】第２の実施の形態によるモデルの利用態様の一例を示す図である。

【図10】第２の実施の形態によるモデルの利用態様の一例を示す図である。

【図11】第３の実施の形態によるモデルの生成に係る処理の一例を示す図である。

【図12】第４の実施の形態によるモデルの生成に係る処理の一例を示す図である。

【図13】第５の実施の形態によるモデルの生成に係る処理の一例を示す図である。

【図14】第６の実施の形態によるモデルの生成に係る処理の一例を示す図である。

【図15】第７の実施の形態によるモデルの生成に係る処理の一例を示す図である。

【発明を実施するための形態】

【0012】

（１）第１の実施の形態
以下、本発明の実施形態を図面に基づいて説明する。ただし、本発明は、実施の形態に限定されるものではない。

【0013】

なお、以下の説明では、同種の要素を区別しないで説明する場合には、枝番を含む参照符号のうちの共通部分（枝番を除く部分）を使用し、同種の要素を区別して説明する場合は、枝番を含む参照符号を使用することがある。例えば、センサを特に区別しないで説明する場合には、「センサ１３１」と記載し、個々のセンサを区別して説明する場合には、「第１のセンサ１３１－１」、「第２のセンサ１３１－２」のように記載することがある。

【0014】

図１において、１００は、全体として第１の実施の形態による物体検出システムを示す。図１は、物体検出システム１００に係る構成の一例を示す図である。

【0015】

物体検出システム１００は、サーバ装置１１０と、クライアント端末１２０とを備える。サーバ装置１１０とクライアント端末１２０とは、通信可能に接続される。サーバ装置１１０には、部屋、荷台、イベント会場といった所定の空間１３０にある複数のセンサ１３１が直接または通信媒体を介して接続される。なお、通信媒体の構成は、必ずしも限定されない。通信媒体は、例えば、ＵＳＢ（Universal Serial Bus）、ＲＳ－２３２Ｃ等の各種の通信規格に準拠した通信媒体、ＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）、インターネット、専用線等である。

【0016】

サーバ装置１１０は、空間１３０の環境（以下、「現場の環境」と記す）における物体検出に最適なセンサ１３１を選定する。サーバ装置１１０は、選定したセンサ１３１のデータおよびセンサ１３１の物体を検出するモデル（以下、「モデル」と記す）を用いて物体検出を行う。サーバ装置１１０は、物体検出に係る結果（検出結果）をクライアント端末１２０に送信する。

【0017】

モデルは、例えば、既に生成されているモデルであってもよい。この場合、既存のモデルの中から、現場の環境における物体検出に最適なモデルが選定されて物体検出が行われる。また、例えば、モデルは、後述のモデル生成処理により生成されたモデルであってもよい。モデル生成処理では、選定されたセンサ１３１の学習データが用いられて、深層学習（ディープラーニング）によりモデルが生成される。

【0018】

クライアント端末１２０は、サーバ装置１１０から検出結果を受信し、受信した検出結果を出力する。

【0019】

センサ１３１は、可視光カメラ、ＴＯＦ（Time Of Flight）カメラ、音センサ、光センサ、サーモカメラ等である。センサ１３１は、エッジデバイスに設けられていてもよい。エッジデバイスは、監視カメラ、ドローン、タブレット端末、スマートフォン等である。

【0020】

センサ１３１は、現場の環境を示す環境情報を取得する。環境情報は、画像情報（画像）、音声といった音情報等である。センサ１３１は、取得した環境情報を所定のタイミングでサーバ装置１１０に送信する。サーバ装置１１０は、受信した環境情報を後述の補助記憶装置２３０に記憶する。なお、所定のタイミングについては、定期的であってもよいし、予め指定された時間ごとであってもよいし、管理者により指示されたタイミングであってもよい。

【0021】

なお、物体検出システム１００は、上述の構成に限らない。例えば、サーバ装置１１０とクライアント端末１２０とは、一体の装置であってもよい。また、例えば、サーバ装置１１０は、センサ１３１で取得された環境情報を記憶する記憶装置から当該環境情報を取得する構成であってもよい。

【0022】

図２は、サーバ装置１１０のハードウェア構成に係る一例を示す図である。

【0023】

サーバ装置１１０は、プロセッサ２１０、主記憶装置２２０、補助記憶装置２３０、および通信装置２４０を備える。

【0024】

プロセッサ２１０は、演算処理を行う装置である。プロセッサ２１０は、例えば、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＡＩ（Artificial Intelligence）チップ等である。

【0025】

主記憶装置２２０は、プログラム、データ等を記憶する装置である。主記憶装置２２０は、例えば、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）等である。ＲＯＭは、ＳＲＡＭ（Static Random Access Memory）、ＮＶＲＡＭ（Non Volatile RAM）、マスクＲＯＭ（Mask Read Only Memory）、ＰＲＯＭ（Programmable ROM）等である。ＲＡＭは、ＤＲＡＭ（Dynamic Random Access Memory）等である。

【0026】

補助記憶装置２３０は、ハードディスクドライブ（Hard Disk Drive）、フラッシュメモリ（Flash Memory）、ＳＳＤ（Solid State Drive）、光学式記憶装置等である。光学式記憶装置は、ＣＤ（Compact Disc）、ＤＶＤ(Digital Versatile Disc)等である。補助記憶装置２３０に格納されているプログラム、データ等は、主記憶装置２２０に随時読み込まれる。

【0027】

通信装置２４０は、通信媒体を介して他の装置と通信する通信インターフェースである。通信装置２４０は、例えば、ＮＩＣ（Network Interface Card）、無線通信モジュール、ＵＳＢ（Universal Serial Bus）モジュール、シリアル通信モジュール等である。通信装置２４０は、通信可能に接続する他の装置から情報を受信する入力装置として機能することもできる。また、通信装置２４０は、通信可能に接続する他の装置に情報を送信する出力装置として機能することもできる。

【0028】

なお、サーバ装置１１０は、上述の構成に限らない。例えば、サーバ装置１１０は、入力装置および／または出力装置を備えてもよい。入力装置は、ユーザから情報を受付けるユーザインターフェースである。入力装置は、例えば、キーボード、マウス、カードリーダ、タッチパネル等である。出力装置は、各種の情報を出力（表示出力、音声出力、印字出力等）するユーザインターフェースである。出力装置は、例えば、各種情報を可視化する表示装置、音声出力装置（スピーカ）、印字装置等である。表示装置は、ＬＣＤ（Liquid Crystal Display）、グラフィックカード等である。

【0029】

付言するならば、クライアント端末１２０は、ノートパソコン、タブレット端末、スマートフォン等のコンピュータである。クライアント端末１２０は、構成要素として、プロセッサ、主記憶装置、補助記憶装置、通信装置、入力装置、および出力装置を備える。これらの構成要素については、サーバ装置１１０と同様であるので、その説明を省略する。

【0030】

図３は、サーバ装置１１０のソフトウェア構成に係る一例を示す図である。

【0031】

サーバ装置１１０は、取得部３１０、選定部３２０、生成部３３０、検出部３４０、および出力部３５０を備える。

【0032】

取得部３１０は、空間１３０に設けられている複数のセンサ１３１の少なくとも１つのセンサ１３１で取得された環境情報を取得する。選定部３２０は、取得部３１０により取得された環境情報をもとに、複数のセンサ１３１の中から、空間１３０の環境における物体検出に最適なセンサ１３１を選定する。生成部３３０は、選定部３２０により選定されたセンサ１３１の学習データを用いて、深層学習によりモデルを生成する。検出部３４０は、選定部３２０により選定されたセンサ１３１で取得されたデータと当該センサ１３１の物体検出モデルとを用いて物体検出する。出力部３５０は、選定の結果、物体検出の結果等を出力する。

【0033】

サーバ装置１１０の機能（取得部３１０、選定部３２０、生成部３３０、検出部３４０、出力部３５０等）は、例えば、プロセッサ２１０が補助記憶装置２３０に格納されたプログラムを主記憶装置２２０に読み出して実行すること（ソフトウェア）により実現されてもよいし、専用の回路等のハードウェアにより実現されてもよいし、ソフトウェアとハードウェアとが組み合わされて実現されてもよい。また、サーバ装置１１０の機能の一部は、サーバ装置１１０と通信可能な他のコンピュータにより実現されてもよい。

【0034】

図４は、主記憶装置２２０ないし補助記憶装置２３０に記憶され、センサ１３１を選定する処理で利用される条件情報の一例（条件テーブル４００）を示す図である。

【0035】

条件テーブル４００は、現場の環境における物体検出に最適なセンサ１３１を選定する際の１つ以上の条件を示す情報を記憶する。より具体的には、条件テーブル４００には、条件４０１毎に、選定可能なセンサ１３１を示すセンサ情報４０２が記憶されている。

【0036】

条件４０１については、空間１３０の広さが閾値より広い、空間１３０において外光の影響がある、空間１３０における照度が低い、空間１３０における物体の密集度合いが高い等の条件がある。本実施の形態では、条件４０１としては、空間１３０の広さが閾値より広いという「第１の条件」が設定されているケース（第１のケース）を例に挙げて説明する。

【0037】

センサ情報４０２は、例えば、各センサ１３１のスペックをもとに管理者により規定されている。本実施の形態では、現場の環境が「第１の条件」を満たす場合に、第１のセンサ１３１－１が設定され、現場の環境が「第１の条件」を満たさない場合に、距離を測定可能な第２のセンサ１３１－２が選定されるケースを例に挙げて説明する。

【0038】

図５は、モデルの生成に係る処理の一例を示す図である。

【0039】

Ｓ５０１では、サーバ装置１１０は、センサ１３１、外部の記憶装置、または補助記憶装置２３０から、環境情報を取得する。

【0040】

Ｓ５０２では、サーバ装置１１０は、現場の環境の条件に合うセンサ１３１を選定する。より具体的には、サーバ装置１１０は、Ｓ５０１で取得した環境情報から、現場の環境における物体検出に最適なセンサ１３１を選定する。本実施の形態では、サーバ装置１１０は、環境情報から、空間１３０の広さを特定する。サーバ装置１１０は、空間１３０の広さが閾値（例えば、第２のセンサ１３１－２の測定可能な距離）以上である場合は、第１のセンサ１３１－１を選定する。サーバ装置１１０は、空間１３０の広さが閾値未満である場合は、第２のセンサ１３１－２を選定する。

【0041】

空間１３０の広さとは、部屋の大きさ（例えば、奥行）、荷台の大きさ（例えば、奥行）、センサ１３１から地面までの距離（例えば、高さ）等である。

【0042】

なお、以下では、第１のケースとは、異なるケースについてＳ５０２の処理を説明する。

【0043】

（空間１３０における外光の影響に応じてセンサ１３１が設定されている第２のケース）
第２のケースでは、例えば、外光を計測可能なセンサ１３１が空間１３０に設けられている。サーバ装置１１０は、当該センサ１３１により取得された環境情報をもとに外光の影響があるか否かを示す情報（外光情報）を補助記憶装置２３０に記憶する。外光の影響がある場合とは、例えば、空間１３０に、太陽の光（例えば、西日）が差し込む場合である。サーバ装置１１０は、外光情報を参照して、空間１３０において外光の影響がある場合は、第１のセンサ１３１－１を選定する。サーバ装置１１０は、空間１３０において外光の影響がない場合は、第１のセンサ１３１－１よりも外光の影響を受けやすい第２のセンサ１３１－２を選定する。なお、外光情報は、管理者により補助記憶装置２３０に登録される態様であってもよい。

【0044】

（空間１３０における照度に応じてセンサ１３１が設定されている第３のケース）
第３のケースでは、例えば、照度を計測可能なセンサ１３１が空間１３０に設けられている。サーバ装置１１０は、当該センサ１３１により取得された環境情報（照度情報）を補助記憶装置２３０に記憶する。サーバ装置１１０は、照度情報を参照し、空間１３０の照度が閾値以上である場合は、第１のセンサ１３１－１を選定する。サーバ装置１１０は、空間１３０の照度が閾値未満である場合は、照度が閾値より低くても測定可能な第２のセンサ１３１－２を選定する。

【0045】

（空間１３０における物体の密集度合いに応じてセンサ１３１が設定されている第４のケース）
第４のケースでは、サーバ装置１１０は、既存の物体を検出するモデルにより物体検出を行い、検出した物体の密集度合い（例えば、物体の数／床面積）を算出する。サーバ装置１１０は、空間１３０における物体の密集度合いが閾値以上である場合は、第１のセンサ１３１－１を選定する。サーバ装置１１０は、空間１３０における物体の密集度合いが閾値未満である場合は、第１のセンサ１３１－１よりも物体の密集度合いの影響を受けやすい第２のセンサ１３１－２を選定する。なお、サーバ装置１１０は、空間１３０に設けられた加重センサで取得された情報をもとに空間１３０における物体の密集度合いを算出してもよい。また、サーバ装置１１０は、空間１３０に設けられたカメラで取得された画像をもとに空間１３０における密集度合いを算出してもよい。

【0046】

なお、上述した各条件については、適宜に組み合わせてもよい。

【0047】

Ｓ５０３では、サーバ装置１１０は、モデル生成処理を行う。より具体的には、サーバ装置１１０は、選定したセンサ１３１（以下、「選定センサ」と記す）の学習データをもとに、選定センサのモデルを深層学習する。深層学習のアルゴリズムについては、公知の技術を適宜に採用することができる。また、選定センサの学習データは、管理者により準備されているものとする。

【0048】

例えば、サーバ装置１１０は、選定センサのモデル以外のモデルの生成を省略することにより、管理者は、現場の環境に適したモデルを得るための時間と労力とを削減することができる。

【0049】

Ｓ５０４では、サーバ装置１１０は、モデル出力処理を行う。例えば、サーバ装置１１０は、生成した選定センサのモデルを補助記憶装置２３０に記憶する。

【0050】

図６は、モデルの利用に係る処理の一例を示す図である。なお、図６に示すＳ５０１およびＳ５０２の処理は、図５で説明した内容と同一であるので、その説明を省略する。

【0051】

Ｓ６０１では、サーバ装置１１０は、物体検出処理を行う。例えば、Ｓ５０１で取得した選定センサの環境情報をもとに選定センサのモデルを用いて物体検出を行う。また、サーバ装置１１０は、物体検出の結果を出力する画面情報を生成する。

【0052】

Ｓ６０２では、サーバ装置１１０は、結果出力処理を行う。サーバ装置１１０は、例えば、生成した画面情報をクライアント端末１２０に送信する。クライアント端末１２０は、受信した画面情報をもとに画面を表示する。

【0053】

なお、Ｓ５０２の処理および選定センサのモデルの生成については、選定センサのモデル（Ｓ５０３）が一度設定された後は、行われなくてもよいし、所定のタイミングで行われてもよい。例えば、定期的に、現場の環境にける物体検出に最適なセンサ１３１が選定される場合は、環境の変化に応じて、最適なセンサ１３１が選定されることになる。これにより、環境の変化に伴ってモデルを変更することができ、物体検出をより精度よく行うことができるようになる。

【0054】

本実施の形態によれば、現場の環境における物体検出に最適なセンサが選定され、物体検出が行われる。

【0055】

（２）第２の実施の形態
本実施の形態では、ＴＯＦカメラと可視光カメラとが所定の部屋に設けられている場合に、部屋の大きさと外光の影響とに応じてセンサが選定される構成について説明する。第１の実施の形態と同じ構成については、同じ符号を用いてその説明を適宜に省略する。

【0056】

本実施の形態では、センサ１３１としては、可視光カメラとＴＯＦカメラとを例に挙げて説明する。ＴＯＦカメラは、所定の距離（例えば、１０ｍ）内においては、距離の情報を取得できる。よって、部屋の大きさが所定の大きさより小さい場合は、ＴＯＦカメラの学習データを用いることで、可視光カメラの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。ただし、ＴＯＦカメラは、可視光カメラよりも外光の影響を受けやすい。よって、外光の影響がある場合は、可視光カメラの学習データを用いることで、ＴＯＦカメラの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。

【0057】

また、補助記憶装置２３０には、部屋において外光の影響があるか否かを示す外光情報が記憶されている。外光の影響がある場合とは、例えば、部屋に窓があり、太陽の光（例えば、西日）が差し込む場合である。外光情報は、例えば、視光カメラ等が取得した画像から算出できる輝度値の変化等であってもよいし、管理者により補助記憶装置２３０に登録されていてもよい。

【0058】

図７は、モデルの生成に係る処理の一例を示す図である。

【0059】

Ｓ７０１では、サーバ装置１１０は、ＴＯＦカメラおよび視光カメラの画像を取得する。

【0060】

Ｓ７０２では、サーバ装置１１０は、取得した画像から部屋の大きさを検出（算出）する。例えば、サーバ装置１１０は、画像の解像度に対する部屋の大きさ（例えば、部屋の奥行）を算出する。

【0061】

Ｓ７０３では、サーバ装置１１０は、部屋の大きさが所定の大きさより広いか否か（広い部屋であるか否か、例えば、部屋の奥行が１０ｍより長いか否か）を判定する。サーバ装置１１０は、部屋の大きさが所定の大きさより広いと判定した場合、Ｓ７０６に処理を移す。サーバ装置１１０は、部屋の大きさが所定の大きさより広くない（狭い）と判定した場合、Ｓ７０４に処理を移す。

【0062】

Ｓ７０４では、サーバ装置１１０は、外光情報をもとに、外光の影響があるか否かを判定する。サーバ装置１１０は、外光の影響があると判定した場合、Ｓ７０６に処理を移す。サーバ装置１１０は、外光の影響がないと判定した場合、Ｓ７０５に処理を移す。

【0063】

Ｓ７０５では、サーバ装置１１０は、ＴＯＦカメラを選定する。

【0064】

Ｓ７０６では、サーバ装置１１０は、可視光カメラを選定する。

【0065】

Ｓ７０７では、サーバ装置１１０は、モデル生成処理を行う。より具体的には、サーバ装置１１０は、選定センサの学習データの一部をもとに深層学習を行い、モデルを生成する（Ｓ７０７－１）。続いて、サーバ装置１１０は、深層学習に用いなかった学習データをもとに、生成した選定センサのモデルを評価する（Ｓ７０７－２）。

【0066】

この際、サーバ装置１１０は、複数種類の深層学習アルゴリズムのフレームワーク（ＦＷ）を用いて、複数種類のモデルを生成して評価してもよい。

【0067】

Ｓ７０８では、サーバ装置１１０は、モデル出力処理を行う。例えば、サーバ装置１１０は、生成したモデルを補助記憶装置２３０に記憶する。サーバ装置１１０は、Ｓ７０７にて生成した最も評価が高いモデルを出力してもよいし、評価の結果をクライアント端末１２０に送信し、ユーザにより指定されたモデルを出力してもよい。

【0068】

図８は、モデルの利用態様の一例を示す図である。

【0069】

図８に示すように、狭いイベント会場であり、かつ、外光の影響がないと判定された場合、ＴＯＦカメラが選定される。ＴＯＦカメラのモデルでは、物体８１１の検出が、顔領域の面積８１２をもとに行われる。また、例えば、広いイベント会場であると判定された場合、可視光カメラが選定される。可視光カメラのモデルでは、物体８２１の検出が、人（例えば、顔）の肌を示す領域である肌領域の面積８２２をもとに行われる。

【0070】

例えば、広いイベント会場であると判定された場合、可視光カメラのモデルが用いられて物体検出が行われた結果が含まれる画面８３０がクライアント端末１２０に表示される。

【0071】

画面８３０には、物体検出された人物の数（人数）を示す情報８３１と、イベント会場の定員に対する人数の割合を示す情報８３２と、人数の時系列を示す情報８３３とが含まれる。

【0072】

画面８３０によれば、例えば、ユーザは、現在の人数、時系列の人数等を把握できるので、人数に応じたプレゼンテーション（質疑応答の時間配分、説明の順序の変更等）を行うことができるようになる。

【0073】

なお、サーバ装置１１０は、部屋の大きさに応じてセンサ１３１を選定したが、これに限るものではない。

【0074】

例えば、サーバ装置１１０は、部屋の大きさに代えて、センサ１３１の高さに応じてセンサ１３１を選定してもよい。サーバ装置１１０は、地面からの高さが所定の高さ（例えば、１０ｍ）以上である場合は、Ｓ７０６の処理を行う。サーバ装置１１０は、地面からの高さが所定の高さ未満である場合は、Ｓ７０４の処理を行う。続いて、モデルの利用態様について、図９を用いて説明する。

【0075】

図９は、モデルの利用態様の一例を示す図である。

【0076】

図９に示すように、ＴＯＦカメラと可視光カメラとを備える飛行体が低い位置にあり、かつ、外光の影響がないと判定された場合（遮光されたドーム球場、倉庫等）、ＴＯＦカメラが選定され、ＴＯＦカメラのモデルが用いられて物体９１１の検出が行われる。また、飛行体が高い位置にあると判定された場合（例えば、屋外のイベント会場）、可視光カメラが選定され、可視光カメラのモデルが用いられて物体９２１の検出が行われる。

【0077】

例えば、飛行体が高い位置にあると判定された場合、可視光カメラのモデルが用いられて物体検出が行われた結果が含まれる画面９３０がクライアント端末１２０に表示される。

【0078】

画面９３０には、物体検出された人物の人（人数）を示す情報９３１と、イベント会場の定員に対する人数の割合を示す情報９３２と、人数の時系列を示す情報９３３とが含まれる。

【0079】

画面９３０によれば、例えば、ユーザは、現在の人数、時系列の人数等を把握できるので、人数に応じたセキュリティ対策（警備員の配置、入場制限等）を行うことができるようになる。

【0080】

また、例えば、サーバ装置１１０は、部屋の大きさに代えて、トラックの荷台の大きさまたは位置に応じてセンサ１３１を選定してもよい。サーバ装置１１０は、荷台の大きさが所定の大きさより広い場合は、Ｓ７０６の処理を行う。サーバ装置１１０は、荷台の大きさが所定の大きさより狭い場合は、Ｓ７０４の処理を行う。続いて、モデルの利用態様について、図１０を用いて説明する。

【0081】

図１０は、モデルの利用態様の一例を示す図である。

【0082】

図１０に示すように、トラックの荷台が近い位置または狭い荷台であり、かつ、外光の影響がないと判定された場合、ＴＯＦカメラが選定され、ＴＯＦカメラのモデルが用いられて物体１０１１の検出が行われる。また、トラックの荷台が遠い位置または広い荷台であると判定された場合、可視光カメラが選定され、可視光カメラのモデルが用いられて物体１０２１の検出が行われる。

【0083】

例えば、トラックの荷台が所定の位置より近い位置であると判定され、かつ、外光の影響がないと判定された場合、画面１０３０がクライアント端末１２０に表示される。

【0084】

画面１０３０には、物体検出された荷物の数（荷物数）を示す情報１０３１と、荷台の最大積載数に対する荷物数の割合を示す情報１０３２と、荷物数の時系列を示す情報１０３３とが含まれる。

【0085】

画面１０３０によれば、例えば、ユーザは、現在の荷物数、時系列の荷物数等を把握できるので、荷物数に応じたオペレーション（積み込みの指示、荷物の手配等）を行うことができるようになる。

【0086】

本実施の形態では、空間１３０の広さと外光の影響とに最適な、可視光カメラの物体を検出するモデルまたはＴＯＦカメラの物体を検出するモデルが用いられるので、空間１３０の広さと外光の影響とに応じて物体検出を精度よく行うことができる。

【0087】

なお、本実施の形態については、モデルを生成して当該モデルを利用する態様について説明したが、この態様に限らない。例えば、既に生成されている、ＴＯＦカメラのモデルと、可視光カメラのモデルとが補助記憶装置２３０に記憶されていて、この中から、空間１３０の広さと外光の影響とに最適なモデルが用いられる態様であってもよい。

【0088】

（３）第３の実施の形態
本実施の形態では、可視光カメラと音センサとが所定の部屋に設けられている場合に、部屋の大きさと外光の影響とに応じてセンサが選定される構成について説明する。第１の実施の形態または第２の実施の形態と同じ構成については、同じ符号を用いてその説明を適宜に省略する。

【0089】

本実施の形態では、センサ１３１としては、マイク、超音波センサ等の音センサと可視光カメラとを例に挙げて説明する。部屋の大きさが所定の大きさより小さい場合は、可視光カメラの学習データを用いることで、音センサの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。ただし、可視光カメラは、音センサよりも外光の影響を受けやすい。よって、外光の影響がある場合は、音センサの学習データを用いることで、可視光カメラの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。

【0090】

図１１は、モデルの生成に係る処理の一例を示す図である。

【0091】

Ｓ１１０１では、サーバ装置１１０は、部屋の大きさが所定の大きさより広いか否かを判定する。サーバ装置１１０は、部屋の大きさが所定の大きさより広いと判定した場合、Ｓ１１０４に処理を移す。サーバ装置１１０は、部屋の大きさが所定の大きさより狭いと判定した場合、Ｓ１１０２に処理を移す。

【0092】

Ｓ１１０２では、サーバ装置１１０は、外光情報をもとに、外光の影響があるか否かを判定する。サーバ装置１１０は、外光の影響があると判定した場合、Ｓ１１０４に処理を移す。サーバ装置１１０は、外光の影響がないと判定した場合、Ｓ１１０３に処理を移す。

【0093】

Ｓ１１０３では、サーバ装置１１０は、可視光カメラを選定する。

【0094】

Ｓ１１０４では、サーバ装置１１０は、音センサを選定する。

【0095】

なお、Ｓ７０１およびＳ７０２では、サーバ装置１１０は、可視光カメラで取得された画像をもとに部屋の大きさを算出したが、これに限らない。例えば、サーバ装置１１０は、音センサで取得された音情報（例えば、人物による会話または音センサが発した音が部屋の壁で反射された反射音）をもとに部屋の大きさを算出してもよい。

【0096】

本実施の形態では、空間１３０の広さと外光の影響とに最適な、可視光カメラの物体を検出するモデルまたは音センサの物体を検出するモデルが用いられるので、空間１３０の広さと外光の影響とに応じて物体検出を精度よく行うことができる。

【0097】

なお、本実施の形態については、モデルを生成して当該モデルを利用する態様について説明したが、この態様に限らない。例えば、既に生成されている、音センサのモデルと、可視光カメラのモデルとが補助記憶装置２３０に記憶されていて、この中から、空間１３０の広さと外光の影響とに最適なモデルが用いられる態様であってもよい。

【0098】

（４）第４の実施の形態
本実施の形態では、光センサと可視光カメラとが所定の部屋に設けられている場合に、部屋の大きさと外光の影響とに応じてセンサが選定される構成について説明する。第１の実施の形態または第２の実施の形態と同じ構成については、同じ符号を用いてその説明を適宜に省略する。

【0099】

本実施の形態では、センサ１３１としては、可視光カメラと光センサとを例に挙げて説明する。部屋の大きさが所定の大きさより小さい場合は、光センサの学習データを用いることで、可視光カメラの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。ただし、光センサは、可視光カメラよりも外光の影響を受けやすい。よって、外光の影響がある場合は、可視光カメラの学習データを用いることで、光センサの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。

【0100】

図１２は、モデルの生成に係る処理の一例を示す図である。

【0101】

Ｓ１２０１では、サーバ装置１１０は、部屋の大きさが所定の大きさより広いか否かを判定する。サーバ装置１１０は、部屋の大きさが所定の大きさより広いと判定した場合、Ｓ１２０４に処理を移す。サーバ装置１１０は、部屋の大きさが所定の大きさより狭いと判定した場合、Ｓ１２０２に処理を移す。

【0102】

Ｓ１２０２では、サーバ装置１１０は、外光情報をもとに、外光の影響があるか否かを判定する。サーバ装置１１０は、外光の影響があると判定した場合、Ｓ１２０４に処理を移す。サーバ装置１１０は、外光の影響がないと判定した場合、Ｓ１２０３に処理を移す。

【0103】

Ｓ１２０３では、サーバ装置１１０は、光センサを選定する。

【0104】

Ｓ１２０４では、サーバ装置１１０は、可視光カメラを選定する。

【0105】

なお、Ｓ７０１およびＳ７０２では、サーバ装置１１０は、光センサで取得された画像をもとに部屋の大きさを算出したが、これに限らない。例えば、サーバ装置１１０は、光センサで取得された光情報（例えば、光センサが発した光が部屋の壁で反射された反射光）をもとに部屋の大きさを算出してもよい。

【0106】

本実施の形態では、空間１３０の広さと外光の影響とに最適な、光センサの物体を検出するモデルまたは可視光カメラの物体を検出するモデルが用いられるので、空間１３０の広さと外光の影響とに応じて物体検出を精度よく行うことができる。

【0107】

なお、本実施の形態については、モデルを生成して当該モデルを利用する態様について説明したが、この態様に限らない。例えば、既に生成されている、可視光カメラのモデルと、光センサのモデルとが補助記憶装置２３０に記憶されていて、この中から、空間１３０の広さと外光の影響とに最適なモデルが用いられる態様であってもよい。

【0108】

（５）第５の実施の形態
本実施の形態では、ＴＯＦカメラと音センサとが所定の部屋に設けられている場合に、部屋の大きさと外光の影響とに応じてセンサが選定される構成について説明する。第１の実施の形態または第２の実施の形態と同じ構成については、同じ符号を用いてその説明を適宜に省略する。

【0109】

本実施の形態では、センサ１３１としては、音センサとＴＯＦカメラとを例に挙げて説明する。部屋の大きさが所定の大きさより小さい場合は、ＴＯＦカメラの学習データを用いることで、音センサの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。ただし、ＴＯＦカメラは、音センサよりも外光の影響を受けやすい。よって、外光の影響がある場合は、音センサの学習データを用いることで、ＴＯＦカメラの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。

【0110】

図１３は、モデルの生成に係る処理の一例を示す図である。

【0111】

Ｓ１３０１では、サーバ装置１１０は、部屋の大きさが所定の大きさより広いか否かを判定する。サーバ装置１１０は、部屋の大きさが所定の大きさより広いと判定した場合、Ｓ１３０４に処理を移す。サーバ装置１１０は、部屋の大きさが所定の大きさより狭いと判定した場合、Ｓ１３０２に処理を移す。

【0112】

Ｓ１３０２では、サーバ装置１１０は、外光情報をもとに、外光の影響があるか否かを判定する。サーバ装置１１０は、外光の影響があると判定した場合、Ｓ１３０４に処理を移す。サーバ装置１１０は、外光の影響がないと判定した場合、Ｓ１３０３に処理を移す。

【0113】

Ｓ１３０３では、サーバ装置１１０は、ＴＯＦカメラを選定する。

【0114】

Ｓ１３０４では、サーバ装置１１０は、音センサを選定する。

【0115】

本実施の形態では、空間１３０の広さと外光の影響とに最適な、ＴＯＦカメラの物体を検出するモデルまたは音センサの物体を検出するモデルが用いられるので、空間１３０の広さと外光の影響とに応じて物体検出を精度よく行うことができる。

【0116】

なお、本実施の形態については、モデルを生成して当該モデルを利用する態様について説明したが、この態様に限らない。例えば、既に生成されている、音センサのモデルと、ＴＯＦカメラのモデルとが補助記憶装置２３０に記憶されていて、この中から、空間１３０の広さと外光の影響とに最適なモデルが用いられる態様であってもよい。

【0117】

（６）第６の実施の形態
本実施の形態では、光センサとＴＯＦカメラとが所定の部屋に設けられている場合に、部屋の大きさと外光の影響とに応じてセンサが選定される構成について説明する。第１の実施の形態または第２の実施の形態と同じ構成については、同じ符号を用いてその説明を適宜に省略する。

【0118】

本実施の形態では、センサ１３１としては、ＴＯＦカメラと光センサとを例に挙げて説明する。部屋の大きさが所定の大きさより小さい場合は、光センサの学習データを用いることで、ＴＯＦカメラの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。ただし、光センサは、ＴＯＦカメラよりも外光の影響を受けやすい。よって、外光の影響がある場合は、ＴＯＦカメラの学習データを用いることで、光センサの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。

【0119】

図１４は、モデルの生成に係る処理の一例を示す図である。

【0120】

Ｓ１４０１では、サーバ装置１１０は、部屋の大きさが所定の大きさより広いか否かを判定する。サーバ装置１１０は、部屋の大きさが所定の大きさより広いと判定した場合、Ｓ１４０４に処理を移す。サーバ装置１１０は、部屋の大きさが所定の大きさより狭いと判定した場合、Ｓ１４０２に処理を移す。

【0121】

Ｓ１４０２では、サーバ装置１１０は、外光情報をもとに、外光の影響があるか否かを判定する。サーバ装置１１０は、外光の影響があると判定した場合、Ｓ１４０４に処理を移す。サーバ装置１１０は、外光の影響がないと判定した場合、Ｓ１４０３に処理を移す。

【0122】

Ｓ１４０３では、サーバ装置１１０は、光センサを選定する。

【0123】

Ｓ１４０４では、サーバ装置１１０は、ＴＯＦカメラを選定する。

【0124】

本実施の形態では、空間１３０の広さと外光の影響とに最適な、光センサの物体を検出するモデルまたはＴＯＦカメラの物体を検出するモデルが用いられるので、空間１３０の広さと外光の影響とに応じて物体検出を精度よく行うことができる。

【0125】

なお、本実施の形態については、モデルを生成して当該モデルを利用する態様について説明したが、この態様に限らない。例えば、既に生成されている、ＴＯＦカメラのモデルと、光センサのモデルとが補助記憶装置２３０に記憶されていて、この中から、空間１３０の広さと外光の影響とに最適なモデルが用いられる態様であってもよい。

【0126】

（７）第７の実施の形態
本実施の形態では、光センサと音センサとが所定の部屋に設けられている場合に、部屋の大きさと外光の影響とに応じてセンサが選定される構成について説明する。第１の実施の形態または第２の実施の形態と同じ構成については、同じ符号を用いてその説明を適宜に省略する。

【0127】

本実施の形態では、センサ１３１としては、音センサと光センサとを例に挙げて説明する。部屋の大きさが所定の大きさより小さい場合は、光センサの学習データを用いることで、音センサの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。ただし、光センサは、音センサよりも外光の影響を受けやすい。よって、外光の影響がある場合は、音センサの学習データを用いることで、光センサの学習データを用いるときよりも物体検出の精度がよいモデルを生成することができる。

【0128】

図１５は、モデルの生成に係る処理の一例を示す図である。

【0129】

Ｓ１５０１では、サーバ装置１１０は、環境情報（音情報および光情報）を取得する。

【0130】

Ｓ１５０２では、サーバ装置１１０は、音情報をもとに、部屋の大きさを検出する。例えば、サーバ装置１１０は、人物による会話または音センサが発した音が部屋の壁で反射された反射音をもとに部屋の大きさを計算する。

【0131】

Ｓ１５０３では、サーバ装置１１０は、部屋の大きさが所定の大きさより広いか否かを判定する。サーバ装置１１０は、部屋の大きさが所定の大きさより広いと判定した場合、Ｓ１５０６に処理を移す。サーバ装置１１０は、部屋の大きさが所定の大きさより狭いと判定した場合、Ｓ１５０４に処理を移す。

【0132】

Ｓ１５０４では、サーバ装置１１０は、外光情報をもとに、外光の影響があるか否かを判定する。サーバ装置１１０は、外光の影響があると判定した場合、Ｓ１５０６に処理を移す。サーバ装置１１０は、外光の影響がないと判定した場合、Ｓ１５０５に処理を移す。

【0133】

Ｓ１５０５では、サーバ装置１１０は、光センサを選定する。

【0134】

Ｓ１５０６では、サーバ装置１１０は、音センサを選定する。

【0135】

本実施の形態では、空間１３０の広さと外光の影響とに最適な、光センサの物体を検出するモデルまたは音センサの物体を検出するモデルが用いられるので、空間１３０の広さと外光の影響とに応じて物体検出を精度よく行うことができる。

【0136】

なお、本実施の形態については、モデルを生成して当該モデルを利用する態様について説明したが、この態様に限らない。例えば、既に生成されている、音センサのモデルと、光センサのモデルとが補助記憶装置２３０に記憶されていて、この中から、空間１３０の広さと外光の影響とに最適なモデルが用いられる態様であってもよい。

【0137】

（８）付記
上述の実施の形態には、例えば、以下のような内容が含まれる。

【0138】

上述の実施の形態においては、本発明を物体検出システムに適用するようにした場合について述べたが、本発明はこれに限らず、この他種々のシステム、装置、方法、プログラムに広く適用することができる。

【0139】

また、上述の実施の形態において、各テーブルの構成は一例であり、１つのテーブルは、２以上のテーブルに分割されてもよいし、２以上のテーブルの全部または一部が１つのテーブルであってもよい。

【0140】

また、上述の実施の形態において、説明の便宜上、テーブルを用いて各種のデータを説明したが、データ構造は限定されるものではなく、情報等と表現してもよい。

【0141】

また、上述の実施の形態において、情報の出力は、ディスプレイへの表示に限るものではない。情報の出力は、スピーカによる音声出力であってもよいし、ファイルへの出力であってもよいし、印刷装置による紙媒体等への印刷であってもよいし、プロジェクタによるスクリーン等への投影であってもよいし、その他の態様であってもよい。

【0142】

また、上述の実施の形態において示した画面は、一例であり、受け付ける情報が同じであればどのような画面デザインであってもよい。例えば、各パラメータの名称をタイトル行にもち、各行が個々のパラメータの入力セルとなっているような表算出シート状の画面デザインであってもよい。また、画面は、ファイルの入力を受け付けるインターフェースを持ち、指定されたファイルの情報を基に画面の内容を更新してもよい。

【0143】

また、上記の説明において、各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、ＳＳＤ（Solid State Drive）等の記憶装置、または、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に置くことができる。

【0144】

上述した実施の形態は、例えば、以下の特徴的な構成を有する。

【0145】

物体検出システム（例えば、物体検出システム１００）は、取得部（例えば、取得部３１０）と、選定部（例えば、選定部３２０）と、検出部（例えば、検出部３４０）とを備える。

【0146】

上記取得部は、所定の空間（例えば、空間１３０）に設けられている複数のセンサ（例えば、第１のセンサ１３１－１、第２のセンサ１３１－２、第Ｎのセンサ１３１－Ｎ）の少なくとも１つのセンサで取得された上記所定の空間の環境を示す環境情報を取得する（例えば、Ｓ５０１参照）。上記取得部は、取得部３１０、サーバ装置１１０、回路等である。

【0147】

上記複数のセンサは、可視光カメラ、ＴＯＦカメラ、サーモカメラ、音センサ、光センサ等である。また、上記物体検出システムでは、センサについては、種類（広角であるか否か、赤外線の照射範囲が広いか否か、マイクに指向性がある否か、光線の照射範囲が広いか否か等）が異なる場合は、異なるセンサとして扱ってもよい。

【0148】

上記環境情報は、空間の広さを示す情報であってもよいし、空間における外光の影響を示す情報であってもよいし、空間における物体の密集度合いを示す情報であってもよいし、空間における照度を示す情報であってもよい。

【0149】

上記選定部は、上記取得部により取得された環境情報をもとに、上記複数のセンサの中から、上記所定の空間の環境における物体検出に最適なセンサを選定する（例えば、Ｓ５０２参照）。上記選定部は、選定部３２０、サーバ装置１１０、回路等である。

【0150】

上記選定部は、上記環境情報をもとに、空間の広さ、センサがある高さ等を算出してセンサを選定する。この際、上記選定部は、条件情報を参照して条件に合うセンサを選定してもよいし、予め設計された条件分岐（処理内容）に従ってセンサを選定してもよい。

【0151】

例えば、選定部は、空間の広さが閾値以上である場合は、広角レンズの可視光カメラを選定し、空間の広さが閾値未満である場合は、広角レンズでない可視光カメラを選定する。例えば、選定部は、空間の広さが閾値以上である場合は、赤外線の照射範囲の広いＴＯＦカメラを選定し、空間の広さが閾値未満である場合は、赤外線の照射範囲の狭いＴＯＦカメラを選定する。また、例えば、選定部は、空間の広さが閾値以上である場合は、可視光カメラを選定し、空間の広さが閾値未満である場合は、サーモカメラを選定する。

【0152】

上記検出部は、上記選定部により選定されたセンサで取得されたデータと上記センサの物体を検出するモデルとを用いて物体検出する（例えば、Ｓ６０１参照）。上記検出部は、検出部３４０、サーバ装置１１０、回路等である。

【0153】

【0154】

上記所定の空間には、第１のセンサ（例えば、可視光カメラ）と、距離を測定可能な第２のセンサ（例えば、ＴＯＦカメラ）とが設けられている。

【0155】

上記選定部は、上記取得部により取得された環境情報（例えば、画像情報）をもとに、上記空間の広さ（部屋の大きさ、荷台の大きさ等）を算出し、上記空間の広さが閾値以上であると判定した場合は、上記第１のセンサを選定する。

【0156】

上記構成では、例えば、閾値が第２のセンサの測定可能な距離である場合に、空間の広さが閾値以上であるときには、第１のセンサが選ばれるので、第２のセンサが選定されることにより物体検出の精度が低下しまう事態を回避することができるようになる。このように、上記構成では、空間の広さに適したセンサが選定されるので、物体検出を精度よく行うことができる。

【0157】

上記第２のセンサは、上記第１のセンサよりも外光の影響を受けやすいセンサである。

【0158】

上記選定部は、上記所定の空間において外光の影響があるか否かを示す外光情報に基づいて外光の影響があるか否かを判定する（例えば、Ｓ７０４参照）。上記選定部は、上記空間の広さが上記閾値未満であると判定し、かつ、外光の影響があると判定した場合、上記第１のセンサを選定する（例えば、Ｓ７０６参照）。上記選定部は、上記空間の広さが上記閾値未満であると判定し、かつ、外光の影響がないと判定した場合、上記第２のセンサを選定する（例えば、Ｓ７０５参照）。

【0159】

外光情報は、所定の空間に設けられているセンサにより取得された情報をもとに算出される情報であってもよいし、管理者により入力される情報であってもよい。

【0160】

上記構成では、外光の影響がある場合には、第１のセンサが選ばれるので、第２のセンサが選定されることにより物体検出の精度が低下しまう事態を回避することができるようになる。このように、上記構成では、外光の影響を加味したセンサが選定されるので、物体検出を精度よく行うことができる。

【0161】

上記所定の空間では、第１のセンサと、距離を測定可能な第２のセンサとを備える飛行体（ドローン、ヘリコプター、飛行船、気球等）が飛行する。

【0162】

上記選定部は、上記取得部により取得された環境情報をもとに、上記飛行体の高さを算出し、上記飛行体の高さ（高度、飛行体から地面までの距離等）が閾値以上であると判定した場合は、上記第１のセンサを選定する。

【0163】

上記環境情報は、上記第１のセンサまたは上記第２のセンサにより取得された情報であってもよいし、飛行体が備える高度計等の他のセンサによって取得された情報であってもよいし、その他のセンサによって取得された情報であってもよい。

【0164】

上記構成では、例えば、閾値が第２のセンサの測定可能な距離である場合に、飛行体の高さが閾値以上であるときには、第１のセンサが選ばれるので、第２のセンサが選定されることにより物体検出の精度が低下してしまう事態を回避することができるようになる。このように、上記構成では、センサの高さに適したセンサが選定されるので、物体検出を精度よく行うことができる。

【0165】

上記所定の空間（部屋、イベント会場、作業場所等）には、可視光カメラとＴＯＦカメラとが設けられている。上記取得部は、上記可視光カメラまたは上記ＴＯＦカメラから上記所定の空間を示す画像情報（画像）を取得する。上記選定部は、上記取得部により取得された画像情報をもとに、上記空間の広さを算出し、上記空間の広さが閾値以上であると判定した場合は、上記可視光カメラを選定する（例えば、Ｓ７０６参照）。

【0166】

上記構成では、例えば、閾値がＴＯＦカメラの測定可能な距離である場合に、空間の広さが閾値以上であるときには、可視光カメラが選ばれるので、ＴＯＦカメラが選定されることにより物体検出の精度が低下してしまう事態を回避することができるようになる。このように、上記構成では、空間の広さに適したセンサが選定されるので、物体検出を精度よく行うことができる。

【0167】

上記所定の空間には、音センサと可視光カメラとが設けられている。上記取得部は、上記可視光カメラから上記所定の空間を示す画像情報を取得する。上記選定部は、上記取得部により取得された画像情報をもとに、上記空間の広さを算出し、上記空間の広さが閾値以上であると判定した場合は、上記音センサを選定する（例えば、Ｓ１１０４参照）。

【0168】

上記構成では、例えば、閾値が可視光カメラの測定可能な距離である場合に、空間の広さが閾値以上であるときには、音センサが選ばれるので、可視光カメラが選定されることにより物体検出の精度が低下してしまう事態を回避することができるようになる。このように、上記構成では、空間の広さに適したセンサが選定されるので、物体検出を精度よく行うことができる。

【0169】

上記所定の空間には、可視光カメラと光センサとが設けられている。上記取得部は、上記可視光カメラから上記所定の空間を示す画像情報を取得する。上記選定部は、上記取得部により取得された画像情報をもとに、上記空間の広さを算出し、上記空間の広さが閾値以上であると判定した場合は、上記可視光カメラを選定する（例えば、Ｓ１２０４参照）。

【0170】

上記構成では、例えば、閾値が光センサの測定可能な距離である場合に、空間の広さが閾値以上であるときには、可視光カメラが選ばれるので、光センサが選定されることにより物体検出の精度が低下してしまう事態を回避することができるようになる。このように、上記構成では、空間の広さに適したセンサが選定されるので、物体検出を精度よく行うことができる。

【0171】

上記所定の空間には、音センサとＴＯＦカメラとが設けられている。上記取得部は、上記ＴＯＦカメラから上記所定の空間を示す画像情報を取得する。上記選定部は、上記取得部により取得された画像情報をもとに、上記空間の広さを算出し、上記空間の広さが閾値以上であると判定した場合は、上記音センサを選定する（例えば、Ｓ１３０４参照）。

【0172】

上記構成では、例えば、閾値がＴＯＦカメラの測定可能な距離である場合に、空間の広さが閾値以上であるときには、音センサが選ばれるので、ＴＯＦカメラが選定されることにより物体検出の精度が低下してしまう事態を回避することができるようになる。このように、上記構成では、空間の広さに適したセンサが選定されるので、物体検出を精度よく行うことができる。

【0173】

上記所定の空間には、ＴＯＦカメラと光センサとが設けられている。上記取得部は、上記ＴＯＦカメラから上記所定の空間を示す画像情報を取得する。上記選定部は、上記取得部により取得された画像情報をもとに、上記空間の広さを算出し、上記空間の広さが閾値以上であると判定した場合は、上記ＴＯＦカメラを選定する（例えば、Ｓ１４０４参照）。

【0174】

上記構成では、例えば、閾値が光センサの測定可能な距離である場合に、空間の広さが閾値以上であるときには、ＴＯＦカメラが選ばれるので、光センサが選定されることにより物体検出の精度が低下してしまう事態を回避することができるようになる。このように、上記構成では、空間の広さに適したセンサが選定されるので、物体検出を精度よく行うことができる。

【0175】

上記所定の空間には、音センサと光センサとが設けられている。上記取得部は、上記音センサから上記所定の空間を示す音情報を取得する。上記選定部は、上記取得部により取得された音情報をもとに、上記空間の広さを算出し、上記空間の広さが閾値以上であると判定した場合は、上記音センサを選定する（例えば、Ｓ１５０４参照）。

【0176】

上記構成では、例えば、閾値が光センサの測定可能な距離である場合に、空間の広さが閾値以上であるときには、音センサが選ばれるので、光センサが選定されることにより物体検出の精度が低下してしまう事態を回避することができるようになる。このように、上記構成では、空間の広さに適したセンサが選定されるので、物体検出を精度よく行うことができる。

【0177】

上記物体検出システムは、上記複数のセンサの各々に対応した物体を検出するモデルを記憶する記憶装置（主記憶装置２２０、補助記憶装置２３０等）を備える。上記検出部は、上記記憶装置に記憶されている物体を検出するモデルから、上記選定部により選定されたセンサの物体を検出するモデルを特定し、上記センサで取得されたデータと上記物体を検出するモデルとを用いて物体検出する（例えば、Ｓ６０１参照）。

【0178】

上記構成では、所定の空間に設けられているセンサの中から、空間の環境における物体検出に最適なセンサが選定され、既に設けられている物体を検出するモデルの中から、選定されたセンサの物体を検出するモデルが特定される。このように、物体検出システムでは、既存の物体を検出するモデルが利用されるので、空間の環境に合った物体を検出するモデルを新たに生成することなく、物体検出を精度よく行うことができる。

【0179】

上記物体検出システムは、上記選定部により選定されたセンサの学習データを用いて、深層学習により物体を検出するモデルを生成する生成部を備える。生成部は、生成部３３０、サーバ装置１１０、回路等である。上記検出部は、上記選定部により選定されたセンサで取得されたデータと、上記生成部により生成された物体を検出するモデルとを用いて物体検出する（例えば、図５、図６参照）。

【0180】

上記構成では、所定の空間に設けられているセンサの中から、空間の環境における物体検出に最適なセンサが選定され、当該センサの物体を検出するモデルが生成されるので、複数のセンサの全てについて物体を検出するモデルを生成することなく、物体検出を精度よく行うことができる。

【0181】

また上述した構成については、本発明の要旨を超えない範囲において、適宜に、変更したり、組み替えたり、組み合わせたり、省略したりしてもよい。

【0182】

「Ａ、Ｂ、およびＣのうちの少なくとも１つ」という形式におけるリストに含まれる項目は、（Ａ）、（Ｂ）、（Ｃ）、（ＡおよびＢ）、（ＡおよびＣ）、（ＢおよびＣ）または（Ａ、Ｂ、およびＣ）を意味することができると理解されたい。同様に、「Ａ、Ｂ、またはＣのうちの少なくとも１つ」の形式においてリストされた項目は、（Ａ）、（Ｂ）、（Ｃ）、（ＡおよびＢ）、（ＡおよびＣ）、（ＢおよびＣ）または（Ａ、Ｂ、およびＣ）を意味することができる。

【符号の説明】

【0183】

１００……物体検出システム、３１０……取得部、３２０……選定部、３３０……生成部、３４０……検出部。

【図1】