(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025007980
(43)【公開日】2025-01-20
(54)【発明の名称】認識システム、認識装置、認識方法、およびプログラム
(51)【国際特許分類】
G08C 15/00 20060101AFI20250109BHJP
G08B 25/04 20060101ALI20250109BHJP
【FI】
G08C15/00 D
G08B25/04 E
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2023109763
(22)【出願日】2023-07-04
(71)【出願人】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(71)【出願人】
【識別番号】305027401
【氏名又は名称】東京都公立大学法人
(74)【代理人】
【識別番号】100121706
【弁理士】
【氏名又は名称】中尾 直樹
(74)【代理人】
【識別番号】100128705
【弁理士】
【氏名又は名称】中村 幸雄
(74)【代理人】
【識別番号】100147773
【弁理士】
【氏名又は名称】義村 宗洋
(72)【発明者】
【氏名】安田 昌弘
(72)【発明者】
【氏名】小野 順貴
【テーマコード(参考)】
2F073
5C087
【Fターム(参考)】
2F073AA11
2F073AA19
2F073AA40
2F073AB01
2F073AB04
2F073BB01
2F073BB04
2F073BB07
2F073BC01
2F073BC02
2F073BC04
2F073BC05
2F073CC01
2F073CC07
2F073CC08
2F073CC12
2F073CC14
2F073CD05
2F073CD11
2F073DD02
2F073DE02
2F073DE06
2F073DE13
2F073EE01
2F073EE16
2F073EF08
2F073FF01
2F073FF12
2F073FG01
2F073FG02
2F073FG11
2F073GG01
2F073GG08
5C087AA12
5C087DD03
5C087DD05
5C087DD31
5C087EE14
5C087FF01
5C087FF02
5C087FF04
5C087GG02
(57)【要約】
【課題】広範囲の環境を認識するために、必要なときに、必要な場所に設置したセンサを稼働させることで、消費電力と計算リソースを抑え、確認するための人的コストを抑えることができる認識装置等を提供する。
【解決手段】認識装置は、カメラを用いて複数の音光変換装置に対応する発光素子を撮影し、映像データを取得する映像取得部と、映像データに含まれる複数の音光変換装置に対応する発光素子の光情報に基づいて、所定の発光パターンを発した音光変換装置を特定し、特定した音光変換装置に対応するエリアのセンサにウェイクアップ信号を送信する特定部と、ウェイクアップ信号を受信したセンサからそのセンサで取得したデータを受信し、そのセンサで取得したデータに基づいて、環境を認識するための処理を実行する認識部とを含む。
【選択図】
図5
【特許請求の範囲】
【請求項1】
複数の音光変換装置と、認識装置と、複数のセンサとを含む認識システムであって、
各前記音光変換装置は、
マイクを用いて周囲の音を収音し、音響信号を取得する音響信号取得部と、
前記音響信号を用いて、音響信号に基づく情報を入力として、所定のイベントが発生したか否かを示す検出結果を出力する検出モデルにより、所定のイベントを検出する検出部と、
検出結果が所定のイベントが発生したことを示す場合、所定の発光パターンで発光素子を発光させる発光部とを含み、
前記認識装置は、
カメラを用いて前記複数の音光変換装置に対応する発光素子を撮影し、映像データを取得する映像取得部と、
前記映像データに含まれる前記複数の音光変換装置に対応する前記発光素子の光情報に基づいて、所定の発光パターンを発した音光変換装置を特定し、特定した音光変換装置に対応するエリアのセンサにウェイクアップ信号を送信する特定部と、
ウェイクアップ信号を受信したセンサからそのセンサで取得したデータを受信し、そのセンサで取得したデータに基づいて、環境を認識するための処理を実行する認識部とを含む、
認識システム。
【請求項2】
広範囲環境認識を行う認識装置であって、
音光変換装置は、周囲の音を収音した音響信号を用いて所定のイベントを検出した場合、所定の発光パターンで発光素子を発光させるものとし、
カメラを用いて複数の音光変換装置に対応する発光素子を撮影し、映像データを取得する映像取得部と、
前記映像データに含まれる前記複数の音光変換装置に対応する前記発光素子の光情報に基づいて、所定の発光パターンを発した音光変換装置を特定し、特定した音光変換装置に対応するエリアのセンサにウェイクアップ信号を送信する特定部と、
ウェイクアップ信号を受信したセンサからそのセンサで取得したデータを受信し、そのセンサで取得したデータに基づいて、環境を認識するための処理を実行する認識部とを含む、
認識装置。
【請求項3】
複数の音光変換装置と、認識装置と、複数のセンサとを用いる認識方法であって、
各前記音光変換装置が、マイクを用いて周囲の音を収音し、音響信号を取得する音響信号取得ステップと、
各前記音光変換装置が、前記音響信号を用いて、音響信号に基づく情報を入力として、所定のイベントが発生したか否かを示す検出結果を出力する検出モデルにより、所定のイベントを検出する検出ステップと、
各前記音光変換装置が、検出結果が所定のイベントが発生したことを示す場合、所定の発光パターンで発光素子を発光させる発光ステップと、
前記認識装置が、カメラを用いて前記複数の音光変換装置に対応する発光素子を撮影し、映像データを取得する映像取得ステップと、
前記認識装置が、前記映像データに含まれる前記複数の音光変換装置に対応する前記発光素子の光情報に基づいて、所定の発光パターンを発した音光変換装置を特定し、特定した音光変換装置に対応するエリアのセンサにウェイクアップ信号を送信する特定ステップと、
前記認識装置が、ウェイクアップ信号を受信したセンサからそのセンサで取得したデータを受信し、そのセンサで取得したデータに基づいて、環境を認識するための処理を実行する認識ステップとを含む、
認識方法。
【請求項4】
請求項2の認識装置としてコンピュータを機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、広範囲環境認識技術に関する。
【背景技術】
【0002】
広範囲環境認識とは、都市全体などの非常に広い範囲にわたって、人物やその周辺の機械等の活動を自動的に検出する問題である。これが実現出来れば、不審な人物の行動を事前に捉えることによる犯罪抑止や、急病人の自動検出による救命活動の迅速化、遠隔地の街の情報を今そこにいるかのように感じることのできるメタバースアプリケーションといったさまざまな応用が考えられる。
【0003】
現在までのところ、このような広範囲な環境認識技術は警備の用途で実用化されており、街中に設置された多数の監視カメラを目視により監視することにより、犯罪の兆候を事前に察知することや、犯罪の証拠を保存することに役立てている。人による監視だけではなく、カメラから得られる情報を使って、自動的に不審な行動を自動検出する技術も実応用がはじまっている。さらに、複数の分散したセンサを組み合わせることによって、より精度良く網羅的に人の活動を捉えることも検討されている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来の広範囲環境認識装置は、基本的に全てのセンサを常に稼働させることを想定している。しかしながら、分散センサを組み合わせた環境認識といった技術の登場に合わせて、今後センサの設置を増やすことを考えると、このような常時稼働型のシステムは大きな電力消費を必要とする。特に、センサ情報から目的の行動を自動検出するようなシステムでは深層学習モデルなどの大きな計算リソースを必要とするものも利用されはじめており、より多くの電力を消費することが見込まれる。さらに、目視による監視を行う場合にも、多くのセンサを確認するためには多くの人手を必要とするため、多数のセンサを設置したとしてもそれらを十分に活用することは難しい。
【0006】
本発明は、広範囲の環境を認識するために、必要なときに、必要な場所に設置したセンサを稼働させることで、消費電力と計算リソースを抑え、確認するための人的コストを抑えることができる認識システム、認識装置、認識方法、およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記の課題を解決するために、本発明の一態様によれば、認識システムは、複数の音光変換装置と、認識装置と、複数のセンサとを含む。各音光変換装置は、マイクを用いて周囲の音を収音し、音響信号を取得する音響信号取得部と、音響信号を用いて、音響信号に基づく情報を入力として、所定のイベントが発生したか否かを示す検出結果を出力する検出モデルにより、所定のイベントを検出する検出部と、検出結果が所定のイベントが発生したことを示す場合、所定の発光パターンで発光素子を発光させる発光部とを含む。認識装置は、カメラを用いて複数の音光変換装置に対応する発光素子を撮影し、映像データを取得する映像取得部と、映像データに含まれる複数の音光変換装置に対応する発光素子の光情報に基づいて、所定の発光パターンを発した音光変換装置を特定し、特定した音光変換装置に対応するエリアのセンサにウェイクアップ信号を送信する特定部と、ウェイクアップ信号を受信したセンサからそのセンサで取得したデータを受信し、そのセンサで取得したデータに基づいて、環境を認識するための処理を実行する認識部とを含む。
【0008】
上記の課題を解決するために、本発明の他の態様によれば、認識装置は、広範囲環境認識を行う。音光変換装置は、周囲の音を収音した音響信号を用いて所定のイベントを検出した場合、所定の発光パターンで発光素子を発光させるものとし、認識装置は、カメラを用いて複数の音光変換装置に対応する発光素子を撮影し、映像データを取得する映像取得部と、映像データに含まれる複数の音光変換装置に対応する発光素子の光情報に基づいて、所定の発光パターンを発した音光変換装置を特定し、特定した音光変換装置に対応するエリアのセンサにウェイクアップ信号を送信する特定部と、ウェイクアップ信号を受信したセンサからそのセンサで取得したデータを受信し、そのセンサで取得したデータに基づいて、環境を認識するための処理を実行する認識部とを含む。
【0009】
上記の課題を解決するために、本発明の他の態様によれば、認識方法は、複数の音光変換装置と、認識装置と、複数のセンサとを用いる。認識方法は、各音光変換装置が、マイクを用いて周囲の音を収音し、音響信号を取得する音響信号取得ステップと、各音光変換装置が、音響信号を用いて、音響信号に基づく情報を入力として、所定のイベントが発生したか否かを示す検出結果を出力する検出モデルにより、所定のイベントを検出する検出ステップと、各音光変換装置が、検出結果が所定のイベントが発生したことを示す場合、所定の発光パターンで発光素子を発光させる発光ステップと、認識装置が、カメラを用いて複数の音光変換装置に対応する発光素子を撮影し、映像データを取得する映像取得ステップと、認識装置が、映像データに含まれる複数の音光変換装置に対応する発光素子の光情報に基づいて、所定の発光パターンを発した音光変換装置を特定し、特定した音光変換装置に対応するエリアのセンサにウェイクアップ信号を送信する特定ステップと、認識装置が、ウェイクアップ信号を受信したセンサからそのセンサで取得したデータを受信し、そのセンサで取得したデータに基づいて、環境を認識するための処理を実行する認識ステップとを含む。
【発明の効果】
【0010】
本発明によれば、消費電力と計算リソースを抑え、確認するための人的コストを抑えることができるという効果を奏する。
【図面の簡単な説明】
【0011】
【
図1】第一実施形態に係る広範囲環境認識システムの構成例を示す図。
【
図2】第一実施形態に係る音光変換装置とカメラとセンサの配置例を示す図。
【
図3】第一実施形態に係る広範囲環境認識システムの処理フローの例を示す図。
【
図6】本手法を適用するコンピュータの構成例を示す図。
【発明を実施するための形態】
【0012】
以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。
【0013】
<第一実施形態のポイント>
本実施形態の広範囲環境認識システムでは、音光変換装置をシステムウェイクアップに用いる。なお、音光変換装置は、音信号を観測すると、それに応じた光を発する装置である。本実施形態では、環境認識を行うべき対象の周囲では、通常時とは異なる音が鳴るはずであると考えた。そこで本システムでは、環境認識の対象とする空間内において疎に音光変換装置を配置し、通常時と一定以上異なる音響信号が得られたときに発光するように設定する。この光を遠方に設置した少数のカメラを用いて捉えることによって、認識すべき対象の存在する区域を限定する。つまり、音光変換装置の発する光をトリガーとして、その周辺のセンサ群をウェイクアップさせることにより、認識したい対象が存在する場所、存在する時刻においてのみ効率的に多数のセンサ系を活用した環境認識を行うことが可能になる。
【0014】
音光変換装置をシステムウェイクアップに用いることで、広範囲環境認識において必要な時刻および場所のセンサのみを駆動することが可能になるため、電力消費を抑えることが可能となる。さらに、この機構によって節約された電力消費量、計算リソースを割り当てることによって、より多くのセンサを用いた高精度な環境認識を実現することも可能となることが期待される。
【0015】
<第一実施形態>
図1は、第一実施形態に係る広範囲環境認識システムの構成例を示す。
【0016】
広範囲環境認識システムは、認識装置200と、N台の音光変換装置100-(k,m)と、Q台のセンサ300-(k,m,p)とを含む。なお、認識装置200は、K台のカメラ90-kを用いて映像データを取得する。k番目のカメラ90-kを用いて取得する映像データには、n
k台の音光変換装置100-(k,m)に対応する発光素子が映るようにカメラ90-kを設置する。音光変換装置100-(k,m)に対応するマイクの周辺にq
k,m台のセンサ300-(k,m,p)が配置される。k=1,2,…,K、m=1,2,…,n
k、p=1,2,…,q
k,mとし、
【数1】
【数2】
とする。
【0017】
図2は、音光変換装置100-(k,m)とカメラ90-kとセンサ300-(k,m,p)の配置例を示す。なお、音光変換装置100-(k,m)が発光素子を点灯または消灯させ、カメラ90-kを用いて発光素子の映像データを取得することで、光変換装置100-(k,m)は光情報を認識装置200に送信することができる。光情報とは、例えば、点灯または消灯を示す情報である。例えば、点灯状態を1とし、消灯状態を0とする信号を光情報で表現することができる。一方、認識装置200からn
k台の音光変換装置100-(k,m)に情報を送信することはできなくともよい。また、音光変換装置100-(k,m)と認識装置200とは他の無線通信等を利用することはできなくともよく、有線接続はされていなくともよい。また、認識装置200とQ台のセンサ300-(k,m,p)とは、無線または有線で通信可能に接続されており、認識装置200はセンサ300-(k,m,p)にウェイクアップ信号を送信することができ、センサ300-(k,m,p)はそのセンサで取得したデータ(以下「センサ情報」ともいう)を認識装置200に送信することができる。
図2の黒丸は音光変換装置100-(k,m)の位置を表し、
図2の白丸はセンサ300-(k,m,p)の位置を表す。
図2の例では、K=4であり、n
1=3であり、q
1,1=4である。広範囲環境認識の対象となるエリアにおいて発生する音をマイクで満遍なく収音できるようにN台の音光変換装置100-(k,m)が配置される。同時に、所定のイベントが発生したときに生じる音の音量の最小値において、ある音光変換装置に対応するマイクが収音する音と、他の音光変換装置に対応するマイクが収音する音とが、同一の音源に由来するものとならないように、N台の音光変換装置100-(k,m)が疎に配置されることが望ましい。
【0018】
音光変換装置100-(k,m)は、マイクを用いて周囲の音を収音し、所定のイベントが発生したときに生じる音を収音したときに、所定の発光パターンで発光素子を発光させる。
【0019】
認識装置200は、所定の発光パターンを受信すると、所定の発光パターンを発した音光変換装置100-(k,m)に対応するエリアのqk,m台のセンサ300-(k,m,p)にウェイクアップ信号を送信し、起動後のセンサ300-(k,m,p)で取得したセンサ情報x(k,m,p)を受信する。例えば、「センサ情報」は、センサがマイクである場合には、マイクで取得された音信号のことである。また、「センサ情報」は、センサがカメラである場合には、カメラで取得された映像信号のことである。
【0020】
認識装置200は、qk,m個のセンサ情報x(k,m,p)に基づいて、イベント検出等の環境を認識するための処理を実行し、認識結果を出力する。
【0021】
音光変換装置100-(k,m)および認識装置200は、例えば、中央演算処理装置(CPU: Central Processing Unit)、主記憶装置(RAM: Random Access Memory)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。音光変換装置100-(k,m)および認識装置200は、例えば、中央演算処理装置の制御のもとで各処理を実行する。音光変換装置100-(k,m)および認識装置200に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて中央演算処理装置へ読み出されて他の処理に利用される。音光変換装置100-(k,m)および認識装置200の各処理部は、少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。音光変換装置100-(k,m)および認識装置200が備える各記憶部は、例えば、RAM(Random Access Memory)などの主記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。ただし、各記憶部は、必ずしも音光変換装置100-(k,m)および認識装置200がその内部に備える必要はなく、ハードディスクや光ディスクもしくはフラッシュメモリ(Flash Memory)のような半導体メモリ素子により構成される補助記憶装置により構成し、音光変換装置100-(k,m)および認識装置200の外部に備える構成としてもよい。
【0022】
図3は、広範囲環境認識システムの処理フローを示す。
図3を用いて、各装置の処理について説明する。
【0023】
<音光変換装置100-(k,m)>
図4は、音光変換装置100-(k,m)の機能ブロック図を示す。音光変換装置100-(k,m)は、音響信号取得部110と、検出部120と、発光部130とを含む。
【0024】
(音響信号取得部110)
音響信号取得部110は、単チャネルまたはマルチチャネルのマイクを用いて周囲の音を収音し、音響信号を取得し(S110)、出力する。なお、音響信号取得部110は、単チャネルまたはマルチチャネルのマイクを含んでもよいし、外部の単チャネルまたはマルチチャネルのマイクが出力する音響信号を受信する構成としてもよい。
【0025】
(検出部120)
検出部120は、音響信号を入力とし、検出モデルにより、所定のイベントを検出し(S120)、検出結果を出力する。検出モデルは、音響信号に基づく情報(例えば音響信号自体であってもよいし、音響信号から抽出される音響特徴量(例えばMFCC等)であってもよい)を入力として、所定のイベントが発生したか否かを示す検出結果を出力するモデルである。例えば、所定のイベントを異常音の発生として、例えば、既存の異常音検知技術を用いることができる(例えば参考文献1参照)。
(参考文献1)特開2019-036112号公報
【0026】
(発光部130)
発光部130は、検出結果を入力とし、検出結果が所定のイベントが発生したことを示す場合、所定の発光パターンで単一または複数の発光素子を発光させる(S130)。なお、発光部130は、単一または複数の発光素子を含んでもよいし、外部の単一または複数の発光素子に所定の発光パターンに対応する電気信号を出力する構成としてもよい。例えば、検出結果が所定のイベントが発生したことを示す場合、発光素子を点灯させ、検出結果が所定のイベントが発生していないことを示す場合、発光素子を消灯させる。
【0027】
なお、検出部120と発光部130の処理を合わせて音光変換アルゴリズムともいう。なお、音光変換アルゴリズムは、観測すべきイベント(所定のイベント)が起こったときに光を発光させるアルゴリズムとも言える。
【0028】
例えば、街灯を発光素子として利用し、街灯のポール部分にマイクを埋め込むことができる。例えば、人間が点滅を識別できない速さで発光素子を点滅させる(発光素子の消灯状態を50msよりも短い時間とする)ことで、街灯の周辺の人に気付かれずに光情報を認識装置200に送信することができる。犯罪の兆候を事前に察知することや、犯罪の証拠を保存することを目的とする場合、街灯の周辺にいる犯罪を行おうとするものや犯罪者(以下「犯罪者等」ともいう)に、その後、マイクで収音することやカメラで撮影することを悟られたくないので、このような構成が有効である。逆に、街灯の周辺の人が思わず街灯を見てしまうような、通常の街灯とは明らかに異なる発光パターンで街灯を点滅させることで、光情報を認識装置200に送信するとともに周辺の注目を集めることができる。犯罪の予防や中止を目的とする場合、犯罪者等は、注目されることを避けるため、このような構成が有効である。しかし、実際の環境認識は、センサ情報を用いて行う必要がある。
<認識装置200>
図5は、認識装置200の機能ブロック図を示す。認識装置200は、映像取得部210と、特定部220と、認識部230とを含む。
【0029】
(映像取得部210)
映像取得部210は、nk台の音光変換装置100-(k,m)を一度に捉えることの出来るように遠くに設置した単一または複数のカメラ90-kを用いて、nk台の音光変換装置100-(k,m)に対応する発光素子を撮影し、映像データを取得し(S210)、出力する。前述の通り、k=1,2,…,Kであり、映像取得部210は、K台のカメラ90-kから合計N台の音光変換装置100-(k,m)に対応する発光素子を撮影した映像データを取得する。なお、映像取得部210は、単一または複数のカメラ90-kを含んでもよいし、外部の単一または複数のカメラ90-kが出力する映像データを受信する構成としてもよい。例えば、ドローンなどの飛行体や建物の屋上等に単一または複数のカメラ90-kを設置することができる。
【0030】
(特定部220)
特定部220は、映像データを入力とし、映像データに含まれる合計N台の音光変換装置100-(k,m)に対応する発光素子の光情報に基づいて、所定の発光パターンを発した音光変換装置100-(k,m)を特定し(S220)、特定した音光変換装置100-(k’,m’)に対応するエリアのqk',m'台のセンサ300-(k’,m’,p)にウェイクアップ信号を送信する(S221)。なお、k’は所定の発光パターンを発した発光素子を捉えた映像データに対応するカメラを示す番号であり、m’はk'番目のカメラ90-k’の映像データに映る所定の発光パターンを発した発光素子に対応する音光変換装置を示す番号である。特定した音光変換装置100-(k’,m’)に対応するエリアは、特定した音光変換装置100-(k’,m’)に対応するマイクの周辺である。なお、所定の発光パターンを発する発光素子に対応する音光変換装置100-(k,m)は1台に限らず、所定の発光パターンを発する発光素子に対応する音光変換装置がないときもあれば、2台以上の場合もある。例えば、所定のイベントが発生したときに生じる音の音量が大きい場合には、2台以上の音光変換装置100-(k,m)が特定される場合もある。
【0031】
例えば、建物の屋上等にカメラ90-kが設置されている場合、映像データにおける音光変換装置100-(k,m)に対応する発光素子が映っている領域は変わらないため、特定部220は、その領域の映像データから光情報を取得する。また、例えば、ドローンなどの飛行体にカメラ90-kを設置されている場合、映像データにおける音光変換装置100-(k,m)に対応する発光素子の領域は変化するため、特定部220は、音光変換装置100-(k,m)に対応する発光素子の位置情報と、時刻ごとのカメラ90-kの位置、高度および向き、視野角等を示す情報とを用いて、映像データにおける音光変換装置100-(k,m)に対応する発光素子が映っている領域を時刻ごとに計算により求め、その領域の映像データから光情報を取得する。カメラ90-kの位置、高度および向き、視野角等を示す情報は、例えば、ドローンなどの飛行体のセンサ情報を利用する。
【0032】
特定部220は、取得した光情報が所定の発光パターンと一致するか否かを判定し、一致する場合には、一致した光情報を発した発光素子に対応する音光変換装置100-(k,m)を特定する。
【0033】
例えば、図示しない記憶部に音光変換装置100-(k,m)と、その音光変換装置100-(k,m)に対応するマイクの周辺にあるqk,m台のセンサ300-(k,m,p)とを対応付けて記憶しておく。
【0034】
特定部220は、図示しない記憶部を参照して、特定した音光変換装置100-(k’,m’)に対応するマイクの周辺にあるqk',m'台のセンサ300-(k’,m’,p)を特定し、ウェイクアップ信号を送信する。
【0035】
(センサ300-(k,m,p))
qk',m'台のセンサ300-(k’,m’,p)は、ウェイクアップ信号を受信すると、起動し、対象の情報の収集を開始し、センサ情報x(k’,m’,p)を取得し(S300)、認識装置200に送信する。ここでは、p=1,2,…,qm',k'である。センサ300-(k,m,p)としては、所望の情報を収集し、機械が処理できる信号に置き換える素子や装置が考えられ、例えば、単一のまたは複数のマイク、単一のまたは複数のカメラ、マイクおよびカメラを含むデバイス等である。ウェイクアップ信号受信前のセンサ300-(k,m,p)は、待機状態であり、駆動状態に比べ消費電力を抑えることができる。待機状態のンサ300-(k,m,p)は、センサ情報を認識装置200に送信せず、認識部230における計算リソースを抑えることができる。
【0036】
(認識部230)
認識部230は、qk',m'個のセンサ情報x(k’,m’,p)を受信し、qk',m'個のセンサ情報x(k’,m’,p)に基づいて、イベント検出等の環境を認識するための処理を実行し(S230)、認識結果を出力する。例えば、特許文献1の技術を用いて、認識部230はイベント検出等の環境認識タスクを実行する。
【0037】
<効果>
以上の構成により、広範囲環境認識において、消費電力と計算リソースを抑え、確認するための人的コストを抑えることができる。
【0038】
<変形例>
第一実施形態の
図2では、ある1つの発光素子は何れか1つのカメラで撮影されるが、1つの発光素子が2つ以上のカメラで撮影される構成としてもよい。要は、映像データに映る発光素子の位置が分かればよい。
なお、本実施形態では、カメラ90-kと音光変換装置100-(k,m)とセンサ300-(k,m,p)と表記し、カメラと音光変換装置とセンサとが対応付けられているものとして表現しているが、音光変換装置とその音光変換装置に対応するマイクの周辺にあるセンサとが対応付けられていればよく、カメラとセンサとは必ずしも対応付けられていなくともよい。
【0039】
第一実施形態の
図2では、ある1つのセンサ300-(k,m,p)は1つの音光変換装置100-(k,m)に対応付けられているが、2つ以上の音光変換装置100-(k,m)に対応するエリアの一部が重複しており、その重複部分に1つのセンサ300-(k,m,p)が配置されている場合には、1つのセンサ300-(k,m,p)が2つ以上の音光変換装置100-(k,m)に対応付けられる構成としてもよい。
【0040】
第一実施形態では、所定の発光パターンは、所定のイベントが発生したことを示す発光パターンについてのみ説明しているが、他の情報を示す所定の発光パターンを用いてもよい。例えば、所定のイベントの種類や、所定のイベントが発生した方向や位置を示す発光パターンを、音光変換装置100-(k,m)と認識装置200との間で共有し、音光変換装置100-(k,m)が発光素子を点灯または消灯させ、カメラ90-kを用いて発光素子の映像データを取得することで、光変換装置100-(k,m)は上述の情報を認識装置200に送信することができる。所定のイベントの種類としては、例えば、自動車のクラクションの音やブレーキ音、悲鳴等が考えれる。所定のイベントが発生した方向や位置を示す情報を送信する場合には、周囲の音を収音するためのマイクとして指向性のあるマイクアレイ等を利用することが考えられる。また、ウェイクアップ信号を送信する際には、所定のイベントが発生した方向や位置に対応するセンサ300-(k,m,p)にのみウェイクアップ信号を送信する構成としてもよい。
第一実施形態では、光情報として、点灯または消灯を示す情報の例を示したが、これに限定されるものではなく、例えば、光情報は光強度を示す情報であってもよい。
【0041】
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
【0042】
<プログラム及び記録媒体>
上述の各種の処理は、
図6に示すコンピュータ2000の記録部2020に、上記方法の各ステップを実行させるプログラムを読み込ませ、制御部2010、入力部2030、出力部2040、表示部2050などに動作させることで実施できる。
【0043】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
【0044】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0045】
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
【0046】
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。