(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024147862
(43)【公開日】2024-10-17
(54)【発明の名称】判定装置、判定方法、及び判定プログラム
(51)【国際特許分類】
G06V 40/20 20220101AFI20241009BHJP
G06T 7/20 20170101ALI20241009BHJP
H04N 7/18 20060101ALI20241009BHJP
B61L 23/00 20060101ALN20241009BHJP
【FI】
G06V40/20
G06T7/20 300A
H04N7/18 D
H04N7/18 K
B61L23/00 Z
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023060541
(22)【出願日】2023-04-04
(71)【出願人】
【識別番号】000005234
【氏名又は名称】富士電機株式会社
(74)【代理人】
【識別番号】110004185
【氏名又は名称】インフォート弁理士法人
(74)【代理人】
【識別番号】100121083
【弁理士】
【氏名又は名称】青木 宏義
(74)【代理人】
【識別番号】100138391
【弁理士】
【氏名又は名称】天田 昌行
(74)【代理人】
【識別番号】100132067
【弁理士】
【氏名又は名称】岡田 喜雅
(74)【代理人】
【識別番号】100157967
【弁理士】
【氏名又は名称】管田 洋明
(72)【発明者】
【氏名】石河 範明
(72)【発明者】
【氏名】野間 拓耶
(72)【発明者】
【氏名】植草 秀明
【テーマコード(参考)】
5C054
5H161
5L096
【Fターム(参考)】
5C054CC02
5C054EA01
5C054EA05
5C054EA07
5C054FC01
5C054FC12
5C054FC13
5C054FC14
5C054FE12
5C054GB01
5C054GB05
5C054HA19
5C054HA31
5H161AA01
5H161MM01
5H161MM15
5H161NN10
5L096CA04
5L096DA03
5L096FA18
5L096FA64
5L096FA66
5L096FA67
5L096FA77
5L096HA02
(57)【要約】
【課題】映像に写っている人物が所定の動作を行ったか否かを容易に判定する。
【解決手段】追跡部は、映像に写っている人物を追跡し、人物を包含する図形を生成する。判定部は、図形の所定方向における長さに関する指標の時間変化に基づいて、人物が所定の動作を行ったか否かを判定する。所定の動作は、腕を振る動作、倒れる動作、又は屈む動作の何れかである。
【選択図】
図1
【特許請求の範囲】
【請求項1】
映像に写っている人物を追跡し、前記人物を包含する図形を生成する追跡部と、
前記図形の所定方向における長さに関する指標の時間変化に基づいて、前記人物が所定の動作を行ったか否かを判定する判定部と、
を備え、
前記所定の動作は、腕を振る動作、倒れる動作、又は屈む動作の何れかであることを特徴とする判定装置。
【請求項2】
前記図形は矩形であり、
前記図形の所定方向における長さは、前記矩形の幅又は高さであることを特徴とする請求項1記載の判定装置。
【請求項3】
前記所定の動作は、前記腕を振る動作であり、
前記判定部は、前記矩形の幅と前記矩形の高さとを用いて前記指標を計算し、前記指標の時間変化の変化量が閾値よりも大きい場合、前記人物が前記腕を振る動作を行ったと判定することを特徴とする請求項2記載の判定装置。
【請求項4】
前記所定の動作は、前記腕を振る動作であり、
前記判定部は、前記矩形の幅と前記矩形の高さとを用いて前記指標を計算し、前記指標の時間変化の周波数に基づいて、前記指標の周波数スペクトルを求め、所定の周波数範囲における前記指標の最大値が閾値よりも大きい場合、前記人物が前記腕を振る動作を行ったと判定することを特徴とする請求項2記載の判定装置。
【請求項5】
前記指標は、前記矩形の高さに対する前記矩形の幅の比率、又は前記矩形の幅に対する前記矩形の高さの比率であることを特徴とする請求項3又は4記載の判定装置。
【請求項6】
前記所定の動作は、前記倒れる動作又は前記屈む動作であり、
前記指標は、前記矩形の高さに対する前記矩形の幅の比率であり、
前記判定部は、前記指標が閾値よりも小さな値から前記閾値よりも大きな値に変化し、かつ、前記指標が前記閾値よりも大きくなっている時間が所定時間よりも長い場合、前記人物が前記倒れる動作又は前記屈む動作を行ったと判定することを特徴とする請求項2記載の判定装置。
【請求項7】
前記所定の動作は、前記倒れる動作又は前記屈む動作であり、
前記指標は、前記矩形の幅に対する前記矩形の高さの比率であり、
前記判定部は、前記指標が閾値よりも大きな値から前記閾値よりも小さな値に変化し、かつ、前記指標が前記閾値よりも小さくなっている時間が所定時間よりも長い場合、前記人物が前記倒れる動作又は前記屈む動作を行ったと判定することを特徴とする請求項2記載の判定装置。
【請求項8】
前記判定部は、第1時刻における前記矩形の代表点の座標と、前記第1時刻よりも後の第2時刻における前記矩形の代表点の座標とに基づいて、前記人物が特定の地点に留まっているか否かを判定することを特徴とする請求項2記載の判定装置。
【請求項9】
映像に写っている人物を追跡し、
前記人物を包含する図形を生成し、
前記図形の所定方向における長さに関する指標の時間変化に基づいて、前記人物が所定の動作を行ったか否かを判定する、
処理をコンピュータが実行し、
前記所定の動作は、腕を振る動作、倒れる動作、又は屈む動作の何れかであることを特徴とする判定方法。
【請求項10】
映像に写っている人物を追跡し、
前記人物を包含する図形を生成し、
前記図形の所定方向における長さに関する指標の時間変化に基づいて、前記人物が所定の動作を行ったか否かを判定する、
処理をコンピュータに実行させ、
前記所定の動作は、腕を振る動作、倒れる動作、又は屈む動作の何れかであることを特徴とする判定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、人物の動作を判定する技術に関する。
【背景技術】
【0002】
駅のホーム等にいる人や人に付随する物等について検出をする技術が知られている(例えば、特許文献1を参照)。鉄道の車両のドアの監視システムも知られている(例えば、特許文献2を参照)。人がドアに挟まれることを防止する技術も知られている(例えば、特許文献3を参照)。異常状態を網羅的に検知する技術も知られている(例えば、特許文献4を参照)。被監視者を監視する技術も知られている(例えば、特許文献5を参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020-138630号公報
【特許文献2】国際公開第2018/180311号
【特許文献3】特開2021-109632号公報
【特許文献4】特開2020-98606号公報
【特許文献5】国際公開第2017/141629号
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1~特許文献3の技術では、撮影された画像に写っている人物の動作を認識する際に、誤認識が発生したり、ハードウェアコスト又は作業負荷が大きくなったりすることがある。
【0005】
1つの側面において、本発明は、映像に写っている人物が所定の動作を行ったか否かを容易に判定することを目的とする。
【課題を解決するための手段】
【0006】
1つの実施形態によれば、判定装置は、追跡部及び判定部を含む。追跡部は、映像に写っている人物を追跡し、人物を包含する図形を生成する。判定部は、図形の所定方向における長さに関する指標の時間変化に基づいて、人物が所定の動作を行ったか否かを判定する。所定の動作は、腕を振る動作、倒れる動作、又は屈む動作の何れかである。
【発明の効果】
【0007】
1つの側面において、映像に写っている人物が所定の動作を行ったか否かを容易に判定することができる。
【図面の簡単な説明】
【0008】
【
図6】両腕を振っている人物の画像を示す図である。
【
図7】片腕を振っている人物の画像を示す図である。
【
図8】人物が腕を振っているときの角度θと矩形の幅及び高さとの関係を示す図である。
【
図9】人物が両腕を振っているときの角度θと指標との関係を示す図である。
【
図10】人物が片腕を振っているときの角度θと指標との関係を示す図である。
【
図11】人物が両腕を振っているときの比率w/hの第1の時間変化を示す図である。
【
図13】人物を包含する矩形の突発的な変化を示す図である。
【
図14】人物が歩いているときの比率w/hの時間変化を示す図である。
【
図15】矩形上に設定されたマーカを示す図である。
【
図16】人物が両腕を振っているときの比率w/hの第2の時間変化を示す図である。
【
図21】人物が倒れる動作又は屈む動作を行ったときの比率w/hの時間変化を示す図である。
【
図22】人物が倒れる動作又は屈む動作を行った後に立ち上がったときの比率w/hの時間変化を示す図である。
【
図24】移動する人物を包含する矩形の位置変化を示す図である。
【
図25】移動する途中で立ち止まる人物を包含する矩形の位置変化を示す図である。
【
図27】情報処理装置のハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下、図面を参照しながら、実施形態を詳細に説明する。
【0010】
鉄道の駅における映像表示システムは、プラットホームに設置された監視システムの映像を、プラットホームに設置された表示装置の画面に表示することができる。運転士、車掌等の乗務員又は駅係員は、映像表示システムを用いて、鉄道の車両に乗り降りする乗降客を監視することができる。また、車両の運転のワンマン化に伴って、監視システムの映像が車両の乗務員室の表示装置へ送信され、運転士が映像を確認することもある。
【0011】
特許文献1の検出システムでは、撮影された画像における複数の分割領域の移動ベクトルが、オプティカルフローによって抽出される。そして、抽出された移動ベクトルを比較することで、発車する列車のドアによる、ホーム上の人等の物体の挟み込みの有無、又はホームから線路内への人等の転落等が検出される。
【0012】
しかしながら、オプティカルフローを用いる検出方法では、天候、影等による外乱が動きとして誤認識されることがある。
【0013】
特許文献2の監視システムでは、予め撮影された、車両ドアに何も挟み込んでいない正常な状態の静止画(基準画像)と、車両ドアの閉扉後に所定の取得時間で最初に取得した静止画(観測画像)との差分比較が行われる。差分がある場合は、一定時間経過後に取得した静止画(観測画像)と基準画像との差分比較が行われ、差分領域を囲む四角形の中心点の動きから、挟み込みが発生しているか否かが検出される。
【0014】
しかしながら、様々な種類の車両が走行している路線の場合、車両形式を認識して、適切な基準画像を選択する必要がある。また、車両の停止位置のずれ、天候、影等による外乱が差分として誤認識されることがある。
【0015】
特許文献3の技術では、鉄道車両のドア毎に設置されたカメラでドア周囲に存在する人が撮影され、ニューラルネットワークを用いて人が認識される。そして、ドアから人までの距離と、人の移動速度とから、人がドアに挟まれ得る状態にあるか否かが予測され、人がドアに挟まれ得る状態にあると予測された場合は、ドアの閉動作が制御される。
【0016】
しかしながら、車両のすべてのドアにカメラを設置する必要があるため、ハードウェアコストが増大するとともに、既存の車両にカメラを設置する場合は、車両の改造が必要となる。また、認識した人の移動速度が変化した場合、ドアに挟まれ得るか否かを正しく予測することが難しくなる。さらに、ニューラルネットワークの機械学習を行う際に、学習用画像に写っているすべての人をアノテーションする必要があるため、作業負荷が大きくなる。
【0017】
図1は、実施形態の判定装置の機能的構成例を示している。
図1の判定装置101は、追跡部111及び判定部112を含む。
【0018】
図2は、
図1の判定装置101が行う判定処理の例を示すフローチャートである。まず、追跡部111は、映像に写っている人物を追跡し(ステップ201)、人物を包含する図形を生成する(ステップ202)。次に、判定部112は、図形の所定方向における長さに関する指標の時間変化に基づいて、人物が所定の動作を行ったか否かを判定する(ステップ203)。所定の動作は、腕を振る動作、倒れる動作、又は屈む動作の何れかである。
【0019】
図1の判定装置101によれば、映像に写っている人物が所定の動作を行ったか否かを容易に判定することができる。
【0020】
図3は、
図1の判定装置101を含む認識システムの構成例を示している。
図3の認識システムは、撮像装置311及び認識装置312を含む。認識装置312は、
図1の判定装置101に対応する。
【0021】
撮像装置311は、例えば、監視カメラである。撮像装置311は、監視領域321の映像を撮影して、認識装置312へ送信する。
【0022】
例えば、鉄道の駅において車両に乗り降りする乗降客を監視する場合、監視領域321は、プラットホーム及び線路を含む領域である。監視領域321は、駅構内の通路であってもよい。監視領域321は、鉄道の駅に限られるわけではなく、道路、歩道、工場内の作業室、店舗内の通路、オフィス等であってもよい。
【0023】
認識装置312は、撮像装置311から映像を受信し、受信した映像を解析することで、映像に写っている監視対象の人物331-i(i=1,2)を認識する。認識装置312は、認識された人物331-iの動作を判定し、人物331-iが所定の動作を行ったと判定された場合、その旨を管理者に通知する。
【0024】
所定の動作は、例えば、腕を振る動作、倒れる動作、又は屈む動作である。監視領域321が鉄道の駅である場合、管理者は、車両の乗務員、駅係員等であり、腕を振る動作は、乗降客がプラットホームから転落したこと等を管理者に知らせる合図である。
【0025】
図4は、
図3の認識装置312の機能的構成例を示している。
図4の認識装置312は、取得部411、解析部412、判定部413、通知部414、及び記憶部415を含む。解析部412及び判定部413は、
図1の追跡部111及び判定部112にそれぞれ対応する。
【0026】
取得部411は、撮像装置311から送信される映像421を取得して、記憶部415に格納する。映像421は、時系列の複数の画像を含む。各時刻における画像はフレームと呼ばれることもある。
【0027】
解析部412は、映像421を解析することで、映像421に含まれる各時刻の画像に写っている人物331-iを認識し、複数の時刻それぞれの画像に写っている同じ人物331-iを追跡する。そして、解析部412は、各時刻の画像に写っている人物331-iを包含する矩形を生成し、生成された矩形を示す矩形情報422を記憶部415に格納する。
【0028】
矩形情報422は、矩形の幅及び高さを含む。人物331-iを包含する矩形は、人物を包含する図形に対応する。
【0029】
図5は、映像421に含まれる画像の例を示している。矩形情報422は、矩形501-1及び矩形501-2の情報を含む。矩形501-1は、人物331-1を包含する矩形であり、矩形501-2は、人物331-2を包含する矩形である。矩形501-1の幅w1及び高さh1は、人物331-1を包含する図形の所定方向における長さに対応する。矩形501-2の幅w2及び高さh2は、人物331-2を包含する図形の所定方向における長さに対応する。
【0030】
判定部413は、矩形情報422が示す矩形501-iの幅wi及び高さhiを用いて、矩形501-iに関する指標を計算する。そして、判定部413は、計算された指標の時間変化に基づいて、人物331-iが所定の動作を行ったか否かを判定する。矩形501-iに関する指標としては、例えば、幅wiに対する高さhiの比率、又は高さhiに対する幅wiの比率が用いられる。
【0031】
図6は、撮像装置311に向かって両腕を振っている人物331-1の画像の例を示している。w(t)は、時刻tの画像において人物331-1を包含する矩形の幅を表し、h(t)は、その矩形の高さを表す。
【0032】
図6(a)は、時刻t1における画像の例を示している。人物331-1を包含する矩形601は、幅w(t1)及び高さh(t1)を有する。
【0033】
図6(b)は、時刻t2における画像の例を示している。人物331-1を包含する矩形602は、幅w(t2)及び高さh(t2)を有する。角度θは、水平線と人物331-1の腕とが成す角度を表す。
【0034】
人物331-1が両腕を振ることで、
図6(a)の状態と
図6(b)の状態とが交互に繰り返される場合、角度θの時間変化に伴って、人物331-1を包含する矩形の幅及び高さが周期的に変動する。
【0035】
図7は、撮像装置311に向かって片腕を振っている人物331-1の画像の例を示している。
図7(a)は、時刻t1における画像の例を示している。人物331-1を包含する矩形701は、幅w(t1)及び高さh(t1)を有する。
【0036】
図7(b)は、時刻t2における画像の例を示している。人物331-1を包含する矩形702は、幅w(t2)及び高さh(t2)を有する。角度θは、水平線と人物331-1の腕とが成す角度を表す。
【0037】
人物331-1が片腕を振ることで、
図7(a)の状態と
図7(b)の状態とが交互に繰り返される場合、角度θの時間変化に伴って、人物331-1を包含する矩形の幅及び高さが周期的に変動する。
【0038】
図8は、人物331-1が腕を振っているときの角度θと矩形の幅及び高さとの関係の例を示している。
図8(a)は、人物331-1が両腕を振っているときの角度θと矩形の幅及び高さとの関係の例を示している。横軸は、
図6(b)の角度θを表し、縦軸は、幅w及び高さhを表す。角度θの単位は度であり、幅w及び高さhの単位はピクセル(画素数)である。
【0039】
曲線801は、幅wの変化を示している。幅wは、角度θが0度のときに最大となり、角度θが90度のときに最小となる。曲線802は、高さhの変化を示している。高さhは、両腕が頭よりも低い位置にあるときは一定であり、両腕が頭よりも高い位置にあるときは、角度θが大きくなるほど大きくなる。
【0040】
図8(b)は、人物331-1が片腕を振っているときの角度θと矩形の幅及び高さとの関係の例を示している。横軸は、
図7(b)の角度θを表し、縦軸は、幅w及び高さhを表す。
【0041】
曲線811は、幅wの変化を示している。幅wは、角度θが0度のときに最大となり、角度θが90度のときに最小となる。曲線812は、高さhの変化を示している。高さhは、腕が頭よりも低い位置にあるときは一定であり、腕が頭よりも高い位置にあるときは、角度θが大きくなるほど大きくなる。
【0042】
角度θが0度から90度まで増加する間の幅wの変化量は、片腕を振る場合よりも両腕を振る場合の方が大きくなる。
【0043】
同一人物331-1であっても、撮像装置311から人物331-1までの距離によって、画像内の矩形の大きさが変動するため、幅wに対する高さhの比率h/w、又は高さhに対する幅wの比率w/hが、矩形に関する指標として用いられる。
【0044】
図9は、人物331-1が両腕を振っているときの角度θと指標との関係の例を示している。
図9(a)は、角度θと比率h/wとの関係の例を示している。横軸は、
図6(b)の角度θを表し、縦軸は、比率h/wを表す。曲線901は、比率h/wの変化を示している。比率h/wは、角度θが0度のときに最小となり、角度θが90度のときに最大となる。
【0045】
図9(b)は、角度θと比率w/hとの関係の例を示している。横軸は、
図6(b)の角度θを表し、縦軸は、比率w/hを表す。曲線902は、比率w/hの変化を示している。比率w/hは、角度θが0度のときに最大となり、角度θが90度のときに最小となる。
【0046】
図10は、人物331-1が片腕を振っているときの角度θと指標との関係の例を示している。
図10(a)は、角度θと比率h/wとの関係の例を示している。横軸は、
図7(b)の角度θを表し、縦軸は、比率h/wを表す。曲線1001は、比率h/wの変化を示している。比率h/wは、角度θが0度のときに最小となり、角度θが90度のときに最大となる。
【0047】
図10(b)は、角度θと比率w/hとの関係の例を示している。横軸は、
図7(b)の角度θを表し、縦軸は、比率w/hを表す。曲線1002は、比率w/hの変化を示している。比率w/hは、角度θが0度のときに最大となり、角度θが90度のときに最小となる。
図10(b)における比率w/hの最大値は、
図9(b)における比率w/hの最大値よりも小さい。
【0048】
判定部413は、所定の監視時間における指標の時間変化の変化量を計算し、計算された変化量が閾値よりも大きい場合、人物331-1が撮像装置311に向かって両腕又は片腕を振る動作を行ったと判定する。
【0049】
図11は、人物331-1が両腕を振っているときの比率w/hの第1の時間変化の例を示している。横軸は、時間(秒)を表し、縦軸は、比率w/hを表す。この例では、角度θが60度から90度までの範囲で変化し、角度θの変化の周波数は1Hzである。したがって、比率w/hは、周波数1Hzで周期的に変動する。人物331-1が片腕を振っているときの比率w/hの時間変化も、
図11と同様である。
【0050】
判定部413は、指標の変化量として、監視時間TCの間における比率w/hの最大値と最小値との差分Δを計算し、差分Δを閾値TH1と比較する。差分ΔがTH1よりも大きい場合、判定部413は、人物331-1が撮像装置311に向かって両腕又は片腕を振る動作を行ったと判定する。差分ΔがTH1以下である場合、判定部413は、人物331-1が両腕又は片腕を振る動作を行っていないと判定する。
【0051】
人物331-1が両腕又は片腕を振っているときの比率h/wの時間変化も、
図11と同様である。比率w/hの代わりに比率h/wを用いた場合、判定部413は、指標の変化量として、監視時間TCの間における比率h/wの最大値と最小値との差分を計算し、差分を閾値TH2と比較する。
【0052】
差分がTH2よりも大きい場合、判定部413は、人物331-1が撮像装置311に向かって両腕又は片腕を振る動作を行ったと判定する。差分がTH2以下である場合、判定部413は、人物331-1が両腕又は片腕を振る動作を行っていないと判定する。
【0053】
人物331-iが両腕又は片腕を振る動作を行ったと判定された場合、通知部414は、映像、音声等によって、監視領域321内の人物が腕を振っていることを管理者に通知する。
【0054】
図3の認識システムによれば、鉄道の車両のドアにカメラを設置する必要がなく、ニューラルネットワークの学習用画像に写っているすべての人をアノテーションする必要もない。したがって、ハードウェアコスト及び作業負荷を抑えて、映像に写っている人物が腕を振る動作を行ったか否かを容易に判定することができる。
【0055】
図12は、
図4の認識装置312が行う第1の認識処理の例を示すフローチャートである。まず、取得部411は、撮像装置311から送信される映像421を取得する(ステップ1201)。
【0056】
次に、解析部412は、映像421を解析することで、映像421に含まれる各時刻の画像に写っている人物を認識し、複数の時刻それぞれの画像に写っている同じ人物を追跡する(ステップ1202)。そして、解析部412は、各時刻の画像に写っている人物を包含する矩形を生成し、生成された矩形を示す矩形情報422を生成する(ステップ1203)。
【0057】
次に、判定部413は、矩形情報422が示す各矩形の幅w及び高さhを用いて、比率w/h又は比率h/wを計算する(ステップ1204)。そして、判定部413は、監視時間の間における比率の最大値と最小値との差分を計算し(ステップ1205)、差分を閾値と比較する(ステップ1206)。ステップ1206において、比率w/hに対しては閾値TH1が用いられ、比率h/wに対しては閾値TH2が用いられる。
【0058】
差分が閾値よりも大きい場合(ステップ1206,YES)、判定部413は、人物が腕を振る動作を行ったと判定する(ステップ1207)。そして、通知部414は、監視領域321内の人物が腕を振っていることを管理者に通知する(ステップ1208)。
【0059】
差分が閾値以下である場合(ステップ1206,NO)、判定部413は、人物が腕を振る動作を行っていないと判定する(ステップ1209)。
【0060】
ところで、映像421を解析する処理において、追跡中の人物331-1を見失ったり、人物331-1の身体の一部のみを包含する矩形が生成されたりすることがある。
【0061】
図13は、追跡中の人物331-1を包含する矩形の突発的な変化の例を示している。
図13(a)は、正常な矩形の例を示している。矩形1301は、人物331-1の全身を包含しており、矩形1301の幅w及び高さhは、人物331-1の正しい幅及び高さを表している。
【0062】
図13(b)は、誤った矩形の例を示している。矩形1302は、
図13(a)の画像の次の時刻における画像から生成された矩形である。矩形1302は、人物331-1の上半身のみを包含している。このため、矩形1302の幅wは、人物331-1の正しい幅を表しているが、矩形1302の高さhは、人物331-1の正しい高さを表していない。
【0063】
矩形1302のような誤った矩形が生成された場合、比率w/h又は比率h/wが大幅に変動するため、人物331-1が腕を振っていないのに、腕を振る動作を行ったと判定される可能性がある。
【0064】
図14は、人物331-1が歩いているときの比率w/hの時間変化の例を示している。横軸は、時間(秒)を表し、縦軸は、比率w/hを表す。監視時間TCの間における比率w/hの最大値は、人物331-1を包含する矩形の高さhが突発的に小さくなった時刻に対応している。
【0065】
この場合、監視時間TCの間における比率w/hの最大値と最小値との差分Δが閾値TH1よりも大きいため、誤って、人物331-1が撮像装置311に向かって腕を振る動作を行ったと判定される。
【0066】
そこで、判定部413は、人物331-1を包含する矩形上に1つ又は複数のマーカを設定し、各マーカの移動量に基づいて、矩形が正しいか否かを判定し、誤った矩形を差分Δの計算対象から除外する。例えば、時刻kにおける画像内のマーカと、次の時刻k+1における画像内の同じマーカとの距離が、所定値よりも大きい場合、時刻k+1における画像から生成された矩形は、誤った矩形であると判定される。
【0067】
図15は、矩形上に設定されたマーカの例を示している。
図15(a)は、時刻kにおける画像から生成された矩形1501上に設定されたマーカの例を示している。矩形1501は、幅w及び高さhを有する。
【0068】
マーカm1は、矩形1501の上辺の中点に設定されており、マーカm2は、矩形1501の底辺の中点に設定されている。領域1502-1は、マーカm1を中心とする直径wの円であり、領域1502-2は、マーカm2を中心とする直径wの円である。
【0069】
図15(b)は、時刻k+1における画像から生成された矩形1503上に設定されたマーカの例を示している。この場合、マーカm1は、領域1502-1の内側に留まっているが、マーカm2は、領域1502-2の外側に移動している。このため、矩形1503は、誤った矩形であると判定され、差分Δの計算対象から除外される。
【0070】
このように、人物331-1の追跡中に突発的に生成された誤った矩形を計算対象から除外することで、腕を振っていない人物331-1が腕を振る動作を行ったと誤判定される可能性が減少する。
【0071】
映像421を解析する処理において、人物331-1を包含する矩形の幅及び高さが不規則に変動することもある。矩形の幅及び高さが不規則に変動した場合、比率w/h又は比率h/wも不規則に変動するため、人物331-1が腕を振っていないのに、腕を振る動作を行ったと判定される可能性がある。
【0072】
そこで、判定部413は、指標の時間変化の周波数を解析し、解析結果に基づいて、人物331-1が腕を振る動作を行ったか否かを判定してもよい。この場合、判定部413は、指標の時間変化の周波数を解析することで、指標の周波数スペクトルを求め、所定の周波数範囲における指標の最大値が閾値よりも大きい場合、人物331-1が腕を振る動作を行ったと判定する。
【0073】
所定の周波数範囲としては、人物331-1が腕を振っているときの角度θの変化の周波数が属する周波数範囲が用いられる。所定の周波数範囲は、例えば、0.2Hzから5Hzまでの範囲の一部又は全部であってもよい。
【0074】
図16は、人物331-1が両腕を振っているときの比率w/hの第2の時間変化の例を示している。
図16(a)は、幅w及び高さhから計算された比率w/hの時間変化の例を示している。横軸は、時間(秒)を表し、縦軸は、比率w/hを表す。
図16(b)は、
図16(a)の時間変化から直流成分を除去した後の比率w/hの時間変化の例を示している。
【0075】
図17は、
図16(b)の時間変化の周波数を解析することで求められた周波数スペクトルの例を示している。横軸は、周波数(Hz)を表し、縦軸は、比率w/hを表す。周波数範囲fCは、所定の周波数範囲の一例である。
【0076】
判定部413は、周波数範囲fCにおける比率w/hの最大値を閾値TH3と比較する。比率w/hの最大値が閾値TH3よりも大きい場合、判定部413は、人物331-1が撮像装置311に向かって腕を振る動作を行ったと判定する。比率w/hの最大値が閾値TH3以下である場合、判定部413は、人物331-1が腕を振る動作を行っていないと判定する。
【0077】
このように、比率w/hの時間変化の周波数を解析することで、矩形の幅w及び高さhが不規則に変動する場合であっても、人物331-1が腕を振る動作を行ったか否かを精度良く判定することができる。比率w/hの代わりに比率h/wを用いた場合も、同様にして、比率h/wの時間変化の周波数を解析することで、人物331-1が腕を振る動作を行ったか否かを判定することができる。
【0078】
図18は、
図4の認識装置312が行う第2の認識処理の例を示すフローチャートである。ステップ1801~ステップ1804の処理は、
図12のステップ1201~ステップ1204の処理と同様である。
【0079】
判定部413は、各矩形の比率w/h又は比率h/wを計算した後、比率の時間変化から直流成分を除去し(ステップ1805)、直流成分が除去された時間変化の周波数を解析することで、周波数スペクトルを求める(ステップ1806)。そして、判定部413は、所定の周波数範囲における比率の最大値を閾値と比較する(ステップ1807)。
【0080】
比率の最大値が閾値よりも大きい場合(ステップ1807,YES)、判定部413は、人物が腕を振る動作を行ったと判定する(ステップ1808)。そして、通知部414は、監視領域321内の人物が腕を振っていることを管理者に通知する(ステップ1809)。
【0081】
比率の最大値が閾値以下である場合(ステップ1807,NO)、判定部413は、人物が腕を振る動作を行っていないと判定する(ステップ1810)。
【0082】
図19は、倒れる人物331-1の画像の例を示している。
図19(a)は、直立している人物331-1の画像の例を示しており、
図19(b)は、倒れている人物331-1の画像の例を示している。
図19(b)の矩形1902における比率w/hは、
図19(a)の矩形1901における比率w/hよりも大きい。
図19(b)の矩形1902における比率h/wは、
図19(a)の矩形1901における比率h/wよりも小さい。
【0083】
図20は、屈む人物331-1の画像の例を示している。
図20(a)は、直立している人物331-1の画像の例を示しており、
図20(b)は、屈んでいる人物331-1の画像の例を示している。
図20(b)の矩形2002における比率w/hは、
図20(a)の矩形2001における比率w/hよりも大きい。
図20(b)の矩形2002における比率h/wは、
図20(a)の矩形2001における比率h/wよりも小さい。
【0084】
図21は、人物331-1が倒れる動作又は屈む動作を行ったときの比率w/hの時間変化の例を示している。横軸は、時間を表し、縦軸は、比率w/hを表す。時刻taにおいて人物331-1が倒れたか又は屈んだ場合、時刻taにおいて、比率w/hが閾値TH4よりも小さな値から閾値TH4よりも大きな値に変化する。
【0085】
そこで、判定部413は、比率w/hがTH4よりも小さな値からTH4よりも大きな値に変化し、かつ、比率w/hがTH4よりも大きくなっている時間が監視時間TMよりも長い場合、人物331-1が倒れる動作又は屈む動作を行ったと判定する。それ以外の場合、判定部413は、人物331-1が倒れる動作又は屈む動作を行っていないと判定する。監視時間TMは、所定時間の一例である。
【0086】
人物331-iが倒れる動作又は屈む動作を行ったと判定された場合、通知部414は、映像、音声等によって、監視領域321内の人物が倒れているか又は屈んでいることを管理者に通知する。
【0087】
図22は、人物331-1が倒れる動作又は屈む動作を行った後に立ち上がったときの比率w/hの時間変化の例を示している。横軸は、時間を表し、縦軸は、比率w/hを表す。時刻taにおいて人物331-1が倒れたか又は屈んだ場合であっても、時刻tbにおいて人物331-1が立ち上がった場合、時刻tbにおいて、比率w/hが閾値TH4よりも大きな値から閾値TH4よりも小さな値に変化する。
【0088】
そこで、比率w/hがTH4よりも大きくなっている時間が監視時間TM以下である場合、判定部413は、人物331-1が倒れる動作又は屈む動作を行っていないと判定する。これにより、一時的に倒れたか又は屈んだ後に自力で立ち上がった人物が管理者に通知されなくなるため、管理者の監視負荷が軽減される。
【0089】
図3の認識システムによれば、ハードウェアコスト及び作業負荷を抑えて、映像に写っている人物が倒れる動作又は屈む動作を行ったか否かを容易に判定することができる。
【0090】
比率w/hの代わりに比率h/wを用いた場合も、同様にして、比率h/wの時間変化に基づいて、人物331-1が倒れる動作又は屈む動作を行ったか否かを判定することができる。
【0091】
判定部413は、比率h/wが閾値TH5よりも大きな値から閾値TH5よりも小さな値に変化し、かつ、比率h/wがTH5よりも小さくなっている時間が監視時間TMよりも長い場合、人物331-1が倒れる動作又は屈む動作を行ったと判定する。それ以外の場合、判定部413は、人物331-1が倒れる動作又は屈む動作を行っていないと判定する。
【0092】
図23は、
図4の認識装置312が行う第3の認識処理の例を示すフローチャートである。ステップ2301~ステップ2304の処理は、
図12のステップ1201~ステップ1204の処理と同様である。
【0093】
判定部413は、各矩形の比率w/h又は比率h/wを計算した後、比率の時間変化から、比率が閾値を跨いで変化したか否かをチェックする(ステップ2305)。ステップ2305において、比率w/hが用いられる場合、判定部413は、比率w/hがTH4よりも小さな値からTH4よりも大きな値に変化したか否かをチェックする。比率h/wが用いられる場合、判定部413は、比率h/wが閾値TH5よりも大きな値から閾値TH5よりも小さな値に変化したか否かをチェックする。
【0094】
比率が閾値を跨いで変化した場合(ステップ2305,YES)、判定部413は、変化後の状態が継続している継続時間を監視時間と比較する(ステップ2306)。ステップ2306において、比率w/hが用いられる場合、変化後の状態は、比率w/hがTH4よりも大きくなっている状態であり、比率h/wが用いられる場合、変化後の状態は、比率h/wがTH5よりも小さくなっている状態である。
【0095】
継続時間が監視時間よりも長い場合(ステップ2306,YES)、判定部413は、人物が倒れる動作又は屈む動作を行ったと判定する(ステップ2307)。そして、通知部414は、監視領域321内の人物が倒れているか又は屈んでいることを管理者に通知する(ステップ2308)。
【0096】
比率が閾値を跨いで変化していない場合(ステップ2305,NO)、又は継続時間が監視時間以下である場合(ステップ2306,NO)、判定部413は、人物が倒れる動作又は屈む動作を行っていないと判定する(ステップ2309)。
【0097】
図4の認識装置312は、監視領域321内において、歩行者が特定の地点で立ち止まる行動を検出して、管理者に通知することもできる。
【0098】
図24は、映像421内で左から右へ向かって移動する人物を包含する矩形の位置変化の例を示している。横軸は、画像のx座標を表し、縦軸は、画像のy座標を表す。
【0099】
点2401は、時刻t1における矩形の代表点を表し、点2402は、時刻t2における矩形の代表点を表す。点2403は、時刻t3における矩形の代表点を表し、点2404は、時刻t4における矩形の代表点を表す。時刻tjと時刻t(j+1)との間隔(j=1~3)は、数枚の画像に相当する規定時間であってもよい。
【0100】
各点の周りの破線の円は、その点を中心とする半径rの円を表す。この例では、人物が左から右へ向かって立ち止まることなく移動しているため、円と円が重なっていない。
【0101】
図25は、映像421内で左から右へ向かって移動する途中で立ち止まる人物を包含する矩形の位置変化の例を示している。点2501は、時刻t1における矩形の代表点を表し、点2502は、時刻t2における矩形の代表点を表し、点2503は、時刻t3における矩形の代表点を表す。点2504は、時刻t4における矩形の代表点を表し、点2505は、時刻t5における矩形の代表点を表す。
【0102】
この例では、点2503、点2504、及び点2505それぞれを中心とする3つの円が互いに重なっているため、時刻t3~時刻t5において、人物が特定の地点で立ち止まっていると推定される。
【0103】
図26は、矩形の代表点の例を示している。この例では、人物を包含する矩形2601の中心点2602が代表点として用いられる。矩形2601の代表点は、矩形2601の何れかの頂点、又は矩形2601の何れかの辺上の点であってもよい。
【0104】
判定部413は、規定時間毎に人物を包含する矩形の代表点の座標を求め、代表点を中心とする半径rの円を生成する。そして、判定部413は、時刻tjにおける円と時刻t(j+1)における円とが重なっている否かをチェックする。時刻tjは、第1時刻の一例であり、時刻t(j+1)は、第1時刻よりも後の第2時刻の一例である。
【0105】
何れかの時刻tjにおける円が時刻t(j+1)における円と重なっている場合、判定部413は、人物が特定の地点に留まっていると判定する。何れの時刻tjにおける円も時刻t(j+1)における円と重なっていない場合、判定部413は、人物が特定の地点に留まっていないと判定する。
【0106】
人物が特定の地点に留まっていると判定された回数が規定回数よりも多い場合、通知部414は、映像、音声等によって、監視領域321内の人物が立ち止まっていることを管理者に通知する。これにより、疑わしい行動を取っている人物の存在を管理者に通報することができる。
【0107】
判定部413は、代表点を中心とする円の代わりに、代表点を中心とする矩形等の他の図形を用いてもよい。
【0108】
判定部413は、図形同士の重なりをチェックする代わりに、代表点の移動距離をチェックしてもよい。この場合、判定部413は、時刻tjにおける代表点と時刻t(j+1)における代表点との距離を計算し、計算された距離を閾値と比較する。計算された距離が閾値よりも小さい場合、判定部413は、人物が特定の地点に留まっていると判定する。計算された距離が閾値以上である場合、判定部413は、人物が特定の地点に留まっていないと判定する。
【0109】
監視領域321が鉄道の駅である場合、認識装置312は、人物の動作を判定した結果に基づいて、車両のドアの閉扉制御を行うことも可能である。
【0110】
人物が所定の動作を行ったと判定された場合、通知部414は、ドアを閉めることができない状態であることを示す制御信号を車両の制御装置に送信し、制御装置は、ドアの閉扉を抑止する。人物が所定の動作を行っていないと判定された場合、通知部414は、ドアを閉めることができる状態であることを示す制御信号を車両の制御装置に送信し、制御装置は、ドアの閉扉を許可する。
【0111】
図1の判定装置101の構成は一例に過ぎず、判定装置101の用途又は条件に応じて、一部の構成要素を省略又は変更してもよい。
【0112】
図3の認識システムの構成は一例に過ぎず、認識システムの用途又は条件に応じて、一部の構成要素を省略又は変更してもよい。
【0113】
図4の認識装置312の構成は一例に過ぎず、認識システムの用途又は条件に応じて、一部の構成要素を省略又は変更してもよい。例えば、人物の動作を管理者に通知する必要がない場合は、通知部414を省略することができる。
【0114】
図2、
図12、
図18、及び
図23に示したフローチャートは一例に過ぎず、判定装置101又は認識システムの構成又は条件に応じて、一部の処理を省略又は変更してもよい。例えば、人物の動作を管理者に通知する必要がない場合は、
図12のステップ1208、
図18のステップ1809、及び
図23のステップ2308の処理を省略することができる。
【0115】
図5~
図7、
図13、
図15、
図19、
図20、及び
図26に示した画像は一例に過ぎず、映像421に含まれる画像は、撮影された映像421に応じて変化する。人物を包含する図形として、円、楕円等の他の図形を用いてもよい。
図8に示した角度θと矩形の幅及び高さとの関係は一例に過ぎず、角度θと矩形の幅及び高さとの関係は、人物に応じて変化する。
図9及び
図10に示した角度θと比率との関係は一例に過ぎず、角度θと比率との関係は、人物に応じて変化する。
【0116】
図11、
図14、
図16、
図21、及び
図22に示した比率w/hの時間変化は一例に過ぎず、比率w/hの時間変化は、人物の動作に応じて変化する。
図17に示した周波数スペクトルは一例に過ぎず、周波数スペクトルは、比率w/hの時間変化に応じて変化する。
図24及び
図25に示した矩形の位置変化は一例に過ぎず、矩形の位置変化は、人物の動作に応じて変化する。
【0117】
図27は、
図1の判定装置101及び
図4の認識装置312として用いられる情報処理装置(コンピュータ)のハードウェア構成例を示している。
図27の情報処理装置は、CPU(Central Processing Unit)2701、メモリ2702、入力装置2703、出力装置2704、補助記憶装置2705、媒体駆動装置2706、及びネットワーク接続装置2707を含む。これらの構成要素はハードウェアであり、バス2708により互いに接続されている。
【0118】
図3の撮像装置311は、通信ケーブルを介して、バス2708に接続されていてもよい。
【0119】
メモリ2702は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)等の半導体メモリであり、処理に用いられるプログラム及びデータを記憶する。メモリ2702は、
図4の記憶部415として動作してもよい。
【0120】
CPU2701(プロセッサ)は、例えば、メモリ2702を利用してプログラムを実行することにより、
図1の追跡部111及び判定部112として動作する。CPU2701は、メモリ2702を利用してプログラムを実行することにより、
図4の取得部411、解析部412、判定部413、及び通知部414としても動作する。
【0121】
入力装置2703は、例えば、キーボード、ポインティングデバイス等であり、オペレータ又はユーザからの指示又は情報の入力に用いられる。出力装置2704は、例えば、表示装置、プリンタ、スピーカ等であり、オペレータ又はユーザへの問い合わせ又は指示、及び処理結果の出力に用いられる。
【0122】
補助記憶装置2705は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。補助記憶装置2705は、ハードディスクドライブ又はSSD(Solid State Drive)であってもよい。情報処理装置は、補助記憶装置2705にプログラム及びデータを格納しておき、それらをメモリ2702にロードして使用することができる。補助記憶装置2705は、
図4の記憶部415として動作してもよい。
【0123】
媒体駆動装置2706は、可搬型記録媒体2709を駆動し、その記録内容にアクセスする。可搬型記録媒体2709は、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等である。可搬型記録媒体2709は、CD-ROM(Compact Disk Read Only Memory)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリ等であってもよい。オペレータ又はユーザは、可搬型記録媒体2709にプログラム及びデータを格納しておき、それらをメモリ2702にロードして使用することができる。
【0124】
このように、処理に用いられるプログラム及びデータを格納するコンピュータ読み取り可能な記録媒体は、メモリ2702、補助記憶装置2705、又は可搬型記録媒体2709のような、物理的な(非一時的な)記録媒体である。
【0125】
ネットワーク接続装置2707は、通信ネットワークに接続され、通信に伴うデータ変換を行う通信インタフェース回路である。情報処理装置は、プログラム及びデータを外部の装置からネットワーク接続装置2707を介して受信し、それらをメモリ2702にロードして使用することができる。
【0126】
なお、情報処理装置が
図27のすべての構成要素を含む必要はなく、用途又は条件に応じて一部の構成要素を省略することも可能である。例えば、オペレータ又はユーザとのインタフェースが不要な場合は、入力装置2703及び出力装置2704を省略してもよい。可搬型記録媒体2709又は通信ネットワークを使用しない場合は、媒体駆動装置2706又はネットワーク接続装置2707を省略してもよい。
【0127】
開示の実施形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができるであろう。
【符号の説明】
【0128】
101 判定装置
111 追跡部
112、413 判定部
311 撮像装置
312 認識装置
321 監視領域
331-1、331-2 人物
411 取得部
412 解析部
414 通知部
415 記憶部
421 映像
422 矩形情報
501-1、501-2、601、602、701、702、1301、1302、1501、1503、1901、1902、2001、2002、2601 矩形
801、802、811、812、901、902、1001、1002 曲線
1502-1、1502-2 領域
2401~2404、2501~2505 点
2602 中心点
2701 CPU
2702 メモリ
2703 入力装置
2704 出力装置
2705 補助記憶装置
2706 媒体駆動装置
2707 ネットワーク接続装置
2708 バス
2709 可搬型記録媒体