特許第6467368号(P6467368)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アクシス アーベーの特許一覧

特許6467368イベントのビデオシーケンスを生成する方法及びシステム、並びにこうしたシステムを備えるカメラ
<>
  • 特許6467368-イベントのビデオシーケンスを生成する方法及びシステム、並びにこうしたシステムを備えるカメラ 図000002
  • 特許6467368-イベントのビデオシーケンスを生成する方法及びシステム、並びにこうしたシステムを備えるカメラ 図000003
  • 特許6467368-イベントのビデオシーケンスを生成する方法及びシステム、並びにこうしたシステムを備えるカメラ 図000004
  • 特許6467368-イベントのビデオシーケンスを生成する方法及びシステム、並びにこうしたシステムを備えるカメラ 図000005
  • 特許6467368-イベントのビデオシーケンスを生成する方法及びシステム、並びにこうしたシステムを備えるカメラ 図000006
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6467368
(24)【登録日】2019年1月18日
(45)【発行日】2019年2月13日
(54)【発明の名称】イベントのビデオシーケンスを生成する方法及びシステム、並びにこうしたシステムを備えるカメラ
(51)【国際特許分類】
   H04N 21/8549 20110101AFI20190204BHJP
   H04N 5/91 20060101ALI20190204BHJP
【FI】
   H04N21/8549
   H04N5/91
【請求項の数】8
【外国語出願】
【全頁数】14
(21)【出願番号】特願2016-40579(P2016-40579)
(22)【出願日】2016年3月3日
(65)【公開番号】特開2016-195385(P2016-195385A)
(43)【公開日】2016年11月17日
【審査請求日】2018年5月16日
(31)【優先権主張番号】15159174.0
(32)【優先日】2015年3月16日
(33)【優先権主張国】EP
【早期審査対象出願】
(73)【特許権者】
【識別番号】502208205
【氏名又は名称】アクシス アーベー
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林特許業務法人
(72)【発明者】
【氏名】エドパルム, ヴィクトル
(72)【発明者】
【氏名】ローゼングレン, ブジャルネ
(72)【発明者】
【氏名】ホルムベルグ, ヨナ
(72)【発明者】
【氏名】ルンドベルグ, ステファン
【審査官】 川中 龍太
(56)【参考文献】
【文献】 米国特許第06011901(US,A)
【文献】 欧州特許出願公開第01879384(EP,A1)
【文献】 国際公開第2014/001381(WO,A2)
【文献】 特開2008−022556(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00 − 21/858
H04N 5/76 − 5/956
H04N 7/18
H04N 5/222− 5/257
H04N 19/00 − 19/98
G11B 27/00 − 27/06
(57)【特許請求の範囲】
【請求項1】
イベントのビデオシーケンスの生成方法であって、前記方法は、
ピクチャグループ内に配列された画像フレームのシーケンスにエンコードされた入力画像フレームを受信することであって、各ピクチャグループが1つのイントラフレーム及びゼロ又はそれ以上の後続するインターフレームを含み、前記画像フレームのシーケンス内の各ピクチャグループがGOP構造を有する、受信すること、
画像フレームのイベント前シーケンス(SEQ1)を、先入先出バッファ(12)に格納することであって、前記イベント前シーケンス(SEQ1)が既定の第1のGOP構造を有する、格納すること、
イベントの通知を受信すること、
前記イベントの通知の受信を受けて、前記イベント前シーケンス(SEQ1)を前記バッファ(12)から読み出すこと、並びに、
画像フレームの前記イベント前シーケンス(SEQ1)と、前記第1のGOP構造とは異なる第2のGOP構造を有するイベント後シーケンス(SEQ2)とを結び付けることによって前記イベントのビデオシーケンスを生成することを含み、
前記第1のGOP構造の第1のGOP長が前記第2のGOP構造の第2のGOP長と異なるという点で、前記第1のGOP構造が前記第2のGOP構造と異なり、各GOP長がそれぞれのピクチャグループに含まれるフレームの数によって規定され、及び、
前記第1のGOP長が既定であり、ユーザ入力により設定され、前記第2のGOP長が動的であることを特徴とする、方法。
【請求項2】
前記第2のGOP長が前記第1のGOP長よりも長い、請求項1に記載の方法。
【請求項3】
前記動的GOP長が、1又は複数の入力画像フレームのために決定される動作レベル、1又は複数の入力画像フレームのノイズレベル、前記入力画像フレームがエンコードされるフレームレート、又は前記画像フレームをエンコードする際に設定されるビットレート限界、のうちの少なくとも1つに基づいて設定される、請求項1に記載の方法。
【請求項4】
イベントビデオシーケンスを生成するシステムであって、前記システムは、
ピクチャグループ内に配列された画像フレームのシーケンスにエンコードされた入力画像フレームを受信するように準備された画像受信機(11)であって、各ピクチャグループが1つのイントラフレーム及びゼロ又はそれ以上の後続するインターフレームを含み、前記画像フレームのシーケンス内の各ピクチャグループがGOP構造を有する、画像受信機(11)、
画像フレームのイベント前シーケンス(SEQ1)を、先入先出ベースで格納するように準備されたバッファ(12)であって、前記イベント前シーケンス(SEQ1)が既定の第1のGOP構造を有する、バッファ(12)、
イベントの通知を受信するように準備されたイベント通知受信機(13)、
イベントの通知の受信を受けて、前記イベント前シーケンス(SEQ1)を前記バッファ(12)から読み出し、画像フレームのイベント後シーケンス(SEQ2)と結び付けるように準備された生成モジュール(14)であって、前記イベント後シーケンス(SEQ2)が前記第1のGOP構造とは異なる第2のGOP構造を有する生成モジュール(14)を含み、
前記第1のGOP構造の第1のGOP長が前記第2のGOP構造の第2のGOP長と異なるという点で、前記第1のGOP構造が前記第2のGOP構造と異なり、各GOP長がそれぞれのピクチャグループに含まれるフレームの数によって規定され、及び、
前記第1のGOP長が既定であり、前記第2のGOP長が動的であり、前記システムがさらに、前記規定のGOP長を設定するためのユーザ入力を受け取るように構成されたユーザ入力モジュール(16)を含むことを特徴とする、システム。
【請求項5】
前記第2のGOP長が前記第1のGOP長よりも長い、請求項4に記載のシステム。
【請求項6】
1又は複数の入力画像フレームのために決定される動作レベル、1又は複数の入力画像フレームのノイズレベル、前記入力画像フレームがエンコードされるフレームレート、又は前記画像フレームをエンコードする際に設定されるビットレート限界、のうちの少なくとも1つに基づいて、前記動的GOP長を設定するように準備されたGOP長モジュール(15)を更に含む、請求項4に記載のシステム。
【請求項7】
請求項4から6の何れか一項に記載のシステム(10)を備えるカメラ。
【請求項8】
コンピュータによって実行されたときに請求項1から3の何れか一項に記載の方法を実行するように適合された命令を含むコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ビデオシーケンスを捕捉する分野に関し、より具体的にはエンコードされた画像フレームのビデオシーケンスを生成することに関する。
【背景技術】
【0002】
ネットワークカメラ監視システムなどのデジタルビデオシステムにおいて、ビデオシーケンスは様々なビデオエンコーディング方法を用いて伝送前に圧縮される。多くのデジタルビデオエンコーディングシステムで、2つの主要なモード(イントラモード及びインターモード)が使用されて、一連のビデオフレームの複数のビデオフレームが圧縮される。イントラモードでは、予測、変換、及びエントロピー符号化を通じて、単一のフレームの所与のチャネル内のピクセルの空間的な冗長性を利用することによって、輝度チャネル及び色度チャネルがエンコードされる。したがって、ピクセルのマクロブロックは、同一フレーム内の、別の同様のマクロブロックに関連してエンコードされ得る。当該エンコードされたフレームはイントラフレームと称され、Iフレームとも称され得る。一方、インターモードは、別々のフレーム間の時間的冗長性を利用し、選択されたピクセルブロックについて1つのフレームから別のフレームへのピクセル内の動きをエンコードすることによって、1又は複数の他のフレームからフレームの各部を予測する、動き補償予測技術に依存する。こうして、ピクセルのマクロブロックは、別の同様のマクロブロックに関連づけられて、過去にデコードされた別のフレーム内でエンコードされ得る。当該エンコードされたフレームはインターフレームと称され、デコードの順において先行するフレームを表し得るPフレーム(前方向予測フレーム)、又は、予測に用いられるフレームの任意の表示順序(display−order)関係を有し得、2つ以上の先行してデコードされたフレームを表し得るBフレーム(両方向予測フレーム)とも称され得る。更に、エンコードされたフレームは、ピクチャグループ(groups of pictures)(GOP)内に配列される。各ピクチャグループはIフレームで始まり、後続するフレームはPフレーム又はBフレームである。ピクチャグループの構造は、GOP構造と呼ばれ得る。GOP構造の中の一側面は、ピクチャグループ内のフレーム数であり、一般的にGOP長と称される。GOP長は、ピクチャグループ内に1つのイントラフレームのみが存在しインターフレームが存在しないことを意味する1から、例えば、ピクチャグループ内に1つのイントラフレームが存在しこれに61,439のインターフレームが後続することを意味する61,440まで変化し得る。一般的に、イントラフレームはインターフレームよりも画像表現においてより多くのビットを要求するので、より長いGOP長を有するモーションビデオは一般的に、より短いGOP長を有するモーションビデオよりも低い出力ビットレートを生み出す。
【0003】
エンコードされたビデオシーケンスを受信する場所で、エンコードされたフレームがデコードされる。ネットワークカメラ監視システムにおける課題は、エンコードされたビデオの送信に利用可能なバンド幅である。このことは、特に多数のカメラを利用したシステムにおいて当てはまる。更に、この課題は、利用可能なバンド幅が小さい場合、例えばビデオシーケンスがモバイルデバイス(例えば、携帯電話、PDA、又はタブレットコンピュータ)に送信される際に特に重要である。画像の格納に関して、例えばカメラに統合されたSDカードに画像を格納する際に、類似の問題が発生する。高画質なビデオ画像という利益と利用可能なバンド幅又は記憶域とを釣り合わせるよう、妥協が必要となる。カメラからの送信ビットレートを低下させるようエンコーディングを制御する幾つかの方法及びシステムが用いられてきた。一般的に、これらの既知の方法及びシステムは、ビットレート制限を適用し、カメラからの出力ビットレートが常にビットレート制限未満であるようにエンコーディングを制御する。この方式によって、システム内のすべてのカメラが、それらのカメラのビデオシーケンスを受信場所(例えば、コントロールセンターなど)へ送信し得るように、利用可能なバンド幅が確実に十分なものになり得る。そのような受信場所では作業員がシステムカメラからのビデオを監視し得、ビデオは後の利用のために録画され得る。しかしビットレート制限は、監視されている現場で何が起こっているかに関係なく、多くの細部を含む画像の大幅な圧縮を必要とし得るので、すべてのカメラにビットレート制限を適用することによって、時として望ましくないほどの低画質につながり得る。近年、出力ビットレートを制御するために、GOP構造を変化させる様々な技法を使用することが提案されてきた。例えば、監視される現場に動作がほとんど又は全くない場合にはより長いGOP長を用いることによって出力ビットレートを減らし、現場に動作がある場合にはGOP長を減少させることによって高いビットレートという代価によってより高画質の画像を可能にするというように、GOP長は変更され得る。
【0004】
ビデオシーケンスの録画は、特に監視や調査のための応用においては、例えば動作検知イベントトリガといった、1又は複数のイベントトリガに基づき得る。こうして、それまで静止していた現場に動作が起こるというようにあるイベントが起こったときに、録画が開始され得る。録画がイベントトリガに基づいている場合、イベント前のビデオシーケンスも録画することが、しばしば有用である。例えば、ある人物が監視される現場の一部を表す関心領域に入ってくることが録画のトリガとなる場合、人物がどのように当該現場の部分に入ってきたかを示すビデオシーケンスも録画することは、興味深いことであり得る。同様に、人物が関心領域の外に出て行った後に何が起こったかを捕捉するようにイベント後のシーケンスも録画することは、一般的に有用である。あるイベントの発生時にイベント前のビデオシーケンスの録画を可能にするために、画像フレームは先入先出バッファ(FIFOバッファとも称される)によって連続的にバッファリングされ得る。イベントが発生した際、当該画像フレームは、イベントの時点で開始されるビデオシーケンスに先立って録画され得るように、バッファから読み出される。次いで、イベントが過ぎた後、既定の時間にわたって、録画は継続され得る。イベント前及びイベント後のシーケンスの時間の長さは、ユーザによって設定され得る。
【0005】
しかし、ビットレートを制御するためにGOP長が変更される場合には、イベント前シーケンスが視覚可能であることを確実にすることはできない。なぜならば、デコーディングはイントラフレームで開始されなければならないからである。もしイベント前のバッファ内の第1の画像がインターフレームである場合、当該バッファに使われているFIFOの原則によって、当該インターフレームが参照する先行フレームは失われてしまっている。イベント前シーケンスに用いられるGOP長及び設定時間に応じて、イベント前のバッファ内にイントラフレームが存在し得るが、ユーザが望むよりもイベントにより近い時点からであり得る。イベント前のバッファ内に、イベントよりも十分に長い前の時点からイントラフレームが存在する見込みは、実際にはユーザがイベント前録画時間として設定したよりも数秒より長くイベント前のバッファ内に格納されるように、既定の安全期間をユーザが設定するイベント前時間に加えることによって、増大し得る。それでも、これによって大きなバッファが必要となり、短いGOP長が使われている場合、バッファは不必要に大きいものとなる。更に、GOP長が長い場合、設定されたイベント前時間の前からバッファ内にイントラフレームが存在することを確実にする、十分な数のフレームのための余地が依然として不足し得る。したがって、イベントのビデオシーケンスを生成する方法を改良する必要が、依然としてあるかどうかが確認されて良い。
【発明の概要】
【0006】
本発明の目的は、様々なGOP長が用いられた場合でも、望ましい長さの時間のイベント前ビデオシーケンスが確実に録画又は表示され得ることを可能にする、イベントのビデオシーケンスの生成方法を提供することである。さらなる目的は、GOP構造が他の態様で変更されても、イベント前シーケンスの録画又は表示を可能にする、イベントのビデオシーケンスの生成方法を提供することである。
【0007】
本発明の更なる目的は、可変のGOP構造、より具体的には可変のGOP長が用いられた場合であっても、望ましい長さの時間のイベント前シーケンスを含むビデオシーケンスの生成を可能にする、イベントのビデオシーケンスの生成システムを提供することである。
【0008】
第1の態様によると、これらの目的は、以下を含むイベントのビデオシーケンスの生成方法を実施することによって、完全に又は少なくとも部分的に達成される。ピクチャグループ内に配列された画像フレームのシーケンスへとエンコードされた、入力画像フレームを受信することであって、各ピクチャグループが、1つのイントラフレームと、後続するゼロ又はそれ以上のインターフレームを含み、画像フレームの前記シーケンス内の各ピクチャグループがGOP構造を有する、受信すること。イベント前の画像フレームのシーケンスを、先入先出バッファ内に格納することであって、前記イベント前シーケンスが、第1の既定のGOP構造を有する、格納すること。前記イベント通知の受信後に、イベントの通知を受信すること。前記イベント前シーケンスを前記バッファから読み出すこと。及び、前記イベント前シーケンスをイベント後の画像フレームのシーケンスと結び付けることによってイベントのビデオシーケンスを生成することであって、前記イベント後シーケンスが、前記第1のGOP構造とは異なる第2のGOP構造を有する、生成すること。この方法によって、望ましい長さの時間の有用なイベント前ビデオシーケンスがイベントのビデオシーケンスに含まれ得ることを確実にする一方、同時に、例えば出力ビットレートの制御のために可変のGOP構造を使用することが可能になる。したがって、既定のGOP構造がイベント前シーケンスのために使用され、一方で別のGOP構造がイベント後シーケンスのために使用される。
【0009】
第1のGOP構造の第1のGOP長が第2のGOP構造の第2のGOP長と異なり、各GOP長はそれぞれのピクチャグループに含まれるフレームの数によって規定されるという点で、第1のGOP構造は第2のGOP構造と異なり得る。
【0010】
第2のGOP長は、前記第1のGOP長より長くて良い。例えば、ユーザは、使用されるGOP長を、ピクチャグループ全体がイベント前のバッファに収まるには長すぎるように設定して良い。そうした場合、より短いGOP長がイベント前シーケンスに使用され得る。
【0011】
第1のGOP長は既定であり得、第2のGOP長は動的であり得る。これは、出力ビットレートが変化するGOP長によって制御されている場合には、有用であり得る。十分な長さの視覚可能なイベント前シーケンスが提供され得ることを確実にするため、イベント前シーケンスには、イベント前のバッファにフィットする、既定の静的なGOP長が使用され得る。
【0012】
当該方法の変形によると、動的GOP長は、1もしくは複数の入力画像フレームのために決定される動作レベル、1もしくは複数の入力画像フレームのノイズレベル、前記入力画像フレームがエンコードされるフレームレート、又は前記画像フレームをエンコードする際のビットレート限界、のうちの少なくとも1つに基づいて設定される。例えば、画像フレーム中に高レベルの動作がある場合には、高画質の画像を提供するためにGOP長は低減され得る。更に、ノイズレベルが高い場合には、誤って高レベルの動作と認識され得、出力ビットレートを低減させるためにGOP長は増大され得る。
【0013】
既定のGOP構造は、ユーザ入力によって設定され得る。
【0014】
第2の態様によると、上記の諸目的は、イベントのビデオシーケンスを生成するシステムであって、以下を含むシステムによって、完全に又は少なくとも部分的に達成される。ピクチャグループ内に配列された画像フレームのシーケンスへとエンコードされた、入力画像フレームを受信するように準備された画像受信機であって、各ピクチャグループが、1つのイントラフレームと、後続するゼロ又はそれ以上のインターフレームを含み、画像フレームの前記シーケンス内の各ピクチャグループがGOP構造を有する、画像受信機。画像フレームのイベント前シーケンスを、先入先出ベースで格納するように準備されたバッファであって、前記イベント前シーケンスが第1の既定のGOP構造を有する、バッファ。イベント通知を受信するように準備されたイベント通知受信機。イベント前シーケンスを前記バッファから読み出し、それをイベントの通知の受信を受けて画像フレームのイベント後シーケンスと結び付けるように準備された生成モジュールであって、前記イベント後シーケンスが、前記第1のGOP構造とは異なる第2のGOP構造を有する、生成モジュール。こうしたシステムによって、望ましい長さの時間のイベント前ビデオシーケンスを含むイベントのビデオシーケンスを生成し、なお可変又は動的なGOP構造を利用することが可能になる。
【0015】
当該システムの一実施形態では、前記第1のGOP構造の第1のGOP長が前記第2のGOP構造の第2のGOP長と異なり、各GOP長はそれぞれのピクチャグループに含まれるフレームの数によって規定されるという点で、第1のGOP構造は第2のGOP構造と異なる。
【0016】
第2のGOP長は、第1のGOP長よりも長くて良い。これによって、長いGDP長がイベント後シーケンスにとって長すぎる場合には、出力ビットレートを低減するため、例えば長いGOP長をイベント前シーケンスに使用することが可能になる。
【0017】
第1のGOP長は既定であり得、前記第2のGOP長は動的であり得る。したがって、第1のGOP長はユーザによってあらかじめプログラム又は設定され得、第2のGOP長は、例えば監視される現場の変化に応じて、変更され得る。
【0018】
一実施形態によると、システムは、1又は複数の入力画像フレームのために決定される動作レベル、1又は複数の入力画像フレームのノイズレベル、前記入力画像フレームがエンコードされるフレームレート、又は前記画像フレームをエンコードする際のビットレート限界、のうちの少なくとも1つに基づいて、前記動的GOP長を設定するように準備されたGOP長モジュールを更に含む。これによって、例えば、ビットレートの節約が可能になり得る。
【0019】
システムは、前記既定のGOP長を設定するためのユーザ入力を受信するように準備された、ユーザ入力モジュールを更に備え得る。それによって、ユーザはイベント前バッファに使用するGOP長を設定し得る。
【0020】
第3の態様によれば、第2の態様によるシステムを備えたカメラによって、上記の諸目的が完全に又は少なくとも部分的に達成される。カメラは、一般的に、システムと同じ方式で実装され得、その利点も付随する。
【0021】
第4の態様によれば、プロセッサによって実行されたときに第1の態様による方法を実行するように適合された命令を含むコンピュータ可読記憶媒体を含む、コンピュータプログラム製品によって、上記の目的が完全に又は少なくとも部分的に達成される。プロセッサは、処理能力を有する任意のタイプのデバイスであり得、例えば、中央処理装置(CPU)、グラフィック処理装置(GPU)、集積回路中に実装されるカスタム仕様の処理デバイス、ASIC、FPGA又はディスクリート素子を含む論理回路であり得る。
【0022】
本明細書で使用される「イベント」という用語は、広く解釈されるべきである。したがって、イベントは、例えば動作検知アルゴリズムといったビデオ分析アルゴリズムによって生成される、又はドアコンタクトもしくはPIRセンサといった外部装置によって生成されるアラームイベントや、カメラシステムによって生成される、エラー通知のようなシステムイベントや、コマンドの入力といったユーザ入力イベントであり得る。
【0023】
本発明の利用可能性の更なる範囲は、以下の詳細な説明から明らかになるであろう。しかし、この詳細な説明よって本発明の範囲内の様々な変更及び修正が当業者に明らかとなるため、詳細な説明及び具体例は、本発明の好適な実施形態を示しながらも例示的な形でのみ提示されることは理解されるべきである。
【0024】
したがって、記載のデバイス及び記載の方法は異なる場合があるため、この発明は、記載のデバイスの特定の構成要素部品又は記載の方法のステップに限定されないことは理解されるべきである。また、本明細書で使用される用語は、特定の実施形態だけを説明することを目的としており、限定的であることを意図していないということも理解されるべきである。明細書及び添付の特許請求の範囲で使用されるように、冠詞(「a」、「an」、「the」、及び「said」)は、文脈によって他のことが明らかに示されない限り、1つ又は複数の要素があることを意味していると意図されることに留意するべきである。それゆえ、例えば、「an object」又は「the object」に対する言及は、幾つかのobjectなどを含み得る。更に、「comprising(備える、含む)」という言葉は、他の要素又はステップを排除しない。
【0025】
ここで、本発明を、実施例を用い且つ添付の概略図を参照しながら、より詳細に説明する。
【図面の簡単な説明】
【0026】
図1】カメラによって監視されている現場の図である。
図2】エンコードされた画像フレームのシーケンスの例である。
図3】イベントのビデオシーケンスの例である。
図4】イベントのビデオシーケンスの生成方法のフロー図である。
図5】イベントのビデオシーケンスの生成システムのブロック図である。
【発明を実施するための形態】
【0027】
図1は、カメラ1によって監視されている現場を示す。この現場には、ドア3を有する建物2がある。この例ではカメラ1は、ドア3の前のエリア、具体的にはドア3付近の人々の動作を監視するのに使用される。
【0028】
カメラ1は現場の画像を捕捉し、捕捉された画像に対してビデオ動作検知アルゴリズムが実施される。カメラ1は、動作検知アルゴリズムからのイベントに基づいて、ビデオを録画するように設定されている。グラフィカルユーザインターフェースを通じて、ユーザは、現場の画像中の、動作検知アルゴリズムが実行される関心領域を規定することができる。例えば、ユーザが、例えば小径5上のようなドア3の前だけの動作のみに関心があるが、茂み4が揺れる動きには関心がないということはあり得る。したがって、ユーザは、ドア3の前の望ましいエリアをカバーする(が茂み4はカバーしない)関心領域を規定し得る。
【0029】
イベント前ビデオシーケンスが録画に含まれることを可能にするために、カメラ1は、以下で図4及び5に関連して更に記載されるFIFOバッファ(図5の12)を有する。動作検知アルゴリズムによって関心領域内に動作があると決定されたとき、イベントが生成される。当該イベントによって、捕捉された画像の録画及び、イベントの時点でバッファ内にある画像の録画が、トリガされる。次いで、録画は、動作検知アルゴリズムがもはや関心領域内の動作を検知しなくなるまで、継続される。人物が関心領域を去った後何が起こったかもユーザに見えるように、イベント後の現場のビデオシーケンスもまた録画するため、動作検知のイベントが関心領域内の動作検知を停止した後、追加時間も録画が継続するように、追加のイベント後録画時間が設定され得る。イベントのビデオシーケンスの録画に加えて(又はその代わりに)、カメラは、イベントのビデオシーケンスを使用場所、例えば安全コントロールセンターに送信し得、安全コントロールセンターでは、イベントのビデオシーケンスは視覚及び/又は録画され得る。
【0030】
イベントのビデオシーケンスは、録画又は送信され得る前には、例えばh.264コーデックといった、ブロックベースのハイブリッドビデオコーデックを使ってエンコードされる。上記のように、画像はIフレーム又はPフレームとしてエンコードされ、GOPとも称されるピクチャグループ内でグルーピングされる。図2は、2つのピクチャグループGOP1及びGOP2内に配置された、エンコードされた画像フレームのシーケンスを示す。第1のピクチャグループGOP1は、Iフレーム101で開始し、その後複数のPフレームが続いている。第1のピクチャグループは、Pフレーム102で終了する。次のフレームはIフレーム103としてエンコードされ、第2のピクチャグループGOP2の始点を形成する。Iフレーム103の後、後続する画像フレームはPフレームとしてエンコードされ、第2のピクチャグループは、Pフレーム104によって終了する。
【0031】
ここで図3を参照すると、どのようにイベントのビデオシーケンスが生成されるかの例が示されている。ここでは、画像フレームはIフレームを表すI及びPフレームを表すPによって示されている。カメラ1は、捕捉された画像フレームをバッファ(図5の参照番号11で示す)内に連続的に格納する。当該バッファはFIFOバッファであり、バッファがフルになった場合、バッファ内の最も古い画像フレームが、最後に捕捉された画像フレームによって上書きされる。イベント前の録画時間が、例えば3秒間のように、ユーザによって設定されている。この3秒間がデコード可能で視覚可能であるためには、当該イベント前ビデオシーケンスはIフレームで開始されなければならない。しかし、この3秒間の第1の画像フレームがPフレームであるということは非常によく起こり得、デコーディングはPフレームからは開始されることができない。なぜならば、Pフレームは、当該Pフレームがエンコードされた際に参照したIフレームなしには、それ自体では、必要なデータ全てを内包していないからである。イベント前の少なくとも3秒間のビデオがあることを保証するため、1つのピクチャグループに相当する、更なる時間がイベント前のバッファに追加される。したがって、イベント前のバッファの実際の長さは、ユーザによって選択されたイベント前時間、並びに現在のフレームレート及びGOP長による。例えば、ユーザによって設定された3秒間というイベント前時間、30fpsというフレームレート、及び128というGOP長によって、イベント前のバッファに格納される合計時間は7.3秒になる。
【0032】
人物が監視された現場に入ると、動作検知アルゴリズムによって関心領域内に動作があると決定され、イベントがトリガされる。当該イベントの通知を受けて、現在イベント前のバッファにある画像フレームが録画され、イベントに際して捕捉が開始された画像フレームの録画が開始される。動作検知アルゴリズムがもはや関心領域内の動作を検知しなくなったとき、録画はユーザに設定されたイベント後録画時間の終了まで、継続される。イベント後録画時間は、例えば5秒間であり得る。
【0033】
ビットレートを制御するためには、録画に動的GOP長を使用することが望ましい。この方法によって、現場に動作がほとんど又は全くない場合には長いGOP長が使用され得る。一般的にPフレームがエンコーディングのために必要とするビット数はIフレームよりも少ないため、それによって、出力ビットレートが低減される。現場に動作がたくさんある場合には、より短いGOP長が使用され得る。これによって出力ビットレートの増大に結び付くが、エンコーディングアーティファクトの低減にもつながる。上記のように、これによって、望ましいイベント前時間のぶんデコードされ視覚され得ることを確実にする、イベント前のバッファ長を決定することが困難になるか、又は不可能にさえなる。ユーザによって設定されたイベント前録画時間が3秒でフレームレートが30fpsである例を再び使用するが、GOP長は増大されて256である。この例では、イベント前バッファは11.3秒ぶんのイベント前ビデオを入れられなければならない。もし以前計算した7.3秒ぶんのビデオだけがイベント前のバッファに格納されるとすると、望ましい3秒間のイベント前録画の開始時点又はそれ以前に、Iフレームが存在しないというリスクが大きい。フレームレートとGOP長とのこの組み合わせでは、ピクチャグループが、ユーザによってイベント前録画時間として設定された3秒よりも長いことは、指摘され得る。
【0034】
本発明によると、これは、バッファに別のGOP構造、(例では別のGOP長)を使用することによって解決する。バッファに、既定のGOP長が使用される場合、バッファの必要な長さは上記のように予測的に計算され得る。図3では、イベント前シーケンスは、参照記号SEQ1によって示される。動作検知イベントがトリガされると、バッファ内に存在するイベント前ビデオシーケンスSEQ1は読み出されて録画され、捕捉された画像フレームの録画が開始される。イベント後シーケンスは、参照記号SEQ2によって示され、イベントの間に捕捉された画像フレーム、即ちイベントの開始からイベントの終了まで、及び設定されたイベント後録画時間の間に捕捉された画像フレームを含む。イベント前シーケンスとは対照的に、イベントに際して開始されるビデオシーケンスでは、図3の各Iフレーム後の様々な数のPフレームによって表されるように、動的GOP長が使用される。ここでは、動的GOP長は、画像フレーム中の動作レベルに基づいて制御される。このような動的GOP長制御は、例えば、本出願人の欧州特許出願第14193291.3に開示されたような、多くの方法によって実施され得、本明細書ではさらに詳細には記載しない。
【0035】
上記の記載はイベントのビデオシーケンスの録画に言及しているが、イベントのビデオシーケンスを生成する同じ原理が、例えばイベントのビデオシーケンスを例えばコントロールセンター内の警備員に対して表示するといった、他の目的にとっても有用であることは、留意され得る。同じ原理はまた、イベントのビデオシーケンスを電子メール又はftp経由で送信するためにも有用である。
【0036】
イベントビデオシーケンスを生成する方法は、本方法の変形のフロー図である図4を参照して、より一般的な条件で記載され得る。入力画像フレームが受信される(ステップS01)。入力画像フレームは、ピクチャグループに配列された画像フレームのシーケンスにエンコードされる。各ピクチャグループは、例えば、使用されるフレームのタイプ(例えばIフレーム及びPフレーム、及び/又はBフレーム)及び、ピクチャグループあたりのフレーム数、即ちGOP長を規定するGOP構造を有する。画像フレームのイベント前シーケンスは、FIFOバッファ内に格納される(ステップS02)。イベント前シーケンスは、第1の既定のGOP構造を有する。イベントの通知又はトリガが受信される(S03)。イベントの通知が受信されると、イベント前シーケンスがバッファから読み出される。(ステップS04)。イベントビデオシーケンスは、画像フレームのイベント前シーケンスとイベント後シーケンスとを結び付けることによって生成される。画像フレームのイベント後シーケンスは、イベントの時点で捕捉を開始され、第1のGOP構造とは異なる第2のGOP構造を有する。第1の及び第2のGOP構造は、例えば異なるGOP長を有するというように、幾つかの点で異なり得る。生成されたイベントビデオシーケンスは、例えば録画、表示又は送信など、様々な方法で使用され得る。当該方法は、コンピュータプログラムを手段として実施され得る。
【0037】
上記の方法によって使用され得るシステムが、ここで図5を参照して記載される。イベントビデオシーケンスを生成するシステム10には、ピクチャグループ内に配列された画像フレームのシーケンスにエンコードされた入力画像フレームを受信するように準備された画像受信機11が含まれる。システム10は、画像フレームのイベント前シーケンスを格納するためのFIFOバッファ12を更に備える。イベント前シーケンスは、第1の既定のGOP構造を有する。さらに、システム10は、イベント通知を受信するように準備されたイベント通知受信機13を有する。システム10はまた、イベント前シーケンスをバッファ12から読み出し、それをイベント通知の受信を受けて画像フレームのイベント後シーケンスと結び付けるように準備された、生成モジュール14を有する。イベント後シーケンスは、第1のGOP構造とは異なる第2のGOP構造を有する。本実施形態では、システム10には、イベント後シーケンス用に動的GOP長を設定するように準備されたGOP長モジュールが含まれる。動的GOP長は、例えば入力画像フレーム内の動作レベルに基づき得る。更に、システム10は、イベント前シーケンス用に既定のGOP長を設定するためのユーザ入力を受信するように準備されたユーザ入力モジュール16を含み得る。ユーザは、例えば、望ましいGOP長をシステム10のグラフィカルユーザインターフェース経由で入力し得る。
【0038】
当業者は、上記の実施形態を様々な方法で変更することができ、その上でなお上記の実施形態に示される本発明の利点を使用することができると理解されるだろう。例として、上記の記載では、インターフレームとしてPフレームだけが使用されていることは留意され得る。しかし、Bフレームを使用することもできる。
【0039】
上記のとおり、イベントビデオシーケンスの生成は、例えば、上記のように、録画、又は表示、又は例えば電子メールもしくはftpによる送信といった、様々な理由のために実施され得る。
【0040】
イベントのビデオシーケンスを生成するためのシステム10は、例えば図1に示す監視カメラ1のように、カメラ内に統合され得る。システム10はまた、カメラとは別個だが操作可能に接続された形でも実装され得る。
【0041】
上記の例の動的GOP長は、動作レベルに基づいている。しかし、イベント後シーケンスのGOP長は、他の技法を使用してもまた変更され得る。GOP長の動的制御は、1又は複数の入力画像フレームのノイズレベル、前記入力画像フレームがエンコードされるフレームレート、又は前記画像フレームをエンコードする際のビットレート限界、に基づき得る。
【0042】
更に、Iフレームは、デコーディングのための新しい開始地点を確実にするために、ネットワーク接続がなくなってから挿入されることが必要とされ得る。
【0043】
更に、又は代替的に、ユーザは、録画に使用されるGOP長を、利用可能なイベント前バッファよりも長すぎるように設定していて良い。このような場合、イベント前シーケンスには、バッファにフィットする、より短いGOP長が使用され得る。一方で、ユーザによって設定されたより長いGOP長は、イベント後シーケンスに使用される。
【0044】
第2のGOP構造は、第1のGOP構造と、単にGOP長が異なるだけでなく、それに代替的又は付加的な態様で異なり得る。単なる例示として、第1のGOP構造はIフレーム、Pフレーム及びBフレームから構成され得、第2のGOP構造はIフレーム及びPフレームのみから構成され得る。
【0045】
GOP構造の変化に加えて、イベント前シーケンスとイベント後シーケンスとでは、エンコーディングに関する他の違いもあり得る。例えば、イベント前シーケンスにはある圧縮値が使用され得、イベント後シーケンスには別の圧縮値が使用され得る。代替的に、イベント前シーケンスには静的圧縮値が使用され得、イベント後シーケンスには動的圧縮値が使用され得る。
【0046】
上記の例では、イベントは、動作検知イベントである。当該方法が、例えば物体追跡アルゴリズム、境界通過検知(cross−line detection)アルゴリズム、道間違い検知アルゴリズム、顔検知アルゴリズム、又はナンバープレート認識アルゴリズムといった、他のビデオ分析アルゴリズムに起因する諸イベントにも同様によく利用され得ることは、理解されるべきである。イベントはまた、例えば、マイクやドアコンタクト、PIRセンサといった外部センサに起因する、この他のアラームイベントのタイプでもあり得る。こうした装置は、カメラ一体型でも、I/Oポート経由でカメラと接続されていても、又は別個でもよい。別個の装置は、例えばイーサネット接続経由で、システム又はカメラに対してイベントの通知を提示し得る。
【0047】
イベントはアラームイベントでなくても良く、システムイベント又はユーザ入力イベントであっても良い。システムイベントはカメラシステムによって生成され得、例えば、ネットワークロス通知といった、エラー通知であり得る。ユーザイベントは、例えば手動による録画開始といった、コマンド入力であり得る。
【0048】
図5に示す実施形態では、システムはただ1つのバッファを有している。しかし、システムはより多くのバッファを備え得、方法はより多くのバッファを使用し得る。例えば、システム及び方法は、1種類以上のイベントによって操作可能であり得、例えば、動作検知に1つのバッファ、顔検知に1つのバッファ、システムイベントに1つのバッファ、及びユーザイベントに1つのバッファというように、こうした各イベントごとに1つのバッファを有し得る。このようにして、利用可能な種類のイベントのそれぞれが、各自のイベントのビデオシーケンスの生成を開始し得る。例えば、第1のイベントのビデオシーケンスの生成は、例えば人物が現場に入ってきたときにコントロールセンターの作業員に対して第1のビデオシーケンスの表示がなされるように、監視される現場の動作検知によって開始され得る。もし当該人物がネットワーク接続を切断するなどカメラに対して手を加える場合、システムイベントが第2のイベントのビデオシーケンスの生成を開始し得、第2のイベントビデオシーケンスはカメラ内に(例えば搭載されているSDカード上に)ローカルに格納され得る。
【0049】
入力画像フレームが生じ得る元であるカメラは、例えば可視光を用いるカメラ、IRカメラ又はサーマルカメラといった、任意の種類のカメラであり得る。カメラは、監視カメラであり得る。
【0050】
入力画像フレームは、一般的には、イントラフレーム及びインターフレームエンコーディング技術を用いてエンコードされる情報の生成が可能な、可視光センサ、サーマルセンサ、TOF(time−of−flight)センサ、又は他のタイプの画像生成センサによって生成され得る。
【0051】
画像フレームをエンコードするのに使用されるエンコーダーは、任意の、ブロックベースのハイブリッドビデオコーデックであり得る。エンコーダーは、イベントのビデオシーケンスの生成システムに統合されていても良く、又は、イベントビデオシーケンス生成システムに操作可能に接続されている、個別の装置もしくはモジュールであっても良い。
【0052】
当該システムは、ソフトウェア、ファームウェアもしくはハードウェア、又はそれらの組み合わせとして実装され得る。
【0053】
したがって、本発明は、図示された実施形態に限定されるべきではなく、添付の特許請求の範囲によってのみ定義されるべきである。
図1
図2
図3
図4
図5