(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6983837
(24)【登録日】2021年11月26日
(45)【発行日】2021年12月17日
(54)【発明の名称】複数のカメラからのビューを組み合わせる方法及びカメラシステム
(51)【国際特許分類】
H04N 7/18 20060101AFI20211206BHJP
G09G 5/00 20060101ALI20211206BHJP
G09G 5/377 20060101ALI20211206BHJP
G09G 5/36 20060101ALI20211206BHJP
G03B 15/00 20210101ALI20211206BHJP
G03B 37/00 20210101ALI20211206BHJP
【FI】
H04N7/18 V
G09G5/00 550C
G09G5/00 510B
G09G5/00 530M
G09G5/36 520L
G09G5/36 520P
G03B15/00 Q
G03B15/00 H
G03B37/00
【請求項の数】13
【外国語出願】
【全頁数】17
(21)【出願番号】特願2019-131680(P2019-131680)
(22)【出願日】2019年7月17日
(65)【公開番号】特開2020-31421(P2020-31421A)
(43)【公開日】2020年2月27日
【審査請求日】2021年2月18日
(31)【優先権主張番号】18186340.8
(32)【優先日】2018年7月30日
(33)【優先権主張国】EP
【早期審査対象出願】
(73)【特許権者】
【識別番号】502208205
【氏名又は名称】アクシス アーベー
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林特許業務法人
(72)【発明者】
【氏名】ステニング, ヨーアン
(72)【発明者】
【氏名】リンス, ハンプス
(72)【発明者】
【氏名】ユアン, ソン
【審査官】
秦野 孝一郎
(56)【参考文献】
【文献】
特開2017−058843(JP,A)
【文献】
特開2006−229789(JP,A)
【文献】
特開2009−124618(JP,A)
【文献】
特開2009−77092(JP,A)
【文献】
特開2015−138427(JP,A)
【文献】
特開平8−205134(JP,A)
【文献】
特開2001−101421(JP,A)
【文献】
特開2017−96777(JP,A)
【文献】
国際公開第2018/129191(WO,A1)
【文献】
特表2020−507837(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/18
G09G 5/00−5/40
G03B 15/00
G03B 35/00−37/06
(57)【特許請求の範囲】
【請求項1】
あるシーンの重なり合っているカメラビュー(110)のビデオデータをそれぞれが取得するよう配置された2つのイメージセンサ(510)からのビデオデータをつなぎ合わせる方法であって、
2つのイメージセンサ(510)を使用して前記シーンの重なり合っているカメラビュー(110)のビデオデータを取得すること(802)であって、それぞれのイメージセンサ(510)は、三次元座標系内の、該三次元座標系の原点に対する相対位置を有する、ビデオデータを取得すること(802)と、
前記重なり合っているカメラビュー(110)に対応する、カメラビュー内のエリア内のモーションを検出すること(804)と、
前記三次元座標系の前記原点に対応する位置から、検出した前記モーションを含むアクティビティ位置までの距離である、アクティビティ距離(z)を判定すること(806)であって、所定の期間中又は所定のモーションの検出数に対して、重なり合っているイメージデータ内のモーションデータを蓄積することと、続いて、最も多くのモーションを蓄積した位置を前記アクティビティ位置として選択することと、を含む前記アクティビティ距離(z)を判定すること(806)と、
前記三次元座標系内にて、判定した前記アクティビティ距離(z)に対応する、前記三次元座標系の前記原点からの距離を有する位置に、所定の形状の投影面(516)を位置決めすること(808)であって、前記投影面(516)が、前記アクティビティ位置に対応する前記三次元座標系内の位置と交差するように位置決めすること(808)と、
前記投影面(516)上に、前記イメージセンサ(510)のそれぞれからの前記ビデオデータを投影すること(810)と、
投影した前記ビデオデータに対応する二次元ビデオを出力すること(812)と、を含む、方法。
【請求項2】
前記重なり合っているカメラビュー(110)に対応する、カメラビュー内のエリア内のモーションを検出すること(804)は、取得した前記ビデオデータの重なり合っている部位内にて動くピクセルを検出することを含む、請求項1に記載の方法。
【請求項3】
前記重なり合っているカメラビュー(110)におけるピクセルデータから、検出した前記モーションの前記アクティビティ位置を判定し、前記アクティビティ位置を、前記アクティビティ距離(z)の判定に使用することをさらに含む、請求項1又は2に記載の方法。
【請求項4】
前記アクティビティ距離(z)を判定すること(806)は、重なり合っているイメージデータにおける検出した前記モーションの瞬間のインスタンスに基づいており、前記モーションの位置を、前記アクティビティ位置として設定する、請求項1〜3のいずれか一項に記載の方法。
【請求項5】
前記アクティビティ距離(z)を判定すること(806)は、前記アクティビティ位置の、取得した前記ビデオデータにおける位置を、前記イメージセンサ(510)のそれぞれの座標系における位置までの距離を含む所定の表において対応する位置と比較することを含む、請求項1〜4のいずれか一項に記載の方法。
【請求項6】
前記アクティビティ距離(z)を判定すること(806)は、重なり合っているシーンをカバーするレーダー信号を受信することと、レーダー応答を、前記アクティビティ位置に関連付けることと、前記アクティビティ位置までの前記距離を前記レーダー信号から取得することと、を含む、請求項1〜4のいずれか一項に記載の方法。
【請求項7】
前記アクティビティ距離(z)を判定すること(806)は、前記アクティビティ位置の、前記2つのイメージセンサからの取得したイメージにおける位置の差、すなわちx1-x2、を計算することを含む、請求項1〜4のいずれか一項に記載の方法。
【請求項8】
前記投影面(516)は平面である、請求項1〜7のいずれか一項に記載の方法。
【請求項9】
前記投影面(516)は円筒面である、請求項1〜7のいずれか一項に記載の方法。
【請求項10】
前記投影面(516)は球面である、請求項1〜7のいずれか一項に記載の方法。
【請求項11】
イメージセンサ(510)をそれぞれが含む2つのカメラ(502、504)であって、前記イメージセンサ(510)は、三次元座標系内の、該三次元座標系の原点に対する相対位置を有し、あるシーンの重なり合っているカメラビュー(110)のビデオデータを取得するよう構成されている、2つのカメラと、
少なくとも1つの画像処理デバイス(506)と、
前記三次元座標系内に画定される所定の投影面(516)と、
前記2つのカメラ(502、504)の前記重なり合っているカメラビュー(110)に対応する、カメラビュー内のエリア内のモーションを検出するよう構成されているモーションデテクタ(520)と、
所定の期間中、又は所定のモーションの検出数に対して、検出したモーションを蓄積するために、前記モーションデテクタ(520)に接続されたモーションアキュムレータと、
前記三次元座標系の前記原点に対応する位置から、検出した前記モーションを含むアクティビティ位置までの距離であるアクティビティ距離(z)を、蓄積した検出したモーションから判定するよう構成されているプロセッサと、
前記カメラ(502、504)のそれぞれからの前記ビデオデータを前記投影面(516)上に投影するよう構成されているイメージプロジェクタであって、前記投影面(516)は、前記三次元座標系内にて、判定した前記アクティビティ距離(z)に対応する、前記三次元座標系の前記原点からの距離を有する位置に位置決めされ、且つ前記アクティビティ位置に対応する前記三次元座標系内の位置と交差するように位置決めされる、イメージプロジェクタと、
投影した前記ビデオデータに対応する二次元ビデオを出力するよう構成されている出力と、を含む、カメラシステム(500)。
【請求項12】
前記モーションデテクタ(520)は、前記カメラ(502、504)からの前記ビデオデータの重なり合っている部位内にて動くピクセルを検出するよう構成されている、請求項11に記載のカメラシステム(500)。
【請求項13】
前記イメージプロジェクタは、ビデオデータを平らな投影面上に投影するよう構成されている、請求項11又は12に記載のカメラシステム(500)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のカメラからのビデオをつなぎ合わせる方法及びカメラシステムに関する。
【背景技術】
【0002】
いくつかのモニタリングシステムは、エリアの単に狭い部位だけでなく、広大なエリア全体を監視することに向けられている。これは、魚眼レンズなどの広角レンズを使用して達成され得る。しかし、この種のセットアップが提供するビデオは、そのエリアを監視したい人々が求める解像度よりも低い解像度である場合があり、また、高価となりすぎる場合がある。この魚眼レンズ構成の代替構成では、監視するエリアの部位のビデオストリームをそれぞれが取得する2つ以上のカメラが配置され、これらのビデオを単一のビデオストリームに共につなぎ合わせる。
図1は、個々に監視できるエリアより広いエリア105を共に監視する2つのカメラ102及び104の一例を示す。
【0003】
各カメラは個々に、方向106及び108にそれぞれ向けられており、監視するエリアの全体シーン105の部位であるビューを取得する。
図2は、カメラ102からのカメラビューを示す。
図3は、カメラ104からのカメラビューを示す。カメラは、図のように平行に向けられてよい。カメラはまた、それらが共に広いエリア105を表す限り、異なる方向に向けられてよい。カメラが固定して載置されている場合は、カメラ102が取得するビデオが、カメラ104が取得するビデオに完全につながることが好ましい。
【0004】
しかし、2つのカメラと、それらがそれぞれ取得するシーンとの間の、シーンの組み合わせが完全にシームレスとなるような整列は、達成及び維持が本質的に不可能である。したがって、あるエリアをカバーするカメラ102及び104は、そのシーンの取得にあたって重なり合うように配置される。本発明では、重なり合っているシーンは、複数のデジタルビデオカメラ102及び104の1つのデジタルビデオカメラ102が取得するシーンが、別のデジタルビデオカメラ104が取得するシーンの部位を含むという意味であると解釈されるべきである。この重なり110を
図4に示す。この重なり110は、
図2及び
図3の共につなぎ合わせたイメージを示す。これら2つのイメージに共通110である。重なり合うエリア110であるこのシーンのエリアを、破線により示す。ビューイングエリアを拡大するために、このようにして2つのビデオをつなぎ合わせることは一般に行われており、これを達成する多くの方法が既知である。
【0005】
しかし、つなぎ合わせたビデオを表す、
図4のつなぎ合わせたイメージには問題がある。2つのイメージが、前景内の道路に対して整列されると、背景内の住宅が、異なる位置に溶け込む。カメラ102が取得する住宅は、112として示す住宅であり、カメラ104が取得する住宅は、114として示す住宅である。住宅が異なる位置にある理由は、2つのカメラ102及び104が、互いに距離dだけ離れて配置されているからである。2つのカメラの間の距離dにより、2つのカメラは、同じポイントからのシーンを取得せず、これによる結果として、イメージに視差が生じる。重ねたイメージにおける視差により、2つの異なるビューイングポイントから見るように、1つのオブジェクトが明白に転移することとなる。
【0006】
これを解消する1つの方法は、カメラをセットアップし、システムに、重なり合うエリア内の特徴を識別させることである。これらの特徴から、調整マトリクスを続いて計算する。調整マトリクスは、重なり合っているイメージデータに適用すると、ビデオのフレーム内のそれぞれのピクセルを個々に調整することにより、ビデオ内のすべての視差問題を補償し、これを実質的に取り除く。しかし、そのようなアプローチには欠点がある。調整マトリクスの生成に必要な計算により、演算が過度に集中し、したがって、ネットワークカメラ、ネットワーク化されたビデオエンコーディングデバイス、又は、複数のカメラに接続され、これらのカメラからのビデオを処理する、ネットワーク化されたビデオ処理デバイスなど、処理パワーが限られたシステム上での実行は現実的でない。さらに、カメラは厳しい天候条件にさらされており、また、カメラ周囲のエリアでのアクティビティからの影響により、カメラのその通常の日々の運用中に、方向が微妙にずれる場合がある。カメラにおいてその方向が微妙にずれると、調整マトリクスを新たに計算する必要がある。
【発明の概要】
【0007】
本発明の目的は、要求処理パワーが低いながらも、許容可能な、重なり合うエリアのビデオを供給することができる、つなぎ合わせの方法を達成することである。
【0008】
この目的は、請求項1に記載の、2つのイメージセンサからのビデオデータをつなぎ合わせる方法と、請求項12に記載のカメラシステムと、により達成される。本発明のさらなる実施形態を、従属請求項に提示する。
【0009】
特に、本発明の実施形態によると、重なり合っているカメラビューのビデオデータをそれぞれが取得するよう配置された2つのイメージセンサからのビデオデータをつなぎ合わせる方法は、重なり合っているカメラビューに対応する、カメラビュー内のエリア内のモーションを検出することと、2つのイメージセンサの場所での位置から、検出したモーションを含むアクティビティまでの距離であるアクティビティ距離を判定することと、三次元座標系内にて、判定したアクティビティ距離に対応する、イメージセンサの場所での位置と、予め画定された投影面上への、アクティビティの投影の位置との間の距離を有する位置に、その予め画定された投影面を位置決めすることと、アクティビティ距離に位置している、予め画定された投影面上に、イメージセンサのそれぞれからのビデオデータを投影することと、投影に対応する二次元ビデオを投影面上に出力することと、を含む。
【0010】
2つのセンサからのビデオデータを、三次元座標系内にて、検出したアクティビティまでの距離に対応する、カメラからの距離に位置する投影面上に投影することの1つの利点は、限られた処理リソースを使用しながらも、つなぎ合わせたビデオの良好な閲覧体験が可能となり得ることである。処理パワーは、投影面の使用により、低レベルに維持でき、続いて、オペレータ又はビデオの閲覧者が注視する領域である、モーションの領域内の視差効果を選択的に防ぐことによっての、ビデオ体験における調整により、ビデオの体験品質が向上する。
【0011】
他の実施形態では、重なり合っているカメラビューに対応する、カメラビュー内のエリア内のモーションを検出することは、取得したビデオの重なり合っている部位内にて動くピクセルを検出することを含む。この特徴の1つの利点は、モーションの検出が、ビデオ処理デバイス内にて達成され得、ビデオ内で動く特徴の位置決めを促進できることである。
【0012】
さらなる実施形態では、この方法は、重なり合っているカメラビューにおけるピクセルデータから、検出したモーションのアクティビティ位置を判定し、このアクティビティ位置を、アクティビティ距離を判定することに使用することをさらに含んでよい。
【0013】
他のさらなる実施形態では、アクティビティ位置を判定することは、重なり合っているイメージデータにおける検出したモーションの瞬間のインスタンスに基づいており、モーションの位置を、アクティビティ位置として設定する。この利点は、モーションを含むシーンの対象のエリアが、カメラからの異なる距離に生じ、そのシーンに対する閲覧体験が改善され得ることである。特に、シーン内の移動する特徴又はオブジェクトまでの距離のばらつきが、高頻度でばらつく傾向にある場合、が挙げられる。
【0014】
他のさらなる実施形態では、アクティビティ位置を判定することは、モーションデータを重なり合っているイメージデータ内に所定の期間中に蓄積することと、続いて、この期間中に最も多くのモーションを蓄積した位置をアクティビティ位置として選択することと、を含む。このようにして、移動する特徴又はオブジェクトまでの距離が、非常に安定したベース距離からばらつく傾向にあるシーンに対する閲覧体験が、改善され得る。
【0015】
さらに、アクティビティ距離を判定することを含むいくつか実施形態は、取得したビデオデータにおけるアクティビティ位置の位置を、イメージセンサのそれぞれの座標系における位置までの距離を含む所定の表において対応する位置と比較することを含む。これは、改善された閲覧体験を提供するために必要な処理パワーをさらにもっと減らし得る。
【0016】
他のさらなる実施形態では、アクティビティ距離を判定することは、重なり合っているシーンをカバーするレーダー信号を受信することと、レーダー応答を、アクティビティ位置に関連付けることと、アクティビティ位置までの距離をレーダー信号から取得することと、を含む。
【0017】
さらに、いくつか実施形態では、アクティビティ距離を判定することは、2つのセンサからの取得したイメージ内のアクティビティ位置の位置における差異、すなわちx
1-x
2、を計算することを含む。
【0018】
いくつか実施形態では、投影面は平面であってよい。他の実施形態では、投影面は円筒面であってよい。さらに他の実施形態では、投影面は球面であってよい。
【0019】
本発明の別の態様によると、カメラシステムは、イメージセンサをそれぞれが含む2つのカメラと、少なくとも1つの画像処理デバイスと、三次元座標系内に画定される所定の投影面と、2つのカメラの重なり合っているカメラビュー内のモーションを識別するよう構成されているモーションデテクタと、2つのイメージセンサの場所での位置から、これらのカメラの重なり合っているカメラビュー内の、2つのカメラからのビデオデータ内にて検出したモーションであるアクティビティまでの距離であるアクティビティ距離を判定するよう構成されているアクティビティ距離判定モジュールと、カメラを使用して取得したビデオデータを、三次元座標系内にて、判定したアクティビティ距離に対応する、イメージセンサの場所での位置と、投影面上への、アクティビティの投影の位置との間の距離を有する位置に位置する投影面上に投影するよう構成されているイメージプロジェクタと、イメージプロジェクタにより作られたビデオデータを、2つのカメラからのつなぎ合わせたビデオとして供給するよう構成されている出力と、を含む。
【0020】
2つのセンサからのビデオデータを、三次元座標系内にて、検出したアクティビティまでの距離に対応する、カメラからの距離に位置する投影面上に投影するイメージプロジェクタを有することの1つの利点は、限られた処理リソースを使用しながらも、つなぎ合わせたビデオの良好な閲覧体験が可能となり得ることである。さらに、処理パワーは、投影面の使用により、低レベルに維持でき、続いて、オペレータ又はビデオの閲覧者が注視する領域である、モーションの領域内の視差効果を選択的に防ぐことによっての、ビデオ体験における調整により、ビデオの体験品質が向上する。
【0021】
他の実施形態では、モーションデテクタは、カメラからのビデオデータの重なり合っている部位内にて動くピクセルを検出するよう構成されている。この特徴の1つの利点は、モーションの検出が、ビデオ処理デバイス内にて達成され得、ビデオ内で動く特徴の位置決めを促進できることである。
【0022】
他のさらなる実施形態では、カメラは、検出したモーションを所定の期間中に蓄積するために、モーションデテクタに接続されたモーションアキュムレータをさらに含んでよく、アクティビティ距離判定モジュールは、蓄積した、検出したモーションからのアクティビティ距離を判定するよう構成されている。モーションアキュムレータにより、移動する特徴又はオブジェクトまでの距離が、非常に安定したベース距離からばらつく傾向にあるシーンに対する閲覧体験が、改善され得る。
【0023】
さらに、イメージプロジェクタは、ビデオデータを平らな投影面上に投影するよう構成されてよい。
【0024】
本発明の適用性のさらなる範囲が、以下の詳細説明より明らかとなるであろう。しかし、本発明の好適な実施形態を示す一方で、詳細説明及び具体例は、説明のみの目的に提供されていることが理解されるべきである。なぜなら、本発明の範囲内での種々の変更及び改修が、本詳細説明から当業者に明らかとなるからである。したがって、本発明は、記載するデバイスの特定の構成部品、又は、記載する方法の特定のステップに限定されず、そのようなデバイス及び方法は異なる場合があることが理解されよう。ここに使用する用語は、特定の実施形態を説明することのみを目的としており、限定を意図していないこともまた理解されよう。なお、本明細書及び添付の特許請求の範囲に使用されるように、冠詞「a」、「an」、「the」、及び「said」は、他の例が文脈により明確に決定づけられない限り、要素が1つ又はそれ以上あることを意味するよう意図していることに注意されたい。したがって、例えば、「1つのセンサ(a sensor)」又は「当該センサ(the sensor)」という引用は、いくつかのセンサなどを含む場合がある。さらに、「含む(comprising)」という語は、他の要素又はステップを排除しない。
【0025】
本発明の他の特徴及び利点は、以下の添付の図面を参照する、現在の好適な実施形態の以下の詳細説明から明らかとなるであろう。
【図面の簡単な説明】
【0026】
【
図1】
図1は、カメラシステムがカバーするシーンの幅を広げる、2つのカメラを使用するセットアップの概略図である。
【
図2】
図2は、
図1のカメラ102が取得するシーンの概略図である。
【
図3】
図3は、
図1のカメラ104が取得するシーンの概略図である。
【
図4】
図4は、共につなぎ合わせた
図2〜
図3の2つのシーンの、その領域内に、オブジェクトに対する視差がないように、シーンの道路/自動車を整列させている概略図である。
【
図5】
図5は、
図1のセットアップと同じシーンを取得する、本発明の実施形態に係るカメラシステムの概略外観図である。
【
図6】
図6は、2つのカメラビューと、オブジェクトのイメージ投影と、の概略図である。
【
図7】
図7は、投影までの距離が変更された、
図6の2つのカメラビューの概略図である。
【
図8】
図8は、特徴位置の視差に基づく三角測量法にて使用される特徴の概略図である。
【
図9】
図9は、本発明の実施形態に係る、つなぎ合わせたイメージを生成するプロセスのフローチャートである。
【発明を実施するための形態】
【0027】
さらに、図面中の類似の参照記号は、いくつかの図面を通して、同様の部品又は対応する部品を示す。
【0028】
本発明は、所定の固定位置に位置するカメラが取得するイメージをつなぎ合わせることに関する。
【0029】
図5をここで参照する。
図5は、イメージを取得してつなぎ合わせるシステム500を示す。本発明の実施形態を実装するシステム500は、重なり合っているシーンのデジタルイメージデータを取得するよう載置された、2つのデジタルビデオカメラ502及び504を含んでよい。重なり合っているシーンとは、デジタルビデオカメラ502及び504の1つである502が取得するシーンが、他のデジタルビデオカメラ104が取得するシーンの部位を含むことを意味することを意図する。取得したシーンのこの共通する部位は以下、ビデオの重なり110と称する。2つのカメラは、組み合わせることで合計シーン105を表すイメージを取得する。デジタルビデオカメラ502及び504は、具体的な距離dを互いに離れて載置されている。カメラのそれぞれの光軸の方向106及び108もまた、既知であってよい。
図5では、カメラ502及び504の光軸は平行である。これはしかし、必須ではない。本発明の実施形態は、ビデオの重なりが生成される限り、カメラは、それらのそれぞれの光軸との間の広がり角にて向けられている配置に対しても機能する。デジタルビデオカメラ502及び504のそれぞれは、時間的に同期されてよい。また、少なくとも、カメラ間のタイミングにおけるいずれの差異の情報が、画像処理デバイス506に利用可能である。カメラ502及び504が取得するイメージは、画像処理デバイス506に送信される。画像処理デバイス506では、イメージは合計シーン105に共につなぎ合わせられ、ビデオシーケンス内に収集される。ビデオ又はビデオシーケンスは、カメラビュー内にて取得したアクティビティの記録及び再生を可能にするために、時間的に連続するイメージのシーケンスから形成される。ビデオ又はビデオシーケンスは、Iフレーム及びPフレームなどの、空間的及び時間的エンコーディングスキームの組み合わせを使用してエンコードされてよい。そのようなエンコーディングスキームの例として、Mpeg−2、Mpeg−4、H.264、H.265などが挙げられる。続いて、つなぎ合わせたビデオシーケンスは、内部メモリカード又はハードドライブ、外部ネットワーク取り付けストレージ、ビデオサーバ、クライアントコンピュータ、及びビデオマネジメントシステムなどのストレージデバイスに送信され、及び/又は、ストリーム化されてよい。画像処理デバイス外部のストレージデバイスへの送信は、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、セルラーネットワーク、及び公衆交換電話ネットワークなどのネットワーク508を介して行われてよい。デジタルビデオカメラ502及び504はそれぞれ、シーンからの光を記録し、記録した光を、取得したシーンを表すイメージデータに変換するよう配置されたイメージセンサ510を含む。
【0030】
図6をここで参照する。いくつか実施形態によると、各センサ510からのイメージデータは、カメラ502及び504のそれぞれのローカルの二次元座標系内に取得されて記録される。例えば、この二次元座標系は、イメージセンサ510の表面に関連する。この表面は、二次元平面である。システムは、三次元座標系内に表される三次元空間内の平面などの、イメージセンサ面のピクセルが、投影面516上に数学的に投影される三次元座標系内にて実施され、作動する。ビデオ取得システム500の座標系は、座標系のすべての軸が交差する原点Oにてすべて始まるx軸、y軸、及びz軸を有するデカルト座標系であってよい。カメラ502及び502のイメージセンサのそれぞれのイメージデータは、カメラシステムから、すなわちこの例では原点Oから、距離z
1にある投影面516上に投影することにより、この三次元座標系に変換されてよい。それぞれのカメラは代替的に、それぞれのカメラのイメージデータが投影される個別の投影面までの個別の距離を有してよい。投影面516は、
図6に示すように平面であってもよいし、円筒の一部、球体の一部、又は、当業者が想到するいずれの他の形状であってもよい。いくつか実施形態では、距離z
1はまず、
図6に示す、カメラ502及び504の双方からの、イメージデータの投影面516に対するものと同じである、所定の距離である。デジタルビデオカメラ502及び504のそれぞれの位置は、それぞれC
1及びC
2と称する。これらは、三次元座標系の原点Oのエリア内にある。この例では、カメラ502及び504のそれぞれは、x軸及びz軸の平面内にその光軸を有する。カメラ502及び504間の距離dは既知であり、これにより、三次元座標系内の位置C
1及びC
2も既知である。
【0031】
図6においてオブジェクト512は、シーン内の、三次元座標系内の位置Pにある。このオブジェクトは、カメラが取得するシーンの重なり内に位置するため、イメージセンサのそれぞれは、このオブジェクトを記録する。それぞれのセンサからのイメージは、投影面516上に投影される。カメラ502が取得するままの状態で、オブジェクト512の投影は、参照番号522を有するシンボルXにより視覚化される。カメラ504が取得するままの状態で、オブジェクト512の投影は、参照番号524を有するシンボルXにより視覚化される。1つのカメラからのデータは、投影面上のある位置にオブジェクトを配置し、他のカメラからのデータは、投影面上の異なる位置にオブジェクトを配置するため、オブジェクト512の投影には視差問題が生じることが、図より明らかである。この視差問題は、投影面516をオブジェクト512の位置Pに移動させることにより、すなわち、投影面516がオブジェクト512の位置Pと交差するように投影面516を位置決めすることにより防ぐことができる。この結果を示す図を
図7に示す。カメラ502及び504の双方が、投影面516上の同じ位置にオブジェクト512を投影しても、オブジェクト512の投影は、いずれの視差的副作用を示さない。図からわかるように、投影面516は、原点から距離z
2まで移動している。この距離は、カメラシステム500の三次元座標系におけるz軸に沿う、オブジェクト512の位置Pに対応する。
【0032】
オブジェクト512に対する視差的副作用を防ぐために、投影面516を動かして、オブジェクトの位置に交差させなければならない。しかし、原点から別々の距離に位置する、2つのカメラビューの重なり合う領域内の他のオブジェクトは、視差効果を示す。オブジェクト512が対象オブジェクトである場合は、対象オブジェクトに視差が生じない、重なり合うエリアを十分に良好に表し得る。この構成は、オペレータ又は閲覧者に良好な閲覧体験を提示し得る。これは、先に提案するように、投影面516までの距離を単に変更することにより達成され得、しかもそのような好適な操作は、比較的少ない処理パワーを使用して達成され得る。なぜなら、投影操作は、同程度に簡易な操作であるためである。この効果を、
図1及び
図4にも示す。ここでは、投影面は、道路までのカメラシステムからの距離に設定されており、背景内の住宅が、視差的副作用を示す。
【0033】
オブジェクト512までの距離、すなわち、原点Oからの位置Pは、システムの既知の特性及び取得したイメージデータの分析に基づく幾何学的三角測量法や、レーダー、ライダー、飛行時間(time of flight又はTOF)技術などのアクティブ測距などの既知の方法を使用して取得されてよい。幾何学的三角測量法の一具体例では、イメージのそれぞれに内における特徴間の視差に基づいて、深度が計算される。
図8を参照されたい。原点Oからオブジェクトまでの距離zは、視差、すなわちx
1-x
2、及び式1を使用して計算されてよい。
【0034】
式1における変数dは、カメラ間の距離である。この距離は、既知である。変数x
1及びx
2は、イメージの縁から、それぞれのイメージ内にある特定の特徴までの、焦面でのそれぞれのイメージにおける距離である。この距離は、取得したイメージ内にて測定されてよい。カメラの焦点距離fもまた既知である。したがって、原点Oから特定の特徴までの距離zは、式1を再配列したものを使用して計算されてよい。式2を参照されたい。
【0035】
さらに、本発明のいくつか実施形態では、カメラ502及び504はそれぞれ、モーションデテクタ520を含む。モーションデテクタ520は、取得したシーン内のモーションを検出し、検出したモーションの特性を画像処理デバイス506に送信するよう構成されている。代替的に、モーションデテクタ520は、カメラ502及び504それぞれからのイメージストリーム内のモーションを検出するために、画像処理デバイス506内に配置されてよい。モーションデテクタ520は、ビデオ分析に基づくモーション検出プロセスなどの、当業者に既知のいずれのモーションデテクタ又はオブジェクトトラッカであってよい。ビデオ分析に基づくモーション検出プロセスの例として、密オプティカルフローアルゴリズム(Dense Optical flow algorithms)、疎オプティカルフローアルゴリズム(Sparse optical flow algorithms)、カルマンフィルタリング(Kalman filtering)、ミーンシフトアルゴリズム(Meanshift algorithms)、カムシフトアルゴリズム(Camshift algorithms)、シングルオブジェクトトラッカ(Single object trackers)、又は、マルチプルオブジェクト追跡検索アルゴリズム(Multiple object track finding algorithms)を実施するオブジェクトトラッキングが挙げられる。これらのトラッカのいくつかの実装は、OpenCVと呼ばれる、オープンソースコンピュータビジョン及び機械学習ソフトウェアライブラリにて利用可能である。https://opencv.org/を参照されたい。検出したモーションの特性は、モーションの位置を含んでよい。モーションの位置は、検出したオブジェクトの重心に位置する単一のポイントとして、エリアの位置と組み合わせた、検出したオブジェクトを表すピクセルのエリアとして、又は、検出したモーションの一部である際立った特徴の位置として画定されてよい。
【0036】
本発明のいくつかの実施形態によると、投影面516から原点Oまでの距離は、検出したモーションのこの位置まで計算される。この距離は、アクティビティ距離と称される。検出したモーションの位置は、カメラ502及び504のそれぞれからのイメージデータ内にて識別されてよい。この距離は、継続して更新されてよい。すなわち、投影面は、重なり合う領域内で動いているオブジェクトに継続して適用されてもよいし、この距離は、定期的に更新されてもよい。すなわち、この距離は、1時間毎などに更新されてよい。
【0037】
他の実施形態によると、所定の期間中に検出したモーションの位置は保存され、ヒートマップを形成するために使用される。ヒートマップ内に表される最も頻繁なモーションを含む位置までの平均距離が、投影面516までの距離を計算するために使用されてよい。また、最も多くのモーションが記録された位置までの平均距離が、投影面516までの距離を計算するために使用されてよい。このようにして、イメージをつなぎ合わせることを目的とする対象オブジェクトは、シーン内で動く特徴又はオブジェクトとなる。
【0038】
さらに他の実施形態によると、カメラビューの重なり合う領域内のモーションは、カメラシステム付近に配置したレーダーを使用して検出されてよい。モーションの検出がレーダーを使用して行われる場合、動いているオブジェクトまでの距離は、画像処理デバイス506に送信され、投影面516に対する、カメラシステム500の三次元座標系内の原点Oまでの距離を設定するために使用されてよい。
【0039】
代替的に、カメラビューの重なり合う領域110内のモーションが検出され、カメラ502及び504のそれぞれからのイメージストリーム内のイメージエリアが識別される。続いて、検出したモーションに属する共通のイメージの特徴が、検出したモーションのイメージエリア内にて識別される。モーションまでの距離が続いて、カメラ502及び504のそれぞれからのイメージデータの共通基準ポイントとして、この特徴を使用して計算されてよい。
【0040】
図9をここで参照する。本発明のいくつかの実施形態に係る、ビデオをつなぎ合わせる1つの方法は、少なくとも2つのカメラ502及び504に、ステップ802にて、このシーンのビデオデータを重なり合っている様式にて取得させることで開始する。先述するように、重なり合っているビデオデータを取得することは、第1のビデオカメラの取得したビデオデータの部位が、第2のビデオカメラにより取得された部位として、取得した合計シーンの、対応する部位110を表すようにすることを含む。
【0041】
モーション検出操作は、ステップ804にて、重なり合っているカメラビュー110を表すイメージデータ上にて行われる。モーション検出操作はまず、重なり合っているカメラビュー110を表すイメージデータを取得する1つのカメラ502からのビデオデータ上にて行われてよい。続いて、検出したモーションは、重なり合っているカメラビュー110を表すイメージデータを取得する他のカメラ504からのビデオデータにて確定されてよい。代替的に、モーション検出操作は、1つのカメラ502からのイメージデータ内のみにて行われ、モーションの共通の特徴が、イメージデータの両セット内にて識別される。代替的に、モーション検出操作は、カメラ502及び504の双方からのイメージデータ内にて行われ、続いて、イメージデータの両セット内での対応するモーションの検出が、1つの、同じモーションとして識別される。続いて、モーションが検出されたイメージデータは、アクティビティとして直接ラベル付けされてもよいし、又は、追加的条件が満たされてから、アクティビティとしてラベル付けされてもよい。1つのそのような条件は、所定の期間が経過したという条件であってよい。
【0042】
アクティビティは続いて、ヒートマップなどの、期間中に蓄積されたモーションとなってよい。そのような期間は、2か月間程度や、2時間程度であってよい。別の条件は、行われた、所定の、モーションの検出数であってよい。有益な結果を得るために十分なモーションの検出数は、モーションイベントの区分や、様々なモーションの検出間の、距離のばらつきなどにより、異なってよい。先述するように、蓄積したモーションから、位置が判定されてよい。アクティビティまでの距離が続いて、ステップ806にて判定される。距離は、上述するように計算されてよい。
【0043】
続いて、所定の投影面516が、上述するように、ステップ808にて、判定したアクティビティ距離にある位置に配置又は再配置される。イメージセンサ510から取得したイメージデータが続いて、ステップ810にて、投影面516上に投影される。1つ又は複数のカメラから、投影面516上にイメージデータを投影する様々なプロセスが、当業者に既知である。そのようなプロセスの1つの記述を、「コンピュータビジョンにおけるマルチプルビュージオメトリ(Multiple View Geometry in Computer Vision)」、第2版、2003年、Richard Hartley及びAndrew Zisserman著、に見ることができる。重なり合うエリア110全体における視差を防ぐために、重なり合うエリア110全体が再計算される場合に比べて、イメージセンサ510からのイメージデータを、判定したアクティビティ距離zに位置する投影面516上に投影することにより、アクティビティの位置での視差を低コストにて防ぐことができる。つなぎ合わせたビデオがこれで、投影面516上に表され、ステップ812にて、データが、投影ビデオから、エンコードされる及び/又は表示される二次元ビデオデータとして、出力され得る。投影面516上に投影されたビデオデータは、共につなぎ合わせた2つのビデオストリームを表すため、上記プロセスからの出力は、つなぎ合わせたビデオストリームとなる。
【0044】
プロセスが、距離を更新すべきであるといういずれの指示を受けていない限りは、投影面516までの距離が判定されると、2つのイメージセンサ510からのビデオをつなぎ合わせることが、イメージセンサのそれぞれからのイメージデータを、判定したアクティビティ距離zにて投影面516上に投影することを含んでよいように、プロセスは実施されてよい。そのような指示の一例は、プロセスが、アクティビティ距離を継続して評価し、計算したアクティビティ距離が、投影面516に対して現在使用しているアクティビティ距離から、所定の距離の閾値よりも大きい値だけ異なる場合に、投影面516に対して使用しているアクティビティ距離を更新することであってよい。
【0045】
2つのビデオを重なり合うエリア110内に組み合わせる、簡易でありながらも効果的な方法は、イメージ情報をそのエリア内に溶け込ませるよう、プロセスを構成することである。例えば、投影面516上の重なりのそれぞれの位置には、イメージセンサ510の1つからの位置での、他のイメージセンサからの位置での明度の半分へのアルファブレンディングなど、明度の半分を加えることでもたらされる明度が、色チャネルのそれぞれにおいて与えられてよい。重なり合う領域にてイメージデータを組み合わせるさらなる方法が、当業者に既知であり、それらのいくつかは、FeatherBlender及びMultiBandBlenderなどのOpenCVにて利用可能である。
【0046】
投影面516までの距離を判定するために使用される、アクティビティの位置の識別は、先の記述にて示されるように、いくつかの異なる方法にて計算されてよい。1つの実施形態によると、アクティビティ距離zの判定は、2つのカメラ502及び504の1つのカメラ502からのビデオ内のモーションを検出することと、カメラ502のカメラビュー内のそのモーションの位置を判定することと、を含む。他のカメラ504からのビデオ内のモーションを検出することと、カメラ504のカメラビュー内のそのモーションの位置を判定することと、をさらに含む。カメラ502のカメラビュー内にて検出したモーションを、カメラ504のカメラビュー内にて検出したモーションと関連付けることと、カメラ502のカメラビューのビデオ内にて検出したモーションが、カメラ504のカメラビューのビデオ内にて検出したモーションと同じであるか判定することと、をさらに含む。2つの検出したモーションの関連付けは、モーションの位置、すなわち、2つのカメラビューの重なり合うエリア110内の位置、それぞれのモーションの時間、すなわち、モーションがほぼ同時に検出された、検出したモーションの速度、すなわち、検出したモーションの速度が同じ、又は、検出したモーションの方向、すなわち、モーションの方向が同じ、を含むグループ内の特徴のいずれの1つ又はいずれの組み合わせに基づいてよい。カメラ502及び504からのビデオストリームのそれぞれ内にて検出したモーションが、同じアクティビティに属するものであることが判定されると、モーションの位置までのアクティビティ距離zが続いて、先述するように計算されてよい。そして、投影面516が、計算されたアクティビティ距離に配置されてよい。モーション及びモーションに関与するオブジェクトは追跡されてよい。また、アクティビティ距離はその動作中に、定期的に更新されてよい。代替的に、アクティビティ距離の計算は、モーションが検出される限り定期的に行われる。さらに別の代替例では、アクティビティ距離が定期的に計算される。その計算されたアクティビティ距離は、蓄積される。そして、アクティビティ距離の平均値が計算されてよい。若干異なるアプローチでは、アクティビティ距離の蓄積は、最新の10、100、又は1000のアクティビティ距離のみを含む。
【0047】
別の代替的なアプローチでは、モーションが最も頻繁に検出された、カメラビューの重なり合うエリア内の位置を示すヒートマップが生成される。また、位置はヒートマップに継続して加えられてよい。カメラからのビデオストリームのそれぞれに対して、1つのヒートマップが生成される。続いて、ビデオストリームのそれぞれ内の、モーションの最大検出数のある位置が判定され、同じアクティビティに関連付けられる。したがって、カメラストリームのそれぞれ内の位置が、先述するように、アクティビティ距離の計算に使用される。
【0048】
本発明は、技術的に詳細な、統合が可能ないずれのレベルでの、カメラシステム、方法、及び/又はコンピュータプログラム製品であってよい。コンピュータプログラム製品は、プロセッサに、本発明の態様を実施させるコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体(又は、複数の媒体)を含んでよい。
【0049】
コンピュータ可読記憶媒体は、命令実行デバイスが使用する命令の保持と保存が可能な実体的なデバイスであり得る。コンピュータ可読記憶媒体は、例えば、電子ストレージデバイス、磁気ストレージデバイス、光学ストレージデバイス、電磁ストレージデバイス、半導体ストレージデバイス、又は、それらのいずれの適した組み合わせであってよいが、これに制限しない。コンピュータ可読記憶媒体の非包括的なさらなる具体例として、次が挙げられる:ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(random access memory又はRAM)、読み取り専用メモリ(read−only memory又はROM)、消去可能プログラマブル読み取り専用メモリ(erasable programmable read−only memory又はEPROM、若しくはフラッシュメモリ)、スタティックランダムアクセスメモリメモリ(static random access memory又はSRAM)、ポータブルコンパクトディスク読み取り専用メモリ(portable compact disc read−only memory又はCD−ROM)、デジタルバーサタイルディスク(digital versatile disk又はDVD)、メモリスティック、及び、それらのいずれの適した組み合わせ。コンピュータ可読記憶媒体は、ここに使用されるように、電波、他の自由に伝播する電磁波、導波管若しくは他の送信媒体を通って伝播する電磁波(例えば、光ファイバケーブルを通る光パルス)、又は電線を通って送信される電気信号など、一時的な信号それ自体として解釈されない。
【0050】
ここに説明するコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体から、演算/処理デバイスのそれぞれに、又は、外部コンピュータ若しくは外部ストレージデバイスに、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、及び/又は、無線ネットワークなどのネットワークを介して、ダウンロードできる。ネットワークは、銅製送信ケーブル、光送信ファイバ、無線送信、ルータ、ファイヤウォール、スイッチ、ゲートウェイコンピュータ、及び/又はエッジサーバを含んでよい。演算/処理デバイスのそれぞれ内のネットワークアダプタカード又はネットワークインタフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、そのコンピュータ可読プログラム命令を、演算/処理デバイスのそれぞれ内のコンピュータ可読記憶媒体内での保存のために転送する。
【0051】
本発明の作動を実施するコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(instruction−set−architecture又はISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用構成データ、又は、SmalltalkやC
++などのオブジェクト志向プログラミング言語や、「C」プログラミング言語や同様のプログラミング言語などの手続き型プログラミング言語などを含む、1つ又はそれ以上のプログラミング言語のいずれの組み合わせにて記述されたソースコード若しくはオブジェクトコードのいずれであってよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で完全に、ユーザのコンピュータ上で部分的に、スタンドアローンソフトウェアパッケージとして、ユーザのコンピュータ上で部分的に及びリモートコンピュータ上で部分的に、又は、リモートコンピュータ若しくはサーバ上で完全に、実行されてよい。後者のシナリオでは、リモートコンピュータは、ローカルエリアネットワーク(local area network又はLAN)若しくはワイドエリアネットワーク(wide area network又はWAN)を含むいずれの種類のネットワークを通して、ユーザのコンピュータに接続されてよいし、又は、(例えば、インターネットサービスプロバイダを使用してのインターネットを通しての)外部コンピュータへの接続が行われてよい。いくつか実施形態では、プログラマブルロジック回路、フィールドプログラマブルゲートアレイ(field−programmable gate arrays又はFPGA)、又は、プログラマブルロジックアレイ(programmable logic arrays又はPLA)などを含む電子回路が、本発明の態様を行うために、電子回路を個人向けに設定するための、コンピュータ可読プログラム命令の状態情報を利用することにより、コンピュータ可読プログラム命令を実行してよい。
【0052】
本発明の態様を、本発明の実施形態に係る方法、装置(システム)、及びコンピュータプログラム製品のフローチャートの図示及び/又はブロック図を参照して説明した。フローチャートの図示及び/又はブロック図のそれぞれのブロック、及び、フローチャートの図示及び/又はブロック図におけるブロックの組み合わせは、コンピュータ可読プログラム命令によって実施できることが理解されるであろう。
【0053】
コンピュータ又は他のプログラマブルデータ処理装置のプロセッサを介して実行されるこれらの命令が、フローチャート及び/又はブロック図の1つのブロック又は複数のブロックに規定される機能/作用を実施する手段を作成するよう、これらのコンピュータ可読プログラム命令は、マシンを作製するための汎用コンピュータ、専用コンピュータ、又は、他のプログラマブルデータ処理装置のプロセッサに提供されてよい。命令が保存されたコンピュータ可読記憶媒体が、フローチャート及び/又はブロック図の1つのブロック又は複数のブロックに規定される機能/作用の態様を実施する命令を含む製品を含むよう、これらのコンピュータ可読プログラム命令は、コンピュータ、プログラマブルデータ処理装置、及び/又は他のデバイスに、特定の様式にて機能するよう命令できるコンピュータ可読記憶媒体内に保存できてよい。
【0054】
コンピュータ、他のプログラマブル装置、又は、他のデバイス上で実行される命令が、フローチャート及び/又はブロック図の1つのブロック又は複数のブロックに規定される機能/作用を実施するよう、これらのコンピュータ可読プログラム命令はまた、コンピュータ、他のプログラマブルデータ処理装置、又は他のデバイスにロードされ、一連の作動ステップが、コンピュータ、他のプログラマブル装置、又は、他のデバイス上で行われ、コンピュータにより実施されるプロセスを生成してよい。
【0055】
図中のフローチャート及びブロック図は、本発明の様々な実施形態に係る、システム、方法、及び、コンピュータプログラム製品の可能な実装のアーキテクチャ、機能、及び、作動を示す。これに関して、フローチャート又はブロック図内のそれぞれのブロックは、規定される論理的機能(単一又は複数)を実施する、1つ又はそれ以上の実行可能命令を含むモジュール、セグメント、又は、命令の部位を表してよい。いくつかの代替的実装では、ブロック内に記される機能は、図に記す順序を外れて実施されてよい。例えば、連続して示す2つのブロックは実際に、実質的に同時に実行されるか、又は、関連する機能によっては、これらのブロックが時に反対の順序にて実行されてよい。なお、ブロック図及び/又はフローチャートの図示のそれぞれのブロック、及び、ブロック図及び/又はフローチャートの図示内のブロックの組み合わせは、規定の機能又は作用を行う、又は、専用ハードウェア及びコンピュータ命令の組み合わせを実現する、専用のハードウェアに基づくシステムによっても実装できる。
【0056】
本発明の様々な実施形態の説明を、例示を目的として提示した。これらはしかし、開示する実施形態に対して包括的又は限定的となることを意図しない。説明する実施形態の範囲及び精神から逸脱することなく、多くの変形例及び変更例が、当業者に明らかとなるであろう。ここに使用する用語は、実施形態の原理、市場にみられる技術の実際の応用又は技術的改善点を最良に説明するよう、又は、ここに開示する実施形態を他の当業者が理解できるよう選択された。