特許第6090786号(P6090786)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人 東京大学の特許一覧

<>
  • 特許6090786-背景差分抽出装置及び背景差分抽出方法 図000014
  • 特許6090786-背景差分抽出装置及び背景差分抽出方法 図000015
  • 特許6090786-背景差分抽出装置及び背景差分抽出方法 図000016
  • 特許6090786-背景差分抽出装置及び背景差分抽出方法 図000017
  • 特許6090786-背景差分抽出装置及び背景差分抽出方法 図000018
  • 特許6090786-背景差分抽出装置及び背景差分抽出方法 図000019
  • 特許6090786-背景差分抽出装置及び背景差分抽出方法 図000020
  • 特許6090786-背景差分抽出装置及び背景差分抽出方法 図000021
  • 特許6090786-背景差分抽出装置及び背景差分抽出方法 図000022
  • 特許6090786-背景差分抽出装置及び背景差分抽出方法 図000023
  • 特許6090786-背景差分抽出装置及び背景差分抽出方法 図000024
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6090786
(24)【登録日】2017年2月17日
(45)【発行日】2017年3月8日
(54)【発明の名称】背景差分抽出装置及び背景差分抽出方法
(51)【国際特許分類】
   G06T 7/20 20170101AFI20170227BHJP
   H04N 7/18 20060101ALI20170227BHJP
【FI】
   G06T7/20 100
   H04N7/18 G
【請求項の数】10
【全頁数】22
(21)【出願番号】特願2013-99408(P2013-99408)
(22)【出願日】2013年5月9日
(65)【公開番号】特開2014-219874(P2014-219874A)
(43)【公開日】2014年11月20日
【審査請求日】2016年4月20日
【新規性喪失の例外の表示】特許法第30条第2項適用 2012年12月18日 公益社団法人 計測自動制御学会発行の「SI 2012 第13回 公益社団法人 計測自動制御学会システムインテグレーション部門 講演会 講演論文集」に発表、2012年12月18〜20日 公益社団法人 計測自動制御学会 SI(システムインテグレーション)部門主催の「第13回 公益社団法人計測自動制御学会 システムインテグレーション部門 講演会 SI 2012」において発表
(73)【特許権者】
【識別番号】504137912
【氏名又は名称】国立大学法人 東京大学
(74)【代理人】
【識別番号】100091904
【弁理士】
【氏名又は名称】成瀬 重雄
(72)【発明者】
【氏名】横山 恵子
(72)【発明者】
【氏名】奥 寛雅
(72)【発明者】
【氏名】石川 正俊
【審査官】 真木 健彦
(56)【参考文献】
【文献】 特開2010−244207(JP,A)
【文献】 特開2009−236569(JP,A)
【文献】 特開平10−021407(JP,A)
【文献】 横山 恵子,奥村 光平,奥 寛雅,石川 正俊,高速視線制御システムを用いた物体追跡のための背景除去アルゴリズム,第13回システムインテグレーション部門講演会 (SI2012) 講演論文集,日本,公益社団法人 計測自動制御学会,2012年12月18日,pp.2237-2240
【文献】 横山 恵子 奥村 光平 奥 寛雅 石川 正俊,可搬型高速視線制御システムの開発と背景差分を用いた屋外での高速物体追跡,ロボティクス・メカトロニクス講演会講演概要集2013,日本,一般社団法人 日本機械学会,2013年 5月22日,2A1-K01,P. 2A1-K01(1) - 2A1-K01(4)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/20
H04N 7/18
H04N 5/232
CiNii
(57)【特許請求の範囲】
【請求項1】
視線方向及び視点位置が移動可能なカメラで得られた画像を用いて背景差分を抽出するための装置であって、
撮像部と、極座標算出部と、記録部と、対象背景抽出部と、差分抽出部とを備えており、
前記撮像部は、カメラと、駆動部とを備えており、
前記カメラは、対象物を含まない画像である背景画像、あるいは、対象物を含む画像である実画像を取得できる構成となっており、
前記駆動部は、前記カメラの視線方向及び視点位置を変更できる構成となっており、
前記極座標算出部は、視線方向取得部と、視点位置取得部と、座標変換部とを備えており、
前記視線方向取得部は、前記カメラにおける視線方向を取得する構成となっており、
前記視点位置取得部は、前記カメラにおける視点位置を取得する構成となっており、
前記座標変換部は、取得された前記視線方向及び視点位置を用いて、前記背景画像あるいは前記実画像における画素の位置情報を、固定座標系における極座標情報に変換する構成となっており、
前記記録部は、前記背景画像における画素の色情報と、当該画素の極座標情報との対応関係を記録する構成となっており、
前記対象背景抽出部は、前記実画像における画素の極座標情報を用いて、前記実画像に対応する角度領域での前記背景画像を対象背景として特定する構成となっており、
前記差分抽出部は、前記実画像と前記対象背景とを比較することによって、それらの間の差分を抽出する構成となっている
背景差分抽出装置。
【請求項2】
前記座標変換部における、前記極座標情報への変換は、
前記背景画像あるいは前記実画像における画素の位置情報を、視点が固定された仮想カメラにおける仮想画像上での、当該画素の位置情報である仮想位置情報に変換する処理と、
前記仮想位置情報を、前記固定座標系における極座標情報に変換する処理と
によって行われる構成となっている
請求項1に記載の背景差分抽出装置。
【請求項3】
さらに量子化部を備えており、
前記量子化部は、前記座標変換部で得られた前記極座標情報を量子化する構成とされており、
さらに、前記量子化部は、前記カメラにおける視線方向が前記固定座標系における基準方向からずれるほど、量子化単位としての角度範囲を増やす構成とされており、
前記記録部は、前記画素の極座標情報として、量子化された前記極座標情報を用いる構成とされている
請求項1又は2に記載の背景差分抽出装置。
【請求項4】
さらに、ブラー生成部を備えており、
前記ブラー生成部は、前記対象背景を、前記視線方向が移動する方向に沿って複数枚特定し、特定された複数枚の前記対象背景を合成することによって、ブラーを有する合成対象背景を生成する構成とされており、
前記差分抽出部は、前記実画像と前記合成対象背景とを比較することによって、前記差分を抽出する構成とされている
請求項1〜3のいずれか1項に記載の背景差分抽出装置。
【請求項5】
前記カメラの視線方向は、パン方向角度とチルト方向角度とによってあらわされている
請求項1〜4のいずれか1項に記載の背景差分抽出装置。
【請求項6】
前記駆動部は、前記カメラの視線方向をパン方向とチルト方向とに変化させる鏡面光学系を備えている
請求項1〜5のいずれか1項に記載の背景差分抽出装置。
【請求項7】
さらに、背景更新部を備えており、
前記背景更新部は、前記実画像のうち、前記差分抽出部において前記差分とされなかった部分を新たな背景画像として特定して、前記記録部における前記背景画像における画素の色情報を更新する構成とされている
請求項1〜6のいずれか1項に記載の背景差分抽出装置。
【請求項8】
前記駆動部は、前記差分抽出部によって差分として抽出された部分に前記カメラの視線方向を向ける構成とされている
請求項1〜7のいずれか1項に記載の背景差分抽出装置。
【請求項9】
視線方向及び視点位置が移動可能なカメラで得られた画像を用いて背景差分を抽出するための方法であって、
前記カメラにより、対象物を含まない画像である背景画像を取得するステップと、
前記カメラの視線方向及び視点位置の情報を用いて、前記背景画像における画素の位置情報を、前記固定座標系における極座標情報に変換するステップと、
前記背景画像における画素の色情報と、当該画素の極座標情報との対応関係を記録部に記録するステップと、
前記カメラにより、対象物を含む画像である実画像を取得するステップと、
前記カメラの視線方向及び視点位置の情報を用いて、前記実画像における画素の位置情報を、固定座標系における極座標情報に変換するステップと、
前記実画像における画素の極座標情報を用いて、前記実画像に対応する角度領域での前記背景画像を対象背景として特定するステップと、
前記実画像と前記対象背景とを比較することによって、それらの間の差分を抽出するステップと
を備えることを特徴とする背景差分抽出方法。
【請求項10】
視線方向及び視点位置が移動可能なカメラで得られた画像を用いて背景差分を抽出するためのコンピュータプログラムであって、
対象物を含まない画像である背景画像をカメラに取得させるステップと、
前記カメラの視線方向及び視点位置の情報を用いて、前記背景画像における画素の位置情報を、固定座標系における極座標情報に変換するステップと、
前記背景画像における画素の色情報と、当該画素の極座標情報との対応関係を記録部に記録するステップと、
象物を含む画像である実画像を前記カメラに取得させるステップと、
前記カメラの視線方向及び視点位置の情報を用いて、前記実画像における画素の位置情報を、前記固定座標系における極座標情報に変換するステップと、
前記実画像における画素の極座標情報を用いて、前記実画像に対応する角度領域での前記背景画像を対象背景として特定するステップと、
前記実画像と前記対象背景とを比較することによって、それらの間の差分を抽出するステップと
をコンピュータに実行させるためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像データどうしを比較することによって背景差分を抽出するための技術に関するものである。
【背景技術】
【0002】
被写体を継続的に撮影するためには、カメラの視線を対象に向け続ける必要がある。多くの場合この作業は撮影者が手動で行うが、ボールの跳躍のような高速かつ不規則な運動に完璧に追従するのは難しい。このため、カメラの視線方向を機械で自動制御するシステム(いわゆるアクティブビジョン;下記非特許文献1参照)の研究は様々な分野で盛んとなっている。
【0003】
通常のアクティブビジョンの技術では、カメラ自体を駆動雲台に取り付けて動かしているため、視線方向の移動についての応答速度が遅い。これでは、急激な加速度変化を含む運動対象(例えば球技で用いられているボール)をトラッキングすることは難しい。高速カメラのフレームレートが、速いものでは100万fpsに達する事や、GPUによって画像処理が高速化されている現状を考えると、視線制御速度は、様々なトラッキングシステムにおいて速度面でのボトルネックとなっていると言える。
【0004】
この問題を解決するために、カメラ前方に配置した小型駆動鏡面によって高速にカメラの視線変更を行うサッカードミラー(Saccade Mirror)と呼ばれる光学系が提案されている(下記非特許文献2参照)。この技術では、2軸のガルバノミラーを用いることによって、高速な視線変更ができるようになっている。もし、制御系において、常に画面中心で対象物をとらえるように視線の制御ができれば、他に類を見ないダイナミックな撮像が可能になると考えられる。
【0005】
ところで、対象物をトラッキングするには、画像中の対象物を抽出し、その方向にカメラの視線を向ける必要がある。画像中の対象物を抽出する方法としては、例えば:
(1)画像中の特徴量を抽出した後、事前学習で得た学習データとの比較によって画像中の対象物を特定する方法;
(2)背景画像をあらかじめ取得しておき、対象物を含む画像(実画像)との比較によって対象物を特定する方法(いわゆる背景差分法)
などが存在する。前記(1)の方法は、背景画像の取得が不要であるという利点はあるが、画像処理の時間が長くなるので、実時間での対象物特定には不向きである。また、この方法は、学習データの内容にもよるが、対象物の特定精度も不十分となりがちである。
【0006】
前記(2)の背景差分法は、高速な対象物特定が可能であるという利点がある。しかしながら、従来から提案されている背景差分法(例えば下記非特許文献3及び4)は、視点固定カメラで得られた画像を前提としている。これらの技術は、視点が動くカメラに直接適用することは難しいと考えられる。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】J. Aloimonos, I. Weiss and A. Bandyopadhyay: "Active Vision", Int'l Journal of Computer Vision, vol. 1, no. 4, pp. 333.356 (1988).
【非特許文献2】K. Okumura, H. Oku and M. Ishikawa: "High-Speed Gaze Controller for Millisecond-order Pan/tilt Camera", Proc. of IEEE Int'l Conf. on Robotics and Automation, pp. 6186. 6191 (2011).
【非特許文献3】T. Wada and T. Matsuyama: "Appearance Sphere: Background model for pan-tilt-zoom camera", Proc. of 13th Int'l Conf. of Pattern Recognition, pp. A718.722 (1996).
【非特許文献4】K. Yachi, T. Wada and T. Matsuyama: "Human Head Tracking using Adaptive Appearance Model with a Fixed-viewpoint Pan-tilt-zoom Camera", Proc. of IEEE Intl' Conf. on Automatic Face and Gesture Recognition, pp. 150.155 (2000).
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明は、前記の状況に鑑みてなされたものである。本発明は、視点が移動するカメラで取得した画像を用いた背景差分の取得を可能にするための技術を提供することを目的としている。
【課題を解決するための手段】
【0009】
前記した課題を解決する手段は、以下の項目のように記載できる。
【0010】
(項目1)
視線方向及び視点位置が移動可能なカメラで得られた画像を用いて背景差分を抽出するための装置であって、
撮像部と、極座標算出部と、記録部と、対象背景抽出部と、差分抽出部とを備えており、
前記撮像部は、カメラと、駆動部とを備えており、
前記カメラは、対象物を含まない画像である背景画像、あるいは、対象物を含む画像である実画像を取得できる構成となっており、
前記駆動部は、前記カメラの視線方向及び視点位置を変更できる構成となっており、
前記極座標算出部は、視線方向取得部と、視点位置取得部と、座標変換部とを備えており、
前記視線方向取得部は、前記カメラにおける視線方向を取得する構成となっており、
前記視点位置取得部は、前記カメラにおける視点位置を取得する構成となっており、
前記座標変換部は、取得された前記視線方向及び視点位置を用いて、前記背景画像あるいは前記実画像における画素の位置情報を、固定座標系における極座標情報に変換する構成となっており、
前記記録部は、前記背景画像における画素の色情報と、当該画素の極座標情報との対応関係を記録する構成となっており、
前記対象背景抽出部は、前記実画像における画素の極座標情報を用いて、前記実画像に対応する角度領域での前記背景画像を対象背景として特定する構成となっており、
前記差分抽出部は、前記実画像と前記対象背景とを比較することによって、それらの間の差分を抽出する構成となっている
背景差分抽出装置。
【0011】
(項目2)
前記座標変換部における、前記極座標情報への変換は、
前記背景画像あるいは前記実画像における画素の位置情報を、視点が固定された仮想カメラにおける仮想画像上での、当該画素の位置情報である仮想位置情報に変換する処理と、
前記仮想位置情報を、前記固定座標系における極座標情報に変換する処理と
によって行われる構成となっている
項目1に記載の背景差分抽出装置。
【0012】
(項目3)
さらに量子化部を備えており、
前記量子化部は、前記座標変換部で得られた前記極座標情報を量子化する構成とされており、
さらに、前記量子化部は、前記カメラにおける視線方向が前記固定座標系における基準方向からずれるほど、量子化単位としての角度範囲を増やす構成とされており、
前記記録部は、前記画素の極座標情報として、量子化された前記極座標情報を用いる構成とされている
項目1又は2に記載の背景差分抽出装置。
【0013】
(項目4)
さらに、ブラー生成部を備えており、
前記ブラー生成部は、前記対象背景を、前記視線方向が移動する方向に沿って複数枚特定し、特定された複数枚の前記対象背景を合成することによって、ブラーを有する合成対象背景を生成する構成とされており、
前記差分抽出部は、前記実画像と前記合成対象背景とを比較することによって、前記差分を抽出する構成とされている
項目1〜3のいずれか1項に記載の背景差分抽出装置。
【0014】
(項目5)
前記カメラの視線方向は、パン方向角度とチルト方向角度とによってあらわされている
項目1〜4のいずれか1項に記載の背景差分抽出装置。
【0015】
(項目6)
前記駆動部は、前記カメラの視線方向をパン方向とチルト方向とに変化させる鏡面光学系を備えている
項目1〜5のいずれか1項に記載の背景差分抽出装置。
【0016】
(項目7)
さらに、背景更新部を備えており、
前記背景更新部は、前記実画像のうち、前記差分抽出部において前記差分とされなかった部分を新たな背景画像として特定して、前記記録部における前記背景画像における画素の色情報を更新する構成とされている
項目1〜6のいずれか1項に記載の背景差分抽出装置。
【0017】
(項目8)
前記駆動部は、前記差分抽出部によって差分として抽出された部分に前記カメラの視線方向を向ける構成とされている
項目1〜7のいずれか1項に記載の背景差分抽出装置。
【0018】
(項目9)
視線方向及び視点位置が移動可能なカメラで得られた画像を用いて背景差分を抽出するための方法であって、
前記カメラにより、対象物を含まない画像である背景画像を取得するステップと、
前記カメラの視線方向及び視点位置の情報を用いて、前記背景画像における画素の位置情報を、前記固定座標系における極座標情報に変換するステップと、
前記背景画像における画素の色情報と、当該画素の極座標情報との対応関係を記録部に記録するステップと、
前記カメラにより、対象物を含む画像である実画像を取得するステップと、
前記カメラの視線方向及び視点位置の情報を用いて、前記実画像における画素の位置情報を、固定座標系における極座標情報に変換するステップと、
前記実画像における画素の極座標情報を用いて、前記実画像に対応する角度領域での前記背景画像を対象背景として特定するステップと、
前記実画像と前記対象背景とを比較することによって、それらの間の差分を抽出するステップと
を備えることを特徴とする背景差分抽出方法。
【0019】
(項目10)
視線方向及び視点位置が移動可能なカメラで得られた画像を用いて背景差分を抽出するためのコンピュータプログラムであって、
対象物を含まない画像である背景画像をカメラに取得させるステップと、
前記カメラの視線方向及び視点位置の情報を用いて、前記背景画像における画素の位置情報を、固定座標系における極座標情報に変換するステップと、
前記背景画像における画素の色情報と、当該画素の極座標情報との対応関係を記録部に記録するステップと、
象物を含む画像である実画像を前記カメラに取得させるステップと、
前記カメラの視線方向及び視点位置の情報を用いて、前記実画像における画素の位置情報を、前記固定座標系における極座標情報に変換するステップと、
前記実画像における画素の極座標情報を用いて、前記実画像に対応する角度領域での前記背景画像を対象背景として特定するステップと、
前記実画像と前記対象背景とを比較することによって、それらの間の差分を抽出するステップと
をコンピュータに実行させるためのコンピュータプログラム。
【0020】
このコンピュータプログラムは、適宜な記録媒体(例えばCD−ROMやDVDディスクのような光学的な記録媒体、ハードディスクやフレキシブルディスクのような磁気的記録媒体、あるいはMOディスクのような光磁気記録媒体)に格納することができる。このコンピュータプログラムは、インターネットなどの通信回線を介して伝送されることができる。
【発明の効果】
【0021】
本発明によれば、視点が移動するカメラで取得した画像を用いた背景差分の取得が可能となる。したがって、例えば、取得した背景差分を対象物とみなして、この対象物を追跡するためにカメラの視線制御を行うことが可能となる。
【図面の簡単な説明】
【0022】
図1】本発明の第1実施形態における背景差分抽出装置の概略的な構成を示すブロック図である。
図2】撮像部の具体的な構成例を示す説明図である。
図3図1の装置を含むトラッキングシステムの概略的な説明図である。
図4図1の装置を用いた背景差分抽出方法の概略的な手順を示すフローチャートである。
図5】背景情報を登録する手順を示すフローチャートである。
図6】座標変換手順を説明するための前提となる座標系及び視点位置の説明図である。
図7】座標変換手順を説明するための前提となる座標系及び画素位置の説明図であって、図(a)は仮想カメラ座標系の説明図、図(b)は固定座標系におけるパン角とチルト角の説明図である。
図8】極座標を算出する手順を示すフローチャートである。
図9】量子化された極座標情報を説明するための説明図である。
図10】実画像の情報を算出するための手順を示すフローチャートである。
図11】本発明の第2実施形態における背景差分抽出装置の概略的な構成を示すブロック図である。
【発明を実施するための形態】
【0023】
以下、添付図面を参照しながら、本発明の第1実施形態に係る背景差分抽出装置について説明する。本実施形態の装置は、後述する対象物トラッキングシステムにおいて用いられるものである。
【0024】
(第1実施形態の構成)
本実施形態の背景差分抽出装置は、図1に示されるように、撮像部1と、極座標算出部2と、記録部3と、対象背景抽出部4と、差分抽出部5とを有している。さらに、この装置は、背景更新部6を有している。
【0025】
撮像部1は、カメラ11と、駆動部12とを備えている。さらに撮像部1は、瞳転送部13を備えている。撮像部1の具体的構成例を図2に示す。
【0026】
カメラ11は、対象物のトラッキングのために適切なフレームレートで画像を取得する構成となっている。例えば、対象物が高速に移動する場合は、1フレーム当たり1msのサイクルでデジタル画像を取得するものを用いることができるが、これはあくまで一例であり、用途に応じて異なるフレームレートを使用することができる。カメラ11の画素数は、トラッキングの目的に即して決定することができ、原理的には特段の制約はない。カメラ11の視線方向を、図2において矢印で示している。後述するように、カメラ11は、対象物を含まない画像である背景画像、あるいは、対象物を含む画像である実画像を取得できる構成となっている。すなわち、カメラ11は、背景画像情報の登録時には背景画像を撮影し、対象物のトラッキングの際には実画像(対象物を含む画像)を撮影するものである。もちろん、本実施形態において、背景画像撮影用のカメラと実画像撮影用のカメラとを別々に備えることも可能である。なお、カメラ11としては、可視光カメラに限らず、赤外光やその他の波長域の電磁波(テラヘルツ波やミリ波を含む)を撮像するカメラであってもよい。要するに、カメラ11としては、デジタル画像を取得できるものであればよく、いわゆるレンジファインダであってもよい。また、カメラ11としては、単一波長の光を撮像するカメラ(モノクロカメラ)であってもよい。この場合、得られた画像の画素値は輝度値のみとなる。本明細書では、画素の輝度値自体も「画素の色情報」の一例に対応するものとする。
【0027】
駆動部12は、カメラ11の視線方向をパン方向とチルト方向とに変化させる鏡面光学系を備えている。より具体的には、図2に示されるように、駆動部12は、パンミラー121とチルトミラー122とを備えている。パンミラー121及びチルトミラー122は、いずれも、図示しない駆動手段、例えば制御モータにより、所定の軸を中心として、パン方向あるいはチルト方向にそれぞれ回動できるようになっている。また、本実施形態では、図示しない制御部により、パン角度及びチルト角度を制御できるようになっている。さらに本実施形態では、実際のパン角度及びチルト角度を取得して、制御部側にフィードバックすることができるようになっている。
【0028】
後述するように、瞳転送部13により転送された瞳の位置(つまり視点位置)は、パン角度あるいはチルト角度の変更に伴って変動する。これにより、駆動部12は、カメラ11の視線方向及び視点位置を変更できる構成となっている。なお、本明細書において、カメラ11の視線方向は、パン方向角度とチルト方向角度とによって表されるものとする。
【0029】
さらに、本実施形態の駆動部12は、差分抽出部5によって差分として抽出された部分にカメラ11の視線方向を向けるように、図示しない制御部によって制御されるものである。
【0030】
瞳転送部13は、図2に示す瞳転送光学系により構成されている。瞳転送部13は、パンミラー121とチルトミラー122との間に、カメラ11の瞳位置を転送するようになっている。
【0031】
極座標算出部2は、視線方向取得部21と、視点位置取得部22と、座標変換部23とを備えている。さらに、本実施形態の極座標算出部2は、量子化部24を備えている。
【0032】
視線方向取得部21は、カメラ11における視線方向を取得する構成となっている。具体的には、視線方向取得部21は、駆動部12におけるパンミラー121及びチルトミラー122の傾斜角度の情報(実際の角度であることが好ましいが制御指令値であってもよい)を撮像部1(又は図示しない制御部)から取得して、視線方向を算出するようになっている。
【0033】
視点位置取得部22は、カメラ11における視点位置を取得する構成となっている。具体的には、視点位置取得部22は、視線方向取得部21と同様に、駆動部12におけるパンミラー121及びチルトミラー122の傾斜角度の情報を撮像部1から取得して、視点位置を算出するようになっている。
【0034】
座標変換部23は、取得された視線方向及び視点位置を用いて、背景画像あるいは実画像における画素の位置情報を、固定座標系(いわゆるワールド座標系)における極座標情報に変換するものである。
【0035】
本実施形態では、座標変換部23における極座標情報への変換が、
(1)背景画像あるいは実画像における画素の位置情報を、視点が固定された仮想カメラにおける仮想画像上での、当該画素の位置情報である仮想位置情報に変換する処理;及び
(2)仮想位置情報を、固定座標系における極座標情報に変換する処理
によって実行されるようになっている。
【0036】
量子化部24は、座標変換部23で得られた極座標情報を量子化するものである。量子化部24は、カメラ11における視線方向が固定座標系における基準方向からずれるほど、量子化単位としての角度範囲を増やす構成とされている。
【0037】
極座標算出部2における詳しい処理は、本実施形態の動作の説明において詳しく述べる。極座標算出部2は、例えばコンピュータのハードウエア及びソフトウエアの組み合わせにより構成することができる。
【0038】
記録部3は、背景画像における画素の色情報と、当該画素の極座標情報との対応関係を記録する構成となっている。本実施形態の記録部3は、この記録部3に記録されるべき画素の極座標情報として、量子化部24によって量子化された極座標情報を用いるものとなっている。
【0039】
記録部3は、例えばコンピュータで利用可能な揮発性あるいは不揮発性メモリであるが、具体的な記録媒体に制約はない。記録部3は、ネットワークを介してコンピュータにより利用可能な記録装置であってもよい。また、画素の色空間としては、特に制約はなく、RGBやHSVなど、必要に応じて適切な色空間を用いることができる。また、色空間としては、輝度情報のみでもよく、また、必要に応じて、輝度情報以外の色彩情報のみであってもよい。
【0040】
対象背景抽出部4は、実画像における画素の極座標情報を用いて、実画像に対応する角度領域での背景画像を対象背景として特定するものである。
【0041】
差分抽出部5は、実画像と対象背景とを比較することによって、それらの間の差分を抽出するものである。
【0042】
背景更新部6は、実画像のうち、差分抽出部5において差分とされなかった部分を新たな背景画像として特定して、記録部3における背景画像の画素の色情報を更新する構成とされている。
【0043】
本実施形態の背景差分抽出装置におけるさらに具体的な構成は、後述の動作の説明において詳しく述べる。
【0044】
(第1実施形態の動作)
以下、本実施形態の背景差分抽出装置の動作について説明する。以下の説明の前提として、本実施形態の背景差分抽出装置が組み込まれるトラッキングシステムの全体的な構成例を図3により説明する。このトラッキングシステムは、コンピュータ100を備えており、このコンピュータ100(すなわちハードウエア及びソフトウエアの組み合わせ)により、極座標算出部2、記録部3、対象背景抽出部4、差分抽出部5及び背景更新部6の機能が実現されている。また、コンピュータ100の制御部(図示せず)から制御指令を駆動部12に送ることでパンミラー121及びチルトミラー122の傾斜角度(パン角度及びチルト角度)を制御して、追跡対象物200に視線を合わせる(つまり追跡する)ことができるようになっている。さらに、この装置では、パンミラー121及びチルトミラー122の実際の傾斜角度をセンサ(図示せず)により取得して、コンピュータ100に戻し、例えば極座標算出部2により利用できるようになっている。
【0045】
以下、図4のフローチャートを参照しながら、本例の背景差分抽出方法を説明する。
【0046】
図4のステップSA−1)
本実施形態の背景差分抽出方法では、まず、対象物を含まない画像である背景画像を登録する処理を行う。背景画像登録処理の具体例を、図5を参照して詳しく説明する。
【0047】
図5のステップSB−1)
まず、カメラ11により、背景画像を取得する。ここで、本実施形態では、カメラ11で取得可能な全ての領域における背景の画像(本明細書では「全背景画像」と称する)を取得する。すなわち、本実施形態では、駆動部12によりカメラ11の視線方向を変更できるので、視線方向の最大可変範囲に対応して、カメラ11で取得可能な全背景画像を取得する。ただし、全背景画像を一度に取得する必要はなく、所定の画角で撮影された背景画像ごとに、以降の極座標算出処理や登録処理を行うこととしてもよい。もちろん、全背景画像を取得した後に、以降の処理を行うことも可能である。また、全背景画像は、以降の背景差分抽出処理に使用されると予想される角度範囲(あるいは視線方向範囲)で取得されればよいので、全ての視線方向範囲に対応した背景画像を取得することは必須ではない。取得された背景画像の情報(画素情報及び画像上の画素位置情報)は、座標変換部23に送られる。
【0048】
図5のステップSB−2)
一方、パンミラー121及びチルトミラー122の実際の傾斜角度(背景画像取得時のもの)は、駆動部12から視線方向取得部21及び視点位置取得部22に送られる。視線方向取得部21及び視点位置取得部22では、パンミラー121及びチルトミラー122の傾斜角度の情報を用いて、視線方向及び視点位置を算出する。なお、この算出において、パンミラー121及びチルトミラー122の実際の傾斜角度に代えて、これらへの傾斜角度の指示値を用いることも可能である。ただし、実際の傾斜角度を用いることによりトラッキング精度の向上を期待できる。以下において、視線方向取得部21及び視点位置取得部22における、パンミラー121及びチルトミラー122の傾斜角度の情報を用いた、視線方向及び視点位置の算出方法を説明する。
【0049】
(視線方向及び視点位置の算出)
固定座標系(世界座標と呼ぶこともある)に対するカメラ11、パンミラー121及びチルトミラー122の位置関係を図6に示す。前記した通り、パンミラー121及びチルトミラー122によって、カメラ11の視線方向を制御できるようになっている。また、瞳転送部13により、カメラ11の瞳位置を光学的にこれらのミラーの中間に転送するようになっている。これにより充分な画角を保ちつつ、駆動部12の小型化が可能となり、しかも高速な視線方向制御が可能となっている。瞳転送部13によりパンミラー121とチルトミラー122との間に転送された瞳は、対象物から見れば、図6において符号pの位置(つまりパンミラー121により瞳の鏡像となる位置)に見える。この位置は、カメラ11の視点位置と光学的に等価なので、以下の説明では視点として扱う。また、視点を原点として対象物に向く視線方向をz軸とするカメラ座標系を(x,y,z)と定義する(図6参照)。カメラ座標(x,y,z)と固定座標(X,Y,Z)との変換は、下記式(1)のように表現できる。
【0050】
【0051】
ここで、計算の便宜上、二つのミラー121及び122の中心間距離をlmとし、瞳転送部13によるカメラ11の瞳の転送先を、チルトミラー122からの光軸上距離lm/2となる位置とする(図6参照)。さらに、カメラ11とパン・チルトミラー121・122とがなす平面(より具体的には、カメラ11の元々の視点位置と両ミラーの中心点との三点を通る平面)とカメラ座標系上のzc軸とが直交する場合のカメラ座標は、世界座標と一致することになる。
【0052】
視線がパン・チルト方向にそれぞれθ,φだけ回転したとき(このときのパン・チルトミラー回転量はそれぞれθ/2,φ/2)における、両座標系の間の変換は前記式(1)と同様の形で表される。ここでRはパンミラーおよびチルトミラーによる視線の回転行列
【0053】
【0054】
を用いて
R=R (2)
と書ける。また前記した視点位置pは、
【0055】
【0056】
と書ける。
【0057】
したがって、視点位置取得部22では、この計算を用いて、パンミラー121及びチルトミラー122の傾斜角度の情報(すなわちカメラの視線方向θとφ)から、視点位置を算出できる。つまり、前記したように、瞳転送部13で転送された瞳の位置(視点位置)は、パン角度あるいはチルト角度の変更に伴って変動する。なお、視線方向取得部21は、パン・チルトミラーの回転角を用いて、カメラ11の視線方向(つまりθとφ)を簡単に取得できる。
【0058】
図5のステップSB−3)
ついで、座標変換部23は、カメラ11の視線方向及び視点位置の情報(つまりθとφ)を用いて、背景画像における画素の位置情報を、固定座標系(X,Y,Z)における極座標情報に変換する。以下、この変換手順の一例を説明する。
【0059】
(極座標情報の算出)
前提として、カメラ11の焦点距離をf、画像平面をπとおく。また図7(a)に示すように、視点移動における並進成分を0と仮定した場合のカメラ座標系(以下「仮想カメラ座標系」という)
【0060】
【0061】
を考え、この仮想カメラ座標系に対応する画像平面(いわば仮想カメラ上の仮想画像)をπ'とする。背景上のある点をPとおき、点Pを通り平面πおよびπ'に平行な平面をΠとおく(図7(a)参照)。
【0062】
図8のステップSC−1〜SC−2)
以下、極座標の算出手順を、図8のフローチャートを参照しながら説明する。点Pが平面π上に投影される点を(u,v)、平面π'上に投影される点を(u',v')とする。ただし(u,v)および(u',v')の原点はそれぞれzおよびz'上にとる。Lを視点pから平面Πまでの距離とすると、|z'−z|はLに対して充分に小さいと考えられるため、画像π上の画素位置(u,v)から仮想画像π'上の画素位置(u',v')を近似的に以下のように導くことができる。
【0063】
【0064】
図8のステップSC−3)
このように算出した点(u',v')を用いると、XYZ固定座標系における点Pの極座標表示角度(θ,φ)は以下のように表される(図7(b))。
【0065】
【0066】
以上より、距離Lが既知ならば式(5)および(6)を用いて、任意視線で得たカメラ画像における画素位置(u,v)を極座標角度(θ,φ)で表せる。以下、Lが既知であれば問題ないが、仮に既知でなくとも所定条件の下では支障がない。以下、並進成分の取り扱いについて補足して説明する。
【0067】
(並進成分の取り扱い)
式(5)の右辺第二項に示された並進成分は、距離Lが充分に大きい場合には、無視出来る程小さい。つまり、背景が充分遠くにある場合には視点移動は問題にならない。具体的には距離Lが
【0068】
【0069】
を満たすならば、並進に伴う画素のずれはサブピクセル単位に収まる。ただしこの式においてw,hは画像の横/縦画素数、γとγはそれぞれ横/縦方向の画角を表す。
【0070】
一方、背景までの距離が、並進を無視できない程に小さい場合は、距離Lを既知として計算するために弱透視投影(Weak perspective projection)(参考文献:J. Aloimonos: "Perspective approximations", Image and Vision Computing, vol. 8, no. 3, pp. 179.192 (1990).)の仮定を用いることができる。弱透視投影の下では、全ての物体は距離Lの平面上に一度正投影される。言い方を変えれば、全ての物体は距離L ̄の平面上にあると仮定される。この時、仮定による誤差がサブピクセル単位になるために実際の距離Lが満たすべき条件は以下のようになる。
【0071】
【0072】
以上により、背景画像の各画素について、極座標情報を取得することができる。前記の処理は、全ての背景画像について同様に行うことができるので、全背景画像についての極座標情報を取得することができる。
【0073】
図8のステップSC−4)
ついで、本実施形態では、量子化部24が、座標変換部23で得られた極座標情報を量子化する処理を行う。ここで、量子化部24は、カメラ11における視線方向が固定座標系における基準方向(本例ではZ軸方向)から外れるほど、量子化単位としての角度範囲を増やすように量子化を行う。以下、量子化処理の具体例を説明する。
【0074】
(量子化処理)
実際には、背景情報は連続的ではなく離散的な画素値として得られるため極座標上に登録されるデータには密度的な偏りが生じ得る。つまり、極座標上において同じ角度幅であっても、パン角あるいはチルト角の大小によって、担うべき情報量(画素数)が違ってきてしまう。1画素に対応する(u,v)の単位変化量をΔuおよびΔvとすると、これらに相当する(θ,φ)の変化量は、式(6)より次のように求まる。
【0075】
【0076】
極座標上のデータの密度分布は、可能な限り均一であることが望ましい。不均一であると、角度範囲ごとに担う情報量が異なってしまう。また、不均一であるということは、ある角度範囲においては不必要に多い情報量を保存するということでもあるので、メモリの利用効率が悪くなる。そのため、ΔuおよびΔvを、例えば以下のように定義することが出来るであろう。
【0077】
【0078】
これらの定義に基づいて、背景情報登録のための量子化角度
θmn=mΔθ(φ),φ=nΔφ(m,nは整数)
を決定することができる。
【0079】
ここで、m,nは、基準方向(前記の例では固定座標系でのZ方向)からのずれ量と考えることができる。したがって、量子化角度は、基準方向からの視線のずれが大きいほど広くなる。前記のようにして量子化した場合の量子化単位の概念図を図9に示す。チルト角が大きくなると、単位当たりのパン角が受け持つ画素量が多くなるので、量子化単位を一定幅で書けば、矩形の画像が「たる型」に変形することになる。なお、前記の式においてm,nは負の値をとることもできる。また、Δu,Δvの定義によっては、背景情報登録時には、特定の量子化角度範囲に属するデータがないという可能性があるが、その場合は、適宜にデータを補間することにより、空データの参照を防ぐことが好ましい。
【0080】
図5のステップSB−4)
ついで、記録部3は、背景画像における画素の色情報と、当該画素の極座標情報との対応関係を記録する。ここで、記録部3は、画素の極座標情報として、量子化部24で量子化された極座標情報を用いる。
【0081】
図4のステップSA−2)
ついで、実画像情報を算出する。実画像情報算出の手順を、図10のフローチャートを参照しながら説明する。
【0082】
図10のステップSD−1)
まず、撮像部1により、対象物を含む画像である実画像を取得する。画像の取得方法自体は背景画像の場合と同様である。ただし、対象物を視線が追跡する場合は、1回の実画像取得ごとに以下の差分抽出処理を行うことが望ましい。
【0083】
図10のステップSD−2)
一方、視線方向取得部21及び視点位置取得部22により、カメラ11の視線方向及び視点位置を取得する。これについても、背景画像の場合と同様でよい。
【0084】
図10のステップSD−3)
ついで、座標変換部23により、カメラ11の視線方向及び視点位置の情報を用いて、実画像における画素の位置情報を、固定座標系における極座標情報に変換する。この座標変換処理も、前記した背景画像と同様に行うことができる。得られた極座標情報は、対象背景抽出部4に送られる。
【0085】
図4のステップSA−3)
次に、対象背景抽出部4は、実画像における画素の極座標情報を用いて、実画像に対応する角度領域での背景画像を対象背景として特定する。さらに具体的には、対象背景抽出部4は、実画像の極座標情報(実際には量子化されている)に基づいて、実画像が撮影した領域に対応する領域での背景画像を特定することができる。したがって、対象背景抽出部4は、実画像に対応する範囲を特定する極座標情報を記録部3に送り、その極座標情報に対応する対象背景の画像(つまり画素情報)を指定あるいは取得することができる。
【0086】
図4のステップSA−4)
次に、差分抽出部5は、実画像と対象背景とを比較することによって、それらの間の差分を抽出する。実画像と対象背景とは、実空間(図7(a)における平面Πと言ってもよい)における同じ領域の画像となっているので、それらの画素どうしの情報(色情報)を比較することによって、背景差分を抽出することができる。
【0087】
ここで、背景差分の抽出においては、画像平面上での画素位置を基準とする方法(つまり画像空間内で行う方法)と、極座標上での画素位置を基準とする方法(つまり極座標空間内で行う方法)とがある。画像平面上での画素位置を基準とする場合は、極座標と画像平面上の画素位置との対応関係(この対応関係は極座標算出時に算出されている)を使って、画素位置を基準として、同一位置の画素どうしを比較することができる。一方、極座標上での画素位置を基準とする場合は、同じ極座標に対応する画素どうしを比較すればよい。なお、前記した通り、本実施形態においては、極座標情報を量子化したので、量子化された極座標ごとの比較が行われる。また、画像空間内で抽出を行う場合も、極座標が量子化されているので、結果的には位置情報が量子化されていることになる。
【0088】
なお、背景か対象物かを判定する場合、画素単位で比較するよりも、当該画素の周辺の画素情報を加味して判断することが妥当であると考えられる。これは、つぎの理由による:
・照明のフリッカやカメラのノイズによって画素値がある程度変動すると予想されること;
・実際の視線方向のブレ、量子化時の丸め誤差、あるいは各種の機械的誤差のために、全視野背景から抽出した背景画像と実際の背景との間には多少のずれが生じると予想されること。
【0089】
そのため、例えば極座標を基準として判定する場合、対象の画素位置に対応する極座標(θmn,φ)を中心とする周辺、つまり
(θ(m+k)(n+l),φ(n+l))(ここで|k|,|l|<2〜3程度)
に登録された画素値全てについて実画像と背景画像とを比較して、背景か否かを判断するのが妥当と考えられる。画像上の座標を基準とする場合は、これらの極座標に対応する画像座標を算出して、差分抽出を行うことができる。なお、本実施形態においては、前記した背景差分による対象抽出に加えて、画像特徴を利用した対象抽出を行うこともできる。つまり、背景差分による対象抽出と、画像特徴を利用した対象抽出のAND条件により、対象の位置を精度よく特定することが可能である。
【0090】
図4のステップSA−5)
ついで、差分抽出部5は、得られた差分情報(つまり対象物の位置情報)を、図示しない制御部に送る。制御部では、カメラ11の視線方向が対象物の位置を向くように、駆動部12を制御する。これにより、対象物をカメラ11で追跡することができる。前記した各処理が十分高速であれば、移動する対象物をカメラ画像のほぼ中心に配置することが可能となる。
【0091】
図4のステップSA−6)
差分抽出部5で抽出された差分以外の部分は、背景を表す情報(つまり背景情報)として利用可能である。そこで、本実施形態の差分抽出部5は、背景情報を背景更新部6に送る。背景情報は、背景に相当する部分の位置情報(この例では量子化された極座標情報)と、その位置における画素の色情報とを含む。背景更新部6は、背景情報を用いて、記録部3における背景画素情報を極座標情報により特定して更新することができる。これにより、背景情報を最新のものに更新できるので、背景差分の抽出精度を向上させることができる。なお、背景情報の更新は、背景差分が抽出されるたびに行う必要はなく、所定時間間隔ごとに行うことも可能である。あるいは、背景差分抽出による背景情報の更新処理を省略することもでき、例えば、所定時間ごとに、全背景情報を再取得して更新してもよい。
【0092】
図4のステップSA−7)
ついで、カメラ11により新しい実画像を取得した場合は、ステップSA−2に戻り、前記した処理を繰り返す。そうでなければ処理を終了する。
【0093】
本実施形態によれば、視点が移動するカメラを用いた場合において、背景差分抽出を高速で、かつ精度よく行うことが可能となる。例えばリアルタイムでの球技の中継放送において、ボール自体を常に追跡する画像を提供することが可能となる。例えば、常にボールを中心においた動画(例えば、卓球において、あたかもボールの背後から常に周囲を見ているかのような動画)のように、新たな付加価値を持つ画像を提供できるという利点がある。また、本実施形態の装置は、医療やファクトリーオートメーションやロボットビジョンなど、各種の分野において応用可能であると考えられる。
【0094】
(第2実施形態)
次に、本発明の第2実施形態に係る背景差分抽出装置を、主に図11を参照しながら説明する。この第2実施形態の説明においては、前記した第1実施形態の背景差分抽出装置と基本的に共通する構成要素については、同一の符号を付すことにより、説明の煩雑を避ける。
【0095】
第2実施形態の装置は、ブラー生成部7を追加的に備えている点で、第1実施形態の装置と相違している。ブラー生成部7は、対象背景を、視線方向が移動する方向に沿って複数枚特定し、特定された複数枚の対象背景を合成することによって、ブラーを有する合成対象背景を生成する処理を行う機能要素である。また、第2実施形態の差分抽出部5は、実画像と合成対象背景とを比較することによって、差分を抽出する構成とされている。さらに、この第2実施形態では、背景更新部6を省略しており、逐次の背景更新は行わないものとされている。したがって、記録部3に記録されている背景画像は、初期に取得された全背景の画像(あるいはその後に再取得された全背景の画像)となっている。
【0096】
モーションブラー(この明細書においては単に「ブラー」と称する)とは、被写体もしくはカメラ自体が露光中に動くことによって生じる画像のぶれである。追跡対象が常に画像内の固定位置に撮影されるように撮影すると、対象の移動速度によっては、露光時間を短くしても風景部分に大きなぶれ(すなわちブラー)を生じることがある。一方、記録部3に記録されている背景画素情報は、通常、静止状態を前提としているので、背景画像にはブラーは存在しない。したがって、このようなぶれを生じると、背景差分を正確に抽出することが一般的には難しくなるという問題がある。そこで、背景画像にも画像処理によりブラーを生じさせることが考えられる。しかしながら、従来から提案されているブラーカーネルを用いたブラー除去(参考文献:P. Hansen and J. N. D. Oleary: "Deblurring Images: Matrices, Spectra, and Filtering", SIAM Press (2006).)は多くの計算量を要するため、実時間システムへの組み込みには適さない。そこで本実施形態では、カメラ11の視線方向が既知という条件を利用して「ブラーを含んだ背景画像」を合成し、背景差分を行う。
【0097】
以下、ブラー生成処理の具体例について詳しく説明する。
【0098】
(ブラー生成処理)
カメラから得られる映像は、露光中に各受像素子に入射する光の総和として得られる。つまり、時刻tからΔt秒間の露光によって得られる画像I(t)は以下の式で表現できる。
【0099】
【0100】
ここでi(θ,φ)は、視線方向(θ,φ)における静止時の画像を表す。ただし、システムの実装においてはi(θ,φ)は連続的ではなく離散的に取得されるため、露光中のサンプリング回数をnとして
【0101】
【0102】
を推定値として得ることができる。ここで(θ[k],φ[k])は、k回目のサンプリング時(時刻t+(k/n)Δt)における視線方向を表す。この処理は、「対象背景を、視線方向が移動する方向に沿って複数枚特定し、特定された複数枚の対象背景を合成することによって、ブラーを有する合成対象背景I^を生成する処理」に相当する。以上の説明から明らかなように、露光中の各時刻における視線方向を決定できれば、全視野背景に基づいて、モーションブラーを含んだ背景画像を合成することができる。
【0103】
背景画像にモーションブラーを生成できれば、差分抽出の精度を向上させることが期待できる。
【0104】
なお、前記のブラー生成処理において、ブラー生成のために合成する画像枚数は、基本的には、視線の移動速度によって決定することができる。すなわち、画像取得のサンプリング間隔とカメラの露光時間Δtとは通常一定であるが、一定の露光時間Δt内で取得された画像のうち、何枚を用いてブラー生成を行うかを、視線の移動速度によって決めることができる。例えば、視線移動速度が低いときは、Δt内での全取得画像を用いるのではなく、ある程度の画像を間引いて合成することが考えられる。このように、視線移動速度に応じて、ブラー生成に用いる画像枚数を変更することができる。
【0105】
第2実施形態の装置における他の構成及び利点は、前記した第1実施形態と同様なので、これ以上詳しい説明は省略する。
【0106】
なお、本発明の内容は、前記各実施形態に限定されるものではない。本発明は、特許請求の範囲に記載された範囲内において、具体的な構成に対して種々の変更を加えうるものである。
【0107】
例えば、前記した各構成要素は、機能ブロックとして存在していればよく、独立したハードウエアとして存在しなくても良い。また、実装方法としては、ハードウエアを用いてもコンピュータソフトウエアを用いても良い。さらに、本発明における一つの機能要素が複数の機能要素の集合によって実現されても良く、本発明における複数の機能要素が一つの機能要素により実現されても良い。
【0108】
また、機能要素は、物理的に離間した位置に配置されていてもよい。この場合、機能要素どうしがネットワークにより接続されていても良い。グリッドコンピューティング又はクラウドコンピューティングにより機能を実現し、あるいは機能要素を構成することも可能である。
【0109】
さらに、前記した実施形態においては、いわゆるサッカードミラーを用いてカメラの視点を動かす例を説明したが、これに限らず、視点が可動なカメラであれば、本発明を適用することが可能であると考えられる。
【符号の説明】
【0110】
1 撮像部
11 カメラ
12 駆動部
121 パンミラー(鏡面光学系)
122 チルトミラー(鏡面光学系)
13 瞳転送部
2 極座標算出部
21 視線方向
21 視線方向取得部
22 視点位置取得部
23 座標変換部
24 量子化部
3 記録部
4 対象背景抽出部
5 差分抽出部
6 背景更新部
7 ブラー生成部
100 コンピュータ
200 追跡対象物
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11