IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特許7412947画像処理装置、画像処理方法およびプログラム
<>
  • 特許-画像処理装置、画像処理方法およびプログラム 図1
  • 特許-画像処理装置、画像処理方法およびプログラム 図2
  • 特許-画像処理装置、画像処理方法およびプログラム 図3
  • 特許-画像処理装置、画像処理方法およびプログラム 図4
  • 特許-画像処理装置、画像処理方法およびプログラム 図5
  • 特許-画像処理装置、画像処理方法およびプログラム 図6
  • 特許-画像処理装置、画像処理方法およびプログラム 図7
  • 特許-画像処理装置、画像処理方法およびプログラム 図8
  • 特許-画像処理装置、画像処理方法およびプログラム 図9
  • 特許-画像処理装置、画像処理方法およびプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-04
(45)【発行日】2024-01-15
(54)【発明の名称】画像処理装置、画像処理方法およびプログラム
(51)【国際特許分類】
   G06T 7/254 20170101AFI20240105BHJP
   G06T 7/90 20170101ALI20240105BHJP
【FI】
G06T7/254 B
G06T7/90 D
【請求項の数】 15
(21)【出願番号】P 2019181532
(22)【出願日】2019-10-01
(65)【公開番号】P2021056936
(43)【公開日】2021-04-08
【審査請求日】2022-10-03
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110001243
【氏名又は名称】弁理士法人谷・阿部特許事務所
(72)【発明者】
【氏名】板倉 希名
【審査官】伊知地 和之
(56)【参考文献】
【文献】特開2017-091298(JP,A)
【文献】特開平10-191020(JP,A)
【文献】特開2009-211607(JP,A)
【文献】特開2003-150964(JP,A)
【文献】国際公開第2007/076890(WO,A1)
【文献】高村誠之他,背景差分法に基づく高速背景除去方式に関する一考察,情報処理学会研究報告,日本,社団法人情報処理学会,2003年08月04日,第2003巻 第81号,pp.23-28
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00
G06T 3/00 - 3/60
G06T 5/00 - 5/50
G06T 7/00 - 7/90
G06V 10/00 - 20/90
G06V 30/418
G06V 40/16
G06V 40/20
CSDB(日本国特許庁)
(57)【特許請求の範囲】
【請求項1】
撮像画像からオブジェクトの形状を示す前景画像を生成する画像処理装置であって、
前記撮像画像及び前記オブジェクトの存在しない背景画像を取得する取得手段と、
前記撮像画像から前記オブジェクトの形状に対応する前景領域を抽出して、当該前景領域を表す前景画像を生成する抽出手段と、
前記前景画像が表す前記前景領域のうち前記オブジェクトの輪郭領域を検出する検出手段と、
前記前景画像における前記輪郭領域を構成する画素に対応する前記撮像画像内の画素の色が、前記背景画像によって示される背景の色と類似する場合、前記前景画像における前記輪郭領域を構成する画素の画素値を、背景領域を表す画素値に変更する補正手段と、
を有することを特徴とする画像処理装置。
【請求項2】
前記前景画像における前記輪郭領域を構成する画素に対応する前記撮像画像内の注目画素の色が、前記撮像画像におけるオブジェクトの色よりも前記背景画像によって示される背景の色に近い場合、当該注目画素の色は当該背景の色に類似していると判定する判定手段を有し
前記補正手段は、前記判定手段にて前記背景の色に類似すると判定された前記注目画素に対応する前記前景画像における前記輪郭領域を構成する画素の画素値を、前記背景領域を表す画素値に変更する、
ことを特徴とする請求項に記載の画像処理装置。
【請求項3】
前記判定手段は、前記注目画素の色について、前記撮像画像におけるオブジェクトの色よりも前記背景画像によって示される背景の色に近い色であるかどうかを、色味に関する所定の評価値を用いて判定することを特徴とする請求項に記載の画像処理装置。
【請求項4】
前記所定の評価値は、MSE、MAE、RMSEのうちいずれかであることを特徴とする請求項に記載の画像処理装置。
【請求項5】
前記判定手段は、前記前景画像と前記背景画像との間で対応する画素同士の画素値を比較し、その差分が所定の閾値以下の場合に、前記注目画素の色は前記背景画像によって示される背景の色に類似していると判定する、ことを特徴とする請求項に記載の画像処理装置。
【請求項6】
前記判定手段は、前記撮像画像の色空間における画素値、又は当該色空間を異なる色空間に変換した変換後の色空間における画素値を用いて、前記判定を行うことを特徴とする請求項3乃至5のいずれか一項に記載の画像処理装置。
【請求項7】
前記撮像画像および前記背景画像は、複数の色成分で表現される共通の色空間を有し、
前記判定手段は、前記注目画素の色について、前記撮像画像におけるオブジェクトの色よりも前記背景画像によって示される背景の色に近い色であるかどうかを、前記撮像画像を構成する画素における画素値の色成分比に基づいて判定することを特徴とする請求項に記載の画像処理装置。
【請求項8】
前記背景画像の色空間における出現頻度が最も高い色成分を導出する導出手段をさらに有し、
前記判定手段は、前記導出手段にて導出された前記背景画像内で出現頻度が最も高い色成分と、前記撮像画像内の前記注目画素においてその値が最大の色成分とが同一でない場合、前記注目画素の色は前記背景画像によって示される背景の色に類似しないと判定する、
ことを特徴とする請求項に記載の画像処理装置。
【請求項9】
前記判定手段は、前記共通の色空間に従った画素値、又は当該色空間を異なる色空間に変換した変換後の色空間に従った画素値を用いて、前記判定を行うことを特徴とする請求項に記載の画像処理装置。
【請求項10】
前記検出手段は、前記抽出手段にて生成された前記前景画像における注目画素が前記撮像画像におけるオブジェクトと前記背景画像によって示される背景との境界付近を構成する画素であると見做し得る所定の条件を満たす場合に、当該注目画素を、前記輪郭領域を構成する画素と決定して、前記輪郭領域を検出する、ことを特徴とする請求項2乃至9のいずれか一項に記載の画像処理装置。
【請求項11】
前記所定の条件は、前記前景画像における注目画素が、前記前景領域を構成する画素であり、かつ、当該注目画素を含む所定のブロック内に前記背景領域を構成する画素が1つ以上存在する場合である、ことを特徴とする請求項10に記載の画像処理装置。
【請求項12】
前記所定の条件は、前記前景画像における注目画素の画素値と、前記前景画像に対してモルフォロジ処理を行って得られた収縮画像における対応する画素の画素値とが同一でない場合である、ことを特徴とする請求項10に記載の画像処理装置。
【請求項13】
撮像画像からオブジェクトの形状を示す前景画像を生成する画像処理装置であって、
前記撮像画像を取得する取得手段と、
前記撮像画像から前記オブジェクトの形状に対応する前景領域を抽出して前景画像を生成する抽出手段と、
前記前景画像から前記オブジェクトの輪郭領域を検出する検出手段と、
前記前景画像における前記輪郭領域を構成する画素を、当該画素に対応する前記撮像画像内の画素の色が背景の色と類似するかどうかに基づき補正する補正手段と、
を有し、
前記補正手段によって得られた補正後の前景画像を、前記検出手段および前記補正手段における処理の対象となる前景画像とする
ことを特徴とする画像処理装置。
【請求項14】
撮像画像からオブジェクトの形状を示す前景画像を生成する画像処理方法であって、
前記撮像画像及び前記オブジェクトの存在しない背景画像を取得する取得ステップと、
前記撮像画像から前記オブジェクトの形状に対応する前景領域を抽出して、当該前景領域とそれ以外の背景領域とを表す前景画像を生成する抽出ステップと、
前記前景画像が表す前記前景領域のうち前記オブジェクトの輪郭領域を検出する検出ステップと、
前記前景画像における前記輪郭領域を構成する画素に対応する前記撮像画像内の画素の色が、前記背景画像によって示される背景の色に類似する場合、前記前景画像における前記輪郭領域を構成する画素を、前記背景領域を表す画素に変更する補正ステップと、
を含むことを特徴とする画像処理方法。
【請求項15】
コンピュータを請求項1乃至13のいずれか一項に記載の画像処理装置の各手段として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、撮像画像から、オブジェクトの形状を示す前景画像を生成する技術に関する。
【背景技術】
【0002】
従来、撮像画像からオブジェクト(被写体)に対応する前景領域を抽出する手法として、背景差分法が存在する。背景差分法では、前景となるオブジェクトが写っている撮像画像の各画素値と、当該オブジェクトが写っていない背景のみの画像(背景画像)の各画素値との差分に基づいて、オブジェクトに対応する前景領域を抽出する。ここで、オブジェクトと背景との境界付近において、撮像画像における画素値と背景画像における画素値との違いが小さくなる場合がある。この場合、本来は背景となるべき部分が、オブジェクトに対応する前景領域として誤って抽出されてしまうことが起こる。つまり、従来の背景差分法には、オブジェクトの輪郭に沿って正確に前景領域を抽出することができないことがあった。この点、特許文献1には、撮像画像から前景領域を抽出した後、オブジェクトのエッジ情報に基づいて、抽出した前景領域の整形を行う技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開平10-23452号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記特許文献1の手法では、エッジ情報自体に誤りが含まれていると、オブジェクトの形状を適切に整形ができないという問題があった。
【0005】
そこで、本開示に係る技術は、前景となるオブジェクトと背景との境界が曖昧でエッジ情報を正確に抽出することが困難な場合においても、精度のよい前景画像を得ることを目的とする。
【課題を解決するための手段】
【0006】
本開示に係わる画像処理装置は、撮像画像からオブジェクトの形状を示す前景画像を生成する画像処理装置であって、前記撮像画像及び前記オブジェクトの存在しない背景画像を取得する取得手段と、前記撮像画像から前記オブジェクトの形状に対応する前景領域を抽出して、当該前景領域を表す前景画像を生成する抽出手段と、前記前景画像が表す前記前景領域のうち前記オブジェクトの輪郭領域を検出する検出手段と、前記前景画像における前記輪郭領域を構成する画素に対応する前記撮像画像内の画素の色が、前記背景画像によって示される背景の色と類似する場合、前記前景画像における前記輪郭領域を構成する画素の画素値を、背景領域を表す画素値に変更する補正手段と、を有することを特徴とする。
【発明の効果】
【0007】
本開示の技術によれば、前景となるオブジェクトと背景との境界が曖昧でエッジ情報を正確に抽出することが困難な場合においても、精度のよい前景画像を得ることができる。
【図面の簡単な説明】
【0008】
図1】前景画像を生成する処理の概要を説明する図
図2】仮想視点映像を生成する画像処理システムの構成の一例を示す図
図3】カメラアダプタの内部構成を示す機能ブロック図
図4】実施形態1に係る、画像処理部の詳細を示す機能ブロック図
図5】実施形態1に係る、前景画像生成処理の流れを示すフローチャート
図6】注目画素が輪郭領域の画素であるか否かを判定する処理の説明図
図7】実施形態1の効果を説明する図
図8】実施形態2に係る、画像処理部の詳細を示す機能ブロック図
図9】実施形態2に係る、前景画像生成処理の流れを示すフローチャート
図10】実施形態2の効果を説明する図
【発明を実施するための形態】
【0009】
以下、本発明の実施形態について、図面を参照して説明する。なお、以下の実施形態は本発明を限定するものではなく、また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。なお、同一の構成については、同じ符号を付して説明する。
【0010】
[実施形態1]
本実施形態では、オブジェクトに対応する前景領域を撮像画像から抽出した後、当該オブジェクトの輪郭領域(背景との境界部分)を検出する。そして、検出した輪郭領域における色を、背景の色との違いに基づき補正することにより、オブジェクトの形状を示す前景画像を生成する。なお、本実施形態において前景画像は、前景領域を“1”、それ以外の背景領域を“0”で表す二値画像とするが、さらに前景領域の確からしさを表す値を加えた多値画像としてもよい。
【0011】
また、本実施形態では、撮像画像から生成したオブジェクトの前景画像を、仮想視点映像の生成に利用するケースを例に説明を行うものとする。すなわち、オブジェクトの前景画像からその3次元形状データを生成し、仮想視点情報に基づいて当該オブジェクト含んだ仮想視点映像を生成する、というユースケースを想定する。
【0012】
(本実施形態の概要)
本実施形態における、前景画像を生成する処理の概要について、図1を参照して説明する。まず、前景領域の抽出対象となる画像(以下、「対象画像」と表記)10が撮像装置であるカメラ11によって撮像される。この対象画像10には、前景としての人物オブジェクト12と背景としてのフィールド13とが写っている。さらに、対象画像10と同一の撮像視点から、人物オブジェクト12がいない状態で背景となるフィールド13を写した画像(以下、「背景画像」と表記)14を撮像する。次に、対象画像10と背景画像14とを対応する画素同士で比較し、画素値の違いが大きい画素を人物オブジェクト12の構成画素と見做すことで、対象画像10から前景領域だけを抽出する。これにより、人物オブジェクト12のシルエットを表した前景画像を取得する。なお、オブジェクトの形状を示す前景画像は、シルエット画像やマスク画像とも呼ばれるものであるが、本明細書では“前景画像”を用いることとする。図1における画像15は、理想的な前景画像を示している。しかしながら実際には、レンズの収差や画像解像度などの影響により、前景領域の輪郭が不明確になることがある。これは、対象画像10上のオブジェクトと背景との境界付近において、背景の色に近いものからオブジェクトの色に近いものまで、色々な画素値の画素が混ざるためである。オブジェクトと背景との境界付近の画素がこのような状態にあると、オブジェクトの画素と背景の画素とに正しく峻別することができないため、オブジェクトの輪郭に沿わない精度の低い前景領域となってしまう。図1における画像15’は、オブジェクトの輪郭に沿っていない精度の低い(誤りを含んだ)前景画像を示している。そこで、本実施形態では、撮像画像から生成した前景画像において誤りを含んでいる可能性の高い輪郭部分16を検出する。そして、検出した輪郭部分16を構成する画素の画素値を、撮像画像における対応する画素の色が背景の色と類似する場合に、背景を示す画素値に変更する補正処理を行う。こうして、輪郭部分における誤りを修正した前景画像が、最終的な前景画像として出力されることになる。以上が、本実施形態で行われる、前景画像生成処理の概要である。以下、本実施形態の具体的な構成について述べる。
【0013】
(システム構成)
図2は、仮想視点映像を生成する画像処理システムの構成の一例を示す図である。画像処理システム100は、撮影モジュール110a~110z、データベース(DB)250、サーバ270、制御装置300、スイッチングハブ180、及びエンドユーザ端末190を有する。すなわち、画像処理システム100は、映像収集ドメイン、データ保存ドメイン、及び映像生成ドメインという3つの機能ドメインを有する。映像収集ドメインは撮影モジュール110a~110zを含み、データ保存ドメインはDB250とサーバ270を含み、映像生成ドメインは制御装置300及びエンドユーザ端末190を含む。
【0014】
制御装置300は、画像処理システム100を構成するそれぞれのブロックに対してネットワークを通じて動作状態の管理及びパラメータ設定制御などを行う。ここで、ネットワークはEthernet(登録商標)であるIEEE標準準拠のGbE(ギガビットイーサーネット)や10GbEでもよいし、インターコネクトInfiniband、産業用ローカルエリアネットワーク等を組合せて構成されてもよい。また、これらに限定されず、他の種類のネットワークであってもよい。
【0015】
最初に、撮影モジュール110a~110zの26セット分の撮像画像を撮影モジュール110zからサーバ270へ送信する動作を説明する。撮影モジュール110a~110zは、それぞれ1台ずつのカメラ112a~112zを有する。以下では、撮影モジュール110a~110zまでの26セットのシステムを区別せず、単に「撮影モジュール110」と記載する場合がある。各撮影モジュール110内の装置についても同様に、「カメラ112」、「カメラアダプタ120」と記載する場合がある。なお、撮影モジュール110の台数を26セットとしているが、あくまでも一例でありこれに限定されない。
【0016】
撮影モジュール110a~110zはデイジーチェーンにより接続される。この接続形態により、撮影画像の4Kや8Kなどへの高解像度化及び高フレームレート化に伴う画像データの大容量化において、接続ケーブル数の削減や配線作業の省力化ができる効果がある。なお、接続形態は任意であり、例えば撮影モジュール110a~110zがスイッチングハブ180にそれぞれ接続されて、スイッチングハブ180を経由して撮影モジュール110間のデータ送受信を行うスター型のネットワーク構成としてもよい。
【0017】
本実施形態では、各撮影モジュール110はカメラ112とカメラアダプタ120とで構成されているがこれに限定されない。例えば、マイク、雲台、外部センサを有していてもよい。また、本実施形態では、カメラ112とカメラアダプタ120とが分離された構成となっているが、同一筺体で一体化されていてもよい。撮影モジュール110a内のカメラ112aにて得られた撮像画像は、カメラアダプタ120aにおいて後述の画像処理が施された後、撮影モジュール110bのカメラアダプタ120bに伝送される。同様に撮影モジュール110bは、カメラ112bにて得られた撮像画像を、撮影モジュール110aから取得した撮像画像と合わせて撮影モジュール110cに伝送する。このような動作を続けることにより、26セット分の撮像画像が、撮影モジュール110zからスイッチングハブ180に伝わり、その後、サーバ270へ伝送される。
【0018】
なお、本実施形態では、個々のカメラアダプタ120内で前景画像の生成までを行うものとして説明する。ただし、このような態様に限定されるものではなく、26セット分の撮像画像を受け取ったサーバ270にて、個々の撮像画像に対応する前景画像の生成を行うような構成であってもよい。
【0019】
(カメラアダプタの構成)
次に、カメラアダプタ120の詳細について説明する。図3は、カメラアダプタ120の内部構成を示す機能ブロック図である。カメラアダプタ120は、ネットワークアダプタ121、伝送部122、画像処理部123及びカメラ制御部124から構成される。
【0020】
ネットワークアダプタ121は、他のカメラアダプタ120やサーバ270、制御装置300とデータ通信を行う。また、例えばIEEE1588規格のOrdinay Clockに準拠し、サーバ270との間で送受信したデータのタイムスタンプの保存や、サーバ270との時刻同期も行う。なお、他のEtherAVB規格や、独自プロトコルによってタイムサーバとの時刻同期を実現してもよい。本実施形態では、ネットワークアダプタ121としてNIC(Network Interface Card)を利用するが、これに限定されない。
【0021】
伝送部122は、ネットワークアダプタ121を介してスイッチングハブ180等に対するデータの伝送を制御する。伝送部122は、送受信されるデータに対して所定の圧縮方式、圧縮率、及びフレームレートを適用した圧縮を行う機能と、圧縮されたデータを伸張する機能とを有している。また、受信したデータ及び画像処理部123で処理されたデータのルーティング先を決定する機能や、決定したルーティング先へデータを送信する機能を有している。また、画像データを、他のカメラアダプタ120またはサーバ270へ転送するためのメッセージを作成する機能も有している。メッセージには画像データのメタ情報が含まれる。このメタ情報には、画像撮影のサンプリング時のタイムコードまたはシーケンス番号、データ種別、及びカメラ112の識別子などが含まれる。なお、送信する画像データは圧縮されていてもよい。また、他のカメラアダプタ120からメッセージを受け取り、メッセージに含まれるデータ種別に応じて、伝送プロトコル規定のパケットサイズにフラグメントされたデータ情報を画像データに復元する。
【0022】
画像処理部123は、カメラ制御部124の制御によりカメラ112が撮影した画像データに基づき、オブジェクトの形状を示す前景画像を生成する処理を行う。また、動的キャリブレーションなどの処理も行う。前景画像の生成を複数のカメラアダプタ120それぞれが行うことで、画像処理システム100における負荷を分散させることができる。動的キャリブレーションは、撮影中に行うキャリブレーションで、カメラ毎の色のばらつきを抑えるための色補正処理や、カメラの振動に起因するブレに対して画像の位置を安定させるためのブレ補正処理(電子防振処理)などが含まれる。
【0023】
カメラ制御部124は、カメラ112と接続し、カメラ112の制御、撮影画像取得、同期信号提供、時刻設定などを行う。カメラ112の制御には、例えば撮影パラメータ(画素数、色深度、フレームレート、及びホワイトバランスの設定など)の設定及び参照、カメラ112の状態情報(撮影中、停止中、同期中、及びエラーなど)の取得、撮影の開始及び停止や、ピント調整などがある。
【0024】
(前景画像生成処理の詳細)
続いて、本実施形態に係る、カメラアダプタ120での前景画像生成処理について、図4に示す機能ブロック図及び図5に示すフローチャートを参照して、詳しく説明する。図4に示すとおり、カメラアダプタ120内の画像処理部123は、前景画像の生成に関わる5つの機能部を有する。具体的には、画像取得部401、前景領域抽出部402、輪郭領域検出部403、類似度判定部404、画素値補正部405を有する。また、図5のフローチャートに示す一連の処理は、カメラアダプタ120内の不図示のCPUが、所定のプログラムを不図示のワークメモリ(RAM)に展開して実行することで実現される。但し、以下に示す処理の全てが1個のCPUによって実行される必要はなく、処理の一部または全部がCPU以外の1つ又は複数の処理回路によって行われるように構成してもよい。カメラアダプタ120に入力される撮像画像は、複数フレームからなる動画像である。例えば、60fpsのフレームレートで撮像された動画像データが10秒分入力された場合は、全600フレームの連番画像がストリームとして入力され、フレーム単位で以下に示す処理が順に行われることになる。ただし、入力される撮像画像は動画像に限定される訳ではなく、静止画像であってもよい。なお、以下の説明において記号「S」はステップを表す。
【0025】
S501では、画像取得部601が、前景領域の抽出対象となるフレーム(以下、「対象画像」と表記)と背景画像のデータを取得する。ここで、背景画像データは、例えば撮像シーンがサッカーの試合であれば選手やボールなどのオブジェクトが存在しない状態のスタジアムにて試合開始直前などに対象画像と同一条件で撮像し、不図示のHDD等に保持しておいたものを読み込めばよい。この場合において同一条件とは、カメラ112の位置、姿勢、焦点距離、光学中心などの物理的条件のほか、天候や時間帯など環境条件も含む。なお、予め撮像した背景画像のデータをHDD等から読み込んで取得するのではなく、入力された動画像を構成する複数フレームに対して中間値フィルタや平均値フィルタを用いたフィルタ処理を行って作成してもよい。或いは、複数フレームに対してクラスタリング処理を行って作成してもよい。本ステップで取得した対象画像と背景画像のデータは、前景領域抽出部402と類似度判定部404に出力される。
【0026】
S502では、前景領域抽出部402が、S501で取得した対象画像と背景画像を用いて、対象画像から前景領域を抽出する。具体的には、対象画像と背景画像における対応する画素同士の画素値を比較し、異なる画素値を持つ画素位置を特定する。そして、画素値が同一である座標の画素の画素値を“0”、画素値が同一でない座標の画素の画素値を“1”とすることで、対象画像における前景領域を示す2値画像が得られる。なお、画素値は厳密に同一である必要はなく、所定の閾値(例えば最大画素値の凡そ5%)の範囲内であれば同一と見做してもよい。こうして得られた2値画像は、暫定的な前景画像(以下、「暫定前景画像」と呼ぶ。)として、輪郭領域検出部403、類似度判定部404及び画素値補正部405に出力される。なお、本実施形態では、背景差分法を用いて前景領域の抽出を行うことを前提に説明を行っているが、例えばフレーム間差分法を用いても構わない。
【0027】
S503では、輪郭領域検出部403が、S502で得られた暫定前景画像におけるオブジェクトの輪郭領域を検出するためのマップ(以下、「輪郭マップ」と呼ぶ。)を初期化する。具体的には、輪郭マップの全画素の画素値を“0”に設定する。この輪郭マップは、暫定前景画像と画素数や画像サイズが共通の2値画像である。暫定前景画像における、オブジェクトと背景との境界付近を示す輪郭領域を構成する画素(或いは、その可能性が高い画素)に対応する画素には“1”、それ以外の画素には“0”の値が付与される。本ステップでの初期化により、輪郭マップ内の全画素について、輪郭領域ではないことを示す値“0”が初期値として設定されることになる。初期化処理後はS504に進む。
【0028】
S504では、輪郭領域検出部403が、S502で得られた暫定前景画像の構成画素のうち注目する画素(以下、「注目画素」と表記)について、オブジェクトと背景との境界付近を示す輪郭領域の画素であるかを判定する。この際の注目画素は、例えば前景画像の左上の画素から順次選択される。ここで、図6を参照して、注目画素が輪郭領域の画素であるか否かの判定処理の詳細を説明する。
【0029】
まず、注目画素の座標(u0,v0)を中心とした所定サイズ(ここでは5×5)のブロック600を設定する。所定サイズは、対象画像のサイズ(4KやフルHDなど)やオブジェクトの大きさ(対象画像に占める割合)に応じて事前に定めておけばよい。次に、暫定前景画像における注目画素601の画素値とブロック600に含まれる各画素の画素値とに基づき、注目画素601が輪郭領域の画素であるかを判定する。具体的には、暫定前景画像における注目画素601の画素値が“1(=オブジェクト)”であり、かつ、ブロック600内に画素値が“0(=背景)の画素が1つ以上存在する場合、注目画素601は輪郭領域の画素であると判定する。いま、ブロック600が、それぞれ602~604の状態であったとする。ブロック602~604における各格子はそれぞれ1画素を表しており、画素値が“0”ある画素を黒、画素値が“1”である画素を白で示している。図6の例では、ブロック604の場合に、注目画素601は輪郭領域の画素であると判定されることになる。注目画素601が背景であるブロック602や、ブロック600内に背景の画素がないブロック603のように、上記条件を満たさない場合は、注目画素601は輪郭領域の画素ではないと判定される。なお、輪郭領域の画素であるか否かの判定手法は、上述の方法に限られない。例えば、暫定前景画像に対してモルフォロジ処理を施した収縮画像を生成し、暫定前景画像における注目画素の画素値と収縮画像における当該注目画素に対応する画素の画素値とが同一でない場合に輪郭領域の画素であると判定してもよい。
【0030】
S505では、輪郭領域検出部403が、S504での判定結果に従って、注目画素についての輪郭マップにおける画素値を更新する。すなわち、注目画素が輪郭領域の画素であると判定された場合は、注目画素の座標(u0,v0)と同一座標に対応する、輪郭マップE(u0,v0)における画素の画素値を“1”に変更する。また、注目画素が輪郭領域の画素ではないと判定された場合は、注目画素の座標(u0,v0)と同一座標に対応する、輪郭マップE(u0,v0)の画素の画素値を“0”のまま維持する。
【0031】
S506では、暫定前景画像内の全画素が注目画素として処理されたかどうかが判定される。未処理の画素があればS504に戻り、次の注目画素が選択されて処理が続行される。一方、全画素の処理が完了していれば、輪郭領域検出部403から更新を終えた輪郭マップが画素値補正部405に出力され、次の処理(S507)に進む。
【0032】
S507では、類似度判定部404が、対象画像を構成する各画素の色が背景の色に類似しているか否かを判定するためのマップ(以下、「類否マップ」と呼ぶ。)を初期化する。具体的には、類否マップの全画素の画素値を“0”に設定する。この類否マップは、対象画像と画素数や画像サイズが共通の2値画像である。対象画像内の画素のうち背景の色と類似する色を持つと判定された画素に対応する画素には“1”、それ以外の画素には“0”の値が付与される。本ステップでの初期化により、類否マップの全画素について、背景の色に類似していないことを示す値“0”が初期値として設定されることになる。初期化処理後はS508に進む。
【0033】
S508では、類似度判定部404が、対象画像における注目画素の色と背景画像によって示される背景の色との類似度を、色味に関する所定の評価値を用いて判定する。ここでいう「色」には、いわゆる色の三属性(色相、明度、彩度)の情報が含まれる。また、注目画素の意味や選択方法は、S504のときと同じであるので説明を省く。以下、本ステップにおける類似度判定について詳しく説明する。
【0034】
まず、注目画素の座標(u0,v0)を中心としたブロックを設定する。ブロックのサイズはS504のときと同じでもよいし異なっていてもよい。次に、背景の色と類似する色を持つ画素であるか否かを判定する指標となる、注目画素についての2つの評価値CF、CBを求める。この2つの評価値CF、CBには例えば平均二乗誤差(MSE)を用い、それぞれ以下の式(1)及び式(2)で表される。
【0035】
【数1】
【0036】
【数2】
【0037】
上記式(1)及び式(2)において、I(x,y)は対象画像における座標(x,y)の画素値、IF(x,y)は暫定前景画像における座標(x,y)の画素値を表す。また、kはRGB3チャンネルを識別するための添え字を表し、Bはブロックを表す。また、nFは、ブロック内に含まれる、暫定前景画像においてオブジェクトに対応する前景領域の画素(画素値=1)の総数、nBはオブジェクトに対応しない背景領域の画素(画素値=0)の総数を表す。ここで、評価値CFは、注目画素の画素値とブロック内に含まれる前景領域の画素値との違いを表し、両者が類似しているほど値は小さくなる。また、評価値CBは、注目画素の画素値とブロック内に含まれる背景領域の画素値との違いを表し、両者が類似しているほど値は小さくなる。なお、本実施形態では色の違いをMSE(Mean Squared Error)により評価しているが、評価指標はこれに限定されるものではなく、MAE(Mean Absolute Error)やRMSE(Root Mean Square Error)などを用いてもよい。次に、求めた2つの評価値CF、CBに基づいて、注目画素の色が背景の色と類似しているかを判定する。具体的には、注目画素について得られた評価値CFが評価値CB以上であれば背景の色と類似していると判定する。逆に、注目画素について得られた評価値CFが評価値CB未満であれば背景の色と類似していないと判定する。なお、本実施形態では、注目画素の画素値が、注目画素を中心としたブロック内に含まれる前景領域の画素値に比べて背景領域の画素値に類似している場合、注目画素の色が背景の色に類似していると判定した。しかしながら、類否の判定方法はこれに限られない。例えば、撮像画像内の注目画素における画素値と、当該注目画素と同一座標の背景画像における画素値との差が小さい場合(所定の閾値以下の場合)に、注目画素の色が背景の色と類似していると判定してもよい。この際は、上述した輪郭領域の画素における色の混ざりを考慮し、所定の閾値として相対的に大きな値を設定する。
【0038】
S509では、類似度判定部404が、S508での判定結果に従って、注目画素についての類否マップにおける画素値を更新する。すなわち、注目画素の色が背景の色と類似すると判定された場合は、注目画素の座標(x,y)と同一座標に対応する、類否マップM(x,y)における画素の画素値を“1”に変更する。また、注目画素の色が背景の色と類似していないと判定された場合は、注目画素の座標(x,y)と同一座標に対応する、類否マップ(x,y)の画素の画素値を“0”のまま維持する。
【0039】
S510では、対象画像内の全画素が注目画素として処理されたかどうかが判定される。未処理の画素があればS508に戻り、次の注目画素が選択されて処理が続行される。一方、全画素の処理が完了していれば、類似度判定部404から更新を終えた類否マップが画素値補正部405に出力され、次の処理(S511)に進む。
【0040】
S511では、画素値補正部405が、暫定前景画像における注目画素(u1,v1)の画素値を、輪郭マップと類否マップとに基づき補正する。注目画素の意味や選択方法は、S504やS508のときと同じであるので説明を省く。具体的には、以下の3つの条件を満たす場合、注目画素は前景領域を構成する画素ではない(背景領域を構成する画素である)と判定し、暫定前景画像における注目画素の画素値を“0”に変更する。一方、以下の3つの条件を満たさない場合、注目画素は前景領域を構成する画素であると判定し、注目画素の画素値の変更は行わない。
第1条件:IF(u1,v1)=1(暫定前景画像における画素値が“1”)であること。
第2条件:E(u1,v1)=1(輪郭マップにおける画素値が“1”)であること。
第3条件:M(u1,v1)=1(類否マップにおける画素値が“1”)であること。
【0041】
上述の通り、暫定前景画像における輪郭領域の各画素は、背景の色とオブジェクトの色とが混ざった画素値を持ち、誤りを含んでいる可能性が高い。そこで、上述の第1条件と第2条件とを用いて、前景領域と輪郭領域のいずれにも属するかどうかを判定する。そして、いずれにも属すると判定された場合において、さらに第3条件も満たす場合は、当該注目画素は背景に属する画素であると判定して、注目画素の画素値を“0”に変更する。以上のような補正処理により、暫定前景画像における誤り部分が修正される。
【0042】
S512では、暫定前景画像内の全画素が注目画素として処理されたかどうかが判定される。未処理の画素があればS511に戻り、次の注目画素が選択されて処理が続行される。一方、全画素の処理が完了していれば、画素値補正部405は、補正処理後の暫定前景画像を最終的な前景画像として出力する。
【0043】
以上が、本実施形態に係る、前景画像生成処理の内容である。ここで、図7を参照して、本実施形態の効果について説明する。前述の図1の場合と同様、カメラ11によって撮像された対象画像10には、前景としての人物オブジェクト12と背景としてのフィールド13とが写っている。そして、対象画像10と同一の撮像視点からフィールド13のみを撮像した背景画像を用いて人物オブジェクト12のシルエットを表した前景画像が生成される。図7には、3種類の前景画像701~703が示されている。まず、前景画像701の場合、人物オブジェクト12とフィールド13との境界付近において、本来は背景領域となるべき画素を誤って前景領域の構成画素と判定してしまっており、人物オブジェクト12のシルエットが実際の輪郭よりも膨張して表現されている。また、前景画像702の場合、人物オブジェクト12のシルエットに相当する部分は正確に抽出できている一方で、対象画像10に含まれるノイズ部分を前景領域として誤って抽出してしまっている。従来手法によるこれら前景画像に対し、本実施形態の手法によって得られる前景画像703の場合、ノイズ部分を前景領域として誤抽出することなく人物オブジェクトのシルエットのみを正確に抽出できている。
【0044】
<変形例>
上述のS508では、対象画像における注目画素の色と背景の色との類似度を判定する際にRGB値の情報を用いていた。RGB値に代えて、例えば、RGB色空間をHSVやLabなどの異なる色空間に変換し、変換後の色空間におけるHSV値やLab値の情報を用いてもよい。
【0045】
以上のとおり本実施形態によれば、前景となるオブジェクトと背景との境界が曖昧であっても、前景となるオブジェクトの輪郭に沿って高精度に前景領域を抽出することができる。
【0046】
[実施形態2]
次に、背景色との類似度を色成分の出現頻度に基づいて判定する態様を、実施形態2として説明する。なお、画像処理システムの構成といった実施形態1と共通の内容については説明を省略することとし、以下では差異点である画像処理部123の構成と処理内容を中心に説明を行うこととする。
【0047】
(本実施形態の概要)
実施形態1では、オブジェクトの輪郭領域において背景の色に近い色を持つ画素は背景領域の画素と見做されるところ、オブジェクトの色にも同程度に近い色を持つ画素の場合は前景領域の画素と見做されることもある。つまり、所定の評価値に基づくRGB値全体の類似度合いに基づく判定の場合には、誤りを持つ画素を検出できないことがあり、最終的に得られる前景画像の精度がその分だけ低下してしまう。そこで、本実施形態では、背景画像の各画素において出現頻度が最も高い色成分を求め、対象画像内の注目画素において、当該求めた色成分の値が最も大きいかどうかを基準に、注目画素の色が背景の色に近いかどうかを判定する。ここで、色成分とは、RGB色空間の場合であればR(レッド)、G(グリーン)、B(ブルー)の各チャンネルに対応する色成分を意味する。本実施形態では、対象画像はRGB色空間で色が表現されているものとする。例えば、芝生の上に人が立っているシーンを撮像した場合、得られた撮像画像における人と芝生の境界付近の画素は、芝生の色と人の色とが混ざった色の画素値を持つ。また、芝生の色を表す画素値は、一般的にG成分が最大値を取るような画素値となる。従って、輪郭領域の画素において、G成分が最大となる画素については背景を構成する画素と見做すことができる。具体的な処理内容としては、まず、前景領域の抽出処理と併せて、背景画像における各画素の色解析処理を行う。この色解析処理により、RGBのうち出現頻度の最も高い色成分を特定する。そして、対象画像における前景領域かつ輪郭領域の画素において最大値を持つ色成分が、背景画像において出現頻度の最も高い色成分と同一である場合、当該画素は前景領域の画素ではないと判定して、その色を背景の色に変更する。これにより、精度の高い前景画像が得られるようにする。
【0048】
(前景画像生成処理の詳細)
本実施形態に係る、カメラアダプタ120での前景画像生成処理について、図8に示す機能ブロック図及び図9に示すフローチャートを参照して、詳しく説明する。図8に示すとおり、本実施形態に係る画像処理部123’は、前景画像の生成に関わる6つの機能部を有する。具体的には、画像取得部401、前景領域抽出部402、輪郭領域検出部403、類似度判定部404’、画素値補正部405及び背景色解析部801を有する。
【0049】
S901~S906は、実施形態1の図5のフローチャートにおけるS501~S506にそれぞれ対応し、異なるところはないので説明を省く。
【0050】
S907では、背景色解析部801が、S901で取得した背景画像を解析し、背景画像を構成する各画素において出現頻度が最も高い色成分を導出する。より詳細には、背景画像において、画素値としてのRGB値の中でR成分の値が最大となる画素の総数PR、G成分の値が最大となる画素の総数PG、B成分の値が最大となる画素の総数PBを求める。そして、求めたPR、PG、PBのうち、その数が最も大きい色成分を、出現頻度が最も高い色成分とする。なお、ここでは背景画像の全画素を用いているが、前景となるオブジェクトの周辺領域など背景画像内の一部領域の中で出現頻度が最も高い色成分を特定してもよい。導出された出現頻度が最も高い色成分の情報は、類似度判定部404’に出力される。
【0051】
S908では、類似度判定部404’が、類否マップを初期化する。この類否マップについては、実施形態1で説明したとおりである。初期化処理後はS909に進む。
【0052】
S909では、類似度判定部404’が、対象画像における注目画素のRGB値をチェックし、値が最大の色成分を特定する。そして、次のS910では、類似度判定部404’が、対象画像における注目画素の色と背景の色との類似度を、色成分比に基づいて判定する。具体的には、S907にて特定された“背景画像内で出現頻度が最も高い色成分”と、S909にて特定された“注目画素においてその値が最大の色成分”とが同一である場合は、注目画素の色と背景の色とが類似していると判定する。一方、両者が同一でない場合は、注目画素の色と背景の色とは類似していないと判定する。なお、注目画素の意味や選択方法は、実施形態1の図5のフローチャートにおけるS504やS508のときと同じである。
【0053】
S911では、類似度判定部404’が、S910での判定結果に従って、注目画素についての類否マップにおける画素値を更新する。すなわち、注目画素の色が背景の色と類似すると判定された場合は、注目画素の座標(x,y)と同一座標に対応する、類否マップM(x,y)における画素の画素値を“1”に変更する。また、注目画素の色が背景の色と類似していないと判定された場合は、注目画素の座標(x,y)と同一座標に対応する、類否マップ(x,y)の画素の画素値を“0”のまま維持する。
【0054】
S912では、対象画像内の全画素が注目画素として処理されたかどうかが判定される。未処理の画素があればS909に戻り、次の注目画素が選択されて処理が続行される。一方、全画素の処理が完了していれば、類似度判定部404’から更新を終えた類否マップが画素値補正部405に出力され、次の処理(S913)に進む。
【0055】
S913及びS914は、実施形態1の図5のフローチャートにおけるS511及びS512にそれぞれ対応し、異なるところはないので説明を省く。
【0056】
以上が、本実施形態に係る、前景画像生成処理の内容である。ここで、図10を参照して、本実施形態の効果について説明する。実施形態1の図7の場合と同様、カメラ11によって撮像された対象画像10には、前景としての人物オブジェクト12と背景としてのフィールド13とが写っている。そして、対象画像10と同一の撮像視点からフィールド13のみを撮像した背景画像を用いて人物オブジェクト12のシルエットを表した前景画像1001及び1002が生成される。図10において、4×4のブロック14は、対象画像10の一部を拡大したものであり、ブロック14の各格子は1画素を表している。また、ブロック14内の画素群18は人物オブジェクト12の色よりも背景の色に類似している画素群を示し、画素群19は人物オブジェクト12の色との類似度合いと背景の色との類似度合いが同等である画素群を示す。前景画像1001は前述の実施形態1の手法を適用して得られた前景画像であり、前景画像1002は前述の本実施形態の手法を適用して得られた前景画像である。実施形態1の手法で得られる前景画像1001では、画素群1011に示すように、人物オブジェクト12の色よりも背景の色に類似している画素群18を、正しく背景として認識することができている。その一方で、オブジェクトの色との類似度合いと背景の色との類似度合いとが同等の画素群19は、前景領域を構成する画素として処理されており、誤りを含んでいる。これに対し、本実施形態の手法で得られる前景画像1002では、オブジェクトの輪郭に沿って正確に前景領域が抽出されている。
【0057】
<変形例>
なお、上述のS902では、実施形態1におけるS502と同様、事前に撮像した背景画像と対象画像とを比較することで暫定前景画像を得ることとしていた。これに代えて、実施形態1を適用して得られた補正後の出力前景画像を、本実施形態における暫定前景画像として扱い、各処理を行うように構成してもよい。この場合、実施形態1と実施形態2をそれぞれ単独で実行した場合に比べて、より高精度な前景画像を得ることができる。
【0058】
上述のS901における、背景画像内で出現頻度の最も高い色成分を決定する方法は、上記の例に限定されない。例えば、RGB色空間をHSVやLabなどの異なる色空間に変換し、変換後の色空間における画素値を用いて、色相を複数のグループに分割した後、頻度の高い色相グループを出現頻度の高い色として決定しても良い。
【0059】
以上のとおり本実施形態によれば、オブジェクトの輪郭に含まれる画素において背景と前景との色の違いが同等程度の場合であっても、オブジェクトの輪郭に沿って前景のオブジェクトを高精度に抽出することができる。
【0060】
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10