(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-08
(45)【発行日】2022-12-16
(54)【発明の名称】画像処理装置、画像処理方法およびプログラム
(51)【国際特許分類】
H04N 5/232 20060101AFI20221209BHJP
H04N 5/225 20060101ALI20221209BHJP
G06T 7/20 20170101ALI20221209BHJP
【FI】
H04N5/232 290
H04N5/225 300
H04N5/225 800
G06T7/20
(21)【出願番号】P 2021541372
(86)(22)【出願日】2019-08-20
(86)【国際出願番号】 JP2019032343
(87)【国際公開番号】W WO2021033251
(87)【国際公開日】2021-02-25
【審査請求日】2021-10-18
(73)【特許権者】
【識別番号】310021766
【氏名又は名称】株式会社ソニー・インタラクティブエンタテインメント
(74)【代理人】
【識別番号】110000637
【氏名又は名称】特許業務法人樹之下知的財産事務所
(72)【発明者】
【氏名】林 正和
(72)【発明者】
【氏名】長沼 宏昌
(72)【発明者】
【氏名】栗原 洋輔
【審査官】高野 美帆子
(56)【参考文献】
【文献】米国特許出願公開第2018/0098082(US,A1)
【文献】国際公開第2011/013281(WO,A1)
【文献】特開2000-115749(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/232
H04N 5/225
H04N 5/351
G06T 7/20
(57)【特許請求の範囲】
【請求項1】
同期的なスキャンによって撮像された画像の1または複数のピクセルにおける光の強度変化に応じて生成されたイベント信号によって検出される、被写体のエッジ部分で発生する光の強度変化に基づいて、前記画像において被写体に第1の動きが発生している第1の領域と、被写体に前記第1の動きとは異なる第2の動きが発生しているか、または被写体が実質的に動いていない第2の領域とを特定する領域特定部と、
前記画像において、前記第1の領域および前記第2の領域に対してそれぞれ異なる画像処理を実行する画像処理郎と
を備える画像処理装置。
【請求項2】
前記画像は、動画像を構成する複数のフレーム画像であり、
前記領域特定部は、前記複数のフレーム画像のそれぞれにおいて前記第1の領域および前記第2の領域、ならびに少なくとも前記第1の領域における被写体の動き方向を特定し、
前記画像処理部は、前記動き方向に基づいて前記複数のフレーム画像において前記第1の領域および前記第2の領域に対する画像処理を継続的に実行する、請求項1に記載の画像処理装置。
【請求項4】
前記領域特定部は、被写体に前記第2の動きが発生している前記第2の領域を特定し、
前記画像処理部は、前記画像において前記第1の領域および前記第2の領域をそれぞれ異なる態様でマーキングする、請求項3に記載の画像処理装置。
【請求項6】
前記画像は、動画像を構成する複数のフレーム画像であり、
前記領域特定部は、前記複数のフレーム画像のそれぞれにおいて前記第1の領域および被写体が実質的に動いていない前記第2の領域を特定し、
前記画像処理部は、前記複数のフレーム画像のそれぞれにおいて前記第1の領域を前後のフレーム画像で特定された前記第2の領域を用いて上書きする、請求項1に記載の画像処理装置。
【請求項7】
同期的なスキャンによって撮像された画像の1または複数のピクセルにおける光の強度変化に応じて生成されたイベント信号によって検出される、被写体のエッジ部分で発生する光の強度変化に基づいて、前記画像において被写体に第1の動きが発生している第1の領域と、被写体に前記第1の動きとは異なる第2の動きが発生しているか、または被写体が実質的に動いていない第2の領域とを特定するステップと、
前記画像において、前記第1の領域および前記第2の領域に対してそれぞれ異なる画像処理を実行するステップと
を含む画像処理方法。
【請求項8】
同期的なスキャンによって撮像された画像の1または複数のピクセルにおける光の強度変化に応じて生成されたイベント信号によって検出される、被写体のエッジ部分で発生する光の強度変化に基づいて、前記画像において被写体に第1の動きが発生している第1の領域と、被写体に前記第1の動きとは異なる第2の動きが発生しているか、または被写体が実質的に動いていない第2の領域とを特定する機能と、
前記画像において、前記第1の領域および前記第2の領域に対してそれぞれ異なる画像処理を実行する機能と
をコンピュータに実現させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法およびプログラムに関する。
【背景技術】
【0002】
入射する光の強度変化を検出したピクセルが時間非同期的に信号を生成する、イベント駆動型のビジョンセンサが知られている。イベント駆動型のビジョンセンサは、所定の周期ごとに全ピクセルをスキャンするフレーム型ビジョンセンサ、具体的にはCCDやCMOSなどのイメージセンサに比べて、低電力で高速に動作可能である点で有利である。このようなイベント駆動型のビジョンセンサに関する技術は、例えば特許文献1および特許文献2に記載されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特表2014-535098号公報
【文献】特開2018-85725号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、イベント駆動型のビジョンセンサについては、上記のような利点は知られているものの、他の装置、例えばフレーム型ビジョンセンサと組み合わせた利用方法については、まだ十分に提案されているとは言いがたい。
【0005】
そこで、本発明は、イベント駆動型のビジョンセンサをフレーム型ビジョンセンサと組み合わせて用いることによって有利な効果を得ることができる画像処理装置、画像処理方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明のある観点によれば、同期的なスキャンによって撮像された画像の1または複数のピクセルにおける光の強度変化に応じて生成されたイベント信号に基づいて、画像において被写体に第1の動きが発生している第1の領域と、被写体に第1の動きとは異なる第2の動きが発生しているか、または被写体が実質的に動いていない第2の領域とを特定する領域特定部と、画像において、第1の領域および第2の領域に対してそれぞれ異なる画像処理を実行する画像処理部とを備える画像処理装置が提供される。
【0007】
本発明の別の観点によれば、同期的なスキャンによって撮像された画像の1または複数のピクセルにおける光の強度変化に応じて生成されたイベント信号に基づいて、画像において被写体に第1の動きが発生している第1の領域と、被写体に第1の動きとは異なる第2の動きが発生しているか、または被写体が実質的に動いていない第2の領域とを特定するステップと、画像において、第1の領域および第2の領域に対してそれぞれ異なる画像処理を実行するステップとを含む画像処理方法が提供される。
【0008】
本発明のさらに別の観点によれば、同期的なスキャンによって撮像された画像の1または複数のピクセルにおける光の強度変化に応じて生成されたイベント信号に基づいて、画像において被写体に第1の動きが発生している第1の領域と、被写体に第1の動きとは異なる第2の動きが発生しているか、または被写体が実質的に動いていない第2の領域とを特定する機能と、画像において、第1の領域および第2の領域に対してそれぞれ異なる画像処理を実行する機能とをコンピュータに実現させるためのプログラムが提供される。
【図面の簡単な説明】
【0009】
【
図1】本発明の一実施形態に係るシステムの概略的な構成を示すブロック図である。
【
図2】本発明の一実施形態におけるカメラ・センサ間のキャリブレーションについて概略的に説明するための図である。
【
図3】本発明の一実施形態における画像とイベント信号とのマッチングの例について説明するための図である。
【
図4】本発明の一実施形態における領域の特定および画像処理の例について説明するための図である。
【
図5】本発明の一実施形態における領域の特定および画像処理の例について説明するための図である。
【
図6】本発明の一実施形態に係る画像処理方法の例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、添付図面を参照しながら、本発明のいくつかの実施形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0011】
図1は、本発明の一実施形態に係るシステムの概略的な構成を示すブロック図である。
図1に示されるように、システム10は、RGBカメラ100と、EDS(Event Driven Sensor)200と、画像処理装置300とを含む。
【0012】
RGBカメラ100は、同期的なスキャンによって画像を撮像する第1のビジョンセンサの例であり、イメージセンサ110と、イメージセンサ110に接続される処理回路120とを含む。イメージセンサ110は、例えば所定の周期で、またはユーザー操作に応じた所定のタイミングで全ピクセルを同期的にスキャンすることによってRGB画像101を撮像する。本実施形態において、RGB画像101は、所定のフレームレートで連続的に撮像されて動画像を構成する複数のフレーム画像を含む。処理回路120は、例えばRGB画像101を保存および伝送に適した形式に変換する。また、処理回路120は、RGB画像101にタイムスタンプ102を与える。
【0013】
EDS200は、センサが光の強度変化を検出したときにイベント信号を生成する第2のビジョンセンサの例であり、センサアレイを構成するセンサ210と、センサ210に接続される処理回路220とを含む。センサ210は、受光素子を含み、入射する光の強度変化、より具体的には輝度変化を検出したときにイベント信号201を生成する。入射する光の強度変化を検出しなかったセンサ210はイベント信号201を生成しないため、EDS200においてイベント信号201は時間非同期的に生成される。処理回路220を経て出力されるイベント信号201は、センサ210の識別情報(例えばピクセルの位置)と、輝度変化の極性(上昇または低下)と、タイムスタンプ202とを含む。
【0014】
ここで、本実施形態において、RGB画像101に与えられるタイムスタンプ102と、イベント信号201に与えられるタイムスタンプ202とは同期している。具体的には、例えば、EDS200でタイムスタンプ202を生成するために用いられる時刻情報をRGBカメラ100に提供することによって、タイムスタンプ102をタイムスタンプ202に同期させることができる。あるいは、タイムスタンプ102,202を生成するための時刻情報がRGBカメラ100とEDS200とでそれぞれ独立している場合、特定のイベント(例えば、画像全体にわたる被写体の変化)が発生した時刻を基準にしてタイムスタンプのオフセット量を算出することによって、事後的にタイムスタンプ102とタイムスタンプ202とを同期させることができる。
【0015】
また、本実施形態では、事前に実行されるRGBカメラ100とEDS200とのキャリブレーション手順によって、EDS200のセンサ210がRGB画像101の1または複数のピクセルに対応付けられ、イベント信号201はRGB画像101の1または複数のピクセルにおける光の強度変化に応じて生成される。より具体的には、例えば、
図2に示すようにRGBカメラ100とEDS200とで共通の校正パターン21を撮像し(EDS200の場合、例えば光源22を用いて校正パターン21の領域全体を明滅させることによって校正パターンを撮像できる)、RGBカメラ100およびEDS200のぞれぞれの内部パラメータおよび外部パラメータからカメラ・センサ間の対応パラメータを算出することによって、RGB画像101の1または複数のピクセルにセンサ210を対応付けることができる。
【0016】
図3は、本発明の一実施形態における画像とイベント信号とのマッチングの例について説明するための図である。図示された例では、RGBカメラ100で撮像されたRGB画像101と、RGB画像101のスキャンに対応する時間にEDS200から出力されたイベント信号201をピクセルの位置に配置したものとが示されている。上記で
図2を参照して説明したようなカメラ・センサ間の対応パラメータを予め算出しておくことによって、
図3に示されるようにイベント信号201の座標系をRGB画像101の座標系に変換し、RGB画像101にイベント信号201を重ね合わせることが可能になる。
【0017】
再び
図1を参照して、画像処理装置300は、例えば通信インターフェース、プロセッサ、およびメモリを有するコンピュータによって実装され、プロセッサがメモリに格納された、または通信インターフェースを介して受信されたプログラムに従って動作することによって実現される領域特定部310および画像処理部320の機能を含む。以下、各部の機能についてさらに説明する。
【0018】
領域特定部310は、イベント信号201に基づいて、RGB画像101において被写体に第1の動きが発生している第1の領域と、被写体に第1の動きとは異なる第2の動きが発生しているか、または被写体が実質的に動いていない第2の領域とを特定する。RGB画像101の被写体に動きが発生した場合、例えば被写体のエッジ部分で発生する光の強度変化、具体的には輝度変化がイベント信号201によって検出される結果、RGB画像101において被写体そのものを認識しなくても、イベント信号201に基づいて被写体の動きが発生した領域を特定することができる。さらに、領域特定部310は、例えばイベント信号201によって示される輝度変化の時系列での位置変化から、それぞれの領域における被写体の動き方向も特定することができる。上述のように、本実施形態においてRGB画像101は動画像を構成する複数のフレーム画像であるため、領域特定部310は複数のフレーム画像のそれぞれにおいて第1の領域および第2の領域を特定してもよい。
【0019】
画像処理部320は、RGB画像101において、第1の領域および第2の領域に対してそれぞれ異なる画像処理を実行して出力画像321を得る。このとき、画像処理部320は、RGB画像101のタイムスタンプ102およびイベント信号201のタイムスタンプ202に基づいて、領域特定部310が特定した第1の領域および第2の領域とRGB画像101とを対応付けることができる。画像処理部320が実行する画像処理の内容については特に限定されないが、例えば、画像処理部320は、RGB画像101において第1の領域のみをマーキングするか、または被写体にそれぞれ異なる動きが発生している第1の領域および第2の領域をそれぞれ異なる態様でマーキングしてもよい。あるいは、画像処理部320は、RGB画像101において被写体が実質的に動いていない第2の領域(例えば背景領域)をマスクしてもよい。あるいは、被写体が実質的に動いていない第2の領域が特定される場合、画像処理部320は、RGB画像101によって構成される複数のフレーム画像のそれぞれにおいて、第1の領域を前後のフレーム画像で特定された第2の領域を用いて上書きすることによって、第1の領域にある動く被写体を隠してもよい。画像処理部320が第1および第2の領域についてそれぞれ異なる画像処理を実行することは、例えば第1の領域または第2の領域のいずれか一方の領域について画像処理を実行し、他方の領域をそのまま出力することを含む。
【0020】
図4および
図5は、本発明の一実施形態における領域の特定および画像処理の例について説明するための図である。
図4に示された例において、領域特定部310は、時系列のイベント信号201から、被写体の動きが発生している領域R1と、被写体が実質的に動いていない領域R2とを特定する。例えば、領域特定部310は、時系列のイベント信号201から特定されるオプティカルフローFの大きさが所定の閾値以上である領域R1を抽出し、残った領域を領域R2とする。
【0021】
他の例において、領域特定部310は、抽出された領域R1をオプティカルフローFによって示される動きの方向および大きさに応じて区分することによって、それぞれ異なる被写体の動きが発生している複数の領域を特定してもよい。オプティカルフローFは、被写体の動き方向を示す情報の例である。被写体の動き方向が特定されることによって、RGB画像101によって構成される複数のフレーム画像において例えば領域R1に対応する被写体を継続的に追跡(トラッキング)することができる。
【0022】
一方、
図5に示された例のように、画像処理部320は、領域特定部310によって特定された領域R1,R2を、
図3を参照して説明したような画像とイベント信号とのマッチング手順によってRGB画像101に重ね合わせることができる。図示された例では、画像処理部320は、RGB画像101において実質的に動いていない領域R2(背景領域)をマスクすることによって、被写体の動きが発生している領域R1を切り出した出力画像321を得る。
【0023】
他の例では、領域R2のマスクに代えて、または領域R2のマスクとともに、画像処理部320が領域R1をマーキングしてもよい。領域特定部310によってそれぞれ異なる被写体の動きが発生している複数の領域が特定された場合、画像処理部320は複数の領域をそれぞれ異なる態様でマーキングしてもよい。例えば上記の例のオプティカルフローFによって各領域の被写体の動き方向が特定され、RGB画像101によって構成される複数のフレーム画像において各領域に対応する被写体が継続的に追跡される場合、画像処理部320は、上述したような領域のマスクや領域のマーキングの処理を複数のフレーム画像において継続的に実行することができる。
【0024】
以上で説明したような本発明の一実施形態では、画像処理装置300の領域特定部310が、イベント信号201に基づいてRGB画像101において被写体に動きが発生している領域を特定する。イベント信号201はRGB画像101の1または複数のピクセルで光の強度変化が検出された場合にのみ生成されるため、例えば時間的に連続する複数のRGB画像101のピクセル同士を比較して被写体に動きが発生している領域を特定する場合に比べて処理を高速化することができる。また、一般にEDS200がイベント信号201を生成可能な周期はRGBカメラ100が動画像を撮像する場合のフレームレートよりも大幅に短いため、本実施形態のようにイベント信号201を利用することによって、例えば動画像においてRGB画像101のみを用いて被写体の動きを特定する場合よりも高精度に画像処理を被写体の動きに追従させることができる。
【0025】
図6は、本発明の一実施形態に係る画像処理方法の例を示すフローチャートである。図示された例では、RGBカメラ100がRGB画像101を撮像し(ステップS101)、それと同時にEDS200がイベント信号201を生成する(ステップS102)。なお、イベント信号201を生成するステップS102は、RGB画像101の1または複数のピクセルに対応付けられるセンサ210が光の強度変化を検出した場合にのみ実行される。RGB画像101にはタイムスタンプ102が与えられ(ステップS103)、イベント信号にはタイムスタンプ202が与えられる(ステップS104)。
【0026】
次に、画像処理装置300での処理が実行される。まず、領域特定部310が、イベント信号201に基づいて上記のようなRGB画像101における第1および第2の領域を特定する(ステップS105)。次に、画像処理部320が、RGB画像101において特定された第1および第2の領域についてそれぞれ異なる画像処理を実行する(ステップS106)。このとき、画像処理が実行されるRGB画像101と、イベント信号201に基づいて特定された第1および第2の領域とは、タイムスタンプ102,202を用いて対応付けられる。以上のような処理によって、例えば動いている被写体を切り出して背景をマスクした出力画像321や、動きが異なる被写体がそれぞれ異なる態様のマーキングによって追跡される動画像の出力画像321を得ることができる。
【0027】
以上、添付図面を参照しながら本発明のいくつかの実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【符号の説明】
【0028】
10…システム、100…RGBカメラ、101…RGB画像、102…タイムスタンプ、110…イメージセンサ、120…処理回路、201…イベント信号、202…タイムスタンプ、210…センサ、220…処理回路、300…画像処理装置、310…領域特定部、320…画像処理部、321…出力画像。