(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-25
(54)【発明の名称】DVSフレームを生成する方法及びシステム
(51)【国際特許分類】
H04N 23/60 20230101AFI20240315BHJP
H04N 23/54 20230101ALI20240315BHJP
H04N 5/262 20060101ALI20240315BHJP
【FI】
H04N23/60 500
H04N23/54
H04N5/262 050
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023551708
(86)(22)【出願日】2021-03-29
(85)【翻訳文提出日】2023-08-24
(86)【国際出願番号】 CN2021083544
(87)【国際公開番号】W WO2022204865
(87)【国際公開日】2022-10-06
(81)【指定国・地域】
(71)【出願人】
【識別番号】592051453
【氏名又は名称】ハーマン インターナショナル インダストリーズ インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ジョウ, レンガオ
【テーマコード(参考)】
5C023
5C122
【Fターム(参考)】
5C023AA37
5C023BA04
5C023BA11
5C122DA03
5C122FC06
5C122FH11
5C122GA21
5C122HB01
(57)【要約】
DVS用のフレームを生成する方法及びシステムが開示される。本方法は、DVSからオブジェクトのDVSピクセルを受信することと、タイムスパンをタイムスパン値に初期化することと、タイムスパン内にキャプチャされたDVSピクセルを統合することによってフレームを生成することと、オブジェクトの移動速度を評価することと、評価された移動速度が第1の閾値よりも低い場合、複数の連続フレームを1つの結合フレームに結合することと、を含む。本システムは、オブジェクトのDVSピクセルをキャプチャするように構成されたDVSと、DVSからDVSピクセルを受信して方法を実行するように構成されたプロセッサとを含む。
【選択図】
図5
【特許請求の範囲】
【請求項1】
DVS用のフレームを生成する方法であって、
DVSからオブジェクトのDVSピクセルを受信することと、
タイムスパンをタイムスパン値に初期化することと、
タイムスパン内でキャプチャされたDVSピクセルを統合することによってフレームを生成することと、
前記オブジェクトの移動速度を評価することと、
前記評価された移動速度が第1の閾値よりも低い場合、複数の連続フレームを1つの結合フレームに結合することと、
を含む前記方法。
【請求項2】
複数の連続フレームを1つの結合フレームに結合することが、前記複数の連続フレームのそれぞれを1つずつ前記結合フレームに結合することを含む、請求項1に記載のフレームを生成する方法。
【請求項3】
フレームを1つの結合フレームに結合することが、前記フレーム内の前記DVSピクセルのそれぞれを前記結合フレームに結合することを含む、請求項2に記載のフレームを生成する方法。
【請求項4】
前記結合フレーム内の各ピクセルを背景色に初期化することをさらに含む、請求項3に記載のフレームを生成する方法。
【請求項5】
DVSピクセルを前記結合フレームに結合することが、前記DVSピクセルのグレーレベルを前記結合フレーム内の対応するピクセルにコピーすることを含む、請求項4に記載のフレームを生成する方法。
【請求項6】
前記移動速度が、前記フレームの少なくとも一部におけるDVSピクセルの数または密度に基づいて評価される、先行請求項のいずれかに記載のフレームを生成する方法。
【請求項7】
前記移動速度が、前記フレーム内の高密度DVSピクセル領域の割合に基づいて評価される、先行請求項のいずれかに記載のフレームを生成する方法。
【請求項8】
複数の連続フレームを1つの結合フレームに結合することが、前記結合フレームの少なくとも一部におけるピクセルの数または密度が閾値以上になるまで、連続フレームを1つの結合フレームに結合することを含む、先行請求項のいずれかに記載のフレームを生成する方法。
【請求項9】
前記評価された移動速度が前記第1の閾値よりも高い第2の閾値よりも高い場合、前記タイムスパンをより小さいタイムスパン値に再設定することをさらに含む、先行請求項のいずれかに記載のフレームを生成する方法。
【請求項10】
複数の連続フレームを1つのフレームに結合することが、前記複数の連続フレームの少なくとも1つのフレームの一部を前記結合フレームに結合することを含む、先行請求項のいずれかに記載のフレームを生成する方法。
【請求項11】
DVSフレームを生成するシステムであって、
オブジェクトのDVSピクセルをキャプチャするように構成されたDVSと、
先行請求項のいずれかに記載の方法を実行するように構成されたプロセッサと、
を含む、前記システム。
【請求項12】
請求項1~10のいずれかに記載の方法を実行するためにプロセッサによって実行され得るコンピュータプログラムを記憶する、コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一般に、DVSフレームを生成するための方法及びシステムに関する。
【背景技術】
【0002】
DVS(ダイナミックビジョンセンサ)と呼ばれる新しい最先端のセンサがある。DVSは光強度の変化のみをキャプチャし、非同期DVSピクセル(ピクセルイベント)を作成する。従来のカメラと比較して、DVSには低遅延、モーションぼやけなし、高ダイナミックレンジ、低消費電力という利点がある。
【0003】
連続したピクセルを含む完全な画像またはフレームを作成する従来のカメラとは異なり、DVSは空間的及び時間的に離散的かつ不連続であり得る非同期DVSピクセルのみを作成するため、DVSによってキャプチャされたDVSピクセル(ピクセルイベント)をタイムスパン内で統合して画像またはフレームを作成する必要がある。DVSは光強度の変化のみをキャプチャするため、検出対象のオブジェクトが実質的に静止している場合やシーン内でゆっくりと移動する場合など、DVSによって撮影されているシーンが安定している場合には、特定のタイムスパンで満足のいく画像またはフレームに十分なピクセルをキャプチャできない場合がある。一方、検出対象のオブジェクトがシーン内で高速に移動する場合など、シーンが急速に変化する場合、DVSは特定のタイムスパンで過剰な冗長DVSピクセルをキャプチャする可能性がある。
【0004】
したがって、検出されるオブジェクトの移動速度に関係なく、DVS用に満足のいく画像またはフレームを取得できる方法またはシステムが必要である。
【0005】
さらに、シーンの一部が急速に変化し、シーンの別の部分がゆっくりと変化する状況が存在する可能性がある。例えば、一部の検出対象オブジェクトがシーン内で速く移動する一方、他の一部の検出対象オブジェクトがシーン内でゆっくりと移動するか、静止している場合などである。この状況では、DVSは、高速に移動するオブジェクトからは過剰な冗長DVSピクセルをキャプチャしたが、ゆっくりと移動するオブジェクトや静止しているオブジェクトからは十分なDVSピクセルをキャプチャしていない可能性がある。したがって、高速のオブジェクトと低速のオブジェクトの両方に対して満足のいく画像またはフレームを取得するのにいくつかの困難が生じる可能性がある。
【0006】
したがって、シーン内のオブジェクトの移動速度が異なる場合に、検出されるすべてのオブジェクトについて満足のいくDVS画像またはフレームを取得できる方法またはシステムが必要である。
【発明の概要】
【課題を解決するための手段】
【0007】
本開示の態様の1つによれば、DVS用のフレームを生成する方法が提供される。この方法は、DVSからオブジェクトのDVSピクセルを受信することと、タイムスパンをタイムスパン値に初期化することと、タイムスパン内にキャプチャされたDVSピクセルを統合することによってフレームを生成することと、オブジェクトの移動速度を評価することと、評価された移動速度が第1の閾値よりも低い場合、複数の連続フレームを1つの結合フレームに結合することと、を含む。
【0008】
本開示の態様の1つによれば、DVSフレームを生成するためのシステムが提供される。このシステムは、オブジェクトのDVSピクセルをキャプチャするように構成されたDVSと、DVSからDVSピクセルを受信し、上述の方法を実行するように構成されたプロセッサとを含む。
【0009】
本開示の態様の1つによれば、コンピュータプログラムを記憶するコンピュータ可読記憶媒体が提供され、コンピュータプログラムはプロセッサによって実行されて、上述の方法を実行することができる。
【0010】
本開示の他のシステム、方法、特徴、及び利点は、以下の図及び詳細な説明の検討時に、当業者には明らかであり、または明らかになる。そのようなさらなるシステム、方法、特徴、及び利点はすべて、この説明に含まれ、本開示の範囲内にあり、以下の特許請求の範囲によって保護されることが意図されている。
【0011】
本開示は、以下の図面及び説明を参照することにより、よりよく理解することができる。図面中の構成要素は、必ずしも原寸に比例しているとは限らず、それよりも本開示の原理を示すことに重点が置かれている。さらに、図では、同様の参照数字が、異なる図全体にわたって対応する部分を示す。
【図面の簡単な説明】
【0012】
【
図1】A~Cは、異なる移動速度を有するオブジェクトの画像またはフレームの概略図を示し、Aのオブジェクト100は矢印で示される方向に中程度の速度で移動し、Bのオブジェクト100は矢印で示される方向に非常に速く移動し、Cのオブジェクト100は非常にゆっくりと移動するか、実質的に静止している。
【
図2】Aは、飲料水のシナリオにおける人物検出を示す画像またはフレームであり、人200が水を飲むためにカップを上げているときの画像またはフレームを示す。Bは、飲料水のシナリオにおける人物検出を示す画像またはフレームであり、人200が水を飲むためにカップを上げているときの画像またはフレームを示す。
【
図3】Aは、飲料水のシナリオにおける人物検出を示す画像またはフレームであり、人200が水を飲み終えてカップをテーブルに置いているときの画像またはフレームを示す。Bは、飲料水のシナリオにおける人物検出を示す画像またはフレームであり、人200が水を飲み終えてカップをテーブルに置いているときの画像またはフレームを示す。
【
図4】連続DVSフレームを1つの結合フレームに結合する例を示す。
【
図5】本開示のいくつかの実施形態による方法のフローチャートを示す。
【
図6】本開示のいくつかの実施形態による、
図5のステップS05の例示的なプロセスを示す。
【
図7】本開示のいくつかの実施形態による、
図6のステップS53の例示的なプロセスを示す。
【
図8】本開示のいくつかの他の実施形態による方法のフローチャートを示す。
【発明を実施するための形態】
【0013】
以下に本開示の好ましい実施形態について、添付図面を参照しながらより詳細に説明する。
【0014】
本明細書で使用する場合、単数形「a」、「an」及び「the」は、文脈が別途明らかに示さない限り、複数形も含むことを意図する。「備える(comprises)」、「備えている(comprising)」、「含む(includes)」及び/または「含んでいる(including)」という用語は、本明細書で使用されているときには、述べられている特徴、完全体、ステップ、操作、要素、及び/または構成要素の存在を明示するが、1つ以上のその他の特徴、完全体、ステップ、操作、要素、構成要素、及び/またはそれらの群の存在を排除または追加しない。本明細書で使用される場合、用語「及び/または」及び記号「/」は、関連する列挙された項目の1つ以上のあらゆる組み合わせを含むことを意味する。加えて、本明細書では、第1、第2などの用語を様々な要素、コンポーネント、ステップまたは計算を説明するために使用することができるが、これらの要素、コンポーネント、ステップまたは計算はこれらの用語によって限定されるべきではなく、むしろこれらの用語は、ある要素、コンポーネント、ステップ、または計算を互いから区別するためにのみ使用される。例えば、第1のコンポーネントを第2のコンポーネントと呼ぶこともでき、同様に、第1の計算を第2の計算と呼ぶこともでき、同様に、第1のステップを第2のステップと呼ぶこともできる。これらはすべて、本開示の範囲から逸脱することなく行われる。
【0015】
本明細書で使用される「DVSピクセル」、「ピクセルイベント」、「イベント」という用語は、交換可能に使用でき、DVSによってキャプチャされる光強度変化を指すことができる。DVSピクセルまたはピクセルイベントまたはイベントは、通常[x,y,t,p]の形式をとるピクセルまたはイベントデータによって表され得る。ここで、xとyはx座標とy座標を表し、tはこのイベントのタイムスタンプを表し、pは光強度の変化が明るくなっているのか暗くなっているのかを意味する極性を表す。DVSの「画像」もしくは「フレーム」、または「DVSフレーム」という用語は、タイムスパン内でDVSによって取得されたすべてのピクセルが統合される画像またはフレームを指す。「結合フレーム」という用語は、いくつかの連続DVSフレームを結合することによって生成されるフレームを指す。
【0016】
係属中の請求項における使用法を明確にするために、かつ本明細書によって公衆に通知するために、「<A>、<B>、・・・及び<N>のうちの少なくとも1つ」または「<A>、<B>、...<N>のうちの少なくとも1つ、またはそれらの組み合わせ」という表現は、本出願人によって明示的に反対の主張がされない限り、本出願前または本出願後の他の何らかの暗示的な定義に取って代わり、最も広い意味で本出願人によって定義されて、A、B、・・・及びN、つまり、任意の1つの要素を単独で含むか、またはリストされていない追加の要素を組み合わせて含むこともできる他の要素の1つ以上と組み合わせた、要素A、B、・・・またはNのうちの1つ以上の任意の組み合わせを含むグループから選択される1つ以上の要素を意味するものとする。
【0017】
DVSは光の強度変化のみをキャプチャし、次いで非同期DVSピクセル(ピクセルイベント)を作成する。表示したり、オブジェクト認識や動きの検出などのさらなる処理を行ったりするための画像またはフレームを生成するには、タイムスパン内にDVSによってキャプチャされたDVSピクセル(ピクセルイベント)を1つの画像またはフレームに統合する必要がある。
【0018】
DVSは光の強度変化のみをキャプチャするため、タイムスパン内でDVSによってキャプチャされるDVSピクセルの数は、シーン内で認識または検出されるオブジェクトの移動速度など、シーンの変化速度に依存する可能性がある。例えば、シーン内で認識または検出されるオブジェクトが実質的に静止しているか、または非常にゆっくりと移動する場合、DVSは特定のタイムスパン内でそのオブジェクトの非常に少数のDVSピクセル(ピクセルイベント)しかキャプチャしない可能性があり、これは、満足のいく画像またはフレームを生成するには不十分である可能性がある。一方、認識または検出されるオブジェクトがシーン内で高速に移動する場合、DVSはタイムスパン内でオブジェクトの移動経路内の冗長なピクセルをキャプチャしすぎて、ぼやけた画像またはフレームを生成する可能性がある。
【0019】
図1A~1Cは、異なる移動速度を有するオブジェクト100の画像またはフレームの概略図を示し、
図1Aのオブジェクト100は矢印で示される方向に中程度の速度で移動し、
図1Bのオブジェクト100は矢印で示される方向に非常に速く移動し、
図1Cのオブジェクト100は非常にゆっくりと移動するか、実質的に静止している。
図1Aでは、オブジェクト100は中程度の速度で移動し、したがって、オブジェクト100の動きに起因するタイムスパンにおける光強度変化の十分なイベントが存在し、したがって、DVSは、タイムスパン内でオブジェクト100の十分なDVSピクセルをキャプチャすることができる。一方、オブジェクト100はタイムスパン中に短い距離D1しか移動しないため、タイムスパン内のすべてのDVSピクセルを統合することによって生成される画像またはフレームは実質的に明瞭であり、オブジェクトの形状(円)を明瞭に示すことができる。
【0020】
図1Bでは、オブジェクト100は高速で移動し、タイムスパン内にD2という比較的長い距離を移動する。オブジェクト100は、タイムスパン内で比較的長い距離を移動するため、DVSは、タイムスパン内でオブジェクトの移動経路内の多くの冗長なピクセルをキャプチャする可能性があり、したがって、タイムスパン内ですべてのDVSピクセルを統合することによって生成される画像またはフレームは、ぼやける可能性があり、オブジェクト100の形状が明瞭に示されておらず、望ましくないか、または満足のいくものではない。
【0021】
図1Cでは、オブジェクト100はゆっくりと移動するか、実質的に静止している。オブジェクト100の動きが遅いため、あるタイムスパンにおいてオブジェクト100の光強度変化のイベントは多くない。したがって、DVSは、タイムスパン内でオブジェクト100の十分なDVSピクセルをキャプチャできず、そのため、タイムスパン内のすべてのDVSピクセルを統合することによって生成された画像またはフレームには、オブジェクトの形状(円)を明瞭に示すのに十分なDVSピクセルがなく、
図1Cの点線の円で示されている。
【0022】
したがって、
図1A~1Cによれば、満足のいく画像またはフレームを取得するには、DVSピクセルを統合するために使用されるタイムスパンが、オブジェクトの移動速度とマッチする必要がある。
【0023】
図2A~2B、3A~3Bは、飲料水のシナリオにおける人物検出を示す画像またはフレームであり、
図2A~2Bは、人200が水を飲むためにカップを上げているときの画像またはフレームを示し、
図3A~3Bは、人200が水を飲み終えてカップをテーブルに置いているときの画像またはフレームを示す。
【0024】
図2A~2Bに示されている瞬間、すなわち、人200が水を飲むためにカップ212を持ち上げているとき、カップ212と、腕202及び頭204などの人200の一部は、比較的速い速度で移動する。
図2Aに示される画像またはフレームは、第1のタイムスパンでDVSによってキャプチャされたDVSピクセルを統合することによって生成されるが、
図2Bに示される画像またはフレームは、第2のタイムスパンでDVSによってキャプチャされるDVSピクセルを統合することによって生成され、第1のタイムスパンは第2のタイムスパンよりも長い。カップ212、頭204、及び腕202は比較的速く移動し、第1のタイムスパンが比較的長いため、カップ212、頭204、及び腕202は第1のタイムスパンで比較的長い距離を移動する。したがって、DVSは、第1のタイムスパンにおいてカップ212、頭204、及び腕202の移動経路において多くの冗長なピクセルをキャプチャする可能性があり、したがって、第1のタイムスパンにおいてDVSピクセルを統合することによって生成される画像またはフレームはぼやける可能性があり、望ましくない、または満足のいくものでない。加えて、カップ212、頭204、及び腕202のうち、カップ212が最も速く動く可能性があるため、
図2Aでは、カップが最もぼやけていて、最も認識しにくい。比較として、第1のタイムスパンよりも小さい第2のタイムスパンを使用して、DVSピクセルを
図2Bの画像またはフレームに統合する。
図2Bに示すように、カップ212、頭204、及び腕202は、
図2Aに示すものよりもはるかにぼやけておらず、より認識しやすい。したがって、
図2A~2Bに示される瞬間、すなわち、人200が水を飲むためにカップ212を上げているとき、カップ212、頭204、及び腕202の移動速度が比較的速いため、及び画像または画像が比較的短いタイムスパンがより適切であり、比較的短い2番目のタイムスパンを使用して生成されたフレームは、はるかに認識しやすく満足のいくものになり得る。
【0025】
図3A~3Bに示されている瞬間、すなわち、人200が水を飲み終えてカップをテーブルに置いているとき、カップ212と人200、例えばその腕202及びその頭204は、比較的は遅い速度で移動する。
図3Aに示す画像またはフレームは、
図2Aの第1のタイムスパンと同じタイムスパンを使用して生成され、
図3Bに示す画像またはフレームは、
図2Bの第2のタイムスパンと同じタイムスパンを使用して生成される。カップ212と人200、例えばその腕202やその頭204は比較的遅い速度で動くが、第1のタイムスパンが比較的大きいため、光強度変化の十分なイベントが依然として存在する。一方、カップ212と人200は、速度が比較的遅いため、第1のタイムスパンでは短い距離しか移動せず、したがって、第1のタイムスパンですべてのDVSピクセルを統合することによって生成された画像またはフレームは、カップ212の形状と、その人200を明瞭に示すことができる。比較すると、移動速度が比較的遅く、第2のタイムスパンが比較的短いため、光強度の変化のイベントはあまりない。したがって、
図3Bでは、カップ122及び人200の形状を明瞭に示すのに十分なDVSピクセルがなく、これは望ましくない、または満足のいくものではない。
【0026】
したがって、
図2A~2B、3A~3Bによれば、飲むプロセス全体を通して満足のいくフレームを得るために、カップと人が比較的遅い速度で移動する場合には比較的長いタイムスパンを使用することができるが、一方、カップと人が比較的早い速度で移動する場合には比較的短いタイムスパンを使用することができる。
【0027】
本開示の発明者は、
図3Bに示すような短いタイムスパンの連続DVSフレーム内の安定したオブジェクトについては、人間の目にはピクセルが連続しているように見えるが、実際にはピクセルが不連続であることを発見した。短いタイムスパンで連続DVSフレーム内の安定したオブジェクトまたは遅いオブジェクトのピクセルを分析することにより、連続DVSフレームの中でも、連続フレームの1つに1つの特定の座標位置のDVSピクセルがある場合、その隣接するフレームまたは複数のフレーム内の同じ座標位置に別のDVSピクセルがある可能性は非常にわずかであることがわかった。つまり、連続DVSフレーム内のDVSピクセルは通常、異なる座標位置にある。2つ以上の連続DVSフレームは非常に似ているように見え得るが、連続DVSフレームのそれぞれには主に、異なる座標位置にあるDVSピクセルが含まれている。したがって、不十分な情報またはDVSピクセルを有する連続DVSフレームを一緒に結合することが可能であり、その結果、連続DVSフレームに含まれるDVSピクセルが互いに補完し、十分な情報またはDVSピクセルを有する結合フレームを提供することができる。
【0028】
図4は、連続DVSフレームを1つの結合フレームに結合する例を示す。
図4に示すフレーム402、404、406は連続DVSフレームであり、そのそれぞれは
図3Bに示すフレームと同様である。本開示の発明者は、フレーム402、404、406は互いに非常によく似ているが、連続フレーム402、404、406の1つが1つの特定の座標位置にDVSピクセルを有する場合、フレーム402、404、406のうちの他の2つの同じ座標位置に別のDVSピクセルがある可能性は非常に小さいことを発見した。すなわち、フレーム402、404、406は互いに似ているように見えるが、フレーム402、404、406のうちの1つのDVSピクセルの座標位置は、フレーム402、404、406の他の2つのものとは実質的にまたはほぼ完全に異なるものであり得、これは予想外で直観に反するかもしれない。したがって、フレーム402、404、406が1つの結合フレーム400に結合されるとき、フレーム402、404、406のそれぞれのDVSピクセルは互いに補完することができ、その結果、十分な情報またはDVSピクセルを有する満足のいく結合フレームが得られる。
【0029】
本開示は、DVS用のフレームを生成するための方法及びシステムを提供する。本開示の方法は、DVSからオブジェクトのDVSピクセルを受信することと、タイムスパンを短いタイムスパン値に初期化することと、タイムスパン内にキャプチャされたDVSピクセルを統合することによってフレームを生成することと、オブジェクトの移動速度を評価することと、評価された移動速度が第1の閾値よりも低い場合、複数の連続フレームを1つの結合フレームに結合することと、を含む。タイムスパンが小さい値に設定されているため、オブジェクトは短い距離を移動し、したがって、オブジェクトが比較的速い速度で移動する場合でも、フレームをぼかす可能性がある移動オブジェクトの余分なピクセルが多くならない。一方、本開示の方法では、オブジェクトの移動速度が遅い場合には、複数の連続フレームを1つのフレームに結合する。複数の連続フレームを1つの結合フレームに結合することにより、オブジェクトが非常にゆっくりと移動する場合や、実質的に静止している場合でも、オブジェクトの形状を明瞭に表示できる十分なDVSピクセルが結合フレーム内に存在することになる。
【0030】
図5は、本開示のいくつかの実施形態による方法のフローチャートを示す。プロセスはS01から開始され、S02に進む。S02では、比較的短いタイムスパンが設定される。比較的短いタイムスパンは、オブジェクトの移動速度が比較的大きい場合でも、冗長なDVSピクセルによるフレームのぼやけを回避する目的で設定される。次に、プロセスはS03に進み、タイムスパン内でDVSによってキャプチャされたDVSピクセルを統合することによってフレームが生成される。次に、プロセスはS04に進み、オブジェクトの移動速度を評価する。評価されたオブジェクトの移動速度が十分に速い場合、プロセスはS03に戻り、次のタイムスパン内でDVSによってキャプチャされたDVSピクセルを統合することによって次のフレームが生成される。評価された移動速度が十分に速くない場合、プロセスはS05に進み、複数の連続フレームを1つの結合フレームに結合することができる。次に、プロセスはS06に進み、結合フレームが所望の効果に達したか否かを評価する。結合フレームが所望の効果に達していない場合(いいえ)、プロセスはS05に戻り、さらに連続フレームが結合フレームに結合される。結合フレームがすでに所望の効果に達している場合(はい)、プロセスはS03に戻り、次のタイムスパン内でDVSによってキャプチャされたDVSピクセルを統合することによって次のフレームが生成される。
【0031】
S02で設定される短いタイムスパンの特定の値は、特定のアプリケーションシナリオに依存する可能性があり、オブジェクトの移動速度がシナリオでは比較的速くても、冗長なDVSピクセルによるフレームのぼやけを回避するためにタイムスパンが十分に小さい限り、任意の適切な値を有することができる。本開示のいくつかの実施形態では、S02で設定される短いタイムスパンは、500マイクロ秒以下、1ミリ秒以下、2ミリ秒以下、3ミリ秒以下、4ミリ秒以下であり得る。
【0032】
S04におけるオブジェクトの移動速度の評価は、様々な方法で行うことができる。本開示のいくつかの実施形態では、オブジェクトの移動速度は、S03で生成されたフレーム内のDVSピクセルの数または密度に基づいて評価されてもよい。フレームの一部またはフレーム全体におけるDVSピクセルの数または密度が所定の値を超える場合、オブジェクトの移動速度が速いと評価され得る。そうでない場合、オブジェクトの移動速度は安定している、または遅いと評価され得る。本開示の他のいくつかの実施形態では、オブジェクトの移動速度は、適切な速度センサによって検出または評価され得る。本開示の他のいくつかの実施形態では、オブジェクトの移動速度の評価または推定は、深層学習アルゴリズムまたはモデルを使用することによって実行され得る。深層学習アルゴリズムまたはモデルは当該技術分野で公知であるため、詳細な説明は省略する。
【0033】
本開示のいくつかの実施形態によれば、S05において、2、3、4、または5つの連続フレームが1つの結合フレームに結合され得る。しかしながら、本開示はこれに限定されず、S05において1つのフレームに結合される連続フレームの数は、任意の適切な数であってよい。他のいくつかの実施形態では、S05で1つのフレームに結合される連続フレームの数は、S04からの評価結果に依存し得る。例えば、S04で評価された移動速度が非常に遅い場合、比較的多数の連続フレーム、例えば4つまたは5つ以上の連続フレームが、S05で1つのフレームに結合され得る。そうでない場合、比較的少数の連続フレーム、例えば2つまたは3つの連続フレームがS05において1つのフレームに結合されてもよい。
【0034】
S06における結合フレームが所望の効果に達したか否かの評価は、様々な方法で行うことができる。本開示のいくつかの実施形態では、評価は、S05で生成された結合フレーム内のDVSピクセルの数または密度に基づいて実行され得る。結合フレームの一部または結合フレーム全体におけるDVSピクセルの数または密度が所定の値を超える場合、所望の効果が達成されたと判断される。それ以外の場合は、所望の効果が得られていないと判断される。他のいくつかの実施形態では、高密度DVSピクセルを有する領域が識別され、フレーム内の高密度DVSピクセル領域の割合に基づいて評価が実行され得る。例えば、いくつかの実施形態では、フレームを複数の領域、例えば100個の領域に分割することができ、所定の数を超えるDVSピクセルを有する各領域を高密度DVSピクセル領域として識別し、高密度DVSピクセル領域の数に基づいて評価を行うことができる。例えば、結合フレーム内の高密度DVSピクセル領域の数が所定の数を超えた場合、所望の効果が達成されたと判断される。それ以外の場合は、所望の効果が得られていないと判断される。本開示の他のいくつかの実施形態では、結合フレームが所望の効果に達したかどうかに関する評価は、深層学習アルゴリズムまたはモデルを使用することによって実行され得る。深層学習アルゴリズムまたはモデルは、所望のオブジェクトを検出するために使用できる。検出が成功した場合、つまり深層学習アルゴリズムまたはモデルが所望のオブジェクトを認識できた場合、目的の効果が達成されたと判断される。それ以外の場合は、所望の効果が得られていないと判断される。
【0035】
図6は、本開示のいくつかの実施形態による、
図5のステップS05の例示的なプロセスを示す。プロセスはS51で開始され、次にS52に進み、出力フレーム内のすべてのピクセルを背景色(グレーレベル)に設定することによって出力フレームが初期化される。次に、プロセスはS53に進み、複数の連続フレームのうちの1つを出力フレームに結合する。次に、プロセスはS54に進み、複数の連続フレームがすべて出力フレームに結合されたか否かが判定される。複数の連続フレームがすべて出力フレームに結合されたと判定された場合には、プロセスはS55に進み、出力フレームが結合フレームとして出力される。そうでない場合、プロセスはS53に戻り、複数の連続フレームのうちの次の1つを出力フレームに結合する。
【0036】
図6には、
図5のステップS05のプロセスの一例が示されているが、本発明はこれに限定されない。例えば、他のいくつかの実施形態では、複数の連続フレームのうちの1つを出力フレームとして設定し、複数の連続フレームの他(複数可)のそれぞれを出力フレームに結合することができる。
【0037】
図7は、本開示のいくつかの実施形態による、
図6のステップS53の例示的なプロセスを示す。プロセスはS531で開始され、次にS532に進み、現在のフレームからの1つのDVSピクセルが出力フレームに結合される。次に、プロセスはS533に進み、現在のフレーム内のすべてのDVSピクセルが出力フレームに結合されたかどうかが判断される。現在のフレーム内のすべてのDVSピクセルが出力フレームに結合されたと判断された場合、プロセスは終了する。そうでない場合、プロセスはS532に戻り、現在のフレーム内のDVSピクセルのうちの次の1つが出力フレームに結合される。
【0038】
図6に示す実施形態では、S53で、複数の連続フレームのフレーム全体が出力フレームに結合される。しかしながら、本開示は、それに限定されない。他のいくつかの実施形態では、フレームの一部だけが結合されて結合フレームに結合される。これは、検出対象の一部が高速で移動する一方で、検出対象の他の一部がゆっくり移動するか、シーン内で静止している場合がある状況で特に有益であり有利である。この状況下では、遅いオブジェクトを含むフレームの部分は結合フレームに結合され得るが、速いオブジェクトを含むフレームの部分は結合フレームに結合されない可能性がある。つまり、遅いオブジェクト(複数可)を含むフレーム部分については、より多くの連続フレームが結合フレームに結合され、一方、高速オブジェクト(複数可)を含むフレーム部分については、より少ない連続フレーム(複数可)が結合フレームに結合される。したがって、速いオブジェクトと遅いオブジェクトの両方に対して満足のいくフレームを実現することができる。
【0039】
本開示のいくつかの実施形態では、DVSフレームまたは結合フレームはグレースケールとして視覚化することができ、DVSフレームまたは結合フレーム内の各ピクセルは複数のグレーレベルを有する。通常、グレースケールの各ピクセルは256のグレーレベル、つまりグレーレベル0からグレーレベル255を有することができ、グレーレベル0は白、グレーレベル255は黒、グレーレベル1~254は白と黒の間のグレーレベルである。しかし、本発明はこれに限定されず、本発明のDVSフレームまたは結合フレームは、任意の適切なグレーレベルを有するグレースケールであってもよい。本開示のいくつかの実施形態では、背景色は、グレーレベル0とグレーレベル255との間の中間グレーレベルである。本開示のいくつかの実施形態では、背景色はグレーレベル128であってもよい。本開示のいくつかの実施形態では、DVSピクセルの[x、y、t、p]のpが、光強度が暗くなってきていることを示す場合、フレーム内の対応するDVSピクセルのグレーレベルをグレーレベル255に設定することができ、DVSピクセルの[x、y、t、p]のpが、光強度が明るくなってきていることを示す場合、フレーム内の対応するDVSピクセルのグレーレベルは、グレーレベル0に設定され得る。このような実施形態では、DVSフレームまたは結合フレーム内の任意のピクセルは、3つの可能なグレーレベル、すなわち、グレーレベル0、グレーレベル128、及びグレーレベル255のうちの1つであり得る。本開示の他のいくつかの実施形態では、3つの可能なグレーレベルが互いに容易に区別できる限り、3つの可能なグレーレベルは、グレーレベル0、グレーレベル128、及びグレーレベル255以外のグレーレベルであってもよい。
【0040】
本開示のいくつかの実施形態では、
図7に示すステップS532は、現在のDVSピクセルのグレーレベルを出力フレーム(結合フレーム)内の対応するピクセルにコピーすること、すなわち、出力フレーム(結合フレーム)内のピクセルのグレーレベルを現在のフレーム内の対応するDVSピクセルのグレーレベルと置き換えることを含む。このような実施形態では、結合フレーム内のDVSピクセルのグレーレベルは、連続フレーム内のソースフレームの連続位置とは無関係である。本開示の他のいくつかの実施形態では、結合フレーム内のDVSピクセルのグレーレベルは、連続DVSフレーム内のソースフレームの連続的な位置に依存し得る。連続DVSフレーム内でソースフレームが後になるほど、結合フレーム内の結果のDVSピクセルのグレーレベルは背景色(グレーレベル)から遠くなる。例えば、連続DVSフレームが3つのフレーム、つまりフレーム1、フレーム2、及びフレーム3を含む場合、ソースDVSピクセルがフレーム3のものであるなら、結果のDVSピクセルは背景色から最も遠いグレーレベルになり、ソースDVSピクセルがフレーム1のものである場合、結果のDVSピクセルは背景色に最も近いグレーレベルになる。
【0041】
図8は、本開示のいくつかの他の実施形態による方法のフローチャートを示す。
図8に示される方法は、ステップS04’及びS07を除いて、
図5に示される方法と同様である。S04’では、オブジェクトの移動速度を評価する。評価されたオブジェクトの移動速度が速すぎる場合には、そうでない場合、プロセスはS07に進み、タイムスパンを短縮し、例えばタイムスパンを現在の値の1/2に設定する。次に、プロセスはS03に戻り、短縮されたタイムスパン内でDVSによってキャプチャされたDVSピクセルを統合することによって次のフレームが生成されるか、または短縮されたタイムスパン内にDVSによってキャプチャされたDVSピクセルを統合することによって現在のフレームが再生成される。評価された移動速度が遅い場合、プロセスはS05に進み、複数の連続フレームを1つの結合フレームに結合することができる。評価された移動速度が通常または中程度の値である場合、プロセスはS03に戻り、タイムスパン内でDVSによってキャプチャされたDVSピクセルを統合することによって次のフレームが生成される。
図8に示す方法の他のステップは、
図5に示すステップと同様であるため、詳細な説明は省略する。
【0042】
本開示のいくつかの実施形態によれば、本開示は以下のように実装することができる。
【0043】
項目1:DVS用のフレームを生成する方法であって、
DVSからオブジェクトのDVSピクセルを受信することと、
タイムスパンをタイムスパン値に初期化することと、
タイムスパン内でキャプチャされたDVSピクセルを統合することによってフレームを生成することと、
前記オブジェクトの移動速度を評価することと、
前記評価された移動速度が第1の閾値よりも低い場合、複数の連続フレームを1つの結合フレームに結合することと、
を含む前記方法。
【0044】
項目2:複数の連続フレームを1つの結合フレームに結合することが、前記複数の連続フレームのそれぞれを1つずつ前記結合フレームに結合することを含む、項目1に記載のフレームを生成する方法。
【0045】
項目3:フレームを1つの結合フレームに結合することが、前記フレーム内の前記DVSピクセルのそれぞれを前記結合フレームに結合することを含む、項目1~2のいずれかに記載のフレームを生成する方法。
【0046】
項目4:前記結合フレーム内の各ピクセルを背景色に初期化することをさらに含む、項目1~3のいずれかに記載のフレームを生成する方法。
【0047】
項目5:DVSピクセルを前記結合フレームに結合することが、前記DVSピクセルのグレーレベルを前記結合フレーム内の対応するピクセルにコピーすることを含む、項目1~4のいずれかに記載のフレームを生成する方法。
【0048】
項目6:前記移動速度が、前記フレームの少なくとも一部におけるDVSピクセルの数または密度に基づいて評価される、項目1~5のいずれかに記載のフレームを生成する方法。
【0049】
項目7:前記移動速度が、前記フレーム内の高密度DVSピクセル領域の割合に基づいて評価される、項目1~6のいずれかに記載のフレームを生成する方法。
【0050】
項目8:複数の連続フレームを1つの結合フレームに結合することが、前記結合フレームの少なくとも一部におけるピクセルの数または密度が閾値以上になるまで、連続フレームを1つの結合フレームに結合することを含む、項目1~7のいずれかに記載のフレームを生成する方法。
【0051】
項目9:前記評価された移動速度が前記第1の閾値よりも高い第2の閾値よりも高い場合、前記タイムスパンをより小さいタイムスパン値に再設定することをさらに含む、項目1~8のいずれかに記載のフレームを生成する方法。
【0052】
項目10:複数の連続フレームを1つのフレームに結合することが、前記複数の連続フレームの少なくとも1つのフレームの一部を前記結合フレームに結合することを含む、項目1~9のいずれかに記載のフレームを生成する方法。
【0053】
項目11:DVSフレームを生成するシステムであって、
オブジェクトのDVSピクセルをキャプチャするように構成されたDVSと、
項目1~10のいずれかに記載の方法を実行するように構成されたプロセッサと、
を含む、前記システム。
【0054】
項目12:項目1~10のいずれかに記載の方法を実行するためにプロセッサによって実行され得るコンピュータプログラムを記憶する、コンピュータ可読記憶媒体。
【0055】
本開示の態様は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)または本明細書において全般に、「回路」、「モジュール」もしくは「システム」と称することができるソフトウェア及びハードウェア態様を結合した実施形態の形をとることができる。
【0056】
本開示は、システム、方法、及び/またはコンピュータプログラム製品であってもよい。コンピュータプログラム製品は、プロセッサに本開示の態様を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体(複数可)を含むことができる。
【0057】
コンピュータ可読記憶媒体は、命令実行デバイスによって使用される命令を保持及び記憶できる有形のデバイスであり得る。コンピュータ可読記憶媒体は、例えば、限定するものではないが、電子記憶デバイス、磁気記憶デバイス、光学記憶デバイス、電磁気記憶デバイス、半導体記憶デバイス、またはそれらの任意の適切な組み合わせであってもよい。コンピュータ可読記憶媒体のより多くの具体例は、網羅的ではないが、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラム可能読み取り専用メモリ(EPROMまたはフラッシュメモリ)、静的ランダムアクセスメモリ(SRAM)、ポータブルのコンパクトディスク読み取り専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピー(登録商標)ディスク、パンチカードもしくは命令が溝に記憶された隆起構造などの機械的符号化デバイス、及び前述の任意の好適な組み合わせを含む。本明細書で使用されるコンピュータ可読記憶媒体は、それ自体、電波または他の自由に伝播する電磁波、導波路または他の伝送媒体を伝播する電磁波(例えば、光ファイバーケーブルを通過する光パルス)、またはワイヤを介して送信される電気信号などの一時的な信号であると解釈されるべきではない。
【0058】
これらのコンピュータ可読プログラム命令は、汎用コンピュータのプロセッサ、専用コンピュータ、または機械を製造するための他のプログラム可能データ処理装置に提供され得、これにより、コンピュータまたは他のプログラム可能データ処理装置のプロセッサを介して実行する命令は、ブロックまたは複数のブロックのフローチャート及び/またはブロック図に指定される機能/行為を実施するための手段を作成する。また、これらのコンピュータ可読プログラム命令は、コンピュータ、プログラム可能データ処理装置、及び/または他のデバイスに特定の方法で機能するように命令できるコンピュータ可読記憶媒体に記憶されてもよく、これにより、命令を記憶しているコンピュータ可読記憶媒体は、フローチャート及び/またはブロック図のブロックまたは複数のブロックに指定される機能/行為の態様を実施する命令を含んだ、製造品を含む。
【0059】
図のフローチャート及びブロック図は、本開示の様々な実施形態に従ったシステム、方法、装置、及びコンピュータプログラム製品の可能である実施態様のアーキテクチャ、機能、及び動作を示す。この点で、フローチャートまたはブロック図の各ブロックは、規定された論理関数(複数可)を実装するための1つ以上の実行可能命令を含むモジュール、セグメント、または命令の一部を表し得る。いくつかの代替実施態様では、ブロックに記載されている機能が、図に記載されている順序とは異なる場合がある。例えば、連続して示される2つのブロックは、実際に、実質的に同時に実行され得る、または、ブロックは、時々、含まれる機能に応じて、逆の順序で実行され得る。また、ブロック図及び/またはフローチャート図の各ブロック、ならびにブロック図及び/またはフローチャート図のブロックの組み合わせは、指定された機能もしくは行為を実行する専用のハードウェアベースのシステムによって実装でき、または専用のハードウェア及びコンピュータ命令の組み合わせによって実行できることに留意されたい。
【0060】
システム及び方法は、本開示の詳細を理解するために一般的な用語で説明されている。いくつかの場合では、本開示の態様を分かりにくくすることを避けるために、周知の構造、材料、及び/または動作については、特に図示したり、詳細に説明したりしていない。他の場合には、本開示の完全な理解を提供するために、具体的な詳細が記載されている。関連分野の当業者は、本開示が、その趣旨または本質的な特徴から逸脱することなく、例えば特定のシステム、装置、状況、材料、またはコンポーネントに適応するために、他の特定の形態で具体化され得ることを認識するであろう。したがって、本明細書の開示及び説明は、例示を目的とするものであり、本開示の範囲を限定するものではない。よって、本開示は、添付の特許請求の範囲とそれらの均等物とを考慮した場合を除いて、制限されるべきではない。
【国際調査報告】