(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024028201
(43)【公開日】2024-03-01
(54)【発明の名称】オブジェクト検出のための方法及び電子装置、コンピュータが読み込み可能なストレージ媒体
(51)【国際特許分類】
G06T 7/00 20170101AFI20240222BHJP
【FI】
G06T7/00 300F
【審査請求】有
【請求項の数】15
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023132575
(22)【出願日】2023-08-16
(31)【優先権主張番号】111131021
(32)【優先日】2022-08-17
(33)【優先権主張国・地域又は機関】TW
(71)【出願人】
【識別番号】520461440
【氏名又は名称】所羅門股▲分▼有限公司
(74)【代理人】
【識別番号】110001416
【氏名又は名称】弁理士法人信栄事務所
(72)【発明者】
【氏名】チェン チョン ロン
(72)【発明者】
【氏名】ヤオ イン
(72)【発明者】
【氏名】スアン ロック グエン
(72)【発明者】
【氏名】ハ チュン ファム
(72)【発明者】
【氏名】タフジラ ヌグラハ ブリリアン
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096DA02
5L096GA51
5L096HA11
5L096JA03
5L096KA04
(57)【要約】 (修正有)
【課題】オブジェクト検出のための方法、電子装置及びコンピュータが読み込み可能なストレージ媒体を提供する。
【解決手段】方法は、ターゲットオブジェクトに関連する複数のレファレンス画像から複数の識別用特徴を抽出することと、前記複数の識別用特徴から、数量が前記識別用特徴の数量より少ない複数の選出識別用特徴を選出して、第1の特徴データセットを取得して保存することと、検知対象画像の受信に応じて、前記検知対象画像に対して特徴抽出処理を実行して第2の特徴データセットを取得することと、前記第1の特徴データセットと前記第2の特徴データセットに基づいて、前記検知対象画像について類似性判定処理を実行し、前記検知対象画像における前記ターゲットオブジェクトのインスタンスの数量を計算することと、を含む。
【選択図】
図2
【特許請求の範囲】
【請求項1】
電子装置が有するプロセッサにより実行されるオブジェクト検出のための方法であって、
いずれも同一のターゲットオブジェクトに関連して前記ターゲットオブジェクトの1つのインスタンスを含む複数のレファレンス画像に対し特徴抽出処理を実行して、前記複数のレファレンス画像から複数の識別用特徴を抽出するステップaと、
前記識別用特徴から、数量が前記識別用特徴の数量より少ない複数の選出識別用特徴を選出する分類処理を実行して、前記選出識別用特徴により示される前記ターゲットオブジェクトの前記インスタンスに関連する第1の特徴データセットを取得し、前記第1の特徴データセットをストレージユニットに保存するステップbと、
検知対象画像の受信に応じて、前記検知対象画像に対して特徴抽出処理を実行して第2の特徴データセットを取得するステップcと、
前記ストレージユニットにアクセスして前記第1の特徴データセットを取得すると共に、前記第1の特徴データセットと前記第2の特徴データセットに基づいて、前記検知対象画像について類似性判定処理を実行することにより、前記検知対象画像が前記ターゲットオブジェクトの少なくとも1つのインスタンスを含むか否かを判定するステップdと、
前記検知対象画像が前記ターゲットオブジェクトの少なくとも1つのインスタンスを含むと判定される場合、前記検知対象画像における前記ターゲットオブジェクトのインスタンスの数量を計算するステップeと、を含む方法。
【請求項2】
追加の画像を他のレファレンス画像として受信した場合、上記ステップaと上記ステップbとを実行して前記第1の特徴データセットをアップデートすることをさらに含む、請求項1に記載の方法。
【請求項3】
前記追加の画像は、前記検知対象画像からクロップされ、前記ターゲットオブジェクトの1つのインスタンスを含む、請求項2に記載の方法。
【請求項4】
前記ステップaの前に、
1つまたは1つ以上の前記レファレンス画像に対してデータ拡大処理を実行して、少なくとも1つの拡大画像を生成して他のレファレンス画像とすることをさらに含み、
前記データ拡大処理は、垂直反転処理と、水平反転処理と、回転処理と、クロップ処理と、サイズ変更処理との1つまたは1つ以上の処理を含む、請求項1に記載の方法。
【請求項5】
前記ステップaにおいて、各前記識別用特徴はいずれも前記ターゲットオブジェクトの外観関連特徴に関連しており、
前記ステップbにおいて、各前記選出識別用特徴は、それぞれ前記ターゲットオブジェクトの1つの独自の外観関連特徴に関連する、請求項1に記載の方法。
【請求項6】
前記ステップbにおいては、
各前記識別用特徴について、前記識別用特徴により示される前記ターゲットオブジェクトの前記インスタンスの外観関連特徴に基づいて、前記識別用特徴を複数のグループにおける1つに割り当てることと、
各前記グループから1つの前記識別用特徴を選択して複数の前記選出識別用特徴における1つとすることと、が含まれる、請求項1に記載の方法。
【請求項7】
前記ステップeにおいては、前記検知対象画像に基づいてマーク付けされた画像を生成し、前記マーク付けされた画像は、マークされた前記ターゲットオブジェクトの前記少なくとも1つのインスタンスのそれぞれを有することと、前記マーク付けされた画像に基づいて、前記検知対象画像における前記ターゲットオブジェクトのインスタンスの数量を計算することと、が含まれる、請求項1に記載の方法。
【請求項8】
いずれも同一のターゲットオブジェクトに関連すると共に前記ターゲットオブジェクトのインスタンスを含む複数のレファレンス画像を保存するストレージユニットと、
前記レファレンス画像に対して特徴抽出処理を実行して前記ターゲットオブジェクトに関連する複数の識別用特徴を取得する第1の特徴抽出モジュールと、
前記複数の識別用特徴から数量が前記複数の識別用特徴の数量より少ない複数の選出識別用特徴を選出することで、前記ターゲットオブジェクトに関連すると共に前記ストレージユニットに保存される第1の特徴データセットを取得する分類モジュールと、
検知対象画像の受信に応じて前記検知対象画像に対して特徴抽出処理を実行して第2の特徴データセットを取得する第2の特徴抽出モジュールと、
前記ストレージユニットにアクセスして前記第1の特徴データセットを取得し、且つ、前記第2の特徴抽出モジュールから前記第2の特徴データセットを受信し、前記第1の特徴データセットと前記第2の特徴データセットに基づいて、前記検知対象画像について類似性判定処理を実行することにより、前記検知対象画像が前記ターゲットオブジェクトの少なくとも1つのインスタンスを含むか否かを判定する類似性判定モジュールと、
前記検知対象画像が前記ターゲットオブジェクトの少なくとも1つのインスタンスを含む場合、前記検知対象画像における前記ターゲットオブジェクトのインスタンスの数量を計算する計算モジュールと、を備える電子装置。
【請求項9】
追加の画像を他のレファレンス画像として受信した場合、前記第1の特徴抽出モジュールは前記他のレファレンス画像に対して特徴抽出処理を実行して他の識別用特徴を取得し、そして前記分類モジュールは前記他の識別用特徴に基づいて前記第1の特徴データセットをアップデートしてからアップデートした前記第1の特徴データセットを前記ストレージユニットに保存する、請求項8に記載の電子装置。
【請求項10】
前記追加の画像は、前記計算モジュールにより前記検知対象画像からクロップされたものであり、且つ前記ターゲットオブジェクトの1つのインスタンスを含む、請求項9に記載の電子装置。
【請求項11】
1つまたは1つ以上の前記レファレンス画像に対してデータ拡大処理を実行して、少なくとも1つの拡大画像を生成して他のレファレンス画像とするプロセッサを更に備え、
前記データ拡大処理は、垂直反転処理と、水平反転処理と、回転処理と、クロップ処理と、サイズ変更処理との1つまたは1つ以上の処理を含む、請求項8に記載の電子装置。
【請求項12】
前記第1の特徴抽出モジュールは、各前記識別用特徴をいずれも前記ターゲットオブジェクトの外観関連特徴に関連するものとして抽出し、前記分類モジュールは、各前記選出識別用特徴をそれぞれ前記ターゲットオブジェクトの1つの独自の外観関連特徴に関連するものとして選出する、請求項8に記載の電子装置。
【請求項13】
前記分類モジュールは、
各前記識別用特徴について、前記識別用特徴により示される前記ターゲットオブジェクトの前記インスタンスの外観関連特徴に基づいて、前記識別用特徴を複数のグループにおける1つに割り当て、
各前記グループから1つの前記識別用特徴を選択して複数の前記選出識別用特徴における1つとする、請求項12に記載の電子装置。
【請求項14】
前記検知対象画像が前記ターゲットオブジェクトの少なくとも1つのインスタンスを含む場合、前記類似性判定モジュールは前記検知対象画像に基づいてマーク付けされた画像を生成し、前記マーク付けされた画像は、マークされた前記ターゲットオブジェクトの前記少なくとも1つのインスタンスのそれぞれを有し、
前記集計モジュールは、前記マーク付けされた画像に基づいて、前記検知対象画像における前記ターゲットオブジェクトのインスタンスの数量を計算する、請求項13に記載の電子装置。
【請求項15】
電子装置のプロセッサにより実行されると、請求項1に記載される方法における各ステップを前記プロセッサに実施させる指令を含むコンピュータが読み込み可能な非一時的ストレージ媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示はオブジェクト検出のための方法及び電子装置に関し、且つ、コンピュータが読み込み可能なストレージ媒体に関する。
【背景技術】
【0002】
図1に画像におけるターゲットオブジェクトのインスタンスの数量の検出に用いられる従来のプロセスが示されている。使用上、検知対象画像(P)を処理してそれに含まれるターゲットオブジェクトのインスタンスの数量を検出することが求められる際、第1の特徴抽出モジュール21(コンピュータ装置に含まれ得る)が各レファレンス画像(R)(前記コンピュータ装置に予め保存されているものであり得、且つ、いずれもターゲットオブジェクトに関連する)に対して第1の抽出アクションを実行することで、前記レファレンス画像(R)におけるターゲットオブジェクトのインスタンスに関連付けられる第1の特徴データセットを取得する。それから、第2の特徴抽出モジュール22(前記コンピュータ装置に含まれ得る)が前記検知対象画像(P)(前記コンピュータ装置により受信されたものであり得る)に対して第2の抽出アクションを実行することで、前記検知対象画像(P)における前記ターゲットオブジェクトの1つもしくは1つ以上のインスタンスに関連付けられる第2の特徴データセットを取得する。それから、類似性検知モジュール23(前記コンピュータ装置に含まれ得る)が前記第1の特徴データセットと前記第2の特徴データセットに基づいて検知アクションを実行し、且つ、前記検知対象画像(P)から、検知したすべての前記ターゲットオブジェクトのインスタンスにマークが付けられた検知画像(P’)を生成する。それから、計算モジュール24(前記コンピュータ装置に含まれ得る)が計算アクションを実行して前記検知画像(P’)における前記ターゲットオブジェクトのインスタンスの数量を判定して結果を出力する。このようにして、画像に含まれるターゲットオブジェクトにおけるインスタンスの数量の検出が完了する。
【0003】
なお、上記従来のプロセスが実行される度、各レファレンス画像(R)に対して前記第1の抽出アクションが実行される必要がある。これには多くの時間がかかり、このため従来のプロセスの全体の効率が落ちる。更に、場合によっては、一部のレファレンス画像(R)に含まれるターゲットオブジェクトのインスタンスはほぼ同一もしくは類似した見た目を有する。従って、各レファレンス画像(R)に対して行われる第1の抽出アクションは、オブジェクトに関する追加情報を得られない可能性があり、そのために関連の作業も余計となりかねない。
【発明の概要】
【発明が解決しようとする課題】
【0004】
従って、本発明は従来技術の少なくとも1つの欠点を解決できる方法の提供を目的とする。
【課題を解決するための手段】
【0005】
本開示の1つの実施例に基づけば、この方法は電子装置が有するプロセッサにより実行され、且つ、
いずれも同一のターゲットオブジェクトに関連して前記ターゲットオブジェクトの1つのインスタンスを含む複数のレファレンス画像に対し特徴抽出処理を実行して、前記複数のレファレンス画像から複数の識別用特徴を抽出するステップaと、
前記識別用特徴から、数量が前記識別用特徴の数量より少ない複数の選出識別用特徴を選出する分類処理を実行して、前記選出識別用特徴により示される前記ターゲットオブジェクトの前記インスタンスに関連する第1の特徴データセットを取得し、前記第1の特徴データセットをストレージユニットに保存するステップbと、
検知対象画像の受信に応じて、前記検知対象画像に対して特徴抽出処理を実行して第2の特徴データセットを取得するステップcと、
前記ストレージユニットにアクセスして前記第1の特徴データセットを取得すると共に、前記第1の特徴データセットと前記第2の特徴データセットに基づいて、前記検知対象画像について類似性判定処理を実行することにより、前記検知対象画像が前記ターゲットオブジェクトの少なくとも1つのインスタンスを含むか否かを判定するステップdと、
前記検知対象画像が前記ターゲットオブジェクトの少なくとも1つのインスタンスを含むと判定される場合、前記検知対象画像における前記ターゲットオブジェクトのインスタンスの数量を計算するステップeと、を含む。
【0006】
本開示の他の1つの目的は、上記方法を実行するために構成される電子装置を提供する。
【0007】
本開示の1つの実施例に基づいて、上記オブジェクトを検知するための電子装置は、
いずれも同一のターゲットオブジェクトに関連すると共に前記ターゲットオブジェクトのインスタンスを含む複数のレファレンス画像を保存するストレージユニットと、
前記レファレンス画像に対して特徴抽出処理を実行して前記ターゲットオブジェクトに関連する複数の識別用特徴を取得する第1の特徴抽出モジュールと、
前記複数の識別用特徴から数量が前記複数の識別用特徴の数量より少ない複数の選出識別用特徴を選出することで、前記ターゲットオブジェクトに関連すると共に前記ストレージユニットに保存される第1の特徴データセットを取得する分類モジュールと、
検知対象画像の受信に応じて前記検知対象画像に対して特徴抽出処理を実行して第2の特徴データセットを取得する第2の特徴抽出モジュールと、
前記ストレージユニットにアクセスして前記第1の特徴データセットを取得し、且つ、前記第2の特徴抽出モジュールから前記第2の特徴データセットを受信し、前記第1の特徴データセットと前記第2の特徴データセットに基づいて、前記検知対象画像について類似性判定処理を実行することにより、前記検知対象画像が前記ターゲットオブジェクトの少なくとも1つのインスタンスを含むか否かを判定する類似性判定モジュールと、
前記検知対象画像が前記ターゲットオブジェクトの少なくとも1つのインスタンスを含む場合、前記検知対象画像における前記ターゲットオブジェクトのインスタンスの数量を計算する計算モジュールと、を備える。
【0008】
本開示の他の1つの目的は、プロセッサに上記方法を実施させる指令を含むコンピュータが読み込み可能な非一時的ストレージ媒体を提供する。
【図面の簡単な説明】
【0009】
本開示の他の特徴および利点は、添付の図面を参照した以下の実施形態の詳細な説明から明らかになるであろう。さまざまな特徴が正確な縮尺で描かれていない場合があることに留意されたい。
【
図1】
図1は画像におけるターゲットオブジェクトのインスタンスの数量を検知する従来のプロセスが示される模式図である。
【
図2】
図2は本開示の1つの実施例に基づくオブジェクト検出のための方法の各ステップが示されるフローチャートである。
【
図3】
図3は本開示の1つの実施例に基づくオブジェクト検出に用いられる例示的な電子装置の構成が示されるブロック図である。
【
図4】
図4には複数のレファレンス画像の取得に用いられるソース画像が示されている。
【
図5】
図5にはターゲットオブジェクトに関連する第1の特徴データセットを取得するステップに含まれる例示的な処理の流れが示される。
【
図6】
図6には本開示の1つの実施例に基づく検知プロセスに含まれる例示的な処理の流れが示される。
【発明を実施するための形態】
【0010】
本開示についてより詳しく説明する前に、適切と考えられる場合、参照符号もしくは参照符号の末尾部分が、対応するまたは類似の要素を示すために図面間で繰り返され、これらは類似する特徴を選択的に有する可能性があることに留意されたい。
【0011】
本開示全体を通して、「に結合される」または「に接続される」という用語は、導電性材料(例えば、電線)を介した複数の電気装置/デバイス/機器間の直接接続、もしくは他の1つ以上の装置/デバイス/機器または無線通信を介した2つの電気装置/デバイス/機器間の間接接続を指す場合がある。
【0012】
図2は本開示の1つの実施例のオブジェクト検出のための方法の各ステップが示されるフローチャートである。この実施例において、この方法は電子装置を使用して実行される。
【0013】
図3は本開示の1つの実施例においてオブジェクト検出に用いられる電子装置1の構成例が示されるブロック図である。この実施例において、電子装置1として例えばサーバー、コンピュータ、ノートパソコン、タブレット、モバイル装置などが挙げられ、ストレージユニット11と、プロセッサ12と、コミュニケーションユニット13とを有する。
【0014】
ストレージユニット11としては例えばランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、プログラマブルROM(PROM)、ファームウェア、もしくはフラッシュメモリなどを用いて実施することができる。このストレージユニット11にソフトウエアアプリケーションと複数のレファレンス画像P1とが保存される。
【0015】
プロセッサ12はストレージユニット11に接続され、且つ、シングルコアプロセッサと、マルチコアプロセッサと、デュアルコアモバイルプロセッサと、マイクロプロセッサと、マイクロコントローラーと、デジタルシグナルプロセッサ(DSP)と、フィールドプログラマブルゲートアレイ(FPGA)と、特定用途向け集積回路(ASIC)と、無線周波数集積回路(RFIC)などを含むことが可能であるがこれらに限らない。上記ソフトウエアアプリケーションに、プロセッサ12により実行される際、プロセッサ12に下記の処理を実施させる指令が含まれている。
図3に示される実施例において、上記ソフトウエアアプリケーションにおける異なる部分を実行するプロセッサ12は、分類モジュール121と、第1の特徴抽出モジュール122と、第2の特徴抽出モジュール123と、類似性判定モジュール124と、計算モジュール125とを含む様々なモジュールとして稼働することができる。
【0016】
なお、他の実施例において、プロセッサ12に含まれるモジュールは、一つもしくは複数の特定用途向け集積回路(ASIC)チップ、一つもしくは複数のプログラマブルロジックデバイス(PLDS)、あるいは、ファームウェアがそれぞれ組み込まれている一つもしくは複数のマイクロコントローラーを用いて実施することができる。プロセッサ12に含まれる各モジュールは、関連の処理を実行するようにニューラルネットワークモデルにより構成されることができる。例えば、一部の実施例において、第1の特徴抽出モジュール122と第2の特徴抽出モジュール123とはいずれもYOLO(You Only Look Once)ニューラルネットワークモデルを用いて実施することが可能であり、畳み込みニューラルネットワーク(CNN)構造をバックボーンとして使用する。この第1の特徴抽出モジュール122を構成するYOLOニューラルネットワークモデルの構造(レイヤー、ニューロン、そして関連のパラメータ)は、第2の特徴抽出モジュール123を構成するそれと類似もしくは同一であることができ、従って一部の実施例においては第1の特徴抽出モジュール122と第2の特徴抽出モジュール123とは、2つの同一のモジュールを用いて実施されることができる。なお、異なる応用において、第1の特徴抽出モジュール122と第2の特徴抽出モジュール123とは異なる構造を有する異なるニューラルネットワークを含むことができる。
【0017】
コミュニケーションユニット13はプロセッサ12に接続され、且つ、無線周波数集積回路(RFIC)、ブルートゥース(登録商標)やWi-Fiなどの無線技術を用いて短距離無線コミュニケーションネットワークをサポートする短距離無線コミュニケーションモジュール、ロング・ターム・エヴォリューション(LTE)や第3世代(3G)や第4世代(4G)や第5世代(G)といった無線モバイル遠距離電気通信技術技術を用いて遠距離電気通信をサポートするモバイルコミュニケーションモジュール、またはこれらに類似するものとにおける1つもしくは1つ以上を含むことができる。
【0018】
複数のレファレンス画像P1はいずれも同一のターゲットオブジェクトに関連する。ソース画像(A)にイチゴだけが含まれている
図4に示される例において、ターゲットオブジェクトはイチゴである。しかし本開示はこのような例に限られない。この実施例において、複数のレファレンス画像P1はプロセッサ12によって(予めにストレージ手段11に保存され、あるいはコミュニケーションユニット13によって取得された)ソース画像(A)から予めに取得されることができる。具体的に言うと、ソース画像(A)における複数の異なるエリアはいずれも前記ターゲットオブジェクトの1つの認識可能なインスタンスが含まれるため、これを特定しクロップアウトしてレファレンス画像P1とすることができる。一部の実施例において、ターゲットオブジェクトは人手により特定されるが、他の一部の実施例においては、ターゲットオブジェクトはオブジェクトを特定するアルゴリズムによって自動的に特定され、そして人手による特定結果と異なる可能性がある。
【0019】
一部の実施例においては、上記方法が実行される前に、プロセッサ12が1つもしくは1つ以上のレファレンス画像P1に対してデータ拡大処理を実行することによって、少なくとも1つの拡大画像を生成して追加のレファレンス画像P1とする。このデータ拡大処理は、反転処理(垂直もしくは水平)と、回転処理と、クロップ処理と、サイズ変更処理(拡大もしくは縮小)との1つまたは1つ以上の処理を含み得る。ちなみに、このデータ拡大処理は関連の技術分野において周知されているので、簡潔性の観点から詳しい説明を省略する。
【0020】
使用に際しては、検知オブジェクト画像P3に対してオブジェクト検知処理を実行してターゲットオブジェクトのインスタンスとして認識される検知オブジェクト画像P3に含まれるターゲットオブジェクトの数量を判定することが求められる際、
図3に示される電子装置1を用いて
図2に示される方法を実行することが考えられる。
【0021】
ステップS1では、プロセッサ12は複数のレファレンス画像P1から複数の識別用特徴を抽出する。一部の実施例において、各識別用特徴はそれぞれ前記ターゲットオブジェクトの1つの独自の外観関連特徴(例えば形状、材質など)に関連するが、これに限られない。
【0022】
具体的に言うと、これらレファレンス画像P1はプロセッサ12の第1の特徴抽出モジュール122に入力される。これに応じて、第1の特徴抽出モジュール122はレファレンス画像P1に対して特徴抽出処理を実行して複数の識別用特徴を出力する。これらの識別用特徴は次の処理のために分類モジュール121に転送される。
【0023】
ステップS2では、分類モジュール121はこれら識別用特徴の受信に応じて、第1の特徴抽出モジュール122から受信した識別用特徴から複数の選出識別用特徴P2を選出する分類処理を実行して、これらの選出識別用特徴を用いて第1の特徴データセットを生成するように構成される。なお、選出識別用特徴P2の数は識別用特徴の数より少ない。
【0024】
具体的には、一部の実施例において、第1の特徴抽出モジュール122は、各識別用特徴のそれぞれについて、その識別用特徴が関連する前記ターゲットオブジェクトのインスタンスの外観関連特徴に基づいて、その識別用特徴を複数のグループにおける1つに割り当てるように構成される。各グループは前記ターゲットオブジェクトが有する1つの外観関連特徴に関連することができるが、これに限られない。分類モジュール121は、各識別用特徴について、その識別用特徴に基づいて前記ターゲットオブジェクトのインスタンスの外観関連特徴を判定して、このように判定された外観関連特徴に基づいてその識別用特徴を1つのグループに割り当てるように構成される。したがって、同一のグループに振り分けられる識別用特徴により示される前記ターゲットオブジェクトのインスタンスは、いずれも類似する外観を有する。なお、この分類処理は関連の技術分野において周知されているので、簡潔性の観点から詳しい説明を省略する。
【0025】
次いで、分類モジュール121は各グループから1つの識別用特徴を選択して選出識別用特徴P2とするように構成される。従って、複数の選出識別用特徴P2は複数のグループからそれぞれ選出される。このため、その後の処理は、レファレンス画像P1から抽出されたすべての識別用特徴の代わりに、選出識別用特徴P2に対して行われることができ、したがってこの方法においては、レファレンス画像P1に含まれる情報の多様性を犠牲にすることなく、必要とされる計算の数を減らせることができる。結果として、各選出識別用特徴P2はターゲットオブジェクトの異なる外観関連特徴にそれぞれ関連する。言い換えれば、各レファレンス画像P1において、各選出識別用特徴P2における1つにより示されるターゲットオブジェクトのそれと同一の外観関連特徴を示す識別用特徴は破棄されるため、選出識別用特徴P2の数は第1の特徴抽出モジュール122により抽出される識別用特徴の数より少なくなる。なお、他の実施例においては、異なる方法で選出識別用特徴P2を選出することができるため、上記に限られない。分類モジュール121により取得される選出識別用特徴P2は、ストレージユニット11に保存される第1の特徴データセットを構成する。
【0026】
図5にステップS1及びステップS2に含まれる処理の例示的なフローチャートが示される。一部の実施例において、第1の特徴データセットの中身には、選出識別用特徴P2に示される前記ターゲットオブジェクトの多くのインスタンスの例えば外観関連特徴(例えば形状、材質など)が含まれることができる。従って、レファレンス画像P1からのデータの情報の多様性を損なうことなく第1の特徴データセットのサイズを削減することができる。
【0027】
更に、
図6に示されるように、第1の特徴データセットが生成されて保存された後、ストレージ手段11からもしくはネットワーク(例えばインターネット)を経由してリモート装置から取得した検知対象画像P3は第2の特徴抽出モジュール123に入力される。プロセッサ12は、検知対象画像P3の受信に応じて、ステップS3からS5を含む検知プロセスを実行するように構成される。
具体的には、ステップS3において、検知対象画像P3において検出された各オブジェクト(以下、「検出されたオブジェクト」と称す)について、第2の特徴抽出モジュール123はそのオブジェクトに対して特徴抽出処理を実行してその検出されたオブジェクトに関連する第2の特徴データセットを取得してから、取得した第2の特徴データセットを類似性判定モジュール124に転送する。
【0028】
ステップS4において、類似性判定モジュール124はストレージユニット11にアクセスして第1の特徴データセットを取得し、第1の特徴データセットと第2の特徴データセットとに基づいて検知対象画像P3に対する類似性判定処理を実行することで、検知対象画像P3にターゲットオブジェクトの少なくとも1つのインスタンスが含まれるかを判定する。具体的に言うと、この類似性判定処理は、第1の特徴データセットに含まれる各選出識別用特徴(例えば、それぞれターゲットオブジェクトの独自の外観関連特徴を表現する)に対して、第2の特徴データセットにより表現されるオブジェクト(例えば、検知対象画像P3に含まれる1つの検出されたオブジェクト)と、第1の特徴データセットにより表現されるオブジェクトとの間の類似性スコアを計算する。なお、この類似性スコアを計算する処理は、関連の技術分野において周知されているので、簡潔性の観点から詳しい説明を省略する。
【0029】
所定の閾値を超えた類似性スコアが取得された場合、類似性判定モジュール124は、検知対象画像P3に含まれるオブジェクトは前記ターゲットオブジェクトのインスタンスであると判定する。
【0030】
実践的には、類似性判定モジュール124は一つもしくは複数の検出されたオブジェクトを前記ターゲットオブジェクトのインスタンスとして判定することができる(以下ではこれらの検出されたオブジェクトを特定されたオブジェクトと称する)。
【0031】
一部の実施例においては、類似性判定処理の前に、類似性判定モジュール124はまず第2の特徴データセットに対してノーマライゼーション処理を実行する。これは異なる検知オブジェクト画像は異なるサイズを有する可能性があるためであり、よって第1の特徴データセットと比較される第2の特徴データセットはノーマライズされる。
【0032】
一部の実施例において、類似性判定モジュール124は更に検知対象画像P3における各特定されたオブジェクトに対してマークを付けてマーク付けされた画像P4を生成するように構成される。一部の実施例において、このマークは比較的に明るい色を有するドットであることができる。
【0033】
一方、所定の閾値を超えた類似性スコアが判定されなかった場合、検知対象画像P3に前記オブジェクトのインスタンスが含まれていない(すなわち、検知対象画像P3における検出されたオブジェクトはいずれも前記ターゲットオブジェクトではない)と推定でき、そして類似性判定モジュール124はターゲットオブジェクトが検出されなかったことを示す信号を出力することができる。なお、ターゲットオブジェクトが検出されなかった場合、この方法は即時終了される。
【0034】
もしそうでなく、検知対象画像P3における少なくとも1つの検出されたオブジェクトが前記ターゲットオブジェクトのインスタンスと判定された場合、検知対象画像P3に基づいてマーク付けされた画像P4が生成されて計算モジュール125に転送される。
【0035】
ステップS5において、計算モジュール125はマーク付けされた画像P4に基づいて検知対象画像P3における特定されたオブジェクトの数量を計算し(すなわち、検知対象画像P3における前記ターゲットオブジェクトのインスタンスの数量を計算する)、そして結果を出力する。具体的には、計算モジュール125はピーク検出アルゴリズム(例えば、「peak_local_max」関数機能)を含むことができ、マーク付けされた画像P4に適用してマーク付けされた画像P4において類似性判定モジュール124により付けられたマークを特定する。このように、計算モジュール125は、検知対象画像P3における特定されたオブジェクトの数と同じとなるマーク付けされた画像P4において見つけられたマークの数を記録するように構成される。それから、検知対象画像P3における特定されたオブジェクトの数が、検知対象画像P3におけるターゲットオブジェクトのインスタンスの数量の結果として記録されまたは出力されることができ、そして上記方法は完了される。
【0036】
なお、この実施例において、検知対象画像P3における特定されたオブジェクトの数量の計算は、まずマーク付けされた画像P4を生成してからマーク付けされた画像P4に対して処理を行うことで特定されたオブジェクトの数量を集計することになっているが、他の実施例においては、特定されたオブジェクトの数量の集計は、他の方法で行うことも可能であり(例えば、ヒートマップを使用する)、上記実施例に限定されない。
【0037】
なお、上記方法は従来のプロセスと比べて以下の利点を有し得る。まず、プロセッサ12はレファレンス画像P1からプロセッサ12により抽出された複数の識別用特徴から複数の選出識別用特徴P2を選出するように構成され、且つこの選出は選出識別用特徴P2の数がプロセッサ12により抽出される識別用特徴より少なく、そして選出識別用特徴P2がなおターゲットオブジェクトの多様なインスタンスを保持するように行われるので、比較的に少ない画像に対して処理を行うことができ、効率を高めることができると共に、第1の特徴データセットに含まれるその後の処理に使われる情報の多様性を犠牲にしなくて済む。更に、ターゲットオブジェクトに関連する第1の特徴データセットを取得した後、第1の特徴データセットはデータストレージ11に保存され、ある画像に対して同一のオブジェクトを検知する処理を行いたい時にアクセスすることができる。言い換えれば、同一のターゲットオブジェクトに対する上記方法が後に実行される場合は、ステップS1とS2を省略することができ、実行される必要があるのは検知プロセスにおけるS3~S5のみである。従って、その後の同一のターゲットオブジェクトに対する上記方法が後に実行される場合、計算は大幅に縮減することができる。
【0038】
一部の実施例において、上記方法の1回の実行が完成した後に、(第1の特徴データセットに追加情報を提供するために)前記ターゲットオブジェクトの追加の画像をレファレンス画像P1として提供したい場合、ステップS1とS2の処理もしくはステップS1とS2に類似する処理が、(一つもしくは複数の追加レファレンス画像P1としての)一つもしくは複数の追加の画像を受信した後に実行されることで、第1の特徴データセットをアップデートし、そしてアップデートされた第1の特徴データセットをストレージユニット11に保存することができる。すなわち、第1の特徴抽出モジュール122は該追加されたレファレンス画像に対して特徴抽出処理を実行することで他の識別用特徴を取得し、そして分類モジュール121はこの(他の識別用特徴として選出され得るあるいは選出されない)他の識別用特徴に基づいて第1の特徴データセットをアップデートしてアップデートされた第1の特徴データセットをストレージユニット11に保存することができる。
【0039】
一部の実施例において、この追加の画像は集計モジュール125により検知対象画像P3からクロップされた画像であることができ、各追加の画像は前記ターゲットオブジェクトの一つの認識可能なインスタンスを含む。例えば、上記方法を1回実行した後、検知対象画像P3は人手による検査により、それぞれ前記ターゲットオブジェクトの一つの認識可能なインスタンスを含む複数のクロップされた画像がクロップにより取得される。あるいは、プロセッサ12は類似性スコアが所定の閾値を超えたオブジェクトを含む検知対象画像P3の一部をクロップしてクロップされた画像を取得するように構成されることができる。
【0040】
以上をまとめると、本開示の実施例は、オブジェクトの検知を実行する方法及び電子装置を提供する。この方法において、いずれもターゲットオブジェクトの認識可能なインスタンスを含む複数のレファレンス画像が処理され、各レファレンス画像は該レファレンス画像に含まれる前記ターゲットオブジェクトのインスタンスの外観関連特徴に基づいて1つのグループに割り当てられる。それから、レファレンス画像から複数の選出された画像が選出されることで、選出された画像に含まれる前記ターゲットオブジェクトのインスタンスの外観関連特徴の多様性を確保すると共に、選出された画像の数がレファレンス画像の数より少ない。それから、選出された画像を処理することにより第1の特徴データセットが取得され、この第1の特徴データセットはターゲットオブジェクトに関連し、且つ、ある検知対象画像に対して処理を行うことで該検知対象画像における前記ターゲットオブジェクトのインスタンスの数量を判定したい時に使用される。従って、前記ターゲットオブジェクトに関連する第1の特徴データセットを取得する処理は、少ない画像に対する処理によって達成されることができるため、処理されるデータの多様性を損なうことなく処理の効率を向上させることができる。一部の場合においては、処理される画像の数が減るので、特徴の抽出に用いられるニューラルネットワークモデルの構造は、各選出された画像からより多くの特徴を抽出できるように変更されることができるようになり、従って最終的にはオブジェクトを検出する精度を向上させることができる。
【0041】
この開示の1つの実施例によれば、上記オブジェクトを検知する方法を実行するコンピュータが読み込み可能な非一時的ストレージ媒体を提供する。このコンピュータが読み込み可能な非一時的ストレージ媒体には、電子装置のプロセッサにより実行されると、プロセッサに
図2の方法の各ステップに書かれている処理を実施させる指令を含むソフトウエアアプリケーションが保存される。一部の実施例において、このコンピュータが読み込み可能な非一時的ストレージ媒体は電子装置1におけるデータストレージ11に類似する形であることができる。
【0042】
上記の説明では、説明のために、実施形態の完全な理解を提供するために、多数の特定の詳細が設定されている。しかしながら、当業者には、これらの具体的な詳細のいくつかがなくても、1つまたは複数の他の実施形態が実践され得ることが明らかであろう。また、本明細書全体を通して、「一実施形態」、「一実施形態」、序数の表示を伴う実施形態等への言及は、特定の特徴、構造、または特性が、本開示の実施に含まれ得ることを意味することを理解すべきである。本明細書では、本開示を合理化し、様々な発明的側面の理解を助ける目的で、様々な特徴が単一の実施形態、図、またはその説明にまとめられていることがあり、1つの実施形態からの1つまたは複数の特徴または特定の詳細が、本開示の実施において、必要に応じて別の実施形態からの1つまたは複数の特徴または特定の詳細とともに実施され得ることをさらに理解すべきである。
【0043】
本開示は、例示的な実施形態と考えられるものに関連して説明されてきたが、本開示は、開示された実施形態に限定されるものではなく、そのような修正および同等の配置をすべて包含するように最も広い解釈の精神および範囲内に含まれる種々の配置を網羅することが意図されていることが理解される。
【外国語明細書】