(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-15
(45)【発行日】2024-05-23
(54)【発明の名称】画像処理システム、情報処理装置、プログラムおよび画像処理方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20240516BHJP
【FI】
G06T7/00 300D
(21)【出願番号】P 2020074922
(22)【出願日】2020-04-20
【審査請求日】2022-11-02
(73)【特許権者】
【識別番号】507214083
【氏名又は名称】メタウォーター株式会社
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100150360
【氏名又は名称】寺嶋 勇太
(74)【代理人】
【識別番号】100163511
【氏名又は名称】辻 啓太
(72)【発明者】
【氏名】川原 恭介
(72)【発明者】
【氏名】高橋 宏幸
【審査官】新井 則和
(56)【参考文献】
【文献】特開2017-199278(JP,A)
【文献】特開2014-142760(JP,A)
【文献】特開2009-223527(JP,A)
【文献】特開2013-062688(JP,A)
【文献】特開2015-182604(JP,A)
【文献】特開2010-218395(JP,A)
【文献】特開平06-347420(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
入力画像における認識対象の画像認識のための調整を行う調整手段と、
前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備え、
前記調整手段は、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、画像処理システム。
【請求項2】
請求項1に記載の画像処理システムにおいて、
前記調整手段は、前記ウィンドウのサイズを固定し、前記面積比および前記長さ比の少なくとも一方が前記所定の範囲に収まるように、前記入力画像の解像度を徐々に変化させる、画像処理システム。
【請求項3】
請求項1に記載の画像処理システムにおいて、
前記調整手段は、前記入力画像の解像度を固定し、前記面積比および前記長さ比の少なくとも一方が前記所定の範囲に収まるように、前記ウィンドウのサイズを徐々に変化させる、画像処理システム。
【請求項4】
請求項1に記載の画像処理システムにおいて、
前記調整手段は、認識対象が予め指定された教師画像を用いた機械学習により作成されたモデルを用いて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、画像処理システム。
【請求項5】
入力画像における認識対象の画像認識のための調整を行う調整手段と、
前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備え、
前記調整手段は、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、情報処理装置。
【請求項6】
入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備える画像処理システムを構成するために、
前記調整手段および前記認識手段の少なくとも1つを備え、
前記調整手段は、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する情報処理装置。
【請求項7】
情報処理装置を、
入力画像における認識対象の画像認識のための調整を行う調整手段と、
前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、として機能させ、
前記調整手段は、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、プログラム。
【請求項8】
通信可能に接続された複数の情報処理装置によって構成され、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備え
る画像処理システムにおける、記複数の情報処理装置のうちの1つの情報処理装置を、
前記調整手段および前記認識手段のうち少なくとも1つとして機能させ、
前記調整手段は、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、プログラム。
【請求項9】
入力画像における認識対象の画像認識のための調整を行う調整ステップと、
前記調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識ステップと、を含み、
前記調整ステップでは、前記ウィンドウ内の画像の面積に対する前記認識対象の画像の面積の比である面積比、および、前記ウィンドウ内の画像の長さに対する前記認識対象の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する、画像処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理システム、情報処理装置、プログラムおよび画像処理方法に関する。
【背景技術】
【0002】
特許文献1には、撮像装置の撮像画像を、撮像装置からの距離に応じて複数の領域に分割し、分割した領域を単位として、認識対象の画像認識を行う技術が記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載されている技術では、認識対象の移動に伴って撮像装置の撮像画像における認識対象の大きさが変動しても、認識対象を追跡するために、撮像画像を撮像装置からの距離に応じて複数の領域に分割している。
【0005】
しかしながら、特許文献1に記載されている技術では、撮像画像に映る認識対象のサイズによっては、認識対象の正確な画像認識を行うことができないという問題があった。
【0006】
かかる事情に鑑みてなされた本発明の目的は、認識対象の画像認識の精度向上を図ることにある。
【課題を解決するための手段】
【0007】
本発明の一実施形態に係る画像処理システムは、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備え、前記調整手段は、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
【0008】
本発明の一実施形態に係る情報処理装置は、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備え、前記調整手段は、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
【0009】
本発明の一実施形態に係る情報処理装置は、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備える画像処理システムを構成するために、前記調整手段および前記認識手段の少なくとも1つを備え、前記調整手段は、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
【0010】
本発明の一実施形態に係るプログラムは、情報処理装置を、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、として機能させ、前記調整手段は、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
【0011】
本発明の一実施形態に係るプログラムは、通信可能に接続された複数の情報処理装置によって構成され、入力画像における認識対象の画像認識のための調整を行う調整手段と、前記調整手段による調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識手段と、を備える画像処理システムにおける、記複数の情報処理装置のうちの1つの情報処理装置を、前記調整手段および前記認識手段のうち少なくとも1つとして機能させ、前記調整手段は、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
【0012】
本発明の一実施形態に係る画像処理方法は、入力画像における認識対象の画像認識のための調整を行う調整ステップと、前記調整後、前記入力画像に対して、前記入力画像における前記認識対象の画像認識の単位であるウィンドウを走査し、前記ウィンドウ内の画像における前記認識対象の画像認識を行う認識ステップと、を含み、前記調整ステップでは、前記認識対象のサイズに応じて、前記ウィンドウのサイズおよび前記入力画像の解像度の少なくとも一方を調整する。
【発明の効果】
【0013】
本発明の一実施形態によれば、認識対象の画像認識の精度向上を図ることができる。
【図面の簡単な説明】
【0014】
【
図1】本発明の一実施形態に係る画像処理システムの構成の一例を示す図である。
【
図2】
図1に示す情報処理装置による画像認識について説明するための図である。
【
図3】
図1に示す情報処理装置の動作の一例を示すフローチャートである。
【
図4】
図1に示す調整手段の動作の一例を示すフローチャートである。
【
図5A】
図1に示す調整手段による撮像画像の解像度の調整の一例を示す図である。
【
図5B】
図1に示す調整手段によるウィンドウのサイズの調整の一例を示す図である。
【
図6】
図1に示す調整手段の動作の他の一例を示すフローチャートである。
【
図7】
図1に示す調整手段の動作を模式的に示す図である。
【発明を実施するための形態】
【0015】
以下、本発明の実施の形態について図面を参照して例示説明する。各図中、同一符号は、同一または同等の構成要素を示している。
【0016】
図1は、本発明の一実施形態に係る画像処理システム1の構成の一例を示す図である。
【0017】
図1に示す画像処理システム1は、撮像装置10と、情報処理装置20とを備える。撮像装置10と情報処理装置20とは、例えば、インターネット、携帯電話網などのネットワークを介して、有線通信および/または無線通信による通信が可能である。
【0018】
撮像装置10は、所定の範囲を撮像した撮像画像を生成する装置である。撮像装置10は、生成した撮像画像を情報処理装置20に送信する。
【0019】
情報処理装置20は、撮像装置10の撮像画像を入力画像とし、入力画像における認識対象の画像認識を行う装置である。情報処理装置20は、例えば、ネットワークを介して撮像装置10と通信可能な、サーバ装置、パーソナルコンピュータなどの装置である。情報処理装置20は、例えば、
図2に示すように、撮像装置10の撮像画像2に対して、画像認識の単位であるウィンドウ3を横方向および縦方向に走査し、ウィンドウ3内の画像における認識対象4の画像認識を行う。
【0020】
図1を再び参照して、情報処理装置20のハードウェア構成について説明する。
【0021】
通信部21は、有線または無線を介して外部装置と通信する1つ以上の通信インタフェースである。本実施形態においては、通信部21は、撮像装置10と通信する通信インタフェースを含む。通信部21は、撮像装置10から送信されてきた撮像画像2を取得し、制御部23に出力する。
【0022】
記憶部22は、1つ以上のメモリである。メモリは、例えば、半導体メモリ、磁気メモリまたは光メモリなどであるが、これらに限られず任意のメモリとすることができる。記憶部22は、例えば、一次記憶装置または二次記憶装置として機能する。記憶部22は、例えば、情報処理装置20に内蔵されるが、任意のインタフェースを介して情報処理装置20に外部から接続される構成も可能である。
【0023】
制御部23は、1つ以上のプロセッサである。制御部23は、例えば、マイクロコントローラであるがこれに限られず、例えば、汎用のプロセッサまたは特定の処理に特化した専用プロセッサなど、任意のプロセッサとすることができる。制御部23は、情報処理装置20全体の動作を制御する。
【0024】
次に、情報処理装置20のソフトウェア構成について、
図1を参照して説明する。情報処理装置20の動作の制御に用いられる1つ以上のプログラムが記憶部22に記憶される。当該1つ以上のプログラムは、制御部23により読み込まれると、制御部23を、調整手段231および認識手段232として機能させる。
【0025】
調整手段231は、画像認識の単位であるウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する手段である。調整手段231は、ウィンドウ3内の画像における認識対象4のサイズに応じて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。調整手段231の動作の詳細については後述する。
【0026】
認識手段232は、調整手段231による調整後、撮像画像2に対してウィンドウ3を走査し、ウィンドウ3内の画像における認識対象4の画像認識を行う手段である。認識手段232は、認識対象4の検出の成否あるいは認識の確からしさを示す認識スコアを調整手段231に出力することができる。
【0027】
次に、本実施形態に係る情報処理装置20の動作について説明する。
【0028】
図3は、本実施形態に係る情報処理装置20の動作の一例を示す図であり、本実施形態に係る画像処理方法について説明するための図である。
【0029】
調整手段231は、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する(ステップS11)。ここで、調整手段231は、ウィンドウ3内の画像における認識対象4のサイズに応じて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。
【0030】
認識手段232は、調整手段231による調整後、撮像画像2に対してウィンドウ3を走査し、ウィンドウ3内の画像における認識対象4の画像認識を行う(ステップS12)。すなわち、認識手段232は、調整手段231により解像度が調整された撮像画像2に対してウィンドウ3を走査して、ウィンドウ3内の画像における認識対象4の画像認識を行う。あるいは、認識手段232は、撮像画像2に対して調整手段231によりサイズが調整されたウィンドウ3を走査して、ウィンドウ3内の画像における認識対象4の画像認識を行う。あるいは、認識手段232は、調整手段231により解像度が調整された撮像画像2に対して、調整手段231によりサイズが調整されたウィンドウ3を走査して、ウィンドウ3内の画像における認識対象4の画像認識を行う。
【0031】
このように本実施形態に係る画像処理方法は、ウィンドウ3のサイズおよび入力画像である撮像画像2の解像度の少なくとも一方を調整する調整ステップ(ステップS11)と、調整後、撮像画像2に対してウィンドウ3を走査し、ウィンドウ3内の画像における認識対象4の画像認識を行う認識ステップ(ステップS12)と、を含む。そして、調整ステップでは、ウィンドウ3内の画像における認識対象4のサイズに応じて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。
【0032】
次に、調整手段231の動作についてより詳細に説明する。
【0033】
図4は、1枚(1フレーム)の撮像画像2に対する画像認識を行う際の、調整手段231の動作の一例を示すフローチャートである。
【0034】
調整手段231は、予め定められた、ウィンドウ3のサイズおよび撮像画像2の解像度を設定する(ステップS21)。
【0035】
調整手段231は、設定したウィンドウ3のサイズおよび撮像画像2の解像度による画像認識により、認識手段232が認識対象4の検出に成功したか否かを判定する(ステップS22)。認識対象4の検出に成功したか否かは、例えば、認識手段232から出力される認識対象4の検出の成否あるいは認識スコアに基づき判定することができる。
【0036】
認識対象4の検出に失敗したと判定した場合(ステップS22:No)、調整手段231は、ウィンドウ3のサイズまたは撮像画像2の解像度を変更し(ステップS23)、ステップS22の処理に戻る。調整手段231は、認識手段232による認識対象4の検出が成功するまで、ステップS22およびステップS23の処理を繰り返す。
【0037】
認識対象4の検出に成功したと判定した場合(ステップS22:Yes)、調整手段231は、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズであるか否かを判定する(ステップS24)。ここで、ウィンドウ3内の画像における認識対象4の検出サイズが適当であるとは、ウィンドウ3内の画像の面積に対する認識対象4の画像の面積の比である面積比、および、ウィンドウ3内の画像の長さに対する認識対象4の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まることを指す。
【0038】
ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズであると判定した場合(ステップS24:Yes)、調整手段231は、現在のウィンドウ3のサイズおよび撮像画像2の解像度の設定を維持し、処理を終了する。
【0039】
ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズでないと判定した場合(ステップS24:No)、調整手段231は、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を変更し(ステップS25)、ステップS24の処理に戻る。調整手段231は、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズになるまで、ステップS24およびステップS25の処理を繰り返す。すなわち、調整手段231は、ウィンドウ3内の画像の面積に対する認識対象4の画像の面積の比である面積比、および、ウィンドウ3内の画像の長さに対する認識対象4の画像の長さの比である長さ比の少なくとも一方が所定の範囲に収まるように、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。
【0040】
本願発明者が検討した結果、上述した面積比あるいは長さ比が所定の範囲内にある場合に、画像認識の認識スコアが上がり、認識精度が向上することが分かった。認識対象4の種類などにより変動するが、例えば、長さ比が1/10~1/2の範囲内にあるときに、認識精度が向上することが分かった。調整手段231は、ウィンドウ3内の画像に認識対象4が検出されると、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズとなるように、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。
【0041】
以下では、調整手段231によるウィンドウ3のサイズまたは撮像画像2の解像度の調整について、
図5A,5Bを参照して説明する。
【0042】
調整手段231によるウィンドウ3のサイズまたは撮像画像2の解像度の調整の一例について、
図5Aを参照して説明する。
図5Aでは、ウィンドウ3のサイズに対して、認識対象4の検出サイズが大きすぎる場合を例として説明する。
図5Aでは、元の撮像画像2の縦方向のサイズをI1とし、元の撮像画像2の横方向のサイズをI2とする。また、ウィンドウ3の縦方向のサイズをW1とし、ウィンドウ3の横方向のサイズをW2とする。また、撮像画像2内の認識対象4の縦方向のサイズをH1とする。
【0043】
調整手段231は、例えば、ウィンドウ3のサイズは固定したままで、撮像画像2の解像度を徐々に変化させる。具体的には、調整手段231は、ウィンドウ3のサイズは固定したままで、撮像画像2の解像度を徐々に下げる。撮像画像2の解像度を下げることで、解像度の調整後の撮像画像2’の縦方向のサイズI1’および横方向のサイズI2’はそれぞれ、元の撮像画像2の縦方向のサイズI1および横方向のサイズI2よりも小さくなる。撮像画像2のサイズが小さくなることで、解像度の調整後の撮像画像2’内の認識対象4の縦方向のサイズH1’も、撮像画像2内の認識対象4の縦方向のサイズH1よりも小さくなる。そのため、例えば、ウィンドウ3の縦方向のサイズW1に対する認識対象4の縦方向のサイズH1’の長さ比(H1’/W1)が所定の範囲に収まるようになる。
【0044】
ウィンドウ3のサイズを固定したままで、撮像画像2の解像度を徐々に下げることで、ウィンドウ3のサイズに対して、認識対象4の検出サイズが大きすぎる場合にも、認識対象4の検出サイズを調整し、認識対象4の画像認識の精度向上を図ることができる。また、ウィンドウ3のサイズを固定とすることで、画像認識を行うCPU(Central Processing Unit)あるいはGPU(Graphics Processing Unit)は1つのウィンドウ3のサイズによる画像認識に対応可能であればよく、構成の簡素化を図ることができる。
【0045】
なお、ウィンドウ3のサイズに対して認識対象4の検出サイズが大きすぎる場合、調整手段231は、撮像画像2の解像度を固定して、ウィンドウ3のサイズを大きくする調整を行ってもよい。また、ウィンドウ3のサイズに対して認識対象4の検出サイズが大きすぎる場合、調整手段231は、撮像画像2の解像度を下げるとともに、ウィンドウ3のサイズを大きくする調整を行ってもよい、これらの調整によっても、認識対象4の検出サイズに対してウィンドウ3のサイズが相対的に大きくなり、ウィンドウ3のサイズに対する認識対象4の検出サイズを適当なサイズにすることができる。
【0046】
次に、調整手段231によるウィンドウ3のサイズまたは撮像画像2の解像度の調整の他の一例について、
図5Bを参照して説明する。
図5Bでは、ウィンドウ3のサイズに対して、認識対象4の検出サイズが小さすぎる場合を例として説明する。
図5Bでは、
図5Aと同様に、元の撮像画像2の縦方向のサイズをI1とし、元の撮像画像2の横方向のサイズをI2とする。また、ウィンドウ3の縦方向のサイズをW1とし、ウィンドウ3の横方向のサイズをW2とする。また、撮像画像2内の認識対象4の縦方向のサイズをH1とする。
【0047】
調整手段231は、例えば、撮像画像2の解像度は固定したままで、ウィンドウ3のサイズを徐々に変化させる。具体的には、調整手段231は、撮像画像2の解像度は固定したままで、ウィンドウ3のサイズを徐々に小さくする。ウィンドウ3のサイズを小さくすることで、サイズの調整後のウィンドウ3’の縦方向のサイズW1’および横方向のサイズW2’はそれぞれ、元のウィンドウ3の縦方向のサイズW1および横方向のサイズW2よりも小さくなる。ウィンドウ3のサイズが小さくなることで、例えば、ウィンドウ3の縦方向のサイズW1’に対する認識対象4の縦方向のサイズH1の長さ比(H1/W1’)が所定の範囲に収まるようになる。
【0048】
撮像画像2の解像度を固定したままで、ウィンドウ3のサイズを徐々に小さくすることで、ウィンドウ3のサイズに対して、認識対象4の検出サイズが小さすぎる場合にも、認識対象4の検出サイズを調整し、認識対象4の画像認識の精度向上を図ることができる。また、事前学習により、教師データに応じた解像度を算出し、撮像画像2の解像度を算出した解像度に固定とすることで、余分な分割/縮小作業を行わずに、認識対象を最適な制度で均一に認識することができるように、ウィンドウ3のサイズを調整することができる。余分な分割/縮小作業を行う必要がないので、撮像画像2の解像度の調整を行うCPUあるいはGPUの処理負荷の軽減を図ることができる。
【0049】
図6は、複数の(複数フレームの)撮像画像2に対して連続的に画像認識を行う際の、調整手段231の動作の一例を示すフローチャートである。以下では、処理対象の撮像画像2の1つ前(直前)の撮像画像2において、所定のウィンドウ3のサイズおよび撮像画像2の解像度で、認識対象4が検出されているものとする。
【0050】
調整手段231は、処理対象の撮像画像2の直前の撮像画像2におけるウィンドウ3のサイズおよび撮像画像2の解像度を用いた画像認識により、認識手段232が認識対象4の検出に引き続き成功したか否かを判定する(ステップS31)。
【0051】
認識対象4の検出に失敗したと判定した場合(ステップS31:No)、調整手段231は、
図6に示す処理を終了する。そして、調整手段231は、例えば、
図4を参照して説明した処理を開始する。
【0052】
認識対象4の検出に成功したと判定した場合(ステップS31:Yes)、調整手段231は、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズであるか否かを判定する(ステップS32)。
【0053】
ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズであると判定した場合(ステップS32:Yes)、調整手段231は、ウィンドウ3のサイズおよび撮像画像2の解像度を調整する必要がないので、処理を終了する。すなわち、調整手段231は、認識対象4の検出に成功し、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズである場合、直前のウィンドウ3のサイズおよび撮像画像2の解像度の設定を維持する。
【0054】
ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズでないと判定した場合(ステップS32:No)、調整手段231は、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を変更し(ステップS33)、ステップS32の処理に戻る。調整手段231は、ウィンドウ3内の画像における認識対象4の検出サイズが適当なサイズになるまで、ステップS32およびステップS33の処理を繰り返す。
【0055】
図7は、複数の撮像画像2に対して連続的に画像認識を行う際の調整手段231の動作を模式的に示す図である。
図7においては、4つの撮像画像2(撮像画像2-1~2-4)に対して連続的に画像認識を行うものとする。具体的には、時刻t0から時刻t10において、撮像画像2-1の画像認識を行い、時刻t10から時刻t20において、撮像画像2-2の画像認識を行い、時刻t20から時刻t30において、撮像画像2-3の画像認識を行い、時刻t30から時刻t40において、撮像画像2-4の画像認識を行うものとする。また、撮像画像2-1~2-4には、2つの認識対象4(認識対象4a,4b)が含まれ、認識対象4a,4bを検出することが予め定められているものとする。また、撮像画像2-1,2-2においては、認識対象4aは認識対象4bよりも小さく映り、撮像画像2-3,2-4においては、認識対象4aは認識対象4bと同程度の大きさで映っているものとする。また、撮像画像2-1~2-2、撮像画像2-3~2-4それぞれにおいて、認識対象4aの大きさはほぼ変化せず、また、撮像画像2-1~2-4において、認識対象4bの大きさはほぼ変化してないものとする。また、調整手段231は、撮像画像2の解像度は固定して、ウィンドウ3のサイズを調整するものとする。
【0056】
調整手段231は、ウィンドウ3のサイズを所定の最小のサイズから徐々に大きくしていく。調整手段231は、時刻t0から、時刻t10よりも前の時刻t01までの期間において、認識対象4a,4bに対するウィンドウ3のサイズを最小のサイズ(例えば、300×300[pixel])に設定する。
図7に示すように、ウィンドウ3のサイズを300×300にした場合、認識対象4a,4bともにウィンドウ3内に収まらず、認識手段232は、認識対象4aおよび認識対象4bを検出することができない。
【0057】
認識手段232が認識対象4a,4bを検出することができない場合、
図4を参照して説明したように、調整手段231は、ウィンドウ3のサイズを変更する。したがって、調整手段231は、時刻t01から、時刻t10よりも前の時刻t02までの期間において、認識対象4a,4bに対するウィンドウ3のサイズを、時刻t0から時刻t01までの期間で設定したウィンドウ3のサイズよりも大きいサイズ(例えば、600×600[pixel])に設定する。
図7に示すように、ウィンドウ3のサイズを600×600に設定した場合、認識対象4aは、ウィンドウ3内に収まり、認識手段232は、認識対象4aを検出することができる。また、ウィンドウ3のサイズに対する認識対象4aの検出サイズが所定の範囲に収まっている場合、認識手段232は、認識対象4aについてのウィンドウ3のサイズの調整を終了する。一方、認識対象4bは、ウィンドウ3内に収まらず、認識手段232は、認識対象4bを検出することができない。
【0058】
認識手段232が認識対象4bを検出することができない場合、調整手段231は、ウィンドウ3のサイズを変更する。したがって、調整手段231は、時刻t02から、時刻t10よりも前の時刻t03までの期間において、認識対象4bに対するウィンドウ3のサイズを、時刻t01から時刻t02までの期間で設定したウィンドウ3のサイズよりも大きいサイズ(例えば、1200×1200[pixel])に設定する。
図7に示すように、ウィンドウ3のサイズを1200×1200に設定した場合、認識対象4bは、ウィンドウ3内に収まり、認識手段232は、認識対象4bを検出することができる。また、ウィンドウ3のサイズに対する認識対象4bの検出サイズが所定の範囲に収まっている場合、調整手段231は、認識対象4bについてのウィンドウ3のサイズの調整を終了する。
【0059】
撮像画像2-2では、認識対象4a,4bのサイズはほぼ変化していない。そのため、認識対象4aに対するウィンドウ3のサイズ(600×600)はそのままで、認識手段232は、認識対象4aを検出することができる。ウィンドウ3のサイズに対する認識対象4aの検出サイズが所定の範囲に収まっている場合、調整手段231は、ウィンドウ3のサイズの設定を維持する。また、認識対象4bに対するウィンドウ3のサイズ(1200×1200)はそのままで、認識手段232は、認識対象4bを検出することができる。ウィンドウ3のサイズに対する認識対象4bの検出サイズが所定の範囲に収まっている場合、調整手段231は、ウィンドウ3のサイズの設定を維持する。したがって、調整手段231は、時刻t10から時刻t20においては、認識対象4a,4bに対するウィンドウ3のサイズの設定を維持する。
【0060】
撮像画像2-3では、認識対象4bのサイズはほぼ変化していないが、認識対象4aのサイズは大きくなっている。そのため、時刻t20~t21においては、撮像画像2-2における認識対象4aに対するウィンドウ3のサイズ(600×600)では、ウィンドウ3内に認識対象4aが収まらず、認識手段232は、認識対象4aを検出することができない。
【0061】
そこで、調整手段231は、認識対象4aに対するウィンドウ3のサイズを所定の最小のサイズから徐々に大きくしていく。調整手段231は、時刻t21から、時刻t30よりも前の時刻t22までの期間において、認識対象4aに対するウィンドウ3のサイズを最小のサイズ(例えば、300×300[pixel])に設定する。
図7に示すように、ウィンドウ3のサイズを300×300にした場合、認識対象4aはウィンドウ3内に収まらず、認識手段232は、認識対象4aを検出することができない。
【0062】
認識手段232が認識対象4aを検出することができない場合、調整手段231は、時刻t22から、時刻t30よりも前の時刻t23までの期間において、認識対象4aに対するウィンドウ3のサイズを、時刻t21から時刻t22までの期間で設定したウィンドウ3のサイズよりも大きいサイズ(例えば、1200×1200[pixel])に設定する。
図7に示すように、ウィンドウ3のサイズを1200×1200に設定した場合、認識対象4aはウィンドウ3内に収まり、認識手段232は、認識対象4aを検出することができる。また、ウィンドウ3のサイズに対する認識対象4aの検出サイズが所定の範囲に収まっている場合、調整手段231は、認識対象4aについてのウィンドウ3のサイズの調整を終了する。
【0063】
なお、
図7においては、時刻t20から時刻t21までの期間(ウィンドウ3のサイズを600×600である期間)において、認識対象4aはウィンドウ3内に収まっていないため、時刻t22において、ウィンドウ3のサイズを、300×300から1200×300に変更する例を説明したが、本発明はこれに限られるものではない、調整手段231は、認識対象4がウィンドウ3内に収まらない場合、ウィンドウ3のサイズを順次、大きくしてもよい。したがって、調整手段231は、時刻t22において、ウィンドウ3のサイズを、300×300の次に大きな、600×600に変更してもよい。また、ウィンドウ3のサイズはあくまでも一例であり、ウィンドウ3のサイズおよび変更率は適宜、設定可能である。
【0064】
一方、撮像画像2-3では、認識対象4bのサイズはほぼ変化していない。そのため、認識対象4bに対するウィンドウ3のサイズ(1200×1200)はそのままで、調整手段231は、認識対象4bを検出することができる。ウィンドウ3のサイズに対する認識対象4bの検出サイズが所定の範囲に収まっている場合、調整手段231は、認識対象4bに対するウィンドウ3のサイズの設定を維持する。
【0065】
撮像画像2-4では、認識対象4a,4bのサイズはほぼ変化していない。そのため、認識対象4aに対するウィンドウ3のサイズ(1200×1200)はそのままで、認識手段232は、認識対象4aを検出することができる。ウィンドウ3のサイズに対する認識対象4aの検出サイズが所定の範囲に収まっている場合、調整手段231は、認識対象4aに対するウィンドウ3のサイズの設定を維持する。また、認識対象4bに対するウィンドウ3のサイズ(1200×1200)はそのままで、認識手段232は、認識対象4bを検出することができる。ウィンドウ3のサイズに対する認識対象4bの検出サイズが所定の範囲に収まっている場合、調整手段231は、認識対象4bに対するウィンドウ3のサイズの設定を維持する。したがって、調整手段231は、時刻t30から時刻t40においては、認識対象4a,4bに対するウィンドウ3のサイズの設定を維持する。
【0066】
なお、本実施形態においては、調整手段231は、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を徐々に変化させる例を用いて説明したが、これに限られるものではない。調整手段231は、例えば、認識対象が予め指定された教師画像を用いた機械学習により作成されたモデルを用いて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整してもよい。
【0067】
上述したようなモデルは、例えば、以下のようにして作成することができる。まず、教師画像(動画クリップ)における認識対象の最大サイズおよび最小サイズを測定する。そして、認識対象が所定の範囲(例えば、1/10~1/2、より好ましくは、1/8~1/5)に収まるための、教師画像の分割率、分割数あるいは縮小率を算出し、算出結果に従い、教師画像を分割あるいは縮小する。次に、分割あるいは縮小された画像のうち、認識対象が含まれている画像における認識対象を矩形で指示するなどしてタグ付けする。そして、認識対象がタグ付けされた画像を用いた機械学習を行うことにより、上述したようなモデルを作成することができる。
【0068】
また、調整手段231は、撮像画像の撮像状況に基づいて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整してもよい。例えば、認識しづらい状況で撮像された撮像画像に対しては、通常時は1/10~1/2に収まるように設定されているウィンドウ3のサイズまたは解像度を、1/8~1/5へと変化させてもよい。撮像状況の特定にあたっては、該当する撮像状況(例えば、夕焼けや雪景色などといった撮影環境や、撮影対象の種類など)を、例えば、ユーザにより予め特定しておいてもよく、機械学習を行った際の認識率(認識精度)から特定してもよい。また、調整手段231は、撮像状況のほかにも、対象物の動きに基づいて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整してもよい。
【0069】
このように本実施形態においては、画像処理システム1は、調整手段231と、認識手段232とを備える。調整手段231は、入力画像としての撮像画像2における認識対象4の画像認識の単位であるウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。認識手段232は、調整手段231による調整後、撮像画像2に対してウィンドウ3を走査し、ウィンドウ3内の画像における認識対象4の画像認識を行う。ここで、調整手段231は、ウィンドウ3内の画像における認識対象4のサイズに応じて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整する。
【0070】
ウィンドウ3内の画像における認識対象4のサイズに応じて、ウィンドウ3のサイズおよび撮像画像2の解像度の少なくとも一方を調整することで、ウィンドウ3内の画像における認識対象4のサイズを、画像認識に適したサイズに変更することができる。そのため、認識対象4のサイズによらず、認識対象4の画像認識の精度向上を図ることができる。
【0071】
本発明を諸図面および実施形態に基づき説明してきたが、当業者であれば本開示に基づき種々の変形及び修正を行うことが容易であることに注意されたい。したがって、これらの変形および修正は本発明の範囲に含まれることに留意されたい。例えば、各手段、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の手段およびステップなどを1つに組み合わせたり、あるいは分割したりすることが可能である。前述したところは本発明の一実施形態にすぎず、特許請求の範囲において、種々の変更を加えてよいことは言うまでもない。
【0072】
また、上述した実施形態において、情報処理装置20の制御部23によって実現される各種の手段をソフトウェア構成として説明したが、これらのうち少なくとも一部の手段は、ソフトウェア資源および/またはハードウェア資源を含む概念であってもよい。
【0073】
また、上述した実施形態に係る情報処理装置20として機能させるために、コンピュータまたは携帯電話などの装置を用いることができる。当該装置は、実施形態に係る情報処理装置20の各機能を実現する処理内容を記述したプログラムを、当該装置のメモリに格納し、当該装置のプロセッサによって当該プログラムを読み出して実行させることによって実現可能である。
【0074】
また、情報処理装置20の各構成または各手段が、通信可能に接続された複数の情報処理装置に分散配置された構成も可能である。当該複数の情報処理装置のうち少なくとも1つの情報処理装置が、上述した画像処理システム1を構成するために、調整手段231および認識手段232の少なくとも1つを備える構成も可能である。
【符号の説明】
【0075】
1 画像処理システム
2,2-1~2-4 撮像画像
3 ウィンドウ
4,4a,4b 認識対象
10 撮像装置
20 情報処理装置
21 通信部
22 記憶部
23 制御部
231 調整手段
232 認識手段