(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0016】
以下、本発明に係る画像処理装置の好ましい実施形態について、図面を参照して説明する。
【0017】
図1に示すように、本発明に係る一実施形態の画像処理装置101は、相違検出部110と、連結領域抽出部120と、面積算出部130と、領域選択部140と、判定部150と、を備える。
【0018】
相違検出部110は、動画のフレーム差分からフレーム間の画像の相違を検出する。詳しく説明すると、
図2に示すように、動画は、複数のフレーム10を有する。各々のフレーム10は静止画である。ここで、動画が有するフレーム10の総数を2以上の任意の自然数nとし、m番目のフレーム10をフレーム10−mと記載する。mは、2以上n以下の自然数である。n枚のフレーム10−1、・・・、10−nに共通する内容について説明する際には、これらのフレームをまとめてフレーム10と記載する。
【0019】
本実施形態のフレーム10の各々は、第1の動画領域20と、第2の動画領域30と、を備え、例えば加工済み動画である。第1の動画領域20は、検出対象の動画を再生する領域であり、複数の画素で構成されている。第2の動画領域30は、第1の動画領域20の向かって上方及び右方に隣接し、少なくとも一部で検出対象の動画とは異なる動画を再生する領域であって、複数の画素で構成されている。
【0020】
相違検出部110は、動画の複数のフレーム10間の画像の相違を検出するために、時間軸上で隣り合うフレーム10−(m−1)、10−m間のフレーム差分をとり、フレーム10−(m−1)、10−m間で相違する画素PXを抽出する。フレーム10−(m−1)、10−m間のフレーム差分をとる方法及び使用するアルゴリズムは、例えば背景差分法に基づくMOG(Mixture of Gaussian Distribution;混合正規分布)、MOG2、GMG(即ち、Godbehere,Matsukawa,Goldbergによるアルゴリズム)、KNN(k-nearest neighbor algorithm;k近傍法)、CNT(CouNT)、LSBP(Local SVG Binary Pattern)、GSOC(Government Security Operation Coordination team)等であり、動画に応じて適宜選定され、特に限定されない。
【0021】
図3に示すように、例えば1枚目のフレーム10−1と2枚目のフレーム10−2とのフレーム差分によって相違検出部110で抽出された画素PXは、第1の動画領域20及び第2の動画領域30の両方で抽出される。
【0022】
連結領域抽出部120は、相違検出部110から複数のフレーム10の各々の画素PXの横方向Xの座標値x及び縦方向Yの座標値y等の情報(相違検出部が相違を検出した結果)を受け取る。連結領域抽出部120は、画素PXに関する情報に基づいて、フレーム10を構成する画素のうち、画像の相違のある画素PXが連続する領域を連結領域CRとして抽出する。
【0023】
図4では、フレーム10−1とのフレーム差分をとったフレーム10−2の領域40において、差分情報として検出された画素PXを網掛けで表し、差分情報として検出されなかった画素PZを白色(即ち、無色)で表している。連結領域抽出部120は、複数の画素PXを、例えば8連結(或いは、8近傍ともいう)でラベリングする。8連結では、縦・横方向(即ち、Y方向・X方向)、或いは斜め方向に連結している画素同士は全て同じラベルの連結領域CRとして抽出される。
【0024】
ここで、抽出される連結領域CRの番号をjと記載し、i番目の連結領域CR[j]と記載する。番号iは、フレーム10内で所定のルールに基づいて決められ、例えばフレーム10に向かって左上側でラベリングされたものから右方向にカウントされ、最初の左上端よりも下側のものがカウントされ、以降同様にカウントされる。以下では、抽出された複数の連結領域CR[1]、・・・、CR[i](即ち、1≦j≦i)の少なくとも一部に共通する内容について説明する際には、これらの画素をまとめて連結領域CRと記載する。
【0025】
なお、動画の内容によっては、連結領域CRが抽出されないフレーム10−mが存在する可能性がある。また、動画の内容によって、複数のフレーム10で抽出される連結領域CRの数は1つ又は複数というように適宜変化し得る。連結領域抽出部120は複数のフレーム10の少なくとも1つのフレーム10内において、1つ又は複数の連結領域CRを抽出する。例えば、フレーム10内に検出対象となる動画のみががある場合には、1つの連結領域CRがフレーム10の全体と略重なるので、結果としてフレーム10の略全体にわたり連結領域CRとして抽出される。
【0026】
面積算出部130は、連結領域抽出部120から連結領域CRに含まれる画素PXの各々の座標値x、yの情報を受け取る。面積算出部130は、連結領域CRを含む所定形状の領域DRの面積Sを、連結領域CRごとに算出する。面積Sを計算する際の所定形状は、典型的には矩形(正方形或いは長方形)であるが、矩形以外の形状、例えば平行四辺形、真円形、楕円形、角の数が4以上の多角形状、星形状、前述の形状以外のフリーフォーム等であり、面積を算出可能であれば特に限定されない。なお、複数の領域DRは、部分的に互いに重なってもよい。
【0027】
本実施形態では、説明をわかりやすくするために、所定形状を長方形とする。面積算出部130は、連結領域CRごとに含まれる全ての画素PXの各々の座標値xの最大値x
MAX及び最小値x
MINと、座標値yの最大値y
MAX及び最小値y
MINと、を算出する。
図5に示すように、面積算出部130は、|x
MAX−x
MIN|×|y
MAX−y
MIN|を算出することによって、連結領域CRのフレーム10における面積を算出できる。面積算出部130は、フレーム10−(m−1)とのフレーム差分をとったフレーム10−mからフレーム10−nまでのフレーム10ごとに、連結領域CRを含む所定形状の領域DRの面積Sを算出する。以下では、フレーム10ごとに面積算出部130で算出された連結領域CR[j]を含む領域DRを領域DR−jと記載し、領域DR−jの面積を面積S[j]と記載する。複数の領域DR−1、・・・、DR−iに共通する内容について説明する場合は、これらの領域をまとめて単に領域DRと記載する。複数の面積S[1]、・・・、S[i]に共通する内容について説明する場合は、これらの面積を総称して単に面積Sと記載する。
【0028】
領域選択部140は、面積算出部130からフレーム10ごとの所定形状の領域DRの面積Sの情報を受け取る。
図6に示すように、領域選択部140は、面積Sの大きさに基づいて、連結領域CRごとに存在する領域(所定形状の領域)DRのうちから、対象領域ORを選択する。領域選択部140は、例えば面積算出部130が連結領域CRごとに算出する面積Sの連結領域CR間の相対順位に基づいて対象領域ORを選択する。以下では、フレーム10−mにおいて選択された対象領域を対象領域OR[m]と記載し、対象領域OR[m]の面積をS
MAX[m]と記載する。
【0029】
領域選択部140は、例えば複数の連結領域CRごとに面積算出部130が算出する面積Sのうち、最大の面積S
MAXを有する領域DRを、対象領域ORとしてフレーム10ごとに選択する。但し、領域選択部140が対象領域OR[m]を選択する基準は、前述のように「面積Sのうち、最大の面積S
MAXを有する」ことに限定されず、動画に応じて所定基準であればよい。領域選択部140は、フレーム10−(m−1)とのフレーム差分をとったフレーム10−mからフレーム10−nまでのフレーム10−mごとに、対象領域OR[m]を選択する。
【0030】
領域選択部140は、面積Sの連結領域CR間の相対順位が最下位の連結領域CRから所定の順位の連結領域CRまでを非対象領域URとし、対象領域ORの候補から除外することにより、対象領域ORを選択する。この場合、非対象領域URには、差分情報として検出された画素PX、即ち相違があると検出された画素PXの比較的面積Sの小さい連結領域CRが含まれている。連結領域CRを含む非対象領域URは、前述の従来の画像処理装置では「検出対象の動画」の候補として抽出される。領域選択部140は、連結領域CRや相違のある画素PXであっても、対象領域ORとして選択される条件を満たさない場合は、それらを処理対象の候補から除外する。領域選択部140は、上述のように最大(即ち、面積Sの連結領域CR間の相対順位の最上位)の面積S
MAXを有する領域DRのみを対象領域ORとして選択すると共に、面積Sの連結領域CR間の相対順位の上位2番目(所定の順位)から最下位までの面積Sを有する連結領域CRを非対象領域URとし、これらの連結領域CRを対象領域ORの候補から除外する。
【0031】
判定部150は、領域選択部140からフレーム10−mごとの対象領域OR[m]の情報を受け取る。
図7に示すように、判定部150は、対象領域OR[m]のフレーム10−m内での位置を、動画の複数のフレーム10について統計演算することによって求める。判定部150における統計演算は、例えばフレーム10−mの座標軸X、Yを基準方向としたときに、対象領域OR[m]のフレーム10−m内の存在範囲において動画の複数のフレーム10における出現頻度を算出することであるが、後述する抽出対象の領域ARを判定できれば特に限定されない。詳しく説明すると、
図7に示すように、X方向について、横軸にX方向の座標値xをとり、縦軸に複数のフレーム10の全てを互いに重ねたときの対象領域OR[2]から対象領域OR[n]までの出現頻度FXをとる。出現頻度FXの最大値FX
MAXの所定の割合の出現頻度を閾値頻度FX
THとする。所定の割合は、例えば70%や50%であるが、特定値に限定されず、動画に応じて適宜設定される。閾値頻度FX
TH以上の出現頻度FXを発現するX方向の範囲ARXを算出する。同様に、Y方向について、横軸にY方向の座標値yをとり、縦軸に複数のフレーム10の全てを互いに重ねたときの対象領域OR[2]から対象領域OR[n]までの出現頻度FYをとる。出現頻度FYの最大値FX
MAXの所定の割合の頻度を閾値頻度FY
THとする。Y方向での所定の割合は、X方向での所定の割合と同一でもよく、X方向での所定の割合と異なってもよい。閾値頻度FY
TH以上の出現頻度FYを発現するY方向の範囲ARYを算出する。
【0032】
判定部150は、前述の統計演算によって、フレーム10内の領域DRのうちの抽出対象の領域ARを判定する。詳細に説明した統計演算を用いると、判定部150は、算出された出現頻度FX、FYに基づいて、フレーム10内の領域のうちの抽出対象の領域ARを判定する。本実施形態では、フレーム10において抽出対象の領域ARの形状は、X方向又はY方向に沿った四辺を有する長方形(矩形)とする。領域ARは、X方向の範囲ARX及びY方向の範囲ARYを有する領域である。つまり、抽出対象の領域ARは、動画において閾値頻度FX
TH、FY
TH以上でフレーム10内の広範囲に変化している領域を表している。
【0033】
画像処理装置101は、不図示のコンピュータ等に収納されている。相違検出部110と、連結領域抽出部120と、面積算出部130と、領域選択部140と、判定部150は、各々について上述した動作を実行するプログラムである。これらのプログラムは、サーバに格納されている。
【0034】
次に、画像処理装置101における各プログラムの実行内容について、
図8を参照しながら説明する。始めに、相違検出部110に対して複数のフレーム10−1、・・・、10−nごとの画素PXの値が入力される(ステップS251)。次に、相違検出部110によって、2枚のフレーム10−(m−1)、10−m間のフレーム差分情報に基づいて相違する、即ち値が異なる画素PXを抽出する(ステップS252)。続いて、連結領域抽出部120によって、フレーム10を構成する画素のうち、画素PXが連続する領域を連結領域CRとして抽出する。つまり、フレーム10−(m−1)、10−m間の差分領域から連結領域CRを抽出する。
【0035】
次に、面積算出部130によって、所定形状の領域DRの面積Sを個々に、即ち連結領域CRごとに算出する(ステップS253)。続いて、領域選択部140によって、複数のフレーム10の各々において、連結領域CRごとに存在する領域DRのうちから、対象領域ORを選択する(ステップS254)。さらに、判定部150によって、複数のフレーム10の各々に関して、対象領域OR[m]のフレーム10−m内での位置を統計演算で求める(ステップS255)。また、判定部150によって、統計演算の結果に基づき、複数のフレーム10の重ね合わせの画素領域内において領域DRのうちの抽出対象の領域ARを判定する(ステップS256)。判定部150によって、複数のフレーム10において抽出対象の領域ARの情報が出力される(ステップS257)。フレーム10において領域DRのうちの抽出対象の領域ARを判定できない場合は、ステップS254に戻り、連結領域CRごとに存在する領域DRのうちから、上述の対象領域とは異なる対象領域ORを選択する。その後、ステップS255、S256の各々を実行する。
【0036】
ステップS256で判定された抽出対象の領域ARは、画像処理装置101から出力
され、フレーム10内に違法動画等が含まれているか否かを検出する画像検出装置(図示略)に送られる。画像検出装置では、例えば複数のフレーム10における抽出対象の領域ARの画素PXの値を抽出し、違法動画等の検出すべき動画のフレームの画素の値を参照データとして、抽出した画素PXの値と検出すべき画素の値とを照合する。抽出した画素PXの値と検出すべき画素の値との照合には、公知の画像認証技術や画像照合のためのアルゴリズム等を適用できる。このような画像検出装置は、画像処理装置101と同じコンピュータや当該コンピュータと接続されている別のコンピュータ等に収納され、前述の称号を行うプログラムで構成されている。
【0037】
以上説明した本実施形態の画像処理装置101は、少なくとも相違検出部110と、連結領域抽出部120と、面積算出部130と、領域選択部140と、判定部150と、を備える。相違検出部110は、動画のフレーム差分からフレーム10間の画像の相違を画素PXの情報から検出する。連結領域抽出部120は、相違検出部110が相違を検出した画素PXの横方向Xの座標値x及び縦方向Yの座標値y等の情報に基づいて、フレーム10を構成する画素のうち、画像の相違のある画素PXが連続する領域を連結領域CRとして抽出する。面積算出部130は、連結領域CRを含む所定形状の領域DRの面積Sを、連結領域CRごとに算出する。領域選択部140は、面積Sの大きさに基づいて、連結領域CRごとに存在する領域(所定形状の領域)DRのうちから、対象領域ORを選択する。領域選択部140は、複数の連結領域CRごとに面積算出部130が算出する面積Sのうち、最大の面積S
MAXを有する領域DRを、対象領域ORとしてフレーム10ごとに選択する。判定部150は、対象領域OR[m]のフレーム10−m内での位置を、動画の複数のフレーム10について統計演算することによって求め、前述の統計演算によって、フレーム10内の領域DRのうちの抽出対象の領域ARを判定する。
【0038】
本実施形態の画像処理装置101の相違検出部110及び連結領域抽出部120では、フレーム10間で差分が生じた画素PXの検出によって動画における画像の相違が検出されることに加え、8近傍等の所定のルールに基づいて画素PXの群GPの連結領域CRが抽出される。このことによって、複数のフレーム10の各々において差分が生じた領域を連結領域CRで捉えるので、従来の装置のように差分が生じた領域を単に検出する場合とは異なり、フレーム10の各々内の主要な且つ動画の作成者又はアップロードする者が視聴者に見せようとする動画(即ち、検出対象の動画)の領域をあぶり出すことができる。また、面積算出部130では、連結領域CRを含む所定形状の領域DRの面積Sを連結領域CRごとに算出するので、連結領域CRで捉えた領域同士のつながりや時間的な拡がり及び移動を適度に考慮し、複数のフレーム10の各々において検出対象の動画が再生される領域の候補を領域DRで捉えて抽出できる。また、領域選択部140では、動画の作成者等の意図を推測又は考慮した所定条件に基づき、領域DRのうちから対象領域ORを選択できる。さらに、判定部150では、統計演算に基づき、複数枚に亘るフレーム10において検出対象の動画の領域の位置を、抽出対象の領域ARとして時間軸上で絞り込むことができる。したがって、本実施形態の画像処理装置101によれば、検出対象の動画とそれ以外の動画とが存在する動画が有する複数のフレーム10内で検出対象の動画と照合すべき動画が存在する領域を領域ARとして抽出でき、領域ARに関する情報に基づいて検出対象の動画を検出可能とすることができる。
【0039】
本実施形態の画像処理装置101では、領域選択部140は、面積算出部130が連結領域CRごとに算出する面積Sの連結領域CR間の相対順位に基づいて対象領域ORを選択する。本実施形態の画像処理装置101によれば、第1の動画領域20内での検出対象の動画の再生領域の面積と第2の動画領域30内での検出対象外の動画の再生領域との面積との違いを、面積Sの連結領域CR間の相対順位で識別し、面積Sの違いに応じて適切に対象領域ORを選択できる。
【0040】
本実施形態の画像処理装置101では、領域選択部140は、面積Sの連結領域CR間の相対順位が最下位の連結領域CRから所定の順位の連結領域CRまでを、対象領域ORの候補から除外することにより、対象領域ORを選択する。このことによって、例えば第2の動画領域30内で検出対象外の動画(所謂、ダミー動画)が第1の動画領域20内の検出対象の動画よりも時間平均的に小さい面積Sで再生されていても、従来の画像処理装置のように検出対象の動画と誤って抽出することなく、検出対象外の動画を処理対象の候補から外すことができる。結果として、本実施形態の画像処理装置101によれば、検出対象の動画を精度良く検出できる。
【0041】
本実施形態の画像処理装置101において、統計演算とは、例えばフレーム10−mの座標軸X、Yを基準方向としたときに、対象領域OR[m]のフレーム10−m内の存在範囲において動画の複数のフレーム10における出現頻度を算出することである。判定部150は、前述の統計演算によって、フレーム10内の領域DRのうちの抽出対象の領域ARを判定する。このような統計演算では、X方向及びY方向の各々での対象領域ORの出現頻度が高い程、時間軸上で画素PXの値が変化し、画像が動いていることを示す。判定部150によって、前述の統計演算を行ってX方向及びY方向の各々での対象領域ORの出現頻度を算出し、適当な閾値以上の出現頻度の領域を抽出対象の領域ARとして抽出できる。画像処理装置101によれば、各フレーム10において抽出した対象領域ORのうち、時間軸上で高頻度に動く動画の範囲、即ち第1の動画領域20と略同じ領域を抽出対象の領域ARとして捉えることができる。
【0042】
本実施形態の画像処理装置101では、連結領域CRごとに存在する領域DRの所定形状とは、例えば矩形である。このことによって、複数のフレーム10の各々において所定形状の領域DRを、典型的な矩形状のフレーム10や第1の動画領域20に応じた形で、領域同士のつながりや時間的な拡がり及び移動を適度に考慮しつつ、抽出できる。したがって、所定形状が矩形以外の形状である場合に比べて、フレーム10において検出対象の動画が再生される領域の候補を精度良く抽出できる。
【0043】
本実施形態の画像処理装置101において、領域選択部140は、複数の連結領域CRごとに面積算出部130が算出する面積Sのうち例えば最大の面積S
MAXを有する、所定形状の領域DRを、対象領域ORとして選択する。このことによって、フレーム10内で第1の動画領域20(即ち、検出対象の動画)の面積Sが第2の動画領域30(即ち、背景や装飾の動画の面積)よりも大きい加工済み動画について、第1の動画領域20を対象領域ORとして良好に選択できる。
【0044】
以上、本発明の好ましい実施形態について詳述したが、本発明は特定の態様に限定されない。本発明は、特許請求の範囲内に記載された本発明の要旨の範囲内において、種々変形及び変更可能である。
【0045】
例えば、上述の実施形態で例示した動画の第2の動画領域30は、第1の動画領域20の上方及び右方に配置されているが、第2の動画領域30は、第1の動画領域20に対して任意の位置に配置されればよい。また、動画は、複数の第2の動画領域30を有してもよい。一例として、動画において、第1の動画領域20の横方向(即ち、X方向)の両側に第2の動画領域30が配置されてもよい。
【0046】
上述の実施形態では、相違検出部110が複数のフレーム10のうち時間軸上で隣り合う2枚のフレーム10−(m−1)、10−m間の差分から画像の相違を検出する例を説明したが、相違検出部110は、例えば時間軸上で比較的近い2枚のフレーム10−(m−2)、10−m間の差分(3≦m≦n)、或いは10−(m−3)、10−m間の差分(4≦m≦n)から画像の相違を検出してもよい。つまり、相違検出部110がフレーム差分から画像の相違を検出する対象のフレーム10の時間軸上の間隔は、特に限定されない。また、上述の実施形態では、2枚のフレーム10間の差分を検出する例について記載したが、互いの差分情報を検出するためのフレーム10の枚数は2枚に限定されず、3枚でも4枚でもよく、10枚程度でもよく、特定数に限定されない。
【0047】
上述の実施形態では、連結領域抽出部120が複数の画素PXを、例えば8連結でラベリングする例を説明したが、4連結(或いは4近傍ともいう)でラベリングしてもよい。4連結では、対象の画素連結領域抽出部120は、複数の画素PXを、8連結及び4連結以外の所定のルールに基づいてラベリングしてもよい。
【0048】
上述の実施形態で説明したように、面積算出部130が算出する領域DRの所定形状は、例示した長方形以外に正方形、平行四辺形、真円形、楕円形、角の数が4以上の多角形状、星形状、雲形、前述の形状以外のフリーフォーム等であってもよい。動画の内容や種類によっては、所定形状は、個々の連結領域CRの周縁に沿った形状であってもよい。
【0049】
上述の実施形態の領域選択部140は、面積Sのうち、最大の面積S
MAXを有する領域DR及びその領域DRの連結領域CRを対象領域ORとして選択し、面積Sの連結領域CR間の相対順位が上位2番目から最下位までの連結領域CRを実質的に選択領域ORの候補から外す。しかしながら、本発明では、面積Sの連結領域CR間の相対順位がより低い連結領域CRを非対象領域URとし、対象領域ORの候補から除外することにより、対象領域ORを選択してもよい。「連結領域CR間の相対順位がより低い」とは、一例として連結領域CR間の相対順位の中央よりも下位であってもよく、別の例として相対順位の最下位から上位に向けて1/3の順位等であってもよく、少なくとも静止画であるかか動画であるかによって検出対象の動画を抽出する従来の画像処理装置によって検出対象の動画の候補として抽出され得る範囲の下位を意味する。
【0050】
また、領域選択部140は、連結領域CRごとに算出する面積Sの連結領域CR間の相対順位に基づいて対象領域ORを選択し、例えば相対順位のうちの所定範囲の順位の連結領域CR及び対応する領域DRを対象領域ORの候補とし、所定範囲外の順位の連結領域CR及び対応する領域DRを非対象領域URとして対象領域ORの候補から除外してもよい。予め、或いは学習装置等によってフレーム10内での検出対象の動画の連結領域CRと検出対象外の動画の連結領域CRとの時間平均的な相対面積比がある程度絞り込める場合は、その相対面積比に応じて前述の所定範囲の順位を設定できる。例えば、フレーム10内での検出対象の動画の連結領域CRの面積に対して検出対象外の動画の連結領域CRの面積の時間平均的な相対面積比が150%から200%となる傾向が強くみられる場合、面積Sの連結領域CR間の相対順位の上位25%以下から中央の順位までを前述の所定範囲の順位として設定できる。前述の所定範囲の順位は、必ずしも固定されていなくてもよく、複数のフレーム10において調整されてもよい。
【0051】
上述の実施形態では、領域選択部140が面積Sのうち、最大の面積S
MAXを有する領域DRを、対象領域ORとして選択する例を説明した。しかしながら、領域選択部140は、面積Sのうち、2番目或いは3番目に大きい面積を有する領域DRを、対象領域ORとして選択してもよい。予め、或いは学習装置等によって加工済み動画内で検出すべき動画領域に対する面積Sの傾向、即ち対象領域ORの選択条件を把握していれば、その傾向及び選択条件に合わせて領域DRのうちから対象領域ORを選択できる。
【0052】
上述の実施形態では、判定部150は、対象領域OR[m]のフレーム10−m内の存在範囲において動画の複数のフレーム10における出現頻度FX、FYを算出し、対象領域OR[m]のフレーム10−m内での位置を、閾値頻度FX
TH、FY
TH以上の出現頻度の範囲ARX、ARYの領域ARとして選択する。しかしながら、判定部150は、例えば複数のフレーム10のX方向及びY方向の各々において対象領域OR[m]の面積S
MAXの大きさに応じた相対値で含まれる画素PXにラベリングし、複数のフレーム10を重ねて画素PXのラベル値の和又は積を算出してもよい。判定部150は、前述のように算出した画素PXのラベル値の和又は積が閾値以上の領域を抽出対象の領域ARとして選択できる。また、判定部150は、上述した演算以外の、例えば標準偏差等に基づく演算やその他の統計演算によって、対象領域ORのフレーム10内での位置を、領域ARとして選択してもよい。
【解決手段】本発明に係る画像処理装置では、動画のフレーム差分からフレーム間の画像の相違が検出される。相違を検出した画素の情報に基づいて、フレームを構成する画素のうち、画像の相違のある画素が連続する領域が連結領域として抽出される。連結領域を含む所定形状の領域の面積は、連結領域ごとに算出される。所定形状の領域の面積の大きさに基づいて、連結領域ごとに存在する所定形状の領域のうちから、対象領域が選択される。複数の連結領域ごとに所定形状の領域の面積のうち、最大の面積を有する領域が対象領域として選択される。画像処理装置では、対象領域のフレーム内での位置を、動画の複数のフレームについて統計演算することによって求め、フレーム内の領域のうちの抽出対象の領域として判定する。