(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023177717
(43)【公開日】2023-12-14
(54)【発明の名称】追加学習用のデータ収集システムおよびデータ収集方法
(51)【国際特許分類】
G06V 10/72 20220101AFI20231207BHJP
G06T 7/00 20170101ALI20231207BHJP
【FI】
G06V10/72
G06T7/00 350B
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022090549
(22)【出願日】2022-06-03
(71)【出願人】
【識別番号】000001122
【氏名又は名称】株式会社日立国際電気
(74)【代理人】
【識別番号】110000062
【氏名又は名称】弁理士法人第一国際特許事務所
(72)【発明者】
【氏名】藤井 幸
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA02
5L096AA06
5L096BA02
5L096CA02
5L096DA02
5L096FA04
5L096FA16
5L096FA52
5L096GA51
5L096HA05
(57)【要約】
【課題】本発明では、追加学習用のデータを効率よく収集する技術を提供することを目的とする。
【解決手段】本発明の追加学習用のデータ収集システムは、所定エリアを撮影した映像に含まれる対象物体を認識し追跡する画像処理をする画像処理機能部と、前記画像処理の追加学習用のデータを蓄積する蓄積処理機能部とを備える。蓄積処理機能部は、データを一時蓄積し、一時蓄積データから所定の指標を算出し、指標に基づいて優先順位算出処理を行い、かつ一時蓄積データの蓄積判断処理を行う。蓄積判断処理は、追加学習用データ部のデータ量が閾値未満の場合には、一時蓄積データを追加学習用データ部に蓄積し、追加学習用データ部のデータ量が閾値以上の場合には、一時蓄積データと、追加学習用データ部に蓄積されたデータのうち優先順位が最も低いデータを優先順位算出処理により比較し、優先順位の低い方のデータを削除する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
所定エリアを撮影した映像に含まれる対象物体を認識し追跡する画像処理をする画像処理機能部と、前記画像処理の追加学習用のデータを蓄積する蓄積処理機能部と、を備えた追加学習用のデータ収集システムであって、
前記蓄積処理機能部は、
データを一時蓄積し、当該一時蓄積データから所定の指標を算出し、
前記指標に基づいて優先順位算出処理を行い、かつ前記一時蓄積データの蓄積判断処理を行い、
前記蓄積判断処理は、
追加学習用データ部のデータ量が閾値未満の場合には、前記一時蓄積データを前記追加学習用データ部に蓄積し、
前記追加学習用データ部のデータ量が閾値以上の場合には、前記一時蓄積データと、前記追加学習用データ部に蓄積されたデータのうち優先順位が最も低いデータ(以下、「最下位データ」という。)を前記優先順位算出処理により比較し、優先順位の低い方のデータを削除する、
ことを特徴とする、追加学習用のデータ収集システム。
【請求項2】
前記指標には、追跡時間と、未認識回数と、対象数の最大値、のいずれかを含む、請求項1に記載の追加学習用のデータ収集システム。
【請求項3】
前記蓄積判断処理において、
前記一時蓄積データの追跡時間が前記最下位データの追跡時間よりも小さい場合、前記一時蓄積データを削除する、請求項2に記載の追加学習用のデータ収集システム。
【請求項4】
前記蓄積判断処理において、
前記一時蓄積データの追跡時間が前記最下位データの追跡時間以上の場合で、かつ、
前記一時蓄積データの未認識回数が前記最下位データの未認識回数よりも小さい場合、前記一時蓄積データを削除する、請求項2に記載の追加学習用のデータ収集システム。
【請求項5】
前記蓄積判断処理において、
前記一時蓄積データの追跡時間が前記最下位データの追跡時間以上の場合で、
前記一時蓄積データの未認識回数が前記最下位データの未認識回数以上の場合で、かつ、
前記一時蓄積データの対象数の最大値が前記最下位データの対象数の最大値よりも小さい場合、前記一時蓄積データを削除する、請求項2に記載の追加学習用のデータ収集システム。
【請求項6】
前記優先順位算出処理において、
前記一時蓄積データと前記最下位データが、追跡時間、未認識回数、および対象数の最大値がそれぞれ同じである場合、映像開始日時が古いデータを優先順位が高いと判断する、請求項2に記載の追加学習用のデータ収集システム。
【請求項7】
前記一時蓄積データを前記追加学習用データ部に蓄積する場合において、
前記優先順位算出処理に基づき、前記追加学習用データ部のデータリストを更新する、請求項1に記載の追加学習用のデータ収集システム。
【請求項8】
所定エリアを撮影した映像に含まれる対象物体を認識し追跡する画像処理を行い、前記画像処理の追加学習用のデータを蓄積する、追加学習用のデータ収集方法であって、
データを一時蓄積し、当該一時蓄積データから所定の指標を算出する第1ステップと、
前記指標に基づいて優先順位算出処理を行い、かつ前記一時蓄積データの蓄積判断処理を行う第2ステップと、を含み、
前記蓄積判断処理は、
追加学習用データ部のデータ量が閾値未満の場合には、前記一時蓄積データを前記追加学習用データ部に蓄積し、
前記追加学習用データ部のデータ量が閾値以上の場合には、前記一時蓄積データと、前記追加学習用データ部に蓄積されたデータのうち優先順位が最も低いデータ(以下、「最下位データ」という。)を前記優先順位算出処理により比較し、優先順位の低い方のデータを削除する、
ことを特徴とする、追加学習用のデータ収集方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、追加学習用のデータ収集システムおよびデータ収集方法に関する。
【背景技術】
【0002】
従来、駅ホームにおいて移動する乗客を追跡するなど、公共施設や自治体などにおける様々な場面において、対象物体を追跡する監視システムが用いられている。そのような監視システムにおいては、カメラで撮像する画像において対象物体を認識し、移動を追跡する画像処理技術が必要になる。
【0003】
例えば特許文献1においては、画面中の対象物を中央に捉えながら確実に追跡することができるように、撮像部から与えられる映像信号中の対象物の画像を検出して、対象物の移動および変化に従って対象物の画像が映像画面中の中央に位置するように第1駆動部および第2駆動部によりパン方向およびチルト方向に移動し、さらに対象物の画像が所定の大きさを維持するように第3駆動部によりズームインまたはズームアウトするべく制御する制御部をもつ侵入物検知システムが開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
近年、AIを用いて画像中における対象物を認識する画像処理技術が、特許文献1に示すような監視システムに適用されつつある。このような画像処理技術を使ったシステムの運用中に特定の画像パターンの見逃し等の誤作動が発生した場合、特定の画像パターンを含む追加学習用のデータを収集し、追加学習を行うことにより、画像処理性能の改善がなされる。
【0006】
しかし、従来の追加学習用のデータ収集は、見逃し等の誤作動が発生した時点付近の映像から作業員が手作業で必要なシーンを切出して追加学習用のデータを収集しており、大変な労力がかかっていた。作業員が行う方法以外にも常時、データを配信し蓄積する方法もあるが、必要がない映像も配信・蓄積されるため、データの蓄積容量や通信回線が圧迫されて、蓄積コストや通信コストが増加するという問題があった。
【0007】
そこで、本発明では、追加学習用のデータを効率よく収集する技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記の課題を解決するために、代表的な本発明の追加学習用のデータ収集システムの一つは、所定エリアを撮影した映像に含まれる対象物体を認識し追跡する画像処理をする画像処理機能部と、前記画像処理の追加学習用のデータを蓄積する蓄積処理機能部と、を備えた追加学習用のデータ収集システムであって、前記蓄積処理機能部は、データを一時蓄積し、当該一時蓄積データから所定の指標を算出し、前記指標に基づいて優先順位算出処理を行い、かつ前記一時蓄積データの蓄積判断処理を行う。そして、前記蓄積判断処理は、追加学習用データ部のデータ量が閾値未満の場合には、前記一時蓄積データを前記追加学習用データ部に蓄積する。さらに、前記追加学習用データ部のデータ量が閾値以上の場合には、前記一時蓄積データと、前記追加学習用データ部に蓄積されたデータのうち優先順位が最も低いデータ(以下、「最下位データ」という。)を前記優先順位算出処理により比較し、優先順位の低い方のデータを削除する。
【発明の効果】
【0009】
本発明によれば、追加学習用のデータを効率よく収集することができる。
上記した以外の課題、構成および効果は、以下の実施をするための形態における説明により明らかにされる。
【図面の簡単な説明】
【0010】
【
図1】
図1は、本発明の実施形態に係る追加学習用のデータ収集システムを示す図である。
【
図2】
図2は、画像処理が行われる映像の第1例を示す模式図である。
【
図3】
図3は、画像処理が行われる映像の第2例を示す模式図である。
【
図4A】
図4Aは、画像処理のフローチャートを示す図である。
【
図4B】
図4Bは、画像処理のフローチャートを示す図である。
【
図5】
図5は、処理済み映像信号Sviに関連付けられた画像処理情報を示す模式図である。
【
図6】
図6は、追加学習用データ部に蓄積されているデータのリストを模式的に示す図である。
【
図7】
図7は、蓄積処理のフローチャートを示す図である。
【
図8】
図8は、変形例1の蓄積処理のフローチャートを示す図である。
【
図9】
図9は、変形例2の画像処理のフローチャートを示す図である。
【発明を実施するための形態】
【0011】
以下、図面を参照して、本発明の実施形態について説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。
【0012】
<システム構成>
図1を参照して、本発明の実施形態に係る追加学習用のデータ収集システムの構成を説明する。
図1は、本発明の実施形態に係る追加学習用のデータ収集システムを示す図である。データ収集システム1は、カメラ部10、画像処理サーバ20、蓄積サーバ30を含む。データ収集システムの構成要素の間で映像信号が通信されるところ、通信の手段および映像の通信規格等は本発明が適用される状況に応じて適切なものを選択することが可能である。
【0013】
カメラ部10は、所定のエリアを撮影し、少なくとも撮影日時の情報を含む映像信号Svを生成する。カメラ部10は、生成した映像信号Svを後述の画像処理サーバ20へ送信する。なお、
図1において示されているカメラ部10の数は1であるが、カメラ部の台数はこれに限定されない。複数のカメラ部を備える構成であってもよい。
【0014】
画像処理サーバ20は、入力部21、認識処理部22、出力部23、学習部24、学習データ部25を備える。ただし、学習部24、学習データ部25は画像処理サーバ20とは別体として設けられてもよい。
【0015】
入力部21は、カメラ部10によって生成された映像信号Svを受信する。入力部21はあってもなくてもよい。
図1においてはカメラ部10から映像信号Svが送信される様子を示しているが、映像データが蓄積された記憶装置を画像処理サーバ20に接続する構成であってもよく、データを移行する方法は限定されない。
【0016】
認識処理部22は、映像信号Svから所定の対象物体を認識し追跡する画像処理を行う。ここで、画像認識は、所定の対象物体を認識するように学習した学習済みモデルを使用したAI(人工知能)によって行われる。学習部24は、学習データ部25に保存された学習データを用いて学習し、所定の対象物体を認識する学習済みモデルを作成する。その後も学習データ部25には、追加学習用のデータが供給される。そして追加学習用のデータを用いて学習部24において学習済みモデルが更新される。
【0017】
さらに認識処理部22は、「認識した」または「認識しない(未認識)」のいずれかを示す認識情報を生成する。「認識しない(未認識)」には、対象物体が移動してカメラのフレーム外に離脱することで認識されなくなる場合の他、見逃し等の誤作動によって認識されなくなる場合も含む。
【0018】
また、認識処理部22は、カメラのフレーム中において認識される、追跡の対象となるべき物体の数を示す数情報を生成する。また、認識処理部22は、所定の対象物体を認識して追跡を開始した追跡開始情報、および当該対象物体が認識されずに追跡が終了した追跡終了情報を生成する。認識処理部22は、上述の認識情報、数情報、追跡開始情報、追跡終了情報を画像処理情報として映像信号Svに関連付ける。出力部23は、映像信号Svに画像処理情報が関連付けられた処理済み映像信号Sviを蓄積サーバ30へ出力する。出力部23はあってもなくてもよく、データを移行する方法は限定されない。
【0019】
蓄積サーバ30は、入力部31、一時蓄積部32、判断部33、追加学習用データ部34を備える。蓄積サーバ30は、処理済み映像信号Sviに追加学習用のデータとなる部分が含まれるかどうかを判断し、収集する。
【0020】
入力部31は、処理済み映像信号Sviを受信する。入力部31はあってもなくてもよく、データを移行する方法は限定されない。一時蓄積部32は、処理済み画像信号Sviのうち、追加学習用のデータとなる映像の部分を抽出し、一時蓄積データとして一時的に蓄積する。判断部33は、一時蓄積部に蓄積された映像の部分に関連付けられた画像処理情報に基づいて優先順位を判断し、一時蓄積データを追加学習用データ部34に蓄積するか否かを判断する。追加学習用データ部34は、学習データ部25における追加学習用のデータを保存し、必要に応じ学習データ部25に学習データを提供する。
【0021】
<画像処理>
図2から
図4を用いて、画像処理サーバ20において行われる画像処理を説明する。
本実施形態においては、所定のエリアに入った人物を認識し追跡する監視システムに対して、データ収集システム1を適用した場合を説明する。ここでは、カメラ部10は、所定のエリアを撮影する定点カメラである。なお、本発明は、監視システムに限定されるものではない。
【0022】
図2は、画像処理が行われる映像の第1例を示す模式図である。
【0023】
図2(a)は、認識処理部22が、人物Aを認識し追跡を開始した場面を示す図である。ここで、認識処理部22は所定のエリアに対してフレーム単位で画像取得および画像処理を行う。フレーム40はある時点での映像信号Svに含まれる1フレームを示している。フレームレートとしては、例えば30fps(frame per second)が用いられる。認識処理部22は、フレーム40のなかに、人物Aが含まれていることを認識する。認識処理部22は、フレーム40の時点から、人物Aを認識し追跡を開始する。また、認識処理部22は、フレーム40のなかに、人物Aの他に、5人の人物44aから44eを認識し、数情報(6[人])を生成する。
図2(a)において、画像処理の対象として認識された物体は破線で囲むように表示されている。物体43は、画像処理の対象として認識されていない。
【0024】
なお、任意の時点でのフレームにおいて、フレームの中央付近にある点から半径r1以内の領域である中心領域Rcと、中心領域の同心円状であって半径r1と半径r1よりも大きい半径r2の間の中間領域Rm、中間領域Rmよりも遠い領域である端部領域Reが設定されている。このような領域の設定は追跡対象の位置を特定する手段の一例であり、これに限定されるものではなく、なくてもよい。
【0025】
図2(b)は、
図2(a)のフレーム40から数フレームが経過した後のフレーム41を示す図である。フレーム41において、人物Aは、撮影されたエリアを左上から右下に移動している。認識処理部22は、このように人物Aの移動を追跡する。また、認識処理部22は、フレーム41のなかに、人物Aの他に、4人の人物45aから45dを認識して数情報(5[人])を生成する。
【0026】
図2(c)は、
図2(b)のフレーム41の次のフレーム42を示す図である。フレーム42において、人物Aは認識されていない。認識処理部22は、人物Aの追跡を判定するための判定条件が成立する場合、人物Aの追跡を終了する。
【0027】
ここで、追跡終了をするための判定条件としては、フレーム42の時点から人物Aが認識されない状態が継続する時間を用いる。このような時間については、認識できなくなったフレームよりも前のフレームにおいて人物Aがいた位置に応じて設定することが考えられる。例えば、人物Aが認識されなくなったフレームよりも直前のフレームにおいて中心領域Rcにいた場合、人物Aの認識されない状態が10秒継続した時点で追跡を終了する。また、人物Aが認識されなくなったフレームよりも直前のフレームにおいて中間領域Rmにいた場合、認識されない状態が5秒継続した時点で追跡を終了する。また、人物Aが認識されなくなったフレームよりも直前のフレームにおいて端部領域Reにいた場合、認識されない状態が1秒継続した時点で追跡を終了する。
【0028】
このような追跡終了の判定条件は、本実施形態が適用される状況に応じて適宜設定することができる。例えば、カメラ部10が駅のプラットフォームのように広いエリアを撮影する場合には上述のように中心領域Rc、中間領域Rm、端部領域Reそれぞれに対応する継続時間の値を設定することとし、一方でカメラ部10が駅の改札のように狭いエリアを撮影する場合には領域を分けることなく1秒の継続時間を一律に設定することが考えられる。監視システムが用いられる場所や予想される人流等の状況に応じて、追跡終了の判定条件を設定することが可能である。
【0029】
図3は、画像処理が行われる映像の第2例を示す模式図である。
図3は、誤作動が起こったために人物の未認識が発生した場合である点で、
図2に示す第1例の場合と異なる。
図2に示された構成と同一又は同等の構成要素については同一の符号を付し、その説明を簡略又は省略する。
【0030】
図3(a)は、認識処理部22が、人物Bを認識し追跡を開始した場面を示す図である。認識処理部22は、フレーム50のなかに、人物Bが含まれていることを認識する。認識処理部22は、フレーム50の時点から、人物Bを認識し追跡を開始する。また、認識処理部22は、フレーム50のなかに、人物Bの他に、5人の人物54aから54eを認識し数情報(6[人])を生成する。
図3(a)において、画像処理の対象として認識された物体は破線で囲むように表示されている。物体43は、画像処理の対象として認識されていない。
【0031】
図3(b)は、
図3(a)のフレーム50から数フレームが経過した後のフレーム51を示す図である。フレーム51において、人物Bは、撮影されたエリアを左上から中央部付近に移動している。認識処理部22は、このように人物B移動を追跡する。また、認識処理部22は、フレーム51のなかに、人物Bの他に、4人の人物55aから55dを認識し数情報(5[人])を生成する。
【0032】
図3(c)は、
図3(b)のフレーム51の次のフレーム52を示す図である。フレーム52において、実際には人物Bに相当する人物は含まれているが、認識処理部22は人物Bを認識していない。認識処理部22は、人物Bがフレーム51において中間領域Rmにいたことから、人物Bが認識されない状態が5秒間継続するかどうかを判定条件に設定する。認識処理部22は、判定条件が成立する(5秒間継続して認識されない)場合、人物Bの追跡を終了する。
【0033】
なお、
図2および
図3の例では、特定の人物1人のみを認識して追跡することを説明したが、本実施形態はこれに限定されない。複数の人物を区別して認識し、追跡することも可能である。
【0034】
図4Aおよび
図4Bは、画像処理のフローチャートを示す図である。
【0035】
図4AのステップS1において、画像処理サーバ20は、カメラ部10から映像信号Svを受信する。映像信号Svの受信は、入力部21を介して行われる。
【0036】
ステップS2において、画像処理サーバ20は、映像信号Svについて学習済みモデルを用いたAI(人工知能)により、所定の対象物体に対する認識処理を行う。
【0037】
ステップ3において開始される追跡処理1は、物体の認識および追跡に関するものである。ステップS3において、認識処理部22は、映像中に所定の対象物体を認識したか否か判断する。ここで、物体の認識は、例えば映像信号をフレーム単位で行うことができる。また、認識処理部22は、ステップS3において、所定の対象物体を「認識した」、または「認識しない(未認識)」のいずれかを示す認識情報、所定の対象物体の情報(位置情報・特徴量)および所定の対象物体の数情報をフレームに関連付ける。数情報の関連付けは、
図4に示される画像処理を行う間継続して行われる。すなわちステップS3においてフレームに関連付けられる情報は、
図2(a)を例とした場合、「認識した」、人物Aおよび人物44a~44eの位置情報・特徴量、および数情報「6」をフレームに関連づける。
【0038】
また、ステップS3において、認識処理部22は、認識した所定の対象物体の追跡処理を行う。認識した所定の対象物体の1つずつに対して追跡処理を行い、関連付けられる追跡情報の有無を判定する。
【0039】
ステップS4において、認識処理部22は、認識された所定の対象物体が追跡中の物体と関連付けがあったかどうか判定する。認識処理部22は、追跡中の物体と関連付けがない場合(ステップS4においてYES)、ステップS5において新たなに出現した物体として追跡情報を追加し、追跡開始情報を付加する。認識処理部22は追跡中の物体と関連付けされた場合(ステップS4においてNO)、ステップS6において追跡情報の更新を行う。ステップS5または、ステップS6を実行後は、ステップS7の工程に移行する。
【0040】
ステップS7において、認識処理部22はステップS2で認識されたすべての所定の対象物体を処理したかを判定する。判定条件が成立しない場合(ステップS7においてNO)、ステップS3の追跡処理1に戻り処理を継続する。判定条件が成立する場合(ステップS7においてYES)、
図4Bのステップ8の工程に移行する。
【0041】
ステップS8において、追跡処理2が開始される。ここでは、まず、認識処理部22は追跡情報の1つを取り出す。
【0042】
ステップS9において、認識処理部22は、追跡開始時間≠現在時刻(ステップS5で追加された追跡情報ではない)かつ、追跡情報更新なし(ステップS6で情報更新が行われていない)であるか否かを判定する。判定条件が成立した場合(ステップS9においてYSE)、未認識を示す情報を関連付け、ステップS10に移行する。判定条件が成立しなかった場合(ステップS9においてNO)の場合、追跡中であるためステップS13に移行する。
【0043】
ステップS10において、認識処理部22は、認識されなくなったフレームの直前のフレームにおける所定の対象物体の位置に基づいて、追跡処理を終了するための判定条件を設定する。
【0044】
ステップS11において、認識処理部22は、判定条件が成立するかどうか判定する。判定条件が成立しない場合(ステップS11においてNO)、ステップS13に移行する。判定条件が成立する場合(ステップS11においてYES)、認識処理部22は、所定の対象物体の追跡を終了させ、追跡が終了したことを示す追跡終了情報を付加する(ステップS12)。
【0045】
ステップS13において、認識処理部22は、所定の対象物体に関連付けられた追跡情報に追跡終了情報が付加されていない場合(ステップS13においてNO)、追跡処理2を繰り返す。認識処理部22は、所定の対象物体に関連付けられた追跡情報に追跡終了情報が付加された場合(ステップS13においてYES)、
図4AのステップS14へ移行する。
【0046】
そして、
図4AのステップS14において、認識処理部22は、映像信号Svに含まれる映像の最後まで画像処理したかどうかを判断する。残りの映像がある場合(ステップS14においてNO)、所定の対象物体の認識・追跡処理を続行する。映像の最後まで画像処理をした場合(ステップS14においてYES)、画像処理を終了する。
【0047】
上述の画像処理は、データ収集システム1が適用されている監視システムの運用中、継続して行われる。このようにすることで、監視システムの運用期間中に生じた膨大な映像データのなかから追加学習用のデータを効率よく収集することができる。
【0048】
<蓄積処理>
図5から
図7を参照して、蓄積サーバ30の一時蓄積部32が行う一時蓄積処理および指標の算出、判断部33が行う蓄積判断処理および優先順位算出処理について説明する。なお、指標の算出は判断部33が行ってもよい。
【0049】
(一時蓄積処理)
図5は 、処理済み映像信号Sviに関連付けられた画像処理情報を示す模式図である。
図5は、
図4AのステップS3から
図4BのステップS12までの工程が行われた場合を模式的に示す。
図5(a)から
図5(c)は、映像信号のなかに、3つの所定の対象物体が含まれている場合を例にとって示している。
図5において、映像信号は、時間軸(t)に沿ってフレームに分かれている。また、所定の対象物体を認識したことを示す認識情報が関連付けられたフレームにはハッチがかけられている。追跡開始情報が付加されたフレームには、ps1、ps2の文字と三角の記号が付されており、追跡終了情報が付加されたフレームにはpf1、pf2の文字と三角の記号が付されている。
図5(a)においては、所定の対象物体1の追跡がpf1で一旦終了した後に、ps2で追跡情報の更新が発生し再び追跡が開始されたことを示している。pf2において追跡終了の判定条件が成立している。
図5(b)においては、所定の対象物体2の追跡がpsnにおいて開始され、
図5に示されるフレーム以降にも追跡が継続していることを示している。
図5(c)においては、所定の対象物体3の追跡が
図5に示されるフレームよりも前に開始され、pfmにおいて一旦終了したことが示されている。
図5(c)においては、追跡情報が更新され、psm+1において再び追跡が開始し、pfm+1において追跡が終了したことが示されている。
【0050】
処理済み画像信号Sviは、蓄積サーバ30の入力部31に送信されたのち、一時蓄積部32において一時蓄積処理がなされる。一時蓄積部32は、処理済み画像信号Sviに含まれる映像データのうち、追跡開始情報が付加されたフレームから追跡終了情報が付加されたフレームまでの間のフレームを抽出し、一時蓄積データとして一時的に蓄積する。
図5の場合、追跡開始情報ps1から追跡終了情報pf1までのフレームを含むフレーム群vf1を一時蓄積データとする。また、一時蓄積部32は、フレーム群vf1に、追跡開始情報ps1に対応する追跡が開始された時刻を示す追跡開始時間ts1、追跡終了情報pf1に対応する追跡が終了した時刻を示す追跡終了時間tf1を関連付ける。フレーム群vf2、vfn、vfm、vfm+1も同様に一時的に蓄積される。以下の説明では、フレーム群vf1を例にとって説明する。
【0051】
(指標の算出)
一時蓄積部32は、フレーム群vf1に関連付けられた画像処理情報から指標を算出する。本実施形態においては、指標として、追跡時間、未認識回数、エリア内の対象数(最大値)、映像開始日時が算出される。ただし指標はこれに限定されるものではない。
【0052】
追跡時間は、追跡開始時刻ts1と追跡終了時刻tf1の間の差を求めることで算出される。例えば、フレーム群vf1の場合、追跡開始時刻ts1と追跡終了時刻tf1の間に15フレームあるので、フレームレート30fpsの場合、追跡時間は15/30=0.5秒である。なお、指標としては追跡時間に限定されない。例えば、フレーム数を用いることもできる。
【0053】
未認識回数は、フレーム群vf1において所定の対象物体の未認識があった回数である。例えば、1フレームの未認識があった場合に1回とカウントする方法がある。
図5(a)において、追跡開始情報ps1が付加されたフレームから追跡終了情報pf1が付加されたフレームまでの間に未認識であるフレームが9つあるので、未認識回数を9回とカウントする。なお、未認識状態の評価方法はこれに限定されない。例えば、指標として未認識回数の代わりに、認識した状態が継続した時間を用いて未認識状態の評価の指標とすることもできる。
【0054】
エリア内の対象数(最大値)(以下、「対象数の最大値」ともいう。)は、フレーム群vf1に含まれる各フレームの数情報のうち最大のものを意味する。なお、指標として用いられるものは最大値に限定されない。例えば、数情報の平均値、数情報の中央値を指標に用いることもできる。
【0055】
映像開始日時は、フレーム群vf1が含まれる映像信号Svの生成が開始される日時である。なお、指標としては他の日時を採用してもよい。
【0056】
(蓄積判断処理)
判断部33は、一時蓄積データを追加学習用データ部34に蓄積するかどうかを判断する。そのため先ず判断部33は、追加学習用データ部34に蓄積されているデータ量が閾値に達しているかどうかを判断する。閾値に達していない場合(閾値未満の場合)、判断部33は、一時蓄積データ(フレーム群vf1)を追加学習用データ部34に蓄積する。その際、後述する優先順位算出処理で決められた新たな優先順位によるデータリスト(後述)の更新が行われる。
【0057】
閾値に達している場合(閾値以上の場合)、判断部33は、追加学習用データ部34に蓄積されているデータと一時蓄積データ(フレーム群vf1)に関し、優先順位算出処理による優先順位に基づいていずれのデータを蓄積するか判断する。なお、データ量の閾値として、例えば追加学習用データ部34の記憶容量の上限値としてもよいし、次のデータを蓄積するために残されている空き容量の下限値を設定してもよい。また、1日に10データまでとするように、所定期間に蓄積するデータの個数(件数)の上限を閾値に用いてもよい。
【0058】
図6は、追加学習用データ部34に蓄積されているデータのリスト(以下、「データリスト」という。)を模式的に示す図である。本実施形態の優先順位や蓄積の判断などにおいて、「データ」はフレーム群(フレーム群vf1など)単位で扱われる。項目「優先順位」は、蓄積されているフレーム群の指標に基づいて判断部33での優先順位算出処理により算出された値である。追加学習用データ部34に蓄積されているデータの指標は、一時蓄積データに対して算出した上述の指標と同様なので説明は省略する。なお、データリストには、
図6に示される項目のほか、適宜、項目を付加することも可能である。例えば、所定の対象物体の種類を示す指標を追加してもよい。このような追加した指標は、後述の優先順位算出処理において考慮することも可能である。
【0059】
例えば、
図6において、優先順位1位のフレーム群は、追跡時間が10分、未認識回数が20回、エリア内の対象数(最大値)が10人である。また、データリストには、優先順位が最も低いデータ(以下、「最下位データ」という。)が含まれる。
図6において、優先順位R
Lのフレーム群が最下位データに該当する。優先順位R
Lのフレーム群は、追跡時間がT
L分、未認識回数がC
L回、エリア内の対象数(最大値)がN
L人である。なお、
図6のデータリストに掲載されたいずれのデータも、同一の映像信号Svから抽出されたフレーム群であることから、映像開始日時が共通しているが、異なる映像信号から抽出されたデータの映像開始日が異なり得ることは言うまでもない。
【0060】
判断部33は、一時蓄積データを追加学習用データ部34に蓄積させるか否かを指標の優先順位によって判断する。蓄積できないと判断された場合は、一時蓄積データはそのまま削除される。蓄積すると判断された場合は、追加学習用データ部34の最下位データを削除する。そして優先順位算出処理で決められた新たな優先順位によるデータリストの更新が行われる。
【0061】
このように一時蓄積データの蓄積または削除が行われた後、次の一時蓄積データがある場合には、同様の蓄積判断処理を繰り返す。
【0062】
(優先順位算出処理)
指標による優先順位のつけ方(優先順位算出処理)に関し説明する。
まず、追跡時間の比較を行う。判断部33は、一時蓄積データの追跡時間が、追加学習用データ部34の最下位データ(RL)の追跡時間以上であるかどうかを判断する。一時蓄積データの追跡時間が最下位データ(RL)の追跡時間(TL)よりも小さい(未満)場合、判断部33は、一時蓄積データを削除する。一時蓄積データの追跡時間が最下位データ(RL)の追跡時間(TL)以上である場合、未認識回数の比較をする。
【0063】
次に未認識回数の比較を行う。判断部33は、一時蓄積データの未認識概数が最下位データ(RL)の未認識回数(CL)以上であるかどうかを判断する。一時蓄積データの未認識回数が最下位データ(RL)の未認識回数(CL)よりも小さい(未満)場合、判断部33は、一時蓄積データを削除する。一時蓄積データの未認識回数が最下位データ(RL)の未認識回数(CL)以上である場合、対象数の最大値の比較をする。
【0064】
次に対象数の最大値の比較を行う。判断部33は、一時蓄積データの対象数の最大値が最下位データ(RL)の対象数の最大値(NL)以上であるか判断する。一時蓄積データの対象数の最大値が最下位データ(RL)の対象数の最大値(NL)よりも小さい(未満)場合、判断部33は、一時蓄積データを削除する。一時蓄積データの対象数の最大値が最下位データ(RL)の対象数の最大値(NL)以上である場合、最下位データ(RL)を削除し、一時蓄積データを追加学習用データ部34に蓄積する。
【0065】
仮に、一時蓄積データと最下位データ(RL)との間で、追跡時間、未認識回数、対象数の最大値が全て同じであった場合には、映像開始日時が古いデータを優先順位が高いとする。ただし、映像開始日時が最新のものを優先順位が高いとしてもよい。
【0066】
上述のように、一時蓄積データと最下位データが優先順位算出処理により比較され、優先順位が低い方のデータが削除される。ただし、優先順位算出は上述の手順に限定されない。例えば未認識回数を第1優先の指標として最初に比較してもよい。またある指標の判定において、最下位データが判定条件を満たさなければその時点で最下位データの方を削除してもよい。
【0067】
一時蓄積データを蓄積してデータリストを更新する際には、データリスト中の全てのデータと一時蓄積データとで同様の優先順位算出処理に従って優先順位を新たに決定しデータリストが更新される。ただし、最下位データだけを更新するようにしてもよい。
【0068】
(蓄積処理のフローチャート)
図7は、蓄積処理のフローチャートを示す図である。
【0069】
ステップS20において、一時蓄積部32は一時蓄積処理を行う。
【0070】
ステップS21において、一時蓄積部32は、一時蓄積データに関連付けられた画像処理情報から指標を算出する。
【0071】
ステップS22からステップS25において、判断部33は、一時蓄積データを蓄積するかどうかを判断する蓄積判断処理を行う。
ステップS12において、判断部33は、追加学習用データ部34に蓄積されているデータ量が閾値に達しているかどうかを判断する。閾値に達していない場合(閾値未満の場合)(ステップS22においてYES)、ステップS26に移行し一時蓄積データを蓄積しデータリストを更新する。閾値に達している場合(閾値以上の場合)(ステップS22においてNO)、判断部33は、ステップS23に移行する。
【0072】
ステップS23からステップS25において、判断部33は、一時蓄積データと追加学習用データ部34に蓄積された最下位データに関し、どちらを蓄積するか判断する。
【0073】
ステップS23において、判断部33は、一時蓄積データの追跡時間が最下位データの追跡時間以上であるか判断する。一時蓄積データの追跡時間が最下位データの追跡時間以上である場合(ステップS23においてYES)、ステップS24に移行する。一時蓄積データの長さである追跡時間が最下位データの追跡時間未満である場合(ステップS23においてNO)、判断部33はステップS28に移行し一時蓄積データを削除する。
【0074】
ステップS24において、判断部33は、一時蓄積データの未認識回数が最下位データの未認識回数以上であるか判断する。一時蓄積データの未認識回数が最下位データの未認識回数以上である場合(ステップS24においてYES)、ステップS15に移行する。一時蓄積データの未認識回数が最下位データの未認識回数未満である場合(ステップS24においてNO)、判断部33はステップS28に移行し一時蓄積データを削除する。
【0075】
ステップS25において、判断部33は、一時蓄積データの対象数の最大値が最下位データの対象数の最大値以上であるか判断する。一時蓄積データの対象数の最大値が最下位データの対象数の最大値以上である場合(ステップS24においてYES)、判断部33は、ステップS26に移行し、追加学習用データ部34から最下位データを削除し、一時蓄積データを追加学習用データ部34に蓄積してデータリストを更新する。一時蓄積データの対象数の最大値が最下位データの対象数の最大値未満である場合(ステップS24においてNO)、判断部33は、ステップS28に移行し一時蓄積データを削除する。
【0076】
ステップ27において、処理済み映像信号Sviの映像データが終了した場合(ステップS27においてYES)、蓄積判断処理を終了する。処理済み映像信号Sviに映像データが含まれる場合(ステップS27においてNO)、ステップS20の一時蓄積処理をする。
【0077】
<作用・効果>
データに優先順位をつけて、蓄積判断に利用することで、優先度の低いデータを容易に排除でき、また作業員の労力をかけずに、追加学習用のデータを効率よく収集することができる。
【0078】
また、追跡する対象物体に応じた適切な指標や優先順位付けを選択することも可能となる。例えば本実施形態においては、指標として、追跡時間、未認識回数、対象数の最大値を採用した。追跡時間が長いと映像の記録時間が長くなるため、誤作動が発生した場合のデータを多く収集でき追加学習用のデータとして適していることから追跡時間を第1優先順位の判断指標に設定した。次に未認識回数が多いと、対象物体の見逃しが発生したときのデータが多く含まれる可能性が高まることから未認識回数を第2優先順位の判断指標に設定した。次に対象数の最大値が多いと、人数が多い分より多くのデータを収集できるメリットがあることから対象数の最大値を第3優先順位の判断指標に設定した。
【0079】
また、追加学習用のデータは優先順位が高いものから優先して蓄積されるため、データの蓄積容量を浪費することなくデータ通信にかかる通信コストも抑制することができる。また、優先順位を付けることによって、学習データを選別するときに優先順位の高いものから優先して効率的に利用することもできる。
【0080】
[変形例1]
変形例1は、優先順位算出処理における判断ステップが1つである点で、実施形態と異なる。
図8は、変形例1の蓄積処理のフローチャートを示す図である。以下の説明において、上述の実施形態と同一または同等の構成要素については同一の符号を付し、その説明を簡略または省略する。
【0081】
変形例1において、一時蓄積データと最下位データの比較に用いる指標は1種類である。このため、一時蓄積データと最下位データの優先度を比較する工程は、ステップ130の1回である。
【0082】
<作用・効果>
例えば特定の色、または特定範囲の身長といった、収集したいデータが特定されている場合には、変形例1のように、優先順位を比較するときの指標を絞ることで、目的にあった追加学習用のデータをより効率よく収集することができる。
【0083】
[変形例2]
変形例2は、画像処理において所定の対象物体が1つに特定されている点で、実施形態と異なる。
図9は、変形例2の画像処理のフローチャートを示す図である。ここでは、
図2および
図3の映像を想定している。以下の説明において、上述の実施形態と同一または同等の構成要素については同一の符号を付し、その説明を簡略または省略する。
【0084】
ステップS201において、画像処理サーバ20は、カメラ部10から映像信号Svを受信する。映像信号Svの受信は、入力部21を介して行われる。
【0085】
ステップS202において、画像処理サーバ20は、映像信号Svについて学習済みモデルを用いたAI(人工知能)により、所定の対象物体(例えば人物Aまたは人物B)に対する認識処理を行う。
【0086】
ステップS203において、認識処理部22は、映像中に所定の対象物体を認識するか否か判断する。ここで、物体の認識は、例えば映像信号をフレーム単位で行うことができる。また、認識処理部22は、所定の対象物体を「認識した」、または「認識しない(未認識)」のいずれかを示す認識情報をフレームに関連付ける。所定の対象物体を認識した場合(ステップS203においてYES)、ステップS4の追跡処理を開始する。所定の対象物体を認識しない場合(ステップS203においてNO)、認識処理部22は、認識処理(ステップS202)を続行する。
【0087】
なお、認識処理部22は、映像信号のフレーム中において認識される、追跡の対象となるべき物体の数を示す数情報をフレームに関連付ける。数情報の関連付けは、
図9に示される画像処理を行う間、継続して行われる。
【0088】
ステップS204において、認識処理部22は、認識した所定の対象物体の追跡処理を行う。追跡処理を行う間は、当該物体の認識が継続している。そのため、認識処理部22は、フレームに所定の物体を認識したか否かを示す認識情報を関連付ける。また、認識処理部22は、追跡を開始した時点を示す追跡開始情報をフレームに関連付ける。
【0089】
ステップS205において、認識処理部22は、追跡中の物体が認識されない状態になったかどうか判定する。認識処理部22は、所定の対象物体を認識しない場合、未認識を示す認識情報をフレームに関連付ける。追跡中の物体を認識している場合(ステップS205においてNO)、認識処理部22は追跡処理を継続する。追跡中の物体が認識されない場合(ステップS205においてYES)、ステップS206の工程に移る。
【0090】
ステップS206において、認識処理部22は、認識されなくなったフレームの直前のフレームにおける所定の対象物体の位置に基づいて、追跡処理を終了するための判定条件を設定する。
【0091】
ステップS207において、認識処理部22は、判定条件が成立するかどうか判定する。判定条件が成立しない場合(ステップS207においてNO)、所定の対象物体を認識する状態であるため、追跡処理を行う。判定条件が成立する場合(ステップS207においてYES)、認識処理部22は、所定の対象物体の追跡を終了させ、追跡が終了したことを示す追跡終了情報をフレームに関連付ける。
【0092】
ステップS208において、認識処理部22は、映像信号Svに含まれる映像の最後まで画像処理したかどうかを判断する。残りの映像がある場合(ステップS208においてNO)、所定の対象物体の認識・追跡処理を続行する。映像の最後まで画像処理をした場合(ステップS208においてYES)、画像処理を終了する。以降は、実施形態に説明した蓄積処理を行う。
【0093】
<作用・効果>
変形例2においては、追跡する対象物体が予め判明している場合、対象物体の認識および追跡が簡便な方法で行われる。蓄積するデータ量を抑えることが可能となり、追加学習用のデータを効率よく収集することができる。
【0094】
以上、本発明の実施の形態について説明したが、本発明は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
本実施形態において、画像処理サーバと蓄積サーバを含む追加学習用のデータ収集システムを示したが、本発明はこれに限定されない。画像処理サーバと蓄積サーバは必ずしも物理的に別体である必要はなく、画像処理サーバの機能を実現する構成(「画像処理機能部」という。)と蓄積サーバの機能を実現する構成(「蓄積処理機能部」という。)を組み合わせたシステムであればよい。
【符号の説明】
【0095】
1 データ収集システム
10 カメラ部
20 画像処理サーバ
21、31 入力部
22 認識処理部
23 出力部
24 学習部
25 学習データ部
30 蓄積サーバ
32 一時蓄積部
33 判断部
34 追加学習用データ部
35 制御部
40~42、50~52 フレーム
43 物体
44a~44e、45a~45d、46a~46c、54a~54e、55a~55d、56a~56c 人物
A、B 特定の人物
vf1、vf2、vfn、vfm、vfm+1 フレーム群
pf1、pf2、pfm、pfm+1 追跡終了情報
ps1、ps2、psn、psm+1 追跡開始情報
r1、r2 半径