特許第6607243号(P6607243)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノンマーケティングジャパン株式会社の特許一覧 ▶ キヤノンITソリューションズ株式会社の特許一覧

特許6607243情報処理装置、情報処理方法、プログラム
<>
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000002
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000003
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000004
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000005
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000006
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000007
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000008
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000009
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000010
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000011
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000012
  • 特許6607243-情報処理装置、情報処理方法、プログラム 図000013
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6607243
(24)【登録日】2019年11月1日
(45)【発行日】2019年11月20日
(54)【発明の名称】情報処理装置、情報処理方法、プログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20191111BHJP
   G06F 3/0484 20130101ALI20191111BHJP
   G09G 5/00 20060101ALI20191111BHJP
   G09G 5/36 20060101ALI20191111BHJP
   G06N 20/00 20190101ALI20191111BHJP
【FI】
   G06T7/00 350B
   G06F3/0484 150
   G09G5/00 510H
   G09G5/00 530T
   G09G5/36 520F
   G09G5/36 520P
   G06N20/00 130
【請求項の数】7
【全頁数】16
(21)【出願番号】特願2017-210783(P2017-210783)
(22)【出願日】2017年10月31日
(65)【公開番号】特開2019-82927(P2019-82927A)
(43)【公開日】2019年5月30日
【審査請求日】2018年3月27日
(73)【特許権者】
【識別番号】390002761
【氏名又は名称】キヤノンマーケティングジャパン株式会社
(73)【特許権者】
【識別番号】592135203
【氏名又は名称】キヤノンITソリューションズ株式会社
(74)【代理人】
【識別番号】100189751
【弁理士】
【氏名又は名称】木村 友輔
(72)【発明者】
【氏名】入江 建志
【審査官】 笠田 和宏
(56)【参考文献】
【文献】 特開2015−005172(JP,A)
【文献】 特開2006−191408(JP,A)
【文献】 特開2006−350963(JP,A)
【文献】 特開2016−157436(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
IPC G06F 3/01
3/048 − 3/0489
15/18
G06N 3/00 − 3/12
7/08 − 99/00
G06T 7/00 − 7/90
G09G 5/00 − 5/36
5/377 − 5/42
(57)【特許請求の範囲】
【請求項1】
ユーザから、画像における属性情報を付与する領域として、複数の領域の指定を受け付ける領域指定受付手段と、
前記画像の表示倍率の設定を受け付ける表示倍率設定受付手段と、
前記表示倍率設定受付手段により設定された表示倍率により前記画像を表示する表示制御手段と、
を備え、
前記表示制御手段は、前記画像における拡大表示されたことのある領域と、拡大表示されたことのない領域とを識別可能に表示することを特徴とする情報処理装置。
【請求項2】
前記表示制御手段は、前記拡大表示されたことのある領域について、所定の条件を満たす倍率で拡大表示されたことのある領域と、所定の条件を満たさない倍率で拡大表示されたことのある領域とを識別可能に表示することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記所定の条件を満たす倍率か否かは、前記指定を受け付けた属性情報を付与する領域に基づき決定されることを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記画像に所定の条件を満たす倍率で拡大表示されたことのない領域が存在する場合、所定の条件を満たす倍率で拡大表示されたことのない領域が存在する旨を通知する通知手段をさらに備えることを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
【請求項5】
画像の切り替え指示を受け付ける切替指示受付手段をさらに備え、
前記通知手段は、前記画像の切り替え指示を受け付けた場合に、前記画像に所定の条件を満たす倍率で拡大表示されたことのない領域が存在する場合、所定の条件を満たす倍率で拡大表示されたことのない領域が存在する旨を通知することを特徴とする請求項4に記載の情報処理装置。
【請求項6】
情報処理装置の領域指定受付手段が、ユーザから、画像における属性情報を付与する領域として、複数の領域の指定を受け付ける領域指定受付工程と、
前記情報処理装置の表示倍率設定受付手段が、前記画像の表示倍率の設定を受け付ける表示倍率設定受付工程と、
前記情報処理装置の表示制御手段が、前記表示倍率設定受付工程により設定された表示倍率により前記画像を表示する表示制御工程と、
を備え、
前記表示制御工程は、前記画像における拡大表示されたことのある領域と、拡大表示されたことのない領域とを識別可能に表示することを特徴とする情報処理方法。
【請求項7】
情報処理装置を、
ユーザから、画像における属性情報を付与する領域として、複数の領域の指定を受け付ける領域指定受付手段と、
前記画像の表示倍率の設定を受け付ける表示倍率設定受付手段と、
前記表示倍率設定受付手段により設定された表示倍率により前記画像を表示する表示制御手段として機能させ、
前記表示制御手段を、前記画像における拡大表示されたことのある領域と、拡大表示されたことのない領域とを識別可能に表示する手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、プログラムに関する。
【背景技術】
【0002】
近年、ディープラーニングと呼ばれる機械学習技術を応用した画像認識技術が発展しており、画像に写っている物体(カテゴリ)が何か、またその位置(画像中座標)はどこにあるのか、を検出する手法が数多く提案されている。
【0003】
ディープラーニング技術を用いた物体検出器を構築するためには、大量の画像と教師データ(画像中のどこに、何のカテゴリの物体があるかを示すアノテーションデータ)が必要となる。
【0004】
また、当該教師データの品質も担保される必要があり、教師データの質が低いと、正しく学習が行われず、検出精度の低い物体検出器が構築されてしまう。
【0005】
したがって、1枚の画像に写っている検出対象の物体を抜け漏れなくラベル付け(検出対象の物体が写っている領域の指定と、その物体が何であるかの指定)することが、非常に重要となっている。
【0006】
また、写っている検出対象物体の大きさが画像解像度に比べて小さい場合には、画像のそれぞれの領域を拡大表示しながらラベル付け操作を実施することが必要となる。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2006−197055号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
特許文献1には、拡大画像と共に全体画像を確認しながら電子ズームできる機能について記載されている。
【0009】
特許文献1に記載された機能のように、全体画像と拡大画像を表示するだけでは、拡大したことがある領域と1度も拡大していない領域とを識別することができず、ラベル付けの抜け漏れの可能性を判断することができない。
【0010】
そこで、本発明は、検出物体のラベル付けの抜け漏れがないかを効率的に確認するための仕組みを提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明の情報処理装置は、画像に含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を受け付ける受付手段と、前記画像の表示倍率の変更を受け付ける表示倍率変更受付手段と、前記表示倍率変更受付手段により変更された表示倍率により前記画像を表示する表示手段と、を備え前記表示手段は、前記画像における拡大表示された領域と、拡大表示されていない領域とを識別可能に表示することを特徴とする。
【発明の効果】
【0012】
本発明によれば、検出物体のラベル付けの抜け漏れがないかを効率的に確認することが可能となる。
【図面の簡単な説明】
【0013】
図1】本発明における情報処理システムの構成の一例を示す図
図2】本発明の情報処理装置(クライアント端末101、サーバ装置102)のハードウェア構成の一例を示すブロック図
図3】表示矩形の作成・更新処理を示すフローチャート
図4】俯瞰画像にマスクを施す処理を示すフローチャート
図5】俯瞰画像にマスクを施す処理を示すフローチャート
図6】俯瞰画像にマスクを施す処理を示すフローチャート
図7】対象画像の切替指示がなされた場合のメッセージ表示処理を示すフローチャート
図8】各種のデータが登録されたデータテーブルの一例を示す図
図9】ラベル付け作業をする画面の一例を示す図
図10】画像を拡大表示した画面の一例を示す図
図11】マスク処理された画像が表示された画面の一例を示す図
図12】メッセージが表示された画面の一例を示す図
【発明を実施するための形態】
【0014】
以下、図面を参照して、本発明の実施形態を詳細に説明する。
【0015】
図1は、本発明における情報処理システムの構成の一例を示す図である。
【0016】
図1に示すように、本発明における情報処理システムは、クライアント端末101とサーバ装置102が通信可能に接続された構成となっている。
【0017】
クライアント端末101は、検出物体に対してラベル付け作業をするユーザが利用する端末であり、俯瞰画像や拡大画像等を表示し、ラベル付けの指示を受け付ける。ラベル付け作業は、表示された画像において、検出物体が写っている領域の指定と、当該検出物体が何であるかの指定を受け付ける作業である。例えば、図9に示す画面では、画像に写っている人物の顔が男性であるか女性であるかのラベル付けをした例を示している。人間の顔に相当する領域を矩形で囲み、その矩形内の顔が男性であるか女性であるかのラベル付けを行う。この際、小さく写っている顔は、そのままのサイズだと判別できないため、拡大表示してラベル付けを行う(図10)。
【0018】
サーバ装置102は、後述する確認OK・確認NG・未確認の領域を判定し、それぞれの領域を識別するためのマスク画像を生成する処理を行う。
【0019】
クライアント端末101、サーバ装置102が実行する処理の詳細は、図3以降の図面を用いて後述する。
【0020】
図2は、本発明の情報処理装置(クライアント端末101、サーバ装置102)のハードウェア構成の一例を示すブロック図である。
【0021】
図2に示すように、情報処理装置は、システムバス204を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、入力コントローラ205、ビデオコントローラ206、メモリコントローラ207、よび通信I/Fコントローラ208が接続される。
【0022】
CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。
【0023】
ROM202あるいは外部メモリ211は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。
【0024】
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ211からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。
【0025】
入力コントローラ205は、キーボード209や不図示のマウス等のポインティングデバイス等の入力装置からの入力を制御する。入力装置がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができることとする。
【0026】
また、タッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。
【0027】
ビデオコントローラ206は、ディスプレイ210などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作を受け付け可能な装置については、入力装置も提供する。
【0028】
なおビデオコントローラ206は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。
【0029】
メモリコントローラ207は、外部メモリ211へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。
【0030】
通信I/Fコントローラ209は、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の3G回線を用いた通信が可能である。
【0031】
尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上での表示を可能としている。また、CPU201は、ディスプレイ210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
【0032】
次に、図3のフローチャートを用いて、表示矩形の作成・更新処理について説明する。
【0033】
ステップS301では、クライアント端末101のCPU201は、図9に示す画面において、ユーザから拡大倍率(表示倍率)の変更指示を受け付けたかを判定し、変更指示を受け付けた場合は、処理をステップS302に移行する。拡大倍率の変更は、図9に表示するスライダーに対する操作により受け付け可能である。図10は、拡大表示された場合の画面の一例を示す図である。
【0034】
ステップS302では、サーバ装置102のCPU201は、新たに表示矩形の作成をする。なお、表示矩形とは、図8の「表示矩形」のデータテーブルで示す通り、どの画像(画像パス)のどの領域(座標)をどの程度の倍率(拡大倍率)で表示したかを管理する情報である。また、表示矩形は、拡大倍率が変更されると新たに作成され(ステップS301〜S304で説明する処理)、同じ倍率で表示領域が変更された場合は、座標情報が更新される(ステップS305〜S308で説明する処理)。
【0035】
ステップS303では、サーバ装置102のCPU201は、ステップS302で作成された表示矩形をクライアント端末101に送信する。
【0036】
ステップS304では、クライアント端末101のCPU201は、ステップS303で送信された表示矩形を受信する。
【0037】
次に、表示矩形の更新処理について説明する。
【0038】
ステップS305では、クライアント端末101のCPU201は、図9に示す画面において、表示座標の変更がなされたかを判定し、変更がなされた場合は、処理をステップS306に移行する。表示座標の変更は、マウスやキーボードによる操作等により受け付け可能である。
【0039】
ステップS306では、サーバ装置102のCPU201は、表示矩形の座標情報を更新する。
【0040】
ステップS307では、サーバ装置102のCPU201は、ステップS307で更新された表示矩形をクライアント端末101に送信する。
【0041】
ステップS307では、クライアント端末101のCPU201は、ステップS307で送信された表示矩形を受信する。
【0042】
次に、図4図6のフローチャートを用いて、俯瞰画像において確認済みと判定される領域と未確認と判定される領域とを識別可能に表示する処理について説明する。
【0043】
図4のステップS401、S404〜S406は、クライアント端末101のCPU201が実行する処理であり、S402(図5図6)、S403は、サーバ装置102のCPU201が実行する処理である。
【0044】
ステップS401では、図9に示す俯瞰画像表示ボタンが押下されたかを判定し、押下された場合は、処理をステップS402に移行する。
【0045】
ステップS402では、俯瞰画像表示用のマスク画像を作成する。本ステップの処理の詳細は、図5図6を用いて説明する。
【0046】
図5のステップS501では、対象画像に該当する表示矩形群を取得する。例えば、対象画像が「1.jpg」の場合、図8に示す表示矩形のうち、画像パスが「/image/1.jpg」となっているIDが1〜3の3つの表示矩形が取得される。
【0047】
ステップS502では、対象画像に該当する検出物体矩形群を取得する。図8に示す検出物体矩形のうち、画像パスが「/image/1.jpg」となっているIDが1〜3の3つが取得される。
【0048】
ステップS503では、ステップS502の処理の結果、検出物体矩形が取得できたかを判定する。
【0049】
取得できた場合(ステップS503:YES)は、処理をステップS504に移行し、取得できなかった場合(ステップS503:NO)は、処理をステップS518に移行する。
【0050】
なお、取得できない場合とは、対象画像において、ラベル付け作業が行われていない場合や検出物体が対象画像に含まれていなかった場合が考えられる。
【0051】
以降、ステップS505〜S517の処理を表示矩形ごとに繰り返し実行し(S504)、ステップS506〜S509の処理を検出物体矩形ごとに繰り返し実行する(S505)。
【0052】
ステップS506では、表示矩形と検出物体矩形のIoU(Intersection-over-Union)を計算する。
【0053】
ステップS507では、予め設定されたIoU設定値を取得する。本実施例においては、図8に示す通り、「0.5」が設定されているものとする。
【0054】
ステップS508では、ステップS506で計算されたIoU値と、ステップS507で取得したIoU設定値を比較し、ステップS506で計算されたIoU値の方が大きい場合(すなわち、表示矩形と検出物体矩形との重なりが、予め設定された値よりも大きい場合)(ステップS508:YES)は、処理をステップS509に移行する。IoU設定値の方が大きい場合は、次の検出物体矩形に処理を移行する。
【0055】
ステップS509では、処理対象の検出物体矩形を代表サイズ計算矩形に採用する。
【0056】
ステップS502で取得したすべての検出物体矩形に対してS506〜S509の処理が実行されると、処理をステップS510に進める。
【0057】
ステップS510では、S509で代表サイズ計算矩形に採用された検出物体矩形があるかを判定する。すなわち、IoU設定値以上に表示矩形と重なっている検出物体矩形が存在したかを判定する。
【0058】
ある場合(ステップS510:YES)は、処理をステップS511に移行する。
【0059】
無い場合(ステップS510:NO)は処理をステップS517に移行し、処理対象の表示矩形を確認保留表示矩形として管理する。
【0060】
ステップS511では、予め設定された代表サイズ計算方法を取得する。本実施例においては、図8に示す通り、平均を用いるものとする。平均以外にも、最小、最大、中央値等を用いる方法が考えられる。
【0061】
ステップS512では、代表サイズ計算矩形群から代表サイズを計算する。本実施例においては、S509で採用された検出物体矩形のサイズ(面積)の平均値を計算する。具体的には、代表サイズ計算矩形の平均サイズ(画像上の本当の大きさ)に表示矩形の拡大倍率を掛けることで、画面上での見かけの大きさを算出する。
【0062】
ステップS513では、予め設定された基準判定サイズを取得する。本実施例においては、図8に示す通り、10000(ピクセル)とする。
【0063】
ステップS514では、ステップS512で計算された代表サイズ(画面上での見かけの大きさ)と、ステップ513で取得した基準判定サイズを比較する。
【0064】
そして、ステップS512で計算された代表サイズの方が大きい場合(S514:YES)は、処理をステップS515に移行し、処理対象の表示矩形を確認OK表示領域として採用する。
【0065】
基準判定サイズの方が大きい場合(S514:NO)は、処理をステップS516に移行し、処理対象の表示矩形を確認NG表示領域として採用する。
【0066】
そして、処理をステップS504に戻し、次の表示矩形に対する処理を実行する。すべての表示矩形に対する処理を終了すると、図6のステップS601に処理を移行する。
【0067】
次に、S503で検出物体矩形がないと判定された場合の処理について説明する。
【0068】
ステップS518では、予め設定された基準倍率設定値を取得する。本実施例においては、図8に示す通り2倍とする。
【0069】
そして、S520〜S522の処理を表示矩形ごとに繰り返し実行する。
【0070】
ステップS520では、ステップS518で取得した基準倍率設定値と、処理対象の表示矩形の拡大倍率とを比較する。
【0071】
そして、表示矩形の拡大倍率の方が大きい場合(S520:YES)は、処理をステップS521に移行し、処理対象の表示矩形を確認OK表示領域として採用する。
【0072】
基準倍率設定値の方が大きい場合(S520:NO)は、処理をステップS522に移行し、処理対象の表示矩形を確認NG表示領域として採用する。
【0073】
すべての表示矩形に対する処理を終了すると、図6のステップS601に処理を移行する。
【0074】
図6のステップS601では、ステップS517で確認保留表示矩形とされた表示矩形ごとに、S602〜S607の処理を実行する。
【0075】
ステップS602では、ステップS515の処理で確認OK表示領域として採用された表示矩形が存在するかを判定する。
【0076】
存在する場合(S602:YES)は、処理をステップS603に移行し、存在しない場合(S602:NO)は、処理をステップS607に移行する。
【0077】
そして、ステップS515で確認OK表示領域として採用されたすべての表示矩形について、確認保留表示矩形の中心座標と確認OK表示矩形の中心座標の距離を計算する(S603、S604)。
【0078】
ステップS605では、ステップS604で計算された距離が最も近い確認OK表示矩形の拡大倍率と、確認保留表示矩形の拡大倍率とを比較する。
【0079】
比較の結果、確認保留表示矩形の拡大倍率が最近傍の確認OK表示矩形の拡大倍率と等しいか大きい(より拡大された)場合(S605:YES)は、処理をステップS606に移行し、確認保留表示矩形の拡大倍率の方が最近傍の確認OK表示矩形の拡大倍率より小さい場合(S605:NO)は、処理をステップS607に移行する。
【0080】
ステップS606では、処理対象の確認保留表示矩形を確認OK表示領域として採用し、S607では、処理対象の確認保留表示矩形を確認NG表示領域として採用する。つまり、確認保留表示矩形の最も近くにある確認OK表示矩形と同等以上の倍率で見ていたら確認OK表示領域とする。
【0081】
すべての確認保留表示矩形に対してS602〜S607の処理が終了すると、処理をステップS608に移行する。
【0082】
ステップS608では、対象画像を取得する。
【0083】
ステップS609では、対象画像と同じ解像度で画素値が(0,0,0)のマスク画像を作成する。
【0084】
ステップS610、S611では、マスク画像のうち、すべての確認NG表示矩形に対応する部分の画素値を(255,0,0)に設定する。すなわち、すべての確認NG表示矩形に対応する部分について、赤色で識別できるように設定する。
【0085】
ステップS612、S613では、マスク画像のうち、すべての確認OK表示矩形に対応する部分の画素値を(0,0,255)に設定する。すなわち、すべての確認OK表示矩形に対応する部分について、青色で識別できるように設定する。
【0086】
S609〜S613の処理により、対象画像のうち、拡大表示がされなかった領域については無色のマスクをし、確認NG表示領域については赤色でマスクをし、確認OK表示領域については青色でマスクをするためのマスク画像が作成される。なお、拡大表示がされなかった領域、確認NG表示領域、確認OK表示領域がそれぞれ識別可能になれば良いため、色の付け方は自由に設定できるものとする。また、色を変えるのではなく、濃淡で識別したり、模様で識別したり、枠線の表示形式により識別しても良い。
【0087】
そして、処理を図4のステップS403に移行する。
【0088】
ステップS403では、ステップS402で作成されたマスク画像をクライアント端末101に送信する。
【0089】
ステップS404では、ステップS403で送信されたマスク画像を受信する。
【0090】
ステップS405では、ステップS404で受信したマスク画像と、対象画像を顔も見付き重ね合わせた画像を作成し、重ね合わせ画像を俯瞰画像として表示する(ステップS406)。
【0091】
以上の処理により、対象画像のうち、拡大表示がされなかった領域については元の画像そのままで表示し、確認NG表示領域については赤色でマスクされ、確認OK表示領域については青色でマスクされた画像を表示することが可能となる。
【0092】
これにより、拡大表示された領域と、拡大表示されていない領域と、を識別可能に表示することが可能となり、さらに拡大表示された領域の中でも、所定の倍率以上に拡大された領域(または動的に算出された倍率以上に拡大された領域)とそれ以外の領域とを識別可能に表示することが可能となる。
【0093】
なお、本実施例では、検出物体矩形がある場合には、検出物体矩形のサイズを基準に、確認OK領域であるか否かを判定したが、検出物体矩形の有無にかかわらず所定の基準倍率を満たすか否かにより判断しても良い(検出物体矩形がある場合でも、S518〜S522の処理と同様の処理により判断しても良い)。
【0094】
次に、図7のフローチャートを用いて、対象画像の切替指示がなされた場合のメッセージ表示処理について説明する。
【0095】
図7のステップS701、S704〜S708、S709の処理は、クライアント端末101のCPU201が実行する処理であり、S702、S703、S707、S708の処理は、サーバ装置102のCPU201が実行する処理である。
【0096】
ステップS701では、図9に示す画面において、ユーザから次の画像を表示する指示または前の画像を表示する指示がなされたかを判定し、指示がなされた場合(S701:YES)は、処理をステップS702に移行する。
【0097】
ステップS702では、俯瞰画像表示用のマスク画像を作成する。本ステップの処理は図5図6のフローチャートに示す処理である。
【0098】
ステップS703では、ステップS702で作成されたマスク画像をクライアント端末101に送信する。
【0099】
ステップS704では、ステップS703で送信されたマスク画像を受信する。
【0100】
ステップS705では、画素値(255,0,0)または画素値(0,0,0)が存在するかを判定する。すなわち、拡大表示されなかった領域または確認NG表示領域が存在するかを判定する。
【0101】
存在する場合(S705:YES)は、処理をステップS706に移行し、拡大表示確認が不十分な領域や未表示領域が存在する旨のメッセージを表示する。メッセージを表示した画面の一例を図12に示す。
【0102】
なお、図12におけるOKボタンが押下された場合は、処理をステップS707に移行する。
【0103】
存在しない場合(S705:NO)は、処理をステップS707に移行する。
【0104】
ステップS707では、編集対象画像(前の画像または次の画像)を取得し、クライアント端末101に送信する(S708)。そして、クライアント端末101は送信された画像を受信し(S709)、当該画像を表示する。
【0105】
以上のように、現在の画像で確認が不十分な領域等が残っている場合にメッセージを通知することで、検出物体のラベル付けの抜け漏れを防ぐことが可能となる。
【0106】
図8は、各種データテーブルの一例を示す図である。
【0107】
カテゴリラベルは、検出物体のカテゴリ(何であるかを示す情報)が登録されたテーブルである。登録するカテゴリ名は、何を検出する物体検出器を構築するかにより異なるものである。本実施例のように画像に含まれる人物の性別を検出する検出器を構築する場合には、図8の例のように、男性・女性といったカテゴリを登録する。
【0108】
画像テーブルは、ラベル付けを行う元画像が登録されたテーブルである。
【0109】
検出物体矩形は、どの画像のどの領域にどのカテゴリの物体が存在するのかを示す情報が登録されるテーブルである。例えば、ID:1で特定される検出物体矩形は、画像:1.jpgの(14,20,30,50)で特定される領域に男性の顔が存在することを示している。
【0110】
設定テーブルは、本発明の処理に必要な設定値が登録されたテーブルである。これらの設定値についても、どのような物体検出器を構築するか、どのような画像データから物体を検出するか等により、その都度登録されるものである。
【0111】
表示矩形テーブルは、どの画像のどの領域をどの程度の倍率で表示したかを示す情報を管理するテーブルである。
【0112】
図11は、ステップS406で表示される画面の一例である。図11の例では色分けではなく、模様により識別表示している。
【0113】
図11に示す通り、縦縞のマスクがなされた領域(1101)は、確認OK表示領域であり、薄墨色でマスクされた領域(1102)は確認NG表示領域である。それ以外の領域は、拡大表示されていない領域である。
【0114】
以上、情報処理システムとしての実施形態について示したが、本発明は、例えば、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【0115】
また、本発明におけるプログラムは、図3図7に示すフローチャートの処理方法をコンピュータが実行可能なプログラムであり、本発明の記憶媒体は図3図7の処理方法をコンピュータが実行可能なプログラムが記憶されている。なお、本発明におけるプログラムは図3図7の各装置の処理方法ごとのプログラムであってもよい。
【0116】
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。
【0117】
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。
【0118】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。
【0119】
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0120】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0121】
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
【0122】
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
【符号の説明】
【0123】
101 クライアント端末
102 サーバ装置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12