(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-07-12
(45)【発行日】2022-07-21
(54)【発明の名称】情報処理装置、情報処理方法、プログラム
(51)【国際特許分類】
G06F 16/58 20190101AFI20220713BHJP
G06N 20/00 20190101ALI20220713BHJP
G06T 7/00 20170101ALI20220713BHJP
G06Q 10/06 20120101ALI20220713BHJP
【FI】
G06F16/58
G06N20/00 130
G06T7/00 350C
G06Q10/06 332
(21)【出願番号】P 2017229220
(22)【出願日】2017-11-29
【審査請求日】2020-11-30
(73)【特許権者】
【識別番号】390002761
【氏名又は名称】キヤノンマーケティングジャパン株式会社
(73)【特許権者】
【識別番号】592135203
【氏名又は名称】キヤノンITソリューションズ株式会社
(74)【代理人】
【識別番号】100189751
【氏名又は名称】木村 友輔
(72)【発明者】
【氏名】入江 建志
【審査官】早川 学
(56)【参考文献】
【文献】特開2012-249156(JP,A)
【文献】特開2011-203991(JP,A)
【文献】特開2009-211574(JP,A)
【文献】特開2013-008114(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06N 20/00-20/20
G06T 7/00
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
画像データに含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を含むラベル付けを受け付ける受付手段と、
前記受付手段により、ラベル付けを受け付けたときの作業内容を特定する特定手段と、
前記特定手段により特定された作業内容の情報を用いて、前記ラベル付けの精度を示す信頼度を算出する算出手段と、
を備え
、
前記作業内容には、他の画像データに対して受け付けたラベル付けの内容を前記画像データに複写する作業を含み、
前記算出手段は、前記複写する作業が行われることを条件に、信頼度を低下させることを特徴とする情報処理装置。
【請求項2】
画像データに含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を含むラベル付けを受け付ける受付手段と、
前記受付手段により、ラベル付けを受け付けたときの作業内容を特定する特定手段と、
前記特定手段により特定された作業内容の情報を用いて、前記ラベル付けの精度を示す信頼度を算出する算出手段と、
を備え
、
前記作業内容には、前記画像データにおいて、指定を受け付けた検出対象物体の領域の数および指定されたラベルの数の比率を含み、
前記算出手段は、前記比率が他の画像データにおける比率よりも低いことを条件に、信頼度を低下させることを特徴とする情報処理装置。
【請求項3】
画像データに含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を含むラベル付けを受け付ける受付手段と、
前記受付手段により、ラベル付けを受け付けたときの作業内容を特定する特定手段と、
前記特定手段により特定された作業内容の情報を用いて、前記ラベル付けの精度を示す信頼度を算出する算出手段と、
を備え
、
前記作業内容には、前記受付手段によりラベル付けを受け付けたときの前記画像データの拡大倍率を含み、
前記算出手段は、前記拡大倍率が所定の値を示すことを条件に、信頼度を低下させることを特徴とする情報処理装置。
【請求項4】
前記算出手段により算出された信頼度が所定の条件を満たすかを判定する判定手段と、
前記判定手段により所定の条件を満たすと判定されること条件に通知する通知手段と
を備えることを特徴とする請求項1
乃至3のいずれか1項に記載の情報処理装置。
【請求項5】
前記作業内容には、ひとつの検出対象物体に対するラベル付けに要した作業時間を含み、
前記算出手段は、前記作業時間が所定の値を示す場合に、信頼度を低下させることを特徴とする請求項1乃至
4のいずれか1項に記載の情報処理装置。
【請求項6】
前記作業内容には、同一の検出対象物体に対するラベルの指定の変更回数を含み、
前記算出手段は、前記変更回数が所定の値を示す場合に、信頼度を低下させることを特徴とする請求項1乃至
5のいずれか1項に記載の情報処理装置。
【請求項7】
前記作業内容には、前記ラベル付けとは異なる作業を行っていたかを示す情報を含み、
前記算出手段は、前記ラベル付けとは異なる作業を行っていたことを条件に、信頼度を低下させることを特徴とする請求項1乃至
6のいずれか1項に記載の情報処理装置。
【請求項8】
前記作業内容には、前記ラベル付けを行ったときに居眠りをしていたかを示す情報を含み、
前記算出手段は、居眠りをしていたことを条件に、信頼度を低下させることを特徴とする請求項1乃至
7のいずれか1項に記載の情報処理装置。
【請求項9】
情報処理装置の受付手段が、画像データに含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を含むラベル付けを受け付ける受付工程と、
前記情報処理装置の特定手段が、前記受付工程でラベル付けを受け付けたときの作業内容を特定する特定工程と、
前記情報処理装置の算出手段が、前記特定工程で特定された作業内容の情報を用いて、前記ラベル付けの精度を示す信頼度を算出する算出工程と
を備えることを特徴とする情報処理装置の制御方法。
【請求項10】
情報処理装置の受付手段が、画像データに含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を含むラベル付けを受け付ける受付工程と、
前記情報処理装置の特定手段が、前記受付工程でラベル付けを受け付けたときの作業内容を特定する特定工程と、
前記情報処理装置の算出手段が、前記特定工程で特定された作業内容の情報を用いて、前記ラベル付けの精度を示す信頼度を算出する算出工程と、
を備え、
前記作業内容には、前記画像データにおいて、指定を受け付けた検出対象物体の領域の数および指定されたラベルの数の比率を含み、
前記算出工程は、前記比率が他の画像データにおける比率よりも低いことを条件に、信頼度を低下させることを特徴とする情報処理装置の制御方法。
【請求項11】
情報処理装置の受付手段が、画像データに含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を含むラベル付けを受け付ける受付工程と、
前記情報処理装置の特定手段が、前記受付工程でラベル付けを受け付けたときの作業内容を特定する特定工程と、
前記情報処理装置の算出手段が、前記特定工程で特定された作業内容の情報を用いて、前記ラベル付けの精度を示す信頼度を算出する算出工程と、
を備え、
前記作業内容には、前記受付手段によりラベル付けを受け付けたときの前記画像データの拡大倍率を含み、
前記算出工程は、前記拡大倍率が所定の値を示すことを条件に、信頼度を低下させることを特徴とする情報処理装置の制御方法。
【請求項12】
コンピュータを、請求項1乃至8のいずれか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、プログラムに関し、特に検出物体のラベル付けの精度を算出することにより、教師データの品質低下を抑制することが可能な仕組みに関する。
【背景技術】
【0002】
近年、ディープラーニングと呼ばれる機械学習技術を応用した画像認識技術が発展しており、画像に写っている物体(カテゴリ)が何か、またその位置(画像中座標)はどこにあるのか、を検出する手法が数多く提案されている。
【0003】
ディープラーニング技術を用いた物体検出器を構築するためには、大量の画像と教師データ(画像中のどこに、何のカテゴリの物体があるかを示すアノテーションデータ)が必要となる。
【0004】
また、当該教師データの品質も担保される必要があり、教師データの質が低いと、正しく学習が行われず、検出精度の低い物体検出器が構築されてしまう。
【0005】
したがって、1枚の画像に写っている検出対象の物体を精度よくラベル付け(検出対象の物体が写っている領域の指定と、その物体が何であるかの指定)することが、非常に重要となっている。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1には、信頼性の高い人同士の同じ対象へのラベル付けの重複を抑制する技術が開示されている。また、特許文献1には、ラベル付けを行った、人の専門性や国籍、性別等に基づいて信頼度を決めることが開示されている。すなわち、特許文献1に記載の技術では、各ラベルの精度が良いか悪いかを判定するものではないため、必ずしもラベル付された教師データの品質を担保できない恐れがあった。
【0008】
本発明は、検出物体のラベル付けの精度を算出することにより、教師データの品質低下を抑制することが可能な仕組みを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明は、画像データに含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を含むラベル付けを受け付ける受付手段と、前記受付手段により、ラベル付けを受け付けたときの作業内容を特定する特定手段と、前記特定手段により特定された作業内容の情報を用いて、前記ラベル付けの精度を示す信頼度を算出する算出手段とを備えることを特徴とする。
【0010】
また、本発明は、画像データに含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を含むラベル付けを受け付ける受付工程と、前記受付工程でラベル付けを受け付けたときの作業内容を特定する特定工程と、前記特定工程で特定された作業内容の情報を用いて、前記ラベル付けの精度を示す信頼度を算出する算出工程とを備えることを特徴とする。
【0011】
また、本発明は、情報処理装置で読み取り実行可能なプログラムであって、前記情報処理装置を、画像データに含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を含むラベル付けを受け付ける受付手段と、前記受付手段により、ラベル付けを受け付けたときの作業内容を特定する特定手段と、前記特定手段により特定された作業内容の情報を用いて、前記ラベル付けの精度を示す信頼度を算出する算出手段として機能させることを特徴とする。
【発明の効果】
【0012】
本発明によると、検出物体のラベル付けの精度を算出することにより、教師データの品質低下を抑制することができる。
【図面の簡単な説明】
【0013】
【
図1】本発明における情報処理システムの構成の一例を示す図
【
図2】本発明の情報処理装置(クライアント端末101、サーバ装置102)のハードウェア構成の一例を示すブロック図
【
図7】ラベル付けの処理の詳細を示すフローチャートの一例を示す図
【
図8】ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図
【
図9】ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図
【
図10】ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図
【
図11】ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図
【
図12】ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図
【
図13】ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図
【
図14】ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図
【
図15】ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図
【発明を実施するための形態】
【0014】
以下、図面を参照して、本発明の実施形態を詳細に説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載した構成の具体的な実施形態の1つである。
【0015】
図1は、本発明における情報処理システムの構成の一例を示す図である。
図1に示すように、本発明における情報処理システムは、クライアント端末101とサーバ装置102が通信可能に接続された構成となっている。
【0016】
クライアント端末101は、検出物体に対してラベル付け作業をするユーザが利用する端末であり、俯瞰画像や拡大画像等を表示し、ラベル付けの指示を受け付ける。
【0017】
ラベル付け作業は、表示された画像において、検出物体が写っている領域の指定と、当該検出物体が何であるかの指定を受け付ける作業である。なお、本実施形態では、ラベルのことをカテゴリともいう。なお、後述する検出物体矩形とは、検出物体が写っているとして指定された領域を囲む矩形のことである。
【0018】
例えば、
図3に示す画面では、画像に写っている人物の顔が男性であるか女性であるか、およびおおよその年齢(例えば、10代か20代か等)のラベル付けをした例を示している。人間の顔に相当する領域を矩形で囲み、その矩形内の顔が男性であるか女性であるか、およびおおよその年齢のラベル付けを行う。
【0019】
この際、小さく写っている顔は、そのままのサイズだと判別できないため、拡大表示してラベル付けを行う(
図4)。
【0020】
また、クライアント端末101は、信頼度を算出する処理を行う。なお、他の実施形態として、信頼度の算出をサーバ装置102が行うことも可能である。
【0021】
サーバ装置102は、ラベル付けの結果を管理する。
【0022】
クライアント端末101、サーバ装置102が実行する処理の詳細は、
図5以降の図面を用いて後述する。
【0023】
次に、
図2を用いて、
図1に示したクライアント端末101とサーバ装置102に適用可能な情報処理装置のハードウェア構成について説明する。
【0024】
図2において、201はCPUで、システムバス204に接続される各デバイスやコントローラを統括的に制御する。また、ROM202あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、PCの実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。
【0025】
203はRAMで、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ211からRAM203にロードして、ロードしたプログラムを実行することで各種動作を実現するものである。
【0026】
また、205は入力コントローラで、キーボード(KB)209等のポインティングデバイス等からの入力を制御する。206はビデオコントローラで、ディスプレイ210(液晶、ブラウン管を問わない)等の表示器への表示を制御する。
【0027】
207はメモリコントローラで、ブートプログラム、各種のアプリケーション、フォントデータ、ユーザファイル、編集ファイル、各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。
【0028】
208は通信I/Fコントローラで、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。
【0029】
なお、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上での表示を可能としている。また、CPU201は、ディスプレイ210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
【0030】
本発明を実現するための後述する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM203にロードされることによりCPU201によって実行されるものである。さらに、上記プログラムの実行時に用いられる設定ファイル等も外部メモリ211に格納されており、これらについての詳細な説明も後述する。以上で、
図2の説明を終了する。
【0031】
次に
図5~
図15のフローチャート等を用いて、本発明で実行される処理の説明を行う。各フローチャートに示す処理は、クライアント端末101、またはサーバ装置102のCPU201が実行する。
【0032】
まず、
図5について説明する。
図5は、本発明におけるラベル付け処理の一例を示す図である。
【0033】
ステップS501において、クライアント端末101は、ラベル付けを行う作業者から、これからラベル付けを行う画像の選択を受け付ける。
【0034】
ステップS502において、クライアント端末101は、ステップS501で選択を受け付けた画像のラベル付けを
図3に示す画像上で受け付ける。ステップS502の処理の詳細は、後ほど
図7を用いて説明する。
【0035】
ステップS503において、クライアント端末101は、ラベル付けの信頼度を算出する。ステップS503の処理の詳細は、後ほど
図8を用いて説明する。
【0036】
ステップS503は、本発明における、前記特定手段により特定された作業内容の情報を用いて、前記ラベル付けの精度を示す信頼度を算出する算出手段の一例である。
【0037】
ステップS504において、クライアント端末101は、信頼度が0より小さいかを判定する。クライアント端末101は、信頼度が0より小さければ、ステップS505で、作業者に対して見直し要求を行い、信頼度が0以上であれば、本処理を終了する。
【0038】
なお、ラベル付けされた画像データの情報は、クライアント端末101からサーバ装置102に送信され、
図16の「検出物体矩形1600-5」に示すデータテーブルの形式でサーバ装置102の外部メモリ211で管理される。
【0039】
図16の「検出物体矩形1600-5」は、どの画像(画像パス)のどの領域(切り出し画像座標)を切り出し、どのカテゴリに分類したかの情報とともに、作業時の情報、具体的には、どの程度の倍率(拡大倍率)で表示したか、カテゴリを何回変更したか、居眠りをしたか、何かを見ながら(ながら作業)ラベル付け作業を行ったかの情報等、と作業時の情報から算出される信頼度とを管理するデータテーブルである。作業時の情報は、ステップS502のラベル付け処理を実行したときに更新される。
【0040】
なお、本実施形態では、信頼度が0より小さいか否かによって、見直し要求を行うか否かを決定しているが、他の実施形態として、画像の総信頼度(その画像に含まれる検出物体矩形の信頼度の合計)がX点(所定の点)以下の場合に見直し要求を行うとしても良い。
【0041】
ステップS505は、本発明における、前記管理手段で管理する信頼度が所定の条件を満たすことを条件に、当該画像データに対して行われたラベル付けを見直させるべく通知する通知手段の一例である。
【0042】
以上で
図5の説明を終了し、次に
図6の学習処理について説明する。
図6の処理は、任意のタイミングで実行されるものとする。
【0043】
ステップS601において、サーバ装置102は、
図5の処理でラベル付けされた画像データ(学習データ)の中から、学習する画像データを選択し、ステップS602において、学習(機械学習)を実行する。以上で、
図6の説明を終了し、次に、
図7を用いて、
図5のステップS502の処理の詳細について説明する。
【0044】
図7は、ラベル付けの処理の詳細を示すフローチャートの一例を示す図である。
【0045】
ステップS701において、クライアント端末101は、カメラでクライアント端末101を操作する作業者を撮影し、撮影により得られる画像データを既知の技術を用いて解析して、ユーザが居眠りをしていないか(所定時間以上目をつぶっていないか)を検知する。
【0046】
居眠り検知に用いるカメラとしては、例えば、クライアント端末101に内蔵されたカメラや、クライアント端末101と接続するカメラを用いることができる。
【0047】
居眠りを検知した場合、居眠り状態を記録し、「検出物体矩形1600-5」中の、居眠り中に作成された「ID」の「居眠り時作成」の項目が「TRUE」に更新される。
【0048】
なお、何秒以上目をつむっていた場合に居眠りと判断するかは、
図17の減点ルール設定(作業者)1703の「減点ルール名」が「居眠り」の行の「設定値」の欄に記憶されている時間によって決定される。
【0049】
ステップS702において、クライアント端末101は、既知のアプリケーション監視ツールを用いて、ながら作業を行っていないか(例えば、動画サイトの動画をみながらラベル付けを行っていないか)を特定する。
【0050】
ながら作業を検知した場合、ながら状態として記録し、「検出物体矩形1600-5」中の、ながら作業中に作成された「ID」の「ながら作業」の項目が「TRUE」になる。
【0051】
なお、アプリケーションによっては、ながら作業を行ってよい場合もありうるので、
図17の減点ルール設定(作業者)1703の「減点ルール名」が「ながら作業」の行の「設定値」の欄に記憶されているものを見ながら作業を行っている場合に「TRUE」とする。
【0052】
ステップS703において、クライアント端末101は、検出物体矩形のラベル付け(検出物体が写っている領域の指定と、当該検出物体が何であるかの指定を受け付ける作業)を作業者から受け付ける。そして、その結果を「検出物体矩形1600-5」に記憶する。
【0053】
また、このとき画像を拡大してラベル付けを行っている場合には、そのときの拡大倍率を、その拡大倍率においてラベル付けされた「ID」の「拡大倍率」欄に記憶する。
【0054】
ステップS703は、本発明における、画像データに含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を含むラベル付けを受け付ける受付手段の一例である。
【0055】
ステップS704において、クライアント端末101は、
図3に示すラベル付け作業をする画面において、次の画像ボタン302、または前の画像ボタン301がユーザ操作に従って選択されたかを判定する。
【0056】
クライアント端末101は、次の画像ボタン302、または前の画像ボタン301が選択されたならば、本処理を終了し、そうでなければステップS701に処理を戻す。
【0057】
なお、次の画像ボタン302が選択され、
図3に示すラベル付け作業をする画面において、複写チェック303にチェックが入っている場合には、次の画像の編集時に、現在の画像の検出物体矩形をすべてコピーする。検出物体矩形をコピーした場合には、
図16の「画像1600-4」の対象画像の「ID」と同一の行の「複写元画像」の欄に、複写元となった画像のパスが記憶される。
【0058】
複写が有効な場合とは、例えば、時系列の画像にラベル付けする場合であって、時系列的に前後の画像で、大きく矩形の変化がない場合である。より具体的には、植物の花のラベル付け(桜の枝についているのが、つぼみであるか、開花しているかのラベル付け)等の場合に、1つずつラベル付けするよりも、一旦前の画像の検出物体矩形をコピーして、変更すべき検出物体矩形だけを変更するほうが効率的である。
【0059】
また、ステップS501で作業者から画像の選択を受け付けた時間は、画像1604-4中の当該画像の「編集開始時刻」に記憶され、ステップS704で、次の画像ボタン302、または前の画像ボタン301が選択された時間は、画像1604-4中の当該画像の「編集終了時刻」に記憶される。
【0060】
ステップS501、ステップS701~ステップS704、後述するステップS1106は、後述するステップS1304は、本発明における、前記受付手段により、ラベル付けを受け付けたときの作業内容を特定する特定手段の一例である。
【0061】
以上で
図7の説明を終了する。次に、
図8を用いて、
図5のステップS503の処理の詳細について説明する。
図8は、ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図である。
【0062】
ステップS801において、クライアント端末101は、
図5のステップS502でラベル付けされた画像を、信頼度を算出する対象の画像(以下、「対象画像」とも称す)として取得する。
【0063】
ステップS802において、クライアント端末101は、
図5のステップS501では、対象画像に該当する検出物体矩形群を取得する。例えば、対象画像が「1.jpg」の場合、
図16に示す検出物体矩形1600-5のうち、画像パスが「/image/1.jpg」となっているIDが1~3の3つの検出物体矩形矩形が取得される。
【0064】
ステップS803において、クライアント端末101は、ステップS802で取得した検出物体矩形群の検出物体矩形1600-5の「信頼度」を0に初期化する。
【0065】
ステップS804において、クライアント端末101は、複写チェックによる信頼度計算を行う。ステップS804の処理の詳細は、
図9を用いて後ほど説明する。
【0066】
ステップS805において、クライアント端末101は、作業時間による信頼度計算を行う。ステップS805の処理の詳細は、
図10を用いて後ほど説明する。
【0067】
ステップS806において、クライアント端末101は、カテゴリ・矩形個数比率による信頼度計算を行う。ステップS806の処理の詳細は、
図11を用いて後ほど説明する。
【0068】
ステップS807において、クライアント端末101は、拡大倍率による信頼度計算を行う。ステップS807の処理の詳細は、
図12を用いて後ほど説明する。
【0069】
ステップS808において、クライアント端末101は、カテゴリ変更回数による信頼度計算を行う。ステップS808の処理の詳細は、
図13を用いて後ほど説明する。
【0070】
ステップS809において、クライアント端末101は、ながら作業による信頼度計算を行う。ステップS809の処理の詳細は、
図14を用いて後ほど説明する。
【0071】
ステップS810において、クライアント端末101は、居眠り検知による信頼度計算を行う。ステップS810の処理の詳細は、
図15を用いて後ほど説明する。
【0072】
以上で
図8の説明を終了する。次に、
図9を用いて、
図8のステップS804の処理の詳細について説明する。
図9は、ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図である。
【0073】
図9の処理では、検出物体矩形が複写で作られているとき、複写元からコピーしたまま一切編集していなければ減点する。
【0074】
ステップS901において、クライアント端末101は、複写チェックルールが有効か、無効かを、
図17の減点ルール(アノテーション)1700の「減点ルール名」が「複写チェック」の行の「有効」の欄を参照することにより、判定する。
【0075】
複写チェックルールが有効ならばステップS902に処理を移行し、複写チェックルールが無効ならば本処理を終了する。
【0076】
なお、本発明においては、複写チェックルールが有効か、無効かは、管理者があらかじめ設定するものとする。
【0077】
ステップS902において、クライアント端末101は、複写チェックルールの減点数を、
図17の減点ルール(アノテーション)1700の「減点ルール名」が「複写チェック」の行の「減点」の欄を参照することにより特定する。
【0078】
ステップS903において、クライアント端末101は、対象画像の複写元画像が存在するかを、
図16の「画像1600-4」の対象画像の「ID」と同一の行の「複写元画像」の欄に、複写元となった画像のパスが記憶されているかにより判定する(記憶されている場合には「YES」と判断)。クライアント端末101は、複写元画像が存在するならば、ステップS904に処理を移行し、複写元画像が存在しなければ本処理を終了する。
【0079】
ステップS904において、クライアント端末101は、複写元画像を取得する。
【0080】
ステップS905において、クライアント端末101は、複写元画像に該当する検出物体矩形群を取得する。例えば、複写元画像が「2.jpg」の場合、
図16に示す検出物体矩形1600-5のうち、画像パスが「/image/2.jpg」となっている「ID」が「4」の検出物体矩形が取得される。
【0081】
次に、クライアント端末101は、対象画像と複写元画像の検出物体矩形ごとにステップS906の処理を繰り返す。
【0082】
ステップS906において、クライアント端末101は、対象画像の検出物体矩形について、「検出物体矩形1600-5」中の「切り出し画像座標」、「カテゴリ名」が、複写元画像の検出物体矩形の「切り出し画像座標」、「カテゴリ名」と同じであるかを判定する。同じである場合、クライアント端末101は、同じであった対象画像の検出物体矩形ごとに、ステップS907の処理を実行し、同じでない場合には、本処理を終了する。
【0083】
ステップS907において、クライアント端末101は、対象画像の検出物体矩形について、「検出物体矩形1600-5」中の「信頼度」を、ステップS902で取得した点数分減点する。
【0084】
以上で
図9の説明を終了する。次に、
図10を用いて、
図8のステップS805の処理の詳細について説明する。
図10は、ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図である。
【0085】
図10の処理では、全画像の平均作業時間(μ)と、標準偏差(σ)を計算し、作業時間<μ-2xσの画像の検出物体矩形は減点する。
【0086】
ステップS1001において、クライアント端末101は、作業時間ルールが有効か、無効かを
図17の減点ルール(アノテーション)1700の「減点ルール名」が「作業時間」の行の「有効」の欄を参照することにより、判定する。
【0087】
作業時間ルールが有効ならばステップS902に処理を移行し、作業時間ルールが無効ならば本処理を終了する。
【0088】
なお、本発明においては、作業時間ルールが有効か、無効かは、管理者があらかじめ設定するものとする。
【0089】
ステップS1002において、クライアント端末101は、作業時間ルールの減点数を、
図17の減点ルール(アノテーション)1700の「減点ルール名」が「作業時間」の行の「減点」の欄を参照することにより取得する。
【0090】
ステップS1003において、クライアント端末101は、ラベル付けが完了している画像の枚数(
図16の画像1600-4で管理されている画像の数)が、必要サンプル数より多いかを判定する。クライアント端末101は、ラベル付けが完了している画像の枚数が、必要サンプル数より多ければ、ステップS1004に処理を移行し、少なければ、本処理を終了する。必要サンプル数は、限定ルール設定(アノテーション)1701中の「限定ルール名」が「作業時間」で「設定名」が「必要サンプル数」となっている行の「設定値」の値を用いる。
【0091】
ステップS1003の処理を実行する理由は、後述するステップS1004~ステップS1006の処理を実行するためには、ある程度のサンプル数が必要なためである。
【0092】
ステップS1004において、クライアント端末101は、ラベル付け済みの各画像について、作業時間の平均を計算する。作業時間は、
図16の画像1600-4の「編集終了時刻」から「編集開始時刻」を引くことにより求められる。
【0093】
ステップS1005において、クライアント端末101は、ラベル付けが完了している画像の枚数の情報と、作業時間の情報、作業時間の平均の情報をもとに、標準偏差を計算する。
【0094】
ステップS1006において、クライアント端末101は、対象画像の作業時間の値が、作業時間の平均―2x標準偏差より小さいかを判定する。小さければ、クライアント端末101は、対象画像の検出物体矩形ごとに、ステップS1007の処理を実行し、大きければ本処理を終了する。
【0095】
ステップS1007において、クライアント端末101は、対象画像の検出物体矩形について、「検出物体矩形1600-5」中の「信頼度」を、ステップS1002で取得した点数分減点する。
【0096】
以上で
図10の説明を終了する。次に、
図11を用いて、
図8のステップS806の処理の詳細について説明する。
図11は、ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図である。
【0097】
図11は、画像同士のカテゴリ・個数比率が近傍の画像と似ていないものが多い時、減点する処理である。「似ていない」はカテゴリごとの個数列をベクトルとし、ベクトル間のコサイン類似度で定義される。
【0098】
ステップS1101において、クライアント端末101は、カテゴリ・個数比率ルールが有効か、無効かを、
図17の減点ルール(アノテーション)1700の「減点ルール名」が「カテゴリ・個数比率」の行の「有効」の欄を参照することにより、判定する。
【0099】
カテゴリ・個数比率ルールが有効ならばステップS902に処理を移行し、カテゴリ・個数比率ルールが無効ならば本処理を終了する。
【0100】
なお、本発明においては、カテゴリ・個数比率ルールが有効か、無効かは、管理者があらかじめ設定するものとする。
【0101】
カテゴリ・個数比率ルールを有効とすべき場合とは、例えば、時系列の画像にラベル付けする場合であって、時系列的に前後の画像で、大きく矩形の変化がない場合である。より具体的には、植物の花のラベル付け(桜の枝についているのが、つぼみであるか、開花しているかのラベル付け)等の場合である。
【0102】
ステップS1102において、クライアント端末101は、カテゴリ・個数比率ルールの減点数を、
図17の減点ルール(アノテーション)1700の「減点ルール名」が「カテゴリ・個数比率」の行の「減点」の欄を参照することにより取得する。
【0103】
ステップS1103において、クライアント端末101は、カテゴリ・個数比率ルールの設定値を、
図17の減点ルール設定(アノテーション)1701の「減点ルール名」が「カテゴリ・個数比率」で「設定名」が「カテゴリ個数比率の類似度閾値」、「カテゴリ個数比率の基準個数」となっている行の「設定値」の欄を参照することにより取得する。
【0104】
ステップS1104において、クライアント端末101は、対象画像の近傍8画像を取得する。
【0105】
近傍8画像とは、
図19に示すイメージ図の(1)~(8)に示すとおり、対象画像のt-1、t+1の画像と、撮影場所が対象画像の隣で、撮影時刻がt-1、t、t+1の画像である。
【0106】
なお、本実施形態では近傍8画像としたが、他の実施形態として、近傍2画像(
図19の(4)と(5)、または(2)と(7))でも良い。
【0107】
ステップS1105において、クライアント端末101は、類似度が低い近傍画像数iを0で初期化し、以下ステップS1106~ステップS1108の処理を近傍8画像ごとに実行する。
【0108】
ステップS1106において、クライアント端末101は、対象画像と近傍画像のコサイン類似度を計算する。
【0109】
例えば、カテゴリ1~5があり、対象画像がそれぞれ2、5、10、1、0個の検出物体矩形を持ち、近傍画像(1)がそれぞれ1、3、7、1、5個の検出物体矩形を持つ時を考える。コサイン類似度を計算する元になるベクトルは、
対象画像:(2,5,10,1,0)
近傍画像(1):(1,3,7,1,5)
となり、ベクトル同士のコサイン類似度を計算できる。コサイン類似度は-1~1の範囲をとり、大きいほど似ていることを表すため、カテゴリごとの個数比率が大きく異なる場合、類似度は低くなる。上記例では、コサイン類似度は0.837になる。
【0110】
ステップS1107において、クライアント端末101は、ステップS1106で計算したコサイン類似度が、ステップS1103で取得した「カテゴリ個数比率の類似度閾値」、の行の「設定値」の値より小さいかを判定する。小さい場合には、ステップS1108において、iに1を加算する。
【0111】
ステップS1109において、クライアント端末101は、ステップS1103で取得した「カテゴリ個数比率の基準個数」の行の「設定値」の値が、ステップS1108までの処理を近傍8画像ごとに繰り返した後のiの値より小さいかを判定する。小さい場合には、対象画像の検出物体矩形ごとに、ステップS1110の処理を実行し、大きければ本処理を終了する。
【0112】
ステップS1110において、クライアント端末101は、対象画像の検出物体矩形について、「検出物体矩形1600-5」中の「信頼度」を、ステップS1102で取得した点数分減点する。
【0113】
以上で
図11の説明を終了する。次に、
図12を用いて、
図8のステップS807の処理の詳細について説明する。
図12は、ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図である。
【0114】
図12の処理では、ラベル付け時の拡大倍率が他のもの比べて小さい検出物体矩形の信頼度を減点する。
【0115】
ステップS1201において、クライアント端末101は、拡大倍率ルールが有効か、無効かを、
図17の減点ルール(アノテーション)1700の「減点ルール名」が「拡大倍率」の行の「有効」の欄を参照することにより、判定する。
【0116】
拡大倍率ルールが有効ならばステップS902に処理を移行し、拡大倍率ルールが無効ならば本処理を終了する。
【0117】
なお、本発明においては、拡大倍率ルールが有効か、無効かは、管理者があらかじめ設定するものとする。
【0118】
ステップS1202において、クライアント端末101は、拡大倍率ルールの減点数を、
図17の減点ルール(アノテーション)1700の「減点ルール名」が「拡大倍率」の行の「減点」の欄を参照することにより特定する。
【0119】
ステップS1203において、クライアント端末101は、拡大倍率ルールの設定値を、
図17の減点ルール設定(アノテーション)1701の「減点ルール名」が「拡大倍率」で「設定名」が「倍率減点基準」となっている行の「設定値」の欄を参照することにより取得する。
【0120】
ステップS1204において、クライアント端末101は、検出物体矩形群の拡大倍率の中央値を計算する。各検出物体矩形群の拡大倍率は、「検出物体矩形1600-5」中の「拡大倍率」を参照することにより特定される。
【0121】
ステップS1204の処理を終了すると、検出物体矩形ごとにステップS1205~ステップS1206の処理を繰り返す。
【0122】
ステップS1205において、クライアント端末101は、(ステップS1204で計算した)中央値*(ステップS1203で取得した)設定値の値が拡大倍率より大きいかを判定する。例えば、設定値「0.5」、中央値「4」のとき、4の半分の2より小さい倍率でラベル付けされたものを減点する。判定に平均値ではなく中央値を用いるのは、平均値を使用する場合、外れ値が存在すると判定が大きくぶれてしまうためである。
【0123】
大きい場合には、クライアント端末101は、ステップS1206に処理を移行する。
【0124】
ステップS1206において、クライアント端末101は、対象画像の検出物体矩形について、「検出物体矩形1600-5」中の「信頼度」を、ステップS1202で取得した点数分減点する。
【0125】
以上で
図12の説明を終了する。次に、
図13を用いて、
図8のステップS808の処理の詳細について説明する。
図13は、ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図である。
【0126】
図13の処理では、カテゴリ変更数が設定値を上回っている場合に、ラベル付けに迷った、あるいはラベル付けの難易度が高い検出物体矩形として、信頼度を減点する。
【0127】
ステップS1301において、クライアント端末101は、カテゴリ変更数ルールが有効か、無効かを
図17の減点ルール(アノテーション)1700の「減点ルール名」が「カテゴリ変更数」の行の「有効」の欄を参照することにより、判定する。
【0128】
カテゴリ変更数ルールが有効ならばステップS1302に処理を移行し、カテゴリ変更数ルールが無効ならば本処理を終了する。
【0129】
なお、本発明においては、カテゴリ変更数ルールが有効か、無効かは、管理者があらかじめ設定するものとする。
【0130】
ステップS1302において、クライアント端末101は、カテゴリ変更数ルールの減点数を、
図17の減点ルール(アノテーション)1700の「減点ルール名」が「カテゴリ変更数」の行の「減点」の欄を参照することにより取得する。
【0131】
ステップS1303において、クライアント端末101は、カテゴリ変更数ルールの設定値を、
図17の減点ルール設定(アノテーション)1701の「カテゴリ変更数」で「設定名」が「カテゴリ変更数」となっている行の「設定値」の欄を参照することにより取得する。
【0132】
ステップS1303の処理を終了すると、検出物体矩形ごとにステップS1304~ステップS1305の処理を繰り返す。
【0133】
ステップS1304において、クライアント端末101は、検出物体矩形のカテゴリ変更数が設定値より大きいかを判定する。大きい場合には、クライアント端末101は、ステップS1305に処理を移行する。
【0134】
カテゴリ変更数は、「検出物体矩形1600-5」中の「カテゴリ変更数」を、参照することにより特定される。
【0135】
ステップS1305において、クライアント端末101は、対象画像の検出物体矩形について、「検出物体矩形1600-5」中の「信頼度」を、ステップS1302で取得した点数分減点する。
【0136】
以上で
図13の説明を終了する。次に、
図14を用いて、
図8のステップS809の処理の詳細について説明する。
図14は、ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図である。
【0137】
図14の処理では、ながら作業でラベル付けされた検出物体矩形の信頼度を減点する。
【0138】
ステップS1401において、クライアント端末101は、ながら作業ルールが有効か、無効かを
図17の減点ルール(作業者)1702の「減点ルール名」が「ながら作業」の行の「有効」の欄を参照することにより、判定する。
【0139】
カテゴリ変更数ルールが有効ならばステップS1402に処理を移行し、カテゴリ変更数ルールが無効ならば本処理を終了する。
【0140】
なお、本発明においては、ながら作業ルールが有効か、無効かは、管理者があらかじめ設定するものとする。
【0141】
ステップS1402において、クライアント端末101は、ながら作業ルールの減点数を、
図17の減点ルール(作業者)1702の「減点ルール名」が「ながら作業」の行の「減点」の欄を参照することにより取得する。
【0142】
ステップS1402の処理を終了すると、検出物体矩形ごとにステップS1403~ステップS1404の処理を繰り返す。
【0143】
ステップS1403において、クライアント端末101は、作業者がながら作業を行っていたかを判定する。ながら作業を行っている場合には、クライアント端末101は、ステップS1404に処理を移行し、ながら作業を行っていなければ、本処理を終了する。
【0144】
ながら作業を行っていたかは、「検出物体矩形1600-5」中の「ながら作業」を、参照することにより特定される。
【0145】
ステップS1404において、クライアント端末101は、対象画像の検出物体矩形について、「検出物体矩形1600-5」中の「信頼度」を、ステップS1402で取得した点数分減点する。
【0146】
以上で
図14の説明を終了する。次に、
図15を用いて、
図8のステップS810の処理の詳細について説明する。
図15は、ラベル付けの信頼度を算出する処理を示すフローチャートの一例を示す図である。
【0147】
図15の処理では、居眠りをしながらラベル付けされた検出物体矩形の信頼度を減点する。
【0148】
ステップS1501において、クライアント端末101は、居眠りルールが有効か、無効かを
図17の減点ルール(作業者)1702の「減点ルール名」が「居眠り」の行の「有効」の欄を参照することにより、判定する。
【0149】
居眠りルールが有効ならばステップS1702に処理を移行し、居眠りルールが無効ならば本処理を終了する。
【0150】
なお、本発明においては、居眠りルールが有効か、無効かは、管理者があらかじめ設定するものとする。
【0151】
ステップS1502において、クライアント端末101は、居眠りルールの減点数を、
図17の減点ルール(作業者)1702の「減点ルール名」が「居眠り」の行の「減点」の欄を参照することにより取得する。
【0152】
ステップS1502の処理を終了すると、検出物体矩形ごとにステップS1503~ステップS1504の処理を繰り返す。
【0153】
ステップS1503において、クライアント端末101は、作業者が居眠りしながらラベル付けを行っていたかを判定する。居眠りしながらラベル付けを行っている場合には、クライアント端末101は、ステップS1504に処理を移行し、居眠りしながらラベル付けを行っていなければ、本処理を終了する。
【0154】
居眠りしながらラベル付けを行ってたかは、「検出物体矩形1600-5」中の「居眠り時作業」を、参照することにより特定される。
【0155】
ステップS1504において、クライアント端末101は、対象画像の検出物体矩形について、「検出物体矩形1600-5」中の「信頼度」を、ステップS1502で取得した点数分減点する。
【0156】
以上で
図15の説明を終了する。次に、
図18を用いて、ステップS505における見直し要求の処理において、クライアント端末101のディスプレイ210に表示される画面について説明する。
図18は、見直し要求通知画面の一例を示す図である。
【0157】
図18の各画面には、ステップS504の処理でYESと判定された対象の画像が表示されるとともに、見直し要求を示す通知(
図18の1801、1802)が表示される。
【0158】
1801の表示がされた場合には、OKボタンを作業者が選択すれば終了するが、1802の表示がされた場合には、各検出物体矩形を作業者が1つ1つ選択し、すべて選択しなければOKボタンが選択できず、終了できない。
【0159】
1801と1802のいずれの通知がなされるかは、どういう理由(作業内容)で信頼度が減点されたかによって変わる。より具体的には、減点ルール(アノテーション)1700のルールにより減点された場合には、1801の表示がされ、減点ルール(作業者)1702のルールにより減点された場合には、1802の表示がされる。
【0160】
すなわち、居眠りやながら作業のように、ラベル付け作業に集中していないような場合には、ラベル付けの精度が非常に低い恐れがあるため、1つ1つ選択させることで再確認させる。一方、減点ルール(アノテーション)1700のルールにより減点される場合は、必ずしもラベル付けの精度が悪いとは限らないため、簡単な確認だけさせることで作業者の作業効率の低下を抑制する。
【0161】
図18の1801、1802の通知を行うことにより、ユーザのラベル付けの精度低下を抑制することが可能となる。
【0162】
また、本実施形態では、同一作業者に対して、1801、および1802の通知をするが、他の実施形態として、減点ルール(アノテーション)1700のルールにより減点された場合には、1801の通知を同一作業者に対して行い、減点ルール(作業者)1702のルールにより減点された場合には、他の作業者に対して1802の通知を行い、他の作業者に改めて確認させることも可能である。
【0163】
他の作業者として、どの作業者を選択するかは、例えば、直近1週間のラベル付け作業の減点が少ない作業者を選択する方法や、減点された作業者の上司を選択する方法がある。そうすることで、よりラベル付けの精度を向上させることが可能となる。以上で
図18の説明を終了する。
【0164】
次に、
図16、
図17を用いて各種データテーブルについて説明する。
【0165】
【0166】
カテゴリラベル1600-1は、検出物体のカテゴリ(何であるかを示す情報)が登録されたテーブルである。登録するカテゴリ名は、何を検出する物体検出器を構築するかにより異なるものである。本実施例のように画像に含まれる人物の性別および年代を検出する検出器を構築する場合には、
図8の例のように、男性・女性、10代・20代といったカテゴリを登録する。
【0167】
撮影場所1600-2は、各画像が撮影される場所の情報が管理するテーブルである。
【0168】
表示矩形1600-3は、どの画像のどの領域をどの程度の倍率で表示したかを示す情報を管理するテーブルである。
【0169】
画像1600―4は、ラベル付けを行う元画像を管理するテーブルである。
【0170】
検出物体矩形1600-5は、どの画像のどの領域にどのカテゴリの物体が存在するのかを示す情報と、作業時の情報とが登録されるテーブルである。例えば、ID:1で特定される検出物体矩形は、画像:1.jpgの(14,20,30,50)で特定される領域に20代の男性の顔が存在し、1倍の拡大倍率でラベル付けがなされ、1度カテゴリが変更され、居眠りはしておらず、ながら作業も行っておらず、信頼度が1点減点されていることを示す。
【0171】
検出物体矩形1600-5は、本発明にける、画像データに含まれる検出対象物体の領域の指定および当該検出対象物体に対するラベルの指定を含むラベル付けがされた画像データと、当該ラベル付けの精度を示す信頼度とを管理する管理手段の一例である。
【0172】
減点ルール(アノテーション)1700、減点ルール(作業者)1702は、本発明の処理に必要な減点ルールやその減点数、およびそのルールが有効となっているかが登録されたテーブルである。
【0173】
減点ルール設定(アノテーション)1701、減点ルール設定(作業者)1703は、本発明の処理に必要な設定値が登録されたテーブルである。以上で
図16、
図17の説明を終了する。
【0174】
以上、本発明によると、検出物体のラベル付けの精度を算出することにより、教師データの品質低下を抑制することができる。
【0175】
本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、1つの機器からなる装置に適用してもよい。
【0176】
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接、或いは遠隔から供給するものを含む。そして、そのシステム或いは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。
【0177】
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
【0178】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
【0179】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD-ROM、CD-R、CD-RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD-ROM,DVD-R)などもある。
【0180】
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
【0181】
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
【0182】
また、本発明のプログラムを暗号化してCD-ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0183】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
【0184】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。
【0185】
なお、前述した実施形態は、本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
【符号の説明】
【0186】
101 クライアント端末
102 サーバ装置