IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特許7197971情報処理装置、情報処理装置の制御方法及びプログラム
<>
  • 特許-情報処理装置、情報処理装置の制御方法及びプログラム 図1
  • 特許-情報処理装置、情報処理装置の制御方法及びプログラム 図2
  • 特許-情報処理装置、情報処理装置の制御方法及びプログラム 図3
  • 特許-情報処理装置、情報処理装置の制御方法及びプログラム 図4
  • 特許-情報処理装置、情報処理装置の制御方法及びプログラム 図5
  • 特許-情報処理装置、情報処理装置の制御方法及びプログラム 図6
  • 特許-情報処理装置、情報処理装置の制御方法及びプログラム 図7
  • 特許-情報処理装置、情報処理装置の制御方法及びプログラム 図8
  • 特許-情報処理装置、情報処理装置の制御方法及びプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-20
(45)【発行日】2022-12-28
(54)【発明の名称】情報処理装置、情報処理装置の制御方法及びプログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20221221BHJP
【FI】
G06T7/00 350C
【請求項の数】 12
(21)【出願番号】P 2017167662
(22)【出願日】2017-08-31
(65)【公開番号】P2019046095
(43)【公開日】2019-03-22
【審査請求日】2020-08-26
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】降籏 久義
(72)【発明者】
【氏名】小林 一彦
【審査官】山田 辰美
(56)【参考文献】
【文献】国際公開第2017/073373(WO,A1)
【文献】特開2017-076287(JP,A)
【文献】特開平07-088791(JP,A)
【文献】特開2015-164035(JP,A)
【文献】特開2016-103094(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00-7/90
(57)【特許請求の範囲】
【請求項1】
画像中の対象物体に設定された、前記対象物体が存在する前記画像中の位置に関するラベル情報を保持する保持手段と、
前記ラベル情報が、前記対象物体が存在する前記画像中の位置に設定されているかの正確さの度合いを示す信頼度を取得する取得手段と、
前記信頼度が所定値以下である場合に、前記ラベル情報によって示される前記画像中の位置と当該ラベル情報に対応する画像とを表示装置に表示させる表示制御手段と、
前記表示装置に対するユーザの操作を受け付ける受付手段と、
前記操作に基づいて前記表示装置に表示されたラベル情報によって示される前記画像中の位置を修正する修正手段と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記ラベル情報が示す前記画像中の位置に前記対象物体が存在する確率を算出することにより前記対象物体を認識する認識手段をさらに備え、
前記取得手段は、前記認識手段による認識結果に基づいて信頼度を取得することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記取得手段は、前記ラベル情報に基づいて前記対象物体の形状を表すモデルを前記画像上に投影し、投影された前記モデルと前記画像との差に基づいて信頼度を取得することを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記画像は距離画像であり、
前記取得手段は、前記距離画像の距離情報に基づいて前記ラベル情報の信頼度を取得することを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記ラベル情報は、前記画像中の任意の位置における前記対象物体の存在の有無を示す情報を含むことを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
【請求項6】
前記ラベル情報は、前記画像中の任意の位置における前記対象物体の存在の有無を示す情報と、前記位置における前記対象物体の姿勢の情報とを含むことを特徴とする請求項1乃至4の何れか1項に記載の情報処理装置。
【請求項7】
前記表示制御手段は、前記ラベル情報に含まれる位置及び姿勢の情報に基づいて、前記画像上に前記対象物体の形状を表すモデルを表示することを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記ラベル情報は、前記対象物体のうち把持対象部分の情報であることを特徴とする請求項1乃至7の何れか1項に記載の情報処理装置。
【請求項9】
前記表示制御手段は、前記信頼度が所定値以下である場合に、前記ラベル情報によって示される前記画像中の位置と当該ラベル情報に対応し前記画像から前記位置を含むように切り出した部分画像とを表示させることを特徴とする請求項1乃至8の何れか1項に記載の情報処理装置。
【請求項10】
前記表示制御手段は、各ラベル情報に対応する画像上の各部位が1つの画像中に複数含まれる場合、1つの画像全体を表示すると共に、前記信頼度が所定値以下であるラベル情報に対応する画像上の部位を強調して表示させることを特徴とする請求項1乃至9の何れか1項に記載の情報処理装置。
【請求項11】
画像中の対象物体に設定された、前記対象物体が存在する前記画像中の位置に関するラベル情報を保持する保持手段を備える情報処理装置の制御方法であって、
前記ラベル情報が、前記対象物体が存在する前記画像中の位置に設定されているかの正確さの度合いを示す信頼度を取得する取得工程と、
前記信頼度が所定値以下である場合に、前記ラベル情報によって示される前記画像中の位置と当該ラベル情報に対応する画像とを表示装置に表示させる表示制御工程と、
前記表示装置に対するユーザの操作を受け付ける受付工程と、
前記操作に基づいて前記表示装置に表示されたラベル情報によって示される前記画像中の位置を修正する修正工程と、
を有することを特徴とする情報処理装置の制御方法。
【請求項12】
コンピュータを、請求項1乃至10の何れか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理装置の制御方法及びプログラムに関し、特に、画像上の物体を認識する技術に関する。
【背景技術】
【0002】
物体を撮影した画像からパターンを学習し、物体の種類や位置姿勢を認識する手法が知られている。パターンの学習を行うには、人が画像に対して正解値を示すラベルを設定する必要がある。画像とラベルのデータを学習データと呼ぶ。
【0003】
精度の高い認識器を作るためには、学習データを大量に用意する必要がある。特許文献1では、「人がラベルを付ける操作」と「認識器の精度を評価する操作」とを所望の精度に達するまで繰り返すことで、十分な精度が確保された学習データを取得する方法が記載されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特許第5953151号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、人が設定するラベル情報には、誤りが含まれる可能性がある。特許文献1に記載の技術では、誤ったラベル情報を含む学習データを利用してパターンの学習を行うと、認識器の精度が低下するという課題がある。
【0006】
本発明は、上記の課題に鑑みてなされたものであり、対象物体に対して設定されたラベル情報を修正できるようにし、ユーザが学習データを効率的に見直すことを可能にする技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記の目的を達成する本発明に係る情報処理装置は、
画像中の対象物体に設定された、前記対象物体が存在する前記画像中の位置に関するラベル情報を保持する保持手段と、
前記ラベル情報が、前記対象物体が存在する前記画像中の位置に設定されているかの正確さの度合いを示す信頼度を取得する取得手段と、
前記信頼度が所定値以下である場合に、前記ラベル情報によって示される前記画像中の位置と当該ラベル情報に対応する画像とを表示装置に表示させる表示制御手段と、
前記表示装置に対するユーザの操作を受け付ける受付手段と、
前記操作に基づいて前記表示装置に表示されたラベル情報によって示される前記画像中の位置を修正する修正手段と、
を備えることを特徴とする。
【発明の効果】
【0008】
本発明によれば、対象物体に対して設定されたラベル情報を修正できるようになり、ユーザが学習データを効率的に見直すことが可能となる。
【図面の簡単な説明】
【0009】
図1】第1の実施形態における、画像とラベル情報の例を示す図である。
図2】第1の実施形態における、情報処理装置の構成を示す図である。
図3】第1の実施形態における、情報処理装置の処理を示すフローチャートである。
図4】第1の実施形態における、信頼度取得部の処理を示すフローチャートである。
図5】第1の実施形態における、信頼度の低いラベル情報と画像とを表示した例を示す図である。
図6】第2の実施形態における、画像とラベル情報の例を示す図である。
図7】第2の実施形態における、信頼度の低いラベル情報と画像とを表示した例を示す図である。
図8】第1の変形例における、対象物体の形状を表すモデルを表示した例を示す図である。
図9】第2の変形例における、信頼度の低いラベル情報と画像とを表示するバリエーションの例を示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら実施形態を説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
【0011】
(第1の実施形態)
<概要>
本実施形態では、学習データのラベル情報に誤りが含まれる可能性を考慮し、ユーザが学習データを効率的に見直すことを可能にする例を説明する。
【0012】
本実施形態では、画像上の任意の位置における対象物体の存在に関するラベル情報を設定する。図1(a)は撮影した画像の例である。図1(a)において、符号110と111と112で示す直方体の物体はラベル情報を設定すべき対象物体である。一方、符号120で示す円柱の物体はラベル情報を設定すべきでない非対象物体である。図1(b)はユーザがラベル情報を設定した例である。図1(b)の130と131とは対象物体が存在する位置にラベル情報を設定した例である。ここでは、ラベル情報を設定した位置を黒点で表現している。132と133は誤って対象物体が存在しない位置にラベル情報を設定した例である。140は対象物体が存在するにもかかわらず、ラベル情報を設定しなかった例である。
【0013】
ユーザがラベルを設定する場合、図1(b)の例のようにラベル情報の設定に誤りが発生する可能性がある。そこで、本実施形態では、ラベル情報の信頼度を算出し、その信頼度が低い場合(所定値以下である場合)に画像とラベル情報とを選択して表示する。これにより、効率的なラベル情報の見直しを可能にする。
【0014】
<システム構成>
まず、図2を参照して、本実施形態のシステム構成について説明する。図2の200は本実施形態の情報処理装置であり、300は画像を撮影する撮影装置である。400は画像情報を表示する表示装置であり、500はユーザが操作する操作装置である。情報処理装置200は、画像取得部210と、ラベル情報保持部220と、信頼度取得部230と、表示制御部240と、操作受付部250と、ラベル情報修正部260とを備える。
【0015】
撮影装置300は、画像を撮影するカメラである。本実施形態では、画像は濃淡画像であるものとするが、濃淡画像に限定されない。表示装置400は、画像を表示するモニタである。本実施形態では、表示制御部240による制御下で、画像取得部210で取得した画像とラベル情報保持部220で保持するラベル情報とを表示する。操作装置500は、ユーザが操作するデバイスである。本実施形態では、マウスとするが、キーボードでもよいし、タッチパネルでもよい。
【0016】
<装置構成>
続いて、情報処理装置200の構成要素について詳述する。画像取得部210は、撮影装置300により撮影された画像を取得する。本実施形態では、取得する画像の枚数は1枚または複数枚である。
【0017】
ラベル情報保持部220は、画像取得部210により取得された各画像に対して設定されたラベル情報を保持する。本実施形態におけるラベル情報は、画像中の任意の位置における対象物体の存在に関する情報であり、画像上の各位置に対象物体が存在するかどうかの情報である。具体的には、対象物体が存在する場合は1、存在しない場合は0の情報を保持する。ラベル情報は、対象物体の存在する位置にはユーザが1のラベルを設定するものとし、それ以外の位置には0のラベルが設定されているとする。また、ラベルは、位置の情報を保持する。位置は画像上での2次元座標の値とする。
【0018】
信頼度取得部230は、ラベル情報保持部220により保持される各ラベル情報について、正確さの度合いを示す信頼度を取得する。信頼度の算出方法の詳細は後述する。認識部235は、画像上で指定された位置に対象物体が存在するかを認識し、存在する確率を算出して出力する。本実施形態では、対象物体が存在する確率をニューラルネットワークに基づく認識器を使って計算するものとする。なお、対象物体が存在する画像と存在しない画像とを利用して学習を行うことで、画像上に対象物体が存在するかを認識する認識器を構築することができる。また、認識部235は情報処理装置200の外部にあってもよい。
【0019】
表示制御部240は、信頼度取得部230により算出された信頼度に基づいて、画像取得部210により取得された画像と、ラベル情報保持部220により保持されるラベル情報とを表示装置400に表示させる制御を行う。操作受付部250は、操作装置500を用いたユーザの入力を受け付ける。ラベル情報修正部260は、操作受付部250により受け付けられたユーザの操作に従って、ラベル情報保持部220により保持されているラベル情報を修正する。
【0020】
<処理>
次に、本実施形態の処理について説明する。図3は、本実施形態に係る情報処理装置200が実施する処理の手順を示すフローチャートである。本処理は、ユーザにより各画像に対して設定済のラベル情報に対して、修正が必要なラベル情報を提示し、ユーザから修正を受付ける処理である。
【0021】
(ステップS310)
信頼度取得部230は、画像取得部210により取得された画像に対して設定されたラベル情報保持部220が保持するラベル情報について、正確さの度合いを示す信頼度を取得する。ここで、図4は、信頼度取得処理の手順を示すフローチャートである。
【0022】
(ステップS3101)
まず、信頼度取得部230は、ラベル情報保持部220が保持するラベル情報を1つ選択する。選択したラベル情報をLとする。また、画像取得部210により取得された画像の中から当該ラベル情報に対応する画像を選択する。選択した画像をIとする。
【0023】
(ステップS3102)
次に、信頼度取得部230は、画像I及びラベルLの情報を認識部235へ出力し、ラベルLの示す画像I上の位置について、対象物体が存在するかどうかの認識結果を認識部235から取得する。より具体的には、認識部235により対象物体が存在する確率Pを算出し、その算出結果を認識部235から取得する。
【0024】
(ステップS3103)
認識部235により算出された確率Pについて、選択したラベルLが1であるのに確率Pが低い場合や、ラベルLが0である位置であるのに確率Pが高い場合は、ラベル情報に誤りがある可能性が高い。信頼度取得部230は、ラベルLが1である場合、信頼度EをE=Pとして設定する。逆に、ラベルLが0である場合、信頼度EをE=1-Pとして設定する。
【0025】
(ステップS3104)
信頼度取得部230は、全てのラベル情報、画像について信頼度を取得したか否かを判定する。全てのラベル情報、画像について信頼度を取得した場合、処理を終了する。一方、全てのラベル情報、画像について信頼度を取得していない場合、ステップS3101に戻る。
【0026】
このように、選択するラベル情報を変えながら、全てのラベル情報について一連の処理を行う。以上で図4の一連の処理が終了する。その後、図3のステップS320へ進む。
【0027】
(ステップS320)
表示制御部240は、信頼度取得部230により取得された信頼度に基づいて、画像取得部210により取得されて保持されている画像と、ラベル情報保持部220で保持するラベル情報とを表示装置400に表示させる。
【0028】
対象物体が存在しない位置にラベルとして1が設定されている場合や、対象物体が存在する位置にラベルとして0が設定されている場合には、ラベル情報の信頼度が低くなる。ここでは、その傾向から信頼度の低いラベルは誤りの可能性が高いと判定し、画像と共に表示を行う。
【0029】
まず、信頼度取得部230が取得したラベル情報の信頼度Eが、所定値以下であるラベル情報を1つ選択する。選択したラベル情報をLとする。次に、ラベルLに対応する画像上の部位を選択する。選択した画像上の部位をJとする。部位Jは、例えば、ラベルLの座標を中心とした所定サイズの矩形領域である。
【0030】
そして、表示装置400のモニタに対して、部位Jを含むウィンドウを表示する。図5は表示例である。図5の700はモニタに表示するウィンドウである。710は表示する部位Jの一例である。720の黒点は、ラベルが1であることを示す情報である。例えば、ラベルが1の場合は黒点720を表示し、ラベルが0の場合は黒点720を表示しないように構成する。ここでは、部位Jに非対象物体である円柱の物体が含まれている。そのため、対象物体が存在しないことを示すラベル1に対応する黒点720が表示される。このようにして、ユーザは、モニタに表示される部位Jとそのラベルの有無(黒点の有無)とを確認することで、ラベル情報が正しいかどうかを判定することができる。
【0031】
例えば、図5の710には対象物体は存在しないにも関わらず、ラベルが1の場合(黒点720が有る場合)、設定したラベル情報が誤りであったと判定することができる。また、図1の140のように、対象物体が存在するにも関わらず、ラベルが0の場合(黒点が無い場合)も、設定したラベル情報が誤りであったと判定することができる。
【0032】
(ステップS330)
操作受付部250は、操作装置500によるユーザの入力を受け付ける。ここでは、マウスの操作によって、ラベル情報を修正受付け可能である。例えば、表示装置400が表示するウィンドウにボタンを配置して、それをマウスでクリックすることでラベル情報を修正できるようにする。ここで、図5の730と731はボタンの例である。730はラベル情報を修正する操作を実行する修正ボタンである。731は次に表示するラベル情報の候補に切り替える切替ボタンである。
【0033】
(ステップS340)
ラベル情報修正部260は、操作受付部250により受け付けられたユーザの操作に従って、ラベル情報を修正するかどうかを判定する。図5の例の場合、対象物体が存在しないにも関わらず、ラベルが1である。例えば、修正ボタン730が押下された場合にラベル情報を修正すると判定する。切替ボタン731が押下された場合にラベル情報を修正しないと判定する。ラベル情報を修正する場合、ステップS350へ進む。一方、ラベル情報を修正しない場合、ステップS360へ進む。
【0034】
(ステップS350)
ラベル情報修正部260は、操作受付部250により受け付けられたユーザ操作に従って、ラベル情報保持部220が保持するラベル情報を修正する。例えば、対象物体が存在するとして設定されていた1のラベルを0に修正し、対象物体が存在しないとして設定されていた0のラベルを1に修正する。この操作により、誤って設定されていたラベル情報を修正することができる。
【0035】
(ステップS360)
表示制御部240は、処理を終了するか否かを判定する。一連の修正作業を終了する不図示のボタンの押下や、全ての修正作業が完了した場合、処理を終了する。一方、切替ボタン731が押下された場合には、処理を終了せずに、ステップS320に戻る。以上で、図3の一連の処理が終了する。
【0036】
以上説明したように、本実施形態に係る情報処理装置は、対象物体について設定されたラベル情報の信頼度を算出し、その信頼度に基づいて、例えば信頼度が所定値以下である場合に、ラベル情報と当該ラベル情報に対応する画像とを選択して表示する。これにより、表示されたラベル情報及び画像を観察したユーザが誤って設定されたラベル情報を修正することが可能となるため、ユーザが学習データを効率的に見直すことが可能となる。
【0037】
(第2の実施形態)
<概要>
本実施形態では、画像中の対象物体の存在に関するラベル情報として、位置及び姿勢を表すパラメータを設定する例について説明する。なお、本実施形態における姿勢とは、画像上での角度を表す数値である。
【0038】
図6は、本実施形態に係るラベル情報を設定した例である。図6の810は対象物体の存在する位置に正しい姿勢のラベル情報が設定できた例を表す。ラベル情報は、対象物体の位置を黒点、姿勢をベクトルとして表現している。ここで、姿勢は、対象物体について予め定められた方向が、画像上ではどの方向になるかを表す。本実施形態では、対象物体の上部の面の方向に、ベクトルが設定されていることを正解としている。811及び820は、対象物体の存在する位置は正しいが、誤った姿勢のラベル情報が設定されている例である。821は、誤って対象物体が存在しない位置にラベル情報を設定した例である。830は対象物体が存在するにもかかわらず、ラベル情報を設定しなかった例である。
【0039】
本実施形態では、位置と姿勢の情報を持つラベル情報について信頼度を算出し、その信頼度に基づいて画像とラベル情報とを選択して表示する。これにより、効率的なラベル情報の見直しを可能にする。
【0040】
<システム構成及び装置構成>
まず、本実施形態のシステム構成について説明する。本実施形態のシステム構成は、第1の実施形態と同じである。ただし、ラベル情報に含まれる情報が増えたことで、各装置の構成要素の処理内容が異なる。
【0041】
まず、ラベル情報保持部220で保持するラベル情報は、画像上の各位置に対象物体が存在するかどうかを示す情報と、対象物体の姿勢の情報とを含む。具体的には、ラベル情報は、対象物体が存在する場合は1、存在しない場合は0の情報を有しており、位置と姿勢の情報も有する。位置は画像上での2次元座標の値、姿勢は画像上での角度の数値とする。
【0042】
信頼度取得部230は、認識部235により算出された、指定された位置及び姿勢で対象物体が存在する確率Pに基づいて、第1の実施形態と同様にして信頼度を取得する。認識部235は、画像上で指定された位置に指定された姿勢で対象物体が存在するかを認識する。本実施形態では、指定された位置及び姿勢で対象物体が存在する確率Pをニューラルネットワークに基づく認識器を使って計算するものとする。なお、対象物体の有無を変えた画像と、対象物体の姿勢を変えた画像とを利用して学習を行うことで、画像上の対象物体の有無と、対象物体がある場合はその姿勢を認識する認識器を構築することができる。
【0043】
表示制御部240は、信頼度取得部230により取得された信頼度に基づいて、画像取得部210により取得されて保持されている画像と、ラベル情報保持部220により保持されているラベル情報とを、表示装置400に表示させる。ここで、ラベル情報は、姿勢が分かるように表示される。本実施形態ではベクトルにより姿勢を表現する。図7は表示の例である。図7の900はモニタに表示するウィンドウである。910はラベル情報に対応する画像上の部位の例である。920の黒点及びベクトルは、対象物体が存在するかどうかを示す情報と、姿勢の情報とを表す。
【0044】
例えば、図7の910に示される920のベクトルは、予め定められた対象物体の方向(ここでは対象物体の上面に垂直な方向)にベクトルが向いていないため、設定したラベル情報が誤りであったと判定することができる。
【0045】
操作受付部250は、操作装置500によるユーザの入力を受け付ける。例えば、姿勢の修正を行う場合、マウスを使って、画像上の部位を指定することで角度を入力できるように構成する。ラベルの有無の修正は第1の実施形態と同様である。ラベル情報修正部260は、操作受付部250により受け付けられたユーザの操作に従って、ラベル情報保持部220が保持するラベル情報を修正する。
【0046】
以上説明したように、本実施形態に係る情報処理装置は、対象物体について設定された位置及び姿勢の情報を含むラベル情報の信頼度を算出し、その信頼度に基づいて、例えば、信頼度が所定値以下である場合にラベル情報と当該ラベル情報に対応する画像とを選択して表示する。これにより、表示されたラベル情報及び画像を観察したユーザが、誤って設定されたラベル情報を修正することが可能となるため、ユーザが学習データを効率的に見直すことが可能となる。
【0047】
[第1の変形例]
第1及び第2の実施形態では、信頼度取得部230は、ラベル情報保持部220が保持するラベル情報について、正確さの度合いを示す信頼度を算出したが、その際、認識部235でニューラルネットワークを用いた認識結果に基づいて信頼度を算出した。
【0048】
しかしながら、信頼度を算出する方法は、画像に対して設定したラベル情報が正しいかどうかの度合いを算出できれば、他のどのような方法を用いてもよい。例えば、ラベル情報が示す位置及び姿勢に基づいて、対象物体の3次元形状モデルを画像上に投影し、投影した3次元形状モデルと画像との一致度に基づいて信頼度を設定してもよい。具体的には、3次元形状モデルを構成する線を画像上に投影し、投影された線と画像上から検出されたエッジとの一致度に基づいて信頼度を設定してもよい。
【0049】
或いは、対象物体の3次元形状モデルをテンプレートとして、画像とのテンプレートマッチングを行うことで一致度を計算し、その一致度に基づいて信頼度を設定してもよい。その場合、一致度が高い場合は信頼度を高く設定する。逆に、一致度が低い場合は信頼度を低く設定する。
【0050】
また、距離画像を用いて、距離画像の品質から信頼度を設定してもよい。例えば、隠れが発生する条件や、対象物体の角度の条件によっては、対象物体が見えづらい場合がある。この場合、誤ったラベル情報を設定する可能性が高いと推測できる。そこで、距離画像から距離情報のばらつきや面の傾きを調べて、その値に基づいて信頼度を設定してもよい。具体的には、距離値のばらつきが大きい場合や、撮影装置300の視線方向に対して物体の面の傾きが大きいため物体を観測しにくい場合は、信頼度を低く設定してもよい。
【0051】
また、ユーザがラベル情報を設定する時に、その自信の程度に応じて信頼度もユーザが設定し、信頼度取得部230が、設定された信頼度を読み込むことによりラベル情報の信頼度を算出してもよい。
【0052】
[第2の変形例]
第1及び第2の実施形態で説明した表示制御部240は、画像とラベル情報とを表示する際に、ラベル情報に含まれる位置や姿勢の情報は黒点やベクトルを使って表示していた。
【0053】
しかしながら、ラベル情報に含まれる情報を表示する方法は、その情報が分かるように表示できれば、他のどのような方法を用いてもよい。例えば、対象物体の形状を表すモデルを画面上に表示してもよい。図8は、ラベルの位置及び姿勢の情報に基づいて、モデルを表示した例である。図8の1000はモニタに表示するウィンドウである。1010はラベル情報に対応する画像上の部位の例である。1020の黒点とベクトルは、対象物体が存在することを示す情報と、姿勢の情報とを表す。1030の点線は、物体の形状を表すモデルであり、位置及び姿勢の情報に基づいて画像上に表示したものである。モデルを表示する方法は、単に位置や姿勢を黒点やベクトルで表示する方法に比べて、画像とラベル情報とが整合しているかどうかを確認しやすいという利点がある。なお、図8の1010は、画像とモデルとを比較した結果、両者の間にずれが確認できるので、設定したラベル情報が誤りであったと判定することができる。その他にも、位置及び姿勢の情報は文字や数字で表示してもよい。或いは、表やグラフで表示してもよい。
【0054】
[第3の変形例]
第1及び第2の実施形態で説明した表示制御部240では、ラベル情報に対応する画像上の部位を1つ切り出して表示していた。しかしながら、画像を表示する方法は、信頼度取得部230で算出する信頼度が低いラベル情報が示す部位が分かるように表示できれば、他のどのような方法を用いてもよい。
【0055】
例えば、信頼度が低い複数のラベル情報について、対応する複数の画像をまとめて表示してもよい。ここで、図9(a)は、複数の画像をまとめて表示した例である。図9の1100、1101、1102は信頼度が低いラベル情報が示す部位の例である。また、複数の画像を表示する場合、信頼度に応じて画像をソートして表示してもよい。すなわち、信頼度に基づいて、ラベル情報と当該ラベル情報に対応する画像上の部位との組を複数表示させる例である。
【0056】
その他にも、画像全体を表示し、信頼度が低いラベル情報が示す部位を強調して表示してもよい。図9(b)は、1つの画像全体を表示して、その中で信頼度が低いラベル情報が示す部位を枠で囲んで強調した例である。図9の1110、1111、1112の点線の枠は、信頼度が低いラベル情報が示す部位を表す。
【0057】
すなわち、各ラベル情報に対応する画像上の各部位が1つの画像中に複数含まれる場合、1つの画像全体を表示すると共に、信頼度が所定値以下であるラベル情報に対応する部位を強調して表示させる例である。
【0058】
その他にも、画像全体を表示して、各部位の信頼度の分布をヒートマップとして表示することで、ラベル情報と信頼度とを比較できるように構成してもよい。
【0059】
このように、複数の候補を表示する方法は、一度に確認ができるため、ユーザによるラベル情報の見直しの効率を向上させることができる。
【0060】
[第4の変形例]
第1及び第2の実施形態で説明したラベル情報は、対象物体の位置や姿勢の情報を含むものであった。しかしながら、ラベル情報は対象物体の位置や姿勢以外のパラメータであってもよく、例えば、対象物体の特定の部分(把持対象部分)についての位置や姿勢であってもよい。
【0061】
具体的には、画像から認識した対象物体をロボットがピッキングするシステムを考えた場合、必要になるのは対象物体を把持する部分の位置や角度である。この場合、対象物体を把持する部分の位置や角度をラベル情報として利用してもよい。処理の内容は、ラベル情報が表現する位置や角度が変化しただけで、第1及び第2の実施形態と同様である。また、その場合、信頼度取得部230は、第1の変形例で述べたように、対象物体の3次元形状モデルを画像上に投影し、投影した3次元形状モデルと画像との一致度に基づいて信頼度を設定してもよい。また、一致度を算出する際に、把持対象位置の近傍を重視して評価値を算出するようにしてもよい。
【0062】
また、さらに対象物体の色や種類を示す情報をラベル情報に加えてもよい。その場合、情報が増えた分、認識部235は、さらに対象物体の色や種類を認識した上で、その確率を出力する。信頼度取得部230は、認識部235が出力する確率と、設定されているラベル情報との差異に応じて信頼度を算出する。
【0063】
[第5の変形例]
第1及び第2の実施形態では、画像取得部210が取得する画像は濃淡画像であった。しかし、画像は対象物体を撮影した画像であれば、濃淡画像でもよいし、カラー画像でもよい。また、対象物体までの距離情報を有する距離画像でもよい。また、撮影装置300で撮影した画像を取得する方法であれば、取得方法はどのような方法でもよい。ネットワークを介して画像を取得してもよいし、一時的にメモリ上に保存した画像を取得してもよい。
【0064】
撮影装置300は、画像を取得する装置であればどのような装置でもよい。画像の2次元情報を取得するカメラでもよいし、距離画像を取得する距離センサでもよい。
【0065】
<効果>
第1の実施形態では、ラベル情報の信頼度を算出し、その信頼度が所定値以下である場合に画像とラベル情報とを選択して表示する。これにより、効率的なラベル情報の見直しが可能となる。
【0066】
第2の実施形態では、位置と姿勢の情報を持つラベル情報について信頼度を算出し、その信頼度に基づいて画像とラベル情報とを選択して表示する。これにより、効率的なラベル情報の見直しが可能となる。
【0067】
<定義>
本発明において、ラベル情報保持部220が保持するラベル情報は、対象物体の位置や姿勢を表す情報でもよいし、対象物体に設定した把持対象位置などの特定の部位の位置や角度を表す情報でも良い。さらに、物体の種類や色などの情報を加えてもよい。
【0068】
本発明において、信頼度取得部230が取得する信頼度は、ラベル情報の正しさの度合いを表す信頼度を算出できる方法であればどのような方法でもよい。ニューラルネットワークに基づく認識結果に従って信頼度を算出てもよいし、対象物体の3次元形状モデルを参考に画像との一致度を見て信頼度を算出してもよい。距離画像の距離情報を用いて、その傾きやばらつきから信頼度を算出してもよい。また、ユーザがラベル情報を設定する時に、その自信の程度に応じてユーザが信頼度を設定しておき、それを読み出すことにより信頼度を取得してもよい。
【0069】
本発明において、表示制御部240が表示する情報は、信頼度取得部230が取得する信頼度が所定値以下のラベル情報が示す部位が分かるように表示できれば、どのような方法で表示してもよい。信頼度が低いラベル情報に対応する画像上の部位を切り出して表示してもよいし、画像全体を表示して信頼度が低いラベル情報の部位を矩形の枠などで示すように表示してもよい。
【0070】
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【符号の説明】
【0071】
200:情報処理装置、210:画像取得部、220:ラベル情報保持部、230:信頼度取得部、235:認識部、240:表示制御部、250:操作受付部、260:ラベル情報修正部、300:撮影装置、400:表示装置、500:操作装置
図1
図2
図3
図4
図5
図6
図7
図8
図9