(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024111955
(43)【公開日】2024-08-20
(54)【発明の名称】情報処理システム及びその制御方法、プログラム
(51)【国際特許分類】
G09G 5/00 20060101AFI20240813BHJP
G09G 5/37 20060101ALI20240813BHJP
G06F 3/01 20060101ALI20240813BHJP
G06F 3/0481 20220101ALI20240813BHJP
H04N 7/18 20060101ALI20240813BHJP
【FI】
G09G5/00 550C
G09G5/00 510G
G09G5/00 550B
G09G5/00 530D
G09G5/37 110
G06F3/01 510
G06F3/0481
H04N7/18 U
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2023016720
(22)【出願日】2023-02-07
(71)【出願人】
【識別番号】390002761
【氏名又は名称】キヤノンマーケティングジャパン株式会社
(71)【出願人】
【識別番号】592135203
【氏名又は名称】キヤノンITソリューションズ株式会社
(74)【代理人】
【識別番号】100189751
【弁理士】
【氏名又は名称】木村 友輔
(72)【発明者】
【氏名】片岡 新
【テーマコード(参考)】
5C054
5C182
5E555
【Fターム(参考)】
5C054CA04
5C054CC02
5C054DA07
5C054FA07
5C182AA31
5C182AB02
5C182AB08
5C182AB14
5C182AB35
5C182AC02
5C182AC03
5C182AC39
5C182BA01
5C182BA03
5C182BA04
5C182BA06
5C182BA14
5C182BA66
5C182BA68
5C182BC26
5C182CB44
5C182CC02
5C182DA65
5E555AA54
5E555BA04
5E555BB04
5E555BC08
5E555BE17
5E555CA42
5E555CB48
5E555DA08
5E555DC11
5E555EA22
5E555FA00
(57)【要約】 (修正有)
【課題】作業の妨げを抑止しながらも検出結果に関する表示情報の更新をより好適に行える仕組みを提供する。
【解決手段】撮像手段で撮像された画像を連続的に取得する第1の取得手段と、前記第1の取得手段で取得した画像から検出対象物を検出する第2の取得手段と、前記検出処理で検出された検出対象物の種別に基づく第1の情報を、検出対象物を含む物品が所定時間検出されないことを含む特定の条件が満たされるまで継続して表示し、その後、前記特定の条件が満たされたことに応じて前記第1の情報を非表示とし、前記特定の条件が満たされた後の第2の時点において、前記検出処理で検出された検出対象物の種別に基づく第2の情報を表示するように制御する表示制御手段とを有し、前記特定の条件は、前記物品の検出の有無に基づく条件であって、前記物品の種別には基づかない条件であることを特徴とする。
【選択図】
図4
【特許請求の範囲】
【請求項1】
撮像手段で撮像された画像を連続的に取得する第1の取得手段と、
前記第1の取得手段で取得した画像から検出対象物を検出する検出処理の結果情報を取得する第2の取得手段と、
第1の時点において前記第2の取得手段で取得した結果情報に基づく検出対象物であって、前記検出処理で検出された検出対象物の種別に基づく第1の情報を、検出対象物を含む物品が所定時間検出されないことを含む特定の条件が満たされるまで継続して表示し、その後、前記特定の条件が満たされたことに応じて前記第1の情報を非表示とし、
前記特定の条件が満たされた後の第2の時点において前記第2の取得手段で取得した結果情報に基づく検出対象物であって、前記検出処理で検出された検出対象物の種別に基づく第2の情報を表示する
ように制御する表示制御手段と、
を有し、
前記特定の条件は、前記物品の検出の有無に基づく条件であって、前記物品の種別には基づかない条件であることを特徴とする情報処理システム。
【請求項2】
前記第2の取得手段は、前記画像に含まれる検出対象物とその種別を検出する第1の検出処理の結果と、前記画像に含まれる前記物品の有無を検出する第2の検出処理の結果と、を取得可能であり、前記所定の条件は、前記第2の取得手段で取得した前記第2の検出処理の結果に基づく条件であることを特徴とする請求項1に記載の情報処理システム。
【請求項3】
前記第1の検出処理は、前記画像に含まれる食事とその品目を検出する処理であり、
前記第2の検出処理は、食器の有無を検出する処理であることを特徴とする請求項2に記載の情報処理システム。
【請求項4】
前記第1の情報及び前記第2の情報は、それぞれの時点で前記第2の取得手段で取得した結果情報に基づく検出対象物であって、前記検出処理で検出された検出対象物の種別と、比較対象物情報と、を比較した情報であることを特徴とする請求項1に記載の情報処理システム。
【請求項5】
前記比較対象物情報は、前記第1の取得手段で取得した画像に含まれるコード画像に基づく情報であることを特徴とする請求項4に記載の情報処理システム。
【請求項6】
前記表示制御手段は、前記撮像手段で撮像されたライブビュー画像を表示するとともに、当該ライブビュー画像に対して前記第1の情報と前記第2の情報のそれぞれを重畳表示するように制御することを特徴とする請求項1に記載の情報処理システム。
【請求項7】
前記表示制御手段は、ウェアラブルな装置の表示手段に対して前記第1の情報と前記第2の情報とを表示するように制御することを特徴とする請求項5に記載の情報処理システム。
【請求項8】
前記ウェアラブルな装置の表示手段は、メガネ型デバイスの表示手段であることを特徴とする請求項7に記載の情報処理システム。
【請求項9】
前記ウェアラブルな装置は、ユーザーの頭部に装着可能な装置であることを特徴とする請求項7に記載の情報処理システム。
【請求項10】
撮像手段で撮像された画像を連続的に取得する第1の取得ステップと、
前記第1の取得ステップで取得した画像から検出対象物を検出する検出処理の結果情報を取得する第2の取得ステップと、
第1の時点において前記第2の取得手段で取得した結果情報に基づく検出対象物であって、前記検出処理で検出された検出対象物の種別に基づく第1の情報を、検出対象物を含む物品が所定時間検出されないことを含む特定の条件が満たされるまで継続して表示し、その後、前記特定の条件が満たされたことに応じて前記第1の情報を非表示とし、
前記特定の条件が満たされた後の第2の時点において前記第2の取得ステップで取得した結果情報に基づく検出対象物であって、前記検出処理で検出された検出対象物の種別に基づく第2の情報を表示する
ように制御する表示制御ステップと、
を有し、
前記特定の条件は、前記物品の検出の有無に基づく条件であって、前記物品の種別には基づかない条件であることを特徴とする情報処理システムの制御方法。
【請求項11】
少なくとも1つのコンピュータを、請求項1乃至9のいずれか1項に記載の情報処理システムの各手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像からの検出対象物の検出に係る情報処理システム及びその制御方法、プログラムに関する。
【背景技術】
【0002】
従来、撮影された画像から検出対象物を画像認識によって検出し、検出結果に応じた表示をする技術が知られている。
【0003】
特許文献1には、伝票データと検品対象画像を表示し、検品対象画像に含まれる検品対象の商品が伝票データに含まれるか否かを判定することが提案されている。商品が伝票データに含まれていない場合、検品対象画像の当該商品の位置に「誤」の文字を表示して、伝票データに含まれる商品と異なる商品であることを示すことが開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の開示】
【発明が解決しようとする課題】
【0005】
撮像された画像から対象物を検出するための撮像を、対象物の複数のセットに対して連続して行う場合、前のセットの検出結果をその次のセットの検出結果として誤認しないように、前のセットの検出結果についてはリセットする必要がある。撮像手段が作業者のヘッドマウント器具などのウェアラブルな器具に備わっている場合、作業者が他の器具を持つ、作業をする、などのために両手が塞がってしまい、手を使ってリセットする操作を行うと作業の妨げとなってしまう場合がある。また、前のセットの検出結果とその次のセットの検出結果が異なる場合に、前のセットの検出結果をリセットするという方法が考えられるが、前後の画像が同じ場合には画像の区切れが判断できず、正確にリセットができない。また、意図的に画像に区切りを入れる方法が考えられる。例えば、ユーザに意図的に検出対象物とは違うところを見てもらうことで、検出対象物が映っていない状態が一定時間続いた場合に、検出結果をリセットすることが考えられる。しかし、検出対象物の検出を精度高く行えない場合、実際には検出対象物が画像に写っているのに、確実な検出ができず、その状態が一定時間続いた場合(すなわち、ユーザが意図的に検出対象物とは違うところを見ているわけではない場合)にも検出結果がリセットされてしまうことが考えられる。これにより、同じ検出対象物が映っているにも関わらずリセットされてしまうということが起こり、ヘッドマウント器具などのウェアラブルな器具を通して検出された結果と実物とを見比べようとした際に、確認しづらくなる。特許文献1では、上記の課題については考慮されていない。
【0006】
そこで本発明では、上記課題に鑑み、作業の妨げを抑止しながらも、検出結果に関する表示情報の更新をより好適に行える仕組みを提供することを目的とする。
【課題を解決するための手段】
【0007】
撮像手段で撮像された画像を連続的に取得する第1の取得手段と、
前記第1の取得手段で取得した画像から検出対象物を検出する検出処理の結果情報を取得する第2の取得手段と、
第1の時点において前記第2の取得手段で取得した結果情報に基づく検出対象物であって、前記検出処理で検出された検出対象物の種別に基づく第1の情報を、検出対象物を含む物品が所定時間検出されないことを含む特定の条件が満たされるまで継続して表示し、その後、前記特定の条件が満たされたことに応じて前記第1の情報を非表示とし、
前記特定の条件が満たされた後の第2の時点において前記第2の取得手段で取得した結果情報に基づく検出対象物であって、前記検出処理で検出された検出対象物の種別に基づく第2の情報を表示する
ように制御する表示制御手段と、
を有し、
前記特定の条件は、前記物品の検出の有無に基づく条件であって、前記物品の種別には基づかない条件であることを特徴とする。
【発明の効果】
【0008】
作業の妨げを抑止しながらも、検出結果に関する表示情報の更新をより好適に行える仕組みを提供することができる。
【図面の簡単な説明】
【0009】
【
図1】情報処理システムの構成の一例を示す図である。
【
図2】各種装置のハードウェア構成の一例を示す図である。
【
図3】クライアント端末100の処理の概要を示すフローチャートである。
【
図4】クライアント端末100への画面表示を示すフローチャートである。
【
図7】リストを取得した後にメニューの判定結果を取得した場合の画面遷移の一例を示す図である。
【
図8】メニューの判定結果を取得した後にリストを取得した場合の画面遷移の一例を示す図である。
【
図9】ウェアラブル端末120上で表示される画面の一例を示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して、本発明の実施形態の一例について説明する。
【0011】
まず、
図1を参照して、本発明の実施形態における情報処理システムの構成の一例について説明する。
図1は画像から検出対象物を検出し、クライアント端末100又はウェアラブル端末120上にその結果を表示するためのシステム構成である。
【0012】
本実施形態は、例えばユーザーがトレー上の食事に誤りがないかを確認するために活用することができる。例えば、病院では患者に合わせて配膳される食事が決められており、患者に誤った食事が配膳される誤配膳が発生しないように細心の注意が払われている。患者ごとにメニューリストが予め用意されており、そのリストと実際に配膳されている食事とを見比べ、問題がないかどうかを人手で判断している。
【0013】
本発明の情報処理システムは、クライアント端末100、サーバ110、ウェアラブル端末120、メニューDB130がネットワーク101によって通信可能に接続されて構成されてい
る。
【0014】
配膳トレー140には、検出対象のセットとなる、少なくとも1品以上の食事と、メニューリストの情報を持つQRコード(登録商標)が印字された紙が載っている。ユーザーが装着しているウェアラブル端末120の撮像部121で、配膳トレー140上の食事とQRコードを含む画像を撮影する。撮像部121は、ウェアラブル端末120を装着したユーザーが見た方向(顔を向けた方向、視界)を撮影するカメラユニットである。ディスプレイ122は、ウェアラブル端末120を装着したユーザーの視線上のメガネレンズ部分に配置される表示部であり、ディスプレイ122に表示された内容は、ディスプレイ122を透過する現実物体からの可視光(光学像)と一緒にユーザーに視認される。すなわち、後述する各種表示物は、撮像部121で撮像される被写体の光学像を透過するディスプレイ122に、当該光学像と同時に視認可能に表示するように制御される。表示される内容がディスプレイ122(メガネのレンズ部分)に投影して表示される構成であってもよい。ウェアラブル端末120は、例えばスマートグラス等の体の一部に装着可能な端末である。スマートグラスとは、ディスプレイを有したメガネ型の装置であり、現実の視野に対して映像を重畳させることができる。
【0015】
クライアント端末100は、例えばパーソナルコンピュータやスマートフォンのような情報処理装置であり、ウェアラブル端末120と通信可能に接続される。また、ウェアラブル端末120を制御するためのアプリケーションプログラム(以下、アプリと称する)がインストールされている。また、ウェアラブル端末120とサーバ110、メニューDB130と通信可能に接続されている。クライアント端末100は、ウェアラブル端末120から送信された画像(撮像部121で撮像された画像)をサーバ110に送信し、サーバ110による画像認識の検出結果やQRコードから読み取ったメニューリストを受信し、その検出結果やメニューリストをディスプレイ205に表示する。また、クライアント端末100で表示されている内容をミラーリングすることで、同じ内容をウェアラブル端末120のディスプレイ122にも表示する。すなわち、ディスプレイ205に表示するように制御する処理は、ウェアラブル端末120のディスプレイ122に表示するように制御する処理でもある。ウェアラブル端末120はウェアラブル(人体に装着可能)なメガネ型のデバイスである。ディスプレイ122は、人体の頭部に装着可能なヘッドマウントディスプレイの一種である。
【0016】
図9にウェアラブル端末120のディスプレイ122での表示例を示す。スマートグラス上では、検出結果を示す情報900と撮像部121で撮像された画像901を表示する。画像901はライブビュー画像であり、画像901に対して検出結果を示す情報900を重畳させるように表示する。スマートグラス上に表示する場合、両脇にデータを表示すると品質が落ちて見づらくなってしまうので情報900を画面の左右中央に表示する。情報900は、後述する結果表示エリア600に対応する表示物である。また、表示画面には、検出対象物の位置を示す枠等の情報は表示せず、メニューリストと画像認識の検出結果、画像901のみを表示している。スマートグラスの場合、人物の頭部に装着しているので、頭部の動きに応じて撮像部121で撮影される画像901の映像の内容は大きく変動する。従って対象物の位置をリアルタイムで検出することが処理負荷や検出精度の問題で難しく、位置を正しく示せない可能性がある。また、対象物の位置を示す枠を含めると、スマートグラスのように表示画面のサイズが小さい場合に、煩雑な表示になってしまう。そのため、必要最低限の情報のみを表示することで、目視で確認しやすい画面の表示を可能としている。
【0017】
メニューDB130には、毎日の献立メニューが記憶されている。その日のメニューを含めた候補リストを作成しておくことで、見た目が似ている食事によって発生する誤検出を低減させる。例えば、その日の夕食のメニューにハヤシライスが含まれていたとする。ハヤシライスとカレーだと画像認識による識別が難しく、誤ってカレーが検出されてしまう可能性がある。そのため、予めハヤシライスを含めた候補リストを作成し、サーバ110に送信することで、ハヤシライスと判定する可能性が高くなるように判定条件を変更する。このようにして、見た目が似ていたとしても正確に検出できるようにしている。
【0018】
サーバ110は、ネットワーク上の少なくとも1つの情報処理装置であり、撮像部121で撮影される画像に対する画像認識処理を行う。サーバ110は少なくとも1つのプロセッサーであるCPU111、ワークメモリとなるRAM112,プログラムを記憶するROM113を有する。CPU111、RAM112、ROM113のそれぞれは1つのサーバ装置内に含まれるハードウェアである必要はなく、ネット―ワーク上の環境で利用できる少なくとも1つのハードウェアリソースであればよい。
【0019】
次に
図2を参照して、本発明を適用可能な装置の一例としてのクライアント端末100の構成の一例を示す。
【0020】
図2において、内部バス250に対してCPU201、メモリ202、不揮発性メモリ203、画像処理部204、ディスプレイ205、操作部206、記録媒体I/F207、外部I/F209、通信I/F210が接続されている。内部バス250に接続される各部は、内部バス250を介して互いにデータのやりとりを行うことができるようにされている。
【0021】
メモリ202は、例えばRAM(半導体素子を利用した揮発性のメモリなど)からなる。CPU201は、例えば不揮発性メモリ203に格納されるプログラムに従い、メモリ202をワークメモリとして用いて、クライアント端末100の各部を制御する。不揮発性メモリ203には、画像データや音声データ、その他のデータ、CPU201が動作するための各種プログラムなどが格納される。不揮発性メモリ203は例えばハードディスク(HD)やROMなどで構成される。
【0022】
画像処理部204は、CPU201の制御に基づいて、不揮発性メモリ203や記録媒体208に格納された画像データや、外部I/F209を介して取得した映像信号、通信I/F210を介して取得した画像データ、撮像された画像などに対して各種画像処理を施す。画像処理部204が行う画像処理には、A/D変換処理、D/A変換処理、画像データの符号化処理、圧縮処理、デコード処理、拡大/縮小処理(リサイズ)、ノイズ低減処理、色変換処理などが含まれる。画像処理部204は特定の画像処理を施すための専用の回路ブロックで構成しても良い。また、画像処理の種別によっては画像処理部204を用いずにCPU201がプログラムに従って画像処理を施すことも可能である。画像から認識すべき対象を認識する処理は、CPU201が画像処理部204と協働して行う。
【0023】
ディスプレイ205は、CPU201の制御に基づいて、画像やGUI(Graphical User Interface)を構成するGUI画面などを表示する。CPU201は、プログラムに従い表示制御信号を生成し、ディスプレイ205に表示するための映像信号を生成してディスプレイ205に出力するようにクライアント端末100の各部を制御する。ディスプレイ205は出力された映像信号に基づいて映像を表示する。なお、クライアント端末100自体が備える構成としてはディスプレイ205に表示させるための映像信号を出力するためのインターフェースまでとし、ディスプレイ205は外付けのモニタ(テレビなど)で構成してもよい。
【0024】
操作部206は、キーボードなどの文字情報入力デバイスや、マウスやタッチパネルといったポインティングデバイス、ボタン、ダイヤル、ジョイスティック、タッチセンサ、タッチパッドなどを含む、ユーザー操作を受け付けるための入力デバイスである。なお、タッチパネルは、ディスプレイ205に重ね合わせて平面的に構成され、接触された位置に応じた座標情報が出力されるようにした入力デバイスである。
【0025】
記録媒体I/F207は、メモリーカードやCD、DVDといった記録媒体208が装着可能とされ、CPU201の制御に基づき、装着された記録媒体208からのデータの読み出しや、当該記録媒体208に対するデータの書き込みを行う。外部I/F209は、外部機器と有線ケーブルや無線によって接続し、映像信号や音声信号の入出力を行うためのインターフェースである。通信I/F210は、外部機器やインターネット211などと通信して、ファイルやコマンドなどの各種データの送受信を行うためのインターフェースである。
【0026】
カメラ部212は、光学像を電気信号に変換するCCDやCMOS素子等で構成される撮像素子(撮像センサー)等で構成されるカメラユニットである。
【0027】
次に
図3を参照して、本発明の実施形態における、クライアント端末100の基本処理について説明する。なお、各ステップの処理は、クライアント端末100のCPU201が、不揮発性メモリ203に記録されたプログラムをメモリ202に展開して実行することにより実現する。ユーザーが配膳トレー140上の食事が適切かどうかを確認する前の処理として、クライアント端末100内のアプリを起動すると、
図3の処理が開始される。
【0028】
S301では、CPU201は、ウェアラブル端末120の制御用のアプリの起動の指示を受け付けると、アプリを起動させる。例えば、クライアント端末100にインストールされたアプリのアイコンをタッチ、クリックすることで起動させる。起動直後のUIには、
図6のように結果表示エリア600が表示される。結果表示エリア600には、信頼度表示領域601,メニューリスト表示領域602,その他の検出結果表示領域603が含まれる。この時点では、信頼度表示領域601,メニューリスト表示領域602,その他の検出結果表示領域603は空欄の表示となる。なお、
図6~
図9に示す各点線枠は、領域を図示するための図面上の補助線であって、表示されるものではない。
【0029】
S302では、CPU201は、ウェアラブル端末120の撮像部121によって撮影された映像を取得する。例えば、ウェアラブル端末120は、配膳トレー140上の食事や、メニューリストの情報を持つQRコードの映像を撮影する。クライアント端末100のCPU201は、撮影された当該映像を取得する。なお、以下、ウェアラブル端末120によって撮影された画像と言う場合は、撮像部121によって撮影された画像のことであるものとする。
【0030】
S303では、CPU201は、S302で取得した映像を背景画像としてディスプレイ205上に表示する。UIの基本画面の表示例を
図7に示す。なお、後述するステップにおいて表示する場合の表示先は、特に説明がない限りディスプレイ205であるものとする。
【0031】
図7の表示例では、ウェアラブル端末120から取得した映像を、背景画像610として表示する。背景画像610はライブビュー画像である。背景画像には、ウェアラブル端末120を装着したユーザーが配膳トレーの方向を向いていれば、配膳トレー上の食事画像803とQRコード画像804が含まれる。また、サーバ110による処理結果(画像認識の結果)を表示するための領域である結果表示エリア600を表示する。
【0032】
S304では、CPU201は、S302で取得した映像をサーバ110に送信する。サーバ110では、取得した映像からトレー上の食事メニューの推論やQRコードのデコードを行う。サーバ側の処理については、
図5のフローチャートを用いて詳述する。
【0033】
S305では、CPU201は、サーバ110から処理結果を受信したか否かを判定する。受信した場合はS306に進み、そうでない場合にはS307へ進む。ここで受信する処理結果は、後述する
図5のS517で送信されるQRコードのデコード結果であるメニューリスト、S524で送信される食器検出数、S527で送信されるメニュー推論結果のいずれかである。
【0034】
S306では、CPU201は、サーバ110から受信した処理結果に基づく表示制御処理を実行する。この処理については、
図4のフローチャートを用いて詳述する。
図4の処理(S306の処理)が終了すると、S305へ戻り、サーバ110から次の処理結果を受信したか否かを判定する。アプリが終了されるまでこの処理を繰り返す。
【0035】
S307では、CPU201は、1フレーム分の時間(例えば30分の1秒)が経過したか否かを判定する。経過した場合には、S302に戻り、再度スマートグラスからの映像を取得する。すなわち、撮像部121によって撮影された画像は毎フレーム連続的に取得する。S307で1フレーム分の時間が経過していないと判定した場合にはS305へ進む。
【0036】
図4に、表示制御処理のフローチャートを示す。この処理は、前述した
図3のS306の詳細である。なお、各ステップの処理は、クライアント端末100のCPU201が、不揮発性メモリ203に記録されたプログラムをメモリ202に展開して実行することにより実現する。クライアント端末100がサーバ110から処理結果を受信すると、
図4の処理が開始される。
【0037】
S401では、CPU201は、サーバ110から受信した処理結果が正解メニューリストであるか否かを判定する。正解メニューリストは、後述する
図5のS517でサーバ110から送信される情報である。また、正解メニューリストは、メニュー推論結果と比較するための比較対象となるメニュー品目群を含む比較対象情報である。正解メニューリストであればS402へ進み、そうでない場合にはS406に進む。具体的には、サーバ110では配膳トレー140上の食事の推論(画像認識による検出)と、QRコードのデコード処理を行っている。クライアント端末100がQRコードをデコードした結果、すなわちメニューリストを食事の推論結果(以下、メニュー推論結果)よりも先に受信したか否かを判定する。
【0038】
S402では、CPU201は、メニューリストを結果表示エリア600のメニューリスト表示領域602に表示する。メニューリストの表示例を
図7(a)に示す。受信したメニューリストを、
図7(a)の点線枠内のメニューリスト表示領域602に表示する。表示例では、御飯・グラタン・野菜サラダ・果物(オレンジ)・キャベツスープのメニューリストを取得した結果を表示している。メニューリスト表示領域602に表示された複数の項目のそれぞれが、メニューリストに含まれる一品(一皿)分の食事名(料理名)を表している。
【0039】
S403では、CPU201は、メニュー推論結果(撮像部121で撮像した画像からの画像認識処理である、後述する
図5のS525の処理による検出結果)をサーバ110から受信済であるか否かを判定する。受信済である場合はS404へ進み、そうでない場合は処理を終了する。
【0040】
S404では、CPU201は、結果表示エリア600の信頼度表示領域601に判定結果記号を表示する。より具体的には、S401で受信した正解メニューリストと、S403で受信済みと判定したメニュー推論結果とを比較し、正解メニューリストにある料理の品目(比較対象物)のそれぞれについて、メニュー推論結果に検出された対象物として含まれているか否かを判定する。そして、メニュー推論結果に検出された対象物として含まれている場合、メニュー推論結果での検出信頼度を取得し、これに基づいて判定結果記号を表示する。すなわち、正解メニューリストにある料理の品目(比較対象物)のそれぞれに対応づけて、メニュー推論処理で検出されたかに関する検出情報を信頼度表示領域601に表示する。なお、その他の検出結果表示領域603に表示される項目に関しては、信頼度(判定結果記号)を対応付けて表示することはしない。
【0041】
この時の表示例を
図7(b)に示す。信頼度表示領域601に検出結果の信頼度を記号で表示しており、例えば、◎・〇・△・×で表し、◎に近いほど信頼度が高いことを示している。
図7(b)の表示例では、メニューリストにある御飯は◎が表示されており、メニュー推論結果において非常に高いスコア値で検出されていることを示している。グラタン・果物(オレンジ)はメニュー推論結果において高いスコア値で検出されていることを示している。キャベツスープはスコア値が低く、検出はされたが信頼度が低い(キャベツスープでない可能性がある程度ある)ことを示している。野菜サラダはスコア値が非常に低く、信頼度が低い(野菜サラダでない可能性が高い)、あるいは検出されていない(推論スコアが取得できていない)ことを示している。画像認識の検出結果を「正」か「誤」の二択ではなく、3段階以上の信頼度で表示することで、ユーザーは信頼度の低い対象物を重点的に目視にて確認することができるようになる。すなわち、検出結果を二択で表示するといずれか一方に振り分けられ、「誤」と表示されていなくても結果が誤っている可能性があるので、検出結果に幅を持たせることでより正確な結果を取得でき、ユーザーは効率よく対象物を確認できるようになる。
【0042】
なお、信頼度表示領域601に表示する信頼度の表示物については、例えば数値(80%や60%など)や文字(高、中、低など)のように、ユーザーが信頼度を認識できる形態であれば記号でなくともよい。なお、検出結果の信頼度が△や×で表示されている場合(すなわち信頼度が所定の基準より低い場合)、△や×のものだけ赤字や太字で強調表示したり、別途メッセージを表示するなどして、ユーザーに確認を促すように通知するようにしても良い。
【0043】
また、S401で取得した正解メニューリストにはない食事(料理)が検出されている場合、後述するS409,S410において、その他の検出結果表示領域603に検出された食事の名称を表示する。その他の検出結果表示領域603に表示される各項目は、一品(一皿)分の料理名(食事名)である。
図7(b)の表示例では、メニューリストが示す内容とは一致しないイタリアンサラダが検出されていることを示している。このように、リストにない食事の名称を表示することで、画像認識の正解データと画像認識結果が本当に一致しないかを確認することが出来る。すなわち、ユーザーはリストにはないと検出された食事がリストの情報とは合致しないかを目視にて確認することができる。なお、メニューリストが示す内容とは一致しない食事であることが識別できる情報であれば、名称でなくとも、例えば識別番号といった情報でも良い。画像認識結果ではその他の検出結果だとしても、実際に目視で確認した場合には問題の無いケースもある。例えば、正解メニューリストに含まれるのが「野菜サラダ」であり、その他の検出結果に含まれるのが「イタリアンサラダ」である場合、「イタリアンサラダ」が実際には「野菜サラダ」の一種であり包含されるものなのであれば問題はなく、そのまま配膳してもよい。一方、例えば、正解メニューリストに含まれるのが「野菜サラダ」であり、その他の検出結果に含まれるのが「ハンバーグ」である場合、「野菜サラダ」を追加して「ハンバーグ」を除外してから配膳する必要がある。このような判断は、ウェアラブル端末120を身に着けたユーザーである作業者が、信頼度表示領域601、メニューリスト表示領域602、その他の検出結果表示領域603の表示内容と実物を見比べて行うこととなる。このように、正解メニューリストに含まれない対象物を検知した場合に、その対象物の識別除法(名称、種別)をその他の検出結果表示領域603に表示することで、検出された正解メニューリストに含まれない対象物が本当に不適当なものであるのかを作業者が確認しやすくなる。さらに例を挙げると、正解メニューリストに「青果物」があり、メニュー推論処理で「バナナ」が検出された場合、名称は一致しないため、「青果物」はメニューリスト表示領域602に表示され、「バナナ」はその他の検出結果表示領域603に表示される。しかし作業者は、メニューリスト表示領域602に表示された「青果物」がその他の検出結果表示領域603に表示された「バナナ」を包含する上位概念の言葉であることがわかるため、不適当な結果(「誤り」)ではなく、問題の無い結果(すなわちその料理をそのまま配膳してよい結果)である可能性を認識することができる。従ってより正確な判断を実物を見て行うことの動機付けとなる。
【0044】
S405では、CPU201は、その他の検出結果表示領域603に表示済みの料理名(メニュー、品目)のうち、メニューリスト表示領域602に表示済みのメニューであり、信頼度表示領域601に判定結果記号を表示済みのメニューがある場合はこれを削除する。具体的な説明は後述するが、S406、S407において先にメニュー推論結果を受信した場合、その他の検出結果表示領域603にその内容を表示しておく。その後、メニューリストを受信した際に、その他の検出結果表示領域603に表示されている内容のうち結果判定済みのメニュー(メニューリスト表示領域602に表示されるものと同じ品目の料理)を削除する。
【0045】
S406では、CPU201は、サーバ110から受信した処理結果がメニュー推論結果であるか否かを判定する。メニュー推論結果である場合はS407へ進み、そうでない場合はS411へ進む。S305で受信した処理結果が、後述する
図5のS527でサーバ110から送信されたメニュー推論結果である場合に、S406でYesと判定される。
【0046】
S407では、CPU201は、サーバ110からメニューリストを受信済みか否かを判定する。受信済みである場合にはS408へ進み、そうでない場合はS410へ進む。メニューリストを受信済みの場合とは、メニューリスト表示領域602にメニューリストに含まれる料理名を表示済みの場合である。
【0047】
S408では、CPU201は、信頼度表示領域601に、メニューリスト表示領域602に表示済みの料理名にそれぞれ対応する判定結果記号であって、S406で受信したと判定したメニュー推論結果に基づく判定結果記号を表示する。
【0048】
S409では、CPU201は、その他の検出結果表示領域603に、S403で受信したと判定したメニュー推論結果に含まれる料理名のうち、メニューリスト表示領域602に表示済みの料理名に含まれない料理名をその他の検出結果表示領域603に表示する。
【0049】
S410では、CPU201は、メニュー推論結果をその他の検出結果表示領域603に表示する。このときの表示例を
図8(a)に示す。
図8(a)の表示例は、メニューリストよりも先にメニュー推論結果を受信した場合であり、メニューリスト表示領域602に料理名が表示されることなく、その他の検出結果表示領域603にメニュー推論結果が示す料理名が表示される。
図8(b)は、その後にメニューリストを受信した後の表示例である。メニューリスト表示領域602に受信したメニューリストが示す料理名を表示し、信頼度表示領域601に信頼度を示した記号を表示する。このとき、その他の検出結果表示領域603には、メニューリストに存在する食事であってすでに信頼度が判定された食事は削除される。
図8(a)から
図8(b)への遷移の例では御飯・グラタン・果物(オレンジ)・キャベツスープがその他の検出結果表示領域603から削除される。また、メニューリストにはない食事(
図8(b)の表示例で示すイタリアンサラダ)はその他の検出結果表示領域603から削除されずに、そのまま表示される。メニュー推論結果を先に受信したときに、仮に何も表示されていないとすると、ユーザーはシステムの故障や動作不良等を懸念してしまうか、レスポンスが悪い(応答性が低い)と感じてしまう可能性がある。そのため、メニュー推論結果を受信した時点で、メニューリストを受信していなくともメニュー推論結果をその他の検出結果表示領域603に表示することで、ユーザーはシステムが正常に処理していることを認識することができる。あるいは、好適な応答性であると感じることができる。
【0050】
S411では、CPU201は、食器の検出数0個が規定回数以上繰り返されたか否かを判定する。すなわち、ウェアラブル端末120によって撮像された画像から検出対象物が検出されない状態が規定回数以上繰り返されたか否かを判定する。検出数0個が規定回数以上繰り返された場合はS410へ進み、そうでない場合は処理を終了する。規定回数は例えば60回である。これは、撮像のフレームレートが30fpsであり、サーバ110への画像送信とサーバ110での画像認識の処理も同じフレームレートで行えるとすれば、2秒に相当する。なお、検出数0個である状態を判定することができるのであれば回数でなくとも良く、例えば一定時間検出数0個が続いているか否かを判定するといった方法でも良い。
【0051】
S412では、CPU201は、結果表示エリア600と背景画像610を初期化する。初期化した後は
図6のように、信頼度表示領域601、メニューリスト表示領域602,その他の検出結果表示領域603が空欄の表示となり、ウェアラブル端末120から次の映像が送信されるまで待機する。この表示をみることで、ユーザーは、いったんリセットされたことを認識できる。すなわち、次に信頼度表示領域601、メニューリスト表示領域602,その他の検出結果表示領域603に表示される内容は、これから撮影する料理のセット(次のトレーの料理群)に関するものであり、過去に撮影された料理のセットに関するものとは違うことを確認することができる。
【0052】
S411の判定は、メニュー推論結果に基づく判定ではなく、食器有無の検出結果に基づいて判定している。食器有無の検出処理(後述する
図5のS523の処理)は、メニュー推論処理(後述するS535の処理)に比べると、検出対象物の種別の検出までは行わない分、少ない処理負荷で高速に処理を行うことが可能であり、かつ、確実な処理結果(信頼度の高い処理結果)を得ることができる。そのため、S411の判定を検出対象物の種別の検出までは行わない食器有無の検出結果に基づいて行うようにすることで、ユーザーの意図に沿ったより好適なタイミングで結果表示エリア600の表示内容をリセットすることができる。例えば、ウェアラブル端末120を装着した作業者(ユーザー)が連続して複数のトレー上の配膳メニューをチェックする際に、トレーとは関係のないところをあえて2秒みる(顔を向けて撮影範囲を変更して2秒まつ)といった動作をするだけで確実にリセットをすることができる。あるいは、トレーの入れ替えの際に自然と2秒、トレー以外をみることになるような運用であれば、作業者がリセットするための意識的な動作を行わなくてもリセットを行える。作業者はリセットのために手を使わないので、手を使った他の作業を阻害しない。また、メニュー推論処理よりも確実な判定条件としているため、実際にはトレー上の食器を見続けている(撮影し続けている)のに、画像認識結果の不確実性のために食器が検出されず、意図せずリセットされてしまうということも起こりくい。すなわち、意図しないリセットも抑制される。仮に、S411の判定条件を食器の有無ではなく、メニュー推論の結果で料理の種別が検出されない状態が一定時間(一定回数)続いたという判定条件とした場合は、実際にはトレー上の食器を見続けている(撮影し続けている)のにも関わらず意図せずリセットされてしまうということが比較的起こりやすくなってしまう。
【0053】
次に
図5(a)~
図5(c)を参照して、本発明の実施形態における、サーバ110の処理について説明する。なお、各ステップの処理は、サーバ110のCPU111がROM113に記録されたプログラムをRAM112に展開して実行することで実現する。ウェアラブル端末120によって撮像された画像をクライアント端末100から受信すると、
図5(a)の処理が開始される。
【0054】
S501では、サーバ110のCPU111は、サーバプログラムを起動させる。
【0055】
S502では、サーバ110のCPU111は、メニューDB130から現在日時に対応する候補メニューを取得する。例えば、10時に次の昼食のメニューを取得するように設定しておいて、その設定時刻になったら昼食のメニューが含まれた候補リストをメニューDB130から取得する。
【0056】
S503では、サーバ110のCPU111は、スマートグラスからの映像(スマートグラス120で撮像された画像)をクライアント端末100から受信する。ここで受信する画像は、前述した
図3のS304で送信された画像である。
【0057】
S504では、サーバ110のCPU111は、S503で受信したスマートグラス120で撮像されたフレーム画像(1フレーム分の画像)をQRコードリーダのキューにキューイングする。
【0058】
S505では、サーバ110のCPU111は、S503で受信したスマートグラス120で撮像されたフレーム画像(1フレーム分の画像)を画像認識のキューにキューイングする。
【0059】
S506では、サーバ110のCPU111は、再起動予定時刻を過ぎたか否かを判定する。再起動予定時刻を過ぎた場合はS507へ進み、そうでない場合はS503へ戻る。再起動予定時刻とは、メニューDBから候補リストを取得するために設定された時刻のことを指す。再起動予定時刻を過ぎた場合、次の時刻に対応する候補メニューを取得するためにサーバプログラムを再起動させる。
【0060】
S507では、サーバ110のCPU111は、サーバプログラムを終了させ、S501に進み、再起動させる。
【0061】
次に
図5(b)を参照して、サーバ110によるQRコード読み取り処理について説明する。S504でQRコードリーダのキューにデータがキューイングされると
図5(b)の処理が開始される。
【0062】
S511では、サーバ110のCPU111は、QRコードリーダのキューからデータの取得を開始する。ここで取得されるデータは、S504でキューイングされた画像(スマートグラス120で撮像されたフレーム画像)である。
【0063】
S512では、サーバ110のCPU111は、キューにデータがあるか否かを判定する。データがある場合はS513へ進み、データがない場合はS511へ戻る。
【0064】
S513では、サーバ110のCPU111は、S511で取得したデータに含まれるフレーム画像からQRコードの位置を検出する。例えば、画像に配膳トレー140に置いてあるQRコードが写っていればその位置を検出する。
【0065】
S514では、サーバ110のCPU111は、QRコードの位置検出に成功したか否かを判定する。QRコードの位置検出に成功した場合はS515へ進み、失敗した場合(QRコードが写っていない画像である場合)はS511へ戻る。
【0066】
S515では、サーバ110のCPU111は、S514で検出したQRコード(S511で取得したデータに含まれるフレーム画像に写っているQRコード)のデコードを開始する。
【0067】
S516では、サーバ110のCPU111は、QRコードのデコードに成功したか否かを判定する。デコードに成功した場合はS517へ進み、失敗した場合はS511へ戻る。
【0068】
S517では、サーバ110のCPU111は、デコード結果をクライアント端末100に送信する。すなわち、デコードした結果取得したメニューリストをクライアント端末100に送信する。その後はS511へ戻り、次のデータをキューから取得する。ここで送信されたメニューデータが、前述した
図3の305で受信された場合、前述した
図4のS401でYesと判定される。
【0069】
次に
図5(c)を参照して、サーバ110による画像認識処理について説明する。S505で画像認識のキューにデータがキューイングされると、
図5(c)の処理が開始される。
【0070】
S521では、サーバ110のCPU111は、画像認識のキューからデータの取得を開始する。ここで取得されるデータは、S505でキューイングされた画像(スマートグラス120で撮像されたフレーム画像)である。
【0071】
S522では、サーバ110のCPU111は、キューにデータがあるか否かを判定する。データがある場合はS523へ進み、データがない場合はS521へ戻る。
【0072】
S523では、サーバ110のCPU111は、S521で取得したデータに含まれるフレーム画像から食器の位置を検出する。この処理は、検出対象物である食器有無の検出処理であり、検出対象物である食器の種別の検出(例えば、大皿か小皿かまでの検出)までは行わない。検出対象物の種別の検出までは行わない分、後述するS525のメニュー推論処理による料理の種別の検出よりも、少ない処理負荷で高速に処理を行うことが可能であり、かつ、後述するS525のメニュー推論処理による料理の種別の検出よりも確実な処理結果(信頼度の高い処理結果)を出力可能である。食器は、後述するS525のメニュー推論処理が検出対象物とする料理を包含する物品(器)である。すなわち、S523で食器が検出されなければS525の処理で検出されるべき料理も無いと想定できる。また、S523で食器が検出されれば、S525の処理で検出されるべき料理が、画像中の食器の内側の領域にあると想定できる。
【0073】
S524では、サーバ110のCPU111は、S523で検出した食器検出数をクライアント端末100に送信する。ここで送信された食器検出数に基づいて、前述したS411の判定が行われる。
【0074】
S525では、サーバ110のCPU111は、S521で取得したデータに含まれるフレーム画像からメニューの推論を行う。より詳しくは、S521で取得した画像を、予め用意された学習済みデータに入力することで推論処理を行い、結果として画像に含まれる料理の種別(料理名、品目)と、その推論スコア(信頼度)を取得する。ここで行われる推論処理は画像から検出対象物を検出する画像認識処理の一種であり、検出対象物である料理の有無だけではなく、料理の種別までを検出する処理である。例えば、検出対象物である料理の種別がハンバーグであるかカレーであるか、という検出まで必要な処理である。検出対象物の種別の検出まで行う分、前述したS523の食器の有無の検出処理よりも、高い処理負荷が必要であり、処理時間がかかる。また、S524の食器の有無の検出処理に比べれば検出結果の精度は高くない(信頼度が相対的に低い)。
【0075】
S526では、サーバ110のCPU111は、S525の処理で検出された料理(品目)のそれぞれについて、推論スコアが閾値以上であるか否かを判定する。そして、推論スコアが閾値以上である料理について、料理名(料理の種別、品目)とそのスコアとを、S527で送信するメニュー推論結果に含める。推論スコアが閾値未満である料理については、その料理名とスコアはS527で送信するメニュー推論結果には含めない。推論スコアが極端に低い料理の検出結果をクライアント端末100に送信すると、メニュー推論結果とメニューリストとの比較を正確に行うことが出来なくなる。そのために閾値を設定して、ある程度信頼性のおける結果だけをクライアント端末100に送信する。
【0076】
S527では、サーバ110のCPU111は、メニュー推論結果をクライアント端末100に送信する。すなわち、配膳トレー140上の食事の種別を推論した結果をクライアント端末100に送信する。その後はS521へ戻り、次のデータをキューから取得する。S527で送信されたメニュー推論結果が前述の
図3のS305で受信された場合に、前述の
図4のS406でYesと判定される。
【0077】
本実施形態の信頼度表示領域601の表示によれば、画像認識での検出処理の結果の信頼度をユーザーが効率的に確認できる仕組みを提供することができる。
【0078】
仮に、本実施形態を適用せず、画像認識の判定結果を信頼度表示領域601に「正」か「誤」の二択で表示する場合を想定する。この場合、たとえ判断が難しいとしてもいずれかに割り当てられてしまうため、「誤」と表示されていても判定結果が正しくなく、実際には正しい料理(メニューリストにある料理)が画像に含まれている可能性がある。これに対し、本実施形態によれば、〇△×のような記号で信頼度を表示している。そのため、画像認識での判断が難しい場合は△もしくは×に割り当てられるので、ユーザーはその部分について画像認識での正誤を対象物の目視で確認することを重点的に行うことが出来る。例えば、「正」か「誤」の二択で表示する場合に「誤」と表示されるような場合でも、本実施形態であれば「△」と表示されるケースがあり、ユーザーはその品目の料理について、画像認識の結果だけで判断することなく、実物を目視しての確認を怠ることなく行うことができる。また、「正」か「誤」の二択で表示する場合に「正」と表示されるような場合でも、本実施形態であれば「〇」または「△」と表示されるケースがあり、ユーザーはその品目の料理について、画像認識の結果だけで判断することなく、実物を目視しての確認を怠ることなく行うことができる。
【0079】
また、上記の仮の想定における、画像認識の判定結果の正誤を一つ一つ確認するとなると、多くの時間や労力を費やしてしまう。これに対し、本実施形態によれば、検出結果の信頼度が低いところのみを人がチェックするようにすることが出来る。そのため、確認が必要なところのみを人が確認していくことで、作業時間を短縮できたり、確認する労力を減らしたりできる。
【0080】
また、本実施形態によれば、ディスプレイ122に結果表示エリア600を表示する際、ライブビュー上において、あるいは、ディスプレイ122を透過した被写体光の位置に対して、メニュー推論処理や食器の検出処理で検出された検出対象物がどこかという位置を示す表示は行わない。これによって、目視での確認が容易な画面を表示することができる。仮に、本実施形態を適用せず、ディスプレイ122上で検出対象物の位置を示す枠等を含めた情報を表示しようとする場合を想定する。その場合、ディスプレイ122の画面上での対象物の位置の動きが大きいと、位置を示す表示を対象物の位置にリアルタイムで追従することが難しく、正しい位置を示せない可能性がある。また、正しい位置を示せたとしても動きが大きすぎて煩雑な表示となる。これに対して、本実施形態によれば、検出対象物の位置を示す枠等の情報を表示せず、表示位置が固定された結果表示エリア600内の固定された領域(601~603)に記号と文字を表示することで、目視での確認が容易になる。また、メガネ型デバイスのように表示画面のサイズが小さい端末機器を活用する場合、検出された物品の位置を示す情報が表示されると、画面上が煩雑になり情報が読み取りにくくなる。これに対し、本実施形態によれば、リストと検出結果を記号と文字で表示しており、検出された物品の位置を示す情報は表示されない。そのため、ユーザーにとって見やすい画面を提供することが可能になる。
【0081】
また、本実施形態によれば、比較対象の情報(メニューリスト)に無い対象物が画像認識(メニュー推論処理)で検出された場合に、より有益な情報を表示する仕組みを提供することができる。具体的には、比較対象の情報(メニューリスト)に無い対象物が画像認識(メニュー推論処理)で検出された場合に、その他の検出結果表示領域603にその検出物の種別(料理の品目名)を表示する。
【0082】
また、本実施形態によれば、検出対象物を確実に検出できない状況であっても、作業の妨げを抑止しながらも表示情報の意図しない更新を抑止できる仕組みを提供することができる。仮に、本実施形態を適用せず、検出対象が食事のメニューの場合であって、その検出結果の信頼度が低い状態が続くことにより結果がリセットされてしまう場合、トレーを見続けているにも関わらず頻繁に結果がリセットされてしまう。これに対し、本実施形態によれば、食器の縁を検出している。これにより、食事のメニューを検出対象とするよりも、検出結果のレスポンスが早くなり、頻繁にリセットされることを防ぐことが出来る。
【0083】
また、本実施形態によれば、比較対象物情報(正解メニューリスト)の取得と画像認識結果(メニュー推論処理の結果)の取得との取得順にかかわらず好適な表示を行える。メニューリストの情報を持つQRコード(登録商標)が印字された紙が食器等によって隠れていたり、トレーから落ちているために、QRコードの読込が行えていないこともあり得る。しかし、多くのトレーを素早く確認していると、QRコードを正確に認識できていないことに気付かない可能性がある。これに対し、本実施形態によれば、先にメニュー推論処理の結果をその他の検出結果表示領域603に表示しておくことで、既にメニュー推論処理は終了しており、後はリストの取得待ち、すなわちQRコードの読込待ちであることをユーザが認識できる。そのため、印刷された紙からコードが取得できていない(撮影できていない)と把握でき、紙の行方が分からなくなっていることに気付くことができる。すなわち、信頼度表示領域601、メニューリスト表示領域602に結果の表示がされない場合にも原因に素早く気付いて解決をする一助となり、作業が長く中断してしまうことを抑制することができる。
【0084】
なお、上述の実施形態では、クライアント端末100を通して、ウェアラブル端末120上に画面を表示する例を説明したが、これに限るものではない。クライアント端末100を間に入れずに、ウェアラブル端末120とサーバ110を、ネットワーク101を介して直接繋げる構成であってもよい。その場合、上述の実施形態で説明したクライアント端末100が主体となる動作を、これに代わってウェアラブル端末120が主体となって動作する。
【0085】
また、ウェアラブル端末120で撮像された画像をクライアント端末100からサーバ110に送信し、サーバ110で画像認識処理を行い、クライアント端末100で画像認識処理の結果に応じた表示を行う例を説明したが、これに限るものではない。サーバ110で行うものとして説明した
図5(a)~
図5(c)の画像認識処理を、クライアント端末100で行うようにしてもよい。また、サーバ110で行うものとして説明した
図5(a)~
図5(c)の画像認識処理と、
図4で行うものとして説明した表示制御処理を含む処理を、ウェアラブル端末120で行うようにしても良い。
【0086】
本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【0087】
なお、CPU201、CPU111が行うものとして説明した上述の各種制御は1つのハードウェアが行ってもよいし、複数のハードウェア(例えば、複数のプロセッサーや回路)が処理を分担することで、装置全体の制御を行ってもよい。
【0088】
また、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。さらに、上述した各実施形態は本発明の一実施形態を示すものにすぎず、各実施形態を適宜組み合わせることも可能である。
【0089】
また、上述した実施形態は、クライアント端末100を携帯電話端末(スマートフォン)に適用した場合を例にして説明したが、これはこの例に限定されず、画像処理により検出された対象物と、検出されるべき物品のリストを比較した結果を表示可能な装置であれば適用可能である。すなわち、パーソナルコンピュータやPDA、携帯型の画像ビューワー、タブレット端末、ゲーム機、電子ブックリーダー、ヘッドマウントディスプレイなどに適用可能である。
【0090】
さらに、上述した実施形態においては、トレー上の食事(料理)を撮影した画像から画像認識によって画像に含まれる料理の品目(種別)検出し、同じトレー上にあるQRコードから取得した正解メニューリストを比較した結果を表示する例を説明した。しかしこれに限るものでは無く、被写体を撮影して得られた画像から画像認識によって検出された物品と、別途取得される情報であって、本来あるべき物品のリストとを比較した結果を表示するものであれば本発明を適用可能である。例えば、物流倉庫へ商品を入荷、または、出荷する際に商品の種類と数量が正しいかどうかをチェックする検品作業の際などにも適用可能である。また、工場などにおいて、組み立て部品を保存棚等からピックアップした結果を撮影し、本来ピックアップすべき部品と一致しているかどうかを確認する際などにも適用可能である。また、処方箋に基づいて薬をピックアップした結果を撮影し、処方箋と一致しているかを確認する際などにも適用可能である。本来あるべき物品のリストの取得方法もQRコードを撮影して取得する方法に限るものではなく、サーバーと通信して取得するなど他の方法で取得してもよい。
【0091】
(他の実施形態)
本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み出して実行する処理である。この場合、そのプログラム、及び該プログラムを記憶した記憶媒体は本発明を構成することになる。
【符号の説明】
【0092】
100 クライアント端末
101 ネットワーク
110 サーバ
120 ウェアラブル端末
130 メニューDB
140 配膳トレー