IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社東芝の特許一覧 ▶ 東芝電機サービス株式会社の特許一覧

特開2024-179951コーディング装置およびコーディング処理プログラム
<>
  • 特開-コーディング装置およびコーディング処理プログラム 図1
  • 特開-コーディング装置およびコーディング処理プログラム 図2
  • 特開-コーディング装置およびコーディング処理プログラム 図3
  • 特開-コーディング装置およびコーディング処理プログラム 図4
  • 特開-コーディング装置およびコーディング処理プログラム 図5
  • 特開-コーディング装置およびコーディング処理プログラム 図6
  • 特開-コーディング装置およびコーディング処理プログラム 図7
  • 特開-コーディング装置およびコーディング処理プログラム 図8
  • 特開-コーディング装置およびコーディング処理プログラム 図9
  • 特開-コーディング装置およびコーディング処理プログラム 図10
  • 特開-コーディング装置およびコーディング処理プログラム 図11
  • 特開-コーディング装置およびコーディング処理プログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024179951
(43)【公開日】2024-12-26
(54)【発明の名称】コーディング装置およびコーディング処理プログラム
(51)【国際特許分類】
   G06V 30/24 20220101AFI20241219BHJP
   G06V 30/424 20220101ALI20241219BHJP
【FI】
G06V30/24 620D
G06V30/424
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023099301
(22)【出願日】2023-06-16
(71)【出願人】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(71)【出願人】
【識別番号】598076591
【氏名又は名称】東芝インフラシステムズ株式会社
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(72)【発明者】
【氏名】石倉 雅也
(72)【発明者】
【氏名】堺 裕之
(72)【発明者】
【氏名】朝日 一隆
【テーマコード(参考)】
5B064
【Fターム(参考)】
5B064AA04
5B064EA07
5B064EA11
5B064EA27
5B064EA35
5B064EA36
5B064EA37
5B064EA39
(57)【要約】
【課題】文字列の認識率を向上できるコーディング装置およびコーディング処理プログラムを提供する。
【解決手段】実施形態によれば、コーディング装置は、通信部とプロセッサとを有する。通信部は、物品を撮影した複数の撮影画像から選出されたオリジナル画像と複数の撮影画像のサムネイル画像とを取得する。プロセッサは、オリジナル画像に対する宛先の文字列の認識に失敗した場合、オリジナル画像以外の撮影画像のサムネイル画像から宛先領域を検出し、宛先領域が検出されたサムネイル画像の撮影画像をオリジナル画像に入れ替えて宛先の文字列を認識する処理を行う。
【選択図】 図3
【特許請求の範囲】
【請求項1】
物品を撮影した複数の撮影画像から選出されたオリジナル画像と前記複数の撮影画像のサムネイル画像とを取得する通信部と、
前記オリジナル画像に対する宛先の文字列の認識に失敗した場合、前記オリジナル画像以外の撮影画像のサムネイル画像から宛先領域を検出し、
前記宛先領域が検出されたサムネイル画像の撮影画像をオリジナル画像に入れ替えて宛先の文字列を認識する処理を行う、
プロセッサと、
を有するコーディング装置。
【請求項2】
前記通信部は、前記物品を処理する物品処理システムの制御装置が宛先の文字列の認識に失敗した撮影画像をオリジナル画像として受信し、
前記プロセッサは、前記制御装置による宛先の文字列の認識とは異なる第2のアルゴリズムに従った文字認識処理によってオリジナル画像に対する宛先の文字列を認識する、
請求項1に記載のコーディング装置。
【請求項3】
操作部に接続する操作インターフェースと、
表示部に接続する表示インターフェースと、を備え、
前記プロセッサは、オリジナル画像に対する宛先の文字列を認識に失敗した場合、前記オリジナル画像と前記複数の撮影画像のサムネイル画像とを前記表示部に表示し、前記操作部に入力された宛先情報を前記制御装置へ送信する、
請求項2に記載のコーディング装置。
【請求項4】
他のコーディング装置が表示する表示画面の画像データを取得する画像インターフェースと、
前記他のコーディング装置に入力する操作信号を生成するエミュレータに接続するエミュレータインターフェースと、
前記画像インターフェースにより物品を撮影した複数の撮影画像から選出されたオリジナル画像と前記複数の撮影画像のサムネイル画像とを表示する前記他のコーディング装置の表示画面の画像データを取得し、
前記表示画面におけるオリジナル画像に対する宛先の文字列の認識に失敗した場合、前記オリジナル画像以外の撮影画像のサムネイル画像から宛先領域を検出し、
前記宛先領域が検出されたサムネイル画像の撮影画像を前記オリジナル画像に入れ替える入替操作を前記エミュレータインターフェースによりエミュレータに送信した後、前記他のコーディング装置が入替操作に応じてオリジナル画像となる撮影画像を入れ替えた表示画面の画像データを前記画像インターフェースにより取得し、
前記表示画面における入れ替え後のオリジナル画像に対する宛先の文字列を認識する文字認識を実行する、
プロセッサと、
を有するコーディング装置。
【請求項5】
前記プロセッサは、
前記表示画面における入れ替え後のオリジナル画像における宛先領域の状態に応じて前記オリジナル画像を変形する変形操作を前記エミュレータインターフェースによりエミュレータに送信し、
前記他のコーディング装置が前記変形操作に応じて変形したオリジナル画像を表示する表示画面の画像データを前記画像インターフェースにより取得し、
前記表示画面における変形後のオリジナル画像に対する宛先の文字列を認識する文字認識を実行する、
請求項4に記載のコーディング装置。
【請求項6】
前記画像インターフェースは、前記物品を処理する物品処理システムの制御装置に接続する他のコーディング装置の表示インターフェースに接続され、
前記エミュレータインターフェースは、前記他のコーディング装置の操作インターフェースにエミュレータを介して接続され、
前記プロセッサは、前記制御装置による宛先の文字列の認識とは異なる第2のアルゴリズムに従った文字認識処理によってオリジナル画像に対する宛先の文字列を認識する、
請求項4又は5の何れか1項に記載のコーディング装置。
【請求項7】
操作部に接続する操作インターフェースと、
表示部に接続する表示インターフェースと、を備え、
前記プロセッサは、前記画像インターフェースにより取得する前記他のコーディング装置が生成する表示画面に対する宛先の文字列の認識に失敗した場合、前記表示画面を前記表示部に表示し、前記操作部に入力された宛先情報を前記エミュレータインターフェースによりエミュレータに送信する、
請求項6に記載のコーディング装置。
【請求項8】
コンピュータに、
物品を撮影した複数の撮影画像から選出されたオリジナル画像と前記複数の撮影画像のサムネイル画像とを取得する機能と、
前記オリジナル画像に対する宛先の文字列の認識に失敗した場合、前記オリジナル画像以外の撮影画像のサムネイル画像から宛先領域を検出する機能と、
前記宛先領域が検出されたサムネイル画像の撮影画像をオリジナル画像に入れ替えて宛先の文字列を認識する処理を行う機能と、
を実現させるコーディング処理プログラム。
【請求項9】
他のコーディング装置が表示する表示画面の画像データを取得する画像インターフェースと、前記他のコーディング装置に入力する操作信号を生成するエミュレータに接続するエミュレータインターフェースとを備えるコンピュータに、
前記画像インターフェースにより物品を撮影した複数の撮影画像から選出されたオリジナル画像と前記複数の撮影画像のサムネイル画像とを表示する前記他のコーディング装置の表示画面の画像データを取得する機能と、
前記表示画面におけるオリジナル画像に対する宛先の文字列の認識に失敗した場合、前記オリジナル画像以外の撮影画像のサムネイル画像から宛先領域を検出する機能と、
前記宛先領域が検出されたサムネイル画像の撮影画像を前記オリジナル画像に入れ替える入替操作を前記エミュレータインターフェースによりエミュレータに送信した後、前記他のコーディング装置が入替操作に応じてオリジナル画像となる撮影画像を入れ替えた表示画面の画像データを前記画像インターフェースにより取得する機能と、
前記表示画面における入れ替え後のオリジナル画像に対する宛先の文字列を認識する文字認識を実行する機能と、
を実現させるコーディング処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、コーディング装置およびコーディング処理プログラムに関する。
【背景技術】
【0002】
従来、物品処理システムで宛先の文字列が認識できなかった画像に対して、宛先を特定するためのビデオコーディングディスク(VCD)と呼ばれるコーディング装置がある。また、近年では、処理対象とする物品を複数の方向から撮影し、複数の撮影画像から宛先の文字列が含まれる撮影画像(オリジナル画像)を検出して文字認識を行う物品処理システムがある。このような物品処理システムは、宛先の文字列が認識できなかった場合、宛先の文字列の認識対象としたオリジナル画像と共に、オリジナル画像以外の撮影画像をサムネイル画像としてVCDへ供給する。
【0003】
従来のVCDは、物品処理システムからのオリジナル画像に対して物品処理システムとは異なるアルゴリズムで文字認識を行うことで宛先の文字列の認識を行い、認識に失敗した場合にオペレータに宛先の入力を行わせる。しかしながら、物品処理システムが検出したオリジナル画像に宛先がなく、サムネイル画像とした撮影画像に宛先の記載があることが有り得る。従来のVCDでは、オペレータが宛先の文字列があるサムネイル画像を発見すると、オペレータが宛先のあるサムネイル画像を指定できる。この場合、VCDは、指定されたサムネイル画像の撮影画像をオリジナル画像に入れ替えて表示させた状態でオペレータによる宛先入力を受け付けるようになっている。すなわち、従来のVCDは、オリジナル画像に宛先がなく、サムネイル画像に宛先がある場合にオペレータの作業負荷が大きくなるという問題がある。
【0004】
また、近年では、既存のVCDに第2のコーディング装置を接続し、第2のコーディング装置での文字認識又はオペレータによる打鍵入力で宛先の文字列を特定するシステムも提案されている。第2のコーディング装置は、既存のVCDが表示部に表示する画像をキャプチャし、キャプチャした画像に対して文字認識を行うため、オリジナル画像に宛先がなく、サムネイル画像に宛先がある場合にオペレータの作業負荷が大きくなるという問題がある。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2021-140632号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記の課題を解決するために、文字列の認識率を向上できるコーディング装置およびコーディング処理プログラムを提供する。
【課題を解決するための手段】
【0007】
実施形態によれば、コーディング装置は、通信部とプロセッサとを有する。通信部は、物品を撮影した複数の撮影画像から選出されたオリジナル画像と複数の撮影画像のサムネイル画像とを取得する。プロセッサは、オリジナル画像に対する宛先の文字列の認識に失敗した場合、オリジナル画像以外の撮影画像のサムネイル画像から宛先領域を検出し、宛先領域が検出されたサムネイル画像の撮影画像をオリジナル画像に入れ替えて宛先の文字列を認識する処理を行う。
【図面の簡単な説明】
【0008】
図1図1は、第1実施形態に係るコーディング装置を含む認識システムの構成例を示すブロック図である。
図2図2は、第1実施形態に係る認識システムに含まれる物品処理システムの制御装置の構成例を示すブロック図である。
図3図3は、第1実施形態に係るコーディング装置としてのVCDの構成例を示すブロック図である。
図4図4は、第1実施形態に係るコーディング装置としてのVCDによる第1の動作例を説明するためのフローチャートである。
図5図5は、第1実施形態に係るコーディング装置としてのVCDが表示部に表示する表示画面の第1表示例を示す図である。
図6図6は、第1実施形態に係るコーディング装置が表示画面に表示するサムネイル画像と複数の撮影画像との関係例を示す図である。
図7図7は、第1実施形態に係るコーディング装置としてのVCDが表示部に表示する表示画面の第2表示例を示す図である。
図8図8は、第1実施形態に係るコーディング装置としてのVCDによる第2の動作例を説明するためのフローチャートである。
図9図9は、第2実施形態に係るコーディング装置を含む認識システムの構成例を示す図である。
図10図10は、第2実施形態に係るコーディング装置としての第2のコーディング装置の構成例を示すブロック図である。
図11図11は、第2実施形態に係るコーディング装置としての第2のコーディング装置の第1の動作例を説明するためのフローチャートである。
図12図12は、第2実施形態に係るコーディング装置としての第2のコーディング装置の第2の動作例を説明するためのフローチャートである。
【発明を実施するための形態】
【0009】
以下、各実施形態について、図面を参照して説明する。
(第1実施形態)
まず、第1実施形態について説明する。
図1は、第1実施形態に係るコーディング装置を含む認識システム101の構成例を示す図である。
第1実施形態に係る認識システム101は、物品処理システム1およびVCS(ビデオコーディングシステム)2を有する。物品処理システム1は、立体である物品に何れかの箇所に表示された宛先情報に基づいて物品を処理するシステムである。VCS2は、物品処理システム1からの画像に含まれる宛先情報を特定し、特定した宛先情報を物品処理システム1へ返すシステムである。
【0010】
図1に示す構成例において、物品処理システム1は、ソータ6、カメラ7および制御装置8を有する。制御装置8は、ソータ6およびカメラ7に接続され、VCS2と通信可能に接続される。制御装置8は、宛先情報となる文字列を認識する文字認識処理を行う機能を有する。制御装置8は、カメラ7が撮影した撮影画像に対して文字認識おける宛先情報としての認識装置を
ソータ6は、物品を処理する処理装置の一例である。ソータ6は、制御装置8からの制御信号に基づいて処理対象とする物品を仕分先に区分する処理を行う。例えば、ソータ6は、制御装置8による制御信号に基づいて所定位置に供給された物品を当該物品に記載された宛先情報に応じた仕分先に仕分けする。ソータ6は、制御装置8が指定する仕分け先に各物品を仕分けする。例えば、ソータ6は、物品を特定するIDと当該物品の仕分先を示す情報(例えば、シュートの番号など)とを示す仕分情報を制御装置8から取得する。ソータ6は、制御装置8から取得する仕分情報に基づいて物品を仕分け処理する。
【0011】
カメラ7は、ソータ6が処理対象とする物品を撮影する。本実施形態において、処理対象とする物品が立体であるものとし、物品を形成する立体の何れか1面に宛先情報の文字列が記載(表示)されているものとする。カメラ7は、立体である物品を複数の方向から撮影するものとする。カメラ7は、ソータ6が処理対象とする物品を複数の方向から物品を撮影した複数の撮影画像を取得する設置される。カメラ7は、複数のカメラで複数方向からの撮影画像を取得するようにしても良いし、1つのカメラを移動させて複数方向から撮影した複数の撮影画像を取得するようにしても良い。カメラ7は、撮影した複数の撮影画像を制御装置8に送信する。
【0012】
なお、本実施形態において、処理対象とする物品としては、宛先情報が所定フォーマットの帳票に記載されて物品の表面に貼り付けられたものを想定して説明する。ただし、処理対象とする物品は、宛先情報としての文字が表面に何れかの箇所に表示されるものであれば良く、宛先情報が記載された任意の形式の帳票が貼付けられたものであっても良いし、宛先表示が物品の表面に記載又は印刷されたものであっても良い。
【0013】
制御装置8は、物品処理システム1を制御する。制御装置8は、カメラ7が処理対象の物品を複数の方向から撮影した複数の撮影画像を取得する。制御装置8は、複数の撮影画像から宛先情報の文字列を含む撮影画像をオリジナル画像として検出する。制御装置8は、複数の撮影画像から検出したオリジナル画像に対して宛先情報の文字列を認識する文字認識処理を行う。
【0014】
制御装置8は、宛先情報の認識に失敗した場合、当該物品のオリジナル画像とオリジナル画像以外の撮影画像のサムネイル画像とをVCS2へ送信し、VCS2から当該物品の宛先情報を取得する。制御装置8は、認識した宛先情報又はVCS2から取得した宛先情報に基づいてソータ6における当該物品の仕分先を設定する。例えば、制御装置8は、物品を識別するIDと当該物品の仕分先を示す情報とを含む仕分情報をソータ6に送信する。これにより、制御装置8は、宛先情報に基づいて物品を処理することを制御する。
【0015】
また、VCS2は、図1に示す構成例において、複数のVCD20(20a、20b、20c、20d)を有する。各VCD20(20a、20b、20c、20d)は、それぞれ操作部30(30a、30b、30c、30d)および表示部40(40a、40b、40c、40d)が接続される。操作部30は、オペレータが宛先情報などを入力する操作キーを操作装置である。表示部40は、操作部30による宛先情報の入力対象となる物品の画像を表示する表示装置である。
【0016】
各VCD20は、物品処理システム1から供給される撮影画像に対して文字認識処理(OCR処理)を行う。本実施形態において、各VCD20は、物品処理システム1の制御装置8から物品を撮影した複数の撮影画像の1つであるオリジナル画像とオリジナル画像以外の撮影画像のサムネイル画像とを取得する。オリジナル画像は、制御装置8が宛先の文字列が含まれると判定した画像(制御装置8が文字認識の対象とした画像)であり、サムネイル画像は、オリジナル画像以外の撮影画像である。
【0017】
VCD20は、制御装置8から取得したオリジナル画像に対して制御装置8とは別のアルゴリズムによる文字認識(第2の文字認識)を実行する。VCD20は、オリジナル画像に対する第2の文字認識で宛先の文字列が認識できた場合、第2の文字認識の認識結果である宛先情報を制御装置8へ送信する。
【0018】
また、VCD20は、第2の文字認識による宛先の文字列の認識に失敗した場合、サムネイル画像に対して宛先の文字列の領域(宛先領域)を検出する処理を行う。VCD20は、サムネイル画像から宛先領域が検出できた場合、宛先領域が検出されたサムネイル画像をオリジナル画像に入れ替える処理を行い、宛先領域が検出された画像をオリジナル画像として文字認識を実行する。VCD20は、入れ替えたオリジナル画像に対する文字認識で宛先の文字列が認識できた場合、文字認識の認識結果である宛先情報を制御装置8へ送信する。
【0019】
VCD20は、オリジナル画像を入れ替えても宛先の文字列が認識できなかった場合、サムネイル画像から宛先領域が検出できなかった場合、表示部40に制御装置8から取得した画像を表示し、オペレータによる操作部30を用いた宛先情報のキー入力を実行させる。VCD20は、オペレータが操作部30を用いて宛先情報をキー入力した場合、オペレータにより入力された宛先情報を制御装置8へ送信する。
【0020】
次に、第1実施形態に係る認識システム101における物品処理システム1の制御装置8における制御系の構成について説明する。
図2は、第1実施形態に係る認識システム101における物品処理システム1の制御装置8における制御系の構成例を示すブロック図である。
図2に示すように、制御装置8は、プロセッサ11、ROM12、RAM13、NVM14、カメラインターフェース(I/F)15、通信部16、操作部17及び表示部18、ソータインターフェース(I/F)19などを備える。
【0021】
プロセッサ11は、データバスおよびインターフェースなどを介して、ROM12、RAM13、NVM14、カメラインターフェース15、通信部16、操作部17、表示部18、ソータインターフェース19と通信可能に接続する。なお、制御装置8は、図2が示すような構成の他に必要に応じた構成をさらに具備したり、制御装置8から特定の構成が除外されたりしてもよい。
【0022】
プロセッサ11は、制御装置8全体の動作を制御する機能を有する。プロセッサ11は、内部キャッシュ及び各種のインターフェースなどを備えてもよい。プロセッサ11は、内部メモリ、ROM12又はNVM14が予め記憶するプログラムを実行することにより種々の処理を実現する。
なお、プロセッサ11がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ11は、ハードウエア回路により実行される機能を制御する。
【0023】
ROM12は、制御プログラム及び制御データなどが予め記憶された不揮発性のメモリである。ROM12に記憶される制御プログラム及び制御データは、制御装置8の仕様に応じて予め組み込まれる。
【0024】
RAM13は、揮発性のメモリである。RAM13は、プロセッサ11の処理中のデータなどを一時的に格納する。RAM13は、プロセッサ11からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM13は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。
【0025】
NVM14は、データの書き込み及び書き換えが可能な不揮発性のメモリである。例えば、NVM14は、例えば、HDD、SSD又はフラッシュメモリなどから構成される。NVM14は、制御装置8の運用用途に応じて制御プログラム、アプリケーション及び種々のデータなどを格納する。
【0026】
カメラインターフェース15は、カメラ7とデータを送受信するためのインターフェースである。カメラインターフェース15は、有線又は無線でカメラ7と通信接続するインターフェースである。カメラインターフェース15は、カメラ7からカメラ7が撮影した撮影画像を受信する。カメラインターフェース15は、受信した撮影画像をプロセッサ11に送信する。また、カメラインターフェース15は、カメラ7に電力を供給するものであっても良い。
【0027】
本実施形態において、カメラ7は、ソータ6が処理対象とする物品を複数の方向から撮影するものである。このため、カメラ7は、複数の方向から所定位置の物品を撮影する複数のカメラ機器(撮像部)で構成されるものであっても良い。カメラ7が複数のカメラ機器である場合、カメラインターフェース15は、カメラ7としての複数のカメラ機器に通信接続するためのインターフェースを含むものとする。
【0028】
通信部16は、VCS2における各VCD20とデータを送受信するためのインターフェースである。例えば、通信部16は、LAN(Local Area Network)接続をサポートするものである。また、通信部16は、USB(Universal Serial Bus)接続をサポートするものであっても良い。なお、通信部16は、制御装置8とデータを送受信するためのインターフェースを備えるものであれば良く、複数のVCD20に接続するためのルータやスイッチングハブなどの通信制御機器に接続するインターフェースであっても良い。
【0029】
操作部17は、オペレータから種々の操作の入力を受け付ける。操作部17は、入力された操作を示す信号をプロセッサ11へ送信する。操作部17は、キーボード、ボタン又はタッチパネルなどから構成される。
【0030】
表示部18は、プロセッサ11からの制御に基づいて情報を表示する。例えば、表示部18は、液晶モニタから構成される。操作部17がタッチパネルから構成される場合、表示部18は、操作部17と一体的に形成された液晶モニタから構成される。
【0031】
ソータインターフェース19は、ソータ6とデータを送受信するためのインターフェースである。例えば、ソータインターフェース19は、有線又は無線でソータ6と通信接続する。ソータインターフェース19は、ソータ6が処理対象とする物品に対する宛先情報に基づく仕分情報をソータ6へ供給する。また、ソータインターフェース19は、ソータ6における処理状況などを示す情報をソータ6から受信するようにしても良い。なお、ソータインターフェース19は、通信部16に含まれる構成としても良い。
【0032】
次に、第1実施形態に係るコーディング装置としてのVCD2におけるVCD20の構成について説明する。
図3は、第1実施形態に係るコーディング装置としてのVCD20における制御系の構成例を示すブロック図である。以下、VCD20a乃至20dは、同様の構成で実現できるため、VCD20として説明するものとする。
【0033】
図3に示すように、VCD20は、プロセッサ21、ROM22、RAM23、NVM24、通信部25、操作インターフェース(I/F)26及び表示インターフェース(I/F)27などを備える。プロセッサ21は、ROM22、RAM23、NVM24、通信部25、操作インターフェース26及び表示インターフェース27にデータバスなどを介して接続する。なお、VCD20は、図3が示すような構成の他に必要に応じた構成を具備したり、図3が示すような構成から特定の構成が除外されたりしてもよい。
【0034】
プロセッサ21は、VCD20全体の動作を制御する。また、プロセッサ21は、プログラムを実行する演算子以外に、内部キャッシュ及び各種のインターフェースなどを備えても良い。プロセッサ21は、内部メモリ、ROM22又はNVM24が記憶するプログラムを実行することにより種々の処理を実現する。
なお、プロセッサ21がプログラムを実行することにより実現する各種の機能のうち一部の機能は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ21は、ハードウエア回路により実行される機能を制御する。
【0035】
ROM22は、制御プログラム及び制御データなどが記憶された不揮発性のメモリである。ROM22に記憶される制御プログラム及び制御データは、VCD20の仕様に応じて組み込まれる。
【0036】
RAM23は、揮発性のメモリである。RAM23は、プロセッサ21の処理中のデータなどを一時的に格納する。RAM23は、プロセッサ21からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM23は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。また、RAM23は、送受信用のデータを一時記憶するバッファメモリとして使用しても良い。
【0037】
NVM24は、データの書き込み及び書き換えが可能な不揮発性のメモリである。例えば、NVM24は、例えば、HDD、SSD又はフラッシュメモリなどから構成される。NVM24は、VCD20の運用用途に応じて制御プログラム、アプリケーション及び種々のデータなどを格納する。
【0038】
通信部25は、制御装置8などとデータを送受信するための通信インターフェースである。例えば、通信部25は、有線又は無線の通信によるLAN(Local Area Network)接続をサポートするものである。また、通信部25は、USB(Universal Serial Bus)接続をサポートするものであっても良い。
【0039】
操作インターフェース26は、操作部30に接続するためのインターフェースである。例えば、操作インターフェース26は、オペレータが操作するキーボード又はマウスなどで構成される操作部30に入力される操作を示す操作信号を受信する。また、操作インターフェース26は、操作部30から受信した操作信号をプロセッサ21に供給する。
【0040】
表示インターフェース27は、オペレータが視認する表示画面を表示する表示部40に接続するためのインターフェースである。表示インターフェース27は、プロセッサ21による制御に応じて表示部40に表示させる表示画面を示す画像データを出力するインターフェースである。
【0041】
次に、第1実施形態に係る認識システム101における物品処理システム1の制御装置8の動作について説明する。
制御装置8は、プロセッサ11がROM12又はNVM14などに格納されるプログラムを実行することにより、物品処理システム1としての動作を制御するための種々の処理を行う。本実施形態において、制御装置8のプロセッサ11は、カメラ7が撮影する撮影画像における宛先の文字列を認識する文字認識機能を有するものとする。
【0042】
物品処理システム1が1つの物品を処理する場合、制御装置8のプロセッサ11は、カメラ7が処理対象とする物品を複数の方向から撮影した複数の撮影画像を取得する。ここで、カメラ7は、所定の撮影位置(撮影領域)にある物品を複数の方向から撮影する。
【0043】
例えば、カメラ7は、所定の撮影位置にある物品を複数の方向から撮影できるように複数の位置に設置した複数のカメラ機器で構成されるものとする。また、カメラ7は、所定の撮影領域にある物品に対する相対的な位置を移動しながら複数の方向から物品を撮影する1又は複数のカメラ機器で構成されるものであっても良い。本第1実施形態に係る制御装置8のプロセッサ11は、カメラインターフェース15によりカメラ7が処理対象とする1つの物品を複数方向から撮影した複数の撮影画像を取得する。
【0044】
プロセッサ11は、カメラ7が撮影した複数の撮影画像を取得すると、所定のアルゴリズム(第1のアルゴリズム)による文字認識処理によって撮影画像から宛先を認識する認識処理(第1の認識処理)を行う。プロセッサ11は、第1の認証処理において、複数の撮影画像から宛先の文字列の領域が含まれる撮影画像を検出する宛先領域の検出処理を行う。プロセッサ11は、宛先領域が検出された1つの撮影画像をオリジナル画像として選出し、オリジナル画像に対して宛先の文字列を認識する処理を行う。プロセッサ11は、第1の認識処理によって宛先の文字列の認識に成功した場合、文字認識の結果として得られた文字列を当該物品の宛先情報として特定する。
【0045】
また、プロセッサ11は、第1の認識処理による宛先の文字列の認識に失敗した場合、VCS2によって宛先情報を特定する処理を行う。すなわち、第1の認識処理で宛先の文字列が認識できなかった場合、プロセッサ11は、通信部16によりオリジナル画像と各撮影画像のサムネイル画像とを含むコーディング情報をVCS2に送信する。コーディング情報は、VCS2におけるVCD20に宛先情報の特定(コーディング)を要求する情報であり、処理対象とする物品の宛先を認識又は打鍵入力するためのコーディング処理用の画像を含む。
【0046】
コーディング処理用の画像は、処理対象とする物品の複数の撮影画像から選出した1つの撮影画像(オリジナル画像)と各撮影画像のサムネイル画像と含む。オリジナル画像は、文字認識処理に用いるフルサイズ(例えば、撮影サイズ)の画像データであり、サムネイル画像は、縮小表示用のフルサイズよりも小さいサイズの画像データであるものとする。ただし、制御装置8は、VCD20に対して、複数の撮影画像をフルサイズの画像データと複数の撮影画像におけるオリジナル画像を示す情報とをコーディング処理用の画像として送信するようにしても良い。この場合、複数の撮影画像のサムネイル画像はVCD20のプロセッサ21が生成するようにすれば良い。
【0047】
制御装置8のプロセッサ11は、物品の撮影画像から宛先情報が認識できなかった場合、VCD20a乃至20dから1つのVCD20を選択し、選択したVCD20にコーディング処理用の画像を含むコーディング情報を送信する。これに対して、VCD20は、コーディング情報に含まれるコーディング処理用の画像から宛先情報を特定し、特定した宛先情報を制御装置8に返信する。この結果として、制御装置8のプロセッサ11は、通信部16を通じてVCD20が特定する宛先情報を取得する。
【0048】
プロセッサ11は、第1の認識処理によって特定した宛先情報又はVCD20から取得した宛先情報に基づいて当該物品の仕分先を設定する。例えば、プロセッサ11は、宛先情報に基づいてソータ6において仕分先とする区分場所を設定する。例えば、プロセッサ11は、ソータ6における物品が投入される複数のシュート(区分場所)から処理対象とする物品の宛先情報の行政区画(都道府県又は市町村など)に対応するシュートを選択し、そのシュートを示す情報(シュートの番号など)を仕分先として設定する。プロセッサ11は、物品を特定するIDとIDで特定される物品の仕分先を示す情報とを含む仕分情報をソータインターフェース19によりソータ6に送信する。これにより、ソータ6は、制御装置8から供給される仕分情報に基づいて物品を仕分ける仕分処理を行う。
【0049】
次に、第1実施形態に係る認識システム101のVCS2におけるVCD20の動作について説明する。
VCD20は、プロセッサ21がROM22又はNVM24などに格納されるプログラムを実行することにより、物品処理システム1の制御装置8からの複数の撮影画像に対する宛先情報のコーディング処理を行う。前述の通り、制御装置8のプロセッサ11は、第1の認識処理に失敗した場合、当該物品のコーディング処理用の画像を含むコーディング情報をVCD20へ送信する。
【0050】
図4は、第1実施形態に係るコーディング装置としてのVDD20の第1の動作例を説明するためのフローチャートである。
VCD20は、通信部25により制御装置8から1つの物品を複数方向から撮影した複数の画像を含むコーディング情報を受信する(ステップS11)。プロセッサ21は、通信部25により制御装置8からの受信したコーディング情報をRAM23又はNVM24などのメモリに保持する。コーディング情報は、物品の識別情報(ID)に対応づけたコーディング処理用の画像を含む。コーディング処理用の画像は、フルサイズの画像データであるオリジナル画像と複数の撮影画像のサムネイル画像とを含むものとする。
【0051】
プロセッサ21は、コーディング情報から抽出したオリジナル画像に対して制御装置8での文字認識とは異なる第2のアルゴリズムの文字認識で宛先の文字列を認識する第2の認識処理を実行する(ステップS12)。プロセッサ21は、第2の認識処理によって宛先の文字列の認識に成功した場合(ステップS13、YES)、認識した宛先の文字列に基づいて生成する宛先情報を制御装置8へ送信し(ステップS14)、コーディング情報に対する処理(コーディング処理)を終了する。
【0052】
また、プロセッサ21は、オリジナル画像に対する第2の認識処理と並行して、コーディング情報に含まれるオリジナル画像以外の撮影画像から宛先情報を認識するサムネイル処理を実行する(ステップS21-S24)。ここで、VCD20は、制御装置8からコーディング情報に含まれるコーディング処理用の画像として制御装置8が指定するオリジナル画像(フルサイズの画像データ)と複数の撮影画像のサムネイル画像(サムネイルサイズの画像データ)とを受信しているものとする。
【0053】
プロセッサ21は、サムネイル処理として、オリジナル画像以外の撮影画像のサムネイル画像に対して宛先の文字列の領域(宛先領域)を検出する検出処理を行う(ステップS21)。例えば、宛先が所定フォーマットの帳票に記載されることを前提する場合、プロセッサ21は、各撮影画像のサムネイル画像において所定フォーマットの帳票らしい画像の領域を宛先領域として検出する。また、任意のフォーマットで物品の表面に宛先が記載されることを前提とする場合、プロセッサ21は、宛先らしい文字群(文字列群)の画像の領域を宛先領域として検出するようにしても良い。
【0054】
プロセッサ21は、どの撮影画像のサムネイル画像からも宛先領域が検出できなかった場合(ステップS22、NO)、制御装置8が指定するオリジナル画像以外からは宛先領域が検出できなかった旨をサムネイル処理の処理結果として保持する。
【0055】
また、プロセッサ21は、オリジナル画像以外の撮影画像から宛先領域が検出できた場合(ステップS22、YES)、宛先領域が検出された撮影画像をオリジナル画像に入れ替える入替処理を行う(ステップS23)。例えば、制御装置8が第1撮影画像をオリジナル画像に指定した場合、サムネイル画像の第2撮影画像から宛先領域が検出されると、プロセッサ21は、第2撮影画像のフルサイズの画像データを制御装置8から取得し、フルサイズの第2撮影画像をオリジナル画像に入れ替える。
【0056】
なお、VCD20は、制御装置8からコーディング情報に含まれるコーディング処理用の画像として複数の撮影画像をフルサイズの画像データを受信し、RAM23などのメモリに保持しておくようにしても良い。この場合、プロセッサ21は、オリジナル画像以外の撮影画像から宛先領域を検出し、オリジナル画像以外の撮影画像から宛先領域が検出できた場合に宛先情報が検出された第2撮影画像のフルサイズの画像をオリジナル画像とすれば良い。
【0057】
プロセッサ21は、オリジナル画像を入れ替えた場合、入れ替えたオリジナル画像に対して制御装置8とは異なる第2のアルゴリズムの文字認識処理によって宛先の文字列を認識する(ステップS24)。プロセッサ21は、入れ替えたオリジナル画像に対する第2のアルゴリズムによる文字認識処理による宛先の文字列の認識結果をサムネイル処理の処理結果として保持する。
【0058】
例えば、プロセッサ21は、入れ替えたオリジナル画像から宛先の文字列が認識できなかった場合、制御装置8が指定するオリジナル画像以外からは宛先情報が認識できなかった旨をサムネイル処理の処理結果として保持する。また、プロセッサ21は、入れ替えたオリジナル画像から宛先の文字列が認識できた場合、認識した宛先の文字列を含む宛先情報をサムネイル処理の処理結果として保持する。
【0059】
一方、プロセッサ21は、制御装置8が指定するオリジナル画像に対する宛先の文字列の認識に失敗した場合(ステップS13、NO)、上述したようなサムネイル処理を終了したか否かを判断する(ステップS15)。プロセッサ21は、サムネイル処理が終了していなければ(ステップS15、NO)、サムネイル処理の終了待ちとなる。
【0060】
第1の認識処理に失敗し、サムネイル処理が終了した場合(ステップS15、YES)、プロセッサ21は、サムネイル処理の結果として宛先情報の認識に成功したか否かを判断する(ステップS16)。サムネイル処理による宛先情報の認識に成功した場合(ステップS16、YES)、プロセッサ21は、サムネイル処理により認識した宛先情報を制御装置8へ送信し(ステップS14)、コーディング情報に対するコーディング処理を終了する。
【0061】
また、サムネイル処理による宛先情報の認識に失敗した場合(ステップS16、NO)、プロセッサ21は、コーディング情報のコーディング処理用の画像を表示部40に表示し、オペレータに操作部30を用いて宛先情報をキー入力させる打鍵入力処理を行う(ステップS17)。ここで、プロセッサ21は、オリジナル画像をメイン画像として表示し、サムネイル画像をサブ画像として表示部40の表示画面に表示する。
【0062】
図5は、VCD20がオリジナル画像とサムネイル画像とを含む表示画面を表示部40に表示した第1表示例である。図6は、表示画面における所定のサブ表示領域42にサムネイル画像として表示する複数の撮影画像の配置例を説明するための図である。図7は、図5に示すような表示画面のオリジナル画像を入替えた場合にVCD20が表示部40に表示する表示画面の第2表示例である。
【0063】
図5および図7に示す表示例において、表示部40は、メイン表示領域41、サブ表示領域42、および、入力表示領域43を含む表示画面(コーディング画面)を表示する。
メイン表示領域41は、処理対象とする物品に対する複数の撮影画像から選出された文字認識処理の対象とする1つの撮影画像をオリジナル画像として表示する。サブ表示領域42は、複数の表示領域421-425を有し、各表示領域421-425に複数の撮影画像のサムネイル画像(縮小画像)を表示する。入力表示領域43は、オペレータが入力した情報などを表示する。
【0064】
ここで、制御装置8は、図6に例示するように、カメラ7が処理対象とする立体の物品を5方向から撮影した5つの撮影画像を取得する。この場合、制御装置8は、コーディング処理用の画像として、5つの撮影画像から選出した1つの撮影画像であるオリジナル画像と5つの撮影画像のサムネイル画像とをVCD20へ供給する。VCD20は、制御装置8からのオリジナル画像をメイン表示領域41に表示し、5つの撮影画像のサムネイル画像をサブ表示領域42の各表示領域に表示する。
【0065】
図5乃至7に示す表示例において、サブ表示領域42は、5方向から撮影した5つの撮影画像に対応する5つの表示領域421、422、423、424、425を有する。図6に示すように、第1表示領域421には、物品の第1面(第1の方向から撮影される面)M1を撮影した撮影画像のサムネイル画像が表示される。第2表示領域422には、物品の第2面(第2の方向から撮影される面)M2を撮影した撮影画像のサムネイル画像が表示される。第3表示領域423には、物品の第3面(第3の方向から撮影される面)M3を撮影した撮影画像のサムネイル画像が表示される。第4表示領域424には、物品の第4面(第4の方向から撮影される面)M4を撮影した撮影画像のサムネイル画像が表示される。第5表示領域425には、物品の第5面(第5の方向から撮影される面)M5を撮影した撮影画像のサムネイル画像が表示される。
【0066】
メイン表示領域41に表示されるオリジナル画像411は、例えば、制御装置8が指定したオリジナル画像である。また、メイン表示領域41に表示されるオリジナル画像411は、サムネイル処理によって入れ替えたオリジナル画像(宛先領域が検出された撮影画像)であっても良い。
【0067】
メイン表示領域41に表示するオリジナル画像は、操作部30によるオペレータの指示に応じて切り替えられる。例えば、図5に示す第1表示例では、第5表示領域425を選択状態とし、第5表示領域425にサムネイル画像を表示している撮影画像のフルサイズの画像をオリジナル画像411としてメイン表示領域41に表示している。図5に示す表示状態において、オペレータが第1表示領域421に表示されているサムネイル画像を選択指示すると、プロセッサ21は、図7に示す第2表示例のように、第1表示領域421を選択状態とし、第1表示領域421にサムネイル画像を表示している撮影画像のフルサイズの画像をオリジナル画像412としてメイン表示領域41に表示する。
【0068】
オペレータは、図5又は図7に示す表示画面を目視(参照)しながら宛先情報を操作部30によりキー入力する。VCD20のプロセッサ21は、オペレータが操作部30を用いてキー入力する情報を取得することにより、オペレータがキー入力する宛先情報を取得する。プロセッサ21は、オペレータが操作部30を用いて宛先情報をキー入力すると、操作部30を用いて入力された宛先情報を制御装置8へ送信し(ステップS14)、コーディング情報に対するコーディング処理を終了する。
【0069】
次に、第1実施形態に係るコーディング装置としてのVDD20の第2の動作例について説明する。第2の動作例では、第1の動作例で並列処理として実行したサムネイル処理を制御装置8が指定するオリジナル画像に対する宛先の文字列の認識が失敗した場合に実行する。
図8は、第1実施形態に係るコーディング装置としてのVDD20の第2の動作例を説明するためのフローチャートである。
【0070】
VCD20は、通信部25により制御装置8から1つの物品を複数方向から撮影した複数の画像を含むコーディング情報を受信する(ステップS31)。プロセッサ21は、通信部25により制御装置8からの受信したオリジナル画像と複数の撮影画像のサムネイル画像とを含むコーディング情報をRAM23又はNVM24などのメモリに保持する。
【0071】
プロセッサ21は、コーディング情報から抽出するオリジナル画像に対して制御装置8での文字認識とは異なる第2のアルゴリズムの文字認識によって宛先の文字列を認識する第2の認識処理を行う(ステップS32)。プロセッサ21は、第2の認識処理によって宛先の文字列の認識に成功した場合(ステップS33、YES)、認識した宛先の文字列に基づいて生成する宛先情報を制御装置8へ送信し(ステップS34)、コーディング情報に対する処理(コーディング処理)を終了する。
【0072】
プロセッサ21は、制御装置8が指定するオリジナル画像に対する宛先の文字列の認識に失敗した場合(ステップS33、NO)、第1の動作例で説明したようなサムネイル処理を実行する(ステップS41-S44)。プロセッサ21は、サムネイル処理として、まず、オリジナル画像以外の撮影画像のサムネイル画像に対して宛先領域の検出処理を行う(ステップS41)。プロセッサ21は、サムネイル画像から宛先領域が検出できなかった場合(ステップS42、NO)、オリジナル画像以外からは宛先領域が検出できなかった旨をサムネイル処理の処理結果とし、ステップS46へ進む。
【0073】
プロセッサ21は、オリジナル画像以外の撮影画像から宛先領域が検出できた場合(ステップS42、YES)、宛先領域が検出された撮影画像をオリジナル画像に入れ替える入替処理を行う(ステップS43)。プロセッサ21は、オリジナル画像を入れ替えた場合、入れ替えたオリジナル画像に対して制御装置8での文字認識とは異なる第2のアルゴリズムの文字認識処理によって宛先の文字列を認識する(ステップS44)。プロセッサ21は、入れ替えたオリジナル画像に対する認識処理による宛先の文字列の認識結果をサムネイル処理の処理結果として保持する。
【0074】
サムネイル処理が終了すると、プロセッサ21は、サムネイル処理の結果として宛先情報の認識に成功したか否かを判断する(ステップS46)。サムネイル処理による宛先情報の認識に成功した場合(ステップS46、YES)、プロセッサ21は、サムネイル処理により認識した宛先情報を制御装置8へ送信し(ステップS34)、コーディング情報に対するコーディング処理を終了する。
【0075】
また、サムネイル処理による宛先情報の認識に失敗した場合(ステップS46、NO)、プロセッサ21は、オリジナル画像と複数の撮影画像のサムネイル画像とを表示部40に表示し、オペレータに操作部30を用いて宛先情報をキー入力させる打鍵入力処理を行う(ステップS47)。プロセッサ21は、オペレータが操作部30を用いて宛先情報をキー入力すると、操作部30を用いて入力された宛先情報を制御装置8へ送信し(ステップS34)、コーディング情報に対するコーディング処理を終了する。
【0076】
以上のように、第1実施形態に係るコーディング装置としてのVCDは、処理対象とする物品を複数方向から撮影した複数の撮影画像から物品処理システムの制御装置が選出されたオリジナル画像と複数の撮影画像のサムネイル画像とを含むコーディング情報を取得し、オリジナル画像に対する宛先の文字列の認識に失敗した場合にサムネイル画像から宛先領域を検出し、宛先領域が検出されたサムネイル画像の撮影画像をオリジナル画像に入れ替えて宛先の文字列を認識する処理を行う。
【0077】
これにより、第1実施形態によれば、物品処理システムが選出するオリジナル画像に対する文字認識に失敗しても、宛先領域が検出できたサムネイル画像の撮影画像をオリジナル画像に入れ替えて文字認識を行うことができ、最終的な文字認識率を向上させることができる。この結果、コーディング装置による宛先情報の入力作業(コーディング処理)の生産性を向上させることができる。
(第2実施形態)
次に、第2実施形態について説明する。
図9は、第2実施形態に係るコーディング装置を含む認識システム102の構成例を示す図である。
第2実施形態に係る認識システム102は、物品処理システム1、VCS2、および、第2のコーディングシステム5(5A、5B、5C、5D)を有する。物品処理システム1およびVCS2は、上述した第1実施形態で説明したものと同様のハードウエア構成を有するものであっても良い。このため、物品処理システム1およびVCS2の構成については詳細な説明を省略する。
【0078】
ただし、第2実施形態において、VCS2を構成する各VCD20は、第2のアルゴリズムによる文字認識処理を行わないものとし、操作インターフェース26および表示インターフェース27に第2のコーディングシステム5を接続する。VCD20の操作インターフェース26は、後述する第2のコーディングシステム5のキーボード(KB)/マウスエミュレータ(単に、エミュレータとも称する)60に接続し、キーボード/マウスエミュレータ60からの操作信号を受信する。また、VCD20の表示インターフェース27は、後述する第2のコーディングシステム5のキャプチャボード70に接続し、VCD20が表示する表示画面を表示するための画像データ(表示装置に表示画面を表示させるための表示データ)をキャプチャボード70に送信する。
【0079】
第2実施形態において、各VCD20は、物品処理システム1からコーディング情報を受信した場合、コーディング情報に含まれるオリジナル画像とサムネイル画像とを表示する表示画面を表示インターフェース27により第2のコーディングシステム5へ供給し、表示画面に対する宛先情報を操作インターフェース26により第2のコーディングシステム5からキー入力情報として取得し、第2のコーディングシステム5から取得するキー入力情報に基づく宛先情報を物品処理システム1へ送信するように動作する。
【0080】
次に、第2実施形態に係るコーディング装置の一例である第2のコーディング装置50を有する第2のコーディングシステム5の構成について説明する。
なお、第2のコーディングシステム5A乃至5Dは、同様の構成であるため、第2のコーディングシステム5として説明し、第2のコーディング装置50a乃至50dは、同様の構成であるため、第2のコーディング装置5として説明する。
【0081】
図9に示すように、第2実施形態に係る第2のコーディングシステム5は、第2のコーディング装置50、キーボード/マウスエミュレータ(エミュレータ)60、キャプチャボード70、操作部80および表示部90を有する。第2のコーディング装置50とVCD20とは、キーボード(KB)/マウスエミュレータ60およびキャプチャボード70を介して接続される。操作部80および表示部90は、第2のコーディング装置50に接続される。
【0082】
図10は、第2実施形態に係るコーディング装置の一例である第2のコーディング装置50の構成例を示すブロック図である。
図10に示すように、第2のコーディング装置50は、プロセッサ51、ROM52、RAM53、NVM54、通信部55、エミュレータインターフェース56、画像インターフェース57、操作インターフェース58、および、表示インターフェース59などを備える。
【0083】
プロセッサ51は、ROM52、RAM53、NVM54、通信部55、エミュレータインターフェース56、画像インターフェース57、操作インターフェース58および表示インターフェース59にデータバスなどを介して接続される。なお、第2のコーディング装置50は、図10に示すような構成の他に必要に応じた構成を具備したり、図10に示す構成から特定の構成が除外されたりしてもよい。
【0084】
プロセッサ51は、第2のコーディング装置50全体の動作を制御する。プロセッサ51は、プログラムを実行する処理回路だけでなく、内部キャッシュ及び各種のインターフェースなどを備えてもよい。プロセッサ51は、内部メモリ、ROM52又はNVM54が予め記憶するプログラムを実行することにより種々の処理を実現する。
なお、プロセッサ51がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ51は、ハードウエア回路により実行される機能を制御する。
【0085】
ROM52は、制御プログラム及び制御データなどが予め記憶された不揮発性のメモリである。ROM52に記憶される制御プログラム及び制御データは、第2のコーディング装置50の仕様に応じて予め組み込まれる。
【0086】
RAM53は、揮発性のメモリである。RAM53は、プロセッサ51の処理中のデータなどを一時的に格納する。RAM53は、プロセッサ51からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM53は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。
【0087】
NVM54は、データの書き込み及び書き換えが可能な不揮発性のメモリである。例えば、NVM54は、例えば、HDD、SSD又はフラッシュメモリなどから構成される。NVM54は、第2のコーディング装置50の運用用途に応じた制御プログラム、アプリケーションプログラム、および、種々のデータなどを格納する。
【0088】
通信部55は、データを送受信するためのインターフェースである。例えば、通信部55は、他の第2のコーディング装置50などとデータを送受信するためのインターフェースを含むようにしても良い。
【0089】
エミュレータインターフェース56は、キーボード/マウスエミュレータ60に接続する。エミュレータインターフェース56は、キーボード/マウスエミュレータ60とデータを送受信するインターフェースである。エミュレータインターフェース56は、プロセッサ51からの制御信号をキーボード/マウスエミュレータ60によりキー入力による操作信号としてVCD20へ出力させる。すなわち、エミュレータインターフェース56は、キーボード/マウスエミュレータ60を通じて操作信号をVCD20に入力する。
【0090】
画像インターフェース57は、キャプチャボード70とデータを送受信するインターフェースである。画像インターフェース57は、キャプチャボード70がキャプチャするVCD20による表示画面の画像を取得する。キャプチャボード70は、VCD20が表示装置に表示する表示画面(VCD20が表示装置に供給する表示用の画像データ)の画像を取得する。画像インターフェース57は、キャプチャボード70がキャプチャするVCD20の表示画面の画像をプロセッサ51に供給する。
【0091】
操作インターフェース58は、操作部80とデータを送受信するためのインターフェースである。例えば、操作インターフェース58は、操作部80に入力された操作を示す操作信号を操作部80から受信する。操作インターフェース58は、受信した操作信号をプロセッサ51に送信する。また、操作インターフェース58は、操作部80に電力を供給するものであってもよい。
【0092】
表示インターフェース59は、表示部90とデータを送受信するためのインターフェースである。表示インターフェース59は、プロセッサ51からの画像データを表示部90に出力する。
【0093】
なお、エミュレータインターフェース56、画像インターフェース57、操作インターフェース58および表示インターフェース59(又はこれらの一部)は、第2のコーディング装置50の本体に一体的に形成されるものであってもよい。また、第2のコーディング装置50は、第2の認識処理を行い、オペレータによる打鍵入力をしないものを含んでも良い。オペレータによる打鍵入力を行わない第2のコーディング装置50は、操作インターフェース58及び表示インターフェース59を備えない構成であっても良い。
【0094】
次に、第2実施形態に係るコーディング装置の例である第2のコーディング装置50が実行する処理について概略的に説明する。
第2のコーディング装置50のプロセッサ51は、ROM52又はNVM54などに格納されるプログラムを実行することで種々の処理機能を実現する。
【0095】
まず、プロセッサ51は、画像インターフェース57を通じてVCD20から表示画面の画像を取得する。第1実施形態で説明したように、VCD20は、制御装置8からのコーディング情報に含まれるオリジナル画像と複数の撮影画像のサムネイル画像とを含む表示画面を表示するための表示(画像)データを生成する。例えば、VCD20は、図5又は図7に示すように、メイン表示領域41にオリジナル画像を表示し、サブ表示領域42に複数の撮影画像のサムネイル画像を表示する表示画面(コーディング画面)を表示装置に表示するための表示データを生成する。
【0096】
キャプチャボード70は、VCD20から表示画面(コーディング画面)の表示データを取得し、表示データにより表示される表示画面の画像をキャプチャし、キャプチャした表示画面の画像データを第2のコーディング装置50に供給する。すなわち、第2のコーディング装置50のプロセッサ51は、画像インターフェース57によりキャプチャボード70がキャプチャしたVCD20の表示画面の画像データを取得する。
【0097】
また、プロセッサ51は、VCD30の表示画面におけるメイン表示領域41に表示されるオリジナル画像の宛先領域について、表示位置、向き及びサイズを取得する機能を有する。さらに、プロセッサ51は、宛先領域の位置、向き及びサイズに基づいて、オリジナル画像に対する変形操作をVCD20に入力するかを判定し、変形操作を指示する操作信号をVCD20に入力する機能を有する。
【0098】
ここで、プロセッサ51は、オリジナル画像において宛先領域を検出し、宛先領域の位置、向きおよびサイズを取得するものとする。プロセッサ51は、VCD20の表示画面からオリジナル画像を抽出し、抽出したオリジナル画像において宛先領域を検出する。プロセッサ51は、所定のアルゴリズムに従って、オリジナル画像における宛先領域の位置、向き及びサイズを取得する。例えば、NVM54は、宛先領域の位置、向き及びサイズを出力するモデル(例えば、ニューラルネットワーク)を予め格納する。プロセッサ51は、NVM54に格納したモデルに基づいてオリジナル画像における宛先領域の位置、向き及びサイズを取得する。
【0099】
なお、NVM54は、撮影画像を入力すると宛先領域の位置を出力するモデル、撮影画像を入力すると宛先領域の向きを出力するモデル、及び、撮影画像を入力すると宛先領域のサイズを出力するモデルを予め格納するようにしても良い。この場合、プロセッサ51は、表示画面から抽出したオリジナル画像を各モデルに入力して宛先領域の位置、向き及びサイズを取得する。
【0100】
また、プロセッサ51は、宛先領域の位置、向き及びサイズに基づいて、オリジナル画像に対する変形操作をVCD20に入力するかを判定する。プロセッサ51は、VCD20の表示画面のメイン表示領域41に表示されるオリジナル画像の宛先領域に対して文字認識処理を適切に行うことができるかを判定する。
【0101】
例えば、プロセッサ51は、オリジナル画像における宛先領域のサイズが所定のサイズ以上であるかを判定する。宛先領域のサイズが所定のサイズより小さい場合、プロセッサ51は、宛先領域のサイズが所定のサイズ以上となるような変形操作を入力すると判定する。例えば、プロセッサ51は、宛先領域のサイズが所定のサイズより小さい場合、メイン表示領域41内のオリジナル画像を拡大する変形操作を入力すると判定する。
【0102】
また、プロセッサ51は、オリジナル画像における宛先領域の向きが正対であるかを判定する。宛先領域の向きが正対でないと判定すると、プロセッサ51は、オリジナル画像における宛先領域の向きが正対するような変形操作を入力すると判定する。例えば、宛先領域の向きが左に90度傾いている場合、プロセッサ51は、メイン表示領域41内のオリジナル画像を右に90度回転させる変形操作を入力すると判定する。
【0103】
また、プロセッサ51は、VCD20の表示画面のメイン表示領域41においてオリジナル画像の宛先領域が見切れているかを判定する。宛先領域が見切れていると判定すると、プロセッサ51は、オリジナル画像の宛先領域がメイン表示領域41に収まるような変形操作を入力すると判定する。例えば、宛先領域の右端が見切れている場合、プロセッサ51は、メイン表示領域41内のオリジナル画像を左に移動する変形操作を入力すると判定する。また、オリジナル画像の宛先領域がメイン表示領域41に収まらない場合、プロセッサ51は、メイン表示領域41内のオリジナル画像を縮小する変形操作を入力すると判定する。
【0104】
また、プロセッサ51は、VCD20にオリジナル画像に対する変形操作を入力すると判定した場合、変形操作を指示する操作信号をVCD20に入力する機能を有する。変形操作を入力すると判定すると、プロセッサ51は、キーボード/マウスエミュレータ26を用いて、入力すると判定された変形操作を指示する操作信号をVCD20の操作インターフェース26に送信する。プロセッサ51は、エミュレータインターフェース56を通じてキーボード/マウスエミュレータ60に変形操作を指示する操作信号を生成させ、キーボード/マウスエミュレータ60が生成した変形操作を指示する操作信号をVCD20の操作インターフェース26に出力させる。これにより、VCD20は、変形操作に応じてメイン表示領域41のオリジナル画像を更新(変形)した表示画面を表示インターフェース27により出力する。
【0105】
また、プロセッサ51は、VCD30の表示画面におけるメイン表示領域41に表示されるオリジナル画像を他の撮影画像に入れ替える入替処理を行う機能を有する。プロセッサ51は、制御装置8が指定するオリジナル画像に対する後述する第2の認識処理による宛先の文字列の認識に失敗した場合、オリジナル画像以外の撮影画像のサムネイル画像から宛先領域を検出する。サムネイル画像から宛先領域が検出できた場合、プロセッサ51は、メイン表示領域41に表示するオリジナル画像を宛先領域が検出できた撮影画像に入れ替えることを指示する入替操作の操作信号をVCD20に入力する。
【0106】
プロセッサ51は、キーボード/マウスエミュレータ60を用いて、オリジナル画像の入れ替えを指示する入替操作の操作信号をエミュレータインターフェース56によりVCD20の操作インターフェース26に送信する。プロセッサ51は、エミュレータインターフェース56により接続するキーボード/マウスエミュレータ60に入替操作を指示する操作信号を生成させ、キーボード/マウスエミュレータ60が生成した入替操作の操作信号をVCD20の操作インターフェース26に出力させる。これにより、VCD20は、入替操作に応じてメイン表示領域41のオリジナル画像を指定された撮影画像に入替(更新)した表示画面を表示インターフェース27により出力する。
【0107】
また、プロセッサ51は、オリジナル画像の宛先領域に対して第2の認識処理により宛先の文字列を認識する機能を有する。プロセッサ51は、VCD20の表示画面におけるオリジナル画像から検出する宛先領域に対して、第1のアルゴリズムとは異なる所定のアルゴリズム(第2のアルゴリズム)に従って宛先の文字列を認識する文字認識処理(第2の認識処理)を行う。第2のアルゴリズムは、第1のアルゴリズムが認識できない文字の少なくとも一部を認識できるように構成される。プロセッサ51は、第2の認識処理の結果に基づいて物品の宛先情報を特定する。
【0108】
プロセッサ51は、文字認識処理(第2の認識処理)によって宛先情報が特定できた場合、特定した宛先情報をVCD20に入力する。プロセッサ51は、キーボード/マウスエミュレータ60により特定した宛先情報をキー入力による操作信号に変換してVCD20の操作インターフェース26に供給する。つまり、プロセッサ51は、エミュレータインターフェース56を通じてキーボード/マウスエミュレータ4に宛先情報を入力する操作信号を生成させ、生成させた宛先情報をキー入力する操作信号をVCD20の操作インターフェース26に出力させる。
【0109】
また、プロセッサ51は、第2の認識処理による宛先の文字列の認識に失敗した場合、操作部80によりオペレータに宛先情報をキー入力される打鍵入力処理を行う。第2の認識処理による宛先の文字列の認識に失敗した場合、プロセッサ51は、VCD20からの表示画面を表示部90に表示し、操作部80による宛先情報のキー入力を受け付ける。プロセッサ51は、操作部80を用いて入力された宛先情報をエミュレータインターフェース56に接続するエミュレータ60によりキー入力された情報を示す操作信号としてVCD20に入力する。
【0110】
また、プロセッサ51は、表示インターフェース27によりキャプチャボード70がキャプチャするVCDの表示画面をリアルタイムで取得し、取得した表示画面を表示部90に表示する。オペレータは、表示部90に表示されるVCD20の表示画面のメイン表示領域41に表示するオリジナル画像を視認して宛先情報を操作部80により入力する。宛先の入力が完了すると、オペレータは、操作部80に宛先情報の入力を完了する操作を入力する。
【0111】
なお、第2のコーディングシステム5は、第2のコーディング装置50に操作部80及び表示部90を接続しないものを含んでも良い。この場合、操作部80及び表示部90が接続されていない第2のコーディング装置50のプロセッサ51は、他の第2のコーディング装置50に接続されている表示部90にVCD20の表示画面を表示し、当該他の第2のコーディング装置50に接続されている操作部80に入力された操作を示す操作信号をVCD20に入力するようにしても良い。また、主たる第2のコーディング装置50(例えば、第2のコーディング装置50a)又は外部の制御装置は、宛先の入力に用いる操作部80及びVCD20の表示画面を表示する表示部90を管理するようにしてもよい。
【0112】
次に、第2実施形態に係る認識システム102の第2のコーディングシステム5における第2のコーディング装置50の動作について説明する。
図11は、第2実施形態に係るコーディング装置としての第2のコーディング装置50の第1の動作例を説明するためのフローチャートである。
【0113】
第2のコーディング装置50は、画像インターフェース57によりVCD20が出力する表示画面をキャプチャボード70でキャプチャした表示画面の画像データとして取得する(ステップS51)。第2のコーディング装置50のプロセッサ21は、画像インターフェース57により取得した表示画面の画像データをRAM53又はNVM54などのメモリに保持する。ここでは、図5に示す第1表示例の表示画面の画像データを取得したことを想定して説明する。
【0114】
プロセッサ51は、VCD20の表示画面の画像データから表示画面のメイン表示領域41に表示されるオリジナル画像を抽出する。プロセッサ51は、抽出したオリジナル画像に対して制御装置8での文字認識とは異なる第2のアルゴリズムの文字認識によって宛先の文字列を認識する第2の認識処理を行う(ステップS52)。
【0115】
プロセッサ51は、第2の認識処理によって宛先の文字列の認識に成功した場合(ステップS53、YES)、第2の認識処理によって得られた宛先の文字列に基づく宛先情報をエミュレータインターフェース56によりエミュレータ60に出力する(ステップS54)。エミュレータ60は、エミュレータインターフェース56から出力された宛先情報をキー入力する操作信号を生成し、生成した操作信号をVCD20へ供給する。この結果、VCD20は、操作インターフェース26に入力された操作信号が示す宛先情報を制御装置8へ送信し、コーディング情報に対するコーディング処理を終了する。
【0116】
また、プロセッサ51は、オリジナル画像に対する第2の認識処理と並行して、コーディング情報に含まれるオリジナル画像以外の撮影画像から宛先情報を認識するサムネイル処理を実行する(ステップS61-S64)。
【0117】
プロセッサ51は、サムネイル処理として、まず、オリジナル画像以外の撮影画像のサムネイル画像に対して宛先領域を検出する検出処理を行う(ステップS61)。プロセッサ51は、どの撮影画像のサムネイル画像からも宛先領域が検出できなかった場合(ステップS62、NO)、サムネイル画像からは宛先領域が検出できなかった旨をサムネイル処理の処理結果として保持する。
【0118】
また、プロセッサ51は、オリジナル画像以外の撮影画像のサムネイル画像から宛先領域が検出できた場合(ステップS62、YES)、宛先領域が検出されたサムネイル画像の撮影画像をオリジナル画像に入れ替える入替処理を行う。プロセッサ51は、宛先領域が検出されたサムネイル画像の撮影画像をオリジナル画像に入れ替える入替操作をエミュレータインターフェース56によりキーボード/マウスエミュレータ60へ送信する(ステップS63)。
【0119】
キーボード/マウスエミュレータ60は、入替操作を指示する操作信号を生成し、生成した入替操作の操作信号をVCD20の操作インターフェース26へ送信する。これにより、VCD20のプロセッサ21は、操作インターフェース26により入替操作の操作信号を受信すると、操作信号に応じてメイン表示領域41のオリジナル画像を指定された撮影画像に入れ替えた表示画面を生成(更新)し、生成した表示画面の画像データを表示インターフェース27により出力する。
【0120】
キャプチャボード70は、表示インターフェース27が出力するオリジナル画像を入れ替えた表示画面をキャプチャし、キャプチャした表示画面の画像データを第2のコーディング装置50の画像インターフェース57へ送信する。第2のコーディング装置50のプロセッサ51は、画像インターフェース57により受信したオリジナル画像が入れ替えられた表示画面を取得する(ステップS64)。
【0121】
例えば、図5に示す第1表示例の表示画面では、サブ表示領域42の第5領域425に表示している撮影画像をメイン表示領域41でオリジナル画像として表示している。図5に示す第1表示例の表示画面においてサブ表示領域42の第1表示領域421に表示しているサムネイル画像に宛先領域が検出された場合、プロセッサ51は、第1表示領域421に表示しているサムネイル画像の撮影画像をオリジナル画像に入れ替える入替操作の操作信号をエミュレータインターフェース56によりキーボード/マウスエミュレータ60へ送信する。キーボード/マウスエミュレータ60が第1表示領域421のサムネイル画像の撮影画像をオリジナル画像に入れ替えることを指示する操作信号を生成し、生成した操作信号をVCD20の操作インターフェース26へ送信する。
【0122】
VCD20のプロセッサ21は、操作インターフェース26により第1表示領域421の撮影画像をオリジナル画像に入れ替えることを指示する操作信号を受信する。VCD20のプロセッサ21と、第1表示領域421に表示しているサムネイル画像(入れ替えが指定されたサムネイル画像)のフルサイズの撮影画像を制御装置8から取得する。
【0123】
なお、サブ表示領域42にサムネイル画像として表示する複数の撮影画像をフルサイズの画像データは制御装置8からコーディング情報として受信してRAM23などのメモリに保持するようにしても良い。この場合、VCD20のプロセッサ21は、メモリから第1表示領域421に表示しているサムネイル画像のフルサイズの撮影画像を取得するようにしても良い。
【0124】
VCD20のプロセッサ21は、入れ替えが指定されたサムネイル画像のフルサイズの撮影画像を取得すると、取得したフルサイズの撮影画像をオリジナル画像としてメイン表示領域41に表示させることにより図7に示すような表示画面を生成(更新)する。VCDのプロセッサ21は、メイン表示領域41のオリジナル画像を第1表示領域421の撮影画像に入れ替えた表示画面を生成(更新)すると、生成した表示画面の表示データを表示インターフェース27により出力する。
【0125】
キャプチャボード70は、VCD20が出力するオリジナル画像を第1表示領域421の画像に入れ替えた表示画面の画像をキャプチャし、キャプチャした表示画面の画像データを第2のコーディング装置50の画像インターフェース57へ送信する。この結果、第2のコーディング装置50のプロセッサ51は、画像インターフェース57により受信したオリジナル画像が入れ替えられた図7に示すような表示画面を取得する。
【0126】
プロセッサ21は、オリジナル画像を入れ替えた表示画面を取得すると、入替処理で得られた表示画面に対してオリジナル画像の拡大回転操作(変形操作)を行う(ステップS65)。プロセッサ21は、上述したように、オリジナル画像における宛先領域を検出し、その宛先領域の位置、向き、および、サイズに基づいて、オリジナル画像に対する変形操作をVCD20に入力するかを判定する。
【0127】
プロセッサ51は、変形操作を入力しない(変形操作が不要である)と判定した場合、ステップS66へ進む。また、変形操作を入力すると判定した場合、プロセッサ51は、オリジナル画像に対する位置の移動、拡大、回転などを指示する変形指示を生成し、変形操作の操作信号をエミュレータインターフェース56およびエミュレータ60を介してVCD20へ供給する。
【0128】
VCD20は、操作インターフェース26に入力される変形操作の操作信号に応じて変形(更新)したオリジナル画像をメイン表示領域41に表示する表示画面を生成し、表示インターフェース27から出力する。変形したオリジナル画像を表示する表示画面は、キャプチャボード70によりキャプチャされ、キャプチャされた表示画面の画像データが第2のコーディング装置50の画像インターフェース57へ供給される。これにより、第2のコーディング装置50のプロセッサ51は、変形操作に応じて変形されたオリジナル画像を表示する表示画面を取得する。
【0129】
プロセッサ51は、オリジナル画像を入れ替えた表示画面又は入れ替えたオリジナル画像を変形した画像を表示した表示画面を取得すると、取得した表示画面のオリジナル画像に対して制御装置8の文字認識とは異なる第2のアルゴリズムの文字認識処理によって宛先の文字列を認識する(ステップS66)。プロセッサ51は、入れ替えたオリジナル画像に対する第2のアルゴリズムによる文字認識による宛先の文字列の認識結果をサムネイル処理の処理結果として保持する。
【0130】
プロセッサ51は、入れ替えたオリジナル画像から宛先の文字列が認識できなかった場合、サムネイル画像の撮影画像からは宛先情報が認識できなかった旨をサムネイル処理の処理結果として保持する。また、プロセッサ51は、入れ替えたオリジナル画像から宛先の文字列が認識できた場合、認識した宛先の文字列を含む宛先情報をサムネイル処理の処理結果として保持する。
【0131】
一方、プロセッサ51は、制御装置8が指定するオリジナル画像に対する宛先の文字列の認識に失敗した場合(ステップS53、NO)、上述したようなサムネイル処理を終了したか否かを判断する(ステップS55)。プロセッサ51は、サムネイル処理が終了していなければ(ステップS55、NO)、サムネイル処理の終了待ちとなる。
【0132】
サムネイル処理が終了した場合(ステップS55、YES)、プロセッサ51は、サムネイル処理の結果として宛先情報の認識に成功したか否かを判断する(ステップS56)。サムネイル処理による宛先情報の認識に成功した場合(ステップS56、YES)、プロセッサ51は、サムネイル処理により認識した宛先情報をエミュレータインターフェース56によりエミュレータ60へ供給する(ステップS54)。エミュレータ60は、第2のコーディング装置50のエミュレータインターフェース56から受信する宛先情報をキー入力する操作信号を生成し、生成した操作信号をVCD20へ供給する。この結果、VCD20は、操作インターフェース26に入力された操作信号が示す宛先情報を制御装置8へ送信し、コーディング情報に対するコーディング処理を終了する。
【0133】
また、サムネイル処理による宛先情報の認識に失敗した場合(ステップS56、NO)、プロセッサ51は、画像インターフェース57により取得する図5又は図7に示すような表示画面を表示部90に表示し、オペレータに操作部80を用いて宛先情報をキー入力させる打鍵入力処理を行う(ステップS57)。
【0134】
オペレータは、表示部90に表示される図5又は図7に示す表示画面を目視(参照)しながら宛先情報を操作部80によりキー入力する。第2のコーディング装置50のプロセッサ51は、オペレータが操作部80を用いてキー入力する宛先情報を取得する。プロセッサ21は、オペレータが操作部80を用いてキー入力した宛先情報を取得すると、取得した宛先情報をエミュレータインターフェース56によりエミュレータ60へ供給する(ステップS54)。エミュレータ60は、第2のコーディング装置50のエミュレータインターフェース56から受信する宛先情報をキー入力する操作信号を生成し、生成した操作信号をVCD20へ供給する。この結果、VCD20は、操作インターフェース26に入力された操作信号が示す宛先情報を制御装置8へ送信し、コーディング情報に対するコーディング処理を終了する。
【0135】
次に、第2実施形態に係るコーディング装置としての第2のコーディング装置50の第2の動作例について説明する。第2の動作例では、第1の動作例で並列処理として実行したサムネイル処理を制御装置8が指定するオリジナル画像に対する宛先の文字列の認識が失敗した場合に実行する。
図12は、第2実施形態に係るコーディング装置としての第2のコーディング装置50の第2の動作例を説明するためのフローチャートである。
【0136】
第2のコーディング装置50は、画像インターフェース57によりVCD20が出力する表示画面をキャプチャボード70でキャプチャした表示画面の画像データとして取得する(ステップS71)。第2のコーディング装置50のプロセッサ21は、画像インターフェース57により取得した表示画面の画像データをRAM53又はNVM54などのメモリに保持する。ここでは、図5に示す第1表示例の表示画面の画像データを取得したことを想定して説明する。
【0137】
プロセッサ51は、VCD20の表示画面の画像データから表示画面のメイン表示領域41に表示されるオリジナル画像を抽出する。プロセッサ51は、抽出したオリジナル画像に対して制御装置8での文字認識とは異なる第2のアルゴリズムの文字認識によって宛先の文字列を認識する第2の認識処理を行う(ステップS72)。
【0138】
プロセッサ51は、第2の認識処理によって宛先の文字列の認識に成功した場合(ステップS73、YES)、第2の認識処理によって得られた宛先の文字列に基づく宛先情報をエミュレータインターフェース56によりエミュレータ60に出力する(ステップS74)。エミュレータ60は、エミュレータインターフェース56から受信した宛先情報をキー入力する操作信号を生成し、生成した操作信号をVCD20へ供給する。この結果、VCD20は、操作インターフェース26に入力された操作信号が示す宛先情報を制御装置8へ送信し、コーディング情報に対するコーディング処理を終了する。
【0139】
また、プロセッサ51は、制御装置8が指定するオリジナル画像に対する第2の認識処理による宛先の文字列の認識に失敗した場合(ステップS73、NO)、サムネイル画像として表示されるオリジナル画像以外の撮影画像から宛先情報を認識するサムネイル処理を実行する(ステップS81-S86)。
【0140】
プロセッサ51は、サムネイル処理として、オリジナル画像以外の撮影画像のサムネイル画像に対して宛先領域を検出する検出処理を行う(ステップS81)。プロセッサ51は、どの撮影画像のサムネイル画像からも宛先領域が検出できなかった場合(ステップS82、NO)、サムネイル画像からは宛先領域が検出できなかった旨をサムネイル処理の処理結果として保持する。
【0141】
また、プロセッサ51は、オリジナル画像以外の撮影画像のサムネイル画像から宛先領域が検出できた場合(ステップS82、YES)、宛先領域が検出されたサムネイル画像の撮影画像をオリジナル画像に入れ替える入替操作をエミュレータインターフェース56によりキーボード/マウスエミュレータ60へ送信する(ステップS83)。これにより、キーボード/マウスエミュレータ60は、入替操作を指示する操作信号をVCD20の操作インターフェース26へ送信する。VCD20のプロセッサ21は、操作インターフェース26により受信する入替操作の操作信号に応じてメイン表示領域41のオリジナル画像を指定された撮影画像に入れ替えた表示画面を生成(更新)し、生成した表示画面の画像データを表示インターフェース27により出力する。
【0142】
キャプチャボード70は、表示インターフェース27が出力するオリジナル画像を入れ替えた表示画面をキャプチャし、キャプチャした表示画面の画像データを第2のコーディング装置50の画像インターフェース57へ送信する。これにより、第2のコーディング装置50のプロセッサ51は、画像インターフェース57により受信したオリジナル画像が入れ替えられた表示画面を取得する(ステップS84)。
【0143】
さらに、プロセッサ21は、オリジナル画像を入れ替えた表示画面を取得すると、入替処理で得られた表示画面に対してオリジナル画像の拡大回転操作(変形操作)を行う(ステップS85)。プロセッサ51は、変形操作を入力しない(変形操作が不要である)と判定した場合、ステップS66へ進む。また、変形操作を入力すると判定した場合、プロセッサ51は、オリジナル画像に対する位置の移動、拡大、回転などを指示する変形指示を生成し、変形操作の操作信号をエミュレータインターフェース56およびエミュレータ60を介してVCD20へ供給する。
【0144】
VCD20は、操作インターフェース26に入力される変形操作の操作信号に応じて変形(更新)したオリジナル画像をメイン表示領域41に表示する表示画面を生成し、表示インターフェース27から出力する。変形したオリジナル画像を表示する表示画面は、キャプチャボード70によりキャプチャされ、キャプチャされた表示画面の画像データが第2のコーディング装置50の画像インターフェース57へ供給される。この結果、第2のコーディング装置50のプロセッサ51は、変形操作に応じて変形されたオリジナル画像を表示する表示画面を取得する。
【0145】
プロセッサ51は、オリジナル画像を入れ替えた表示画面又は入れ替えたオリジナル画像を変形した画像を表示した表示画面を取得すると、取得した表示画面のオリジナル画像に対して制御装置8の文字認識とは異なる第2のアルゴリズムの文字認識処理によって宛先の文字列を認識する(ステップS86)。プロセッサ51は、入れ替えたオリジナル画像に対する第2のアルゴリズムによる文字認識による宛先の文字列の認識結果をサムネイル処理の処理結果として保持する。
【0146】
プロセッサ51は、入れ替えたオリジナル画像から宛先の文字列が認識できなかった場合、サムネイル画像の撮影画像からは宛先情報が認識できなかった旨をサムネイル処理の処理結果として保持する。また、プロセッサ51は、入れ替えたオリジナル画像から宛先の文字列が認識できた場合、認識した宛先の文字列を含む宛先情報をサムネイル処理の処理結果として保持する。
【0147】
プロセッサ51は、サムネイル処理の結果として宛先情報の認識に成功したか否かを判断する(ステップS87)。サムネイル処理による宛先情報の認識に成功した場合(ステップS87、YES)、プロセッサ51は、サムネイル処理により認識した宛先情報をエミュレータインターフェース56によりエミュレータ60へ供給する(ステップS74)。エミュレータ60は、第2のコーディング装置50のエミュレータインターフェース56から受信する宛先情報をキー入力する操作信号を生成し、生成した操作信号をVCD20へ供給する。この結果、VCD20は、操作インターフェース26に入力された操作信号が示す宛先情報を制御装置8へ送信し、コーディング情報に対するコーディング処理を終了する。
【0148】
また、サムネイル処理による宛先情報の認識に失敗した場合(ステップS87、NO)、プロセッサ51は、画像インターフェース57により取得する図5又は図7に示すような表示画面を表示部90に表示し、オペレータに操作部80を用いて宛先情報をキー入力させる打鍵入力処理を行う(ステップS89)。
【0149】
プロセッサ51は、オペレータが操作部80を用いてキー入力した宛先情報を取得すると、取得した宛先情報をエミュレータインターフェース56によりエミュレータ60へ供給する(ステップS74)。エミュレータ60は、第2のコーディング装置50のエミュレータインターフェース56から受信する宛先情報をキー入力する操作信号を生成し、生成した操作信号をVCD20へ供給する。この結果、VCD20は、操作インターフェース26に入力された操作信号が示す宛先情報を制御装置8へ送信し、コーディング情報に対するコーディング処理を終了する。
【0150】
以上のように、第2実施形態に係るコーディング装置としての第2のコーディング装置は、既存のVCSにおけるVCDの表示インターフェースと操作インターフェースとに接続される。第2のコーディング装置は、処理対象とする物品の複数の撮影画像から選出されたオリジナル画像と複数の撮影画像のサムネイル画像とを含む既存のVCDの表示画面の画像を取得する。第2のコーディング装置は、既存のVCDから取得した表示画面から抽出するオリジナル画像に対する宛先の文字列の認識に失敗した場合に宛先領域が検出できたサムネイル画像の撮影画像をオリジナル画像に入れ替える入替操作の操作信号を既存のVCDに供給する。第2のコーディング装置は、オリジナル画像を入れ替えた表示画面を既存のVCDから取得して入れ替えたオリジナル画像に対して宛先の文字列を認識する処理を行う。
【0151】
これにより、VCDから取得する表示画面におけるオリジナル画像に対する文字認識に失敗しても、当該表示画面のサムネイル画像から宛先領域が検出できれば、宛先領域が検出できたサムネイル画像の撮影画像をオリジナル画像に入れ替えて文字認識を行うことができ、最終的な文字認識率を向上させることができる。この結果、既存のVCDの構成を変更することなく、第2のコーディング装置による宛先情報の認識率を向上させてコーディング処理の生産性を向上させることができる。
【0152】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0153】
1…物品処理システム、2…VCS、5(5A、5B、5C、5D)…第2のコーディングシステム、6…ソータ、7…カメラ、8…制御装置、11…プロセッサ、12…ROM、13…RAM、14…NVM、15…カメラインターフェース、16…通信部、19…ソータインターフェース、20(20a、20b、20c、20d)…VCD(コーディング装置)、21…プロセッサ、22…ROM、23…RAM、24…NVM、25…通信部、26…操作インターフェース、27…表示インターフェース、30…操作部、40…表示部、50(50a、50b、50c、50d)…第2のコーディング装置(コーディング装置)、51…プロセッサ、52…ROM、53…RAM、54…NVM、55…通信部、56…エミュレータインターフェース、57…画像インターフェース、58…操作インターフェース、59…表示インターフェース、60(60a、60b、60c、60d)…キーボード(KB)/マウスエミュレータ、70(70a、70b、70c、70d)…キャプチャボード、80(80a、80b、80c、80d)…操作部、90(90a、90b、90c、90d)…表示部。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12