IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社東芝の特許一覧 ▶ 東芝電機サービス株式会社の特許一覧

<>
  • 特許-情報処理装置及びプログラム 図1
  • 特許-情報処理装置及びプログラム 図2
  • 特許-情報処理装置及びプログラム 図3
  • 特許-情報処理装置及びプログラム 図4
  • 特許-情報処理装置及びプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-27
(45)【発行日】2024-10-07
(54)【発明の名称】情報処理装置及びプログラム
(51)【国際特許分類】
   G06V 30/12 20220101AFI20240930BHJP
   G06V 30/14 20220101ALI20240930BHJP
   G06V 30/424 20220101ALI20240930BHJP
   G06F 3/0481 20220101ALI20240930BHJP
【FI】
G06V30/12 B
G06V30/14 340J
G06V30/424
G06F3/0481
【請求項の数】 8
(21)【出願番号】P 2020151217
(22)【出願日】2020-09-09
(65)【公開番号】P2022045557
(43)【公開日】2022-03-22
【審査請求日】2023-06-13
(73)【特許権者】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(73)【特許権者】
【識別番号】598076591
【氏名又は名称】東芝インフラシステムズ株式会社
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(72)【発明者】
【氏名】南埜 雄飛
(72)【発明者】
【氏名】佐藤 昌孝
【審査官】秦野 孝一郎
(56)【参考文献】
【文献】特開2010-009410(JP,A)
【文献】特開2002-056353(JP,A)
【文献】特開平08-243507(JP,A)
【文献】特開平08-099068(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/00-30/12
G06V 30/18-30/222
G06V 30/226-30/32
G06V 30/42-30/424
G06F 3/01
G06F 3/048-3/04895
(57)【特許請求の範囲】
【請求項1】
外部装置から文字列を入力する画面を取得する画像インターフェースと、
前記外部装置に操作を示す信号を送信する入力インターフェースと、
表示端末と通信する表示インターフェースと、
操作端末と通信する操作インターフェースと、
前記表示インターフェースを通じて前記画面を前記表示端末に表示し、前記操作インターフェースを通じてキー入力を受け付け、
前記表示インターフェースを通じて前記キー入力が示す文字列を含むダイアログを前記表示端末に表示し、
前記入力インターフェースを通じて前記キー入力を示す信号を前記外部装置に送信し、
前記画像インターフェースを通じて前記キー入力が示す文字列が入力された前記画面を前記外部装置から取得し、
前記表示インターフェースを通じて前記ダイアログと前記画面とを前記表示端末に表示する、
プロセッサと、
を備え
前記画面は、文字列が写る文字列画像を含み、
前記プロセッサは、
前記文字列画像に対して文字認識処理を行った文字認識処理装置から文字認識処理の結果を取得し、
前記入力インターフェースを通じて、前記文字認識処理の結果に基づいて文字列を入力する信号を前記外部装置に送信し、
前記文字認識処理に失敗した場合、前記操作インターフェースを通じてキー入力を受け付ける、情報処理装置。
【請求項2】
前記プロセッサは、前記画面に前記ダイアログを表示する、
請求項1に記載の情報処理装置。
【請求項3】
前記文字列画像は、所定の処理装置が前記文字認識処理に失敗した画像である、
請求項に記載の情報処理装置。
【請求項4】
前記所定の処理装置は、物品を区分する区分機である、
請求項に記載の情報処理装置。
【請求項5】
前記画面が入力を受け付ける文字列は、宛先である、
請求項1乃至の何れか1項に記載の情報処理装置。
【請求項6】
前記宛先は、郵便番号を含む、
請求項に記載の情報処理装置。
【請求項7】
前記入力インターフェースは、操作端末をエミュレーションするエミュレータに接続する、
請求項1乃至の何れか1項に記載の情報処理装置。
【請求項8】
プロセッサによって実行されるプログラムであって、
前記プロセッサに、
外部装置から文字列を入力する画面を取得する機能と、
前記画面を表示し、キー入力を受け付ける機能と、
前記キー入力が示す文字列を含むダイアログを表示する機能と、
前記キー入力を示す信号を前記外部装置に送信する機能と、
前記キー入力が示す文字列が入力された前記画面を前記外部装置から取得する機能と
前記ダイアログと前記画面とを表示する機能と、
前記画面に含まれる文字列が写る文字列画像に対して文字認識処理を行った文字認識処理装置から文字認識処理の結果を取得する機能と、
前記文字認識処理の結果に基づいて文字列を入力する信号を前記外部装置に送信する機能と、
前記文字認識処理に失敗した場合、前記キー入力を受け付ける機能と、
を実現させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、情報処理装置及びプログラムに関する。
【背景技術】
【0002】
VCD(Video Coding Device)から画像を取得し取得された画像に対してOCR(Optical Character Recognition)を行う情報処理装置が提供されている。そのような情報処理装置は、OCR処理に失敗した場合、VCDからの画像を表示してオペレータからキー入力を受け付ける。情報処理装置は、キー入力を示す操作信号をVCDに入力する。
【0003】
従来、情報処理装置は、操作信号の生成時間又は画像の取得時間などにより、オペレータがキー入力を行ってから画面に反映されるまでにラグが生じることがある。そのため、オペレータは、自身が入力した文字を即座に確認することができない。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2008-90531号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記の課題を解決するため、オペレータに、VCDへ入力される文字を効果的に確認させることができる情報処理装置及びプログラムを提供する。
【課題を解決するための手段】
【0006】
実施形態によれば、情報処理装置は、画像インターフェースと、入力インターフェースと、表示インターフェースと、操作インターフェースと、プロセッサと、を備える。画像インターフェースは、外部装置から文字列を入力する画面を取得する。入力インターフェースは、前記外部装置に操作を示す信号を送信する。表示インターフェースは、表示端末と通信する。操作インターフェースは、操作端末と通信する。プロセッサは、前記表示インターフェースを通じて前記画面を前記表示端末に表示し、前記操作インターフェースを通じてキー入力を受け付け、前記表示インターフェースを通じて前記キー入力が示す文字列を含むダイアログを前記表示端末に表示し、前記入力インターフェースを通じて前記キー入力を示す信号を前記外部装置に送信し、前記画像インターフェースを通じて前記キー入力が示す文字列が入力された前記画面を前記外部装置から取得し、前記表示インターフェースを通じて前記ダイアログと前記画面とを前記表示端末に表示する。前記画面は、文字列が写る文字列画像を含み、前記プロセッサは、前記文字列画像に対して文字認識処理を行った文字認識処理装置から文字認識処理の結果を取得し、前記入力インターフェースを通じて、前記文字認識処理の結果に基づいて文字列を入力する信号を前記外部装置に送信し、前記文字認識処理に失敗した場合、前記操作インターフェースを通じてキー入力を受け付ける。
【図面の簡単な説明】
【0007】
図1図1は、実施形態に係る入力システムの構成例を示すブロック図である。
図2図2は、実施形態に係るVCDの構成例を示すブロック図である。
図3図3は、実施形態に係るOCR装置の構成例を示すブロック図である。
図4図4は、実施形態に係るVCD画面の例を示す図である。
図5図5は、実施形態に係る入力システムの動作例を示すシーケンス図である。
【発明を実施するための形態】
【0008】
以下、実施形態について、図面を参照して説明する。
実施形態に係る入力システムは、VCDから、郵便番号などの文字列を含む画像を取得する。入力システムは、OCR装置において、取得された画像に対してOCR処理(文字認識処理)を行う。入力システムは、OCR処理の結果に基づいて文字列を入力するための操作信号をVCDに入力する。入力システムは、OCR処理に失敗した場合、取得された画像をOCR装置に表示する。入力システムは、OCR装置を通じて、オペレータからキー入力を受け付ける。入力システムは、キー入力を示す操作信号をOCR装置からVCDに入力する。
【0009】
図1は、実施形態に係る入力システム1の構成例を示す。図1が示すように、入力システム1は、管理PC2、ネットワーク3、エミュレータ4、キャプチャボード5、表示端末7、操作端末8、VCD10及びOCR装置20などを備える。
【0010】
エミュレータ4は、第1のエミュレータ4a及び第2のエミュレータ4bから構成される。キャプチャボード5は、第1のキャプチャボード5a及び第2のキャプチャボード5bから構成される。表示端末7は、第1の表示端末7a及び第2の表示端末7bから構成される。操作端末8は、第1の操作端末8a及び第2の操作端末8bから構成される。VCD10は、第1のVCD10a及び第2のVCD10bから構成される。OCR装置20は、第1のOCR装置20a及び第2のOCR装置20bから構成される。
【0011】
管理PC2は、ネットワーク3に接続する。
第1のVCD10aは、第1のエミュレータ4a及び第1のキャプチャボード5aに接続する。第1のOCR装置20aは、ネットワーク3、第1のエミュレータ4a、第1のキャプチャボード5a、第1の表示端末7a及び第1の操作端末8aに接続する。
【0012】
第2のVCD10bは、第2のエミュレータ4b及び第2のキャプチャボード5bに接続する。第2のOCR装置20bは、ネットワーク3、第2のエミュレータ4b、第2のキャプチャボード5b、第2の表示端末7b及び第2の操作端末8bに接続する。
【0013】
なお、入力システム1は、図1が示すような構成の他に必要に応じた構成をさらに具備したり、入力システム1から特定の構成が除外されたりしてもよい。
【0014】
管理PC2は、入力システム1全体を管理する。管理PC2は、OCR装置20とデータを送受信する。管理PC2は、種々の操作信号などをOCR装置20などに送信する。また、管理PC2は、OCR装置20からのデータ(OCR処理の結果など)を受信する。
【0015】
ネットワーク3は、管理PC2とOCR装置20との間の通信及びOCR装置20間の通信などを中継する。たとえば、ネットワーク3は、LAN(Local Area Network)などである。
【0016】
VCD10(第1のVCD10a及び第2のVCD10b、外部装置)は、所定の処理装置からの画像に表示される文字列を入力する。
【0017】
たとえば、処理装置は、郵便物又は荷物などの物品をシュータなどに区分する区分機である。処理装置は、カメラを用いて、物品の宛先面(宛先が記載されている面)を撮影する。宛先面を撮影すると、処理装置は、所定のアルゴリズム(第1のアルゴリズム)に従って宛先面が写る画像(宛先画像、文字列画像)にOCR(プライマリOCR)処理を行う。
【0018】
OCR処理を行うと、処理装置は、OCR処理の結果に基づいて物品の宛先面に記載されている宛先を取得する。宛先を取得すると、処理装置は、取得された宛先に基づいて物品を区分する。
【0019】
OCR処理に失敗して宛先を取得できない場合、処理装置は、宛先画像をVCD10に送信する。
【0020】
後述するように、VCD10は、宛先画像に含まれる宛先面に記載された宛先を処理装置に送信する。
処理装置は、VCD10から宛先を取得する。宛先を取得すると、処理装置は、取得された宛先に基づいて物品を区分する。
【0021】
VCD10は、宛先面を含む宛先画像を取得する。VCD10は、宛先画像を含む画面(VCD画面)をOCR装置20に送信する。VCD10は、文字列として、宛先画像に記載されている宛先をOCR装置20から取得する。VCD10は、取得された宛先を処理装置に送信する。
VCD10については、後に詳述する。
【0022】
エミュレータ4(第1のエミュレータ4a及び第2のエミュレータ4b)は、VCD10に接続するキーボード又はマウスなどの操作端末をエミュレーションする。エミュレータ4は、OCR装置20からの制御に従ってオペレータが操作端末を通じて入力する操作信号と同様の操作信号をVCD10に供給する。たとえば、エミュレータ4は、マウスの移動若しくはクリック、又は、キーボード入力などを示す操作信号をVCD10に供給する。
【0023】
ここでは、第1のエミュレータ4aは、第1のOCR装置20aの制御に従って第1のVCD10aに操作信号を供給する。また、第2のエミュレータ4bは、第2のOCR装置20bの制御に従って第2のVCD10bに操作信号を供給する。
【0024】
キャプチャボード5は、VCD10が供給するVCD画面を取得する。キャプチャボード5は、取得されたVCD画面をOCR装置20に供給する。
【0025】
ここでは、第1のキャプチャボード5aは、第1のVCD10aからのVCD画面を第1のOCR装置20aに供給する。第2のキャプチャボード5bは、第2のVCD10bからのVCD画面を第2のOCR装置20bに供給する
表示端末7は、OCR装置20からの制御に従って情報を表示する。即ち、表示端末7は、OCR装置20からの供給される情報を表示する。たとえば、表示端末7は、液晶モニタなどである。また、表示端末7は、LED(Light Emitting Diode)などのランプから構成されるものであってもよい。
【0026】
ここでは、第1の表示端末7aは、第1のOCR装置20aからの制御に従って情報を表示する。また、第2の表示端末7bは、第2のOCR装置20bからの制御に従って情報を表示する。
【0027】
操作端末8は、オペレータから種々の操作の入力を受け付ける。操作端末8は、入力された操作を示す信号をOCR装置20へ送信する。操作端末8は、キーボード又はマウスなどから構成される。
【0028】
ここでは、第1の操作端末8aは、入力された操作を示す信号を第1のOCR装置20aへ送信する。また、第2の操作端末8bは、入力された操作を示す信号を第2のOCR装置20bへ送信する。
【0029】
OCR装置20(情報処理装置、外部装置)は、キャプチャボード5からのVCD画面の宛先画像に対してOCR(セカンダリOCR)処理を行う。OCR装置20は、OCR処理の結果に基づいて宛先をVCD10に送信する。また、OCR装置20は、OCR処理に失敗した場合、操作端末8に入力されるキー入力をVCD10に送信する。OCR装置20については、後に詳述する。
【0030】
ここでは、第1のOCR装置20aは、第1のVCD10aに宛先又はキー入力を送信する。また、第2のOCR装置20bは、第2のVCD10bに宛先又はキー入力を送信する。
【0031】
次に、VCD10について説明する。第1のVCD10a及び第2のVCD10bは、同様の構成であるため、VCD10として説明する。
【0032】
図2は、実施形態に係るVCD10の構成例を示す。図2は、VCD10の構成例を示すブロック図である。図2が示すように、VCD10は、プロセッサ11、ROM12、RAM13、NVM14、通信部15、表示インターフェース16及び操作インターフェース17などを備える。
【0033】
プロセッサ11と、ROM12、RAM13、NVM14、通信部15、表示インターフェース16及び操作インターフェース17と、は、データバスなどを介して互いに接続する。
なお、VCD10は、図2が示すような構成の他に必要に応じた構成を具備したり、VCD10から特定の構成が除外されたりしてもよい。
【0034】
プロセッサ11は、VCD10全体の動作を制御する機能を有する。プロセッサ11は、内部キャッシュ及び各種のインターフェースなどを備えてもよい。プロセッサ11は、内部メモリ、ROM12又はNVM14が予め記憶するプログラムを実行することにより種々の処理を実現する。
【0035】
なお、プロセッサ11がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ11は、ハードウエア回路により実行される機能を制御する。
【0036】
ROM12は、制御プログラム及び制御データなどが予め記憶された不揮発性のメモリである。ROM12に記憶される制御プログラム及び制御データは、VCD10の仕様に応じて予め組み込まれる。
【0037】
RAM13は、揮発性のメモリである。RAM13は、プロセッサ11の処理中のデータなどを一時的に格納する。RAM13は、プロセッサ11からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM13は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。
【0038】
NVM14は、データの書き込み及び書き換えが可能な不揮発性のメモリである。たとえば、NVM14は、たとえば、HDD、SSD又はフラッシュメモリなどから構成される。NVM14は、VCD10の運用用途に応じて制御プログラム、アプリケーション及び種々のデータなどを格納する。
【0039】
通信部15は、所定の処理装置とデータを送受信するためのインターフェースである。たとえば、通信部15は、有線又は無線のLAN接続をサポートするインターフェースである。
【0040】
表示インターフェース16は、キャプチャボード5とデータを送受信するインターフェースである。表示インターフェース16は、プロセッサ11からの制御に従って、VCD画面をキャプチャボード5に送信する。
【0041】
操作インターフェース17は、操作の入力を受け付けるためのインターフェースである。たとえば、操作インターフェース17は、キーボード又はマウスなどの操作端末に入力される操作を示す操作信号を受信する。操作インターフェース17は、受信された操作信号をプロセッサ21に供給する。たとえば、操作インターフェース17は、USB(Universal Serial Bus)接続をサポートする。
【0042】
ここでは、操作インターフェース17は、エミュレータ4に接続する。即ち、操作インターフェース17は、エミュレータ4からの操作信号を受信する。
たとえば、VCD10は、デスクトップPC又はノートPCなどである。
【0043】
VCD10のプロセッサ11は、通信部15を通じて宛先画像を処理装置から取得する。宛先画像を取得すると、プロセッサ11は、宛先画像に写る宛先の入力を受け付けるVCD画面を生成する。VCD画面は、取得された宛先画像を含む。
【0044】
VCD画面を生成すると、プロセッサ11は、表示インターフェース16を通じて、生成されたVCD画面をキャプチャボード5に出力する。
【0045】
VCD画面を出力すると、プロセッサ11は、操作インターフェース17を通じて宛先の入力を受け付ける。プロセッサ11は、操作インターフェース17を通じて、操作部が接続されている場合と同様の信号(キー入力などを示す操作信号)をエミュレータ4から取得する。
【0046】
プロセッサ11は、操作インターフェース17を通じて入力が確定する操作信号(たとえば、エンターキーが押された操作信号など)を受信すると、通信部15を通じて入力された宛先を処理装置に送信する。
【0047】
ここでは、第1のVCD10aは、プロセッサ11a、ROM12a、RAM13a、NVM14a、通信部15a、表示インターフェース16a及び操作インターフェース17aなどを備える。
【0048】
また、第2のVCD10bは、プロセッサ11b、ROM12b、RAM13b、NVM14b、通信部15b、表示インターフェース16b及び操作インターフェース17bなどを備える。
【0049】
次に、OCR装置20について説明する。第1のOCR装置20a及び第2のOCR装置20bは、同様の構成であるため、OCR装置20として説明する。
【0050】
図3は、実施形態に係るOCR装置20の構成例を示す。図3は、OCR装置20の構成例を示すブロック図である。図3が示すように、OCR装置20は、プロセッサ21、ROM22、RAM23、NVM24、通信部25、エミュレータインターフェース26、画像インターフェース27、表示インターフェース28及び操作インターフェース29などを備える。
【0051】
プロセッサ21と、ROM22、RAM23、NVM24、エミュレータインターフェース26、画像インターフェース27、表示インターフェース28及び操作インターフェース29と、は、データバスなどを介して互いに接続する。
なお、OCR装置20は、図3が示すような構成の他に必要に応じた構成を具備したり、OCR装置20から特定の構成が除外されたりしてもよい。
【0052】
プロセッサ21は、OCR装置20全体の動作を制御する機能を有する。プロセッサ21は、内部キャッシュ及び各種のインターフェースなどを備えてもよい。プロセッサ21は、内部メモリ、ROM22又はNVM24が予め記憶するプログラムを実行することにより種々の処理を実現する。
【0053】
なお、プロセッサ21がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであってもよい。この場合、プロセッサ21は、ハードウエア回路により実行される機能を制御する。
【0054】
ROM22は、制御プログラム及び制御データなどが予め記憶された不揮発性のメモリである。ROM22に記憶される制御プログラム及び制御データは、OCR装置20の仕様に応じて予め組み込まれる。
【0055】
RAM23は、揮発性のメモリである。RAM23は、プロセッサ21の処理中のデータなどを一時的に格納する。RAM23は、プロセッサ21からの命令に基づき種々のアプリケーションプログラムを格納する。また、RAM23は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。
【0056】
NVM24は、データの書き込み及び書き換えが可能な不揮発性のメモリである。たとえば、NVM24は、たとえば、HDD、SSD又はフラッシュメモリなどから構成される。NVM24は、OCR装置20の運用用途に応じて制御プログラム、アプリケーション及び種々のデータなどを格納する。
【0057】
通信部25(画像インターフェース、入力インターフェース)は、管理PC2又は他のOCR装置20とデータを送受信するためのインターフェースである。通信部25は、ネットワーク3に接続する。たとえば、通信部25は、有線又は無線のLAN接続をサポートするインターフェースである。
【0058】
エミュレータインターフェース26(入力インターフェース)は、エミュレータ4とデータを送受信するインターフェースである。エミュレータインターフェース26は、プロセッサ21からの制御に従ってエミュレータ4に操作信号をVCD10へ出力させる。たとえば、エミュレータインターフェース26は、USB接続をサポートする。
【0059】
画像インターフェース27は、キャプチャボード5とデータを送受信するインターフェースである。画像インターフェース27は、キャプチャボード5からVCD画面を取得する。画像インターフェース27は、取得されたVCD画面をプロセッサ21に供給する。
【0060】
表示インターフェース28は、表示端末7とデータを送受信するインターフェースである。表示インターフェース28は、プロセッサ11からの制御に従って、表示端末7に情報を表示させる。
【0061】
操作インターフェース29は、操作端末8とデータを送受信するインターフェースである。操作インターフェース29は、操作端末8に入力される操作を示す操作信号を受信する。操作インターフェース29は、受信された操作信号をプロセッサ21に供給する。たとえば、操作インターフェース29は、USB接続をサポートする。
【0062】
たとえば、OCR装置20は、デスクトップPC又はノートPCなどである。
なお、エミュレータインターフェース26、画像インターフェース27、表示インターフェース28及び操作インターフェース29(又はこれらの一部)は、一体的に形成されるものであってもよい。
【0063】
ここでは、第1のOCR装置20aは、プロセッサ21a、ROM22a、RAM23a、NVM24a、通信部25a、エミュレータインターフェース26a、画像インターフェース27a、表示インターフェース28a及び操作インターフェース29aなどを備える。
【0064】
また、第2のOCR装置20bは、プロセッサ21b、ROM22b、RAM23b、NVM24b、通信部25b、エミュレータインターフェース26b、画像インターフェース27b、表示インターフェース28b及び操作インターフェース29bなどを備える。
【0065】
次に、OCR装置20が実現する機能について説明する。OCR装置20が実現する機能は、プロセッサ21がROM22又はNVM24などに格納されるプログラムを実行することで実現される。
【0066】
まず、プロセッサ21は、キャプチャボード5を用いてVCD10が供給するVCD画面を取得する機能を有する。
即ち、プロセッサ21は、VCD10が表示インターフェース16に接続する表示端末(ディスプレイなど)に表示する画像を取得する。
【0067】
プロセッサ21は、画像インターフェース27を通じてVCD画面をキャプチャボード5から取得する。即ち、キャプチャボード5は、プロセッサ21からの制御に従ってVCD画面を取得する。キャプチャボード5は、画像インターフェース27を通じて、取得されたVCD画面をプロセッサ21に供給する。
【0068】
たとえば、プロセッサ21は、所定の間隔(たとえば、1秒)でVCD画面を取得する。また、プロセッサ21は、VCD画面に変化が生じた場合に、VCD画面を取得してもよい。この場合、プロセッサ21は、画像処理アルゴリズムなどに従ってVCD画面に変化が生じたかを判定してもよい。
【0069】
プロセッサ21は、OCR(セカンダリOCR)処理によりVCD画面から宛先を取得する機能を有する。
【0070】
VCD画面を取得すると、プロセッサ21は、予め取得されたフォーマットなどに従ってVCD画面から宛先画像を抽出する。
宛先画像を抽出すると、プロセッサ21は、第1のアルゴリズムとは異なる所定のアルゴリズム(第2のアルゴリズム)に従って宛先画像にOCR処理を行う。第2のアルゴリズムは、第1のアルゴリズムが認識できない文字画像の少なくとも一部を認識することができる。
【0071】
OCR処理を行うと、プロセッサ21は、OCR処理の結果に基づいて物品の宛先面に記載されている宛先を取得する。
【0072】
なお、プロセッサ21は、OCR処理を行う前に、VCD画面又は宛先画像に所定の処理を行ってもよい。たとえば、プロセッサ21は、VCD画面又は宛先画像を拡大又は縮小してもよい。また、プロセッサ21は、VCD画面又は宛先画像に対してノイズを除去する処理などを行ってもよい。
【0073】
また、プロセッサ21は、エミュレータ4を用いて、OCR処理により取得された宛先をVCD10に送信する機能を有する。
【0074】
OCR処理により宛先を取得すると、プロセッサ21は、エミュレータ4を用いて、宛先をVCD10の操作インターフェース17に送信する。即ち、プロセッサ21は、宛先を入力するキー入力操作を示す操作信号を操作インターフェース17に送信する。
【0075】
また、プロセッサ21は、宛先の入力を完了する操作を示す操作信号を操作インターフェース17に入力してもよい。
【0076】
また、プロセッサ21は、OCR処理に失敗した場合、操作端末8への操作(キー入力など)を示す操作信号をVCD10に入力する機能を有する。
【0077】
OCR処理に失敗した場合、プロセッサ21は、VCD10からのVCD画面を表示端末7に表示する。
【0078】
図4は、VCD画面30の例を示す。図4が示す例では、VCD画面30は、宛先として郵便番号の入力を受け付ける。図4が示すように、VCD画面30は、表示領域31及び入力フォーム32などを表示する。また、VCD画面30上には、ダイアログ33が表示される。ダイアログ33については、後述する。
【0079】
表示領域31は、宛先画像を表示する。ここでは、表示領域31は、封筒の宛先面を表示する。
【0080】
入力フォーム32は、宛先として郵便番号の入力を受け付ける。入力フォーム32は、操作端末8に入力された宛先(ここでは、郵便番号)を表示する。
VCD画面を表示端末7に表示すると、プロセッサ21は、操作端末8を通じて入力フォーム32への入力を受け付ける。
【0081】
ここで、オペレータは、表示端末7に表示されるVCD画面30の表示領域31を目視して宛先を操作端末8に入力する。宛先の入力が完了すると、オペレータは、操作端末8に、入力を完了する操作を入力する。
【0082】
オペレータが操作端末8にキー入力を行うと、プロセッサ21は、操作インターフェース29を通じて操作端末8からキー入力を示す操作信号を受信する。プロセッサ21は、エミュレータ4を用いて、キー入力を示す操作信号をVCD10に送信する。
【0083】
VCD10のプロセッサ11は、操作インターフェース17を通じて、エミュレータ4からの操作信号を受信する。操作信号を受信すると、プロセッサ11は、入力フォーム32に操作信号に基づく文字列を表示したVCD画面30を生成する。VCD画面30を生成すると、プロセッサ11は、表示インターフェース16を通じてVCD画面30をキャプチャボード5に供給する。
【0084】
キャプチャボード5は、供給されたVCD画面30をOCR装置20に供給する。
OCR装置20のプロセッサ21は、画像インターフェース27を通じてVCD画面30をキャプチャボード5から取得する。VCD画面30を取得すると、プロセッサ21は、表示インターフェース28を通じてVCD画面30(入力フォーム32に入力された文字列を表示するVCD画面30)を表示端末7に表示する。
【0085】
また、プロセッサ21は、他のOCR装置20にVCD画面30を送信してもよい。たとえば、第2のOCR装置20bのプロセッサ11bは、VCD画面30を第1のOCR装置20aに送信する。
【0086】
第1のOCR装置20aのプロセッサ21aは、通信部25aを通じてVCD画面30を第2のOCR装置20bから取得する。VCD画面30を取得すると、プロセッサ21aは、表示インターフェース28を通じてVCD画面30を第1の表示端末7aに表示する。
【0087】
VCD画面30を表示すると、プロセッサ21aは、第1の操作端末8aを通じて宛先の入力を受け付ける。プロセッサ21aは、通信部25aを通じて、入力された操作を示す信号を第2のOCR装置20bに送信する。
【0088】
第2のOCR装置20bのプロセッサ21bは、第1のOCR装置20aからの当該信号を取得する。プロセッサ21bは、第2のエミュレータ4bを用いて、当該信号に基づいて、第1のOCR装置20aに入力された操作を示す操作信号を第2のVCD10bの操作インターフェース17bに入力する。
【0089】
第2のVCD10bのプロセッサ11bは、操作インターフェース17bを通じて、第2のエミュレータ4bからの操作信号を受信する。操作信号を受信すると、プロセッサ11bは、入力フォーム32に操作信号に基づく文字列を表示したVCD画面30を生成する。VCD画面30を生成すると、プロセッサ11bは、表示インターフェース16bを通じてVCD画面30を第2のキャプチャボード5bに供給する。
【0090】
第2のキャプチャボード5bは、供給されたVCD画面30を第2のOCR装置20bに供給する。
第2のOCR装置20bのプロセッサ21bは、画像インターフェース27bを通じてVCD画面30を第2のキャプチャボード5bから取得する。VCD画面30を取得すると、プロセッサ21bは、通信部25bを通じてVCD画面30を第1のOCR装置20aに送信する。
【0091】
第1のOCR装置20aのプロセッサ21aは、通信部25aを通じてVCD画面30を第2のOCR装置20bから受信する。VCD画面30を受信すると、プロセッサ21aは、表示インターフェース28aを通じてVCD画面30(入力フォーム32に入力された文字列を表示するVCD画面30)を第1の表示端末7aに表示する。
【0092】
また、プロセッサ21は、操作端末8を通じて入力された文字列を表示端末7に表示する機能を有する。
【0093】
プロセッサ21は、VCD画面30にダイアログを表示する。
ダイアログ33は、入力フォーム32の近傍に表示されている。ここでは、ダイアログ33は、入力フォーム32の上部に表示されている。
【0094】
ダイアログ33は、入力フォーム32に入力される文字列を表示する。
【0095】
前述の通り、プロセッサ21は、操作端末8を通じて、入力フォーム32への入力を受け付ける。入力フォーム32への入力を受け付けると、プロセッサ21は、ダイアログ33に入力された文字列を表示する。
【0096】
プロセッサ21は、操作端末8を通じてキー入力を受け付けるごとに、ダイアログ33に文字列を表示する。即ち、プロセッサ21は、オペレータのキー入力をリアルタイムにダイアログ33に表示する。また、プロセッサ21は、操作端末8を通じて入力を削除する操作の入力を受け付けると、当該操作に従ってダイアログ33から文字列(又は文字列の一部)を削除してもよい。
【0097】
なお、プロセッサ21は、VCD画面30を表示端末7に表示すると同時にダイアログ33をVCD画面30上に表示してもよい。また、プロセッサ21は、操作端末8を通じてキー入力を受け付けると、ダイアログ33をホップアップして表示してもよい。また、プロセッサ21は、入力が完了すると、ダイアログ33から文字列を削除する。また、プロセッサ21は、入力が完了すると、ダイアログ33を消去してもよい。
【0098】
次に、入力システム1の動作例について説明する。
図5は、入力システム1の動作例について説明するためのシーケンス図である。
【0099】
ここでは、第2のVCD10bがVCD画面30を出力するものとする。また、オペレータは、第1のOCR装置20aに宛先を入力するものとする。
【0100】
まず、第2のVCD10bのプロセッサ11bは、表示インターフェース16bを通じてVCD画面30を第2のOCR装置20bに送信する(S11)。
【0101】
第2のOCR装置20bのプロセッサ21bは、第2のキャプチャボード5bを通じてVCD画面30を取得する。VCD画面30を取得すると、プロセッサ21bは、VCD画面30の表示領域31に対してOCR処理を行う(S12)。ここでは、プロセッサ21bは、OCR処理に失敗したものとする。即ち、プロセッサ21bは、OCR処理によって宛先を取得できなかったものとする。
【0102】
OCR処理に失敗すると、プロセッサ21bは、通信部25bを通じてVCD画面30を第1のOCR装置20aに送信する(S13)。
【0103】
第1のOCR装置20aのプロセッサ21aは、通信部25aを通じてVCD画面30を第2のOCR装置20bから取得する。VCD画面30を取得すると、プロセッサ21aは、表示インターフェース28aを通じて、取得されたVCD画面30を第1の表示端末7aに表示する(S14)。
【0104】
ここで、オペレータは、VCD画面30の入力フォーム32に文字列を入力する(S15)。即ち、オペレータは、第1の操作端末8aにキー入力を行う。
【0105】
第1のOCR装置20aのプロセッサ21aは、操作インターフェース29aを通じてキー入力を示す操作信号を第1の操作端末8aから取得する。操作信号を取得すると、プロセッサ21aは、キー入力が示す文字列をVCD画面30上のダイアログ33に表示する(S16)。
【0106】
キー入力が示す文字列をダイアログ33に表示すると、プロセッサ21aは、通信部25aを通じて、キー入力を示す信号を第2のOCR装置20bに送信する(S17)。
【0107】
第2のOCR装置20bのプロセッサ21bは、通信部25bを通じて当該信号を第1のOCR装置20aから取得する。当該信号を取得すると、プロセッサ21bは、第2のエミュレータ4bを用いて、当該信号に基づいてキー入力を示す操作信号を第2のVCD10bに入力する(S18)。
【0108】
第2のVCD10bのプロセッサ11bは、操作インターフェース17bを通じて当該操作信号を第2のOCR装置20bから取得する。当該操作信号を取得すると、プロセッサ11bは、表示インターフェース16bを通じて、入力フォーム32にキー入力が示す文字列を表示したVCD画面30を第2のOCR装置20bに送信する(S19)。
【0109】
第2のOCR装置20bのプロセッサ21bは、第2のキャプチャボード5bを通じてVCD画面30を取得する。VCD画面30を取得すると、プロセッサ21bは、通信部25bを通じて、取得されたVCD画面30を第1のOCR装置20aに送信する(S20)。
【0110】
第1のOCR装置20aのプロセッサ21aは、通信部25aを通じてVCD画面30を取得する。VCD画面30を取得すると、プロセッサ21aは、表示インターフェース16aを通じて、取得されたVCD画面30を第1の表示端末7aに表示する(S21)。ここで、プロセッサ21aは、ダイアログ33の表示を維持する。
【0111】
入力システム1は、オペレータが宛先の入力を完了するまでS15乃至S21を繰り返す。
宛先の入力が完了すると、第1のOCR装置20aのプロセッサ21aは、VCD画面30及びダイアログ33内の文字列を削除する(S22)。
【0112】
プロセッサ21aがVCD画面30及びダイアログ33内の文字列を削除すると、入力システム1は、動作を終了する。
【0113】
なお、プロセッサ21aは、宛先の入力が完了すると、入力フォーム32の表示が完了する前に(即ち、S21が完了する前に)S22に進んでもよい。
また、プロセッサ21aは、S12でOCR処理に成功すると、第1のエミュレータ4aを用いてOCR処理の結果に基づいて宛先を入力する操作信号を第2のVCD10bに入力する。
【0114】
また、プロセッサ21は、入力フォーム32上にダイアログ33を表示してもよい。
また、プロセッサ21は、文字列として、ID、住所、氏名、メールアドレス又は電話番号などの入力を受け付けるものであってもよい。プロセッサ21が入力を受け付ける文字列は、特定の内容に限定されるものではない。
【0115】
また、プロセッサ21は、エミュレータ4の機能を実現するものであってもよい。たとえば、プロセッサ21は、NVM24などが格納するプログラムを実行することでエミュレータ4の機能を実現する。
また、OCR装置20は、エミュレータ4、キャプチャボード5、表示端末7及び操作端末8と一体的に形成されるものであってもよい。
【0116】
以上のように構成されたOCR装置は、セカンダリOCRに失敗した場合、VCD画面を表示して、オペレータから文字列の入力を受け付ける。OCR装置は、入力された文字列をダイアログに表示する。その結果、OCR装置は、VCD画面に入力された文字列が反映される前に、入力された文字列を表示することができる。従って、OCR装置は、オペレータに、VCDへ入力される文字列を効果的に確認させることができる。
【0117】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
なお、以下に本願の出願当初の特許請求の範囲の記載を付記する。
[C1]
外部装置から文字列を入力する画面を取得する画像インターフェースと、
前記外部装置に操作を示す信号を送信する入力インターフェースと、
表示端末と通信する表示インターフェースと、
操作端末と通信する操作インターフェースと、
前記表示インターフェースを通じて前記画面を前記表示端末に表示し、前記操作インターフェースを通じてキー入力を受け付け、
前記表示インターフェースを通じて前記キー入力が示す文字列を含むダイアログを前記表示端末に表示し、
前記入力インターフェースを通じて前記キー入力を示す信号を前記外部装置に送信し、
前記画像インターフェースを通じて前記キー入力が示す文字列が入力された前記画面を前記外部装置から取得し、
前記表示インターフェースを通じて前記ダイアログと前記画面とを前記表示端末に表示する、
プロセッサと、
を備える情報処理装置。
[C2]
前記プロセッサは、前記画面に前記ダイアログを表示する、
請求項1に記載の情報処理装置。
[C3]
前記画面は、文字列が写る文字列画像を含む、
請求項1又は2に記載の情報処理装置。
[C4]
前記文字列画像は、所定の処理装置が文字認識処理に失敗した画像である、
請求項3に記載の情報処理装置。
[C5]
前記所定の処理装置は、物品を区分する区分機である、
請求項4に記載の情報処理装置。
[C6]
前記プロセッサは、
前記文字列画像に対して文字認識処理を行い、
前記入力インターフェースを通じて、前記文字認識処理の結果に基づいて文字列を入力する信号を前記外部装置に送信し、
前記文字認識処理に失敗した場合、前記操作インターフェースを通じてキー入力を受け付ける、
請求項3乃至5の何れか1項に記載の情報処理装置。
[C7]
前記画面が入力を受け付ける文字列は、宛先である、
請求項1乃至6の何れか1項に記載の情報処理装置。
[C8]
前記宛先は、郵便番号を含む、
請求項7に記載の情報処理装置。
[C9]
前記入力インターフェースは、操作端末をエミュレーションするエミュレータに接続する、
請求項1乃至8の何れか1項に記載の情報処理装置。
[C10]
プロセッサによって実行されるプログラムであって、
前記プロセッサに、
外部装置から文字列を入力する画面を取得する機能と、
前記画面を表示し、キー入力を受け付ける機能と、
前記キー入力が示す文字列を含むダイアログを表示する機能と、
前記キー入力を示す信号を前記外部装置に送信する機能と、
前記キー入力が示す文字列が入力された前記画面を前記外部装置から取得する、
前記ダイアログと前記画面とを表示する機能と、
を実現させるプログラム。
【符号の説明】
【0118】
1…入力システム、2…管理PC、3…ネットワーク、4…エミュレータ、4a…第1のエミュレータ、4b…第2のエミュレータ、5…キャプチャボード、5a…第1のキャプチャボード、5b…第2のキャプチャボード、7…表示端末、7a…第1の表示端末、7b…第2の表示端末、8…操作端末、8a…第1の操作端末、8b…第2の操作端末、10…VCD、10a…第1のVCD、10b…第2のVCD、11(11a及び11b)…プロセッサ、12(12a及び12b)…ROM、13(13a及び13b)…RAM、14(14a及び14b)…NVM、15(15a及び15b)…通信部、16(16a及び16b)…表示インターフェース、17(17a及び17b)…操作インターフェース、20…OCR装置、20a…第1のOCR装置、20b…第2のOCR装置、21(21a及び21b)…プロセッサ、22(22a及び22b)…ROM、23(23a及び23b)…RAM、24(24a及び24b)…NVM、25(25a及び25b)…通信部、26(26a及び26b)…エミュレータインターフェース、27(27a及び27b)…画像インターフェース、28(28a及び28b)…表示インターフェース、29(29a及び29b)…操作インターフェース、30…VCD画面、31…表示領域、32…入力フォーム、33…ダイアログ。
図1
図2
図3
図4
図5