(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-06-23
(45)【発行日】2025-07-01
(54)【発明の名称】情報処理装置及び情報処理プログラム
(51)【国際特許分類】
G06V 30/12 20220101AFI20250624BHJP
G06F 3/0484 20220101ALI20250624BHJP
【FI】
G06V30/12 J
G06V30/12 B
G06F3/0484
(21)【出願番号】P 2021022762
(22)【出願日】2021-02-16
【審査請求日】2024-01-22
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】木村 俊一
(72)【発明者】
【氏名】関野 雅則
(72)【発明者】
【氏名】久保田 聡
【審査官】▲広▼島 明芳
(56)【参考文献】
【文献】特開2020-071619(JP,A)
【文献】特開2020-187493(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/00 - 30/424
G06F 3/0484
(57)【特許請求の範囲】
【請求項1】
プロセッサを備え、
前記プロセッサは、
予め定めた複数の項目に記入又は入力された情報、及び前記複数の項目の前記情報を読取った読取り結果のうち、前記項目毎の前記情報及び前記読取り結果を切り替えて一画面に表示させ、
前記一画面に表示される前記情報及び前記読取り結果の切り替え前後において、前記情報及び前記読取り結果をそれぞれ同じ表示領域に表示させ、かつ、前記情報及び前記読取り結果を同様の表示サイズで表示させる機能を実行し、
前記情報及び前記読取り結果の表示サイズが予め定めた第1サイズよりも小さい場合、前記情報及び前記読取り結果に加えて、ユーザによる前記読取り結果の修正を受付ける修正部を表示させ、
前記修正部に表示される修正表示を前記第1サイズよりも大きい第2サイズで前記一画面に表示させる、
情報処理装置。
【請求項2】
プロセッサを備え、
前記プロセッサは、
予め定めた複数の項目に記入又は入力された情報、及び前記複数の項目の前記情報を読取った読取り結果のうち、前記項目毎の前記情報及び前記読取り結果を切り替えて一画面に表示させ、
表示された前記一画面において、前記情報及び前記読取り結果を前記一画面に隣接して表示させ、かつ、前記読取り結果が表示される表示状態と表示されない非表示状態とのユーザによる切り替えを受付ける機能を実行し、
前記機能を実行した場合、同内容が表示された複数の前記読取り結果と、複数の前記読取り結果に対応する前記情報とを前記一画面に隣接して表示させ、
表示された前記一画面において、複数の前記読取り結果の中の第1読取り結果の修正を受付けた場合、前記第1読取り結果以外の第2読取り結果を非表示状態に切り替える、
情報処理装置。
【請求項3】
コンピュータに、
予め定めた複数の項目に記入又は入力された情報、及び前記複数の項目の前記情報を読取った読取り結果のうち、前記項目毎の前記情報及び前記読取り結果を切り替えて一画面に表示させ、
前記一画面に表示される前記情報及び前記読取り結果の切り替え前後において、前記情報及び前記読取り結果をそれぞれ同じ表示領域に表示させ、かつ、前記情報及び前記読取り結果を同様の表示サイズで表示させる機能を実行し、
前記情報及び前記読取り結果の表示サイズが予め定めた第1サイズよりも小さい場合、前記情報及び前記読取り結果に加えて、ユーザによる前記読取り結果の修正を受付ける修正部を表示させ、
前記修正部に表示される修正表示を前記第1サイズよりも大きい第2サイズで前記一画面に表示させる、
処理を実行させるための情報処理プログラム。
【請求項4】
コンピュータに、
予め定めた複数の項目に記入又は入力された情報、及び前記複数の項目の前記情報を読取った読取り結果のうち、前記項目毎の前記情報及び前記読取り結果を切り替えて一画面に表示させ、
表示された前記一画面において、前記情報及び前記読取り結果を前記一画面に隣接して表示させ、かつ、前記読取り結果が表示される表示状態と表示されない非表示状態とのユーザによる切り替えを受付ける機能を実行し、
前記機能を実行した場合、同内容が表示された複数の前記読取り結果と、複数の前記読取り結果に対応する前記情報とを前記一画面に隣接して表示させ、
表示された前記一画面において、複数の前記読取り結果の中の第1読取り結果の修正を受付けた場合、前記第1読取り結果以外の第2読取り結果を非表示状態に切り替える、
処理を実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、文字認識処理における頻繁な視線の移動や、それに伴う操作の煩雑性を解消した文字認識装置が記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
予め定めた項目に記入又は入力された情報をOCR(=Optical Character Recognition)処理で読取る場合は、OCR処理の精度が100%ではないため、ユーザによる確認及び修正の少なくとも一方の作業が行われることが多い。このとき、ユーザによる作業が多くなるほど人件費を要するため、ユーザによる作業を短時間で終了させることが望ましい。
【0005】
そこで、本発明は、予め定めた項目に記入又は入力された情報を読取った結果に対して、ユーザが行う確認及び修正の少なくとも一方の作業を支援する機能を提供することを目的とする。
【課題を解決するための手段】
【0006】
第1の態様の情報処理装置は、プロセッサを備え、前記プロセッサは、予め定めた複数の項目に記入又は入力された情報、及び前記複数の項目の前記情報を読取った読取り結果のうち、前記項目毎の前記情報及び前記読取り結果を切り替えて一画面に表示させ、表示された前記一画面において、ユーザによる前記読取り結果の確認及び修正の少なくとも一方の支援を行う機能を実行する。
【0007】
第2の態様の情報処理装置は、第1の情報処理装置であって、前記機能は、前記情報及び前記読取り結果を前記一画面に隣接して表示し、かつ、前記読取り結果が表示される表示状態と表示されない非表示状態とのユーザによる切り替えを受付ける第1機能である。
【0008】
第3の態様の情報処理装置は、第2の情報処理装置であって、前記プロセッサは、前記第1機能を実行した場合、前記情報及び前記読取り結果に加えて、ユーザによる前記読取り結果の修正を受付ける修正部を前記一画面に表示させる。
【0009】
第4の態様の情報処理装置は、第3の情報処理装置であって、前記プロセッサは、前記修正部を用いた前記読取り結果の修正を受付けた場合、前記読取り結果を非表示状態に切り替える。
【0010】
第5の態様の情報処理装置は、第2から第4の何れかの態様の情報処理装置であって、前記プロセッサは、前記第1機能を実行した場合、同内容が表示された複数の前記読取り結果と、複数の前記読取り結果に対応する前記情報とを前記一画面に隣接して表示させ、表示された前記一画面において、複数の前記読取り結果の中の第1読取り結果の修正を受付けた場合、前記第1読取り結果以外の第2読取り結果を非表示状態に切り替える。
【0011】
第6の態様の情報処理装置は、第1から第5の何れかの態様の情報処理装置であって、前記機能は、前記一画面に表示される前記情報及び前記読取り結果の切り替え前後において、前記情報及び前記読取り結果をそれぞれ同じ表示領域に表示させる第2機能である。
【0012】
第7の態様の情報処理装置は、第6の情報処理装置であって、前記プロセッサは、前記第2機能を実行した場合、前記情報及び前記読取り結果を同様の表示サイズで表示させる。
【0013】
第8の態様の情報処理装置は、第7の情報処理装置であって、前記プロセッサは、前記情報及び前記読取り結果の表示サイズが予め定めた第1サイズよりも小さい場合、前記情報及び前記読取り結果に加えて、ユーザによる前記読取り結果の修正を受付ける修正部を表示させ、前記修正部に表示される修正表示を前記第1サイズよりも大きい第2サイズで前記一画面に表示させる。
【0014】
第9の態様の情報処理装置は、第1から第8の何れかの態様の情報処理装置であって、前記機能は、予め定めた切り替え操作を1回受付けた場合に、前記一画面に表示される前記情報及び前記読取り結果を切り替える第3機能である。
【0015】
第10の態様の情報処理装置は、第9の情報処理装置であって、前記プロセッサは、前記一画面に前記項目毎の前記情報及び前記読取り結果の一部が表示されている場合に前記切り替え操作を1回受付けたとき、前記第3機能として、前記情報及び前記読取り結果を切り替えて、前記項目毎の前記情報及び前記読取り結果の他の一部を表示させる。
【0016】
第11の態様の情報処理装置は、第1から第10の何れかの態様の情報処理装置であって、前記機能は、予め定めた入力操作を受付けた場合に前記一画面を前記読取り結果が表示されない非表示状態とし、受付けた前記入力操作に応じた入力内容を前記一画面における前記読取り結果を表示するための表示領域に表示させる第4機能である。
【0017】
第12の態様の情報処理装置は、第11の情報処理装置であって、前記プロセッサは、前記入力操作とは異なる特別操作を受付けた場合、前記第4機能として、前記一画面を前記読取り結果が表示される表示状態とし、表示中の前記読取り結果を用いたユーザによる修正を受付ける。
【0018】
第13の態様の情報処理プログラムは、コンピュータに、予め定めた複数の項目に記入又は入力された情報、及び前記複数の項目の前記情報を読取った読取り結果のうち、前記項目毎の前記情報及び前記読取り結果を切り替えて一画面に表示させ、表示された前記一画面において、ユーザによる前記読取り結果の確認及び修正の少なくとも一方の支援を行う機能を実行する、処理を実行させる。
【発明の効果】
【0019】
第1の態様によれば、予め定めた項目に記入又は入力された情報を読取った結果に対して、ユーザが行う確認及び修正の少なくとも一方の作業を支援する機能が提供される。
【0020】
第2の態様によれば、一画面において予め定めた項目に記入又は入力された情報に隣接して表示された読取り結果の表示の有無が切り替えられる。
【0021】
第3の態様によれば、同じ画面に表示された予め定めた複数の項目に記入又は入力された情報及び読取り結果を確認しながら、ユーザに読取り結果の修正作業を行わせることができる。
【0022】
第4の態様によれば、読取り結果を非表示状態に切り替える指示と、修正部を用いた読取り結果の修正を受付ける指示とが別々である構成に比べて、ユーザによる読取り結果の修正作業の工数が削減される。
【0023】
第5の態様によれば、一画面において予め定めた項目に記入又は入力された情報に隣接して表示された複数の読取り結果の中の一部の読取り結果の表示の有無が切り替えられる。
【0024】
第6の態様によれば、切り替え前後で予め定めた複数の項目に記入又は入力された情報及び読取り結果が異なる表示領域に表示される構成に比べて、読取り結果を確認する際のユーザの視線移動が少なくなる。
【0025】
第7の態様によれば、予め定めた複数の項目に記入又は入力された情報及び読取り結果の表示サイズが異なる構成に比べて、読取り結果を確認する際のユーザの視線移動が少なくなる。
【0026】
第8の態様によれば、一画面に予め定めた第1サイズよりも小さい文字及び記号のみが表示される構成に比べて、読取り結果を確認する際のユーザの視認性を高められる。
【0027】
第9の態様によれば、一画面に表示される予め定めた複数の項目に記入又は入力された情報及び読取り結果を切り替える際にユーザによる複数の操作を必要とする構成に比べて、ユーザによる読取り結果の確認作業の工数が削減される。
【0028】
第10の態様によれば、一画面に表示される予め定めた複数の項目に記入又は入力された情報及び読取り結果の切り替えが常に情報を読取った項目毎に行われる構成に比べて、ユーザによる読取り結果の確認作業の工数が削減される。
【0029】
第11の態様によれば、表示中の読取り結果を非表示状態にするための指示と、入力操作に応じた入力内容を表示するための指示とが別々である構成に比べて、ユーザによる読取り結果の修正作業の工数が削減される。
【0030】
第12の態様によれば、ユーザの操作により例外なく表示中の読取り結果が非表示状態となる構成に比べて、ユーザによる読取り結果の修正作業の工数が削減される。
【0031】
第13の態様によれば、予め定めた項目に記入又は入力された情報を読取った結果に対して、ユーザが行う確認及び修正の少なくとも一方の作業を支援する機能が提供される。
【図面の簡単な説明】
【0032】
【
図1】情報処理装置のハードウェア構成を示すブロック図である。
【
図2】第1のジョブの読取り対象となる書類の例である。
【
図3】第2のジョブの読取り対象となる書類の例である。
【
図4】書類P1からP3の読取り範囲内に含まれる画像データの読取り結果を表形式で示した例である。
【
図5】書類P4からP6の読取り範囲内に含まれる画像データの読取り結果を表形式で示した例である。
【
図6】情報処理装置による第1実行処理の流れを示すフローチャートである。
【
図7】情報処理装置の表示部に表示される第1の表示例である。
【
図8】情報処理装置の表示部に表示される第2の表示例である。
【
図9】情報処理装置の表示部に表示される第3の表示例である。
【
図10】情報処理装置の表示部に表示される第4の表示例である。
【
図11】情報表示部に表示される書類情報の表示方法についての説明図である。
【
図12】情報処理装置による第2実行処理の流れを示すフローチャートである。
【
図13】情報処理装置の表示部に表示される第5の表示例である。
【
図14】情報処理装置の表示部に表示される第6の表示例である。
【
図15】第2の実施形態における第1の比較例の確認画面の表示例である。
【
図16】第2の実施形態における第2の比較例の確認画面の表示例である。
【
図17】情報処理装置の表示部に表示される第7の表示例である。
【
図18】情報処理装置による第3実行処理の流れを示すフローチャートである。
【
図19】情報処理装置の表示部に表示される第8の表示例である。
【
図20】第3の実施形態における比較例の確認画面の表示例である。
【
図22】情報処理装置の表示部に表示される第9の表示例である。
【
図23】情報処理装置による第4実行処理の流れを示すフローチャートである。
【
図24】情報処理装置の表示部に表示される第10の表示例である。
【
図25】情報処理装置の表示部に表示される第11の表示例である。
【発明を実施するための形態】
【0033】
(第1の実施形態)
以下、本実施の形態に係る情報処理装置20について説明する。
図1は、情報処理装置20のハードウェア構成を示すブロック図である。情報処理装置20には、一例として、サーバコンピュータ、若しくはパーソナルコンピュータ等の汎用的なコンピュータ装置、又はスマートフォン、若しくはタブレット端末等の携帯端末が適用される。
【0034】
図1に示すように、情報処理装置20は、CPU21(=Central Processing Unit)、ROM22(=Read Only Memory)、RAM23(=Random Access Memory)、記憶部24、入力部25、表示部26、及び通信部27を備えている。各構成は、バス28を介して相互に通信可能に接続されている。CPU21は「プロセッサ」の一例である。
【0035】
CPU21は、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、CPU21は、ROM22又は記憶部24からプログラムを読み出し、RAM23を作業領域としてプログラムを実行する。CPU21は、ROM22又は記憶部24に記憶されているプログラムにしたがって、上記各構成の制御及び各種の演算処理を行う。本実施の形態では、ROM22又は記憶部24には、少なくとも後述する第1実行処理、第2実行処理、第3実行処理、及び第4実行処理を実行するための情報処理プログラムが格納されている。なお、情報処理プログラムは、情報処理装置20に予めインストールされていてもよいし、不揮発性の記憶媒体に記憶したり、又は、ネットワークを介して配布したりして、情報処理装置20に適宜インストールしてもよい。不揮発性の記憶媒体の例としては、CD-ROM、光磁気ディスク、HDD(=Hard Disk Drive)、DVD-ROM、フラッシュメモリ、メモリカード等が想定される。
【0036】
ROM22は、各種プログラム及び各種データを格納する。RAM23は、作業領域として一時的にプログラム又はデータを記憶する。
【0037】
記憶部24は、HDD、SSD(=Solid State Drive)又はフラッシュメモリ等の記憶装置により構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。
【0038】
入力部25は、例えば、マウス等のポインティングデバイス、各種ボタン、キーボード、マイク、及びカメラ等を含み、各種の入力を行うために使用される。
【0039】
表示部26は、例えば、液晶ディスプレイであり、各種の情報を表示する。表示部26は、タッチパネル方式を採用して、入力部25として機能してもよい。
【0040】
通信部27は、他の機器と通信するためのインタフェースである。当該通信には、たとえば、イーサネット(登録商標)若しくはFDDI等の有線通信の規格、又は、4G、5G、若しくはWi-Fi(登録商標)等の無線通信の規格が用いられる。
【0041】
上記の情報処理プログラムを実行する際に、情報処理装置20は、上記のハードウェア資源を用いて、当該情報処理プログラムに基づく処理を実行する。
【0042】
次に、情報処理装置20により行われるOCR処理の流れについて説明する。なお、以下では、前提として、図示しない画像形成装置のFAX機能及びスキャン機能等を用いて、予め定めた複数の項目に文字及び記号等のテキストが記入又は入力された複数の書類が画像データ化され、当該画像データがOCR処理において利用可能になっているものとする。
【0043】
OCR処理では、読取り対象となる書類の画像データを読取る範囲である読取り範囲が設定される。そして、OCR処理では、設定された読取り範囲内に含まれる画像データが読取られ、その結果が読取り結果としてテキストで表示される。
【0044】
また、OCR処理では、読取り範囲内に含まれる画像データを読取る処理の実行単位であるジョブを1つ実行すると、複数枚(例:10枚)の書類のそれぞれの読取り範囲内に含まれる画像データが読取られる。そして、第1の実施形態では、読取り対象となる各書類に対して、予め定めた複数の項目毎の画像データをそれぞれ読取るための複数の読取り範囲が設定されている。
【0045】
以下に第1の実施形態で用いる書類の例を示す。
図2は、第1のジョブの読取り対象となる書類の例であり、
図2(A)は第1のジョブにおける1枚目の読取り対象となる書類P1を示し、
図2(B)は第1のジョブにおける2枚目の読取り対象となる書類P2を示し、
図2(C)は第1のジョブにおける10枚目の読取り対象となる書類P3を示している。また、書類P1からP3は、各書類のレイアウトが同様の定型フォーマットの書類である。
【0046】
図2(A)から(C)に示すように、書類P1からP3では、各書類に記載された「項目1」、「項目2」、「項目3」、「項目4」、及び「項目5」の各文字の右側に位置する矩形の枠が読取り範囲として設定されている。
【0047】
図3は、第2のジョブの読取り対象となる書類の例であり、
図3(A)は第2のジョブにおける1枚目の読取り対象となる書類P4を示し、
図3(B)は第2のジョブにおける2枚目の読取り対象となる書類P5を示し、
図3(C)は第2のジョブにおける3枚目の読取り対象となる書類P6を示している。また、書類P4からP6は、各書類のレイアウトが異なる非定型フォーマットの書類である。
【0048】
図3(A)では、書類P4に記載された「項目1」、「項目2」、及び「項目3」の各文字の右側に位置する矩形の枠が読取り範囲として設定されている。
図3(B)では、書類P5に記載された「項目ア」、「項目イ」、及び「項目ウ」の各文字の右側に位置する矩形の枠が読取り範囲として設定されている。
図3(C)では、書類P6に記載された「項目α」、及び「項目β」の各文字の右側に位置する矩形の枠が読取り範囲として設定されている。
【0049】
そして、情報処理装置20は、OCR処理において、一のジョブに含まれる書類のレイアウトが同様であるか否かに関わらず、読取り範囲として設定された各枠内に含まれる画像データを読取り、その結果を読取り結果としてテキストで表示する。
【0050】
以下にOCR処理における読取り範囲内に含まれる画像データの読取り結果の例を示す。
図4は、書類P1からP3の読取り範囲内に含まれる画像データの読取り結果を表形式で示した例である。また、
図5は、書類P4からP6の読取り範囲内に含まれる画像データの読取り結果を表形式で示した例である。
図4及び
図5では、一のジョブに含まれる各書類と、各書類における各項目とを対応付けて、各項目に対応する読取り範囲内に含まれる画像データを読取ってテキストで示した読取り結果が表示されている。
【0051】
ここで、OCR処理における読取り結果が、当該読取り結果に対応する読取り対象となる書類に予め記入又は入力されたテキストと一致する精度は100%でない。そのため、OCR処理では、表示された読取り結果のユーザによる確認及び修正の少なくとも一方の作業(以下、「確認修正作業」とする)が行われることが多い。このとき、ユーザによる確認修正作業が多くなるほど人件費を要するため、当該確認修正作業を短時間で終了させることが望ましい。
【0052】
そこで、第1の実施形態における情報処理装置20では、OCR処理における読取り結果に対してユーザが行う確認修正作業を支援する機能として、以下で説明する第1機能を実行する。
【0053】
図6は、情報処理装置20により第1機能が実行される第1実行処理の流れを示すフローチャートである。CPU21がROM22又は記憶部24から情報処理プログラムを読み出して、RAM23に展開して実行することにより第1実行処理が行われる。
【0054】
図6に示すステップS10において、CPU21は、OCR処理を開始し、一のジョブに含まれる複数の書類の各読取り範囲内に含まれる画像データの読取りを行う。そして、ステップS11に進む。
【0055】
ステップS11において、CPU21は、書類の項目毎の後述する書類情報と、当該書類情報の画像データの読取り結果とを表示部26の後述する確認画面30に隣接して表示させる。そして、ステップS12に進む。
【0056】
ステップS12において、CPU21は、確認画面30における読取り結果の表示態様を、読取り結果が表示される表示状態と表示されない非表示状態とのユーザによる切り替えを受付ける。そして、当該処理を終了する。第1の実施形態では、ユーザが表示状態と非表示状態とを切り替える方法が複数設けられている。この方法については後述する。
【0057】
次に、第1の実施形態における表示部26の表示例について説明する。
図7は、情報処理装置20の表示部26に表示される第1の表示例である。
【0058】
図7(A)に示す表示部26には、ユーザにOCR処理における読取り結果を確認させるための確認画面30の第1の表示例が表示されている。一例として、確認画面30は、ユーザの入力部25としてのマウス操作により表示される。具体的には、CPU21は、表示部26上の確認画面30を表示させるための図示しない予め定めたアイコンが左クリックにより選択された場合に確認画面30を表示する。なお、確認画面30は、表示部26の一の画面に表示され、「一画面」の一例である。
【0059】
図7(A)に示す確認画面30には、情報表示部31と、結果表示部32と、非表示ボタン33と、が表示されている。
【0060】
情報表示部31は、確認画面30において、読取り対象となった書類の予め定めた複数の項目に記入又は入力された情報である書類情報が表示される部分である。
【0061】
結果表示部32は、確認画面30において、読取り対象となった書類の読取り範囲内に含まれる書類情報の画像データの読取り結果が表示される部分である。
【0062】
第1の実施形態では、
図7(A)に示すように、CPU21が情報表示部31の枠内に表示された書類情報と結果表示部32の枠内に表示された読取り結果とを上下に隣接して表示させている。また、「隣接して表示」とは、上記の書類情報と読取り結果との間の距離hが「情報表示部31又は結果表示部32の矩形の枠の高さ以下」又は「書類情報又は読取り結果のテキストの高さ以下」とすること等である。第1の実施形態では、上記の「隣接して表示」として、上記の書類情報と読取り結果との間の距離hを「結果表示部32の矩形の枠の高さ以下」としている。そして、
図7(A)に示す確認画面30の表示中に非表示ボタン33が操作された場合、CPU21は、読取り結果の表示態様を非表示状態に切り替え、確認画面30から結果表示部32を削除する。つまり、第1の実施形態における非表示状態は、確認画面30から結果表示部32を削除することで、ユーザが読取り結果を視認できない状態である。
【0063】
図7(B)に示す表示部26には、確認画面30の第2の表示例が表示されている。
図7(B)は、
図7(A)に示す確認画面30の表示中に非表示ボタン33が操作された後の状態を示している。
【0064】
図7(B)に示す表示部26では、確認画面30から結果表示部32が削除されたことにより、
図7(A)では視認できなかった書類情報の一部である「D」のテキストが視認可能となっている。そして、
図7(B)に示す確認画面30を見たユーザは、読取り対象となった書類に予め記入又は入力されたテキストの「B」と「C」との間に「D」が含まれていたことを確認できる。
【0065】
ここで、
図7において読取り対象となった書類は、一旦枠内に「ABC」と記入又は入力されたが、本来意図するテキストは「ABDC」であったために、後で枠外に「D」が追記されたものである。このような場合に、書類情報と読取り結果とを隣接して表示すると、
図7(A)に示すように、上記書類の枠外に追記された部分が結果表示部32に覆われ視認できなくなる。
【0066】
また、一般的なOCR処理では、読取り範囲として設定された枠内に含まれる画像データを読取りテキスト化するため、枠外に記入又は入力された部分についてはテキスト化されないことが多い。その結果、書類情報と読取り結果とを隣接して表示する場合に読取り結果が常時表示される構成(以下、「比較構成1」とする)では、ユーザによる確認修正作業で上記書類の枠外に追記された部分を見落とすおそれがある。また、比較構成1では、ユーザによる確認修正作業を一旦終えた後に上記書類の枠外に追記された部分を発見することで、再度ユーザによる確認修正作業を行う必要が生じるおそれもある。
【0067】
第1の実施形態では、CPU21が、読取り対象となった書類の予め定めた複数の項目に記入又は入力された書類情報、及び読取り範囲内に含まれる当該書類情報の画像データを読取った読取り結果のうち、当該書類の項目毎の書類情報及び読取り結果を切り替えて確認画面30に表示させる。そして、CPU21は、表示された確認画面30において、書類情報及び読取り結果を隣接して表示し、かつ、読取り結果が表示される表示状態と表示されない非表示状態とのユーザによる切り替えを受付ける第1機能を実行する。なお、上記の「項目に記入又は入力」には、項目に対応する枠内への記入又は入力に加え、項目に対応する枠からはみ出した当該枠の枠外への記入又は入力(
図7(B)参照)も含まれる。
【0068】
以上の構成により、第1の実施形態によれば、読取り結果に対してユーザが行う確認修正作業を支援する機能が提供される。第1の実施形態によれば、上記の第1機能を実行することで、確認画面30において書類情報に隣接して表示された読取り結果の表示の有無が切り替えられる。そして、第1の実施形態によれば、ユーザが読取り結果を非表示状態に切り替えることで上記書類の項目に対応する枠からはみ出た部分も確認できるため、比較構成1に比べて、上記書類の書類情報の見落としが抑制される。また、第1の実施形態によれば、上記構成に加えて書類情報及び読取り結果が隣接して表示されることで書類情報及び読取り結果の比較が容易となるため、比較構成1に比べて、ユーザによる読取り結果の確認修正作業の工数が削減される。
【0069】
図8は、情報処理装置20の表示部26に表示される第2の表示例である。
図8(A)に示す表示部26には、確認画面30の第3の表示例が表示されている。
図8(A)に示す確認画面30には、情報表示部31と、結果表示部32と、非表示ボタン33と、修正部34と、が表示されている。なお、
図8(A)に示す情報表示部31に表示された書類情報及び結果表示部32に表示された読取り結果は、
図7(A)と同内容である。
【0070】
修正部34は、確認画面30において、結果表示部32に表示される読取り結果と同内容のテキストが修正可能に表示される部分である。
【0071】
ユーザによる読取り結果の確認修正作業として修正作業を行うためには、確認画面30において読取り結果の修正入力が可能な機能を提供する必要がある。そこで、第1の実施形態では、CPU21が、修正部34を用いたユーザによる読取り結果の修正を受付けている。
【0072】
図8(B)に示す表示部26には、確認画面30の第4の表示例が表示されている。
図8(B)は、
図8(A)に示す確認画面30に対して、修正部34を用いたユーザによる読取り結果の修正が行われた後の状態を示している。
【0073】
図8(B)に示す修正部34は、
図8(A)に示す修正部34で「ABC」と表示されていた「B」と「C」との間に「D」のテキストが追加されている。このとき、ユーザは、非表示ボタン33を操作して確認画面30から結果表示部32を削除することで、
図8(B)に示すように、
図8(A)では視認できなかった書類情報の一部を視認しつつ、修正部34を用いた読取り結果の修正が行える。
【0074】
上記のように、CPU21は、第1機能を実行した場合、書類情報及び読取り結果に加えて、修正部34を確認画面30に表示させる。第1の実施形態では、書類情報及び読取り結果として表示されたテキストは修正不能であるが、修正部34に表示されたテキストは修正可能であるため、修正部34を用いた読取り結果の修正が行える。そのため、第1の実施形態によれば、同じ画面に表示された書類情報及び読取り結果を確認しながら、ユーザに読取り結果の確認修正作業を行わせることができる。
【0075】
なお、修正部34には、
図8(A)に示すように結果表示部32に表示される読取り結果と同内容のテキストが予め表示されていてもよいし、修正部34の初期状態はテキストが表示されていない空白であってもよい。
【0076】
図9は、情報処理装置20の表示部26に表示される第3の表示例である。
図9(A)に示す表示部26には、確認画面30の第5の表示例が表示されている。
図9(A)に示す確認画面30には、情報表示部31と、結果表示部32と、修正部34と、が表示されている。なお、
図9(A)に示す情報表示部31に表示された書類情報及び結果表示部32に表示された読取り結果は、
図7(A)と同内容である。
【0077】
ここで、CPU21は、
図9(A)に示す確認画面30の表示中に、修正部34を用いた読取り結果の修正を受付けた場合、読取り結果の表示態様を非表示状態に切り替え、確認画面30から結果表示部32を削除する。一例として、CPU21は、修正部34に表示されたテキストをマウスで左クリックしてキャレット35が表示された場合に確認画面30から結果表示部32を削除する。
【0078】
図9(B)に示す表示部26には、確認画面30の第6の表示例が表示されている。
図9(B)は、
図9(A)に示す確認画面30に対して、修正部34を用いたユーザによる読取り結果の修正が行われた後の状態を示している。
【0079】
図9(B)に示す修正部34は、
図9(A)に示す修正部34で「ABC」と表示されていた「B」と「C」との間に「D」のテキストが追加されている。当該「D」のテキストの追加は、ユーザによる入力部25としてのキーボードの文字キーの操作で行われる。このとき、
図9(B)では、
図8に示す確認画面30とは異なり、ユーザによる非表示ボタン33の操作なしに確認画面30から結果表示部32が削除されている。
図9(B)に示す確認画面30では、CPU21が、修正部34を用いた読取り結果の修正を受付けたことに基づき、読取り結果を非表示状態に切り替え、確認画面30から結果表示部32を削除している。そのため、第1の実施形態によれば、読取り結果を非表示状態に切り替える指示と、修正部34を用いた読取り結果の修正を受付ける指示とが別々である構成に比べて、ユーザによる読取り結果の確認修正作業の工数が削減される。
【0080】
なお、修正部34を用いた読取り結果の修正の受付けは、修正部34に表示されたテキストをマウスで左クリックして指定することに限らず、修正部34の枠内又は枠上の任意の位置をマウスで左クリックして指定することでもよい。
【0081】
図10は、情報処理装置20の表示部26に表示される第4の表示例である。
図10(A)に示す表示部26には、確認画面30の第7の表示例が表示されている。
図10(A)に示す確認画面30には、情報表示部31と、結果表示部32、36と、が表示されている。
【0082】
ここで、
図10(A)に示す情報表示部31に表示された書類情報及び結果表示部32、36に表示された読取り結果は、
図7(A)と同内容である。ただし、
図10に示す確認画面30では、
図7に示す確認画面30と異なり、結果表示部32、36に表示された読取り結果を用いた修正が可能とされている。
【0083】
また、
図10(A)に示すように、CPU21は、情報表示部31に表示された書類情報を結果表示部32、36に表示された読取り結果で上下に挟みつつ隣接して表示させている。
【0084】
CPU21は、
図10(A)に示す確認画面30の表示中に、複数の読取り結果の中の一の読取り結果の修正を受付けた場合、当該一の読取り結果以外の他の読取り結果を非表示状態に切り替え、当該他の読取り結果が表示された結果表示部32又は結果表示部36を確認画面30から削除する。一例として、CPU21は、結果表示部32又は結果表示部36に表示された読取り結果をマウスで左クリックしてキャレット35が表示された場合に、キャレット35が表示されていない読取り結果が表示された結果表示部32又は結果表示部36を確認画面30から削除する。
【0085】
図10(B)に示す表示部26には、確認画面30の第8の表示例が表示されている。
図10(B)は、
図10(A)に示す確認画面30に対して、結果表示部36を用いたユーザによる読取り結果の修正が行われた後の状態を示している。
【0086】
図10(B)に示す結果表示部36は、
図10(A)に示す結果表示部36で「ABC」と表示されていた「B」と「C」との間に「D」のテキストが追加されている。当該「D」のテキストの追加は、ユーザによる入力部25としてのキーボードの文字キーの操作で行われる。このとき、
図10(B)では、確認画面30から結果表示部32が削除されているため、ユーザは、読取り対象となった書類に予め記入又は入力されたテキストの「B」と「C」との間に「D」が含まれていたことを確認しつつ、結果表示部36を用いた読取り結果の修正が行える。上記の場合、結果表示部36に表示された読取り結果が「第1読取り結果」の一例となり、結果表示部32に表示された読取り結果が「第2読取り結果」の一例となる。
【0087】
上記のように、CPU21は、第1機能を実行した場合、同内容が表示された複数の読取り結果と、複数の読取り結果に対応する書類情報とを確認画面30に隣接して表示させる。そして、CPU21は、表示された確認画面30において、複数の読取り結果の中の一の読取り結果の修正を受付けた場合、当該一の読取り結果以外の他の読取り結果を非表示状態に切り替える。これにより、第1の実施形態によれば、確認画面30において書類情報に隣接して表示された複数の読取り結果の中の一部の読取り結果の表示の有無が切り替えられる。そして、第1の実施形態によれば、修正対象以外の読取り結果をユーザが視認できなくすることで読取り対象となる書類の項目に対応する枠からはみ出た部分も確認できるため、比較構成1に比べて、上記書類の書類情報の見落としが抑制される。
【0088】
次に、第1の実施形態における情報表示部31に表示される書類情報の表示方法について説明する。
【0089】
図11は、第1の実施形態における情報表示部31に表示される書類情報の表示方法についての説明図である。
【0090】
図11(A)は、読取り対象となる書類P7を示している。
図11(A)に示すように、書類P7には、「項目1」及び「項目2」等の複数の項目にテキストが予め記入又は入力されている。
【0091】
図11(B)は、
図11(A)に示す書類P7の各項目に対応する書類情報の情報表示部31における第1の表示方法を示している。当該第1の表示方法では、CPU21が、書類P7の一の項目に予め記入又は入力されたテキストを含んだ領域を切り取って表示している。そして、当該第1の表示方法では、一例として、表示部26上の次の項目を表示させるための図示しない予め定めたアイコンが左クリックにより選択された場合に、CPU21が書類P7の次の項目に予め記入又は入力されたテキストを含んだ領域を切り取って表示する。
【0092】
図11(C)は、
図11(A)に示す書類P7の各項目に対応する書類情報の情報表示部31における第2の表示方法を示している。当該第2の表示方法は、書類P7の一部が表示される点では上記の第1の表示方法と同様だが、次の項目に予め記入又は入力されたテキストを表示させる方法が異なる。具体的には、当該第2の表示方法では、スクロールバー37を操作して画面をスクロールすることで、CPU21が情報表示部31に表示される書類P7の領域を切り替える。
【0093】
第1の実施形態では、確認画面30において、書類情報と読取り結果とを上下に隣接して表示させたが、隣接させる方向はこれに限らず、書類情報と読取り結果とを左右に隣接して表示させてもよい。
【0094】
第1の実施形態では、確認画面30に複数の読取り結果として2つの読取り結果を表示させたが、これに限らず、確認画面30に表示される読取り結果は3つ以上でもよい。
【0095】
(第2の実施形態)
次に、情報処理装置20の第2の実施形態について、他の実施形態との重複部分を省略又は簡略しつつ説明する。
【0096】
第2の実施形態における情報処理装置20では、OCR処理における読取り結果に対してユーザが行う確認修正作業を支援する機能として、以下で説明する第2機能を実行する。
【0097】
図12は、情報処理装置20により第2機能が実行される第2実行処理の流れを示すフローチャートである。CPU21がROM22又は記憶部24から情報処理プログラムを読み出して、RAM23に展開して実行することにより第2実行処理が行われる。
【0098】
図12に示すステップS20において、CPU21は、OCR処理を開始し、一のジョブに含まれる複数の書類の各読取り範囲内に含まれる画像データの読取りを行う。そして、ステップS21に進む。
【0099】
ステップS21において、CPU21は、書類の項目毎の書類情報と、当該書類情報の画像データの読取り結果とを表示部26の確認画面30に表示させる。そして、ステップS22に進む。
【0100】
ステップS22において、CPU21は、入力部25を通じた確認画面30に表示される書類情報及び読取り結果を切り替えるための切り替え操作が行われたか否かを判定し、切り替え操作が行われたと判定した場合(ステップS22:YES)はステップS23に進む。一方、CPU21により切り替え操作が行われていないと判定された場合(ステップS22:NO)は切り替え操作が行われるまで待機する。第2の実施形態では、切り替え操作を、一例として、入力部25としてのキーボードのエンターキー又はタブキーの操作としている。
【0101】
ステップS23において、CPU21は、確認画面30に表示される書類情報及び読取り結果を切り替え、切り替え前後で同じ表示領域に書類情報及び読取り結果をそれぞれ表示させる。そして、当該処理を終了する。
【0102】
次に、第2の実施形態における表示部26の表示例について説明する。
図13は、情報処理装置20の表示部26に表示される第5の表示例である。
【0103】
図13に示す表示部26には、確認画面30の第9の表示例が表示されている。
図13に示す確認画面30には、表示部26の画面中央付近に、情報表示部31と、結果表示部32と、が表示されている。情報表示部31及び結果表示部32のそれぞれの矩形の枠は、確認画面30において、固定位置、すなわち、同じ表示領域に表示される。そして、
図13では、図示されていないが、情報表示部31の枠内には、読取り対象となった書類の書類情報が表示され、結果表示部32の枠内には、読取り対象となった書類の読取り範囲内に含まれる書類情報の画像データの読取り結果が表示される。
【0104】
以下、第2の実施形態において、
図2(A)に示す書類P1の複数の項目毎の書類情報及び読取り結果を切り替えて表示する場合について説明する。
【0105】
図14は、情報処理装置20の表示部26に表示される第6の表示例である。
図14(A)は、書類P1の「項目1」に対応する書類情報及び読取り結果が表示された確認画面30の第10の表示例を示し、
図14(B)は、書類P1の「項目2」に対応する書類情報及び読取り結果が表示された確認画面30の第11の表示例を示している。
【0106】
まず、CPU21は、表示部26上の確認画面30を表示させるための図示しない予め定めたアイコンが左クリックにより選択された場合に、
図14(A)に示す確認画面30を表示させる。このとき、CPU21は、情報表示部31及び結果表示部32に、書類P1の「項目1」に対応する「ABC」のテキストを書類情報及び読取り結果として表示させる。そして、CPU21は、
図14(A)に示す確認画面30の表示中に切り替え操作が行われたと判定した場合、確認画面30に表示される書類情報及び読取り結果を切り替える。このとき、CPU21は、切り替え後の書類P1の「項目2」に対応する「DEFG」のテキストを、書類情報及び読取り結果として、切り替え前と同じ表示領域である情報表示部31及び結果表示部32に表示させる。つまり、第2の実施形態では、書類情報及び読取り結果の表示領域が表示部26の画面中央付近の情報表示部31及び結果表示部32のそれぞれの枠内に固定されているため、切り替え前後で同じ枠内に各書類情報及び各読取り結果が表示される。そして、第2の実施形態では、情報表示部31及び結果表示部32の枠内に書類P1の複数の項目に対応する書類情報及び読取り結果を表示せず、1つの項目に対応する書類情報及び読取り結果を表示している。
【0107】
ここで、ユーザによる読取り結果の確認修正作業の工数を削減するためには、読取り結果を確認する際のユーザの視線移動を少なくすることが望ましい。
【0108】
図15は、第2の実施形態における第1の比較例(以下、「比較構成2」とする)の確認画面300の表示例である。
図15に示す確認画面300には、情報表示部310と、結果表示部320と、が表示されている。
【0109】
図15に示す情報表示部310には、書類情報として、書類P1の「項目1」に対応する「ABC」及び「項目2」に対応する「DEFG」のテキストが上下に並んで表示されている。また、結果表示部320には、書類P1の1つの項目に対応する読取り結果が表示されている。
【0110】
そして、比較構成2では、
図15(A)に示すように、書類情報として表示された「ABC」のテキストと、読取り結果として表示された「ABC」のテキストとが上下に隣接して表示されている。また、比較構成2では、
図15(B)に示すように、書類情報として表示された「DEFG」のテキストと、読取り結果として表示された「DEFG」のテキストとが上下に隣接して表示されている。
【0111】
上記の構成により、比較構成2では、複数の読取り結果を確認すると、ユーザの視線が上下に移動することになる。
【0112】
これに対し、第2の実施形態では、CPU21が、確認画面30に表示される書類情報及び読取り結果の切り替え前後において、書類情報及び読取り結果をそれぞれ同じ表示領域である情報表示部31及び結果表示部32に表示させる第2機能を実行する。そのため、第2の実施形態によれば、切り替え前後で書類情報及び読取り結果が異なる表示領域に表示される構成に比べて、読取り結果を確認する際のユーザの視線移動が少なくなる。
【0113】
次に、第2の実施形態における第2の比較例(以下、「比較構成3」とする)について説明する。
【0114】
図16は、比較構成3の確認画面300の表示例である。
図16に示す確認画面300には、情報表示部310と、結果表示部320と、が表示されている。なお、
図16に示す情報表示部310に表示された書類情報及び結果表示部320に表示された読取り結果は、
図15と同内容である。
【0115】
比較構成3では、
図16(A)に示すように、書類情報として表示された「ABC」の表示サイズが、読取り結果として表示された「ABC」の表示サイズよりも大きく、双方の表示サイズが異なっている。また、比較構成3では、
図16(B)に示すように、書類情報として表示された「DEFG」の表示サイズが、読取り結果として表示された「DEFG」の表示サイズよりも大きく、双方の表示サイズが異なっている。
【0116】
上記の構成により、比較構成3では、書類情報として表示されたテキストと、読取り結果として表示されたテキストとに対して、ユーザが同時に視点を合わせることが困難となる。そのため、比較構成3では、一例として、読取り結果として表示されたテキストに対して視点を合わせた後、視線を移動させて書類情報として表示されたテキストに対して視点を合わせることとなる。したがって、比較構成3では、書類情報及び読取り結果を比較する際のユーザの視線移動が多くなることが想定される。
【0117】
これに対し、第2の実施形態では、CPU21は、第2機能を実行した場合、書類情報及び読取り結果を同様の表示サイズで表示させる。
【0118】
ここで、第2の実施形態では、書類情報の一テキストあたりの幅及び高さ、並びに、情報表示部31及び結果表示部32の枠の高さのそれぞれに対応する表示サイズが予め設定され、記憶部24に記憶されている。そして、第2の実施形態では、書類情報及び読取り結果を同様の表示サイズとする方法として以下の3種類が設けられている。
【0119】
方法1は、情報表示部31に表示された書類情報の存在範囲W及びテキスト数Nを用いる方法である。
図14(A)を例にすると、存在範囲Wは、書類情報として表示された「A」の左端から「C」の右端までの幅であり、テキスト数Nは「3」である。このとき、一例として、存在範囲Wが「3cm」であった場合は、存在範囲Wをテキスト数Nで割ることにより書類情報の一テキストあたりの幅が算出される。この場合は、書類情報の一テキストあたりの幅が「1cm」と算出される。そして、CPU21は、書類情報の一テキストあたりの幅「1cm」に対応する表示サイズを記憶部24から取得し、取得した表示サイズで読取り結果を表示させる。
【0120】
方法2は、情報表示部31に表示された書類情報の一テキストあたりの高さを用いる方法である。
図14(A)を例にすると、方法2は、一例として、CPU21が、書類情報として表示された「A」、「B」、及び「C」の高さの平均を算出し、算出した平均高さに対応する表示サイズを記憶部24から取得し、取得した表示サイズで読取り結果を表示させる。
【0121】
方法3は、情報表示部31及び結果表示部32の枠の高さを用いる方法である。
図14(A)を例にすると、方法3は、一例として、CPU21が、情報表示部31及び結果表示部32の枠の高さの平均を算出し、算出した平均高さに対応する表示サイズを記憶部24から取得し、取得した表示サイズで読取り結果を表示させる。
【0122】
上記の構成により、第2の実施形態では、書類情報として表示されたテキストと、読取り結果として表示されたテキストとに対して、ユーザが同時に視点を合わせることが可能となる。そのため、第2の実施形態によれば、書類情報及び読取り結果の表示サイズが異なる構成に比べて、読取り結果を確認する際のユーザの視線移動が少なくなる。
【0123】
なお、上記の「同様の表示サイズ」とは、必ずしも同一の表示サイズである必要はなく、多少の相違は許容される。一例として、書類情報の表示サイズが予め用意された読取り結果の表示サイズと一致しない場合、CPU21は、上記の書類情報の表示サイズに最も近い表示サイズで読取り結果を表示させる。この場合でも、書類情報及び読取り結果は、上記の「同様の表示サイズ」で表示されていることに含まれる。
【0124】
また、CPU21は、書類情報及び読取り結果の表示サイズが予め定めた第1サイズよりも小さい場合、書類情報及び読取り結果に加えて、ユーザによる読取り結果の修正を受付ける修正部34に表示させる。そして、CPU21は、修正部34に表示される読取り結果と同内容のテキストである修正表示を第1サイズよりも大きい第2サイズで確認画面30に表示させる。
【0125】
図17は、情報処理装置20の表示部26に表示される第7の表示例である。
図17に示す表示部26には、確認画面30の第12の表示例が表示されている。
図17に示す確認画面30には、情報表示部31と、結果表示部32と、修正部34と、が表示されている。
【0126】
図17に示す情報表示部31には、書類情報として「ABCDEFGHIJKLMNOPQRTSTUVWXYZ」のテキストが表示され、結果表示部32には、読取り結果として「ABCDEFGHIJKLMNOPQRTSTUVWXYZ」のテキストが表示されている。
【0127】
図17に示す修正部34には、修正表示として、読取り結果と同内容である「ABCDEFGHIJKLMNOPQRTSTUVWXYZ」が修正可能に表示されている。
【0128】
ここで、
図17に示す書類情報及び読取り結果の表示サイズは、第1サイズよりも小さい。そのため、CPU21は、書類情報及び読取り結果に加えて修正部34を確認画面30に表示し、当該修正部34に表示される修正表示を第1サイズよりも大きい第2サイズで表示させる。なお、第2サイズは、予め定めたユーザの視認性が高い固定の表示サイズである。
【0129】
上記の構成により、第2の実施形態によれば、確認画面30に予め定めた第1サイズよりも小さいテキストのみが表示される構成に比べて、読取り結果を確認する際のユーザの視認性を高められる。
【0130】
第2の実施形態では、切り替え操作を入力部25としてのキーボードのエンターキー又はタブキーの操作としたが、切り替え操作はこれに限られない。一例として、当該切り替え操作は、表示部26に表示された予め定めたボタン操作でもよいし、マウス操作でもよいし、上記のエンターキー及びタブキーとは異なるキーボード操作でもよい。
【0131】
(第3の実施形態)
次に、情報処理装置20の第3の実施形態について、他の実施形態との重複部分を省略又は簡略しつつ説明する。
【0132】
第3の実施形態における情報処理装置20では、OCR処理における読取り結果に対してユーザが行う確認修正作業を支援する機能として、以下で説明する第3機能を実行する。
【0133】
図18は、情報処理装置20により第3機能が実行される第3実行処理の流れを示すフローチャートである。CPU21がROM22又は記憶部24から情報処理プログラムを読み出して、RAM23に展開して実行することにより第3実行処理が行われる。
【0134】
図18に示すステップS30において、CPU21は、OCR処理を開始し、一のジョブに含まれる複数の書類の各読取り範囲内に含まれる画像データの読取りを行う。そして、ステップS31に進む。
【0135】
ステップS31において、CPU21は、書類の項目毎の書類情報と、当該書類情報の画像データの読取り結果とを表示部26の確認画面30に表示させる。そして、ステップS32に進む。
【0136】
ステップS32において、CPU21は、入力部25を通じた確認画面30に表示される書類情報及び読取り結果を切り替えるための切り替え操作が1回行われたか否かを判定し、切り替え操作が1回行われたと判定した場合(ステップS32:YES)はステップS33に進む。一方、CPU21により切り替え操作が1回行われていないと判定された場合(ステップS32:NO)は切り替え操作が1回行われるまで待機する。第3の実施形態では、一例として、切り替え操作を第2の実施形態と同様に入力部25としてのキーボードのエンターキー又はタブキーの操作としている。
【0137】
ステップS33において、CPU21は、確認画面30に表示される書類情報及び読取り結果を切り替えて表示させる。そして、当該処理を終了する。
【0138】
次に、第3の実施形態における表示部26の表示例について説明する。
図19は、情報処理装置20の表示部26に表示される第8の表示例である。
【0139】
図19(A)に示す表示部26には、確認画面30の第13の表示例が表示されている。
図19(A)に示す確認画面30には、情報表示部31と、結果表示部32と、が表示されている。そして、
図19(A)に示す情報表示部31及び結果表示部32には、
図2に示す書類P1の「項目1」に対応する「ABC」のテキストが書類情報及び読取り結果として表示されている。CPU21は、
図19(A)に示す確認画面30の表示中に切り替え操作が1回行われたと判定した場合、確認画面30に表示される書類情報及び読取り結果を切り替える。
【0140】
図19(B)に示す表示部26には、確認画面30の第14の表示例が表示されている。
図19(B)は、
図19(A)に示す確認画面30の表示中に切り替え操作が1回行われた後の状態を示している。
図19(B)に示す確認画面30では、CPU21が、情報表示部31及び結果表示部32に、書類P1の「項目2」に対応する「DEFG」のテキストを書類情報及び読取り結果として表示させている。また、CPU21は、
図19(B)に示す確認画面30の表示中に切り替え操作が1回行われたと判定した場合、確認画面30に表示される書類情報及び読取り結果を切り替える。
【0141】
図19(C)に示す表示部26には、確認画面30の第15の表示例が表示されている。
図19(C)は、
図19(B)に示す確認画面30の表示中に切り替え操作が1回行われた後の状態を示している。
図19(C)に示す確認画面30では、CPU21が、情報表示部31及び結果表示部32に、書類P1の「項目3」に対応する「HIJ」のテキストを書類情報及び読取り結果として表示させている。
【0142】
ここで、ユーザによる読取り結果の確認修正作業の工数を削減するためには、読取り結果の切り替えを高速化することが望ましい。
【0143】
図20は、第3の実施形態における比較例(以下、「比較構成4」とする)の確認画面300の表示例である。
図20に示す確認画面300には、情報表示部310と、結果表示部320と、次へボタン330と、が表示されている。
図20に示す情報表示部310及び結果表示部320には、
図2に示す書類P1の「項目1」に対応する「ABC」のテキストが書類情報及び読取り結果として表示されている。
【0144】
比較構成4では、
図20に示す確認画面300の表示中にマウスを操作してマウスポインタを次へボタン330上に移動させた後、次へボタン330上でマウスが左クリックされた場合に確認画面300に表示される書類情報及び読取り結果が切り替わる。
【0145】
比較構成4のように、表示部260に表示されたボタン操作により表示される書類情報及び読取り結果が切り替わる構成では、マウス操作が必要となる。そして、一般的に、マウス操作はキーボード操作よりも時間を要することが知られている。
【0146】
近年では、OCR処理の精度が向上し、読取り結果が、当該読取り結果に対応する読取り対象となる書類に予め記入又は入力されたテキストと一致する、すなわち、読取り結果が正しい可能性が高くなった。そのため、読取り結果が正しい場合は、最小限の操作で次の書類情報及び読取り結果に切り替わることが望ましい。
【0147】
そこで、第3の実施形態では、CPU21が、切り替え操作としてのキーボードのエンターキー又はタブキーの操作を1回受付けた場合に、確認画面30に表示される書類情報及び読取り結果を切り替える第3機能を実行する。これにより、読取り結果が正しい場合は、1回のキーボード操作だけで「読取り結果が正しいことの確認」及び「次の読取り結果への切り替え」の2つの作業が完了する。そのため、第3の実施形態によれば、確認画面30に表示される書類情報及び読取り結果を切り替える際にユーザによる複数の操作を必要とする構成に比べて、ユーザによる読取り結果の確認修正作業の工数が削減される。
【0148】
また、一般的に、OCR処理において読取り範囲内に含まれる画像データが少ないほど、一例として、読取り範囲内に含まれるテキストが短いほど、読取り結果が正しい可能性が高い。これに対し、OCR処理において読取り範囲内に含まれる画像データが多いほど、一例として、読取り範囲内に含まれるテキストが長いほど、読取り結果が正しい可能性が低い。そのため、読取り範囲内に含まれるテキストが長い場合は、当該テキスト内の一部の誤認識のために、1回のキーボード操作だけで「読取り結果が正しいことの確認」及び「次の読取り結果への切り替え」の2つの作業を完了できないことがある。
【0149】
そこで、第3の実施形態では、CPU21が、読取り対象となった書類の項目毎の書類情報及び読取り結果の一部が確認画面30に表示されている場合に切り替え操作を1回受付けたとき、第3機能として、書類情報及び読取り結果を切り替えて、当該書類の項目毎の書類情報及び読取り結果の他の一部を表示させる。
【0150】
図21は、読取り対象となる書類P8を示している。
図21に示すように、書類P8には、一の項目に対応する「ABCDE」、「FGHIJK」、「LMNO」、「PQRST」、及び「UVWX」のテキストが一行毎に改行されて同じ枠内に予め記入又は入力されている。
【0151】
図22は、情報処理装置20の表示部26に表示される第9の表示例である。
図22(A)に示す表示部26には、確認画面30の第16の表示例が表示されている。
図22(A)に示す確認画面30には、情報表示部31と、結果表示部32と、が表示されている。そして、
図22(A)に示す情報表示部31及び結果表示部32には、
図21に示す書類P8の一行目に予め記入又は入力された「ABCDE」のテキストが書類情報及び読取り結果として表示されている。CPU21は、
図22(A)に示す確認画面30の表示中に切り替え操作が1回行われたと判定した場合、確認画面30に表示される書類情報及び読取り結果を切り替える。
【0152】
図22(B)に示す表示部26には、確認画面30の第17の表示例が表示されている。
図22(B)は、
図22(A)に示す確認画面30の表示中に切り替え操作が1回行われた後の状態を示している。
図22(B)に示す確認画面30では、CPU21が、情報表示部31及び結果表示部32に、書類P8の二行目に予め記入又は入力された「FGHIJK」のテキストを書類情報及び読取り結果として表示させている。
【0153】
以上のように、第3の実施形態では、同じ枠内に予め記入又は入力されたテキストを複数個に分割し、分割したテキストが書類情報及び読取り結果として情報表示部31及び結果表示部32に表示されている。これにより、第3の実施形態では、読取り範囲内に含まれるテキストが長い場合でも、1回のキーボード操作だけで「読取り結果が正しいことの確認」及び「次の読取り結果への切り替え」の2つの作業が完了する。そのため、第3の実施形態によれば、確認画面30に表示される書類情報及び読取り結果の切り替えが常に読取り範囲内に含まれるテキスト毎に行われる構成に比べて、ユーザによる読取り結果の確認修正作業の工数が削減される。
【0154】
第3の実施形態では、行毎にテキストを分割したが、テキストの分割方法はこれに限られない。一例として、テキストは、Nテキスト毎(例:3テキスト毎)に分割してもよいし、形態素毎、単語毎、文節毎、又は文毎に分割してもよい。このとき、テキストにおける形態素、単語、文節、及び文の解析は、公知の技術を用いて行われる。
【0155】
第3の実施形態では、切り替え操作を入力部25としてのキーボードのエンターキー又はタブキーの操作としたが、切り替え操作はこれに限られない。一例として、当該切り替え操作は、マウス操作でもよいし、上記のエンターキー及びタブキーとは異なるキーボード操作でもよい。
【0156】
(第4の実施形態)
次に、情報処理装置20の第4の実施形態について、他の実施形態との重複部分を省略又は簡略しつつ説明する。
【0157】
第4の実施形態における情報処理装置20では、OCR処理における読取り結果に対してユーザが行う確認修正作業を支援する機能として、以下で説明する第4機能を実行する。
【0158】
図23は、情報処理装置20により第4機能が実行される第4実行処理の流れを示すフローチャートである。CPU21がROM22又は記憶部24から情報処理プログラムを読み出して、RAM23に展開して実行することにより第4実行処理が行われる。
【0159】
図23に示すステップS40において、CPU21は、OCR処理を開始し、一のジョブに含まれる複数の書類の各読取り範囲内に含まれる画像データの読取りを行う。そして、ステップS41に進む。
【0160】
ステップS41において、CPU21は、書類の項目毎の書類情報と、当該書類情報の画像データの読取り結果とを表示部26の確認画面30に表示させる。そして、ステップS42に進む。
【0161】
ステップS42において、CPU21は、結果表示部32を用いた読取り結果の修正を行うための入力部25を通じた入力操作が行われたか否かを判定し、入力操作が行われたと判定した場合(ステップS42:YES)はステップS43に進む。一方、CPU21により入力操作が行われていないと判定された場合(ステップS42:NO)は入力操作が行われるまで待機する。第4の実施形態では、一例として、入力操作を入力部25としてのキーボードの文字キー又は数字キーの操作としている。
【0162】
ステップS43において、CPU21は、表示部26における読取り結果の表示態様を非表示状態に切り替え、結果表示部32に表示された読取り結果を確認画面30から削除する。そして、ステップS44に進む。
【0163】
ステップS44において、CPU21は、ステップS42で行われた入力操作に応じた入力内容を結果表示部32に表示させる。そして、当該処理を終了する。
【0164】
次に、第4の実施形態における表示部26の表示例について説明する。
図24は、情報処理装置20の表示部26に表示される第10の表示例である。
【0165】
図24(A)に示す表示部26には、確認画面30の第18の表示例が表示されている。
図24(A)に示す確認画面30には、情報表示部31と、結果表示部32と、が表示されている。そして、
図24(A)に示す情報表示部31には、
図2に示す書類P1の「項目1」に対応する「ABC」のテキストが書類情報として表示されている。
図24(A)に示す結果表示部32には、「XYZ」のテキストが読取り結果として修正可能に表示されている。
【0166】
上記のように、
図24(A)に示す確認画面30では、書類情報として表示されたテキストと、読取り結果として表示されたテキストとが一テキストも一致していない。そして、CPU21は、
図24(A)に示す確認画面30の表示中に入力操作が行われたと判定した場合、表示部26における読取り結果の表示態様を非表示状態に切り替え、結果表示部32に表示された読取り結果を確認画面30から削除する。つまり、第4の実施形態における非表示状態は、結果表示部32に表示された読取り結果を確認画面30から削除することで、ユーザが読取り結果を視認できない状態である。
【0167】
図24(B)に示す表示部26には、確認画面30の第19の表示例が表示されている。
図24(B)は、
図24(A)に示す確認画面30の表示中に入力操作が行われた後の状態を示している。
図24(B)に示す確認画面30では、CPU21が、
図24(A)に示す確認画面30で表示していた読取り結果を削除して結果表示部32の枠内を空白で表示させている。
【0168】
図24(C)に示す表示部26には、確認画面30の第20の表示例が表示されている。
図24(C)は、
図24(B)に示す結果表示部32に入力操作に応じた入力内容が入力された後の状態を示している。
【0169】
図24(C)に示す結果表示部32は、
図24(B)に示す結果表示部32で空白となっていた枠内に、入力操作に応じた入力内容である「ABC」が追加されている。そして、書類情報として表示されたテキストと、読取り結果として表示されたテキストとが一致したことで、
図24(C)に示す確認画面30では、ユーザによる読取り結果の確認修正作業が完了している。
【0170】
ここで、ユーザによる読取り結果の確認修正作業の工数を削減するためには、表示中の読取り結果を削除する際のユーザの操作数を少なくすることが望ましい。
【0171】
一例として、表示中の読取り結果をキーボードのデリートキー又はバックスペースキーの操作で削除する構成では、当該読取り結果を削除した後に文字キー及び数字キー等を操作して修正内容を入力する必要がある。そのため、読取り結果が、当該読取り結果に対応する読取り対象となる書類に予め記入又は入力されたテキストと一致しない、すなわち、読取り結果が間違っている場合は、読取り結果が正しい場合に比べて、上記の削除操作の分だけ確認修正作業の工数が増加してしまう。
【0172】
そこで、第4の実施形態では、CPU21が、確認画面30において入力操作を受付けた場合に読取り結果が表示されない非表示状態とし、受付けた入力操作に応じた入力内容を、読取り結果を表示するための表示領域である結果表示部32に表示させる第4機能を実行する。これにより、読取り結果が間違っている場合は、1回のキーボード操作だけで「読取り結果の全削除」及び「入力操作に応じた入力内容の入力」の2つの作業が完了する。そのため、第4の実施形態によれば、表示中の読取り結果を非表示状態にするための指示と、入力操作に応じた入力内容を表示するための指示とが別々である構成に比べて、ユーザによる読取り結果の確認修正作業の工数が削減される。
【0173】
また、読取り結果が間違っている場合に当該読取り結果を一律に全て削除すると、かえって確認修正作業の工数が増加することもある。一例として、読取り結果の間違っている部分が一テキストである場合は、当該読取り結果を用いて修正した方が効率的になり得る。
【0174】
そこで、第4の実施形態では、CPU21が、入力操作とは異なる特別操作を受付けた場合、第4機能として、確認画面30において読取り結果が表示される表示状態とし、表示中の読取り結果を用いたユーザによる修正を受付ける。第4の実施形態では、特別操作を、一例として、結果表示部32に表示された読取り結果を入力部25としてのマウスで左クリックして指定する操作としている。
【0175】
図25は、情報処理装置20の表示部26に表示される第11の表示例である。
図25(A)に示す表示部26には、確認画面30の第21の表示例が表示されている。
図25(A)に示す確認画面30には、情報表示部31と、結果表示部32と、が表示されている。そして、
図25(A)に示す情報表示部31には、
図2に示す書類P1の「項目1」に対応する「ABC」のテキストが書類情報として表示されている。
図25(A)に示す結果表示部32には、「AC」のテキストが読取り結果として修正可能に表示されている。
【0176】
上記のように、
図25(A)に示す確認画面30では、書類情報として表示されたテキストと、読取り結果として表示されたテキストとが一致していないが、双方の相違は読取り結果に「B」のテキストが不足している点のみである。
【0177】
ここで、CPU21は、
図25(A)に示す確認画面30の表示中に特別操作を受付けた場合、第4機能として、確認画面30において読取り結果が表示される表示状態を維持し、表示中の読取り結果を用いたユーザによる修正を受付ける。
【0178】
図25(B)に示す表示部26には、確認画面30の第22の表示例が表示されている。
図25(B)は、
図25(A)に示す確認画面30の表示中に特別操作が行われた後の状態を示している。
図25(B)に示す確認画面30では、マウスを左クリックして指定された「A」と「C」との間にキャレット35が表示されており、当該部分にテキストが追加可能であることを示している。そして、CPU21は、
図25(B)に示す確認画面30の表示中に入力操作を受付けた場合、キャレット35が表示されている部分に入力操作に応じた入力内容を表示させる。
【0179】
図25(C)に示す表示部26には、確認画面30の第23の表示例が表示されている。
図25(C)は、
図25(B)に示す確認画面30の表示中に入力操作が行われた後の状態を示している。
【0180】
図25(C)に示す結果表示部32は、
図25(B)に示す結果表示部32で「AC」と表示されていた「A」と「C」との間に「B」のテキストが追加されている。そして、書類情報として表示されたテキストと、読取り結果として表示されたテキストとが一致したことで、
図25(C)に示す確認画面30では、ユーザによる読取り結果の確認修正作業が完了している。
【0181】
上記の構成により、第4の実施形態によれば、ユーザの操作により例外なく表示中の読取り結果が非表示状態となる構成に比べて、ユーザによる読取り結果の確認修正作業の工数が削減される。
【0182】
また、第4の実施形態では、上記の構成により、読取り結果を一括で全削除して入力を受付ける機能と、表示中の読取り結果を用いた修正を受付ける機能とを組み合わせて提供することができる。
【0183】
第4の実施形態では、特別操作を、結果表示部32に表示された読取り結果を入力部25としてのマウスで左クリックして指定する操作としたが、特別操作はこれに限られない。一例として、特別操作は、結果表示部32の枠内又は枠上の任意の位置をマウスで左クリックして指定する操作でもよいし、矢印キー等のテキストの入力に用いられないキーボード操作でもよい。
【0184】
(その他)
上記各実施形態では、情報処理装置20の表示部26に確認画面30を表示していたが、確認画面30が表示される端末は情報処理装置20に限られない。一例として、情報処理装置20は、上記の第1実行処理、第2実行処理、第3実行処理、及び第4実行処理の少なくとも1つの処理を実行するが、実行した処理の結果に対応する確認画面30は、情報処理装置20とは異なるサーバコンピュータ、若しくはパーソナルコンピュータ等の汎用的なコンピュータ装置、又はスマートフォン、若しくはタブレット端末等の携帯端末の表示画面に表示させてもよい。
【0185】
上記各実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えば CPU: Central Processing Unit、等)や、専用のプロセッサ(例えば GPU: Graphics Processing Unit、ASIC: Application Specific Integrated Circuit、FPGA: Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
【0186】
また上記各実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
【符号の説明】
【0187】
20 情報処理装置
21 CPU(プロセッサの一例)