(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023045981
(43)【公開日】2023-04-03
(54)【発明の名称】情報処理装置及びプログラム
(51)【国際特許分類】
G06V 30/12 20220101AFI20230327BHJP
【FI】
G06K9/03 C
G06K9/03 J
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2021154632
(22)【出願日】2021-09-22
(71)【出願人】
【識別番号】000116079
【氏名又は名称】ローレルバンクマシン株式会社
(71)【出願人】
【識別番号】500267170
【氏名又は名称】ローレル機械株式会社
(71)【出願人】
【識別番号】500265501
【氏名又は名称】ローレル精機株式会社
(74)【代理人】
【識別番号】110003177
【氏名又は名称】弁理士法人旺知国際特許事務所
(72)【発明者】
【氏名】小澤 茂樹
【テーマコード(参考)】
5B064
【Fターム(参考)】
5B064AA01
5B064AB03
5B064BA01
5B064DA10
5B064DA27
5B064DA32
5B064EA08
5B064EA11
5B064EA12
5B064EA16
5B064EA27
5B064EA31
5B064EA39
5B064FA03
5B064FA04
5B064FA05
5B064FA09
5B064FA13
(57)【要約】
【課題】文字認識処理における文字の認識の精度を高める。
【解決手段】文字認識装置10は、画像に含まれる文字を認識し、認識した文字の確度を算出する複数の文字認識処理の各々により、申込書画像GMに含まれる一の文字を認識する記載内容認識部124と、複数の文字認識処理の各々による一の文字の認識結果として得られる複数の候補文字の1つを、一の文字の認識結果に対応する確定文字に決定する認識結果決定部126と、を備え、申込書画像GMは、1つ以上の項目を含む書類の画像であり、文字の認識に使用する文字認識処理の優先度が項目毎に決められており、認識結果決定部126は、複数の候補文字の各々の確度と、複数の文字認識処理の各々の優先度とに基づいて、複数の候補文字の1つを、確定文字に決定する。
【選択図】
図4
【特許請求の範囲】
【請求項1】
画像に含まれる文字を認識し、認識した文字の確度を算出する複数の文字認識処理の各々により、1つ以上の項目を含む書類の画像である文字画像に含まれる一の文字を認識する認識部と、
前記複数の文字認識処理の各々による前記一の文字の認識結果として得られる複数の候補文字の1つを、前記一の文字の認識結果に対応する確定文字に決定する決定部と、
を備え、
文字の認識に使用する文字認識処理の優先度が項目毎に決められており、
前記決定部は、
前記複数の候補文字の各々の確度と、前記複数の文字認識処理の各々の前記優先度とに基づいて、前記複数の候補文字の1つを、前記確定文字に決定する、
ことを特徴とする情報処理装置。
【請求項2】
前記複数の文字認識処理の各々には、前記優先度に基づく重み値が決められており、
前記決定部は、
前記複数の候補文字の各々の確度を前記複数の文字認識処理の各々の前記重み値で重み付けすることにより、前記複数の候補文字の各々の評価値を算出し、
前記複数の候補文字のうち、前記評価値が最も高い候補文字を、前記確定文字に決定する、
請求項1に記載の情報処理装置。
【請求項3】
前記決定部は、
前記複数の文字認識処理のうち前記優先度が最も高い文字認識処理による前記一の文字の認識結果として得られる第1候補文字の確度が所定値以上の場合、前記複数の候補文字のうち、前記第1候補文字を前記確定文字に決定する、
請求項1に記載の情報処理装置。
【請求項4】
前記決定部により決定された前記確定文字を表示部に表示させる表示制御部をさらに備え、
前記表示制御部は、
前記複数の文字認識処理のうち前記優先度が最も高い文字認識処理で前記確定文字が認識されていない場合の前記確定文字の表示態様を、前記複数の文字認識処理のうちの前記優先度が最も高い文字認識処理で前記確定文字が認識された場合の前記確定文字の表示態様とは異ならせる、
請求項1から3のいずれか1項に記載の情報処理装置。
【請求項5】
画像に含まれる文字を認識し、認識した文字の確度を算出する第1文字認識処理、及び、画像に含まれる文字を認識し、認識した文字の確度を算出する第2文字認識処理の各々により、文字画像に含まれる一の文字を認識する認識部と、
前記第1文字認識処理による前記一の文字の認識結果として得られる1つ以上の第1候補文字と、前記第2文字認識処理による前記一の文字の認識結果として得られる1つ以上の第2候補文字との両方に含まれる共通文字が存在する場合、前記共通文字を前記一の文字の認識結果に対応する確定文字とするか否かを決定する決定部と、
を備えている、
ことを特徴とする情報処理装置。
【請求項6】
前記決定部は、
前記共通文字が、第1条件及び第2条件の両方の条件を満たす場合、前記共通文字を前記確定文字の候補である確定候補文字に決定し、
前記第1条件は、
前記1つ以上の第1候補文字に含まれる前記共通文字の確度である第1確度、及び、前記1つ以上の第2候補文字に含まれる前記共通文字の確度である第2確度のうちの高い方の確度に関する条件であり、
前記第2条件は、
前記第1確度と前記第2確度との差異の程度に関する条件である、
請求項5に記載の情報処理装置。
【請求項7】
前記第1条件は、
前記高い方の確度が所定の確度以上であるという条件であり、
前記第2条件は、
前記第1確度と前記第2確度との差分が所定値以下であるという条件である、
請求項6に記載の情報処理装置。
【請求項8】
前記決定部は、
前記確定候補文字が複数存在する場合、
前記複数の確定候補文字の中で確度が最も高い確定候補文字を、前記確定文字に決定する、
請求項7に記載の情報処理装置。
【請求項9】
前記決定部は、
前記確定候補文字が複数存在する場合、
前記複数の確定候補文字の中で、前記第1確度と前記第2確度との平均値が最も高い確定候補文字を、前記確定文字に決定する、
請求項7に記載の情報処理装置。
【請求項10】
前記決定部は、
前記共通文字が複数存在する場合、
前記複数の共通文字の中で、前記1つ以上の第1候補文字に含まれる前記共通文字の確度である第1確度と、前記1つ以上の第2候補文字に含まれる前記共通文字の確度である第2確度との平均値が最も高い共通文字を、前記確定文字に決定する、
請求項5に記載の情報処理装置。
【請求項11】
画像に含まれる文字列を構成する複数の文字を認識する第1文字認識処理、及び、前記画像に含まれる前記複数の文字のうち一の文字を認識する第2文字認識処理を実行する認識部と、
前記第1文字認識処理による前記一の文字の認識結果として得られる第1候補文字と、前記第2文字認識処理による前記一の文字の認識結果として得られる第2候補文字とが、互いに同じ文字である場合、前記同じ文字を、前記一の文字の認識結果に対応する確定文字に決定する決定部と、
を備えている、
ことを特徴とする情報処理装置。
【請求項12】
プロセッサを、
画像に含まれる文字を認識し、認識した文字の確度を算出する複数の文字認識処理の各々により、1つ以上の項目を含む書類の画像である文字画像に含まれる一の文字を認識する認識部と、
前記複数の文字認識処理の各々による前記一の文字の認識結果として得られる複数の候補文字の1つを、前記一の文字の認識結果に対応する確定文字に決定する決定部と、
として機能させ、
文字の認識に使用する文字認識処理の優先度が項目毎に決められており、
前記決定部は、
前記複数の候補文字の各々の確度と、前記複数の文字認識処理の各々の前記優先度とに基づいて、前記複数の候補文字の1つを、前記確定文字に決定する、
プログラム。
【請求項13】
プロセッサを、
画像に含まれる文字を認識し、認識した文字の確度を算出する第1文字認識処理、及び、画像に含まれる文字を認識し、認識した文字の確度を算出する第2文字認識処理の各々により、文字画像に含まれる一の文字を認識する認識部と、
前記第1文字認識処理による前記一の文字の認識結果として得られる1つ以上の第1候補文字と、前記第2文字認識処理による前記一の文字の認識結果として得られる1つ以上の第2候補文字との両方に含まれる共通文字が存在する場合、前記共通文字を前記一の文字の認識結果に対応する確定文字とするか否かを決定する決定部と、
として機能させる、
プログラム。
【請求項14】
プロセッサを、
画像に含まれる文字列を構成する複数の文字を認識する第1文字認識処理、及び、前記画像に含まれる前記複数の文字のうち一の文字を認識する第2文字認識処理を実行する認識部と、
前記第1文字認識処理による前記一の文字の認識結果として得られる第1候補文字と、前記第2文字認識処理による前記一の文字の認識結果として得られる第2候補文字とが、互いに同じ文字である場合、前記同じ文字を、前記一の文字の認識結果に対応する確定文字に決定する決定部と、
として機能させる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及びプログラムに関する。
【背景技術】
【0002】
文字認識装置等の情報処理装置では、一般的に、光学文字認識(OCR:Optical character recognition)技術が採用されている(例えば、特許文献1参照)。OCR技術は、帳票等の媒体に記載された文字をカメラ及びイメージスキャナ等の光学的な手段により画像として取込み、取り込んだ画像内の文字をコンピュータ等が利用可能な文字情報(例えば、文字コード)に変換する技術である。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、この種のOCR技術の文字認識精度は100%にはならない。このため、文字認識処理における文字の認識の精度を高めることが可能な情報処理装置が求められている。
【課題を解決するための手段】
【0005】
本発明の好適な態様に係る情報処理装置は、画像に含まれる文字を認識し、認識した文字の確度を算出する複数の文字認識処理の各々により、1つ以上の項目を含む書類の画像である文字画像に含まれる一の文字を認識する認識部と、前記複数の文字認識処理の各々による前記一の文字の認識結果として得られる複数の候補文字の1つを、前記一の文字の認識結果に対応する確定文字に決定する決定部と、を備え、文字の認識に使用する文字認識処理の優先度が項目毎に決められており、前記決定部は、前記複数の候補文字の各々の確度と、前記複数の文字認識処理の各々の前記優先度とに基づいて、前記複数の候補文字の1つを、前記確定文字に決定する。
【0006】
また、本発明の好適な他の態様に係る情報処理装置は、画像に含まれる文字を認識し、認識した文字の確度を算出する第1文字認識処理、及び、画像に含まれる文字を認識し、認識した文字の確度を算出する第2文字認識処理の各々により、文字画像に含まれる一の文字を認識する認識部と、前記第1文字認識処理による前記一の文字の認識結果として得られる1つ以上の第1候補文字と、前記第2文字認識処理による前記一の文字の認識結果として得られる1つ以上の第2候補文字との両方に含まれる共通文字が存在する場合、前記共通文字を前記一の文字の認識結果に対応する確定文字とするか否かを決定する決定部と、を備えている。
【0007】
また、本発明の好適な他の態様に係る情報処理装置は、画像に含まれる文字列を構成する複数の文字を認識する第1文字認識処理、及び、前記画像に含まれる前記複数の文字のうち一の文字を認識する第2文字認識処理を実行する認識部と、前記第1文字認識処理による前記一の文字の認識結果として得られる第1候補文字と、前記第2文字認識処理による前記一の文字の認識結果として得られる第2候補文字とが、互いに同じ文字である場合、前記同じ文字を、前記一の文字の認識結果に対応する確定文字に決定する決定部と、を備えている。
【0008】
本発明の好適な態様に係るプログラムは、プロセッサを、画像に含まれる文字を認識し、認識した文字の確度を算出する複数の文字認識処理の各々により、1つ以上の項目を含む書類の画像である文字画像に含まれる一の文字を認識する認識部と、前記複数の文字認識処理の各々による前記一の文字の認識結果として得られる複数の候補文字の1つを、前記一の文字の認識結果に対応する確定文字に決定する決定部と、として機能させ、文字の認識に使用する文字認識処理の優先度が項目毎に決められており、前記決定部は、前記複数の候補文字の各々の確度と、前記複数の文字認識処理の各々の前記優先度とに基づいて、前記複数の候補文字の1つを、前記確定文字に決定する。
【0009】
また、本発明の好適な他の態様に係るプログラムは、プロセッサを、画像に含まれる文字を認識し、認識した文字の確度を算出する第1文字認識処理、及び、画像に含まれる文字を認識し、認識した文字の確度を算出する第2文字認識処理の各々により、文字画像に含まれる一の文字を認識する認識部と、前記第1文字認識処理による前記一の文字の認識結果として得られる1つ以上の第1候補文字と、前記第2文字認識処理による前記一の文字の認識結果として得られる1つ以上の第2候補文字との両方に含まれる共通文字が存在する場合、前記共通文字を前記一の文字の認識結果に対応する確定文字とするか否かを決定する決定部と、として機能させる。
【0010】
また、本発明の好適な他の態様に係るプログラムは、プロセッサを、画像に含まれる文字列を構成する複数の文字を認識する第1文字認識処理、及び、前記画像に含まれる前記複数の文字のうち一の文字を認識する第2文字認識処理を実行する認識部と、前記第1文字認識処理による前記一の文字の認識結果として得られる第1候補文字と、前記第2文字認識処理による前記一の文字の認識結果として得られる第2候補文字とが、互いに同じ文字である場合、前記同じ文字を、前記一の文字の認識結果に対応する確定文字に決定する決定部と、として機能させる。
【発明の効果】
【0011】
本発明によれば、文字認識処理における文字の認識の精度を高めることが可能となる。
【図面の簡単な説明】
【0012】
【
図1】第1実施形態に係る文字認識システムの概要を説明するための説明図である。
【
図3】
図1に示した文字認識装置のハードウェア構成の一例を示す図である。
【
図4】
図1に示した文字認識装置の構成の一例を示す機能ブロック図である。
【
図5】
図3に示した優先テーブルの一例を示す説明図である。
【
図6】確定文字決定処理の一例を説明するための説明図である。
【
図7】内容確認画面の概要の一例を示す説明図である。
【
図8】
図1に示した文字認識装置の動作の一例を示すフローチャートである。
【
図9】
図8に示した確定文字決定処理の一例を示すフローチャートである。
【
図10】
図8に示した確定文字決定処理の別の例を示すフローチャートである。
【
図11】第2実施形態に係る文字認識装置の概要を説明するための説明図である。
【
図12】
図11に示した認識結果決定部の動作の一例を説明するための説明図である。
【
図13】
図11に示した認識結果決定部の動作の一例を示すフローチャートである。
【
図14】第3実施形態に係る文字認識装置の概要を説明するための説明図である。
【
図15】
図14に示した認識結果決定部の動作の一例を説明するための説明図である。
【
図16】第1変形例に係る重みテーブルの一例を説明するための説明図である。
【
図17】第1変形例に係る確定文字決定処理の一例を説明するための説明図である。
【
図18】第2変形例に係る文字認識システムの一例を示す図である。
【発明を実施するための形態】
【0013】
以下、本発明を実施するための形態について図面を参照して説明する。なお、各図において、各部の寸法及び縮尺は、実際のものと適宜に異ならせてある。また、以下に述べる実施の形態は、本発明の好適な具体例であるから、技術的に好ましい種々の限定が付されているが、本発明の範囲は、以下の説明において特に本発明を限定する旨の記載がない限り、これらの形態に限られるものではない。
【0014】
[1.第1実施形態]
先ず、
図1を参照しながら、第1実施形態に係る文字認識システム1の概要の一例について説明する。
【0015】
図1は、第1実施形態に係る文字認識システム1の概要を説明するための説明図である。
【0016】
図1に示す文字認識システム1は、文字認識装置10、端末装置20及び画像入力装置30を有する。文字認識装置10は、「情報処理装置」の一例である。文字認識装置10及び端末装置20は、例えば、ネットワークNWを介して、互いに通信可能に接続されている。ネットワークNWは、インターネット及びローカルエリアネットワークを含み得る。例えば、ネットワークNWは、有線ネットワーク及び無線ネットワークの一方又は両方を含む。また、ネットワークNWと文字認識装置10との接続等は、例えば、複数の要素間を互いに通信可能にする接続であればよく、有線及び無線の一方を用いた接続であってもよいし、有線及び無線の両方を用いた接続であってもよい。
【0017】
文字認識装置10としては、ネットワークNWに接続可能な任意の情報処理装置を採用することができる。文字認識装置10は、例えば、光学文字認識(OCR:Optical character recognition)技術を用いて、画像に含まれる文字を認識する文字認識処理を実行する。文字認識処理の対象となる画像の一例は、後述する
図2において説明される。また、文字認識装置10の構成は、後述する
図3及び
図4において説明される。本実施形態では、所定のサービスに入会するための入会申込書に記載されている文字を文字認識装置10が認識する場合を想定する。例えば、本実施形態では、文字認識装置10は、光学文字認識技術を用いて、入会申込書に記載された情報を電子データに変換する。
【0018】
端末装置20としては、ネットワークNWに接続可能な任意の情報処理装置を採用することができる。具体的には、端末装置20は、例えば、パーソナルコンピュータ等の据置型の情報機器であってもよいし、ノート型のパーソナルコンピュータ、タブレット端末及びスマートフォン等の可搬型の情報端末であってもよい。
図1に示す端末装置20は、端末装置20のオペレータの操作を受け付ける操作装置27と、画像等を表示する表示装置28とを有する。例えば、端末装置20は、文字認識処理の結果等を表示装置28に表示させる。文字認識処理の結果は、例えば、文字認識装置10からネットワークNWを介して端末装置20に送信される。なお、表示装置28は、「表示部」の一例である。
【0019】
また、端末装置20は、画像入力装置30と通信可能に接続される。端末装置20と画像入力装置30との接続は、有線及び無線の一方を用いた接続であってもよいし、有線及び無線の両方を用いた接続であってもよい。端末装置20は、例えば、文字認識処理の対象となる画像を示す画像情報を画像入力装置30から取得し、画像入力装置30から取得した画像情報を、ネットワークNWを介して文字認識装置10に送信する。
【0020】
なお、端末装置20は、表示装置28を含まなくてもよい。端末装置20は、表示装置28を含まない場合、表示装置28と通信可能に接続される。この場合、端末装置20と表示装置28との接続は、有線及び無線の一方を用いた接続であってもよいし、有線及び無線の両方を用いた接続であってもよい。
【0021】
画像入力装置30は、例えば、カメラ及びイメージスキャナ等の光学的な装置である。例えば、画像入力装置30は、入会申込書等の書類を撮像することにより、書類の画像を示す画像情報を生成する。画像入力装置30により生成された画像情報は、端末装置20に送信される。なお、画像入力装置30は、端末装置20に含まれてもよい。
【0022】
【0023】
申込書画像GMは、例えば、複数の項目を含む入会申込書の画像である。複数の項目を含む入会申込書は、「1つ以上の項目を含む書類」の一例である。すなわち、申込書画像GMは、「文字画像」の一例である。
【0024】
例えば、申込書画像GMは、文字認識処理の対象となる画像である。従って、申込書画像GMは、複数の項目に対応する複数の記載欄を含む。
図2に示す例では、申込書に記載される複数の項目は、申込番号、カナ氏名、氏名、郵便番号、住所、電子メール(E-mail)、及び、電話番号である。
【0025】
複数の記載欄の各々は、当該記載欄に記載すべき申込内容の項目の名称である項目名称が記載された項目名称記載領域AMと、当該記載欄に係る申込内容が記載された申込内容記載領域AKと、を含む。以下では、申込書画像GMのうち、複数の申込内容記載領域AKの各々に記載された申込内容に係る文字列を示す画像は、文字列画像GCLとも称される。また、
図2では、複数の文字列画像GCLを互いに区別するために、複数の文字列画像GCLの各々の符号の末尾には、数字(1、2、3、4、5、6又は7)が付されている。
【0026】
例えば、文字列画像GCL1は、「申込番号」に係る申込内容記載領域AKに記載された申込内容に係る文字列を示す。また、文字列画像GCL2は、「カナ氏名」に係る申込内容記載領域AKに記載された申込内容に係る文字列を示し、文字列画像GCL3は、「氏名」に係る申込内容記載領域AKに記載された申込内容に係る文字列を示す。また、文字列画像GCL4は、「郵便番号」に係る申込内容記載領域AKに記載された申込内容に係る文字列を示し、文字列画像GCL5は、「住所」に係る申込内容記載領域AKに記載された申込内容に係る文字列を示す。また、文字列画像GCL6は、「電子メール」に係る申込内容記載領域AKに記載された申込内容に係る文字列を示し、文字列画像GCL7は、「電話番号」に係る申込内容記載領域AKに記載された申込内容に係る文字列を示す。
【0027】
また、以下では、複数の文字列画像GCLの各々により示される文字列に含まれる複数の文字の各々を示す画像は、個別文字画像GCとも称される。すなわち、複数の文字列画像GCLの各々は、複数の個別文字画像GCを含む画像である。例えば、文字列画像GCL5は、「海」の個別文字画像GC1及び「大」の個別文字画像GC2等を含む。
【0028】
なお、以下では、文字認識装置10が、
図2に例示するフォーマットを有する申込書画像GMを、文字認識処理の対象とする場合を想定するが、本発明はこのような態様に限定されるものではない。本実施形態において、文字認識装置10は、任意のフォーマットを有する書類又はフォーマットが決められていない文章(例えば、白紙のメモ等)を、文字認識処理の対象とすることができる。また、以下では、申込内容記載領域AKに記載された申込内容が、手書きされた文字である手書文字により記載される場合を想定するが、本発明はこのような態様に限定されるものではない。例えば、本実施形態において、1つ以上の文字列画像GCLにより示される複数の文字のうち、一部又は全部が、活字により記載されていてもよい。
【0029】
次に、
図3を参照しながら、文字認識装置10のハードウェア構成について説明する。
【0030】
図3は、
図1に示した文字認識装置10のハードウェア構成の一例を示す図である。
【0031】
文字認識装置10は、文字認識装置10の各部を制御する処理装置12と、各種情報を記憶する記憶装置14と、通信装置16とを有する。
【0032】
記憶装置14は、例えば、処理装置12の作業領域として機能するRAM(Random Access Memory)等の揮発性メモリと、制御プログラムPG1等の各種情報を記憶するEEPROM(Electrically Erasable Programmable Read-Only Memory)等の不揮発性メモリとの、一方又は両方を含む。なお、記憶装置14は、文字認識装置10に着脱可能であってもよい。具体的には、記憶装置14は、文字認識装置10に着脱されるメモリカード等の記憶媒体であってもよい。また、記憶装置14は、例えば、文字認識装置10とネットワークNW等を介して通信可能に接続された記憶装置(例えば、オンラインストレージ)であってもよい。
【0033】
図3に示す記憶装置14は、制御プログラムPG1、優先テーブルPTBL及び複数の学習モデルLMを記憶している。
図3では、複数の学習モデルLMを互いに区別するために、複数の学習モデルLMの各々の符号の末尾には、数字(例えば、1)又は小文字のアルファベット(例えば、m)が付されている。例えば、mは、2以上の自然数を示す。
【0034】
制御プログラムPG1は、「プログラム」の一例である。本実施形態では、制御プログラムPG1は、例えば、文字認識装置10が文字認識処理を実行するためのアプリケーションプログラムを含む。但し、制御プログラムPG1は、例えば、処理装置12が文字認識装置10の各部を制御するためのオペレーティングシステムプログラムを含んでもよい。
【0035】
優先テーブルPTBLには、例えば、後述する
図4に示す複数の文字認識部CRに対応付けられた複数の優先度を示す情報が記憶されている。優先度は、文字の認識に使用する文字認識部CRの優先度であり、項目毎に決められている。なお、優先テーブルPTBLの詳細は、後述する
図5において説明される。
【0036】
複数の学習モデルLMの各々は、例えば、多層ニューラルネットワークであり、1又は複数の種類の文字について、当該種類の文字を含む画像と、当該画像に含まれる文字との関係を学習した学習モデルである。なお、本実施形態では、説明の便宜上、画像の示す文字の種類が、漢字、ひらがな、カタカナ、アラビア数字(以下、単に「数字」とも称する)、アルファベット、及び、記号の、6種類である場合を想定する。ここで、記号とは、例えば、ドット、カンマ、句点、読点、ハイフン、及び、演算記号を含む概念である。
【0037】
処理装置12は、文字認識装置10の全体を制御するプロセッサであり、例えば、1又は複数のCPU(Central Processing Unit)を含んで構成される。処理装置12は、例えば、記憶装置14に記憶された制御プログラムPG1を実行し、制御プログラムPG1に従って動作することで、後述する
図4に示す制御部120として機能する。なお、制御プログラムPG1は、ネットワークNWを介して他の装置から送信されてもよい。
【0038】
また、例えば、処理装置12が複数のCPUを含んで構成される場合、処理装置12の機能の一部又は全部は、これら複数のCPUが制御プログラムPG1等のプログラムに従って協働して動作することで実現されてもよい。また、処理装置12は、1又は複数のCPUに加え、又は、1又は複数のCPUのうち一部又は全部に代えて、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、又は、FPGA(Field Programmable Gate Array)等のハードウェアを含んで構成されるものであってもよい。この場合、処理装置12の機能の一部又は全部は、DSP等のハードウェアにより実現されてもよい。
【0039】
通信装置16は、有線ネットワーク及び無線ネットワークの一方又は両方を介して、文字認識装置10の外部に存在する外部装置との通信を行うためのハードウェアである。
【0040】
次に、
図4を参照しながら、文字認識装置10の機能について説明する。
【0041】
図4は、
図1に示した文字認識装置10の構成の一例を示す機能ブロック図である。
【0042】
制御部120は、
図3において説明されたように、処理装置12により実現される。なお、処理装置12が複数のCPUを含んで構成される場合、制御部120の一部又は全部の機能は、これら複数のCPUが制御プログラムPG1に従って協働して動作することで実現されてもよい。また、処理装置12がDSP等のハードウェアを含んで構成される場合、制御部120の一部又は全部は、DSP等のハードウェアにより実現されてもよい。
【0043】
制御部120は、例えば、画像情報取得部122、記載内容認識部124、認識結果決定部126及び表示情報生成部128を有する。記載内容認識部124は、「認識部」の一例であり、認識結果決定部126は、「決定部」の一例である。また、表示情報生成部128は、「表示制御部」の一例である。
【0044】
画像情報取得部122は、例えば、文字認識処理の対象となる申込書画像GMを示す画像情報(画像入力装置30により生成された画像情報)を、通信装置16を介して端末装置20から取得する。
【0045】
記載内容認識部124は、複数の文字認識部CRを有する。本実施形態では、複数の文字認識部CRが複数の学習モデルLMと1対1に対応している場合を想定する。
図4では、複数の文字認識部CRを互いに区別するために、複数の文字認識部CRの各々の符号の末尾には、数字(例えば、1)又は小文字のアルファベット(例えば、m)が付されている。例えば、mは、2以上の自然数を示す。
【0046】
複数の文字認識部CRの各々は、例えば、画像に含まれる文字を認識し、かつ、認識した文字の確からしさを示す確度を算出する処理を、文字認識処理として実行する。記載内容認識部124は、例えば、画像情報取得部122が取得した画像情報により示される申込書画像GMに対する文字認識処理を、複数の文字認識部CRのうちの2つ以上の文字認識部CRに実行させる。例えば、記載内容認識部124は、優先テーブルPTBLに記憶された優先度等の情報に基づいて、複数の文字認識部CRの中から2つ以上の文字認識部CRを選択する。そして、記載内容認識部124は、複数の文字認識部CRの中から選択した2つ以上の文字認識部CRの各々に申込書画像GMに対する文字認識処理を実行させることにより、申込書画像GMに含まれる文字を認識する。以下では、文字認識部CRが認識した文字の確からしさを示す確度は、単に、文字の確度とも称される。
【0047】
複数の文字認識部CR(CR1~CRm)の各々は、複数の学習モデルLM(LM1~LMm)のうちの対応する学習モデルLMを用いて、個別文字画像GCにより示される文字を認識する。すなわち、本実施形態では、複数の文字認識部CRの各々は、記憶装置14に記憶された複数の学習モデルLMのうちの対応する学習モデルLMを用いることで、AI(Artificial Intelligence)-OCRによる文字認識処理を実行する。
【0048】
なお、本実施形態では、複数の文字認識部CRが、互いに異なるアルゴリズムを用いて、文字認識処理を実行する場合を想定する。例えば、文字認識部CR1が文字認識処理において用いるアルゴリズムと、文字認識部CRmが文字認識処理において用いるアルゴリズムとは異なる。ここで、「アルゴリズムが異なる」とは、例えば、文字認識処理に用いられる学習モデルLMの種類が異なることであってもよいし、文字認識処理に用いられる学習モデルLMを学習させる場合に用いるデータセットが異なることであってもよい。あるいは、「アルゴリズムが異なる」とは、例えば、文字認識処理に用いられる学習モデルLMの種類が異なること、及び、文字認識処理に用いられる学習モデルLMを学習させる場合に用いるデータセットが異なることの両方の概念を含むものであってもよい。なお、学習モデルLMの種類は、例えば、ニューラルネットワークの種類である。
【0049】
また、「データセットが異なる」とは、例えば、2つのデータセットの一方に用いられた画像に含まれる文字に、2つのデータセットの他方に用いられた画像に含まれる文字とは異なる種類の文字が含まれることである。なお、2つのデータセットが互いに異なる場合、2つのデータセットの一方に用いられた画像には、2つのデータセットの他方に用いられた画像に含まれる文字と異なる種類の文字及び同じ種類の文字の両方が含まれてもよい。
【0050】
また、2つの学習モデルLMにそれぞれ用いられる2つのデータセットが互いに異なる場合、2つの学習モデルLMをそれぞれ構成する2つのニューラルネットワークは、互いに異なる種類であってもよいし、同一の種類であってもよい。すなわち、2つの学習モデルLMにそれぞれ用いられる2つのデータセットが互いに異なることは、2つのニューラルネットワークの種類が互いに異なるか否かに拘わらず、「アルゴリズムが異なる」ことに該当する。また、例えば、2つの学習モデルLMをそれぞれ構成する2つのニューラルネットワークの種類が互いに異なることは、2つの学習モデルLMにそれぞれ用いられる2つのデータセットが互いに異なるか否かに拘わらず、「アルゴリズムが異なる」ことに該当する。
【0051】
なお、本実施形態では、複数の文字認識部CRが複数の学習モデルLMと1対1に対応している場合を想定するが、本発明はこのような態様に限定されるものではない。例えば、複数の文字認識部CRのうちの、一部又は全部は、ニューラルネットワークを用いずに文字認識処理を行う構成要素であってもよい。なお、複数の文字認識部CRの全部がニューラルネットワークを用いずに文字認識処理を行う構成要素である場合、記憶装置14は、学習モデルLMを記憶しなくてもよい。
【0052】
また、複数の文字認識部CRには、画像に含まれる文字列を構成する複数の文字を認識する文字認識部CRが含まれてもよい。この種の文字認識部CRは、例えば、複数の文字列が登録された所定の辞書を用いて、画像に含まれる文字列を構成する複数の文字を認識してもよい。あるいは、文字認識部CRは、文字列の認識を学習した学習モデルLMを用いることにより、画像に含まれる文字列を構成する複数の文字を認識してもよい。文字列の認識を学習した学習モデルLMは、例えば、1つ以上の文字と1つ以上の文字の後に続く一の文字との関係、及び、一の文字と一の文字の後に続く1つ以上の文字との関係の一方又は両方を学習した学習モデルLMであってもよい。
【0053】
認識結果決定部126は、記載内容認識部124による一の文字に対する文字認識処理の結果を示す認識情報を取得する。例えば、認識情報は、複数の文字認識部CRのうちの2つ以上の文字認識部CRの各々により実行された文字認識処理による一の文字の認識結果を示す。2つ以上の文字認識部CRの各々により実行された文字認識処理による一の文字の認識結果は、例えば、一の文字の認識結果の候補となる複数の候補文字、及び、複数の候補文字の確度を含む。
【0054】
例えば、認識結果決定部126は、一の文字に対する文字認識処理を実行した2つ以上の文字認識部CRの各々の認識結果として得られる複数の候補文字のうちのいずれか1つを、一の文字の認識結果に対応する確定文字に決定する。具体的には、認識結果決定部126は、複数の候補文字の各々の確度と、複数の文字認識部CRの各々の優先度とに基づいて、複数の候補文字のうちのいずれか1つを、確定文字に決定する。
【0055】
例えば、複数の文字認識部CRの各々に、優先度に基づく重み値が決められている場合、認識結果決定部126は、複数の候補文字の各々の確度を複数の文字認識部CRの各々の重み値で重み付けすることにより、複数の候補文字の各々の評価値を算出する。重み値は、例えば、0以上の実数である。認識結果決定部126は、複数の候補文字のうち、評価値が最も高い候補文字を、一の文字の認識結果に対応する確定文字に決定する。なお、評価値が互いに同じ複数の候補文字が存在する場合、認識結果決定部126は、当該複数の候補文字のうち、確度が最も高い候補文字を確定文字に決定してもよいし、優先度(又は重み値)が最も高い候補文字を確定文字に決定してもよい。あるいは、認識結果決定部126は、過去に確定文字として決定した候補文字の修正の有無を文字認識部CR毎に蓄積し、評価値が互いに同じ複数の候補文字のうち、正解率が最も高い候補文字を確定文字に決定してもよい。
【0056】
表示情報生成部128は、認識結果決定部126により決定された確定文字を表示装置28に表示させる。例えば、表示情報生成部128は、認識結果決定部126により決定された確定文字を確認するための画像(例えば、後述する
図7に示す内容確認画面CCH)を表示装置28に表示させるための表示情報を生成する。そして、表示情報生成部128は、生成した表示情報を、通信装置16を介して端末装置20に出力する。
【0057】
なお、文字認識装置10の構成は、
図3及び
図4に示した例に限定されない。例えば、文字認識装置10は、文字認識装置10の管理者等による操作を受け付ける操作装置を有してもよい。
【0058】
次に、
図5を参照しながら、優先テーブルPTBLについて説明する。
【0059】
図5は、
図3に示した優先テーブルPTBLの一例を示す説明図である。優先テーブルPTBLは、例えば、記載内容認識部124が複数の文字認識部CRから2つ以上の文字認識部CRを選択する場合に記載内容認識部124により参照され、認識結果決定部126が評価値を算出する場合に認識結果決定部126により参照される。
【0060】
優先テーブルPTBLは、例えば、申込書画像GM(文字認識処理の対象となる画像)が有する複数の記載欄と1対1に対応する複数のレコードを有する。優先テーブルPTBLの各レコードは、項目ID、項目名称及び優先度を有する。
【0061】
項目IDは、申込書画像GMが有する複数の記載欄の中から、各記載欄を識別するための情報である。項目名称は、申込書画像GMが有する各記載欄の項目名称記載領域AMに記載された名称である。
【0062】
優先度は、例えば、項目IDにより示される記載欄に記載された文字の認識に使用する文字認識部CRの優先度である。なお、
図5に示すハイフン(“-”)は、優先度が文字認識部CRに対応付けられていないことを意味する。例えば、各記載欄(各項目)において、優先度が対応付けられていない文字認識部CRは、当該記載欄に記載された文字の認識に使用されない。また、本実施形態では、優先度の数字が小さい場合、優先度の数字が大きい場合に比べて、優先度が高い。各項目において、優先度が高い文字認識部CRは、優先度が低い文字認識部CRに比べて、当該項目の記載欄に記載された文字の認識に適している。
【0063】
例えば、優先度は、項目毎に、複数の文字認識部CRの各々の学習度に応じて決定される。「学習度」は、例えば、学習に用いられるデータセットに含まれるサンプル(画像)の数、学習の回数、及び、正解率のうちの一部又は全部を含む概念であってもよい。
図5に示す優先テーブルPTBLでは、記載内容認識部124が6つの文字認識部CR1、CR2、CR3、CR4、CR5及びCR6を有する場合を想定している。
【0064】
例えば、文字認識部CR1及びCR2は、アルファベット、数字及び記号の認識に特化した英数字用の文字認識部CRである。なお、文字認識部CR1及びCR2の一方又は両方は、アルファベット、数字及び記号の認識精度が他の文字種(例えば、漢字等)に比べて高い文字認識部CRであってもよい。また、例えば、文字認識部CR3及びCR4は、漢字及びひらがなの認識に特化した漢字用の文字認識部CRである。なお、文字認識部CR3及びCR4の一方又は両方は、漢字及びひらがなの認識精度が他の文字種(例えば、数字等)に比べて高い文字認識部CRであってもよい。また、例えば、文字認識部CR5及びCR6は、カタカナの認識に特化したカナ用の文字認識部CRである。なお、文字認識部CR5及びCR6の一方又は両方は、カタカナの認識精度が他の文字種(例えば、数字等)に比べて高い文字認識部CRであってもよい。
【0065】
また、例えば、複数の項目のうちの一の項目において、2つの文字認識部CRのうち、一の項目に関する文字列についての学習度が高い文字認識部CRの優先度は、他の文字認識部CRの優先度より高くなるように、設定される。
図5に示す例では、漢字用の文字認識部CR3及びCR4のうち、文字認識部CR4が、文字認識部CR3より、「住所」に関する文字列についての学習度が高い場合を想定する。このため、「住所」に係る項目では、文字認識部CR4の優先度は、文字認識部CR3の優先度より高い。従って、「住所」に係る項目では、例えば、文字認識部CR4の優先度は、「1」に設定され、文字認識部CR3の優先度は、「2」に設定される。
【0066】
図5に示されるように、本実施形態では、文字の認識に使用する文字認識部CRの優先度が項目毎に決められている。例えば、記載内容認識部124は、複数の項目のうちの一の項目の申込内容記載領域AKに記載された文字列を認識する場合、優先テーブルPTBLが有する複数のレコードのうち、一の項目に対応するレコードを参照する。そして、記載内容認識部124は、複数の文字認識部CRのうち、一の項目に対応するレコードにおいて優先度が対応付けられている文字認識部CRを、一の項目の申込内容記載領域AKに記載された文字列を認識する文字認識部CRとして選択する。
【0067】
具体的には、記載内容認識部124は、例えば、「郵便番号」に係る申込内容記載領域AKに記載された文字列を認識する場合、項目IDが「k004」のレコードを参照し、英数字用の文字認識部CR1及びCR2を選択する。また、例えば、記載内容認識部124は、「住所」に係る申込内容記載領域AKに記載された文字列を認識する場合、項目IDが「k005」のレコードを参照する。そして、記載内容認識部124は、漢字用の文字認識部CR3及びCR4と、英数字用の文字認識部CR2と、カナ用の文字認識部CR5とを選択する。
【0068】
また、認識結果決定部126は、一の項目の申込内容記載領域AKに記載された文字列に含まれる一の文字について、認識結果に対応する確定文字を決定する場合、優先テーブルPTBLが有する複数のレコードのうち、一の項目に対応するレコードを参照する。そして、認識結果決定部126は、一の文字を認識した2つ以上の文字認識部CRの認識結果として得られる複数の候補文字のうちのいずれか1つを、複数の候補文字の各々の確度と一の項目に対応するレコードに記憶された複数の優先度の各々とに基づいて、確定文字に決定する。確定文字を決定する処理の詳細は、後述する
図6において説明される。以下では、確定文字を決定する処理は、確定文字決定処理とも称される。
【0069】
なお、優先テーブルPTBLは、
図5に示した例に限定されない。例えば、複数の項目のうちの一部の項目では、優先度が対応付けられた文字認識部CRが1つのみであってもよい。また、例えば、優先テーブルPTBLには、優先度に加え、又は、優先度に代えて、重み値が記憶されてもよい。優先度に基づく重み値は、項目毎に決められてもよい。例えば、優先度が「1」の文字認識部CRの重み値は、「住所」の項目と「郵便番号」の項目とで互いに異なる値でもよいし、互いに同じ値でもよい。また、優先度に代えて重み値が優先テーブルPTBLに記憶される場合、重み値は、「優先度」に該当する。本実施形態では、重み値が大きい場合、重み値が小さい場合に比べて、優先度が高い。
【0070】
また、優先度は、学習度以外の指標を用いて決定されてもよい。学習度以外の指標は、例えば、過去に確定文字として決定された候補文字に対するオペレータによる修正の有無の実績(例えば、正解率又は修正率)であってもよい。例えば、優先度は、項目毎に、複数の文字認識部CRの各々の正解率又は修正率に応じて決定されてもよい。この場合、例えば、一の項目において、正解率が高い文字認識部CR(又は、修正率が低い文字認識部CR)の優先度は、正解率が低い文字認識部CR(又は、修正率が高い文字認識部CR)の優先度より高く設定される。なお、各項目における各文字認識部CRの修正率は、例えば、当該項目において、過去に確定文字として決定された候補文字の延べ数に対する、過去に確定文字として決定された候補文字に対するオペレータによる修正の延べ回数の比率で表される。また、各項目における各文字認識部CRの正解率は、例えば、当該項目における各文字認識部CRの修正率を1から減算した値で表される。なお、複数の文字認識部CRの各々の正解率又は修正率は、文字種毎に算出されてもよい。
【0071】
次に、
図6を参照しながら、確定文字決定処理の概要について説明する。
【0072】
図6は、確定文字決定処理の一例を説明するための説明図である。
図6では、「住所」に係る申込内容記載領域AKに記載された文字列を示す文字列画像GCL5に対して文字認識処理が実行された場合を例にして、「大」の個別文字画像GC2の認識結果に対応する確定文字の決定方法の一例が説明される。
【0073】
なお、
図6では、記載内容認識部124及び認識結果決定部126が
図5に示した優先テーブルPTBLを参照する場合を想定する。従って、「住所」の項目では、
図5に示されるように、文字認識部CR4は、複数の文字認識部CR2~CR5のうち優先度が最も高い文字認識部CRである。
図6では、複数の文字認識部CRの各々には、優先度に基づく重み値が決められている場合を想定する。例えば、優先度が「1」の文字認識部CR4の重み値は、1.20に設定され、優先度が「2」の文字認識部CR3の重み値は、1.05に設定され、優先度が「3」の文字認識部CR2及びCR4の各々の重み値は、1.00に設定されている。また、評価値は、例えば、候補文字の確度と重み値との積で表される。
【0074】
図6に示す例では、認識結果決定部126は、文字認識部CR2~CR5の各々による「大」の個別文字画像GC2に対する文字認識処理の結果として、複数の候補文字と複数の候補文字の各々の確度とを示す認識情報を取得する。
【0075】
例えば、文字認識部CR3から得られる候補文字は、確度が90%の「丈」の文字であり、文字認識部CR4から得られる候補文字は、確度が85%の「大」の文字である。なお、文字認識部CR4から得られる候補文字(「大」)の確度(85%)は、文字認識部CR3から得られる候補文字(「丈」)の確度(90%)より低い。また、例えば、文字認識部CR2から得られる候補文字は、確度が30%の「K」の文字であり、文字認識部CR5から得られる候補文字は、確度が60%の「ス」の文字である。文字認識部CR2及びCR5の各々から得られる候補文字の確度は、文字認識部CR3から得られる候補文字の確度より低い。
【0076】
認識結果決定部126は、複数の候補文字の各々の確度を複数の文字認識部CRの各々の重み値で重み付けすることにより、評価値を算出する。具体的には、認識結果決定部126は、文字認識部CR3から得られる候補文字の確度(90%)を文字認識部CR3の重み値(1.05)で重み付けすることにより、文字認識部CR3から得られる候補文字の評価値を算出する。同様に、認識結果決定部126は、文字認識部CR4から得られる候補文字の確度(85%)を文字認識部CR4の重み値(1.20)で重み付けすることにより、文字認識部CR4から得られる候補文字の評価値を算出する。
【0077】
そして、認識結果決定部126は、複数の候補文字のうち、評価値が最も高い候補文字を、「大」の個別文字画像GC2の認識結果に対応する確定文字に決定する。例えば、文字認識部CR3から得られる候補文字(「丈」)の評価値は、95(=90×1.05)であり、文字認識部CR4から得られる候補文字(「大」)の評価値は、102(=85×1.20)である。また、文字認識部CR2から得られる候補文字(「K」)の評価値は、30(=30×1.00)であり、文字認識部CR5から得られる候補文字(「ス」)の評価値は、60(=60×1.00)である。従って、
図6に示す例では、複数の候補文字(「丈」、「大」、「K」及び「ス」)のうち、評価値が最も高い候補文字は、
図6の星印で示されるように、評価値が102の「大」の文字である。このため、認識結果決定部126は、複数の候補文字のうち、評価値が最も高い「大」の文字を、「大」の個別文字画像GC2の認識結果に対応する確定文字に決定する。
【0078】
このように、
図6に示す例では、複数の文字認識部CR2~CR5のうち優先度が最も高い文字認識部CR4から得られる候補文字(「大」)が、「大」の個別文字画像GC2の認識結果に対応する確定文字に決定される。複数の文字認識部CR2~CR5のうち優先度が最も高い文字認識部CR4は、他の文字認識部CR2、CR3及びCR5に比べて、「住所」に関する文字列の認識に適している。例えば、文字認識部CR4は、複数の文字認識部CR2~CR5のうち、「住所」に関する文字列についての学習度が最も高い文字認識部CRである。このため、例えば、文字認識部CR4から得られる候補文字(「大」)が誤っている確率は、他の文字認識部CR(例えば、文字認識部CR3)から得られる候補文字が誤っている確率に比べて、低いと考えられる。
【0079】
ここで、
図6に示す例では、複数の候補文字のうち、確度が最も高い候補文字は、
図6の二重丸で示されるように、確度が90%の「丈」の文字である。例えば、評価値を用いずに確定文字が決定される形態(以下、第1対比例とも称する)では、複数の候補文字のうち、確度が最も高い「丈」の文字が、「大」の個別文字画像GC2の認識結果に対応する確定文字に決定される。すなわち、第1対比例では、例えば、「住所」に関する文字列についての学習度が文字認識部CR4より低い文字認識部CR3から得られる候補文字(「丈」)が、「大」の個別文字画像GC2の認識結果に対応する確定文字に決定される。このため、第1対比例では、本実施形態に比べて、誤った文字が確定文字に決定される確率が高くなる。換言すれば、本実施形態では、第1対比例に比べて、誤った文字が確定文字に決定されることを抑制することができる。すなわち、本実施形態では、文字認識処理における文字の認識の精度を高めることができる。
【0080】
なお、確定文字決定処理は、
図6に示した例に限定されない。例えば、評価値は、候補文字の確度と重み値との和であってもよい。この場合、各文字認識部CRの重み値は、
図6において想定した重み値と異なる値に設定されてもよい。
【0081】
また、例えば、複数の文字認識部CR2~CR5のうち優先度が最も高い文字認識部CR4による一の文字の認識結果として得られる候補文字を確定文字とするか否かは、後述する
図10等に示されるように、重み値を用いずに決定されてもよい。以下では、一の文字に対する文字認識処理を実行した複数の文字認識部CRのうち、優先度が最も高い文字認識部CRは、第1優先度の文字認識部CRとも称される。また、以下では、第1優先度の文字認識部CRによる一の文字の認識結果として得られる候補文字は、第1優先度の候補文字とも称される。第1優先度の候補文字は、「第1候補文字」の一例である。
【0082】
以下では、第1優先度の候補文字を確定文字とするか否かが重み値を用いずに決定される方法の概要を、
図6に示した認識結果を例にして説明する。例えば、認識結果決定部126は、第1優先度の候補文字の確度が所定値以上か否かによって、第1優先度の文字認識部CR4を他の文字認識部CRより優先するか否かを決定してもよい。
【0083】
例えば、所定値が80%の場合、第1優先度の文字認識部CR4による一の文字の認識結果として得られる第1優先度の候補文字の確度(85%)は、所定値以上である。この場合、認識結果決定部126は、第1優先度の候補文字(「大」)を確定文字に決定してもよい。すなわち、認識結果決定部126は、複数の文字認識部CRのうち優先度が最も高い文字認識部CRによる一の文字の認識結果として得られる第1優先度の候補文字の確度が所定値以上の場合、複数の候補文字のうち、第1優先度の候補文字を確定文字に決定してもよい。
【0084】
第1優先度の文字認識部CR4は、例えば、複数の文字認識部CR2~CR5のうち、「住所」に関する文字列についての学習度が最も高い文字認識部CRである。このため、第1優先度の候補文字の確度が所定値以上である場合、第1優先度の候補文字が誤っている確率は、他の文字認識部CRによる一の文字の認識結果として得られる候補文字が誤っている確率に比べて、低いと考えられる。従って、認識結果決定部126は、第1優先度の候補文字の確度が所定値以上の場合に第1優先度の候補文字を確定文字に決定することにより、誤った文字が確定文字に決定されることを抑制できる。
【0085】
また、認識結果決定部126は、第1優先度の文字認識部CRによる一の文字の認識結果として得られる第1優先度の候補文字の確度が所定値未満の場合、複数の候補文字のうち、確度が最も高い候補文字を、確定文字に決定してもよい。この場合、確度が所定値未満の候補文字が確定文字に決定されることが、抑制される。
【0086】
ここで、例えば、第1優先度の候補文字が確定文字として無条件に選択される形態(以下、第2対比例とも称する)では、第1優先度の候補文字の確度が所定値未満の場合でも、第1優先度の候補文字が確定文字に決定される。すなわち、第2対比例では、第1優先度の候補文字の確度が所定値未満の場合、確度が所定値以上の候補文字が存在しているか否かに拘わらず、第1優先度の候補文字が確定文字に決定される。一の文字の認識結果の確度が所定値未満の場合、一の文字の認識結果の確度が所定値以上の場合に比べて、一の文字が誤って認識されている確率が高い。従って、第2対比例では、第1優先度の候補文字の確度が所定値未満の場合に複数の候補文字のうちの確度が最も高い候補文字が確定文字に決定される形態に比べて、誤った文字が確定文字に決定される確率が高くなる。
【0087】
すなわち、第1優先度の候補文字の確度が所定値以上か否かによって、第1優先度の文字認識部CRを他の文字認識部CRより優先するか否かが決定される形態においても、誤った文字が確定文字に決定されることを抑制することができる。従って、本実施形態では、第1優先度の候補文字を確定文字とするか否かが重み値を用いずに決定される場合でも、文字認識処理における文字の認識の精度を高めることができる。
【0088】
なお、認識結果決定部126は、第1優先度の文字認識部CRによる一の文字の認識結果として得られる第1優先度の候補文字の確度が所定値未満の場合、確定文字の決定を保留してもよい。この場合、例えば、後述する
図7に示す内容確認画面CCHには、確定文字が表示されなくてもよいし、確定文字の決定が保留されたことを示す情報(例えば、「?」マーク等)が表示されてもよい。認識結果決定部126による確定文字の決定が保留された場合、例えば、ユーザに確定文字を入力又は選択させることにより、確定文字が決定されてもよい。
【0089】
次に、
図7を参照しながら、認識結果決定部126により決定された確定文字を確認するための内容確認画面CCHの概要について説明する。
【0090】
図7は、内容確認画面CCHの概要の一例を示す説明図である。
【0091】
内容確認画面CCHは、例えば、表示装置28に表示される。例えば、内容確認画面CCHには、複数の項目名称、複数の項目名称に1対1に対応する複数の文字列画像GCL、複数の文字列画像GCLに1対1に対応する複数の認識文字列LMK、修正ボタンSSB、及び、確定ボタンKTBが表示される。なお、複数の項目名称は、申込書画像GMにおける複数の記載欄と1対1に対応する。
図7では、複数の認識文字列LMKを互いに区別するために、複数の認識文字列LMKの各々の符号の末尾には、複数の文字列画像GCLのうちの対応する文字列画像GCLの符号の末尾に付された数字(1、2、3、4、5、6又は7)と同じ数字が付されている。
【0092】
認識文字列LMKは、文字認識装置10において、申込書画像GMに含まれる文字列画像GCLに対して実行された文字認識処理の結果に基づいて得られた文字列である。従って、認識文字列LMKに含まれる複数の文字の各々は、文字認識装置10の認識結果決定部126により決定された確定文字である。
【0093】
また、内容確認画面CCHには、注意マークMKが表示される場合がある。ここで、注意マークMKは、個別文字画像GCにより示される文字と確定文字とが異なる文字である可能性があると文字認識装置10が判断した場合に、内容確認画面CCHに表示される画像である。
図7では、文字列画像GCL5に含まれる個別文字画像GC1の認識結果に対応する確定文字(「海」)が第1優先度の文字認識部CR4で認識されず、文字認識部CR3で認識された場合を想定する。このため、
図7では、個別文字画像GC1により示される文字(「海」)と、個別文字画像GC1の認識結果に対応する確定文字(「海」)とが、異なる文字である可能性があると文字認識装置10が判断した場合を想定する。この場合、例えば、個別文字画像GC1の認識結果に対応する確定文字の表示位置に対応する位置に、注意マークMKが表示される。
【0094】
なお、
図7では、文字認識部CR3により正しく認識された候補文字(「海」)を認識結果決定部126が確定文字に決定した場合を想定している。すなわち、個別文字画像GC1により示される文字(「海」)と、個別文字画像GC1の認識結果に対応する確定文字(「海」)とが、異なる文字である可能性があると文字認識装置10が判断したが、最終的には、正しい候補文字(「海」)が確定文字に決定されている。
【0095】
また、
図6に示した例では、文字列画像GCL5に含まれる個別文字画像GC2の認識結果に対応する確定文字(「大」)が第1優先度の文字認識部CR4で認識されている。この場合、文字列画像GCL5に含まれる個別文字画像GC2により示される文字(「大」)と、個別文字画像GC2の認識結果に対応する確定文字(「大」)とが異なる文字である可能性があることを示す注意マークMKは、内容確認画面CCHに表示されない。すなわち、第1優先度の文字認識部CRで確定文字が認識されていない場合の確定文字の表示態様は、第1優先度の文字認識部CRで確定文字が認識された場合の確定文字の表示態様とは異なる。
【0096】
端末装置20を操作するオペレータは、注意マークMKを視認することにより、個別文字画像GCにより示される文字と確定文字とが異なる文字である可能性があることを認識できる。この結果、本実施形態では、注意マークMKが表示されない態様に比べて、確定文字が誤っていることを見落とす可能性を低減することができる。
【0097】
また、修正ボタンSSBは、確定文字を修正可能な状態とするためのGUI(Graphical User Interface)である。例えば、端末装置20を操作するオペレータは、内容確認画面CCHにおいて、個別文字画像GCと、当該個別文字画像GCに対応する確定文字とを比較する。そして、端末装置20を操作するオペレータは、確定文字が、個別文字画像GCにより示される文字とは異なる文字であると判断した場合に、修正ボタンSSBを選択(例えば、押下)する。
【0098】
また、確定ボタンKTBは、内容確認画面CCHに表示された複数の認識文字列LMKを確定するためのGUIである。例えば、確定ボタンKTBが選択された場合、各認識文字列LMKに含まれる各確定文字が確定し、内容確認画面CCHの状態が、端末装置20を操作するオペレータが各確定文字を変更できない状態になる。これにより、文字認識システム1は、申込書画像GMに含まれる文字の認識結果を、内容確認画面CCHに表示される複数の確定文字であるとして確定する。
【0099】
なお、内容確認画面CCHの例は、
図7に示した例に限定されない。例えば、内容確認画面CCHに表示された注意マークMKにポインタを重ねた場合に、1つ以上の修正候補の文字を含むポップアップ画像が表示されてもよい。1つ以上の修正候補の文字は、例えば、複数の候補文字のうち、評価値が高い順に選択された所定数の候補文字であってもよい。あるいは、第1優先度の文字認識部CRによる一の文字の認識結果として2つ以上の候補文字が存在する場合、修正候補の文字は、第1優先度の文字認識部CRから得られる2つ以上の候補文字であってもよい。
【0100】
次に、
図8を参照しながら、文字認識装置10の動作の概要について説明する。
【0101】
図8は、
図1に示した文字認識装置10の動作の一例を示すフローチャートである。
図8に示す動作は、画像情報取得部122、記載内容認識部124、認識結果決定部126及び表示情報生成部128を含む制御部120として機能する処理装置12により、実行される。例えば、ステップS100では、処理装置12は画像情報取得部122として機能し、ステップS200、S220、S240、S260及びS400では、処理装置12は記載内容認識部124として機能する。また、ステップS300では、処理装置12は認識結果決定部126として機能し、ステップS500では、処理装置12は表示情報生成部128として機能する。
【0102】
先ず、ステップS100において、画像情報取得部122は、申込書画像GMを示す画像情報を端末装置20から取得する。
【0103】
次に、ステップS200において、記載内容認識部124は、ステップS100において取得された画像情報により示される申込書画像GMに含まれる複数の申込内容記載領域AKの各々を特定する。
【0104】
次に、ステップS220において、記載内容認識部124は、ステップS200において特定された複数の申込内容記載領域AKの中から1つの申込内容記載領域AKを選択する。例えば、記載内容認識部124は、複数の申込内容記載領域AKのうち、文字認識処理が実行されていない1つの申込内容記載領域AKを選択する。
【0105】
次に、ステップS240において、記載内容認識部124は、ステップS220において選択された申込内容記載領域AKに表された文字列画像GCLに対する文字認識処理を実行する2つ以上の文字認識部CRを選択する。例えば、記載内容認識部124は、優先テーブルPTBLの複数のレコードのうち、ステップS220において選択された申込内容記載領域AKに対応する項目のレコードを参照し、参照したレコードに記憶された優先度に基づいて文字認識部CRを選択する。なお、ステップS240以降の説明では、特に断りがない場合、「文字列画像GCL」は、ステップS220において選択された申込内容記載領域AKに表された文字列画像GCLを意味するものとする。
【0106】
次に、ステップS260において、記載内容認識部124は、文字列画像GCLに対する文字認識処理を、ステップS240において選択された2つ以上の文字認識部CRに実行させる。すなわち、ステップS240において選択された2つ以上の文字認識部CRの各々は、文字列画像GCLに対して、文字認識処理を実行する。
【0107】
次に、ステップS300において、認識結果決定部126は、文字列画像GCLに含まれる複数の個別文字画像GCの各々の認識結果に対応する確定文字を決定する確定文字決定処理を、ステップS260における文字認識処理の結果に基づいて実行する。例えば、認識結果決定部126は、
図6において説明されたように、複数の候補文字の各々の確度と、複数の文字認識部CRの各々の優先度とに基づいて複数の個別文字画像GCの各々の認識結果に対応する確定文字を決定する。
【0108】
次に、ステップS400において、記載内容認識部124は、ステップS200において特定された複数の申込内容記載領域AKの全てについて、ステップS260の文字認識処理が実行されたか否かを判定する。ステップS400における判定の結果が肯定の場合、処理装置12は、処理をステップS500に進める。一方、ステップS400における判定の結果が否定の場合、処理装置12は、処理をステップS220に戻す。
【0109】
ステップS500において、表示情報生成部128は、認識結果決定部126により決定された確定文字を表示装置28に表示させる表示情報を生成する。例えば、表示情報生成部128は、内容確認画面CCHを表示装置28に表示させる表示情報を生成し、生成した表示情報を端末装置20に出力する。ステップS500の処理が実行されることにより、
図8に示した動作は終了する。
【0110】
なお、文字認識装置10の動作は、
図8に示した例に限定されない。例えば、ステップS300の処理は、ステップS400の処理より後に実行されてもよいし、ステップS200、S240、S260及びS400の一連の処理と並列に実行されてもよい。また、例えば、ステップS400の処理は、記載内容認識部124とは別の機能ブロック(例えば、認識結果決定部126等)により実行されてもよい。
【0111】
また、例えば、複数回繰り返されるステップS240の一部において、記載内容認識部124は、文字列画像GCLに対する文字認識処理を実行する文字認識部CRを1つのみ選択してもよい。また、例えば、ステップS240において選択される文字認識部CRの数の上限が予め決められていてもよい。この場合、ステップS240において選択される文字認識部CRの数の上限は、例えば、2つでもよい。ステップS240において選択される文字認識部CRの数の上限が2つの場合、例えば、文字認識部CR3及びCR4の一方又は両方は複数種類(実施の形態では6種類)の文字を認識できることが好ましい。
【0112】
また、複数の項目の全てで、複数の文字認識部CRの全てが文字の認識に使用されてもよい。この場合、各項目において、複数の文字認識部CRの全てに対して優先度が決められている。また、複数の項目の全てで、複数の文字認識部CRの全てが文字の認識に使用される場合、例えば、ステップS240の処理は省かれる。
【0113】
次に、
図9を参照しながら、確定文字決定処理のフローについて説明する。
【0114】
図9は、
図8に示した確定文字決定処理の一例を示すフローチャートである。
図9に示す処理は、
図8に示したステップS300の確定文字決定処理の一例である。
図9に示す確定文字決定処理では、優先度に基づく重み値を用いて算出される評価値に基づいて、確定文字が決定される場合を想定する。ステップS320の処理は、例えば、
図8のステップS260の処理が実行された後に実行される。なお、
図9においても、特に断りがない場合、「文字列画像GCL」は、
図8のステップS220において選択された申込内容記載領域AKに表された文字列画像GCLを意味するものとする。
【0115】
先ず、ステップS320において、認識結果決定部126は、文字列画像GCLに含まれる複数の個別文字画像GCのうち、確定文字が決定されていない一の個別文字画像GCを特定する。
【0116】
次に、ステップS340において、認識結果決定部126は、ステップS320において特定された一の個別文字画像GCに対応する複数の候補文字の各々の評価値を算出する。なお、一の個別文字画像GCに対応する複数の候補文字は、例えば、
図8のステップS240において選択された2つ以上の文字認識部CRによる一の個別文字画像GCの認識結果として得られる複数の候補文字である。また、複数の候補文字の各々の評価値は、例えば、当該候補文字の確度と、当該候補文字を認識した文字認識部CRの重み値との積で表される。
【0117】
次に、ステップS360において、認識結果決定部126は、一の個別文字画像GCに対応する複数の候補文字のうち、ステップS340において算出された評価値が最も高い候補文字を、一の個別文字画像GCの認識結果に対応する確定文字に決定する。
【0118】
次に、ステップS380において、認識結果決定部126は、文字列画像GCLに含まれる複数の個別文字画像GCの全てについて、確定文字が決定されたか否かを判定する。ステップS380における判定の結果が否定の場合、処理装置12は、処理をステップS320に戻す。一方、ステップS380における判定の結果が肯定の場合、処理装置12は、確定文字決定処理を終了し、処理を
図8のステップS400に進める。
【0119】
次に、
図10を参照しながら、確定文字決定処理の別の例について説明する。
【0120】
図10は、
図8に示した確定文字決定処理の別の例を示すフローチャートである。
図10に示す処理は、
図8に示したステップS300の確定文字決定処理の別の例である。
図9において説明した動作と同様の要素については、同様の符号を付し、詳細な説明を省略する。
図10に示す確定文字決定処理では、優先度に基づく重み値が用いられない場合を想定する。例えば、
図10に示す確定文字決定処理では、第1優先度の文字認識部CRによる一の文字の認識結果として得られる第1優先度の候補文字の確度が所定値以上か否かによって、第1優先度の文字認識部CRを他の文字認識部CRより優先するか否かが決定される。ステップS320の処理は、例えば、
図8のステップS260の処理が実行された後に実行される。なお、
図10においても、特に断りがない場合、「文字列画像GCL」は、
図8のステップS220において選択された申込内容記載領域AKに表された文字列画像GCLを意味するものとする。
【0121】
先ず、ステップS320において、認識結果決定部126は、文字列画像GCLに含まれる複数の個別文字画像GCのうち、確定文字が決定されていない一の個別文字画像GCを特定する。
【0122】
次に、ステップS342において、認識結果決定部126は、第1優先度の文字認識部CRによる一の文字の認識結果として得られる第1優先度の候補文字の確度が所定値以上か否かを判定する。ステップS342における判定の結果が肯定の場合、処理装置12は、処理をステップS362に進める。一方、ステップS342における判定の結果が否定の場合、処理装置12は、処理をステップS364に進める。
【0123】
ステップS362において、認識結果決定部126は、第1優先度の候補文字を一の個別文字画像GCの認識結果に対応する確定文字に決定する。処理装置12は、ステップS362の処理を実行した後、処理をステップS380に進める。
【0124】
ステップS364において、認識結果決定部126は、一の個別文字画像GCに対応する複数の候補文字のうち、確度が最も高い候補文字を、一の個別文字画像GCの認識結果に対応する確定文字に決定する。処理装置12は、ステップS364の処理を実行した後、処理をステップS380に進める。
【0125】
ステップS380において、認識結果決定部126は、文字列画像GCLに含まれる複数の個別文字画像GCの全てについて、確定文字が決定されたか否かを判定する。ステップS380における判定の結果が否定の場合、処理装置12は、処理をステップS320に戻す。一方、ステップS380における判定の結果が肯定の場合、処理装置12は、確定文字決定処理を終了し、処理を
図8のステップS400に進める。
【0126】
以上、本実施形態では、文字認識装置10は、記載内容認識部124及び認識結果決定部126を有する。記載内容認識部124は、画像に含まれる文字を認識し、認識した文字の確度を算出する複数の文字認識処理の各々(複数の文字認識部CRの各々が実行する文字認識処理)により、1つ以上の項目を含む書類の画像である申込書画像GMに含まれる一の文字を認識する。文字の認識に使用する文字認識処理の優先度は、項目毎に決められている。認識結果決定部126は、複数の文字認識処理の各々による一の文字の認識結果として得られる複数の候補文字の1つを、一の文字の認識結果に対応する確定文字に決定する。具体的には、認識結果決定部126は、複数の候補文字の各々の確度と、複数の文字認識処理の各々の優先度とに基づいて、複数の候補文字の1つを、確定文字に決定する。
【0127】
このように、本実施形態では、一の文字に対応する確定文字が複数の文字認識処理の結果に基づいて決定される。このため、本実施形態では、一の文字に対応する確定文字が1つの文字認識処理の結果に基づいて決定される態様に比べて、文字の認識の精度を高めることができる。さらに、本実施形態では、複数の候補文字の各々の確度と複数の文字認識処理の各々の優先度とに基づいて確定文字が決定されるため、複数の候補文字の各々の確度のみに基づいて確定文字が決定される態様に比べて、文字の認識の精度を高めることができる。
【0128】
また、本実施形態では、複数の文字認識処理の各々には、優先度に基づく重み値が決められていてもよい。この場合、認識結果決定部126は、複数の候補文字の各々の確度を複数の文字認識処理の各々の重み値で重み付けすることにより、複数の候補文字の各々の評価値を算出する。そして、認識結果決定部126は、複数の候補文字のうち、評価値が最も高い候補文字を、確定文字に決定する。この場合、重み値を適切に設定することにより、誤った文字が確定文字に決定されることを抑制できる。例えば、本実施形態では、各項目において、複数の文字認識部CRの各々の学習度に応じて重み値を決定することにより、文字の認識の精度を高めることができる。
【0129】
また、本実施形態では、複数の文字認識処理の各々に、優先度に基づく重み値が決められていなくてもよい。この場合、認識結果決定部126は、複数の文字認識処理のうち優先度が最も高い文字認識処理による一の文字の認識結果として得られる第1優先度の候補文字の確度が所定値以上の場合、複数の候補文字のうち、第1優先度の候補文字を確定文字に決定してもよい。これにより、本実施形態では、誤った文字が確定文字に決定されることを抑制することができ、文字の認識の精度を高めることができる。
【0130】
また、認識結果決定部126は、複数の文字認識処理のうち優先度が最も高い文字認識処理による一の文字の認識結果として得られる第1優先度の候補文字の確度が所定値未満の場合、複数の候補文字のうち、確度が最も高い候補文字を、確定文字に決定してもよい。この場合においても、誤った文字が確定文字に決定されることを抑制することができ、文字の認識の精度を高めることができる。
【0131】
また、本実施形態では、認識結果決定部126により決定された確定文字を表示装置28に表示させる表示情報生成部128をさらに有する。表示情報生成部128は、複数の文字認識処理のうち優先度が最も高い文字認識処理で確定文字が認識されていない場合の確定文字の表示態様を、複数の文字認識処理のうちの優先度が最も高い文字認識処理で確定文字が認識された場合の確定文字の表示態様とは異ならせる。このため、オペレータは、例えば、一の確定文字の表示態様が他の確定文字の表示態様と異なる場合、一の確定文字が誤っている可能性があることを認識できる。この結果、本実施形態では、確定文字が誤っている可能性がある場合においても確定文字の表示態様が変化しない場合に比べて、確定文字が誤っていることを見落とす可能性を低減することができる。
【0132】
[2.第2実施形態]
次に、
図11を参照しながら、第2実施形態に係る文字認識装置10の概要の一例について説明する。
【0133】
図11は、第2実施形態に係る文字認識装置10の概要を説明するための説明図である。
図1から
図10において説明した要素と同様の要素については、同様の符号を付し、詳細な説明を省略する。
【0134】
図11に示す文字認識装置10は、
図3に示した文字認識装置10と同一の構成である。例えば、文字認識装置10は、処理装置12、記憶装置14及び通信装置16を有する。但し、記憶装置14に記憶される制御プログラムPG2は、
図3に示した制御プログラムPG1と相違する。なお、制御プログラムPG2は、「プログラム」の一例である。本実施形態では、制御プログラムPG2は、例えば、文字認識装置10が文字認識処理を実行するためのアプリケーションプログラムを含む。但し、制御プログラムPG2は、例えば、処理装置12が文字認識装置10の各部を制御するためのオペレーティングシステムプログラムを含んでもよい。
【0135】
また、本実施形態では、各項目の記載欄(より詳細には、申込内容記載領域AK)に記載された文字の認識に使用する文字認識部CRを示す情報として、優先度が優先テーブルPTBLに記憶されている場合を想定する。さらに、本実施形態では、各項目の記載欄に記載された文字の認識に使用する文字認識部CRの数が1つ以上2つ以下である場合を想定する。複数の項目のうちの少なくとも1つの項目では、2つの文字認識部CRが文字の認識に使用される。2つの文字認識部CRの優先度は、互いに同じでもよいし、異なってもよい。本実施形態では、文字の認識に使用される2つの文字認識部CRの優先度が互いに同じ場合を想定する。各項目において、文字の認識に使用される2つの文字認識部CRの一方により実行される文字認識処理は、「第1文字認識処理」の一例であり、2つの文字認識部CRの他方により実行される文字認識処理は、「第2文字認識処理」の一例である。
【0136】
図11に示す処理装置12は、
図3に示した制御プログラムPG1の代わりに制御プログラムPG2を実行することを除いて、
図3に示した処理装置12と同様である。例えば、処理装置12は、記憶装置14から読み出した制御プログラムPG2を実行することによって、制御部120Aとして機能する。
【0137】
制御部120Aは、認識結果決定部126の代わりに認識結果決定部126Aを有することを除いて、
図4に示した制御部120と同様である。例えば、制御部120Aは、画像情報取得部122、記載内容認識部124、認識結果決定部126A及び表示情報生成部128を有する。認識結果決定部126Aは、「決定部」の一例である。
【0138】
画像情報取得部122及び記載内容認識部124は、
図4に示した画像情報取得部122及び記載内容認識部124と同様である。但し、記載内容認識部124が有する複数の文字認識部CRの各々は、一の文字の認識結果として、1つ以上の候補文字及び1つ以上の候補文字の各々の確度を出力する。
【0139】
認識結果決定部126Aは、記載内容認識部124による一の文字に対する文字認識処理の結果を示す認識情報を取得する。例えば、認識情報は、複数の文字認識部CRのうちの2つの文字認識部CRの各々により実行された文字認識処理による一の文字の認識結果、又は、複数の文字認識部CRのうちの1つ文字認識部CRにより実行された文字認識処理による一の文字の認識結果を示す。2つの文字認識部CRのうちの一の文字認識部CR又は1つの文字認識部CRにより実行された文字認識処理による一の文字の認識結果は、例えば、一の文字の認識結果の候補となる1つ以上の候補文字、及び、1つ以上の候補文字の確度を含む。
【0140】
なお、2つの文字認識部CRの一方の文字認識処理による一の文字の認識結果として得られる1つ以上の候補文字は、「第1候補文字」の一例であり、2つの文字認識部CRの他方の文字認識処理による一の文字の認識結果として得られる1つ以上の候補文字は、「第2候補文字」の一例である。以下では、一の文字に対する文字認識処理を実行した2つの文字認識部CRの一方の認識結果として得られる候補文字は、第1候補文字とも称され、2つの文字認識部CRの他方の認識結果として得られる候補文字は、第2候補文字とも称される。
【0141】
例えば、認識結果決定部126Aは、1つ以上の第1候補文字と1つ以上の第2候補文字との両方に含まれる共通文字が存在する場合、共通文字を一の文字の認識結果に対応する確定文字とするか否かを決定する。共通文字を一の文字の認識結果に対応する確定文字とするか否かを決定する処理を含む確定文字決定処理については、後述する
図12において説明される。
【0142】
表示情報生成部128は、確定文字の表示形態を異ならせる条件を除いて、
図4に示した表示情報生成部128と同様である。例えば、表示情報生成部128は、共通文字が存在しない場合の確定文字の表示態様を、共通文字が存在する場合の確定文字の表示態様とは異ならせる。具体的には、例えば、表示情報生成部128は、一の文字の認識結果として得られた複数の候補文字の中に共通文字が存在しない場合、内容確認画面CCH内に注意マークMKを表示する表示情報を生成し、生成した表示情報を端末装置20に出力する。これにより、例えば、内容確認画面CCHのうち、一の文字の認識結果に対応する確定文字の表示位置に対応する位置に、注意マークMKが表示される。
【0143】
例えば、2つの文字認識部CRによる一の文字に対する文字認識の精度が低い場合、2つの文字認識部CRによる一の文字に対する文字認識の精度が高い場合に比べて、共通文字が存在しない確率が高いと考えられる。従って、2つの文字認識部CRによる一の文字の認識結果として得られた複数の候補文字の中に共通文字が存在しない場合、共通文字が存在する場合に比べて、誤った文字が確定文字に決定される確率が高いと考えられる。このため、端末装置20を操作するオペレータは、注意マークMKを視認することにより、個別文字画像GCにより示される文字と確定文字とが異なる文字である可能性があることを認識できる。この結果、本実施形態では、注意マークMKが表示されない態様に比べて、確定文字が誤っていることを見落とす可能性を低減することができる。
【0144】
なお、制御部120Aの動作は、確定文字決定処理を除いて、
図4に示した制御部120の動作と同様である。例えば、制御部120Aの動作は、
図8に示したステップS300の確定文字決定処理を除いて、
図8に示した動作と同様である。
【0145】
次に、
図12を参照しながら、認識結果決定部126Aによる確定文字決定処理の一例について説明する。
【0146】
図12は、
図11に示した認識結果決定部126Aの動作の一例を説明するための説明図である。
図12では、上述した
図6と同様に、「住所」に係る申込内容記載領域AKに記載された文字列を示す文字列画像GCL5に対して文字認識処理が実行された場合を例にして、「大」の個別文字画像GC2の認識結果に対応する確定文字の決定方法の一例が説明される。但し、
図12では、説明を分かり易くするために、確度等を
図6に示した例と異ならせている箇所がある。
【0147】
図12では、文字列画像GCL5の文字の認識に使用される文字認識部CRとして、文字認識部CR3及びCR4が選択された場合を想定する。この場合、文字認識部CR3及びCR4の一方により実行される文字認識処理が「第1文字認識処理」に該当し、文字認識部CR3及びCR4の他方により実行される文字認識処理が「第2文字認識処理」に該当する。以下では、文字認識部CR3の認識結果として得られる候補文字は、第1候補文字とも称され、文字認識部CR4の認識結果として得られる候補文字は、第2候補文字とも称される。
【0148】
図12に示す例では、認識結果決定部126Aは、文字認識部CR3による「大」の個別文字画像GC2に対する文字認識処理の結果として、「丈」、「太」、「大」、「火」及び「木」の文字を含む複数の第1候補文字と、複数の第1候補文字の各々の確度とを取得する。さらに、認識結果決定部126Aは、文字認識部CR4による「大」の個別文字画像GC2に対する文字認識処理の結果として、「犬」、「大」、「太」、「木」及び「丈」の文字を含む複数の第2候補文字と、複数の第2候補文字の各々の確度とを取得する。
【0149】
認識結果決定部126Aは、複数の第1候補文字と複数の第2候補文字とを含む複数の候補文字から、複数の第1候補文字と複数の第2候補文字との両方に存在する共通文字を検索する。
図12では、「丈」、「太」、「大」及び「木」の文字が、複数の第1候補文字と複数の第2候補文字との両方に存在する場合を想定する。従って、認識結果決定部126Aは、「丈」、「太」、「大」及び「木」の文字を共通文字として認識する。
【0150】
そして、認識結果決定部126Aは、第1条件及び第2条件の両方の条件を満たす1つ以上の共通文字が存在するか否かに基づいて、共通文字を一の文字の認識結果に対応する確定文字とするか否かを決定する。第1条件は、1つ以上の第1候補文字に含まれる共通文字の確度である第1確度、及び、1つ以上の第2候補文字に含まれる共通文字の確度である第2確度のうちの高い方の確度に関する条件である。また、第2条件は、第1確度と第2確度との差異の程度に関する条件である。具体的には、第1条件は、例えば、第1確度及び第2確度の高い方の確度が所定の確度以上であるという条件であり、第2条件は、第1確度と第2確度との差分の絶対値が所定値以下であるという条件である。
【0151】
図12では、第1条件が、第1確度及び第2確度の高い方の確度が80%以上であるという条件であり、第2条件が、第1確度と第2確度との差分の絶対値が20%以下であるという条件である場合を想定する。この場合、複数の共通文字(「丈」、「太」、「大」及び「木」)のうち、「丈」の文字は、第1確度と第2確度との差分が40%であるため、第2条件を満たさない。「太」の文字は、第1確度及び第2確度の高い方の確度が85%であり、第1確度と第2確度との差分が5%であるため、第1条件及び第2条件の両方の条件を満たす。「大」の文字は、第1確度及び第2確度の高い方の確度が87%であり、第1確度と第2確度との差分が5%であるため、第1条件及び第2条件の両方の条件を満たす。また、「木」の文字は、第1確度及び第2確度の高い方の確度が60%であるため、第1条件を満たさない。
【0152】
このため、認識結果決定部126Aは、複数の共通文字(「丈」、「太」、「大」及び「木」)のうち、「太」及び「大」の文字を第1条件及び第2条件の両方の条件を満たす共通文字として特定する。例えば、認識結果決定部126Aは、共通文字が第1条件及び第2条件の両方の条件を満たす場合、第1条件及び第2条件の両方の条件を満たす共通文字を、一の文字の認識結果に対応する確定文字の候補である確定候補文字に決定する。すなわち、認識結果決定部126Aは、「太」及び「大」の文字を確定候補文字に決定する。認識結果決定部126Aは、複数の確定候補文字が存在する場合、複数の確定候補文字の1つを、確定文字に決定する。
【0153】
なお、確定候補文字が1つの場合、認識結果決定部126Aは、確定候補文字を確定文字に決定する。以下では、複数の確定候補文字が存在する場合の確定文字の決定方法の例として、第1の決定方法、第2の決定方法及び第3の決定方法を説明する。但し、複数の確定候補文字が存在する場合の確定文字の決定方法は、以下の第1の決定方法、第2の決定方法及び第3の決定方法に限定されない。
【0154】
第1の決定方法では、認識結果決定部126Aは、複数の確定候補文字の中で確度が最も高い確定候補文字を、確定文字に決定する。
図12に示す認識結果では、2つの確定候補文字(「太」及び「大」)の中で、「大」の文字の確度が最も高い。このため、第1の決定方法では、認識結果決定部126Aは、2つの確定候補文字(「太」及び「大」)の中で、確度が最も高い確定候補文字(「大」)を確定文字に決定する。第1の決定方法では、第1確度と第2確度との平均値の算出等の演算を行うことなく確定文字を決定することができるため、確定文字決定処理が煩雑になることを抑制することができる。
【0155】
第2の決定方法では、認識結果決定部126Aは、複数の確定候補文字の中で、第1確度と第2確度との平均値が最も高い確定候補文字を、確定文字に決定する。「太」の文字の確度の平均値は、82.5%(=(85%+80%)/2)であり、「大」の確度の平均値は、84.5%(=(82%+87%)/2)である。このため、第2の決定方法では、認識結果決定部126Aは、2つの確定候補文字(「太」及び「大」)の中で、確度の平均値が最も高い確定候補文字(「大」)を確定文字に決定する。第2の決定方法では、複雑な演算を用いることなく単純な演算(第1確度と第2確度との平均値の算出)により確定文字を決定することができるため、確定文字決定処理が煩雑になることを抑制することができる。
【0156】
第3の決定方法では、認識結果決定部126Aは、複数の確定候補文字の中で評価値が最も高い確定候補文字を、確定文字に決定する。評価値は、例えば、評価値をEv、第1確度及び第2確度の高い方の確度をACmax、第1確度と第2確度との差分の絶対値をACdiffとした場合、係数α及びβを用いて、下記の式(1)で表される。なお、式(1)の“*”は、乗算を示す。係数α及びβは、0より大きい実数である。
Ev=ACmax*α-ACdiff*β ・・・(1)
【0157】
このように、第3の決定方法では、第1確度及び第2確度の高い方の確度(ACmax)と、第1確度と第2確度との差分の絶対値(ACdiff)とに基づく評価値(Ev)を用いて確定文字が決定される。このため、第3の決定方法では、例えば、上述の式(1)で表される評価値(Ev)を用いずに確定文字が決定される場合に比べて、精度の高い確定文字の決定を行うことができる。
【0158】
なお、評価値(Ev)と第1確度及び第2確度との関係は、上述の式(1)に限定されない。例えば、評価値(Ev)は、上述の式(1)において、第1確度及び第2確度の高い方の確度(Acmax)の代わりに、第1確度及び第2確度の平均値を用いて算出されてもよい。また、評価値(Ev)は、第1確度と第2確度との差分の絶対値(ACdiff)の代わりに、第1確度と第2確度との比を用いて算出されてもよい。第1確度と第2確度との比は、例えば、第1確度及び第2確度の高い方の確度を、第1確度及び第2確度の低い方の確度で除算した値である。第1確度及び第2確度の低い方の確度を、第1確度及び第2確度の高い方の確度で除算した値を第1確度と第2確度との比とする場合、上述の式(1)において、係数βは、負の実数になる。
【0159】
ここで、
図12に示す例では、複数の共通文字のうち、確度が最も高い共通文字は、確度が90%の「丈」の文字である。「丈」の文字の確度は90%であるが、文字認識部CR4では、「丈」の文字の確度は50%である。このため、「丈」の文字は、第1確度及び第2確度のうちの高い方の確度に関する第1条件を満たすが、第1確度と第2確度との差異の程度に関する第2条件を満たさない。第1条件及び第2条件の一方のみを満たす共通文字が確定文字に決定された場合、第1条件及び第2条件の両方を満たす共通文字が確定文字に決定される場合に比べて、誤った文字が確定文字に決定される確率が高いと考えられる。
【0160】
本実施形態では、第1条件及び第2条件の両方の条件を満たす共通文字を確定文字に決定することにより、第1条件及び第2条件の一方又は両方を満たさない共通文字が確定文字に決定される場合に比べて、誤った文字が確定文字に決定されることを抑制することができる。
【0161】
なお、確定文字の決定方法は、上述した例に限定されない。例えば、認識結果決定部126Aは、第1条件及び第2条件のいずれも考慮せずに、複数の共通文字の中で確度が最も高い共通文字を確定文字に決定してもよい。あるいは、認識結果決定部126Aは、第1条件及び第2条件のいずれも考慮せずに、複数の共通文字の中で、第1確度と第2確度との平均値が最も高い共通文字を確定文字に決定してもよい。あるいは、認識結果決定部126Aは、第1条件及び第2条件のいずれも考慮せずに、複数の共通文字の中で、上述の式(1)で表される評価値が最も高い共通文字を確定文字に決定してもよい。
【0162】
第1条件及び第2条件のいずれも考慮されずに共通文字が確定文字に決定される場合でも、複数の候補文字のうち確度が最も高い候補文字が確定文字に無条件で決定される形態に比べて、誤った文字が確定文字に決定される確率が低いと考えられる。以下では、複数の候補文字のうち確度が最も高い候補文字が確定文字に無条件で決定される形態は、第3対比例とも称される。
【0163】
例えば、
図12に示す認識結果では、複数の候補文字のうち、確度が最も高い候補文字は、確度が92%の「犬」の文字である。「犬」の文字は、文字認識部CR4による一の文字の認識結果として得られる複数の第2候補文字に含まれているが、文字認識部CR3による一の文字の認識結果として得られる複数の第1候補文字には含まれていない。このため、第3対比例では、誤った文字(「犬」)が、「大」の個別文字画像GC2の認識結果に対応する確定文字に決定される。なお、「大」の個別文字画像GC2の認識結果に対応する確定文字として正しい候補文字(「大」)は、複数の共通文字に含まれている。このため、第1条件及び第2条件のいずれも考慮されずに、複数の共通文字の1つが確定文字に決定される場合でも、第3対比例に比べて、誤った文字が確定文字に決定される確率が低いと考えられる。すなわち、本実施形態では、確定文字の決定に第1条件及び第2条件のいずれも考慮されない場合でも、1つ以上の共通文字の1つを確定文字に決定することにより、第3対比例に比べて、誤った文字が確定文字に決定されることを抑制することができる。
【0164】
次に、
図13を参照しながら、認識結果決定部126Aによる確定文字決定処理のフローについて説明する。
【0165】
図13は、
図11に示した認識結果決定部126Aの動作の一例を示すフローチャートである。
図13に示す確定文字決定処理では、第1確度及び第2確度のうちの高い方の確度に関する第1条件、及び、第1確度と第2確度との差異の程度に関する第2条件が確定文字の決定に用いられる場合を想定する。
【0166】
図13に示す確定文字決定処理は、例えば、
図8に示した動作において、ステップS300の確定文字決定処理として実行される。例えば、ステップS320の処理は、
図8のステップS260の処理が実行された後に実行される。
図9及び
図10において説明した動作と同様の要素については、同様の符号を付し、詳細な説明を省略する。
【0167】
なお、
図13においても、特に断りがない場合、「文字列画像GCL」は、
図8のステップS220において選択された申込内容記載領域AKに表された文字列画像GCLを意味するものとする。また、
図13では、
図8のステップS240において2つの文字認識部CRが選択された場合を想定する。なお、
図8のステップS240において選択された文字認識部CRの数が1つの場合、ステップS350からステップS372までの一連の処理が省かれ、ステップS320、S374及びS380の一連の処理が実行される。
【0168】
先ず、ステップS320において、認識結果決定部126Aは、文字列画像GCLに含まれる複数の個別文字画像GCのうち、確定文字が決定されていない一の個別文字画像GCを特定する。
【0169】
次に、ステップS350において、認識結果決定部126Aは、一の個別文字画像GCに対応する複数の候補文字から共通文字を検索する。
【0170】
次に、ステップS352において、認識結果決定部126Aは、共通文字が存在するか否かを判定する。すなわち、認識結果決定部126Aは、共通文字が複数の候補文字から検索されたか否かを判定する。ステップS352における判定の結果が肯定の場合、処理装置12は、処理をステップS354に進める。一方、ステップS352における判定の結果が否定の場合、処理装置12は、処理をステップS374に進める。
【0171】
ステップS354において、認識結果決定部126Aは、第1条件を満たす共通文字が存在するか否かを判定する。ステップS354における判定の結果が肯定の場合、処理装置12は、処理をステップS356に進める。一方、ステップS354における判定の結果が否定の場合、処理装置12は、処理をステップS374に進める。
【0172】
ステップS356において、認識結果決定部126Aは、第2条件を満たす共通文字が存在するか否かを判定する。ステップS356における判定の結果が肯定の場合、処理装置12は、処理をステップS370に進める。一方、ステップS356における判定の結果が否定の場合、処理装置12は、処理をステップS372に進める。
【0173】
ステップS370において、認識結果決定部126Aは、第1条件及び第2条件の両方の条件を満たす共通文字(すなわち、確定候補文字)の1つを確定文字に決定する。なお、例えば、複数の確定候補文字が存在する場合、認識結果決定部126Aは、上述した
図12において説明された第1の決定方法、第2の決定方法及び第3の決定方法のいずれかにより、複数の確定候補文字の1つを確定文字に決定してもよい。処理装置12は、ステップS370の処理を実行した後、処理をステップS380に進める。
【0174】
ステップS372において、認識結果決定部126Aは、第1条件を満たす共通文字の1つを確定文字に決定する。例えば、第1条件を満たす共通文字が複数存在する場合、認識結果決定部126Aは、第1条件を満たす複数の共通文字のうち、確度が最も高い共通文字を確定文字に決定する。あるいは、認識結果決定部126Aは、第1条件を満たす複数の共通文字の中で、上述の式(1)で表される評価値が最も高い共通文字を確定文字に決定してもよい。処理装置12は、ステップS372の処理を実行した後、処理をステップS380に進める。
【0175】
ステップS374において、認識結果決定部126Aは、複数の候補文字の1つを確定文字に決定する。例えば、認識結果決定部126Aは、複数の候補文字のうち、確度が最も高い候補文字を確定文字に決定する。処理装置12は、ステップS374の処理を実行した後、処理をステップS380に進める。
【0176】
ステップS380において、認識結果決定部126Aは、文字列画像GCLに含まれる複数の個別文字画像GCの全てについて、確定文字が決定されたか否かを判定する。ステップS380における判定の結果が否定の場合、処理装置12は、処理をステップS320に戻す。一方、ステップS380における判定の結果が肯定の場合、処理装置12は、確定文字決定処理を終了し、処理を
図8のステップS400に進める。
【0177】
なお、認識結果決定部126Aの動作は、
図13に示した例に限定されない。例えば、認識結果決定部126Aは、ステップS356の判定の代わりに、第1条件及び第2条件の両方の条件を満たす共通文字(すなわち、確定候補文字)が存在するか否かの判定を、ステップS354の判定の前に実行してもよい。この場合、ステップS354の判定は、確定候補文字が存在しない場合に実行され、ステップS372の処理は、ステップS354における判定の結果が肯定の場合に実行される。
【0178】
また、例えば、認識結果決定部126Aは、ステップS356における判定の結果が否定の場合、ステップS374の処理を実行してもよい。すなわち、ステップS372の処理が省かれてもよい。また、例えば、認識結果決定部126Aは、ステップS354における判定の結果が否定の場合、ステップS374において、共通文字の1つを確定文字に決定してもよい。例えば、認識結果決定部126Aは、ステップS354における判定の結果が否定の場合、複数の共通文字の中で、上述の式(1)で表される評価値が最も高い共通文字を確定文字に決定してもよい。
【0179】
以上、本実施形態では、文字認識装置10は、記載内容認識部124及び認識結果決定部126Aを有する。記載内容認識部124は、画像に含まれる文字を認識し、認識した文字の確度を算出する第1文字認識処理、及び、画像に含まれる文字を認識し、認識した文字の確度を算出する第2文字認識処理の各々(2つの文字認識部CRの各々が実行する文字認識処理)により、申込書画像GMに含まれる一の文字を認識する。認識結果決定部126Aは、第1文字認識処理による一の文字の認識結果として得られる1つ以上の第1候補文字と、第2文字認識処理による一の文字の認識結果として得られる1つ以上の第2候補文字との両方に含まれる共通文字が存在する場合、共通文字を一の文字の認識結果に対応する確定文字とするか否かを決定する。
【0180】
第1候補文字及び第2候補文字を含む複数の候補文字のうち、第1候補文字と第2候補文字との両方に含まれる共通文字は、一の文字の認識結果として第1文字認識処理及び第2文字認識処理の両方で認識された候補文字である。すなわち、共通文字以外の候補文字は、一の文字の認識結果として第1文字認識処理及び第2文字認識処理の一方のみで認識された候補文字である。従って、一の文字の認識結果として正しい候補文字が共通文字に含まれる確率は、一の文字の認識結果として正しい候補文字が共通文字以外の候補文字に含まれる確率に比べて高いと考えられる。本実施形態では、共通文字が存在する場合、共通文字を確定文字とするか否かが決定されるため、誤った文字が確定文字に決定されることを抑制することができる。すなわち、本実施形態では、文字認識処理における文字の認識の精度を高めることができる。
【0181】
また、本実施形態では、認識結果決定部126Aは、共通文字が、第1条件及び第2条件の両方の条件を満たす場合、共通文字を確定文字の候補である確定候補文字に決定してもよい。第1条件は、1つ以上の第1候補文字に含まれる共通文字の確度である第1確度、及び、1つ以上の第2候補文字に含まれる共通文字の確度である第2確度のうちの高い方の確度に関する条件である。第2条件は、第1確度と第2確度との差異の程度に関する条件である。第1条件及び第2条件の両方の条件を満たす共通文字に正しい候補文字が含まれる確率は、第1条件及び第2条件の一方又は両方を満たさない共通文字に正しい候補文字が含まれる確率に比べて高いと考えられる。従って、本実施形態では、第1条件及び第2条件の両方の条件を満たす共通文字を確定候補文字に決定することにより、共通文字が確定文字に無条件に決定される形態に比べて、誤った文字が確定文字に決定されることを抑制することができる。
【0182】
例えば、本実施形態では、第1条件は、第1確度及び第2確度のうちの高い方の確度が所定の確度以上であるという条件で、第2条件は、第1確度と第2確度との差分が所定値以下であるという条件であってもよい。第1条件及び第2条件の両方の条件を満たす共通文字は、第1確度及び第2確度のうちの高い方の確度が所定の確度以上であり、第1確度と第2確度との差分が所定値以下である。すなわち、第1条件及び第2条件の両方の条件を満たす共通文字は、第1条件を満たさない共通文字に比べて、第1確度及び第2確度のうちの高い方の確度が高く、かつ、第2条件を満たさない共通文字に比べて、第1確度と第2確度との差分が小さい。このため、第1条件及び第2条件の両方の条件を満たす共通文字は、第1条件及び第2条件の一方又は両方を満たさない共通文字に比べて、文字の認識の精度が高いと考えられる。従って、本実施形態では、第1条件及び第2条件の両方の条件を満たす共通文字を確定候補文字に決定することにより、文字認識処理における文字の認識の精度を高めることができる。
【0183】
また、本実施形態では、認識結果決定部126Aは、確定候補文字が複数存在する場合、複数の確定候補文字の中で確度が最も高い確定候補文字を確定文字に決定してもよい。この場合においても、誤った文字が確定文字に決定されることを抑制することができ、文字認識処理における文字の認識の精度を高めることができる。
【0184】
また、本実施形態では、認識結果決定部126Aは、確定候補文字が複数存在する場合、複数の確定候補文字の中で、第1確度と第2確度との平均値が最も高い確定候補文字を確定文字に決定してもよい。この場合においても、誤った文字が確定文字に決定されることを抑制することができ、文字認識処理における文字の認識の精度を高めることができる。
【0185】
また、本実施形態では、上述の第1条件及び第2条件は設定されなくてもよい。第1条件及び第2条件が設定されない形態では、認識結果決定部126Aは、共通文字が複数存在する場合、複数の共通文字の中で確度が最も高い共通文字を確定文字に決定してもよい。この場合においても、複数の候補文字のうち確度が最も高い候補文字が確定文字に無条件で決定される場合に比べて、誤った文字が確定文字に決定されることを抑制することができ、文字認識処理における文字の認識の精度を高めることができる。
【0186】
あるいは、第1条件及び第2条件が設定されない形態では、認識結果決定部126Aは、共通文字が複数存在する場合、複数の共通文字の中で、第1確度と第2確度との平均値が最も高い共通文字を確定文字に決定してもよい。この場合においても、複数の候補文字のうち確度が最も高い候補文字が確定文字に無条件で決定される場合に比べて、誤った文字が確定文字に決定されることを抑制することができ、文字認識処理における文字の認識の精度を高めることができる。
【0187】
また、本実施形態では、認識結果決定部126Aにより決定された確定文字を表示装置28に表示させる表示情報生成部128をさらに有する。表示情報生成部128は、共通文字が存在しない場合の確定文字の表示態様を、共通文字が存在する場合の確定文字の表示態様とは異ならせる。共通文字が存在しない場合、共通文字が存在する場合に比べて、2つの文字認識部CRによる一の文字に対する文字認識の精度が低いと考えられる。すなわち、共通文字が存在しない場合、共通文字が存在する場合に比べて、誤った文字が確定文字に決定される確率が高いと考えられる。このため、オペレータは、例えば、一の確定文字の表示態様が他の確定文字の表示態様と異なる場合、一の確定文字が誤っている可能性があることを認識できる。この結果、本実施形態では、確定文字が誤っている可能性がある場合においても確定文字の表示態様が変化しない場合に比べて、確定文字が誤っていることを見落とす可能性を低減することができる。
【0188】
また、本実施形態では、上述した第1実施形態と同様に、項目毎に重み値が文字認識部CRに対応付けられてもよい。
【0189】
[3.第3実施形態]
次に、
図14を参照しながら、第3実施形態に係る文字認識装置10の概要の一例について説明する。
【0190】
図14は、第3実施形態に係る文字認識装置10の概要を説明するための説明図である。
図1から
図13において説明した要素と同様の要素については、同様の符号を付し、詳細な説明を省略する。
【0191】
図14に示す文字認識装置10は、
図11に示した文字認識装置10と同一の構成である。例えば、文字認識装置10は、処理装置12、記憶装置14及び通信装置16を有する。但し、記憶装置14に記憶される制御プログラムPG3は、
図11に示した制御プログラムPG2と相違する。なお、制御プログラムPG3は、「プログラム」の一例である。本実施形態では、制御プログラムPG3は、例えば、文字認識装置10が文字認識処理を実行するためのアプリケーションプログラムを含む。但し、制御プログラムPG3は、例えば、処理装置12が文字認識装置10の各部を制御するためのオペレーティングシステムプログラムを含んでもよい。
【0192】
また、本実施形態では、優先テーブルPTBL、及び、各項目の記載欄に記載された文字の認識に使用する文字認識部CRの数の上限等は、上述した第2実施形態と同様である。例えば、本実施形態では、各項目において1つ以上2つ以下の文字認識部CRが文字の認識に使用され、複数の項目のうちの少なくとも1つの項目では、2つの文字認識部CRが文字の認識に使用される。以下では、文字の認識に使用される2つの文字認識部CRの一方は、第1の文字認識部CRとも称され、2つの文字認識部CRの他方は、第2の文字認識部CRとも称される。
【0193】
本実施形態では、第1の文字認識部CRが、申込書画像GMに含まれる文字列を構成する複数の文字を認識し、第2の文字認識部CRが、申込書画像GMに含まれる文字列を構成する複数の文字のうち一の文字を認識する場合を想定する。第1の文字認識部CRにより実行される文字認識処理は、「第1文字認識処理」の一例であり、第2の文字認識部CRにより実行される文字認識処理は、「第2文字認識処理」の一例である。また、申込書画像GMは、「画像」の一例である。申込書画像GMに含まれる文字列画像GCLにより示される文字列が申込書画像GMに含まれる文字列に該当する。
【0194】
図14に示す処理装置12は、
図11に示した制御プログラムPG2の代わりに制御プログラムPG3を実行することを除いて、
図11に示した処理装置12と同様である。例えば、処理装置12は、記憶装置14から読み出した制御プログラムPG3を実行することによって、制御部120Bとして機能する。
【0195】
制御部120Bは、認識結果決定部126Aの代わりに認識結果決定部126Bを有することを除いて、
図11に示した制御部120Aと同様である。例えば、制御部120Bは、画像情報取得部122、記載内容認識部124、認識結果決定部126B及び表示情報生成部128を有する。認識結果決定部126Bは、「決定部」の一例である。
【0196】
画像情報取得部122及び記載内容認識部124は、
図11に示した画像情報取得部122及び記載内容認識部124と同様である。但し、記載内容認識部124が有する複数の文字認識部CRは、第1の文字認識部CR及び第2の文字認識部CRを含む。また、第1の文字認識部CRは、申込書画像GMに含まれる文字列の認識結果として、文字列を構成する複数の文字の各々の候補文字及び各候補文字の確度を出力する。第2の文字認識部CRは、複数の文字のうち一の文字の認識結果として、候補文字及び候補文字の確度を出力する。
【0197】
第1の文字認識部CRによる一の文字の認識結果として得られる候補文字は、「第1候補文字」の一例であり、第2の文字認識部CRによる一の文字の認識結果として得られる候補文字は、「第2候補文字」の一例である。以下では、第1の文字認識部CRによる一の文字の認識結果として得られる候補文字は、第1候補文字とも称され、第2の文字認識部CRによる一の文字の認識結果として得られる候補文字は、第2候補文字とも称される。
【0198】
認識結果決定部126Bは、記載内容認識部124による一の文字に対する文字認識処理の結果を示す認識情報を取得する。例えば、認識情報は、第1の文字認識部CRにより実行された文字認識処理による文字列(一の文字を含む文字列)の認識結果、及び、第2の文字認識部CRにより実行された文字認識処理による一の文字の認識結果を示す。
【0199】
例えば、認識結果決定部126Bは、第1候補文字と第2候補文字とが互いに同じ文字である場合、当該同じ文字を一の文字の認識結果に対応する確定文字に決定する。
【0200】
表示情報生成部128は、確定文字の表示形態を異ならせる条件を除いて、
図11に示した表示情報生成部128と同様である。例えば、表示情報生成部128は、第1候補文字と第2候補文字とが互いに異なる場合の確定文字の表示態様を、第1候補文字と第2候補文字とが互いに同じ場合の確定文字の表示態様とは異ならせる。具体的には、例えば、表示情報生成部128は、第1候補文字と第2候補文字とが互いに異なる場合、内容確認画面CCH内に注意マークMKを表示する表示情報を生成し、生成した表示情報を端末装置20に出力する。これにより、例えば、内容確認画面CCHのうち、一の文字の認識結果に対応する確定文字の表示位置に対応する位置に、注意マークMKが表示される。
【0201】
例えば、第1候補文字と第2候補文字とが互いに異なる場合、第1候補文字と第2候補文字とが互いに同じ場合に比べて、誤った文字が確定文字に決定される確率が高いと考えられる。このため、端末装置20を操作するオペレータは、注意マークMKを視認することにより、個別文字画像GCにより示される文字と確定文字とが異なる文字である可能性があることを認識できる。この結果、本実施形態では、注意マークMKが表示されない態様に比べて、確定文字が誤っていることを見落とす可能性を低減することができる。
【0202】
なお、表示情報生成部128は、第1候補文字と第2候補文字とが互いに異なり、かつ、第1候補文字の確度が第2候補文字の確度より所定値以上低い場合の確定文字の表示態様を、第1候補文字と第2候補文字とが互いに同じ場合の確定文字の表示態様とは異ならせてもよい。例えば、表示情報生成部128は、第1候補文字と第2候補文字とが互いに異なり、かつ、第1候補文字の確度が第2候補文字の確度より所定値以上低い場合、内容確認画面CCH内に注意マークMKを表示する表示情報を生成してもよい。
【0203】
例えば、第1候補文字と第2候補文字とが互いに異なる場合でも、第1候補文字の確度と第2候補文字の確度との差分が所定値未満の場合、第1候補文字の確度が第2候補文字の確度より所定値以上低い場合に比べて、確定文字が正しい確率が高いと考えられる。従って、例えば、第1候補文字と第2候補文字とが互いに異なり、かつ、第1候補文字の確度が第2候補文字の確度より所定値以上低い場合に、内容確認画面CCH内に注意マークMKが表示される形態では、注意マークMKを効果的に表示できる。注意マークMKを効果的に表示するとは、例えば、確定文字が正しい場合に注意マークMKが頻繁に表示されることを抑制することである。
【0204】
また、表示情報生成部128は、第1候補文字と第2候補文字とが互いに異なる場合の確定文字の表示態様を、第1候補文字の確度が第2候補文字の確度より所定値以上低い場合と、第1候補文字の確度と第2候補文字の確度との差分が所定値未満の場合とで異ならせてもよい。例えば、表示情報生成部128は、第1候補文字の確度が第2候補文字の確度より所定値以上低い場合と、第1候補文字の確度と第2候補文字の確度との差分が所定値未満の場合とで、注意マークMKの色等を異ならせてもよい。この場合、例えば、端末装置20を操作するオペレータは、注意マークMKの色を視認することにより、個別文字画像GCにより示される文字と確定文字とが異なる文字である可能性の程度を認識できる。
【0205】
なお、制御部120Bの動作は、確定文字決定処理を除いて、
図11に示した制御部120Aの動作と同様である。例えば、制御部120Bの動作は、後述する
図15において説明される確定文字決定処理を
図8に示したステップS300において実行することを除いて、
図8に示した動作と同様である。
【0206】
次に、
図15を参照しながら、認識結果決定部126Bによる確定文字決定処理の一例について説明する。
【0207】
図15は、
図14に示した認識結果決定部126Bの動作の一例を説明するための説明図である。
図15では、「住所」に係る申込内容記載領域AKに記載された文字列を示す文字列画像GCL5に対して文字認識処理が実行された場合を例にして、「東」、「青」及び「海」の個別文字画像GCの認識結果に対応する確定文字の決定方法の一例が説明される。
【0208】
なお、
図15では、文字列画像GCL5の文字の認識に使用される文字認識部CRとして、文字認識部CR3及びCR4が選択された場合を想定する。さらに、
図15では、文字認識部CR4が第1の文字認識部CRであり、文字認識部CR3が第2の文字認識部CRである場合を想定する。また、
図15では、文字認識部CR4が、住所に関する辞書(以下、住所辞書とも称する)を用いて、一の文字を含む文字列の認識結果である候補文字列を特定する場合を想定する。
【0209】
図15では、文字認識部CR4による「東」及び「青」の個別文字画像GCの認識結果に対応する2つの第1候補文字が、それぞれ「東」及び「青」の文字である場合を想定する。また、
図15では、文字認識部CR4による「海」の個別文字画像GC1の認識結果に対応する第1候補文字の候補が「海」、「梅」及び「侮」の文字である場合を想定する。
【0210】
文字認識部CR4は、「東」及び「青」の個別文字画像GCの認識結果に対応する2つの第1候補文字と、「海」の個別文字画像GC1の認識結果に対応する第1候補文字の候補との組み合わせによる文字列が、住所辞書に登録されているか否かを判定する。
図15の×印は文字列が住所辞書に登録されていないことを示し、
図15の丸印は文字列が住所辞書に登録されていることを示す。例えば、文字認識部CR4は、「東青海」及び「東青侮」の文字列が住所辞書に登録されていないため、「東青海」及び「東青侮」の文字列は候補文字列でないと判定する。また、文字認識部CR4は、「東青梅」の文字列が住所辞書に登録されているため、「東青梅」の文字列を候補文字列に決定する。すなわち、文字認識部CR4は、「梅」の文字を、「海」の個別文字画像GC1の認識結果に対応する第1候補文字に決定する。
【0211】
一方、文字認識部CR3は、「海」の個別文字画像GC1の認識結果に対応する第2候補文字の候補(「海」、「梅」及び「侮」)のうち、最も確度が高い「海」の文字を、「海」の個別文字画像GC1の認識結果に対応する第2候補文字に決定する。なお、
図15では、文字認識部CR3による「東」及び「青」の個別文字画像GCの認識結果に対応する2つの第2候補文字が、それぞれ「東」及び「青」の文字である場合を想定する。
【0212】
認識結果決定部126Bは、文字認識部CR4による「東」の個別文字画像GCに対する文字認識処理の結果として、第1候補文字(「東」)と第1候補文字の確度(90%)とを取得する。さらに、認識結果決定部126Bは、文字認識部CR3による「東」の個別文字画像GCに対する文字認識処理の結果として、第2候補文字(「東」)と第2候補文字の確度(88%)とを取得する。認識結果決定部126Bは、第1候補文字(「東」)と第2候補文字(「東」)とが互いに同じであるため、「東」の文字を、「東」の個別文字画像GCの認識結果に対応する確定文字に決定する。同様に、認識結果決定部126Bは、「青」の個別文字画像GCに対する文字認識処理の結果として得られる第1候補文字(「青」)と第2候補文字(「青」)とが互いに同じであるため、「青」の文字を、「青」の個別文字画像GCの認識結果に対応する確定文字に決定する。
【0213】
また、認識結果決定部126Bは、文字認識部CR4による「海」の個別文字画像GC1に対する文字認識処理の結果として、第1候補文字(「梅」)と第1候補文字の確度(30%)とを取得する。さらに、認識結果決定部126Bは、文字認識部CR3による「海」の個別文字画像GC1に対する文字認識処理の結果として、第2候補文字(「海」)と第2候補文字の確度(90%)とを取得する。
【0214】
認識結果決定部126Bは、第1候補文字(「梅」)と第2候補文字(「海」)とが互いに異なるが、第1候補文字(「梅」)を、「海」の個別文字画像GC1の認識結果に対応する確定文字に決定する。但し、認識結果決定部126Bは、第1候補文字(「梅」)と第2候補文字(「海」)とが互いに異なるため、第1候補文字と第2候補文字とが互いに異なることを、表示情報生成部128に通知する。そして、表示情報生成部128は、例えば、内容確認画面CCH内に注意マークMKを表示する表示情報を生成し、生成した表示情報を端末装置20に出力する。これにより、例えば、内容確認画面CCHのうち、「海」の個別文字画像GC1の認識結果に対応する確定文字の表示位置に対応する位置に、注意マークMKが表示される。
【0215】
なお、認識結果決定部126Bの動作は、上述の例に限定されない。例えば、認識結果決定部126Bは、第1候補文字(「梅」)と第2候補文字(「海」)とが互いに異なる場合、第1候補文字及び第2候補文字のうち確度が高い第2候補文字(「海」)を、「海」の個別文字画像GC1の認識結果に対応する確定文字に決定してもよい。すなわち、認識結果決定部126Bは、第1候補文字と第2候補文字とが互いに異なる場合、第1候補文字及び第2候補文字のうち確度が高い候補文字を確定文字に決定してもよい。この場合においても、認識結果決定部126Bは、第1候補文字と第2候補文字とが互いに異なることを、表示情報生成部128に通知する。
【0216】
あるいは、認識結果決定部126Bは、第1候補文字と第2候補文字とが互いに異なる場合、第2候補文字の確度から第1候補文字の確度を減算した値である判定値に基づいて、第1候補文字及び第2候補文字の一方を確定文字に決定してもよい。具体的には、例えば、認識結果決定部126Bは、判定値が所定値未満の場合、第1候補文字を確定文字に決定し、判定値が所定値以上の場合、第2候補文字を確定文字に決定してもよい。
【0217】
また、認識結果決定部126Bは、第1候補文字と第2候補文字とが互いに異なり、かつ、第1候補文字の確度が第2候補文字の確度より所定値以上低い場合、第1候補文字と第2候補文字とが互いに異なることを、表示情報生成部128に通知してもよい。
【0218】
以上、本実施形態では、文字認識装置10は、記載内容認識部124及び認識結果決定部126Bを有する。記載内容認識部124は、申込書画像GMに含まれる文字列を構成する複数の文字を認識する第1文字認識処理、及び、申込書画像GMに含まれる複数の文字のうち一の文字を認識する第2文字認識処理を実行する。認識結果決定部126Bは、第1文字認識処理による一の文字の認識結果として得られる第1候補文字と、第2文字認識処理による一の文字の認識結果として得られる第2候補文字とが、互いに同じ文字である場合、同じ文字を、一の文字の認識結果に対応する確定文字に決定する。
【0219】
第1候補文字と第2候補文字とが互いに同じ場合、第1候補文字と第2候補文字とが互いに異なる場合に比べて、誤った文字が確定文字に決定される確率が低いと考えられる。本実施形態では、第1候補文字と第2候補文字とが互いに同じ文字である場合に当該同じ文字が確定文字に決定されるため、誤った文字が確定文字に決定されることを抑制することができ、文字認識処理における文字の認識の精度を高めることができる。
【0220】
また、本実施形態では、認識結果決定部126Bにより決定された確定文字を表示装置28に表示させる表示情報生成部128をさらに有する。表示情報生成部128は、第1候補文字と第2候補文字とが互いに異なる場合の確定文字の表示態様を、第1候補文字と第2候補文字とが互いに同じ場合の確定文字の表示態様とは異ならせる。このため、オペレータは、例えば、一の確定文字の表示態様が他の確定文字の表示態様と異なる場合、一の確定文字が誤っている可能性があることを認識できる。この結果、本実施形態では、確定文字が誤っている可能性がある場合においても確定文字の表示態様が変化しない場合に比べて、確定文字が誤っていることを見落とす可能性を低減することができる。
【0221】
また、本実施形態では、表示情報生成部128は、第1候補文字と第2候補文字とが互いに異なり、かつ、第1候補文字の確度が第2候補文字の確度より所定値以上低い場合の確定文字の表示態様を、第1候補文字と第2候補文字とが互いに同じ場合の確定文字の表示態様とは異ならせてもよい。この場合においても、確定文字が誤っている可能性がある場合においても確定文字の表示態様が変化しない場合に比べて、確定文字が誤っていることを見落とす可能性を低減することができる。
【0222】
また、本実施形態では、上述した第1実施形態と同様に、項目毎に重み値が文字認識部CRに対応付けられてもよい。
【0223】
[4.変形例]
本発明は、以上に例示した実施形態に限定されない。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を併合してもよい。
【0224】
[第1変形例]
上述した第1実施形態では、項目毎に重み値が文字認識部CRに対応付けられる場合を例示したが、本発明はこのような態様に限定されるものではない。例えば、重み値は、各文字認識部CRにおいて、文字毎に対応付けられてもよい。
【0225】
図16は、第1変形例に係る重みテーブルWTNLの一例を説明するための説明図である。本変形例では、重みテーブルWTNLが優先テーブルPTBLとは別に設けられる場合を想定する。例えば、記憶装置14は、制御プログラムPG1、優先テーブルPTBL、重みテーブルWTNL及び複数の学習モデルLMを記憶する。例えば、重みテーブルWTNLは、認識結果決定部126が評価値を算出する場合に認識結果決定部126により参照される。なお、文字の認識に使用する文字認識部CRを記載内容認識部124が複数の文字認識部CRから選択する場合には、優先テーブルPTBLが記載内容認識部124により参照される。
【0226】
重みテーブルWTNLは、例えば、文字認識部CR毎に管理される。また、各文字認識部CRの重みテーブルWTNLは、例えば、所定のタイミングで更新される。例えば、各文字認識部CRの重みテーブルWTNLは、過去に確定文字として決定され、かつ、正しい文字に修正された1つ以上の候補文字と1対1に対応する複数のレコードを有する。すなわち、
図16に示す例では、過去に確定文字として決定されたことのない候補文字、及び、修正されたことのない候補文字は、重みテーブルWTNLに登録されていない。本変形例では、重みテーブルWTNLに登録されていない文字(例えば、過去に確定文字として決定されたことのない候補文字、及び、修正されたことのない候補文字等)の重み値は、1として扱われる。
【0227】
各文字認識部CRの重みテーブルWTNLにおいて、各レコードは、文字ID及び重み値を有する。文字IDは、当該文字認識部CRが認識する複数の文字の中から、各文字を識別するための情報であり、各文字を示す情報である。例えば、文字IDは、各文字に割り当てられた文字コードであってもよい。なお、
図16では、説明を分かり易くするために、文字IDにより示される文字も図示されている。
【0228】
重み値は、例えば、文字IDにより示される文字に対応付けられた重み値である。重み値は、0以上1以下の実数である。但し、上述したように、
図16に示す例では、1の重み値は、重みテーブルWTNLに登録されていない文字に対応付けられるため、重みテーブルWTNLに登録された文字に対応付けられる重み値は、0以上1未満の実数である。
【0229】
例えば、修正回数が多い文字の重み値は、修正回数が少ない文字の重み値より小さい値に設定される。なお、例えば、文字認識部CR3が「木」の個別文字画像GCを「大」の文字と誤って認識し、文字認識部CR3から得られる誤った候補文字(「大」)が確定文字に決定された場合、「大」の文字が「木」の文字に修正されるため、「大」の文字の修正回数にカウントされる。また、文字認識部CR3が、「木」の個別文字画像GCを誤った文字に認識したことがある場合でも、「木」以外の個別文字画像GCを「木」の文字と誤って認識したことがない場合、「木」の文字の修正回数は0である。
【0230】
なお、重みテーブルWTNLは、
図16に示した例に限定されない。例えば、重みテーブルWTNLは、重みテーブルWTNLに登録された各文字に対応付けて、当該文字が初めて重みテーブルWTNLに登録されてから当該文字が確定文字として決定された回数を記憶してもよい。この場合、重み値は、確定文字として決定された回数に対する修正回数の比率(以下、修正率とも称する)を考慮して設定されてもよい。例えば、修正率が高い文字の重み値は、修正率が低い文字の重み値より小さい値に設定されてもよい。
【0231】
あるいは、各文字認識部CRの重みテーブルWTNLは、当該文字認識部CRが認識可能な全ての文字と1対1に対応する複数のレコードを有してもよい。この場合、各文字認識部CRの重みテーブルWTNLは、各文字について、確定文字として決定された回数を記憶してもよい。この場合においても、重み値は、修正率を考慮して設定されてもよい。
【0232】
次に、
図17を参照しながら、重みテーブルWTNLを用いた確定文字決定処理の一例について説明する。
【0233】
図17は、第1変形例に係る確定文字決定処理の一例を説明するための説明図である。
図17では、上述した
図6と同様に、「住所」に係る申込内容記載領域AKに記載された文字列を示す文字列画像GCL5に対して文字認識処理が実行された場合を例にして、「大」の個別文字画像GC2の認識結果に対応する確定文字の決定方法の一例が説明される。但し、
図17では、説明を分かり易くするために、確度等を
図6に示した例と異ならせている箇所がある。
【0234】
なお、
図17では、認識結果決定部126が
図16に示した重みテーブルWTNLを参照する場合を想定する。さらに、
図17では、説明を分かり易くするために、文字列画像GCL5の文字の認識に使用される文字認識部CRとして、文字認識部CR3及びCR4が選択された場合を想定する。
【0235】
図17に示す例では、認識結果決定部126は、文字認識部CR3による「大」の個別文字画像GCに対する文字認識処理の結果として、「丈」、「太」、「大」、「火」及び「木」の文字を含む複数の候補文字と、複数の候補文字の各々の確度とを、取得する。さらに、認識結果決定部126は、文字認識部CR4による「大」の個別文字画像GCに対する文字認識処理の結果として、「犬」、「大」、「太」、「木」及び「丈」の文字を含む複数の候補文字と、複数の候補文字の各々の確度とを、取得する。
【0236】
認識結果決定部126は、複数の候補文字の各々の確度を複数の候補文字の各々の確度重み値で重み付けすることにより、評価値を算出する。例えば、各候補文字の評価値は、各候補文字の確度と各候補文字の重み値との積で表される。具体的には、認識結果決定部126は、例えば、文字認識部CR3から得られる「丈」の候補文字の確度(90%)と「丈」の候補文字の重み値(0.8)との積(90*0.8=72)を、「丈」の候補文字の評価値として算出する。文字認識部CR3から得られる複数の候補文字のうちの「丈」以外の候補文字の各々、及び、文字認識部CR4から得られる複数の候補文字の各々についても、「丈」の候補文字と同様に、評価値が算出される。
【0237】
そして、認識結果決定部126は、文字認識部CR3及びCR4の各々による「大」の個別文字画像GC2の認識結果として得られる複数の候補文字のうち、評価値が最も高い候補文字を、「大」の個別文字画像GCの認識結果に対応する確定文字に決定する。なお、評価値が最も高い候補文字が複数存在する場合、認識結果決定部126は、当該複数の候補文字のうち、優先度が最も高い候補文字を確定文字に決定してもよい。すなわち、認識結果決定部126は、複数の候補文字の各々の確度と、複数の候補文字の各々の重み値と、複数の文字認識部CRの各々の優先度とに基づいて、複数の候補文字の1つを、確定文字に決定してもよい。あるいは、認識結果決定部126は、評価値が最も高い候補文字が複数存在する場合、当該複数の候補文字のうち、確度が最も高い候補文字を確定文字に決定してもよい。
【0238】
ここで、
図17に示す例では、複数の候補文字のうち、確度が最も高い候補文字は、
図17の二重丸で示されるように、確度が92%の「犬」の文字である。例えば、文字毎に重み値が設定されていない形態(以下、第4対比例とも称する)では、複数の候補文字のうち、確度が最も高い「犬」の文字が、「大」の個別文字画像GCの認識結果に対応する確定文字に決定される。すなわち、第4対比例では、文字認識部CR4から得られる複数の候補文字のうち、修正回数が「大」の文字より多い「犬」の文字が、「大」の個別文字画像GCの認識結果に対応する確定文字に決定される。このため、第4対比例では、本変形例に比べて、誤った文字が確定文字に決定される確率が高くなる。換言すれば、本変形例では、第4対比例に比べて、誤った文字が確定文字に決定されることを抑制することができる。
【0239】
以上、本変形例においても、上述した第1実施形態と同様の効果を得ることができる。なお、文字の認識に使用する文字認識部CRの優先度が、当該文字の修正回数又は修正率に応じて、文字毎に決定されてもよい。また、上述した第2実施形態及び第3実施形態においても、本変形例と同様に、各文字認識部CRにより認識される文字毎に重み値が対応付けられてもよい。
【0240】
[第2変形例]
上述した実施形態及び変形例では、文字認識装置10と端末装置20とが互いに別体である場合を例示したが、本発明はこのような態様に限定されるものではない。例えば、文字認識装置10と端末装置20とは、一体として構成されてもよい。
【0241】
図18は、第2変形例に係る文字認識システム1Aの一例を示す図である。
図1から
図17において説明された要素と同様の要素については、同一の符号が付され、詳細な説明は省略される。
【0242】
文字認識システム1Aは、文字認識装置10A及び画像入力装置30を有する。例えば、文字認識装置10Aは、画像入力装置30と通信可能に接続される。なお、文字認識装置10Aと画像入力装置30との接続は、有線及び無線の一方を用いた接続であってもよいし、有線及び無線の両方を用いた接続であってもよい。
【0243】
文字認識装置10Aは、文字認識装置10Aの各部を制御する処理装置12と、各種情報を記憶する記憶装置14と、通信装置16と、文字認識装置10Aのオペレータの操作を受け付ける操作装置27と、画像等を表示する表示装置28とを有する。文字認識装置10Aは、操作装置27及び表示装置28を有することを除いて、
図3に示した文字認識装置10と同様である。但し、文字認識装置10Aでは、制御プログラムPG1の代わりに制御プログラムPG4を処理装置12が実行する点が、文字認識装置10と相違する。このため、記憶装置14は、制御プログラムPG1の代わりに制御プログラムPG4を記憶する。なお、文字認識装置10Aは、「情報処理装置」の別の例であり、制御プログラムPG4は、「プログラム」の別の例である。
【0244】
本変形例では、制御プログラムPG4は、例えば、文字認識装置10Aが文字認識処理を実行するためのアプリケーションプログラムを含む。但し、制御プログラムPG4は、例えば、処理装置12が文字認識装置10Aの各部を制御するためのオペレーティングシステムプログラムを含んでもよい。制御プログラムPG4は、他の装置から送信されてもよい。
【0245】
制御プログラムPG4に含まれるアプリケーションプログラムに従って動作する処理装置12は、例えば、画像情報取得部122、記載内容認識部124、認識結果決定部126及び表示情報生成部128を含む制御部120として機能する。
図18に示す処理装置12により実現される制御部120は、端末装置20を介して実行した処理を端末装置20を介さずに実行することを除いて、
図4に示した制御部120と同様である。例えば、画像情報取得部122は、文字認識処理の対象となる画像を示す画像情報を画像入力装置30から取得する。また、例えば、表示情報生成部128は、内容確認画面CCH等の画像を表示装置28に表示させるための表示情報を、表示装置28に出力する。
【0246】
なお、文字認識システム1Aの構成は、
図18に示した例に限定されない。例えば、画像入力装置30は、文字認識装置10Aに含まれてもよい。また、例えば、文字認識装置10Aは、表示装置28を含まなくてもよい。文字認識装置10Aは、表示装置28を含まない場合、表示装置28と通信可能に接続される。文字認識装置10Aと表示装置28との接続は、有線及び無線の一方を用いた接続であってもよいし、有線及び無線の両方を用いた接続であってもよい。また、制御プログラムPG4に含まれるアプリケーションプログラムに従って動作する処理装置12は、例えば、制御部120Aとして機能してもよいし、制御部120Bとして機能してもよい。なお、処理装置12が制御部120Bとして機能する場合、例えば、重みテーブルWTBLが記憶装置14に記憶されている。
【0247】
以上、本変形例においても、上述した実施形態及び変形例と同様の効果を得ることができる。
【0248】
[第3変形例]
上述した実施形態及び変形例において、文字認識装置10又は10Aは、文字認識処理の結果に対する修正の内容を学習してもよい。以上、本変形例においても、上述した実施形態及び変形例と同様の効果を得ることができる。
【0249】
[第4変形例]
上述した実施形態及び変形例では、文字認識処理の対象となる画像が申込書画像GMである場合を例示したが、本発明はこのような態様に限定されるものではない。例えば、文字認識処理の対象となる画像は、処方箋、経理書類(例えば、請求書、決算書、振込用紙及び見積書等)、及び、記録用紙(例えば、実験等における測定値が記録された用紙等)等の書類の画像であってもよい。
【符号の説明】
【0250】
1、1A…文字認識システム、10、10A…文字認識装置、12…処理装置、14…記憶装置、16…通信装置、20…端末装置、27…操作装置、28…表示装置、30…画像入力装置、120、120A、120B…制御部、122…画像情報取得部、124…記載内容認識部、126…認識結果決定部、128…表示情報生成部、CCH…内容確認画面、CR…文字認識部、GM…申込書画像、LM…学習モデル、NW…ネットワーク、MK…注意マーク、PTBL…優先テーブル、WTBL…重みテーブル。