(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0017】
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において同一部には原則として同一符号を付し、その繰り返しの説明は省略する。
【0018】
(実施の形態1)
図1〜
図21を用いて、本発明の実施の形態1の文字認識システム及び文字認識方法について説明する。実施の形態1の文字認識システムは、OCRを用いて帳票の文字認識の処理を行うシステムである。実施の形態1の文字認識方法は、実施の形態1の文字認識システム上において、ユーザの操作に基づいてコンピュータにより実行される処理手順を含む方法である。
【0019】
実施の形態1の文字認識システムは、帳票の2つの箇所に二重エントリとして記入されている2つの金額等の文字列について、それらの文字の種類が異なる場合にも、自動的に、文字種の変換、比較、及び判定等を行う高度な機能を提供する。文字認識システムは、2つの文字列を比較し、一致及び不一致や、記入誤りや改ざん等の可能性を判定し、その結果に応じて、アラート等を含む結果画面をユーザへ出力し、出力データを保存する。これにより、ユーザによる帳票の確認や修正等の作業を支援する。
【0020】
[文字認識システム]
図1は、実施の形態1の文字認識システムの構成を示す。実施の形態1の文字認識システムは、OCR装置1とPC2との接続により構成される。実施の形態1の文字認識システムは、帳票5のOCR処理に関する主な処理をPC2で行う。言い換えると、実施の形態1の文字認識システムは、ソフトOCR方式のシステムである。OCR装置1は、帳票5のOCR処理のうち、帳票5の画像データを得る処理までを行う装置である。PC2は、ソフトウェア処理によりOCR処理を行う装置である。OCR処理は、言い換えると、帳票5のデータ化、文字列データを得る処理である。
【0021】
ユーザは、実施の形態1の文字認識システムを利用し、OCR装置1及びPC2を操作する。ユーザは、帳票5のOCR処理に関する作業として、帳票5の記載内容の確認、データの修正や確定、等の作業を行う。
【0022】
帳票5は、所定の業務で用いられる所定の形式の帳票であり、例えば請求書や小切手である。図示しない記入者は、帳票5の欄に、金額等の文字を、手書きで記入する。あるいは、帳票5の欄には、金額等の文字が、ライター等の機器を用いて印字される。ユーザは、提出された帳票5を受け取る。
【0023】
ユーザは、作業のため、1枚以上の帳票5を、OCR装置1にセットし入力する。ユーザは、PC2を操作し、作業に関する設定や指示入力を行う。PC2は、指示入力に従い、OCR装置1へ命令を送信する。OCR装置1は、PC2からの命令に従い、帳票5のOCR処理を開始する。
【0024】
OCR装置1は、帳票入力部11を含む。帳票入力部11は、図示しないスキャナ等のハードウェア及びソフトウェアにより構成される。OCR装置1は、帳票入力部11により、帳票5を読み込んでスキャンし、帳票5の画像データ21を得る。OCR装置1は、読み込み済みの帳票5を、図示しないスタッカへ排出し蓄積する。
【0025】
OCR装置1とPC2は、所定の通信インタフェースで接続される。OCR装置1は、図示しない通信インタフェース装置を含む。OCR装置1は、帳票入力部11により得た画像データ21を、通信インタフェース装置による通信処理を介してPC2へ転送する。
【0026】
PC2は、制御装置201、記憶装置202、入力装置203、表示装置204、印刷装置205、及び通信インタフェース装置206を有する。制御装置201は、CPU、ROM、RAM等により構成される。記憶装置202は、メモリやディスク等を含む。入力装置203は、キーボードやマウス等を含む。通信インタフェース装置206は、OCR装置1との通信インタフェースに対応した通信処理を行う。
【0027】
入力装置203や表示装置204等は、PC2の外部に接続されてもよい。PC2は、その他の入出力装置が接続されてもよい。PC2は、通信インタフェース装置206を通じてLAN等の通信網に接続されてもよい。PC2は、LAN等に接続されるサーバやストレージに、OCR処理に係わるデータを保存してもよい。
【0028】
制御装置201は、記憶装置202に格納されているプログラム20をロードしてソフトウェア処理を実行することにより、文字認識部12等の各処理部を実現する。プログラム20は、PC2に特有のOCR処理を実行させるプログラムである。制御部201は、文字認識部12、変換部13、比較部14、出力部15、及びユーザインタフェース部16を有する。
【0029】
記憶装置202は、OCR処理に係わる各データとして、画像データ21、認識結果文字データ22、変換結果文字データ23、比較結果データ24、及び出力データ25等を記憶する。
【0030】
PC2は、OCR装置1から転送された帳票5の画像データ21を、通信インタフェース装置206を通じて受信し、記憶装置202内に格納する。
【0031】
文字認識部12は、帳票5の画像データ21を入力し、画像データ21に対して文字認識処理を行い、その結果である認識結果文字データ22を出力する。文字認識部12は、認識結果文字データ22を記憶装置202に格納する。
【0032】
PC2は、後述の位置ずれ補正処理や桁数比較処理を行う機能を備える。PC2は、認識結果文字データ22に基づいて、位置ずれ補正処理や桁数比較処理を行う。
【0033】
変換部13は、記憶装置202の認識結果文字データ22を入力し、認識結果文字データ22に対して、所定の変換処理を行い、その結果である変換結果文字データ23を出力する。変換部13は、変換結果文字データ23を記憶装置202に格納する。
【0034】
比較部14は、記憶装置202の変換結果文字データ23を入力し、変換結果文字データ23に対して、所定の比較処理を行い、その結果である比較結果データ24を出力する。比較部14は、比較結果データ24を記憶装置202に格納する。比較部14は、後述の判定処理を行う。この判定処理は、改ざん等の可能性を判定する処理を含む。
【0035】
出力部15は、記憶装置202の比較結果データ24を入力し、所定の出力処理として、比較結果データ24を含む出力データ25を構成し、出力データ25を記憶装置202に保存する。また、出力部15は、ユーザインタフェース部16及び表示装置204を用いて、出力データ25に対応したOCR処理の結果画面をユーザへ表示する。また、出力部15は、出力データ25に基づいて、OCR処理の結果を、印刷装置205により印刷出力させることもできる。
【0036】
ユーザインタフェース部16は、文字認識システム及びOCRの作業に関するユーザインタフェースとしての画面をユーザに提供する処理を行う。画面は、文字認識システムの設定や作業の指示入力の画面、OCR処理の結果画面、等を含む。ユーザインタフェース部16は、出力データ25に基づいて、Webページ等による画面データを構成し、画面データに基づいて表示装置204に結果画面を表示させる。
【0037】
実施の形態1の文字認識システムは、多数の帳票5を順次に連続的に処理することも可能である。その場合、OCR装置1は、セットされた複数の帳票5を順に読み込んでスキャンし、それぞれの帳票5の画像データ21を得る。OCR装置1は、スキャン済みの帳票5をスタッカへ排出して蓄積する。PC2は、複数の各々の帳票5の画像データについて順次にOCR処理を行い、帳票5毎に比較結果データ24等を得る。
【0038】
PC2は、ある帳票5の処理の結果、その帳票5の記載内容が正常であると判定した場合、例えば二重エントリの2つの金額が一致している場合、その帳票5に関してはアラートを出力せず、その帳票5に関する出力データ25を保存する。その場合、PC2は、複数の帳票5の連続的な処理を停止せずに継続する。
【0039】
ユーザは、正常と判定された帳票5については、そのまま、その帳票5の認識結果文字データ22等のデータを正しいものとして確定してもよい。また、ユーザは、後で、OCR装置1のスタッカに蓄積されている帳票5を取り出して内容を確認することもできる。
【0040】
PC2は、ある帳票5の処理の結果、帳票5の記載内容が異常であると判定した場合、例えば二重エントリの2つの金額が不一致である場合、その帳票5に関して、即時にアラートを含む結果画面を出力する。その場合、PC2は、複数の帳票5の連続的な処理を一時停止させる。ユーザは、アラートの発生時に、PC2の結果画面で、アラートの内容や認識結果文字データ22等を見て、その帳票5について、確認や修正等の対処の作業を行う。また、ユーザは、OCR装置1のスタッカに蓄積されているその帳票5を取り出して確認することもできる。ユーザは、その帳票5に関する対処の作業を済ませると、画面での指示入力により、複数の帳票5の連続的な処理を再開させる。
【0041】
実施の形態1の変形例として、OCR装置1は、PC2からの命令に従い、正常と判定された帳票5を、正常用の第1のスタッカへ振り分けて排出して蓄積し、異常と判定された帳票5を、異常用の第2のスタッカへ振り分けて排出して蓄積するようにしてもよい。
【0042】
実施の形態1の変形例として、PC2は、複数の帳票5の連続的な処理において、ある帳票5を異常と判定した場合に、即時にアラートを含む結果画面を出力するのではなく、そのアラートを含む出力データ25を記憶装置202に保存してもよい。ユーザは、後で、PC2を操作し、記憶装置202からそのアラートを含む出力データ25を読み出して画面に表示する。ユーザは、アラートが出力された1枚以上の帳票5について、確認等の作業をまとめて行うことができる。
【0043】
[帳票の例]
図2の(a)は、帳票の第1の例として、日本の請求書の例を示し、特に、帳票のうちの、金額の記入欄51及び複記欄52を示す。この記入欄51及び複記欄52は、金額の二重エントリのために設けられている。記入欄51は、「項目」及び「合計」の各行において、金額が算用数字で記入されている。複記欄52は、「項目」及び「合計」の各行において、金額が漢数字で記入されている。複記欄52の金額は、記入欄51の金額と同じ金額が、異なる文字の種類で記入されている。数字欄61は、記入欄51のうちの「合計」の行の欄に相当する。数字欄61には、金額の合計が算用数字で記入されている。大字欄62は、複記欄52のうちの「合計」の行の欄に相当する。大字欄62は、金額の合計が漢数字で記入されている。
【0044】
なお、複記欄52が無い形式の帳票の場合もある。その場合、二重エントリの仕方としては、例えば記入欄51に対して上下左右等のいずれかの近い位置に、金額が漢数字で記入される。
【0045】
数字欄61は、例として、金額が「\1,265-」として記入されている。この金額は、詳しくは、「0」〜「9」等の算用数字と、「,」(カンマ)、「\」(円記号)、「-」(ハイフン)等の記号文字とが使用されている。「,」は桁を示すために使用されている。「\」等の文字は、金額の先頭を示すために使用されている。以下、この記号文字を先頭記号ともいう。「-」等の文字は、金額の末尾を示すために使用されている。以下、この記号文字を末尾記号ともいう。なお、先頭記号や末尾記号が使用されない場合もある。
【0046】
大字欄62は、例として、金額が「金壱千弐百陸拾伍円」として記入されている。「\1,265-」と「金壱千弐百陸拾伍円」は、同じ金額である1265円を示す。この金額は、詳しくは、「壱」,「弐」,……,「玖」等の漢数字、「千」等の桁を表す漢字、「金」等の先頭記号、「円」等の末尾記号が使用されている。「円」は通貨記号でもある。
【0047】
上記例のように、金額の明確化や改ざん等の防止のために、漢数字と算用数字とを用いた二重エントリが行われ、先頭記号や末尾記号が使用されている。「壱」等の「大字」は、改ざん等の防止のため、「一」等の単純な漢数字や、「1」等の単純な算用数字の代わりに使用される。先頭記号や末尾記号は、他にも、帳票や業務に応じて、「也」や「※」等、特定の記号文字が使用される。
【0048】
図2の(b)は、帳票5の第2の例として、中国の請求書の例を示し、特に、帳票のうちの、金額の記入欄71及び複記欄72を示す。この記入欄71及び複記欄72は、同様に、金額の二重エントリのために設けられている。記入欄71は、金額が算用数字で記入されている。複記欄72は、金額が漢数字で記入されている。複記欄72の金額は、記入欄71の金額と同じ金額が、異なる文字の種類で記入されている。記入欄71のうち、小写欄81には、金額の合計が算用数字で記入されている。複記欄72のうち、大写欄82には、金額の合計が漢数字で記入されている。なお、中国語の数詞の表現として、「小写」、「大写」がある。「大写」は、日本語の「大字」に相当する。
【0049】
「元」は、金額の末尾記号であり、通貨記号でもある。「整」は、補助単位であり、算用数字の「.」(ピリオド)以下の数字が「00」である場合、「整」が使用される。他の補助単位として、「角」や「分」がある。
【0050】
小写欄81は、例として、金額が「\1265.00」として記入されている。この金額は、詳しくは、「0」〜「9」等の算用数字と、「\」、「.」等の記号とが使用されている。
【0051】
大写欄82は、例として、金額が下記のように記入されている。
【0053】
「\1265.00」と上記金額は同じ金額を示す。この金額は、詳しくは、下記のような漢数字が使用されている。
【0055】
また、この金額は、詳しくは、「仟」等の桁を表す漢字、及び所定の先頭記号や末尾記号が使用されている。先頭記号としては、○と×を組合せて構成される記号や、「\」が使用されている。末尾記号としては、「整」や「.00」が使用されている。
【0056】
図2の(c)の表は、使用文字として数字の例を示す。第1行は算用数字を示す。第2行及び第3行は、日本の場合の漢数字の例を示す。第4行は、中国の場合の漢数字の例を示す。例えば、「零」,「壱」〜「玖」は、それぞれ「0」,「1」〜「9」に対応する文字である。
図2の(a)の日本の帳票では、「大字」として、第1行の「壱」,「弐」等を使用しているが、これに限らず、他の漢数字が使用される場合もある。PC2は、帳票で使用される文字のデータを保持している。
【0057】
[処理及び作業の概要]
図3は、実施の形態1の文字認識システム及び文字認識方法における処理及び作業の概要を示す。S1等はステップを表す。以下、
図3のステップS1〜S5を順に説明する。
【0058】
(S1) ユーザは、PC2を操作し、ユーザインタフェース部16により提供される画面を見ながら、設定や指示入力を行う。ユーザは、帳票5のうちの二重エントリに対応する2つの対象箇所の読み取りの指定を行う。対象箇所は、所定の欄や任意の領域等のフィールドである。また、ユーザは、後述の拡張機能の利用を指定する。また、ユーザは、後述の読み取りモードとして、「誤読低減モード」または「不読低減モード」を指定する。ユーザは、上記指定の上で、OCR処理の実行指示を入力する。
【0059】
なお、拡張機能とは、実施の形態1の文字認識システムが提供する高度な機能に対応する。即ち、拡張機能とは、帳票の二重エントリについて、自動的に、変換、比較、判定及び結果出力等を行う機能に対応する。
【0060】
(S2) PC2は、S1の指示入力に従い、OCR処理の制御を実行する。PC2は、OCR装置1へ命令を送信する。OCR装置1は、命令に従い、
図1の帳票入力部11による処理を実行し、帳票の画像データ21を得て、PC2へ転送する。PC2は、文字認識部12により、帳票の画像データ21に基づいて、その帳票の領域のうち、S1で指定されたフィールドを読み取る文字認識処理を行い、認識結果文字データ22を得る。
【0061】
(S3) PC2は、ユーザによる拡張機能及び読み取りモードの指定がある場合、その指定に対応した処理を行う。PC2は、まずS3で変換処理を行う。
【0062】
変換部13は、S2の認識結果文字データ22に基づいて、帳票の2つのフィールドの文字列について、一方のフィールドの文字列の文字の種類を、他方のフィールドの文字列の文字の種類に合わせるように変換し、変換結果文字データ23を得る。
【0063】
(S4) PC2は、次にS4で比較処理を行う。比較部14は、変換結果文字データ23に基づいて、一方のフィールドの変換後の文字列と、他方のフィールドの非変換の文字列とを比較し、一致及び不一致を判定する。また、比較部14は、比較の際、改ざん等の可能性を判定する。比較部14は、処理の結果、比較結果データ24を得る。
【0064】
(S5) PC2は、次にS5で出力処理を行う。出力部15は、比較結果データ24に基づいて、比較結果データ24を含む出力データ25を構成する。出力部15は、出力データ25を用いて、OCR処理の結果画面をユーザへ表示する。出力部15は、出力データ25を保存する。ユーザは、結果画面を見て、帳票の記載内容の判断や確認、データの修正、確定等の作業を行う。帳票毎に、S1〜S5のような処理が同様に行われる。S1の画面では複数の帳票の連続処理も指定可能である。
【0065】
[読み取りモード]
実施の形態1の文字認識システムは、読み取りモードとして、「誤読低減モード」と「不読低減モード」がある。読み取りモードは、OCR処理に関する制御用のモードである。
【0066】
「誤読低減モード」は、文字認識における誤読を低減させるモードである。誤読とは、帳票の画像から文字を認識して誤った文字へ変換してしまうことを指す。ユーザは、帳票の作業にあたり、誤読の低減を優先して、なるべく誤読を無くしたい場合、誤読低減モードを利用する。
【0067】
実施の形態1の文字認識システムは、誤読低減モードでは、文字認識処理において、画像からどの文字へ変換すべきかが曖昧で確定しにくい場合、誤読の結果を避けるため、積極的な変換はせずに、不読の結果とする。これにより、文字認識システムは、特定のアラート等を含む結果画面を出力し、ユーザによる判断を薦める。不読とは、帳票の画像から文字を認識して1つの文字へ変換できないことを指す。ユーザは、不読の結果の文字について、自分で確認や判断を行う。これにより、誤読の文字への確定が減少する。
【0068】
「不読低減モード」は、文字認識における不読を低減させるモードである。ユーザは、帳票の作業にあたり、不読の低減を優先して、なるべく不読を無くしたい場合、不読低減モードを利用する。
【0069】
実施の形態1の文字認識システムは、不読低減モードでは、文字認識処理において、特有の処理を適用し、不読の結果を避けるため、積極的な推測に基づいた文字変換を行う。これにより、従来の文字認識処理の場合には不読の結果になる文字についても、不読を解消するように文字変換し、不読を解消した文字を含む結果画面を出力する。
【0070】
以下、まず
図4〜
図16を用いて、「誤読低減モード」の場合について説明する。
【0071】
[誤読低減モードの場合の処理フロー]
図4は、PC2における誤読低減モードの場合の処理フローを示す。以下、
図4のステップS101〜S111の処理について、例を挙げながら説明する。
【0072】
(S101) ユーザは、PC2の画面で、帳票の2つの対象箇所のフィールドの読み取り、拡張機能、及び「誤読低減モード」等を指定し、実行指示を入力する。2つのフィールドは、例えば
図2の(a)の記入欄51の領域91及び複記欄52の領域92である。
【0073】
(S102) OCR装置1は、帳票入力部11により、帳票の画像データ21を得る。PC2は、文字認識部12により、帳票の2つのフィールドを含む領域を読み取り、2つの文字列のデータを含む認識結果文字データ22を得る。
【0074】
(S103) PC2は、S102の認識結果文字データ22における2つの文字列において、不読が無いかどうかを確認する。不読が有る場合(S103−N)は、不読が有る旨の結果とし、S111へ移る。この場合、S111では、不読が有る旨の結果画面を表示し、処理を終了する。不読が無い場合(S103−Y)は、S104へ移る。
【0075】
(S104,S105) S104で、PC2は、画像データ21及び認識結果文字データ22に基づいて、2つの文字列について、位置ずれ補正処理を行う。位置ずれ補正処理は、対象箇所である記入欄51や複記欄52の領域に対して、金額等の文字列が、ずれた位置に記入または印字されている場合に対処する処理である。
【0076】
PC2は、帳票の領域の指定のフィールド内に、対象の文字列が有る場合、S104の処理の結果を「空白無し」とする。PC2は、指定のフィールド内に、対象の文字列が無い場合、対象のフィールドの周りを探索する。PC2は、探索の結果、文字列が見つかった場合、S104の処理の結果を「空白無し」とし、その文字列を、認識結果文字データ22に含め、以降の処理で対象とする。PC2は、探索の結果、文字列が見つからなかった場合、当該フィールド内は空白になっているため、S104の結果を「空白有り」とする。
【0077】
PC2は、S104の処理の結果が「空白有り」の場合(S105−N)、「空白有り」の旨の結果とし、S111へ移る。この場合、S111では、「空白有り」の旨の結果画面を表示し、処理を終了する。「空白無し」の場合(S105−Y)は、S106へ移る。
【0078】
(S106,S107) S106で、PC2は、2つの対象箇所のフィールドの文字列について、桁数比較処理を行う。PC2は、この処理では、2つの文字列について、文字の種類に応じて、それぞれの桁数を判定し、両者の桁数を比較し、桁数の一致/不一致を判定する。
【0079】
S107で、PC2は、S106の処理の結果、桁数が不一致の場合(S107−N)、桁数が不一致の旨の結果とし、S111へ移る。この場合、S111では、桁数が不一致の旨の結果画面を表示し、処理を終了する。桁数が一致の場合(S107−Y)は、S108へ移る。
【0080】
(S108) PC2は、変換部13により、2つの対象箇所のフィールドの文字列について、文字の種類に関する変換処理を行う。なお、文字の種類を「文字種」ともいう。本例では、
図2の(a)のように、数字欄61の算用数字による文字列と、大字欄62の漢数字による文字列とがある。変換部13は、2つの文字列の文字種が異なるので、文字種の変換処理を行う。
【0081】
文字種の変換処理は、詳しくは、以下の3つの方式が挙げられる。それらを、説明上、第1の変換、第2の変換、第3の変換と称する。第1の変換とは、漢数字を算用数字へ合わせるように漢数字の文字列を変換することである。第2の変換とは、算用数字を漢数字へ合わせるように算用数字の文字列を変換することである。第3の変換とは、第1の変換と第2の変換との両方を行うことである。ユーザは、PC2の画面で、第1の変換等のいずれを利用するかを指定可能である。
【0082】
(S109) PC2は、比較部14により、変換結果文字データ23における、同じ文字種となった2つの文字列について、比較処理を行い、一致/不一致等を判定する。
【0083】
(S110) また、PC2は、比較部14により、変換結果文字データ23における、2つの文字列について、改ざん等の可能性を判定する処理を行う。比較部14は、S109及びS110の処理の結果を、比較結果データ24として出力する。
【0084】
(S111) PC2は、出力部15により、S102〜S110の処理の結果に応じた出力データ25を構成し、保存する。出力部15は、出力データ25に基づいた結果画面をユーザに表示する。ユーザは、結果画面で、帳票のデータの内容を確認する。ユーザは、特に、二重エントリの2つの金額について、一致/不一致やアラームの内容を確認する。
【0085】
[読み取り指定の画面例]
図5は、
図4のS101に対応した、読み取り指定の際の画面例を示す。この画面は、2つの対象箇所に対応して、右側に示す「第1フィールド」欄と、左側に示す「第2フィールド」欄とがある。ユーザは、本画面で、例えば
図2の(a)の帳票の数字欄61及び大字欄62の金額を読み取るために、2つの領域91,92や文字種を指定する。本例では、「第1フィールド」欄では、数字欄61の領域91が対象箇所として設定される。「第2フィールド」欄では、大字欄62の領域92が対象箇所として設定される。
【0086】
「第1フィールド」欄及び「第2フィールド」欄において、それぞれ、項目として、「文字タイプ」、「文字種」、「文字数」、「読み取り位置(座標)」、「拡張機能」、「読み取りモード」がある。各項目は、テキスト入力の形式でもよいし、リストボックスの選択肢から選択する形式、等でもよい。
【0087】
「文字タイプ」項目は、フィールドの文字列の文字タイプが指定される。文字タイプは、全角、半角、等がある。本例では、「第1フィールド」では「半角」、「第2フィールド」では「全角」が指定されている。「文字種」項目は、フィールドの文字列の文字種が指定される。文字種は、漢数字、算用数字、等がある。本例では、「第1フィールド」では「算用数字」、「第2フィールド」では「漢数字」が指定されている。「文字数」項目は、フィールドの文字列の最大文字数が指定される。本例では、「第1フィールド」では「10」、「第2フィールド」では「18」が指定されている。
【0088】
「読み取り位置(座標)」項目は、読み取りの対象のフィールドの位置が座標で指定される。この項目は、例えば矩形の領域を規定する2点の座標の指定のために、「水平スタート」、「水平エンド」、「垂直スタート」、「垂直エンド」の4つの項目を含む。本例では、「第1フィールド」の場合、対象の領域91の左上の点の座標が(1000,500)であり、右下の点の座標が(1400,550)である。
【0089】
図2の(a)の例で、破線枠で示す領域91,92は、読み取り指定されたフィールドの例を示す。なお、この領域91,92は、数字欄61及び大字欄62の中の一部を除いた領域とした例である。一部とは、「(大字)」,「(数字)」の記載箇所である。これに限らず、フィールドとして帳票内の任意の領域が指定可能である。
図2の(b)の例のように、フィールドとして小写欄81や大写欄82と同じ領域も指定可能である。また、その場合、PC2は、フィールドの中に含まれる「(小写)」等の所定の文字を、対象外として処理してもよい。
【0090】
「拡張機能」項目は、拡張機能を利用する場合に指定可能である。本例では、「第1フィールド」の「拡張機能」項目の値として「金額(変換しない)」が選択された場合を示す。この値は、第1フィールドが二重エントリの金額の記入欄であること、及びその記入欄の文字列の文字種を変換せずに、第2フィールドの文字列と比較すること、等を指定する値である。また、「第2フィールド」の「拡張機能」項目の値として「金額(変換する)」が選択された場合を示す。この値は、第2フィールドが二重エントリの金額の複記欄であること、及び複記欄の文字列の文字種を変換して、第1フィールドの文字列と比較すること、等を指定する値である。
【0091】
「読み取りモード」項目は、読み取りモードとして、誤読低減モードと不読低減モードとから選択して指定可能である。本例では、「第1フィールド」及び「第2フィールド」で、誤読低減モードが指定されている。
【0092】
ユーザは、上記画面で、2つのフィールドの各項目の値を指定した後、OKボタンにより設定する。PC2は、この設定情報に従い、OCR処理を行う。PC2は、「文字種」項目及び「拡張機能」項目での指定に応じて、文字種の変換及び比較等の処理を行う。上記「文字種」及び「拡張機能」項目の設定例は、第1の変換に対応した設定例である。なお、第2の変換の場合、「第1フィールド」の「拡張機能」項目で「金額(変換する)」、「第2フィールド」の「拡張機能」項目で「金額(変換しない)」と指定される。第3の変換の場合、両方の「拡張機能」項目で「金額(変換する)」と指定される。
【0093】
また、「第1フィールド」及び「第2フィールド」の文字列の「文字種」項目の値が同じであり、両方の「拡張機能」項目で「金額(変換しない)」が指定された場合、PC2は、文字種を変換する必要が無いので変換せずに、両者の金額を比較する。「拡張機能」項目で何も指定されない場合、PC2は、2つの文字列の変換や比較を行わず、別々に文字認識を行う。
【0094】
なお、変形例として、「文字タイプ」と「文字種」が1つの項目に統合された構成でもよい。
【0095】
[文字認識の例]
図6は、
図2の(a)の帳票の例、及び
図4のS102に対応した、帳票の2つの対象箇所のフィールドについての文字認識の例を示す。文字認識部12は、指定されたフィールド内の文字列を読み取る。
【0096】
図6の(a)は、第1フィールド及び第2フィールドのいずれの文字認識結果においても不読が無い場合を示す。右側は、第1フィールドの算用数字の文字列のデータを示す。この文字列のデータは、
図2の(a)の数字欄61に記入された文字列と同じである正しい文字列「\1,265-」である。先頭記号が「\」、末尾記号が「-」である。左側は、第2フィールドの漢数字の文字列のデータを示す。この文字列のデータは、
図2の(a)の大字欄62に記入された文字列と同じである正しい文字列「金壱千弐百陸拾伍円」である。先頭記号が「金」、末尾記号が「円」である。
【0097】
図6の(b)は、第1フィールドの文字列の文字認識結果に不読が有る場合を示す。第1フィールドの算用数字において、文字「5」が不読となっている。
図6の(c)は、第2フィールドの文字列の文字認識結果に不読が有る場合を示す。不読の箇所を記号「?」で示す。第2フィールドの漢数字において、文字「弐」が不読となっている。
図6の(d)は、第1フィールド及び第2フィールドの両方の文字列の文字認識結果に不読が有る場合を示す。第2フィールドの漢数字の文字「弐」、及び第1フィールドの算用数字の文字「5」が不読となっている。
【0098】
PC2は、文字認識の結果、
図6の(b)〜(d)のように、2つのフィールドの一方または両方に、不読の文字が有る場合、不読が有る旨の結果とし、対応するアラートを含む結果画面をユーザに表示する。
【0099】
[位置ずれ補正処理]
図7は、
図4のS104に対応した、位置ずれ補正処理の例を示す。指定のフィールドに対応した画像において空白である場合、ずれた位置に文字が記入または印字されている可能性がある。そこで、PC2は、位置ずれ補正処理として、指定のフィールドの外側を探索し、文字列が見つかった場合、その文字列を文字認識の結果に含めるように補正する。
【0100】
図7の(a)は、
図2の(a)の帳票の例に対応し、大字欄62の領域に対して、上側にずれた位置に、701に示すように、金額の漢数字が印字されており、これにより大字欄62が空白になっている。なお、ここでは大字欄62が第2フィールドである。
【0101】
図7の(b)は、
図7の(a)の場合の位置ずれ補正処理として、大字欄62の領域に対して、上下左右に範囲を拡げて、文字列を探索する例である。702は、探索の範囲を示す。HXは、水平方向に拡げる幅の設定値を示す。HYは、垂直方向に拡げる幅の設定値を示す。
【0102】
PC2は、702の範囲で、所定の文字記号を目標にしながら、文字列を探索する。この目標の文字記号は、前述の「金」等の先頭記号や、「円」等の末尾記号が挙げられる。上記範囲の設定値は、任意に設定可能である。PC2は、範囲を拡げても文字列が見つからない場合、「空白有り」の旨の結果とし、対応するアラートを含む結果画面をユーザに表示する。
【0103】
図7の(c)は、位置ずれ補正処理等の際に用いる、特定の記号文字の表703を示す。この表703は、先頭記号、末尾記号、その他の記号について、日本や中国毎に、一覧で登録されている。なお、ここでは、末尾記号として、「円」や「元」等の通貨記号を含めている。
【0104】
[桁数比較処理]
図8は、
図4のS106に対応した、桁数比較処理の例を示す。
【0105】
図8の(a)は、
図2の(a)に対応した、第1フィールドの算用数字の文字認識結果の文字列のデータと、第2フィールドの漢数字の文字認識結果の文字列のデータとを示す。PC2は、2つの文字列において、先頭記号、末尾記号、桁漢字、カンマ等の文字記号に基づいて、それぞれの桁数を判定し、両者を比較する。PC2は、第1フィールドの文字列のうち、先頭記号「\」と末尾記号「-」との間にある、算用数字及びカンマの部分である「1,265」をみることにより、算用数字の桁数が4とわかる。また、PC2は、第2フィールドの文字列のうち、先頭記号「金」と末尾記号「円」との間にある、桁漢字等をみることにより、漢数字の桁数が4とわかる。桁漢字は、「千」,「百」,「拾」等である。本例では、2つのフィールドの文字列の桁数が一致している。
【0106】
図8の(b)は、桁数比較処理に用いる表を示す。表801は、日本及び中国のそれぞれについて、桁漢字ごとの桁数を格納している。例えば桁漢字が「千」である場合、桁数が4であり、桁漢字が「拾万」である場合、桁数が8である。
【0107】
図8の(c)は、中国の場合の桁数比較処理の例を示す。PC2は、第1フィールドの算用数字の文字列における最終の部分である、ピリオド後の数字を参照する。ピリオド後の数字が例えば「00」である。また、PC2は、第2フィールドの漢数字の文字列における最終の部分である、末尾記号を参照する。ここでは、末尾記号として、漢字「元」、及び「元」以後の漢字「整」がある。PC2は、
図8の(b)の表802を参照する。
【0108】
表802は、
図8の(c)の中国の場合の桁数比較処理に用いる表を示す。この表802は、第1行の「末尾漢字」と、第2行の「ピリオド後の数字」とが関係付けられている。例えば末尾漢字「整」と、ピリオド後の数字「00」とが対応する。同様に、末尾漢字「角」と、ピリオド後の数字「10」〜「90」とが対応する。末尾漢字「分」と、ピリオド後の数字「01」〜「09」とが対応する。
【0109】
PC2は、上記桁数比較処理の結果、2つの文字列の桁数が一致しない場合、桁数が不一致の旨の結果とし、対応するアラームを含む結果画面をユーザに表示する。なお、ユーザは、設定画面で、位置ずれ補正処理や桁数比較処理の実行有無を設定可能である。
【0110】
[変換処理例(1)]
図9の(a)は、
図4のS108の第1の変換の場合に対応した、文字種の変換処理の例を示す。変換部13は、比較対象である2つのフィールドの文字列について、
図10の変換表に従い、文字種の変換処理を行う。第1の変換の場合、第1フィールドの算用数字は、変換の非対象であり、第2フィールドの漢数字は、変換の対象である。変換部13は、第2フィールドの文字列の文字種である漢数字を、第1フィールドの文字列の文字種である算用数字に合わせるように、第2フィールドの文字列を変換する。
【0111】
図10は、文字種の変換処理に用いる変換表の構成例を示す。
【0112】
図10の(a)は、日本の場合の変換表151の一部を示す。この変換表151は、第1列の「漢数字」、第2列の「算用数字」、及び第3列の「桁数」の関係付け情報が設定されている。この変換表151に従い、例えば、「零円」は「0」に、「壱円」は「1」に、「壱拾」は「10」に変換される。
【0113】
図10の(b)は、同様に、中国の場合の変換表152の一部を示す。この変換表152は、更に、「元」以後の「整」等の文字、ピリオド以後の数字、及び桁数の関係付け情報が設定されている。この変換表152に従い、例えば、以下のように変換される。
【0115】
図9の(a)の第2フィールドの文字列は、
図10の(a)の変換表151に従い、「壱千」が「1,000」に、「弐百」が「200」に、「陸拾」が「60」に、「伍円」が「5」に変換される。変換部13は、各文字の変換後の数字を加算する。即ち、変換後の文字列の算用数字は、1,000+200+60+5=1,265となる。
【0116】
なお、
図10の変換表は、第1の変換、第2の変換のいずれでも使用できる。第1の変換の場合、変換表において、第1列が変換前の文字、第2列が変換後の文字として参照される。第2の変換の場合、変換表において、第2列が変換前の文字、第1列が変換後の文字として参照される。
【0117】
[変換処理例(2)]
図9の(b)は、
図4のS108の第2の変換の場合に対応した、文字種の変換処理の例を示す。変換部13は、比較対象の2つのフィールドの文字列について、
図10の変換表に従い、文字種の変換処理を行う。第2の変換の場合、第1フィールドの算用数字は、変換の対象であり、第2フィールドの漢数字は、変換の非対象である。変換部13は、第1フィールドの文字列の文字種である算用数字を、第2フィールドの文字列の文字種である漢数字に合わせるように、第1フィールドの文字列を変換する。
【0118】
変換部13は、第2の変換の場合、
図10の(a)の変換表151を用いて、算用数字の個々の数字ごとに、漢数字へ変換する。
図9の(b)の第1フィールドの文字列は、
図10の(a)の変換表151に従い、「1」が「壱千」に、「2」が「弐百」に、「6」が「陸拾」に、「5」が「伍」に変換される。変換部13は、各数字の変換後の漢字ごとに、第2フィールドの文字列のうちの対応する位置の非変換の漢字と比較し、一致/不一致を判定する。各変換後の文字が全て一致する場合、総合的な比較結果として一致となり、変換後の文字が1つでも不一致の場合、総合的な比較結果として不一致となる。変換部13は、各変換後の文字を接続して1つの文字列にする。変換後の文字列である漢数字は、「壱千」+「弐百」+「陸拾」+「伍」=「壱千弐百陸拾伍」となる。
【0119】
[変換及び比較処理(1)]
図11は、
図4のS108の第1の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。変換部13は、第2フィールドの文字列の漢数字を算用数字に変換する。比較部14は、第2フィールドの変換後の文字列である算用数字と、第1フィールドの非変換の文字列である算用数字とを全体で比較し、一致/不一致を判定する。以下、
図11のステップS201〜S209の処理について説明する。
【0120】
(S201) 変換部13は、第2フィールドの文字列の開始文字から順に終了文字まで調べて、「数漢字」及び「桁漢字」の文字を探す。
図9の(a)の例では、左端から順に文字が検出され、開始文字が先頭記号「金」であり、終了文字が末尾記号「円」である。また、「数漢字」とは、「壱」等であり、「桁漢字」とは、「千」等である。
【0121】
(S202) 変換部13は、S201で得た数漢字及び桁漢字の文字について、
図10の(a)の変換表151を用いて、算用数字へ変換する。なお、中国の場合、
図10の(b)の変換表152を用いて同様に処理が行われる。
【0122】
(S203) 変換部13は、S202の変換結果の算用数字を加算する。
【0123】
(S204) 変換部13は、第2フィールドの文字列のうち、対象の文字の桁数が0になるまで、S201〜S203の処理を繰り返す。桁数が0の場合(S205−Y)は、S205へ移る。桁数が0とは、末尾記号「円」等に到達した場合である。
【0124】
(S205) 変換部13は、S204までの第2フィールドの変換結果の数字と、第1フィールドの算用数字とを全体で比較して、一致/不一致等を判定する比較処理を行い、その結果を比較結果データ24として保存する。
【0125】
(S206) 変換部13は、対象が日本の帳票である場合(S206−N)、処理を終了し、対象が中国の帳票である場合(S206−Y)、S207へ移る。
【0126】
(S207,S208) 変換部13は、中国の帳票における第2フィールドの文字列において、「元」以降の文字を探し、同様に、算用数字への変換や加算を行う。変換部13は、数漢字や、「角」等の桁漢字について、
図10の(b)の変換表152を用いて、算用数字へ変換し、変換結果の算用数字を加算する。変換部13は、文字列の最終文字になるまで(S208−N)、同様に処理を繰り返し、最終文字になると(S208−Y)、S209へ移る。
【0127】
(S209) 変換部13は、S207,S208の処理の結果である「元」以降の文字列の変換結果の算用数字について、第1フィールドの文字列のピリオド以降の算用数字との比較処理を行い、その結果を比較結果データ24へ反映して保存する。
【0128】
[変換及び比較処理(2)]
図12は、
図4のS108の第2の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。変換部13は、第1フィールドの文字列の算用数字を漢数字に変換する。比較部14は、第1フィールドの変換後の文字列である漢数字と、第2フィールドの非変換の文字列である漢数字との比較処理として、各桁の文字毎に比較して、一致/不一致を判定する。以下、
図12のステップS301〜S311の処理について説明する。
【0129】
(S301) 変換部13は、第1フィールドの文字列の開始文字から順に終了文字までを調べ、個々の文字である[数字]に着目する。変換部13は、その着目する[数字]毎に、([桁数]−n)を計算する。[桁数]は、第1フィールドの文字列の桁数を示す。変換部13は、前述の桁数比較処理による[桁数]を得る。nは、繰り返し処理の回数を示し、最初はn=0である。
図9の(b)の例では、変換部13は、左端から順に、まず先頭記号「\」の次の数字「1」を得る。文字列「1265」の[桁数]は4である。n=0である。よって、([桁数]−n)=(4−0)=4である。
【0130】
(S302) 変換部13は、S301の[数字]、及び([桁数]−n)の計算値に基づいて、
図10の(a)の変換表151を用いて、数字を漢数字へ変換する。変換部13は、([桁数]−n)の計算値により、変換表151の「桁数」列の値を参照する。例えば計算値=4の場合、「桁数」列の値が4である第4行が該当する。この第4行の情報において、[数字]=「1」から、対応する算用数字が「1000」、漢数字が「壱千」とわかる。よって、変換部13は、着目の[数字]=「1」について、漢数字「壱千」へ変換する。
【0131】
(S303〜S305) S303で、変換部13は、S302の第1フィールドの変換結果の漢数字である部分文字と、第2フィールドの漢数字における対応する位置の部分文字とを比較する。変換部13は、比較の結果、一致する場合(S304−Y)、S305へ移り、一致しない場合(S304−N)、文字列単位での比較結果を不一致と判定し、S311へ移る。S305で、変換部13は、n回繰り返しのためにnを1増加し、その結果、着目の[数字]について桁数が0になる場合(S305−Y)、S306へ移り、桁数が0ではない場合(S305−Y)、S301へ戻って同様に繰り返す。
【0132】
なお、次のn=1の場合、S301では、([桁数]−n)=(4−1)=3である。この値=3により、変換表151の「桁数」列の値が3である第3行が参照される。第3行において、[数字]=「2」から、対応する算用数字が「200」、漢数字が「弐百」とわかる。
【0133】
(S306) 変換部13は、対象が中国の場合(S306−Y)、S307〜S310の処理を行い、対象が日本の場合(S306−N)、S311へ移る。
【0134】
(S307) 変換部13は、中国の帳票の文字列における、ピリオド以降の数字を探す。変換部13は、ピリオド以降の数字について、同様に、
図10の(b)の変換表152に従い、漢数字へ変換する。
【0135】
(S308〜S310) 変換部13は、S307の変換結果の漢数字の部分文字と、第2フィールドの漢数字の部分文字とを比較し、一致/不一致を判定する。変換部13は、比較の結果、一致する場合(S309−Y)、S310へ移り、一致しない場合(S309−N)、文字列単位での比較結果を不一致と判定し、S311へ移る。S310では、文字列の最終文字である場合(S310−Y)、S311へ移り、最終文字でない場合(S310−N)、S307へ戻り、同様に繰り返す。
【0136】
(S311) 変換部13は、2つの文字列の一致または不一致の結果に応じた比較結果データ24を保存し、処理を終了する。
【0137】
[比較処理例]
図13は、
図4のS109に対応した、文字列の比較処理の例を示す。
【0138】
図13の(a)は、
図11に対応した第1の変換の場合の比較処理と、
図12に対応した第2の変換の場合の比較処理との概要を示す。なお、説明上、第1の変換に対応して、第2フィールドの変換後の文字列の算用数字と、第1フィールドの非変換の文字列の算用数字との比較を、第1の比較と称する。第2の変換に対応して、第1フィールドの変換後の文字列の漢数字と、第2フィールドの非変換の文字列の漢数字との比較を、第2の比較と称する。
【0139】
図13の(b)は、第1の比較の例として、不一致の場合を示す。第2フィールドの変換後の文字列の算用数字と、第1フィールドの非変換の文字列の算用数字とが不一致である。第2フィールドの変換後の文字列の算用数字は、正しい数字「1,265」である。第1フィールドの非変換の文字列の算用数字は、正しくない数字「7,265」となっている。即ち、「1」と「7」の部分で不一致である。正しくない数字になっている原因としては、記入誤り、改ざん、文字認識での誤読、等が挙げられる。記入誤りの場合、記入者は、「1」を誤って「7」と記入している。改ざんの場合、改ざん者は、記入済みの「1」を意図的に「7」に読めるように加工している。誤読の場合、PC2は、文字認識処理の際、画像から「1」を「7」として推定して文字変換している。
【0140】
図13の(c)は、第2の比較の例として、不一致の例を示す。第1フィールドの変換後の文字列の漢数字と、第2フィールドの非変換の文字列の漢数字とが不一致である。第1フィールドの変換後の文字列の漢数字は、正しい「壱千弐百陸拾伍」である。第2フィールドの非変換の文字列の漢数字は、正しくない「七千弐百陸拾伍」となっている。即ち、「壱千」と「七千」の部分で不一致である。正しくない漢数字になっている原因としては、同様に、記入誤り、改ざん、文字認識での誤読、等が挙げられる。
【0141】
なお、第3の変換が指定されている場合、第1の変換及び第1の比較と、第2の変換及び第2の比較との両方が行われる。PC2は、両方の結果をユーザへ出力する。ユーザは、画面で両方の結果を見て、判断や確認ができる。この場合、二重のチェックになるため、精度を更に高めることができる。
【0142】
[改ざん可能性判定処理]
図14は、
図4のS110に対応した、比較部14による改ざん可能性判定処理の例を示す。
【0143】
図14の(a)は、第1の変換及び第1の比較の場合の改ざん可能性判定処理の例を示す。比較部14は、
図13のような2つの文字列の比較処理の結果、不一致である場合、改ざん等の可能性を判定する。比較部14は、
図14の(b)の改ざん可能性判定用の判定表140を参照して、改ざん等の可能性を判定する。
【0144】
本例では、第2フィールドの文字列は正しい漢数字であり、第1の変換の結果の文字列は正しい算用数字「1,265」である。また、第1フィールドの文字列の算用数字については、文字認識結果の文字列において、正しくない算用数字「7,265」になっている。よって、両者の文字列についての第1の比較の結果が不一致となっている。
【0145】
図14の(b)は、改ざん可能性判定用の判定表140を示す。この判定表140は、列として、「漢数字(日本)」、「漢数字(中国)」、「算用数字」、「改ざん候補算用数字」がある。この表は、改ざん等の可能性が有り得る組合せ、または可能性が高い組合せが、各行に設定されている。「漢数字(日本)」列は、日本の場合の漢数字の文字が一覧で格納されている。同様に、「漢数字(中国)」列は、中国の場合の漢数字の文字が一覧で格納されている。「算用数字」列は、「漢数字」の値に対応付けられる算用数字の文字が格納されている。「改ざん候補算用数字」列は、当該行の漢数字と算用数字との組に関して、改ざん等の候補として考えられる算用数字が格納されている。
【0146】
例えば第1行は、「壱」と「1」の組に関して、改ざん候補算用数字として、「4」,「7」,「9」が設定されている。これは、例えば改ざん者が「1」を他の数字へ改ざんする場合に、「4」,「7」,「9」へ変える可能性が高いことを考慮して設定されている。
【0147】
図14の(c)は、実際の改ざんの例を示す。左側から、「1」を「4」へ変える例、「1」を「7」へ変える例、「2」を「3」へ変える例を示す。このように、線の追加あるいは消去により、数字が改ざんされる可能性がある。また、意図的な改ざん以外にも、ごみの付着等を含め、誤って線が追加あるいは消去されてしまう場合も有り得る。また、判読しにくく曖昧な形の文字が記入されている場合、文字認識結果で誤読や不読になる可能性が高くなる。
【0148】
比較部14は、
図14の(a)の第1の比較の結果が不一致である場合、不一致の部分である「1」及び「7」と、「1」の変換前の文字である「壱」とを把握する。そして、比較部14は、「壱」と「1」と「7」の組合せに基づいて、判定表140を参照し、その組合せに該当する行がある場合は検出する。本例では、第1行の「改ざん候補算用数字」の値の中に「7」があるので、第1行がその組合せに該当する。よって、比較部14は、
図14の(a)の比較結果について、改ざん可能性が高いと判定する。逆に、比較部14は、比較結果について、判定表140の中に該当する行が無い場合、改ざん可能性が低いと判定する。
【0149】
[結果画面の出力例]
図15及び
図16は、
図4のS111に対応した、出力部15による結果画面の出力例を示す。
図2の(a)の帳票の例を用いて説明する。出力部15は、
図4の不読が有る等の判定結果ごとに、異なる表示内容の結果画面を出力する。
【0150】
図15の(a)は、2つのフィールドの文字列の比較結果が一致の場合の出力例を示す。第1の変換及び第1の比較の結果、両者の文字列は一致している。出力部15は、画面に、2つのフィールドの文字認識結果の文字列をそのまま表示すると共に、比較結果情報として「金額が一致しています。」といったメッセージを表示する。また、出力部15は、画面に、第2フィールドの文字種の変換後の文字列を表示してもよい。画面に例えば「変換後の金額:1,265」といった情報が表示される。
【0151】
上記一致の結果の場合、出力部15は、正常と判定し、アラートを出力しない。また、出力部15は、画面で、フィールド及びその金額の文字列等の情報を、白黒や青等、目立たない色で表示する。また、この場合、出力部15は、画面を表示させずに、対応する出力データ25を保存するのみとしてもよい。
【0152】
また、出力部15は、画面内に、OKボタンや修正ボタンを設ける。ユーザは、画面で、ある帳票に関するOCR処理の結果を見て、確認した場合は、OKボタンにより、終了ができる。また、ユーザは、画面で結果を見て、データの修正等の作業を行う場合、修正ボタンにより、その帳票のデータに関する修正用の画面へ遷移できる。
【0153】
図15の(b)は、2つのフィールドの文字列の一方または両方に、文字認識結果として不読がある場合の出力例を示す。本例では、第1フィールドの算用数字に不読がある。出力部15は、画面に、文字認識結果の文字列を表示する際、不読の箇所を例えば記号「?」で表示する。
【0154】
この結果の場合、出力部15は、第1のアラートを出力する。第1のアラートは、軽いレベルのアラートであり、ユーザへの注意喚起に相当する。出力部15は、第1のアラートとして、画面に、「不読の箇所「?」があります。」といったメッセージを表示する。また、出力部15は、第1のアラートとして、画面で、不読を含むフィールド、または2つのフィールドを、黄色等で表示する。これにより、
図15の(a)のようなアラート無しの場合よりも目立つようにする。
【0155】
図15の(c)は、2つのフィールドの文字列の一方または両方において空白有りの場合の出力例を示す。本例では、第2フィールドが空白である。出力部15は、文字認識及び位置ずれ補正処理の結果、空白有りの場合、この画面で、フィールドのデータを空白として表示する。
【0156】
この結果の場合、出力部15は、例えば第1のアラートを出力する。出力部15は、画面に、「空白があります。」といったメッセージを表示する。また、出力部15は、画面で、空白を含むフィールド、または2つのフィールドを、黄色等で表示する。
【0157】
図15の(d)は、2つのフィールドの文字列において桁数が不一致の場合の出力例を示す。本例では、第1フィールドの算用数字が「265」であり、その桁数が3である。第2フィールドの漢数字は桁数が4である。よって、両者の桁数が不一致になっている。
【0158】
この結果の場合、出力部15は、例えば第1のアラートを出力する。出力部15は、画面に、「桁数が一致しません。」といったメッセージを表示する。出力部15は、画面で、2つのフィールドを、黄色等で表示する。出力部15は、画面に、変換後の文字列の金額や、各文字列の桁数を表示してもよい。
【0159】
図16の(a)は、2つのフィールドの文字列の比較結果が不一致であり、かつ、改ざん可能性判定処理の結果、改ざん可能性が低いと判定された場合の出力例を示す。本例では、第1フィールドの文字列は正しい算用数字「1,265」であり、第2フィールドの文字列は誤った漢数字「壱千陸百陸拾伍」である。また、変換後の金額が「1,665」であり、両者の金額が不一致である。不一致の部分の組合せは、「陸」,「6」,「2」である。
図14の改ざん可能性判定処理で、判定表140には、「陸」,「6」,「2」の組合せに該当する行が無いので、改ざん可能性が低いと判定される。
【0160】
この結果の場合、出力部15は、例えば第1のアラートを出力する。出力部15は、画面に、比較結果情報として「金額が一致していません。」といったメッセージ、及び変換後の文字列の金額、等を表示する。出力部15は、画面で、2つのフィールドを、黄色等で表示する。また、出力部15は、フィールドの文字列のうち、不一致の箇所の文字を、わかりやすいように、異なる色やマーク等で目立つように表示してもよい。
【0161】
図16の(b)は、2つのフィールドの文字列の比較結果が不一致であり、かつ、改ざん可能性判定処理の結果、改ざん可能性が高いと判定された場合の出力例を示す。本例では、第1フィールドの文字列は誤った算用数字「7,265」であり、第2フィールドの文字列は正しい漢数字「壱千弐百陸拾伍」である。また、変換後の金額が「1,265」であり、両者の金額が不一致である。不一致の部分の組合せは、「壱」,「1」,「7」である。
図14の改ざん可能性判定処理で、判定表140には、「壱」,「1」,「7」の組合せに該当する行が有るので、改ざん可能性が高いと判定される。
【0162】
この結果の場合、出力部15は、第2のアラートを出力する。第2のアラートは、第1のアラートよりも強いレベルのアラートであり、ユーザへの警告に相当する。出力部15は、第2のアラートとして、画面で、2つのフィールドを、赤色等、目立つ色で表示する。また、出力部15は、画面に、比較結果情報として「金額が一致していません。」、「改ざんの可能性があります。」等のメッセージ、及び変換後の文字列の金額等を表示する。ユーザは、第2のアラートから、改ざん可能性を考慮して確認や判断ができる。
【0163】
また、出力部15は、画面に、2つのフィールドの文字列の金額の金額差を表示してもよい。例えば、比較部14は、金額差を計算する。第1フィールドの金額が「7265」、第2フィールドの金額が「1265」である場合、金額差は、7265−1265=6000である。出力部15は、画面に、「金額差=6000」のような情報を表示する。
【0164】
更に、比較部14は、上記金額差を、閾値と比較し、金額差が閾値以上に大きい場合に、上記第2のアラートを出力するようにしてもよいし、あるいは、第2のアラートよりも更に強いレベルのアラートを出力するようにしてもよい。ユーザは、金額差を考慮して確認や判断ができる。
【0165】
上記のように、PC2は、比較結果が不一致である原因を推定し、比較結果や原因の推定に応じたアラートを含む結果画面をユーザに出力し、ユーザの判断を支援する。ユーザは、結果画面で、日本や中国の帳票における二重エントリの2つの金額等の文字列について、文字認識結果の文字列データ、比較や判定の結果、及びアラートの内容を見て確認することができる。よって、ユーザは、確認や判断がしやすく、効率的に作業ができる。なお、実施の形態1では、アラートについて、第1及び第2のアラートのように大別して2種類としたが、これに限らず可能である。
【0166】
[不読低減モードの場合]
次に、
図17〜
図21を用いて、「不読低減モード」の場合について説明する。不読低減モードの場合の処理は、誤読低減モードの場合の処理に対して、主に異なる点として、以下が挙げられる。
【0167】
PC2は、2つのフィールドの文字列についての第1の文字認識の結果において、不読が有る場合、不読が有る場合に対応した特有の処理を行う。この特有の処理は、第2の文字認識の処理、改ざん可能性判定を含む比較処理を含む。なお、説明上、文字認識部12による文字認識処理を、二段階の処理に分け、第1の文字認識、第2の文字認識とする。第1の文字認識の処理は、従来の処理と同様であり、一旦、不読の有無を含む結果を出す。第2の文字認識の処理は、新たな処理であり、第1の文字認識の結果の不読の文字について、不読を解消するための文字変換を行う。
【0168】
[不読低減モードの場合の処理フロー]
図17は、PC2における不読低減モードの場合の処理フローを示す。以下、
図17のステップS401〜S409の処理について、例を挙げながら説明する。
【0169】
(S401) ユーザは、PC2の画面で、帳票の二重エントリの2つの対象箇所のフィールドの読み取り、拡張機能、及び「不読低減モード」等を指定し、実行指示を入力する。
【0170】
(S402〜S404) S402〜S404の処理は、
図4のS102,S104,S106の処理と基本的に同様である。S402では、文字認識部12による第1の文字認識の処理により、認識結果文字データ22を得る。この際、文字認識結果として「不読」が発生する場合がある。「不読低減モード」では、PC2は、文字認識結果に「不読」の文字が有る場合でも、終了せずに、次のS403以降の処理を行う。S403では位置ずれ補正処理が行われ、S404では桁数比較処理が行われる。
【0171】
(S405) S405で、PC2は、不読の有無を確認する。不読が無い場合(S405−Y)は、S406へ移り、不読が有る場合(S405−N)は、S407へ移る。
【0172】
(S406) 比較部14は、一方のフィールドの文字列と、他方のフィールドの文字列とについて、不読が無い場合に対応した変換及び比較処理を行う。この変換及び比較処理は、
図4のS108やS109と同様である。
【0173】
(S407) 比較部14は、一方のフィールドの文字列と、他方のフィールドの文字列とについて、不読が有る場合に対応した変換及び比較処理を行う。変換部13は、変換処理では、S402の文字認識結果の文字列における「不読」以外の文字について、
図10の変換表に従い、文字種を変換する。
【0174】
(S408) S406またはS407の後、比較部14は、変換結果文字データ23における2つの文字列について、改ざん等の可能性を判定する処理を行う。比較部14は、処理の結果を比較結果データ24として出力する。
【0175】
(S409) 出力部15は、比較結果データ24に基づいて、出力データ25を構成し、出力データ25を保存し、結果画面をユーザに表示する。
【0176】
[変換及び比較処理(3)]
図18は、
図17のS407、及び第1の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。以下、
図18のステップS501〜S508の処理を説明する。
【0177】
(S501) 変換部13は、変換対象の第2フィールドの文字列の開始文字から順に調べ、数漢字及び桁漢字の文字を探す。
【0178】
(S502) 対象の文字列について、文字認識結果で不読が無い場合(S502−Y)は、S503へ移り、不読が有る場合(S502−N)は、S504へ移る。
【0179】
(S503) 変換部13は、不読が無い場合に対応した文字種の変換処理を
図4のS108と同様に行う。第1の変換の場合、
図10の変換表を用いて、漢数字が算用数字へ変換される。
【0180】
(S504,S505) 変換部13は、不読が有る場合に対応した処理を行う。この処理については後述する。この処理の結果、不読の文字について、第2の文字認識による文字変換が可能であり当該文字変換がされた場合(S505−Y)、S506へ移り、不可能であり当該文字変換がされていない場合(S505−N)、処理を終了する。
【0181】
(S506) S503またはS505の後、変換部13は、変換結果の算用数字を加算する。
【0182】
(S507) 変換部13は、第2フィールドの文字列のうち、対象の文字が、最終文字になるまで、S501〜S506の処理を繰り返す。対象の文字が最終文字になると(S507−Y)、S508へ移る。なお、対象が中国の帳票の場合、「元」以降の文字について、最終文字になるまで、同様に処理が行われる。
【0183】
(S508) 変換部13は、S507までの第2フィールドの変換結果の数字と、第1フィールドの算用数字とを比較し、一致/不一致を判定し、その結果を比較結果データ24として保存する。
【0184】
[変換及び比較処理(4)]
図19は、
図17のS407、及び第2の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。以下、
図19のステップS601〜S609の処理を説明する。
【0185】
(S601) 変換部13は、
図12のS301と同様に、変換対象の第1フィールドの文字列の開始文字から順に調べ、着目の[数字]毎に、([桁数]−n)を計算する。
【0186】
(S602) 対象の文字列について、文字認識結果で不読が無い場合(S602−Y)は、S603へ移り、不読が有る場合(S602−N)は、S604へ移る。
【0187】
(S603) 変換部13は、不読が無い場合に対応した文字種の変換処理を、
図4のS108と同様に行う。第2の変換の場合、
図10の変換表を用いて、算用数字が漢数字へ変換される。
【0188】
(S604,S605) 変換部13は、不読が有る場合に対応した処理を行う。この処理の結果、不読の文字について、不読を解消する文字変換が可能であり当該文字変換がされた場合(S605−Y)、S606へ移り、不可能であり当該文字変換がされていない場合(S605−N)、S609へ移る。なお、変換部13は、文字変換が不可能の場合、S608へ移り、不読の文字以降の文字について同様に処理を繰り返してもよい。
【0189】
(S606〜S608) S603またはS605の後、変換部13は、第1フィールドの変換結果の漢数字の部分文字と、第2フィールドの漢数字の対応する位置の部分文字とを比較する。比較の結果、一致する場合(S607−Y)、S608へ移り、一致しない場合(S607−N)、文字列単位での比較結果を不一致と判定し、S609へ移る。S608で、変換部13は、n回繰り返しのためにnを1増加し、その結果、着目の数字が最終文字になる場合(S608−Y)はS609へ移り、最終文字でない場合(S608−Y)はS601へ戻って同様に繰り返す。なお、対象が中国の帳票の場合、ピリオド以降の数字について、最終文字になるまで、同様に処理が行われる。
【0190】
(S609) 変換部13は、文字列の一致/不一致の結果に応じた比較結果データ24を保存し、処理を終了する。
【0191】
[不読が有る場合の処理]
図20及び
図21を用いて、
図17のS407に対応した、不読が有る場合の処理について説明する。PC2は、文字認識部12及び比較部14等を用いて、この処理を行う。この処理は、第1の文字認識において不読が有る場合に、第1の文字認識の候補の文字を比較対象として含めて、改ざん等の可能性を判定しつつ、不読の文字をできるだけ文字変換して不読を解消する処理である。
【0192】
図20は、不読が有る場合の処理として、第1の変換の場合の例を示す。第1フィールドに記入されている算用数字は「1,265」である。第2フィールドに記入されている漢数字は「金壱千弐百陸拾伍円」である。第1フィールドの算用数字に対する第1の文字認識の結果は不読が有る。文字列「1,265」のうち文字「1」が不読の例である。文字列「1,265」のうち他の文字については、誤読及び不読が無い。第2フィールドの漢数字に対する第1の文字認識の結果は、誤読及び不読が無い。第1の変換により、第2フィールドの漢数字は算用数字へ変換される。第1の変換の後の文字列の算用数字は「1,265」である。
【0193】
PC2は、算用数字に不読が有る場合、その不読の文字について、所定の組合せの値を比較し、不読の解消のために第2の文字認識による文字変換を試みる。所定の組合せは、(1)第2フィールドの漢数字の第1の文字認識の結果の文字と、(2)第1フィールドの算用数字の第1の文字認識における候補文字と、を含む。PC2は、算用数字に不読が有る場合、
図21の不読が有る場合の処理表210、及び
図14の改ざん可能性判定用の判定表140を参照し、上記組合せの値の比較に基づいて、第2の文字認識を行う。
【0194】
第1の文字認識における候補文字の例として、第1の候補文字がX、第2の候補文字がY、等とする。第1の文字認識の処理では、これらの候補文字のいずれかに確定して文字変換することができず、結果が不読となっている。
【0195】
図21は、不読が有る場合の処理用の表の構成例を示す。
図21の(a)は、不読が有る場合の処理表210として、日本の帳票の場合及び第1の変換の場合に対応した一部分を示す。この処理表210は、
図20の例、即ち記入された算用数字「1」に不読が有る場合に対応した部分を示す。
【0196】
処理表210において、列として、「記入算用数字」、「認識結果漢数字」、「文字認識の第1候補」、「文字認識の第2候補」、「文字変換、出力」がある。「記入算用数字」は、
図20の第1フィールドに記入された算用数字、特に「1」の場合を示す。「認識結果漢数字」は、
図20の第2フィールドの漢数字の第1の文字認識の結果の漢数字、特に「壱」の場合を示す。「文字認識の第1候補」及び「文字認識の第2候補」は、
図20の第1の文字認識における候補文字のうちの第1の候補文字X及び第2の候補文字Yが対応する。「文字変換、出力」は、第2の文字認識における文字変換の結果とする文字またはアラート等の出力の値を示す。
【0197】
PC2は、処理表210のうち、「認識結果漢数字」、「文字認識の第1候補」、「文字認識の第2候補」の3つの列の値の組合せを参照し、第2の文字認識に関する判断を行う。PC2は、
図20のような比較対象の組合せの値から、処理表210のその組合せに該当する行を参照し、「文字変換、出力」列の値を採用する。
図20の組合せの例では、{壱,X,Y}である。PC2は、「認識結果漢数字」として「壱」であるため、
図21の処理表210を参照する。PC2は、処理表210のうち、第1の候補文字X及び第2の候補文字Yの組合せに応じた行を参照する。
【0198】
処理表210における「第1候補」及び「第2候補」の列は、「1」のような正しい記入を想定した文字と、「改ざん候補」の文字と、「その他」の文字との組合せが設定されている。
【0199】
処理表210の第1行及び第2行は、「第1候補」列の値が「1」である。例えば、文字Xが「1」、文字Yが「改ざん候補」である場合、第1行が該当する。よって、PC2は、第1行の「文字変換、出力」列の値である「第1候補(1)」を採用する。「第1候補(1)」は、「第1候補」列の文字Xである「1」を指している。即ち、PC2は、不読の文字を「1」へ文字変換して不読を解消する。
【0200】
「改ざん候補」とは、
図14の判定表140において「改ざん候補算用数字」列に設定されている値を指す。判定表140から、例えば、漢数字「壱」及び算用数字「1」に関しては、「改ざん候補」の文字として、{4,7,9}である。処理表210の第1行の「第2候補」列の「改ざん候補」は、第2の候補文字Yがこれらの文字{4,7,9}のいずれかである場合を指す。組合せが{壱,1,4}等である場合、不読の文字は「1」へ文字変換される。
【0201】
例えば、文字Xが「1」、文字Yが「その他」である場合、第2行が該当する。よって、PC2は、第2行の「文字変換、出力」列の値である「第1候補(1)」を採用する。「その他」とは、「1」自体及び「改ざん候補」を除いた文字を指す。例えば漢数字「壱」及び算用数字「1」に関しては、「0」〜「9」のうち、「1」と{4,7,9}を除いて、{0,2,3,5,6,8}である。組合せが{壱,1,2}等である場合、不読の文字は「1」へ文字変換される。
【0202】
処理表210の第3行〜第5行は、「第1候補」列の値が「改ざん候補」である。例えば、文字Xが「改ざん候補」の文字、文字Yが「1」である場合、第3行が該当し、「第2候補(1)」が採用される。「第2候補(1)」は、「第2候補」列の文字Yである「1」を指す。また、文字X及び文字Yが「改ざん候補」の文字である場合、第4行が該当し、「強いアラート」が採用される。「強いアラート」は、改ざん等の可能性が高いという判定に応じた、強いレベルのアラートの出力を指す。「強いアラート」は前述の第2のアラートと同じでもよい。例えば、組合せが{壱,4,7}等である場合、PC2は、「1」が「4」や「7」へ改ざん等がされた可能性が高いと推測し、この「強いアラート」を出力する。また、文字Xが「改ざん候補」の文字、文字Yが「その他」の文字である場合、第5行が該当し、「強いアラート」が採用される。
【0203】
処理表210の第6行〜第8行は、「第1候補」列の値が「その他」である。例えば、文字Xが「その他」の文字、文字Yが「1」である場合、第6行が該当し、「第2候補(1)」が採用される。また、文字Xが「その他」の文字、文字Yが「改ざん候補」の文字である場合、第7行が該当し、「弱いアラート」が採用される。「弱いアラート」は、改ざん等の可能性が低いという判定に応じた、「強いアラート」よりも弱いレベルのアラートの出力を指す。「弱いアラート」は前述の第1のアラートと同じでもよい。例えば、組合せが{壱,2,4}等である場合、PC2は、「1」が「4」等へ改ざん等がされた可能性が有ると推定し、この「弱いアラート」を出力する。また、文字X及び文字Yが共に「その他」の文字の場合、第8行が該当し、「弱いアラート」が採用される。
【0204】
組合せが第1行、第2行、第3行、または第6行に該当する場合、不読の文字は第2の文字認識により文字変換され、不読が解消される結果となる。組合せが第4行、第5行、第7行、または第8行に該当する場合、特定のアラートが出力される結果となる。
【0205】
また、PC2は、漢数字に不読が有る場合、その不読の文字について、所定の組合せの値を比較し、不読の解消のための第2の文字変換を試みる。所定の組合せは、(1)第1フィールドの算用数字の第1の文字認識の結果の文字と、(2)第2フィールドの漢数字の第1の文字認識における候補の文字と、を含む。PC2は、漢数字に不読が有る場合、
図21の(b)の表120B、及び
図14の判定表140を参照し、上記組合せの値の比較に基づいて、第2の文字変換を行う。
【0206】
図21の(b)は、不読が有る場合の処理表210Bを示す。この処理表210Bは、日本の帳票の場合及び第2の変換の場合に対応した一部分を示す。この処理表210は、記入された漢数字「壱」に不読が有る場合に対応した部分を示す。
【0207】
表210Bにおいて、列として、「記入漢数字」、「認識結果算用数字」、「文字認識の第1候補」、「文字認識の第2候補」、「文字変換、出力」がある。「記入漢数字」は、第2フィールドに記入された漢数字、特に「壱」の場合を示す。「認識結果算用数字」は、第1フィールドの算用数字の第1の文字認識の結果の算用数字、特に「1」の場合を示す。「文字認識の第1候補」及び「文字認識の第2候補」は、第1の文字認識における候補文字を示す。
【0208】
PC2は、処理表210Bのうち、「認識結果算用数字」、「文字認識の第1候補」、「文字認識の第2候補」の3つの列の値の組合せを参照し、第2の文字認識に関する判断を行う。PC2は、比較対象の組合せ{1,X,Y}の値から、処理表210Bのその組合せに該当する行を参照し、「文字変換、出力」列の値を採用する。
【0209】
処理表210Bの第1行は、「文字認識の第1候補」列の値が「壱」であり、「文字認識の第2候補」列の値が「壱 以外」である。文字Xが「壱」であり、文字Yが「壱」以外の文字である場合、第1行に該当し、「文字変換、出力」列の値である「第1候補(壱)」が採用される。「第1候補(壱)」は、「第1候補」列の文字Xである「壱」を指している。即ち、PC2は、不読の文字を「壱」へ文字変換して不読を解消する。
【0210】
処理表210Bの第2行は、「第1候補」列の値が「壱 以外」であり、「第2候補」列の値が「壱」である。文字Xが「壱」以外の文字であり、文字Yが「壱」である場合、第2行に該当し、「第2候補(壱)」が採用される。「第2候補(壱)」は、「第2候補」列の文字Yである「壱」を指している。
【0211】
処理表210Bの第3行は、「第1候補」及び「第2候補」列の値が共に「壱 以外」である。文字X及び文字Yが「壱」以外の文字である場合、第3行に該当し、「弱いアラート」が採用される。
【0212】
「1」以外の算用数字及び「壱」以外の漢数字についても、同様に、処理表210や処理表210Bの情報が用意されている。PC2は、「1」以外の算用数字及び「壱」以外の漢数字についても、処理表210や処理表210Bを用いて、同様に不読が有る場合の処理を行う。中国の帳票の場合、日本とは異なる使用文字による処理表210や処理表210Bを用いて、同様に不読が有る場合の処理が行われる。
【0213】
上記例のように、不読低減モードでは、第1の変換及び第2の変換のいずれの場合でも、不読を低減できる。また、ユーザは、改ざん等の可能性を判断しやすい。
【0214】
[効果等]
以上説明したように、実施の形態1の文字認識システム及び文字認識方法によれば、文字の種類が異なる二重エントリを含む帳票の場合にも、精度や効率を高め、ユーザの作業の負担を軽減できる。ユーザは、帳票の記載内容の確認や、データの修正や確定等の作業が容易になる。
【0215】
特許文献1を含め、従来の文字認識システムは、二重エントリの文字種が異なる2つの金額を自動的に比較及び判定するような高度な機能を持たない。一方、実施の形態1の文字認識システムは、二重エントリの2つの金額の文字種が異なる場合、自動的に文字種を変換して比較及び判定等を行う高度な機能を提供する。よって、ユーザは、2つの文字列の比較等の手間が軽減され、一見してすぐに判断がしやすい。
【0216】
実施の形態1の文字認識システムは、二重エントリの金額の比較や、改ざん等の可能性の判定を含め、自動的なチェックを行い、判定結果に応じたアラートを出力する。よって、ユーザは、金額の不一致、改ざん等の可能性を認識及び検出しやすい。
【0217】
実施の形態1の文字認識システムは、誤読低減モードや不読低減モードを備えており、帳票のOCR処理、即ち帳票データを得る処理に関して、精度を高めることができる。ユーザは、信頼性が高い帳票データを得ることができる。
【0218】
実施の形態1の文字認識システムは、多数の帳票のOCR処理の場合にも、帳票毎に自動的なチェックを行い、出力データを保存し、必要に応じて結果画面を出力する。これにより、多数の帳票のOCR処理及びユーザの作業の効率を高めることができる。
【0219】
(実施の形態2)
図22を用いて、本発明の実施の形態2の文字認識システム及び文字認識方法について説明する。実施の形態2の文字認識方法は、実施の形態2の文字認識システム上において、ユーザの操作に基づいてコンピュータにより実行される処理手順を含む方法である。
【0220】
図22は、実施の形態2の文字認識システムの構成を示す。実施の形態2の文字認識システムは、OCR装置3とPC4との接続により構成される。実施の形態2の文字認識システムは、帳票5のOCR処理に関する主な処理を、PC4ではなく、OCR装置3で行う。言い換えると、実施の形態2の文字認識システムは、ハードOCR方式のシステムである。OCR装置3は、帳票5のOCR処理のうち、帳票5の画像データ41を得る処理から比較結果データ44を出力する処理までを行う装置である。PC4は、ソフトウェア処理により、OCR処理のうち、比較結果データ44を含む出力データ45をユーザへ出力する出力処理等を行う装置である。
【0221】
ユーザは、OCR装置3及びPC4を操作する。ユーザは、作業のため、帳票5をOCR装置3にセットして入力する。ユーザは、PC4で作業に関する設定や指示入力を行う。PC4は、指示入力に従い、OCR装置3へ命令を送信する。OCR装置3は、PC4からの命令に従い、帳票5のOCR処理を開始する。
【0222】
OCR装置3は、図示しないスキャナやスタッカの他、制御装置301、記憶装置302、及び通信インタフェース装置303を有する。
【0223】
制御装置301は、CPU、ROM、RAM等により構成される。記憶装置302は、メモリやディスク等を含む。通信インタフェース装置303は、PC4との通信インタフェースに対応した通信処理を行う。
【0224】
制御装置301は、記憶装置302に格納されているプログラム30をロードしてソフトウェア処理を実行することにより、帳票入力部31等の各処理部を実現する。プログラム30は、OCR装置3に特有のOCR処理を実行させるプログラムである。なお、このプログラム処理は、ハードウェア回路に実装されていてもよい。制御装置301は、帳票入力部31、文字認識部32、変換部33、及び比較部34を有する。
【0225】
記憶装置302は、OCR処理に係わる各データとして、画像データ41、認識結果文字データ42、変換結果文字データ43、及び比較結果データ44等を記憶する。
【0226】
OCR装置3は、帳票入力部31により、帳票5を読み込んでスキャンし、帳票5の画像データ41を得て、記憶装置302に格納する。
【0227】
文字認識部32は、記憶装置302の帳票5の画像データ41を入力し、画像データ41に対して文字認識処理を行い、その結果である認識結果文字データ42を記憶装置302に格納する。
【0228】
変換部33は、記憶装置302の認識結果文字データ42を入力し、認識結果文字データ42に対して、所定の変換処理を行い、その結果である変換結果文字データ43を記憶装置302に格納する。
【0229】
比較部34は、記憶装置302の変換結果文字データ43を入力し、変換結果文字データ43に対して、所定の比較処理を行い、その結果である比較結果データ44を記憶装置302に格納する。
【0230】
OCR装置3は、OCR処理の結果である、比較結果データ44や認識結果文字データ42を、通信インタフェース装置303による通信処理を介し、PC4へ転送する。
【0231】
PC4は、図示しない制御装置、記憶装置、通信インタフェース装置、入力装置、表示装置、等の一般的な要素を有する。PC4は、それらの要素の上に構成される、出力部35、及びユーザインタフェース部36を有する。PC4は、OCR装置1から転送された比較結果データ44や認識文字結果データ42を受信し、内部の記憶装置に格納する。
【0232】
出力部35は、記憶装置の比較結果データ44を入力し、所定の出力処理として、比較結果データ44を含む出力データ45を構成し、出力データ45を記憶装置に保存する。また、出力部35は、ユーザインタフェース部36及び表示装置を用いて、出力データ45に対応したOCR処理の結果画面をユーザへ表示する。
【0233】
ユーザインタフェース部36は、文字認識システム及びOCRの作業に関するユーザインタフェースとしての画面をユーザに提供する処理を行う。ユーザインタフェース部36は、出力データ45に基づいて、Webページ等による画面データを構成し、画面データに基づいて表示装置に結果画面を表示させる。
【0234】
実施の形態2の文字認識システム及び文字認識方法によっても、実施の形態1と同様の効果が得られる。
【0235】
以上、本発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されず、その要旨を逸脱しない範囲で種々変更可能である。