特許6472218 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立情報通信エンジニアリングの特許一覧

特許6472218文字認識システム及び文字認識方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6472218

(24)【登録日】2019年2月1日

(45)【発行日】2019年2月20日

(54)【発明の名称】文字認識システム及び文字認識方法

(51)【国際特許分類】

G06K 9/03 20060101AFI20190207BHJP

【ＦＩ】

G06K9/03 D

G06K9/03 B

【請求項の数】13

【全頁数】36

(21)【出願番号】特願2014-232521(P2014-232521)

(22)【出願日】2014年11月17日

(65)【公開番号】特開2016-95753(P2016-95753A)

(43)【公開日】2016年5月26日

【審査請求日】2017年10月6日

(73)【特許権者】

【識別番号】000233295

【氏名又は名称】株式会社日立情報通信エンジニアリング

(74)【代理人】

【識別番号】100080001

【弁理士】

【氏名又は名称】筒井大和

(72)【発明者】

【氏名】横井博樹

(72)【発明者】

【氏名】中島和樹

【審査官】川▲崎▼ 博章

(56)【参考文献】

【文献】特開２００５−２６６９２３（ＪＰ，Ａ）

【文献】特開２００９−１６９８２７（ＪＰ，Ａ）

【文献】特開昭５６−０６８８８０（ＪＰ，Ａ）

【文献】特開２０１４−０２６４２１（ＪＰ，Ａ）

【文献】特開平０３−０７４７８５（ＪＰ，Ａ）

【文献】特開２００９−２００７９４（ＪＰ，Ａ）

【文献】特開２００１−０７６０９３（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｋ９／０３

(57)【特許請求の範囲】

【請求項1】

帳票を入力して当該帳票の画像データを得る帳票入力部と、
前記帳票の前記画像データから、２つのフィールドの２つの文字列として、第１のフィールドの第１の文字列、及び第２のフィールドの第２の文字列を文字認識し、認識結果文字データを得る文字認識部と、
前記認識結果文字データから、前記第１の文字列の文字種と前記第２の文字列の文字種とが異なる場合に、一方の文字列の文字種を他方の文字列の文字種に合わせるように前記一方の文字列を変換し、変換結果文字データを得る変換部と、
前記変換結果文字データから、前記第１の文字列と前記第２の文字列とを比較し、一致または不一致を判定し、比較結果データを得る比較部と、
前記比較結果データを含む出力データをユーザへ出力する出力部と、
を有し、
前記第１の文字列の文字と、前記第２の文字列の文字と、前記第１の文字列の文字についての改ざん候補文字と、の組合せが設定された判定表を有し、
前記比較部は、前記不一致と判定した前記第１の文字列の文字及び前記第２の文字列の文字について、前記判定表の前記組合せに該当するかどうかにより、前記第１の文字列の文字についての改ざんを含む可能性を判定し、判定結果を出力する、
文字認識システム。

【請求項2】

請求項１記載の文字認識システムにおいて、
前記帳票は、前記第１の文字列に、算用数字による金額を含み、前記第２の文字列に、漢数字による金額を含み、
前記文字種が異なる前記２つの文字列に関する文字毎の対応関係が設定された変換表を有し、
前記変換部は、前記変換表を用いて、前記第２の文字列の漢数字を前記第１の文字列の算用数字に合わせるように前記第２の文字列を変換する、文字認識システム。

【請求項3】

請求項１記載の文字認識システムにおいて、
前記帳票は、前記第１の文字列に、算用数字による金額を含み、前記第２の文字列に、漢数字による金額を含み、
前記文字種が異なる前記２つの文字列に関する文字毎の対応関係が設定された変換表を有し、
前記変換部は、前記変換表を用いて、前記第１の文字列の算用数字を前記第２の文字列の漢数字に合わせるように前記第１の文字列を変換する、文字認識システム。

【請求項4】

請求項１記載の文字認識システムにおいて、
前記認識結果文字データに基づいて、前記２つのフィールドの各フィールド毎および前記２つの文字列の各文字列毎に、前記各フィールドの領域内に前記各文字列が見つからない場合、当該領域よりも外側に拡げた範囲で前記各文字列を探し、前記各文字列が見つからない場合は、空白有りの結果とし、前記各文字列が見つかった場合は、当該各文字列を前記認識結果文字データに含めて、空白無しの結果とし、当該結果を出力する、文字認識システム。

【請求項5】

請求項１記載の文字認識システムにおいて、
前記認識結果文字データに基づいて、前記第１の文字列の桁数と、前記第２の文字列の桁数と、を判定し、前記第１の文字列の桁数と、前記第２の文字列の桁数と、を比較し、当該桁数の一致または不一致を判定し、当該判定の結果を出力する、文字認識システム。

【請求項6】

請求項１記載の文字認識システムにおいて、
前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
前記指示入力の画面は、前記２つのフィールドと、前記２つの文字列のそれぞれの文字種と、前記変換の対象の文字列と、を指定する項目を含む、文字認識システム。

【請求項7】

請求項１記載の文字認識システムにおいて、
前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
前記結果画面は、前記第１の文字列の前記文字認識の結果のデータと、前記第２の文字列の前記文字認識の結果のデータ、または前記第２の文字列の前記変換の結果のデータと、前記一致または不一致の判定結果と、前記不一致の場合のアラートと、を含む、文字認識システム。

【請求項8】

請求項１記載の文字認識システムにおいて、
前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
前記結果画面は、前記第１の文字列の前記文字認識の結果のデータと、前記第２の文字列の前記文字認識の結果のデータ、または前記第２の文字列の前記変換の結果のデータと、前記一致または不一致の判定結果と、前記不一致の場合には、前記第１の文字列の文字についての改ざんを含む可能性の判定結果と、前記改ざんを含む可能性のアラートと、を含む、文字認識システム。

【請求項9】

請求項１記載の文字認識システムにおいて、
前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
前記指示入力の画面は、誤読低減モードを指定する項目を含み、
前記誤読低減モードが指定されている場合、前記第１の文字列の前記文字認識の結果、または前記第２の文字列の前記文字認識の結果の少なくとも一方において、不読の文字が有る場合、当該不読が有る旨の結果とし、前記結果画面に、当該不読の文字の箇所と、当該不読が有る旨のアラートと、を含む情報を出力する、文字認識システム。

【請求項10】

請求項１記載の文字認識システムにおいて、
前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
前記第１の文字列の前記文字認識の結果のデータにおける第１の金額と、前記第２の文字列の前記変換の結果のデータにおける第２の金額と、の金額差を計算し、前記結果画面に、前記金額差と、前記金額差が有る場合または前記金額差が閾値以上である場合のアラートと、を含む情報を出力する、文字認識システム。

【請求項11】

請求項１記載の文字認識システムにおいて、
前記ユーザの操作に基づいた指示入力の画面と、前記出力データに基づいた結果画面と、を前記ユーザへ出力するユーザインタフェース部を有し、
前記指示入力の画面は、不読低減モードを指定する項目を含み、
前記第１の文字列の第１の文字認識の候補文字と、前記第２の文字列の前記第１の文字認識の結果の文字と、第２の文字認識の結果出力として文字またはアラートと、を含む対応関係の情報が設定された処理表を有し、
前記不読低減モードが指定されている場合、前記第１の文字列の前記第１の文字認識の結果、または前記第２の文字列の前記第１の文字認識の結果の少なくとも一方に、不読の文字が有る場合に、当該不読が有る場合の処理として、前記第１の文字列の前記第１の文字認識の候補文字と、前記第２の文字列の前記第１の文字認識の結果の文字と、の組合せから、前記処理表を参照して、前記第２の文字認識の結果出力を決定し、
前記第２の文字認識の結果出力として前記文字が決定された場合、前記不読の文字を、当該文字へ文字変換することにより当該不読を解消し、
前記結果画面は、前記第２の文字認識の結果出力を含む、文字認識システム。

【請求項12】

請求項１１記載の文字認識システムにおいて、
前記処理表は、前記第１の文字列の前記第１の文字認識の候補文字として、第１の候補文字、及び第２の候補文字を含み、当該候補文字として、正しい記入を想定した文字と、改ざん候補の文字と、その他の文字と、の組合せが設定されており、
前記比較部は、前記第１の文字列の前記第１の文字認識の候補文字における前記第１の候補文字及び前記第２の候補文字と、前記第２の文字列の前記第１の文字認識の結果の文字との組合せから、前記処理表を参照して、前記第２の文字認識の結果出力を決定し、前記結果出力として、前記第１の候補文字または前記第２の候補文字が前記正しい記入を想定した文字である場合には、当該文字を出力し、前記第１の候補文字が前記改ざん候補の文字である場合には、前記アラートを出力する、文字認識システム。

【請求項13】

帳票を入力して当該帳票の画像データを得る帳票入力ステップと、
前記帳票の前記画像データから、２つのフィールドの２つの文字列として、第１のフィールドの第１の文字列、及び第２のフィールドの第２の文字列を文字認識し、認識結果文字データを得る文字認識ステップと、
前記認識結果文字データから、前記第１の文字列の文字種と前記第２の文字列の文字種とが異なる場合に、一方の文字列の文字種を他方の文字列の文字種に合わせるように前記一方の文字列を変換し、変換結果文字データを得る変換ステップと、
前記変換結果文字データから、前記第１の文字列と前記第２の文字列とを比較し、一致または不一致を判定し、比較結果データを得る比較ステップと、
前記比較結果データを含む出力データをユーザへ出力する出力ステップと、
を有し、
前記比較ステップは、前記第１の文字列の文字と、前記第２の文字列の文字と、前記第１の文字列の文字についての改ざん候補文字と、の組合せが設定された判定表を用いて、前記不一致と判定した前記第１の文字列の文字及び前記第２の文字列の文字について、前記判定表の前記組合せに該当するかどうかにより、前記第１の文字列の文字についての改ざんを含む可能性を判定し、判定結果を出力する、
文字認識方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ＯＣＲ（Optical Character Reader）を用いた文字認識の技術に関する。

【背景技術】

【0002】

ＯＣＲを用いた文字認識システムは、請求書や小切手等の帳票から画像を読み込み、帳票の欄に記入されている文字を認識し、その文字データを得る。ユーザは、画面でその文字データを見て、帳票の記入内容の確認、データの修正や確定、等の作業を行う。

【0003】

ＯＣＲを用いた文字認識システムに関する先行技術例として、特開２００２−９２５４５号公報（特許文献１）が挙げられる。特許文献１には、帳票における２つの欄に記入された２つの金額の文字を文字認識する旨が記載されている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２００２−９２５４５号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

帳票における２つの欄または箇所に、二重エントリとして、対応関係を持つ２つの文字列が記入される場合がある。二重エントリは、金額等の重要な情報について、正確性の確保や、改ざん防止等の目的で行われる場合がある。二重エントリは、複記と呼ばれる場合もある。帳票には、二重エントリのための２つの欄が併設される場合がある。例えば、請求書において、金額の記入欄に、金額の文字列が記入され、複記欄に、記入欄の金額と同じ金額の文字列が記入される。

【0006】

従来の文字認識システムは、帳票の二重エントリの２つの文字列を、単に別々に文字認識してデータを得る場合、２つの文字列の対応関係については判定していない。その場合、ユーザは、誤った金額等の文字列を得る可能性や、２つの文字列の不一致に気付かない可能性が高くなる。

【0007】

特許文献１の技術は、帳票の２つの欄に同じ金額が同じ種類の文字、例えば算用数字で記入される場合に対応した技術である。

【0008】

しかし、帳票の二重エントリの２つの欄または箇所に、同じ金額が異なる種類の文字で記入または印字される場合がある。例えば、記入欄に、金額が算用数字で記入され、複記欄に、同じ金額が漢数字で記入される。複記欄が無い帳票の場合、記入欄の近くの箇所に金額が記入される場合もある。

【0009】

上記の場合、従来の文字認識システムは、２つの金額の文字の種類が異なるため、単純比較、及び対応関係の判定等はできない。ユーザは、２つの金額の文字認識結果を見て、２つの金額を比較し、金額の記入誤りや改ざん等の可能性が無いか判断及び確認する必要がある。ユーザは、帳票毎にこのような作業が要求され、手間及び時間がかかる。

【0010】

特に、２つの金額の文字の種類が異なる場合、文字の種類が同じである場合よりも、ユーザは、金額の比較や判断を一見ですぐに行うことは難しい。また、多数の帳票の処理を行う文字認識システムは、ユーザによる帳票の確認等の作業を介在する場合、処理を一時停止させる必要がある。そのため、多数の帳票の処理に長い時間がかかり、ユーザの作業の負担が大きい。

【0011】

上記のように、従来の文字認識システムは、二重エントリを含む帳票の文字認識に関して、精度や効率の観点で改善余地がある。

【0012】

本発明の目的は、文字認識システムに関して、文字の種類が異なる二重エントリを含む帳票の場合にも、精度や効率を高め、ユーザの作業の負担を軽減できる技術を提供することである。

【課題を解決するための手段】

【0013】

本発明のうち代表的な実施の形態は、文字認識システム及び文字認識方法であって、以下に示す構成を有することを特徴とする。

【0014】

一実施の形態の文字認識システムは、帳票を入力して当該帳票の画像データを得る帳票入力部と、前記帳票の前記画像データから、２つのフィールドの２つの文字列として、第１のフィールドの第１の文字列、及び第２のフィールドの第２の文字列を文字認識し、認識結果文字データを得る文字認識部と、前記認識結果文字データから、前記第１の文字列の文字種と前記第２の文字列の文字種とが異なる場合に、一方の文字列の文字種を他方の文字列の文字種に合わせるように前記一方の文字列を変換し、変換結果文字データを得る変換部と、前記変換結果文字データから、前記第１の文字列と前記第２の文字列とを比較し、一致または不一致を判定し、比較結果データを得る比較部と、前記比較結果データを含む出力データをユーザへ出力する出力部と、を有する。

【発明の効果】

【0015】

本発明のうち代表的な実施の形態によれば、文字認識システムに関して、文字の種類が異なる二重エントリを含む帳票の場合にも、精度や効率を高め、ユーザの作業の負担を軽減できる。

【図面の簡単な説明】

【0016】

【図1】本発明の実施の形態１の文字認識システムの構成を示す図である。

【図2】実施の形態１における、帳票の具体例を示す図である。

【図3】実施の形態１における、処理及び作業の概要のフローを示す図である。

【図4】実施の形態１における、誤読低減モードの場合の処理フローを示す図である。

【図5】実施の形態１における、読み取り指定の際の画面例を示す図である。

【図6】実施の形態１における、対象箇所の読み取り例を示す図である。

【図7】実施の形態１における、位置ずれ補正処理の例を示す図である。

【図8】実施の形態１における、桁数比較処理の例を示す図である。

【図9】実施の形態１における、文字列変換処理の例を示す図である。

【図10】実施の形態１における、文字列変換処理に用いる変換表の例を示す図である。

【図11】実施の形態１における、第１の変換の場合の変換処理のフローを示す図である。

【図12】実施の形態１における、第２の変換の場合の変換処理のフローを示す図である。

【図13】実施の形態１における、文字列比較処理の例を示す図である。

【図14】実施の形態１における、改ざん可能性判定処理の例を示す図である。

【図15】実施の形態１における、結果画面の出力例を示す図である。

【図16】実施の形態１における、結果画面の出力例を示す図である。

【図17】実施の形態１における、不読低減モードの場合の処理フローを示す図である。

【図18】実施の形態１における、第１の変換の場合の、変換処理及び比較処理を含むフローを示す図である。

【図19】実施の形態１における、第２の変換の場合の、変換処理及び比較処理を含むフローを示す図である。

【図20】実施の形態１における、不読が有る場合の処理として、第１の変換の場合の例を示す図である。

【図21】実施の形態１における、不読が有る場合の処理表の例を示す図である。

【図22】本発明の実施の形態２の文字認識システムの構成を示す図である。

【発明を実施するための形態】

【0017】

以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において同一部には原則として同一符号を付し、その繰り返しの説明は省略する。

【0018】

（実施の形態１）
図１〜図２１を用いて、本発明の実施の形態１の文字認識システム及び文字認識方法について説明する。実施の形態１の文字認識システムは、ＯＣＲを用いて帳票の文字認識の処理を行うシステムである。実施の形態１の文字認識方法は、実施の形態１の文字認識システム上において、ユーザの操作に基づいてコンピュータにより実行される処理手順を含む方法である。

【0019】

実施の形態１の文字認識システムは、帳票の２つの箇所に二重エントリとして記入されている２つの金額等の文字列について、それらの文字の種類が異なる場合にも、自動的に、文字種の変換、比較、及び判定等を行う高度な機能を提供する。文字認識システムは、２つの文字列を比較し、一致及び不一致や、記入誤りや改ざん等の可能性を判定し、その結果に応じて、アラート等を含む結果画面をユーザへ出力し、出力データを保存する。これにより、ユーザによる帳票の確認や修正等の作業を支援する。

【0020】

［文字認識システム］
図１は、実施の形態１の文字認識システムの構成を示す。実施の形態１の文字認識システムは、ＯＣＲ装置１とＰＣ２との接続により構成される。実施の形態１の文字認識システムは、帳票５のＯＣＲ処理に関する主な処理をＰＣ２で行う。言い換えると、実施の形態１の文字認識システムは、ソフトＯＣＲ方式のシステムである。ＯＣＲ装置１は、帳票５のＯＣＲ処理のうち、帳票５の画像データを得る処理までを行う装置である。ＰＣ２は、ソフトウェア処理によりＯＣＲ処理を行う装置である。ＯＣＲ処理は、言い換えると、帳票５のデータ化、文字列データを得る処理である。

【0021】

ユーザは、実施の形態１の文字認識システムを利用し、ＯＣＲ装置１及びＰＣ２を操作する。ユーザは、帳票５のＯＣＲ処理に関する作業として、帳票５の記載内容の確認、データの修正や確定、等の作業を行う。

【0022】

帳票５は、所定の業務で用いられる所定の形式の帳票であり、例えば請求書や小切手である。図示しない記入者は、帳票５の欄に、金額等の文字を、手書きで記入する。あるいは、帳票５の欄には、金額等の文字が、ライター等の機器を用いて印字される。ユーザは、提出された帳票５を受け取る。

【0023】

ユーザは、作業のため、１枚以上の帳票５を、ＯＣＲ装置１にセットし入力する。ユーザは、ＰＣ２を操作し、作業に関する設定や指示入力を行う。ＰＣ２は、指示入力に従い、ＯＣＲ装置１へ命令を送信する。ＯＣＲ装置１は、ＰＣ２からの命令に従い、帳票５のＯＣＲ処理を開始する。

【0024】

ＯＣＲ装置１は、帳票入力部１１を含む。帳票入力部１１は、図示しないスキャナ等のハードウェア及びソフトウェアにより構成される。ＯＣＲ装置１は、帳票入力部１１により、帳票５を読み込んでスキャンし、帳票５の画像データ２１を得る。ＯＣＲ装置１は、読み込み済みの帳票５を、図示しないスタッカへ排出し蓄積する。

【0025】

ＯＣＲ装置１とＰＣ２は、所定の通信インタフェースで接続される。ＯＣＲ装置１は、図示しない通信インタフェース装置を含む。ＯＣＲ装置１は、帳票入力部１１により得た画像データ２１を、通信インタフェース装置による通信処理を介してＰＣ２へ転送する。

【0026】

ＰＣ２は、制御装置２０１、記憶装置２０２、入力装置２０３、表示装置２０４、印刷装置２０５、及び通信インタフェース装置２０６を有する。制御装置２０１は、ＣＰＵ、ＲＯＭ、ＲＡＭ等により構成される。記憶装置２０２は、メモリやディスク等を含む。入力装置２０３は、キーボードやマウス等を含む。通信インタフェース装置２０６は、ＯＣＲ装置１との通信インタフェースに対応した通信処理を行う。

【0027】

入力装置２０３や表示装置２０４等は、ＰＣ２の外部に接続されてもよい。ＰＣ２は、その他の入出力装置が接続されてもよい。ＰＣ２は、通信インタフェース装置２０６を通じてＬＡＮ等の通信網に接続されてもよい。ＰＣ２は、ＬＡＮ等に接続されるサーバやストレージに、ＯＣＲ処理に係わるデータを保存してもよい。

【0028】

制御装置２０１は、記憶装置２０２に格納されているプログラム２０をロードしてソフトウェア処理を実行することにより、文字認識部１２等の各処理部を実現する。プログラム２０は、ＰＣ２に特有のＯＣＲ処理を実行させるプログラムである。制御部２０１は、文字認識部１２、変換部１３、比較部１４、出力部１５、及びユーザインタフェース部１６を有する。

【0029】

記憶装置２０２は、ＯＣＲ処理に係わる各データとして、画像データ２１、認識結果文字データ２２、変換結果文字データ２３、比較結果データ２４、及び出力データ２５等を記憶する。

【0030】

ＰＣ２は、ＯＣＲ装置１から転送された帳票５の画像データ２１を、通信インタフェース装置２０６を通じて受信し、記憶装置２０２内に格納する。

【0031】

文字認識部１２は、帳票５の画像データ２１を入力し、画像データ２１に対して文字認識処理を行い、その結果である認識結果文字データ２２を出力する。文字認識部１２は、認識結果文字データ２２を記憶装置２０２に格納する。

【0032】

ＰＣ２は、後述の位置ずれ補正処理や桁数比較処理を行う機能を備える。ＰＣ２は、認識結果文字データ２２に基づいて、位置ずれ補正処理や桁数比較処理を行う。

【0033】

変換部１３は、記憶装置２０２の認識結果文字データ２２を入力し、認識結果文字データ２２に対して、所定の変換処理を行い、その結果である変換結果文字データ２３を出力する。変換部１３は、変換結果文字データ２３を記憶装置２０２に格納する。

【0034】

比較部１４は、記憶装置２０２の変換結果文字データ２３を入力し、変換結果文字データ２３に対して、所定の比較処理を行い、その結果である比較結果データ２４を出力する。比較部１４は、比較結果データ２４を記憶装置２０２に格納する。比較部１４は、後述の判定処理を行う。この判定処理は、改ざん等の可能性を判定する処理を含む。

【0035】

出力部１５は、記憶装置２０２の比較結果データ２４を入力し、所定の出力処理として、比較結果データ２４を含む出力データ２５を構成し、出力データ２５を記憶装置２０２に保存する。また、出力部１５は、ユーザインタフェース部１６及び表示装置２０４を用いて、出力データ２５に対応したＯＣＲ処理の結果画面をユーザへ表示する。また、出力部１５は、出力データ２５に基づいて、ＯＣＲ処理の結果を、印刷装置２０５により印刷出力させることもできる。

【0036】

ユーザインタフェース部１６は、文字認識システム及びＯＣＲの作業に関するユーザインタフェースとしての画面をユーザに提供する処理を行う。画面は、文字認識システムの設定や作業の指示入力の画面、ＯＣＲ処理の結果画面、等を含む。ユーザインタフェース部１６は、出力データ２５に基づいて、Ｗｅｂページ等による画面データを構成し、画面データに基づいて表示装置２０４に結果画面を表示させる。

【0037】

実施の形態１の文字認識システムは、多数の帳票５を順次に連続的に処理することも可能である。その場合、ＯＣＲ装置１は、セットされた複数の帳票５を順に読み込んでスキャンし、それぞれの帳票５の画像データ２１を得る。ＯＣＲ装置１は、スキャン済みの帳票５をスタッカへ排出して蓄積する。ＰＣ２は、複数の各々の帳票５の画像データについて順次にＯＣＲ処理を行い、帳票５毎に比較結果データ２４等を得る。

【0038】

ＰＣ２は、ある帳票５の処理の結果、その帳票５の記載内容が正常であると判定した場合、例えば二重エントリの２つの金額が一致している場合、その帳票５に関してはアラートを出力せず、その帳票５に関する出力データ２５を保存する。その場合、ＰＣ２は、複数の帳票５の連続的な処理を停止せずに継続する。

【0039】

ユーザは、正常と判定された帳票５については、そのまま、その帳票５の認識結果文字データ２２等のデータを正しいものとして確定してもよい。また、ユーザは、後で、ＯＣＲ装置１のスタッカに蓄積されている帳票５を取り出して内容を確認することもできる。

【0040】

ＰＣ２は、ある帳票５の処理の結果、帳票５の記載内容が異常であると判定した場合、例えば二重エントリの２つの金額が不一致である場合、その帳票５に関して、即時にアラートを含む結果画面を出力する。その場合、ＰＣ２は、複数の帳票５の連続的な処理を一時停止させる。ユーザは、アラートの発生時に、ＰＣ２の結果画面で、アラートの内容や認識結果文字データ２２等を見て、その帳票５について、確認や修正等の対処の作業を行う。また、ユーザは、ＯＣＲ装置１のスタッカに蓄積されているその帳票５を取り出して確認することもできる。ユーザは、その帳票５に関する対処の作業を済ませると、画面での指示入力により、複数の帳票５の連続的な処理を再開させる。

【0041】

実施の形態１の変形例として、ＯＣＲ装置１は、ＰＣ２からの命令に従い、正常と判定された帳票５を、正常用の第１のスタッカへ振り分けて排出して蓄積し、異常と判定された帳票５を、異常用の第２のスタッカへ振り分けて排出して蓄積するようにしてもよい。

【0042】

実施の形態１の変形例として、ＰＣ２は、複数の帳票５の連続的な処理において、ある帳票５を異常と判定した場合に、即時にアラートを含む結果画面を出力するのではなく、そのアラートを含む出力データ２５を記憶装置２０２に保存してもよい。ユーザは、後で、ＰＣ２を操作し、記憶装置２０２からそのアラートを含む出力データ２５を読み出して画面に表示する。ユーザは、アラートが出力された１枚以上の帳票５について、確認等の作業をまとめて行うことができる。

【0043】

［帳票の例］
図２の（ａ）は、帳票の第１の例として、日本の請求書の例を示し、特に、帳票のうちの、金額の記入欄５１及び複記欄５２を示す。この記入欄５１及び複記欄５２は、金額の二重エントリのために設けられている。記入欄５１は、「項目」及び「合計」の各行において、金額が算用数字で記入されている。複記欄５２は、「項目」及び「合計」の各行において、金額が漢数字で記入されている。複記欄５２の金額は、記入欄５１の金額と同じ金額が、異なる文字の種類で記入されている。数字欄６１は、記入欄５１のうちの「合計」の行の欄に相当する。数字欄６１には、金額の合計が算用数字で記入されている。大字欄６２は、複記欄５２のうちの「合計」の行の欄に相当する。大字欄６２は、金額の合計が漢数字で記入されている。

【0044】

なお、複記欄５２が無い形式の帳票の場合もある。その場合、二重エントリの仕方としては、例えば記入欄５１に対して上下左右等のいずれかの近い位置に、金額が漢数字で記入される。

【0045】

数字欄６１は、例として、金額が「\1,265-」として記入されている。この金額は、詳しくは、「0」〜「9」等の算用数字と、「,」（カンマ）、「\」（円記号）、「-」（ハイフン）等の記号文字とが使用されている。「,」は桁を示すために使用されている。「\」等の文字は、金額の先頭を示すために使用されている。以下、この記号文字を先頭記号ともいう。「-」等の文字は、金額の末尾を示すために使用されている。以下、この記号文字を末尾記号ともいう。なお、先頭記号や末尾記号が使用されない場合もある。

【0046】

大字欄６２は、例として、金額が「金壱千弐百陸拾伍円」として記入されている。「\1,265-」と「金壱千弐百陸拾伍円」は、同じ金額である１２６５円を示す。この金額は、詳しくは、「壱」，「弐」，……，「玖」等の漢数字、「千」等の桁を表す漢字、「金」等の先頭記号、「円」等の末尾記号が使用されている。「円」は通貨記号でもある。

【0047】

上記例のように、金額の明確化や改ざん等の防止のために、漢数字と算用数字とを用いた二重エントリが行われ、先頭記号や末尾記号が使用されている。「壱」等の「大字」は、改ざん等の防止のため、「一」等の単純な漢数字や、「1」等の単純な算用数字の代わりに使用される。先頭記号や末尾記号は、他にも、帳票や業務に応じて、「也」や「※」等、特定の記号文字が使用される。

【0048】

図２の（ｂ）は、帳票５の第２の例として、中国の請求書の例を示し、特に、帳票のうちの、金額の記入欄７１及び複記欄７２を示す。この記入欄７１及び複記欄７２は、同様に、金額の二重エントリのために設けられている。記入欄７１は、金額が算用数字で記入されている。複記欄７２は、金額が漢数字で記入されている。複記欄７２の金額は、記入欄７１の金額と同じ金額が、異なる文字の種類で記入されている。記入欄７１のうち、小写欄８１には、金額の合計が算用数字で記入されている。複記欄７２のうち、大写欄８２には、金額の合計が漢数字で記入されている。なお、中国語の数詞の表現として、「小写」、「大写」がある。「大写」は、日本語の「大字」に相当する。

【0049】

「元」は、金額の末尾記号であり、通貨記号でもある。「整」は、補助単位であり、算用数字の「.」（ピリオド）以下の数字が「00」である場合、「整」が使用される。他の補助単位として、「角」や「分」がある。

【0050】

小写欄８１は、例として、金額が「\1265.00」として記入されている。この金額は、詳しくは、「0」〜「9」等の算用数字と、「\」、「.」等の記号とが使用されている。

【0051】

大写欄８２は、例として、金額が下記のように記入されている。

【0052】

【数1】

【0053】

「\1265.00」と上記金額は同じ金額を示す。この金額は、詳しくは、下記のような漢数字が使用されている。

【0054】

【数2】

【0055】

また、この金額は、詳しくは、「仟」等の桁を表す漢字、及び所定の先頭記号や末尾記号が使用されている。先頭記号としては、○と×を組合せて構成される記号や、「\」が使用されている。末尾記号としては、「整」や「.00」が使用されている。

【0056】

図２の（ｃ）の表は、使用文字として数字の例を示す。第１行は算用数字を示す。第２行及び第３行は、日本の場合の漢数字の例を示す。第４行は、中国の場合の漢数字の例を示す。例えば、「零」，「壱」〜「玖」は、それぞれ「0」，「1」〜「9」に対応する文字である。図２の（ａ）の日本の帳票では、「大字」として、第１行の「壱」，「弐」等を使用しているが、これに限らず、他の漢数字が使用される場合もある。ＰＣ２は、帳票で使用される文字のデータを保持している。

【0057】

［処理及び作業の概要］
図３は、実施の形態１の文字認識システム及び文字認識方法における処理及び作業の概要を示す。Ｓ１等はステップを表す。以下、図３のステップＳ１〜Ｓ５を順に説明する。

【0058】

（Ｓ１）ユーザは、ＰＣ２を操作し、ユーザインタフェース部１６により提供される画面を見ながら、設定や指示入力を行う。ユーザは、帳票５のうちの二重エントリに対応する２つの対象箇所の読み取りの指定を行う。対象箇所は、所定の欄や任意の領域等のフィールドである。また、ユーザは、後述の拡張機能の利用を指定する。また、ユーザは、後述の読み取りモードとして、「誤読低減モード」または「不読低減モード」を指定する。ユーザは、上記指定の上で、ＯＣＲ処理の実行指示を入力する。

【0059】

なお、拡張機能とは、実施の形態１の文字認識システムが提供する高度な機能に対応する。即ち、拡張機能とは、帳票の二重エントリについて、自動的に、変換、比較、判定及び結果出力等を行う機能に対応する。

【0060】

（Ｓ２）ＰＣ２は、Ｓ１の指示入力に従い、ＯＣＲ処理の制御を実行する。ＰＣ２は、ＯＣＲ装置１へ命令を送信する。ＯＣＲ装置１は、命令に従い、図１の帳票入力部１１による処理を実行し、帳票の画像データ２１を得て、ＰＣ２へ転送する。ＰＣ２は、文字認識部１２により、帳票の画像データ２１に基づいて、その帳票の領域のうち、Ｓ１で指定されたフィールドを読み取る文字認識処理を行い、認識結果文字データ２２を得る。

【0061】

（Ｓ３）ＰＣ２は、ユーザによる拡張機能及び読み取りモードの指定がある場合、その指定に対応した処理を行う。ＰＣ２は、まずＳ３で変換処理を行う。

【0062】

変換部１３は、Ｓ２の認識結果文字データ２２に基づいて、帳票の２つのフィールドの文字列について、一方のフィールドの文字列の文字の種類を、他方のフィールドの文字列の文字の種類に合わせるように変換し、変換結果文字データ２３を得る。

【0063】

（Ｓ４）ＰＣ２は、次にＳ４で比較処理を行う。比較部１４は、変換結果文字データ２３に基づいて、一方のフィールドの変換後の文字列と、他方のフィールドの非変換の文字列とを比較し、一致及び不一致を判定する。また、比較部１４は、比較の際、改ざん等の可能性を判定する。比較部１４は、処理の結果、比較結果データ２４を得る。

【0064】

（Ｓ５）ＰＣ２は、次にＳ５で出力処理を行う。出力部１５は、比較結果データ２４に基づいて、比較結果データ２４を含む出力データ２５を構成する。出力部１５は、出力データ２５を用いて、ＯＣＲ処理の結果画面をユーザへ表示する。出力部１５は、出力データ２５を保存する。ユーザは、結果画面を見て、帳票の記載内容の判断や確認、データの修正、確定等の作業を行う。帳票毎に、Ｓ１〜Ｓ５のような処理が同様に行われる。Ｓ１の画面では複数の帳票の連続処理も指定可能である。

【0065】

［読み取りモード］
実施の形態１の文字認識システムは、読み取りモードとして、「誤読低減モード」と「不読低減モード」がある。読み取りモードは、ＯＣＲ処理に関する制御用のモードである。

【0066】

「誤読低減モード」は、文字認識における誤読を低減させるモードである。誤読とは、帳票の画像から文字を認識して誤った文字へ変換してしまうことを指す。ユーザは、帳票の作業にあたり、誤読の低減を優先して、なるべく誤読を無くしたい場合、誤読低減モードを利用する。

【0067】

実施の形態１の文字認識システムは、誤読低減モードでは、文字認識処理において、画像からどの文字へ変換すべきかが曖昧で確定しにくい場合、誤読の結果を避けるため、積極的な変換はせずに、不読の結果とする。これにより、文字認識システムは、特定のアラート等を含む結果画面を出力し、ユーザによる判断を薦める。不読とは、帳票の画像から文字を認識して１つの文字へ変換できないことを指す。ユーザは、不読の結果の文字について、自分で確認や判断を行う。これにより、誤読の文字への確定が減少する。

【0068】

「不読低減モード」は、文字認識における不読を低減させるモードである。ユーザは、帳票の作業にあたり、不読の低減を優先して、なるべく不読を無くしたい場合、不読低減モードを利用する。

【0069】

実施の形態１の文字認識システムは、不読低減モードでは、文字認識処理において、特有の処理を適用し、不読の結果を避けるため、積極的な推測に基づいた文字変換を行う。これにより、従来の文字認識処理の場合には不読の結果になる文字についても、不読を解消するように文字変換し、不読を解消した文字を含む結果画面を出力する。

【0070】

以下、まず図４〜図１６を用いて、「誤読低減モード」の場合について説明する。

【0071】

［誤読低減モードの場合の処理フロー］
図４は、ＰＣ２における誤読低減モードの場合の処理フローを示す。以下、図４のステップS101〜S111の処理について、例を挙げながら説明する。

【0072】

（S101）ユーザは、ＰＣ２の画面で、帳票の２つの対象箇所のフィールドの読み取り、拡張機能、及び「誤読低減モード」等を指定し、実行指示を入力する。２つのフィールドは、例えば図２の（ａ）の記入欄５１の領域９１及び複記欄５２の領域９２である。

【0073】

（S102）ＯＣＲ装置１は、帳票入力部１１により、帳票の画像データ２１を得る。ＰＣ２は、文字認識部１２により、帳票の２つのフィールドを含む領域を読み取り、２つの文字列のデータを含む認識結果文字データ２２を得る。

【0074】

（S103）ＰＣ２は、S102の認識結果文字データ２２における２つの文字列において、不読が無いかどうかを確認する。不読が有る場合（S103−Ｎ）は、不読が有る旨の結果とし、S111へ移る。この場合、S111では、不読が有る旨の結果画面を表示し、処理を終了する。不読が無い場合（S103−Ｙ）は、S104へ移る。

【0075】

（S104，S105） S104で、ＰＣ２は、画像データ２１及び認識結果文字データ２２に基づいて、２つの文字列について、位置ずれ補正処理を行う。位置ずれ補正処理は、対象箇所である記入欄５１や複記欄５２の領域に対して、金額等の文字列が、ずれた位置に記入または印字されている場合に対処する処理である。

【0076】

ＰＣ２は、帳票の領域の指定のフィールド内に、対象の文字列が有る場合、S104の処理の結果を「空白無し」とする。ＰＣ２は、指定のフィールド内に、対象の文字列が無い場合、対象のフィールドの周りを探索する。ＰＣ２は、探索の結果、文字列が見つかった場合、S104の処理の結果を「空白無し」とし、その文字列を、認識結果文字データ２２に含め、以降の処理で対象とする。ＰＣ２は、探索の結果、文字列が見つからなかった場合、当該フィールド内は空白になっているため、S104の結果を「空白有り」とする。

【0077】

ＰＣ２は、S104の処理の結果が「空白有り」の場合（S105−Ｎ）、「空白有り」の旨の結果とし、S111へ移る。この場合、S111では、「空白有り」の旨の結果画面を表示し、処理を終了する。「空白無し」の場合（S105−Ｙ）は、S106へ移る。

【0078】

（S106，S107） S106で、ＰＣ２は、２つの対象箇所のフィールドの文字列について、桁数比較処理を行う。ＰＣ２は、この処理では、２つの文字列について、文字の種類に応じて、それぞれの桁数を判定し、両者の桁数を比較し、桁数の一致／不一致を判定する。

【0079】

S107で、ＰＣ２は、S106の処理の結果、桁数が不一致の場合（S107−Ｎ）、桁数が不一致の旨の結果とし、S111へ移る。この場合、S111では、桁数が不一致の旨の結果画面を表示し、処理を終了する。桁数が一致の場合（S107−Ｙ）は、S108へ移る。

【0080】

（S108）ＰＣ２は、変換部１３により、２つの対象箇所のフィールドの文字列について、文字の種類に関する変換処理を行う。なお、文字の種類を「文字種」ともいう。本例では、図２の（ａ）のように、数字欄６１の算用数字による文字列と、大字欄６２の漢数字による文字列とがある。変換部１３は、２つの文字列の文字種が異なるので、文字種の変換処理を行う。

【0081】

文字種の変換処理は、詳しくは、以下の３つの方式が挙げられる。それらを、説明上、第１の変換、第２の変換、第３の変換と称する。第１の変換とは、漢数字を算用数字へ合わせるように漢数字の文字列を変換することである。第２の変換とは、算用数字を漢数字へ合わせるように算用数字の文字列を変換することである。第３の変換とは、第１の変換と第２の変換との両方を行うことである。ユーザは、ＰＣ２の画面で、第１の変換等のいずれを利用するかを指定可能である。

【0082】

（S109）ＰＣ２は、比較部１４により、変換結果文字データ２３における、同じ文字種となった２つの文字列について、比較処理を行い、一致／不一致等を判定する。

【0083】

（S110）また、ＰＣ２は、比較部１４により、変換結果文字データ２３における、２つの文字列について、改ざん等の可能性を判定する処理を行う。比較部１４は、S109及びS110の処理の結果を、比較結果データ２４として出力する。

【0084】

（S111）ＰＣ２は、出力部１５により、S102〜S110の処理の結果に応じた出力データ２５を構成し、保存する。出力部１５は、出力データ２５に基づいた結果画面をユーザに表示する。ユーザは、結果画面で、帳票のデータの内容を確認する。ユーザは、特に、二重エントリの２つの金額について、一致／不一致やアラームの内容を確認する。

【0085】

［読み取り指定の画面例］
図５は、図４のS101に対応した、読み取り指定の際の画面例を示す。この画面は、２つの対象箇所に対応して、右側に示す「第１フィールド」欄と、左側に示す「第２フィールド」欄とがある。ユーザは、本画面で、例えば図２の（ａ）の帳票の数字欄６１及び大字欄６２の金額を読み取るために、２つの領域９１，９２や文字種を指定する。本例では、「第１フィールド」欄では、数字欄６１の領域９１が対象箇所として設定される。「第２フィールド」欄では、大字欄６２の領域９２が対象箇所として設定される。

【0086】

「第１フィールド」欄及び「第２フィールド」欄において、それぞれ、項目として、「文字タイプ」、「文字種」、「文字数」、「読み取り位置（座標）」、「拡張機能」、「読み取りモード」がある。各項目は、テキスト入力の形式でもよいし、リストボックスの選択肢から選択する形式、等でもよい。

【0087】

「文字タイプ」項目は、フィールドの文字列の文字タイプが指定される。文字タイプは、全角、半角、等がある。本例では、「第１フィールド」では「半角」、「第２フィールド」では「全角」が指定されている。「文字種」項目は、フィールドの文字列の文字種が指定される。文字種は、漢数字、算用数字、等がある。本例では、「第１フィールド」では「算用数字」、「第２フィールド」では「漢数字」が指定されている。「文字数」項目は、フィールドの文字列の最大文字数が指定される。本例では、「第１フィールド」では「１０」、「第２フィールド」では「１８」が指定されている。

【0088】

「読み取り位置（座標）」項目は、読み取りの対象のフィールドの位置が座標で指定される。この項目は、例えば矩形の領域を規定する２点の座標の指定のために、「水平スタート」、「水平エンド」、「垂直スタート」、「垂直エンド」の４つの項目を含む。本例では、「第１フィールド」の場合、対象の領域９１の左上の点の座標が（1000，500）であり、右下の点の座標が（1400，550）である。

【0089】

図２の（ａ）の例で、破線枠で示す領域９１，９２は、読み取り指定されたフィールドの例を示す。なお、この領域９１，９２は、数字欄６１及び大字欄６２の中の一部を除いた領域とした例である。一部とは、「（大字）」，「（数字）」の記載箇所である。これに限らず、フィールドとして帳票内の任意の領域が指定可能である。図２の（ｂ）の例のように、フィールドとして小写欄８１や大写欄８２と同じ領域も指定可能である。また、その場合、ＰＣ２は、フィールドの中に含まれる「（小写）」等の所定の文字を、対象外として処理してもよい。

【0090】

「拡張機能」項目は、拡張機能を利用する場合に指定可能である。本例では、「第１フィールド」の「拡張機能」項目の値として「金額（変換しない）」が選択された場合を示す。この値は、第１フィールドが二重エントリの金額の記入欄であること、及びその記入欄の文字列の文字種を変換せずに、第２フィールドの文字列と比較すること、等を指定する値である。また、「第２フィールド」の「拡張機能」項目の値として「金額（変換する）」が選択された場合を示す。この値は、第２フィールドが二重エントリの金額の複記欄であること、及び複記欄の文字列の文字種を変換して、第１フィールドの文字列と比較すること、等を指定する値である。

【0091】

「読み取りモード」項目は、読み取りモードとして、誤読低減モードと不読低減モードとから選択して指定可能である。本例では、「第１フィールド」及び「第２フィールド」で、誤読低減モードが指定されている。

【0092】

ユーザは、上記画面で、２つのフィールドの各項目の値を指定した後、ＯＫボタンにより設定する。ＰＣ２は、この設定情報に従い、ＯＣＲ処理を行う。ＰＣ２は、「文字種」項目及び「拡張機能」項目での指定に応じて、文字種の変換及び比較等の処理を行う。上記「文字種」及び「拡張機能」項目の設定例は、第１の変換に対応した設定例である。なお、第２の変換の場合、「第１フィールド」の「拡張機能」項目で「金額（変換する）」、「第２フィールド」の「拡張機能」項目で「金額（変換しない）」と指定される。第３の変換の場合、両方の「拡張機能」項目で「金額（変換する）」と指定される。

【0093】

また、「第１フィールド」及び「第２フィールド」の文字列の「文字種」項目の値が同じであり、両方の「拡張機能」項目で「金額（変換しない）」が指定された場合、ＰＣ２は、文字種を変換する必要が無いので変換せずに、両者の金額を比較する。「拡張機能」項目で何も指定されない場合、ＰＣ２は、２つの文字列の変換や比較を行わず、別々に文字認識を行う。

【0094】

なお、変形例として、「文字タイプ」と「文字種」が１つの項目に統合された構成でもよい。

【0095】

［文字認識の例］
図６は、図２の（ａ）の帳票の例、及び図４のS102に対応した、帳票の２つの対象箇所のフィールドについての文字認識の例を示す。文字認識部１２は、指定されたフィールド内の文字列を読み取る。

【0096】

図６の（ａ）は、第１フィールド及び第２フィールドのいずれの文字認識結果においても不読が無い場合を示す。右側は、第１フィールドの算用数字の文字列のデータを示す。この文字列のデータは、図２の（ａ）の数字欄６１に記入された文字列と同じである正しい文字列「\1,265-」である。先頭記号が「\」、末尾記号が「-」である。左側は、第２フィールドの漢数字の文字列のデータを示す。この文字列のデータは、図２の（ａ）の大字欄６２に記入された文字列と同じである正しい文字列「金壱千弐百陸拾伍円」である。先頭記号が「金」、末尾記号が「円」である。

【0097】

図６の（ｂ）は、第１フィールドの文字列の文字認識結果に不読が有る場合を示す。第１フィールドの算用数字において、文字「5」が不読となっている。図６の（ｃ）は、第２フィールドの文字列の文字認識結果に不読が有る場合を示す。不読の箇所を記号「？」で示す。第２フィールドの漢数字において、文字「弐」が不読となっている。図６の（ｄ）は、第１フィールド及び第２フィールドの両方の文字列の文字認識結果に不読が有る場合を示す。第２フィールドの漢数字の文字「弐」、及び第１フィールドの算用数字の文字「5」が不読となっている。

【0098】

ＰＣ２は、文字認識の結果、図６の（ｂ）〜（ｄ）のように、２つのフィールドの一方または両方に、不読の文字が有る場合、不読が有る旨の結果とし、対応するアラートを含む結果画面をユーザに表示する。

【0099】

［位置ずれ補正処理］
図７は、図４のS104に対応した、位置ずれ補正処理の例を示す。指定のフィールドに対応した画像において空白である場合、ずれた位置に文字が記入または印字されている可能性がある。そこで、ＰＣ２は、位置ずれ補正処理として、指定のフィールドの外側を探索し、文字列が見つかった場合、その文字列を文字認識の結果に含めるように補正する。

【0100】

図７の（ａ）は、図２の（ａ）の帳票の例に対応し、大字欄６２の領域に対して、上側にずれた位置に、７０１に示すように、金額の漢数字が印字されており、これにより大字欄６２が空白になっている。なお、ここでは大字欄６２が第２フィールドである。

【0101】

図７の（ｂ）は、図７の（ａ）の場合の位置ずれ補正処理として、大字欄６２の領域に対して、上下左右に範囲を拡げて、文字列を探索する例である。７０２は、探索の範囲を示す。ＨＸは、水平方向に拡げる幅の設定値を示す。ＨＹは、垂直方向に拡げる幅の設定値を示す。

【0102】

ＰＣ２は、７０２の範囲で、所定の文字記号を目標にしながら、文字列を探索する。この目標の文字記号は、前述の「金」等の先頭記号や、「円」等の末尾記号が挙げられる。上記範囲の設定値は、任意に設定可能である。ＰＣ２は、範囲を拡げても文字列が見つからない場合、「空白有り」の旨の結果とし、対応するアラートを含む結果画面をユーザに表示する。

【0103】

図７の（ｃ）は、位置ずれ補正処理等の際に用いる、特定の記号文字の表７０３を示す。この表７０３は、先頭記号、末尾記号、その他の記号について、日本や中国毎に、一覧で登録されている。なお、ここでは、末尾記号として、「円」や「元」等の通貨記号を含めている。

【0104】

［桁数比較処理］
図８は、図４のS106に対応した、桁数比較処理の例を示す。

【0105】

図８の（ａ）は、図２の（ａ）に対応した、第１フィールドの算用数字の文字認識結果の文字列のデータと、第２フィールドの漢数字の文字認識結果の文字列のデータとを示す。ＰＣ２は、２つの文字列において、先頭記号、末尾記号、桁漢字、カンマ等の文字記号に基づいて、それぞれの桁数を判定し、両者を比較する。ＰＣ２は、第１フィールドの文字列のうち、先頭記号「\」と末尾記号「-」との間にある、算用数字及びカンマの部分である「1,265」をみることにより、算用数字の桁数が４とわかる。また、ＰＣ２は、第２フィールドの文字列のうち、先頭記号「金」と末尾記号「円」との間にある、桁漢字等をみることにより、漢数字の桁数が４とわかる。桁漢字は、「千」，「百」，「拾」等である。本例では、２つのフィールドの文字列の桁数が一致している。

【0106】

図８の（ｂ）は、桁数比較処理に用いる表を示す。表８０１は、日本及び中国のそれぞれについて、桁漢字ごとの桁数を格納している。例えば桁漢字が「千」である場合、桁数が４であり、桁漢字が「拾万」である場合、桁数が８である。

【0107】

図８の（ｃ）は、中国の場合の桁数比較処理の例を示す。ＰＣ２は、第１フィールドの算用数字の文字列における最終の部分である、ピリオド後の数字を参照する。ピリオド後の数字が例えば「00」である。また、ＰＣ２は、第２フィールドの漢数字の文字列における最終の部分である、末尾記号を参照する。ここでは、末尾記号として、漢字「元」、及び「元」以後の漢字「整」がある。ＰＣ２は、図８の（ｂ）の表８０２を参照する。

【0108】

表８０２は、図８の（ｃ）の中国の場合の桁数比較処理に用いる表を示す。この表８０２は、第1行の「末尾漢字」と、第２行の「ピリオド後の数字」とが関係付けられている。例えば末尾漢字「整」と、ピリオド後の数字「00」とが対応する。同様に、末尾漢字「角」と、ピリオド後の数字「10」〜「90」とが対応する。末尾漢字「分」と、ピリオド後の数字「01」〜「09」とが対応する。

【0109】

ＰＣ２は、上記桁数比較処理の結果、２つの文字列の桁数が一致しない場合、桁数が不一致の旨の結果とし、対応するアラームを含む結果画面をユーザに表示する。なお、ユーザは、設定画面で、位置ずれ補正処理や桁数比較処理の実行有無を設定可能である。

【0110】

［変換処理例（１）］
図９の（ａ）は、図４のS108の第１の変換の場合に対応した、文字種の変換処理の例を示す。変換部１３は、比較対象である２つのフィールドの文字列について、図１０の変換表に従い、文字種の変換処理を行う。第１の変換の場合、第１フィールドの算用数字は、変換の非対象であり、第２フィールドの漢数字は、変換の対象である。変換部１３は、第２フィールドの文字列の文字種である漢数字を、第１フィールドの文字列の文字種である算用数字に合わせるように、第２フィールドの文字列を変換する。

【0111】

図１０は、文字種の変換処理に用いる変換表の構成例を示す。

【0112】

図１０の（ａ）は、日本の場合の変換表１５１の一部を示す。この変換表１５１は、第１列の「漢数字」、第２列の「算用数字」、及び第３列の「桁数」の関係付け情報が設定されている。この変換表１５１に従い、例えば、「零円」は「0」に、「壱円」は「1」に、「壱拾」は「10」に変換される。

【0113】

図１０の（ｂ）は、同様に、中国の場合の変換表１５２の一部を示す。この変換表１５２は、更に、「元」以後の「整」等の文字、ピリオド以後の数字、及び桁数の関係付け情報が設定されている。この変換表１５２に従い、例えば、以下のように変換される。

【0114】

【数3】

【0115】

図９の（ａ）の第２フィールドの文字列は、図１０の（ａ）の変換表１５１に従い、「壱千」が「1,000」に、「弐百」が「200」に、「陸拾」が「60」に、「伍円」が「5」に変換される。変換部１３は、各文字の変換後の数字を加算する。即ち、変換後の文字列の算用数字は、1,000＋200＋60＋5＝1,265となる。

【0116】

なお、図１０の変換表は、第１の変換、第２の変換のいずれでも使用できる。第１の変換の場合、変換表において、第１列が変換前の文字、第２列が変換後の文字として参照される。第２の変換の場合、変換表において、第２列が変換前の文字、第１列が変換後の文字として参照される。

【0117】

［変換処理例（２）］
図９の（ｂ）は、図４のS108の第２の変換の場合に対応した、文字種の変換処理の例を示す。変換部１３は、比較対象の２つのフィールドの文字列について、図１０の変換表に従い、文字種の変換処理を行う。第２の変換の場合、第１フィールドの算用数字は、変換の対象であり、第２フィールドの漢数字は、変換の非対象である。変換部１３は、第１フィールドの文字列の文字種である算用数字を、第２フィールドの文字列の文字種である漢数字に合わせるように、第１フィールドの文字列を変換する。

【0118】

変換部１３は、第２の変換の場合、図１０の（ａ）の変換表１５１を用いて、算用数字の個々の数字ごとに、漢数字へ変換する。図９の（ｂ）の第１フィールドの文字列は、図１０の（ａ）の変換表１５１に従い、「1」が「壱千」に、「2」が「弐百」に、「6」が「陸拾」に、「5」が「伍」に変換される。変換部１３は、各数字の変換後の漢字ごとに、第２フィールドの文字列のうちの対応する位置の非変換の漢字と比較し、一致／不一致を判定する。各変換後の文字が全て一致する場合、総合的な比較結果として一致となり、変換後の文字が１つでも不一致の場合、総合的な比較結果として不一致となる。変換部１３は、各変換後の文字を接続して１つの文字列にする。変換後の文字列である漢数字は、「壱千」＋「弐百」＋「陸拾」＋「伍」＝「壱千弐百陸拾伍」となる。

【0119】

［変換及び比較処理（１）］
図１１は、図４のS108の第１の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。変換部１３は、第２フィールドの文字列の漢数字を算用数字に変換する。比較部１４は、第２フィールドの変換後の文字列である算用数字と、第１フィールドの非変換の文字列である算用数字とを全体で比較し、一致／不一致を判定する。以下、図１１のステップS201〜S209の処理について説明する。

【0120】

（S201）変換部１３は、第２フィールドの文字列の開始文字から順に終了文字まで調べて、「数漢字」及び「桁漢字」の文字を探す。図９の（ａ）の例では、左端から順に文字が検出され、開始文字が先頭記号「金」であり、終了文字が末尾記号「円」である。また、「数漢字」とは、「壱」等であり、「桁漢字」とは、「千」等である。

【0121】

（S202）変換部１３は、S201で得た数漢字及び桁漢字の文字について、図１０の（ａ）の変換表１５１を用いて、算用数字へ変換する。なお、中国の場合、図１０の（ｂ）の変換表１５２を用いて同様に処理が行われる。

【0122】

（S203）変換部１３は、S202の変換結果の算用数字を加算する。

【0123】

（S204）変換部１３は、第２フィールドの文字列のうち、対象の文字の桁数が０になるまで、S201〜S203の処理を繰り返す。桁数が０の場合（S205−Ｙ）は、S205へ移る。桁数が０とは、末尾記号「円」等に到達した場合である。

【0124】

（S205）変換部１３は、S204までの第２フィールドの変換結果の数字と、第１フィールドの算用数字とを全体で比較して、一致／不一致等を判定する比較処理を行い、その結果を比較結果データ２４として保存する。

【0125】

（S206）変換部１３は、対象が日本の帳票である場合（S206−Ｎ）、処理を終了し、対象が中国の帳票である場合（S206−Ｙ）、S207へ移る。

【0126】

（S207，S208）変換部１３は、中国の帳票における第２フィールドの文字列において、「元」以降の文字を探し、同様に、算用数字への変換や加算を行う。変換部１３は、数漢字や、「角」等の桁漢字について、図１０の（ｂ）の変換表１５２を用いて、算用数字へ変換し、変換結果の算用数字を加算する。変換部１３は、文字列の最終文字になるまで（S208−Ｎ）、同様に処理を繰り返し、最終文字になると（S208−Ｙ）、S209へ移る。

【0127】

（S209）変換部１３は、S207，S208の処理の結果である「元」以降の文字列の変換結果の算用数字について、第１フィールドの文字列のピリオド以降の算用数字との比較処理を行い、その結果を比較結果データ２４へ反映して保存する。

【0128】

［変換及び比較処理（２）］
図１２は、図４のS108の第２の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。変換部１３は、第１フィールドの文字列の算用数字を漢数字に変換する。比較部１４は、第１フィールドの変換後の文字列である漢数字と、第２フィールドの非変換の文字列である漢数字との比較処理として、各桁の文字毎に比較して、一致／不一致を判定する。以下、図１２のステップS301〜S311の処理について説明する。

【0129】

（S301）変換部１３は、第１フィールドの文字列の開始文字から順に終了文字までを調べ、個々の文字である［数字］に着目する。変換部１３は、その着目する［数字］毎に、（［桁数］−ｎ）を計算する。［桁数］は、第１フィールドの文字列の桁数を示す。変換部１３は、前述の桁数比較処理による［桁数］を得る。ｎは、繰り返し処理の回数を示し、最初はｎ＝０である。図９の（ｂ）の例では、変換部１３は、左端から順に、まず先頭記号「\」の次の数字「1」を得る。文字列「1265」の［桁数］は４である。ｎ＝０である。よって、（［桁数］−ｎ）＝（４−０）＝４である。

【0130】

（S302）変換部１３は、S301の［数字］、及び（［桁数］−ｎ）の計算値に基づいて、図１０の（ａ）の変換表１５１を用いて、数字を漢数字へ変換する。変換部１３は、（［桁数］−ｎ）の計算値により、変換表１５１の「桁数」列の値を参照する。例えば計算値＝４の場合、「桁数」列の値が４である第４行が該当する。この第４行の情報において、［数字］＝「1」から、対応する算用数字が「1000」、漢数字が「壱千」とわかる。よって、変換部１３は、着目の［数字］＝「1」について、漢数字「壱千」へ変換する。

【0131】

（S303〜S305） S303で、変換部１３は、S302の第１フィールドの変換結果の漢数字である部分文字と、第２フィールドの漢数字における対応する位置の部分文字とを比較する。変換部１３は、比較の結果、一致する場合（S304−Ｙ）、S305へ移り、一致しない場合（S304−Ｎ）、文字列単位での比較結果を不一致と判定し、S311へ移る。S305で、変換部１３は、ｎ回繰り返しのためにｎを１増加し、その結果、着目の［数字］について桁数が０になる場合（S305−Ｙ）、S306へ移り、桁数が０ではない場合（S305−Ｙ）、S301へ戻って同様に繰り返す。

【0132】

なお、次のｎ＝１の場合、S301では、（［桁数］−ｎ）＝（４−１）＝３である。この値＝３により、変換表１５１の「桁数」列の値が３である第３行が参照される。第３行において、［数字］＝「2」から、対応する算用数字が「200」、漢数字が「弐百」とわかる。

【0133】

（S306）変換部１３は、対象が中国の場合（S306−Ｙ）、S307〜S310の処理を行い、対象が日本の場合（S306−Ｎ）、S311へ移る。

【0134】

（S307）変換部１３は、中国の帳票の文字列における、ピリオド以降の数字を探す。変換部１３は、ピリオド以降の数字について、同様に、図１０の（ｂ）の変換表１５２に従い、漢数字へ変換する。

【0135】

（S308〜S310）変換部１３は、S307の変換結果の漢数字の部分文字と、第２フィールドの漢数字の部分文字とを比較し、一致／不一致を判定する。変換部１３は、比較の結果、一致する場合（S309−Ｙ）、S310へ移り、一致しない場合（S309−Ｎ）、文字列単位での比較結果を不一致と判定し、S311へ移る。S310では、文字列の最終文字である場合（S310−Ｙ）、S311へ移り、最終文字でない場合（S310−Ｎ）、S307へ戻り、同様に繰り返す。

【0136】

（S311）変換部１３は、２つの文字列の一致または不一致の結果に応じた比較結果データ２４を保存し、処理を終了する。

【0137】

［比較処理例］
図１３は、図４のS109に対応した、文字列の比較処理の例を示す。

【0138】

図１３の（ａ）は、図１１に対応した第１の変換の場合の比較処理と、図１２に対応した第２の変換の場合の比較処理との概要を示す。なお、説明上、第１の変換に対応して、第２フィールドの変換後の文字列の算用数字と、第１フィールドの非変換の文字列の算用数字との比較を、第１の比較と称する。第２の変換に対応して、第１フィールドの変換後の文字列の漢数字と、第２フィールドの非変換の文字列の漢数字との比較を、第２の比較と称する。

【0139】

図１３の（ｂ）は、第１の比較の例として、不一致の場合を示す。第２フィールドの変換後の文字列の算用数字と、第１フィールドの非変換の文字列の算用数字とが不一致である。第２フィールドの変換後の文字列の算用数字は、正しい数字「1,265」である。第１フィールドの非変換の文字列の算用数字は、正しくない数字「7,265」となっている。即ち、「1」と「7」の部分で不一致である。正しくない数字になっている原因としては、記入誤り、改ざん、文字認識での誤読、等が挙げられる。記入誤りの場合、記入者は、「1」を誤って「7」と記入している。改ざんの場合、改ざん者は、記入済みの「1」を意図的に「7」に読めるように加工している。誤読の場合、ＰＣ２は、文字認識処理の際、画像から「1」を「7」として推定して文字変換している。

【0140】

図１３の（ｃ）は、第２の比較の例として、不一致の例を示す。第１フィールドの変換後の文字列の漢数字と、第２フィールドの非変換の文字列の漢数字とが不一致である。第１フィールドの変換後の文字列の漢数字は、正しい「壱千弐百陸拾伍」である。第２フィールドの非変換の文字列の漢数字は、正しくない「七千弐百陸拾伍」となっている。即ち、「壱千」と「七千」の部分で不一致である。正しくない漢数字になっている原因としては、同様に、記入誤り、改ざん、文字認識での誤読、等が挙げられる。

【0141】

なお、第３の変換が指定されている場合、第１の変換及び第１の比較と、第２の変換及び第２の比較との両方が行われる。ＰＣ２は、両方の結果をユーザへ出力する。ユーザは、画面で両方の結果を見て、判断や確認ができる。この場合、二重のチェックになるため、精度を更に高めることができる。

【0142】

［改ざん可能性判定処理］
図１４は、図４のS110に対応した、比較部１４による改ざん可能性判定処理の例を示す。

【0143】

図１４の（ａ）は、第１の変換及び第１の比較の場合の改ざん可能性判定処理の例を示す。比較部１４は、図１３のような２つの文字列の比較処理の結果、不一致である場合、改ざん等の可能性を判定する。比較部１４は、図１４の（ｂ）の改ざん可能性判定用の判定表１４０を参照して、改ざん等の可能性を判定する。

【0144】

本例では、第２フィールドの文字列は正しい漢数字であり、第１の変換の結果の文字列は正しい算用数字「1,265」である。また、第１フィールドの文字列の算用数字については、文字認識結果の文字列において、正しくない算用数字「7,265」になっている。よって、両者の文字列についての第１の比較の結果が不一致となっている。

【0145】

図１４の（ｂ）は、改ざん可能性判定用の判定表１４０を示す。この判定表１４０は、列として、「漢数字（日本）」、「漢数字（中国）」、「算用数字」、「改ざん候補算用数字」がある。この表は、改ざん等の可能性が有り得る組合せ、または可能性が高い組合せが、各行に設定されている。「漢数字（日本）」列は、日本の場合の漢数字の文字が一覧で格納されている。同様に、「漢数字（中国）」列は、中国の場合の漢数字の文字が一覧で格納されている。「算用数字」列は、「漢数字」の値に対応付けられる算用数字の文字が格納されている。「改ざん候補算用数字」列は、当該行の漢数字と算用数字との組に関して、改ざん等の候補として考えられる算用数字が格納されている。

【0146】

例えば第１行は、「壱」と「1」の組に関して、改ざん候補算用数字として、「4」，「7」，「9」が設定されている。これは、例えば改ざん者が「1」を他の数字へ改ざんする場合に、「4」，「7」，「9」へ変える可能性が高いことを考慮して設定されている。

【0147】

図１４の（ｃ）は、実際の改ざんの例を示す。左側から、「1」を「4」へ変える例、「1」を「7」へ変える例、「2」を「3」へ変える例を示す。このように、線の追加あるいは消去により、数字が改ざんされる可能性がある。また、意図的な改ざん以外にも、ごみの付着等を含め、誤って線が追加あるいは消去されてしまう場合も有り得る。また、判読しにくく曖昧な形の文字が記入されている場合、文字認識結果で誤読や不読になる可能性が高くなる。

【0148】

比較部１４は、図１４の（ａ）の第１の比較の結果が不一致である場合、不一致の部分である「1」及び「7」と、「1」の変換前の文字である「壱」とを把握する。そして、比較部１４は、「壱」と「1」と「7」の組合せに基づいて、判定表１４０を参照し、その組合せに該当する行がある場合は検出する。本例では、第１行の「改ざん候補算用数字」の値の中に「7」があるので、第１行がその組合せに該当する。よって、比較部１４は、図１４の（ａ）の比較結果について、改ざん可能性が高いと判定する。逆に、比較部１４は、比較結果について、判定表１４０の中に該当する行が無い場合、改ざん可能性が低いと判定する。

【0149】

［結果画面の出力例］
図１５及び図１６は、図４のS111に対応した、出力部１５による結果画面の出力例を示す。図２の（ａ）の帳票の例を用いて説明する。出力部１５は、図４の不読が有る等の判定結果ごとに、異なる表示内容の結果画面を出力する。

【0150】

図１５の（ａ）は、２つのフィールドの文字列の比較結果が一致の場合の出力例を示す。第１の変換及び第１の比較の結果、両者の文字列は一致している。出力部１５は、画面に、２つのフィールドの文字認識結果の文字列をそのまま表示すると共に、比較結果情報として「金額が一致しています。」といったメッセージを表示する。また、出力部１５は、画面に、第２フィールドの文字種の変換後の文字列を表示してもよい。画面に例えば「変換後の金額：1,265」といった情報が表示される。

【0151】

上記一致の結果の場合、出力部１５は、正常と判定し、アラートを出力しない。また、出力部１５は、画面で、フィールド及びその金額の文字列等の情報を、白黒や青等、目立たない色で表示する。また、この場合、出力部１５は、画面を表示させずに、対応する出力データ２５を保存するのみとしてもよい。

【0152】

また、出力部１５は、画面内に、ＯＫボタンや修正ボタンを設ける。ユーザは、画面で、ある帳票に関するＯＣＲ処理の結果を見て、確認した場合は、ＯＫボタンにより、終了ができる。また、ユーザは、画面で結果を見て、データの修正等の作業を行う場合、修正ボタンにより、その帳票のデータに関する修正用の画面へ遷移できる。

【0153】

図１５の（ｂ）は、２つのフィールドの文字列の一方または両方に、文字認識結果として不読がある場合の出力例を示す。本例では、第１フィールドの算用数字に不読がある。出力部１５は、画面に、文字認識結果の文字列を表示する際、不読の箇所を例えば記号「？」で表示する。

【0154】

この結果の場合、出力部１５は、第１のアラートを出力する。第１のアラートは、軽いレベルのアラートであり、ユーザへの注意喚起に相当する。出力部１５は、第１のアラートとして、画面に、「不読の箇所「？」があります。」といったメッセージを表示する。また、出力部１５は、第１のアラートとして、画面で、不読を含むフィールド、または２つのフィールドを、黄色等で表示する。これにより、図１５の（ａ）のようなアラート無しの場合よりも目立つようにする。

【0155】

図１５の（ｃ）は、２つのフィールドの文字列の一方または両方において空白有りの場合の出力例を示す。本例では、第２フィールドが空白である。出力部１５は、文字認識及び位置ずれ補正処理の結果、空白有りの場合、この画面で、フィールドのデータを空白として表示する。

【0156】

この結果の場合、出力部１５は、例えば第１のアラートを出力する。出力部１５は、画面に、「空白があります。」といったメッセージを表示する。また、出力部１５は、画面で、空白を含むフィールド、または２つのフィールドを、黄色等で表示する。

【0157】

図１５の（ｄ）は、２つのフィールドの文字列において桁数が不一致の場合の出力例を示す。本例では、第１フィールドの算用数字が「265」であり、その桁数が３である。第２フィールドの漢数字は桁数が４である。よって、両者の桁数が不一致になっている。

【0158】

この結果の場合、出力部１５は、例えば第１のアラートを出力する。出力部１５は、画面に、「桁数が一致しません。」といったメッセージを表示する。出力部１５は、画面で、２つのフィールドを、黄色等で表示する。出力部１５は、画面に、変換後の文字列の金額や、各文字列の桁数を表示してもよい。

【0159】

図１６の（ａ）は、２つのフィールドの文字列の比較結果が不一致であり、かつ、改ざん可能性判定処理の結果、改ざん可能性が低いと判定された場合の出力例を示す。本例では、第１フィールドの文字列は正しい算用数字「1,265」であり、第２フィールドの文字列は誤った漢数字「壱千陸百陸拾伍」である。また、変換後の金額が「1,665」であり、両者の金額が不一致である。不一致の部分の組合せは、「陸」，「6」，「2」である。図１４の改ざん可能性判定処理で、判定表１４０には、「陸」，「6」，「2」の組合せに該当する行が無いので、改ざん可能性が低いと判定される。

【0160】

この結果の場合、出力部１５は、例えば第１のアラートを出力する。出力部１５は、画面に、比較結果情報として「金額が一致していません。」といったメッセージ、及び変換後の文字列の金額、等を表示する。出力部１５は、画面で、２つのフィールドを、黄色等で表示する。また、出力部１５は、フィールドの文字列のうち、不一致の箇所の文字を、わかりやすいように、異なる色やマーク等で目立つように表示してもよい。

【0161】

図１６の（ｂ）は、２つのフィールドの文字列の比較結果が不一致であり、かつ、改ざん可能性判定処理の結果、改ざん可能性が高いと判定された場合の出力例を示す。本例では、第１フィールドの文字列は誤った算用数字「7,265」であり、第２フィールドの文字列は正しい漢数字「壱千弐百陸拾伍」である。また、変換後の金額が「1,265」であり、両者の金額が不一致である。不一致の部分の組合せは、「壱」，「1」，「7」である。図１４の改ざん可能性判定処理で、判定表１４０には、「壱」，「1」，「7」の組合せに該当する行が有るので、改ざん可能性が高いと判定される。

【0162】

この結果の場合、出力部１５は、第２のアラートを出力する。第２のアラートは、第１のアラートよりも強いレベルのアラートであり、ユーザへの警告に相当する。出力部１５は、第２のアラートとして、画面で、２つのフィールドを、赤色等、目立つ色で表示する。また、出力部１５は、画面に、比較結果情報として「金額が一致していません。」、「改ざんの可能性があります。」等のメッセージ、及び変換後の文字列の金額等を表示する。ユーザは、第２のアラートから、改ざん可能性を考慮して確認や判断ができる。

【0163】

また、出力部１５は、画面に、２つのフィールドの文字列の金額の金額差を表示してもよい。例えば、比較部１４は、金額差を計算する。第１フィールドの金額が「7265」、第２フィールドの金額が「1265」である場合、金額差は、7265−1265＝6000である。出力部１５は、画面に、「金額差＝6000」のような情報を表示する。

【0164】

更に、比較部１４は、上記金額差を、閾値と比較し、金額差が閾値以上に大きい場合に、上記第２のアラートを出力するようにしてもよいし、あるいは、第２のアラートよりも更に強いレベルのアラートを出力するようにしてもよい。ユーザは、金額差を考慮して確認や判断ができる。

【0165】

上記のように、ＰＣ２は、比較結果が不一致である原因を推定し、比較結果や原因の推定に応じたアラートを含む結果画面をユーザに出力し、ユーザの判断を支援する。ユーザは、結果画面で、日本や中国の帳票における二重エントリの２つの金額等の文字列について、文字認識結果の文字列データ、比較や判定の結果、及びアラートの内容を見て確認することができる。よって、ユーザは、確認や判断がしやすく、効率的に作業ができる。なお、実施の形態１では、アラートについて、第１及び第２のアラートのように大別して２種類としたが、これに限らず可能である。

【0166】

［不読低減モードの場合］
次に、図１７〜図２１を用いて、「不読低減モード」の場合について説明する。不読低減モードの場合の処理は、誤読低減モードの場合の処理に対して、主に異なる点として、以下が挙げられる。

【0167】

ＰＣ２は、２つのフィールドの文字列についての第１の文字認識の結果において、不読が有る場合、不読が有る場合に対応した特有の処理を行う。この特有の処理は、第２の文字認識の処理、改ざん可能性判定を含む比較処理を含む。なお、説明上、文字認識部１２による文字認識処理を、二段階の処理に分け、第１の文字認識、第２の文字認識とする。第１の文字認識の処理は、従来の処理と同様であり、一旦、不読の有無を含む結果を出す。第２の文字認識の処理は、新たな処理であり、第１の文字認識の結果の不読の文字について、不読を解消するための文字変換を行う。

【0168】

［不読低減モードの場合の処理フロー］
図１７は、ＰＣ２における不読低減モードの場合の処理フローを示す。以下、図１７のステップS401〜S409の処理について、例を挙げながら説明する。

【0169】

（S401）ユーザは、ＰＣ２の画面で、帳票の二重エントリの２つの対象箇所のフィールドの読み取り、拡張機能、及び「不読低減モード」等を指定し、実行指示を入力する。

【0170】

（S402〜S404） S402〜S404の処理は、図４のS102，S104，S106の処理と基本的に同様である。S402では、文字認識部１２による第１の文字認識の処理により、認識結果文字データ２２を得る。この際、文字認識結果として「不読」が発生する場合がある。「不読低減モード」では、ＰＣ２は、文字認識結果に「不読」の文字が有る場合でも、終了せずに、次のS403以降の処理を行う。S403では位置ずれ補正処理が行われ、S404では桁数比較処理が行われる。

【0171】

（S405） S405で、ＰＣ２は、不読の有無を確認する。不読が無い場合（S405−Ｙ）は、S406へ移り、不読が有る場合（S405−Ｎ）は、S407へ移る。

【0172】

（S406）比較部１４は、一方のフィールドの文字列と、他方のフィールドの文字列とについて、不読が無い場合に対応した変換及び比較処理を行う。この変換及び比較処理は、図４のS108やS109と同様である。

【0173】

（S407）比較部１４は、一方のフィールドの文字列と、他方のフィールドの文字列とについて、不読が有る場合に対応した変換及び比較処理を行う。変換部１３は、変換処理では、S402の文字認識結果の文字列における「不読」以外の文字について、図１０の変換表に従い、文字種を変換する。

【0174】

（S408） S406またはS407の後、比較部１４は、変換結果文字データ２３における２つの文字列について、改ざん等の可能性を判定する処理を行う。比較部１４は、処理の結果を比較結果データ２４として出力する。

【0175】

（S409）出力部１５は、比較結果データ２４に基づいて、出力データ２５を構成し、出力データ２５を保存し、結果画面をユーザに表示する。

【0176】

［変換及び比較処理（３）］
図１８は、図１７のS407、及び第１の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。以下、図１８のステップS501〜S508の処理を説明する。

【0177】

（S501）変換部１３は、変換対象の第２フィールドの文字列の開始文字から順に調べ、数漢字及び桁漢字の文字を探す。

【0178】

（S502）対象の文字列について、文字認識結果で不読が無い場合（S502−Ｙ）は、S503へ移り、不読が有る場合（S502−Ｎ）は、S504へ移る。

【0179】

（S503）変換部１３は、不読が無い場合に対応した文字種の変換処理を図４のS108と同様に行う。第１の変換の場合、図１０の変換表を用いて、漢数字が算用数字へ変換される。

【0180】

（S504，S505）変換部１３は、不読が有る場合に対応した処理を行う。この処理については後述する。この処理の結果、不読の文字について、第２の文字認識による文字変換が可能であり当該文字変換がされた場合（S505−Ｙ）、S506へ移り、不可能であり当該文字変換がされていない場合（S505−Ｎ）、処理を終了する。

【0181】

（S506） S503またはS505の後、変換部１３は、変換結果の算用数字を加算する。

【0182】

（S507）変換部１３は、第２フィールドの文字列のうち、対象の文字が、最終文字になるまで、S501〜S506の処理を繰り返す。対象の文字が最終文字になると（S507−Ｙ）、S508へ移る。なお、対象が中国の帳票の場合、「元」以降の文字について、最終文字になるまで、同様に処理が行われる。

【0183】

（S508）変換部１３は、S507までの第２フィールドの変換結果の数字と、第１フィールドの算用数字とを比較し、一致／不一致を判定し、その結果を比較結果データ２４として保存する。

【0184】

［変換及び比較処理（４）］
図１９は、図１７のS407、及び第２の変換の場合に対応した、変換処理及び比較処理を含むフローを示す。以下、図１９のステップS601〜S609の処理を説明する。

【0185】

（S601）変換部１３は、図１２のS301と同様に、変換対象の第１フィールドの文字列の開始文字から順に調べ、着目の［数字］毎に、（［桁数］−ｎ）を計算する。

【0186】

（S602）対象の文字列について、文字認識結果で不読が無い場合（S602−Ｙ）は、S603へ移り、不読が有る場合（S602−Ｎ）は、S604へ移る。

【0187】

（S603）変換部１３は、不読が無い場合に対応した文字種の変換処理を、図４のS108と同様に行う。第２の変換の場合、図１０の変換表を用いて、算用数字が漢数字へ変換される。

【0188】

（S604，S605）変換部１３は、不読が有る場合に対応した処理を行う。この処理の結果、不読の文字について、不読を解消する文字変換が可能であり当該文字変換がされた場合（S605−Ｙ）、S606へ移り、不可能であり当該文字変換がされていない場合（S605−Ｎ）、S609へ移る。なお、変換部１３は、文字変換が不可能の場合、S608へ移り、不読の文字以降の文字について同様に処理を繰り返してもよい。

【0189】

（S606〜S608） S603またはS605の後、変換部１３は、第１フィールドの変換結果の漢数字の部分文字と、第２フィールドの漢数字の対応する位置の部分文字とを比較する。比較の結果、一致する場合（S607−Ｙ）、S608へ移り、一致しない場合（S607−Ｎ）、文字列単位での比較結果を不一致と判定し、S609へ移る。S608で、変換部１３は、ｎ回繰り返しのためにｎを１増加し、その結果、着目の数字が最終文字になる場合（S608−Ｙ）はS609へ移り、最終文字でない場合（S608−Ｙ）はS601へ戻って同様に繰り返す。なお、対象が中国の帳票の場合、ピリオド以降の数字について、最終文字になるまで、同様に処理が行われる。

【0190】

（S609）変換部１３は、文字列の一致／不一致の結果に応じた比較結果データ２４を保存し、処理を終了する。

【0191】

［不読が有る場合の処理］
図２０及び図２１を用いて、図１７のS407に対応した、不読が有る場合の処理について説明する。ＰＣ２は、文字認識部１２及び比較部１４等を用いて、この処理を行う。この処理は、第１の文字認識において不読が有る場合に、第１の文字認識の候補の文字を比較対象として含めて、改ざん等の可能性を判定しつつ、不読の文字をできるだけ文字変換して不読を解消する処理である。

【0192】

図２０は、不読が有る場合の処理として、第１の変換の場合の例を示す。第１フィールドに記入されている算用数字は「1,265」である。第２フィールドに記入されている漢数字は「金壱千弐百陸拾伍円」である。第１フィールドの算用数字に対する第１の文字認識の結果は不読が有る。文字列「1,265」のうち文字「1」が不読の例である。文字列「1,265」のうち他の文字については、誤読及び不読が無い。第２フィールドの漢数字に対する第１の文字認識の結果は、誤読及び不読が無い。第１の変換により、第２フィールドの漢数字は算用数字へ変換される。第１の変換の後の文字列の算用数字は「1,265」である。

【0193】

ＰＣ２は、算用数字に不読が有る場合、その不読の文字について、所定の組合せの値を比較し、不読の解消のために第２の文字認識による文字変換を試みる。所定の組合せは、（１）第２フィールドの漢数字の第１の文字認識の結果の文字と、（２）第１フィールドの算用数字の第１の文字認識における候補文字と、を含む。ＰＣ２は、算用数字に不読が有る場合、図２１の不読が有る場合の処理表２１０、及び図１４の改ざん可能性判定用の判定表１４０を参照し、上記組合せの値の比較に基づいて、第２の文字認識を行う。

【0194】

第１の文字認識における候補文字の例として、第１の候補文字がＸ、第２の候補文字がＹ、等とする。第１の文字認識の処理では、これらの候補文字のいずれかに確定して文字変換することができず、結果が不読となっている。

【0195】

図２１は、不読が有る場合の処理用の表の構成例を示す。図２１の（ａ）は、不読が有る場合の処理表２１０として、日本の帳票の場合及び第１の変換の場合に対応した一部分を示す。この処理表２１０は、図２０の例、即ち記入された算用数字「1」に不読が有る場合に対応した部分を示す。

【0196】

処理表２１０において、列として、「記入算用数字」、「認識結果漢数字」、「文字認識の第１候補」、「文字認識の第２候補」、「文字変換、出力」がある。「記入算用数字」は、図２０の第１フィールドに記入された算用数字、特に「1」の場合を示す。「認識結果漢数字」は、図２０の第２フィールドの漢数字の第１の文字認識の結果の漢数字、特に「壱」の場合を示す。「文字認識の第１候補」及び「文字認識の第２候補」は、図２０の第１の文字認識における候補文字のうちの第１の候補文字Ｘ及び第２の候補文字Ｙが対応する。「文字変換、出力」は、第２の文字認識における文字変換の結果とする文字またはアラート等の出力の値を示す。

【0197】

ＰＣ２は、処理表２１０のうち、「認識結果漢数字」、「文字認識の第１候補」、「文字認識の第２候補」の３つの列の値の組合せを参照し、第２の文字認識に関する判断を行う。ＰＣ２は、図２０のような比較対象の組合せの値から、処理表２１０のその組合せに該当する行を参照し、「文字変換、出力」列の値を採用する。図２０の組合せの例では、｛壱，Ｘ，Ｙ｝である。ＰＣ２は、「認識結果漢数字」として「壱」であるため、図２１の処理表２１０を参照する。ＰＣ２は、処理表２１０のうち、第１の候補文字Ｘ及び第２の候補文字Ｙの組合せに応じた行を参照する。

【0198】

処理表２１０における「第１候補」及び「第２候補」の列は、「1」のような正しい記入を想定した文字と、「改ざん候補」の文字と、「その他」の文字との組合せが設定されている。

【0199】

処理表２１０の第１行及び第２行は、「第１候補」列の値が「1」である。例えば、文字Ｘが「1」、文字Ｙが「改ざん候補」である場合、第１行が該当する。よって、ＰＣ２は、第１行の「文字変換、出力」列の値である「第１候補（1）」を採用する。「第１候補（1）」は、「第１候補」列の文字Ｘである「1」を指している。即ち、ＰＣ２は、不読の文字を「1」へ文字変換して不読を解消する。

【0200】

「改ざん候補」とは、図１４の判定表１４０において「改ざん候補算用数字」列に設定されている値を指す。判定表１４０から、例えば、漢数字「壱」及び算用数字「1」に関しては、「改ざん候補」の文字として、｛4，7，9｝である。処理表２１０の第１行の「第２候補」列の「改ざん候補」は、第２の候補文字Ｙがこれらの文字｛4，7，9｝のいずれかである場合を指す。組合せが｛壱，1，4｝等である場合、不読の文字は「1」へ文字変換される。

【0201】

例えば、文字Ｘが「1」、文字Ｙが「その他」である場合、第２行が該当する。よって、ＰＣ２は、第２行の「文字変換、出力」列の値である「第１候補（1）」を採用する。「その他」とは、「1」自体及び「改ざん候補」を除いた文字を指す。例えば漢数字「壱」及び算用数字「1」に関しては、「0」〜「9」のうち、「1」と｛4，7，9｝を除いて、｛0，2，3，5，6，8｝である。組合せが｛壱，1，2｝等である場合、不読の文字は「1」へ文字変換される。

【0202】

処理表２１０の第３行〜第５行は、「第１候補」列の値が「改ざん候補」である。例えば、文字Ｘが「改ざん候補」の文字、文字Ｙが「1」である場合、第３行が該当し、「第２候補（1）」が採用される。「第２候補（1）」は、「第２候補」列の文字Ｙである「1」を指す。また、文字Ｘ及び文字Ｙが「改ざん候補」の文字である場合、第４行が該当し、「強いアラート」が採用される。「強いアラート」は、改ざん等の可能性が高いという判定に応じた、強いレベルのアラートの出力を指す。「強いアラート」は前述の第２のアラートと同じでもよい。例えば、組合せが｛壱，4，7｝等である場合、ＰＣ２は、「1」が「4」や「7」へ改ざん等がされた可能性が高いと推測し、この「強いアラート」を出力する。また、文字Ｘが「改ざん候補」の文字、文字Ｙが「その他」の文字である場合、第５行が該当し、「強いアラート」が採用される。

【0203】

処理表２１０の第６行〜第８行は、「第１候補」列の値が「その他」である。例えば、文字Ｘが「その他」の文字、文字Ｙが「1」である場合、第６行が該当し、「第２候補（1）」が採用される。また、文字Ｘが「その他」の文字、文字Ｙが「改ざん候補」の文字である場合、第７行が該当し、「弱いアラート」が採用される。「弱いアラート」は、改ざん等の可能性が低いという判定に応じた、「強いアラート」よりも弱いレベルのアラートの出力を指す。「弱いアラート」は前述の第１のアラートと同じでもよい。例えば、組合せが｛壱，2，4｝等である場合、ＰＣ２は、「1」が「4」等へ改ざん等がされた可能性が有ると推定し、この「弱いアラート」を出力する。また、文字Ｘ及び文字Ｙが共に「その他」の文字の場合、第８行が該当し、「弱いアラート」が採用される。

【0204】

組合せが第１行、第２行、第３行、または第6行に該当する場合、不読の文字は第２の文字認識により文字変換され、不読が解消される結果となる。組合せが第４行、第５行、第７行、または第８行に該当する場合、特定のアラートが出力される結果となる。

【0205】

また、ＰＣ２は、漢数字に不読が有る場合、その不読の文字について、所定の組合せの値を比較し、不読の解消のための第２の文字変換を試みる。所定の組合せは、（１）第１フィールドの算用数字の第１の文字認識の結果の文字と、（２）第２フィールドの漢数字の第１の文字認識における候補の文字と、を含む。ＰＣ２は、漢数字に不読が有る場合、図２１の（ｂ）の表１２０Ｂ、及び図１４の判定表１４０を参照し、上記組合せの値の比較に基づいて、第２の文字変換を行う。

【0206】

図２１の（ｂ）は、不読が有る場合の処理表２１０Ｂを示す。この処理表２１０Ｂは、日本の帳票の場合及び第２の変換の場合に対応した一部分を示す。この処理表２１０は、記入された漢数字「壱」に不読が有る場合に対応した部分を示す。

【0207】

表２１０Ｂにおいて、列として、「記入漢数字」、「認識結果算用数字」、「文字認識の第１候補」、「文字認識の第２候補」、「文字変換、出力」がある。「記入漢数字」は、第２フィールドに記入された漢数字、特に「壱」の場合を示す。「認識結果算用数字」は、第１フィールドの算用数字の第１の文字認識の結果の算用数字、特に「1」の場合を示す。「文字認識の第１候補」及び「文字認識の第２候補」は、第１の文字認識における候補文字を示す。

【0208】

ＰＣ２は、処理表２１０Ｂのうち、「認識結果算用数字」、「文字認識の第１候補」、「文字認識の第２候補」の３つの列の値の組合せを参照し、第２の文字認識に関する判断を行う。ＰＣ２は、比較対象の組合せ｛1，Ｘ，Ｙ｝の値から、処理表２１０Ｂのその組合せに該当する行を参照し、「文字変換、出力」列の値を採用する。

【0209】

処理表２１０Ｂの第１行は、「文字認識の第１候補」列の値が「壱」であり、「文字認識の第２候補」列の値が「壱以外」である。文字Ｘが「壱」であり、文字Ｙが「壱」以外の文字である場合、第１行に該当し、「文字変換、出力」列の値である「第１候補（壱）」が採用される。「第１候補（壱）」は、「第１候補」列の文字Ｘである「壱」を指している。即ち、ＰＣ２は、不読の文字を「壱」へ文字変換して不読を解消する。

【0210】

処理表２１０Ｂの第２行は、「第１候補」列の値が「壱以外」であり、「第２候補」列の値が「壱」である。文字Ｘが「壱」以外の文字であり、文字Ｙが「壱」である場合、第２行に該当し、「第２候補（壱）」が採用される。「第２候補（壱）」は、「第２候補」列の文字Ｙである「壱」を指している。

【0211】

処理表２１０Ｂの第３行は、「第１候補」及び「第２候補」列の値が共に「壱以外」である。文字Ｘ及び文字Ｙが「壱」以外の文字である場合、第３行に該当し、「弱いアラート」が採用される。

【0212】

「1」以外の算用数字及び「壱」以外の漢数字についても、同様に、処理表２１０や処理表２１０Ｂの情報が用意されている。ＰＣ２は、「1」以外の算用数字及び「壱」以外の漢数字についても、処理表２１０や処理表２１０Ｂを用いて、同様に不読が有る場合の処理を行う。中国の帳票の場合、日本とは異なる使用文字による処理表２１０や処理表２１０Ｂを用いて、同様に不読が有る場合の処理が行われる。

【0213】

上記例のように、不読低減モードでは、第１の変換及び第２の変換のいずれの場合でも、不読を低減できる。また、ユーザは、改ざん等の可能性を判断しやすい。

【0214】

［効果等］
以上説明したように、実施の形態１の文字認識システム及び文字認識方法によれば、文字の種類が異なる二重エントリを含む帳票の場合にも、精度や効率を高め、ユーザの作業の負担を軽減できる。ユーザは、帳票の記載内容の確認や、データの修正や確定等の作業が容易になる。

【0215】

特許文献１を含め、従来の文字認識システムは、二重エントリの文字種が異なる２つの金額を自動的に比較及び判定するような高度な機能を持たない。一方、実施の形態１の文字認識システムは、二重エントリの２つの金額の文字種が異なる場合、自動的に文字種を変換して比較及び判定等を行う高度な機能を提供する。よって、ユーザは、２つの文字列の比較等の手間が軽減され、一見してすぐに判断がしやすい。

【0216】

実施の形態１の文字認識システムは、二重エントリの金額の比較や、改ざん等の可能性の判定を含め、自動的なチェックを行い、判定結果に応じたアラートを出力する。よって、ユーザは、金額の不一致、改ざん等の可能性を認識及び検出しやすい。

【0217】

実施の形態１の文字認識システムは、誤読低減モードや不読低減モードを備えており、帳票のＯＣＲ処理、即ち帳票データを得る処理に関して、精度を高めることができる。ユーザは、信頼性が高い帳票データを得ることができる。

【0218】

実施の形態１の文字認識システムは、多数の帳票のＯＣＲ処理の場合にも、帳票毎に自動的なチェックを行い、出力データを保存し、必要に応じて結果画面を出力する。これにより、多数の帳票のＯＣＲ処理及びユーザの作業の効率を高めることができる。

【0219】

（実施の形態２）
図２２を用いて、本発明の実施の形態２の文字認識システム及び文字認識方法について説明する。実施の形態２の文字認識方法は、実施の形態２の文字認識システム上において、ユーザの操作に基づいてコンピュータにより実行される処理手順を含む方法である。

【0220】

図２２は、実施の形態２の文字認識システムの構成を示す。実施の形態２の文字認識システムは、ＯＣＲ装置３とＰＣ４との接続により構成される。実施の形態２の文字認識システムは、帳票５のＯＣＲ処理に関する主な処理を、ＰＣ４ではなく、ＯＣＲ装置３で行う。言い換えると、実施の形態２の文字認識システムは、ハードＯＣＲ方式のシステムである。ＯＣＲ装置３は、帳票５のＯＣＲ処理のうち、帳票５の画像データ４１を得る処理から比較結果データ４４を出力する処理までを行う装置である。ＰＣ４は、ソフトウェア処理により、ＯＣＲ処理のうち、比較結果データ４４を含む出力データ４５をユーザへ出力する出力処理等を行う装置である。

【0221】

ユーザは、ＯＣＲ装置３及びＰＣ４を操作する。ユーザは、作業のため、帳票５をＯＣＲ装置３にセットして入力する。ユーザは、ＰＣ４で作業に関する設定や指示入力を行う。ＰＣ４は、指示入力に従い、ＯＣＲ装置３へ命令を送信する。ＯＣＲ装置３は、ＰＣ４からの命令に従い、帳票５のＯＣＲ処理を開始する。

【0222】

ＯＣＲ装置３は、図示しないスキャナやスタッカの他、制御装置３０１、記憶装置３０２、及び通信インタフェース装置３０３を有する。

【0223】

制御装置３０１は、ＣＰＵ、ＲＯＭ、ＲＡＭ等により構成される。記憶装置３０２は、メモリやディスク等を含む。通信インタフェース装置３０３は、ＰＣ４との通信インタフェースに対応した通信処理を行う。

【0224】

制御装置３０１は、記憶装置３０２に格納されているプログラム３０をロードしてソフトウェア処理を実行することにより、帳票入力部３１等の各処理部を実現する。プログラム３０は、ＯＣＲ装置３に特有のＯＣＲ処理を実行させるプログラムである。なお、このプログラム処理は、ハードウェア回路に実装されていてもよい。制御装置３０１は、帳票入力部３１、文字認識部３２、変換部３３、及び比較部３４を有する。

【0225】

記憶装置３０２は、ＯＣＲ処理に係わる各データとして、画像データ４１、認識結果文字データ４２、変換結果文字データ４３、及び比較結果データ４４等を記憶する。

【0226】

ＯＣＲ装置３は、帳票入力部３１により、帳票５を読み込んでスキャンし、帳票５の画像データ４１を得て、記憶装置３０２に格納する。

【0227】

文字認識部３２は、記憶装置３０２の帳票５の画像データ４１を入力し、画像データ４１に対して文字認識処理を行い、その結果である認識結果文字データ４２を記憶装置３０２に格納する。

【0228】

変換部３３は、記憶装置３０２の認識結果文字データ４２を入力し、認識結果文字データ４２に対して、所定の変換処理を行い、その結果である変換結果文字データ４３を記憶装置３０２に格納する。

【0229】

比較部３４は、記憶装置３０２の変換結果文字データ４３を入力し、変換結果文字データ４３に対して、所定の比較処理を行い、その結果である比較結果データ４４を記憶装置３０２に格納する。

【0230】

ＯＣＲ装置３は、ＯＣＲ処理の結果である、比較結果データ４４や認識結果文字データ４２を、通信インタフェース装置３０３による通信処理を介し、ＰＣ４へ転送する。

【0231】

ＰＣ４は、図示しない制御装置、記憶装置、通信インタフェース装置、入力装置、表示装置、等の一般的な要素を有する。ＰＣ４は、それらの要素の上に構成される、出力部３５、及びユーザインタフェース部３６を有する。ＰＣ４は、ＯＣＲ装置１から転送された比較結果データ４４や認識文字結果データ４２を受信し、内部の記憶装置に格納する。

【0232】

出力部３５は、記憶装置の比較結果データ４４を入力し、所定の出力処理として、比較結果データ４４を含む出力データ４５を構成し、出力データ４５を記憶装置に保存する。また、出力部３５は、ユーザインタフェース部３６及び表示装置を用いて、出力データ４５に対応したＯＣＲ処理の結果画面をユーザへ表示する。

【0233】

ユーザインタフェース部３６は、文字認識システム及びＯＣＲの作業に関するユーザインタフェースとしての画面をユーザに提供する処理を行う。ユーザインタフェース部３６は、出力データ４５に基づいて、Ｗｅｂページ等による画面データを構成し、画面データに基づいて表示装置に結果画面を表示させる。

【0234】

実施の形態２の文字認識システム及び文字認識方法によっても、実施の形態１と同様の効果が得られる。

【0235】

以上、本発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されず、その要旨を逸脱しない範囲で種々変更可能である。

【産業上の利用可能性】

【0236】

本発明は、帳票のＯＣＲ処理を行う業務に利用可能である。

【符号の説明】

【0237】

１…ＯＣＲ装置、２…ＰＣ、５…帳票、１１…帳票入力部、１２…文字認識部、１３…変換部、１４…比較部、１５…出力部、１６…ユーザインタフェース部、２０…プログラム、２１…画像データ、２２…認識結果文字データ、２３…変換結果文字データ、２４…比較結果データ、２５…出力データ、１０１…制御装置、１０２…記憶装置、１０３…入力装置、１０４…表示装置、１０５…印刷装置、１０６…通信インタフェース装置。

【図1】