(58)【調査した分野】(Int.Cl.,DB名)
原始証憑を読取った読取画像から、原始証憑のフォーマットを判断するフォーマット判断手段と、前記読取画像から、文字認識辞書を利用して文字を認識して認識候補のテキストデータを生成する文字認識手段と、を具える会計処理支援システムにおいて、前記文字認識辞書として、漢字等を含む第1の文字認識辞書と、数字認識用の第2の文字認識辞書を具え、
前記画像がレシートである場合に、
前記文字認識手段により、前記第1の文字認識辞書を利用して漢字等を含む文字列としての認識候補のテキストデータに加え、前記第2の文字認識辞書を利用して数字であると仮定した認識候補のテキストデータを生成し、
前記認識候補のテキストデータから日付情報となる日付データ文字列を抽出する日付情報抽出手段と、
前記認識候補のテキストデータから合計金額情報となる合計金額データ文字列を抽出する合計金額情報抽出手段と、を具え、
前記日付情報抽出手段は、前記認識候補のテキストデータから日付情報の特定に関する日付キーワードを含む文字列を会計処理に有意な情報と位置づけて抽出して、当該文字列を日付情報データと推定して、前記推定した文字列を日付情報に係る数字と仮定した場合の認識候補を優先して取り扱う認識候補のテキストデータ最適化を行い、
前記合計金額情報抽出手段は、前記テキストデータから前記合計金額情報の特定に関する合計金額キーワードを含む文字列が存在する場合は、当該文字列と特定の相対的位置関係にある文字列を会計処理に有意な情報と位置づけて抽出して、当該文字列を合計金額情報と推定し、前記合計金額キーワードを含む文字列が前記テキストデータに存在しない場合は、文字サイズまたは文字の太さに基づいて一意の文字列を抽出し、当該抽出した数字を含む文字列を合計金額情報と推定し、
前記推定した文字列を合計金額情報に係る数字と仮定した場合の認識候補を優先して取り扱う認識候補のテキストデータ最適化を行う、ことを特徴とする会計データ入力支援システム。
前記合計金額情報抽出手段は、前記テキストデータから前記合計金額情報の特定に関する合計金額キーワードを含む文字列が存在する場合は、前記特定の相対的位置関係として右側を設定し、当該文字列の前記合計金額キーワードの右側の数字を合計金額と判断することを特徴とする、請求項1に記載の会計データ入力支援システム。
前記第1の文字認識辞書は、会計処理用の原始証憑で使用される文字に絞り込んだ最低限の定義データを有する認識辞書で構成されることを特徴とする、請求項1または2に記載の会計データ入力支援システム。
前記第2の文字認識辞書は、認識対象の文字列が数字であると推定される場合に、数字と仮定した場合の文字認識処理を行う際に、数字以外の文字列を除去して数字の認識率を向上させる認識辞書で構成されることを特徴とする、請求項1乃至3のいずれか一つに記載の会計データ入力支援システム。
前記日付キーワードは、「年」、「月」、「日」、「/」、「.」、「−」のうちの少なくとも一つ以上を含むことを特徴とする、請求項1乃至4のいずれか一つに記載の会計データ入力支援システム。
原始証憑を読取った読取画像から、原始証憑のフォーマットを判断するフォーマット判断手段と、前記読取画像から、文字認識辞書を利用して文字を認識して認識候補のテキストデータを生成する文字認識手段と、を具える会計処理支援システムにおいて、
前記文字認識辞書として、漢字等を含む第1の文字認識辞書と、数字認識用の第2の文字認識辞書を具え、
前記画像が通帳である場合に、
前記文字認識手段により、前記第1の文字認識辞書を利用して漢字等を含む文字列としての認識候補のテキストデータに加え、前記第2の文字認識辞書を利用して数字であると仮定した認識候補のテキストデータを生成し、
前記認識候補のテキストデータから日付情報となる日付データ文字列を抽出する日付情報抽出手段と、
前記認識候補のテキストデータから金額情報となる金額データ文字列を抽出する金額情報抽出手段と、を具え、
日付情報抽出手段はその構成要素として、前記テキストデータから行単位に文字列データを抽出し、前記文字列データをさらに列毎の項目名単位に分解して、日付に関する通帳データ文字列を生成する通帳日付情報抽出手段を具え、
金額情報抽出手段はその構成要素として、前記テキストデータから行単位に文字列データを抽出し、前記文字列データをさらに列毎の項目名単位に分解して、金額に関する通帳データ文字列を生成する通帳金額情報抽出手段を具え、
前記通帳日付情報抽出手段は、前記行単位に文字列データを抽出する際に、左端の列の文字列を会計処理に有意な情報と位置づけて抽出して、当該文字列を日付情報であると推定し、前記推定した文字列を日付情報に係る数字と仮定した場合の認識候補を優先して取り扱う認識候補のテキストデータ最適化を行い、
さらに、前記通帳金額情報抽出手段は、右端の文字列を会計処理に有意な情報と位置づけて抽出して、当該文字列を残高情報であると推定して、前記推定した文字列を残高情報に係る数字と仮定した場合の認識候補を優先して取り扱う認識候補のテキストデータ最適化を行って、前記通帳データ文字列を生成することを特徴とする会計データ入力支援システム。
前記通帳金額情報抽出手段が、前記テキストデータから行単位に文字列データを抽出する際に、上に空でない行を含む任意の行を抽出し、前記抽出した任意の行の残高情報と、上の行の残高情報を比較することで、前記通帳データ文字列の支払情報と預入情報を判別することを特徴とする、請求項7に記載の会計データ入力支援システム。
前記通帳金額情報抽出手段は、前記任意の行に含まれる残高情報(A)と、前記上の行に含まれる残高情報(B)を比較して、(A)>(B)である場合、残高情報の隣の項目が預入情報であると判断して、前記通帳データ文字列を生成することを特徴とする、請求項8に記載の会計データ入力支援システム。
前記通帳金額情報抽出手段は、前記通帳データ文字列の残った項目を、支払情報であるとして前記通帳データ文字列を生成することを特徴とする、請求項9に記載の会計データ入力支援システム。
原始証憑を読取った読取画像から、原始証憑のフォーマットを判断するフォーマット判断手段と、前記読取画像から、文字認識辞書を利用して文字を認識して認識候補のテキストデータを生成する文字認識手段と、前記文字認識辞書として、漢字等を含む第1の文字認識辞書と、数字認識用の第2の文字認識辞書を、を具えるコンピューターシステムにおける会計データ入力支援方法において、
前記画像がレシートである場合に、
前記文字認識手段が、前記第1の文字認識辞書を利用して漢字等を含む文字列としての認識候補のテキストデータに加え、前記第2の文字認識辞書を利用して数字であると仮定した認識候補のテキストデータを生成するステップと、
日付情報抽出手段が、前記認識候補のテキストデータから日付情報となる日付データ文字列を会計処理に有意な情報と位置づけて抽出して、当該文字列を抽出するステップと、
合計金額情報抽出手段が、前記認識候補のテキストデータから合計金額情報となる合計金額データ文字列を会計処理に有意な情報と位置づけて抽出して、当該文字列を抽出するステップとを具え、
前記日付情報抽出手段が、前記認識候補のテキストデータから日付情報の特定に関する日付キーワードを含む文字列を日付情報データと推定して、前記推定した文字列を日付情報に係る数字と仮定した場合の認識候補を優先して取り扱う認識候補のテキストデータ最適化を行うステップと、
前記合計金額情報抽出手段が、前記テキストデータから前記合計金額情報の特定に関する合計金額キーワードを含む文字列が存在する場合は、当該文字列と特定の相対的位置関係にある文字列を合計金額情報と推定し、前記合計金額キーワードを含む文字列が前記テキストデータに存在しない場合は、文字サイズまたは文字の太さに基づいて一意の文字列を抽出し、当該抽出した数字を含む文字列を合計金額情報と推定して、前記推定した文字列を合計金額情報に係る数字と仮定した場合の認識候補を優先して取り扱う認識候補のテキストデータ最適化を行うステップとを具えた、ことを特徴とする会計データ入力支援方法。
原始証憑を読取った読取画像から、原始証憑のフォーマットを判断するフォーマット判断手段と、前記読取画像から、文字認識辞書を利用して文字を認識して認識候補のテキストデータを生成する文字認識手段と、前記文字認識辞書として、漢字等を含む第1の文字認識辞書と、数字認識用の第2の文字認識辞書を、を具えるコンピューターシステムにおける会計データ入力支援方法において、
前記画像がレシートである場合に、
前記文字認識手段が、前記第1の文字認識辞書を利用して漢字等を含む文字列としての認識候補のテキストデータに加え、前記第2の文字認識辞書を利用して数字であると仮定した認識候補のテキストデータを生成するステップと、
日付情報抽出手段が、前記認識候補のテキストデータから日付情報となる日付データ文字列を会計処理に有意な情報と位置づけて抽出して、当該文字列を抽出するステップと、
合計金額情報抽出手段が、前記認識候補のテキストデータから合計金額情報となる合計金額データ文字列を会計処理に有意な情報と位置づけて抽出して、当該文字列を抽出するステップとを具え、
前記日付情報抽出手段が、前記認識候補のテキストデータから日付情報の特定に関する日付キーワードを含む文字列を日付情報データと推定して、前記推定した文字列を日付情報に係る数字と仮定した場合の認識候補を優先して取り扱う認識候補のテキストデータ最適化を行うステップと、
前記合計金額情報抽出手段が、前記テキストデータから前記合計金額情報の特定に関する合計金額キーワードを含む文字列が存在する場合は、当該文字列と特定の相対的位置関係にある文字列を合計金額情報と推定し、前記合計金額キーワードを含む文字列が前記テキストデータに存在しない場合は、文字サイズまたは文字の太さに基づいて一意の文字列を抽出し、当該抽出した数字を含む文字列を合計金額情報と推定して、前記推定した文字列を合計金額情報に係る数字と仮定した場合の認識候補を優先して取り扱う認識候補のテキストデータ最適化を行うステップとを具えた、ことを特徴とする会計データ入力支援プログラム。
【発明の概要】
【発明が解決しようとする課題】
【0010】
プレプリントされた定型のOCR読取り専用の伝票を使う場合には、顧問先にて取引の際に発生した領収書や通帳等の原始証憑類をユーザーが目視しながら、手書きで伝票に文字を記入することになる。これは煩雑な作業であり、また誤入力も多くなる問題があった。
【0011】
領収書(レシート)や通帳等の原始証憑類をスキャナにて読み取り、OCR処理して、会計ソフトへデータ出力する場合は、読み取る原始証憑類が定型化されており会計ソフトで対応していれば認識精度が高まりデータ入力作業の軽減が図れるが、領収書(レシート)のフォーマットは発行者が任意に設定できるため定型化されておらず、通帳も金融機関毎に項目の並びが違ったり定型化されていない。このため会計ソフトで対応していない形式のレシートや通帳は読み取り不可能となるか、認識精度が大幅に下落するという問題がある。
【0012】
また、原始証憑類をスキャナにて読み取らせ、OCR処理するためには、原始証憑類のどの部分を認識してデータ出力すべきかの処理が複雑化する。実際、特にレシートはフォーマットが定義されておらず記載内容に意味づけがなされていないため、会計情報として取り込みたいデータがどこにあるのか把握しづらく、したがって必要な情報を抽出しづらい問題がある。処理の複雑化は、誤認識の発生箇所が多くなることの要因となり、ユーザーは誤認識した箇所の修正作業を行う機会が多くなるので、データ入力作業の軽減が図れないという問題がある。
【0013】
ところで、原始証憑類から得られる、会計処理に関する情報として重要なのは日付と合計金額であるので、原始証憑類をスキャナにて読取りOCR処理を行う場合、日付と合計金額の情報を精度良く取得することが重要となる。
【0014】
そこで、本発明は、会計事務所の顧問先企業などで、領収書(レシート)や通帳等の原始証憑類をスキャナにて読み取った画像をOCR処理して会計ソフトへデータ出力を行う場合の処理について、日付や合計金額などの認識処理を簡素化するとともに、誤認識を少なくすることで、データ入力に際し、キーボードからの入力作業を軽減し、データ入力ミスの削減を図ることを目的とする。
【課題を解決するための手段】
【0015】
上記目的を達成するため、本発明は、原始証憑を読取った読取画像から、原始証憑のフォーマットを判断するフォーマット判断手段と、前記読取画像から、文字認識辞書を利用して文字を認識して認識候補のテキストデータを生成する文字認識手段と、を具える会計処理支援システムにおいて、前記文字認識辞書として、漢字等を含む第1の文字認識辞書と、数字認識用の第2の文字認識辞書を具え、
前記画像がレシートである場合に、
前記文字認識手段により、前記第1の文字認識辞書を利用して漢字等を含む文字列としての認識候補のテキストデータに加え、前記第2の文字認識辞書を利用して数字であると仮定した認識候補のテキストデータを生成し、
前記認識候補のテキストデータから日付情報となる日付データ文字列を抽出する日付情報抽出手段と、
前記認識候補のテキストデータから合計金額情報となる合計金額データ文字列を抽出する合計金額情報抽出手段と、を具え、
前記日付情報抽出手段は、前記認識候補のテキストデータから日付情報の特定に関する日付キーワードを含む文字列を会計処理に有意な情報と位置づけて抽出して、当該文字列を日付情報データと推定して、前記推定した文字列を日付情報に係る数字と仮定した場合の認識候補を優先して取り扱う認識候補のテキストデータ最適化を行い、
前記合計金額情報抽出手段は、前記テキストデータから前記合計金額情報の特定に関する合計金額キーワードを含む文字列が存在する場合は、当該文字列と特定の相対的位置関係にある文字列を会計処理に有意な情報と位置づけて抽出して、当該文字列を合計金額情報と推定し、前記合計金額キーワードを含む文字列が前記テキストデータに存在しない場合は、文字サイズまたは文字の太さに基づいて一意の文字列を抽出し、当該抽出した数字を含む文字列を合計金額情報と推定し、
前記推定した文字列を合計金額情報に係る数字と仮定した場合の認識候補を優先して取り扱う認識候補のテキストデータ最適化を行う、ことを特徴とする。
【0016】
一実施例において、前記合計金額情報抽出手段は、前記テキストデータから前記合計金額情報の特定に関する合計金額キーワードを含む文字列が存在する場合は、前記特定の相対的位置関係として右側を設定し、当該文字列の前記合計金額キーワードの右側の数字を合計金額と判断することを特徴とする。
【0017】
一実施例において、前記第1の文字認識辞書は、会計処理用の原始証憑で使用される文字に絞り込んだ最低限の定義データを有する認識辞書で構成されることを特徴とする。
【0018】
一実施例において、前記第2の文字認識辞書は、認識対象の文字列が数字であると推定される場合に、数字と仮定した場合の文字認識処理を行う際に、数字以外の文字列を除去して数字の認識率を向上させる認識辞書で構成されることを特徴とする。
【0019】
一実施例において、前記日付キーワードは、「年」、「月」、「日」、「/」、「.」、「−」のうちの少なくとも一つ以上を含むことを特徴とする。
【0020】
一実施例において、 前記合計金額キーワードは、「合計」、「現計」、「買上計」のいずれかであることを特徴とする。
【発明の効果】
【0021】
本発明では、顧問先企業や会計事務所において、領収書(レシート)や通帳等の原始証憑類をスキャナやカメラ機能付モバイル機器等にて読取りOCR処理して、会計ソフトへデータ出力を行うことで、キーボードからの入力作業を軽減し、データ入力ミスの削減を図ることができる。本発明は、特にフリーフォーマットの原始証憑であっても、日付や合計金額といった必要な会計データを探し当て、会計ソフトの入力画面に流し込むことができる。
【0022】
また、文字認識処理における辞書データとして、数字のみを認識候補とする辞書データを用いたり、原始証憑で使用される文字に絞り込んだ辞書データを用いたりすることにより、処理速度や認識精度の向上を達成することができる。
【発明を実施するための形態】
【0024】
本発明を実施するための形態について、添付の図面を参照しながら以下に詳細に説明する。
図1は、本発明にかかる会計データ入力支援システムの全体概要を説明する概略図である。本発明はフリーフォーマットの領収書(レシート)や通帳等の原始証憑10をスキャナや、被写体を撮影して画像データとして保存することができるデジタルカメラ、デジタルビデオ等(無線機能で画像をアップロードできる機能や、メモリ装置を介する場合を含む)、カメラ付き携帯電話、カメラ付きスマートフォン、カメラ付きモバイル端末、カメラ付きタブレット端末、モバイルカメラ等のモバイル端末(携帯電話、スマートフォン等の携帯型の端末装置、カメラ機能付きタブレット端末等(以下単に「カメラ機能付きモバイル機器」))のカメラ、あるいはその他の原始証憑をデジタル化できる各種の読み取り装置20で読み取り、画像処理を行ってコンピュータ100上で動作する会計ソフトに会計データが自動的に反映されるようにするものである。ここで、会計ソフトが対応している伝票形式であれば予めどの部分に何が記載されているかが判明しているため、必要な部分を読み取ってOCR処理を行い会計データに反映することができるが、定型化されていないフリーフォーマットの原始証憑はこのような処理ができない。そこで本発明は、フリーフォーマットの原始証憑であっても、下側の拡大画面に示すように、日付や合計金額といった必要な会計データを探し当て、会計ソフトの入力画面に流し込めるようにすることを特徴とする。
【0025】
先に、
図5を用いて、本発明にかかる会計データ入力支援システムのシステム構成について説明する。一実施例では、会計データ入力支援システム1は、顧問先あるいは会計事務所に設置されるコンピューターシステムとして構成される。
図5−Aに示すように、システム1は、原始証憑10を読み取るためのスキャナまたはカメラ機能付きモバイル機器等の読み取り装置20と、当該読み取り装置20と直接あるいはネットワークを介して接続された端末装置100とを具える。端末装置100は、キーボードやマウス等の入力部110と、ディスプレイ等の表示部120と、USBポートや可搬型記憶ドライブ等の出力部130と、インターネット等のネットワークに接続するための通信部140と、端末装置100の各種制御を司る制御部150と、各種データが格納される記憶部160とを具える。
【0026】
記憶部160は少なくとも、原始証憑のイメージデータ格納部161と、文字認識辞書162と、単語辞書163と、キーワード辞書164と、取引情報格納部165と、会計データ格納部166とを具える。制御部150の機能としては、読み取り処理部、イメージ処理部、管理部、文字認識処理部、辞書ハンドリング部、認識候補生成部、単語照合部、最適化処理部、取引データ生成部、および仕訳処理部がある。これらの機能は記憶部160に格納された会計ソフトあるいは別個のプログラムモジュールを制御部150で読み出して展開することにより実現される。なお、本発明の実施例は
図5−Aに示す形態のものに限られず、一部の要素がなくても、また他の要素を具えてもよい。
【0027】
読み取り処理部は、読み取り装置20で原始証憑を読み取り、イメージデータ(読取画像)を作成する。この読み取り処理部が破線で示されているのは、原始証憑の読取り自体は、当該端末装置で行うことは必須ではなく、カメラ機能を有する他の装置(カメラ機能付きモバイル機器やデジタルカメラ等)で行ってもよいことによるものである。すなわち、読取処理部(破線囲みで図示)は、端末装置100内または読取装置20内、さらにこれとネットワーク接続された他の端末装置100a、端末装置20、データサーバやNAS(Network Attached Storage)等にあってもよい。また、当該端末装置100は、デスクトップ型のコンピュータの他、ノート型のコンピュータ、あるいは、カメラ機能付モバイル機器であってもよい。カメラ機能付モバイル機器の場合は、
図1ないし
図5−Aの読取り装置(スキャナ等)は端末装置100の内部に構成されることになる。
【0028】
イメージ処理部はフォーマット判断手段を含み、読み取り処理部で作成されたイメージデータ(読取画像)から、そのイメージデータの証憑タイプが、領収書(レシート)等であるか、あるいは預金通帳であるかの大まかな判定を行ったり、あるいは領収書(レシート)や通帳等の原始証憑の文字列がどこにあるかといった大まかなフォーマットを判定するフォーマット判断手段で判断する。
【0029】
管理部は、読み取り処理部で作成されたイメージデータと仕訳処理部で仕訳入力される仕訳データの関連づけを行う。
【0030】
文字認識手段は文字認識処理部、辞書ハンドリング部、認識候補生成部、最適化処理部が連携することで実現する。具体的には辞書ハンドリング部が選択した文字認識辞書(漢字等を含む辞書、数字用辞書)を利用して、文字認識処理部が各文字の特徴量を算出して文字認識辞書と比較し、認識候補生成部で比較結果を考慮して認識候補を生成し、辞書ハンドリング部が選択したキーワード辞書を利用して日付や合計に関するキーワードを検出し、最適化処理部が、キーワード等に基づいて所定の推定処理を行い、推定に基づいた最適化処理プログラムにより、認識候補として優先順位を上げて、認識候補を最適化することで、認識候補のテキストデータを調整する。
【0031】
日付情報抽出手段は辞書ハンドリング部、認識候補生成部、最適化処理部が連携することで実現する。具体的には文字認識手段の認識候補生成部が出力した認識候補のテキストデータから最適化処理部が日付情報の特定に関する日付キーワードを含む文字列を日付情報データと推定して、推定した文字列を日付情報に係る数字と仮定した場合の認識候補の優先順位を上げる認識候補のテキストデータ最適化を行う。
【0032】
合計金額情報抽出手段は辞書ハンドリング部、認識候補生成部、単語照合部、最適化処理部が連携することで動作する。具体的には文字認識手段の認識候補生成部が出力した認識候補のテキストデータと辞書ハンドリング部が選択した単語辞書の合計等の単語とを単語照合部が照合し、前記合計金額情報の特定に関する合計金額キーワードを含む文字列が存在する場合は、最適化処理部が当該文字列と特定の相対的位置関係にある文字列を合計金額情報と推定し、前記合計金額キーワードを含む文字列が前記テキストデータに存在しない場合は、最適化処理部が最も文字サイズの大きな数字を含む文字列を合計金額情報と推定し、推定した文字列を合計金額情報に係る数字と仮定した場合の認識候補の優先順位を上げる認識候補のテキストデータ最適化を行う。
【0033】
仕訳処理部は、例えば
図1に示すような2画面式会計入力画面の入力内容から仕訳データを作成し、会計データ格納部へ保存する。
【0034】
取引データ生成部は仕訳処理部で生成された仕訳データから取引情報である摘要を取引情報格納部へ保存する。
【0035】
さらに、記憶部160のイメージデータ格納部161、取引情報格納部165、および会計データ格納部166は、端末装置100内またはこれとネットワーク接続されたデータサーバやNAS(Network Attached Storage)等にあってもよい。このようなシステム構成の変形例を
図5−B、
図5−Cに示す。
図5−Bの実施例では、イメージデータ格納部161がネットワーク接続されたサーバー装置50上に配置され、さらに原始証憑を読み取った読み取り装置20に接続された端末装置100aとは異なる端末装置100bで会計データ入力支援処理を行うようにしている。本例ではさらに、サーバー装置50を設けずに他の端末装置100aにイメージデータ格納部161が配置され、これをネットワーク接続された端末装置100bで読み出して会計データ入力支援処理を行うようにすることも考えられる。
【0036】
また、原始証憑が通常顧問先において発生した取引に係るものであることから、端末装置100b、他の端末装置100aは、共に顧問先側の端末装置であることが想定されるが、他の端末装置100aは、会計事務所側の端末、もしくは会計事務所の職員が持ち込んだ端末装置であってもよい。会計事務所側のサービスとして、顧問先から原始証憑を預かって読取りを行う場合もあるからである。あるいは、逆に、端末装置100bが会計事務所側の端末装置であり、他の端末装置100aが顧問先側の端末装置として原始証憑の読取りを行うように構成しても良い。また、端末装置100bおよび他の端末装置100aとも会計事務所側の端末装置として構成されていても良い。
【0037】
図5−Cの実施例では、例えばスマートフォンといったカメラ機能付モバイル機器(すなわち読み取り装置20)から直接ネットワークを介してサーバー装置50にイメージデータが格納され、これを端末装置100で読み出して処理が行われる。この場合のサーバー装置50はNASやクラウドであってもよい。このように、システム構成は多様であり、特に限定する趣旨ではなく、何らかの形で、原始証憑を読み取ったイメージが存在しさえすれば足りる趣旨である。本発明では、以下、原始証憑を読み取ったイメージがあることを出発点として、原始証憑に関する文字認識処理をどのように工夫したかを中心に説明する。
【0038】
次に、
図2〜
図3を用いて、第1実施例にかかる、原始証憑がレシートである場合の会計データ入力支援方法を説明する。原始証憑のタイプがレシートであるか預金通帳であるかは、前述のフォーマット判断手段(
図6のステップS06−02のレイアウト解析に相当)が、「領収」、「レシート」等のキーワードが含まれるか(領収書の場合)、あるいは「残高」等のキーワードが含まれるか(預金通帳の場合)の判定処理のほか、文字列が、雑多に並んでいるか(領収書の場合)、あるいは縦方向の列毎に整然と並んでいるか(預金通帳の場合)等を加味して判定するが、一般的な技術を用いることで足りるため、詳細は省略する。
図2−Aの左側に、一般的な飲食店のレシートを示す。このレシートは店ごとに定型ではないが、通常は店名や電話番号などの店情報、日付、個々の注文内容と金額、合計金額、預かり金額、お釣りといった情報が印字される。本発明では、このうち会計データとして重要である日付と合計金額(図では「現計」として表示)に着目する。
図2は日付情報に着目した場合の処理の概要を示した図であり、
図3は合計金額情報に着目した場合の処理の概要を示した図である。
【0039】
まず、
図2を参照して、日付情報に着目した場合の処理の概要を説明する。読み取り装置20で読み取った画像データをOCR処理し、認識候補の文字列を生成した後、認識候補の文字列の中に、日付に関するキーワード(例えば、年、月、日、/、−、.(ピリオド)、Novなど英語の月表記)がないか検索し(以下同様の処理をキーワード検出処理と呼ぶ)(S101)、日付に関するキーワードがあった場合に、当該キーワードを含む一連の文字列を日付情報であると推定して、この文字列を抽出する(S102)。次に、当該文字列の最適化処理に移行する。
【0040】
図2−Aの例で示すと、実際のレシートには「2013年9月6日」と記載されており、システムは読み取り画像からステップS102でこの部分を日付情報であると推定する。しかしながら、レシートの状態や読み取り精度の設定などの要因により、一次的な読み込みでこの部分が「2DJ8年9月Q日」や「×+−年Oか6口」と認識される場合がある。このような場合を考慮して最適化処理が行われる。なお、前文の後者の場合でも、「年」の文字が入っているため日時情報として文字列を抽出することができる。
【0041】
日付情報であると仮定した場合の最適化処理では、日付情報が数字で構成されていることから、当該文字列に含まれる文字がすべて数字であると仮定した場合の認識候補を用いて(S102)、認識候補の最適化処理が行われる(S103)。すなわち、文字認識辞書を例えば
図11の右側に示す数字のみのものに固定し、数字以外の文字が候補に挙がらないようにする。そのうえで画像データから文字毎に複数の特徴点を抽出して特徴量として算出した値を、辞書データの特徴量と比較して、最も類似度の高い数字を決定する。どの数字とも特徴点がある程度一致しない場合は認識エラーとなる。これにより、推定された文字列から正確な数字が抽出され、認識されたテキストデータは「2013?9?6?」のようになる(S103の(イ))。
【0042】
ここで「?」の部分は、年月日等の漢字に相当する部分なので、数字の認識候補として確定できない(類似度の高い候補が存在しないとした)場合を表現しており、この部分に相当する文字は、別途、通常の認識辞書で文字認識した年月日等の文字列の認識候補によって補完して(ステップS103の(ロ))、「2013年9月6日」と日付を完成させるようにしてもよい。このようにして、キーワードの検出に応じて、所定の推定処理を行い、日付等の数字に関する文字列が含まれることを前提とした処理として、仮に数字だと仮定して数字用の認識辞書を用いた文字認識を行って認識候補を生成し、数字だと仮定した場合の、数字らしい認識候補を優先的に取り扱うことで、日付情報の認識の精度を向上させることができる。なお、ステップS101のキーワード検出は、通常の認識辞書を用いた文字認識により生成した認識候補について、単語照合を行ったものを用いることができる。また、数字と仮定した場合の数字の辞書を用いた認識処理は、日付情報のキーワードを検出する前に、予め行っておいてもよいし、日付情報のキーワードを検出した後に、行うようにしてもよい。
【0043】
ここで、数字らしい認識候補を優先的に取り扱う処理としては、上記の例に限られるものではなく、次のような処理を行っても良い。
図2−Bは、認識候補最適化処理の変形例を説明するための参考図である。特に数字と仮定した上で数字用の認識辞書を用いて文字認識して生成した認識候補を用いずに、通常の認識辞書によって、レシートに対する文字認識処理を行った場合、システムは文字ごとに複数の特徴点を抽出して生成した特徴量を辞書データと比較することにより、特徴点が一致する文字を候補として挙げる。この過程において、
図2−Bの左側に示すように複数の文字列の認識候補が生じる。
【0044】
次に、日付部分の文字認識において、
図2−Aのように数字であると仮定した場合の認識候補(S103のイ)を用いずに、「数字を最も多く含む候補」の優先順位を上げて最適化するようにしてもよい。より具体的には、
図2−Bの例では、例えば最初の認識候補として特徴点の一致が最も多い順に「2DJ8年9月Q日」、「×+−年Oか6口」、「2013年9か6日」という候補が挙がった場合、従来のシステムでは最も一致の多い「2DJ8年9月Q日」を最終候補として認識するが、本発明ではこの部分が日付情報であると推定しているため、最も数字の多い「2013年9か6日」という候補の優先順位を上げて最有力候補とする。
【0045】
図3を参照して領収書やレシートの合計金額の読み取りに関する最適化処理について説明する。システムは、
図3−Aの左側に示すレシートのOCRデータから、合計金額に関するキーワードを検索する(S201)。一実施例では合計金額に関するキーワードは、「合計」、「現計」、「買上計」などの文字列を含んで、予めシステム内のキーワード辞書(
図12参照)に登録されているものとする。このようなキーワードが検出された場合、当該キーワードの右側の文字列が、合計金額に関する数字であると推定する(S202)。このとき、慣習上合計金額の文字列は「¥」や「円」などの文字を含むことが多いため、キーワードの右側の文字列がこれらの文字を含むか否かを判断し、含む場合に合計金額と推定してもよい。
【0046】
キーワード辞書に登録されたキーワードと一致する文字列が存在するかを調べるキーワード検出処理においては、予め、認識候補として、一文字単位の認識候補の生成処理を行い、単語辞書を用いて、文字を複数組み合わせた単語レベルでの照合を行うことで、認識候補としての精度を向上させたうえで、認識候補の検索を行う(
図6のステップS06−05参照)。
【0047】
S202までの処理で、合計金額の数字がすべて明確に読み取れていればよいが、さらに数字に特化した認識候補の最適化を行ってもよい(S203)。すなわち、推定された文字列に対して
図11の右側に示す数字のみの辞書を適用して文字認識を行い、数字の認識精度を上げるようにする。より具体的には、数字と仮定した場合の認識候補を予め生成しておき、あるいは合計金額を示すキーワードを検出した際に、その右側の文字列を金額の数字と仮定した場合の認識候補を生成し、その認識候補を優先的に用いることで認識精度を上げる。
図3−Aの例では、ステップS203のイ)において、数字であると仮定した場合の認識候補が「?4?200」となり、このうち数字の文字部分は優先的に候補として利用し、認識精度の低い部分である「?」部分は、漢字等であるとした場合の認識候補で精度の高い部分である数字以外の部分「¥」「,」で置換することで、認識結果の出力として「¥4200」を得る。さらに、「¥」文字の後ろや「円」文字の前に数字があるかの判定を加えて、当該文字列が金額情報であることの認識精度を向上させることができる。
【0048】
次に、
図3−Bに示す例のように、レシートに合計金額に関するキーワードが存在しない場合のキーワード検出に代えた代替手段としての検出処理を説明する。本例のように、原始証憑に合計金額に関する文字列が存在しない場合には、画像読み込みとOCR処理において、個々の文字の大きさを認識するようにする。通常のOCR処理では画像内の文字をテキスト化するだけで文字の大きさに着目することはないが、例えばレシートでは合計金額が最も大きな数字として表記されることがあるため、本発明では数字の大きさを比較して最も大きな数字を合計金額であると推定する(S204)。この場合、店名なども大きく表示されることが多いため、数字のみを比較対象として認識精度を向上させることができる。また、電話番号や日付も大きく表示されることがあるため、これを除外すべく、例えば「数字4桁−数字4桁」といった並びの文字列は電話番号の可能性が高いとして合計金額として推定しないようにしたり、日付キーワード(年、月、日、/など)を含む文字列はフォントサイズが大きくても合計金額として推定しないようにしてもよい。その後、推定された数字の文字列に対して上記と同様の最適化処理を行い、認識結果を出力する。また、本実施例では、最も大きな文字を重要情報として抽出することを中心に記載したが、最も太い文字列や、斜体となっている文字列、あるいはフォントの種類が異なる文字列を重要情報として抽出するようにしてもよい。
【0049】
このようにして検出された日付と合計金額の情報が会計ソフト側に渡され、
図1に示す2画面式会計入力画面に自動的に反映される。
図1の下側に画面例を示すように、画面左側に原始証憑(この場合はレシート)が表示され、これに含まれる日付情報と合計金額が右側の入力画面に自動的に反映されている。ユーザーは原始証憑を参照して、日付と合計金額が一致しているのを確認したうえで、必要に応じて、自動で入力された年月日の日付情報や合計金額等の金額情報をキーボードやタッチ入力等で修正することができる。特に、日付情報については、領収書等において、発行日と取引が発生した日(購入日など)、ないしポイント有効期限等、様々な日付情報が印刷されている場合もあり、キーボード等で取引日を手入力できるようにするほか、複数の年月日情報の認識候補を表示して選択できるようにしてもよい。あるいは、会社の会計処理によっては、領収書の取引の日付ではなく精算の日付を入力する場合もあるため、その場合には手入力による修正の他、データ入力した日付が自動的に反映されるようにしてもよい。
【0050】
また、他の情報(店名、誰といたか、目的、支払い方法等)を入力して会計データを作成する。本例では、入力画面は5W1H(いつ、どこで、誰と、どのように、何で)に基づく質問形式であり、ユーザーは質問の答えを選択するか直接入力することにより会計データを作成することができる。この質問式伝票の詳細は本発明の特徴部分ではなく、本願出願人の他の出願に詳細に開示されているため本願での説明は省略する。このように作成された会計データがシステムの会計データ格納部166に保存される。会計データが顧問先側で作成された場合は、出力部130から記憶媒体に納められて会計事務所に渡されたり、通信部140からネットワークを介して会計事務所に送られる。
【0051】
なお、上記は原始証憑がレストランのレシートである例を用いて説明したが、レシート以外にも金額等が手書きの領収書、請求書、各種税金の納付書などの原始証憑にも本発明を適用することができる。その場合の処理方法は上記と同様である。
【0052】
図6〜
図9を用いて、原始証憑類からのデータ入力支援方法の詳細について説明する。
図6は、本発明にかかる方法の全体処理を説明するためのフロー図である。まず読み取り装置20で読み取った伝票(原始証憑)のイメージを取り込む(S06−01)。前処理として、イメージ内から文字列を切り出し(S06−02)、次に一文字単位での切り出しを行う(S06−03)。文字列の切り出しでは、イメージ内に文字列(すなわちドットの固まり)がどこにあるかが判断され、一文字単位の切り出しでは全角/半角等のピッチ判定が行われる。この場合に用いられる切出しの手法としては、文字列を構成する微細なドットの固まりをX軸側およびY軸側からサンプリングしてヒストグラム化して、ドットの固まりの存在箇所を把握する射影手法が知られている。なお、この前処理において、レシートであるか通帳であるか等の大枠の原稿タイプ判定を行ってもよい(
図7のステップS07−01参照)。
【0053】
次に、イメージに含まれる文字列について、認識処理として、1文字単位の文字認識を行う(S06−04)。この処理は、文字認識処理と、辞書ハンドリングと、認識候補生成により実現される。この場合、前述したように、通常モードでの文字認識(漢字等を含む認識辞書を用いた認識候補生成)に加え、必要に応じて文字列が数字であると仮定した文字認識を行うべく、数字のみの辞書を適用して、数字と仮定した認識候補を生成するようにすると、認識精度を向上させることができる。なお、前述のように、数字と仮定した場合の認識候補の生成処理は、日付情報や(合計)金額情報であると推定した場合において、その都度実行しても良いし、予め、全ての文字列について実行するようにしても良い。
【0054】
次に、1文字単位で認識された各文字について単語レベルでの単語照合が行われ、「合計」等のキーワードに対応する文字列の認識候補としての精度を向上させる処理として、認識候補の調整が行われる(S06−05)。月日や合計金額のキーワード検索によって、あるいは証憑タイプが「領収書」等であることが判明しているにも拘わらず、「合計」等の文字列が見つからない場合には、最も大きな数字列の特定を行い、注目する文字列の絞り込みが行われる(ステップS06−06の(1)丸数字1および(2)丸数字1)(例えば、日付情報に関しては
図2−AのステップS101、合計金額情報に関しては
図3−AのステップS201あるいは
図3−Bのキーワード検出代替処理に相当)。この処理により、日付あるいは合計金額といった注目すべき文字列が決定する。
【0055】
そして、注目すべき文字列に対して最適化処理が行われる(S06−06の(1)の丸数字2〜3および(2)の丸数字2〜3)。すなわち、キーワード検出により日付や合計金額と推定する文字列について、キーワードがある場合には数字であると仮定した最適化処理を行い、キーワードがない場合には例えば最も大きな数字の文字列に着目し、これを数字と仮定した最適化処理を行う。このようにして最適な認識候補が決定されて出力される(S06−07)。
【0056】
図7は、
図6のステップS06−04をより詳細に説明するための図である。最初に読み取りイメージの原稿タイプの判定が行われる(S07−01)。これは、例えば会計ソフトで対応しているOCR伝票のフォーマットが予めシステムに登録されており、画像内の識別子を読み込むことによりどの伝票フォーマットか判定したり、画像の大きさや枠の配置から預金通帳であると判定したり、その他のフォーマットの特定できない伝票(原始証憑)かを判定したりすることにより行われる。このように原稿タイプを自動的に判定するようにしてもよいし、あるいは通帳かレシートか領収書か等の選択画面を提示して、ユーザーが証憑イメージを見て入力してもよい。システムで対応しているOCR伝票である場合(S07−02:Y)、どこに何が記載されるかが予め判明しているため、システムは必要な部分の情報を読み取って会計入力画面に自動的に反映させる(S07−12)。この処理自体は公知技術であり、詳細な説明は本明細書においては省略する。
【0057】
読み取りイメージが、フォーマットの特定できない伝票(原始証憑)である場合、まず漢字等を含む辞書による文字認識が行われる(S07−03〜07)。
図11に、文字認識辞書の構造例を示す。
図11において左側が漢字等を含む文字認識辞書の登録内容を示し、右側が数字用の文字認識辞書の登録内容を示す。
図11に示すように、各文字について文字コード、特徴量などが登録されている。数字用の文字認識辞書は、数字のみ、あるいは数字と数学記号のみが登録され、漢字や仮名等は登録されていないため情報量が少なく、これを用いる場合の処理が高速化するとともに、数字以外の候補を示さないため数字について誤認識を有効に回避することができる。一方、漢字等を含む文字認識辞書は一般的なOCR辞書でもよいが、本発明は会計データの入力支援にかかるものであるため、特に原始証憑で用いられる可能性のある文字のみに特化して構成されていてもよい。これにより漢字等を含む辞書を用いる場合でも処理の高速化と認識率の向上を図ることができる。
【0058】
図7に戻ると、ステップS07−03でフォーマットの特定できない伝票(原始証憑)用の文字認識辞書(すなわち、
図11の辞書)を取得し、最初に漢字等を含む文字認識辞書をセットして(S07−04)、文字認識処理を行う(S07−05〜07)。次に、数字と仮定した場合の文字認識を行うべく、数字用の文字認識辞書をセットし(S07−08)、文字認識辞書を行う(S07−09〜11)。このようにして原始証憑イメージの文字認識が行われる。数字と仮定した認識候補を生成する場合、数字に関しては認識候補を精度良く生成できるので、日付情報を含む文字列や、合計等の文字列の右側ないし最も大きな数字列を合計金額の数字と推定し、数字と仮定した場合の認識候補をあえて生成した上で、優先的に取り扱うことで認識精度の向上を図ることができる。なお、前述のように、数字と仮定した場合の認識候補の生成処理は、日付情報や(合計)金額情報であると推定した場合において、その都度実行しても良いし、予め、全ての文字列について実行するようにしても良い。
【0059】
図8は、レシートや領収書の日付情報の文字認識を行う場合の、
図6の後処理(S06−05〜06)を説明するためのフロー図である。前述したように、システムには予め会計データにおける重要情報(例えば日付や合計金額)を抽出するためのキーワードが登録されている。このキーワード辞書の一例を
図12に示す。本図に示すように、例えば合計金額を示すキーワードとして、「合計」、「現計」、「買上計」、「領収金額」、「支払」・・・といったキーワードが登録され、日付に関するキーワードとして「日、月、年」、「/」、「−」、「.」・・・といったキーワードが登録されている。
図12に示されているように、キーワードには第1、第2、・・・といった優先順位が示されているが、これは例えば日付情報に関し、レシートには発行日と取引日のほかポイントの有効期限等の複数の日付情報を含み、どれが会計情報として有意な情報であるかは、文字認識の観点からは難しい面があり(必ずしも発行日とか取引日と明示されているわけではないため)、レシートを統計的に解析して、上記のような優先順位で抽出した文字列を取引日として取り扱うことで、およそ取引日である可能性が高いことを背景として、取引日の日付情報として用いることができる。同様に、合計等のキーワードにおいても、優先順位が設けられ、適宜重み付け等して、合計金額の数字である可能性が高い文字列を効率的に判別することに利用される。システムは日付に関するキーワード辞書をセットし(S08−01)、文字認識を行った原始証憑に対してキーワード検索を行う(S08−02)。ここでキーワードがヒットした場合、すなわち例えばある文字列で「月、日」などの文字が検出された場合(S08−03:Y)、キーワードに応じた推定処理(
図2ステップS102)を行う(S08−04)。
【0060】
ステップS08−04の推定処理では、一実施例では、抽出されたキーワードに応じて、例えば
図13に示す推定処理テーブルの処理が行われる。すなわち、証憑のタイプ毎に、認識対象毎に、推定処理が動的に選択され、選択された推定処理に連携する最適化処理が動的に選択されるように構成される。より具体的には、
図13に示すように、例えば領収書の日付情報に関するキーワードが抽出された場合、最適化処理プログラムID:P002が選択され、「年月日以外の部分を数字と推定」して、
図2に関して説明したような最適化処理が行われる。また、この場合に「年」や「月」、「日」の直前の文字が数字の認識候補を含むかどうかも加味することで、推定の精度を向上させるようにしてもよい。そして、キーワードに応じて、
図2に関して説明した最適化処理を行う(S08−05)。すなわち、
図2−Aに示すように、数字であるとした場合の認識候補と、漢字等である場合の認識候補の双方を勘案し、数字と推測される部分の認識候補は「数字であるとした場合の認識候補」を採用することで、認識精度を向上させたり、
図2−Bに示すように、数字であるとした場合の認識候補を用いずに、通常の辞書での文字認識を行った認識候補のうち、数字を多く含む候補の優先順位を上げるようにしてもよい。さらに、例えば「年」の前は4桁(または下2桁)、「月、日」の前は2桁(または下1桁)の数字があるということを前提として、その他の認識候補を除外したり、当該文字列を日付情報ではないものと判定するようにしてもよい。さらに、会計事務所や顧問先で仕訳入力を行おうとする原始証憑は通常近い過去のことであるため、認識される月日が一定の日付(例えば5年前以降)の範囲内にあるかを判断して、判定の確からしさや抽出処理の確からしさを判定してもよい。なお、ステップS08−03の日付情報に関するキーワードが見つからない場合は、
図1に示す2画面式会計入力画面でユーザー自身が入力するようにしてもよい。
【0061】
図9は、レシートや領収書の合計金額情報の文字認識を行う場合の、
図6の後処理(S06−05〜06)を説明するためのフロー図である。
図8と同様にキーワード類型をセットし、キーワード辞書(
図12)を参照してキーワード検出を行う(S09−01〜03)。例えば「現計」、「合計」などの合計金額に関するキーワードがあった場合、当該キーワードの右側の文字列(数字列)を合計金額とするといったキーワードに応じた推定処理、最適化処理を実行し(S09−04〜05)、文字列単位の認識候補を生成する(S09−06)。一方、キーワード検索により合計金額情報に関するキーワードが見あたらない場合(S09−03:N)、代替処理としてキーワードに代わる重要情報の検出を行う(S09−08)。すなわち、
図13に示すように領収書の合計金額情報として、キーワードが無い場合、最も大きな数字列を合計金額の数字と推定する(S09−09、最適化処理プログラムID:P011)。より詳細には、原始証憑イメージに含まれる文字の大きさを1文字単位で比較したり、認識した文字列群を切り出した単位で大きさを比較して大きい文字列群を残し、最後に残った文字列群を抽出したり、文字列の全体の平均値を算出して大きい文字の固まりをいくつか抽出して比較したりすることにより、最も大きな数字列を索出する。このとき、合計金額は数字であるため、数字の文字列のみに絞って検出するようにすると、店名などを除外することができる。さらに、大きな文字列が1箇所しか発見されなかった場合は、その文字列を合計金額情報であると推定したり、例えば大きな文字列が3箇所発見された場合には、中央より右側にある文字列や、最も上段の位置にある文字列を合計金額情報と推定するようにしてもよい。これは、レシートにおいて比較的大きく表示される数字として、合計金額、預かり金額、お釣りがあることが想定され、このうち合計金額は最も上に記載されることが多いことを考慮したものである。このようにして合計金額情報を推定したら、認識候補の最適化を行って(S09−10)、文字列単位の認識候補を生成する(S09−06)。 なお、上記の説明では、文字列の大きさ(文字サイズ)を重要情報として把握した例を記載したが、文字の太さを(単独で、あるいは文字の大きさに重畳して)考慮してもよい。
【0062】
また、文字サイズの比較は、切り出した文字について、文字の縦方向の高さのみの勘案、あるいは横方向の幅のみの勘案のほか、高さと幅の両方(面積)を勘案するようにしてもよいし、高さ、幅、面積などのうち、いずれかの要素に重み付けをして判定するようにしてもよい。切り出した文字の高さや幅、面積の判断については、読取りの際の傾きを補正した後のイメージを用いることが通常であるが、補正前のものを用いることができる。なお、言うまでもないことであるが、認識辞書との特徴量の比較を行うために、文字サイズを調整して正規化することがあるが、文字サイズ等の比較は、正規化する前の状態で行う。
【0063】
次に、
図4、
図10を用いて、本発明の第2実施例にかかる、原始証憑が預金通帳である場合の会計データ入力支援方法を説明する。原始証憑が預金通帳の場合にも、基本的には、
図6のフローチャートの処理を遂行することになるが、
図6のステップS06−06の処理を詳細化したのが、
図10の処理フローである。預金通帳は、例えば
図4−Aに示すように、取引毎に「日付」、「支払」、「預入」、「残高」などの欄に別れているが、予め印刷された欄名は薄く印字されていて読み取れなかったり、また「支払」と「預入」の欄が金融機関によって逆になっている場合があり、定型の原始証憑として扱いづらい問題がある。そこで本発明は、左端が「日付」、右端が「残高」であると仮定したうえで、これらの間の「支払」と「預入」を自動的に判定して会計データとして取り込めるようにしたことを特徴とする。
【0064】
図4−Aに示す預金通帳の読み取り画像において、前提として、例えばOCR認識処理において、認識候補の文字列について、日付や残高、預入等のキーワードの文字列と一致する文字列があるかどうかの検索を行い、これらのキーワードに合致する文字列が検出されれば、その下に存在する数字の文字列を該当するキーワード(日付、残高、支払、預入など)の内容と把握して、2画面式会計入力画面(
図1)の該当箇所に反映させる。一方、証憑タイプが「預金通帳」であることが判明しているにも拘わらず、「残高」等の文字列が、前処理としてのノイズ除去処理や濃度調整で消失したりして、キーワードに合致する文字列が見つからない場合、行単位で文字列を切り出し(S301)、左端の文字列を「日付」、右端の文字列を「残高」であると推定し、中央の2つが「支払」と「預入」であると推定する(S302:
図13の推定処理テーブル参照)。そして、これらの文字列に対し数字としての認識候補の優先順位を上げて、候補を調整する(S303)。調整のための認識候補の最適化処理は、日付情報については
図2−AのステップS103、金額情報については
図3−AのステップS203などの処理と同様であるため、詳細は省略する。これにより、
図4−AのS304に示すように、日付と残高が確定した認識結果が出力されるが、この段階では間の2つの文字列が支払であるか預入であるかを確定できない。
【0065】
そこで本発明はさらに、
図4−Bに概略を示すように、前後の行の残高の増減傾向を判定して(S403)、前の行から残高が増えていればその行の日付と残高の間の数字は預入であり、逆に残高が減っていれば支払であると把握して、その欄の内容を確定させる(S404)。この場合において、実際の増分(
図4−BのステップS403の例では3万円)が、その左側の列(右から2列目)の金額「30,000」円と合致するかどうかを判定して、検算を加えることで、認識精度を向上させるようにしてもよい。なお、キーワード検出代替処理S401は
図4−AのステップS301、推定処理S402は
図4−AのステップS302などの処理と同様であるため、詳細は省略する。
【0066】
図10は、この預金通帳における取引情報の文字認識処理の詳細を説明するフロー図である。預金通帳のイメージデータの文字認識において見出しとなるキーワードが見つからない場合、代替処理としてキーワードに代わる重要情報の検出が行われる(S10−01)。例えば左端の文字列に対して「日付」であると推定して、それ以外は「金額」であると推定する(S10−02)。このとき、右端が「残高」で中央の2つがそれぞれ「支払」と「預入」のいずれかであると推定してもよい。次に、各行について重要情報に応じた最適化処理を行って認識候補を生成する(S10−03〜05)。
【0067】
次に、各行において右端の文字列を「残高」であると推定したうえで、例えば上が空でない任意の行に注目し、その上下の行の残高の増減傾向を判定し、その内容から支払と預入の列を決定する(S10−06〜09)。このようにして、預金通帳の見出し欄の内容が確定し、その下方に記載される文字列の意味合いが確定して、システムは取引の内容に応じて日付や金額を自動的に抽出して会計入力画面に反映させることができる。
【0068】
このように、レシートなどの原始証憑は、枠線などで記載位置・内容が決まっているOCR伝票と異なり、数字/漢字などの区別が困難で認識率が低いが、会計に関する情報として重要なのは、日付と合計金額の情報なので、これらのキーワードの検出およびキーワードに応じた推定処理(キーワードが見つからない場合はキーワード代替処理を行った上での重要情報の推定処理)を行い、推定処理に応じた最適化処理(認識候補の優先的な取り扱いや、候補としての順位をアップするといった調整処理)を付加することで、日付や合計金額の認識に特化した十分な認識精度を得ることができる。
【0069】
また、あえて、数字であると仮定した文字認識を所定の段階で行う際に、漢字等を除去して数字に特化した数字用の文字認識辞書を活用することは、所定の推定処理を経て、数字らしいことを前提とした上で、数字であると仮定した場合の認識候補を優先的に取り扱う、という一連の処理の中で、会計処理に有意な「取引の年月日や(合計等の)金額情報といった数字」の認識率を向上させる上で有用である。また、レシート等はフォーマットが定義されておらず記載内容に意味づけがなされていないので、会計情報として取込みたいデータがどれなのか把握・抽出しにくいが、会計データとして取り込みたい項目(日付や仕訳に入れる金額(合計金額など))を自動的に抽出することで、入力を容易にすることができる。
【0070】
以上、本発明の数々の実施形態および実施例について詳細に説明したが、本発明の技術的範囲は上記の実施形態ないし実施例に限定されるものではなく、本発明は添付の特許請求の範囲を逸脱することなく様々な変形例、変更例として実現することができ、このような変形例、変更例はすべて本発明の技術的範囲に属すると解されるべきである。