(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023057446
(43)【公開日】2023-04-21
(54)【発明の名称】文書認識装置および文書認識方法
(51)【国際特許分類】
G06V 30/42 20220101AFI20230414BHJP
【FI】
G06K9/00 K
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2021166983
(22)【出願日】2021-10-11
(71)【出願人】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110001689
【氏名又は名称】青稜弁理士法人
(72)【発明者】
【氏名】大館 良介
【テーマコード(参考)】
5B064
【Fターム(参考)】
5B064AA01
(57)【要約】
【課題】文書認識において、エンドユーザが読取対象文字列の属性を簡単な操作で決定することができ、システム管理者の労力をかけずに辞書を拡充することのできるようにする。
【解決手段】文書認識装置は、文書画像を文字認識して文字列に対する属性とその属性に対応する項目の項目値を求める装置であり、文書の文字認識の結果情報と文字列に対する属性とその属性に対応する項目の項目値のペアリングの結果情報を表示し、文字列に対する属性とその属性に対応する項目の項目値のペアリングできなかったときに、文書上の文字列の表記と対応する項目の項目値を対指定した情報を受付け、文字列に対する属性とその属性に対応する項目の項目値のペアリングできなかった文字列に対する属性とその属性に対応する項目の項目値に対してのペアリングの補完を行う。
【選択図】
図7
【特許請求の範囲】
【請求項1】
文書画像を文字認識して文字列に対する属性とその属性に対応する項目の項目値を求める文書認識装置において、
文書の文字認識の結果情報と文字列に対する属性とその属性に対応する項目の項目値のペアリングの結果情報を表示し、
文字列に対する属性とその属性に対応する項目の項目値のペアリングできなかったときに、文書上の文字列の表記と対応する項目の項目値に関する情報を受付け、文字列に対する属性とその属性に対応する項目の項目値のペアリングできなかった文字列に対する属性とその属性に対応する項目の項目値に対してのペアリングの補完を行うことを特徴とする文書認識装置。
【請求項2】
文書上の文字列の表記と対応する項目の項目値に関する情報は、文書上の文字列の表記と対応する項目の項目値を対指定した情報であることを特徴とする請求項1記載の文書認識装置。
【請求項3】
文字列に対する属性とその属性に対応する項目の項目値のペアリングできなかった文字列に対する属性とその属性に対応する項目の項目値に対してのペアリングの補完を行ったときに、属性と文字列の表記に関する辞書データまたは属性と文字列の項目値記載形式に関する辞書データを追加することを特徴とする請求項1記載の文書認識装置。
【請求項4】
複数の文字列に対する属性とその属性に対応する項目の項目値の対象に対して、ペアリングできなかったときに、ある文字列に対する属性とその属性に対応する項目の項目値のペアリングの補完結果に基づいて、他の文字列に対する属性とその属性に対応する項目の項目値のペアリングの補完を行うことを特徴とする請求項1記載の文書認識装置。
【請求項5】
文書画像を文字認識して文字列に対する属性とその属性に対応する項目の項目値を求める文書認識装置の文書認識方法において、
文書の文字認識の結果情報と文字列に対する属性とその属性に対応する項目の項目値のペアリングの結果情報を表示するステップと、
文字列に対する属性とその属性に対応する項目の項目値のペアリングできなかったときに、文書上の文字列の表記と対応する項目の項目値を対指定した情報を受付けるステップと、
文字列に対する属性とその属性に対応する項目の項目値のペアリングできなかった文字列に対する属性とその属性に対応する項目の項目値に対してのペアリングの補完を行うステップと、
文字列に対する属性とその属性に対応する項目の項目値のペアリングできなかった文字列に対する属性とその属性に対応する項目の項目値に対してのペアリングの補完を行ったときに、属性と文字列の表記に関する辞書データまたは属性と文字列の項目値記載形式に関する辞書データを追加するステップとを有することを特徴とする文書認識方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書認識装置および文書認識方法に係り、特に、帳票などの入力欄を有する文書の認識と認識辞書を充実させる用途に好適な文書認識装置および文書認識方法に関する。
【背景技術】
【0002】
現今、情報処理装置により、活字や手書きのテキストの画像データを読み込み、文字コードに変換する光学式文字認識(OCR:Optical Character Reader)は、様々な文書形態に応用され、デジタルデータの活用手段として広く利用されている。
【0003】
例えば、帳票に応用される場合には、このような光学式文字認識による文書認識装置は、予め読取対象文字列の文書画像上での記載位置とその属性をユーザが事前に装置に登録しておく「帳票定義体」を定義しておき、それにより、読取対象文字列の読取および当該文字列の属性の認識と意味づけを行っていた。そのような文書処理においては、処理する文書のレイアウト、すなわち文字列の記載位置や枠の記載位置、枠の並びが統一されており、文書画像における読取対象文字列の記載位置が固定である場合には、前記の帳票定義体を事前に装置に登録することにより、読取対象文字列の位置検出および該文字列の属性の読取りを行うことができる。
【0004】
帳票に関する文書認識に関する技術としては、例えば、特許文献1に開示されている。特許文献1に記載された帳票認識装置では、帳票画像から検出された文字列に対し、項目値スコアを計算し、項目値候補スコアを計算し、項目値候補ペアの配置関係に対し、異なる属性の項目値同士の配置関係としての妥当さを表す項目値候補配置スコアを計算する。そして、それらの項目値候補スコアと項目候補配置スコアの値から、異なる属性の項目値同士のペアとしての妥当さを表す項目値候補ペアスコアを計算し、項目値グループの項目値を決定することが記載されている。
【0005】
この特許文献1に記載の技術を用いることにより、処理する文書のレイアウトが未知である文書処理業務において読取対象文字列の読取と当該文字列の属性(詳細は後述)の決定が可能になるとしている。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1に記載の技術によれば、文書内の文字列の意味と配置に基づくスコア計算によって文字列の属性の決定が可能になる。しかしながら、特許文献1に記載の技術は、文字列認識の結果を属性および項目値の辞書と照合する必要があるため、辞書が存在しない場合や文字列を構成する文字に対する文字認識の結果が誤っていた場合には、項目名と項目値を一意にペアリングすることが困難になるという課題がある。
【0008】
現実の文書処理システムにおいては、システム導入前に辞書を完備できないケースも多く、また文字認識の結果が必ずしも正しいとは限らないため、これらの不確実な状況に対応し、システム管理者の労力をかけずに辞書を拡充する必要である。
【0009】
本発明の目的は、読取対象文字列の属性を決定し、システム管理者の労力をかけずに辞書を拡充することのできる文書認識装置を提供することにある。
【課題を解決するための手段】
【0010】
本発明の文書認識装置の構成は、好ましくは、文書画像を文字認識して文字列に対する属性とその属性に対応する項目の項目値を求める文書認識装置において、文書の文字認識の結果情報と文字列に対する属性とその属性に対応する項目の項目値のペアリングの結果情報を表示し、文字列に対する属性とその属性に対応する項目の項目値のペアリングできなかったときに、文書上の文字列の表記と対応する項目の項目値に関する情報を受付け、文字列に対する属性とその属性に対応する項目の項目値のペアリングできなかった文字列に対する属性とその属性に対応する項目の項目値に対してのペアリングの補完を行うようにしたものである。
【発明の効果】
【0011】
本発明によれば、エンドユーザが読取対象文字列の属性を簡単な操作で決定することができ、システム管理者の労力をかけずに辞書を拡充することのできる文書認識装置を提供することができる。
【図面の簡単な説明】
【0012】
【
図2】文書認識装置のハードウェア・ソフトウェア構成図である。
【
図3】文字認識結果テーブルの一例を示す図である。
【
図6】文書認識装置の一連の処理の概要を示すフローチャートである。
【
図7】不確定ペアリング処理の詳細を示すフローチャートである。
【
図8】文書認識結果画面の一例を示す図である(その一)。
【
図9】帳票上の表記表示文字列と対応する項目に対して対指定を行っている様子を示す図である。
【
図10】文書認識結果画面の一例を示す図である(その二)。
【発明を実施するための形態】
【0013】
以下、本発明の係る一実施形態を、
図1ないし
図10を用いて説明する。
【0014】
本発明の文書認識装置は、文字認識において読取対象となる文字列の属性と表記、その文字列の記載形式に関する辞書(詳細は後述)が必ずしも完備されていない場合においても、読取対象文字列の属性を決定し、システム管理者にとって、労力をかけずに辞書を拡充するものであり、そのために、エンドユーザに対してペアリング候補を提示し、エンドユーザに操作をさせて、ペアリングできなかった属性の表記を辞書に追加する装置である。
【0015】
ここで、文字列の属性、表記、項目値、ペアリングについて説明する。
属性とは、文字列の有する論理的な性質である。表記とは、帳票上の文字列の外形(項目名)である。項目値とは、帳票上の文字列が入力項目を表しているときに、帳票上で入力あるいは指定された値である。ペアリングとは、属性と項目値の対応をペアとして求めることである。
【0016】
例えば、属性として「金額」の場合に、表記として、「金額」、「払い込み額」、「合計」などが考えられる項目値は、例えば、表記として「金額」の項目に記載された「1,234円」、「¥1,234」の値である。
【0017】
先ず、
図1ないし
図6を用いて文書認識装置の構成について説明する。
【0018】
文書認識装置100は、機能構成として、
図1に示されるように、レイアウト解析部101、文字認識部102、属性項目値ペアリング処理部103、不確定ペアリング処理部104、記憶部110を有する。
【0019】
レイアウト解析部101は、帳票のレイアウトを解析し文字列が配置された相対位置を求める機能部である。文字認識部102は、帳票の画像から文字を認識し、対応する文字コードを求める機能部である。属性項目値ペアリング処理部103は、帳票から読み取られる情報に基づいて、属性とそれに対応する読み取られた項目値のペアリングを行う機能部である。不確定ペアリング処理部104は、属性項目値ペアリング処理部103でペアリングできなかった属性と項目値に対して、エンドユーザに情報を入力させたり、あるいは、既知の情報に基づいた演算処理により、属性と項目値のベアリングを行う機能部である。記憶部110は、文書認識装置100で用いられるデータを記憶する処理部である。
【0020】
記憶部110には、文字認識結果テーブル201、辞書データテーブル202、ペアリングテーブル203が保持される。なお、各々のテーブルの詳細は、後に説明する。
【0021】
文書認識装置100は、ハードウェア構成として、
図2に示されるように、プロセッサ301、主記憶装置302、表示インタフェース303、入出力インタフェース304、補助記憶インタフェース305、ネットワークインタフェース306が、内部バス等を介して互いに接続される構成である。
【0022】
プロセッサ301は、主記憶装置302にロードされたプログラムを実行し、文書認識装置100の各部に指令を与える装置である。プロセッサ301がプログラムにしたがって処理を実行することによって、特定の機能を実現する。
【0023】
主記憶装置302は、プロセッサ301が実行するプログラムおよびプログラムが使用する一時的データを格納する装置である。主記憶装置302は、例えば、DRAM(Dynamic Random Access Memory)などの半導体記憶装置が考えられる。
【0024】
表示インタフェース303は、LCD(Liquid Crystal Display)などの表示装置310を接続するインタフェース回路である。
【0025】
入出力インタフェース304は、入力装置320と出力装置330を接続するインタフェース回路である。入力装置320は、キーボード、マウス、およびタッチパネル等の文書認識装置100に情報を入力する装置である。また、入力装置320は、スキャナ、デジタルカメラ等の画像取得のための機器も含む。出力装置330は、プリンタなどの文書認識装置100の処理結果やデータの情報を出力する装置である。
【0026】
補助記憶インタフェース305は、HDD(Hard Disk Drive)などの磁気記憶媒体装置、または、SSD(Solid State Drive)などの不揮発性の半導体記憶媒体装置などの大容量の補助記憶装置340を接続する回路である。
【0027】
補助記憶装置340には、プログラムが格納されており、実行時には、そのプログラムは、主記憶装置302にロードされ、プロセッサ301が各々の機能を実現するプログラムを実行する。文書認識装置100には、レイアウト解析プログラム351、文字認識プログラム352、属性項目値ペアリング処理プログラム353、不確定ペアリング処理プログラム354がインストールされている。
【0028】
レイアウト解析プログラム351、文字認識プログラム352、属性項目値ペアリング処理プログラム353、不確定ペアリング処理プログラム354は、各々、レイアウト解析部101、文字認識部102、属性項目値ペアリング処理部103、不確定ペアリング処理部104の機能を実現するプログラムである。
【0029】
また、補助記憶装置340には、データとして、文字認識結果テーブル201、辞書データテーブル202、ペアリングテーブル203が格納される。
【0030】
ネットワークインタフェース306は、ネットワーク5を接続するためのインタフェース回路である。ネットワーク5は、通信媒体としては、有線でもよいし、無線でもよい。また、接続形態は、LAN(Local Area Network:構内ネットワーク)でもよいし、インターネットのようなグローバルネットワークであってもよい。また、文書認識装置100は、ネットワークや直接の接続を介して、他の計算機や記憶装置とデータの送受信や処理の分担をしてもよい。
【0031】
上記の文書認識装置100は、各機能を実現するソフトウェアにより実現する例について説明した。この場合には、プログラム開発者が、プログラムコードを、例えば、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)などにより記述し、コンパイルまたはアセンブルにより得た実行形式により、または、スクリプト言語によるスクリプトを実行することによりで実装することができる。
【0032】
プログラムを格納する記憶媒体としては、既に述べたHDD(Hard Disk Drive)、SSD(Solid State Drive)の外、例えば、フレキシブルディスク、CD-ROM、DVD-ROM、光ディスク、光磁気ディスク、CD-R、磁気テープ、不揮発性のメモリカード、ROMなどであってもよい。
【0033】
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。
【0034】
次に、
図3ないし
図5を用いて文書認識装置で用いられるデータ構造について説明する。
【0035】
文字認識結果テーブル201は、帳票上に配置されている文字列に対する認識結果を格納するテーブルであり、
図3に示されるように、認識結果ID201a、文字列201b、記載座標201c、確信度201dの各フィールドからなる。
【0036】
認識結果ID201aには、認識結果のレコードを一意的に表す識別子が格納される。文字列201bには、帳票上の文字列を文字認識処理により認識した文字列が格納される。記載座標201cには、レイアウト解析処理により解析された文字列の帳票上の相対位置の座標で、例えば、矩形の左上と右下の座標が格納される。確信度201dには、文字認識処理の結果として、各認識結果文字列に付与される認識の信頼性を示す数値を、例えば、0以上1未満のスカラー値として格納する。
【0037】
辞書データテーブル202は、文字認識と文字列の属性と項目値のペアリングに用いられる辞書データを格納するテーブルであり、辞書データテーブル(TYPEI)202Iと、辞書データテーブル(TYPEII)202IIの二種類のテーブルがある。
【0038】
辞書データテーブル(TYPEI)202Iは、
図4に示されるように、属性202Ia、表記202Ibの各フィールドを有する。
【0039】
属性202Iaには、文字列の属性が格納される。属性とは、既に説明したように、文字列の有する論理的な性質である。表記202Ibには、文字列の表記が格納される。表記とは、既に説明したように、帳票上の文字列の外形(項目名)である。
図4に示されるように、一つの属性に対して複数の表記が存在する場合もありうる。例えば、
図4の例では、「金額」という属性に対して、「金額」、「合計」、「total」などの表記を持ちうることを示している。また、辞書が完備されていないとは、ある属性に対して、帳票上に実現される文字列が、その属性に対応する表記として、辞書データテーブル(TYPEI)202Iに含まれていないことを意味する。
【0040】
辞書データテーブル(TYPEII)202IIは、
図4に示されるように、属性202IIa、項目形値記載形式202IIbの各フィールドを有する。
【0041】
属性202IIaには、文字列の属性が格納されることは、辞書データテーブル(TYPEI)202Iと同様である。項目形値記載形式202IIbには、属性202IIaの項目値の記載形式を表す情報がある記述形式により格納される。例えば、「金額」の属性に対しては、「¥」マークと「数字」の組合せが指定され、「発行日」の属性に対しては、日付をあらわす「yyyy/mm/dd」の形式で項目値として格納されることを意味する。
【0042】
ペアリングテーブル203は、属性と項目値のペアリングを格納するテーブルであり、
図5に示されるように、属性203a、項目値203bの各フィールドからなる。ペアリングとは、既に説明したように、属性と項目値の対応をペアとして求めることであり、帳票上の文字列が入力項目を表しているときに、帳票上で入力あるいは指定された値である。
【0043】
属性203aには、文字列の属性が格納される。項目値203bには、属性203aの属性に対応する項目値が格納される。
【0044】
次に、
図6および
図7を用いて文書認識装置で実行される処理について説明する。
【0045】
先ず、
図6を用いて文書認識装置の一連の処理の概要について説明する。
文書認識装置100は、先ず、帳票を読み込んだ入力画像に対してレイアウト解析処理を実施する(S201)。レイアウト解析処理とは、文字認識の前処理として、一般的に実施される帳票上文字列に対してのレイアウト配置を求める処理であり、例えば、入力画像を白黒の二値画像にし、連結する黒画素成分を抽出し、罫線、文字行、表領域等およびそれらの座標等を画像から抽出することが考えられる。なお、S201の入力画像は、入力装置320から取得したものの他、補助記憶装置340や外部の記憶装置などに格納されたものでもよいし、ネットワークインタフェース306を介してネットワーク5に接続された外部装置やサーバから取得したものでもよい。
【0046】
次に、文書認識装置100は、文字認識処理を実施する(S102)。文字認識処理とは、S101で抽出した全文字列に対して行う字種判別の処理のことであり、例えば、文字列画像から方向特徴を抽出し、その方向特徴を用いて文字認識辞書内の最近傍探索によって字種を判別することが考えられる。このとき、字種への所属確率としての確信度も同時に取得する。S102の処理結果として、
図3に示された文字認識結果テーブル201に値が設定される。
【0047】
次に、文書認識装置100は属性項目値ペアリング処理を実施する(S103)。属性項目値ペアリング処理とは、S102で文字認識して判別した各文字列に対して行う属性判定処理のことであり、特許文献1のような公知の手法を用いて実現可能である。例えば、文字認識結果テーブル201と、
図4に示した辞書データテーブル202を使用し、各文字列の意味と配置関係からに基づいてペアリングをして、
図5に示したペアリングテーブル203に値を格納する。
【0048】
次に、不確定ペアリング処理を実施する(S104)。不確定ペアリング処理では、辞書の不完備や文字認識結果の誤りによってS103でペアリングできなかった文字列をペアリングする。S104の処理の詳細については、
図7を用いて説明する。
【0049】
次に、
図7を用いて不確定ペアリング処理の詳細について説明する。
これは、
図6のS104に該当する処理である。
先ず、文書認識装置100は、
図6のS101ないしS103の処理で得た情報に基づいて、表示装置310に文書認識結果画面を表示する(S201)。文書認識結果画面には、後に詳細に説明するように、ペアリングの結果が表示される
次に、文書認識装置100は、帳票により求められることが期待される全属性の項目値を取得できたか否かを判定する(S202)。全属性の項目値を取得できたときには(S202:YES)、処理を終了し、全属性の項目値を取得できていなときには(S202:NO)、S203に行く。
【0050】
次に、文書認識装置100は、エンドユーザからペアリング結果表示欄のペアリングできていない属性と項目値に対しての入力を受け付ける(S203)。
【0051】
次に、入力された属性と項目値のペアが一組か否かを判定する(S204)。入力された属性と項目値のペアが一組のときには(S204:YES)、S206に行き、入力された属性と項目値のペアが複数のときには(S204:NO)、S205に行く。
【0052】
入力される属性と項目値のペアが一組のときの文書認識結果画面におけるユーザインタフェースは、後に、
図8および
図9により説明する。
【0053】
入力された属性と項目値のペアが複数のときには(S204:NO)、文書認識装置100は、ペアリングできていない属性と項目値を表記または項目値から特定可能か否かを判定し(S205)、特定可能のときには(S205:YES)、S206に行き、特定可能でないときには(S205:NO)、S208に行く。
【0054】
入力された属性と項目値のペアが複数のときの文書認識結果画面700におけるユーザインタフェースは、後に、
図10により説明する。
【0055】
入力された属性と項目値のペアが一組のとき(S204:YES)または入力された属性と項目値のペアが複数のときでペアリングできていない属性と項目値を表記または項目値から特定可能のときには(S204:NO、S205:YES)、文書認識装置100は、入力された情報と認識された結果に基づいて、ペアリング結果表示欄を更新する(S206)。
次に、属性-表記に関する辞書テーブル(TYPEI)202Iを更新する(S207)。
次に、最終結果として、必要なときには、ペアリング結果表示欄を更新する(S208)。
【0056】
なお、本実施形態の処理では、属性-表記に関する辞書テーブル(TYPEI)を説明した。しかしながら、属性-表記に関する辞書テーブル(TYPEI)が既に登録されており、文字認識処理の結果、項目の項目値が得られ、それが数値型、日付型であるなど推測できるときには、その属性に対応する属性-項目値記載形式に関する辞書データテーブル(TYPEII)を追加することも考えられる。
【0057】
次に、
図8ないし
図10を用いて文書認識装置の提供するユーザインタフェースについて説明する。
【0058】
先ず、
図8および
図9を用いて入力される属性と項目値のペアが一組のときの文書認識結果画面におけるユーザインタフェースについて説明する。また、
図4に示した辞書データテーブル202が格納されているものとする。
【0059】
文書認識結果画面500は、
図8に示されるように、帳票解析情報表示欄510、ペアリング結果表示欄520、閉じるボタンからなる。
【0060】
帳票解析情報表示欄510は、文書認識装置100が対象となる帳票に対して、レイアウト解析処理、文字認識処理を行った結果の情報を表示する欄である。帳票解析情報表示欄510には、三種類の文字列が表示色などの区別により、エンドユーザに識別できる形態で表示される。
【0061】
図8の例では、「請求書No.」のように、文字列の表記を表す表記表示文字列510aと、「89」のように、項目に対する項目値を表す項目値表示文字列510bと、「請求書」のように、前記両者のいずれに属さないOther文字列510cである。
【0062】
ペアリング結果表示欄520には、属性項目値ペアリング処理により、ペアリングされた属性と項目値のペアリングの結果が表示される。
図8の例では、属性が「発行日」のエントリが、空白になっており、属性項目値ペアリング処理で、属性と項目値が対応付けられなかったことを示している。
【0063】
これは、文字認識として、表記表示文字列510aとして「日付」の文字列自体は正しく検出および認識できているが、辞書データテーブル(TYPEI)202Iに、「発行日」の属性202Iaに対して、表記202Ibとして「日付」を有するレコードが存在しなかったため、「発行日」の属性の項目値がペアリングできなかったことを意味する。
【0064】
したがって、エンドユーザは、
図9に示されるような操作を行って、「日付」の表記表示文字列510aと、それに対応する「2017/6/29」の項目値表示文字列510bをマウスなどのポィンティングデバイスより選択し、右クリックによって表示されるコンテクストメニュー540あるいはキーボードなどより、「対指定」コマンドを入力する。これにより、「発行日」の属性と、「2017/6/29」の項目値が対応付けられ、その結果がペアリング結果表示欄520に反映される。また、属性-表記の対応を示す辞書データテーブル(TYPEI)202Iに、属性202Iaが、「発行日」、表記202Ibが、「日付」のレコードが追加される。
【0065】
この例は、入力される属性と項目値のペアが一組のときである。
【0066】
次に、
図10を用いて入力される属性と項目値のペアが二組のときの文書認識結果画面におけるユーザインタフェースについて説明する。また、上と同様に、
図4に示した辞書データテーブル202が格納されているものとする。
【0067】
図10に示したように、
図8と異なっている所は、属性「金額」に対応する表記項目文字列510aが、「振込金額」となっていることである。
【0068】
したがって、この場合、ペアリング結果表示欄520には、属性が「発行日」のエントリと、属性が「金額」が、空白になっており、この二つが属性項目値ペアリング処理で、属性と項目値が対応付けられなかったことを示している。
【0069】
このとき、エンドユーザは、既に示した
図9に示されるような操作を行って、「日付」の表記表示文字列510aと、それに対応する「2017/6/29」の項目値表示文字列510bの「対指定」コマンドを行う。
【0070】
このとき、属性が「発行日」のエントリがペアリングされるため、ペアリングできなかったエントリとして、属性が「金額」であるエントリが残ることになる。
【0071】
したがって、文書認識装置100は、残っているペアリングの候補から、表記項目文字列510aが「振込金額」の項目は、属性が「金額」であることを判定することができる。
【0072】
そして、属性が「発行日」のエントリと、属性が「金額」が、空白になっており、この二つが属性項目値ペアリング処理で、属性と項目値が対応付けられなかったが、属性が「発行日」のエントリは、辞書データテーブル202II(TYPEII)の項目値記載形式202IIbで、「yyyy/mm/dd」の形式と合致するため、属性が「発行日」の項目値として、「2017/6/29」の項目値表示文字列510bを採用すべきであり、属性が「金額」のエントリは、辞書データテーブル202II(TYPEII)の項目値記載形式202IIbで、「[数字]円」の形式と合致するため、属性が「金額」の項目値として、「1234円」の項目値表示文字列510bを採用すべきであるとして、各々の値が特定される。
【0073】
また、属性-表記の対応を示す辞書データテーブル(TYPEI)202Iに、属性202Iaが、「発行日」、表記202Ibが、「日付」のレコードと、属性202Iaが、「金額」、表記202Ibが、「振込金額」のレコードが追加される。
【0074】
この例は、入力される属性と項目値のペアが二組のときであり、
図7のS205:YESの場合である。
【0075】
以上述べてきたように、エンドユーザは、辞書の不備または文字認識誤りなどの失敗により、属性と項目値のペアリングが失敗したときでも、文書認識結果画面500上での簡単なユーザ操作により、属性と項目値のペアリングの不備を補って完全なものにすることを試行することができる。
【0076】
また、この操作により、属性と表記を対応させる辞書データが拡充されていくので、システム管理者にとって辞書構築の負担を軽減することができる。
【符号の説明】
【0077】
100…文書認識装置、101…レイアウト解析部、102…文字認識部、103…属性項目値ペアリング処理部、104…不確定ペアリング処理部、110…記憶部、
201…文字認識結果テーブル、202…辞書データテーブル、203…ペアリングテーブル