(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-22
(45)【発行日】2023-05-30
(54)【発明の名称】OCR認識結果確認支援プログラム、OCR認識結果確認支援方法およびOCR認識結果確認支援システム
(51)【国際特許分類】
G06V 30/12 20220101AFI20230523BHJP
G06V 30/412 20220101ALI20230523BHJP
【FI】
G06V30/12 J
G06V30/412
(21)【出願番号】P 2019117796
(22)【出願日】2019-06-25
【審査請求日】2022-03-08
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100104190
【氏名又は名称】酒井 昭徳
(72)【発明者】
【氏名】川口 哲成
(72)【発明者】
【氏名】杉村 幸弘
【審査官】藤原 敬利
(56)【参考文献】
【文献】特開平09-297821(JP,A)
【文献】特開平03-122773(JP,A)
【文献】特開平07-073269(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00- 1/40
G06T 3/00- 5/50
G06V 30/00-30/424
(57)【特許請求の範囲】
【請求項1】
イメージデータを取得し、
前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、
拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、
前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する、
処理をコンピュータに実行させることを特徴とするOCR認識結果確認支援プログラム。
【請求項2】
前記イメージデータは、帳票上に複数の属性別の手書き記入欄を有し、
前記イメージデータの取得では、複数の前記帳票の前記属性別のイメージデータを取得し、
前記リストの出力では、複数の前記帳票で共通する所定の前記属性の前記確認用イメージデータと、当該確認用イメージデータの文字認識結果と、を比較可能な表示形式でリスト出力する、
ことを特徴とする請求項1に記載のOCR認識結果確認支援プログラム。
【請求項3】
前記リストの出力では、複数の前記帳票で共通する一つの前記属性の前記文字列の前記文字認識結果に含まれる前記文字列でソートし、
前記ソートした複数の前記帳票の前記文字認識結果と、当該文字認識結果に対応する前記確認用イメージデータと、を比較可能な表示形式でリスト出力する、
ことを特徴とする請求項2に記載のOCR認識結果確認支援プログラム。
【請求項4】
出力された前記リストを用いたユーザによる前記文字認識結果の正誤の確認に基づき、当該確認済の前記文字認識結果を前記帳票
の電子データとして記憶する、
ことを特徴とする請求項2または3に記載のOCR認識結果確認支援プログラム。
【請求項5】
複数の属性別の前記文字認識結果を前記帳票単位で統合し、前記帳票の電子データとして記憶する、
ことを特徴とする請求項4に記載のOCR認識結果確認支援プログラム。
【請求項6】
イメージデータを取得し、
前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、
拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、
前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する、
処理をコンピュータが実行することを特徴とするOCR認識結果確認支援方法。
【請求項7】
イメージデータを取得し、前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する制御部、
を備えたことを特徴とするOCR認識結果確認支援システム。
【請求項8】
帳票に手書きで記載された文字列を読み取り、前記イメージデータを出力するスキャナと、
前記リストを表示または印刷出力する出力部と、
出力された前記リストに基づき、前記文字認識結果の正誤の確認をユーザ操作するための操作部と、
を備えたことを特徴とする請求項7に記載のOCR認識結果確認支援システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字認識(OCR:Optical Character Recognition)結果の確認を支援するOCR認識結果確認支援プログラム、OCR認識結果確認支援方法およびOCR認識結果確認支援システムに関する。
【背景技術】
【0002】
OCRを用いることで手書き文字をデータ化することができる。例えば、帳票に記入された手書き文字を文字認識することで、帳票の記入内容をテキストデータ等にデータ化し、帳票データのデータベースを構築できる。
【0003】
OCRによる文字認識では、手書きされた文字の形状や大きさ等が一様ではないため、文字認識に誤りが生じることがある。このため、手書きされた文字のイメージデータ(例えば画像データ)と、OCR結果のデータ(例えばテキストデータ)とを見比べて、文字認識結果の正誤をユーザが確認する作業を行う。
【0004】
文字認識結果の確認に関連する技術として、OCRの認識結果を色や品詞等のパターン毎にクラスタリングし、同じ文字パターンとして文字認識された複数の画像パターンの認識結果を並べて表示し、確認させるオペレータを選択する技術が開示されている。また、同じ認識結果となった文字イメージから類似するもの同士をクラスタリングして同じクラスタと判定された文字イメージ同士を並べて表示する技術が開示されている。また、認識元の文字列のイメージを1文字毎に分解し、指定された認識結果1文字分の前後の文字のイメージを連結してソートしたものを一覧表示する技術が開示されている。また、文書画像内の図、罫線、画像、表等の領域認識結果と、領域内の文字認識結果を併せて表示する技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2017-111500号公報
【文献】特開2005-309608号公報
【文献】特開2015-55891号公報
【文献】特開平11-149520号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来技術では、OCRにより得られた文字認識結果の確認作業を効率化できなかった。例えば、確認リスト上に確認対象として並べる手書き文字が複数の文字の文字列からなり各文字のサイズが違う場合、単に同じ文字列のイメージを並べただけでは、比較すべき各文字同士の位置が異なり、容易に確認することができない。
【0007】
また、ユーザの癖により手書き文字の大きさが文字毎に異なる場合、同じ文字のイメージ(字形)が同じ位置に並んだとしでも、文字サイズが違うため、異なった字形に見誤る場合がある。このように、手書き文字が複数の文字から構成される文字列の場合、従来技術では、ユーザによる確認作業の際、文字認識結果の正誤を一目で容易に確認することができなかった。
【0008】
一つの側面では、本発明は、手書き文字のイメージデータと文字認識結果とを比較する作業を容易に行えるリストを出力できることを目的とする。
【課題を解決するための手段】
【0009】
本発明の一側面によれば、イメージデータを取得し、前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する、処理を行うことを要件とする。
【発明の効果】
【0010】
本発明の一態様によれば、手書き文字のイメージデータと文字認識結果とを比較する作業を容易に行えるリストを出力できるという効果を奏する。
【図面の簡単な説明】
【0011】
【
図1】
図1は、実施の形態にかかるOCR認識結果確認支援の一実施例を示す説明図である。
【
図2】
図2は、実施の形態にかかるOCR認識結果確認支援装置のハードウェア構成例を示す図である。
【
図3】
図3は、実施の形態にかかるOCR認識用のイメージデータの変換処理を説明する図である。
【
図4】
図4は、実施の形態にかかるOCR認識用のイメージデータの変換処理例を示す図である。
【
図5】
図5は、実施の形態にかかるOCR認識結果確認支援の処理例を示すフローチャートである。
【
図6A】
図6Aは、実施の形態にかかるOCR認識結果確認支援装置が出力するOCR結果確認リスト例を示す図である。(その1)
【
図6B】
図6Bは、実施の形態にかかるOCR認識結果確認支援装置が出力するOCR結果確認リスト例を示す図である。(その2)
【
図7】
図7は、従来技術に相当する文字認識結果のリストを示す図である。
【発明を実施するための形態】
【0012】
(実施の形態)
以下に図面を参照して、開示のOCR認識結果確認支援プログラム、OCR認識結果確認支援方法およびOCR認識結果確認支援システムの実施の形態を詳細に説明する。
【0013】
図1は、実施の形態にかかるOCR認識結果確認支援の一実施例を示す説明図である。OCR認識結果確認支援装置100は、帳票等に手書きされた文字を文字認識し、ユーザが行う文字認識結果の確認作業を支援する。OCRでは、手書き文字の文字認識結果に誤りが生じることがあり、実施の形態のOCR認識結果確認支援装置100は、OCR認識結果を確認するユーザに対して、文字認識状態の正誤を容易に確認可能な表示形式で提示する。
【0014】
OCR認識結果確認支援装置100は、例えば、手書き文字で記入された多数の帳票の内容を集約して電子化(電子データ化)する業務に適用できる。OCR認識結果確認支援装置100は、CPUや記憶部101等を有するPC、サーバ等のコンピュータ装置を用いて構成でき、OCR認識結果確認支援プログラムは、記憶部101等に格納されている。CPUが記憶部101等の記憶部に格納されているOCR認識結果確認支援プログラムをプログラム実行することで、所定のOCR認識処理を実行する。
【0015】
OCR認識結果確認支援システムは、上記のOCR認識結果確認支援装置100と、このOCR認識結果確認支援装置100に接続される出力部103と、操作部104と、データベース(DB)105と、スキャナ110と、を含む。出力部103は、例えば、
図1に記載したディスプレイや、プリンタ等である。操作部104は、例えば、
図1に記載したキーボードである。DB105は、OCR認識結果確認支援装置100から独立して配置した構成としてもよいし、OCR認識結果確認支援装置100の記憶部101の一部の記憶領域を用いる構成としてもよい。
【0016】
図1を用いて、帳票に対するOCR認識結果確認支援に関する全体の処理の流れを説明する。はじめに、市町村の役場等の職員(ユーザ)Uが利用者宅Hを訪問して所定の帳票Tを利用者に渡し、利用者に対し帳票Tの各記入欄への記入を依頼する。利用者は筆記具を用いて帳票Tの記入欄に文字を手書きして記入する。職員Uは、手書き文字が記入された帳票Tを回収し、役場に持ち帰る(ステップS1)。
【0017】
職員Uは、複数の利用者宅Hの訪問により、複数の帳票Tを収集する。なお、
図1に記載した各工程別の複数の職員Uは、同一の職員であってもよいし、異なる職員であってもよく、同一の職員Uが複数の構成の作業を実施してもよい。
【0018】
この後、職員Uは、OCR認識結果確認支援装置100を用いて収集した複数の帳票Tの記入内容の電子化を行うため、スキャナ110を用いて複数の帳票Tをそれぞれ読み取る(ステップS2)。スキャナ110で読み取った帳票Tのイメージデータ(画像データ)IMGは、OCR認識結果確認支援装置100に入力される(ステップS3)。
【0019】
OCR認識結果確認支援装置100は、例えば、読み取った帳票T毎にイメージデータIMGに対するOCR認識(文字認識)、および文字認識結果を確認するための表示にかかる処理を行う(ステップS4)。OCR認識結果確認支援装置100の記憶部101には、これら文字認識および文字認識結果の表示制御にかかる処理プログラムが格納されており、CPU等のプロセッサが処理プログラムを実行する。
【0020】
文字認識および文字認識結果の表示制御にかかる処理(ステップS4)は、帳票Tのデータの分解処理(ステップS101)、属性別変換結果データのリスト化処理(ステップS102)、帳票Tのデータの統合処理(ステップS103)を含む。
【0021】
帳票Tのデータの分解処理(ステップS101)では、OCR認識結果確認支援装置100は、一つの帳票T毎の文字認識処理を行う。この文字認識処理時に、OCR認識結果確認支援装置100は、帳票TのイメージデータIMGと、このイメージデータを文字認識処理した文字認識結果(テキストデータ)OCRを関連付けて保持する。
【0022】
ここで、OCR認識結果確認支援装置100は、文字認識の処理の実行前に、イメージデータの文字列を文字単位に分解する分解処理と、文字列の各文字のイメージデータの大きさを揃える整形処理と、を行う。これら処理の詳細は後述する。
【0023】
この後、OCR認識結果確認支援装置100は、文字認識処理を行い、文字認識後のイメージデータを属性別に分解する。例えば、帳票Tには、複数の記入欄を有し、一つの記入欄が氏名、他の記入欄が住所、さらに他の記入欄としてアンケート回答等、を有する。例えば、これら異なる項目の記入欄の氏名、住所等が属性(属性項目)に相当する。そして、OCR認識結果確認支援装置100は、属性別のイメージデータを属性別変換結果データ102として記憶部101に保持する。
【0024】
リスト化処理(ステップS102)では、OCR認識結果確認支援装置100は、氏名や住所等の属性別の属性別変換結果データ102のうち、同じ属性のイメージデータと文字認識結果(テキストデータ)を複数の帳票Tから集約する。そして、OCR認識結果確認支援装置100は、文字列データでソートしたリストを作成し、イメージデータと文字認識結果とを比較可能な形式で出力する(ステップS5)。例えば、リストを
図1に示す出力部としてのディスプレイ103に表示出力、あるいはプリンタに印字出力する。
【0025】
例えば、
図1に示すリストL1は、属性として氏名を昇順にソートした表示状態を示す。OCR認識結果確認支援装置100は、氏名のリストL1として、帳票Tに記入された氏名の確認用イメージデータIMG(L11)と、文字認識結果OCR(テキストデータ)L12とを横に並べて配置する。縦方向には、異なる複数の帳票Tに記入された氏名の確認用イメージデータL11と、文字認識結果(テキストデータ)L12を配置する。
【0026】
また、
図1に示すリストL2は、属性として住所を昇順にソートした表示状態を示す。OCR認識結果確認支援装置100は、住所のリストL2として、帳票Tに記入された住所の確認用イメージデータL21と、文字認識結果(テキストデータ)L22とを横に並べて配置する。縦方向には、異なる複数の帳票Tに記入された住所の確認用イメージデータL21と、文字認識結果(テキストデータ)L22を配置する。
【0027】
なお、
図1に示した確認用イメージデータL11,L21および後述するイメージデータは、実際には手書き文字であるが、便宜上、所定のフォントで記載してある。
【0028】
役場の職員Uは、例えば、属性別に文字認識結果の確認を異なる職員が担当してもよい。
図1の例では、属性が氏名に関する文字認識結果の確認を職員U1が行い、属性が住所に関する文字認識結果の確認を職員U2が行う。
【0029】
そして、職員U1は、ディスプレイ103等に表示されている氏名のリストL1を参照し、氏名に関する文字認識結果の確認を行う。この際、職員U1は、氏名のリストL1に表示されている確認用イメージデータL11と文字認識結果(テキストデータ)L12とを見比べることにより、確認用イメージデータL11に対する文字認識結果(テキストデータ)L12の確認作業を行う。
【0030】
例えば、職員U1は、氏名のリストL1上で、互いに横に並べられた確認用イメージデータL11と、文字認識結果(テキストデータ)L12とを比較する。そして文字認識結果(テキストデータ)L12が正しく文字認識されたものであるか正誤を確認する。
図1の例では、氏名のリストL1の文字認識結果は正常である例を示している。ここで、例えば、氏名リストL1の最上段のイメージデータ「川口 明子」に対し、文字認識結果(テキストデータ)L12が「川口 朗子」の場合、職員U1は、文字認識結果(テキストデータ)L12に誤りがあることを確認できる。
【0031】
ここで、氏名のリストL1の確認用イメージデータL11は、帳票T上で実際には手書きされ、文字毎の大きさ等が異なるものであったが、上記の分解処理(ステップS101)で行ったイメージデータの整形処理により、各文字の大きさが揃えられている。これにより、職員U1は、氏名のリストL1に表示されている確認用イメージデータL11の各文字を見落とすことなく確認できる。この際、職員U1は、文字の大きさが揃えられた確認用イメージデータL11と、文字認識結果(テキストデータ)L12とを容易に見比べることができる。このように、OCR認識結果確認支援装置100は、職員U1が行う確認作業を正確かつ効率的に遂行できるように支援する。
【0032】
ここで、氏名のリストL1の確認用イメージデータL11、および文字認識結果(テキストデータ)L12について、異なる複数の帳票Tを縦方向に昇順にソートして配列している。これにより、同じ文字列が縦方向に連続して配置されているため、確認用イメージデータL11を縦方向に目で追って確認した際に異なる文字の混入があれば容易に確認(発見)できるようになる。同様に、文字認識結果(テキストデータ)L12を縦方向に目で追って確認した際に異なる文字の混入(文字の誤認識に相当)を容易に発見できるようになる。
【0033】
詳細は後述するが、異なる複数の帳票Tを文字認識結果で縦方向に昇順にソートした場合、確認用イメージデータL11は縦方向で同じ文字列が続いて配置される。このため、同じ文字列が連続している間は、文字認識結果(テキストデータ)L12だけを縦方向に確認していけばよいため、確認作業をさらに効率化できる。
【0034】
また、職員U2についても、住所のリストL2を参照し、住所に関する文字認識結果の確認を容易に行う支援を行う。この際、職員U2は、住所のリストL2に表示されている確認用イメージデータL21と文字認識結果(テキストデータ)L22とを見比べる。そして、確認用イメージデータL21に対する文字認識結果(テキストデータ)L22が正しく文字認識されているかの正誤の確認作業を行う。職員U2についても、OCR認識結果確認支援装置100は、住所に関する文字認識結果の確認作業を正確かつ効率的に遂行できるよう支援する。
【0035】
そして、職員U1,U2は、文字認識結果で文字認識に誤りがあれば、例えば、操作部としてのキーボード104等を操作することで、誤った文字認識結果(テキストデータ)L12,L22を正しい文字認識結果に修正することができる。この際、OCR認識結果確認支援装置100は、属性別変換結果データ102の対応する文字認識結果のデータ(テキストデータ)をキーボード104から入力された文字(文字列)に変更し、記憶部101に格納する。
【0036】
図1に示す例では、属性が氏名と住所の例で職員U1,U2が文字認識の確認作業を行う例を示したが、さらに他の属性について他の職員Uが文字認識の確認作業を行ってもよい。
【0037】
そして、帳票Tについて、全ての属性別の文字認識の確認作業が終了すると、OCR認識結果確認支援装置100は、属性別変換結果データ102を用いて帳票Tのデータの統合作業を行い(ステップS103)、DB105に格納する。
【0038】
属性別変換結果データ102には、氏名、住所等の属性別に分解されたデータであるが、この統合作業では、帳票T毎に氏名や住所等の各属性を統合し、元の各帳票Tが有する全項目を文字認識結果OCR(テキストデータ)としてDB105に格納する。イメージデータIMGは、文字認識結果の確認用に用いるため、DB105に格納する必要はなく、文字認識の確認作業が終了した時点で削除する。これに限らず、DB105に、文字認識結果OCR(テキストデータ)と、この文字認識結果OCR(テキストデータ)に対応するイメージデータIMGを関連付けて格納してもよい。
【0039】
これにより、DB105には、帳票Tに手書きで記入された文字をテキストデータに変換した電子化データが格納される。このDB105に格納された電子化データに対し、外部端末がアクセスすることで、外部端末では、帳票T毎の情報を容易に取得できるようになる。外部端末は、上記ディスプレイ103、キーボード104を備えた端末装置であってもよい。
【0040】
図2は、実施の形態にかかるOCR認識結果確認支援装置のハードウェア構成例を示す図である。OCR認識結果確認支援装置100は、例えば、
図2に示すハードウェアからなる汎用のPCやサーバで構成することができる。
【0041】
OCR認識結果確認支援装置100は、CPU(Central Processing Unit)201、メモリ202、ネットワークインタフェース(IF)203、記録媒体IF204、記録媒体205、入出力IF206、を含む。200は各部を接続するバスである。
【0042】
CPU201は、OCR認識結果確認支援装置100の全体の制御を司る制御部として機能する演算処理装置である。メモリ202は、不揮発性メモリおよび揮発性メモリを含む。不揮発性メモリは、例えば、CPU201のプログラムを格納するROM(Read Only Memory)である。揮発性メモリは、例えば、CPU201のワークエリアとして使用されるDRAM(Dynamic Random Access Memory)、SRAM(Static Random Access Memory)等である。
【0043】
ネットワークIF203は、LAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどのネットワークNWに対する通信インタフェースである。OCR認識結果確認支援装置100は、ネットワークIF203を介してネットワークNWに通信接続する。例えば、OCR認識結果確認支援装置100は、ネットワークNWを介して、外部端末と通信可能である。
【0044】
記録媒体IF204は、CPU201が処理した情報を記録媒体205との間で読み書きするためのインタフェースである。記録媒体205は、メモリ202を補助する記録装置であり、HDD(Hard Disk Drive)や、SSD(Solid State Drive)、USB(Universal Serial Bus)フラッシュドライブ等を用いることができる。
【0045】
メモリ202または記録媒体205に記録されたプログラムをCPU201が実行することにより、OCR認識結果確認支援の処理機能を実現する。また、メモリ202や記録媒体205は、OCR認識結果確認支援装置100が扱う情報を記録保持する。また、記録媒体205は、
図1に示した記憶部101に相当し、属性別変換結果データ102を記憶保持する。
【0046】
入出力IF206は、CPU201に対する情報入出力用のインタフェースであり、入出力IF206を介して外部装置としてのスキャナ110、ディスプレイ103、キーボード104等(
図1参照)、が接続される。
【0047】
また、
図1に記載のデータベース105は、
図2に記載の記録媒体205を用いて構成できる。またデータベース105は、
図2に記載の他の各構成(CPU201~記録媒体205)を含む構成としてもよい。
【0048】
図3は、実施の形態にかかるOCR認識用のイメージデータの変換処理を説明する図である。
図3(a)は、上述した帳票TのOCR認識元となった手書き文字のイメージデータIMG(1)の例を示す。この手書き文字のイメージデータIMG(1)の文字列は「金沢市増泉1丁目」であり、文字301「金」、文字302「沢」、…、文字30n「目」の複数(n個)の文字からなる。そして、各文字301~30nは、便宜上、各文字の大きさが異なり不揃いの状態を示している。
【0049】
OCR認識結果確認支援装置100は、このように各文字の大きさが異なり不揃いの状態のイメージデータIMG(1)について、文字として認識できる単位(文字単位)で1文字ずつイメージデータを分割する分割処理を行う。この後、各文字のサイズが略均等なサイズになるように、各文字を拡大または縮小する整形処理等、の複数の変換処理を行い、確認用イメージデータIMG(n)を生成する。確認用イメージデータIMG(n)は、文字列の各文字301,302,…30nのサイズが所定サイズで揃えた状態に整形される。なお、整形処理は、各文字のサイズを所定(基準)サイズと略均等になるように、各文字を拡大または縮小してもよい。なお、略均等とは、各文字の高さの差が所定の範囲内、各文字の横幅の差が所定の範囲内、および/又は、各文字を囲む矩形の面積の差が所定の範囲内等の状態である。
【0050】
そして、OCR認識結果確認支援装置100は、生成した確認用イメージデータIMG(n)を文字認識確認用のリストL1,L2(
図1参照)の確認用イメージデータL11,L21として出力する。なお、括弧(1)、(n)は、当初のイメージデータIMG(1)に対して所定の変換処理を行った毎に増加する回数を示し、最終的にn回目の変換処理で確認用イメージデータ(n)を生成している。
【0051】
(イメージデータの変換処理例)
図4は、実施の形態にかかるOCR認識用のイメージデータの変換処理例を示す図である。
図4の(a)~(d)に示すように、OCR認識結果確認支援装置100の制御部(CPU201)は、手書き文字のイメージデータIMGに対して複数(n)回の変換処理を行う。
【0052】
図4(a)に示すように、はじめに制御部は、スキャナ110が読み取った帳票T上の手書き文字の領域を切り取ったイメージデータIMG(1)を生成する。この例では、帳票Tの属性「住所」の所定の枠E(図示の例では1行)内の複数の文字301~308からなる文字列を切り取る。
【0053】
図4(a)に示す例では、手書き文字で生じる特徴を強調するため、便宜上、1行の文字列の各文字の大きさ、筆記状態(図示の例は手書きの各文字を異なるフォントで表現)、1行内での各文字の高さ位置、が異なっている状態を示した。
【0054】
次に、
図4(b)に示すように、制御部は、枠E内の文字列を1文字単位で複数に分割する分割処理を行ったイメージデータIMG(2)を生成する。この際、制御部は、文字301「金」、文字302「沢」、…文字308「目」のそれぞれの文字の大きさに対応し、各文字単位の分割枠E1~E8を設定する。
【0055】
例えば、制御部は、文字301「金」は、この「金」の文字全体(例えば文字の外縁)に適合した四角(□)状の分割枠E1を設定する。ここで、文字301「金」と比較して文字302「沢」のように小さい文字については、制御部は、文字「沢」の大きさに対応して分割枠E2も分割枠E1に比べて小さく設定する。
【0056】
この後、
図4(c)に示すように、制御部は、分割処理後のイメージデータIMG(2)の各文字301「金」、文字302「沢」、…文字308「目」のそれぞれの文字の大きさを拡大または縮小して一様に揃える整形処理を行ったイメージデータIMG(3)を生成する。
【0057】
例えば、制御部は、最も大きい文字301「金」を基準として、他の文字302「沢」~文字308「目」を文字301「金」と同じ大きさにする。この場合、制御部は、基準の文字301「金」の分割枠E1の大きさ(縦横)と同じ大きさとなるように、他の文字302「沢」の分割枠E2~文字308「目」の分割枠E8をそれぞれ拡大または縮小して基準となる同じ大きさに揃える。これにより、文字列の文字301「金」、文字302「沢」、…文字308「目」の大きさが同じになる。
【0058】
この後、
図4(d)に示すように、制御部は、文字列の文字301「金」、文字302「沢」、…文字308「目」の各文字を連結したイメージデータIMG(n)を生成する。この場合、イメージデータの変換処理は4回であり、IMG(n)のn=4である。この処理により、1文字単位で分割されたイメージデータIMG(3)は、各文字の大きさが揃えられた状態で分割前の状態のイメージデータIMG(1)に連結される。
【0059】
例えば、制御部は、文字301「金」の分割枠E1、文字302「沢」の分割枠E2、…文字308「目」の分割枠E8を行方向で連結し、一つのイメージデータIMG(n)を生成する。生成したイメージデータIMG(n)は、
図3(b)で説明した確認用イメージデータIMGに相当する。また、制御部は、このイメージデータIMG(n)を
図1に示した住所のリストL2の確認用イメージデータL21として出力する。
【0060】
(OCR認識結果確認支援装置の処理例)
図5は、実施の形態にかかるOCR認識結果確認支援の処理例を示すフローチャートである。制御部(CPU)201が実行し、主に複数の帳票Tに対する文字認識結果の確認支援の処理例を示す。
【0061】
はじめに、制御部は、複数の帳票Tの中から一つの帳票Tに対しOCR(文字認識)する箇所のイメージデータIMGを切り取る(ステップS501)。この処理は、
図4(a)の枠EのイメージデータIMG(1)の切り取りに相当する。
【0062】
次に、制御部は、切り取ったイメージデータを1文字単位のイメージデータに分割する(ステップS502)。この処理により、
図4(b)に示した1文字単位の分割枠E1~E8で分割したイメージデータIMG(2)が生成される。
【0063】
次に、制御部は、1文字単位に分割したイメージデータの中の文字部分のサイズを整形する(ステップS503)。この処理により、
図4(c)に示した各文字の分割枠E1~E8を拡大または縮小して基準となる同じ大きさにすることで、各文字の大きさを揃えたイメージデータIMG(3)が生成される。
【0064】
次に、制御部は、サイズを整形した1文字単位のイメージデータを分割前の状態に連結する(ステップS504)。この処理により、
図4(d)に示した各文字の大きさを揃えた分割枠E1~E8を連結したイメージデータIMG(4)が生成される。
【0065】
このイメージデータIMG(4)は、ユーザUが文字認識結果を確認するための確認用イメージデータ(
図3(b)参照))に相当する。例えば、制御部は、ユーザUが文字認識結果を確認する際、生成したイメージデータIMG(4)を
図1に示した住所のリストL2の確認用イメージデータL21として出力する。
【0066】
次に、制御部は、一つの帳票Tの全箇所をOCR(文字認識)したか判断する(ステップS505)。帳票T上には、複数の記入箇所を有しており、これら全ての記入箇所に対する文字認識を行い、上述したイメージデータIMGの生成を行う。複数の記入箇所は、上記説明した氏名や住所などの各属性に相当する。なお、文字認識は、帳票Tを読み取った当初のイメージデータに対しておこなうこともできる。そして、一つの帳票Tの全箇所を文字認識済であれば(ステップS505:Yes)、制御部は、ステップS506の処理に移行する。一方、一つの帳票Tで文字認識が終わっていない箇所があれば(ステップS505:No)、ステップS501の処理に戻って未処理部分に対しステップS501以下の処理を再度実行する。
【0067】
ステップS506では、制御部は、全ての帳票Tを処理したか判断する(ステップS506)。上記の処理で一つの帳票Tに対する文字認識を行い、イメージデータIMGの生成を行うが、ここでは、対象とする複数の帳票Tに対する文字認識によりイメージデータIMGの生成を行ったかを判断する。全ての帳票Tを処理済であれば(ステップS506:Yes)、制御部は、ステップS507の処理に移行し、未処理の帳票Tがあれば(ステップS506:No)、ステップS501の処理に戻る。
【0068】
ステップS507では、制御部は、氏名、住所などの属性単位にリスト化したOCR(文字認識)結果を出力する(ステップS507)。上記の処理により、制御部は、帳票Tに記入された手書き文字は、氏名や住所の属性単位のイメージデータIMGを生成し、生成したイメージデータIMGをディスプレイ103上に表示する。また、プリンタを介して印字出力してもよい。
【0069】
このイメージデータIMGは、職員(ユーザ)Uが帳票Tの文字認識結果を確認する際のリスト上の確認用イメージデータとして用いられる。詳細は後述するが、例えば、
図1で説明した例の属性「氏名」のリストL1の確認用イメージデータL11としてイメージデータIMGを表示し、その横に文字認識結果(テキストデータ)L12を表示出力する。同様に、属性「住所」のリストL2の確認用イメージデータL21としてイメージデータIMGを表示し、その横に文字認識結果(テキストデータ)L22を表示出力する。
【0070】
これにより、職員Uが属性別のリストL1、L2に表示されているイメージデータと、文字認識結果(テキストデータ)とを比較することで、文字認識結果の正誤を確認することができる。例えば、職員Uは、文字認識結果で文字認識結果の正誤を、例えば、キーボード104等の操作で制御部に伝える。この際、職員Uは、誤った文字認識結果(テキストデータ)があれば正しい文字を入力操作して文字認識結果を修正する。また、文字認識に誤りがなければ無操作、あるいは正しい文字認識結果の旨を操作入力する。
【0071】
そして、制御部は、全ての属性分を確認したか判断する(ステップS508)。職員(ユーザ)Uによる氏名や住所等、帳票Tの全ての属性に対する上記文字認識の確認作業が終了すれば(ステップS508:Yes)、制御部は、ステップS509の処理に移行する。また、文字認識の確認作業で未処理分の属性が残っていれば(ステップS508:No)、ステップS507の処理に戻る。
【0072】
ステップS509では、制御部は、一つの帳票T単位にOCR(文字認識)結果を統合し(ステップS509)、以上の一連の処理を終了する。この処理では、一つの帳票Tに含まれる氏名や、住所等の複数の属性のイメージデータIMGをこの一つの帳票T単位のデータのまとまりとして統合した電子データをDB105に格納する。
【0073】
なお、イメージデータIMGは、文字認識結果と比較するために生成したものであり、ステップS508で文字認識結果の正誤を確認した後は、確認済の帳票Tの全てのイメージデータIMGは不要となる。このため、職員Uが文字認識結果の正誤を確認した時点で上記生成したイメージデータIMGを削除してもよい。例えば、制御部は、ステップS509の処理でイメージデータIMGを削除する。この場合、DB105には、帳票Tの文字認識結果のみを格納し、イメージデータIMGは格納しない。
【0074】
図6A,
図6Bは、実施の形態にかかるOCR認識結果確認支援装置が出力するOCR結果確認リスト例を示す図である。
図6Aは、複数の帳票Tを住所の属性でソートしたリストL2の出力例を示す。OCR認識結果確認支援装置100の制御部(CPU201)は、リストL2として、各帳票T別の結果No(601)、文字認識(OCR)結果(住所)L22、確認用イメージデータL21をリスト化する。
【0075】
各行が一つの帳票Tのデータを示し、例えば、最上部の1行は、ある一つの帳票T(結果No「104」のデータであり、文字認識結果L22として「金沢市増泉1丁目」(テキストデータ)611を表示する。また、確認用イメージデータL21として「金沢市増泉1丁目」の手書き文字のイメージデータ612を表示する。
【0076】
2行目は、他の一つの帳票T(結果No「789」)のデータであり、文字認識(OCR)結果L22として「金沢市増泉1丁目」(テキストデータ)613を表示する。また、確認用イメージデータL21として「金沢市増泉1丁目」の手書き文字のイメージデータ614を表示する。3行目は、さらに他の一つの帳票T(結果No「159」のデータであり、文字認識結果L22として「金沢市増泉1丁目」(テキストデータ)615を表示する。また、確認用イメージデータL21として「金沢市増泉1丁目」の手書き文字のイメージデータ616を表示する。
【0077】
住所の文字認識結果を確認する職員(ユーザ)U2は、住所のリストL2上で、互いに横に並べられた文字認識結果L22と、確認用イメージデータL21と、を比較する。例えば、帳票T単位で1行目では、文字認識結果L22の領域のテキストデータ611と、確認用イメージデータL21の領域のイメージデータ612と、を比較する。これにより、文字認識結果(テキストデータ)L12が正しく文字認識されているか正誤を確認する。
【0078】
そして、確認用イメージデータL21は、手書き文字の文字列のイメージデータを文字毎に分解する分解処理、および各文字の大きさを同じにする整形処理を行った後のイメージデータである(上記IMG(4)に相当)。ここで、確認用イメージデータL21は、帳票T上では実際には手書きされ、文字毎の大きさ等が異なるものであったが、上述した分解処理および整形処理により、各文字の大きさが揃えられている。
【0079】
これにより、職員U2は、住所のリストL2に表示されている確認用イメージデータL21の各文字を見落とすことなく確認できる。この際、職員U2は、文字の大きさが揃えられた確認用イメージデータL21と、文字認識結果(テキストデータ)L22とを容易に見比べることができる。
【0080】
例えば、最上部の1行の帳票T(結果No「104」)の文字認識結果L22のテキストデータ611が「金沢市増泉1丁目」であり、確認用イメージデータL21のイメージデータ612が「金沢市増泉1丁目」である。この場合、職員U2は、文字認識結果L22のテキストデータ611が正しく文字認識されていると判断することができる。
【0081】
また、リストL2は、文字認識結果を住所の昇順にソートしたものであり、OCR認識結果確認支援装置100は、複数の帳票Tの文字認識結果L22の縦方向には、同じ住所を連続して配置する。図示の例では、住所「金沢市増泉1丁目」の複数の帳票Tを表示している。
【0082】
このようにソート表示することで、職員(ユーザ)U2は、同じ文字認識結果「金沢市増泉1丁目」が連続している間は、確認用イメージデータL21だけを上部から順に見ていき、文字が似ていないものの有無を判断するだけでよい。このようにして、複数の帳票Tの文字認識結果の正誤を容易に確認できるようになる。
【0083】
この際の職員(ユーザ)U2の視線Pの移動状態を図示した。例えば、文字認識結果L22の領域内で新たな住所の文字認識結果611として「金沢市増泉1丁目」の表示があった場合、以降の視線Pは確認用イメージデータL21の領域を上部から順に移動させればよい。すなわち、イメージデータ612→イメージデータ614→イメージデータ616と縦に移動させるだけでよい。
【0084】
ここで、確認用イメージデータL21に表示されている各帳票Tのイメージデータ612,614,616は、上述したイメージデータの分割処理および整形処理により、文字列の各文字が同じ大きさになるように揃えられている。このため、確認用イメージデータL21の領域内で上下位置で表示されている各帳票Tのイメージデータ612,614,616は、文字列の各文字がほぼ同じ位置に位置している。例えば、イメージデータ612,614,616の住所の先頭文字301「金」は位置p1で上下方向に対しほぼ同じ位置に表示される。同様に、イメージデータ612,614,616の住所の末尾文字308「目」は位置pnで上下方向に対しほぼ同じ位置に表示される。すなわち、文字列の各文字が上下方向で位置ずれなく表示されている。
【0085】
確認用イメージデータL21に表示する各帳票Tのイメージデータ612,614,616はそれぞれ複数の文字からなる文字列である。実施の形態では、文字列の各文字を同じ大きさにすることで文字間隔を均一にし、上下方向で文字の位置ずれを起こすことなく表示している。
【0086】
これにより、上記視線Pの移動時において、職員U2は、確認用イメージデータL21の領域内で上下に連続する文字列全体をイメージ、例えば、図形として捉え、似ていない図形を見つける、という直観的な作業を行うことができる。そして、文字認識結果の正誤の確認作業を効率的に遂行できる。
【0087】
図6Aには、帳票Tの結果No「159」の文字認識結果が誤認識である状態を示している。文字認識結果L22の文字認識結果L22領域内で帳票Tの結果No「159」の文字認識結果615が「金沢市増泉1丁目」であるが、対応する確認用イメージデータL21の領域内のイメージデータ616は「金沢市増泉2丁目」であったとする。この場合、確認用イメージデータL21の領域内で職員U2が上下に連続する文字列全体を見ていく途中で、イメージデータ616の「金沢市増泉2丁目」の文字列のうち6番目の文字X「2」が上下と異なることを容易に見つけ出すことができる。この場合、文字認識結果615は正しくは「金沢市増泉2丁目」であり、帳票Tの結果No「159」の住所の文字認識結果に誤りが生じている、との確認作業を行う。
【0088】
住所のリストL2は、文字認識結果で昇順にソートしたものであるため、職員U2は、確認用イメージデータL21の領域内で視線Pを上下に移動させてイメージ(図形相当)での相似状態を確認するだけで、文字認識結果の誤りを容易に見つけ出すことができる。
【0089】
また、
図6Bは、複数の帳票Tを氏名の属性でソートしたリストL1の出力例を示す。OCR認識結果確認支援装置100の制御部(CPU201)は、上述した住所の属性のリストL2と同様に、氏名の属性のリストL1についても、各帳票T別の結果No(601)、文字認識(OCR)結果(氏名)L12、確認用イメージデータL11をリスト化する。
【0090】
この際、確認用イメージデータL11の領域内の各帳票Tのイメージデータ622,624,626は、文字列の各文字が同じ大きさであり、上下位置で同じ位置に位置している。例えば、イメージデータ622,624,626の氏名の先頭文字301「川」は位置p1で上下方向に対しほぼ同じ位置に表示される。同様に、イメージデータ622,624,626の氏名の2番目の文字302「口」は位置p2で上下方向に対しほぼ同じ位置に表示される。このように、文字列の各文字が上下方向で位置ずれなく表示されている。
【0091】
これにより、職員(ユーザ)U1は、氏名のリストL1に表示されている確認用イメージデータL11の各文字を見落とすことなく確認できる。この際、職員U1は、文字の大きさが揃えられた確認用イメージデータL11と、文字認識結果(テキストデータ)L12とを容易に見比べることができ、文字認識結果の正誤を容易に確認できる。
【0092】
また、職員(ユーザ)U1は、視線Pの移動状態に示すように、文字認識結果L12の領域内で新たな氏名の文字認識結果621として「金沢市増泉1丁目」の表示があった場合、以降の視線Pは確認用イメージデータL11の領域を上部から順に移動させればよい。すなわち、イメージデータ622→イメージデータ624→イメージデータ626と縦に移動させるだけでよい。これにより、上記視線Pの移動時において、職員U1は、確認用イメージデータL11の領域内で上下に連続する文字列全体をイメージ(図形相当)として捉え、似ていない図形を見つける、という直観的な作業を行うことができる。そして、文字認識結果の正誤の確認作業を効率的に遂行できる。
【0093】
(対比参考図)
図7は、従来技術に相当する文字認識結果のリストを示す図である。
図7には、実施の形態との対比のために、便宜上、実施の形態(
図6A)同様の住所の属性と同じ表示形式とした。すなわち、帳票Tの結果No(701)、文字認識(OCR)結果702、確認用イメージデータ703を有し、文字認識結果702を昇順にソートした住所のリストLを示している。
【0094】
従来、帳票T別に、文字認識結果702と、確認用イメージデータ703とを並べることで1行の帳票T単位で文字認識結果の正誤を確認することができる。しかし、従来技術では、確認用イメージデータ703の領域に表示する各帳票Tのイメージデータ712,714,716は、帳票T上に手書きされた文字をそのままイメージとして表示することになる。
【0095】
このため、確認用イメージデータ703の領域に表示されるイメージデータ712,714,716は、各帳票T毎に文字301~30nの大きさが異なり、文字間隔も異なり、文字列全体の大きさ(横幅)も異なる。このため、従来は、文字認識結果の正誤の確認に手間がかかり、正誤判断の誤りも生じた。このように、従来は、文字認識結果702と確認用イメージデータ703とを比較しにくく、確認作業を効率的かつ正確に遂行することができない。
【0096】
さらに、確認用イメージデータ703の領域では、異なる帳票Tのイメージデータ712,714,716の文字が上下に位置していない。例えば、1行目(結果No「104」)の帳票Tのイメージデータ712の先頭の文字301「金」の位置を基準として上下位置p1の領域を見るとする。この場合、3行目(結果No「159」)の帳票Tのイメージデータ716では先頭の文字301「金」、および2番目の文字302「沢」の2文字が位置している。
【0097】
また、3行目(結果No「159」)の帳票Tのイメージデータ716の末尾の文字308「目」の位置の上下位置pnの領域で見た場合、1行目(結果No「104」)の帳票Tのイメージデータ712の4番目の文字304「増」が位置している。ここで、3行目(結果No「159」)の帳票Tのイメージデータ716の末尾の文字308「目」に対し、1行目(結果No「104」)の帳票Tのイメージデータ712の末尾の文字308「目」は、文字列方向(横方向)でずれた位置に位置している。
【0098】
このように、異なる帳票Tのイメージデータ712,714,716の文字が上下に位置していないため、実施の形態で説明したような確認用イメージデータの領域だけで視線Pを上下方向に移動させて異なるイメージを捉えるという作業は行えない。これにより、各行の文字列内で文字が似ていないものの有無を判断することができず、文字認識結果の正誤の確認作業を効率化できない。
【0099】
従来技術では、仮に
図7の表示形式としても、確認用イメージデータ703では、文字列の各文字の大きさが違うことが理由で、同じ文字列画像を並べても、同じ文字が位置ずれを起こして上下には並ばない。比較すべき文字同士(1文字目同士、2文字目同士、…)は、文字列内で位置ずれを起こして上下には並ばない。また、手書き文字では、帳票に記入した人の癖により各文字の大きさがバラバラになるため、仮に、確認用イメージデータ703の同じ文字が同じ上下位置に並んだとしても、異なった字形に見誤ることがある。
【0100】
このように、従来技術では、手書きの文字列に対する一目での確認作業を実現できない。また、一目確認の本質は、並んだ字形の中から違和感のある「字形」を検出することであり、この本質において文字サイズの不揃いは、確認作業上邪魔な要素となる。例えば、上記の特許文献2の技術では、画像の特徴量を利用しているが、関係のない文字サイズまでクラスタリングの演算要素となってしまい、確認精度が落ちてしまう。
【0101】
これに対し、実施の形態では、
図6A,
図6Bを用いて説明したように、異なる帳票Tの確認用イメージデータL11,L21の領域内のイメージデータは、文字列の各文字が上下で同じ位置に位置している。これにより、職員(ユーザ)Uは、確認用イメージデータL11,L21の領域だけで視線Pを上下方向に移動させて異なるイメージを捉えるという作業を行うことができる。そして、各行の文字列内で文字が似ていないものの有無を簡単に判断することができ、文字認識結果の正誤の確認作業を効率化することができる。
【0102】
以上説明した実施の形態は、ユーザによるOCR認識結果の確認作業を支援するために、イメージデータを取得し、イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小する。そして、拡大又は縮小した文字を連結して前記文字列の確認用イメージデータを生成し、イメージデータ又は確認用イメージデータを文字認識した結果得られる文字認識結果と、確認用イメージデータとを比較可能な表示形式のリストを出力する。これにより、リストに表示される確認用イメージデータの各文字が同じ大きさに揃えられ、ユーザは文字認識結果の確認作業時に、確認用イメージデータと、当該確認用イメージデータの文字認識結果とを容易に比較でき、確認作業を適切に行えるようになる。帳票等に記載された手書き文字は、各種多様であり、大きさや筆跡状態が異なるが、上記のように手書き文字のイメージデータに対する分割および整形を行うことで、文字列の各文字を同じ大きさにでき、ユーザによる確認用イメージデータの視認性を向上でき、文字認識結果との比較も容易かつ正しく文字認識結果の正誤を精度よく判断できるようになる。
【0103】
また、取得したイメージデータを文字毎に分割し、各分割した枠の大きさを基準となる大きさに拡大又は縮小してもよい。この処理はイメージデータに対する汎用の画像処理で容易に行うことができ、視認性を向上させた確認用イメージデータを容易に生成できる。
【0104】
また、帳票は、一般的に複数の属性別の手書き記入欄を有している。このような帳票に対応して、イメージデータの取得では、複数の帳票の属性別のイメージデータを取得する。また、リストの出力では、複数の帳票で共通する所定の属性の確認用イメージデータと、当該確認用イメージデータの文字認識結果と、を比較可能な表示形式でリスト出力する。これにより、複数の帳票に対する属性別の文字認識結果の確認作業を行えるようになる。帳票には、氏名、住所等の複数の属性の記入欄が設けられており、属性別に文字認識結果の確認作業を行うことで、この確認作業を効率的に行えるようになる。
【0105】
さらに、複数の帳票のリストの出力では、複数の帳票で共通する一つの属性の文字列の文字認識結果に含まれる文字列でソートする。そして、ソートした複数の帳票の文字認識結果と、当該文字認識結果に対応する確認用イメージデータと、を比較可能な表示形式でリスト出力してもよい。例えば、氏名や住所等の属性別にソートされたリストを用いることで、文字認識結果および確認用イメージデータが氏名の昇順で表示できる。このため、例えば、複数の帳票にわたる確認用イメージデータの表示領域部分で連続する文字列全体をイメージ、例えば、図形として捉え、似ていない図形を見つける、という直観的な作業を行うことができる。そして、文字認識結果の正誤の確認作業を効率的に行えるようになる。
【0106】
また、出力されたリストを用いたユーザによる文字認識結果の正誤の確認に基づき、当該確認済の文字認識結果を、帳票の電子データとして記憶する。これにより、手書き文字の帳票を容易に電子化でき、正しく文字認識された電子データとして記憶しておくことができる。
【0107】
また、複数の属性別の文字認識結果を帳票単位で統合し、帳票の電子データとして記憶してもよい。これにより、1枚の帳票が有する手書き記入欄を全て含む帳票単位の電子データを得ることができる。また、帳票の記載内容に基づく各種処理を行う外部端末に対し容易に帳票のデータを入出力できるようになる。
【0108】
また、OCR認識結果確認支援システムは、以上の各処理を行うOCR認識結果確認支援装置と、帳票に手書きで記載された文字列を読み取りイメージデータを出力するスキャナを含む。また、リストを表示または印刷出力する出力部と、出力されたリストに基づき、文字認識結果の正誤の確認をユーザ操作するための操作部と、を含み構成してもよい。このような汎用の外部装置を接続することで、ユーザによる文字認識結果の確認作業を効率的に行えるようになる。
【0109】
これらのことから、実施の形態によれば、手書き文字で記載された帳票の文字認識精度を向上して電子化できるようになる。すなわち、帳票の手書き文字の確認用イメージデータと、文字認識した文字認識結果(テキストデータ)とをユーザが比較し、文字認識結果の正誤を確認する確認作業を効率化できる。この際、確認用イメージデータ自体の視認性を向上でき、文字認識結果の正誤をユーザが正しく判断できるため、最終的に帳票全体の文字認識精度を向上した電子データを得ることができるようになる。
【0110】
なお、本発明の実施の形態で説明したOCR認識結果確認支援にかかる方法は、あらかじめ用意されたプログラムをサーバ等のプロセッサに実行させることにより実現することができる。本方法は、ハードディスク、フレキシブルディスク、CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disk)、フラッシュメモリ等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また本方法は、インターネット等のネットワークを介して配布してもよい。
【0111】
上述した実施の形態に関し、さらに以下の付記を開示する。
【0112】
(付記1)イメージデータを取得し、
前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、
拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、
前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する、
処理をコンピュータに実行させることを特徴とするOCR認識結果確認支援プログラム。
【0113】
(付記2)前記イメージデータは、帳票上に複数の属性別の手書き記入欄を有し、
前記イメージデータの取得では、複数の前記帳票の前記属性別のイメージデータを取得し、
前記リストの出力では、複数の前記帳票で共通する所定の前記属性の前記確認用イメージデータと、当該確認用イメージデータの文字認識結果と、を比較可能な表示形式でリスト出力する、
ことを特徴とする付記1に記載のOCR認識結果確認支援プログラム。
【0114】
(付記3)前記リストの出力では、複数の前記帳票で共通する一つの前記属性の前記文字列の前記文字認識結果に含まれる前記文字列でソートし、
前記ソートした複数の前記帳票の前記文字認識結果と、当該文字認識結果に対応する前記確認用イメージデータと、を比較可能な表示形式でリスト出力する、
ことを特徴とする付記2に記載のOCR認識結果確認支援プログラム。
【0115】
(付記4)出力された前記リストを用いたユーザによる前記文字認識結果の正誤の確認に基づき、当該確認済の前記文字認識結果を前記帳票の電子データとして記憶する、
ことを特徴とする付記2または3に記載のOCR認識結果確認支援プログラム。
【0116】
(付記5)複数の属性別の前記文字認識結果を前記帳票単位で統合し、前記帳票の電子データとして記憶する、
ことを特徴とする付記4に記載のOCR認識結果確認支援プログラム。
【0117】
(付記6)取得した前記イメージデータを複数の前記文字それぞれの外形を含む複数の分割枠に分割し、
分割した前記分割枠の大きさを基準となる大きさに拡大又は縮小する、
ことを特徴とする付記1~5のいずれか一つに記載のOCR認識結果確認支援プログラム。
【0118】
(付記7)イメージデータを取得し、
前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、
拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、
前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する、
処理をコンピュータが実行することを特徴とするOCR認識結果確認支援方法。
【0119】
(付記8)イメージデータを取得し、前記イメージデータに含まれる文字列の各文字の大きさが略均等になるように各文字の大きさを拡大又は縮小し、拡大又は縮小した前記文字を連結して前記文字列の確認用イメージデータを生成し、前記イメージデータ又は前記確認用イメージデータを文字認識した結果得られる文字認識結果と、前記確認用イメージデータとを比較可能な表示形式のリストを出力する制御部、
を備えたことを特徴とするOCR認識結果確認支援システム。
【0120】
(付記9)帳票に手書きで記載された文字列を読み取り、前記イメージデータを出力するスキャナと、
前記リストを表示または印刷出力する出力部と、
出力された前記リストに基づき、前記文字認識結果の正誤の確認をユーザ操作するための操作部と、
を備えたことを特徴とする付記8に記載のOCR認識結果確認支援システム。
【符号の説明】
【0121】
100 OCR認識結果確認支援装置
101 記憶部
102 属性別変換結果データ
103 ディスプレイ
104 キーボード
105 データベース
110 スキャナ
201 CPU(制御部)
202 メモリ
203 ネットワークインタフェース
205 記録媒体
206 入出力インタフェース
301~30n 文字
611,613,615,621 文字認識結果(テキストデータ)
612,614,616,622,624,626 イメージデータ
E 枠
E1~E8 分割枠
H 利用者宅
NW ネットワーク
IMG イメージデータ
L1(L1,L2) リスト
L11,L21 確認用イメージデータ
L12,L22 文字認識結果(テキストデータ)
P 視線(視線の移動状態)
T 帳票
U(U1,U2) 職員(ユーザ)