IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通フロンテック株式会社の特許一覧

<>
  • 特許-帳票認識プログラムおよび帳票認識装置 図1
  • 特許-帳票認識プログラムおよび帳票認識装置 図2
  • 特許-帳票認識プログラムおよび帳票認識装置 図3
  • 特許-帳票認識プログラムおよび帳票認識装置 図4
  • 特許-帳票認識プログラムおよび帳票認識装置 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-01
(45)【発行日】2024-05-13
(54)【発明の名称】帳票認識プログラムおよび帳票認識装置
(51)【国際特許分類】
   G06V 30/12 20220101AFI20240502BHJP
【FI】
G06V30/12 J
【請求項の数】 4
(21)【出願番号】P 2021020008
(22)【出願日】2021-02-10
(65)【公開番号】P2022122643
(43)【公開日】2022-08-23
【審査請求日】2023-03-10
(73)【特許権者】
【識別番号】000237639
【氏名又は名称】富士通フロンテック株式会社
(74)【代理人】
【識別番号】110002918
【氏名又は名称】弁理士法人扶桑国際特許事務所
(72)【発明者】
【氏名】中林 正典
(72)【発明者】
【氏名】岩崎 敏彦
【審査官】新井 則和
(56)【参考文献】
【文献】特開平11-143985(JP,A)
【文献】特開2001-005804(JP,A)
【文献】特開平11-143984(JP,A)
【文献】特開2020-187622(JP,A)
【文献】特開2002-236878(JP,A)
【文献】特開2011-237905(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/12
(57)【特許請求の範囲】
【請求項1】
コンピュータに帳票に記入された文字列の文字認識および補正を実行させるための帳票認識プログラムであって、
前記コンピュータを、
前記帳票の画像データを取得する画像取得部、
前記画像データから前記帳票の住所欄の文字列を文字認識して出力する帳票認識部、
文字認識された文字列から住所辞書に登録された郵便番号住所に該当する文字列を抽出し、抽出された文字列を前記郵便番号住所の文字列で補正する補正処理部、
補正済の第1文字列のデータと前記郵便番号住所の文字列より後に続く未補正の第2文字列のデータとを分けて表示し、前記第1文字列のデータおよび前記第2文字列のデータのうちの前記第2文字列のデータに、修正入力位置を示すカーソルを表示して前記第2文字列の編集を受け付けるデータ出力部、
として機能させる、帳票認識プログラム。
【請求項2】
前記補正処理部は、文字認識された文字列を前記住所辞書と突合することにより前記住所辞書に登録された住所に該当する文字列を抽出し、抽出された文字列を前記住所辞書の正しい住所の文字列で補正して前記第1文字列として出力する、請求項1記載の帳票認識プログラム。
【請求項3】
前記補正処理部は、文字認識された文字列を前記住所辞書の前記郵便番号住所を構成する都道府県、市区町村および町域の順に突合していくことにより前記郵便番号住所に該当する住所を抽出する、請求項2記載の帳票認識プログラム。
【請求項4】
帳票に記入された文字列の文字認識および補正を行う帳票認識装置において、
前記帳票の画像データを取得する画像取得部と、
前記画像データから前記帳票の住所欄の文字列を文字認識して出力する帳票認識部と、
文字認識された文字列から住所辞書に登録された郵便番号住所に該当する文字列を抽出し、抽出された文字列を前記郵便番号住所の文字列で補正する補正処理部と、
補正済の第1文字列のデータと前記郵便番号住所の文字列より後に続く未補正の第2文字列のデータとを分けて表示し、前記第1文字列のデータおよび前記第2文字列のデータのうちの前記第2文字列のデータに、修正入力位置を示すカーソルを表示して前記第2文字列の編集を受け付けるデータ出力部と、
を備える、帳票認識装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票認識プログラムおよび帳票認識装置に関する。
【背景技術】
【0002】
金融機関または自治体の窓口業務として、帳票に記入された文字列を電子化することが行われている(たとえば、特許文献1参照)。このためには、まず、必要事項が記入された帳票は、画像読取装置により読み取られて画像データにされる。この画像データは、帳票認識装置に入力される。帳票認識装置では、画像読取装置から取得した画像データから記入された領域の画像を切り出し、光学文字認識(以下、OCR(Optical Character Recognition)という)処理を行って画像データの文字列をテキスト化する。
【0003】
OCR処理により出力されたテキストデータは、100%の正読とはならず、誤読が発生し得るものである。そのため、オペレータがOCR処理されたデータと帳票に記入された文字またはその文字の画像データとを目視で確認し、誤読があった場合には、OCR処理されたデータに対して正しいデータに補正することになる。
【0004】
ここで、OCR処理される帳票の項目の中には、住所がある。住所は、都道府県、市区町村および町域を含む郵便番号住所と、丁目、番および号を含む住所表示番号とにより構成されている。郵便番号住所は、郵便番号に該当する地域の住所を表したものであり、マスタ辞書と呼ばれる郵便番号辞書で管理されている住所である。したがって、OCR処理をして出力された郵便番号住所のデータは、郵便番号辞書との突合により正しいデータかどうかの判断が容易であり、正しいデータでない場合は、郵便番号辞書のデータで補正することが可能なデータである。特に、郵便番号住所は、AI(Artificial Intelligence)技術を組み合わせることで、手書き文字でも極めて高い文字認識率が得られている。一方、住所表示番号は、郵便番号辞書で管理されないデータであるため、郵便番号住所のように補正することはできないデータである。
【0005】
OCR処理された帳票の住所データは、補正が可能な郵便番号住所と補正ができない住所表示番号とが一連のデータとして出力される。このような住所データは、オペレータが確認するときに、補正が可能な郵便番号住所についてはあらかじめ補正しておくことにより、オペレータの確認作業および補正作業の処理時間を低減することができる。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2011-221886号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
OCR処理された住所データのオペレータによる確認および補正は、補正済の郵便番号住所と未補正の住所表示番号とが一連のデータとして出力された住所データの全体に対して行われる。このため、補正済の郵便番号住所に関して補正範囲が減ることはあっても住所データの全体の確認範囲が減ることはないので、オペレータの補正作業の処理時間を十分に低減させることができないという問題点があった。
【0008】
本発明はこのような点に鑑みてなされたものであり、オペレータの補正作業の処理時間を十分に低減させることができる帳票認識プログラムおよび帳票認識装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明では、上記の課題を解決するために、1つの案では、コンピュータに帳票に記入された文字列の文字認識および補正を実行させるための帳票認識プログラムが提供される。この帳票認識プログラムは、コンピュータを、帳票の画像データを取得する画像取得部、画像データから帳票の住所欄の文字列を文字認識して出力する帳票認識部、文字認識された文字列から住所辞書に登録された郵便番号住所に該当する文字列を抽出し、抽出された文字列を郵便番号住所の文字列で補正する補正処理部、補正済の第1文字列のデータと郵便番号住所の文字列より後に続く未補正の第2文字列のデータとを分けて出力するデータ出力部、として機能させる。
【0010】
本発明の別の案では、帳票に記入された文字列の文字認識および補正を行う帳票認識装置が提供される。この帳票認識装置は、帳票の画像データを取得する画像取得部と、画像データから帳票の住所欄の文字列を文字認識して出力する帳票認識部と、文字認識された文字列から住所辞書に登録された郵便番号住所に該当する文字列を抽出し、抽出された文字列を郵便番号住所の文字列で補正する補正処理部と、補正済の第1文字列のデータと郵便番号住所の文字列より後に続く未補正の第2文字列のデータとを分けて出力するデータ出力部と、を備える。
【発明の効果】
【0011】
上記構成の帳票認識プログラムおよび帳票認識装置によれば、住所辞書に基づいて補正が可能な郵便番号住所は正しい住所に補正して第1文字列のデータとして出力し、郵便番号住所の後に続く住所は未補正の第2文字列のデータとし、第1文字列のデータとは分離して出力するようにした。オペレータは、誤読の可能性がある第2文字列のデータだけを確認・修正すればよいので、オペレータの確認・修正に対する煩わしさや作業時間および作業負荷が低減される。
【図面の簡単な説明】
【0012】
図1】第1の実施の形態に係る帳票認識装置を示すブロック図である。
図2】第2の実施形態に係る帳票認識装置のハードウェア構成例を示す図である。
図3】第2の実施形態の帳票認識処理のフローチャートである。
図4】補正処理の遷移を示す図であって、(A)はOCR結果のデータ例を示し、(B)は都道府県の補正例を示し、(C)は市区町村の補正例を示し、(D)は町域の補正例を示し、(E)は出力されるデータの例を示す図である。
図5】モニタの表示例を示す図であって、(A)は帳票認識装置の帳票認識処理を適用する前の画面表示例を示し、(B)は帳票認識装置の帳票認識処理を適用した後の画面表示例を示している。
【発明を実施するための形態】
【0013】
以下、添付図面を参照しながら、本発明を実施するための形態を詳細に説明する。
[第1の実施の形態]
図1は第1の実施の形態に係る帳票認識装置を示すブロック図である。
【0014】
帳票認識装置10は、画像読取装置11と画面表示装置12とが接続されている。帳票認識装置10は、画像取得部10aと、帳票認識部10bと、補正処理部10cと、データ出力部10dと、住所辞書10eとを備えている。
【0015】
帳票認識装置10の画像取得部10aは、帳票認識装置10に接続された画像読取装置11から帳票の画像データを取得する。帳票の画像データには、帳票の住所欄に記入された住所の画像データを含んでいる。
【0016】
帳票認識部10bは、取得した画像データから帳票の住所欄の領域を切り出し、切り出した画像データに対してOCR処理を実施することにより住所欄の文字列を文字認識して出力する。
【0017】
補正処理部10cは、文字認識された文字列を住所辞書10eに登録された郵便番号住所と突合することにより文字認識された文字列から郵便番号住所に該当する文字列を抽出する。すなわち、補正処理部10cは、文字列の先頭から郵便番号住所の「都道府県」、「市町村」および「町域」を順次確認する。ここで、文字列の「都道府県」、「市町村」および「町域」が住所辞書10eの郵便番号住所に該当するかどうかを順次確認する。「町域」までの住所が確認されると、「都道府県」から「町域」までの郵便番号住所を第1文字列として確定し、文字列の「都道府県」、「市町村」および「町域」を住所辞書10eの郵便番号住所で置き換える。これにより、文字列の「都道府県」、「市町村」および「町域」は、一部の文字が誤読されていたとしても、住所辞書10eの正しい郵便番号住所で補正されたことになる。
【0018】
データ出力部10dは、補正処理部10cで補正された補正済の第1文字列のデータと郵便番号住所の文字列より後に続く未補正の第2文字列のデータとを受けて、第1文字列のデータおよび第2文字列のデータを分離して出力する。
【0019】
画面表示装置12は、帳票認識装置10から第1文字列のデータおよびその画像データと第2文字列のデータおよびその画像データとを受けて表示する。画面表示装置12では、第1文字列のデータおよび第2文字列のデータと、その画像データとをたとえば上下に並べて表示する。これにより、補正済の第1文字列のデータについては、単に確認のためだけに表示し、未補正の第2文字列のデータについては、補正対象のデータとして表示される。つまり、住所の補正作業を行うオペレータは、郵便番号住所の文字列より後に続く未補正の第2文字列のみを確認し、誤読文字があれば、誤読文字を補正するだけでよい。これにより、オペレータの補正作業の処理時間を十分に低減できるようになる。
[第2の実施の形態]
図2は第2の実施形態に係る帳票認識装置のハードウェア構成例を示す図である。
【0020】
帳票認識装置100は、帳票認識処理機能を備えたコンピュータである。帳票認識装置100は、CPU(Central Processing Unit)101を備え、CPU101によって装置全体が制御される。CPU101には、バス107を介してRAM(Random Access Memory)102と複数の周辺機器とが接続されている。
【0021】
RAM102は、帳票認識装置100の主記憶装置として使用される。RAM102には、CPU101に実行させるOS(Operating System)のプログラムや帳票認識処理を実行するためのアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。
【0022】
バス107に接続されている周辺機器としては、HDD(Hard Disk Drive)103、通信インタフェース104、GPU(Graphics Processing Unit)105、および入出力インタフェース106が接続されている。
【0023】
HDD103は、内蔵したディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。HDD103は、帳票認識装置100の補助記憶装置として使用される。HDD103には、OSのプログラム、帳票認識処理のためのアプリケーションプログラム、および郵便番号住所の住所辞書を含む各種データが格納される。なお補助記憶装置としては、フラッシュメモリなどの不揮発性の半導体記憶装置を使用することもできる。
【0024】
GPU105には、モニタ108が接続されている。GPU105は、CPU101からの命令に従って、帳票認識および補正作業を行うための所定のGUI(Graphical User Interface)をモニタ108の画面に表示させる。モニタ108は、たとえば、液晶ディスプレイである。
【0025】
入出力インタフェース106には、画像読取装置としてのスキャナ109、キーボード110、マウス111が接続されている。また、入出力インタフェース106は、可搬型記録媒体112への情報の書き込み、および可搬型記録媒体112からの情報の読み出しが可能な可搬型記録媒体インタフェースと接続可能になっている。入出力インタフェース106は、スキャナ109、キーボード110、マウス111、可搬型記録媒体インタフェースから送られてくる信号を、バス107を介してCPU101に送信する。
【0026】
通信インタフェース104は、LAN(Local Area Network)120に接続されている。通信インタフェース104は、LAN120を介して他のコンピュータ130との間でデータの送受信を行う。
【0027】
以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。なお、帳票認識装置100は、それぞれFPGA(Field Programmable Gate Array)またはDSP(Digital Signal Processer)などからなるモジュールを含んで構成することもでき、CPU101を有しない構成とすることもできる。その場合、帳票認識装置100は、それぞれ不揮発性メモリ(たとえば、EEPROM(Electrically Erasable and Programmable Read Only Memory)、フラッシュメモリ、フラッシュメモリ型メモリカードなど)を備え、モジュールのファームウェアを記憶する。不揮発性メモリは、可搬型記録媒体112または通信インタフェース104を介してファームウェアを書き込むことができる。このように帳票認識装置100は、不揮発性メモリに記憶されているファームウェアを書き換えることにより、ファームウェアの更新をすることもできる。
【0028】
次に、帳票認識装置100が実行する帳票認識処理について、図3および図4を参照して詳細に説明する。
図3は第2の実施形態の帳票認識処理のフローチャート、図4は補正処理の遷移を示す図であって、(A)はOCR結果のデータ例を示し、(B)は都道府県の補正例を示し、(C)は市区町村の補正例を示し、(D)は町域の補正例を示し、(E)は出力されるデータの例を示す図である。
【0029】
帳票認識装置100の帳票認識処理は、スキャナ109が読み取った帳票の画像データを受けて住所の文字情報を認識し、住所辞書のデータに基づいて郵便番号住所の補正を行う処理である。
【0030】
[ステップS1]帳票認識装置100のCPU101は、スキャナ109から取得した帳票の住所の画像データに対して文字認識を行うOCR処理を実施する。OCR処理の結果、たとえば、図4(A)に示したようなOCR結果データが得られたとする。
【0031】
[ステップS2]CPU101は、OCR結果データを住所辞書と突合して正しい「都道府県」を抽出し、OCR結果データの「都道府県」の文字列を住所辞書にある「都道府県」の文字列で補正する。たとえば、図4(B)に示したように、OCR結果データに対して「都道府県」の文字列と認識された部分を住所辞書の「都道府県」の文字列で補正する。これにより、OCR処理で誤読があったとしても、住所辞書の正しい「都道府県」の文字列で補正されることになる。
【0032】
[ステップS3]CPU101は、OCR結果データを住所辞書と突合して正しい「市区町村」を抽出し、OCR結果データの「市区町村」の文字列を住所辞書にある「市区町村」の文字列で補正する。たとえば、図4(C)に示したように、OCR結果データに対して「市区町村」の文字列と認識された部分を住所辞書の「市区町村」の文字列で補正する。
【0033】
[ステップS4]CPU101は、OCR結果データを住所辞書と突合して正しい「町域」を抽出し、OCR結果データの「町域」の文字列を住所辞書にある「町域」の文字列で補正する。たとえば、図4(D)に示したように、OCR結果データに対して「町域」の文字列と認識された部分を住所辞書の「町域」の文字列で補正する。
【0034】
[ステップS5]CPU101は、ステップS2~S4で補正された、郵便番号住所に相当する補正済データをあらかじめRAM102に定義された図4(E)に示す第1住所の記憶領域102aに格納する。
【0035】
[ステップS6]CPU101は、OCR結果データの中で、「町域」の文字列より後に続く住所表示番号に相当した未補正データをあらかじめRAM102に定義された図4(E)に示す第2住所の記憶領域102bに格納する。
【0036】
[ステップS7]CPU101は、RAM102の所定の記憶領域102a,102bに格納された第1住所および第2住所のデータをそれぞれ読み出し、住所のOCR結果データとして分離した状態でモニタ108へ出力する。
【0037】
図5はモニタの表示例を示す図であって、(A)は帳票認識装置の帳票認識処理を適用する前の画面表示例を示し、(B)は帳票認識装置の帳票認識処理を適用した後の画面表示例を示している。
【0038】
帳票認識装置100の帳票認識処理を適用する前では、モニタ108の画面構成は、図5(A)に示したように、住所欄108aとイメージ欄108bとを備えている。住所欄108aには、OCR結果データがそのまま表示され、その左端には、修正入力位置を示すカーソル108cが表示されている。イメージ欄108bには、スキャナ109が読み取った帳票の画像データのイメージが表示される。
【0039】
これに対し、帳票認識装置100の帳票認識処理を適用したときのモニタ108の画面構成は、図5(B)に示したように、第1住所欄108dと、第2住所欄108eと、イメージ欄108bとを備えている。第1住所欄108dには、OCR結果データのうち、補正済の第1住所が表示され、第2住所欄108eには、OCR結果データのうち、未補正の第2住所が表示される。修正入力位置を示すカーソル108cは、補正の必要がない第1住所欄108dにはなく、第2住所欄108eの左端に表示されている。イメージ欄108bには、スキャナ109が読み取った帳票の画像データのイメージが表示される。
【0040】
オペレータが帳票の住所を確認し、修正するとき、住所表示番号のみの点検だけでよく、既にカーソル108cが補正可能な第2住所欄108eにあるので、OCR結果データの住所表示番号に誤読があれば、住所表示番号を即座に修正することが可能になる。なお、図示の例では、第2住所欄108eの住所表示番号の「24」が「29」と誤読されている例を示しており、この場合、オペレータは、第2住所欄108eの「29」を「24」に修正することになる。
【0041】
AI技術を組み合わせたOCR処理を用いている場合、誤読率が大幅に低減していることから、オペレータによる確認作業が疎かになる傾向があるが、住所表示番号の情報だけを独立して出力したことにより、確認・修正すべき事項がピンポイントで判断可能となる。これにより、オペレータは、誤読の可能性がある住所表示番号だけを確認・修正すればよいので、オペレータの確認・修正に対する煩わしさや作業時間および作業負荷が低減される。
【0042】
なお、上記の実施の形態では、郵便番号住所の補正に住所辞書との突合による技術を利用したが、これに限定されるものではなく、たとえば、文字列同士の似ている度合いを計算するレーベンシュタイン距離による技術を利用してもよい。また、本発明は、補正が可能な部分と補正ができない部分とからなる住所に適用したが、商品情報などで枝番などが付加された商品についても、同様な方式として適用することが可能である。
【符号の説明】
【0043】
10 帳票認識装置
10a 画像取得部
10b 帳票認識部
10c 補正処理部
10d データ出力部
10e 住所辞書
11 画像読取装置
12 画面表示装置
100 帳票認識装置
101 CPU
102 RAM
102a,102b 記憶領域
103 HDD
104 通信インタフェース
105 GPU
106 入出力インタフェース
107 バス
108 モニタ
108a 住所欄
108b イメージ欄
108c カーソル
108d 第1住所欄
108e 第2住所欄
109 スキャナ
110 キーボード
111 マウス
112 可搬型記録媒体
120 LAN
130 コンピュータ
図1
図2
図3
図4
図5