特許6554352 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社富士通コンピュータテクノロジーズの特許一覧

特許6554352帳票判別プログラム、帳票判別方法及び帳票判別装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6A
6B
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6554352

(24)【登録日】2019年7月12日

(45)【発行日】2019年7月31日

(54)【発明の名称】帳票判別プログラム、帳票判別方法及び帳票判別装置

(51)【国際特許分類】

G06K 9/20 20060101AFI20190722BHJP

G06K 9/40 20060101ALI20190722BHJP

【ＦＩ】

G06K9/20 340C

G06K9/40

【請求項の数】5

【全頁数】17

(21)【出願番号】特願2015-145245(P2015-145245)

(22)【出願日】2015年7月22日

(65)【公開番号】特開2017-27365(P2017-27365A)

(43)【公開日】2017年2月2日

【審査請求日】2018年4月2日

(73)【特許権者】

【識別番号】309033839

【氏名又は名称】株式会社富士通コンピュータテクノロジーズ

(74)【代理人】

【識別番号】100089118

【弁理士】

【氏名又は名称】酒井宏明

(72)【発明者】

【氏名】若林久孝

(72)【発明者】

【氏名】佐々木央

(72)【発明者】

【氏名】高橋清治

【審査官】板垣有紀

(56)【参考文献】

【文献】特開平４−２７１４８８（ＪＰ，Ａ）

【文献】特開昭５７−１６２０８４（ＪＰ，Ａ）

【文献】特開昭５７−０１７０８５（ＪＰ，Ａ）

【文献】馬場口登他，手書き日本文字列からの文字切り出しの基礎的考察，電子情報通信学会論文誌Ｄ，日本，１９８５年１２月２５日，Vol.J68-D No.12，pp.2123-2131，検索日：2019年6月14日，ＵＲＬ，https://search.ieice.org/bin/pdf_link.php?category=D&lang=J&year=1985&fname=j68-d_12_2123&abst=

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｋ９／２０

Ｇ０６Ｋ９／４０

(57)【特許請求の範囲】

【請求項1】

コンピュータに、
画像データを取得する処理と、
前記画像データにラベリング処理が実行されることにより同一のラベルが付与される画素のブロブのうちブロブ間で所定の条件を満たすブロブ同士を統合する処理と、
複数のブロブの統合により得られた集合ブロブが直線状に整列する複数の集合ブロブのうち最小の集合ブロブにしたがって定める閾値よりも小さいブロブを前記画像データから除去する処理と
を実行させることを特徴とする帳票判別プログラム。

【請求項2】

前記コンピュータに、
前記画像データに含まれる線分状のブロブのうち、線分の方向が共通し、線分から分岐が検出されず、かつ線分の幅が一定であるブロブが所定の密度以上で分布する線分状のブロブのグループを抽出する処理と、
前記閾値よりも小さいブロブが除去された画像データから前記線分状のブロブのグループを除去する処理と
をさらに実行させることを特徴とする請求項１に記載の帳票判別プログラム。

【請求項3】

前記コンピュータに、
前記閾値よりも小さいブロブが除去された画像データに文字認識処理が実行されることにより得られた文字認識結果と、帳票の種類ごとに当該帳票に含まれるキーワードが定義された辞書とを比較することにより、前記帳票の種類を判別する処理をさらに実行させることを特徴とする請求項１に記載の帳票判別プログラム。

【請求項4】

コンピュータが、
画像データを取得する処理と、
前記画像データにラベリング処理が実行されることにより同一のラベルが付与される画素のブロブのうちブロブ間で所定の条件を満たすブロブ同士を統合する処理（Ｓ１０５）と、
複数のブロブの統合により得られた集合ブロブが直線状に整列する複数の集合ブロブのうち最小の集合ブロブにしたがって定める閾値よりも小さいブロブを前記画像データから除去する処理と
を実行することを特徴とする帳票判別方法。

【請求項5】

画像データを取得する取得部と、
前記画像データにラベリング処理が実行されることにより同一のラベルが付与される画素のブロブのうちブロブ間で所定の条件を満たすブロブ同士を統合する統合部と、
複数のブロブの統合により得られた集合ブロブが直線状に整列する複数の集合ブロブのうち最小の集合ブロブにしたがって定める閾値よりも小さいブロブを前記画像データから除去する除去部と
を有することを特徴とする帳票判別装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、帳票判別プログラム、帳票判別方法及び帳票判別装置に関する。

【背景技術】

【0002】

生保や損保の他、銀行の口座開設などの申込受付業務では、申込者の本人確認を行うために、免許証、住民票や印鑑証明などの本人確認書類が用いられる。この本人確認書類は、スキャナ等の読取装置により画像データへ電子化された上で申込者のデータエントリに関連付けて登録されることにより、生保、損保や銀行等の業務システムが有するデータベース上で管理される。

【0003】

このように本人確認が行われる業務では、証跡の一例として、本人確認記録が作成されることがある。このため、申込者の本人確認に用いられた本人確認書類と共にその本人確認書類の種類が業務システムのデータベースへ登録される。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２００１−１１１８１６号公報

【特許文献2】特開２００９−０４４６１６号公報

【特許文献3】特開平１０−１４３６０７号公報

【特許文献4】特開２００５−２６７４８０号公報

【特許文献5】特開２０１０−２４４４７２号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、上記の書類には、地紋や透かしなどが含まれるので、書類の種類を判別する処理の自動化は困難である。

【0006】

例えば、ＯＣＲ（Optical Character Recognition）等が用いられる場合、書面に含まれる地紋や透かしなどが妨げとなって文字認識の精度が低下するので、書類の種類を判別するのは困難である。さらに、上記の書類は、ＦＡＸ等により書類の画像データが伝送されたり、原本の代わりにその複製、いわゆるコピーが提出されたりする場合がある。この場合、ＦＡＸやコピーにより書類の画像データ上で地紋や透かしなどが強調される結果、書類の種類を判別するのはより困難になる。

【0007】

１つの側面では、本発明は、書類の種類を判別できる帳票判別プログラム、帳票判別方法及び帳票判別装置を提供することを目的とする。

【課題を解決するための手段】

【0008】

一態様では、コンピュータに、画像データを取得する処理と、前記画像データにラベリング処理が実行されることにより同一のラベルが付与される画素のブロブのうちブロブ間で所定の条件を満たすブロブ同士を統合する処理と、複数のブロブの統合により得られた集合ブロブが直線状に整列する複数の集合ブロブのうち最小の集合ブロブにしたがって定める閾値よりも小さいブロブを前記画像データから除去する処理とを実行させる。

【発明の効果】

【0009】

書類の種類を判別できる。

【図面の簡単な説明】

【0010】

【図1】図１は、実施例１に係る帳票判別装置の機能的構成を示すブロック図である。

【図2】図２は、画像データの一例を示す図である。

【図3】図３は、面ノイズの除去例を示す図である。

【図4】図４は、第２の除去処理の一例を示す図である。

【図5】図５は、画像データの一例を示す図である。

【図6A】図６Ａは、第３の除去処理の一例を示す図である。

【図6B】図６Ｂは、第３の除去処理の一例を示す図である。

【図7】図７は、画像データの一例を示す図である。

【図8】図８は、実施例１に係る帳票判別処理の手順を示すフローチャート（１）である。

【図9】図９は、実施例１に係る帳票判別処理の手順を示すフローチャート（２）である。

【図10】図１０は、実施例１及び実施例２に係る帳票判別プログラムを実行するコンピュータのハードウェア構成例を示す図である。

【発明を実施するための形態】

【0011】

以下に添付図面を参照して本願に係る帳票判別プログラム、帳票判別方法及び帳票判別装置について説明する。なお、この実施例は開示の技術を限定するものではない。そして、各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

【実施例1】

【0012】

［帳票判別装置１０の構成］
図１は、実施例１に係る帳票判別装置１０の機能的構成を示すブロック図である。図１に示す帳票判別装置１０は、生保や損保の他、銀行の口座開設などの各種の申込受付業務で申込者の本人確認に用いられる本人確認書類が電子化された画像データから本人確認書類の種類を判別する帳票判別処理を実行するものである。

【0013】

一実施形態として、帳票判別装置１０は、パッケージソフトウェアまたは帳票認識ソフトなどのＯＣＲ（Optical Character Recognition）ソフトにアドオンされるライブラリ、これらをオンラインで提供するオンラインソフトウェアとして、上記の帳票判別処理を実現する帳票判別プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、帳票判別装置１０は、上記の申込受付業務を担当する係員が使用する情報処理装置に上記の帳票判別プログラムをインストールさせることにより実装することができる。この他、帳票判別装置１０は、上記の申込受付業務を担当する係員が使用する情報処理装置などをクライアント端末として収容するサーバ装置に上記の帳票判別プログラムをインストールさせることにより実装することができる。この場合、帳票判別装置１０は、生保、損保や銀行などの業務システムの一部として実装されることとしてもよいし、上記の帳票判別処理により実現されるサービスをアウトソーシングによって提供するクラウドとして実装することとしてもかまわない。

【0014】

図１には、符号１１〜符号１９に対応する機能部が示されているが、これはあくまで一例に過ぎず、図示された機能部の一部を省略したり、図示以外の機能部が帳票判別装置１０に備わることを妨げない。例えば、申込受付業務を担当する係員が使用する情報処理装置が帳票判別装置１０として実装される場合、パーソナルコンピュータや携帯端末装置などが標準装備する機能部、例えば入力デバイス、画像または音声の出力デバイス、通信インタフェースなどの他、スキャナ等の読取部などの機能部を有することとしてもかまわない。また、上記の業務システムの一部として帳票判別装置１０が実装される場合、本人確認書類の画像データ以外にも、申込者のエントリデータを管理するデータベースが帳票判別装置１０の記憶装置、例えば主記憶装置や補助記憶装置などに記憶されることとしてもよい。

【0015】

図１に示すように、帳票判別装置１０は、あくまで一例として、画像記憶部１１と、取得部１３と、第１除去部１５と、第２除去部１７と、判別部１８と、第３除去部１９とを有する。

【0016】

画像記憶部１１は、画像データを記憶する記憶部である。

【0017】

一実施形態として、画像記憶部１１は、イメージスキャナ等の読取装置または読取装置を搭載するＦＡＸを通じて、上記の申込受付業務で申込者の本人確認に用いられる本人確認書類の原本または複製が電子化された画像データを記憶する。かかる画像データは、デジタル画像であればよく、例えば、カラー画像であってもよいし、グレースケール画像であってもよく、また、二値化画像であってもかまわない。

【0018】

例えば、上記の申込受付業務を担当する係員により使用される情報処理装置が帳票判別装置１０として実装される場合、画像記憶部１１には、帳票判別装置１０に接続される読取装置から出力される画像データが登録される。また、上記の業務システムの一部として帳票判別装置１０が実装される場合、画像記憶部１１には、申込者のＦＡＸ装置から伝送される画像データが登録されたり、読取装置からアップロードされる画像データが登録されたり、あるいは、上記の申込受付業務を担当する係員により使用される情報処理装置または申込者により使用される情報処理装置から伝送される画像データが登録されたりする。

【0019】

なお、上記の画像記憶部１１には、半導体メモリを始めとする各種の記憶装置またはその記憶領域の一部を割り当てることにより実装できる。例えば、記憶装置の一例として、フラッシュメモリ（Flash Memory）、ＤＲＡＭ（Dynamic Random Access Memory）やＳＲＡＭ（Static Random Access Memory）などを採用できる。このような半導体メモリ素子の他、ＨＤＤ（Hard Disk Drive）、光ディスクやＳＳＤ（Solid State Drive）などを採用することもできる。

【0020】

取得部１３は、画像を取得する処理部である。

【0021】

一実施形態として、取得部１３は、次のような条件で上記の帳票判別処理を起動し、画像記憶部１１に記憶された画像データを取得する。例えば、画像記憶部１１に新規の画像データが登録された場合、取得部１３は、画像記憶部１１から新規の画像データを読み出す。この他、取得部１３は、申込者のエントリデータの参照要求が受け付けられた場合、当該エントリデータに関連付けられた画像データを画像記憶部１１から読み出す。ここでは、あくまで一例として、帳票判別装置１０が有する画像記憶部１１から画像データを取得する場合を例示したが、必ずしも帳票判別装置１０が本人確認書類の画像データを保存しておらずともかまわない。例えば、取得部１３は、図示しない外部ネットワークを介して、申込者のＦＡＸから伝送される画像データを取得することができる。また、取得部１３は、図示しない内部ネットワークを介して、読取装置からアップロードされる画像データを取得したり、あるいは、図示しないファイルサーバ上に記憶された画像データを取得したりすることもできる。この他、取得部１３は、メモリカードやＵＳＢ（Universal Serial Bus）メモリなどのリムーバブルメディアから画像データを取得することもできる。

【0022】

このように、取得部１３は、帳票判別装置１０が有する記憶装置にアクセスすることにより画像データを取得することができる他、外部装置との通信により画像データを取得することもできる。

【0023】

図２は、画像データの一例を示す図である。図２には、本人確認書類の一例として、印鑑登録証明書の複製が電子化された画像データ２００が示されている。図２に示すように、原本ではなく、印鑑登録証明書の複製が電子化される場合、印鑑登録証明書の原本に埋め込まれていた透かしが画像データ２００上に現れる。すなわち、図２に示す通り、「複写」という透かし文字列が複製によって繰り返し現れる。さらに、画像データ２００では、印鑑登録証明書の紙面上に存在する地紋が強調される。すなわち、地紋が原因となって粒状の細かいノイズ、すなわち面ノイズが画像データ２００上の紙面全体にわたって現れる。これら地紋や透かしは、本人確認書類の種類を問わずに埋め込まれていることが多く、ＯＣＲ等により文字認識を行う上でその精度を低下させる原因となる。なお、図２には、印鑑登録証明書に関する画像データを例示したが、図２に示す印鑑登録証明書を発行する地方自治体と異なる地方自治体により発行される印鑑登録証明書においても、さらには、他の種類の本人確認書類においても地紋や透かしが同様に現れる。

【0024】

第１除去部１５、第２除去部１７及び第３除去部１９は、画像データにラベリング処理が実行されることにより同一のラベルが付与された画素のブロブのうち、各処理部に設定された条件を満たすブロブを除去する処理部である。

【0025】

これらのうち、第１除去部１５及び第２除去部１７は、図２を用いて説明したノイズの中でも、面ノイズ、すなわち地紋に起因する粒状のノイズを除去の照準とする。図３は、面ノイズの除去例を示す図である。図３には、図２に示した画像データ２００上の領域２１０、すなわち文字列「印鑑登録証明書」のうち「印鑑登」の部分が拡大された状態で処理の遷移が示されている。図３の上段には、取得部１３により取得された時点の領域２１０が示されている。さらに、図３の中段には、第１除去部１５による除去が行われた後の領域２１０が示されると共に、図３の下段には、第２除去部１７による除去が行われた後の領域２１０が示されている。なお、ここでは、第１除去部１５及び第２除去部１７が除去の照準とするノイズを説明することに重点を置き、各処理部の具体的な処理内容については後述する。

【0026】

図３の上段及び中段に示す通り、第１除去部１５では、面ノイズの中でも、第２除去部１７が照準とするノイズよりもサイズが小さいノイズが除去の照準とされる。一方、図３の中段及び下段に示す通り、第２除去部１７では、面ノイズの中でも、第１除去部１５が照準とするノイズよりもサイズが大きく、画像データに含まれる文字が持つ文字サイズよりも小さいノイズを除去の照準とし、第１除去部１５が除去しきれなかったノイズを除去することに照準が置かれている。

【0027】

より具体的には、第１除去部１５は、取得部１３により取得された画像データにラベリング処理を実行する。このとき、取得部１３により取得された画像データがカラー画像である場合、第１除去部１５は、カラー画像をグレースケール画像へ変換することができる。また、取得部１３により取得された画像データがグレースケール画像である場合、第１除去部１５は、グレースケール画像に含まれる各画素が持つ画素値が閾値以上であるか否かを判定することによって二値化画像を生成することができる。なお、ここでは、第１除去部１５がラベリング処理を実行する場合を例示したが、ラベリング処理は外部装置に実行させることとしてもかまわない。

【0028】

ここで、上記の「ラベリング処理」は、画素値が白「１」または黒「０」に二値化された画像上で白または黒が連続する画素に同一のラベルを割り当てる処理を指し、既知の任意の手法を適用することができる。書類上の文字は、黒または黒に準じる色で表現されるので、ここでは、一例として、黒「０」が連続する画素に同一の識別情報が割り当てられる場合を想定する。以下では、ラベリング処理により同一のラベルが割り当てられた黒画素の連接体のことを「ブロブ」と記載する場合がある。さらに、以下では、画像処理を簡素化する観点から、プロセッサ上で仮想的に実現される各処理部が黒画素の連接体を包含する外接矩形を「ブロブ」として扱い、また、複数の連接体を包含する外接矩形を後述の「集合ブロブ」として扱って画像処理を行う場合を例示する。

【0029】

このように画像データにラベリング処理が実行された状況の下、第１除去部１５は、ｎ×ｎピクセル以下のブロブを除去する第１の除去処理を実行する。かかる第１の除去処理に用いられるサイズの閾値ｎには、任意の値を設定できる。例えば、免許証、住民票や印鑑証明などの各種の本人確認書類の間で本人確認書類の種類を特徴付けるキーワードの文字サイズが最も小さい種類の本人確認書類であり、かつ当該本人確認書類に含まれるキーワードの中でも最小の文字サイズよりも小さいサイズを設定できる。数値の例を挙げれば、３×３ピクセル以下のノイズ、あるいは、５×５ピクセル以下のノイズに照準を絞ることができる。これは、第１の除去処理では、ｎ×ｎピクセルを超えるサイズのノイズの除去は第２除去部１７により実行される第２の除去処理に委ねることができ、必ずしも全てのノイズが除去されずともよいからである。なお、上記のサイズの閾値ｎには、固定値が設定されることとしてもよく、また、ユーザによる指定値が設定されることとしてもかまわない。

【0030】

この結果、図３の中段に示す通り、図３の上段では一面に分布していた面ノイズが第１の除去処理によりある程度除去される。

【0031】

その上で、第２除去部１７は、第１除去部１５により第１の除去処理が行われた画像データから、当該画像データに含まれる各文字が持つ文字サイズのうち最小の文字サイズよりも小さいブロブを除去する第２の除去処理を実行する。

【0032】

かかる第２の除去処理を実現する処理部として、第２除去部１７は、図１に示す通り、統合部１７ａと、推定部１７ｂと、除去部１７ｃとを有する。

【0033】

統合部１７ａは、第１除去部１５により第１の除去処理が行われた画像データに含まれるブロブのうち、所定の条件を満たすブロブ同士を統合する処理部である。以下では、複数のブロブが統合されることによって得られるブロブの集合のことを「集合ブロブ」と記載する場合がある。

【0034】

一実施形態として、統合部１７ａは、ブロブのサイズ、ブロブ間の距離や統合後の形状などの条件を満たす２つ以上のブロブ同士を結合することにより、集合ブロブを生成する。かかる集合ブロブの生成は、画像データへ電子化された本人確認書類に含まれる文字が持つ文字サイズを推定するために実行される。このため、上記の条件には、集合ブロブのサイズ及び形状が文字または文字の部首を形成しうるものが設定される。例えば、統合部１７ａは、幅及び高さのサイズが所定の閾値以下であるブロブを統合の対象とし、サイズが閾値を超えるブロブを統合の対象から除外する。これによって、本人確認書類の種類を問わず、ブロブの統合後に本人確認書類で出現し得ない文字サイズの集合ブロブが生成されるのを抑制する。さらに、統合部１７ａは、ブロブ間の距離が所定の閾値以内のブロブ同士を結合の候補とする一方で、ブロブ間の距離が閾値を超えるブロブ同士は結合の候補としない。これは、異なる文字の構成要素が結合されるのを抑制するためである。さらに、統合部１７ａは、互いのブロブが結合される場合の外接矩形の幅及び高さのサイズの差が所定の範囲内であるブロブ同士を結合する一方で、所定の範囲外であるブロブ同士は結合しない。これは、フォントを問わず、文字の外接矩形は略正方形状であるので、正方形から逸脱するブロブ同士が結合されるのを抑制する。これらの条件によって、略正方形状の集合ブロブが生成される。

【0035】

推定部１７ｂは、集合ブロブから画像データに含まれる文字が持つ最小の文字サイズを推定する処理部である。

【0036】

一実施形態として、推定部１７ｂは、統合部１７ａにより統合された集合ブロブのうち直線状に整列する集合ブロブを抽出する。例えば、推定部１７ｂは、重心、中心や頂点などの代表点が持つ垂直座標が所定の範囲内に分布する集合ブロブを抽出する。これによって、水平方向に整列する複数の集合ブロブが横書きの文字列として抽出される。また、推定部１７ｂは、上記の代表点が持つ水平座標が所定の範囲内に分布する集合ブロブを抽出する。これによって、垂直方向に整列する複数の集合ブロブが縦書きの文字列として抽出される。このように集合ブロブを抽出する場合、推定部１７ｂは、幅および高さのサイズが類似する集合ブロブ同士に絞って抽出することとしてもよい。その上で、推定部１７ｂは、横書きの文字列及び縦書きの文字列として抽出された集合ブロブが持つ幅及び高さのサイズのうち最も小さいサイズを上記の最小の文字サイズとして推定する。

【0037】

なお、ここでは、横書き及び縦書きの両方に対応する集合ブロブを抽出する場合を例示したが、横書きまたは縦書きの一方に対応する集合ブロブに絞って抽出を行うこととしてもかまわない。また、幅及び高さの両方のサイズのうち最小のサイズを文字サイズとして推定する場合を例示したが、幅または高さの一方のサイズのうち最小のサイズを文字サイズとして推定することとしてもかまわない。例えば、縦倍角の文字列を含む本人確認書類を帳票判別処理の範疇とする場合、幅のサイズのうち最小のサイズが文字サイズとして推定される。また、横倍角の文字列を含む本人確認書類を帳票判別処理の範疇とする場合、高さのサイズのうち最小のサイズが文字サイズとして推定される。

【0038】

除去部１７ｃは、画像データに含まれる文字が持つ最小の文字サイズよりも小さいブロブを除去する第２の除去処理を実行する処理部である。

【0039】

一実施形態として、除去部１７ｃは、第１除去部１５により第１の除去処理が行われた画像データに含まれるブロブのうち、推定部１７ｂにより推定された最小の文字サイズ／２未満のブロブを除去する。なお、ここでは、一例として、最小の文字サイズ／２未満のブロブを除去する場合を例示するが、必ずしも最小の文字サイズ／２を閾値とせずともよく、最小の文字サイズよりも小さければ、任意の値を閾値として設定できる。

【0040】

図４は、第２の除去処理の一例を示す図である。図４には、図２に示した画像データ２００上の領域２１０、すなわち文字列「印鑑登録証明書」のうち「印鑑登」の部分が拡大された状態で処理の遷移が示されている。図４の上段には、第１除去部１５により第１の除去処理が行われた時点の領域２１０が示されている。さらに、図４の中段には、集合ブロブが生成された時点の領域２１０が示されると共に、図４の下段には、横書きの文字列が抽出された時点の領域２１０が示されている。なお、図４では、同一のラベルが付与されたブロブが実線で示されると共に、ブロブが統合された集合ブロブが一点鎖線で示されている。

【0041】

図４の上段から中段への遷移で示すように、ブロブの統合によって集合ブロブが生成される。図４の中段に示す集合ブロブの中には、文字に対応する集合ブロブ４１０〜４３０もあれば、面ノイズの集合に対応する集合ブロブ４４０〜４５０も混在する。このため、図４の下段に示す通り、集合ブロブ４１０〜４５０の５つの集合ブロブのうち横書きの文字列に対応する集合ブロブ４１０〜４３０が最小の文字サイズの推定に用いられる。これら集合ブロブ４１０〜４３０の３つのブロブが持つ幅及び高さの中でも、集合ブロブ４３０の高さＸが最小であるので、集合ブロブ４３０の高さＸが最小の文字サイズとして推定される。このように集合ブロブ４３０の高さが最小の文字サイズとして推定された後、集合ブロブ４３０の高さよりも小さい閾値、すなわち「Ｘ／２」未満のブロブが除去される。これによって、図３の下段に示す結果が得られる。

【0042】

ここで、図３の下段に示す通り、第２の除去処理によって画像データに含まれる文字列の一部の文字や文字の一部が欠落したとしてもかまわない。なぜなら、上記の「帳票判別処理」の目的は、本人確認書類の種類の判別にあり、かかる目的を達成するために必ずしも本人確認書類に含まれるキーワードの全文字の認識が必要ないからである。つまり、本人確認書類の種類の判別に目的がある場合、例えば、印鑑登録証明書に含まれるキーワード「印鑑登録証明書」の各文字を全て認識するのが目的なのではなく、画像データの文字認識結果から類似度、例えば編集距離等により、画像データが印鑑登録証明書であると同定することに目的があるからである。すなわち、図３の例で言えば、「鑑」から「金」、「臣」及び「皿」以外の部分がノイズと共に除去されている。この程度の欠落では、「鑑」が認識できないとは限られないが、ＯＣＲエンジンによっては、キーワード「印鑑登」のうち「鑑」が認識されない可能性も生じる。仮に、「印○登」と認識された場合でも残りの「録証明書」が認識できれば、キーワード「印鑑登録証明書」と文字認識結果「印○登録証明書」との編集距離は十分に近いので、画像データが印鑑登録証明書であると判別することは可能である。

【0043】

判別部１８は、画像データから本人確認書類の種類を判別する処理部である。

【0044】

一実施形態として、判別部１８は、第２除去部１７により第２の除去処理が実行された場合、当該第２の除去処理が実行された画像データから本人確認書類の種類を判別する。例えば、判別部１８は、第２の除去処理が実行された画像データに文字認識処理を実行することにより、画像データから文字認識結果を得る。その後、判別部１８は、本人確認書類の種類ごとに当該種類の本人確認書類を特徴付けるキーワードが定義された辞書と、文字認識結果として得られた文字列とを比較することにより、文字認識結果からキーワードを検出する。このとき、判別部１８は、辞書内のキーワードと文字認識結果の文字列の編集距離が所定の範囲内である場合、当該文字認識結果の文字列が辞書に登載されたキーワードであると同定し、当該キーワードを検出する。そして、判別部１８は、キーワードの検出結果を用いて、本人確認書類の種類ごとに当該画像データが当該種類に対応する尤もらしさ、いわゆる尤度を算出する。かかる尤度の算出には、一例として、辞書に登載されたキーワードが検出される個数が多い種類ほど高い尤度を算出するアルゴリズムが適用される。その上で、判別部１８は、本人確認書類の種類ごとに算出された尤度の中に尤度が所定の閾値以上である種類が存在する場合、最高の尤度が算出された本人確認書類の種類を判別結果として出力する。このとき、判別部１８は、尤度が閾値以上である種類が存在しない場合、第３除去部１９により第３の除去処理が実行された後に、第３の除去処理が実行された画像データから本人確認書類の種類を改めて判別する。

【0045】

図５は、画像データの一例を示す図である。図５には、第２除去部１７による第２の除去処理が実行された画像データ５００が示されている。図５に示す画像データ５００の場合、キーワード「印鑑登録証明書」のうち「録」及び「証」の２文字が透かし「複写」と重複している。このように透かしが重複する場合でも、種類「印鑑証明」の尤度が閾値以上の値で算出される場合もあるが、辞書との照合に用いる編集距離の閾値や尤度を算出するアルゴリズムによっては種類「印鑑証明」の尤度が閾値以上の値で算出されない場合もある。この場合、第３除去部１９による第３の除去処理が実行された画像データから本人確認書類の種類が改めて判別される。なお、第２の除去処理が実行された画像データから本人確認書類の種類が判別できる場合、第３除去部１９による第３の除去処理は実行されない。

【0046】

第３除去部１９は、第２除去部１７により第２の除去処理が行われた画像データから、透かしに対応するブロブを除去する第３の除去処理を実行する処理部である。

【0047】

一実施形態として、第３除去部１９は、取得部１３により取得された画像データから線分状のブロブを抽出する。かかる線分状のブロブは、一例として、各種のエッジ検出及びラベリング処理を併用することにより抽出できる。以下では、線分状のブロブのことを「ラン」と記載する場合がある。その後、第３除去部１９は、線分の方向が共通し、線分から分岐が検出されず、かつ線分の幅が一定であるブロブが所定の密度以上で分布するランのグループを除去する。

【0048】

具体的には、第３除去部１９は、画像データから抽出されたランのうちランを１つ選択する。続いて、第３除去部１９は、先に選択されたランが分岐なしの線分、言い換えれば枝分かれがない線分であるか否かを判定する。そして、第３除去部１９は、ランが分岐なしの線分である場合、先に選択されたランから所定の範囲内に当該ランと同等の方向及び幅を持つ他のランが存在するか否かを判定する。これらのうち、方向については、一例として、線分が基準に設定された方向、例えば水平線となす角度が選択中のランの角度±α以内である他のランをグループ化の条件とすることができる。また、ランの幅についても、一例として、ランの幅が選択中のランの幅±β以内である他のランをグループ化の条件とすることができる。そして、第３除去部１９は、他のランが存在する場合、当該ランと他のランをグループ化する。このようにグループ化されたランのことを「集合ラン」と記載する場合がある。その後、第３除去部１９は、集合ランの密度が所定の閾値以上であるか否かを判定する。かかる密度の判定の一例として、選択中のランの中心からｍピクセル以内の距離に所定数以上の他のランが存在するか否か等により判断することができる。その上で、第３除去部１９は、集合ランの密度が閾値以上である場合、画像データから集合ランを除去する。このように、第３除去部１９は、全てのランが選択されるまで集合ランの除去を繰り返し実行する。

【0049】

図６Ａ及び図６Ｂは、第３の除去処理の一例を示す図である。図６Ａには、図５に示した画像データ５００に含まれる領域５１０の拡大図が示されている。また、図６Ｂには、図６Ａに示された領域５１０のうち領域６１０がさらに拡大された拡大図が示されると共に、領域５１０でグループ化された集合ランの各ランが実線で囲まれた状態で示されている。図６Ａ及び図６Ｂに示す通り、透かし「複写」の文字の輪郭は、同一の方向に向かって延びる分岐なしの線分が一定の間隔で集まることにより形成される。このことから、線分の方向が共通し、線分から分岐が検出されず、かつ線分の幅が一定であるブロブが所定の密度以上で分布するランが図６Ｂに示された通りにグループ化された上で除去される。このような集合ランの除去が繰り返し実行されると、図７に示す画像データ７００が得られる。

【0050】

図７は、画像データの一例を示す図である。図７には、第３除去部１９による第３の除去処理が実行された画像データ７００が示されている。図７に示す画像データ７００からは、図５に示した画像データ５００に比べて、透かし「複写」の文字の大部分が第３の除去処理によって除去されている。それ故、図５に示した画像データ５００に比べて、キーワード「印鑑登録証明書」のうち「録」及び「証」の２文字を認識できる公算が高まる。したがって、種類「印鑑証明」の尤度が閾値以上の値で算出される可能性を高めることができる。このような透かし除去を実現する第３の除去処理は、同一の方向に向かって延びる分岐なしの線分が一定の間隔で集まるという透かしの性質を利用するので、本人確認書類の種類が異なる場合や同種の本人確認書類であっても発行元が異なる場合にも適用できる可能性を高めることができる。

【0051】

なお、上記の取得部１３、第１除去部１５、第２除去部１７、判別部１８及び第３除去部１９は、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）などに帳票判別プログラムを実行させることによって実現できる。また、上記の各機能部は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などのハードワイヤードロジックによっても実現できる。

【0052】

［処理の流れ］
図８及び図９は、実施例１に係る帳票判別処理の手順を示すフローチャートである。この帳票判別処理は、一例として、画像記憶部１１に新規の画像データが登録された場合や申込者のエントリデータの参照要求が受け付けられた場合などに起動される。

【0053】

図８に示すように、取得部１３により画像データが取得されると（ステップＳ１０１）、第１除去部１５は、ステップＳ１０１で取得された画像データにラベリング処理を実行する（ステップＳ１０２）。その上で、第１除去部１５は、図示しないコンフィグファイルに記述されたサイズまたはユーザインタフェースを介して指定されたサイズにしたがってｎ×ｎピクセル以下のブロブを除去する第１の除去処理を実行する（ステップＳ１０３）。

【0054】

その後、統合部１７ａは、ステップＳ１０２のラベリング処理で得られたブロブのサイズ、ブロブ間の距離や統合後の形状などの条件を満たす２つ以上のブロブ同士を統合する（ステップＳ１０４）。かかるステップＳ１０４の処理によって、集合ブロブが生成されることになる。

【0055】

続いて、推定部１７ｂは、ステップＳ１０４で統合された集合ブロブのうち水平方向及び垂直方向へ直線状に整列する集合ブロブを抽出する（ステップＳ１０５）。これによって、横書きの文字列および縦書きの文字列に相当する集合ブロブが抽出される。

【0056】

そして、推定部１７ｂは、ステップＳ１０５で横書きの文字列及び縦書きの文字列として抽出された集合ブロブが持つ幅及び高さのサイズのうち最も小さいサイズを最小の文字サイズとして推定する（ステップＳ１０６）。

【0057】

その後、除去部１７ｃは、ステップＳ１０３で第１の除去処理が行われた画像データに含まれるブロブのうち、ステップＳ１０６で推定された最小の文字サイズ／２未満のブロブを除去する第２の除去処理を実行する（ステップＳ１０７）。

【0058】

その上で、判別部１８は、ステップＳ１０７で第２の除去処理が実行された画像データから本人確認書類の種類を判別する帳票判別処理を実行する（ステップＳ１０８）。このとき、本人確認書類の種類の判別に成功した場合（ステップＳ１０９Ｙｅｓ）、判別部１８は、ステップＳ１０８で判別された本人確認書類の種類の判別結果を所定の出力先へ出力し（ステップＳ１１０）、処理を終了する。

【0059】

このように本人確認書類の種類の判別結果を出力することにより、ステップＳ１０１で取得された画像データに関連付けて業務システムのデータベース上に格納された申込者のエントリデータに本人確認書類の種類の判別結果を自動的に登録させることもできる。

【0060】

一方、本人確認書類の種類の判別に成功しなかった場合（ステップＳ１０９Ｎｏ）、第３除去部１９は、ステップＳ１０１で取得された画像データから線分状のブロブを抽出する（ステップＳ１１１）。続いて、第３除去部１９は、ステップＳ１１１で画像データから抽出されたランのうちランを１つ選択する（ステップＳ１１２）。

【0061】

そして、第３除去部１９は、ステップＳ１１２で選択されたランが分岐なしの線分、言い換えれば枝分かれがない線分であるか否かを判定する（ステップＳ１１３）。この結果、ランが分岐なしの線分である場合（ステップＳ１１３Ｙｅｓ）、第３除去部１９は、ステップＳ１１２で選択されたランから所定の範囲内に当該ランと同等の方向及び幅を持つ他のランが存在するか否かをさらに判定する（ステップＳ１１４）。なお、ランが分岐なしの線分でない場合（ステップＳ１１３Ｎｏ）または他のランが存在しない場合（ステップＳ１１４Ｎｏ）、ステップＳ１１８の処理へ移行する。

【0062】

このとき、他のランが存在する場合（ステップＳ１１４Ｙｅｓ）、第３除去部１９は、当該ランと他のランをグループ化する（ステップＳ１１５）。かかるステップＳ１１５の処理によって集合ランが生成される。その後、第３除去部１９は、集合ランの密度が所定の閾値以上であるか否かを判定する（ステップＳ１１６）。なお、集合ランの密度が閾値以上でない場合（ステップＳ１１６Ｎｏ）、ステップＳ１１８の処理へ移行する。

【0063】

その上で、集合ランの密度が閾値以上である場合（ステップＳ１１６Ｙｅｓ）、第３除去部１９は、画像データから集合ランを除去する第３の除去処理を実行する（ステップＳ１１７）。そして、未選択のランがなくなるまで（ステップＳ１１８Ｙｅｓ）、上記のステップＳ１１２から上記のステップＳ１１７までの処理が繰り返し実行される。

【0064】

その後、未選択のランがなくなると（ステップＳ１１８Ｎｏ）、判別部１８は、ステップＳ１１７で第３の除去処理が実行された画像データから本人確認書類の種類を判別する帳票判別処理を実行する（ステップＳ１１９）。そして、判別部１８は、ステップＳ１１９で判別された本人確認書類の種類の判別結果を所定の出力先へ出力し（ステップＳ１１０）、処理を終了する。

【0065】

［効果の一側面］
上述してきたように、本実施例に係る帳票判別装置１０は、本人確認書類が電子化された画像データに対するラベリング処理により得たブロブを正方形状に集め、その集合ブロブが直線状に整列する複数の集合ブロブのうち最小の集合ブロブよりも小さいブロブを除去する。この結果、本人確認書類の複製が電子化された場合でも地紋に起因する面ノイズが軽減される。したがって、本実施例に係る帳票判別装置１０によれば、書類の種類を判別することが可能になる。

【実施例2】

【0066】

さて、これまで開示の装置に関する実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下では、本発明に含まれる他の実施例を説明する。

【0067】

［除去処理の組合せパターン］
上記の実施例１では、第２の除去処理が行われた画像データから本人確認書類の種類が判別できなかった場合に絞って第３の除去処理が実行される場合を例示したが、このような実施形態に限定されない。例えば、帳票判別装置１０は、第２の除去処理だけを単独で実行することもできれば、第３の除去処理だけを単独で実行することもできる。さらに、帳票判別装置１０は、第３の除去処理を省略することなく、第２の除去処理及び第３の除去処理の両方が実行された画像データから本人確認書類の種類を判別させることとしてもよいし、第３の除去処理が行われた画像データから本人確認書類の種類が判別できなかった場合に絞って第２の除去処理を実行させることとしてもかまわない。

【0068】

［分散および統合］
また、図示した各装置の構成要素は、必ずしも物理的に図示の如く構成されておらずともよい。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、取得部１３、第１除去部１５、第２除去部１７、判別部１８または第３除去部１９を帳票判別装置１０の外部装置としてネットワーク経由で接続するようにしてもよい。また、取得部１３、第１除去部１５、第２除去部１７、判別部１８または第３除去部１９を別の装置がそれぞれ有し、ネットワーク接続されて協働することで、上記の帳票判別装置１０の機能を実現するようにしてもよい。

【0069】

［帳票判別プログラム］
また、上記の実施例で説明した各種の処理は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図１０を用いて、上記の実施例と同様の機能を有する帳票判別プログラムを実行するコンピュータの一例について説明する。

【0070】

図１０は、実施例１及び実施例２に係る帳票判別プログラムを実行するコンピュータのハードウェア構成例を示す図である。図１０に示すように、コンピュータ１００は、操作部１１０ａと、スピーカ１１０ｂと、カメラ１１０ｃと、ディスプレイ１２０と、通信部１３０とを有する。さらに、このコンピュータ１００は、ＣＰＵ１５０と、ＲＯＭ１６０と、ＨＤＤ１７０と、ＲＡＭ１８０とを有する。これら１１０〜１８０の各部はバス１４０を介して接続される。

【0071】

ＨＤＤ１７０には、図１０に示すように、上記の実施例１で示した取得部１３、第１除去部１５、第２除去部１７、判別部１８及び第３除去部１９と同様の機能を発揮する帳票判別プログラム１７０ａが記憶される。この帳票判別プログラム１７０ａは、図１に示した取得部１３、第１除去部１５、第２除去部１７、判別部１８及び第３除去部１９の各構成要素と同様、統合又は分離してもかまわない。すなわち、ＨＤＤ１７０には、必ずしも上記の実施例１で示した全てのデータが格納されずともよく、処理に用いるデータがＨＤＤ１７０に格納されればよい。

【0072】

このような環境の下、ＣＰＵ１５０は、ＨＤＤ１７０から帳票判別プログラム１７０ａを読み出した上でＲＡＭ１８０へ展開する。この結果、帳票判別プログラム１７０ａは、図１０に示すように、帳票判別プロセス１８０ａとして機能する。この帳票判別プロセス１８０ａは、ＲＡＭ１８０が有する記憶領域のうち帳票判別プロセス１８０ａに割り当てられた領域にＨＤＤ１７０から読み出した各種データを展開し、この展開した各種データを用いて各種の処理を実行する。例えば、帳票判別プロセス１８０ａが実行する処理の一例として、図８〜図９に示す処理などが含まれる。なお、ＣＰＵ１５０では、必ずしも上記の実施例１で示した全ての処理部が動作せずともよく、実行対象とする処理に対応する処理部が仮想的に実現されればよい。

【0073】

なお、上記の帳票判別プログラム１７０ａは、必ずしも最初からＨＤＤ１７０やＲＯＭ１６０に記憶されておらずともかまわない。例えば、コンピュータ１００に挿入されるフレキシブルディスク、いわゆるＦＤ、ＣＤ−ＲＯＭ、ＤＶＤディスク、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」に各プログラムを記憶させる。そして、コンピュータ１００がこれらの可搬用の物理媒体から各プログラムを取得して実行するようにしてもよい。また、公衆回線、インターネット、ＬＡＮ、ＷＡＮなどを介してコンピュータ１００に接続される他のコンピュータまたはサーバ装置などに各プログラムを記憶させておき、コンピュータ１００がこれらの装置から各プログラムを取得して実行するようにしてもよい。

【符号の説明】

【0074】

１０帳票判別装置
１１画像記憶部
１３取得部
１５第１除去部
１７第２除去部
１７ａ統合部
１７ｂ推定部
１７ｃ除去部
１８判別部
１９第３除去部

【図1】