IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7447482画像処理装置、システム、方法、及びプログラム
<>
  • 特許-画像処理装置、システム、方法、及びプログラム 図1
  • 特許-画像処理装置、システム、方法、及びプログラム 図2
  • 特許-画像処理装置、システム、方法、及びプログラム 図3
  • 特許-画像処理装置、システム、方法、及びプログラム 図4
  • 特許-画像処理装置、システム、方法、及びプログラム 図5
  • 特許-画像処理装置、システム、方法、及びプログラム 図6
  • 特許-画像処理装置、システム、方法、及びプログラム 図7A
  • 特許-画像処理装置、システム、方法、及びプログラム 図7B
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-04
(45)【発行日】2024-03-12
(54)【発明の名称】画像処理装置、システム、方法、及びプログラム
(51)【国際特許分類】
   G06V 30/412 20220101AFI20240305BHJP
   G06V 30/12 20220101ALI20240305BHJP
【FI】
G06V30/412
G06V30/12 Z
【請求項の数】 9
(21)【出願番号】P 2019232975
(22)【出願日】2019-12-24
(65)【公開番号】P2021101304
(43)【公開日】2021-07-08
【審査請求日】2022-11-09
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】下村 駿平
【審査官】伊知地 和之
(56)【参考文献】
【文献】特開2019-008775(JP,A)
【文献】特開2018-055255(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/412
G06V 30/12
(57)【特許請求の範囲】
【請求項1】
文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出する特徴量抽出生成部と、
前記文書帳票を、前記個別第一特徴量と前記個別第二特徴量に基づいてグループ分けし、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、を生成するグループ分類部と、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とする制御部と、
を備え
前記制御部は、前記新たな文書帳票の前記個別第二特徴量が前記予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、前記予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する前記記録文字列の数が最も多い第一特徴量を、前記特定第一特徴量として特定する、
画像処理装置。
【請求項2】
前記グループ分類部は、前記文書帳票を、前記個別第二特徴量が示す前記非記録文字列の一致度、エンブレム画像の一致度、前記非記録文字列の座標範囲の一致度のうち少なくとも1つ、及び、前記個別第一特徴量が示す前記記録文字列の特徴の類似度に基づいて前記グループ分けを行う、
請求項1に記載の画像処理装置。
【請求項3】
前記新たな文書帳票の前記個別第一特徴量が含まれる前記グループを特定し、前記新たな文書帳票の前記個別第二特徴量が含まれる前記グループを特定するグループ特定部をさらに備える、
請求項1又は2に記載の画像処理装置。
【請求項4】
前記文書帳票と、前記文書帳票の前記個別第一特徴量と、を対応付けて記録し、前記文書帳票と、前記文書帳票の前記個別第二特徴量と、を対応付けて記録する記憶部をさらに備える、
請求項1から3のいずれか1つに記載の画像処理装置。
【請求項5】
前記文書帳票と、前記文書帳票に含まれる前記記録文字列と、をデータベースから取得し、前記新たな文書帳票を画像読取装置から取得する取得部をさらに備える、
請求項1から4のいずれか1つに記載の画像処理装置。
【請求項6】
前記文書帳票の前記個別第一特徴量は、前記記録文字列の属性情報及び前記記録文字列の座標情報の少なくともいずれかを含み、
前記記録文字列の前記属性情報は、数字、アルファベット、ひらがな、漢字、文字数、文字高さ、フォントの情報のうち少なくとも1つを含み、
前記記録文字列の座標情報は、前記記録文字列の先頭文字の座標及び終了文字の座標の少なくともいずれかを含む、
請求項1から5のいずれか1つに記載の画像処理装置。
【請求項7】
画像処理装置と画像読取装置と記録装置とデータベースとを備え、
前記画像読取装置は、
光学的に文書帳票の画像データを取得し、前記画像データを前記画像処理装置へ出力する読取出力部を有し、
前記画像処理装置は、
前記文書帳票の前記画像データを文字認識し、前記文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出する特徴量抽出部と、
前記文字認識した文字認識結果を前記記録装置に出力する処理出力部と、
前記文書帳票を、前記個別第一特徴量と前記個別第二特徴量に基づいてグループ分けし、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、を生成するグループ分類部と、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とする制御部と、を有し、
前記制御部は、前記新たな文書帳票の前記個別第二特徴量が前記予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、前記予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する前記記録文字列の数が最も多い第一特徴量を、前記特定第一特徴量として特定し、
前記記録装置は、
前記画像処理装置から前記文字認識結果を取得する文字認識取得部と、
前記文字認識結果を前記データベースに記録する文字認識記録部と、を有し、
前記データベースは、
前記記録装置から取得した前記文字認識結果を記録する記録テーブルを有する、
システム。
【請求項8】
文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出することと、
前記文書帳票を、前記個別第一特徴量と前記個別第二特徴量に基づいてグループ分けし、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、を生成することと、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とすることと、
前記新たな文書帳票の前記個別第二特徴量が前記予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、前記予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する前記記録文字列の数が最も多い第一特徴量を、前記特定第一特徴量として特定することと、
を備える方法。
【請求項9】
文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出することと、
前記文書帳票を、前記個別第一特徴量と前記個別第二特徴量に基づいてグループ分けし、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、を生成することと、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とすることと、
前記新たな文書帳票の前記個別第二特徴量が前記予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、前記予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する前記記録文字列の数が最も多い第一特徴量を、前記特定第一特徴量として特定することと、
をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像処理装置、システム、方法、及びプログラムに関し、特に、記録対象ではない文字列が少ない文書帳票やエンブレム画像がない文書帳票であっても、文書帳票の書式を判別することが可能な画像処理装置、システム、方法、及びプログラムに関する。
【背景技術】
【0002】
スキャナ等を用いて取得した文書帳票の画像データをOCR(Optical Character Recognition)処理して文書を読み取る画像処理装置がある。特許文献1の画像処理装置は、ОCR処理の結果を記録し、記録したОCR処理の結果から、文書帳票の書式ごとに学習データを生成する。そして、特許文献1の画像処理装置は、記録対象ではない文字列(非記録文字列)の一致度、エンブレム画像の一致度、記録対象ではない文字列の座標範囲の一致度などを使用して、新たな文書帳票の書式を判別(判定)する。しかしながら、記録対象ではない文字列がない、あるいは少ない文書帳票やエンブレム画像がない文書帳票など(表形式の帳票)の書式を判別することが難しいという課題があった。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2019-8775号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記のとおり、記録対象ではない文字列がない、あるいは少ない文書帳票やエンブレム画像がない文書帳票などの書式を判別することが難しいという課題があった。
【0005】
本開示の目的は、上述した課題を解決する画像処理装置、システム、方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0006】
本開示に係る画像処理装置は、
文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出する特徴量抽出生成部と、
前記文書帳票を、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、にグループ分けするグループ分類部と、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とする制御部と、
を備える。
【0007】
本開示に係るシステムは、
画像処理装置と画像読取装置と記録装置とデータベースとを備え、
前記画像読取装置は、
光学的に文書帳票の画像データを取得し、前記画像データを前記画像処理装置へ出力する読取出力部を有し、
前記画像処理装置は、
前記文書帳票の前記画像データを文字認識し、前記文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出する特徴量抽出部と、
前記文字認識した文字認識結果を前記記録装置に出力する処理出力部と、
前記文書帳票を、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、にグループ分けするグループ分類部と、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とする制御部と、を有し、
前記記録装置は、
前記画像処理装置から前記文字認識結果を取得する文字認識取得部と、
前記文字認識結果を前記データベースに記録する文字認識記録部と、を有し、
前記データベースは、
前記記録装置から取得した前記文字認識結果を記録する記録テーブルを有する。
【0008】
本開示に係る方法は、
文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出することと、
前記文書帳票を、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、にグループ分けすることと、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とすることと、
を備える。
【0009】
本開示に係るプログラムは、
文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、前記文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量と、を抽出することと、
前記文書帳票を、複数の前記個別第一特徴量を含むグループ第一特徴量と、複数の前記個別第二特徴量を含むグループ第二特徴量と、にグループ分けすることと、
新たな文書帳票の前記個別第二特徴量が予め記録された前記グループ第二特徴量内のいずれにも一致しない場合、予め記録された前記グループ第一特徴量内から、前記新たな文書帳票の前記個別第一特徴量と一致する特定第一特徴量を特定し、前記特定第一特徴量が示す書式を前記新たな文書帳票の書式とすることと、
をコンピュータに実行させる。
【発明の効果】
【0010】
本開示によれば、記録対象ではない文字列が少ない文書帳票やエンブレム画像がない文書帳票であっても、文書帳票の書式を判別することが可能な画像処理装置、システム、方法、及びプログラムを提供することができる。
【図面の簡単な説明】
【0011】
図1】実施の形態に係るシステムを例示するブロック図である。
図2】実施の形態に係る画像処理装置を例示するブロック図である。
図3】実施の形態に係る画像処理装置を例示するブロック図である。
図4】文書帳票を例示する模式図である。
図5】データベースが記録する記録テーブルの概要を例示する図である。
図6】実施の形態に係る画像処理装置の動作を例示するフローチャートである。
図7A】実施の形態に係る画像処理装置の動作を例示するフローチャートである。
図7B】実施の形態に係る画像処理装置の動作を例示するフローチャートである。
【発明を実施するための形態】
【0012】
以下、図面を参照して本発明の実施の形態について説明する。各図面において、同一又は対応する要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明を省略する。
【0013】
[実施の形態]
<システム>
実施の形態に係るシステムを説明する。
図1は、実施の形態に係るシステムを例示するブロック図である。
【0014】
図1に示すように、システム10は、画像処理装置1、画像読取装置2、記録装置3、及びデータベース4を備える。画像処理装置1は、画像読取装置2と通信ケーブルにより接続される。画像処理装置1は、記録装置3と接続される。画像読取装置2は、記録装置3と接続される。データベース4は、画像処理装置1と記録装置3とに接続される。
【0015】
画像読取装置2は、光学的に文書帳票などの画像データを取得して画像処理装置1へ出力する読取出力部(図示せず)を有する。
【0016】
画像処理装置1は、文書帳票の画像データをOCR処理し文字認識する特徴量抽出生成部と、文字認識した文字認識結果を記録装置3に出力する処理出力部(図示せず)と、を有する。画像処理装置1の詳細については、後述する。
【0017】
記録装置3は、文字認識取得部(図示せず)と、文字認識記録部(図示せず)とを有する。文字認識取得部は、画像処理装置1から文字認識結果を取得する。文字認識記録部は、取得した文字認識結果をデータベース4に記録する。
【0018】
データベース4は、記録テーブル(図示せず)を有する。記録テーブルは、記録装置3から取得した文字認識結果を記録する。具体的には、データベース4は、記録装置3から過去に登録された複数の文書帳票の画像データとその画像データに含まれる文字列のうち、記録対象となる文字列を示す記録文字列の対応関係を記録する。記録文字列が示す文字列は、文書帳票に記載される文字列のうちデータベース4に記録、保存しておくべき重要な文字列である。すなわち、記録文字列とは、記録対象となる文字列を示す。なお、非記録文字列とは、表形式の書式帳票などの、記録対称とならない文字列を示す。
【0019】
システム10を使用する作業者は、予め、記録装置3を用いて過去に登録された複数の文書帳票の画像データと、その画像データに含まれる文字列のうちの記録文字列と、をデータベース4の記録テーブルに登録する。記録装置3には、文書帳票の画像データと、その画像データに含まれる文字列の情報のうち記録対象となる文字列を示す記録文字列の情報と、の対応関係が、複数の文書帳票について十分に記録されているものとする。記録テーブルについては、後述する。
【0020】
<画像処理装置>
実施の形態に係る画像処理装置を説明する。
図2は、実施の形態に係る画像処理装置を例示するブロック図である。
図2は、実施の形態に係る画像処理装置の最小構成を例示するブロック図である。
図3は、実施の形態に係る画像処理装置を例示するブロック図である。
【0021】
図2に示すように、実施の形態に係る画像処理装置1は、制御部101、特徴量抽出生成部100、読取対象特徴量生成部104、及びグループ分類部106を備える。特徴量抽出生成部100は、特徴量抽出部103と、読取対象特徴量生成部104と、を有する。また、図3に示すように、実施の形態に係る画像処理装置1は、取得部102、記録部105、及びグループ特定部107をさらに備える。
【0022】
制御部101は、取得部102、特徴量抽出部103、読取対象特徴量生成部104、記録部105、グループ分類部106、及びグループ特定部107を制御する。
【0023】
取得部102は、文書帳票の画像データと、文書帳票に含まれる記録文字列と、をデータベース4から取得する。また、取得部102は、新たな文書帳票の画像データを画像読取装置2から取得する。
【0024】
特徴量抽出部103は、文書帳票に含まれる文字列の特徴を示す特徴量を抽出する。読取対象特徴量生成部104は、特徴量抽出部103が抽出した特徴量に基づいて、文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量と、非記録文字列の特徴を示す個別第二特徴量と、を生成する。
【0025】
すなわち、特徴量抽出生成部100は、文書帳票の画像データをOCR処理し、文書帳票の画像データの文字認識処理結果(OCR処理結果)に基づいて、文書帳票に含まれる記録文字列の特徴を示す個別第一特徴量を抽出する。特徴量抽出生成部100は、文書帳票に含まれる非記録文字列の認識情報を示す個別第二特徴量を抽出する。
【0026】
また、特徴量抽出生成部100は、複数の文書帳票の画像データに対応する個別第一特徴量と、個別第二特徴量と、を文書帳票毎かつ文字列毎に抽出する。特徴量抽出生成部100による個別第一特徴量と個別第二特徴量の具体的な抽出方法は、後述する。
【0027】
グループ分類部106は、文書帳票を、複数の個別第一特徴量を含むグループ第一特徴量と、複数の個別第二特徴量を含むグループ第二特徴量と、にグループ分けする。
【0028】
制御部101は、取得部102が取得した新たな文書帳票の個別第二特徴量が予め記録されたグループ第二特徴量内の複数の個別第二特徴量のいずれかに一致するかを確認する。制御部101は、確認した結果、いずれにも一致しない場合、予め記録されたグループ第一特徴量内の複数の個別第一特徴量から、新たな文書帳票の個別第一特徴量と一致する特定第一特徴量を特定する。制御部101は、特定した特定第一特徴量が示す書式を新たな文書帳票の書式とする。
【0029】
グループ特定部107は、新たな文書帳票の個別第一特徴量が含まれるグループを特定する。グループ特定部107は、新たな文書帳票の個別第二特徴量が含まれるグループを特定する。
【0030】
記録部105は、文書帳票と、文書帳票の個別第一特徴量と、を対応付けて記録し、文書帳票と、文書帳票の個別第二特徴量と、を対応付けて記録する。記録部105は、新たな文書帳票についても同様に、新たな文書帳票とその個別第一特徴量とを対応付けて記録し、新たな文書帳票とその個別第二特徴量とを対応付けて記録する。
【0031】
実施の形態に係る画像処理装置1は、新たな文書帳票の個別第二特徴量が予め記録されたグループ第二特徴量内のいずれにも一致しない場合、予め記録されたグループ第一特徴量内から、新たな文書帳票の個別第一特徴量と一致する特定第一特徴量を特定し、特定第一特徴量が示す書式を新たな文書帳票の書式とする。
【0032】
これにより、実施の形態によれば、記録対象ではない文字列が少ない文書帳票やエンブレム画像がない文書帳票であっても、文書帳票の書式を判別することが可能な画像処理装置、システム、方法、及びプログラムを提供することができる。
【0033】
<文書帳票とデータベース>
文書帳票とデータベースとの関係を説明する。
図4は、文書帳票を例示する模式図である。
図5は、データベースが記録する記録テーブルの概要を例示する図である。
【0034】
図4に示すように、文書帳票5には、その文書を作成した企業のマーク、作成日、作成担当者、文書内容が、その文書帳票5に特有のフォーマットで記載されている。文書帳票5に記載された文書内容は、例えば、文書帳票5が発注票であれば、1つまたは複数の発注した商品名やその発注個数などの情報の組である。記録文字列(記録対象である文字列)とは、例えば、図4に示す日付51、発注先52、商品名53、数量54、金額55である。非記録文字列(記録対象ではない文字列)とは、例えば、図4に示す発注者の名称501、発注者のエンブレム画像502、文書帳票のタイトル503、挨拶文504である。
【0035】
図5に示すように、データベース4の記録テーブルには、異なる複数の文書帳票についての画像データと、各文書帳票に記載されている特定の記録文字列の対応関係(組み合わせ)が、その文書帳票ごとに予め多数記録されている。具体的には、データベース4の記録テーブルには、異なる複数の文書帳票のそれぞれについての特定の記録文字列情報が複数枚分記録されている。データベース4の記録テーブルには、文書帳票を識別する帳票IDと、文書帳票の画像データと、その文書帳票に記載されている文字列のうち記録すべき特定の記録文字列と、が対応付けられて記録されている。1つの文書帳票に対応する記録文字列は、複数個あってもよい。このように、記録テーブルには、文書帳票に対応する帳票IDと、文書帳票に対応する画像データと、文書帳票に対応する1つ以上の記録文字列と、が、文書帳票ごとに記録されている。
【0036】
<画像処理装置の動作>
実施の形態に係る画像処理装置の動作を説明する。
図6は、実施の形態に係る画像処理装置の動作を例示するフローチャートである。
図7Aは、実施の形態に係る画像処理装置の動作を例示するフローチャートである。
図7Bは、実施の形態に係る画像処理装置の動作を例示するフローチャートである。
【0037】
作業者は、データベース4に予め文書帳票(図4参照)ごとに、画像データ及び記録文字列等が記録された状態で(図5参照)、画像処理装置1を起動し、画像処理装置1へ処理開始を指示する。
【0038】
作業者が処理開始を指示すると、図6に示すように、画像処理装置1の取得部102は、データベース4から文書帳票5の画像データと、その画像データに対応する記録文字列の情報と、を全て読み込んだかを判定する(ステップS101)。
【0039】
ステップS101においてNOの場合、取得部102は、データベース4から文書帳票5の画像データと、その画像データに対応する記録文字列の情報と、を読み取る(ステップS102)。取得部102は、画像データと記録文字列とを特徴量抽出部103へ出力する。
【0040】
特徴量抽出部103は、画像データをOCR処理して画像データ中の全ての文字列と、当該文字列の範囲を示す画像データ内の座標を検出する(ステップS103)。なお、文字列とは、複数の文字によって構成される文字の纏まりのことである。特徴量抽出部103は、他の文字との間隔などによって、その1つの纏まりの範囲を解析し、その範囲に含まれる1つまたは複数の文字を文字列として抽出すると共に、その画像データ内の文字列の範囲を示す座標を検出する。文字列に含まれる文字には、表意文字、表音文字などの記号、マーク、アイコン画像などを含んでよい。
【0041】
特徴量抽出部103は、OCR処理により画像データから抽出した文字列と、画像データと共にデータベース4から読み取った記録文字列と、を比較する。特徴量抽出部103は、OCR処理により画像データから抽出した文字列のうち、記録文字列の文字情報と一致した画像データ中の文字列と、その文字列に含まれる文字の属性と、その範囲の座標とを特定する(ステップS104)。
【0042】
文字の属性は、数字、アルファベット、ひらがな、漢字、文字数、文字高さ、フォントなどにより表される情報である。また、文字列の範囲の座標は、文字列に含まれる先頭文字の座標、終了文字の座標などを示す情報である。文字の属性を記録文字列の属性情報と称し、文字列の範囲の座標を記録文字列の座標情報と称することもある。
【0043】
特徴量抽出部103は、それら特定した情報を含む特徴量を1つの文書帳票5について生成する(ステップS105)。特徴量は、特徴量抽出部103によって、文書帳票5における記録文字列ごとに生成される。すなわち、特徴量抽出部103は、文書帳票毎かつ記録文字列毎に特徴量を生成する。この文書帳票毎かつ記録文字列毎の特徴量を、個別第一特徴量と称する。個別第一特徴量は、文字の属性、文字列の範囲を示す座標の何れか一方または両方を含んでいてもよい。
【0044】
特徴量抽出部103は、個々の文書帳票5における1つ又は複数の記録文字列それぞれの個別第一特徴量を、文書帳票5の識別子(帳票ID)および記録文字列の識別子に対応付けてデータベース4に記録する(ステップS106)。
【0045】
記録文字列の識別子として、例えば、その記録文字列の位置を示す座標値を用いることができる。特徴量抽出部103は、図4に示す文書帳票5に含まれる記録文字列である日付51、発注先52、商品名53、数量54、金額55それぞれの、文字属性、文字列の範囲を示す座標などを示す各個別第一特徴量を、文書帳票5の識別子および記録文字列の識別子に対応付けてデータベース4に記録する。
【0046】
また、特徴量抽出部103は、記録文字列に含まれる文字情報と一致しない画像データ中の非記録文字列と、その非記録文字列に含まれる文字の属性と、その範囲の座標と、を特定する(ステップS107)。
【0047】
特徴量抽出部103は、それら特定した情報を含む特徴量を1つの文書帳票5について生成する(ステップS108)。特徴量は、特徴量抽出部103によって、文書帳票5における非記録文字列ごとに生成される。すなわち、特徴量抽出部103は、文書帳票毎かつ非記録文字列毎に特徴量を生成する。この文書帳票毎かつ非記録文字列毎の特徴量を、個別第二特徴量と称する。個別第二特徴量は、文字の属性、文字列の範囲を示す座標の何れか一方または両方を含んでいてもよい。
【0048】
特徴量抽出部103は、個々の文書帳票5における1つ又は複数の非記録文字列それぞれの個別第二特徴量を、文書帳票5の識別子および非記録文字列の識別子に対応付けてデータベース4に記録する(ステップS109)。
【0049】
非記録文字列の識別子として、例えば、その非記録文字列の位置を示す座標値を用いることができる。特徴量抽出部103は、図4に示す文書帳票5に含まれる非記録文字列である発注者の名称501、発注者のエンブレム画像502、文書帳票のタイトル503、挨拶文504などを示す各個別第二特徴量を、文書帳票5の識別子および非記録文字列の識別子に対応付けてデータベース4に記録する。
【0050】
データベース4には、異なる複数の文書帳票5の画像データと、その画像データに対応する記録文字列の情報と、が記録されている。画像処理装置1の取得部102は、全ての文書帳票5についての画像データと記録文字列の情報を読み込むまでステップS101からステップS109の処理を繰り返す。
【0051】
ステップS101において、取得部102が文書帳票5についての画像データと記録文字列の情報を全て読み込んだと判定した場合(ステップS101:YES)、グループ分類部106は、文書帳票5の画像データに含まれる個別第二特徴量と個別第一特徴量に基づいて、文書帳票5をグループ分けする(ステップS112)。
【0052】
グループ分類部106は、例えば、各文書帳票5を、個別第二特徴量が示す非記録文字列の一致度や、エンブレム画像の一致度、非記録文字列の座標範囲の一致度などに基づいてグループ分けする。また、グループ分類部106は、個別第一特徴量が示す記録文字列の特徴(文字の属性、文字数、文字高さ、フォント)の類似度などに基づいて、グループ分けをする。このように、グループ分類部106は、個別第二特徴量だけでなく、個別第一特徴量にも基づいて、文書帳票5をグループ分けする。グループ分類部106は、このグループ分けの処理において文書帳票5のグループ識別子を決定する。
【0053】
グループ分類部106は、全ての文書帳票5についてグループ分けが終了したかを判定する(ステップS113)。グループ分類部106は、全ての文書帳票5のグループ分けが完了していない場合には(ステップS113:NО)、ステップS112の処理を繰り返す。
【0054】
グループ分類部106は、全ての文書帳票5のグループ分けが完了した場合には(ステップS113:YES)、文書帳票5の識別子とその文書帳票5に付与されたグループ識別子とを対応付けてデータベース4の記録テーブルに記録する(ステップS114)。
【0055】
読取対象特徴量生成部104は、あるグループに属する1つまたは複数の文書帳票5の各個別第一特徴量および各個別第二特徴量をデータベース4から読み取る。読取対象特徴量生成部104は、グループに属する文書帳票5の各個別第一特徴量および各個別第二特徴量に対応する各グループ第一特徴量、各グループ第二特徴量を生成する(ステップS115)。
【0056】
読取対象特徴量生成部104は、グループそれぞれについて各グループ第一特徴量、各グループ第二特徴量を算出し、グループの識別子に対応付けてデータベース4に記録する(ステップS116)。
【0057】
次に、図7Aに示すように、作業者は、新たな文書帳票を画像読取装置2に読み取らせる操作を行う。これにより、画像読取装置2は、新たな文書帳票の画像データを生成して画像処理装置1へ出力する。画像処理装置1の取得部102は、新たな文書帳票の画像データを画像読取装置2から取得する(ステップS201)。
【0058】
取得部102は、新たな文書帳票の画像データを特徴量抽出部103へ出力する。特徴量抽出部103は、新たな文書帳票の画像データをOCR処理して、文字列と、文字列に含まれる文字の特徴と、その文字列の範囲の画像データ中の座標と、を検出する(ステップS202)。
【0059】
特徴量抽出部103は、それら検出した情報を含む第三特徴量を、新たな文書帳票の画像データ中の文字列ごとに生成する(ステップS203)。新たに読み込んだ画像データの文書帳票に含まれる文字列の特徴を示す情報を、第三特徴量と称する。
【0060】
グループ特定部107は、データベース4から、ある複数のグループ第二特徴量のうち、新たな文書帳票のグループを特定するために使用するグループ第二特徴量を読み取る(ステップS2031)。当該グループ第二特徴量は、例えば、文書帳票の画像データに表示される発注者のエンブレム画像502(図4参照)に対応する個別第二特徴量であってよい。
【0061】
グループ特定部107は、グループ第二特徴量に示す情報が、ステップS201で取得した新たな文書帳票の画像データから特定できるかどうかを判定する(ステップS2032)。グループ特定部107は、全てのグループについてのグループ第二特徴量を用いて同様の処理を行う。
【0062】
グループ特定部107は、データベース4から読み取ったグループ第二特徴量に一致する情報が、新たに読み込んだ文書帳票の画像データから特定できた場合(ステップS2032:YES)、そのグループ第二特徴量を有するグループを、新たに読み込んだ文書帳票の画像データのグループと特定する(ステップS2033)。特定したグループの第二特徴量が示す書式を新たな文書帳票の書式とする。
【0063】
しかしながら、非記録文字列の情報から作成される第二特徴量のグループを示すグループ第二特徴量については、表形式の書式帳票などの非記録文字列がない、あるいは、少ない場合に、正しくグループを判定することができない。
【0064】
そこで、実施の形態に係る画像処理装置1は、全てのグループについてのグループ第二特徴量について、一致する情報が新たに読み込んだ文書帳票から特定できなかった場合(ステップS2032:NО)、グループ第一特徴量を用いてグループの特定を行う。
【0065】
具体的には、第二特徴量と同様に、あるグループの全ての記録文字列に関する第一特徴量の示す情報が、ステップS201で取得した新たな文書帳票の画像データから特定できるかどうかを判定する(ステップS2034)。
【0066】
記録文字列の全ての種類でグループ第一特徴量と第三特徴量が一致する場合に(ステップS2034:YES)、同一のグループとして判定する。そして、そのグループ第一特徴量を有するグループを、新たに読み込んだ文書帳票の画像データのグループと特定する(ステップS204)。
【0067】
一致する条件として、グループ第一特徴量のy座標(縦方向)の値は含まないようにする。すなわち、一致する条件として、y座標(縦方向)の値は比較せず、x座標(横方向)の値だけを比較する。これにより、表形式の文書帳票のように、y方向に表の長さが変化する場合でも、表の長さに影響されることなく判定することができる。
【0068】
図4を用いて判定方法を説明すると、日付51から金額55までの記録文字列の全てと一致するグループ第一特徴量を、同一のグループとして判定する。そして、商品名53のように複数の候補がある場合、1つでも一致する候補があれば良いとする。
【0069】
また、文書帳票の画像データと一致するグループ第一特徴量が、複数個存在する場合、一致する文字列が多いグループを、同一のグループとして判定する。
【0070】
すなわち、画像処理装置1は、新たな文書帳票の個別第二特徴量が予め記録されたグループ第二特徴量内のいずれにも一致しない場合、予め記録されたグループ第一特徴量内から、新たな文書帳票の個別第一特徴量と一致する記録文字列の数が最も多い第一特徴量を、特定第一特徴量として特定してもよい。
【0071】
ステップS204の後、図7Bに示すように、グループ特定部107は、データベース4からそのグループについての1つまたは複数のグループ第一特徴量を読み出す(ステップS205)。グループ特定部107は、記録部105へ第三特徴量と1つまたは複数のグループ第一特徴量を出力する。グループ第一特徴量は、そのグループに属する文書帳票内の1つまたは複数の記録文字列を特定するための特徴量である。
【0072】
記録部105は、画像データ中の1つまたは複数の文字列についての第三特徴量と、1つまたは複数のグループ第一特徴量とを取得する。記録部105は各グループ第一特徴量に含まれる文字列の範囲を示す座標を用いて、各グループ第一特徴量が示す当該座標に対応する座標を有する第三特徴量が全て存在するかを判定する(ステップS206)。
【0073】
各グループ第一特徴量の座標に対応する座標を有する第三特徴量が全て存在する場合には、記録文字列に対応する文書帳票内の全ての記載事項に文字の記載が存在する。一方、各グループ第一特徴量の座標に対応する座標を有する第三特徴量が全て存在しない場合には、文書帳票内の何れかの記載事項に文字の記載が無い状態である。
【0074】
ステップS206でYESの場合、記録部105は、グループ第一特徴量に含まれる文字属性と、座標に基づいて特定された対応する第三特徴量に含まれる文字属性がそれぞれ一致するかどうかを判定する(ステップS207)。
【0075】
記録部105は、ステップS207の判定結果がYESとなり文字属性が一致する場合、現在処理している画像データにおいて1つまたは複数の第三特徴量が示す座標に基づく記録文字列の範囲に矩形枠を表示した確認画面を生成する。記録部105は、その確認画面をモニタに出力する(ステップS208)。
【0076】
作業者は、この確認画面に表示された矩形領域を確認して、画像処理装置1が記録しようとする記録文字列を確認することができる。これにより、作業者は、記録文字列に不足が無いかを確認することができる。確認画面にはOKまたはNGの何れかのボタンのアイコン画像が表示されている。このボタンのアイコン画像のうちOKのボタンを選択することにより、作業者は、記録文字列としての選択に不足がないことを指示することができる。
【0077】
他方、ボタンのアイコン画像のうちNGのボタンを選択することにより、作業者は、記録文字列としての選択に不足があることを指示することができる。記録部105は、作業者のボタンのアイコン画像の押下に応じて、記録文字列の選択に不足が無いかを判定する(ステップS209)。
【0078】
記録部105は、不足が無い場合には、第三特徴量に含まれる文字列を、文書帳票の識別情報に対応付けて記録テーブルに記録する(ステップS210)。
【0079】
ステップS206でNOの場合、ステップS207でNOの場合、ステップS209でNOの場合、記録部105は、画像データ中の対応する座標の第三特徴量が存在しなかったグループ第一特徴量の座標の範囲に入力欄を設けた帳票画像の入力用画像データを生成してモニタに出力する(ステップS211)。
【0080】
作業者は、この入力用画像データを見ながら、画像処理装置1のキーボード等の入力装置を操作して、モニタに表示されている入力用画像データ内の入力欄に記録文字列を入力する。当該入力用画像データには保存ボタン(記録ボタン)が表示されており、保存ボタンの押下操作をすると、記録部105は、既に文書帳票について取得した第三特徴量の他、新たに入力用画像データの入力欄に入力された文字列を含む第三特徴量を生成する(ステップS212)。記録部105は、帳票画像データの識別子と入力欄に入力された文字列とを対応付けてデータベース4に記録する。
【0081】
画像処理装置1は、図6で示した処理フローを再度実施することにより、グループ第一特徴量およびグループ第二特徴量を更新し、記録できる文字列の範囲を拡張する。これにより、次に同じ文書帳票を処理したときには、自動的に文字列を記録でき、作業者が文字列を入力する手間を省くことができる。記録部105は、全ての第三特徴量それぞれに含まれる文字列を、文書帳票の記録テーブルに記録する(ステップS213)。
【0082】
画像処理装置1は、ステップS2031からステップS204に示したように、グループ分類部106に、グループ第一特徴量を用いた判定を加えることで、第二特徴量(非記録文字列)がない、あるいは、少ない表形式の文書帳票のような場合でも、文書帳票の書式を正しく判別することが可能になる。
【0083】
また、画像処理装置1は、予め作業者が記録しておいた複数の異なる文書帳票の画像データと記録文字列によって、新たに入力した文書帳票の種別によらずにその文書帳票の画像データにおける記録文字列を記録することができる。これにより、画像処理装置1は、文書帳票における記録文字列の記録の作業者の労力を軽減することができる。
【0084】
<特徴>
以下に、実施の形態の特徴を記載する。
画像処理装置1は、文書帳票の書式の特定(判別)において、非記録文字列がない、あるいは、少ない表形式の文書帳票のような場合でも、記録文字列の属性(数字、アルファベット、ひらがな、漢字、文字数、文字高さ、フォントなど)、記録文字列の座標(文字列に含まれる先頭文字の座標、終了文字の座標など)に基づいて文書帳票毎に生成されたグループ個別第一特徴量を利用することで、文書帳票の書式を判別する。
【0085】
尚、上記の実施の形態では、本発明をハードウェアの構成として説明したが、本発明はこれに限定されるものではない。本発明は、各構成要素の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。
【0086】
上記の実施の形態において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実態のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(具体的にはフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(具体的には光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(具体的には、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM))、フラッシュROM、RAM(Random Access Memory)を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0087】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
【符号の説明】
【0088】
1…画像処理装置
2…画像読取装置
3…記録装置
4…データベース
5…文書帳票
10…システム
100…特徴量抽出生成部
101…制御部
102…取得部
103…特徴量抽出部
104…読取対象特徴量生成部
105…記録部
106…グループ分類部
107…グループ特定部
図1
図2
図3
図4
図5
図6
図7A
図7B