(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-11
(45)【発行日】2024-03-19
(54)【発明の名称】画像処理方法、画像処理プログラムおよび画像処理装置
(51)【国際特許分類】
G06V 30/14 20220101AFI20240312BHJP
G06T 7/11 20170101ALI20240312BHJP
G06V 30/412 20220101ALI20240312BHJP
【FI】
G06V30/14 340J
G06T7/11
G06V30/412
(21)【出願番号】P 2020043072
(22)【出願日】2020-03-12
【審査請求日】2022-11-17
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】村山 大助
(72)【発明者】
【氏名】石川 雅基
(72)【発明者】
【氏名】朝倉 陽子
(72)【発明者】
【氏名】時尾 響
(72)【発明者】
【氏名】石塚 康成
(72)【発明者】
【氏名】大塚 恭平
(72)【発明者】
【氏名】一宮 央樹
(72)【発明者】
【氏名】田村 尭央
(72)【発明者】
【氏名】浅葉 海
【審査官】伊知地 和之
(56)【参考文献】
【文献】特開2019-021981(JP,A)
【文献】特開2002-245461(JP,A)
【文献】特開2018-005462(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/14
G06T 7/11
G06V 30/412
(57)【特許請求の範囲】
【請求項1】
コンピュータが実行する画像処理方法であって、
押印済の契約書の書面が電子的に読み込まれることにより生成された画像データを処理対象として、前記画像データから、印面に相当する領域を特定し、
予め記憶装置に記憶された、契約書の印面位置に対応する契約書内の第1の領域と、契約を締結した人物に関する情報が記載される契約書内の第2の領域
であって、前記第1の領域を基準とする縦方向の2つの座標差分で定義された前記第2の領域との位置関係を参照し、処理対象である前記画像データから特定した前記印面の領域と前記位置関係とに基づいて特定される領域を、処理対象である前記画像データから抽出し、
抽出した前記領域を出力する
処理を実行することを特徴とする画像処理方法。
【請求項2】
押印済の契約書の書面が電子的に読み込まれることにより生成された複数の画像データを有する学習データを基にして、前記第1の領域と、前記第2の領域との位置関係を学習し、学習結果を前記記憶装置に記憶させる処理を更に実行することを特徴とする請求項1に記載の画像処理方法。
【請求項3】
前記学習する処理は、前記第1の領域として特定される座標と前記第2の領域として特定される座標との差分値を、画像データ毎に算出し、算出した差分値のうち、最大の差分値を、前記位置関係として学習することを特徴とする請求項2に記載の画像処理方法。
【請求項4】
前記学習する処理は、前記第1の領域として特定される座標と前記第2の領域として特定される座標との差分値を、画像データ毎に算出し、算出した複数の差分値を基にして、差分値の外れ値を算出し、前記複数の差分値から前記外れ値を除外した差分値を基にして、前記位置関係を学習することを特徴とする請求項2に記載の画像処理方法。
【請求項5】
コンピュータに
押印済の契約書の書面が電子的に読み込まれることにより生成された画像データを処理対象として、前記画像データから、印面に相当する領域を特定し、
予め記憶装置に記憶された、契約書の印面位置に対応する契約書内の第1の領域と、契約を締結した人物に関する情報が記載される契約書内の第2の領域
であって、前記第1の領域を基準とする縦方向の2つの座標差分で定義された前記第2の領域との位置関係を参照し、処理対象である前記画像データから特定した前記印面の領域と前記位置関係とに基づいて特定される領域を、処理対象である前記画像データから抽出し、
抽出した前記領域を出力する
処理を実行させることを特徴とする画像処理プログラム。
【請求項6】
押印済の契約書の書面が電子的に読み込まれることにより生成された画像データを処理対象として、前記画像データから、印面に相当する領域を特定する特定部と、
予め記憶装置に記憶された、契約書の印面位置に対応する契約書内の第1の領域と、契約を締結した人物に関する情報が記載される契約書内の第2の領域
であって、前記第1の領域を基準とする縦方向の2つの座標差分で定義された前記第2の領域との位置関係を参照し、処理対象である前記画像データから特定した前記印面の領域と前記位置関係とに基づいて特定される領域を処理対象である前記画像データから抽出し、抽出した前記領域を出力する抽出部と
を有することを特徴とする画像処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理方法等に関する。
【背景技術】
【0002】
契約書には、契約を締結した人物に関する情報として、住所や氏名等が記載され、各種の処理に利用されている。以下の説明では、適宜、契約を締結した人物に関する情報を「締結者情報」と表記する。
【0003】
ここで、紙媒体の契約書に記載された締結者情報を検出する場合には、スキャナを用いて、契約書を画像データとして取り込み、画像データに対して文字検出の画像処理を実行する。なお、契約書の画像データ全体に対して、文字検出の画像処理を実行すると、締結者情報を含まない領域に対しても、画像処理が行われ、検出効率が低下する。
【0004】
なお、契約書の書式が予め決まっている場合には、契約書の画像データの所定の領域に対して、文字検出の画像処理を実行することができ、締結者情報の検出効率を向上させることができる。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した従来技術では、締結者情報が記載された領域を効率よく抽出することができないという問題がある。
【0007】
たとえば、契約書の書式が未知である場合には、締結者情報が記載された領域を事前に特定することができず、契約書の画像データ全体に対して、文字検出の画像処理を実行することになり、検出効率が低下してしまう。
【0008】
1つの側面では、本発明は、締結者情報が記載された領域を効率よく抽出することができる画像処理方法、画像処理プログラムおよび画像処理装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
第1の案では、コンピュータに次の処理を実行させる。コンピュータは、押印済の契約書の書面が電子的に読み込まれることにより生成された画像データを処理対象として、画像データから、印面に相当する領域を特定する。コンピュータは、予め記憶装置に記憶された、契約書の印面位置に対応する契約書内の第1の領域と、契約を締結した人物に関する情報が記載される契約書内の第2の領域との位置関係を参照し、処理対象である画像データから特定した印面の領域と位置関係とに基づいて特定される領域を、処理対象である画像データから抽出する。コンピュータは、抽出した領域を出力する。
【発明の効果】
【0010】
締結者情報が記載された領域を効率よく抽出することができる。
【図面の簡単な説明】
【0011】
【
図1】
図1は、本実施例に係る画像処理装置の処理を説明するための図である。
【
図2】
図2は、本実施例に係る画像処理装置の構成を示す機能ブロック図である。
【
図3】
図3は、学習データのデータ構造の一例を示す図である。
【
図4】
図4は、パターンデータのデータ構造の一例を示す図である。
【
図5】
図5は、第1y座標差分のヒストグラムを示す図である。
【
図6】
図6は、第1パターンの検出例を示す図である。
【
図7】
図7は、第2パターンの検出例を示す図である。
【
図8】
図8は、本実施例に係る画像処理装置の学習処理の処理手順を示すフローチャートである。
【
図9】
図9は、本実施例に係る画像処理装置の画像処理の処理手順を示すフローチャートである。
【
図10】
図10は、第1パターンと第2パターンとの比較結果を示す図である。
【
図11】
図11は、実施例の画像処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0012】
以下に、本願の開示する画像処理方法、画像処理プログラムおよび画像処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
【実施例】
【0013】
図1は、本実施例に係る画像処理装置の処理を説明するための図である。画像処理装置は、学習データ141を基にして、パターンデータ142を学習しておく。パターンデータ142は、印面10の中心座標を基準とする検出領域を示す情報である。たとえば、検出領域は、契約書の領域のうち、契約を締結した人物に関する情報(締結者情報)が記述されるであろう領域に対応する。印面10の中心座標(中心座標を含む印面の領域)が「第1の領域」に対応する。
【0014】
パターンデータ142は、印面10の中心座標を基準とする第1y座標差分(y1)と、第2y座標差分(y2)とを定義する。第1y座標差分は、検出領域の上端11aと、印面10の中心座標との差分である。第2y座標差分は、検出領域の下端11bと、印面10の中心座標との差分である。上端11a、下端11bのy座標に対応する領域が「第2の領域」に対応する。
【0015】
画像処理装置が、パターンデータ142を用いて、契約書の画像データ20に含まれる検出領域25を抽出する場合には、画像データ20の印面20aを特定する。画像処理装置は、印面20aの中心座標と、第1y座標差分(y1)とを基にして、検出領域25の上端25aを特定する。画像処理装置は、印面20aの中心座標と、第2y座標差分(y2)とを基にして、検出領域25の下端25bを特定する。なお、画像処理装置は、検出領域25のx座標方向の幅x25を、画像データ20の幅x20と同一とする。画像処理装置は、検出領域25に対して、文字認識を実行することで、締結者情報の文字列を認識する。
【0016】
上記のように、本実施例に係る画像処理装置は、契約書の画像データ20から印面20aを特定し、パターンデータ142に定義された印面の中心座標を基準とした検出領域の位置関係を基にして、画像データ20の検出領域25を抽出する。すなわち、画像処理装置は、契約書の書式が未知でも、押印位置と締結者情報の記載位置との位置関係が変わらないことに着目することで、締結者情報が記載された検出領域を効率的に抽出することができる。また、検出領域を効率的に抽出することで、検出領域に記載されているであろう締結者情報を適切に認識することもできる。
【0017】
次に、本実施例に係る画像処理装置の構成について説明する。
図2は、本実施例に係る画像処理装置の構成を示す機能ブロック図である。
図2に示すように、この画像処理装置100は、スキャナ50に接続される。画像処理装置100は、通信部110と、入力部120と、表示部130と、記憶部140と、制御部150とを有する。
【0018】
スキャナ50は、契約書の表面を電子的に読み込むことで、契約書の画像データを生成する装置である。本実施例では、スキャナ50は、押印済みの契約書の画像データを生成するものとする。スキャナ50は、画像データを、画像処理装置100の通信部110に出力する。
【0019】
通信部110は、スキャナ50と接続し、画像データを取得する装置である。通信部110は、通信装置の一例である。図示を省略するが、通信部110は、ネットワークを介して、他の外部装置と接続し、データ通信を実行してもよい。後述する制御部150は、通信部110を解して、スキャナ50、外部装置等とデータをやり取りする。
【0020】
入力部120は、各種のデータを画像処理装置100の制御部150に入力するための入力装置である。入力部120は、キーボードやマウス、タッチパネル等に対応する。
【0021】
表示部130は、表示部130は、制御部150から出力される情報を表示する表示装置である。表示部130は、有機EL(Electro Luminescence)ディスプレイ、液晶ディスプレイ、タッチパネル等に対応する。
【0022】
記憶部140は、学習データ141、パターンデータ142を有する。記憶部140は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子や、HDD(Hard Disk Drive)などの記憶装置に対応する。
【0023】
学習データ141は、パターンデータ142を生成するために用いられるデータである。
図3は、学習データのデータ構造の一例を示す図である。
図3に示すように、この学習データ141は、サンプル番号と、画像データと、上端y座標と、下端y座標と、印面中心x座標と、印面中心y座標と、第1y座標差分と、第2y座標差分とを有する。
【0024】
サンプル番号は、サンプルとなる画像データを識別する情報である。画像データは、スキャナなどによって電子化されたサンプルとなる契約書の画像データである。サンプルとなる契約書には、締結者情報が記載されており、押印済みとする。サンプルとなる契約書の画像データは、「第二の画像データ」に対応する。以下の説明では、特に区別する場合、学習データの画像データを、第二の画像データと表記する。
【0025】
上端y座標は、第二の画像データにおける検出領域の上端のy座標を示す。下端y座標は、第二の画像データにおける検出領域の下端のy座標を示す。印面中心x座標は、第二の画像データにおける印面の中心x座標である。印面中心y座標は、第二の画像データにおける印面の中心y座標である。たとえば、第二の画像データの左上隅の座標を原点とする。
【0026】
第1y座標差分は、印面中心y座標から、上端y座標を減算した差分値である。第2y座標は、下端y座標から、印面中心座標を減算した差分値である。
【0027】
図2の説明に戻る。パターンデータ142は、学習データ141を基にして生成される情報であって、印面の中心座標を基準とする検出領域を示す情報である。パターンデータ142の検出座標は、新規の契約書の画像データにおいて、締結者情報が記載されている可能性の高い領域を示す。
図4は、パターンデータのデータ構造の一例を示す図である。
図4に示すように、パターンデータ142には、第1パターンと、第2パターンとが含まれる。
【0028】
第1パターンには、第1-1y座標差分と、第2-1y座標差分とが設定される。第1-1y座標差分は、学習データ141に格納された各第1y座標差分のうち、最大の第1y座標差分となる。第2-1y座標差分は、学習データ141に格納された各第2y座標差分のうち、最大の第2y座標差分となる。
【0029】
第2パターンには、第1-2y座標差分と、第2-2y座標差分とが設定される。第1-2y座標差分は、学習データ141に格納された各1y座標差分から外れ値を除き、外れ値以外の第1y座標差分のうち、最大の第1y座標差分となる。第2-2y座標差分は、学習データ141に格納された各第2y座標差分から外れ値を除き、外れ値以外の第2y座標差分のうち、最大の第2y座標差分となる。
【0030】
第2パターンは、外れ値を除外する。このため、第1パターンによって特定される検出領域は、第2パターンによって特定される検出領域よりも広くなる。
【0031】
図2の説明に戻る。制御部150は、取得部151と、学習部152と、特定部153と、抽出部154と、文字認識部155とを有する。制御部150は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などによって実現できる。また、制御部150は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのハードワイヤードロジックによっても実現できる。
【0032】
取得部151は、外部装置等から学習データ141を取得する処理部である。取得部151は、取得した学習データ141を記憶部140に格納する。また、取得部151は、スキャナ50から、押印済みの新規の契約書の画像データを取得した場合に、取得した画像データを、特定部153に出力する。押印済みの新規の契約書の画像データは、「第一の画像データ」に対応する。以下の説明では、特に区別する場合、押印済みの新規の契約書の画像データを、第一の画像データと表記する。
【0033】
学習部152は、学習データ141を基にして、パターンデータ142を生成する処理部である。なお、学習データ141に含まれる印面中心y座標(印面中心x座標)は、予め設定されていてもよいし、第二の画像データから印面を特定して、自動で設定してもよい。学習部152は、印面中心y座標を自動で特定した場合には、上端y座標および下端y座標を基にして、第1y座標差分、第2y座標差分を自動で算出してもよい。
【0034】
学習部152が、パターンデータ142の「第1パターン」を学習する処理について説明する。学習部152は、学習データ141の各第1y座標差分を比較し、最大の第1y座標差分を特定する。学習部152は、特定した最大の第1y座標差分を、第1パターンの第1-1y座標差分として学習する。
【0035】
学習部152は、学習データ141の各第2y座標差分を比較し、最大の第2y座標差分を特定する。学習部152は、特定した最大の第2y座標差分を、第1パターンの第2-1y座標差分として学習する。
【0036】
学習部152は、第1-1y座標差分および第2-1y座標差分を、第1パターンとして、パターンデータ142に登録する。
【0037】
続いて、学習部152が、パターンデータ142の「第2パターン」を学習する処理について説明する。学習部152は、学習データ141の全ての第1y座標差分を基にして、第1y座標差分の平均値μ1を算出する。また、学習部152は、学習データ141の全ての第1y座標差分を基にして、第1y座標差分の標準偏差σ1を算出する。
【0038】
学習部152は、学習データ141の全ての第1y座標差分のうち、「μ1-3×σ1」未満となる第1y座標差分と、「μ1+3×σ1」以上となる第1y座標差分とを外れ値として特定する。学習部152は、学習データ141の全ての第1y座標差分から外れ値を除外した第1y座標差分のうち、最大の第1y座標差分を、第2パターンの第2-1y座標差分として学習する。
【0039】
図5は、第1y座標差分のヒストグラムを示す図である。
図5に示すヒストグラムの横軸は、第1y座標差分の値に対応する。ヒストグラムの縦軸は、頻度に対応する。たとえば、範囲30に値が含まれる第1y座標差分の値が、外れ値となる。たとえば、31aに示す値が、第1パターンの第1-1y座標差分の値となる。31bに示す値が、第2パターンの第1-2y座標差分の値となる。
【0040】
学習部152は、学習データ141の全ての第2y座標差分を基にして、第2y座標差分の平均値μ2を算出する。また、学習部152は、学習データ141の全ての第2y座標差分を基にして、第1y座標差分の標準偏差σ2を算出する。
【0041】
学習部152は、学習データ141の全ての第2y座標差分のうち、「μ2-3×σ2」未満となる第2y座標差分と、「μ2+3×σ2」以上となる第2y座標差分とを外れ値として特定する。学習部152は、学習データ141の全ての第2y座標差分から外れ値を除外した第2y座標差分のうち、最大の第2y座標差分を、第2パターンの第2-2y座標差分として学習する。第1y座標差分について、ヒストグラムの説明を省略する。
【0042】
学習部152は、第1-2y座標差分および第2-2y座標差分を、第2パターンとして、パターンデータ142に登録する。
【0043】
学習部152は、上記処理を実行することで、パターンデータ142を学習し、学習したパターンデータ142を、記憶部140に格納する。
【0044】
図2の説明に戻る。特定部153は、第一の画像データから、印面に相当する領域座標を特定する処理部である。たとえば、特定部153は、印鑑の色や形状を定義したテンプレートと、第一の画像データと比較して、印面の領域を特定する。特定部153は、特定した印面の領域の中心座標(x
0、y
0)を特定し、中心座標(x
0、y
0)の情報を、抽出部154に出力する。ただし、領域座標は必ずしも中心座標に限定されるわけではなく、例えば、印面の頂点に対応する座標でも良く、複数の座標を領域座標としても良い。
【0045】
抽出部154は、パターンデータ142を用いて、第一の画像データに含まれる検出領域を抽出する処理部である。抽出部154は、パターンデータ142に含まれる第1パターンまたは第2パターンのいずれか一方を用いて、検出領域を抽出する。第1パターンを用いるのか、第2パターンを用いるのかは、予め設定されているものとする。
【0046】
抽出部154が、第1パターンを用いて、検出領域を抽出する処理の一例について説明する。抽出部154は、印面の中心座標(x0、y0)と、第1-1y座標差分とを基にして、検出領域25の上端を特定する。抽出部154は、印面の中心座標(x0、y0)と、第2-1y座標差分とを基にして、検出領域の下端を特定する。なお、抽出部154は、検出領域のx座標方向の幅を、第一の画像データの幅と同一とする。
【0047】
抽出部154は、第1パターンを用いて、第一の画像データに対して特定した検出領域の情報を、文字認識部155に出力する。
【0048】
図6は、第1パターンの検出例を示す図である。
図6に示すように、印面40の中心座標と、第1パターンとを基にして、検出領域40aが設定される。
【0049】
抽出部154が、第2パターンを用いて、検出領域を抽出する処理の一例について説明する。抽出部154は、印面の中心座標(x0、y0)と、第1-2y座標差分とを基にして、検出領域25の上端を特定する。抽出部154は、印面の中心座標(x0、y0)と、第2-2y座標差分とを基にして、検出領域の下端を特定する。なお、抽出部154は、検出領域のx座標方向の幅を、第一の画像データの幅と同一とする。
【0050】
抽出部154は、第2パターンを用いて、第一の画像データに対して特定した検出領域の情報を、文字認識部155に出力する。
【0051】
図7は、第2パターンの検出例を示す図である。
図7に示すように、印面40の中心座標と、第2パターンとを基にして、検出領域40bが設定される。
【0052】
文字認識部155は、抽出部154によって抽出された検出領域の画像に対して、文字認識を実行することで、締結者情報の文字列を認識する処理部である。文字認識部155は、認識した文字列を、表示部130に出力する。文字認識部155は、ネットワークを介して、文字列の認識結果を、外部装置等に通知してもよい。
【0053】
次に、本実施例に係る画像処理装置100の処理手順の一例について説明する。
図8は、本実施例に係る画像処理装置の学習処理の処理手順を示すフローチャートである。
図8に示すように、画像処理装置100の取得部151は、学習データ141を取得する(ステップS101)。
【0054】
画像処理装置100の学習部152は、学習データ141の各第1y座標差分を比較し、最大となる第1y座標差分を、第1-1座標差分に設定する(ステップS102)。学習部152は、学習データ141の各第2y座標差分を比較し、最大となる第2y座標差分を、第2-1座標差分に設定する(ステップS103)。
【0055】
学習部152は、第1-1y座標差分および第2-1y座標差分を、第1パターンとして、パターンデータ142に登録する(ステップS104)。
【0056】
学習部152は、学習データ141の各第1座標差分を基にして、平均値μ1および標準偏差σ1を算出する(ステップS105)。学習部152は、平均値μ1および標準偏差σ1を基にして、学習データ141の各第1y座標差分から外れ値を除外する(ステップS106)。
【0057】
学習部152は、外れ値を除外した第1y座標差分のうち、最大となる第1y座標差分を、第1-2y座標差分に設定する(ステップS107)。
【0058】
学習部152は、学習データ141の各第2座標差分を基にして、平均値μ2および標準偏差σ2を算出する(ステップS108)。学習部152は、平均値μ2および標準偏差σ2を基にして、学習データ141の各第2y座標差分から外れ値を除外する(ステップS109)。
【0059】
学習部152は、外れ値を除外した第2y座標差分のうち、最大となる第2y座標差分を、第2-2y座標差分に設定する(ステップS110)。
【0060】
学習部152は、第1-2y座標差分および第2-2y座標差分を、第2パターンとして、パターンデータ142に登録する(ステップS111)。
【0061】
図9は、本実施例に係る画像処理装置の画像処理の処理手順を示すフローチャートである。
図9に示すように、画像処理装置100の取得部151は、スキャナ50から第一の画像データを取得する(ステップS201)。
【0062】
画像処理装置100の特定部153は、第一の画像データから、印面の領域を特定する(ステップS202)。特定部153は、印面の中心座標を特定する(ステップS203)。
【0063】
画像処理装置100の抽出部154は、第1パターンを選択する場合には(ステップS204,Yes)、ステップS205に移行する。一方、抽出部154は、第1パターンを選択しない場合には(ステップS204,No)、ステップS207に移行する。
【0064】
ステップS205について説明する。抽出部154は、第1パターンの第1-1y座標差分、第2-1y座標差分をパターンデータ142から取得する(ステップS205)。抽出部154は、第1パターンと印面の中心座標とを基にして、検出領域を抽出する(ステップS206)。
【0065】
画像処理装置100の文字認識部155は、検出領域の画像から、文字列を認識する(ステップS209)。文字認識部155は、認識結果を表示部130に出力する(ステップS210)。
【0066】
ステップS207について説明する。抽出部154は、第2パターンの第1-2y座標差分、第2-2y座標差分をパターンデータ142から取得する(ステップS207)。抽出部154は、第2パターンと印面の中心座標とを基にして、検出領域を抽出し(ステップS208)、ステップS209に移行する。
【0067】
次に、本実施例1に係る画像処理装置100の効果について説明する。画像処理装置100は、契約書の画像データから印面を特定し、パターンデータに定義された印面の中心座標を基準とした検出領域の位置関係を基にして、画像データの検出領域を抽出する。すなわち、画像処理装置は、契約書の書式が未知でも、押印位置と締結者情報の記載位置との位置関係が変わらないことに着目することで、締結者情報が記載された検出領域を効率的に抽出することができる。また、検出領域を効率的に抽出することで、検出領域に記載されているであろう締結者情報を適切に認識することもできる。
【0068】
画像処理装置100は、学習データ141に含まれる各第1y座標差分の最大値と、第2y座標差分の最大値とを基にして、第1パターンを学習する。これによって、画像データから印面を抽出することで、締結者情報の検出領域を特定することが可能となる。
【0069】
画像処理装置100は、学習データ141に含まれる各第1y座標差分から外れ値を除外した残りの第1y座標差分と、各第2y座標差分から外れ値を除外した残りの第2y座標差分とを基にして、第2パターンを学習する。これによって、画像データから印面を抽出することで、締結者情報の検出領域を特定することが可能となる。また、第1パターンの検出領域よりも、検出領域を絞り込むことができる。
【0070】
ここで、第1パターンによって特定した検出領域と、第2パターンによって特定した検出領域とに対して文字認識を実行した場合の認識結果の一例について説明する。
図10は、第1パターンと第2パターンとの比較結果を示す図である。
【0071】
図10に示す例では、印面45の中心座標と、第1パターンとを基にして検出領域45aが設定される。印面46の中心座標と、第1パターンとを基にして検出領域46aが設定される。
図10に示す例では、第1パターンでは、締結者情報を検出しているが、第2パターンでは、締結者情報の一部を検出(検出漏れが発生している)できていない。第1パターンの検出領域は、第2パターンの検出領域よりも大きいため、検出漏れを防ぐことができる。
【0072】
たとえば、発明者が実験を行ったところ、第1パターンの検出領域は、帳票の約4割であり、締結者情報の検出率は100%であった。一方、第2パターンの検出領域は、帳票の約1.5割であり、締結者情報の検出率は97.8%であった。
【0073】
次に、上記実施例に示した画像処理装置100と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。
図11は、実施例の画像処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。
【0074】
図11に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、ユーザからのデータの入力を受け付ける入力装置202と、ディスプレイ203とを有する。また、コンピュータ200は、記憶媒体からプログラム等を読み取る読み取り装置204と、有線または無線ネットワークを介して、スキャナ50、外部装置等との間でデータの授受を行う通信装置205とを有する。また、コンピュータ200は、各種情報を一時記憶するRAM206と、ハードディスク装置207とを有する。そして、各装置201~207は、バス208に接続される。
【0075】
ハードディスク装置207は、取得プログラム207a、学習プログラム207b、特定プログラム207c、抽出プログラム207d、文字認識プログラム207eを有する。また、CPU201は、各プログラム207a~207eを読み出してRAM206に展開する。
【0076】
取得プログラム207aは、取得プロセス206aとして機能する。学習プログラム207bは、学習プロセス206bとして機能する。特定プログラム207cは、特定プロセス206cとして機能する。抽出プログラム207dは、抽出プロセス206dとして機能する。文字認識プログラム207eは、文字認識プロセス206eとして機能する。
【0077】
取得プロセス206aの処理は、取得部151の処理に対応する。学習プロセス206bの処理は、学習部152の処理に対応する。特定プロセス206cの処理は、特定部153の処理に対応する。抽出プロセス206dの処理は、抽出部154の処理に対応する。文字認識プロセス206eの処理は、文字認識部155の処理に対応する。
【0078】
なお、各プログラム207a~207eについては、必ずしも最初からハードディスク装置207に記憶させておかなくても良い。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD-ROM、DVD、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ200が各プログラム207a~207eを読み出して実行するようにしてもよい。
【0079】
以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。
【0080】
(付記1)コンピュータに、
押印済の契約書の書面が電子的に読み込まれることにより生成された画像データを処理対象として、前記画像データから、印面に相当する領域を特定し、
予め記憶装置に記憶された、契約書の印面位置に対応する契約書内の第1の領域と、契約を締結した人物に関する情報が記載される契約書内の第2の領域との位置関係を参照し、処理対象である前記画像データから特定した前記印面の領域と前記位置関係とに基づいて特定される領域を、処理対象である前記画像データから抽出し、
抽出した前記領域を出力する
処理を実行させることを特徴とする画像処理方法。
【0081】
(付記2)押印済の契約書の書面が電子的に読み込まれることにより生成された複数の画像データを有する学習データを基にして、前記第1の領域と、前記第2の領域との位置関係を学習し、学習結果を前記記憶装置に記憶させる処理を更に実行させることを特徴とする付記1に記載の画像処理方法。
【0082】
(付記3)前記学習する処理は、前記第1の領域として特定される座標と前記第2の領域として特定される座標との差分値を、画像データ毎に算出し、算出した差分値のうち、最大の差分値を、前記位置関係として学習することを特徴とする付記2に記載の画像処理方法。
【0083】
(付記4)前記学習する処理は、前記第1の領域として特定される座標と前記第2の領域として特定される座標との差分値を、画像データ毎に算出し、算出した複数の差分値を基にして、差分値の外れ値を算出し、前記複数の差分値から前記外れ値を除外した差分値を基にして、前記位置関係を学習することを特徴とする付記2に記載の画像処理方法。
【0084】
(付記5)コンピュータに、
押印済の契約書の書面が電子的に読み込まれることにより生成された画像データを処理対象として、前記画像データから、印面に相当する領域を特定し、
予め記憶装置に記憶された、契約書の印面位置に対応する契約書内の第1の領域と、契約を締結した人物に関する情報が記載される契約書内の第2の領域との位置関係を参照し、処理対象である前記画像データから特定した前記印面の領域と前記位置関係とに基づいて特定される領域を、処理対象である前記画像データから抽出し、
抽出した前記領域を出力する
処理を実行させることを特徴とする画像処理プログラム。
【0085】
(付記6)押印済の契約書の書面が電子的に読み込まれることにより生成された複数の画像データを有する学習データを基にして、前記第1の領域と、前記第2の領域との位置関係を学習し、学習結果を前記記憶装置に記憶させる処理を更に実行させることを特徴とする付記5に記載の画像処理プログラム。
【0086】
(付記7)前記学習する処理は、前記第1の領域として特定される座標と前記第2の領域として特定される座標との差分値を、画像データ毎に算出し、算出した差分値のうち、最大の差分値を、前記位置関係として学習することを特徴とする付記6に記載の画像処理プログラム。
【0087】
(付記8)前記学習する処理は、前記第1の領域として特定される座標と前記第2の領域として特定される座標との差分値を、画像データ毎に算出し、算出した複数の差分値を基にして、差分値の外れ値を算出し、前記複数の差分値から前記外れ値を除外した差分値を基にして、前記位置関係を学習することを特徴とする付記6に記載の画像処理プログラム。
【0088】
(付記9)押印済の契約書の書面が電子的に読み込まれることにより生成された画像データを処理対象として、前記画像データから、印面に相当する領域を特定する特定部と、
予め記憶装置に記憶された、契約書の印面位置に対応する契約書内の第1の領域と、契約を締結した人物に関する情報が記載される契約書内の第2の領域との位置関係を参照し、処理対象である前記画像データから特定した前記印面の領域と前記位置関係とに基づいて特定される領域を処理対象である前記画像データから抽出し、抽出した前記領域を出力する抽出部と
を有することを特徴とする画像処理装置。
【0089】
(付記10)押印済の契約書の書面が電子的に読み込まれることにより生成された複数の画像データを有する学習データを基にして、前記第1の領域と、前記第2の領域との位置関係を学習し、学習結果を前記記憶装置に記憶させる学習部を更に有することを特徴とする付記9に記載の画像処理装置。
【0090】
(付記11)前記学習部は、前記第1の領域として特定される座標と前記第2の領域として特定される座標との差分値を、画像データ毎に算出し、算出した差分値のうち、最大の差分値を、前記位置関係として学習することを特徴とする付記10に記載の画像処理装置。
【0091】
(付記12)前記学習部は、前記第1の領域として特定される座標と前記第2の領域として特定される座標との差分値を、画像データ毎に算出し、算出した複数の差分値を基にして、差分値の外れ値を算出し、前記複数の差分値から前記外れ値を除外した差分値を基にして、前記位置関係を学習することを特徴とする請求項10に記載の画像処理装置。
【符号の説明】
【0092】
50 スキャナ
100 画像処理装置
110 通信部
120 入力部
130 表示部
140 記憶部
141 学習データ
142 パターンデータ
150 制御部
151 取得部
152 学習部
153 特定部
154 抽出部
155 文字認識部