(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-11
(45)【発行日】2023-12-19
(54)【発明の名称】情報処理装置及び情報処理プログラム
(51)【国際特許分類】
G06V 30/14 20220101AFI20231212BHJP
G06T 7/00 20170101ALI20231212BHJP
【FI】
G06V30/14 340J
G06T7/00 570
G06T7/00 590
(21)【出願番号】P 2019209447
(22)【出願日】2019-11-20
【審査請求日】2022-10-20
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】100115129
【氏名又は名称】清水 昇
(74)【代理人】
【識別番号】100102716
【氏名又は名称】在原 元司
(74)【代理人】
【識別番号】100122275
【氏名又は名称】竹居 信利
(72)【発明者】
【氏名】小林 邦彦
(72)【発明者】
【氏名】久保 周作
(72)【発明者】
【氏名】上野 邦和
【審査官】伊知地 和之
(56)【参考文献】
【文献】特開2002-245461(JP,A)
【文献】特開2017-049976(JP,A)
【文献】特開2019-040467(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/14
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
メモリと一又は複数のプロセッサを備え、
前記メモリは、対象画像と予め定められた位置関係にある項目の情報を抽出するための規則を記憶しており、
前記プロセッサは、
画像から対象画像を抽出し、
前記規則を用いて、抽出した対象画像と予め定められた位置関係にある項目の情報を抽出
し、
前記対象画像を印影画像とし、
前記項目の情報を署名又は記名の文字認識結果とし、
前記メモリは、さらに、印鑑の印影画像と該印鑑の所有者を対応させて記憶しており、
前記プロセッサは、
前記画像内の文字画像の全て又は一部を文字認識し、
抽出した印影画像と予め定められた位置関係にある文字画像の文字認識結果を署名又は記名として抽出し、
抽出した文字認識結果が、前記メモリ内の印影画像に対応する所有者と一致するか否かについての判断結果を、表示装置に表示させるように制御する、
情報処理装置。
【請求項2】
前記プロセッサは、さらに、
抽出した文字認識結果が、前記メモリ内の印影画像に対応する所有者に一致しない場合は、該所有者に対して通知を行う、
請求項
1に記載の情報処理装置。
【請求項3】
前記対象画像を印影画像とし、
前記項目の情報を署名画像とし、
前記メモリは、さらに、印鑑の印影画像と該印鑑の所有者による署名画像を対応させて記憶しており、
前記プロセッサは、
抽出した印影画像と予め定められた位置関係にある文字画像を署名画像として抽出し、
抽出した印影画像と文字画像が、前記メモリ内の印影画像と署名画像と一致するか否かについての判断結果を、表示装置に表示させるように制御する、
請求項1に記載の情報処理装置。
【請求項4】
前記プロセッサは、さらに、
抽出した署名画像が、前記メモリ内の印影画像に対応する署名画像に一致しない場合は、前記所有者、又は、抽出した署名画像を文字認識した結果である署名者に対して通知を行う、
請求項
3に記載の情報処理装置。
【請求項5】
前記規則は、前記対象画像と前記項目の位置関係の他に、さらに、前記対象画像の大きさと前記項目の領域の大きさの関係、前記項目に記載されている文字の属性の指定、前記項目に記載されている文字画像の文字認識結果、のうちいずれか1つ、又は、これらの組み合わせによって構成されている、
請求項1から
4のいずれか1項に記載の情報処理装置。
【請求項6】
メモリと一又は複数のプロセッサを備え、
前記メモリは、対象画像と予め定められた位置関係にある項目の情報を抽出するための規則を記憶している、
コンピュータに、
画像から対象画像を抽出し、
前記規則を用いて、抽出した対象画像と予め定められた位置関係にある項目の情報を抽出
し、
前記対象画像を印影画像とし、
前記項目の情報を署名又は記名の文字認識結果とし、
前記メモリは、さらに、印鑑の印影画像と該印鑑の所有者を対応させて記憶しており、
前記コンピュータは、
前記画像内の文字画像の全て又は一部を文字認識し、
抽出した印影画像と予め定められた位置関係にある文字画像の文字認識結果を署名又は記名として抽出し、
抽出した文字認識結果が、前記メモリ内の印影画像に対応する所有者と一致するか否かについての判断結果を、表示装置に表示させるように制御する、
処理を実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、画像を含んだ情報を効率的かつ適確に検索し得る情報検索方法および情報検索プログラムを記録した記録媒体を提供することを課題とし、自動情報収集装置でWWW上の画像を含むデータを収集し、この収集データの特徴量を特徴量抽出装置で抽出し、単語抽出装置で画像情報の近傍の単語を抽出し、各単語に対して画像に近い順に高い点数を付与し、データと単語とをそれぞれのデータ特徴量と点数とに対応付けてデータベースに格納し、検索時は、キー画像の特徴量を抽出し、データベース内のデータの特徴量から近似順位を求め、キー画像とキーワードに対してデータベース内の画像とキー画像の近似順位およびキーワードとデータベース内の単語との一致したものとその点数からキーワードに関係する画像を順位付けし、該順位に基づいて検索結果を得ることが開示されている。
【0003】
特許文献2には、文書画像からの情報項目の値の抽出を容易にすることを課題とし、文書情報DBには、文書画像から抽出すべき各項目の項目名と、文書画像中でのその項目名に対する項目値が存在すべき相対位置とが登録され、項目名抽出部は、文書画像に対する文字認識結果から、抽出すべき項目の項目名に該当する文字列を求め、項目値抽出部は、求められた項目名に対し、項目値が存在すべき相対位置にある文字列を、その項目名に対する項目値として抽出することが開示されている。
【0004】
特許文献3には、フォーマットが未知の画像から、効率よく高速に文字認識処理による情報の抽出を行う情報処理装置を提供することを課題とし、情報処理装置は、画像を領域解析することにより領域を抽出し、特定のキーワードと当該キーワードに対応するバリューとを抽出するためのルールを取得し、ルールを用いてキーワードを含む領域および当該キーワードに対応するバリューを含む領域を特定する順番を、当該ルールに含まれる前記キーワードと当該キーワードに対応するバリューとが取り得る値に応じて決定し、決定された順番に従い、キーワードを含む領域または当該キーワードに対応するバリューを含む領域を抽出された領域の中から特定し、特定された領域に対して文字認識処理を行い、その後、決定された順番に従い、先に特定した領域に基づいて、対応するもう一方の領域を特定することが開示されている。
【先行技術文献】
【特許文献】
【0005】
【文献】特開平11-224256号公報
【文献】特開2007-233913号公報
【文献】特開2018-128996号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
画像から対象情報と関連する項目の情報を抽出する情報処理装置において、キーとなる対象情報を文字認識結果であるテキストとした構成では、対象情報が文字認識できない画像である場合に関連する項目の情報を抽出することができない。そこで本発明は、対象情報が画像である場合に、その対象情報である画像と予め定められた位置関係にある項目の情報を抽出することができる情報処理装置及び情報処理プログラムを提供することを目的としている。
【課題を解決するための手段】
【0007】
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。なお、以下の「請求項」とあるのは、出願当初の請求項である。
請求項1の発明は、メモリと一又は複数のプロセッサを備え、前記メモリは、対象画像と予め定められた位置関係にある項目の情報を抽出するための規則を記憶しており、前記プロセッサは、画像から対象画像を抽出し、前記規則を用いて、抽出した対象画像と予め定められた位置関係にある項目の情報を抽出する、情報処理装置である。
【0008】
請求項2の発明は、前記対象画像を印影画像とし、前記項目の情報を署名又は記名の文字認識結果とし、前記メモリは、さらに、印鑑の印影画像と該印鑑の所有者を対応させて記憶しており、前記プロセッサは、前記画像内の文字画像の全て又は一部を文字認識し、抽出した印影画像と予め定められた位置関係にある文字画像の文字認識結果を署名又は記名として抽出し、抽出した文字認識結果が、前記メモリ内の印影画像に対応する所有者と一致するか否かについての判断結果を、表示装置に表示させるように制御する、請求項1に記載の情報処理装置である。
【0009】
請求項3の発明は、前記プロセッサは、さらに、抽出した文字認識結果が、前記メモリ内の印影画像に対応する所有者に一致しない場合は、該所有者に対して通知を行う、請求項2に記載の情報処理装置である。
【0010】
請求項4の発明は、前記対象画像を印影画像とし、前記項目の情報を署名画像とし、前記メモリは、さらに、印鑑の印影画像と該印鑑の所有者による署名画像を対応させて記憶しており、前記プロセッサは、抽出した印影画像と予め定められた位置関係にある文字画像を署名画像として抽出し、抽出した印影画像と文字画像が、前記メモリ内の印影画像と署名画像と一致するか否かについての判断結果を、表示装置に表示させるように制御する、請求項1に記載の情報処理装置である。
【0011】
請求項5の発明は、前記プロセッサは、さらに、抽出した署名画像が、前記メモリ内の印影画像に対応する署名画像に一致しない場合は、前記所有者、又は、抽出した署名画像を文字認識した結果である署名者に対して通知を行う、請求項4に記載の情報処理装置である。
【0012】
請求項6の発明は、前記規則は、前記対象画像と前記項目の位置関係の他に、さらに、前記対象画像の大きさと前記項目の領域の大きさの関係、前記項目に記載されている文字の属性の指定、前記項目に記載されている文字画像の文字認識結果、のうちいずれか1つ、又は、これらの組み合わせによって構成されている、請求項1から5のいずれか1項に記載の情報処理装置である。
【0013】
請求項7の発明は、メモリと一又は複数のプロセッサを備え、前記メモリは、対象画像と予め定められた位置関係にある項目の情報を抽出するための規則を記憶している、コンピュータに、画像から対象画像を抽出し、前記規則を用いて、抽出した対象画像と予め定められた位置関係にある項目の情報を抽出する、処理を実行させるための情報処理プログラムである。
【発明の効果】
【0014】
請求項1の情報処理装置によれば、対象情報が画像である場合に、その対象情報である画像と予め定められた位置関係にある項目の情報を抽出することができる。
【0015】
請求項2の情報処理装置によれば、対象画像を印影画像とし、項目の情報を署名又は記名の文字認識結果とした場合に、文字認識結果が、印鑑の所有者と一致するか否かについて、ユーザーは知ることができる。
【0016】
請求項3の情報処理装置によれば、文字認識結果が、印鑑の所有者に一致しない場合は、その所有者に対して通知を行うことができる。
【0017】
請求項4の情報処理装置によれば、対象画像を印影画像とし、項目の情報を署名画像とし、印影画像と署名画像が、メモリ内の印影画像と署名画像と一致するか否かについて、ユーザーは知ることができる。
【0018】
請求項5の情報処理装置によれば、署名画像が、メモリ内の印影画像に対応する署名画像に一致しない場合は、印鑑の所有者、又は、抽出した署名画像を文字認識した結果である署名者に対して通知を行うことができる。
【0019】
請求項6の情報処理装置によれば、規則として、対象画像と項目の位置関係の他に、さらに、対象画像の大きさと項目の領域の大きさの関係、項目に記載されている文字の属性の指定、項目に記載されている文字画像の文字認識結果、のうちいずれか1つ、又は、これらの組み合わせを用いることができる。
【0020】
請求項7の情報処理プログラムによれば、対象情報が画像である場合に、その対象情報である画像と予め定められた位置関係にある項目の情報を抽出することができる。
【図面の簡単な説明】
【0021】
【
図1】第1の実施の形態の構成例についての概念的なモジュール構成図である。
【
図2】第1の実施の形態を利用したシステム構成例を示す説明図である。
【
図3】第1の実施の形態が処理対象とする文書の例を示す説明図である。
【
図4】バリュー抽出規則テーブルのデータ構造例を示す説明図である。
【
図5】第1の実施の形態による処理例を示すフローチャートである。
【
図6】画像情報テーブルのデータ構造例を示す説明図である。
【
図7】画像・文字処理結果テーブルのデータ構造例を示す説明図である。
【
図8】第1の実施の形態による処理例を示すフローチャートである。
【
図9】第1の実施の形態による処理例を示すフローチャートである。
【
図10】第1の実施の形態による表示例を示す説明図である。
【
図11】第2の実施の形態の構成例についての概念的なモジュール構成図である。
【
図12】第2の実施の形態を利用したシステム構成例を示す説明図である。
【
図13】第2の実施の形態が処理対象とする文書の例を示す説明図である。
【
図14】第2の実施の形態による処理例を示すフローチャートである。
【
図15】印鑑情報テーブルのデータ構造例を示す説明図である。
【
図16】署名印鑑処理結果テーブルのデータ構造例を示す説明図である。
【
図17】第2の実施の形態による処理例を示す説明図である。
【
図18】第2の実施の形態による処理例を示すフローチャートである。
【
図19】第2の実施の形態による処理例を示すフローチャートである。
【
図20】第2の実施の形態による表示例を示す説明図である。
【
図21】第2の実施の形態による処理例を示すフローチャートである。
【
図22】第2の実施の形態による処理例を示すフローチャートである。
【
図23】印鑑情報テーブルのデータ構造例を示す説明図である。
【
図24】第2の実施の形態による処理例を示すフローチャートである。
【
図25】本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
【発明を実施するための形態】
【0022】
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(「ソフトウェア」の解釈として、コンピュータ・プログラムを含む)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(例えば、コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(例えば、データの授受、指示、データ間の参照関係、ログイン等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(「2以上の値」には、もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。また、「A、B、C」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その1つのみを選んでいる場合(例えば、Aのみ)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(「ネットワーク」には、一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(つまり、社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスクドライブ、RAM(Random Access Memoryの略)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unitの略)内のレジスタ等を含んでいてもよい。
【0023】
本実施の形態である画像処理装置100は、対象画像と関連する項目の情報を抽出することができる機能を有しており、
図1の例に示すように、画像処理装置100は、UI処理モジュール105、情報登録モジュール110、情報記憶モジュール115、画像・文字認識処理モジュール120、スキャン処理モジュール125、画像処理モジュール130、画像認識処理モジュール135、文字認識処理モジュール140、結果保存モジュール145、結果情報記憶モジュール150、確認モジュール155を有している。
ここで「対象画像」は、文書画像内にある画像であって、キーとなり得る画像である。なお、「キー」とは、画像から項目の情報を抽出するための手がかりとなる情報である。したがって、対象画像には、同じ文書画像内に関連する項目がある。「対象画像」として、例えば、印影画像、顔画像、商品画像等がある。
【0024】
UI処理モジュール105は、情報登録モジュール110、画像・文字認識処理モジュール120、確認モジュール155と接続されている。UI処理モジュール105は、画像処理装置100のユーザーインタフェースの機能を有する。例えば、対象となる画像又は画像・文字認識処理モジュール120による処理結果等を表示装置に表示し、画像・文字認識処理モジュール120による処理結果等の修正の操作等を受け付ける。表示装置として、例えば、液晶ディスプレイ、有機EL(Electro-Luminescenceの略)等であってもよいし、タッチパネル等を制御して、表示を行うようにしてもよいし、操作者が有している携帯通信機器と通信(主に無線通信)を行って、その携帯通信機器に表示させるようにしてもよい。また、表示装置への表示の他に、スピーカーによる音声出力、触覚デバイスを用いた触感によって、ユーザーへのメッセージを提示するようにしてもよい。操作等を受け付ける方法として、マウス、キーボード、カメラ、マイク等を用いたユーザーの操作(視線、ジェスチャ、音声等も含む)を受け付けるようにしてもよいし、、また、前述したように、タッチパネル等を制御して、操作を受け付けるようにしてもよいし、操作者が有している携帯通信機器と通信(主に無線通信)を行って、その携帯通信機器における操作を受け付けるようにしてもよい。
【0025】
情報登録モジュール110は、UI処理モジュール105、情報記憶モジュール115と接続されている。情報登録モジュール110は、対象となり得る画像に関する情報、対象画像と予め定められた位置関係にある項目の情報を抽出するための規則を、情報記憶モジュール115に記憶させる。例えば、UI処理モジュール105が受け付けたユーザーの操作に応じて、それらの情報を情報記憶モジュール115に記憶させる。
【0026】
「対象となり得る画像に関する情報」とは、画像を本実施の形態において一意に識別するための情報とその画像との組み合わせの情報である。「対象となり得る画像に関する情報」として、例えば、画像情報テーブル600がある。
図6は、画像情報テーブル600のデータ構造例を示す説明図である。画像情報テーブル600は、画像ID欄605、画像欄610を有している。画像ID欄605は、本実施の形態において、画像を一意に識別するための情報(具体的には、画像ID:IDentificationの略)を記憶している。画像欄610は、画像を記憶している。例えば、画像情報テーブル600の1行目は、画像ID:G0011は、画像「image11」であることを示しており、2行目は、画像ID:G0012は、画像「image12」であることを示している。画像欄610には、画像そのものを記憶していてもよいし、その画像が記憶されているURL(Uniform Resource Locatorの略)等であってもよいし、その画像を認識するために必要な特徴を記憶するようにしてもよい。
【0027】
「対象画像と予め定められた位置関係にある項目の情報を抽出するための規則」とは、キーとなる画像の位置とその画像に関連する項目がある位置との関係を規定した情報である。例えば、バリュー抽出規則テーブル400がある。
図4は、バリュー抽出規則テーブル400のデータ構造例を示す説明図である。バリュー抽出規則テーブル400は、ルールID欄405、キー欄410、バリュー抽出規則欄415を有している。ルールID欄405は、本実施の形態において、ルールを一意に識別するための情報(具体的には、ルールID)を記憶している。キー欄410は、キーを記憶している。バリュー抽出規則欄415は、バリュー抽出規則を記憶している。例えば、バリュー抽出規則テーブル400の1行目は、ルールID:GR0001は、キーが「顔画像」であり、バリュー抽出規則が「顔画像の右側にある領域」であることを示しており、2行目は、ルールID:SR1111は、キーが「印影画像」であり、バリュー抽出規則が「正立の印影画像の左側にある署名領域」であることを示している。
【0028】
また、規則は、対象画像と項目の位置関係の他に、さらに、対象画像の大きさと項目の領域の大きさの関係、項目に記載されている文字の属性の指定、項目に記載されている文字画像の文字認識結果、のうちいずれか1つ、又は、これらの組み合わせによって構成されていてもよい。
「文字の属性の指定」の規則とは、文字における表示形態を示すものであって、例えば、下線が引かれているか否か、文字の大きさ、文字の書体、文字の色等の指定が該当する。
「文字画像の文字認識結果」の規則とは、項目として抽出される文字画像を文字認識した結果のテキストであって、例えば、日付を除く、予め定められた文字列であること、又は、予め定められた文字列を除く等が該当する。
【0029】
情報記憶モジュール115は、情報登録モジュール110、画像認識処理モジュール135と接続されている。情報記憶モジュール115は、対象画像と予め定められた位置関係にある項目の情報を抽出するための規則を少なくとも記憶している。例えば、前述したバリュー抽出規則テーブル400を記憶している。さらに、画像情報テーブル600等を記憶していてもよい。
【0030】
画像・文字認識処理モジュール120は、UI処理モジュール105、スキャン処理モジュール125と接続されている。画像・文字認識処理モジュール120は、スキャン処理モジュール125、画像処理モジュール130、画像認識処理モジュール135、文字認識処理モジュール140を制御して、画像からの対象となる画像の認識処理と抽出処理、そして、その抽出した画像内の文字の認識処理を行わせる。
【0031】
スキャン処理モジュール125は、画像・文字認識処理モジュール120、画像処理モジュール130と接続されている。スキャン処理モジュール125は、対象画像が含まれている画像を取得する。例えば、画像読取装置で画像を読み取ってもよいし、カメラ等で画像を撮影してもよい。また、画像が蓄積されている画像蓄積装置から画像を取得するようにしてもよい。なお、画像には、文書の画像が含まれる。
画像処理モジュール130は、スキャン処理モジュール125、画像認識処理モジュール135、文字認識処理モジュール140、結果保存モジュール145と接続されている。画像処理モジュール130は、スキャン処理モジュール125によって取得された画像に対して、画像認識処理モジュール135、文字認識処理モジュール140を用いて、対象画像の抽出処理を行い、抽出した対象画像と予め定められた位置関係にある項目の情報を抽出する。ここで項目の情報として、文字認識処理モジュール140による文字認識結果が該当する。そして、この処理結果を結果保存モジュール145に渡す。
【0032】
画像認識処理モジュール135は、情報記憶モジュール115、画像処理モジュール130と接続されている。画像認識処理モジュール135は、スキャン処理モジュール125によって取得された画像から、情報記憶モジュール115に記憶されている対象画像を抽出する。そして、抽出した対象画像を画像処理モジュール130に渡す。
また、情報記憶モジュール115に記憶されている規則を用いて、抽出した対象画像と予め定められた位置関係にある項目の画像を抽出する。抽出した項目の画像を、文字認識処理モジュール140に渡す。
例えば、対象画像が顔画像である場合は、情報記憶モジュール115内の顔画像とのパターンマッチング処理で、その顔画像を抽出するようにしてもよいし、情報記憶モジュール115内の顔画像の特徴を用いて、顔認識処理を行って、その顔画像を抽出するようにしてもよい。顔認識処理として、人工知能による顔認識等の既存の技術を用いればよい。
【0033】
文字認識処理モジュール140は、画像処理モジュール130と接続されている。文字認識処理モジュール140は、画像認識処理モジュール135によって抽出された項目の画像を対象として、文字認識処理を行う。そして、文字認識結果を画像処理モジュール130に渡す。
【0034】
確認モジュール155は、UI処理モジュール105、結果保存モジュール145と接続されている。確認モジュール155は、画像処理モジュール130による処理結果である、(1)画像から抽出した対象画像、(2)その対象画像と予め定められた位置関係にある項目の情報を、ユーザーに確認させる。そして、ユーザーが誤りを発見した場合は、ユーザーの操作に応じて修正が行われる。例えば、抽出した対象画像を表示することによって、その対象画像の確認が行われ、誤りがある場合はユーザーの操作によって対象画像の抽出が行われる。同様に、文字認識結果を表示することによって、その文字認識結果の確認が行われ、誤りがある場合はユーザーの操作によって文字の修正が行われる。
【0035】
結果保存モジュール145は、画像処理モジュール130、結果情報記憶モジュール150、確認モジュール155と接続されている。結果保存モジュール145は、画像処理モジュール130による処理結果である、(1)画像から抽出した対象画像、(2)その対象画像と予め定められた位置関係にある項目の情報を、結果情報記憶モジュール150に記憶させる。そして、確認モジュール155の処理のために、結果情報記憶モジュール150内の情報を読み出して、確認モジュール155に渡す。
【0036】
結果情報記憶モジュール150は、結果保存モジュール145と接続されている。結果情報記憶モジュール150は、画像処理モジュール130による処理結果を記憶する。例えば、画像・文字処理結果テーブル700を記憶する。
図7は、画像・文字処理結果テーブル700のデータ構造例を示す説明図である。画像・文字処理結果テーブル700は、文書ID欄705、文書名欄710、説明文認識結果欄715、画像ID欄720、処理日欄725を有している。文書ID欄705は、本実施の形態において、文書を一意に識別するための情報(具体的には、文書ID)を記憶している。文書名欄710は、文書名を記憶している。説明文認識結果欄715は、文字認識処理モジュール140による文字認識結果である説明文認識結果を記憶している。画像ID欄720は、画像認識処理モジュール135によって抽出された画像の画像IDを記憶している。画像情報テーブル600の画像ID欄605に対応するものである。処理日欄725は、画像処理モジュール130による処理が行われた日時(年、月、日、時、分、秒、秒以下、又はこれらの組み合わせであってもよい)を記憶している。例えば、画像・文字処理結果テーブル700の1行目は、文書ID:D1111は、文書名が「所員リスト」であり、説明文認識結果が「富士太郎 XXX研究G」であり、画像IDが「G0011」であり、処理日が「2019/10/1」であることを示しており、2行目は、文書ID:D1111は、文書名が「所員リスト」であり、説明文認識結果が「富士二郎 YYY研究G」であり、画像IDが「G0012」であり、処理日が「2019/10/1」であることを示している。
【0037】
図2は、第1の実施の形態を利用したシステム構成例を示す説明図である。
図1の例に示した画像処理装置100は、単独のスタンドアロンとして処理を行うようにしてもよいし、通信回線に接続されて、他のユーザー端末250から利用されるようにしてもよい。
画像処理装置100A、画像処理装置100B、画像情報等登録サーバー210、ユーザー端末250は、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、画像処理装置100による機能は、クラウドサービスとして実現してもよい。また、ユーザー端末250と画像処理装置100又は画像情報等登録サーバー210との接続は、ユーザー端末250内のWEBブラウザによって行われるようにしてもよい。
画像情報等登録サーバー210は、情報記憶モジュール115、結果情報記憶モジュール150を有している。情報記憶モジュール115、結果情報記憶モジュール150は、
図1の例に示すように画像処理装置100に内蔵されていてもよいし、
図2の例に示すように、画像処理装置100の外部の画像情報等登録サーバー210にあり、通信回線290を介して、画像処理装置100に情報記憶モジュール115、結果情報記憶モジュール150の機能を提供するようにしてもよい。
【0038】
例えば、画像処理装置100のスキャナで、文書が読み込まれる。そして、画像処理装置100によって、その文書の画像から対象画像を抽出し、抽出したその対象画像と予め定められた位置関係にある項目の情報を抽出することが行われる。その処理結果が画像情報等登録サーバー210に記憶される。そして、ユーザーがユーザー端末250を操作して、画像情報等登録サーバー210内の処理結果を表示し、確認と修正が行われる。
【0039】
図3は、第1の実施の形態が処理対象とする文書の例を示す説明図である。
画像処理装置100のスキャナによって読み込まれる文書の一例である。
文書300は、タイトル310、画像320a、説明領域330a、画像320b、説明領域330b、画像320c、説明領域330cを有している。例えば、画像320がユーザーの顔画像であり、説明領域330にはそのユーザーの氏名等の説明文が記載されている。また、画像320が商品画像であり、説明領域330にはその商品の性能等の説明文が記載されている。
ここで、画像320が対象画像である。そして、画像320が顔画像である場合、
図4の例に示しているバリュー抽出規則テーブル400の1行目の規則を用いた場合、説明領域330が「顔画像の右側にある領域」が該当する。そして、説明領域330内を文字認識した結果が項目の情報に該当する。
【0040】
図5は、第1の実施の形態による処理例を示すフローチャートである。
ステップS500では、画像・文字認識処理を開始する。
ステップS502では、文書のスキャンを実施する。
ステップS504では、画像認識処理を行う。具体的には、文書の画像から対象画像の抽出処理を行う。例えば、
図6に示す画像情報テーブル600内の画像欄610内の画像を、スキャンした文書の画像から抽出する。
【0041】
ステップS506では、文字認識処理をしていない対象画像はあるか否かを判断し、ある場合はステップS508へ進み、それ以外の場合は処理を終了する(ステップS599)。
ステップS508では、文字認識処理を行う。ステップS508の詳細な処理については、
図8の例に示すフローチャートを用いて後述する。
ステップS510では、画像と文字の認識結果を情報記憶モジュール115に記憶させ、ステップS506へ戻る。例えば、
図7に示す画像・文字処理結果テーブル700を情報記憶モジュール115に記憶させる。
【0042】
図8は、第1の実施の形態による処理例を示すフローチャートである。
ステップS800では、文字認識処理を開始する。
ステップS802では、文書画像内の対象の顔画像の位置を抽出する。
ステップS804では、「顔画像の右側にある領域」というバリュー抽出規則を用いて、顔画像に対応する説明領域を抽出する。具体的には、
図4の例に示したバリュー抽出規則テーブル400の1行目のバリュー抽出規則欄415内の規則を用いることになる。
【0043】
ステップS806では、ステップS804で抽出した説明領域の画像を文字認識する。
ステップS808では、顔画像をキーとして、説明領域の文字認識結果をバリューとする。具体的には、
図7の例に示した画像・文字処理結果テーブル700の画像ID欄720内の画像IDが示す画像がキーとなり、説明文認識結果欄715内の文字認識結果がバリューとなる。
【0044】
図9は、第1の実施の形態による処理例を示すフローチャートである。
ステップS900では、確認処理を開始する。
ステップS902では、結果情報記憶モジュール150から画像・文字処理結果テーブル700を取得する。
ステップS904では、処理済みの文書の一覧を表示する。画像・文字処理結果テーブル700の文書名欄710を利用して、例えば、
図10(a)に示す文書リスト画面1000を表示する。
図10は、第1の実施の形態による表示例を示す説明図である。文書リスト画面1000には、文書名欄1005、確認実施欄1010、結果欄1015、日付欄1020を表示する。文書名欄1005には、文書名を表示する。確認実施欄1010には、確認の実施が済んでいるか否かの情報を表示する。結果欄1015には、その確認の結果を表示する。日付欄1020には、その確認が行われた日付を表示する。
【0045】
ステップS906では、ユーザーが確認をすべき文書を指示する。
ステップS908では、指示された文書の顔画像と説明文を表示して、確認処理をユーザーに行わせる確認画面1050を表示する。例えば、ステップS906で
図10(a)に示す文書リスト画面1000の1行目が指示された場合の例を、
図10(b)に示す確認画面1050のように表示する。確認画面1050には、文書名欄1055、顔画像欄1060、説明欄1065、チェック欄1070a、チェック欄1070bを表示する。文書名欄1055には、文書名を表示する。顔画像欄1060は、「所員リスト」という文書の画像から抽出した対象画像である顔画像を表示する。説明欄1065は、その顔画像に対応する説明領域内に記載された説明の文字認識結果を表示する。そして、各行には、チェック欄1070が対応しており、ユーザーは文書名欄1055、顔画像欄1060、説明欄1065を確認する。
ステップS910では、ユーザーが確認結果を入力する。文書名欄1055、顔画像欄1060、説明欄1065の確認の結果、誤りがなければチェック欄1070をチェックする。また、誤りを発見した場合は、例えば、顔画像の抽出操作、又は、文字認識結果の修正を行い、チェック欄1070をチェック
ステップS912では、確認結果を用いて、画像・文字処理結果テーブル700を更新する。
【0046】
図11は、第2の実施の形態の構成例についての概念的なモジュール構成図である。
画像処理装置1100は、UI処理モジュール1105、印鑑情報登録モジュール1110、印鑑情報記憶モジュール1115、署名印影認識処理モジュール1120、スキャン処理モジュール1125、画像処理モジュール1130、印影認識処理モジュール1135、署名認識処理モジュール1140、署名印影結果保存モジュール1145、署名印影結果情報記憶モジュール1150、署名印影確認モジュール1155を有している。第2の実施の形態である画像処理装置1100は、第1の実施の形態である画像処理装置100による対象画像を印影画像に限定して処理を行うものである。UI処理モジュール1105、印鑑情報登録モジュール1110、印鑑情報記憶モジュール1115、署名印影認識処理モジュール1120、スキャン処理モジュール1125、画像処理モジュール1130、印影認識処理モジュール1135、署名認識処理モジュール1140、署名印影結果保存モジュール1145、署名印影結果情報記憶モジュール1150、署名印影確認モジュール1155は、それぞれ画像処理装置100のUI処理モジュール105、情報登録モジュール110、情報記憶モジュール115、画像・文字認識処理モジュール120、スキャン処理モジュール125、画像処理モジュール130、画像認識処理モジュール135、文字認識処理モジュール140、結果保存モジュール145、結果情報記憶モジュール150、確認モジュール155に該当する。第1の実施の形態の説明における対象画像を印影画像と読み替え、第1の実施の形態の説明における項目の情報を署名又は記名の文字認識結果と読み替えればよい。なお、印影画像に対する特有の処理について説明する。
対象とする文書例である申込書、契約書、組織内における稟議文書等では、印鑑が押されたものを原本とし、正式な文書として採用される。これらの文書は多くの場合保管しておく必要がある。しかし、常に必要なものではないので、スキャナや複合機により読み込まれて電子化され、紙ファイル自体は倉庫に保管するといった運用が多くなってきている。
しかしながら、本実施の形態以外のシステムにあっては、それらの押印された文書を電子化し、ファイルサーバー等に保管すると、その文書が正しい印鑑によって押印されている否かは電子文書を開いて見てみなければ分からない。
第2の実施の形態は、印影画像をキーとして、その印影画像に対応する署名又は記名を抽出して、ユーザーに確認させるようにしている。
【0047】
UI処理モジュール1105は、印鑑情報登録モジュール1110、署名印影認識処理モジュール1120、署名印影確認モジュール1155と接続されている。
印鑑情報登録モジュール1110は、UI処理モジュール1105、印鑑情報記憶モジュール1115と接続されている。
【0048】
印鑑情報記憶モジュール1115は、印鑑情報登録モジュール1110、印影認識処理モジュール1135と接続されている。印鑑情報記憶モジュール1115は、印影画像と予め定められた位置関係にある項目の情報を抽出するための規則、及び、印鑑の印影画像とその印鑑の所有者を対応させて記憶している。
また、規則は、印影画像と項目の位置関係の他に、さらに、印影画像の大きさと項目である「署名又は記名」の領域の大きさの関係、項目に記載されている文字の属性の指定、項目に記載されている文字画像の文字認識結果、のうちいずれか1つ、又は、これらの組み合わせによって構成されていてもよい。
「文字の属性の指定」の規則とは、署名又は記名における表示形態を示すものであって、例えば、下線が引かれているか否か、文字の大きさ、文字の書体、文字の色等の指定が該当する。なお、文字の書体は、署名である場合は手書きであるため不定とする。また、記名である場合は印刷文字であるため、明朝体、ゴシック体等がある。
「文字画像の文字認識結果」の規則とは、項目として抽出される署名又は記名である文字画像を文字認識した結果のテキストであって、例えば、日付を除く、氏名等のように予め定められた文字列であること、又は、「署名者」等のように予め定められた文字列を除く等が該当する。
【0049】
署名印影認識処理モジュール1120は、UI処理モジュール1105、スキャン処理モジュール1125と接続されている。
スキャン処理モジュール1125は、署名印影認識処理モジュール1120、画像処理モジュール1130と接続されている。
画像処理モジュール1130は、スキャン処理モジュール1125、印影認識処理モジュール1135、署名認識処理モジュール1140、署名印影結果保存モジュール1145と接続されている。
印影認識処理モジュール1135は、印鑑情報記憶モジュール1115、画像処理モジュール1130と接続されている。
【0050】
署名認識処理モジュール1140は、画像処理モジュール1130と接続されている。署名認識処理モジュール1140は、画像内の文字画像の全て又は一部を文字認識する。ここでの「画像内の文字画像の一部」とは、規則によって定められている「印影画像と予め定められた位置関係にある項目」がある領域をいう。もちろんのことながら、画像内の文字画像の全てを文字認識する場合よりも、文字認識する処理量は少なくなる。
そして、署名認識処理モジュール1140は、抽出した印影画像と予め定められた位置関係にある文字画像の文字認識結果を署名又は記名として抽出する。
【0051】
署名印影結果保存モジュール1145は、画像処理モジュール1130、署名印影結果情報記憶モジュール1150、署名印影確認モジュール1155と接続されている。
署名印影結果情報記憶モジュール1150は、署名印影結果保存モジュール1145と接続されている。
【0052】
署名印影確認モジュール1155は、UI処理モジュール1105、署名印影結果保存モジュール1145と接続されている。署名印影確認モジュール1155は、署名認識処理モジュール1140によって抽出された文字認識結果が、印鑑情報記憶モジュール1115内の印影画像に対応する所有者と一致するか否かについての判断結果を、表示装置に表示させるように制御する。
さらに、署名印影確認モジュール1155は、署名認識処理モジュール1140によって抽出された文字認識結果が、印鑑情報記憶モジュール1115内の印影画像に対応する所有者に一致しない場合は、その所有者に対して通知を行うようにしてもよい。
通知先として、印鑑の所有者以外に、スキャン操作を行った担当者、印鑑情報の管理者等を含めてもよい。ただし、印鑑が用いられているにも関わらず、その印鑑の所有者の署名又は記名に対応した印鑑でない場合は、印鑑が無断で使用されている可能性があるので、その印鑑の所有者に印鑑が使用された旨を通知するようにしている。また、署名又は記名を、その印鑑の所有者に通知するようにしてもよい。
なお、通知として、例えば、電子メール、チャット、電子掲示板、ソーシャルメディアを用いた通知、プッシュ通知、自動音声応答による電話発信等があり、電話発信として、例えば、Lync(登録商標)等を用いて行えばよい。
【0053】
図12は、第2の実施の形態を利用したシステム構成例を示す説明図である。
画像処理装置1100A、画像処理装置1100B、印鑑情報等登録サーバー1210、ユーザー端末250は、通信回線290を介してそれぞれ接続されている。印鑑情報等登録サーバー1210は、印鑑情報記憶モジュール1115、署名印影結果情報記憶モジュール1150を有している。
図2の例に示したシステム構成に対応しており、画像処理装置100を画像処理装置1100、画像情報等登録サーバー210を印鑑情報等登録サーバー1210、情報記憶モジュール115を印鑑情報記憶モジュール1115、結果情報記憶モジュール150を署名印影結果情報記憶モジュール1150としている。
【0054】
例えば、画像処理装置1100のスキャナで、印鑑が押印された文書が読み込まれる。そして、画像処理装置1100によって、その文書の画像から印影画像を抽出し、抽出したその印影画像と予め定められた位置関係にある領域にある署名又は記名を文字認識して、署名又は記名のテキスト情報を抽出することが行われる。その処理結果が印鑑情報等登録サーバー1210に記憶される。そして、ユーザーがユーザー端末250を操作して、印鑑情報等登録サーバー1210内の処理結果を表示し、確認と修正が行われる。さらに、署名又は記名のテキスト情報と印影画像に対応する印鑑の所有者が一致するか否かの判断が行われ、一致しない場合は、警告等を内容とする通知先への通知が行われる。
【0055】
仕事の順序を定めている作業フローの中の業務には、非定型形式の契約書のような書類がある。具体的には、署名や印鑑がある位置が定まっていない書類がある。このような非定型形式の書類に対して、確認すべき署名や印鑑の位置が定まっていないが、画像処理装置1100は、署名と印鑑の押印が正しく実施されているかを判断できるようにしている。
図13は、第2の実施の形態が処理対象とする文書の例を示す説明図である。
図13(a)の例では、書類1300の下方の領域を示している。未だ記名、押印がされていない白紙の状態の例である。書類1300には、本文欄1305、日付欄1310、雇用者欄1315、労働者欄1335が記載されている。雇用者欄1315は、肩書欄1320、署名・記名欄1325、押印欄1330を有している。労働者欄1335は、肩書欄1340、署名・記名欄1345、押印欄1350を有している。
なお、雇用者欄1315、労働者欄1335は、書類1300内で定められた位置ではなく、任意の位置に記載されていてもよい。したがって、その場合、事前に雇用者欄1315、労働者欄1335の位置を知ることはできない。
【0056】
図13(b)の例は、
図13(a)の例に示した書類1300に正しく署名と印鑑の押印がなされた書類1300bを示している。
雇用者欄1315bの署名・記名欄1325bには「鈴木一郎」と記名され、押印欄1330bには鈴木一郎の印鑑によって押印された印影がある。
労働者欄1335bの署名・記名欄1345bには「田中太郎」と記名され、押印欄1350bには田中太郎の印鑑によって押印された印影がある。
画像処理装置1100は、書類1300bを対象とした場合、
図14の例に示すフローチャートによる処理によって、照合結果として「正しい」と判断する。
【0057】
一方、
図13(c)の例は、
図13(a)の例に示した書類1300に誤って署名と印鑑の押印がなされた書類1300cを示している。
雇用者欄1315cの署名・記名欄1325cには「富士一郎」と記名されているが、押印欄1330cには鈴木一郎の印鑑によって押印された印影がある。
労働者欄1335cの署名・記名欄1345cには「田中太郎」と記名され、押印欄1350cには田中太郎の印鑑によって押印された印影がある。
画像処理装置1100は、書類1300cを対象とした場合、
図14の例に示すフローチャートによる処理によって、照合結果として「誤り」と判断する。
【0058】
図14は、第2の実施の形態である画像処理装置1100による処理例を示すフローチャートである。
ステップS1400では、署名印影認識処理を開始する。
ステップS1402では、帳票のスキャンを実施する。
ステップS1404では、印影認識処理を行う。例えば、印鑑情報テーブル1500の印影画像欄1515を用いて、パターンマッチングによって印影画像を抽出するようにしてもよい。また、印影は朱色であり、円形(楕円を含む)であるという特徴を利用して、その特徴を有している画像を抽出するようにしてもよい。
図15は、印鑑情報テーブル1500のデータ構造例を示す説明図である。印鑑情報テーブル1500は、印鑑ID欄1505、印鑑所有者名欄1510、印影画像欄1515を有している。印鑑ID欄1505は、本実施の形態において、印鑑を一意に識別するための情報(具体的には、印鑑ID)を記憶している。印鑑所有者名欄1510は、その印鑑の所有者名を記憶している。印影画像欄1515は、印影画像を記憶している。なお、印影画像欄1515には、印影画像そのものの他に、その印影画像の認識に必要となる特徴量を記憶するようにしてもよい。印鑑情報テーブル1500の1行目は、印鑑ID:S0001は、印鑑所有者名が「鈴木一郎」であり、印影画像として「鈴木」という印鑑が登録されていることを示しており、2行目は、印鑑ID:S0002は、印鑑所有者名が「田中太郎」であり、印影画像として「田中」という印鑑が登録されていることを示している。
【0059】
ステップS1406では、署名認識処理していない印影があるか否かを判断し、ある場合はステップS1408へ進み、それ以外の場合は処理を終了する(ステップS1499)。
ステップS1408では、署名認識処理を行う。ステップS1408の詳細な処理については、
図18の例に示すフローチャートを用いて後述する。
ステップS1410では、印鑑情報との照合を行う。具体的には、印鑑情報テーブル1500を用いて、ステップS1404でキーとして抽出した印影画像と同じ印影画像を印鑑情報テーブル1500の印影画像欄1515内の印影画像から抽出する。そして、ステップS1408でバリューとして抽出した署名領域の文字認識結果と、抽出した印影画像と同じ行にある印鑑情報テーブル1500の印鑑所有者名欄1510内の印鑑所有者名とを照合する。つまり、署名が印影画像の印鑑の所有者と一致するか否かを判断する。
【0060】
ステップS1412では、印影と署名の認識結果、照合結果を署名印影結果情報記憶モジュール1150に記憶させ、ステップS1406へ戻る。具体的には、署名印鑑処理結果テーブル1600を生成して、署名印影結果情報記憶モジュール1150に記憶させる。
図16は、署名印鑑処理結果テーブル1600のデータ構造例を示す説明図である。署名印鑑処理結果テーブル1600は、書類ID欄1605、書類名欄1610、署名認識結果欄1615、印影画像欄1620、印鑑ID欄1625、判断結果欄1630を有している。書類ID欄1605は、本実施の形態において、書類を一意に識別するための情報(具体的には、書類ID)を記憶している。書類名欄1610は、書類名を記憶している。署名認識結果欄1615は、署名認識結果を記憶している。印影画像欄1620は、印影画像を記憶している。印鑑ID欄1625は、印鑑IDを記憶している。判断結果欄1630は、判断結果を記憶している。ここでの判断結果とは、署名の文字認識結果と印影画像の印鑑の所有者が一致しているか否かを示す情報である。
図16の例では「×」は一致していないことを示し、「○」は一致していることを示している。署名印鑑処理結果テーブル1600の1行目は、書類ID:D0001は、書類名が「XXX契約書」であり、署名認識結果が「富士一郎」であり、印影画像として「鈴木」という印鑑が押印された印影であり、印鑑IDが「S0001」であり、判断結果が「×」であることを示しており、2行目は、書類ID:D0002は、書類名が「XXX契約書」であり、署名認識結果が「田中太郎」であり、印影画像として「田中」という印鑑が押印された印影であり、印鑑IDが「S0002」であり、判断結果が「○」であることを示している。
【0061】
図18は、第2の実施の形態による処理例を示すフローチャートである。
図17に示す例を用いて説明する。
図17は、第2の実施の形態による処理例を示す説明図である。
ステップS1800では、署名認識処理を開始する。
ステップS1802では、画像内の印影画像の位置を抽出する。具体的には、
図14の例に示すフローチャートのステップS1404で抽出された印影画像の位置を抽出すればよい。
図17(a)の例は、
図13(c)に示した例と同じであるが、押印欄1330c内の印影画像を抽出する。
ステップS1804では、「正立の印影画像の左側にある署名領域」というバリュー抽出規則を用いて、印影画像に対応する署名領域を抽出する。具体的には、
図4の例に示すバリュー抽出規則テーブル400の2行目のバリュー抽出規則を利用して、印影画像に対応する署名領域を抽出する。このバリュー抽出規則によって、
図17(a)では、押印欄1330cの左側にある領域を抽出する。この例では、肩書欄1320cと署名・記名欄1325cが抽出されることになり、その結果が
図17(b)の例に示す抽出画像1710の文字画像である。
【0062】
ステップS1806では、ステップS1804で抽出した署名領域の画像を文字認識する。例えば、既存の技術を用いて、認識対象の文字は活字体であるか手書きであるかを判断し、活字体の記名である場合は、印刷文字用の文字認識処理を行うようにし、手書きでの署名である場合は、手書き用の文字認識処理を行うようにすればよい。
ステップS1808では、印影画像をキーとして、署名領域の文字認識結果をバリューとする。
図17(c)の例に示すように、キー・バリュー情報1720を生成する。キー・バリュー情報1720は、署名認識結果1725と印影画像1730によって構成されており、印影画像1730はキーである印影画像を記憶しており、署名認識結果1725はバリューである抽出画像1710の文字認識結果を記憶している。なお、規則として、前述の印影画像との位置関係の他に、「項目に記載されている文字画像の文字認識結果として、「雇用者」、「労働者」という文字列は、バリューから除外する」が含まれている場合の処理結果であり、「雇用者」という文字列は除外されて「富士一郎」という名前だけがバリューとして抽出されている。
【0063】
図19は、第2の実施の形態による処理例を示すフローチャートである。
図20に示す例を用いて説明する。
図20は、第2の実施の形態による表示例を示す説明図である。
ステップS1900では、署名印影確認処理を開始する。
ステップS1902では、署名印影結果情報記憶モジュール1150から署名印影処理結果を取得する。
ステップS1904では、処理済みの文書の一覧を表示する。
図20(a)の例に示すように、文書リスト画面2000を表示装置に表示するように制御する。文書リスト画面2000には、文書名欄2005、確認実施欄2010、結果欄2015、日付欄2020を表示する。文書名欄2005には、文書名を表示する。確認実施欄2010には、確認実施を済んでいるか否かの情報を表示する。結果欄2015には、照合結果を表示する。日付欄2020には、ユーザーによる確認が行われた日付を表示する。
【0064】
ステップS1906では、ユーザーが確認をすべき文書を指示する。
図20(a)の例に示す文書リスト画面2000では、最終行が選択されたとする。
ステップS1908では、指示された文書の署名と印影を表示して、確認処理をユーザーに行わせる確認画面を表示する。
図20(b)の例に示す確認画面2050を表示装置に表示するように制御する。確認画面2050には、文書名欄2055、名前欄2060、印影画像欄2065、印鑑所有者名欄2070、チェック欄2075を表示する。文書名欄2055には、文書名を表示する。名前欄2060には、バリューである署名欄に記載されていた名前を表示する。つまり、署名欄内の文字画像の文字認識結果である。印影画像欄2065には、キーである印影画像を表示する。印鑑所有者名欄2070には、印鑑の所有者名を表示する。具体的には、印鑑情報テーブル1500を用いて印影画像から印鑑の所有者を抽出すればよい。
ステップS1910では、ユーザーが確認結果を入力する。
図20(b)の例では、名前欄2060の名前(富士一郎)と印鑑所有者名欄2070内の名前(鈴木一郎)が異なっているので、ユーザーは、この「xxx契約書」は不当であると判断することになる。
ステップS1912では、確認結果を用いて、署名印影処理情報を更新する。
【0065】
図21は、第2の実施の形態による処理例を示すフローチャートである。
図14の例に示すフローチャートのステップS1410の処理を、
図21の例に示すフローチャートに置きかえてもよい。
ステップS2100では、印鑑情報照合処理を開始する。
ステップS2102では、署名の認識結果は印鑑の所有者と一致するか否かを判断し、一致する場合は処理を終了し(ステップS2199)、それ以外の場合はステップS2104へ進む。
ステップS2104では、通知先にアラームを通知する。ここでの通知先として、印鑑の所有者、スキャン操作を行った担当者、印鑑情報の管理者等がある。ただし、印鑑が無断で使用されている可能性が高いので、印鑑の所有者を通知先として含めるべきである。
【0066】
次に、第2の実施の形態において、署名の文字画像を文字認識の対象とはしない場合の処理について説明する。例えば、手書きの署名である場合、又は、署名の文字画像を認識できなかった場合には、次のようにしてもよい。
対象画像を印影画像とし、項目の情報を署名画像とする。そして、印鑑情報記憶モジュール1115は、さらに、印鑑の印影画像とその印鑑の所有者による署名画像を対応させて記憶している。
画像処理モジュール1130は、印影認識処理モジュール1135が抽出した印影画像と予め定められた位置関係にある文字画像を署名画像として抽出する。そして、画像処理モジュール1130は、印影認識処理モジュール1135が抽出した印影画像と文字画像が、印鑑情報記憶モジュール1115内の印影画像と署名画像と一致するか否かについての判断結果を、表示装置に表示させるように制御する。
画像処理モジュール1130は、さらに、印影認識処理モジュール1135が抽出した署名画像が、印鑑情報記憶モジュール1115内の印影画像に対応する署名画像に一致しない場合は、所有者、又は、抽出した署名画像を文字認識した結果である署名者に対して通知を行う。
ここでの通知先として、印鑑の所有者、署名者以外に、スキャン操作を行った担当者、管理者等を含めてもよい。ただし、印鑑が用いられているにも関わらず、その所有者の署名でない場合は、印鑑が無断で使用されている可能性があるので、所有者に印鑑が使用された旨を通知するようにしている。その際に、署名を通知するようにしてもよい。また、署名されているにも関わらず、その署名者が所有している印影でない場合は、印鑑を誤って使用した可能性があるので、署名者に印鑑を誤って使用した旨を通知するようにしている。その際に、印影画像を通知するようにしてもよい。
【0067】
以下に、前述した第2の実施の形態とは異なる処理について説明する。
図22は、第2の実施の形態による処理例を示すフローチャートである。
図14の例に示したフローチャートに対応するものであり、署名認識処理において、署名を文字認識できない場合における処理である。
ステップS2200では、署名印影認識処理を開始する。
ステップS2202では、帳票のスキャンを実施する。
ステップS2204では、印影認識処理を行う。
ステップS2206では、署名認識処理していない印影があるか否かを判断し、ある場合はステップS2208へ進み、それ以外の場合は処理を終了する(ステップS2299)。
ステップS2208では、署名認識処理を行う。ステップS2208の詳細な処理については、
図24の例に示すフローチャートを用いて後述する。
【0068】
ステップS2210では、印鑑情報との照合を行う。具体的には、印鑑情報テーブル2300を用いて照合を行う。
図23は、印鑑情報テーブル2300のデータ構造例を示す説明図である。印鑑情報テーブル2300は、印鑑ID欄2305、印鑑所有者署名欄2310、印影画像欄2315を有している。印鑑ID欄2305は、本実施の形態において、印鑑を一意に識別するための情報(具体的には、印鑑ID)を記憶している。印鑑所有者署名欄2310は、その印鑑の所有者の署名画像を記憶している。印影画像欄2315は、印影画像を記憶している。印鑑情報テーブル2300の1行目は、印鑑ID:SS0001は、印鑑の所有者(鈴木一郎)の手書きの署名画像であり、印影画像として「鈴木」という印鑑が登録されていることを示しており、2行目は、印鑑ID:SS0002は、印鑑の所有者(田中太郎)の手書きの署名画像であり、印影画像として「田中」という印鑑が登録されていることを示している。
照合の具体的な処理は、印鑑情報テーブル2300を用いて、ステップS2204でキーとして抽出した印影画像と同じ印影画像を印鑑情報テーブル2300の印影画像欄2315内の印影画像から抽出する。そして、ステップS2208でバリューとして抽出した署名領域内の署名画像と、抽出した印影画像と同じ印影画像がある印鑑情報テーブル2300の行における印鑑所有者署名欄2310内の署名画像とを照合する。照合処理として、例えば、両者の署名画像同士のパターンマッチングであってもよいし、署名画像の特徴を抽出し、特徴空間における両者の距離が予め定められた閾値以下又は未満である場合は、同じ者による署名であると判断し、それ以外の場合は、異なる者による署名であると判断するようにしてもよい。
【0069】
ステップS2212では、印影と署名の2つの画像照合結果を署名印影結果情報記憶モジュール1150に記憶させ、ステップS2206へ戻る。なお、署名印影結果情報記憶モジュール1150に記憶させる情報として、
図16の例に示した署名印鑑処理結果テーブル1600の署名認識結果欄1615を署名画像欄として、バリュー抽出規則テーブル400を用いて抽出したバリューである署名画像を記憶させたものとしたデータ構造とすればよい。
【0070】
なお、ステップS2208の処理として、
図18の例に示すフローチャートを用いてもよい。そして、ステップS2208の後に、署名を文字認識できたか否かの判断処理を行い、文字認識できなかった場合は、ステップS2210、ステップS2212の処理を行い、文字認識できた場合は、
図14の例に示すフローチャートのステップS1410、ステップS1412の処理を行うようにしてもよい。
【0071】
図24は、第2の実施の形態による処理例を示すフローチャートである。
図18の例に示したフローチャートに対応するものである。
ステップS2400では、署名認識処理を開始する。
ステップS2402では、画像内の印影画像の位置を抽出する。
ステップS2404では、「正立の印影画像の左側にある署名領域」というバリュー抽出規則を用いて、印影画像に対応する署名領域を抽出する。
ステップS2406では、印影画像をキーとして、署名領域の画像をバリューとする。したがって、この処理でのバリューは、手書きの署名画像である。
【0072】
図25を参照して、本実施の形態の画像処理装置100、画像処理装置1100のハードウェア構成例について説明する。
図25に示す構成は、例えばパーソナルコンピュータ等によって構成されるものであり、スキャナ等のデータ読み取り部2517と、プリンタ等のデータ出力部2518を備えたハードウェア構成例を示している。メモリとして、ROM(Read Only Memoryの略)2502、RAM(Random Access Memoryの略)2503、HDD(Hard Disk Driveの略)2511、リムーバブル記録媒体2513を例示している。メモリとして、さらに、通信部2516と通信回線を介して接続されている記憶手段を含めてもよい。プロセッサとして、一つのCPU(Central Processing Unitの略)2501を例示している。一つのCPU2501に複数のプロセッサコアが搭載されていてもよいし、複数のCPU2501が搭載されていてもよい。プロセッサとして、さらに、通信部2516と通信回線を介して接続されているプロセッサを含めてもよい。また、複数のプロセッサを用いる場合は、密結合マルチプロセッサ、疎結合マルチプロセッサのいずれの形態であってもよい。
【0073】
CPU2501は、前述の実施の形態において説明した各種のモジュール、すなわち、UI処理モジュール105、情報登録モジュール110、画像・文字認識処理モジュール120、スキャン処理モジュール125、画像処理モジュール130、画像認識処理モジュール135、文字認識処理モジュール140、結果保存モジュール145、確認モジュール155、UI処理モジュール1105、印鑑情報登録モジュール1110、署名印影認識処理モジュール1120、スキャン処理モジュール1125、画像処理モジュール1130、印影認識処理モジュール1135、署名認識処理モジュール1140、署名印影結果保存モジュール1145、署名印影確認モジュール1155等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
【0074】
ROM2502は、CPU2501が使用するプログラムや演算パラメータ等を格納する。RAM2503は、CPU2501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス2504により相互に接続されている。
【0075】
ホストバス2504は、ブリッジ2505を介して、PCI(Peripheral Component Interconnect/Interfaceの略)バス等の外部バス2506に接続されている。
【0076】
キーボード2508、マウス等のポインティングデバイス2509は、操作者により操作されるデバイスである。ディスプレイ2510は、液晶表示装置、有機ELディスプレイ又はCRT(Cathode Ray Tubeの略)等があり、各種情報をテキストやイメージ情報として表示する。また、ポインティングデバイス2509とディスプレイ2510の両方の機能を備えているタッチスクリーン等であってもよい。その場合、キーボードの機能の実現について、キーボード2508のように物理的に接続しなくても、画面(例えば、タッチスクリーン)上にソフトウェアでキーボード(いわゆるソフトウェアキーボード、スクリーンキーボード等ともいわれる)を描画して、キーボードの機能を実現するようにしてもよい。
【0077】
HDD2511は、ハードディスク(ハードディスク以外に、フラッシュ・メモリ等であってもよい)を内蔵し、ハードディスクを駆動し、CPU2501によって実行するプログラムや情報を記録又は再生させる。HDD2511は、情報記憶モジュール115、結果情報記憶モジュール150、印鑑情報記憶モジュール1115、署名印影結果情報記憶モジュール1150等としての機能を実現させる。さらに、その他の各種データ、各種コンピュータ・プログラム等が格納される。
【0078】
ドライブ2512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体2513に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース2507、外部バス2506、ブリッジ2505、及びホストバス2504を介して接続されているRAM2503に供給する。なお、リムーバブル記録媒体2513も、データ記録領域として利用可能である。
【0079】
接続ポート2514は、外部接続機器2515を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート2514は、インタフェース2507、及び外部バス2506、ブリッジ2505、ホストバス2504等を介してCPU2501等に接続されている。通信部2516は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部2517は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部2518は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
【0080】
前述の実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のシステムにソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、前述の実施の形態が実現される。
なお、
図25に示す画像処理装置100等のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、
図25に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、プロセッサとして、GPU(Graphics Processing Unitの略、GPGPU(General-Purpose computing on Graphics Processing Unitsの略)を含む)を用いてもよいし、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(具体例として、ASIC(Application Specific Integrated Circuitの略)等がある)や再構成可能な集積回路(具体例として、FPGA(Field-Programmable Gate Arrayの略)等がある)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに
図25に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯情報通信機器として、携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(複合機とは、スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等に組み込まれていてもよい。
【0081】
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD-R、DVD-RW、DVD-RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD-ROM)、CDレコーダブル(CD-R)、CDリライタブル(CD-RW)等、ブルーレイ・ディスク(Blu-ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digitalの略)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
【符号の説明】
【0082】
100…画像処理装置
105…UI処理モジュール
110…情報登録モジュール
115…情報記憶モジュール
120…画像・文字認識処理モジュール
125…スキャン処理モジュール
130…画像処理モジュール
135…画像認識処理モジュール
140…文字認識処理モジュール
145…結果保存モジュール
150…結果情報記憶モジュール
155…確認モジュール
210…画像情報等登録サーバー
250…ユーザー端末
290…通信回線
1100…画像処理装置
1105…UI処理モジュール
1110…印鑑情報登録モジュール
1115…印鑑情報記憶モジュール
1120…署名印影認識処理モジュール
1125…スキャン処理モジュール
1130…画像処理モジュール
1135…印影認識処理モジュール
1140…署名認識処理モジュール
1145…署名印影結果保存モジュール
1150…署名印影結果情報記憶モジュール
1155…署名印影確認モジュール
1210…印鑑情報等登録サーバー