(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025022027
(43)【公開日】2025-02-14
(54)【発明の名称】情報処理装置、情報処理システム、情報処理方法及びプログラム
(51)【国際特許分類】
G06V 20/62 20220101AFI20250206BHJP
G06T 7/00 20170101ALI20250206BHJP
G06F 16/53 20190101ALI20250206BHJP
【FI】
G06V20/62
G06T7/00 300E
G06F16/53
【審査請求】未請求
【請求項の数】17
【出願形態】OL
(21)【出願番号】P 2023126232
(22)【出願日】2023-08-02
(71)【出願人】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(71)【出願人】
【識別番号】301063496
【氏名又は名称】東芝デジタルソリューションズ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】古畑 彰夫
(72)【発明者】
【氏名】長田 邦男
【テーマコード(参考)】
5B175
5L096
【Fターム(参考)】
5B175DA01
5B175DA02
5B175HB03
5L096BA17
5L096FA44
5L096FA69
5L096HA08
(57)【要約】
【課題】より速い処理速度で、より高精度に識別対象を識別する。
【解決手段】実施形態の情報処理装置は、記憶制御部、抽出部、推定部及び識別部を備える。記憶制御部は、識別対象を示すモデル画像に含まれる参照領域毎に、前記参照領域の参照位置情報と、前記参照領域の参照属性情報と、を関連付けて記憶部に記憶する。抽出部は、クエリ画像から、比較領域と、前記比較領域の比較位置情報と、前記比較領域の比較属性情報を抽出する。識別部は、前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照属性情報と前記比較属性情報とによる属性の照合とに基づいて、前記クエリ画像を識別する。
【選択図】
図4
【特許請求の範囲】
【請求項1】
識別対象を示すモデル画像に含まれる参照領域毎に、前記参照領域の参照位置情報と、前記参照領域の参照属性情報と、を関連付けて記憶部に記憶する記憶制御部と、
クエリ画像から、比較領域と、前記比較領域の比較位置情報と、前記比較領域の比較属性情報を抽出する抽出部と、
前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照属性情報と前記比較属性情報とによる属性の照合とに基づいて、前記クエリ画像を識別する識別部と、
を備える情報処理装置。
【請求項2】
前記抽出部は、前記比較領域に付随する比較文字情報をさらに抽出し、
前記比較文字情報の意味、及び、前記比較文字情報の記載位置と前記比較位置情報との位置関係の少なくとも一方から、前記比較属性情報を推定する推定部、
を更に備える請求項1に記載の情報処理装置。
【請求項3】
前記比較領域を少なくとも含む入力された画像から、入力された画像内に含まれる領域の備える比較属性を推定する属性推定モデルを用いて、前記比較領域と、前記比較領域に付随する前記比較属性情報とを推定する推定部、
を更に備える請求項1に記載の情報処理装置。
【請求項4】
前記抽出部は、前記比較領域に付随する比較文字情報をさらに抽出し、
前記推定部は、前記比較文字情報の意味、及び、前記比較文字情報の記載位置と前記比較位置情報との位置関係の少なくとも一方から、前記比較属性情報を推定する、
請求項3に記載の情報処理装置。
【請求項5】
前記比較文字情報の信頼度を算出する算出部を更に備え、
前記識別部は、前記信頼度が信頼度閾値以上の場合、前記参照位置情報と前記比較位置情報とによる位置の照合と、参照文字情報と前記比較文字情報とによる文字の照合とに基づいて、前記クエリ画像を識別し、前記信頼度が前記信頼度閾値より小さい場合、前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照属性情報と前記比較属性情報とによる属性の照合とに基づいて、前記クエリ画像を識別する、
請求項2又は4に記載の情報処理装置。
【請求項6】
前記記憶制御部は、前記参照領域の参照位置情報と、前記参照領域の参照属性情報とに、更に前記参照領域に付随する参照文字情報を関連付けて記憶し、
前記比較文字情報の信頼度を算出する算出部を更に備え、
前記識別部は、前記信頼度が信頼度閾値以上の場合、前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照文字情報と前記比較文字情報とによる文字の照合とに基づいて、前記クエリ画像を識別し、前記信頼度が前記信頼度閾値より小さい場合、前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照属性情報と前記比較属性情報とによる属性の照合とに基づいて、前記クエリ画像を識別する、
請求項2又は4に記載の情報処理装置。
【請求項7】
前記推定部は、前記比較領域の重要度を更に推定し、
前記識別部は、前記重要度が重要度閾値以上の場合、前記参照位置情報と前記比較位置情報とによる位置の照合と、参照文字情報と前記比較文字情報とによる文字の照合とに基づいて、前記クエリ画像を識別し、前記重要度が前記重要度閾値より小さい場合、前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照属性情報と前記比較属性情報とによる属性の照合とに基づいて、前記クエリ画像を識別する、
請求項2又は4に記載の情報処理装置。
【請求項8】
前記記憶制御部は、前記参照領域の参照位置情報と、前記参照領域の参照属性情報とに、更に前記参照領域に付随する参照文字情報を関連付けて記憶し、
前記推定部は、前記比較領域の重要度を更に推定し、
前記識別部は、前記重要度が重要度閾値以上の場合、前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照文字情報と前記比較文字情報とによる文字の照合とに基づいて、前記クエリ画像を識別し、前記重要度が前記重要度閾値より小さい場合、前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照属性情報と前記比較属性情報とによる属性の照合とに基づいて、前記クエリ画像を識別する、
請求項2又は4に記載の情報処理装置。
【請求項9】
前記参照領域に付随する参照文字情報は、前記参照領域の内部、または、前記参照領域に隣接する領域の少なくとも一方にある文字情報であり、
前記比較領域に付随する比較文字情報は、前記比較領域の内部、または、前記比較領域に隣接する領域の少なくとも一方にある文字情報である、
請求項6に記載の情報処理装置。
【請求項10】
前記記憶制御部は、前記モデル画像毎に、識別に使用される領域の範囲を前記記憶部に更に記憶し、
前記抽出部は、前記クエリ画像ごとに、前記識別に使用される領域の範囲をさらに抽出し、
前記識別部は、前記参照位置情報と前記比較位置情報とが、前記範囲に含まれる場合、前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照属性情報と前記比較属性情報とによる属性の照合とに基づいて、前記クエリ画像を識別する、
請求項1乃至4のいずれか1項に記載の情報処理装置。
【請求項11】
前記識別部は、前記クエリ画像から抽出された、前記識別に使用される領域をもとに、前記比較位置情報を補正する、
請求項10に記載の情報処理装置。
【請求項12】
前記識別部は、前記クエリ画像から抽出された、前記識別に使用される領域の中心に、より近い前記比較位置情報により位置が特定される比較領域から順番に、前記位置の照合と前記属性の照合とを実行する、
請求項10に記載の情報処理装置。
【請求項13】
前記識別対象は帳票である、
請求項1乃至4のいずれか1項に記載の情報処理装置。
【請求項14】
前記識別対象は帳票であり、
前記推定部は、前記比較文字情報が、記入欄に記入されているか否かを更に推定し、
前記識別部は、前記記入欄に記入されている比較文字情報の比較位置情報と、前記記入欄に記入されている比較文字情報の比較属性情報は、前記クエリ画像の識別に使用しない、
請求項2又は4に記載の情報処理装置。
【請求項15】
識別対象を示すモデル画像に含まれる参照領域毎に、前記参照領域の参照位置情報と、前記参照領域の参照属性情報と、を関連付けて記憶部に記憶する記憶制御部と、
クエリ画像から、比較領域と、前記比較領域の比較位置情報と、前記比較領域の比較属性情報を抽出する抽出部と、
前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照属性情報と前記比較属性情報とによる属性の照合とに基づいて、前記クエリ画像を識別する識別部と、
を備える情報処理システム。
【請求項16】
情報処理装置が、識別対象を示すモデル画像に含まれる参照領域毎に、前記参照領域の参照位置情報と、前記参照領域の参照属性情報と、を関連付けて記憶部に記憶するステップと、
前記情報処理装置が、クエリ画像から、比較領域と、前記比較領域の比較位置情報と、前記比較領域の比較属性情報を抽出するステップと、
前記情報処理装置が、前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照属性情報と前記比較属性情報とによる属性の照合とに基づいて、前記クエリ画像を識別するステップと、
を含む情報処理方法。
【請求項17】
コンピュータを、
識別対象を示すモデル画像に含まれる参照領域毎に、前記参照領域の参照位置情報と、前記参照領域の参照属性情報と、を関連付けて記憶部に記憶する記憶制御部と、
クエリ画像から、比較領域と、前記比較領域の比較位置情報と、前記比較領域の比較属性情報を抽出する抽出部と、
前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照属性情報と前記比較属性情報とによる属性の照合とに基づいて、前記クエリ画像を識別する識別部、
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、情報処理装置、情報処理システム、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
スキャナなどによって読み取られた定型帳票などの画像を、識別対象のモデルとマッチングすることによって識別する技術が従来から知られている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】国際公開第2020/071558号
【特許文献2】特開2010-140402号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、より速い処理速度で、より高精度に識別対象を識別することが難しかった。
【課題を解決するための手段】
【0005】
実施形態の情報処理装置は、記憶制御部、抽出部及び識別部を備える。記憶制御部は、識別対象を示すモデル画像に含まれる参照領域毎に、前記参照領域の参照位置情報と、前記参照領域の参照属性情報と、を関連付けて記憶部に記憶する。抽出部は、クエリ画像から、比較領域と、前記比較領域の比較位置情報と、前記比較領域の比較属性情報を抽出する。識別部は、前記参照位置情報と前記比較位置情報とによる位置の照合と、前記参照属性情報と前記比較属性情報とによる属性の照合とに基づいて、前記クエリ画像を識別する。
【図面の簡単な説明】
【0006】
【
図1】
図1は、帳票識別について説明するための図である。
【
図2】
図2は、帳票識別の課題の例1を説明するための図である。
【
図3】
図3は、帳票識別の課題の例2を説明するための図である。
【
図4】
図4は、実施形態の情報処理装置の機能構成の例を示す図である。
【
図5】
図5は、実施形態の識別処理の例を説明するための図である。
【
図6】
図6は、実施形態の識別処理の例を説明するための図である。
【
図7】
図7は、実施形態のモデル登録処理の例を示すフローチャートである。
【
図8】
図8は、実施形態の識別処理の例を示すフローチャートである。
【
図9】
図9は、実施形態の変形例1の情報処理システムの装置構成の例を示す図である。
【
図10】
図10は、実施形態の情報処理装置、クライアント装置及びサーバ装置のハードウェア構成の例を示す図である。
【発明を実施するための形態】
【0007】
以下に添付図面を参照して、情報処理装置、情報処理システム、情報処理方法及びプログラムの実施形態を詳細に説明する。
【0008】
以下の実施形態では、識別対象が、帳票である場合を例にして説明するが、識別対象は任意でよい。
【0009】
図1は、帳票識別について説明するための図である。実施形態の情報処理装置1は、クエリ帳票と、モデル帳票とを照合(マッチング)することによって、クエリ帳票を識別する。クエリ帳票は、例えば、スキャナによってスキャンされた画像である。モデル帳票は、例えば、情報処理装置1に事前に登録された定形帳票のテンプレートである。
【0010】
図2は、帳票識別の課題の例1を説明するための図である。帳票識別にテキストが考慮されない場合、
図2のモデル帳票A及びBのように、類似した帳票の識別ができない、または、類似した帳票の識別精度が低下する。
【0011】
図3は、帳票識別の課題の例2を説明するための図である。
図3に示すように、帳票識別にテキストが考慮される場合、上述の
図2の帳票は識別できるが、テキスト認識処理によって処理コストが高くなり、また、テキストの誤認識リスクもある。
【0012】
以下、より速い処理速度で、より高精度に識別対象を識別することを可能にする情報処理装置の実施形態について詳細に説明する。
【0013】
[機能構成の例]
図4は、実施形態の情報処理装置1の機能構成の例を示す図である。実施形態の情報処理装置1は、記憶部11、記憶制御部12、抽出部13、算出部14、推定部15及び識別部16を備える。
【0014】
記憶部11は、情報処理装置1で使用される情報を記憶する。例えば、記憶部11は、識別部16による識別処理で使用される識別キーを記憶する。識別キーは、例えば、識別対象を示すモデル画像(実施形態では、モデル帳票)に含まれる参照領域毎に、参照領域の参照位置情報と、参照領域の参照属性情報と、が関連付けられた情報である。
【0015】
なお、記憶部11は、参照領域の参照位置情報と、参照領域の参照属性情報とに、更に参照領域に付随する参照文字情報を関連付けて記憶してもよい。
【0016】
具体的には、参照領域は、例えば、氏名の記入欄である。この場合、参照領域に付随する参照文字情報は、「氏名」である。また、参照領域の参照位置情報は、モデル帳票に含まれる氏名の記入欄の位置を示す情報(例えば、座標情報など)である。また、参照領域の参照属性情報は、例えば「名前」である。
【0017】
記憶制御部12は、記憶部11に記憶される情報の追加、削除または変更などの記憶制御を行う。
【0018】
抽出部13は、クエリ画像(実施形態では、クエリ帳票)から、比較領域と、比較領域に付随する比較属性情報と、比較領域の比較位置情報と、を抽出する。また、これらに加えて比較文字情報を抽出してもよい。クエリ画像の比較領域、比較文字情報及び比較位置情報は、上述のモデル画像の参照領域、参照文字情報及び参照位置情報の説明と同様であるので説明を省略する。
【0019】
例えば、抽出部13の抽出処理には、クエリ帳票から、比較領域と、比較領域に付随する比較文字情報と、比較領域に付随する比較属性情報と、比較領域の比較位置情報とを抽出するように予め学習されたDNN(Deep Neural Network)を用いたセマンティックセグメンテーションが用いられる。また、入力された画像から画像ごとに含まれる文字を抽出するように予め学習されたDNNを用いた文字認識により、比較文字情報を抽出するなどしてもよい。
【0020】
算出部14は、抽出部13により抽出された比較文字情報の信頼度を算出する。例えば、クエリ画像に、模様等の背景がある場合、クエリ画像に含まれる比較文字情報の抽出精度が下がる可能性がある。実施形態では、信頼度によって、クエリ画像に含まれる比較文字情報の抽出精度が評価される。
【0021】
なお、信頼度の算出方法は任意でよい。例えば、信頼度は、抽出部13で用いられるDNNから出力される確信度(例えば、確率など)に基づき算出される。
【0022】
推定部15は、比較領域を少なくとも含む入力された画像から、入力された画像内に含まれる領域の備える比較属性を推定する属性推定モデルを用いて、比較領域と、比較領域に付随する比較属性情報とを推定する。
【0023】
また、推定部15は、抽出部13により抽出された比較文字情報と、比較領域の比較位置情報とから、比較領域の比較属性情報を推定してもよい。例えば、推定部15は、比較文字情報の意味、及び、比較文字情報の記載位置と比較位置情報との位置関係の少なくとも一方から、比較属性情報を推定する。具体的には、例えば、比較文字情報が「氏名」であり、「氏名」の右又は下に比較領域がある場合、当該比較領域の比較属性情報が「名前」であることが推定される。
【0024】
なお、推定部15は、比較領域の重要度を更に推定してもよい。例えば、重要度がより高い比較領域として、クエリ帳票の見出しを示す比較領域が挙げられる。なお、重要度の推定方法は任意でよい。例えば、重要度は、抽出部13で用いられるDNNから出力される情報(例えば、抽出された比較領域の種類(分類)を示すラベル情報など)に基づき算出される。
【0025】
識別部16は、参照位置情報と比較位置情報とによる位置の照合と、参照属性情報と比較属性情報とによる属性の照合とに基づいて、クエリ画像を識別する。
【0026】
なお、識別部16は、算出部14により算出された比較文字情報の信頼度に基づき、クエリ画像の識別方法を変更してもよい。例えば、識別部16は、信頼度が信頼度閾値以上の場合、参照位置情報と比較位置情報とによる位置の照合と、記憶部11に記憶されたモデル画像(実施形態では、モデル帳票)の参照文字情報と、比較文字情報とによる文字の照合とに基づいて、クエリ画像を識別してもよい。識別部16は、信頼度が信頼度閾値より小さい場合、参照位置情報と比較位置情報とによる位置の照合と、参照属性情報と比較属性情報とによる属性の照合とに基づいて、クエリ画像を識別してもよい。
【0027】
また、識別部16は、推定部15により推定された比較領域の重要度に基づき、クエリ画像の識別方法を変更してもよい。例えば、識別部16は、重要度が重要度閾値以上の場合、参照位置情報と比較位置情報とによる位置の照合と、記憶部11に記憶されたモデル画像(実施形態では、モデル帳票)の参照文字情報と比較文字情報とによる文字の照合とに基づいて、クエリ画像を識別してもよい。識別部16は、重要度が重要度閾値より小さい場合、参照位置情報と比較位置情報とによる位置の照合と、参照属性情報と比較属性情報とによる属性の照合とに基づいて、クエリ画像を識別してもよい。
【0028】
重要度が重要度閾値以上の場合に、参照文字情報と比較文字情報とによる文字の照合を行うことによって、文字認識の回数を減らし、処理コストを低減することができる。
【0029】
図5は、実施形態の識別処理の例を説明するための図である。
図5の例では、記憶部11は、識別部16によるモデル帳票A及びBの識別処理で使用される識別キーを記憶する。
【0030】
例えば、モデル帳票Aは、6つの参照領域を含む。6つの参照領域は、氏名の記入欄であることを示す表記、氏名の記入欄、住所の記入欄であることを示す表記、住所の記入欄、電話の記入欄であることを示す表記、及び、電話の記入欄を含む。
【0031】
モデル帳票Aの識別キーは、参照領域毎に、参照領域に付随する参照文字情報と、参照領域の参照位置情報と、参照領域の参照属性情報と、が関連付けられた情報である。
【0032】
参照領域に付随する参照文字情報は、参照領域の内部、または、参照領域に隣接する領域の少なくとも一方にある文字情報である。具体的には、
図5の例では、例えば、電話の記入欄であることを示す表記を含む参照領域101、及び、電話の記入欄である参照領域102に付随する参照文字情報は、「電話」である。また、参照領域101及び102の参照属性情報は「電話」である。
【0033】
一方、
図5の例では、クエリ帳票には、6つの比較領域がある。6つの比較領域は、氏名の記入欄であることを示す表記、氏名の記入欄、住所の記入欄であることを示す表記、住所の記入欄、電話の記入欄であることを示す表記、及び、電話の記入欄を含む。
【0034】
具体的には、
図5の例では、例えば、電話の記入欄であることを示す表記は、「電話」であり、電話の記入欄には、「090-XXXX―YYYY」が記入されている。
【0035】
図5の例では、抽出部13は、クエリ帳票から、6つの比較領域と、6つの比較領域に付随する比較文字情報と、6つの比較領域の比較位置情報と、を抽出する。
【0036】
比較領域に付随する比較文字情報は、比較領域の内部、または、比較領域に隣接する領域の少なくとも一方にある文字情報である。具体的には、
図5の例では、例えば、電話の記入欄であることを示す表記を含む比較領域201、及び、電話の記入欄である比較領域202に付随する比較文字情報は、「電話」である。
【0037】
なお、抽出部13は、上述のDNNによって、「090-XXXX―YYYY」が電話の記入欄である比較領域202に記入されていることを判別し、識別処理に使用される比較文字情報としては抽出しない。これは、例えばユーザーによる誤記入がある場合などを想定し、帳票の識別処理の精度を低下させないようにするためである。具体的には、
図5の例では、例えば、電話の記入欄である比較領域202に、ユーザーが電話番号以外の情報を誤って記入していた場合、誤って記入されていた情報を用いて帳票の識別処理が行われると、帳票の識別処理の精度を低下させる可能性がある。
【0038】
推定部15は、抽出部13により抽出された比較文字情報と比較位置情報とから、6つの比較領域の比較属性情報を推定する。
【0039】
具体的には、
図5の例では、例えば、推定部15は、電話の記入欄であることを示す表記を含む比較領域201の比較属性情報が「電話」であることを推定する。また、推定部15は、比較領域202の比較位置情報から、比較領域202が、比較領域201の右に隣接する領域であることを特定することによって、比較領域202の比較属性情報が「電話」であることを推定する。
【0040】
識別部16は、参照位置情報と比較位置情報とによる位置の照合と、参照属性情報と比較属性情報とによる属性の照合とに基づいて、クエリ画像を識別する。
図5の例では、6つの参照領域と、6つの比較領域とについて、照合が行われる。
【0041】
具体的には、例えば、参照領域101と比較領域201については、識別部16は、参照領域101の参照位置情報と、比較領域201の比較位置情報とを照合し、参照領域101の参照属性情報と、比較領域201の比較属性情報とを照合する。
図5の例では、識別部16は、6つの参照領域と、6つの比較領域との照合結果に基づいて、クエリ画像がモデル帳票Aであることを識別する。
【0042】
図5のように、参照領域の参照属性情報と、比較領域の比較属性情報とが、照合に利用されることによって、参照領域と比較領域との対応付けの絞り込みが効くため、識別精度が上がるとともに、識別処理をより高速に行うことができる。
【0043】
図6は、実施形態の識別処理の例を説明するための図である。
図6に示すように、クエリ帳票に含まれる比較領域は、位置(比較位置情報)と、属性(比較属性情報)とによって、モデル帳票との照合が行われる。例えば、
図6の例では、比較領域211の属性は「帳票タイトル文字列」であり、比較領域212の属性は「記号」であり、比較領域213の属性は「番号」であり、比較領域214の属性は「名前」であり、比較領域215の属性は「生年月日」である。
【0044】
比較領域211~215の位置だけでなく、比較領域211~215の属性が、モデル帳票との照合に用いられることによって、クエリ帳票の識別精度を向上させることができる。また、比較領域211~215に付随する文字列ではなく、比較領域211~215の属性が、モデル帳票との照合に用いられることによって、クエリ帳票の識別処理速度の向上と、文字列の誤認識による識別精度の低下を抑えることができる。
【0045】
[モデル登録処理の例]
図7は、実施形態のモデル登録処理の例を示すフローチャートである。はじめに、抽出部13が、モデル帳票から、記入部分(記入欄を示す参照領域)を抽出する(ステップS1)。ステップS1で抽出された記入部分は、モデル帳票の識別キーとして記憶されない。
【0046】
次に、抽出部13が、モデル帳票から領域(上述の参照領域及び参照位置情報)を抽出し、推定部15が、抽出部13により抽出された領域の属性(上述の参照属性情報)を推定する(ステップS2)。
【0047】
次に、記憶制御部12が、参照領域毎に、参照領域の参照位置情報と、参照領域の参照属性情報と、が関連付けられた識別キーを記憶部11に記憶する(ステップS3)。
【0048】
なお、ステップS2において、抽出部13が、参照領域に付随する参照文字情報を更に抽出し、ステップS3において、記憶制御部12が、参照文字情報が更に関連付けられた識別キーを記憶部11に記憶してもよい。
【0049】
[識別処理の例]
図8は、実施形態の識別処理の例を示すフローチャートである。はじめに、抽出部13が、クエリ帳票から、記入部分(記入欄を示す比較領域)を抽出する(ステップS11)。ステップS11で抽出された記入部分は、クエリ帳票の識別キーとして記憶されない。
【0050】
次に、抽出部13が、クエリ帳票から領域(上述の比較領域及び比較位置情報)を抽出し、推定部15が、抽出部13により抽出された領域の属性(上述の比較属性情報)を推定する(ステップS12)。
【0051】
次に、記憶制御部12が、比較領域毎に、比較領域の比較位置情報と、比較領域の比較属性情報と、が関連付けられた識別キーを保持する(ステップS13)。
【0052】
次に、識別部16が、クエリ帳票と照合していない未処理のモデル帳票があるか否かを判定する(ステップS14)。未処理のモデル帳票がある場合(ステップS14,Yes)、当該モデル帳票を取得し(ステップS15)、当該モデル帳票の識別キーを取得する(ステップS16)。
【0053】
次に、識別部16は、ステップS13で保持されたクエリ帳票の識別キーと、ステップS16で取得されたモデル帳票の識別キーとを照合することによって、クエリ帳票を識別する(ステップS17)。
【0054】
クエリ帳票の識別キーとモデル帳票の識別キーとが一致する場合(ステップS18,Yes)、識別部16は、識別された帳票を示す情報(例えば、定型帳票の種類及び様式など)を出力し(ステップS19)、識別処理は終了する。
【0055】
クエリ帳票の識別キーとモデル帳票の識別キーとが一致しない場合(ステップS18,No)、処理はステップS14に戻る。
【0056】
未処理のモデル帳票がない場合(ステップS14,No)、識別部16は、クエリ帳票が、記憶部11に記憶されている照合対象のモデル帳票と不一致であることを示す情報を出力し(ステップS20)、識別処理は終了する。
【0057】
以上、説明したように、実施形態の情報処理装置1では、記憶制御部12が、識別対象を示すモデル画像に含まれる参照領域毎に、参照領域の参照位置情報と、参照領域の参照属性情報と、を関連付けて記憶部11に記憶する。抽出部13は、クエリ画像から、比較領域と、比較領域の比較位置情報と、比較領域の比較属性情報を抽出する。識別部16は、参照位置情報と比較位置情報とによる位置の照合と、参照属性情報と比較属性情報とによる属性の照合とに基づいて、クエリ画像を識別する。
【0058】
これにより実施形態の情報処理装置1によれば、より速い処理速度で、より高精度に識別対象を識別することができる。
【0059】
(実施形態の変形例1)
次に実施形態の変形例1について説明する。変形例1の説明では、実施形態と同様の説明については省略し、実施形態と異なる箇所について説明する。変形例1では、複数の装置によってクエリ画像の識別処理を行う場合について説明する。
【0060】
[装置構成の例]
図9は、実施形態の変形例1の情報処理システムの装置構成の例を示す図である。変形例1の情報処理システム100は、クライアント装置2及びサーバ装置3を備える。クライアント装置2及びサーバ装置3は、ネットワーク200を介して接続される。なお、ネットワーク200の通信方式は、有線方式でもよいし、無線方式でもよい。また、ネットワーク200は、有線方式と無線方式とを組み合わせて構成されていてもよい。
【0061】
変形例1では、クライアント装置2及びサーバ装置3の組み合わせによって、上述の実施形態の各機能(
図4参照)が実現される。上述の実施形態の各機能は、クライアント装置2及びサーバ装置3のどちらに備えられていてもよい。例えば、クライアント装置2が、上述の抽出部13及び算出部14を備え、サーバ装置3が、上述の記憶部11、記憶制御部12、推定部15及び識別部16を備えてもよい。
【0062】
(実施形態の変形例2)
次に実施形態の変形例2について説明する。変形例2の説明では、実施形態と同様の説明については省略し、実施形態と異なる箇所について説明する。変形例2では、識別部16による識別処理の実行方法のバリエーションについて説明する。
【0063】
例えば、記憶制御部12は、モデル画像(例えば、モデル帳票)毎に、識別に使用される領域の範囲を記憶部11に更に記憶してもよい。抽出部13は、クエリ画像ごとに、識別に使用される領域の範囲をさらに抽出する。そして、識別部16が、上述の参照位置情報と比較位置情報とが、識別に使用される領域の範囲に含まれる場合、参照位置情報と比較位置情報とによる位置の照合と、参照属性情報と比較属性情報とによる属性の照合とに基づいて、クエリ画像を識別してもよい。
【0064】
識別に使用される領域の範囲が予め定められていることによって、モデル帳票と比較されるクエリ画像がシフト、回転、拡大、または縮小されている場合でも、より容易に対応することができる。
【0065】
また、識別部16は、抽出部13によりクエリ画像から抽出された、識別に使用される領域をもとに、参照位置情報との位置の照合に使用される比較位置情報を補正してもよい。
【0066】
また例えば、識別部16は、クエリ画像から抽出された、識別に使用される領域の中心に、より近い比較位置情報により位置が特定される比較領域から順番に、位置の照合と属性の照合とを実行してもよい。これにより、クエリ画像の中心(座標基準点)ほど位置ずれの許容範囲が小さいため、識別対象の絞り込みがききやすいという効果が得られる。
【0067】
最後に、実施形態の情報処理装置1、クライアント装置2及びサーバ装置3のハードウェア構成の例について説明する。
【0068】
[ハードウェア構成の例]
図10は、実施形態の情報処理装置1、クライアント装置2及びサーバ装置3のハードウェア構成の例を示す図である。実施形態の情報処理装置1、クライアント装置2及びサーバ装置3は、プロセッサ301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306を備える。プロセッサ301、主記憶装置302、補助記憶装置303、表示装置304、入力装置305及び通信装置306は、バス310を介して接続されている。
【0069】
なお、情報処理装置1、クライアント装置2及びサーバ装置3は、上記構成の一部が備えられていなくてもよい。例えば、情報処理装置1、クライアント装置2及びサーバ装置3が、外部の装置の入力機能及び表示機能を利用可能な場合、情報処理装置1、クライアント装置2及びサーバ装置3に表示装置304及び入力装置305が備えられていなくてもよい。
【0070】
プロセッサ301は、補助記憶装置303から主記憶装置302に読み出されたプログラムを実行する。主記憶装置302は、ROM(Read Only Memory)及びRAM(Random Access Memory)等のメモリである。補助記憶装置303は、HDD(Hard Disk Drive)及びメモリカード等である。
【0071】
表示装置304は、例えば液晶ディスプレイ等である。入力装置305は、情報処理システム10を操作するためのインタフェースである。なお、表示装置304及び入力装置305は、表示機能と入力機能とを有するタッチパネル等により実現されていてもよい。通信装置306は、他の装置と通信するためのインタフェースである。
【0072】
例えば、情報処理装置1、クライアント装置2及びサーバ装置3で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルで、メモリカード、ハードディスク、CD-RW、CD-ROM、CD-R、DVD-RAM及びDVD-R等のコンピュータで読み取り可能な記憶媒体に記録されてコンピュータ・プログラム・プロダクトとして提供される。
【0073】
また例えば、情報処理装置1、クライアント装置2及びサーバ装置3で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。
【0074】
また例えば、情報処理装置1、クライアント装置2及びサーバ装置3で実行されるプログラムをダウンロードさせずにインターネット等のネットワーク経由で提供するように構成してもよい。具体的には、例えばASP(Application Service Provider)型のクラウドサービスによって構成してもよい。
【0075】
また例えば、情報処理装置1、クライアント装置2及びサーバ装置3のプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
【0076】
情報処理装置1、クライアント装置2及びサーバ装置3で実行されるプログラムは、上述の機能構成のうち、プログラムによっても実現可能な機能を含むモジュール構成となっている。当該各機能は、実際のハードウェアとしては、プロセッサ301が記憶媒体からプログラムを読み出して実行することにより、上記各機能ブロックが主記憶装置302上にロードされる。すなわち上記各機能ブロックは主記憶装置302上に生成される。
【0077】
なお上述した各機能の一部又は全部をソフトウェアにより実現せずに、IC(Integrated Circuit)等のハードウェアにより実現してもよい。
【0078】
また複数のプロセッサ301を用いて各機能を実現してもよく、その場合、各プロセッサ301は、各機能のうち1つを実現してもよいし、各機能のうち2つ以上を実現してもよい。
【0079】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0080】
1 情報処理装置
2 クライアント装置
3 サーバ装置
11 記憶部
12 記憶制御部
13 抽出部
14 算出部
15 推定部
16 識別部
100 情報処理システム
200 ネットワーク
301 プロセッサ
302 主記憶装置
303 補助記憶装置
304 表示装置
305 入力装置
306 通信装置
310 バス