(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-13
(45)【発行日】2024-02-21
(54)【発明の名称】情報処理装置、及び情報処理プログラム
(51)【国際特許分類】
G06V 30/412 20220101AFI20240214BHJP
G06F 3/0483 20130101ALI20240214BHJP
G06F 40/114 20200101ALI20240214BHJP
H04N 1/387 20060101ALI20240214BHJP
【FI】
G06V30/412
G06F3/0483
G06F40/114
H04N1/387
(21)【出願番号】P 2020030965
(22)【出願日】2020-02-26
【審査請求日】2023-01-20
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】山本 拓馬
(72)【発明者】
【氏名】桑野 綾
(72)【発明者】
【氏名】佐藤 満
(72)【発明者】
【氏名】高橋 透
【審査官】佐藤 直樹
(56)【参考文献】
【文献】特開2002-176526(JP,A)
【文献】特開2002-312385(JP,A)
【文献】特開平11-039465(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/412
G06F 3/0483
G06F 40/114
H04N 1/387
(57)【特許請求の範囲】
【請求項1】
プロセッサを有し、前記プロセッサは、
複数の書類を含む紙媒体を読み取った画像である読取画像と、前記書類に含まれる項目からユーザによって指定された項目の情報である項目情報と、を取得し、
前記項目情報に関連付けられた文字列を前記読取画像から抽出し、
抽出された前記文字列が、前記読取画像の前頁において抽出した前記文字列と異なっている場合、抽出を開始した頁から、異なる前記文字列が含まれる頁の前頁までを一式の書類として分割する分割位置を設定し、
前記分割位置に応じて分割した前記読取画像を出力
し、
前記一式の書類の最大頁及び最大部数の少なくとも一方の設定値をさらに取得し、前記設定値を超えた場合、前記設定値を超えた旨の通知を行う
情報処理装置。
【請求項2】
プロセッサを有し、前記プロセッサは、
複数の書類を含む紙媒体を読み取った画像である読取画像と、前記書類に含まれる項目からユーザによって指定された項目の情報である項目情報と、を取得し、
前記項目情報に関連付けられた文字列を前記読取画像から抽出し、
前記文字列を抽出する領域である抽出領域をさらに取得し、
単一頁に複数の前記抽出領域が設定されている場合、前記抽出領域の各々に優先順位を設定し、
前記読取画像の前記抽出領域から前記項目情報に関連付けられた前記文字列を抽出し、
抽出された前記文字列が、前記読取画像の前頁において抽出した前記文字列と異なっている場合、抽出を開始した頁から、異なる前記文字列が含まれる頁の前頁までを一式の書類として分割する分割位置を設定し、
前記分割位置に応じて分割した前記読取画像を出力する、
情報処理装置。
【請求項3】
前記プロセッサは、前記設定値を超えた場合、ユーザによって指定された分割位置をさらに取得し、取得した前記分割位置に応じて、前記設定値を超えた書類を分割して出力する請求項
1に記載の情報処理装置。
【請求項4】
前記プロセッサは、前記設定値を超えた場合、前記項目情報に関連付けられた文字列を前記読取画像から抽出する処理を停止する請求項
1に記載の情報処理装置。
【請求項5】
前記プロセッサは、前記読取画像、及び前記分割位置をさらに表示する請求項1から請求項4の何れか1項に記載の情報処理装置。
【請求項6】
前記プロセッサは、ユーザによって指定された分割位置をさらに取得し、取得した前記分割位置に応じて、設定された前記分割位置の修正、追加、及び削除の少なくとも1つの処理を行う請求項5に記載の情報処理装置。
【請求項7】
前記プロセッサは、ユーザによる抽出領域の指定を受け付ける請求項
2に記載の情報処理装置。
【請求項8】
前記プロセッサは、前記文字列を抽出した領域をさらに記憶し、記憶した前記領域を前記抽出領域に設定する請求項
2又は請求項
7に記載の情報処理装置。
【請求項9】
前記プロセッサは、前記読取画像から抽出した前記文字列をさらに記憶し、抽出された前記文字列が前記読取画像の前頁において抽出した前記文字列と異なっている場合、抽出された前記文字列と、記憶された前記文字列と、を比較して抽出された前記文字列を含む前記読取画像の頁を、記憶された前記文字列を含む分割された前記読取画像に追加する請求項1から請求項
8の何れか1項に記載の情報処理装置。
【請求項10】
前記プロセッサは、抽出された文字列と、記憶された文字列とが対応する場合、抽出された文字列を含む前記読取画像の頁を、記憶された文字列を含む分割された前記読取画像に追加する請求項
9に記載の情報処理装置。
【請求項11】
前記プロセッサは、抽出された前記文字列と、記憶された前記文字列と、が対応する場合、書類が整列されていない旨の通知を行う請求項
9又は請求項1
0に記載の情報処理装置。
【請求項12】
前記プロセッサは、前記読取画像から前記文字列を抽出した場合、最後に抽出した文字列が含まれる頁の次の頁から抽出を再開する請求項1から請求項1
1の何れか1項に記載の情報処理装置。
【請求項13】
コンピュータに
複数の書類を含む紙媒体を読み取った画像である読取画像と、前記書類に含まれる項目からユーザによって指定された項目の情報である項目情報と、を取得し、
前記項目情報に関連付けられた文字列を前記読取画像から抽出し、
抽出された前記文字列が、前記読取画像の前頁において抽出した前記文字列と異なっている場合、抽出を開始した頁から、異なる前記文字列が含まれる頁の前頁までを一式の書類として分割する分割位置を設定し、
前記分割位置に応じて分割した前記読取画像を出力
し、
前記一式の書類の最大頁及び最大部数の少なくとも一方の設定値をさらに取得し、前記設定値を超えた場合、前記設定値を超えた旨の通知を行う
ことを実行させるための情報処理プログラム。
【請求項14】
コンピュータに
複数の書類を含む紙媒体を読み取った画像である読取画像と、前記書類に含まれる項目からユーザによって指定された項目の情報である項目情報と、を取得し、
前記項目情報に関連付けられた文字列を前記読取画像から抽出し、
前記文字列を抽出する領域である抽出領域をさらに取得し、
単一頁に複数の前記抽出領域が設定されている場合、前記抽出領域の各々に優先順位を設定し、
前記読取画像の前記抽出領域から前記項目情報に関連付けられた前記文字列を抽出し、
抽出された前記文字列が、前記読取画像の前頁において抽出した前記文字列と異なっている場合、抽出を開始した頁から、異なる前記文字列が含まれる頁の前頁までを一式の書類として分割する分割位置を設定し、
前記分割位置に応じて分割した前記読取画像を出力する、
ことを実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、及び情報処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、申請を特定するための申請特定情報を含む申請情報を記憶する第1の外部装置及び前記申請特定情報と関連付けられた保存画像データを前記第1の外部装置から参照可能に記憶する第2の外部装置と通信可能に構成された情報処理装置であって、前記第1の外部装置に記憶された申請特定情報を含む用紙と申請特定情報を含まない用紙とが順次読み込まれ、生成された画像データを入力する入力手段と、前記用紙に含まれる前記申請特定情報を識別する識別手段と、前記識別手段による識別結果に基づいて、前記入力手段により入力された画像データを申請単位に分割する分割手段と、前記分割手段により分割された画像データ毎に、該当する申請特定情報を含む属性データを生成する属性データ生成手段と、前記分割手段により分割された画像データを前記保存画像データとして前記第2の外部装置に転送するとともに、前記属性データ生成手段により生成された属性データを前記第2の外部装置に転送する転送手段とを有することを特徴とする情報処理装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
例えば、ユーザによって記入された紙媒体の書類の画像を読み取ることで、書類の画像から記入された文字列を認識するOCR(Optical Character Recognition)処理を行う情報処理装置がある。
【0005】
ところで、複数の書類をまとめた紙媒体の束をOCR処理する場合において、一式の書類であることを識別するために関連する書類に同一の文字及び記号等を予め付し、同一の文字及び記号等を予め付した紙媒体の束を読み取った画像(以下、「読取画像」という。)を書類の種類毎及び申請単位毎等の一式の書類毎に分割する技術がある。
【0006】
しかしながら、紙媒体の束を読み取った読取画像を分割する場合において、一式の書類であることを識別するために、一式の書類毎に予め同一の文字及び記号等を付した書類を用意する必要があり、必ずしも書類を分割する処理の負担を低減できるとは限らなかった。
【0007】
本発明は、紙媒体の束を読み取った読取画像を分割する場合において、一式の書類であることを識別するために、一式の書類毎に予め同一の文字及び記号等を付した書類を用意する場合と比較して、書類を分割する処理の負担を低減できる情報処理装置、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
第1の態様の情報処理装置は、プロセッサを有し、プロセッサは、複数の書類を含む紙媒体を読み取った画像である読取画像と、書類に含まれる項目からユーザによって指定された項目の情報である項目情報と、を取得し、項目情報に関連付けられた文字列を読取画像から抽出し、抽出された文字列が、読取画像の前頁において抽出した文字列と異なっている場合、抽出を開始した頁から、異なる文字列が含まれる頁の前頁までを一式の書類として分割する分割位置を設定し、分割位置に応じて分割した読取画像を出力する。
【0009】
第2の態様の情報処理装置は、第1の態様に係る情報処理装置において、プロセッサは、一式の書類の最大頁及び最大部数の少なくとも一方の設定値をさらに取得し、設定値を超えた場合、設定値を超えた旨の通知を行う。
【0010】
第3の態様の情報処理装置は、第2の態様に係る情報処理装置において、プロセッサは、設定値を超えた場合、ユーザによって指定された分割位置をさらに取得し、取得した分割位置に応じて、設定値を超えた書類を分割して出力する。
【0011】
第4の態様の情報処理装置は、第2の態様に係る情報処理装置において、プロセッサは、設定値を超えた場合、項目情報に関連付けられた文字列を読取画像から抽出する処理を停止する。
【0012】
第5の態様の情報処理装置は、第1の態様から第4の態様までの何れか1つの態様に係る情報処理装置において、プロセッサは、読取画像、及び分割位置をさらに表示する。
【0013】
第6の態様の情報処理装置は、第5の態様に係る情報処理装置において、プロセッサは、ユーザによって指定された分割位置をさらに取得し、取得した分割位置に応じて、設定された分割位置の修正、追加、及び削除の少なくとも1つの処理を行う。
【0014】
第7の態様の情報処理装置は、第1の態様から第6の態様の何れか1つの態様に係る情報処理装置において、プロセッサは、文字列を抽出する領域である抽出領域をさらに取得し、読取画像の抽出領域から項目情報に関連付けられた文字列を抽出する。
【0015】
第8の態様の情報処理装置は、第7の態様に係る情報処理装置において、プロセッサは、単一頁に複数の抽出領域が設定されている場合、抽出領域の各々に優先順位を設定する。
【0016】
第9の態様の情報処理装置は、第7の態様又は第8の態様に係る情報処理装置において、プロセッサは、ユーザによる抽出領域の指定を受け付ける。
【0017】
第10の態様の情報処理装置は、第7の態様から第9の態様の何れか1つの態様に係る情報処理装置において、プロセッサは、文字列を抽出した領域をさらに記憶し、記憶した領域を抽出領域に設定する。
【0018】
第11の態様の情報処理装置は、第1の態様から第10の態様の何れか1つの態様に係る情報処理装置において、プロセッサは、読取画像から抽出した文字列をさらに記憶し、抽出された文字列が読取画像の前頁において抽出した文字列と異なっている場合、抽出された文字列と、記憶された文字列と、を比較して抽出された文字列を含む読取画像の頁を、記憶された文字列を含む分割された読取画像に追加する。
【0019】
第12の態様の情報処理装置は、第11の態様に係る情報処理装置において、プロセッサは、抽出された文字列と、記憶された文字列とが対応する場合、抽出された文字列を含む読取画像の頁を、記憶された文字列を含む分割された読取画像に追加する。
【0020】
第13の態様の情報処理装置は、第11の態様又は第12の態様に係る情報処理装置において、プロセッサは、抽出された文字列と、記憶された文字列と、が対応する場合、書類が整列されていない旨の通知を行う。
【0021】
第14の態様の情報処理装置は、第1の態様から第13の態様の何れか1つの態様に係る情報処理装置において、プロセッサは、読取画像から文字列を抽出した場合、最後に抽出した文字列が含まれる頁の次の頁から抽出を再開する。
【0022】
第15の態様の情報処理プログラムは、コンピュータに複数の書類を含む紙媒体を読み取った画像である読取画像と、書類に含まれる項目からユーザによって指定された項目の情報である項目情報と、を取得し、項目情報に関連付けられた文字列を読取画像から抽出し、抽出された文字列が、読取画像の前頁において抽出した文字列と異なっている場合、抽出を開始した頁から、異なる文字列が含まれる頁の前頁までを一式の書類として分割する分割位置を設定し、分割位置に応じて分割した読取画像を出力することを実行させる。
【発明の効果】
【0023】
第1の態様の情報処理装置及び第15の態様の情報処理プログラムによれば、一式の書類であることを識別するために、一式の書類毎に予め同一の文字及び記号等を付した書類を用意する場合と比較して、書類を分割する処理の負担を低減できる。
【0024】
第2の態様の情報処理装置によれば、一式の書類の最大頁及び最大部数を考慮しない場合と比較して、より精度よく書類を分割することができる。
【0025】
第3の態様の情報処理装置によれば、ユーザによって指定される分割位置を考慮しない場合と比較して、分割する処理の負荷を低減することができる。
【0026】
第4の態様の情報処理装置によれば、項目情報に関連付けられた文字列を読取画像から抽出する処理を停止しない場合と比較して、より早く不正な書類が含まれていることを検出することができる。
【0027】
第5の態様の情報処理装置によれば、書類の分割状況を視覚によって確認することができる。
【0028】
第6の態様の情報処理装置によれば、ユーザによって指定される分割位置を考慮しない場合と比較して、より精度よく分割位置を設定させることができる。
【0029】
第7の態様の情報処理装置によれば、文字列を抽出する領域を考慮しない場合と比較して、処理時間をより低減することができる。
【0030】
第8の態様の情報処理装置によれば、優先順位を考慮しない場合と比較して、抽出する精度をより向上させることができる。
【0031】
第9の態様の情報処理装置によれば、ユーザによって指定される抽出領域を考慮しない場合と比較して、抽出する精度をより向上させることができる。
【0032】
第10の態様の情報処理装置によれば、記憶された抽出領域を考慮しない場合と比較して、抽出する負荷をより低減させることができる。
【0033】
第11の態様の情報処理装置によれば、文字列を抽出した書類と、過去に抽出した一式の書類と、の関連を確認することができる。
【0034】
第12の態様の情報処理装置によれば、一式の書類の一部が、他の一式の書類に紛れていた場合であっても、一式の書類として分割することができる。
【0035】
第13の態様の情報処理装置によれば、一式の書類の中に他の書類が紛れていることを検出することができる。
【0036】
第14の態様の情報処理装置によれば、一式の書類と、他の一式の書類と、を区別することができる。
【図面の簡単な説明】
【0037】
【
図1】各実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。
【
図2】各実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。
【
図3】各実施形態に係る読み取った書類の一例を示す模式図である。
【
図4】第1実施形態に係る分割位置の設定の説明に供する書類の一例を示す概略図である。
【
図5】各実施形態に係る分割位置であるページ範囲の一例を示す模式図である。
【
図6】各実施形態に係る分割位置、及び一式の書類の表示の一例を示す模式図である。
【
図7】各実施形態に係る情報処理の一例を示すフローチャートである。
【
図8】第1実施形態に係る分割位置設定処理の一例を示すフローチャートである。
【
図9】第2実施形態に係る分割位置の設定の説明に供する書類の一例を示す概略図である。
【
図10】第2実施形態に係る分割位置設定処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0038】
[第1実施形態]
以下、図面を参照して、本開示の技術を実施するための形態例を詳細に説明する。なお、本実施形態に係る情報処理装置10は、一例として、書類及び帳票等を読み取ったデータを管理するサーバである形態について説明する。しかし、これに限定されない。情報処理装置10は、例えばプリント機能、コピー機能、スキャン機能、及びファクシミリ機能等の機能を有する複合機に搭載されてもよいし、パーソナルコンピュータ等の端末でもよい。
【0039】
図1は、本実施形態に係る情報処理装置10のハードウェア構成の一例を示すブロック図である。
図1に示すように、本実施形態に係る情報処理装置10は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、ストレージ14、入力部15、モニタ16、及び通信インターフェース(通信I/F)17を含んで構成されている。CPU11、ROM12、RAM13、ストレージ14、入力部15、モニタ16、及び通信I/F17の各々はバス18により相互に接続されている。ここで、CPU11は、プロセッサの一例である。
【0040】
CPU11は、情報処理装置10の全体を統括し、制御する。ROM12は、本実施形態で用いる情報処理プログラムを含む各種プログラム及びデータ等を記憶している。RAM13は、各種プログラムの実行時のワークエリアとして用いられるメモリである。CPU11は、ROM12に記憶されたプログラムをRAM13に展開して実行することにより、画像データから文字を抽出し、記憶する処理を行う。ストレージ14は、一例としてHDD(Hard Disk Drive)、SSD(Solid State Drive)、又はフラッシュメモリ等である。なお、ストレージ14には、情報処理プログラム等を記憶してもよい。入力部15は、文字の入力等を受け付けるキーボード及びマウス等である。モニタ16は、画像データ等を表示する。通信I/F17は、データの送受信を行う。
【0041】
次に、
図2を参照して、情報処理装置10の機能構成について説明する。
図2は、本実施形態に係る情報処理装置10の機能的な構成の一例を示すブロック図である。
【0042】
図2に示すように、情報処理装置10は、取得部21、抽出部22、記憶部23、設定部24、及び出力部25を有する。CPU11が情報処理プログラムを実行することで、取得部21、抽出部22、記憶部23、設定部24、及び出力部25として機能する。
【0043】
取得部21は、複数の書類を含む紙媒体を読み取った画像(以下、「読取画像」という。)と、書類に含まれる項目からユーザによって指定された項目の情報(以下、「項目情報」という。)と、を取得する。取得部21は、ユーザによって指定された一式の書類の最大ページ、及び最大部数の設定値と、ユーザによって指定された一式の書類の分割位置と、文字列を抽出する領域である抽出領域と、を取得する。
【0044】
なお、本実施形態では、OCR処理を用いて、読取画像から書類に記載されている項目、及び文字列を抽出する形態について説明する。ここで、項目とは、書類に記載されている「氏名」、及び「住所」等の記載する項目であり、文字列とは、項目に応じて、ユーザが記載した自身の氏名、及び住所等である。また、本実施形態に係る一式の書類とは、同一人物が提出した複数枚の一揃いの書類である。
【0045】
抽出部22は、項目情報を用いて、読取画像に含まれる項目に関連付けられた文字列を読取画像から抽出する。また、抽出部22は、抽出した文字列が位置する領域を抽出する。
【0046】
記憶部23は、分割した読取画像、読取画像から取得した文字列、及び文字列を抽出した領域を記憶する。
【0047】
設定部24は、抽出した文字列が、読取画像の前ページにおいて抽出した文字列と異なっている場合、抽出を開始したページから、異なる文字列が含まれるページの前ページまでを一式の書類として分割する分割位置を設定する。
【0048】
出力部25は、分割位置に応じて分割した読取画像を出力する。
【0049】
次に、情報処理装置10の作用について説明する前に、
図3から
図6を参照して、本実施形態に係る分割位置を設定する手法について説明する。
【0050】
まず、
図3及び
図4を参照して、分割位置の設定について説明する。
図3は、本実施形態に係る読み取った書類の一例を示す模式図である。
図4は、本実施形態に係る分割位置の設定の説明に供する書類の一例を示す概略図である。
【0051】
一例として、
図3に示すように、書類には、項目として、管理番号、発行日、氏名、住所、及び電話番号が含まれており、「管理番号:12345」のように、項目の横に文字列が記載されている。抽出する項目として、ユーザによって「管理番号」が指定された場合、情報処理装置10は、書類を読み取った画像に対して、OCR処理を行った結果から管理番号の横に記載されている「12345」を抽出する。このように、予め項目を指定し、指定した項目に関連付けられている文字列の抽出を行うことを「キーバリュー抽出」という。本実施形態では、各々の書類に記載された項目(キー)に対応する文字列(バリュー)を抽出する形態について説明する。ここで、キーバリュー抽出では、項目に関連付けられている文字列の相対位置(項目、及び文字列の位置関係)を予め設定しておく必要がある。本実施形態では、項目から右側に位置する文字列を抽出する設定がなされている形態について説明する。
【0052】
情報処理装置10は、複数の書類の画像である読取画像と、ユーザによって指定され、抽出する項目である項目情報を取得する。
【0053】
情報処理装置10は、読取画像から項目情報に係る項目、及び項目に関連付けられている文字列を抽出し、記憶する。例えば、項目情報として、「管理番号」が指定された場合、情報処理装置10は、項目「管理番号」の右側に記載された「12345」を抽出し、2ページ以降の管理番号と比較する比較対象として、記憶する。ここで、以下では、比較するために記憶した文字列を「比較対象」という。
【0054】
図4示すように、情報処理装置10は、読取画像に含まれる書類の画像の各々から管理番号に関連付けられている文字列を抽出し、抽出した文字列と、記憶した比較対象と、の比較を行う。例えば、
図4において、3ページ目の書類の画像の管理番号が「1」であり、4ページ目の書類の画像の管理番号が「100」である場合、情報処理装置10は、1ページから3ページまでを一式の書類として、ページ番号を記憶して分割位置を設定する。また、情報処理装置10は、抽出した管理番号「100」を比較対象として、記憶して、最後に文字列を抽出した次のページである5ページ目から、文字列の抽出を再開して管理番号の比較を行う。
【0055】
ここで、情報処理装置10が管理番号を抽出できなかった場合、文字列を抽出できなかったページを飛ばして処理を続行することで、一式の書類をまとめられる。具体的には、1ページ目の文字列と、3ページ目の文字列が同一であれば、2ページ目の文字列も同一であると推定され、文字列が抽出できなかった場合であっても一式の書類としてまとめられる。
【0056】
しかしながら、文字列が抽出できなかったページが連続して複数ページ存在した場合、複数の一式の書類が1つにまとめられてしまうことがある。この場合、予め一式の書類のページ数の上限を設定しておくことで、複数の一式の書類がまとめられる場合を避けられる。つまり、情報処理装置10は、ユーザから指定された一式の書類の最大ページ数を取得して、設定値として設定し、一式の書類のページ数が設定値を超えた場合、前ページまでを一式の書類として、分割位置を設定する。
【0057】
なお、本実施形態では、文字列が抽出できないページが連続して複数ページ存在した場合に対応するために、文字列が抽出できないページを飛ばして分割位置を設定する処理を継続する形態について説明した。しかし、これに限定されない。文字列が抽出できないページが連続して複数ページ存在した場合、分割位置を設定する処理を停止してユーザに通知してもよい。また、分割位置を設定する処理を停止した場合、ユーザに文字列を入力させて、分割位置を設定する処理を継続してもよいし、書類の読み取りから実行する旨の通知をユーザに行ってもよい。
【0058】
また、本実施形態では、設定値として、一式の書類の上限値である最大ページ数を設定する形態について説明した。しかし、これに限定されない。設定値として、連続して文字列が抽出できないページの数の上限を設定してもよいし、設定値として、読取画像に含まれる一式の書類の部数の上限値である最大部数を設定してもよい。例えば、情報処理装置10が、想定とは異なる項目を抽出した場合、意図しない位置に分割位置が設定され、分割位置が過剰に設定される場合がある。この場合、一式の書類の部数の上限値を設定することで、分割位置が過剰に設定されていることが早期に検出される。
【0059】
また、本実施形態では、抽出した文字列を記憶する形態について説明した。しかし、これに限定されない。文字列を抽出した領域を記憶してもよい。つまり、抽出した文字列は、各々の書類の同一の位置に付されていることが多いため、文字列を抽出した位置から、文字列が含まれる領域を特定して記憶し、各々の書類における記憶した領域から文字列の抽出を行うことで、文字列の抽出が容易となる。ここで、文字列が含まれる領域は、「抽出領域」の一例である。
【0060】
また、1ページに文字列を抽出した抽出領域が複数ある場合、複数の領域に優先順位を設定して、優先順位に応じて、文字列の抽出を行ってもよい。優先順位は、ユーザによって指定されてもよいし、過去に同一の書類について抽出した結果を用いて、抽出した回数が多い順に優先順位を設定してもよい。また、1ページに文字列を抽出した抽出領域が複数ある場合、ユーザから抽出領域の指定を受け付けてもよい。
【0061】
次に、
図5及び
図6を参照して、分割した書類を表示する手法について説明する。
図5は、本実施形態に係る分割位置であるページ範囲の一例を示す模式図である。
図6は、本実施形態に係る分割位置、及び一式の書類の表示の一例を示す模式図である。
【0062】
まず、
図5を参照して、分割した書類のページ範囲を表示する一例について説明する。
【0063】
一例として、
図5に示すように、情報処理装置10は、分割位置表示領域31を有しており、分割位置表示領域31は、文書番号、ページ範囲、ページ数、及びメッセージを表示する。文書番号は、分割した一式の書類毎に一意に割り振られる数字であり、ページ範囲は、読取画像として取得した書類における一式の書類の開始ページ、及び終了ページであり、ページ数は、各々の一式の書類のページ数である。メッセージは、一式の書類が設定値を超過した場合等、ユーザに通知するための文字列である。
【0064】
図5に示すように、情報処理装置10は、設定した分割位置に応じて、一式の書類毎のページ範囲、ページ数、及びメッセージを表示して、ユーザに提示を行う。また、分割位置を設定する処理において、設定値を超えた場合、メッセージに設定値を超えている旨の通知を行う。
【0065】
なお、本実施形態では、設定値を超えた場合、通知を行う形態について説明した。しかし、これに限定されない。設定値を超えた場合、処理を停止してもよいし、停止して、かつ設定値を超えた旨を通知してもよいし、設定値を超えた一式の書類に対して、ユーザから分割位置の指定を受け付けてもよい。
【0066】
また、本実施形態では、分割位置として、ページ範囲、ページ数、及びメッセージを表示する形態について説明した。しかし、これに限定されない。ページ範囲に応じて、読取画像を分割し、モニタに表示してもよいし、読取画像を分割して異なる場所に設置されているサーバ等に送信してもよいし、読取画像と共に、設定した分割位置を表示してもよい。例えば、
図6に示すように、情報処理装置10は、取得した読取画像30の一覧、及び分割位置32を表示してもよい。
【0067】
図6に示すように、情報処理装置10は、モニタ16に読取画像30、及び設定した分割位置32をモニタ16に表示する。また、情報処理装置10は、ユーザの指示に応じて、設定された分割位置32の修正、追加、削除を受け付けてもよい。
【0068】
次に、
図7及び
図8を参照して、本実施形態に係る情報処理プログラムの作用について説明する。
図7は、本実施形態に係る情報処理の一例を示すフローチャートである。CPU11がROM12又はストレージ14から情報処理プログラムを読み出し、実行することによって、
図7に示す情報処理が実行される。
図7に示す情報処理は、例えば、ユーザから情報処理プログラムの実行指示が入力された場合、情報処理が実行される。
【0069】
ステップS101において、CPU11は、ユーザから指定された項目情報を取得する。
【0070】
ステップS102において、CPU11は、初期値として、開始ページ、及び終了ページに1を設定する。
【0071】
ステップS103において、CPU11は、カウンタに1を設定する。
【0072】
ステップS104において、文書番号に1を設定する。
【0073】
ステップS105において、CPU11は、比較対象に初期値を設定する。
【0074】
ステップS106において、CPU11は、読取画像である書類の画像を取得する。
【0075】
ステップS107において、CPU11は、設定されたページ数の書類の画像に対してOCR処理を実行し、読取画像から項目、及び文字列を取得する。
【0076】
ステップS108において、CPU11は、読取画像から項目情報に対応する文字列を抽出できたか否かの判定を行う。項目情報に対応する文字列を抽出できた場合(ステップS108:YES)、CPU11は、ステップS109に移行する。一方、項目情報に対応する文字列を抽出できなかった場合(ステップS108:NO)、CPU11は、ステップS110に移行する。
【0077】
ステップS109において、CPU11は、分割位置設定処理を行う。なお、分割位置設定処理については、後述する
図8において詳細に説明する。
【0078】
ステップS110において、CPU11は、読取画像に次ページがないか否かの判定を行う。読取画像に次ページがない場合(ステップS110:YES)、CPU11は、ステップS112に移行する。一方、読取画像に次ページがある場合(ステップS110:NO)、CPU11は、ステップS111に移行する。
【0079】
ステップS111において、CPU11は、カウンタに1を加算し、ステップS107に移行する。
【0080】
ステップS112において、CPU11は、終了ページにカウンタの値を設定する。
【0081】
ステップS113において、CPU11は、開始ページ、及び終了ページを用いて、ページ数を算出する。
【0082】
ステップS114において、CPU11は、文書番号に開始ページ、終了ページ、及びページ数を関連付けて記憶する。
【0083】
ステップS115において、CPU11は、ページ範囲(開始ページ、及び終了ページ)に応じて、読取画像を分割する。
【0084】
ステップS116において、CPU11は、分割した読取画像を出力する。
【0085】
次に、
図8を参照して、本実施形態に係る分割位置設定処理プログラムの作用について説明する。
図8は、本実施形態に係る分割位置設定処理の一例を示すフローチャートである。CPU11がROM12又はストレージ14から分割位置設定処理プログラムを読み出し、実行することによって、
図8に示す情報処理が実行される。
図8に示す分割位置設定処理は、例えば、情報処理プログラムから分割位置設定処理プログラムの実行指示が入力された場合、分割位置設定処理が実行される。
【0086】
ステップS201において、CPU11は、比較対象に初期値が設定されているか否かの判定を行う。比較対象に初期値が設定されている場合(ステップS201:YES)、CPU11は、ステップS202に移行する。一方、比較対象に初期値が設定されていない場合(ステップS201:NO)、CPU11は、ステップS203に移行する。
【0087】
ステップS202において、CPU11は、比較対象に抽出した文字列を設定する。
【0088】
ステップS203において、CPU11は、抽出した文字列と、比較対象と、が同一であるか否かの判定を行う。抽出した文字列と、比較対象と、が同一である場合(ステップS203:YES)、CPU11は、分割位置設定処理を終了する。一方、抽出した文字列と、比較対象と、が同一でない場合(ステップS203:NO)、CPU11は、ステップS204に移行する。
【0089】
ステップS204において、CPU11は、終了ページに、カウンタの値-1を設定する。
【0090】
ステップS205において、CPU11は、開始ページ、及び終了ページを用いて、ページ数を算出する。
【0091】
ステップS206において、CPU11は、文書番号に開始ページ、終了ページ、及びページ数を関連付けて記憶する。
【0092】
ステップS207において、CPU11は、開始ページにカウンタの値を設定する。
【0093】
ステップS208において、CPU11は、文書番号に1を加算する。
【0094】
ステップS209において、CPU11は、比較対象に取得した文字列を設定する。
【0095】
以上説明したように、キーバリュー抽出を用いることで、一式の書類毎に分割位置が設定される。したがって、本実施形態によれば、一式の書類であることを識別するために、一式の書類毎に予め同一の文字及び記号等を付した書類を用意する場合と比較して、書類を分割する処理の負担が低減される。
【0096】
[第2実施形態]
第1実施形態では、順番に並べられた書類に対して、比較対象と、項目に関連付けられ、抽出した文字列と、を比較して分割位置を設定する形態について説明した。本実施形態では、入れ違いが生じている書類に対して、過去に抽出した文字列と、項目に関連付けられ、抽出した文字列と、を比較して、分割位置を設定する形態について説明する。なお、本実施形態に係る情報処理装置10のハードウェア構成(
図1参照)、情報処理装置10の機能的な構成(
図2参照)、及び書類を示す概略図(
図3参照)は、第1実施形態と同様であるため、説明を省略する。また、本実施形態に係る分割位置の設定の説明に供する書類の概略図(
図4参照)、分割位置であるページ範囲を示す模式図(
図5参照)、及び分割位置、及び一式の書類を示す模式図(
図6参照)は、第1実施形態と同様であるため、説明を省略する。また、本実施形態に係る情報処理のフロー図(
図7参照)は、第1実施形態と同様であるため、説明を省略する。
【0097】
情報処理装置10の作用について説明する前に、
図9を参照して、本実施形態に係る分割位置を設定する手法について説明する。
図9は、本実施形態に係る分割位置の設定の説明に供する書類の一例を示す概略図である。
【0098】
項目に関連付けられている文字列を抽出して、各々の書類の画像から抽出した文字列を比較して分割位置を設定する場合、書類の順番に入れ違いが生じていると、分割位置が過剰に設定されてしまうことがある。
【0099】
例えば、
図9に示すように、3ページ目から5ページ目までは、前ページと管理番号が異なっているため、1ページ毎に分割位置が設定される。しかしながら、過去に分割した書類の管理番号を記憶し、過去に分割した書類の管理番号と、抽出した管理番号と、を比較することで入れ違いが検出される。
【0100】
具体的には、
図9において、情報処理装置10は、3ページ目の管理番号「100」を抽出して分割位置を設定する場合において、比較対象として記憶した管理番号「1」と、分割した一式の書類(1ページ目及び2ページ目の書類)と、を関連付けて記憶する。また、抽出した管理番号「100」は、比較対象として記憶される。ここで、以下では、分割した一式の書類に関連付けられて記憶された比較対象(文字列)を「抽出済文字列」という。
【0101】
情報処理装置10は、4ページ目の管理番号「1」を抽出し、抽出した管理番号「1」と、記憶されている比較対象の管理番号「100」と、が異なっていると判定した場合、抽出済文字列の管理番号「1」と、抽出した管理番号「1」と、の比較を行う。情報処理装置10は、抽出済文字列の管理番号「1」と、抽出した管理番号「1」と、が同一であると判定した場合、分割された一式の書類に、管理番号を抽出した4ページ目の書類を関連付けて記憶する。
【0102】
つまり、比較対象と、抽出した文字列と、が異なる場合、抽出済文字列と、抽出した文字列と、を比較することで、書類の入れ違いが検出される。
【0103】
次に、
図10を参照して、本実施形態に係る分割位置設定処理プログラムの作用について説明する。
図10は、本実施形態に係る分割位置設定処理の一例を示すフローチャートである。CPU11がROM12又はストレージ14から分割位置設定処理プログラムを読み出し、実行することによって、
図10に示す情報処理が実行される。
図10に示す分割位置設定処理は、例えば、情報処理プログラムから分割位置設定処理プログラムの実行指示が入力された場合、分割位置設定処理が実行される。なお、
図10における
図8に示す情報処理と同一のステップについては、
図8と同一の符号を付して、その説明を省略する。
【0104】
ステップS203において、CPU11は、抽出した文字列と、比較対象と、が同一であるか否かの判定を行う。抽出した文字列と、比較対象と、が同一である場合(ステップS203:YES)、CPU11は、分割位置設定処理を終了する。一方、抽出した文字列と、比較対象と、が同一でない場合(ステップS203:NO)、CPU11は、ステップS210に移行する。
【0105】
ステップS210において、CPU11は、記憶されている文書番号、ページ数、ページ範囲(開始ページ、及び終了ページ)、及び抽出済文字列を取得する。
【0106】
ステップS211において、CPU11は、抽出した文字列と、抽出済文字列と、が同一であるか否かの判定を行う。抽出した文字列と、抽出済文字列と、が同一である場合(ステップS211:YES)、CPU11は、ステップS213に移行する。一方、抽出した文字列と、抽出済文字列と、が同一でない場合(ステップS211:NO)、CPU11は、ステップS204に移行する。
【0107】
ステップS212において、CPU11は、抽出済文字列として、文書番号に比較対象を関連付けて記憶する。
【0108】
ステップS213において、取得したページ範囲にカウンタの値を追加する。
【0109】
ステップS214において、取得したページ数に1を加算する。
【0110】
ステップS215において、文書番号に、カウンタの値、及びページ数を関連付けて記憶する。
【0111】
なお、本実施形態では、書類が入れ違いになっている場合、一式の書類に纏める形態について説明した。しかし、これに限定されない。書類の入れ違いを検出した場合、処理を停止して、ユーザに書類が整列されていない、又は入れ違いになっている旨を通知してもよい。
【0112】
以上説明したように、分割した書類に、抽出した文字列を関連付けて記憶することで、入れ違いが生じた書類であっても一式の書類毎に分割される。したがって、本実施形態によれば、一式の書類であることを識別するために、一式の書類毎に予め同一の文字及び記号等を付した書類を用意する場合と比較して、書類を分割する処理の負担が低減される。
【0113】
その他、上記実施形態で説明した情報処理装置10の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。
【0114】
また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
【0115】
なお、上記各実施形態において、プロセッサとは、広義的なプロセッサを指し、例えばCPU等の汎用的なプロセッサや、例えばGPU(Graphics Processing Unit)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、及びプログラマブル論理デバイス等の専用のプロセッサを含むものである。
【0116】
また、上記各実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
【0117】
また、上記各実施形態では、情報処理のプログラムがストレージ14に予め記憶(インストール)されている態様を説明したが、これに限定されない。プログラムは、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
【符号の説明】
【0118】
10 情報処理装置
11 CPU
12 ROM
13 RAM
14 ストレージ
15 入力部
16 モニタ
17 通信I/F
18 バス
21 取得部
22 抽出部
23 記憶部
24 設定部
25 出力部
30 読取画像
31 分割位置表示領域
32 分割位置