IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

<>
  • 特許-情報処理装置、及び情報処理プログラム 図1
  • 特許-情報処理装置、及び情報処理プログラム 図2
  • 特許-情報処理装置、及び情報処理プログラム 図3
  • 特許-情報処理装置、及び情報処理プログラム 図4
  • 特許-情報処理装置、及び情報処理プログラム 図5
  • 特許-情報処理装置、及び情報処理プログラム 図6
  • 特許-情報処理装置、及び情報処理プログラム 図7
  • 特許-情報処理装置、及び情報処理プログラム 図8
  • 特許-情報処理装置、及び情報処理プログラム 図9
  • 特許-情報処理装置、及び情報処理プログラム 図10
  • 特許-情報処理装置、及び情報処理プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-27
(45)【発行日】2024-06-04
(54)【発明の名称】情報処理装置、及び情報処理プログラム
(51)【国際特許分類】
   G06T 1/00 20060101AFI20240528BHJP
   G06Q 10/10 20230101ALI20240528BHJP
   G06V 30/14 20220101ALI20240528BHJP
   G06V 30/412 20220101ALI20240528BHJP
   H04N 1/00 20060101ALI20240528BHJP
【FI】
G06T1/00 200D
G06Q10/10
G06V30/14 340K
G06V30/412
H04N1/00 L
【請求項の数】 15
(21)【出願番号】P 2020055029
(22)【出願日】2020-03-25
(65)【公開番号】P2021157328
(43)【公開日】2021-10-07
【審査請求日】2023-02-28
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】山本 拓馬
(72)【発明者】
【氏名】桑野 綾
(72)【発明者】
【氏名】佐藤 満
(72)【発明者】
【氏名】高橋 透
【審査官】中田 剛史
(56)【参考文献】
【文献】特開2011-108163(JP,A)
【文献】特開2002-312385(JP,A)
【文献】特開平10-021380(JP,A)
【文献】米国特許出願公開第2004/0208371(US,A1)
【文献】特開2001-028041(JP,A)
【文献】特開2018-186411(JP,A)
【文献】特開2020-004170(JP,A)
【文献】特開2019-130746(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00
G06Q 10/10
H04N 1/00
G06V 30/14
G06V 30/412
(57)【特許請求の範囲】
【請求項1】
プロセッサを有し、前記プロセッサは、
複数の書類を含む紙媒体を読み取った画像である読取画像と、前記書類に含まれる項目からユーザによって指定された複数の項目の情報である項目情報と、を取得し、
前記項目情報に含まれる前記項目の各々に関連付けられた文字列を前記読取画像から抽出し、
前記項目情報に含まれる各々の前記項目に必須項目を設定し、
前記必須項目に設定された前記項目に関連付けられる前記文字列を全て抽出した場合、抽出を開始した頁から、最後に抽出した前記文字列が含まれる頁までを一式の書類として分割する分割位置を設定し、
前記分割位置に応じて分割した前記読取画像を出力する、
情報処理装置。
【請求項2】
前記プロセッサは、前記項目情報に含まれる各々の前記項目に必須項目、及び選択項目を設定し、必須項目に設定された前記項目に係る前記文字列を全て抽出した場合、かつ選択項目に係る文字列の少なくとも1つの文字列が抽出された場合、最後に抽出した前記文字列が含まれる頁までを一式の書類として分割位置を設定する請求項1に記載の情報処理装置。
【請求項3】
前記プロセッサは、前記一式の書類の最大頁及び最大部数の少なくとも一方の設定値をさらに取得し、前記設定値を超えた場合、前記設定値を超えた旨の通知を行う請求項1又は請求項2に記載の情報処理装置。
【請求項4】
前記プロセッサは、前記設定値を超えた場合、ユーザによって指定された分割位置をさらに取得し、取得した前記分割位置に応じて、前記設定値を超えた書類を分割して出力する請求項3に記載の情報処理装置。
【請求項5】
前記プロセッサは、前記設定値を超えた場合、前記項目情報に関連付けられた前記文字列を前記読取画像から抽出する処理を停止する請求項3に記載の情報処理装置。
【請求項6】
前記プロセッサは、前記読取画像、及び前記分割位置をさらに表示する請求項1から請求項5の何れか1項に記載の情報処理装置。
【請求項7】
前記プロセッサは、ユーザによって指定された分割位置をさらに取得し、取得した前記分割位置に応じて、設定された前記分割位置の修正、追加、及び削除の少なくとも1つの処理を行う請求項6に記載の情報処理装置。
【請求項8】
前記プロセッサは、前記文字列を抽出する領域である抽出領域をさらに取得し、前記読取画像の前記抽出領域から前記項目情報に関連付けられた前記文字列を抽出する請求項1から請求項7の何れか1項に記載の情報処理装置。
【請求項9】
前記プロセッサは、単一頁に複数の前記抽出領域が設定されている場合、前記抽出領域の各々に優先順位を設定する請求項8に記載の情報処理装置。
【請求項10】
前記プロセッサは、ユーザによる抽出領域の指定を受け付ける請求項8又は請求項9に記載の情報処理装置。
【請求項11】
前記プロセッサは、前記文字列を抽出した領域をさらに記憶し、記憶した前記領域を前記抽出領域に設定する請求項8から請求項10の何れか1項に記載の情報処理装置。
【請求項12】
前記プロセッサは、前記読取画像に含まれる単一頁から、前記項目情報に関連付けられる前記文字列を複数抽出した場合、抽出した複数の前記文字列の内、一つの前記文字列を選択する請求項1から請求項11の何れか1項に記載の情報処理装置。
【請求項13】
前記プロセッサは、前記項目情報に含まれる項目の各々に優先順位をさらに設定し、優先順位に基づいて、一つの文字列を選択する請求項12に記載の情報処理装置。
【請求項14】
前記プロセッサは、前記読取画像から前記文字列を抽出した場合、最後に抽出した前記文字列が含まれる頁の次の頁から抽出を再開する請求項1から請求項13の何れか1項に記載の情報処理装置。
【請求項15】
コンピュータに
複数の書類を含む紙媒体を読み取った画像である読取画像と、前記書類に含まれる項目からユーザによって指定された項目の情報である項目情報と、を取得し、
前記項目情報に含まれる前記項目の各々に関連付けられた文字列を前記読取画像から抽出し、
前記項目情報に含まれる各々の前記項目に必須項目を設定し、
前記必須項目に設定された前記項目に関連付けられる前記文字列を全て抽出した場合、抽出を開始した頁から、最後に抽出した前記文字列が含まれる頁までを一式の書類として分割する分割位置を設定し、
前記分割位置に応じて分割した前記読取画像を出力する、
ことを実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、及び情報処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、申請を特定するための申請特定情報を含む申請情報を記憶する第1の外部装置及び前記申請特定情報と関連付けられた保存画像データを前記第1の外部装置から参照可能に記憶する第2の外部装置と通信可能に構成された情報処理装置であって、前記第1の外部装置に記憶された申請特定情報を含む用紙と申請特定情報を含まない用紙とが順次読み込まれ、生成された画像データを入力する入力手段と、前記用紙に含まれる前記申請特定情報を識別する識別手段と、前記識別手段による識別結果に基づいて、前記入力手段により入力された画像データを申請単位に分割する分割手段と、前記分割手段により分割された画像データ毎に、該当する申請特定情報を含む属性データを生成する属性データ生成手段と、前記分割手段により分割された画像データを前記保存画像データとして前記第2の外部装置に転送するとともに、前記属性データ生成手段により生成された属性データを前記第2の外部装置に転送する転送手段とを有することを特徴とする情報処理装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2009-294792号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
例えば、ユーザによって記入された紙媒体の書類の画像を読み取ることで、書類の画像から記入された文字列を認識するOCR(Optical Character Recognition)処理を行う情報処理装置がある。
【0005】
ところで、複数の書類をまとめた紙媒体の束をOCR処理する場合において、一式の書類であることを識別するために関連する書類に同一の文字及び記号等を予め付し、同一の文字及び記号等を予め付した紙媒体の束を読み取った画像(以下、「読取画像」という。)を書類の種類毎及び申請単位毎等の一式の書類毎に分割する技術がある。
【0006】
しかしながら、紙媒体の束を読み取った読取画像を分割する場合において、一式の書類であることを識別するために、一式の書類毎に予め同一の文字及び記号等を付した書類を用意する必要があり、必ずしも書類を分割する処理の負担を低減できるとは限らなかった。
【0007】
本発明は、紙媒体の束を読み取った読取画像を分割する場合において、一式の書類であることを識別するために、一式の書類毎に予め同一の文字及び記号等を付した書類を用意する場合と比較して、書類を分割する処理の負担を低減できる情報処理装置、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
第1の態様の情報処理装置は、プロセッサを有し、プロセッサは、複数の書類を含む紙媒体を読み取った画像である読取画像と、書類に含まれる項目からユーザによって指定された複数の項目の情報である項目情報と、を取得し、項目情報に含まれる項目の各々に関連付けられた文字列を読取画像から抽出し、項目情報に関連付けられた各々の文字列を読取画像から抽出した場合、抽出を開始した頁から、最後に抽出した文字列が含まれる頁までを一式の書類として分割する分割位置を設定し、分割位置に応じて分割した読取画像を出力する。
【0009】
第2の態様の情報処理装置は、第1の態様に係る情報処理装置において、プロセッサは、一式の書類の最大頁及び最大部数の少なくとも一方の設定値をさらに取得し、設定値を超えた場合、設定値を超えた旨の通知を行う。
【0010】
第3の態様の情報処理装置は、第2の態様に係る情報処理装置において、プロセッサは、設定値を超えた場合、ユーザによって指定された分割位置をさらに取得し、取得した分割位置に応じて、設定値を超えた書類を分割して出力する。
【0011】
第4の態様の情報処理装置は、第2の態様に係る情報処理装置において、プロセッサは、設定値を超えた場合、項目情報に関連付けられた文字列を読取画像から抽出する処理を停止する。
【0012】
第5の態様の情報処理装置は、第1の態様から第4の態様までの何れか1つの態様に係る情報処理装置において、プロセッサは、読取画像、及び分割位置をさらに表示する。
【0013】
第6の態様の情報処理装置は、第5の態様に係る情報処理装置において、プロセッサは、ユーザによって指定された分割位置をさらに取得し、取得した分割位置に応じて、設定された分割位置の修正、追加、及び削除の少なくとも1つの処理を行う。
【0014】
第7の態様の情報処理装置は、第1の態様から第6の態様の何れか1つの態様に係る情報処理装置において、プロセッサは、文字列を抽出する領域である抽出領域をさらに取得し、読取画像の抽出領域から項目情報に関連付けられた文字列を抽出する。
【0015】
第8の態様の情報処理装置は、第7の態様に係る情報処理装置において、プロセッサは、単一頁に複数の抽出領域が設定されている場合、抽出領域の各々に優先順位を設定する。
【0016】
第9の態様の情報処理装置は、第7の態様又は第8の態様に係る情報処理装置において、プロセッサは、ユーザによる抽出領域の指定を受け付ける。
【0017】
第10の態様の情報処理装置は、第7の態様から第9の態様の何れか1つの態様に係る情報処理装置において、プロセッサは、文字列を抽出した領域をさらに記憶し、記憶した領域を抽出領域に設定する。
【0018】
第11の態様の情報処理装置は、第1の態様から第10の態様の何れか1つの態様に係る情報処理装置において、プロセッサは、読取画像に含まれる単一頁から、項目情報に関連付けられる文字列を複数抽出した場合、抽出した複数の文字列の内、一つの文字列を選択する。
【0019】
第12の態様の情報処理装置は、第11の態様に係る情報処理装置において、プロセッサは、項目情報に含まれる項目の各々に優先順位をさらに設定し、優先順位に基づいて、一つの文字列を選択する。
【0020】
第13の態様の情報処理装置は、第1の態様から第12の態様に何れか1つの態様に係る情報処理装置において、プロセッサは、項目情報に含まれる各々の項目に必須項目を設定し、必須項目に設定された項目に関連付けられる文字列を全て抽出した場合、最後に抽出した文字列が含まれる頁までを一式の書類として分割位置を設定する。
【0021】
第14の態様の情報処理装置は、第13の態様に係る情報処理装置において、プロセッサは、項目情報に含まれる各々の項目に必須項目、及び選択項目を設定し、必須項目に設定された項目に係る文字列を全て抽出した場合、かつ選択項目に係る文字列の少なくとも1つの文字列が抽出された場合、最後に抽出した文字列が含まれる頁までを一式の書類として分割位置を設定する。
【0022】
第15の態様の情報処理装置は、第1の態様から第14の態様の何れか1つの態様に係る情報処理装置において、プロセッサは、読取画像から文字列を抽出した場合、最後に抽出した文字列が含まれる頁の次の頁から抽出を再開する。
【0023】
第16の態様の情報処理プログラムは、コンピュータに複数の書類を含む紙媒体を読み取った画像である読取画像と、書類に含まれる項目からユーザによって指定された複数の項目の情報である項目情報と、を取得し、項目情報に含まれる項目の各々に関連付けられた文字列を読取画像から抽出し、項目情報に関連付けられた各々の文字列を読取画像から抽出した場合、抽出を開始した頁から、最後に抽出した文字列が含まれる頁までを一式の書類として分割する分割位置を設定し、分割位置に応じて分割した読取画像を出力することを実行させる。
【発明の効果】
【0024】
第1の態様の情報処理装置及び第16の態様の情報処理プログラムによれば、一式の書類であることを識別するために、一式の書類毎に予め同一の文字及び記号等を付した書類を用意する場合と比較して、書類を分割する処理の負担を低減できる。
【0025】
第2の態様の情報処理装置によれば、一式の書類の最大頁及び最大部数を考慮しない場合と比較して、より精度よく書類を分割することができる。
【0026】
第3の態様の情報処理装置によれば、ユーザによって指定される分割位置を考慮しない場合と比較して、分割する処理の負荷を低減することができる。
【0027】
第4の態様の情報処理装置によれば、項目情報に関連付けられた文字列を読取画像から抽出する処理を停止しない場合と比較して、より早く不正な書類が含まれていることを検出することができる。
【0028】
第5の態様の情報処理装置によれば、書類の分割状況を視覚によって確認することができる。
【0029】
第6の態様の情報処理装置によれば、ユーザによって指定される分割位置を考慮しない場合と比較して、より精度よく分割位置を設定することができる。
【0030】
第7の態様の情報処理装置によれば、文字列を抽出する領域を考慮しない場合と比較して、処理時間をより低減することができる。
【0031】
第8の態様の情報処理装置によれば、優先順位を考慮しない場合と比較して、抽出する精度をより向上させることができる。
【0032】
第9の態様の情報処理装置によれば、ユーザによって指定される抽出領域を考慮しない場合と比較して、抽出する精度をより向上させることができる。
【0033】
第10の態様の情報処理装置によれば、記憶された抽出領域を考慮しない場合と比較して、抽出する負荷をより低減させることができる。
【0034】
第11の態様の情報処理装置によれば、単一頁から複数の文字列を抽出する場合と比較して、より精度よく分割位置を設定することができる。
【0035】
第12の態様の情報処理装置によれば、優先順位を考慮しない場合と比較して、より精度よく分割位置を設定することができる。
【0036】
第13の態様の情報処理装置によれば、一式の書類と、他の一式の書類と、を区別することができる。
【0037】
第14の態様の情報処理装置によれば、選択項目を考慮しない場合と比較して、より精度よく一式の書類と、他の一式の書類と、を区別することができる。
【0038】
第15の態様の情報処理装置によれば、一式の書類と、他の一式の書類と、を区別することができる。
【図面の簡単な説明】
【0039】
図1】各実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。
図2】各実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。
図3】各実施形態に係る読み取った書類の一例を示す模式図である。
図4】第1実施形態に係る分割位置の設定の説明に供する書類の一例を示す概略図である。
図5】各実施形態に係る分割位置であるページ範囲の一例を示す模式図である。
図6】各実施形態に係る分割位置、及び一式の書類の表示の一例を示す模式図である。
図7】第1実施形態に係る情報処理の一例を示すフローチャートである。
図8】第1実施形態に係る分割位置設定処理の一例を示すフローチャートである。
図9】第2実施形態に係る分割位置の設定の説明に供する書類の一例を示す概略図である。
図10】第2実施形態に係る情報処理の一例を示すフローチャートである。
図11】第2実施形態に係る分割位置設定処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0040】
[第1実施形態]
以下、図面を参照して、本開示の技術を実施するための形態例を詳細に説明する。なお、本実施形態に係る情報処理装置10は、一例として、書類及び帳票等を読み取った画像データを管理するサーバである形態について説明する。しかし、これに限定されない。情報処理装置10は、例えばプリント機能、コピー機能、スキャン機能、及びファクシミリ機能等の機能を有する複合機に搭載されてもよいし、パーソナルコンピュータ等の端末でもよい。
【0041】
図1は、本実施形態に係る情報処理装置10のハードウェア構成の一例を示すブロック図である。図1に示すように、本実施形態に係る情報処理装置10は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、ストレージ14、入力部15、モニタ16、及び通信インターフェース(通信I/F)17を含んで構成されている。CPU11、ROM12、RAM13、ストレージ14、入力部15、モニタ16、及び通信I/F17の各々はバス18により相互に接続されている。ここで、CPU11は、プロセッサの一例である。
【0042】
CPU11は、情報処理装置10の全体を統括し、制御する。ROM12は、本実施形態で用いる情報処理プログラムを含む各種プログラム及びデータ等を記憶している。RAM13は、各種プログラムの実行時のワークエリアとして用いられるメモリである。CPU11は、ROM12に記憶されたプログラムをRAM13に展開して実行することにより、画像データから文字を抽出し、記憶する処理を行う。ストレージ14は、一例としてHDD(Hard Disk Drive)、SSD(Solid State Drive)、又はフラッシュメモリ等である。なお、ストレージ14には、情報処理プログラム等を記憶してもよい。入力部15は、文字の入力等を受け付けるキーボード及びマウス等である。モニタ16は、画像データ等を表示する。通信I/F17は、データの送受信を行う。
【0043】
次に、図2を参照して、情報処理装置10の機能構成について説明する。図2は、本実施形態に係る情報処理装置10の機能的な構成の一例を示すブロック図である。
【0044】
図2に示すように、情報処理装置10は、取得部21、抽出部22、記憶部23、設定部24、及び出力部25を有する。CPU11が情報処理プログラムを実行することで、取得部21、抽出部22、記憶部23、設定部24、及び出力部25として機能する。
【0045】
取得部21は、複数の書類を含む紙媒体を読み取った画像(以下、「読取画像」という。)と、書類に含まれる項目からユーザによって指定された複数の項目の情報(以下、「項目情報」という。)と、を取得する。取得部21は、ユーザによって指定された一式の書類の最大ページ、及び最大部数の設定値と、ユーザによって指定された一式の書類の分割位置と、文字列を抽出する領域である抽出領域と、を取得する。
【0046】
なお、本実施形態では、OCR処理を用いて、読取画像から書類に記載されている項目、及び文字列を抽出する形態について説明する。ここで、項目とは、書類に記載されている「氏名」、及び「住所」等の記載する項目であり、文字列とは、項目に応じて、ユーザが記載した自身の氏名、及び住所等である。また、本実施形態に係る一式の書類とは、同一人物が提出した複数枚の一揃いの書類である。
【0047】
抽出部22は、項目情報を用いて、読取画像に含まれる項目に関連付けられた文字列を読取画像から抽出する。また、抽出部22は、抽出した文字列が位置する抽出領域を抽出する。
【0048】
記憶部23は、分割した読取画像、読取画像から取得した文字列、及び文字列が位置する抽出領域を記憶する。
【0049】
設定部24は、記項目情報に関連付けられた各々の文字列を読取画像から抽出した場合、抽出を開始したページから、最後に抽出した文字列が含まれるページまでを一式の書類として分割する分割位置を設定する。
【0050】
出力部25は、分割位置に応じて分割した読取画像を出力する。
【0051】
なお、本実施形態に係る項目情報は、必須項目、及び選択項目を含んでいる形態について説明する。必須項目とは、一式の書類の何れかの書類に必ず含まれている項目であり、情報処理装置10は、必須項目を全て抽出した場合、分割位置を設定する。また、選択項目とは、ユーザが指定した複数の項目の内、少なくとも1つが一式の書類の何れかの書類に含まれている項目であり、情報処理装置10は、選択項目の内、少なくとも1つを抽出した場合、分割位置を設定する。
【0052】
つまり、必須項目のみ指定された場合、情報処理装置10は、必須項目に指定された項目に関連付けられる文字列を全て抽出した場合、分割位置を設定する。また、必須項目、及び選択項目を指定された場合、必須項目に関連付けられる文字列を全て抽出した場合、かつ選択項目に指定された項目の何れか1つに関連付けられる文字列を抽出した場合、分割位置を設定する。
【0053】
次に、情報処理装置10の作用について説明する前に、図3から図6を参照して、本実施形態に係る分割位置を設定する手法について説明する。なお、本実施形態では、必須項目のみが指定された形態について説明する。
【0054】
まず、図3及び図4を参照して、分割位置の設定について説明する。図3は、本実施形態に係る読み取った書類の一例を示す模式図である。図4は、本実施形態に係る分割位置の設定の説明に供する書類の一例を示す概略図である。
【0055】
一例として、図3に示すように、書類には、項目として、管理番号、発行日、氏名、住所、及び電話番号が含まれており、「氏名:富士 太郎」のように、項目の横に文字列が記載されている。抽出する項目として、ユーザによって「氏名」が指定された場合、情報処理装置10は、書類を読み取った読取画像に対して、OCR処理を行った結果から氏名の横に記載されている「富士 太郎」を抽出する。このように、予め項目を指定し、指定した項目に関連付けられている文字列の抽出を行うことを「キーバリュー抽出」という。本実施形態では、各々の書類に記載された項目(キー)に対応する文字列(バリュー)を抽出する形態について説明する。ここで、キーバリュー抽出では、項目に関連付けられている文字列の相対位置(すなわち、項目、及び文字列の位置関係。本実施例では、項目を基準とした場合の文字列が存在しうる位置を指す。)を予め設定しておく必要がある。本実施形態では、項目から右側に位置する文字列を抽出する設定がなされている形態について説明する。
【0056】
情報処理装置10は、複数の書類の画像である読取画像と、ユーザによって指定され、抽出する複数の項目である項目情報を取得する。
【0057】
情報処理装置10は、読取画像から項目情報に係る項目、及び項目に関連付けられている文字列を抽出し、記憶する。例えば、図3に示すように、項目情報として、「氏名」、及び「電話番号」が指定された場合、かつ相対位置として、項目情報の右側が指定された場合、情報処理装置10は、項目「氏名」の右側に記載された「富士 太郎」を抽出する(たたし、「:」は除く)。情報処理装置10は、必須項目の「氏名」に関連付けて「富士 太郎」を記憶する。また、情報処理装置10は、「電話番号」の右側に記載された「03-XXXX-XXXX」を抽出し、必須項目の「電話番号」に関連付けて「03-XXXX-XXXX」を記憶する。情報処理装置10は、必須項目に指定された「氏名」、及び「電話番号」を抽出した場合、1ページ目から「氏名」、及び「電話番号」の内、最後に抽出した項目が含まれるページまでを一式の書類として、ページ番号を記憶して、分割位置を設定する。
【0058】
ここで、1ページに必須項目に指定した項目が複数存在する場合、複数の文字列を抽出して分割位置が過剰に設定されてしまうことがある。この場合、1ページから抽出する文字列は、1つのみと設定することで、1ページから複数の文字列を抽出して過剰に分割位置を設定する場合を避けられる。
【0059】
図4示すように、情報処理装置10は、必須項目として、「氏名」、「電話番号」、及び「住所」が指定された場合、1ページ目の書類の画像から順番に「氏名」、「電話番号」、及び「住所」の何れかの項目を抽出する。
【0060】
一例として、1ページ目の書類の画像から「氏名:富士 太郎」、2ページ目の書類の画像から「電話番号:03-XXXX-XXXX」、3ページ目の書類の画像から「住所:東京都XX区」を抽出した場合について説明する。情報処理装置10は、各々の書類の画像から必須項目に指定された項目を全て抽出した場合、1ページから3ページまでを一式の書類として、ページ番号を記憶して分割位置を設定する。また、情報処理装置10は、最後に文字列を抽出したページの次のページである4ページ目から、必須項目に係る文字列を抽出する処理を再開する。
【0061】
なお、本実施形態では、1ページに複数の項目が含まれている場合、1ページから1つの項目を抽出する形態について説明した。しかし、これに限定されない。1ページに複数の項目が存在する場合、抽出する項目にユーザによって指定された優先順位を設定して、優先順位に応じて抽出する項目を選択してもよい。また、1ページに含まれる複数の項目の内、一方の項目が他のページに含まれていることを検出した場合、他方の項目を当該ページにて抽出したと判断してもよい。また、抽出する文字列の順番は、必須項目に設定されている項目の順番によらず、いかなる順番であってもよい。
【0062】
また、情報処理装置10が文字列を抽出できなかった場合、文字列を抽出できなかったページを飛ばして処理を続行することで、一式の書類に分割される。例えば、図4に示すように、6ページ目で必須項目に指定された項目を抽出できなかった場合、6ページ目の前後の4ページ、5ページ、及び7ページにて必須項目に指定された項目を抽出して、4ページから7ページを一式の書類として分割位置を設定する。このようにして、項目を抽出できなかった場合であっても一式の書類に分割される。
【0063】
しかしながら、文字列が抽出できなかったページが連続して複数ページ存在した場合、複数の一式の書類が1つにまとめられてしまうことがある。この場合、予め一式の書類のページ数の上限を設定しておくことで、複数の一式の書類がまとめられる場合を避けられる。つまり、情報処理装置10は、ユーザから指定された一式の書類の最大ページ数を取得して、設定値として設定し、一式の書類のページ数が設定値を超えた場合、前ページまでを一式の書類として、分割位置を設定する。
【0064】
なお、本実施形態では、設定値として、一式の書類の上限値である最大ページ数を設定する形態について説明した。しかし、これに限定されない。設定値として、読取画像に含まれる一式の書類の部数の上限値である最大部数を設定してもよい。例えば、情報処理装置10が、ユーザの想定とは異なる項目を抽出した場合、意図しない位置に分割位置が設定され、分割位置が過剰に設定される場合がある。この場合、一式の書類の部数の上限値を設定することで、分割位置が過剰に設定されていることが早期に検出される。
【0065】
また、本実施形態では、抽出した文字列を記憶する形態について説明した。しかし、これに限定されない。文字列を抽出した位置を含む領域を記憶してもよい。つまり、ユーザによって指定された文字列は、各々の書類の同一の位置に付されていることが想定されるため、文字列を抽出した位置を含む領域を記憶し、各々の書類における記憶した領域から文字列の抽出を行うことで、文字列の抽出が容易となる。
【0066】
また、1ページに文字列を抽出した抽出領域が複数ある場合、ユーザによって文字列を抽出する領域の指定を受け付けてもよいし、複数の領域に優先順位を設定して、優先順位に応じて、文字列の抽出を行ってもよい。優先順位は、ユーザによって指定されてもよいし、過去に同一の書類について抽出した結果を用いて、抽出した回数が多い順に優先順位を設定してもよい。
【0067】
次に、図5及び図6を参照して、分割した書類を表示する手法について説明する。図5は、本実施形態に係る分割位置であるページ範囲の一例を示す模式図である。図6は、本実施形態に係る分割位置、及び一式の書類の表示の一例を示す模式図である。
【0068】
まず、図5を参照して、分割した書類のページ範囲を表示する一例について説明する。
【0069】
一例として、図5に示すように。情報処理装置10は、分割位置表示領域31を有しており、分割位置表示領域31は、文書番号、ページ範囲、ページ数、及びメッセージを表示する。文書番号は、分割した一式の書類毎に一意に割り振られる数字であり、ページ範囲は、読取画像として取得した書類における一式の書類の開始ページ、及び終了ページであり、ページ数は、各々の一式の書類のページ数である。メッセージは、一式の書類が設定値を超過した場合等、ユーザに通知するための文字列である。
【0070】
図5に示すように、情報処理装置10は、設定した分割位置に応じて、一式の書類毎のページ範囲、ページ数、及びメッセージを表示して、ユーザに提示を行う。また、分割位置を設定する処理において、設定値を超えた場合、メッセージに設定値を超えている旨の通知を行う。
【0071】
なお、本実施形態では、設定値を超えた場合、通知を行う形態について説明した。しかし、これに限定されない。設定値を超えた場合、処理を停止してもよいし、停止して、かつ設定値を超えた旨を通知してもよいし、設定値を超えた一式の書類に対して、ユーザから分割位置の指定を受け付けてもよい。
【0072】
また、本実施形態では、分割位置として、ページ範囲、ページ数、及びメッセージを表示する形態について説明した。しかし、これに限定されない。ページ範囲に応じて、読取画像を分割し、モニタに表示してもよいし、読取画像を分割して異なる場所に設置されているサーバ等に送信してもよいし、読取画像と共に、設定した分割位置を表示してもよい。例えば、図6に示すように、情報処理装置10は、取得した読取画像30の一覧、及び分割位置32を表示してもよい。
【0073】
図6に示すように、情報処理装置10は、モニタ16に読取画像30、及び設定した分割位置32をモニタ16に表示する。また、情報処理装置10は、ユーザの指示に応じて、設定された分割位置32の修正、追加、削除を受け付けてもよい。
【0074】
次に、図7及び図8を参照して、本実施形態に係る情報処理プログラムの作用について説明する。図7は、本実施形態に係る情報処理の一例を示すフローチャートである。CPU11がROM12又はストレージ14から情報処理プログラムを読み出し、実行することによって、図7に示す情報処理が実行される。図7に示す情報処理は、例えば、ユーザから情報処理プログラムの実行指示が入力された場合、情報処理が実行される。
【0075】
ステップS101において、CPU11は、ユーザから指定された項目情報を取得する。
【0076】
ステップS102において、CPU11は、初期値として、開始ページ、及び終了ページに1を設定する。
【0077】
ステップS103において、CPU11は、カウンタに1を設定する。
【0078】
ステップS104において、文書番号に1を設定する。
【0079】
ステップS105において、CPU11は、項目情報に含まれる必須項目を設定する。
【0080】
ステップS106において、CPU11は、読取画像である書類の画像を取得する。
【0081】
ステップS107において、CPU11は、カウンタの値に対応するページ数の読取画像に対してOCR処理を実行し、読取画像から項目、及び文字列を取得する。
【0082】
ステップS108において、CPU11は、読取画像から項目情報に対応する文字列を抽出できたか否かの判定を行う。項目情報に対応する文字列を抽出できた場合(ステップS108:YES)、CPU11は、ステップS109に移行する。一方、項目情報に対応する文字列を抽出できなかった場合(ステップS108:NO)、CPU11は、ステップS111に移行する。
【0083】
ステップS109において、CPU11は、抽出した文字列が抽出済みか否かの判定を行う。抽出した文字列が抽出済みである場合(ステップS109:YES)、CPU11は、ステップS111に移行する。一方、抽出した文字列が抽出済みでない場合(ステップS109:NO)、CPU11は、ステップS110に移行する。
【0084】
ステップS110において、CPU11は、分割位置設定処理を行う。なお、分割位置設定処理については、後述する図8において詳細に説明する。
【0085】
ステップS111において、CPU11は、読取画像に次ページがないか否かの判定を行う。読取画像に次ページがない場合(ステップS111:YES)、CPU11は、ステップS113に移行する。一方、読取画像に次ページがある場合(ステップS111:NO)、CPU11は、ステップS112に移行する。
【0086】
ステップS112において、CPU11は、カウンタに1を加算して、ステップS107に移行する。
【0087】
ステップS113において、CPU11は、終了ページにカウンタの値を設定する。
【0088】
ステップS114において、CPU11は、開始ページ、及び終了ページを用いて、ページ数を算出する。
【0089】
ステップS115において、CPU11は、文書番号に開始ページ、終了ページ、及びページ数を関連付けて記憶する。
【0090】
ステップS116において、CPU11は、ページ範囲(開始ページ、及び終了ページ)に応じて、読取画像を分割する。
【0091】
ステップS117において、CPU11は、分割した読取画像を出力する。
【0092】
次に、図8を参照して、本実施形態に係る分割位置設定処理プログラムの作用について説明する。図8は、本実施形態に係る分割位置設定処理の一例を示すフローチャートである。CPU11がROM12又はストレージ14から分割位置設定処理プログラムを読み出し、実行することによって、図8に示す情報処理が実行される。図8に示す分割位置設定処理は、例えば、情報処理プログラムから分割位置設定処理プログラムの実行指示が入力された場合、分割位置設定処理が実行される。
【0093】
ステップS201において、CPU11は、必須項目に抽出した文字列を設定する。
【0094】
ステップS202において、CPU11は、必須項目が全て揃ったか否かの判定を行う。必須項目が全て揃った場合(ステップS202:YES)、CPU11は、ステップS203に移行する。一方、必須項目が全て揃っていない場合(ステップS202:NO)、CPU11は、分割位置設定処理を終了する。
【0095】
ステップS203において、CPU11は、終了ページに、カウンタの値を設定する。
【0096】
ステップS204において、CPU11は、開始ページ、及び終了ページを用いて、ページ数を算出する。
【0097】
ステップS205において、CPU11は、文書番号に開始ページ、終了ページ、及びページ数を関連付けて記憶する。
【0098】
ステップS206において、CPU11は、開始ページにカウンタの値+1を設定する。
【0099】
ステップS207において、CPU11は、文書番号に1を加算する。
【0100】
ステップS208において、CPU11は、必須項目を初期化する。
【0101】
以上説明したように、キーバリュー抽出を用いることで、一式の書類毎に分割位置が設定される。したがって、本実施形態によれば、一式の書類であることを識別するために、一式の書類毎に予め同一の文字及び記号等を付した書類を用意する場合と比較して、書類を分割する処理の負担が低減される。
【0102】
[第2実施形態]
第1実施形態では、必須項目に指定された項目に関連付けられる文字列を抽出して分割位置を設定する形態について説明した。本実施形態では、必須項目、及び選択項目に指定された項目に関連付けられる文字列を抽出して分割位置を設定する形態について説明する。なお、本実施形態に係る情報処理装置10のハードウェア構成(図1参照)、情報処理装置10の機能的な構成(図2参照)、及び書類を示す概略図(図3参照)は、第1実施形態と同様であるため、説明を省略する。また、本実施形態に係る分割位置であるページ範囲を示す模式図(図5参照)、及び分割位置と、一式の書類とを示す模式図(図6参照)は、第1実施形態と同様であるため、説明を省略する。
【0103】
情報処理装置10の作用について説明する前に、図9を参照して、本実施形態に係る分割位置を設定する手法について説明する。図9は、本実施形態に係る分割位置の設定の説明に供する書類の一例を示す概略図である。
【0104】
例えば、「氏名」、及び「ユーザ番号」のように、項目には、一方の項目が特定されると、他の項目も特定されるものがある。具体的には、「ユーザ番号」は、何らかのユーザ情報と関連付いていることが多く、ユーザを一意に特定するユーザ情報として「氏名」と関連付いていることが一般的である。すなわち、「氏名」から「ユーザ番号」を、または、「ユーザ番号」から「氏名」を特定することが可能である。このように、キーバリュー抽出を用いて、一式の書類を分割する場合において、「氏名」、及び「ユーザ番号」のように、複数の同等の情報の内、何れか一方の項目が抽出された場合、十分に必要な情報が得られることがある。
【0105】
したがって、本実施形態では、選択項目に指定された項目である「氏名」、及び「ユーザ番号」の少なくとも一方が抽出された場合、読取画像に分割位置を設定して、一式の書類に分割される形態について説明する。
【0106】
例えば、図9に示すように、必須項目として、「電話番号」、及び「住所」が指定され、選択項目として、「氏名」、及び「ユーザ番号」が指定された場合、情報処理装置10は、読取画像から必須項目、及び選択項目を抽出する。情報処理装置10は、1ページ目から「氏名」、2ページ目から「電話番号」、3ページ目から「住所」を抽出した場合、1ページ目から3ページ目までを一式の書類として、分割位置を設定する。
【0107】
また、情報処理装置10は、4ページ目から「ユーザ番号」、5ページ目から「電話番号」、7ページ目から「住所」を抽出した場合、4ページ目から7ページ目までを一式の書類として、分割位置を設定する。
【0108】
つまり、必須項目に指定された項目を全て抽出し、かつ選択項目に指定された項目の何れか1つを抽出した場合、分割位置を設定することで、一式の書類として、まとめられる。
【0109】
次に、図10及び図11を参照して、本実施形態に係る情報処理プログラムの作用について説明する。図10は、本実施形態に係る情報処理の一例を示すフローチャートである。CPU11がROM12又はストレージ14から情報処理プログラムを読み出し、実行することによって、図10に示す情報処理が実行される。図10に示す情報処理は、例えば、ユーザから情報処理プログラムの実行指示が入力された場合、情報処理が実行される。なお、図10における図7に示す情報処理と同一のステップについては、図7と同一の符号を付して、その説明を省略する。
【0110】
ステップS118において、CPU11は、項目情報に含まれる選択項目を設定する。
【0111】
次に、図11を参照して、本実施形態に係る分割位置設定処理プログラムの作用について説明する。図11は、本実施形態に係る分割位置設定処理の一例を示すフローチャートである。CPU11がROM12又はストレージ14から分割位置設定処理プログラムを読み出し、実行することによって、図11に示す情報処理が実行される。図11に示す分割位置設定処理は、例えば、情報処理プログラムから分割位置設定処理プログラムの実行指示が入力された場合、分割位置設定処理が実行される。なお、図11における図8に示す情報処理と同一のステップについては、図8と同一の符号を付して、その説明を省略する。
【0112】
ステップS209において、CPU11は、抽出した文字列が必須項目に係る文字列か否かの判定を行う。抽出した文字列が必須項目である場合(ステップS209:YES)、CPU11は、ステップS201に移行する。一方、抽出した文字列が必須項目でない場合(ステップS209:NO)、CPU11は、ステップS210に移行する。
【0113】
ステップS210において、CPU11は、選択項目に抽出した文字列を設定する。
【0114】
ステップS211において、CPU11は、必須項目が全て揃ったか否かの判定を行う。必須項目が全て揃った場合(ステップS211:YES)、CPU11は、ステップS212に移行する。一方、必須項目が全て揃っていない場合(ステップS211:NO)、CPU11は、分割位置設定処理を終了する。
【0115】
ステップS212において、CPU11は、選択項目の何れかが抽出されているか否かの判定を行う。選択項目の何れかが抽出されている場合(ステップS212:YES)、CPU11は、ステップS203に移行する。一方、選択項目が抽出されていない場合(ステップS212:NO)、CPU11は、分割位置設定処理を終了する。
【0116】
ステップS213において、CPU11は、必須項目、及び選択項目を初期化する。
【0117】
なお、本実施形態では、選択項目は1種類である形態について説明した。しかし、これに限定されない。選択項目は複数設定してもよい。複数の選択項目において、選択項目に設定された項目の少なくとも1つが抽出されたか否かの判定を、各々の選択項目毎に行ってもよい。
【0118】
以上説明したように、選択項目に設定した項目の何れかが抽出された場合であっても、読取画像が一式の書類毎に分割される。したがって、本実施形態によれば、一式の書類であることを識別するために、一式の書類毎に予め同一の文字及び記号等を付した書類を用意する場合と比較して、書類を分割する処理の負担が低減される。
【0119】
なお、本発明では、必須項目、及び選択項目を含む項目情報を抽出することによって、分割位置を設定して、一式の書類に分割する形態について説明した。しかし、これに限定されない。項目に関連付けられた文字列を記憶し、記憶した文字列と、抽出した文字列と、を比較してもよい。具体的には、分割された一式の書類を特徴づける共通する文字列を抽出して記憶し、抽出した文字列が記憶した文字列に対応する場合、文字列を抽出した書類の画像を、分割した一式の書類に分類する。
【0120】
例えば、一式の書類毎に割り振られた管理番号を抽出し、抽出した管理番号が、分割した一式の書類の管理番号と同一である場合、管理番号を抽出した書類の画像を、管理番号が同一である一式の書類と共に記憶する。
【0121】
つまり、一式の書類毎に共通する文字列を予め記憶し、記憶した文字列と、抽出した文字列と、を比較することで、一式の書類の一部が、他の一式の書類に紛れていても、書類の入れ違いが検出される。
【0122】
その他、上記実施形態で説明した情報処理装置10の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。
【0123】
また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
【0124】
なお、上記各実施形態において、プロセッサとは、広義的なプロセッサを指し、例えばCPU等の汎用的なプロセッサや、例えばGPU(Graphics Processing Unit)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、及びプログラマブル論理デバイス等の専用のプロセッサを含むものである。
【0125】
また、上記各実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
【0126】
また、上記各実施形態では、情報処理のプログラムがストレージ14に予め記憶(インストール)されている態様を説明したが、これに限定されない。プログラムは、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
【符号の説明】
【0127】
10 情報処理装置
11 CPU
12 ROM
13 RAM
14 ストレージ
15 入力部
16 モニタ
17 通信I/F
18 バス
21 取得部
22 抽出部
23 記憶部
24 設定部
25 出力部
30 読取画像
31 分割位置表示領域
32 分割位置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11