(58)【調査した分野】(Int.Cl.,DB名)
前記対応情報生成手段の動作モードを、予め定められた前記画像情報に対応する前記対応情報を生成するモードと、前記抽出手段が前記画像情報の所定領域から前記識別情報を抽出できた場合に、当該画像情報に対応する前記対応情報を生成するモードとから選択するモード選択手段、
をさらに備える、請求項1又は2に記載の画像処理装置。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の課題は、複数枚の原稿を読み取って得られた電子文書の利便性を向上させることにある。
【課題を解決するための手段】
【0006】
請求項1に係る発明は、複数の個別文書からなる文書群の画像情報から前記個別文書ごとに含まれる識別情報を抽出する抽出手段と、前記識別情報と前記個別文書の画像情報との対応関係を示す対応情報を生成する対応情報生成手段と、前記識別情報の内容に基づき前記識別情報の順序を並び替えて、前記文書群の画像情報、前記対応情報、及び並び替えられた前記識別情報を含んだ電子文書を生成する電子文書生成手段と、
前記電子文書生成手段によって並び替えられた前記識別情報を使用者が選択可能なように表示手段に表示し、前記表示手段に表示された前記識別情報のうちのひとつが使用者によって選択されると、前記対応情報に基づいて、選択された前記識別情報に対応する個別文書の画像情報が前記表示手段に表示されるよう制御する制御手段、を備える画像処理装置である。
【0008】
請求項
2に係る発明は、前記電子文書生成手段は、識別情報の並び替えを行う際、前記電子文書における前記文書群の画像情報の順序の並び替えを行わない、請求項1に記載の画像処理装置である。
【0009】
請求項
3に係る発明は、前記抽出手段は、前記画像情報の所定領域から前記識別情報を抽出する、請求項1又は2に記載の画像処理装置である。
【0010】
請求項
4に係る発明は、前記対応情報生成手段は、前記抽出手段が前記画像情報の前記所定領域から前記識別情報を抽出できた場合に、当該画像情報に対応する前記対応情報を生成する、請求項
3に記載の画像処理装置である。
【0011】
請求項
5に係る発明は、前記対応情報生成手段の動作モードを、予め定められた前記画像情報に対応する前記対応情報を生成するモードと、前記抽出手段が前記画像情報の所定領域から前記識別情報を抽出できた場合に、当該画像情報に対応する前記対応情報を生成するモードとから選択するモード選択手段、をさらに備える、請求項1又は2に記載の画像処理装置である。
【0012】
請求項
6に係る発明は、前記抽出手段は、識別情報として文字列を抽出する、請求項1又は2に記載の画像処理装置である。
【0013】
請求項
7に係る発明は、複数の個別文書からなる文書群を読み取る読取手段と、前記読取手段によって読み取られた前記複数の個別文書からなる文書群の画像情報から前記個別文書ごとに含まれる識別情報を抽出する抽出手段と、前記識別情報と前記個別文書の画像情報との対応関係を示す対応情報を生成する対応情報生成手段と、前記識別情報の内容に基づき前記識別情報の順序を並び替えて、前記文書群の画像情報、前記対応情報、及び並び替えられた前記識別情報を含んだ電子文書を生成する電子文書生成手段と、
前記電子文書生成手段によって並び替えられた前記識別情報を使用者が選択可能なように表示手段に表示し、前記表示手段に表示された前記識別情報のうちのひとつが使用者によって選択されると、前記対応情報に基づいて、選択された前記識別情報に対応する個別文書の画像情報が前記表示手段に表示されるよう制御する制御手段、を備える画像読取装置である。
【0014】
請求項
8に係る発明は、コンピュータを、複数の個別文書からなる文書群の画像情報から前記個別文書ごとに含まれる識別情報を抽出する抽出手段と、前記識別情報と前記個別文書の画像情報との対応関係を示す対応情報を生成する対応情報生成手段と、前記識別情報の内容に基づき前記識別情報の順序を並び替えて、前記文書群の画像情報、前記対応情報、及び並び替えられた前記識別情報を含んだ電子文書を生成する電子文書生成手段と、
前記電子文書生成手段によって並び替えられた前記識別情報を使用者が選択可能なように表示手段に表示し、前記表示手段に表示された前記識別情報のうちのひとつが使用者によって選択されると、前記対応情報に基づいて、選択された前記識別情報に対応する個別文書の画像情報が前記表示手段に表示されるよう制御する制御手段、
として機能させるプログラムである。
【発明の効果】
【0015】
請求項1,2,8又は9に係る発明によれば、本構成を有していない場合と比較して、複数枚の原稿を読み取って得られた電子文書の利便性を向上させることができる。
【0016】
請求項
2に係る発明によれば、付された電子しおりがソートされた場合であっても、原稿の読み取り順序を示す情報を電子文書に残すことができる。
【0017】
請求項
3に係る発明によれば、本構成を有していない場合と比較して、識別情報の誤認識の虞を低減させることができる。
【0018】
請求項
4に係る発明によれば、電子しおりを付与すべきページを自動的に識別し、当該識別されたページのみに電子しおりを付与することができる。
【0019】
請求項
5に係る発明によれば、各状況に応じた適切な電子しおり付与のモードを選択することができる。
【0020】
請求項
6に係る発明によれば、原稿に含まれる文字列に基づいて電子しおりをソートすることができる。
【発明を実施するための形態】
【0022】
以下、本発明に係る画像読取装置の実施形態について説明する。なお、本発明は以下の実施形態に限定されるものではない。
【0023】
図1は、本実施形態に係る画像読取装置及び周辺装置の構成概略図を示す図である。
図1には、本実施形態に係る画像読取装置12及び周辺装置として端末38が示されている。
【0024】
紙文書群10は、複数の紙文書からなる。
図2は、紙文書群の例を示す図である。本実施形態においては、紙文書群10として、学校におけるテストの解答用紙の1学年分を用いる。1人の解答者の解答用紙が1つの紙文書である。その例が
図2(a)に示されている。テストの解答用紙には、所定位置50(
図2(a)の例ではページ右上)に解答者を示す学籍番号が解答者により記載される。学籍番号に代えて或いは加えて、解答者の氏名が記載されていてもよい。記載された学籍番号や氏名により、紙文書群10に含まれる各紙文書を識別することができる。すなわち、この学籍番号や氏名が各紙文書を識別する識別情報となっている。
【0025】
テストの解答用紙は、解答者1人当たり1枚であり、紙文書群10に含まれる複数の紙文書は全て同一のフォームで構成されている。そして、学籍番号は全ての紙文書の所定位置に記載されている。また、テストの解答用紙は解答者1人当たり2枚であって、学籍番号が1枚目の所定位置のみに記載されていてもよい。この場合は、紙文書群10に含まれる各紙文書がそれぞれ2枚から構成されているということになる。或いは、解答者によって解答用紙の枚数が異なっていてもよい。この場合も、各解答者の解答用紙の1枚目の所定位置のみに学籍番号が記載されていてよい。いずれの場合においても、各解答者の解答用紙の1枚目のページ右上の所定位置に、学籍番号或いは解答者の氏名が記載される。
【0026】
紙文書群10の他の例として、例えば
図2(b)に示すような複数の宅配便伝票であってもよい。宅配便伝票においても、
図2(b)に示される所定位置52に、各伝票を識別する識別情報であるお問い合わせ番号が記載されている。このように、紙文書群10としては、各紙文書の所定位置に識別情報が記載されていれば、どのような文書であってもよい。
【0027】
紙文書群10に記載される識別情報としては、上記例のように数字を含む文字列であってもよく、識別情報から各紙文書を識別し得る文字列が取得できれば、バーコードやQRコード(登録商標)のような記号或いは模様等であってもよい。
【0028】
図1に戻り、画像読取装置12は、スキャナ機能、コピー機能、及びプリント機能等を有する複合機である。或いは、スキャナ機能のみを有するスキャナであってもよい。画像読取装置12は、画像読取手段14、制御手段16、外部I/F30、入力手段32、表示手段34、及び記憶手段36を含んで構成される。画像読取装置12が含む各手段の機能はプログラムにより実現されてもよい。当該プログラムは記憶手段36に記憶される。
【0029】
画像読取手段14は、例えば複合機が有するスキャナ機能であり、紙文書群10に含まれる各紙文書を光学的に読み取り、画像データを生成する。画像読取手段14は、複数の紙文書をセットできるトレイを含んでおり、図示しない自動原稿送り手段により複数の紙文書をトレイから画像読取手段14に送り、複数の紙文書を連続的に読み取ることが可能である。紙文書群10に含まれる紙文書がそれぞれ1枚からなる場合は、各紙文書に対応する画像データが生成される。したがって、複数の紙文書を読み取ることで複数の画像データが生成される。紙文書が複数枚からなる場合は、紙文書の各枚に対応する画像データがそれぞれ生成される。
【0030】
後に電子文書生成手段28により、各画像データを各ページとする1つの電子文書が生成される。本明細書においては、紙文書群10が読み取られることで生成される複数ページを有する電子ファイルを電子文書と記載し、電子文書の各ページをなすデータを画像データ或いは画像情報と記載する。
【0031】
画像読取手段14は、画像データを取得した順序を電子文書のページ数として取得し画像データと関連付けておく。例えば、紙文書の1枚目を読み取って得られた画像データを1ページ目とし、紙文書の2枚目を読み取って得られた画像データを2ページ目としておく。電子文書のページ数を示す情報は、ページ数と画像データとの対応関係を示す情報を電子文書に含めるようにしてもよく、或いは、画像データ自体に含めてもよい。
【0032】
制御手段16は、識別情報抽出手段18、電子しおり情報生成手段20、モード選択手段22、順序情報生成手段24及び電子文書生成手段28を含んで構成されている。順序情報生成手段24は並替手段26を含んでいる。
【0033】
識別情報抽出手段18は、画像読取手段14が生成した画像データから識別情報を抽出する。具体的には、画像データに対してOCR(Optical Character Recognition)処理を行い、画像データから識別情報である学籍番号を文字列として抽出する。識別情報としてバーコードやQRコード等の記号又は模様等が記載されている場合は、当該記号又は模様等を読み取って当該記号又は模様等に対応する文字列を抽出する。識別情報抽出手段18により抽出され後述の電子しおり情報に含まれる文字列とは、コンピュータが認識できる文字コードの列を意味する。
【0034】
識別情報抽出手段18は、画像データのうちユーザにより指定された領域においてOCR処理を行う。例えば、画像データの領域を6等分し、いずれの領域においてOCR処理を行うかをユーザに指定させる。もちろん、ユーザが指定する領域は識別情報が記載されている領域である。或いは、領域を指定せず、画像データの全領域においてOCR処理を行うようにしてもよい。しかし、全領域においてOCR処理を行うと、識別情報の誤認識の虞が高まり、また、処理時間が増えてしまうため、指定された所定領域のみにおいてOCR処理を行うのが好ましい。
【0035】
電子しおり情報生成手段20は、複数の画像データにそれぞれ対応する複数の電子しおり情報を生成する。電子文書が表示される際には、電子文書の各ページを構成する複数の画像データとともに、各ページに関連付けられた電子しおりが表示される。ユーザは、電子しおりをクリックすることで、当該電子しおりに関連付けられたページを直ちに開くことができる。電子しおりは、電子文書に付された電子しおり情報に基づいて表示される。電子しおり情報生成手段20は、電子しおりを表示させるために、電子文書に含まれるデータである電子しおり情報を生成する。
【0036】
電子しおり情報には、識別情報抽出手段18が抽出した識別情報である学籍番号を示す文字列が含まれる。識別情報が記号又は模様等である場合は、当該記号又は模様等から読み取れる文字列が含まれることになる。電子しおり情報には、電子しおりとともに表示されるしおり名を示すしおり名情報も含まれる。しおり名としては、抽出した識別情報である学籍番号のみ(例えば「10001」)としてもよいが、所定の文字列、例えば「学籍番号:」を付加し、しおり名を「学籍番号:10001」とするようにしてもよい。さらに、例えば画像読取装置12の外部或いは内部に用意されたDB(不図示)に学籍番号と氏名とが関連付けられたテーブル等を用意しておき、当該テーブルを参照して学籍番号から氏名を取得し、これをしおり名とする或いはしおり名に付加してもよい。
【0037】
生成された電子しおり情報は、画像データと関連付けられる。具体的には、画像データと、当該画像データから抽出した識別情報を含む電子しおり情報とが関連付けられる。画像データと電子しおり情報との関連付けは、画像読取手段14が取得した画像データのページ数と、当該画像データから抽出した識別情報を含む電子しおり情報との対応関係を示す情報を電子文書に含めることにより行う。或いは、画像データのページ数を示す情報を電子しおり情報自体に含ませるようにしてもよい。
【0038】
モード選択手段22は、電子しおり情報生成手段20の動作モードを選択する。動作モードとして、指定モードと自動モードの2つのモードが用意されている。電子しおり情報生成手段20の動作モードに応じて識別情報抽出手段18の動作も変更される。これらのモードはユーザにより選択され、モード選択手段22は、電子しおり情報生成手段20の動作モードをユーザにより選択されたモードに設定する。
【0039】
指定モードは、ユーザにより指定された電子文書のページのみに電子しおりを付すモードである。すなわち、ユーザにより指定されたページの画像データから識別情報を抽出して電子しおり情報を生成し、当該画像データに関連付ける。ユーザによる電子文書のページの指定方法は、例えば「2ページおきに電子しおりを付す」というようなものである。もちろん、何ページおきに電子しおりを付すかは任意であり、紙文書の構成に応じてユーザが変更可能である。
【0040】
指定モードは、紙文書群10に含まれる個別の各紙文書のまとまりが同一枚数であって、各紙文書に1つの電子しおりを付したい場合に有効である。例えば、各解答者の解答用紙が2枚からなっているような場合である。この場合、電子化後の利便性を考慮すると、各解答者の解答用紙の1枚目にのみ電子しおりを付すのが好ましい。したがって、このような場合は、指定モードにおいて「2ページおきに電子しおりを付す」と指定することで、各解答者の解答用紙の1枚目を読み取って得られた画像データに対してのみ電子しおり情報を生成させることができる。
【0041】
自動モードは、電子しおり情報生成手段20が電子しおりを付すページを識別し、電子しおりを付すと判断されたページのみに電子しおりを付すモードである。具体的には、画像読取手段14が生成した画像データ全てについてOCR処理を行い、画像データから識別情報が抽出できた場合に、当該画像データに対応する電子しおり情報を生成する、というモードである。自動モードの場合は、全ての画像データについてOCR処理を行うため、OCR処理の処理時間短縮、及び識別情報の誤認識の可能性を低減させるよう、OCR処理をする領域が予め指定されていることが好ましい。抽出した識別情報が、紙文書群10の各紙文書を識別する適切な識別情報であることを確認するため、例えば「抽出した識別情報が5桁の数字である」等の条件を付加し、当該条件を満たした場合に画像データから識別情報が抽出できた、と判断するようにしてもよい。
【0042】
自動モードは、紙文書群10に含まれる個別の各紙文書のまとまりの枚数がそれぞれ異なる場合であって、各紙文書に1つの電子しおりを付したい場合に有効である。例えば、解答者によって解答用紙の枚数が異なっており、学籍番号の記入欄が1枚目にのみ記載されている場合である。このような場合に、自動モードによれば、紙文書群10のうち各解答者の1枚目の解答用紙を読み取って得られた画像データに対してのみ電子しおり情報を生成させることができる。
【0043】
順序情報生成手段24は、各電子しおり情報に対応する複数の電子しおりが表示された場合における、複数の電子しおりの表示順序を示す順序情報を生成する。本実施形態で生成される電子文書においては、電子文書のデータ構造における電子しおり情報の配列順序と同じ順序で電子しおりが表示されるようになっている。つまり、電子しおり情報の配列順序自体が電子しおりの表示順序を示す順序情報であるといえる。したがって、複数の電子しおり情報が生成され配列順序が決定した時点で順序情報も生成されていることとなり、この場合は、電子しおり情報生成手段20が順序情報生成手段24の機能を包含していることになる。また、順序情報生成手段24は、各電子しおり情報に対応する電子しおりの表示順序を示す情報を別途生成し、当該情報を電子文書、特に各電子しおり情報に含ませるようにしてもよい。
【0044】
電子しおり情報生成手段20が電子しおり情報を生成した段階では、電子しおり情報の順序、すなわち電子しおりの表示順序は、電子しおり情報に関連付けられた画像データのページ数の順序と同様の順序となっている。例えば、画像データの1ページ目に関連付けられた電子しおり情報が1番目となっており、画像データの2ページ目に関連付けられた電子しおり情報が2番目となっている。
【0045】
順序情報生成手段24に含まれる並替手段26は、順序情報を書き換える処理を行う。上述の通り、本実施形態においては、電子しおり情報の配列順序が電子しおりの表示順序を示すことから、並替手段26は、複数の電子しおり情報の配列順序を並べ替える処理を行う。具体的には、電子しおり情報に含まれている識別情報に基づいて、電子しおり情報をソートする。例えば、識別情報である学籍番号が昇順となるように電子しおり情報をソートする。もちろん、これを降順となるようにソートしてもよいし、或いはDBから取得した学籍番号に対応する氏名に基づいてソートするようにしてもよい。順序情報が別途生成されている場合は、各電子しおり情報が有する識別情報に基づいて、電子しおりの表示順序を上記同様に変更させるよう順序情報を書き換える。
【0046】
紙文書群10は、必ずしもその順序が適切な状態であるとは限らない。解答用紙を例に挙げれば、解答用紙は解答者の席順に回収されるのが一般的であり、且つ、席順が学籍番号順となっていない場合も多々ある。したがって、紙文書群10における各紙文書の順序、すなわち画像読取手段14が生成する画像データの順序が学籍番号順となっておらず、同時に電子しおり情報生成手段20が生成した電子しおり情報も学籍番号順とはなっていない場合が十分考えられる。そこで、並替手段26により学籍番号に基づいて電子しおり情報をソートさせている。これにより、後に電子文書が表示されたときに、電子しおりが例えば学籍番号の昇順にソートされた状態で表示されることになり、閲覧者が容易に所望の画像データを閲覧できるようになる。すなわち、電子文書における画像データの検索性を向上させる。
【0047】
並替手段26は、電子しおりの表示順序を並べ替えるが、画像データの順序、すなわち電子文書における画像データのページ順序は整列させずに画像読取手段14が読み取った順序のまま維持する。これにより、電子文書における画像データの検索性を向上させつつ、紙文書群10における紙文書の順序を示す情報も電子文書に残されることになる。また、画像データの順序の並べ替えには処理に時間がかかるところ、画像データの順序の並べ替え処理を省くことで処理時間が低減されることになる。
【0048】
一方、並替手段26が電子しおり情報の順序とともに画像データの順序を並べ替える処理を行うようにしてもよい。例えば、1ページ目である画像データAに対応する電子しおり情報と2ページ目である画像データBに対応する電子しおり情報との順序が入れ替えられた場合に、画像データの順序も同様に入れ替え、電子文書の1ページ目を画像データBとし2ページ目を画像データAとするようにしてもよい。
【0049】
電子しおり情報とともに画像データを並べ替えることで、電子しおり情報の順序と画像データの順序とが同様になる。これは、例えば表示される電子しおりを目次的に利用したい場合等に有効である。すなわち、閲覧者は、表示される電子しおりを確認しただけで、電子文書における画像データの順序或いは構成を把握することが可能になる。
【0050】
電子文書生成手段28は、複数ページを有する電子文書を生成する。電子文書は、例えばpdfファイルであってよい。電子文書は、複数の画像データ、ソートされた複数の電子しおり情報を含んでいる。電子文書は、画像読取手段14により生成された複数の画像データとなる。電子文書生成手段28は、1つの紙文書群10について1つの電子文書を生成する。
【0051】
1つの紙文書群10を1つの電子文書に電子化することで、紙文書群10を複数の電子文書に電子化したときに比べ、電子文書の利便性を向上させることができる。例えば、複数の画像データを閲覧する場合、いちいち電子文書を開いたり閉じたりする必要がなくなる。これにより、閲覧者の操作の手間が省かれることなり、閲覧にかかる時間が短縮され閲覧者が受けるストレスも低減される。また、電子文書が1つであるので、一部の電子文書を紛失してしまう虞もない。すなわち、電子文書の管理も容易になる。
【0052】
また、複数の電子文書に分割してしまうと、紙文書群10における紙文書の順序情報が電子化によって失われてしまうが、電子文書を1つとし、画像データをソートさせないことで、紙文書群10における紙文書の順序情報を電子文書に残しておくことが可能になる。この場合であっても、各画像データに対応する電子しおり情報をソートしておくことで電子しおりがソートされた状態で表示されるので、画像データの検索性は失われない。
【0053】
図3は、電子しおり情報が付与された電子文書のデータ構造を示す図である。電子文書は、電子文書のバージョン情報等が含まれるヘッダ部60、電子文書の内容等の実データ、すなわち画像データが含まれるボディ部62、電子しおり情報を含むしおり情報部64、及び電子文書の包括的なデータがまとめられているトレーラ部66を含んで構成されている。しおり情報部64には、電子しおり生成情報手段20が生成した複数の電子しおり情報が、並替手段26で並べ替えられた順序で含まれている。
【0054】
図1に戻り、外部I/F30は、画像読取装置12と他の機器とを接続する外部入出力インターフェイスである。例えば、USB端子やLANカードである。外部I/F30にケーブルが接続されることで他の機器と接続してもよいし、無線により接続されてもよい。電子文書生成手段28により生成された電子文書は、外部I/F30を介して他の機器に送信される。
【0055】
入力手段32は、画像読取装置12に対するユーザ指示を入力するための手段であり、例えば操作パネルである。入力手段32は、画像データにおけるOCR処理を行う所定領域の指定、電子しおり情報生成手段20の動作モードの指定、及びその他指示を入力するためにユーザにより用いられる。
【0056】
表示手段34は、例えば液晶モニタであり、画像読取装置12の処理内容や、ユーザ指示の内容を表示するものである。表示手段34はタッチパネルであってもよく、この場合には液晶モニタは表示手段34と入力手段32の機能を兼ねることとなる。表示手段34は、電子文書生成手段28により生成された電子文書を表示可能とするようにしてもよい。
【0057】
記憶手段36は、例えばROMやRAMであり、画像読取装置12の各機能を動作させるためのプログラムを記憶する。或いは、各手段における処理データを一時的に記憶する。
【0058】
端末38は、例えばパーソナルコンピュータやタブレット端末であり、CPU等の制御手段40、ROM或いはRAM等の記憶手段42、キーボード、マウス等の入力手段44、USB端子やLANカード等の外部I/F46、及びモニタ等の表示手段48、を含んで構成されている。制御手段40は、外部I/F46を介して画像読取装置12から電子文書を受信して記憶手段42に記憶させる。制御手段40が電子文書を表示手段48に表示させることで端末38のユーザが電子文書を閲覧可能となる。
【0059】
図4は、電子しおり情報と画像データとの対応関係を示す概念図である。本実施形態では、紙文書群10が百数十枚の解答用紙からなるが、
図4にはそのうち1枚目から5枚目までが示されている。複数の解答用紙は、解答者の席順等の順序で回収されるため、解答者の学籍番号順に整列されていない。紙文書群10が画像読取手段14のトレイにセットされ連続的に読み取られると、画像データ群70が生成される。上述の通り、画像データ群70は、画像読取手段14が読み取った順序でページ数が付されるため、紙文書群10の1枚目を読み取って得られた画像データが1ページ目となり、紙文書群10の2枚目を読み取って得られた画像データが2ページ目となる。以後同様にページ数が各画像データに付されることになる。
【0060】
画像データ群70が生成されると、電子しおり情報生成手段20により各画像データに関連付けられる電子しおり情報群72が生成される。
図4には、電子しおり情報と各画像データとの対応関係が矢印で示されている。電子しおり情報群72に含まれる文字(例えば「学籍番号:10134」)は、電子しおり情報に含まれるしおり名情報である。例えば、画像データの1ページ目から抽出された識別情報「学籍番号:10134」をしおり名とする電子しおり情報74aは、画像データの1ページに関連付けられている。以後、画像データの2〜5ページ目と電子しおり情報74b〜74eがそれぞれ関連付けられている。
図4には図示されていないが、画像データの6ページ以降も同様に電子しおりと関連付けられている。このように、電子しおり情報生成手段20が電子しおり情報を生成した段階では、電子しおり情報の順序は、対応する画像データのページの順序と同様となっている。
【0061】
図5は、ソートされた電子しおり情報と画像データとの対応関係を示す概念図である。
図5には、ソートされた電子しおり情報群76が示されている。
図5においても、
図4同様、電子しおり情報と画像データの対応関係が矢印で示されている。ソートされた電子しおり情報群76においては、電子しおり情報群72の電子しおり情報が、各電子しおり情報に含まれている識別情報、すなわち学籍番号が昇順となるようにソートされている。電子しおり情報がソートされても、各電子しおり情報74a〜74eと画像データの1〜5ページ目との対応関係は維持されたままである。画像データ群70とソートされた電子しおり情報群76とが結合されて電子文書80が生成される。
【0062】
図6は、本実施形態における画像読取装置の処理の流れを示すフローチャートである。以下、
図1を参照しながら
図6のフローチャートを説明する。
【0063】
ステップS10において、nの値を1に初期化する。ここで、nは紙文書群10の何枚目を読み取るかを表し、また画像データのページ数を表す変数である。
【0064】
ステップS12において、画像読取手段14は、紙文書群10のn枚目の紙文書を光学的に読み取り、1つの画像データを生成する。
【0065】
ステップS14において、画像読取手段14は、ステップS12で生成した画像データのページ数をnページ目とする。
【0066】
ステップS16において、電子しおり情報生成手段20は、電子しおり情報生成手段20の動作モードを判定する。動作モードが指定モードに設定されている場合はステップS18に進み、自動モードに設定されている場合はステップS20に進む。
【0067】
ステップS18において、電子しおり情報生成手段20は、nページ目はユーザによって指定されたページであるか否かを判定する。例えば、指定モードにおいてユーザにより「2ページおきに電子しおりを付す」という指示がされている場合、nが奇数の場合はnページ目が指定ページであると判定し、nが偶数の場合はnページ目が指定ページではない、と判定する。
【0068】
ステップS20において、識別情報抽出手段18は、ステップS12で生成した画像データの所定領域に識別番号である学籍番号が存在するか否かを判定する。具体的には、画像データのユーザにより指定された所定領域に対してOCR処理を行い、文字列として5桁の数字が抽出できた場合は所定領域に学籍番号が存在すると判定し、そうでない場合は所定領域に学籍番号は存在しない、と判定する。
【0069】
ステップS22において、識別情報抽出手段18は、画像データの所定領域に対してOCR処理を行い、識別情報である学籍番号を示す文字列を抽出する。
【0070】
ステップS24において、電子しおり情報生成手段20は、ステップS20又はS22で抽出した文字列を含む電子しおり情報を生成する。さらに、生成した電子しおり情報を画像データのnページ目に関連付ける。
【0071】
ステップS26において、画像読取手段14は、トレイにセットされた全ての紙文書を読み取ったか否かを判定する。当該判定は、例えばトレイに紙文書が残っているか否かを識別することで行われる。
【0072】
ステップS26で、全ての紙文書の読み取りが終わっていないと判定された場合はステップS28に進み、ステップS28においてnをインクリメントする。そして、次の紙文書についてステップS12からの処理を再度実行する。
【0073】
全ての紙文書の読み取りが終了すると、ステップS30において、並替手段26は、電子しおり情報をソートする処理を行う。電子しおり情報のソートは、各電子しおり情報に含まれている学籍番号が昇順となるように行う。
【0074】
ステップS32において、電子文書生成手段28は、画像データ群及び電子しおり情報群を結合して1つの電子文書を生成する。電子文書の各ページはステップS12で生成された画像データである。電子文書には、ステップS24で生成され、ステップS30でソートされた複数の電子しおり情報が含まれている。
【0075】
図7は、ソートされた電子しおり情報を含む電子文書が表示された様子を示す図である。例えば、
図1に示す端末38において、画像読取装置12により生成された電子文書が適切なアプリケーションにより実行されると、
図7に示すような画面が表示手段48に表示される。当該アプリケーションは、電子文書の本文データである画像データが表示される画像データ表示部90、電子しおり群102が表示されるしおり表示部100、及び画像データ表示部90に表示されている画像データのページ数が表示されるページ数表示部120を含んでいる。
【0076】
しおり表示部100には、ソートされた電子しおり情報の順序で電子しおり群102が表示されている。電子しおり群102に含まれる各電子しおりは、しおり名104及びしおりアイコン106を含んでいる。電子しおりがポインタ110によりクリックされると、当該電子しおりに関連付けられたページが表示部90に表示される。
図7には、しおり名「学籍番号:10002」の電子しおりがクリックされ、当該電子しおりに対応する画像データが画像データ表示部90に表示されている例が示されている。なお、しおり名104の周囲に示されている枠112は、現在画像データ表示部90に表示されているページに対応する電子しおりを示す枠である。
【0077】
電子しおり群102が学籍番号順にソートされていることで、電子文書の閲覧者は、たとえ電子しおりの数が多数であっても所望の学籍番号を容易に発見することができる。そして、当該電子しおりをクリックすることで所望の解答用紙を直ちに閲覧することができる。
【0078】
図7に示される電子文書においては、電子しおり情報はソートされているが、画像データはソートされず画像読取手段14により読取られた順序のまま維持されている。したがって、
図7に示すように、電子しおりの順序が2番目であるしおり名「学籍番号:10002」の電子しおりに対応する画像データのページ数は142ページ目となっている。
【解決手段】画像読取手段14は、各文書を識別する識別情報が記載された複数の紙文書を読み取り複数の画像データを生成する。識別情報抽出手段18は、画像データから識別情報を抽出する。電子しおり情報生成手段20は、画像データから抽出した識別情報を含む電子しおり情報を生成し、当該画像データに関連付ける。順序情報生成手段24は、電子しおり情報に対応する電子しおりの表示順序であって、識別情報に基づいた表示順序を示す順序情報を生成する。電子文書生成手段28は、複数の画像データ、複数の電子しおり情報及び順序情報を含む電子文書を生成する。