(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024095575
(43)【公開日】2024-07-10
(54)【発明の名称】文書読取装置および文書読取プログラム
(51)【国際特許分類】
H04N 1/00 20060101AFI20240703BHJP
H04N 1/04 20060101ALI20240703BHJP
【FI】
H04N1/00 350
H04N1/04 106A
【審査請求】未請求
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2023213967
(22)【出願日】2023-12-19
(31)【優先権主張番号】P 2022211951
(32)【優先日】2022-12-28
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】599001389
【氏名又は名称】株式会社プリマジェスト
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】栗山 淳
(72)【発明者】
【氏名】小倉 慶一
(72)【発明者】
【氏名】西野 真吾
(72)【発明者】
【氏名】鄭 元碩
(72)【発明者】
【氏名】松岡 晋也
(72)【発明者】
【氏名】桑原 真介
【テーマコード(参考)】
5C062
5C072
【Fターム(参考)】
5C062AA05
5C062AB17
5C062AB20
5C062AB23
5C062AB42
5C062AC02
5C062AC05
5C062AC58
5C062AC66
5C062AC67
5C072AA01
5C072BA05
5C072CA02
5C072EA08
5C072LA02
5C072LA12
5C072RA04
5C072UA13
(57)【要約】
【課題】互いに関連する複数枚の文書を一度に読み取る場合に、それらの文書が予定された文書構成と一致するかを、読取ファイルの生成前の段階で知らせてくれる文書読取装置を提供する。
【解決手段】文書読取装置は、複数の文書を載置する載置台と、載置台を撮像して載置台の全体画像を出力する撮像部と、全体画像から載置台に載置された複数の文書のそれぞれの文書領域を認識する認識部と、認識部に認識された文書領域の構成が事前に設定された文書構成と一致するかを判別する判別部と、判別部による判別結果を告知する告知部とを備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
複数の文書を載置する載置台と、
前記載置台を撮像して前記載置台の全体画像を出力する撮像部と、
前記全体画像から前記載置台に載置された前記複数の文書のそれぞれの文書領域を認識する認識部と、
前記認識部に認識された前記文書領域の構成が事前に設定された文書構成と一致するかを判別する判別部と、
前記判別部による判別結果を告知する告知部と
を備える文書読取装置。
【請求項2】
前記告知部が前記判別結果を告知した後にユーザからファイル生成指示を受け付ける受付部と、
前記ファイル生成指示を受け付けた場合に、前記全体画像からそれぞれの前記文書領域を切り出して、互いに関連付けられた複数の読取ファイルを生成するファイル生成部と
を備える請求項1に記載の文書読取装置。
【請求項3】
前記受付部は、前記ファイル生成指示を受け付ける前にユーザから前記文書領域の修正を受け付ける請求項2に記載の文書読取装置。
【請求項4】
前記受付部は、前記判別部が一致すると判別した場合に前記ファイル生成指示を受け付ける請求項2に記載の文書読取装置。
【請求項5】
前記判別部は、前記文書構成として設定された文書枚数が前記認識部によって認識された前記文書領域の領域数と一致するかを判別する請求項1に記載の文書読取装置。
【請求項6】
前記判別部は、前記文書構成として設定された文書サイズが前記認識部によって認識された前記文書領域の領域サイズと一致するかを判別する請求項1に記載の文書読取装置。
【請求項7】
前記判別部は、前記文書構成として設定された記載が前記認識部によって認識された前記文書領域に含まれるかを判別する請求項1に記載の文書読取装置。
【請求項8】
前記全体画像を表示する表示部を備え、
前記告知部は、前記判別部が一致すると判別した場合には一致判別に係る前記判別結果を、一致しないと判別した場合にはいずれの前記文書領域が前記文書構成と一致しないかをユーザが視認できる態様で不一致判別に係る前記判別結果を前記表示部に表示する請求項1から7のいずれか1項に記載の文書読取装置。
【請求項9】
複数の文書を載置する載置台と、前記載置台を撮像して前記載置台の全体画像を出力する撮像部とを備える文書読取装置の文書読取プログラムであって、
前記全体画像から前記載置台に載置された前記複数の文書のそれぞれの文書領域を認識する認識ステップと、
前記認識ステップで認識された前記文書領域の構成が事前に設定された文書構成と一致するかを判別する判別ステップと、
前記判別ステップによる判別結果を告知する告知ステップと
をコンピュータに実行させる文書読取プログラム。
【請求項10】
前記全体画像を表示する表示部を備え、
前記判別部は、前記文書構成として設定された前記記載としてのマークが前記文書領域に含まれるかをその存在位置と共に判別し、
前記告知部は、前記文書領域に前記マークが含まれると前記判別部が判別した場合に、前記全体画像に前記マークの前記存在位置をユーザに視認させるマーク指標を重畳して表示する請求項7に記載の文書読取装置。
【請求項11】
前記判別部は、前記記載として複数種類の前記マークが設定されている場合には、それぞれの種類の前記マークを互いに区別して判別し、
前記告知部は、それぞれの種類の前記マークをユーザが区別して視認できるように前記マーク指標を表示する請求項10に記載の文書読取装置。
【請求項12】
前記告知部は、前記判別部が判別した前記マークの個数に関する情報を前記表示部に表示する請求項10に記載の文書読取装置。
【請求項13】
前記文書領域のうち前記判別部が前記マークの有無を判別する判別領域の指定をユーザから受け付ける領域受付部を備える請求項10に記載の文書読取装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書読取装置および文書読取プログラムに関する。
【背景技術】
【0002】
ラインセンサを走査させることにより紙の文書の記載を読み取り、デジタルファイル化するスキャナが広く普及している。一般的なスキャナは、透明ガラスの原稿台の定位置に取り込んだ文書の記載を読み取る。このようなコピー機の応用としてのスキャナをさらに発展させ、画素が二次元的に配列された撮像センサを用いて載置台に載置された文書の全体を俯瞰して撮像することにより、文書の記載を一度に読み取る書画カメラタイプの文書読取装置も知られるようになってきた(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
これまでの書画カメラタイプの文書読取装置は、撮像センサの制約もあり、その載置台には1枚程度の文書しか載置できなかった。しかし、撮像センサの性能の向上に伴い、広い載置台を一度に撮像しても十分な解像度が得られるようになってきた。そこで、一般的によく利用されるA4サイズの文書が複数枚載置できる載置台を備える文書読取装置の開発が視野に入ってきている。
【0005】
このような広い載置台を備える文書読取装置であれば、複数の文書を並べて一度に読み取り、それぞれの文書に対応する読取ファイルを即時に生成できるので利便性が高い。例えば、申込者ごとに3枚の申請書類を受け付ける場合には、それら3枚の申請書類を纏めて読み取れば、申込者単位で読取ファイルを生成でき、これらをグループとして管理することもできる。しかし、このような場合には当然ながら同一申込者から受け付けた3枚の申請書類を正しく選択して載置台に並べる必要があり、特に大量の申請書類を読み取るような場合には、しばしば並び間違えることが発生し得る。このような間違いに起因して不整合な文書構成の読取ファイルが発生すると、それらの読取ファイルを削除し、グループとして管理された他のファイル関係を再確認し、関連する申請書類を再度読み取る必要がある。すなわち、読取りを予定している複数枚の文書構成と実際に読み取った複数枚の文書構成が整合しないことがしばしば発生し、読取ファイルの生成後にその間違いに気づくと、正しい読取ファイルを取得し直す膨大な作業が発生してしまう。
【0006】
本発明は、このような問題を解決するためになされたものであり、互いに関連する複数枚の文書を一度に読み取る場合に、それらの文書が予定された文書構成と一致するかを、読取ファイルの生成前の段階で知らせてくれる文書読取装置等を提供するものである。
【課題を解決するための手段】
【0007】
本発明の第1の態様における文書読取装置は、複数の文書を載置する載置台と、載置台を撮像して載置台の全体画像を出力する撮像部と、全体画像から載置台に載置された複数の文書のそれぞれの文書領域を認識する認識部と、認識部に認識された文書領域の構成が事前に設定された文書構成と一致するかを判別する判別部と、判別部による判別結果を告知する告知部とを備える。
【0008】
また、本発明の第2の態様における文書読取プログラムは、複数の文書を載置する載置台と、載置台を撮像して載置台の全体画像を出力する撮像部とを備える文書読取装置の文書読取プログラムであって、全体画像から載置台に載置された複数の文書のそれぞれの文書領域を認識する認識ステップと、認識ステップで認識された文書領域の構成が事前に設定された文書構成と一致するかを判別する判別ステップと、判別ステップによる判別結果を告知する告知ステップとをコンピュータに実行させる。
【発明の効果】
【0009】
本発明により、互いに関連する複数枚の文書を一度に読み取る場合に、それらの文書が予定された文書構成と一致するかを、読取ファイルの生成前の段階で知らせてくれる文書読取装置等を提供することができる。
【図面の簡単な説明】
【0010】
【
図1】本実施形態に係る文書読取装置の利用状況の一例を示す図である。
【
図3】文書構成の判別結果を告知する表示画面の例を示す図である。
【
図4】文書領域の修正により文書構成が変更される例を示す図である。
【
図5】他の例における文書構成の判別結果を告知する表示画面の例を示す図である。
【
図6】他の例における文書構成の判別結果を告知する表示画面の例を示す図である。
【
図7】他の例における文書構成の判別結果を告知する表示画面の例を示す図である。
【
図8】ファイル生成指示の受付けと読取ファイルの生成を説明する図である。
【
図9】文書構成を設定する設定画面の例を示す図である。
【
図11】更に他の例における文書構成の判別結果を告知する表示画面の例を示す図である。
【
図12】更に他の例における文書構成の判別結果を告知する表示画面の例を示す図である。
【
図13】
図9の例に続く文書構成を設定する設定画面の例を示す図である。
【発明を実施するための形態】
【0011】
以下、発明の実施の形態を通じて本発明を説明するが、特許請求の範囲に係る発明を以下の実施形態に限定するものではない。また、実施形態で説明する構成の全てが課題を解決するための手段として必須であるとは限らない。
【0012】
図1は、本実施形態に係る文書読取装置100の利用状況の一例を示す図である。文書読取装置100は、複数の文書を一度に撮像して、その撮像画像からそれぞれの文書に対応する読取ファイルを生成することができる装置である。
【0013】
文書読取装置100は、主に、載置台101、制御ユニット110、撮像部120、照明部130、表示部140、入力部150を備える。載置台101は、例えばA4サイズの文書を縦横に2枚×3枚配列しても余裕のある程度の大きさを有する、複数の文書を載置するためのいわゆる原稿台である。載置台101の表面には、例えば低反射性の黒色シートが貼着されている。図の例では、載置台101上に、読取対象である3つの文書(文書A901、文書B902、文書C903)がランダムに載置されている。
【0014】
制御ユニット110は、文書読取装置100を制御するための制御素子、制御回路等を収容する。制御ユニット110は、例えばPCのような汎用コンピュータであってもよく、制御ユニット110がPCである場合には、文書読取プログラムを実行することによって、全体が文書読取装置100として機能する。
【0015】
撮像部120は、載置台101を俯瞰するように設置されており、載置台101の全体を一定の解像度で撮像できる撮像レンズと撮像センサを備える。撮像部120は、制御ユニット110の要求に従って載置台101を撮像し、生成した撮像信号を制御ユニット110へ送信する。撮像部120は、専用の撮像ユニットではなく、例えば汎用のミラーレス一眼カメラを用いて構成してもよい。照明部130は、載置台101の全体を均質に照明する。照明部130は、撮像部120と同様に載置台101を俯瞰するように設置されており、例えば白色LEDと、その発光を拡散させる拡散板を備える。照明部130は、制御ユニット110の指示に従って載置台101を照射する。照明部130は、各種情報を載置台101へ投射可能なプロジェクタを用いて構成してもよい。
【0016】
表示部140は、載置台101に対して読取対象となる文書を載置したり取り除いたりする作業を行うユーザが視認しやすい位置に設置された、例えば液晶モニタである。表示部140は、制御ユニット110からの表示信号を受信して、撮像部120が撮像した載置台101の全体画像等を表示する。図においては、載置台101に載置された文書A901、文書B902、文書C903を含む全体画像等が表示されている様子を表している。入力部150は、ユーザが制御ユニット110へ指示を行うための入力デバイスであり、例えば図示するようなマウスを含む。また、入力部150は、表示部140の表示面に重畳されたタッチパネルや、音声指示認識に連動するマイク等を含んでもよい。
【0017】
図2は、文書読取装置100のハードウェア構成図である。制御ユニット110は、主に、制御部160、記憶部170、画像処理部180を備える。制御部160は、文書読取装置100の制御とプログラムの実行処理を行うプロセッサ(CPU:Central Processing Unit)である。プロセッサは、ASIC(Application Specific Integrated Circuit)やGPU(Graphics Processing Unit)等の演算処理チップと連携する構成であってもよい。制御部160は、記憶部170に記憶された文書読取プログラムを読み出して、文書読取に関する様々な処理を実行する。
【0018】
記憶部170は、不揮発性の記憶媒体であり、例えばSSD(Solid State Drive)によって構成される。記憶部170は、生成された読取ファイルを記憶する他にも、文書読取装置100の動作時に必要な定数、変数、設定値、CGデータ、文書読取プログラム等も記憶する。特に本実施形態においては、後述する文書構成設定ファイルを記憶する。画像処理部180は、例えば専ら画像処理を実行するASICによって構成され、撮像部120から受け取った撮像信号に補間処理等の各種の画像処理を施し、予め定められたフォーマットに即した画像データを生成して制御部160へ引き渡す。
【0019】
撮像部120、照明部130、表示部140、入力部150は、制御部160と有線または無線によって接続されている。撮像部120は、制御部160からの撮像要求に応じて撮像処理を実行し、その出力である撮像信号を制御部160へ返す。例えば、表示用の撮像信号を要求された場合には、撮像部120は、60fpsの周期で撮像処理を繰り返し、そのフレーム信号を撮像信号として制御部160へ逐次送信する。この場合、画像処理部180は、制御部160から引き渡されたフレーム信号から60fpsの画像データを生成し、その画像データは制御部160によって表示信号に変換されて、表示部140で60fpsの表示画像として表示される。
【0020】
照明部130は、制御部160からの照明指示に応じてLEDを発光させ、停止信号に応じてLEDの発光を停止する。表示部140は、制御部160が生成、変換した表示信号を受信し、視認可能なモニタ映像に変換して表示する。入力部150は、ユーザの操作を操作信号に変換して制御部160へ送信する。
【0021】
制御部160は、実行する文書読取プログラムに応じて様々な機能制御部としての役割を担う。例えば、表示部140に表示させるモニタ映像のための表示信号を生成する場合には表示制御部として機能する。制御部160は、本実施形態においては特に、認識部161、判別部162、告知部163、受付部164、ファイル生成部165として機能し得る。認識部161は、主に、画像処理部が生成した全体画像から、載置台101に載置された複数の文書のそれぞれの文書領域を認識する。判別部162は、主に、認識部161に認識された文書領域の構成が事前に設定された文書構成と一致するかを判別する。告知部163は、主に、判別部162による判別結果を告知する。受付部164は、主に、入力部150と協働してユーザからファイル生成指示を受け付ける。ファイル生成部165は、主に、画像処理部180と協働して全体画像から文書領域をそれぞれ切り出し、互いに関連付けられた複数の読取ファイルを生成する。
【0022】
本実施形態における文書読取装置100のように広い載置台を備える文書読取装置は一般的に、複数の文書を並べて一度に読み取り、それぞれの文書に対応する読取ファイルを即時に生成できるので利便性が高い。例えば、申込者ごとに3枚の申請書類を受け付ける場合には、それら3枚の申請書類を纏めて読み取れば、申込者単位で読取ファイルを生成でき、これらをグループとして管理することもできる。しかし、このような場合には当然ながら同一申込者から受け付けた3枚の申請書類を正しく選択して載置台に並べる必要があるが、特に多くの申込者から受け付けた大量の申請書類を読み取るような場合には、作業者が間違った組合せの申請書類を並べてしまうことがある。
【0023】
このような間違いに起因して不整合な文書構成の読取ファイルが発生すると、それらの読取ファイルを削除し、グループとして管理された他のファイル関係を再確認し、関連する申請書類を再度読み取る等の作業が必要となる。すなわち、従来の文書読取装置では、読取りを予定している複数枚の文書構成と実際に読み取った複数枚の文書構成が整合しないことがしばしば発生し、作業者は、読取ファイルの生成後にその間違いに気づくと、回復のための膨大な作業を強いられていた。
【0024】
そこで、本実施形態における文書読取装置100は、読取ファイルの生成前に、認識部161によって認識された文書領域の構成が事前に設定された文書構成と一致するか否かを判別部162が判別し、その判別結果を告知部163がユーザに対して告知する。このような文書読取装置100によれば、ユーザは、読取り対象となる複数の文書が未だ載置台101に載置されている状態で、当該文書の構成が予定された構成と異なることを知ることができ、正しい文書に差し替える等の対処を直ちに行える。また、読取ファイルの生成前に間違いの指摘を受けるので、ユーザは、既に生成され記憶部170に記憶された読取ファイルの間違いを探したり削除したりする必要がない。
【0025】
以下に、いくつかの例を通じて、主に判別部162による文書構成の一致判別と告知部163による告知の処理について説明する。
図3は、文書構成の一致判別とその判別結果の告知の一例を説明するための図であり、特に、判別結果を告知する表示画面の例を示す図である。
【0026】
図3(A)は、認識部161によって認識された文書領域の構成が事前に設定された文書構成と一致しないと判別部162が判別した場合の表示例を示す図である。表示部140には載置台101の全体像である全体画像200が、いくつかのCGと共に表示されている。全体画像200は、例えばA4サイズの文書である文書A901、文書B902、文書C903の像が含まれ、認識部161によりそれぞれ文書領域A201、文書領域B202、文書領域C203として自動的に認識されている。全体画像200からそれぞれの文書領域の認識は、例えば全体画像を所定の閾値で白黒画像化し、白黒の境界と矩形形状のマッチングに基づいて行うことができる。このような自動認識を採用することにより、文書が載置台101に対して斜めに載置されていても、文書領域を適切に認識することができる。すなわち、ユーザは、読取ファイルを生成したい文書を、向きを気にすることなく素早く載置台101に載置することができる。
【0027】
認識された文書領域A201、文書領域B202、文書領域C203のそれぞれの外縁部分には、一定幅の縁取り枠である枠指標A211、枠指標B212、枠指標C213が重畳されている。それぞれの指標枠はCGであり、例えば彩色により互いが区別される。本実施形態においては縁取り枠を採用するが、文書領域をユーザが視認できるのであれば、例えば四隅にL字状のポインタを配置するなど、いずれの態様であっても構わない。
【0028】
枠指標A211、枠指標B212、枠指標C213のそれぞれの近傍には、文書領域を識別するための識別記号を示す識別指標A221、識別指標B222、識別指標C223が重畳されている。本実施形態における識別記号は、表示されている全体画像200に含まれる文書領域の順番を示すべく「1」「2」「3」のように連番を採用している。識別指標として表示する識別記号は連番に限らず、読取ファイルの生成時に付与されるファイル名の一部であったり、OCR機能により認識された文書内容に基づくものであったりしてもよい。
【0029】
ここでは、一度に読み取るべき文書の構成は、文書枚数が4枚であり、文書サイズがA4サイズであると事前に設定されているとする。文書構成の具体的な事前設定については後述するが、ユーザによって事前に設定された文書構成は、文書構成設定ファイルに記述されて記憶部170に記憶されている。判別部162は、文書構成設定ファイルを記憶部170から読み出し、そこに記述された文書構成と、認識部161が認識した複数の文書領域の構成とが一致するか否かを判別する。図の例では、文書構成設定ファイルに記述されている文書構成である「文書枚数が4枚、それぞれの文書サイズがA4サイズ」と、認識された文書領域(文書領域A201、文書領域B202、文書領域C203)の領域数および領域サイズとを比較し、一致するか否かを判別する。この例において判別部162は、A4サイズの文書が1枚足りないことを判別し、その判別結果を告知部163へ引き渡す。
【0030】
告知部163は、そのような判別結果を受け取ると、「A4文書が1枚たりません」のテキストを含む不一致告知241を生成し、全体画像200に重畳して表示部140に表示させることにより、その判別結果をユーザに告知する。このとき、ユーザからファイル生成指示を受け付けるファイルボタン231は、例えばグレーアウトの処理が施され、ユーザからの操作を受け付けない。すなわち、事前に設定された文書構成と認識された文書領域の構成が一致しない場合には、読取ファイルの生成が禁止される。
【0031】
図3(B)は、認識部161によって認識された文書領域の構成が事前に設定された文書構成と一致すると判別部162が判別した場合の表示例を示す図である。ここでは、認識部161によって認識された文書領域の構成は
図3(A)の例と同一であるが、一度に読み取るべき文書の構成は、文書枚数が3枚であり、文書サイズがA4サイズであると事前に設定されているとする。この例において判別部162は、認識部161によって認識された文書領域の構成が事前に設定された文書構成と一致することを判別し、その判別結果を告知部163へ引き渡す。
【0032】
告知部163は、そのような判別結果を受け取ると、「文書構成が一致しました。」のテキストを含む一致告知242を生成し、全体画像200に重畳して表示部140に表示させることにより、その判別結果をユーザに告知する。このとき、ファイルボタン231はアクティブとなり、ユーザからのファイル生成指示を受け付ける。ユーザは、指標枠に囲まれたそれぞれの文書領域から読取ファイルを生成してよいと考えたら、ファイルボタン231にカーソル270を合わせてクリックする。
【0033】
なお、
図3の例では、文書構成として「文書枚数」と「文書サイズ」の2項目が事前に設定されているものとしたが、もちろん、いずれかの1項目が設定されていてもよい。例えば文書枚数が4枚とのみ設定されているのであれば、認識部161が認識した文書領域の領域数が4つである限り、それらの領域サイズがA4サイズに相当する大きさであろうが、A3サイズに相当する大きさであろうが、判別部162は一致すると判別する。
【0034】
図4は、文書構成の一致判別とその判別結果の告知の他の一例を説明するための図であり、特に、文書領域の修正により文書構成が変更される例を示す図である。
図3の例においては、載置台101に載置された文書がいずれもA4サイズの文書であったが、
図4の例では、A4サイズの文書とA3サイズの文書が混在して載置されている場合を想定している。具体的には、文書A901と文書C903は
図3の例と同じくA4サイズの文書であって、全体画像200においてはそれぞれがA4サイズに相当する文書領域A201および文書領域B203として認識されており、文書B902はA3サイズの文書であって、全体画像200においてはA3サイズに相当する文書領域B202として認識された場合について説明する。
【0035】
ここでは、一度に読み取るべき文書の構成は、文書枚数が3枚であり、それぞれの文書サイズがA4サイズであると事前に設定されているとする。
図4の上図に示すように、A3サイズに相当する文書領域B202が認識されると、枠指標B212は当該領域を取り囲むように表示される。この状態において認識部161によって認識された文書領域の構成は、A4サイズに相当する文書領域(文書A901、文書C903)が2つであり、A3サイズに相当する文書領域(文書領域B202)が1つである。したがって、判別部162は、事前に設定された文書構成に対して、A3文書が1枚余分に存在することと、A4文書が1枚足りないことを判別し、その判別結果を告知部163へ引き渡す。
【0036】
告知部163は、そのような判別結果を受け取ると、「A3文書が1枚不要です」と「A4文書が1枚足りません」のテキストを含む不一致告知241を生成し、全体画像200に重畳して表示部140に表示させることにより、その判別結果をユーザに告知する。このとき、ファイルボタン231は、ユーザからの操作を受け付けない。
【0037】
ユーザは、A4サイズの正しい文書を載置すべきところを間違えてA3サイズの文書を載置したのであれば、A3サイズの文書を取り除いて、A4サイズの正しい文書を載置すればよい。しかし、ここでは、載置されたA3サイズの文書B902のうち、A4サイズに相当する左半分の領域から読取ファイルを生成したい場合について説明する。例えば、3枚一組の申請書類のうちの1枚がA3サイズであって、その左半分が申請者の記入欄となっており、右半分が注意事項の記載となっているような場合に、読取ファイルとしては左半分のみが必要な状況が考え得る。
【0038】
このような状況においてユーザは、文書領域B202を取り囲む枠指標B212のうち、中図に示すように、右辺にカーソル270を合わせ、左辺へ向かってドラッグする。そして、下図に示すように、A4サイズに相当するまで幅を縮めてリリースすると、枠指標B212が取り囲む領域が確定し、この取り囲まれた領域が新たな文書領域B202として認識される。すなわち、受付部164がユーザから枠指標を変形する変形指示を受け付けると、その変形結果により認識部161が認識した文書領域が修正される。
【0039】
文書領域B202の領域サイズがA4サイズ相当に修正されると、文書領域A201と文書領域C203のそれぞれの領域サイズもA4サイズ相当であることから、事前に設定された文書構成と一致することになる。したがって、判別部162は、文書領域B202が修正されたことにより、文書領域B202を含む全体の文書領域の構成が事前に設定された文書構成と一致すると判別し、その判別結果を告知部163へ引き渡す。
【0040】
告知部163は、そのような判別結果を受け取ると、「文書構成が一致しました。」のテキストを含む一致告知242を生成し、全体画像200に重畳して表示部140に表示させることにより、その判別結果をユーザに告知する。このとき、ファイルボタン231はアクティブとなり、ユーザからのファイル生成指示を受け付ける。ユーザからのファイル生成指示を受け付けると、枠指標に囲まれた文書領域が切り出されて読取ファイルが生成される。すなわち、修正されていない文書領域A201および文書領域C203については、それぞれ文書A901および文書Cの全体に相当する部分が切り出されて読取ファイルが生成され、修正後の枠指標B212に囲まれた文書領域B202については、文書B902のうち左半分に相当する部分が切り出されて読取ファイルが生成される。
【0041】
なお、ユーザによる入力部150の操作に応じて枠指標を追加し、例えばA3サイズに相当する文書領域B202を、2つのA4サイズに相当する枠指標を並べることにより2つの文書領域に分割してもよい。この場合、文書領域B202がA4サイズに相当する2つの文書領域に修正されたことになる。判別部162は、修正後の文書領域を含む全体の文書領域の構成が事前に設定された文書構成と一致するか否かを判別する。また、ユーザは、特定の文書領域の枠指標または識別指標にカーソル270を合わせて入力部150のデリートキーを押下すれば、当該文書領域は除去される。判別部162は、当該文書領域の除去後の全体の文書領域の構成が事前に設定された文書構成と一致するか否かを判別する。
【0042】
図5は、文書構成の一致判別とその判別結果の告知の他の一例を説明するための図であり、特に、判別結果を告知する表示画面の例を示す図である。
図5の例では、事前に設定された文書構成として、文書枚数と文書の色が設定されている。ここでは、一度に読み取るべき文書の構成は、文書枚数が4枚であり、それぞれの文書の色が、白色、水色、ピンク、黄色であると事前に設定されているとする。
【0043】
認識部161は、認識した文書領域の領域数とそれぞれの文書領域の素地色を判別部162へ引き渡し、判別部162は、そのような文書領域の構成が事前に設定されている文書構成と一致するか否かを判別する。図示する例においては、文書領域A201の素地色が白色であり、文書領域B202の素地色が水色であり、文書領域C203の素地色がピンクである。判別部162は、事前に設定された文書構成に対して、文書枚数が1枚足りず、文書の色として黄色に対応する文書領域が存在しないことを判別し、その判別結果を告知部163へ引き渡す。
【0044】
告知部163は、そのような判別結果を受け取ると、「黄色文書が1枚足りません」のテキストを含む不一致告知241を生成し、全体画像200に重畳して表示部140に表示させることにより、その判別結果をユーザに告知する。このとき、ファイルボタン231は、ユーザからの操作を受け付けない。
【0045】
図6は、文書構成の一致判別とその判別結果の告知の他の一例を説明するための図であり、特に、文書構成設定ファイルの記述内容と判別結果を告知する表示画面の例を示す図である。
図6の例では、事前に設定された文書構成として、それぞれの文書に記載されるロゴが設定されている。文書構成設定ファイルには、ユーザが登録した登録ロゴ251が記述されている。登録ロゴ251は、例えばGIFファイルとして文書構成設定ファイルに関連付けられていてもよい。
【0046】
認識部161は、認識した文書領域のそれぞれが、登録ロゴ251と同一のロゴを含むか否かを、例えばパターンマッチングの手法を用いて認識し、その認識結果を判別部162へ引き渡す。判別部162は、そのような認識結果を受け取ると、事前に設定された文書構成に対して、文書領域C203に登録ロゴ251が存在しないことを判別し、その判別結果を告知部163へ引き渡す。
【0047】
告知部163は、そのような判別結果を受け取ると、「登録ロゴが検出されません」のテキストを含む不一致告知241を生成して全体画像200に重畳すると共に、文書領域C203に例えば網掛けを施すことにより、その判別結果をユーザに告知する。このとき、ファイルボタン231は、ユーザからの操作を受け付けない。ユーザは、このような表示を確認することにより、いち早く条件を満たさない文書を認識することができる。
【0048】
なお、ユーザが登録するロゴは、文字を組み合わせて図案化したものに限らず、所属や識別などを示す標章であればよい。また、登録ロゴ251の設定にあたり、それぞれの文書の全体領域に対して登録ロゴ251が検出されるべき特定領域を併せて設定できるようにしてもよい。特定領域が設定されている場合には、認識部161は、当該特定領域に登録ロゴ251と同一のロゴを含むか否かを認識する。また、いずれの文書領域が事前に設定された文書構成と一致しないかを示す表示は、網掛け表示に限らない。ユーザがその文書領域を視認できる態様であれば、いかなる表示であっても構わない。
【0049】
図7は、文書構成の一致判別とその判別結果の告知の他の一例を説明するための図であり、特に、文書構成設定ファイルの記述内容と判別結果を告知する表示画面の例を示す図である。
図7の例では、事前に設定された文書構成として、それぞれの文書に記載される氏名が設定されている。文書構成設定ファイルには、ユーザが登録した登録氏名261が記述されている。
【0050】
認識部161は、認識した文書領域のそれぞれが、登録氏名261と同一の氏名を含むか否かを、例えばOCR機能を用いて認識し、その認識結果を判別部162へ引き渡す。判別部162は、そのような認識結果を受け取ると、事前に設定された文書構成に対して、文書領域A201に登録氏名261が存在しないことを判別し、その判別結果を告知部163へ引き渡す。
【0051】
告知部163は、そのような判別結果を受け取ると、「登録氏名が確認されません」のテキストを含む不一致告知241を生成して全体画像200に重畳すると共に、文書領域A201に例えば網掛けを施すことにより、その判別結果をユーザに告知する。このとき、ファイルボタン231は、ユーザからの操作を受け付けない。ユーザは、このような表示を確認することにより、いち早く条件を満たさない文書を認識することができる。なお、登録可能な氏名は1名に限らず、複数名の氏名を登録できるようにしてもよい。例えば、複数名の氏名を読取順位と共にリスト形式で受け付けて登録すれば、読取りごとに異なる氏名がその読取りにおいて認識された文書領域に含まれるか否かを判別することができる。例えば、読取順位の第1位に「鈴木太郎」が、第2位に「山田花子」が登録されている場合に、判別部162は、1度目の読取りにおいては認識された文書領域のそれぞれに「鈴木太郎」が含まれるかを判別し、2度目の読取りにおいては認識された文書領域のそれぞれに「山田花子」が含まれるかを判別する。
【0052】
また、ユーザが登録できる文字列は氏名に限らず、他の文字列を登録できるようにしてもよい。例えば特定の自治体名を登録できるようにすれば、文書に含まれる申込者住所欄に当該自治体名が記載された文書を判別することができ、当該自治体の住民からの申請書類に限って読取ファイルを生成することができる。また、登録氏名261の設定にあたり、それぞれの文書の全体領域に対して登録氏名261が検出されるべき特定領域を併せて設定できるようにしてもよい。特定領域が設定されている場合には、認識部161は、当該特定領域に登録氏名261と同一の氏名を含むか否かを認識する。他の文字列を登録できるようにする場合も同様である。
【0053】
図8は、ファイル生成指示の受付けと読取ファイルの生成を説明する図である。具体的には、
図3(B)で示す例において、ユーザがファイルボタン231にカーソル270を合わせてクリックした後の処理を説明する図である。
【0054】
受付部164がファイルボタン231のクリックを検知してユーザからのファイル生成指示を受け付けると、ファイル生成部165は、画像処理部180と協働して、全体画像200から枠指標に対応する領域をそれぞれ切り出して読取ファイルを生成する。なお、このとき切出し対象とする全体画像200の画像データは、表示部140の表示に用いた画像データであってもよいし、改めて撮像部120に撮像させて取得する画像データであってもよい。改めて撮像部120に撮像させる場合には、表示部140へ表示させるための画像データよりも高解像度の画像データが取得できるように、高解像モードで撮像させてもよい。
【0055】
図示するように、ファイル生成部165は、枠指標A211に囲まれた文書領域A201から読取ファイル「docfile_01.pdf」を、枠指標B212に囲まれた文書領域B202から読取ファイル「docfile_02.pdf」を、枠指標C213に囲まれた文書領域C203から読取ファイル「docfile_03.pdf」を生成する。ファイル名のうち連番を示す「01」「02」「03」は、識別指標の連番に対応する。すなわち、生成される読取ファイルの順序は、識別指標の識別記号が示す、あるいは内包する順位に応じて決定される。なお、本実施形態においては生成する読取ファイルをPDFファイルとするが、生成する読取ファイルのファイルフォーマットはPDFファイルに限らない。
【0056】
ファイル生成部165は、このように一度のファイル生成指示に基づいて生成した複数の読取ファイルを関連付ける関連付け処理を実行する。すなわち、一度のファイル生成指示に基づいて生成された複数の読取ファイルは、互いに関連するファイルであることが認識できるように、生成した読取ファイルに対して何らかの関連付け処理を実行する。本実施形態においては、一度のファイル生成指示に基づいて生成された複数の読取ファイルをまとめて格納するためのフォルダを生成する。具体的には、記憶部170のツリー構造において、例えば設定された階層に連番となるフォルダ「docfol_05」を生成し、当該フォルダに生成した3つの読取ファイルを格納する。関連付け処理は、フォルダを生成する場合に限らず、例えば、それぞれのファイルのタグ領域に、当該読取ファイルに連動して生成された読取ファイルのIDを記述してもよい。また、生成された複数の読取ファイルを、その順序に応じてそれぞれを一ページとする、一つの文書ファイルに纏めてもよい。
【0057】
次に、文書構成の具体的な事前設定について説明する。
図9は、文書構成を事前に設定する設定画面の例を示す図である。設定画面においては、設定可能な構成である構成項目282が縦方向に一列に列挙され、それぞれの構成項目282の左側には、その構成項目282の設定を有効または無効とするためのチェックボックス281が配置されている。例えば図の例では、構成項目282のうちの「ロゴ認識」の左に配置されたチェックボックス281には、設定が有効にされたことを示すチェックマークが配置されている。
【0058】
それぞれの構成項目282の右側には、その構成項目282に対してユーザによって選択された設定あるいは初期設定である設定構成283が配置されている。例えば図の例では、構成項目282のうちの「文書サイズ」の右側に、設定構成283として「A4」サイズが設定されている。設定構成283は、設定したい一つをクリックすると、例えば、予め用意された選択肢を示す選択ボックス285が現れ、ユーザは選択ボックス285に表示される選択肢の中から一つを選んで設定することができる。また、例えば構成項目282のうちの「氏名認識」のように任意の文字列の入力が必要な場合には、例えば、文字列の入力を受け付けるテキストボックスが現れ、ユーザはキーボード等を操作して文字列を入力することにより所望の文字列を設定することができる。
【0059】
設定構成283のさらに右側には詳細ボタン284が配置されている。ユーザが詳細ボタン284をクリックすると、詳細な設定構成を設定するための設定ウィンドウが開かれる。例えば、
図5の例のように文書の色を複数設定する場合や、
図6の例のように登録ロゴ251が表されたGIFファイルを指定する場合に設定ウィンドウが開かれる。設定ウィンドウを介して設定された設定構成は、例えば図において登録ロゴ251が表示されているように、少なくともその一部が対象となる設定構成283として表示される。
【0060】
ユーザから以上のような操作を受け付けた後に、受付部164が設定ボタン232のクリックを受け付けると、設定された内容に従って文書構成設定ファイルが生成または更新され、記憶部170に記憶される。
【0061】
次に、制御部160が実行する文書読取処理の処理手順について説明する。
図10は、制御部160の処理手順を示すフロー図である。フローは、ユーザによって読取対象となる文書が載置台101に載置された時点から開始する。
【0062】
制御部160は、ステップS101で、撮像部120へ撮像要求信号を送信して撮像処理を実行させ、その出力である撮像信号を受け取り、画像処理部180に画像処理を行わせることにより全体画像を取得する。認識部161は、ステップS102で、取得した全体画像から載置台101に載置された複数の文書のそれぞれの文書領域を認識する。制御部160は、ステップS103で、認識部161が認識したそれぞれの文書領域に枠指標等を重畳した表示信号を生成し、表示部140に視認可能なモニタ映像に変換させて表示させる。
【0063】
制御部160は、ステップS104で、事前に設定された文書構成が存在するか、すなわち、文書構成設定ファイルに設定が有効にされた構成項目が存在するか否かを確認する。有効にされた構成項目が存在しなければステップS109へ進み、有効にされた構成項目が1つでも存在すればステップS105へ進む。
【0064】
ステップS105へ進んだら、判別部162は、認識部161に認識された文書領域の構成が、文書構成設定ファイルで設定が有効にされた構成項目において設定された文書構成と一致するか否かを判別し、その判別結果を告知部163へ引き渡す。告知部163は、ステップS106で、その判別結果を確認し、一致するとの判別結果であればステップS107へ進み、一致告知242を生成して表示部140に表示させると共に、ファイルボタン231をアクティブに変更して、ステップS109へ進む。一致しないとの判別結果であればステップS108へ進み、不一致告知241を生成して表示部140に表示させると共にファイルボタン231を非アクティブのままにしてステップS101へ戻る。
【0065】
受付部164は、ステップS109で、ユーザからファイル生成指示を受け付けたか否かを確認する。ファイル生成指示を受け付けた場合には、ステップS110へ進み、ファイル生成部165は、全体画像から枠指標に対応する文書領域をそれぞれ切り出して複数の読取ファイルを生成し、それらの読取ファイルを関連付ける関連付け処理を行って、ステップS111へ進む。ファイル生成指示を受け付けていない場合には、ステップS110をスキップしてステップS111へ進む。
【0066】
制御部160は、ステップS111で、ユーザから終了指示を受けたか否かを確認する。終了指示を受けていなければ、ステップS101へ戻り、一連の処理を繰り返す。終了指示を受けていれば、一連の処理を終了させる。
【0067】
更に文書構成の一致判別とその判別結果の告知の例について説明する。
図11は、更に他の例における文書構成の判別結果を告知する表示画面の例を示す図である。上述の
図6の例では事前に文書に記載され得るロゴを文書構成設定ファイルに設定しておき、判別部162は、認識した文書領域のそれぞれが、文書構成ファイルに設定された登録ロゴと同一のロゴを含むか否かを判別した。
図11の例は
図6の例に類似するものであり、文書に記載されているか否かを確認したい1つ以上のマークをユーザが文書構成設定ファイルに設定しておくと、判別部162は、文書領域のそれぞれが設定された登録マークと同一のマークを含むか否かを、設定された登録マークごとに判別する。
【0068】
ユーザは、読取対象である文書が例えば物件の間取図や設備図を含む場合に、特定の設備が当該物件に含まれるかを、読取ファイルを生成する前に確認したい場合がある。そのような場合に、確認したい設備の図面記号を登録マークとして事前に設定しておく。
図11は、読取対象である文書B902が物件の間取図を含む場合であって、トイレとコンロの図面記号であるトイレ記号252aとコンロ記号252bがそれぞれ登録マークとして事前に設定されている場合の例を表している。図示するように、文書B902に対応する文書領域B202は、その一部を拡大図として示すように、ある物件の1階から3階までの間取図を含んでいる。また、登録マークを設定する設定ファイルには、事前の設定により、それぞれの図面記号を表す画像ファイル(例えばGIFファイル)が関連付けられる。
【0069】
文書領域A201、文書領域B202、文書領域C203は認識部161に認識された文書領域である。判別部162は、画像処理部180と協働してこれらの文書領域がトイレ記号252aとコンロ記号252bを含むか否かを判別する。これらの図面記号が含まれるか否かは、例えば、トイレ記号252aとコンロ記号252bのそれぞれの画像ファイルの画像を各文書領域にそれぞれ当てはめて一致度を算出するパターンマッチングの手法を採用することができる。この場合、判別対象となる図面記号は、文書領域内で画像ファイルの画像の向きや大きさと異なって存在していても適切に判別され得る。また、設定された登録マークが文書領域に含まれるか否かの判別は、パターンマッチングの手法に限らず、学習モデルに入力して登録マークに対応する領域を出力させる手法など他の手法を採用してもよい。
【0070】
判別部162は、設定された図面記号を文書領域中から見つけ出したら、当該図面記号の位置情報と共に、その判別結果を告知部163へ引き渡す。告知部163は、判別結果を受け取ると、当該図面記号の存在位置をユーザに視認させるマーク指標を全体画像200に重畳して表示部140に表示する。具体的には図示するように、トイレ記号252aには、それを取り囲む枠指標であるマーク指標A224aを、コンロ記号252bには、それを取り囲む枠指標であるマーク指標B224bを重畳する。マーク指標はCGであり、例えばマーク指標A224aとマーク指標B224bのように複数種類のマーク指標が重畳される場合には、例えば彩色により互いが区別されることが好ましい。また、ここではマーク指標として図面記号を取り囲む縁取り枠を採用するが、マーク指標をユーザが視認できるのであれば、例えば四隅にL字状のポインタを配置するなど、いずれの態様であっても構わない。
【0071】
また、告知部163は、判別部162が判別した図面記号の個数に関する情報を表示部140に表示する。具体的には、文書領域とできるだけ重ならない領域に告知ウィンドウ243を設け、当該告知ウィンドウ243に判別部162が判別したトイレ記号252aの個数とコンロ記号252bの個数をそれぞれの図面記号と共に表示する。このとき、それぞれの図面記号を見つけ出した文書領域に関する識別番号(図の例では文書領域B202に対応する「文書2」)も告知ウィンドウ243に表示するとよい。また、対応する文書領域の枠指標(図の例では枠指標B212)を点滅させるなどして、いずれの文書領域で図面記号が判別されたかをユーザに視認させるようにしてもよい。
【0072】
ファイルボタン231がクリックされてユーザからファイル生成指示を受け付けたら、ファイル生成部165は、画像処理部180と協働して、全体画像200から枠指標に対応する領域をそれぞれ切り出して読取ファイルを生成する。ファイル生成部165は、生成する読取ファイルに関連付けて判別部162の判別結果に関する情報を、例えば、それぞれのファイルのタグ領域に記述してもよい。例えば、トイレ記号252aとコンロ記号252bが見つかった文書領域B202から生成される読取ファイルのタグ領域には、「トイレ記号252a:3個、コンロ記号252b:2個」などと記述され得る。
【0073】
上記の説明においては、判別部162が設定された登録マークと同一のマークが含まれるか否かを判別する判別領域を、認識部161が認識したそれぞれの文書領域の全体と定めたが、ユーザが判別領域を指定できるように構成してもよい。例えば、受付部164は、判別領域の指定をユーザから受け付ける領域受付部として機能し、ユーザがカーソル270で取り囲む範囲を受け付けて判別領域とすることができる。あるいは、認識部161が認識したそれぞれの文書領域のうち、ユーザがカーソル270で取り囲む範囲を判別領域から除外してもよい。このようにユーザによる判別領域の指定を受け付ければ、例えば図面に含まれる記号凡例の領域のように認識の対象としたくない領域を判別領域から除外することができる。
【0074】
図11においては、物件の間取図からトイレとコンロの図面記号を判別してユーザに示す例を説明したが、もちろん対象となる図面記号はこれらに限らず他の図面記号も登録マークとして設定し得る。また、設定し得る登録マークの数は1つであってもよいし、3つ以上であってもよい。また、間取図が文書領域B202のみに含まれる場合に限らず、他の文書領域にも含まれていてもよく、その場合に判別部162は、対象となる文書領域のそれぞれに対して設定された登録マークの有無を判別する。告知部163は、判別された登録マークごとの個数を、表示部140に、対象となるすべての文書領域において判別された総数として表示してもよいし、文書領域ごとに分けて表示してもよい。
【0075】
また、対象とする登録マークは物件の間取図に用いられる図面記号に限らず、符号、標章、標識などのマークを設定の対象とすることができる。
図6を用いて説明したロゴもマークの一例に含み得る。したがって、これらのマークの有無を判別し得る対象は、間取図に限らず、例えば機械図面、回路図面、地図、数式、化学式なども想定し得る。
【0076】
登録マークとして印影を設定することもできる。商習慣において契約書等の複数の文書にまたがって印影が残るように印章を押す割印が知られている。ユーザは、このような割印が読取対象である文書に含まれるかを、読取ファイルを生成する前に確認したい場合がある。
図12は、更に他の例における文書構成の判別結果を告知する表示画面の例として、登録マークとしての印影が検出された様子を示す図である。
【0077】
図12に示す例においては、印影252cが登録マークとして事前に設定されている。文書領域B202は、載置台101に見開き状態で載置された文書B902を表し、頁の境界をまたぐ2か所において割印が存在する。判別部162は、文書領域B202から印影252cと同じ印影を見つけ出す。告知部163は、見つけ出されたこれらの印影を取り囲むようにマーク指標C224cを表示する。また、文章領域C203は、載置台101に載置された単葉の文書B902を表し、その一辺において約半分の印影が現れた割印が存在する。判別部162は、そのような割印であっても、文書領域C203から見つけ出す。具体的には、パターンマッチングの手法を用いる場合、マッチング演算の精度にもよるが、印影252cの約30%以上が一致する領域を対象となる文書領域から見つけ出すことができる。告知部163は、このような部分的な印影に対しても取り囲むようにマーク指標C224cを表示する。
【0078】
また、告知部163は、判別部162が登録マークである印影252cを検出した旨を告知する検出告知244を表示する。このとき、印影を見つけ出した文書領域の枠指標(図の例では枠指標B212および枠指標C213)を点滅させるなどして、いずれの文書領域で印影が判別されたかをユーザに視認させるようにしてもよい。
【0079】
ファイルボタン231がクリックされてユーザからファイル生成指示を受け付けたら、ファイル生成部165は、画像処理部180と協働して、全体画像200から枠指標に対応する領域をそれぞれ切り出して読取ファイルを生成する。このとき、いずれの文書領域からも登録マークである印影252cが検出されない場合には、例えばファイルボタン231をグレーアウト表示にして、ファイル生成指示を受け付けないようにしてもよい。
【0080】
図13は、
図9の例に続く文書構成を設定する設定画面の例を示す図であり、特に登録マークの設定について説明するための図である。
図9と同じ要素については同一の符番を付すことにより、その説明を省略する。
【0081】
構成項目282のうちの「登録マーク」の左に配置されたチェックボックス281が有効にされると、判別部162による登録マークの判別機能が有効に設定される。また、構成項目282の右側に配置された詳細ボタン284がクリックされると、詳細な設定構成を設定するための設定ウィンドウ291が開かれる。
【0082】
設定ウィンドウ291内には、主に、アップロードボタン292、登録マーク一覧293、ラジオボタン294、完了ボタン295が配置されている。ユーザは、アップロードボタン292をクリックすると、マークが記述された画像ファイル(例えばGIFファイル)を選択でき、選択された画像ファイルに記述されたマークは、登録マーク一覧293に配列される。ラジオボタン294は、オプションメニューの選択のために配列されており、図の例では、「カウント表示」のラジオボタン294がクリックされると、登録マークごとに検出された個数が告知ウィンドウ243に表示されるように設定される。「未検出時のファイル生成を許可」のラジオボタン294がクリックされると、登録マークが検出されなかった場合でも読取ファイルの生成が許容されるように設定される。完了ボタン295がクリックされると、設定された項目が確定され、設定ウィンドウ291は、閉じられる。
【0083】
以上説明した本実施形態においては、受付部164は、入力部150を介してユーザの指示を受け付けるものとして説明したが、例えば、ユーザが載置台101上で行う手振りを認識部161が全体画像から認識した場合に、当該手振りに関連付けられている特定の指示が与えられたものと受け付けてもよい。
【0084】
また、以上説明した本実施形態においては、告知部163は、表示部140に不一致告知241または一致告知242を重畳表示することにより、判別部162による判別結果を告知するが、判別結果の告知は表示部による表示に限らず、スピーカによる音声等であってもよい。
【0085】
また、以上説明した本実施形態においては、複数の文書を読み取る場合について説明したが、もちろん文書読取装置100は、載置台101に単一の文書が載置されたされた場合にも読取ファイルを生成することができる。判別部162が文書領域に設定されたマークが含まれるかをその存在位置と共に特に判別し、告知部163が全体画像200に当該マークの存在位置をユーザに視認させるマーク指標を重畳して表示部140に表示する処理は、単一の文書が載置されたされた場合であっても有効である。載置台101は複数の文書が載置できる程度に大きいので、例えば大サイズの図面を一枚載置して登録マークを検出させる用途にも好適である。また、含まれているべきマークが文書に含まれていないことが読取ファイルの生成前にわかれば、そのような文書の読取ファイルを生成してしまったり、それを除去する手間を生じさせたりすることを防ぐことができる。
【符号の説明】
【0086】
100…文書読取装置、101…載置台、110…制御ユニット、120…撮像部、130…照明部、140…表示部、150…入力部、160…制御部、161…認識部、162…判別部、163…告知部、164…受付部、165…ファイル生成部、170…記憶部、180…画像処理部、200…全体画像、201…文書領域A、202…文書領域B、203…文書領域C、211…枠指標A、212…枠指標B、213…枠指標C、221…識別指標A、222…識別指標B、223…識別指標C、224a…マーク指標A、224b…マーク指標B、224c…マーク指標C、231…ファイルボタン、232…設定ボタン、241…不一致告知、242…一致告知、243…告知ウィンドウ、244…検出告知、251…登録ロゴ、252…登録マーク、252a…登録マークA、252b…登録マークB、252c…登録マークC、261…登録氏名、270…カーソル、281…チェックボックス、282…構成項目、283…設定構成、284…詳細ボタン、285…選択ボックス、291…設定ウィンドウ、292…アップロードボタン、293…登録マーク一覧、294…ラジオボタン、295…完了ボタン、901…文書A、902…文書B、903…文書C