(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1または2に記載の技術では、ユーザは、視認可能なインクを用いて文書に対して例えばアンダーラインを記載するなど所定の情報を記載する。このため、特許文献1または2に記載の技術では、文書のスキャン画像において、ユーザにより記載された情報が視認可能となってしまう。
【0007】
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、スキャン画像において視認不可能となるように原稿に記載されたマークの範囲に記載されている文字列を認識することが可能な、新規かつ改良されたスキャナ装置、及びプログラムを提供することにある。
【課題を解決するための手段】
【0008】
上記課題を解決するために、本発明のある観点によれば、可視光と紫外光とで原稿のスキャンを行う読み取り部と、前記紫外光でスキャンされた画像から、線分である区間マークの開始位置と終了位置において前記区間マークに対して垂直に記載された開始マークおよび終了マークを認識するマーク認識部と、前記可視光でスキャンされた画像から前記開始マーク、前記区間マーク、および前記終了マークの範囲に記載された文字列を認識する文字列認識部と、前記文字列認識部で認識された文字列をファイル名として、前記可視光でスキャンされた画像を保管するように制御するファイル保管部と、を備える、スキャナ装置が提供される。
【0009】
前記開始マーク、前記区間マーク、および前記終了マークは、可視光で読み取り不能なインクを用いて前記原稿に記載されていてもよい。
【0010】
前記区間マークの方向は、前記原稿において文字列が記載されている方向と同じであってもよい。
【0011】
また、上記課題を解決するために、本発明の別の観点によれば、可視光と紫外光とで原稿のスキャンを行う読み取り部と、前記紫外光でスキャンされた画像から、線分である第1の区間マークと、前記第1の区間マークの開始位置において前記第1の区間マークに対して垂直に記載された開始マークとを認識するマーク認識部と、前記可視光でスキャンされた画像から前記第1の区間マーク上に記載されている文字列を認識する文字列認識部と、前記文字列認識部で認識された文字列に基づいてファイル名を設定し、前記可視光でスキャンされた画像を保管するように制御するファイル保管部と、を備える、スキャナ装置が提供される。
【0012】
前記マーク認識部は、前記紫外光でスキャンされた画像から、前記原稿において前記第1の区間マークが記載されている行の次の行に記載されている、前記第1の区間マークと平行な線分である第2の区間マークと、前記第2の区間マークの終了位置において前記第2の区間マークに対して垂直に記載された終了マークとをさらに認識し、前記文字列認識部は、前記可視光でスキャンされた画像から前記第2の区間マーク上に記載されている文字列をさらに認識し、前記ファイル保管部は、前記第1の区間マーク上に記載されている文字列の認識結果と前記第2の区間マーク上に記載されている文字列の認識結果とを連結することにより前記ファイル名を設定してもよい。
【0013】
前記マーク認識部は、前記紫外光でスキャンされた画像から、前記原稿において前記第1の区間マークの終了位置において前記第1の区間マークに対して垂直に記載された終了マークをさらに認識し、前記ファイル保管部は、前記第1の区間マーク上に記載されている文字列の認識結果を前記ファイル名に設定してもよい。
【0014】
また、上記課題を解決するために、本発明の別の観点によれば、コンピュータを、可視光と紫外光とで原稿のスキャンを行う読み取り部と、前記紫外光でスキャンされた画像から、線分である区間マークの開始位置と終了位置において前記区間マークに対して垂直に記載された開始マークおよび終了マークを認識するマーク認識部と、前記可視光でスキャンされた画像から前記開始マーク、前記区間マーク、および前記終了マークの範囲に記載された文字列を認識する文字列認識部と、前記文字列認識部で認識された文字列をファイル名として、前記可視光でスキャンされた画像を保管するように制御するファイル保管部、として機能させるための、プログラムが提供される。
【発明の効果】
【0015】
以上説明したように本発明によれば、スキャン画像において視認不可能となるように原稿に記載されたマークの範囲に記載されている文字列を認識することができる。
【発明を実施するための形態】
【0017】
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0018】
また、本明細書及び図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なるアルファベットを付して区別する場合もある。例えば、実質的に同一の機能構成を有する複数の構成を、必要に応じてスキャナ10aおよびスキャナ10bのように区別する。ただし、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、同一符号のみを付する。例えば、スキャナ10aおよびスキャナ10bを特に区別する必要が無い場合には、単にスキャナ10と称する。
【0019】
<<1.実施形態の詳細な説明>>
<1−1.概要>
まず、本実施形態の概要について、
図1を参照して説明する。本実施形態によるスキャナ10は、配置された文書をスキャンし、そして、スキャンした画像ファイルを保存するための装置である。このスキャナ10は、本発明におけるスキャナ装置の一例である。なお、スキャナ10は、複合機であってもよい。また、文書は、本発明における原稿の一例である。
【0020】
また、スキャナ10は、スキャン後の画像ファイルに対してファイル名を設定することが可能である。ここで、画像ファイルのファイル名には、ファイルの内容をユーザが判別可能な名前が設定されることが望ましい。そこで、
図1に示したように、まず、ユーザは、文書20に記載されている文字列のうち、ファイル名とすることを希望する文字列の上に例えばペン30を用いて所定の図形を記載しておく。そして、スキャナ10は、文書20がスキャンされた画像ファイルから、記載された所定の図形の位置に記載されている文字列を認識し、そして、認識した文字列に基づいて文書20のファイル名を自動的に設定することが可能である。これにより、ユーザは、ファイルの内容が判別可能なファイル名を、スキャン後の画像ファイルに容易に設定することができる。
【0021】
ところで、ユーザが文書に対して所定の図形を記載する際に、仮に視認可能なインクを用いると、当該文書がスキャンされた画像ファイルにおいて、記載された図形が視認可能となってしまう。
【0022】
そこで、上記事情を一着眼点にして、本実施形態によるスキャナ10を創作するに至った。本実施形態によれば、スキャン画像において視認不可能となるように原稿に記載された所定の図形の範囲に記載されている文字列を認識し、そして、認識した文字列に基づいてスキャン画像のファイル名を自動的に設定することができる。
【0023】
<1−2.構成>
次に、本実施形態による構成について説明する。
図2は、本実施形態によるスキャナ10の構成を示した機能ブロック図である。
図2に示したように、スキャナ10は、制御部100、スキャン部120、および、記憶部126を有する。
【0024】
[1−2−1.制御部100]
制御部100は、スキャナ10に内蔵される例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などのハードウェアを用いて、スキャナ10の動作を全般的に制御する。また、
図2に示したように、制御部100は、マーク認識部102、文字列認識部104、および、ファイル保管部106を有する。
【0025】
[1−2−2.マーク認識部102]
マーク認識部102は、後述する紫外光スキャン部124により文書がスキャンされた紫外光スキャン画像から、例えば紫外光でのみ読み取り可能なインクなど、可視光で読み取り不能なインクを用いて文書に記載された所定の文字列認識用図形を認識する。ここで、所定の文字列認識用図形の種類は、例えば、一行用の文字列認識用図形と、二行用の文字列認識用図形との二種類である。例えば、一行用の文字列認識用図形は、文書内の一行に記載された、線分である区間マークと、区間マークの開始位置および終了位置において区間マークに対して垂直に記載された開始マークおよび終了マークとが結合された図形である。ここで、区間マークの方向は、例えば、文書において文字列が記載されている方向と同じである。
【0026】
図3は、一行用の文字列認識用図形の一例(一行用の文字列認識用図形210)が記載された文書の例(文書20)を示した説明図である。
図3に示したように、一行用の文字列認識用図形210は、開始マーク220a、終了マーク220b、および、区間マーク222が結合された図形である。なお、
図3に示したように、文書20において左横書きで文字列が記載されている場合には、開始マーク220aおよび終了マーク220bは縦線であり、また、区間マーク222は横線である。ここで、開始マーク220aは、認識対象の文字列の最初の文字の位置に記載される、文字の高さと略同一の長さの直線である。また、終了マーク220bは、認識対象の文字列の最後の文字の位置に記載される、文字の高さと略同一の長さの直線である。また、区間マーク222は、例えば、開始マーク220aの中央の位置から終了マーク220bと接する位置まで記載される直線である。
【0027】
また、二行用の文字列認識用図形は、例えば、第1の文字列認識用図形と、文書において第1の文字列認識用図形が記載されている行の次の行に記載された第2の文字列認識用図形とから構成される。ここで、第1の文字列認識用図形は、線分である第1の区間マークと、第1の区間マークの開始位置において第1の区間マークに対して垂直に記載された開始マークとが結合された図形である。また、第2の文字列認識用図形は、第1の区間マークと平行な線分である第2の区間マークと、第2の区間マークの終了位置において第2の区間マークに対して垂直に記載された終了マークとが結合された図形である。
【0028】
図4は、二行用の文字列認識用図形の一例(二行用の文字列認識用図形230)が記載された文書の例(文書20)を示した説明図である。
図4に示したように、二行用の文字列認識用図形230は、第1の文字列認識用図形230aと、第1の文字列認識用図形230aの次の行に記載される第2の文字列認識用図形230bとから構成される。ここで、第1の文字列認識用図形230aは、開始マーク240aおよび第1の区間マーク242aが結合された図形である。また、開始マーク240aは、認識対象の文字列の最初の文字の位置に記載される、文字の高さと略同一の長さの直線である。また、第1の区間マーク242aは、開始マーク240aの中央の位置から行末の位置まで記載される直線である。
【0029】
また、第2の文字列認識用図形230bは、終了マーク240bおよび第2の区間マーク242bが結合された図形である。ここで、終了マーク240bは、認識対象の文字列の最後の文字の位置に記載される、文字の高さと略同一の長さの直線である。また、第2の区間マーク242bは、(第1の文字列認識用図形230aが記載されている行の次の行の)行頭から終了マーク240bの位置まで記載される直線であり、かつ、終了マーク240bの中央の位置で接するように記載される。なお、文書20において左横書きで文字列が記載されている場合には、開始マーク240aおよび終了マーク240bは、縦線であり、また、第1の区間マーク242aおよび第2の区間マーク242bは、横線である。
【0030】
なお、
図3および
図4では、左横書きで文字列が記載されている場合において、マーク認識部102が文字列認識用図形を認識する例を示したが、かかる例に限定されない。例えば、マーク認識部102は、文字列が右横書きや縦書きで記載されている場合に関しても、同様に文字列認識用図形を認識することが可能である。なお、例えば、文字列が縦書きで記載されている場合には、文字列認識用図形における開始マークおよび終了マークは、文字の幅と略同一の長さの横線であり、また、区間マーク(または、第1の区間マーク・第2の区間マーク)は縦線である。
【0031】
上述した文字列認識用図形の記載例によれば、例えば文字列に対してアンダーラインを引く方法などと比較して、ユーザは、認識対象の最初の文字の位置および最後の文字の位置を明確に指定することができるので、スキャナ10は、ユーザの意図した文字列を正確に特定することができる。また、開始マークおよび終了マークにより、文字列が横書きの場合には認識対象の文字の高さを、文字列が縦書きの場合には文字の幅をユーザはそれぞれ指定することができるので、文字列の認識の精度を向上させることができる。
【0032】
(1−2−2−1.変形例)
なお、紫外光スキャン部124によりスキャンされる文書の枚数が一枚の場合だけでなく、複数枚の文書が同時にスキャンされる場合に関しても、マーク認識部102は、上記の文字列認識用図形を認識することが可能である。例えば、マーク認識部102は、同時にスキャンされた複数枚の文書のうち例えばスキャンされた順番に沿って一枚ずつ文字列認識用図形を探索することにより、当該複数枚の文書のうちいずれか一枚に記載された文字列認識用図形を認識することが可能である。
【0033】
[1−2−3.文字列認識部104]
文字列認識部104は、後述する可視光スキャン部122により文書がスキャンされた可視光スキャン画像から、マーク認識部102により認識された所定の文字列認識用図形で囲まれた範囲に記載されている文字列を例えばOCRにより認識する。例えば、
図3に示した例では、文字列認識部104は、マーク認識部102により認識された一行用の文字列認識用図形210で囲まれた範囲に記載されている文字列(「KYZ10」)を認識する。また、
図4に示した例では、マーク認識部102により二行用の文字列認識用図形230が認識された場合には、文字列認識部104は、認識された第1の文字列認識用図形230aで囲まれた範囲に記載されている文字列(「BDFH」)と、第2の文字列認識用図形230bで囲まれた範囲に記載されている文字列(「J1357」)とをそれぞれ認識する。
【0034】
なお、文字列認識部104は、プリンタ等により印字された文字列だけでなく、手書きされた文字列を認識することも可能である。
【0035】
[1−2−4.ファイル保管部106]
ファイル保管部106は、文字列認識部104により認識された文字列に基づいて、可視光スキャン部122により取得される可視光スキャン画像のファイル名を設定する。例えば、マーク認識部102により一行用の文字列認識用図形が認識された場合には、ファイル保管部106は、文字列認識部104により認識された文字列を可視光スキャン画像のファイル名として設定する。また、マーク認識部102により二行用の文字列認識用図形が認識された場合には、ファイル保管部106は、第1の文字列認識用図形で囲まれた範囲に記載されている文字列の認識結果と、第2の文字列認識用図形で囲まれた範囲に記載されている文字列の認識結果とを連結し、そして、連結した文字列を可視光スキャン画像のファイル名として設定する。
【0036】
また、ファイル保管部106は、可視光スキャン部122により取得された可視光スキャン画像を、後述する記憶部126に保管する。
【0037】
[1−2−5.スキャン部120]
スキャン部120は、本発明における読み取り部の一例である。
図2に示したように、スキャン部120は、可視光スキャン部122、および、紫外光スキャン部124を含む。
【0038】
[1−2−6.可視光スキャン部122]
可視光スキャン部122は、可視光を用いて文書をスキャンすることにより、可視光スキャン画像を取得する。例えば、可視光スキャン部122は、配置された文書に可視光を照射し、その反射光を撮像素子で電気信号に変換することにより、可視光スキャン画像を取得する。
【0039】
[1−2−7.紫外光スキャン部124]
紫外光スキャン部124は、紫外光を用いて文書をスキャンすることにより、紫外光スキャン画像を取得する。例えば、紫外光スキャン部124は、配置された文書に紫外光を照射し、その反射光を撮像素子で電気信号に変換することにより、紫外光スキャン画像を取得する。
【0040】
[1−2−8.記憶部126]
記憶部126は、例えば、可視光スキャン部122により取得された可視光スキャン画像や、各種のソフトウェアなどを記憶することが可能である。
【0041】
<1−3.動作>
以上、本実施形態による構成について説明した。続いて、本実施形態による動作について、
図5〜
図7を参照して説明する。
図5は、本実施形態による動作を示したフローチャートである。
図5に示したように、まず、ユーザは、スキャン対象の文書に記載されている文字列のうち、ファイル名に設定することを希望する文字列の上に、紫外光でのみ読み取り可能なインクを用いて所定の文字列認識用図形を記載する(S101)。そして、ユーザは、スキャナ10に当該文書をセットする(S103)。
【0042】
その後、可視光スキャン部122は、例えばユーザの操作に基づいて、S103でセットされた文書を可視光を用いてスキャンすることにより、可視光スキャン画像を取得する(S105)。
【0043】
続いて、紫外光スキャン部124は、セットされた文書を紫外光を用いてスキャンすることにより、紫外光スキャン画像を取得する(S107)。
【0044】
続いて、スキャナ10は、後述する「ファイル名設定処理」を実行する(S109)。
【0045】
その後、ファイル保管部106は、S105で取得された可視光スキャン画像を記憶部126に保管する(S111)。
【0046】
[1−3−1.ファイル名設定処理]
ここで、
図6および
図7を参照して、S109における「ファイル名設定処理」の動作について詳細に説明する。
図6に示したように、まず、マーク認識部102は、S107でスキャンされた紫外光スキャン画像を取得する(S201)。そして、マーク認識部102は、取得した紫外光スキャン画像において所定の文字列認識用図形を探索する(S203)。所定の文字列認識用図形が認識されなかった場合には(S203:No)、ファイル保管部106は、例えばスキャン日時情報を用いるなど所定のルールに従ってファイル名を生成し、そして、生成したファイル名を、S105で取得された可視光スキャン画像のファイル名に設定する(S205)。そして、当該「ファイル名設定処理」は終了する。
【0047】
一方、所定の文字列認識用図形が認識された場合には(S203:Yes)、マーク認識部102は、次に、認識された文字列認識用図形が一行用の文字列認識用図形であるか否かを判定する(S207)。認識された文字列認識用図形が一行用の文字列認識用図形である場合には(S207:Yes)、文字列認識部104は、該当の文字列認識用図形で囲まれた範囲を特定する(S209)。次に、文字列認識部104は、S105で取得された可視光スキャン画像から、S209で特定された範囲に記載されている文字列を認識する(S211)。そして、ファイル保管部106は、S211で認識された文字列を可視光スキャン画像のファイル名として設定する(S213)。そして、当該「ファイル名設定処理」は終了する。
【0048】
ここで、
図7を参照して、認識された文字列認識用図形が一行用の文字列認識用図形ではない場合、すなわち、二行用の文字列認識用図形が認識された場合(S207:No)の動作について説明する。
図7に示したように、まず、文字列認識部104は、認識された二行用の文字列認識用図形のうち第1の文字列認識用図形で囲まれた範囲(以下、範囲Aと称する)を特定する(S221)。次に、文字列認識部104は、認識された二行用の文字列認識用図形のうち第2の文字列認識用図形で囲まれた範囲(以下、範囲Bと称する)を特定する(S223)。
【0049】
続いて、文字列認識部104は、S221で特定された範囲Aに含まれる文字列と、S223で特定された範囲Bに含まれる文字列と、をそれぞれ認識する(S225)。
【0050】
続いて、ファイル保管部106は、範囲Aに含まれる文字列の認識結果と、範囲Bに含まれる文字列の認識結果とを連結する(S227)。そして、ファイル保管部106は、連結した文字列を可視光スキャン画像のファイル名として設定する(S229)。その後、当該「ファイル名設定処理」は終了する。
【0051】
(変形例)
なお、本実施形態による動作は、上述した動作例に限定されない。例えば、S205の動作は、実行されなくてもよい。さらに、この場合、動作全体を強制終了してもよい。
【0052】
<1−4.効果>
[1−4−1.効果1]
以上、例えば
図5〜
図7などを参照して説明したように、本実施形態によるスキャナ10は、紫外光を用いて文書がスキャンされた紫外光スキャン画像から、可視光で読み取り不能なインクを用いてユーザにより記載された文字列認識用図形上に記載されている文字列を認識し、そして、可視光を用いて当該文書がスキャンされた可視光スキャン画像のファイル名を、認識した文字列に基づいて設定する。
【0053】
このため、ユーザにより文書に記載された文字列認識用図形を可視光スキャン画像において視認不可能にしつつ、文字列認識用図形上に記載されている文字列に基づいて可視光スキャン画像のファイル名を自動的に設定することができる。つまり、可視光スキャン画像の内容が元の文書と同一に視認されるように可視光スキャン画像を記録することができる。また、可視光スキャン画像の内容を判別可能なファイル名をユーザは容易に設定することができる。
【0054】
[1−4−2.効果2]
また、本実施形態による文字列認識用図形は、例えば、線分である区間マークと、区間マークに対して垂直に記載された開始マークおよび終了マークとが結合された図形である。このため、例えば文字列に対してアンダーラインを引く方法などと比較して、ユーザは、認識対象の最初の文字の位置および最後の文字の位置を明確に指定することができるので、スキャナ10は、ユーザの意図した文字列を正確に特定することができる。また、開始マークおよび終了マークにより、文字列が横書きの場合には認識対象の文字の高さを、文字列が縦書きの場合には文字の幅をユーザはそれぞれ指定することができるので、文字列の認識の精度を向上させることができる。
【0055】
なお、例えば、アンダーラインを引く方法では、インクの不足などにより仮にアンダーラインが掠れたり、薄くなった場合には、ユーザが引いたアンダーラインのうち一部だけしか認識できず、その結果、ユーザの意図とは異なる文字列が認識される恐れがある。一方、上述した文字列認識用図形では、認識対象の文字列の開始位置と終了位置とをユーザが明示することができるので、仮に横線が掠れたり、薄くなったとしても、ユーザが意図した通りの範囲をスキャナ10は特定することができ、認識対象の文字列を正確に特定することが可能である。
【0056】
<<2.変形例>>
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
【0057】
<2−1.変形例1>
例えば、
図3および
図4に示した文字列認識用図形の例では、認識対象の文字列の範囲全体に区間マーク(例えば横線)が記載される例を示したが、かかる例に限定されない。例えば、区間マークは、認識対象の文字列の範囲のうち一部だけにしか記載されなくてもよい。一例として、最初の区間マークは、開始マークの位置から所定の長さ以上であり、かつ、二個目の区間マークは、終了マークの位置から所定の長さ以上であるような二個の区間マークが記載されていればよい。
【0058】
<2−2.変形例2>
また、上記の説明では、認識対象の文字列が1行または2行の文字列である例について説明したが、かかる例に限定されず、3行以上の文字列であってもよい。例えば、二行用の文字列認識用図形のうち第2の文字列認識用図形が、第1の文字列認識用図形が記載されている行の二行目以後に記載されている場合には、スキャナ10は、第1の文字列認識用図形が記載されている行(以下、開始行と称する)と、第2の文字列認識用図形が記載されている行(以下、終了行と称する)との間に位置する全ての行に含まれる文字列を自動的に認識可能であってもよい。なお、この変形例の場合、開始行と終了行との間に位置する全ての行の文字列に対して区間マークが記載されていてもよいし、記載されていなくてもよい。
【0059】
<2−3.変形例3>
また、
図3および
図4では、一枚の文書内で文字列の記載方向が統一されている場合について示したが、かかる例に限定されず、一枚の文書内で例えば横書きの文字列と縦書きの文字列とが混在している場合に関しても、スキャナ10は、文字列認識用図形を認識することが可能である。例えば、スキャナ10は、文書に含まれる各文字列(例えば一文単位など)に関して、まず、当該文字列が記載されている方向を特定し、そして、特定した方向に基づいて文字列認識用図形の有無を判定してもよい。または、スキャナ10は、まず、いずれか一方の方向(例えば縦書き)の文字列の領域を切り出し、次に、切り出した領域に含まれる文字列の方向をいずれか他方の方向(例えば横書き)と一致するように傾け、そして、傾けた領域において文字列認識用図形の有無を判定してもよい。
【0060】
<2−4.変形例4>
また、上述した文字列認識用図形は、例えば
図3および
図4に示したような形状の図形に限定されず、長方形であってもよい。
【0061】
<2−5.変形例5>
また、上述した実施形態では、スキャナ10が単独で全ての処理を実行する例について説明したが、かかる例に限定されない。例えば、有線または無線により接続された複数の装置が、上述した処理を分散して実行することも可能である。例えば、上述したスキャン部120と同様の機能を有するスキャナ(図示省略)と、上述した制御部100と同様の機能を有するサーバ(図示省略)と、上述した記憶部126と同様の機能を有する記憶装置(図示省略)とが有線または無線により接続されることにより、上述した処理を分散して実行してもよい。
【0062】
<2−6.変形例6>
また、本実施形態によれば、例えばCPU、ROM、およびRAMなどのハードウェアを、上述したスキャナ10の各構成と同等の機能を発揮させるためのコンピュータプログラムも提供可能である。また、該コンピュータプログラムが記録された記録媒体も提供される。