IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ セイコーエプソン株式会社の特許一覧

<>
  • 特開-画像読取システムおよび画像読取方法 図1
  • 特開-画像読取システムおよび画像読取方法 図2
  • 特開-画像読取システムおよび画像読取方法 図3
  • 特開-画像読取システムおよび画像読取方法 図4
  • 特開-画像読取システムおよび画像読取方法 図5
  • 特開-画像読取システムおよび画像読取方法 図6
  • 特開-画像読取システムおよび画像読取方法 図7
  • 特開-画像読取システムおよび画像読取方法 図8
  • 特開-画像読取システムおよび画像読取方法 図9
  • 特開-画像読取システムおよび画像読取方法 図10
  • 特開-画像読取システムおよび画像読取方法 図11
  • 特開-画像読取システムおよび画像読取方法 図12
  • 特開-画像読取システムおよび画像読取方法 図13
  • 特開-画像読取システムおよび画像読取方法 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024006609
(43)【公開日】2024-01-17
(54)【発明の名称】画像読取システムおよび画像読取方法
(51)【国際特許分類】
   H04N 1/00 20060101AFI20240110BHJP
   G03G 21/00 20060101ALI20240110BHJP
【FI】
H04N1/00 C
G03G21/00 376
G03G21/00 370
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2022107671
(22)【出願日】2022-07-04
(71)【出願人】
【識別番号】000002369
【氏名又は名称】セイコーエプソン株式会社
(74)【代理人】
【識別番号】100096703
【弁理士】
【氏名又は名称】横井 俊之
(72)【発明者】
【氏名】▲濱▼口 喜博
【テーマコード(参考)】
2H270
5C062
【Fターム(参考)】
2H270LB02
2H270LB04
2H270LB05
2H270LB06
2H270LB10
2H270LB13
2H270LB17
2H270LB18
2H270NB22
2H270PA05
2H270PA12
2H270PA67
2H270PA76
2H270PA81
2H270PA83
2H270PB05
2H270PB06
2H270QB14
2H270QB18
2H270ZC03
2H270ZC04
2H270ZD01
5C062AA02
5C062AA05
5C062AB02
5C062AB17
5C062AB20
5C062AB23
5C062AC02
5C062AC05
5C062AC58
5C062AE03
5C062AE07
5C062AE15
5C062AF07
5C062AF13
(57)【要約】
【課題】複数枚の原稿の読取結果から複数の画像ファイルを生成する際、ユーザーの負担を減らしたり、ユーザーの利便性を高めたりする余地がある。
【解決手段】画像読取システムは、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取部と、前記読取画像データに対して処理を行う制御部と、を備え、前記制御部は、前記読取画像データに対して文字認識を行う文字認識処理と、前記文字認識処理の結果から、前記原稿の目次に列記されたページ番号を取得する番号取得処理と、前記ページ番号に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
【選択図】図4
【特許請求の範囲】
【請求項1】
複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取部と、
前記読取画像データに対して処理を行う制御部と、を備え、
前記制御部は、
前記読取画像データに対して文字認識を行う文字認識処理と、
前記文字認識処理の結果から、前記原稿の目次に列記されたページ番号を取得する番号取得処理と、
前記ページ番号に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、
前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行することを特徴とする画像読取システム。
【請求項2】
複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取部と、
前記読取画像データに対して処理を行う制御部と、を備え、
前記制御部は、
前記読取画像データに対して文字認識を行う文字認識処理と、
前記文字認識処理の結果から、所定のしきい値以上の文字サイズの文字列を見出しと判別する見出し判別処理と、
前記見出しを有するページのページ番号に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、
前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行することを特徴とする画像読取システム。
【請求項3】
複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取部と、
前記読取画像データに対して処理を行う制御部と、を備え、
前記制御部は、
前記読取画像データを構成するページ毎に背景色を特定する背景色特定処理と、
前記ページ間の背景色の変化に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、
前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行することを特徴とする画像読取システム。
【請求項4】
前記制御部は、
前記ページ範囲のそれぞれを登録したページ情報リストを生成し、
前記ファイル化処理では、前記ページ情報リストに基づいて前記読取画像データを分割して、前記ページ範囲毎の前記画像ファイルを生成する、ことを特徴とする請求項1~請求項3のいずれかに記載の画像読取システム。
【請求項5】
表示部を備え、
前記制御部は、前記読取画像データのページであって、前記ページ範囲の区切り位置を挟む前後の各ページを前記表示部に表示させる、ことを特徴とする請求項1~請求項3のいずれかに記載の画像読取システム。
【請求項6】
前記制御部は、前記区切り位置を挟む前後の各ページを、前記読取画像データのページであって前記区切り位置を挟む前後の各ページ以外のページと共に前記表示部に表示させる場合に、前記区切り位置を挟む前後の各ページのうち少なくとも一方を、前記区切り位置を挟む前後の各ページ以外のページよりも拡大して表示させる、ことを特徴とする請求項5に記載の画像読取システム。
【請求項7】
表示部を備え、
前記制御部は、複数の前記ページ範囲のそれぞれに対応する複数の前記画像ファイルのファイル情報を示す第1表示領域と、複数の前記画像ファイルのうちの1つに含まれる全ページを表示可能な第2表示領域とを、前記表示部に表示させることを特徴とする請求項1~請求項3のいずれかに記載の画像読取システム。
【請求項8】
前記ファイル情報は、前記画像ファイルのファイル名を含み、前記ファイル名は、共通の前記読取画像データから生成される複数の前記画像ファイルに共通の名称と、共通の前記読取画像データから生成される複数の前記画像ファイルに連続で付された番号と、を含むことを特徴とする請求項7に記載の画像読取システム。
【請求項9】
前記制御部は、前記第1表示領域に表示されている複数の前記ファイル情報のうちの1つが選択された場合に、選択された前記ファイル情報が対応する前記画像ファイルに含まれるページを前記第2表示領域に表示させる、ことを特徴とする請求項7に記載の画像読取システム。
【請求項10】
前記制御部は、
単一のページがプレビュー表示される第3表示領域を前記表示部に表示させることが可能であり、
前記第2表示領域に表示されているページのうちの1つが選択された場合に、選択された当該ページを拡大して前記第3表示領域にプレビュー表示させる、ことを特徴とする請求項7に記載の画像読取システム。
【請求項11】
前記制御部は、前記第1表示領域の初期状態においては、前記第1表示領域内で前記読取画像データの先頭ページを含む前記画像ファイルの前記ファイル情報が選択された状態とする、ことを特徴とする請求項9に記載の画像読取システム。
【請求項12】
複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取工程と、
前記読取画像データに対して処理を行う処理工程と、を備え、
前記処理工程では、
前記読取画像データに対して文字認識を行う文字認識処理と、
前記文字認識処理の結果から、前記原稿の目次に列記されたページ番号を取得する番号取得処理と、
前記ページ番号に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、
前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行することを特徴とする画像読取方法。
【請求項13】
複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取工程と、
前記読取画像データに対して処理を行う処理工程と、を備え、
前記処理工程では、
前記読取画像データに対して文字認識を行う文字認識処理と、
前記文字認識処理の結果から、所定のしきい値以上の文字サイズの文字列を見出しと判別する見出し判別処理と、
前記見出しを有するページのページ番号に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、
前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行することを特徴とする画像読取方法。
【請求項14】
複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取工程と、
前記読取画像データに対して処理を行う処理工程と、を備え、
前記処理工程では、
前記読取画像データを構成するページ毎に背景色を特定する背景色特定処理と、
前記ページ間の背景色の変化に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、
前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行することを特徴とする画像読取方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像読取システムおよび画像読取方法に関する。
【背景技術】
【0002】
スキャナーによる原稿の読み取りで生成された読取画像データを画像ファイル化し、画像ファイルを、指定された保存先へ転送することができる。
【0003】
関連技術として、原稿を読み取って画像データを得る読取手段と、複数の束に分割されている複数枚の原稿を読取手段が束ごとに読み取って得た画像データに基づいて、複数の束の各々に対応する複数のファイルを生成する生成手段と、読取手段が束ごとに原稿を読み取ったことに従って、原稿を複数の束に分割するための分割位置を記憶する記憶手段と、複数枚の原稿を再度読取手段で読み取らせる場合に、記憶手段に記憶される分割位置に基づいて、読取手段が複数枚の原稿を読み取って得られる画像データから複数のファイルを生成するよう制御する制御手段と、を有する画像読取装置が開示されている(特許文献1参照。)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2012‐114657号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
前記文献1によれば、読取手段が複数枚の原稿を読み取って得られる画像データから複数のファイルを生成するために必要な分割位置の情報を、予め記憶手段に記憶しておくために、以前の原稿読み取り時に、ユーザーが複数枚の原稿を束に分割して束ごとに読取手段に読み取らせる必要がある。
【0006】
このような状況を鑑みると、複数枚の原稿の読取結果から複数の画像ファイルを生成する際に、ユーザーの負担を減らしたり、ユーザーの利便性を高めたりする余地があると言える。
【課題を解決するための手段】
【0007】
画像読取システムは、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取部と、前記読取画像データに対して処理を行う制御部と、を備え、前記制御部は、前記読取画像データに対して文字認識を行う文字認識処理と、前記文字認識処理の結果から、前記原稿の目次に列記されたページ番号を取得する番号取得処理と、前記ページ番号に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
【0008】
画像読取システムは、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取部と、前記読取画像データに対して処理を行う制御部と、を備え、前記制御部は、前記読取画像データに対して文字認識を行う文字認識処理と、前記文字認識処理の結果から、所定のしきい値以上の文字サイズの文字列を見出しと判別する見出し判別処理と、前記見出しを有するページのページ番号に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
【0009】
画像読取システムは、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取部と、前記読取画像データに対して処理を行う制御部と、を備え、前記制御部は、前記読取画像データを構成するページ毎に背景色を特定する背景色特定処理と、前記ページ間の背景色の変化に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
【0010】
画像読取方法は、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取工程と、前記読取画像データに対して処理を行う処理工程と、を備え、前記処理工程では、前記読取画像データに対して文字認識を行う文字認識処理と、前記文字認識処理の結果から、前記原稿の目次に列記されたページ番号を取得する番号取得処理と、前記ページ番号に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
【0011】
画像読取方法は、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取工程と、前記読取画像データに対して処理を行う処理工程と、を備え、前記処理工程では、前記読取画像データに対して文字認識を行う文字認識処理と、前記文字認識処理の結果から、所定のしきい値以上の文字サイズの文字列を見出しと判別する見出し判別処理と、前記見出しを有するページのページ番号に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
【0012】
画像読取方法は、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取工程と、前記読取画像データに対して処理を行う処理工程と、を備え、前記処理工程では、前記読取画像データを構成するページ毎に背景色を特定する背景色特定処理と、前記ページ間の背景色の変化に基づいて、複数のページで構成される前記読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、前記ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
【図面の簡単な説明】
【0013】
図1】システム構成を簡易的に示すブロック図。
図2】画像読取処理を示すフローチャート。
図3図3Aは分割保存の要否指示を受け付けるためのUI画面を示す図、図3Bは区切りタイプの選択を受け付けるためのUI画面を示す図、図3Cはページ指定を受け付けるためのUI画面を示す図。
図4】区切りタイプが目次である場合の分割保存の流れを示すフローチャート。
図5】読取画像データの1つのページとページ情報リストとを例示する図。
図6】読取画像データをページ範囲毎に画像ファイル化する様子を示す図。
図7】区切りタイプが見出しである場合の分割保存の流れを示すフローチャート。
図8】見出しを有する各ページとページ情報リストとを例示する図。
図9】区切りタイプが背景色である場合の分割保存の流れを示すフローチャート。
図10】背景色が異なる各ページとページ情報リストとを例示する図。
図11】区切りタイプがユーザー指定である場合の分割保存の流れを示すフローチャート。
図12】第1分割表示領域および第2分割表示領域を含むUI画面を示す図。
図13】第1分割表示領域および第2分割表示領域を含むUI画面を示す図。
図14】第1表示領域、第2表示領域および第3表示領域を含むUI画面を示す図。
【発明を実施するための形態】
【0014】
以下、各図を参照しながら本発明の実施形態を説明する。なお各図は、本実施形態を説明するための例示に過ぎない。各図は例示であるため、比率や形状や濃淡が正確でなかったり、互いに整合していなかったり、一部が省略されていたりする場合がある。
【0015】
1.システム構成の概略説明:
図1は、本実施形態にかかる画像読取システム10の構成を簡易的に示している。画像読取システム10により画像読取方法が実行される。
画像読取システム10は、制御部11、表示部13、操作受付部14、記憶部15、通信IF16、搬送部17、読取部18等を備える。IFはインターフェイスの略である。制御部11は、プロセッサーとしてのCPU11a、ROM11b、RAM11c等を有する一つ又は複数のICや、その他の不揮発性メモリー等を含んで構成される。
【0016】
制御部11では、プロセッサーつまりCPU11aが、ROM11bや、その他のメモリー等に保存されたプログラム12に従った演算処理を、RAM11c等をワークエリアとして用いて実行することにより、本実施形態にかかる処理を実現する。プログラム12を、画像読取プログラムとも呼ぶ。プロセッサーは、一つのCPUに限られることなく、複数のCPUや、ASIC等のハードウェア回路により処理を行う構成としてもよいし、CPUとハードウェア回路とが協働して処理を行う構成としてもよい。
【0017】
表示部13は、視覚情報を表示するための手段であり、例えば、液晶ディスプレイや、有機ELディスプレイ等により構成される。表示部13は、ディスプレイと、ディスプレイを駆動するための駆動回路と、を含む構成であってもよい。
【0018】
操作受付部14は、ユーザーによる操作や入力を受け付けるための手段であり、例えば、物理的なボタンや、タッチパネルや、マウスや、キーボード等によって実現される。表示部13および操作受付部14を含めて「操作パネル」と呼んでもよい。タッチパネルとしての操作受付部14は、表示部13の一機能として実現される。
【0019】
記憶部15は、例えば、ハードディスクドライブや、ソリッドステートドライブや、その他のメモリーによる記憶手段である。制御部11が有するメモリーの一部を記憶部15と捉えてもよい。記憶部15を、制御部11の一部と捉えてもよい。
【0020】
通信IF16は、画像読取システム10が公知の通信規格を含む所定の通信プロトコルに準拠して有線又は無線で図示しない外部装置と通信を実行するための一つまたは複数のIFの総称である。通信IF16は通信部に該当する。外部装置は、例えば、パーソナルコンピューター(PC)、サーバー、スマートフォン、タブレット型端末、ファクシミリ装置等の通信装置である。
【0021】
搬送部17は、読取対象となる原稿を所定の搬送経路に沿って搬送するための手段である。搬送部17は、例えば、回転して原稿を搬送するローラーや、回転の動力源としてのモーター等を備える。搬送部17は、給紙トレイに置かれた複数枚の原稿を一枚単位で順次搬送可能な、いわゆるADF(Auto Document Feeder)の機能を兼ね備えている。
【0022】
読取部18は、搬送部17が搬送する原稿を光学的に読み取る手段である。読取部18は、原稿を照射する光源、原稿からの反射光や透過光を受光して光電変換により読取結果としての電気信号を生成し出力するイメージセンサー、イメージセンサーからの出力をデジタル信号に変換等して画像データとするアナログフロントエンド等、イメージスキャナーとして一般的な構成を有する。
【0023】
以下では、読取部18が複数枚の原稿を連続して読み取って生成した読取結果としての画像データを、読取画像データと呼ぶ。つまり読取部18は、複数枚の原稿を読み取って読取画像データを生成する「読取工程」を行う。制御部11は、読取画像データを読取部18から取得し、読取画像データに対する処理を行う「処理工程」を実行する。
【0024】
画像読取システム10は、図1に示す構成が一体的にまとめられた1台のスキャナーにより実現されるとしてもよい。
あるいは、画像読取システム10は、通信可能に接続した複数台の装置により実現される。画像読取システム10は、例えば、主に制御部11や操作パネルの役割を担い処理工程を行う情報処理装置と、搬送部17や読取部18を有して読取工程を行うスキャナーとを含んで構成される。この場合、搬送部17および読取部18を含めて画像読取装置と捉える。むろん、操作パネルは、画像読取装置の側にも備えられている。
【0025】
スキャナーから見たとき、制御部11は、ネットワークで通信可能に接続したクラウド上のサーバーによってプログラムやアプリケーションに従って実行される一機能であってもよい。つまり、スキャナーから読取画像データがネットワークを介してクラウドへアップロードされ、アップロードを受けた側のサーバーにおいて、プログラムやアプリケーションに従って処理工程が実行されるとしてもよい。
【0026】
2.画像読取処理:
図2は、画像読取システム10が実行する画像読取処理を、フローチャートにより示している。画像読取処理の説明により画像読取方法が開示される。
ユーザーは、複数枚の原稿を重ねた原稿の束をADFの給紙トレイにセットし、所定のスキャンスタートボタンを操作して読取部18に原稿のスキャンを開始させる。搬送部17は、スキャンスタートボタンの操作を契機として原稿を一枚単位で順次搬送し、読取部18は、搬送される原稿を順次読み取り、読取画像データを生成する(ステップS100)。
【0027】
ステップS110では、制御部11は、読取画像データを複数の画像ファイルに分割して保存するか否か、つまり分割保存の要否を判定する。
図3Aは、制御部11が表示部13に表示させるUI画面20の一例を示している。UIは、ユーザーインターフェイスの略である。UI画面20によれば、ユーザーは、分割保存するかしないかを、ボタン20aまたはボタン20bの操作により指示することができる。従って、制御部11は、UI画面20を通じて分割保存する旨の指示があれば、ステップS110で“Yes”と判定してステップS130へ進み、UI画面20を通じて分割保存しない旨の指示があれば、ステップS110で“Nо”と判定してステップS120へ進む。
【0028】
ステップS120では、制御部11は、読取画像データの全体、つまり読取画像データを構成する全ページを1つの画像ファイルに変換して、この画像ファイルを所定の保存先へ保存し、図2のフローチャートを終える。ステップS120や後述のステップS140において、読取画像データから変換するファイルの形式は特に問わない。制御部11は、例えば、読取画像データをPDF(Portable Document Format)形式の画像ファイルに変換する。
【0029】
画像ファイルの保存先は、スキャナー内蔵または外付けのメモリーであったり、情報処理装置内蔵または外付けのメモリーであったりする。むろん、記憶部15が保存先であってもよい。あるいは、保存先は、画像読取システム10が通信IF16を介して接続する外部装置が有する所定のフォルダーやクラウド上の記憶領域であってもよい。いずれにしても、画像ファイルの保存先は、デフォルトで決められていたり、ユーザーにより指示されていたりする。さらに、画像ファイルの保存を広義に捉えると、所定の送信先である外部装置へ電子メールやファクシミリ通信により送信する処理であってもよい。従って、ステップS120やステップS140における画像ファイルの保存を、画像ファイルの出力や送信と言い換えてもよい。
【0030】
制御部11は、ステップS130では「区切りタイプ」の判定を行い、ステップS140では、区切りタイプに応じた区切りによる、読取画像データから複数の画像ファイルへの分割ファイル化と、それら複数の画像ファイルの保存を行う。区切りタイプは、読取画像データを複数のページ範囲に区切るための方法、指針、基準等と解釈できる。以下では、ステップS130,S140の詳細を説明する。
【0031】
図4,7,9,11はそれぞれ、ステップS130,S140の詳細の一部をフローチャートにより示している。
図3Bは、制御部11が表示部13に表示させるUI画面21の一例を示している。UI画面21によれば、ユーザーは、複数の区切りタイプの中から区切りタイプを選択することができる。具体的には、「目次」、「見出し」、「背景色」、「ユーザー指定」の4種類の区切りタイプの中から、ボタン21a,21b,21c,21dを択一的に操作して区切りタイプを選択することができる。
【0032】
制御部11は、UI画面21を通じて区切りタイプとして「目次」が選択されていれば、区切りタイプ=「目次」と判定し、ステップS131の“Yes”からステップS141Aへ進む。一方、区切りタイプとして「目次」が選択されていなければ、ステップS131の“Nо”からステップS132へ進む。制御部11は、UI画面21を通じて区切りタイプとして「見出し」が選択されていれば、区切りタイプ=「見出し」と判定し、ステップS132の“Yes”からステップS141Bへ進む。一方、区切りタイプとして「見出し」が選択されていなければ、ステップS132の“Nо”からステップS133へ進む。制御部11は、UI画面21を通じて区切りタイプとして「背景色」が選択されていれば、区切りタイプ=「背景色」と判定し、ステップS133の“Yes”からステップS141Cへ進む。一方、区切りタイプとして「背景色」が選択されていなければ、区切りタイプ=「ユーザー指定」と判定し、ステップS133の“Nо”からステップS141Dへ進む。
【0033】
図4は、区切りタイプ=「目次」である場合の分割保存の流れを示している。同様に、図7は、区切りタイプ=「見出し」である場合の分割保存の流れを示し、図9は、区切りタイプ=「背景色」である場合の分割保存の流れを示し、図11は、区切りタイプ=「ユーザー指定」である場合の分割保存の流れを示している。むろん、区切りタイプが何であるかを判定する順番は、上述したような、目次、見出し、背景色、ユーザー指定の順でなくてもよい。制御部11は、区切りタイプが目次、見出し、背景色、ユーザー指定のいずれであるかを判定し、その判定結果に従って、ステップS141A,S141B,S141C,S141Dのいずれかに処理を進めることができればよい。
【0034】
2‐1.区切りタイプ=「目次」の場合の分割保存:
図4によれば、ステップS141Aでは、制御部11は、読取画像データを構成する各ページに対して文字認識処理を実行する。文字認識処理は、ОCR(Optical Character Recognition)と呼ばれる光文字認識の技術を用いればよい。制御部11は、ОCRを実行するための機能やプログラムを有している。
ステップS142Aでは、制御部11は、文字認識処理の結果から、原稿の目次に列記されたページ番号を取得する番号取得処理を実行する。
【0035】
図5は、読取画像データを構成する複数のページのうちの1つのページPを例示している。本実施形態では、読取画像データを構成する、ある1つのページをページPと表記することがある。また、本実施形態では、読取画像データを構成する複数のページのうち、ページ番号nのページを、ページnと表記することもある。ページ番号は、読取画像データの先頭ページから最終ページまでの連番の自然数である。ページPには、文字列、写真、図形、グラフ等の様々なオブジェクトが表現されている。文字認識処理により、このような各種オブジェクトのうち文字列が認識される。制御部11は、文字認識の結果から、目次領域の特徴に基づいて目次領域31を抽出する。目次領域とは、原稿の内容に関する目次が記載された領域であり、特徴としては、通常、原稿内の各コンテンツとページ番号とが一対一で記載されている。つまり、目次領域にはコンテンツ毎のページ番号が列記されている。また、目次領域の特徴としては、例えば、“目次”、“コンテンツ”、“インデックス”、“サマリー”等といった特定のワードが含まれていることがある。
【0036】
ユーザーが、UI画面21に対する操作により区切りタイプとして「目次」を選択している状況においては、読取画像データのいずれかのページPに目次領域が含まれていると解してよい。また、ユーザーは、原稿のいずれのページに目次が記載されているかを認識している場合がある。このような場合、ユーザーは、目次が記載されているページのページ番号を制御部11へ通知し、制御部11が文字認識したり文字認識の結果から目次領域を抽出したりする対象のページPを限定させてもよい。このような処理の結果、図5の例では、ページPから目次領域31が抽出されたとする。制御部11は、目次領域31から、そこに列記されたページ番号、図5の例では“4”、“8”、“14”、“19”、“26”というページ番号を取得する。以下では、目次領域31に列記されたページ番号を「目次対応ページ番号」と称する。
【0037】
ステップS143Aでは、制御部11は、ステップS142Aで取得した目次対応ページ番号に基づいて、読取画像データを区切るページ範囲のそれぞれを登録したページ情報リスト32を生成する。1つのページ範囲が1つの画像ファイルとなる。制御部11は、1つの目次対応ページ番号が示すページから次の目次対応ページ番号の前ページまでの範囲を、1つのページ範囲に決定する。
【0038】
図5の例では、目次領域31から“4”、“8”、“14”、“19”、“26”という目次対応ページ番号が取得された。そのため、制御部11は、ページ1からページ3の範囲、ページ4からページ7の範囲、ページ8からページ13の範囲、ページ14からページ18の範囲、ページ19からページ25の範囲、ページ26から最終ページの範囲、のそれぞれをページ範囲に決定し、ページ情報リスト32に登録する。
【0039】
なお、目次領域31から“1”という目次対応ページ番号は取得できていないが、制御部11は、読取画像データの先頭のページ1から、目次領域31から取得した最小の目次対応ページ番号“4”の前ページであるページ3までの範囲を、1つのページ範囲に決定する。また、目次領域31から取得した最大の目次対応ページ番号“26”のページ26から最終ページの範囲を、1つのページ範囲に決定する。このようなページ1から取得したページ番号によるページ範囲の最初の区切り位置までの範囲や、取得したページ番号によるページ範囲の最後の区切り位置から最終ページまでの範囲もそれぞれ1つのページ範囲として扱う考えは、図7,9,11においても同じである。
【0040】
図5や、後述の図8,10では、ページ情報リストには、各ページ範囲の先頭のページ番号のみ記載されているが、ページ情報リストは、各ページ範囲の先頭と終わりそれぞれのページ番号を記載したものであってもよいし、各ページ範囲の終わりのページ番号のみを記載したものであってもよい。このようにステップS143Aでページ範囲をリスト化する処理は、目次に列記されたページ番号に基づいて、読取画像データを区切るページ範囲を決定するページ範囲決定処理にも該当する。
【0041】
ステップS144Aでは、制御部11は、ページ情報リスト32に登録されている1つのページ範囲に対応する画像データを読取画像データから抜き出し、ステップS145Aでは、ステップS144Aで抜き出した画像データを1つの画像ファイルに変換した上で、画像ファイルを保存する。保存の意味は、ステップS120に関連して説明した通りである。
【0042】
ステップS146Aでは、制御部11は、ページ情報リスト32に登録されている全てのページ範囲について、ステップS144A,S145Aの処理を終えたか否かを判定し、終えていない場合はステップS144A以下を繰り返す。制御部11は、ページ情報リスト32に登録されている全てのページ範囲について、ステップS144A,S145Aの処理を終えた場合に、ステップS146Aで“Yes”と判定し、図4および図2のフローチャートを終える。
【0043】
ステップS144A,S145Aは、ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理に該当する。また、ファイル化処理では、ページ情報リストに基づいて読取画像データを分割して、ページ範囲毎の画像ファイルを生成するとも言える。
【0044】
図6は、ファイル化処理を模式的に示している。図6図8,10等では、読取画像データ30を構成するページPのそれぞれを簡単に矩形で示している。矩形内の数字は、ページ番号である。図6に示すように、制御部11は、ページ情報リスト32に基づき、読取画像データ30のページ1~ページ3、ページ4~ページ7、ページ8~ページ13…といった各ページ範囲を、それぞれ画像ファイルF1,F2,F3…に変換して保存する。
【0045】
2‐2.区切りタイプ=「見出し」の場合の分割保存:
図7によれば、ステップS141Bでは、制御部11は、見出しを判別するためのしきい値としての文字サイズを取得する。文字サイズをフォントサイズとも言う。制御部11は、UI画面を介したユーザーによる文字サイズの入力を受けることにより、文字サイズを取得すればよい。見出しを判別するためのしきい値としての文字サイズを、以下では文字しきい値と呼ぶ。
【0046】
ステップS142Bでは、制御部11は、読取画像データの1つのページの文字認識処理を行う。読取画像データの先頭ページから順に文字認識処理の対象とすればよい。
ステップS143Bでは、制御部11は、ステップS142Bによる1つのページを対象とした文字認識処理の結果に、見出しが有るか否かを判定する。見出しが有れば、ステップS143Bの“Yes”の判定からステップS144Bへ進み、一方、見出が無ければ、ステップS143Bの“Nо”の判定からステップS145Bへ進む。
【0047】
制御部11は、文字認識処理の結果として認識した文字列内に、文字しきい値以上の文字サイズの文字からなる文字列が有る場合に、この文字しきい値以上の文字サイズの文字列を見出しと判別し、ステップS143Bにおいて、見出し有りと判定する。一方、文字認識の結果から、文字しきい値以上の文字サイズの文字からなる文字列を抽出できなかった場合に、見出しは無いと判定する。ステップS143Bは見出し判別処理に該当する。
なお、文字しきい値は、ユーザーによる指定ではなく、本文の文字サイズに基づいて決定してもよい。制御部11は、文字認識処理の結果から、文字列の一定割合以上を占める本文を特定するとともに本文の文字サイズを特定する。そして、制御部11は、本文の文字サイズのα倍以上のサイズを文字しきい値として、見出しを判別してもよい。αは、1より大きい係数である。
【0048】
ステップS144Bでは、制御部11は、見出し有りと判定したページのページ番号に基づいて、ページ範囲を登録したページ情報リストを生成する。見出し有りと判定したページのページ番号を「見出しページ番号」と呼ぶ。制御部11は、1つの見出しページ番号が示すページから次の見出しページ番号の前ページまでの範囲を、1つのページ範囲に決定する。
【0049】
ステップS145Bでは、制御部11は、読取画像データの最終ページを対象としてステップS143Bの判定を終えたか否かを判定し、最終ページを対象としてステップS143Bの判定を終えていなければ、“Nо”の判定からステップS142Bへ進む。一方、最終ページを対象としてステップS143Bの判定を終えていれば、ステップS145の“Yes”の判定からステップS146Bへ進む。ステップS145Bから進んだステップS142Bでは、制御部11は、読取画像データ内の次の1つのページを対象として文字認識処理を実行する。このようなステップS142B~S145Bのサイクルを繰り返し、ステップS144Bの結果として、図8に示すようなページ情報リスト34が生成される。また、このようにページ範囲をリスト化する処理は、見出しページ番号に基づいて、読取画像データを区切るページ範囲を決定するページ範囲決定処理にも該当する。
【0050】
図8は、ステップS144Bにおいて見出しページ番号に基づきページ範囲をリスト化する処理を、模式的に示している。図8では、読取画像データ30を構成するページPのうち、見出し33を有するページPを示している。図8の例によれば、見出しページ番号は“3”、“10”、“15”、“24”等である。そのため、制御部11は、ページ1およびページ2の範囲、ページ3からページ9の範囲、ページ10からページ14の範囲、ページ15からページ23の範囲…といった各ページ範囲をページ情報リスト34に登録する。
【0051】
ステップS146B,S147B,S148Bに関する説明としては、図4のステップS144A,S145A,S146Aの説明において、ページ情報リスト32を、ページ情報リスト34に置き換えればよい。制御部11は、ステップS148Bで“Yes”と判定し、図7および図2のフローチャートを終える。
【0052】
2‐3.区切りタイプ=「背景色」の場合の分割保存:
図9によれば、ステップS141Cでは、制御部11は、読取画像データのページ単位で背景色を特定する背景色特定処理を行う。読取画像データの先頭ページから順に背景色特定処理の対象とすればよい。背景色とは、ページ内の色であって文字や写真や図形等の各種オブジェクトを除いた領域の色であり、多くの場合は白色である。制御部11は、背景色を、RGB等の複数次元の色情報の替わりに、輝度等の1次元の明るさの情報で簡易的に特定してもよい。
【0053】
ステップS142Cでは、制御部11は、1つのページを注目ページとし、注目ページの背景色が、注目ページの1つ前のページの背景色および1つ後のページの背景色と異なるか、つまり前後背景色と異なるか否かを判定する。注目ページの背景色が、前後背景色と異なればステップS142Cの“Yes”の判定からステップS143Cへ進み、一方、注目ページの背景色が、1つ前のページの背景色および1つ後のページの背景色の少なくとも一方と同じであれれば、ステップS142Cの“Nо”の判定からステップS144Cへ進む。
【0054】
なお、ステップS141Cで読取画像データのページ2まで背景色を特定した状況では、ステップS142Cの判定が実質的にできないため“Nо”となり、ページ3まで背景色を特定できたとき、ページ2を注目ページとしてステップS142Cの判定ができるようになる。ページ間で背景色を比べたとき、完全に一致することは寧ろ少ない。そのため、制御部11は、ページ間の背景色の差が、予め定められた背景色の差に関するしきい値以上であるときに、ページ間で背景色が異なると判定してもよい。
【0055】
ステップS143Cでは、制御部11は、背景色が前後背景色と異なると判定したページのページ番号に基づいて、ページ範囲を登録したページ情報リストを生成する。背景色が前後背景色と異なるページのページ番号を「異色ページ番号」と呼ぶ。制御部11は、1つの異色ページ番号が示すページから次の異色ページ番号の前ページまでの範囲を、1つのページ範囲に決定する。
【0056】
ステップS144Cでは、制御部11は、読取画像データの最終ページを対象としてステップS142Cの判定を終えたか否かを判定し、ステップS142Cの判定を終えていなければ、“Nо”の判定からステップS141Cへ進む。一方、最終ページを対象としてステップS142Cの判定を終えていれば、ステップS144Cの“Yes”の判定からステップS145Cへ進む。ステップS144Cから進んだステップS141Cでは、制御部11は、読取画像データ内の次の1つのページを対象として背景色特定処理を実行する。このようなステップS141C~S144Cのサイクルを繰り返し、ステップS143Cの結果として、図10に示すようなページ情報リスト35が生成される。また、このようにページ範囲をリスト化する処理は、ページ間の背景色の変化に基づいて、読取画像データを区切るページ範囲を決定するページ範囲決定処理に該当する。
【0057】
図10は、ステップS143Cにおいて異色ページ番号に基づきページ範囲をリスト化する処理を、模式的に示している。図10では、読取画像データ30を構成するページPのうち、背景色が前後背景色と異なるページPをグレー色で示している。図10の例によれば、異色ページ番号は“3”、“8”等である。そのため、制御部11は、ページ1およびページ2の範囲、ページ3からページ7の範囲…といった各ページ範囲をページ情報リスト35に登録する。
【0058】
ステップS145C,S146C,S147Cに関する説明としては、図4のステップS144A,S145A,S146Aの説明において、ページ情報リスト32を、ページ情報リスト35置き換えればよい。制御部11は、ステップS147Cで“Yes”と判定し、図9および図2のフローチャートを終える。
【0059】
2‐4.区切りタイプ=「ユーザー指定」の場合の分割保存:
図11によれば、ステップS141Dでは、制御部11は、ページ指定を取得すると共に、読取画像データのページ範囲を決定する。制御部11は、ページ指定をユーザーからの入力により取得する。
図3Cは、制御部11が表示部13に表示させるUI画面22の一例を示している。UI画面22は、ランダム指定に対応する入力欄22aと、固定指定に対応する入力欄22bとを有する。ユーザーは、入力欄22a,22bのどちらか一方への入力を行う。
【0060】
ランダム指定とは、各ページ範囲の先頭のページ番号をユーザーが任意に入力する指定方法であり、図3Cの例では、ランダム指定として、“3”、“10”、“13”、“19”といったページ番号が入力欄22aに入力されている。一方、固定指定とは、ページ範囲の一定のページ数をユーザーが任意に入力する指定方法である。入力欄22bに、例えば“5”と入力された場合は、5ページ分の範囲を1つのページ範囲とすることを意味し、これは “1”、“6”、“11”、“16”、“21”…というようにページ1から5ページ間隔で各ページ範囲のページ番号が指定されたことに等しい。入力欄22bに入力されるページ数は、読取画像データのページ数よりも少ないページ数である。
【0061】
ステップS141Dにおいて、ページ指定を取得するとは、このようなランダム指定又は固定指定を受けることを意味する。つまり、ステップS141Dは、読取画像データのページ数よりも少ないページ数の指定、または、ページ番号の指定を受け付ける受付処理を含んでいると言える。制御部11は、ランダム指定により受け付けたページ番号、または、固定指定により受け付けたページ数に基づいて、読取画像データを区切るページ範囲を決定する。ページ範囲の決定方法は、これまでに説明した目次対応ページ番号や、見出しページ番号や、異色ページ番号に基づいてページ範囲を決定する方法と同じである。むろん、制御部11は、ランダム指定により受け付けたページ番号、または、固定指定により受け付けたページ数に基づいて、ページ情報リストを生成してもよい。
【0062】
ステップS142Dでは、制御部11は、読取画像データを構成する複数のページのうちの1つを注目ページとして選択する。制御部11は、先頭のページ1からページ番号順に注目ページとして選択すればよい。
ステップS143Dでは、制御部11は、注目ページのページ番号が、ステップS141Dで決定したいずれかのページ範囲の終わりのページ番号に一致するか否かを判定し、一致すれば“Yes”の判定からステップS144Dへ進み、一致しなければ“Nо”の判定からステップS142Dへ進む。
【0063】
ステップS144Dでは、制御部11は、開始ページから注目ページまでのページ範囲の画像データを読取画像データから抜き出し、ステップS145Dでは、ステップS144Dで抜き出した画像データを1つの画像ファイルに変換した上で、画像ファイルを保存する。ここで言う開始ページとは、前回のステップS144Dで読取画像データから抜き出していないページのうちページ番号が最も小さいページである。図11のフローチャートにおける1回目のステップS144Dの時点では、読取画像データのページ1が開始ページである。ステップS144D,S145Dは、ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理に該当する。
【0064】
ステップS146Dでは、制御部11は、読取画像データの最終ページを注目ページに選択したか否かを判定し、最終ページを注目ページに選択していなければ“Nо”の判定からステップS142Dへ進み、最終ページを注目ページに選択済みであれば“Yes”の判定から図11および図2のフローチャートを終える。ステップS143DまたはステップS146Dから進んだステップS142Dでは、制御部11は、それまでの注目ページの次のページ番号のページを注目ページに選択する。
【0065】
3.UI画面の表示態様:
図12は、制御部11が表示部13に表示させるUI画面23の一例を示している。制御部11は、読取画像データを区切るページ範囲を決定したタイミングで、自動的にあるいはユーザーの求めに応じて、ページ範囲の決定を反映した内容のUI画面23を表示部13に表示させる。ページ範囲を決定したタイミングとは、図4のフローチャートであればステップS143Aの後のタイミング、図7のフローチャートであればステップS145Bの“Yes”の後のタイミング、図9のフローチャートであればステップS144Cの“Yes”の後のタイミングである。また、図11のフローチャートであればステップS141Dの後のタイミングである。
【0066】
図12内の上段によれば、UI画面23には、第1分割表示領域23aと第2分割表示領域23bとが左右に並んでいる。第1分割表示領域23aには、ある1つのページ範囲に属するページの少なくとも一部がプレビュー表示されている。第2分割表示領域23bには、当該1つのページ範囲の次のページ範囲に属するページの少なくとも一部がプレビュー表示されている。第1分割表示領域23aにページが表示されるページ範囲を、第1ページ範囲と呼び、第2分割表示領域23bにページが表示されるページ範囲を、第2ページ範囲と呼ぶことにする。UI画面23には、さらに、ページスクロールボタン23c,23dや、ページ範囲スクロールボタン23g,23hや、分割保存実行ボタン23eや、キャンセルボタン23f等が含まれている。
【0067】
図12内の上段によれば、第1分割表示領域23aにおいては、第1ページ範囲に属するページのうちページ番号が最も大きいページが、第1ページ範囲に属する他のページよりも拡大された状態で、かつ、第2分割表示領域23bに隣り合う位置に表示されている。また、第2分割表示領域23bにおいては、第2ページ範囲に属するページのうちページ番号が最も小さいページが、第2ページ範囲に属する他のページよりも拡大された状態で、かつ、第1分割表示領域23aに隣り合う位置に表示されている。より具体的には、第1分割表示領域23aには、第1ページ範囲に属するページ6,7が表示されており、このうちページ7が拡大表示されている。また、第2分割表示領域23bには、第2ページ範囲に属するページ8,9が表示されており、このうちページ8が拡大表示されている。
【0068】
図12内の上段の例では、ページ7は、第1ページ範囲に属する各ページの中でページ番号が最も大きく、ページ8は、第2ページ範囲に属する各ページの中でページ番号が最も小さい。よって、ページ7とページ8との間が、ページ範囲の区切り位置である。つまり、UI画面23は、第1分割表示領域23aと第2分割表示領域23bとの境目を、ページ範囲の区切り位置として分かり易く示している。このようなUI画面23の説明によれば、制御部11は、読取画像データのページであって、ページ範囲の区切り位置を挟む前後の各ページを表示部13に表示させる。ユーザーは、UI画面23を通じて、ページ範囲とページ範囲との区切り位置を確認することができる。
【0069】
さらに、UI画面23の説明によれば、制御部11は、区切り位置を挟む前後の各ページを、読取画像データのページであって区切り位置を挟む前後の各ページ以外のページと共に表示させる場合に、区切り位置を挟む前後の各ページのうち少なくとも一方を、区切り位置を挟む前後の各ページ以外のページよりも拡大して表示させる。なお、制御部11は、図12内の上段の例において、区切り位置を挟む前後のページ7,8のうちどちらか一方は拡大表示しなくてもよい。
【0070】
ページスクロールボタン23cは、UI画面23におけるページの表示を1ページずつ、ページ番号を小さくする方向へスクロールするボタンであり、ページスクロールボタン23dは、UI画面23におけるページの表示を1ページずつ、ページ番号を大きくする方向へスクロールするボタンである。ユーザーは、ページスクロールボタン23c,23dを操作することにより、現時点で決定されているページ範囲の区切り位置を変更することができる。
【0071】
図12内の下段のUI画面23は、図12内の上段のUI画面23においてユーザーがページスクロールボタン23dを1回操作した後の状態を示している。図12内の下段のUI画面23によれば、第1分割表示領域23aには、第1ページ範囲に属するページの一部としてページ7,8が表示され、第2分割表示領域23bには、第2ページ範囲に属するページの一部としてページ9,10が表示されている。ページ8,9は拡大表示されている。つまり、ユーザーがページスクロールボタン23dを操作したことにより、ページ範囲の区切り位置が、それまでの、ページ7とページ8との間の位置から、ページ8とページ9との間の位置へ変更された。
【0072】
図13も、制御部11が表示部13に表示させるUI画面23を示している。図13内の上段に示すUI画面23は、図12内の上段のUI画面23と同じである。ページ範囲スクロールボタン23gは、UI画面23におけるページの表示を、ページ番号が小さい側の隣の区切り位置までスクロールするボタンであり、ページ範囲スクロールボタン23hは、UI画面23におけるページの表示を、ページ番号が大きい側の隣の区切り位置までスクロールするボタンである。つまり、ユーザーは、ページ範囲スクロールボタン23g,23hを操作することにより、現在のページ範囲の区切り位置の表示を、他のページ範囲の区切り位置の表示に変更することができる。
【0073】
図13内の下段のUI画面23は、図13内の上段のUI画面23においてユーザーがページ範囲スクロールボタン23hを1回操作した後の状態を示している。図13内の下段のUI画面23によれば、第1分割表示領域23aには、ページ13,14が表示され、第2分割表示領域23bには、ページ15,16が表示されている。つまり、ユーザーがページ範囲スクロールボタン23hを操作したことにより、それまでページ7とページ8との間でページ範囲の区切り位置が表示されていた状態から、ページ番号が大きい側の隣の区切り位置である、ページ14とページ15との間の区切り位置が表示された状態になった。
【0074】
図13によれば、ページ8からページ14までが、上述の区切りタイプに応じて制御部11によって自動的に決定されたページ範囲のうちの1つであることが解る。このような図12,13の説明によれば、上述の区切りタイプに応じて制御部11によって決定されたページ範囲の各区切り位置を、ユーザーは、ページ範囲スクロールボタン23g,23hやページスクロールボタン23c,23dを操作することにより、任意に変更することができる。
【0075】
図12,13の例において、制御部11は、分割保存実行ボタン23eが操作されたとき、その時点でのページ範囲の区切りを、読取画像データにおけるページ範囲の区切りとして確定して、確定した内容でページ情報リストを更新し、更新したページ情報リストに従って、フローチャートの続きを実行すればよい。ここで言う、フローチャートの続きとは、図4のフローチャートであればステップS143Aの後の処理、図7のフローチャートであればステップS145Bの“Yes”の後の処理、図9のフローチャートであればステップS144Cの“Yes”の後の処理、図11のフローチャートであればステップS141Dの後の処理である。
【0076】
図14は、制御部11が表示部13に表示させるUI画面24の一例を示している。UI画面24は、例えば、図12,13に示したようなUI画面23の替わりに表示される。あるいは、UI画面24は、UI画面23を表示した後であって、制御部11が読取画像データのページ範囲毎のファイル化を開始する直前に、最終確認の位置付けで表示されるものであってもよい。あるいは、UI画面24は、ページ範囲毎の各画像ファイルの保存が終了した後に、処理結果の報告という位置付けで表示されるものであってもよい。
【0077】
UI画面24は、概略、第1表示領域24a、第2表示領域24bおよび第3表示領域24cを含む。図14では、区切りタイプとして「目次」が選択された場合に対応する表示内容を示している。また、図14の説明では、以下では画像ファイルが生成される、保存される、と記載するが、生成された、保存された、というように過去形で解釈してもよい。第1表示領域24aには、読取画像データの複数のページ範囲のそれぞれに対応して生成される複数の画像ファイルの「ファイル情報」が示される。図14の例では、読取画像データが3つのページ範囲に区切られて、これら3つのページ範囲のそれぞれに対応する画像ファイルが生成され、保存されるものとする。
【0078】
1つのファイル情報は、例えば、画像ファイルが対応するページ範囲の先頭ページのページ番号および最終ページのページ番号、ページ範囲の総ページ数、画像ファイルのファイル名、ページ範囲の先頭ページや最終ページのサムネイル画像、等が含まれる。画像ファイルのファイル名は、共通の読取画像データから生成される複数の画像ファイルに共通の名称と、共通の読取画像データから生成される複数の画像ファイルに連続で付された番号と、を含む。
【0079】
図14によれば、読取画像データのページ1,2,3のページ範囲に対応する画像ファイルのファイル名は「サンプル1_目次1」とされている。同様に、読取画像データのページ4~9のページ範囲に対応する画像ファイルのファイル名は「サンプル1_目次2」、読取画像データのページ10~13のページ範囲に対応する画像ファイルのファイル名は「サンプル1_目次3」とされている。これらファイル名のうち「サンプル1」は、共通の読取画像データから生成される複数の画像ファイルに共通の名称であり、具体的には、読取画像データのファイル名である。読取画像データのファイル名は、原稿の読み取り時に、画像読取システム10が自動的に付与した名称でもよいし、ユーザーが入力した名称であってもよい。
【0080】
ファイル名のうち「目次」は、ユーザーが選択した区切りタイプを表す文字である。従って、区切りタイプとして「見出し」が選択された場合は、制御部11は、画像ファイルのファイル名に「見出し」という文字を入れ、区切りタイプとして「背景色」が選択された場合は、画像ファイルのファイル名に「背景色」という文字を入れる。ファイル名のうち「目次」に続く1~3の数字は、共通の読取画像データから生成される複数の画像ファイルに連続で付された番号つまり連番である。
【0081】
ただし、制御部11は、区切りタイプとして「見出し」が選択された場合に、画像ファイルのファイル名に「見出し」という文字ではなく、文字認識の結果から抽出した、ページ範囲毎の見出しそのものを入れてもよい。例えば、制御部11が、読取画像データに対する文字認識の結果から「写真をきれいに印刷するためのポイント」という文字列を見出しとして抽出し、この見出しを有するページを先頭ページとするページ範囲を1つの画像ファイルに変換する場合を想定する。この場合、制御部11は、当該画像ファイルのファイル名に「写真をきれいに印刷するためのポイント」という文字列をそのまま、あるいは所定文字数以内になるように一部を削除したり編集したりした上で、入れてもよい。
【0082】
第2表示領域24bは、複数の画像ファイルのうちの1つに含まれる全ページを表示可能な領域である。全ページを表示可能であるから、全ページを表示しなければいけない訳ではない。制御部11は、第1表示領域24aに表示されている複数のファイル情報のうちの1つが選択された場合に、選択されたファイル情報が対応する画像ファイルに含まれるページを第2表示領域24bに表示させる。図14の例では、第1表示領域24aにおいて、ファイル名「サンプル1_目次2」のファイル情報がユーザーの操作により選択されている。そのため、図14では、第2表示領域24bには、ファイル名「サンプル1_目次2」の画像ファイルに含まれる全ページであるページ4~9がサムネイル画像により表示されている。つまり、第2表示領域24bの表示内容は、第1表示領域24aにおけるファイル情報の選択に連動して変化する。
【0083】
第3表示領域24cには、単一のページがプレビュー表示される。制御部11は、第2表示領域24bに表示されているページのうちの1つが選択された場合に、選択された当該ページを拡大して第3表示領域24cにプレビュー表示させる。図14の例では、第2表示領域24bにおいて、ページ4のサムネイル画像がユーザーの操作により選択されている。そのため、図14では、第3表示領域24cには、ページ4が第1表示領域24aや第2表示領域24bにおけるサムネイル画像よりも拡大して表示されている。さらに、第3表示領域24cには、プレビュー表示しているページを含む画像ファイルに関するスキャン日時、ファイル種類、ファイルサイズ、ページサイズ、パス情報等、詳細な情報が表示されてもよい。パス情報は、画像ファイルの保存先を示す。
【0084】
制御部11は、UI画面24を表示部13に表示させる場合に、第1表示領域24aの初期状態においては、第1表示領域24a内で読取画像データの先頭ページを含む画像ファイルのファイル情報が選択された状態とする。第1表示領域24aの初期状態とは、表示した第1表示領域24aに対するユーザーの操作を未だ受けていない状態を指す。図14の例では、第1表示領域24aにおいて、ファイル名「サンプル1_目次2」のファイル情報がユーザーの操作により選択されているが、第1表示領域24aの初期状態においては、ページ1を含む画像ファイル、つまりファイル名「サンプル1_目次1」のファイル情報が選択状態となる。従って、前記初期状態においては、第2表示領域24bには、読取画像データの先頭ページを含む画像ファイルに含まれる各ページが表示されている。
【0085】
第3表示領域24cは、UI画面24内において常に表示されているとは限らない。例えば、上述の初期状態では、UI画面24内に第3表示領域24cは表示されていない。また、制御部11は、第2表示領域24bにおいていずれかのページへの選択操作を受けた場合に、第3表示領域24cを表示して、選択されたページの拡大プレビュー表示をするとしてもよい。
【0086】
ユーザーは、UI画面24を参照して、画像ファイル化して保存するページ範囲を取捨選択するとしてもよい。つまり、制御部11は、UI画面24に対するユーザーによる所定の選択操作を受け付け、第1表示領域24aに表示したファイル情報のうち、ファイル化の対象として選択されたファイル情報にかかる画像ファイルのみ、読取画像データから生成して保存するようにしてもよい。
【0087】
4.まとめ:
このように本実施形態によれば、画像読取システム10は、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取部18と、読取画像データに対して処理を行う制御部11と、を備え、制御部11は、読取画像データに対して文字認識を行う文字認識処理と、文字認識処理の結果から、原稿の目次に列記されたページ番号を取得する番号取得処理と、前記ページ番号に基づいて、複数のページで構成される読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
前記構成によれば、画像読取システム10は、原稿内の目次に基づいて読取画像データを自動的に複数のページ範囲に区切って、それぞれのページ範囲を画像ファイル化する。そのため、原稿のスキャンに際してユーザーの負担を減らし、ユーザーの利便性を高めることができる。
【0088】
また、本実施形態によれば、画像読取システム10は、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取部18と、読取画像データに対して処理を行う制御部11と、を備え、制御部11は、読取画像データに対して文字認識を行う文字認識処理と、文字認識処理の結果から、所定のしきい値以上の文字サイズの文字列を見出しと判別する見出し判別処理と、見出しを有するページのページ番号に基づいて、複数のページで構成される読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
前記構成によれば、画像読取システム10は、原稿内の見出しに基づいて読取画像データを自動的に複数のページ範囲に区切って、それぞれのページ範囲を画像ファイル化する。そのため、原稿のスキャンに際してユーザーの負担を減らし、ユーザーの利便性を高めることができる。
【0089】
また、本実施形態によれば、画像読取システム10は、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取部18と、読取画像データに対して処理を行う制御部11と、を備え、制御部11は、読取画像データを構成するページ毎に背景色を特定する背景色特定処理と、ページ間の背景色の変化に基づいて、複数のページで構成される読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
前記構成によれば、画像読取システム10は、ページ間の背景色の変化に基づいて読取画像データを自動的に複数のページ範囲に区切って、それぞれのページ範囲を画像ファイル化する。そのため、原稿のスキャンに際してユーザーの負担を減らし、ユーザーの利便性を高めることができる。
【0090】
また、本実施形態によれば、制御部11は、ページ範囲のそれぞれを登録したページ情報リストを生成し、ファイル化処理では、ページ情報リストに基づいて読取画像データを分割して、ページ範囲毎の画像ファイルを生成する。
前記構成によれば、制御部11は、読取画像データを区切るページ範囲を、リスト形式で管理し、これを参照して読取画像データを分割して複数の画像ファイルを生成したり、ページ情報リストを読取画像データの分割保存の履歴として保存しておいたりすることができる。また、制御部11は、ページ情報リスト自体を、UI画面として表示部13に表示させることも可能である。
【0091】
画像読取システム10は、表示部13を備える。
制御部11は、読取画像データのページであって、ページ範囲の区切り位置を挟む前後の各ページを表示部13に表示させるとしてもよい。
前記構成によれば、制御部11は、ページ範囲の区切り位置を挟む前後の各ページを表示部13に表示させることで、読取画像データのいずれのページ間で区切って複数の画像ファイルとするかを、ユーザーに明確に認識させることができる。
【0092】
また、本実施形態によれば、制御部11は、前記区切り位置を挟む前後の各ページを、読取画像データのページであって前記区切り位置を挟む前後の各ページ以外のページと共に表示部13に表示させる場合に、前記区切り位置を挟む前後の各ページのうち少なくとも一方を、前記区切り位置を挟む前後の各ページ以外のページよりも拡大して表示させるとしてもよい。
前記構成によれば、ページ範囲の区切り位置に臨むページの内容を、ユーザーが認識し易くなる。
【0093】
また、本実施形態によれば、制御部11は、複数のページ範囲のそれぞれに対応する複数の画像ファイルのファイル情報を示す第1表示領域24aと、複数の画像ファイルのうちの1つに含まれる全ページを表示可能な第2表示領域24bとを、表示部13に表示させるとしてもよい。
前記構成によれば、ユーザーにとって、読取画像データをページ範囲で区切って生成される各画像ファイルの概要と、各画像ファイルのうちの1つの画像ファイルの詳細とが、表示部13を通じて認識し易くなる。
【0094】
また、本実施形態によれば、ファイル情報は、画像ファイルのファイル名を含み、ファイル名は、共通の読取画像データから生成される複数の画像ファイルに共通の名称と、共通の読取画像データから生成される複数の画像ファイルに連続で付された番号と、を含むとしてもよい。
前記構成によれば、共通の読取画像データから生成される各画像ファイルに対して、ユーザーから見て分かり易いファイル名が付与される。
【0095】
また、本実施形態によれば、制御部11は、第1表示領域24aに表示されている複数のファイル情報のうちの1つが選択された場合に、選択されたファイル情報が対応する画像ファイルに含まれるページを第2表示領域24bに表示させる、としてもよい。
前記構成によれば、画像ファイルの各ページの詳細を見たいユーザーの利便性を高めることができる。
【0096】
また、本実施形態によれば、制御部11は、単一のページがプレビュー表示される第3表示領域24cを表示部13に表示させることが可能であり、第2表示領域24bに表示されているページのうちの1つが選択された場合に、選択された当該ページを拡大して第3表示領域24cにプレビュー表示させる、としてもよい。
前記構成によれば、ユーザーが所望する1つのページをユーザーに詳細に確認させることができる。
【0097】
また、本実施形態によれば、制御部11は、第1表示領域24aの初期状態においては、第1表示領域24a内で読取画像データの先頭ページを含む画像ファイルのファイル情報が選択された状態とする、としてもよい。
前記構成によれば、第1表示領域24aの初期状態においては、読取画像データの先頭ページを含む画像ファイルのファイル情報や、この画像ファイルに含まれる各ページについて、ユーザーに注目させることができる。
【0098】
本実施形態は、画像読取システム10やスキャナーといった装置だけでなく、それらが実行する方法や、方法をプロセッサーに実行させるプログラム12といった各種カテゴリーの発明を開示する。
つまり、画像読取方法は、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取工程と、読取画像データに対して処理を行う処理工程と、を備え、処理工程では、読取画像データに対して文字認識を行う文字認識処理と、文字認識処理の結果から、原稿の目次に列記されたページ番号を取得する番号取得処理と、前記ページ番号に基づいて、複数のページで構成される読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
【0099】
また、画像読取方法は、処理工程では、読取画像データに対して文字認識を行う文字認識処理と、文字認識処理の結果から、所定のしきい値以上の文字サイズの文字列を見出しと判別する見出し判別処理と、見出しを有するページのページ番号に基づいて、複数のページで構成される読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
【0100】
また、画像読取方法は、処理工程では、読取画像データを構成するページ毎に背景色を特定する背景色特定処理と、ページ間の背景色の変化に基づいて、複数のページで構成される読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。
【0101】
さらに本実施形態によれば、画像読取システム10は、複数枚の原稿を読み取って読取結果としての読取画像データを生成する読取部18と、読取画像データに対して処理を行う制御部11と、表示部13と、を備え、制御部11は、読取画像データのページ数よりも少ないページ数の指定、または、ページ番号の指定を受け付ける受付処理と、指定されたページ数またはページ番号に基づいて、複数のページで構成される読取画像データを区切る複数のページ範囲を決定するページ範囲決定処理と、ページ範囲のそれぞれを1つの画像ファイルとするファイル化処理と、を実行する。さらに制御部11は、複数のページ範囲のそれぞれに対応する複数の画像ファイルのファイル情報を示す第1表示領域24aと、複数の画像ファイルのうちの1つに含まれる全ページを表示可能な第2表示領域24bとを、表示部13に表示させる。
前記構成に、画像読取システム10は、ユーザーから指定されたページ数またはページ番号に基づいて、読取画像データを自動的に複数のページ範囲に区切って、それぞれのページ範囲を画像ファイル化する。そのため、原稿のスキャンに際してユーザーの負担を減らし、ユーザーの利便性を高めることができる。
【0102】
さらに本実施形態によれば、画像読取システム10は、目次、見出し、背景色、ユーザー指定等といった複数の区切りタイプの中から、区切りタイプの選択を受け付ける。そして、選択された区切りタイプに応じて、各フローチャートに示したような分割保存の処理を実行する。当該構成によれば、ユーザーが原稿の特徴や自身の要望に適した区切りタイプを選択することが可能となり、分割保存の結果に対するユーザーの満足度を高めることができる。
【符号の説明】
【0103】
10…画像読取システム、11…制御部、12…プログラム、13…表示部、14…操作受付部、15…記憶部、16…通信IF、17…搬送部、18…読取部、20,21,22,23,24…UI画面、23a…第1分割表示領域、23b…第2分割表示領域、24a…第1表示領域、24b…第2表示領域、24c…第3表示領域、30…読取画像データ、31…目次領域、32,34,35…ページ情報リスト、33…見出し
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14