特許7172649 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ セイコーエプソン株式会社の特許一覧

特許7172649画像処理装置および画像処理プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-11-08

(45)【発行日】2022-11-16

(54)【発明の名称】画像処理装置および画像処理プログラム

(51)【国際特許分類】

H04N 1/00 20060101AFI20221109BHJP

G03G 21/00 20060101ALI20221109BHJP

【ＦＩ】

H04N1/00 002Z

G03G21/00 386

H04N1/00 L

【請求項の数】 6

(21)【出願番号】P 2019010934

(22)【出願日】2019-01-25

(65)【公開番号】P2020120308

(43)【公開日】2020-08-06

【審査請求日】2021-11-04

(73)【特許権者】

【識別番号】000002369

【氏名又は名称】セイコーエプソン株式会社

(74)【代理人】

【識別番号】100096703

【弁理士】

【氏名又は名称】横井俊之

(72)【発明者】

【氏名】原田英一

(72)【発明者】

【氏名】水庫潔

【審査官】橋爪正樹

(56)【参考文献】

【文献】特開２００７－１４２６３１（ＪＰ，Ａ）

【文献】特開２００１－２５１４８３（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｎ１／００

Ｇ０３Ｇ２１／００

Ｇ０６Ｆ３／１２

(57)【特許請求の範囲】

【請求項1】

複数の原稿の読取結果に対する処理を実行する制御部を備える画像処理装置であって、
前記制御部は、
前記複数の原稿の読み取りにより生成された複数ページ分の文書データを取得し、
前記取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域の検出を実行し、
前記ページ毎の文書データにおける前記見出し領域の有無に基づいてページの前後関係を推測することにより、前記原稿の読取順序の正否を判定する、ことを特徴とする画像処理装置。

【請求項2】

前記制御部は、前記ページ毎の文書データを対象として、ページ内下部の空白領域である最も下方の行を含む下部空白領域の検出を実行し、前記ページ毎の文書データにおける前記見出し領域の有無および前記下部空白領域の有無に基づいてページの前後関係を推測することにより、前記原稿の読取順序の正否を判定する、ことを特徴とする請求項１に記載の画像処理装置。

【請求項3】

前記制御部は、前記文書データに含まれる文字列のフォントサイズ及び又は行間に基づいて前記見出し領域を検出する、ことを特徴とする請求項１または請求項２に記載の画像処理装置。

【請求項4】

前記制御部は、前記原稿の読取順序が正しくないと判定した場合に、前記原稿の読取順序が正しくない旨を外部へ通知する、ことを特徴とする請求項１～請求項３のいずれかに記載の画像処理装置。

【請求項5】

前記制御部は、前記原稿の読取順序が正しくないと判定した場合に、前記複数ページ分の文書データを並べ替えて保存する、ことを特徴とする請求項１～請求項４のいずれかに記載の画像処理装置。

【請求項6】

複数の原稿の読取結果に対する処理をコンピューターに実行させる画像処理プログラムであって、
前記複数の原稿の読み取りにより生成された複数ページ分の文書データを取得する機能と、
前記取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域を検出する機能と、
前記ページ毎の文書データにおける前記見出し領域の有無に基づいてページの前後関係を推測することにより、前記複数の原稿の読取順序の正否を判定する機能と、を実行させることを特徴とする画像処理プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、画像処理装置および画像処理プログラムに関する。

【背景技術】

【0002】

原稿の両面を読み取り可能なシートフィードスキャナーにより、複数の原稿を連続して両面読取することができる。ユーザーが複数の原稿からなる原稿の束をシートフィードスキャナーへセットするときに、原稿の束の表裏を誤ってセットすると、原稿の束の最終シートの裏面から読み取りが開始されてしまう。
なお、原稿の表面を白紙と検出し、裏面を白紙と検出しなかった場合に、原稿の裏表セットミスであると報知する画像読取装置が知られている（特許文献１参照）。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２００７‐３６７３２号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、前記文献１のように白紙を原稿の裏面と判別する手法では、原稿の裏面にも印刷がされている場合には原稿の表裏を判別することができない。そのため、いずれのページにも文書が含まれている複数ページ分の読取データから、原稿が正しい順序で読み取られたか否かを判定することが困難であった。

【課題を解決するための手段】

【0005】

複数の原稿の読取結果に対する処理を実行する制御部を備える画像処理装置であって、前記制御部は、前記複数の原稿の読み取りにより生成された複数ページ分の文書データを取得し、前記取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域の検出を実行し、前記ページ毎の文書データにおける前記見出し領域の有無に基づいてページの前後関係を推測することにより、前記原稿の読取順序の正否を判定する。

【図面の簡単な説明】

【0006】

【図1】システムの構成を簡易的に示すブロック図。

【図2】搬送経路を含むスキャナーの機械的構造を簡易的に示す図。

【図3】読取順序の正否判定処理を示すフローチャート。

【図4】推測規則の例を示す図。

【図5】複数の原稿が正しい向きでスキャナーにセットされ読み取られた事例Ｃａｓｅ１と、複数の原稿が間違った向きでスキャナーにセットされ読み取られた事例Ｃａｓｅ２とを説明する図。

【図6】ＵＩ画面の例を示す図。

【発明を実施するための形態】

【0007】

以下、各図を参照しながら本発明の実施形態を説明する。各図は、本実施形態を説明するための例示に過ぎない。各図は例示であるため、互いに整合していなかったり、一部が省略されていたりする場合がある。

【0008】

１．システムの概略説明：
図１は、本実施形態にかかるシステム１の構成を簡易的に示している。システム１は、画像処理装置１０およびスキャナー２０を含んでいる。システム１を、画像読取システム等と記載してもよい。スキャナー２０を、画像読取装置と記載してもよい。

【0009】

画像処理装置１０は、例えば、パーソナルコンピューター、スマートフォン、タブレット型端末、携帯電話機、サーバー或いはそれらと同程度の処理能力を有する情報処理装置によって実現される。画像処理装置１０は、制御部１１、表示部１３、操作受付部１４、通信インターフェイス１５、記憶部１６等を備える。インターフェイスをＩＦと略して表記する。制御部１１は、プロセッサーとしてのＣＰＵ１１ａ、ＲＯＭ１１ｂ、ＲＡＭ１１ｃ等を有する一つ又は複数のＩＣや、その他の不揮発性メモリー等を含んで構成される。

【0010】

制御部１１では、プロセッサーつまりＣＰＵ１１ａが、ＲＯＭ１１ｂや、その他のメモリー等に保存されたプログラムに従った演算処理を、ＲＡＭ１１ｃ等をワークエリアとして用いて実行することにより、画像処理装置１０を制御する。制御部１１は、例えば、画像処理プログラム１２に従った処理を実行する。なお、プロセッサーは、一つのＣＰＵに限られることなく、複数のＣＰＵや、ＡＳＩＣ（Application Specific Integrated Circuit）等のハードウェア回路により処理を行う構成としてもよいし、ＣＰＵとハードウェア回路とが協働して処理を行う構成としてもよい。

【0011】

表示部１３は、視覚的情報を表示するための手段であり、例えば、液晶ディスプレイや、有機ＥＬディスプレイ等により構成される。表示部１３は、ディスプレイと、ディスプレイを駆動するための駆動回路とを含む構成であってもよい。操作受付部１４は、ユーザーによる操作を受け付けるための手段であり、例えば、物理的なボタンや、タッチパネルや、マウスや、キーボード等によって実現される。むろん、タッチパネルは、表示部１３の一機能として実現されるとしてもよい。表示部１３および操作受付部１４を含めて、画像処理装置１０の操作パネルと呼ぶことができる。

【0012】

表示部１３や操作受付部１４は、画像処理装置１０の構成の一部であってもよいが、画像処理装置１０に対して外付けされた周辺機器であってもよい。通信ＩＦ１５は、画像処理装置１０が公知の通信規格を含む所定の通信プロトコルに準拠して有線又は無線で外部と通信を実行するための一つまたは複数のＩＦの総称である。記憶部１６は、例えば、ハードディスクドライブや不揮発性メモリーにより構成される。記憶部１６は制御部１１の一部であってもよい。

【0013】

スキャナー２０は、複数の原稿を連続的に読み取り可能なシードフィードスキャナーである。スキャナー２０は、知られているように、原稿をイメージセンサーを用いて光学的に読み取り、読取結果としての画像データを生成し、出力する。画像処理装置１０は通信ＩＦ１５を介してスキャナー２０と接続している。画像処理装置１０は、スキャナー２０から出力された画像データを入力し、入力した画像データに対する処理を実行する。

【0014】

図２は、搬送経路２３を含むスキャナー２０の機械的構造を簡易的に示している。スキャナー２０は、本体部２１と、本体部２１の所定面を覆う蓋２２とを備える。蓋２２は本体部２１に対して開閉可能である。本体部２１と蓋２２との間には、原稿３２の搬送経路２３が確保されている。スキャナー２０は、搬送経路２３の上流の供給口２４から原稿３２を一枚単位で筐体内へ取り込む。そして、スキャナー２０は、供給口２４から取り込んだ原稿３２について、ローラー２５ａ，２５ｂ，２６ａ，２６ｂ，２８ａ，２８ｂ等を回転させることにより、搬送経路２３内を搬送し、搬送経路２３の下流の排出口２７から外部へ排出する。

【0015】

ローラー２５ａ，２５ｂ，２６ａ，２６ｂ，２８ａ，２８ｂは、原稿３２を搬送するためにスキャナー２０が有する搬送部の一部を構成する。図示は省略しているが、搬送部は、各ローラーを回転させるためのモーター等を含む。対のローラー２５ａ，２５ｂは搬送経路２３を挟んで互いに相対している。同様に、対のローラー２６ａ，２６ｂは搬送経路２３を挟んで互いに相対しており、対のローラー２８ａ，２８ｂは搬送経路２３を挟んで互いに相対している。ローラー２５ａは蓋２２に配設され、ローラー２５ｂは本体部２１に配設されている。ローラー２６ａは蓋２２に配設され、ローラー２６ｂは本体部２１に配設されている。ローラー２８ａは蓋２２に配設され、ローラー２８ｂは本体部２１に配設されている。ローラー２５ａ，２５ｂは、搬送経路２３途中の読取部２９，３０よりも、搬送の上流に在る。ローラー２６ａ，２６ｂは、読取部２９，３０よりも下流に在る。ローラー２８ａ，２８ｂは、ローラー２５ａ，２５ｂよりも更に上流に在り、供給口２４の近傍に配設されている。

【0016】

供給口２４の近傍には、原稿３２を載置可能な給紙トレイ３１が配設されている。原稿３２は、印刷が施されたシート状の媒体であり、典型的には紙である。給紙トレイ３１に載置された原稿３２の束の下から順に原稿３２を一枚単位で搬送経路２３へ連続的に取り込む、いわゆるＡＤＦ（Auto Document Feeder）を、搬送部は含んでいる。ローラー２８ａ，２８ｂをＡＤＦと解してもよい。

【0017】

本体部２１に配設された読取部２９を第１読取部２９と呼び、蓋２２に配設された読取部３０を第２読取部３０と呼ぶ。第１読取部２９および第２読取部３０は、それぞれにイメージセンサーや光源や各種光学系を備える。第１読取部２９および第２読取部３０のそれぞれにおいて、イメージセンサーは、光源が照射する光の原稿３２からの反射光を受光し、受光量に応じて生成した電荷を画像データとして出力する。イメージセンサーは、複数の光電変換素子が主走査方向に並んで構成されている。主走査方向とは、原稿３２の搬送方向に対して交差する方向である。ここで言う交差とは、直交を意味するが、厳密な直交だけでなく、実際の部品取り付け精度等に起因して生じる程度の誤差を含む意味であってもよい。図２においては、主走査方向は、図２の紙面に対して垂直な方向である。

【0018】

スキャナー２０は、原稿３２の両面を読み取ることが可能である。すなわち、第１読取部２９は、搬送経路２３内を搬送される原稿３２の本体部２１の方を向く面を読み取り、第２読取部３０は、搬送経路２３内を搬送される原稿３２の蓋２２の方を向く面を読み取る。
本実施形態では、原稿３２の両面のうち、本体部２１の方を向く面、つまり第１読取部２９により読み取られる面を「一方の面」と呼ぶ。原稿３２の両面のうち、蓋２２の方を向く面、つまり第２読取部３０により読み取られる面を「他方の面」と呼ぶ。

【0019】

あるいは、スキャナー２０は、第１読取部２９および第２読取部３０のうち第１読取部２９のみを有し、原稿３２の一つの面の読み取りの後に原稿３２を反転させる機構を有する機種であってもよい。この場合は、原稿３２の両面のうち、最初に本体部２１の方を向いている面、つまり第１読取部２９により先に読み取られる面が「一方の面」であり、前記反転後に第１読取部２９により読み取られる面が「他方の面」である。

【0020】

理想的には、原稿３２の「表面」が「一方の面」となり、原稿３２の「裏面」が「他方の面」となる。原稿３２の表面および裏面は、原稿の内容に依拠して予め決められている。ユーザーは、原稿３２の表面が下方つまり本体部２１の方を向くように、原稿３２を給紙トレイ３１に載置する。ただし、ユーザーの間違いにより、裏面が本体部２１の方を向いた状態の原稿３２が給紙トレイ３１に載置されてしまうこともある。スキャナー２０は、原稿３２の一方の面を第１読取部２９により読み取った結果である画像データ、原稿３２の他方の面を第２読取部３０又は第１読取部２９により読み取った結果である画像データ、の順で一枚の原稿３２につき２ページ分の画像データを画像処理装置１０へ出力する。

【0021】

画像処理装置１０とスキャナー２０とは、図示しないネットワークを通じて接続するとしてもよい。画像処理装置１０は、独立した一つの情報処理装置によって実現されるだけでなく、ネットワークを介して互いに通信可能に接続した複数の情報処理装置によって実現されてもよい。あるいは、画像処理装置１０およびスキャナー２０は、それらが一体の装置であってもよい。つまり、以下に説明する画像処理装置１０が実行する処理は、スキャナー２０の一部分である画像処理装置１０が実行する、と解してもよい。

【0022】

２．読取順序の正否判定処理：
図３は、制御部１１が画像処理プログラム１２に従って実行する、読取順序の正否判定処理をフローチャートにより示している。

【0023】

ステップＳ１００では、制御部１１は、上述のようにスキャナー２０が複数の原稿３２の両面読取により出力した複数ページ分の画像データを、通信ＩＦ１５を介して取得する。本実施形態では、スキャナー２０は、両面に文書が印刷された原稿３２を読み取るものとする。以下では、スキャナー２０が原稿３２を読み取ることにより画像処理装置１０へ出力する画像データを、「文書データ」と呼ぶ。

【0024】

スキャナー２０からは、１枚目の原稿３２の一方の面の読取結果である文書データ、１枚目の原稿３２の他方の面の読取結果である文書データ、２枚目の原稿３２の一方の面の読取結果である文書データ、２枚目の原稿３２の他方の面の読取結果である文書データ…という順序で、複数ページ分の文書データが出力される。そのため、ステップＳ１００で制御部１１は、結果的に、複数の原稿３２それぞれの一方の面の読み取りにより生成された複数ページ分の文書データを、複数の奇数番目のページ（奇数ページ）の文書データとして取得し、前記複数の原稿３２それぞれの他方の面の読み取りにより生成された複数ページ分の文書データを、複数の偶数番目のページ（偶数ページ）の文書データとして取得することになる。

【0025】

ステップＳ１１０では、制御部１１は、ステップＳ１００で取得した複数ページ分の文書データのうちの１ページ目の文書データを解析することにより、この１ページ目の文書データを、いずれかのページタイプに分類する。
この場合、制御部１１は、１ページ目の文書データを解析することにより「見出し領域」を検出する。見出し領域とは、文書の見出しに該当する文字列を含んだ領域である。見出しを、表題、タイトル、ヘッドライン等とも言う。

【0026】

制御部１１は、見出し領域の検出の対象とするページの文書データから、文字認識により、文字列を抽出する。そして、制御部１１は、抽出した文字列のうち、相対的に大きいフォントサイズによる文字列であって、他の文字列との行間として、他の文字列同士の行間よりも広い行間あるいは所定値以上の行間が確保されている文字列を、見出し領域として検出する。例えば、制御部１１は、前記抽出した文字列を、フォントサイズの違いに応じて分類し、分類した文字列の中で最も大きいフォントサイズの文字列について、上述した行間の条件を加味して、見出し領域に該当するか否かを判断してもよい。なお、制御部１１は、上述したようなフォントサイズまたは行間のいずれか一方の条件に基づいて見出し領域を検出してもよい。

【0027】

また、制御部１１は、１ページ目の文書データを解析することにより「下部空白領域」を検出する。下部空白領域とは、ページ内下部の空白領域のことである。空白領域とは、文字、図形、写真画像などのオブジェクトが何も印刷されていない領域を意味する。制御部１１は、下部空白領域の検出の対象とするページの文書データにおいて、上下左右の余白領域を特定する。原稿３２の各面においては、余白、縁、マージン等と呼ばれる、何も印刷しない余白領域が上下左右の端部に確保されていることが一般的である。そのため、制御部１１はページ単位の文書データの上下左右の各端における所定幅の領域を、余白領域として特定する。そして、制御部１１は、下部空白領域の検出の対象とするページの文書データにおける余白領域を除いた領域内の、空白領域であって最も下方の行を含む空白領域を、下部空白領域として検出する。前記最も下方の行に文字列が存在していれば、下部空白領域の存在が成立せず、下部空白領域は検出されない。

【0028】

制御部１１は、見出し領域の検出結果および下部空白領域の検出結果に基づいて、１ページ目の文書データを分類する。
制御部１１は、見出し領域の検出に成功し、且つ、下部空白領域の検出に成功したページの文書データを、第１のタイプ（以下、タイプａ）に分類する。
また、制御部１１は、見出し領域の検出に成功し、且つ、下部空白領域の検出に成功しなかったページの文書データを、第２のタイプ（以下、タイプｂ）に分類する。
また、制御部１１は、見出し領域の検出に成功せず、且つ、下部空白領域の検出に成功したページの文書データを、第３のタイプ（以下、タイプｃ）に分類する。
また、制御部１１は、見出し領域の検出に成功せず、且つ、下部空白領域の検出に成功しなかったページの文書データを、第４のタイプ（以下、タイプｄ）に分類する。

【0029】

ステップＳ１２０では、制御部１１は、ステップＳ１００で取得した複数ページ分の文書データのうち、現時点でステップＳ１１０または前回のステップＳ１２０による分類を終えているページの次のページについて、文書データを解析することにより、いずれかのページタイプに分類する。ステップＳ１１０とステップＳ１２０とは、対象のページが異なるだけで、処理は同じである。つまり、ステップＳ１２０においても、制御部１１は、対象のページの文書データについて見出し領域の検出および下部空白領域の検出を実行し、それら見出し領域の検出結果および下部空白領域の検出結果に基づいて、タイプａ，ｂ，ｃ，ｄのいずれかに分類する。ステップＳ１１０の次に実行するステップＳ１２０では、制御部１１は、当然、ステップＳ１００で取得した複数ページ分の文書データのうちの２ページ目の文書データを対象として、前記分類を行う。

【0030】

ステップＳ１３０では、制御部１１は、連続する二ページ分の文書データの前後関係を推測し、その前後関係が適切であるか否かを判定する。ここで言う、連続する二ページ分の文書データとは、ステップＳ１２０で分類の対象としたページ（以下、後ページ）の文書データと、後ページの一つ前のページ（以下、前ページ）の文書データとを指す。ステップＳ１１０→Ｓ１２０の流れで実行するステップＳ１３０では、ステップＳ１００で取得した複数ページ分の文書データのうちの１ページ目が前ページに該当し、２ページ目が後ページに該当する。

【0031】

制御部１１は、推測規則４０を参照することにより、連続する二ページ分の文書データの前後関係を推測する。
図４は、推測規則４０の例を示している。推測規則４０は、一種のテーブルであり、所定の記憶領域（例えば、記憶部１６）に予め記憶されている。推測規則４０は、前ページのページタイプと後ページのページタイプとの対応関係を規定している。

【0032】

推測規則４０によれば、前ページのページタイプがタイプａであれば、後ページのページタイプはタイプａまたはタイプｂと推測される。これは、見出し領域が有り且つ下部空白領域が有るページの次のページは、見出し領域が有るページの可能性が高いからである。
また、推測規則４０によれば、前ページのページタイプがタイプｂであれば、後ページのページタイプはタイプｃまたはタイプｄと推測される。これは、見出し領域が有り且つ下部空白領域が無いページの次のページは、見出し領域が無いページの可能性が高いからである。
また、推測規則４０によれば、前ページのページタイプがタイプｃであれば、後ページのページタイプはタイプａまたはタイプｂと推測される。これは、見出し領域が無く且つ下部空白領域が有るページの次のページは、見出し領域が有るページの可能性が高いからである。
また、推測規則４０によれば、前ページのページタイプがタイプｄであれば、後ページのページタイプはタイプｃまたはタイプｄと推測される。これは、見出し領域が無く且つ下部空白領域が無いページの次のページは、見出し領域が無いページの可能性が高いからである。

【0033】

制御部１１は、前ページのページタイプと推測規則４０とに基づいて、後ページのページタイプを推測する。そして、推測した後ページのページタイプのいずれかと、ステップＳ１２０で分類した後ページのページタイプとが合う場合に、連続する二ページ分の文書データの前後関係が適切である（ステップＳ１３０において“Ｙｅｓ”）と判定し、ステップＳ１４０へ進む。一方、制御部１１は、推測した後ページのページタイプのいずれとも、ステップＳ１２０で分類した後ページのページタイプが合わない場合に、連続する二ページ分の文書データの前後関係が適切でない（ステップＳ１３０において“Ｎｏ”）と判定し、ステップＳ１６０へ進む。

【0034】

ステップＳ１４０では、制御部１１は、ステップＳ１００で取得した複数ページ分の文書データのうちの最終ページを「後ページ」としたステップＳ１３０の判定を終えたか否かにより、処理を分岐する。つまり、制御部１１は、最終ページを後ページとしたステップＳ１３０の判定を終えたとステップＳ１４０で判定した場合（ステップＳ１４０において“Ｙｅｓ”）、ステップＳ１５０へ進み、最終ページを後ページとしたステップＳ１３０の判定を終えていないとステップＳ１４０で判定した場合（ステップＳ１４０において“Ｎｏ”）、ステップＳ１２０以下を繰り返す。これまでの説明から判るように、ステップＳ１２０以下を繰り返すサイクルにおいては、前回のステップＳ１３０における後ページが今回のステップＳ１３０における前ページとなり、前回のステップＳ１３０における後ページの次のページが今回のステップＳ１３０における後ページとなる。

【0035】

ステップＳ１５０では、制御部１１は、原稿３２の読取順序が正当であると判定する。ステップＳ１５０では、制御部１１は、さらに「通常処理」を実施し、フローチャートを終了する。通常処理については、後述する。

【0036】

一方、ステップＳ１６０では、制御部１１は、原稿３２の読取順序が不当であると判定する。ステップＳ１６０では、制御部１１は、さらに「誤セット対応処理」を実施し、フローチャートを終了する。誤セット対応処理については、後述する。

【0037】

図５は、複数の原稿が正しい向きでスキャナー２０にセットされて読み取られた事例（Ｃａｓｅ１）と、複数の原稿が間違った向きでスキャナー２０にセットされて読み取られた事例（Ｃａｓｅ２）とを説明する図である。符号３２Ａは、ある一枚の原稿３２を示し、符号３２Ｂは、原稿３２Ａとは異なる一枚の原稿３２を示している。また、符号３２Ａ‐１は、原稿３２Ａの表面を示し、符号３２Ａ‐２は、原稿３２Ａの裏面を示している。符号３２Ｂ‐１は、原稿３２Ｂの表面を示し、符号３２Ｂ‐２は、原稿３２Ｂの裏面を示している。原稿３２Ａ，３２Ｂはいずれも両面に文書が印刷された原稿３２である。原稿３２Ａ，３２Ｂの関係においては、原稿３２Ａが先頭の原稿３２であり、原稿３２Ｂが原稿３２Ａの次の原稿３２である。

【0038】

従って、原稿３２Ａの表面３２Ａ‐１を下方にして、つまり表面３２Ａ‐１が給紙トレイ３１に相対する向きで原稿３２Ａを給紙トレイ３１に載置し、原稿３２Ａの上に、表面３２Ｂ‐１を下方にして原稿３２Ｂを載置して、スキャナー２０で原稿３２Ａ，３２Ｂを読み取ったケースが、Ｃａｓｅ１に該当する。
一方、ユーザーが、原稿３２Ａ，３２Ｂの束を、原稿３２Ｂの裏面３２Ｂ‐２を下方にしてスキャナー２０にセットしてしまうこともある。つまり、裏面３２Ｂ‐２が給紙トレイ３１に相対する向きで原稿３２Ｂを給紙トレイ３１に載置し、原稿３２Ｂの上に、裏面３２Ａ‐２を下方にして原稿３２Ａを載置して、スキャナー２０で原稿３２Ｂ，３２Ａを読み取ったケースが、Ｃａｓｅ２に該当する。
図５では、スペースの都合上、スキャナー２０が読み取る複数の原稿３２として二枚の原稿３２Ａ，３２Ｂを示しているが、言うまでもなくスキャナー２０は三枚以上の原稿３２を連続的に読み取ることが可能である。

【0039】

符号ＩＭ１は、スキャナー２０による表面３２Ａ‐１の読取結果としての文書データを示している。符号ＩＭ２は、スキャナー２０による裏面３２Ａ‐２の読取結果としての文書データを示している。符号ＩＭ３は、スキャナー２０による表面３２Ｂ‐１の読取結果としての文書データを示している。符号ＩＭ４は、スキャナー２０による裏面３２Ｂ‐２の読取結果としての文書データを示している。文書データＩＭ１，ＩＭ２，ＩＭ３，ＩＭ４はそれぞれが、ページ単位の画像データである。図５において、符号ＩＭ１，ＩＭ２，ＩＭ３，ＩＭ４とともに括弧書きで記載した番号１，２，３，４は、画像処理装置１０の制御部１１がスキャナー２０から取得したときのページ単位の各文書データの順序、つまりページ順である。

【0040】

Ｃａｓｅ１においては、制御部１１は、文書データＩＭ１を１ページ目の文書データとして取得し、文書データＩＭ２を２ページ目の文書データとして取得し、文書データＩＭ３を３ページ目の文書データとして取得し、文書データＩＭ４を４ページ目の文書データとして取得する。一方、Ｃａｓｅ２においては、制御部１１は、文書データＩＭ４を１ページ目の文書データとして取得し、文書データＩＭ３を２ページ目の文書データとして取得し、文書データＩＭ２を３ページ目の文書データとして取得し、文書データＩＭ１を４ページ目の文書データとして取得する。

【0041】

Ｃａｓｅ１を参照して図３のフローチャートを具体的に説明する。
ステップＳ１１０では、制御部１１は、１ページ目の文書データＩＭ１を解析することにより、文書データＩＭ１をいずれかのページタイプに分類する。文書データＩＭ１内の文字列「ＡＢＣＤＥ」は見出しの一例である。よって、ステップＳ１１０では、制御部１１は、文字列「ＡＢＣＤＥ」を含む見出し領域５０を検出する。また、文書データＩＭ１内の下部にハッチングを施して示した領域５２は下部空白領域である。つまり、ステップＳ１１０では、制御部１１は、下部空白領域５２を検出する。図５において、文書データＩＭ１，ＩＭ２，ＩＭ３，ＩＭ４内の破線による矩形は、余白領域５４を区画している。つまり、文書データＩＭ１，ＩＭ２，ＩＭ３，ＩＭ４の外縁を示す実線による各矩形と、文書データＩＭ１，ＩＭ２，ＩＭ３，ＩＭ４内の破線による各矩形とで挟まれた枠状の領域が、余白領域５４である。見出し領域や下部空白領域はいずれも、余白領域５４よりも内側の領域内で検出される。制御部１１は、文書データＩＭ１から見出し領域５０および下部空白領域５２の検出に成功したことに応じて、文書データＩＭ１をタイプａに分類する。

【0042】

ステップＳ１１０の次のステップＳ１２０では、制御部１１は、２ページ目の文書データＩＭ２を解析することにより、文書データＩＭ２をいずれかのページタイプに分類する。文書データＩＭ２内の文字列「ＦＧＨＩＪ」は見出しの一例である。よって、ステップＳ１１０の次のステップＳ１２０では、制御部１１は、文字列「ＦＧＨＩＪ」を含む見出し領域５１を検出する。また、文書データＩＭ２内では、最も下方の行まで文字列が存在しているため、下部空白領域は検出されない。制御部１１は、文書データＩＭ２から見出し領域５１の検出に成功し、下部空白領域を検出できなかったことに応じて、文書データＩＭ２をタイプｂに分類する。

【0043】

ステップＳ１１０，Ｓ１２０の後のステップＳ１３０では、制御部１１は、１ページ目の文書データＩＭ１と２ページ目の文書データＩＭ２との前後関係を推測し、その前後関係が適切であるか否かを判定する。文書データＩＭ１のページタイプは、タイプａであり、推測規則４０によれば、前ページがタイプａであるときに推測される後ページはタイプａ又はタイプｂである。文書データＩＭ２のページタイプは、タイプｂである。従って、前ページである文書データＩＭ１のページタイプから推測した後ページのページタイプと、後ページである文書データＩＭ２のページタイプとが合うことにより、制御部１１は、ステップＳ１３０において“Ｙｅｓ”と判定し、ステップＳ１４０へ進む。

【0044】

ステップＳ１４０の“Ｎｏ”の判定を経て、２回目のステップＳ１２０では、制御部１１は、３ページ目の文書データＩＭ３を解析することにより、文書データＩＭ３をいずれかのページタイプに分類する。文書データＩＭ３内では、ページの最も上方の行から最も下方の行まで文字列が存在しており、見出し領域、下部空白領域はいずれも検出されない。よって、制御部１１は、文書データＩＭ３をタイプｄに分類する。２回目のステップＳ１２０の後のステップＳ１３０では、制御部１１は、２ページ目の文書データＩＭ２と３ページ目の文書データＩＭ３との前後関係を推測し、その前後関係が適切であるか否かを判定する。文書データＩＭ２のページタイプは、タイプｂであり、推測規則４０によれば、前ページがタイプｂであるときに推測される後ページはタイプｃ又はタイプｄである。文書データＩＭ３のページタイプは、タイプｄである。従って、前ページである文書データＩＭ２のページタイプから推測した後ページのページタイプと、後ページである文書データＩＭ３のページタイプとが合うことにより、制御部１１は、ステップＳ１３０において“Ｙｅｓ”と判定し、ステップＳ１４０へ進む。

【0045】

ステップＳ１４０の“Ｎｏ”の判定を経て、３回目のステップＳ１２０では、制御部１１は、４ページ目の文書データＩＭ４を解析することにより、文書データＩＭ４をいずれかのページタイプに分類する。文書データＩＭ４内では、ページの最も上方の行から文字列が存在している一方で、下部にハッチングを施して示すように下部空白領域５３が存在する。従って、制御部１１は、文書データＩＭ４から見出し領域を検出できず、下部空白領域５３の検出に成功したことに応じて、文書データＩＭ４をタイプｃに分類する。３回目のステップＳ１２０の後のステップＳ１３０では、制御部１１は、３ページ目の文書データＩＭ３と４ページ目の文書データＩＭ４との前後関係を推測し、その前後関係が適切であるか否かを判定する。文書データＩＭ３のページタイプは、タイプｄであり、推測規則４０によれば、前ページがタイプｄであるときに推測される後ページはタイプｃ又はタイプｄである。文書データＩＭ４のページタイプは、タイプｃである。従って、前ページである文書データＩＭ３のページタイプから推測した後ページのページタイプと、後ページである文書データＩＭ４のページタイプとが合うことにより、制御部１１は、ステップＳ１３０において“Ｙｅｓ”と判定し、ステップＳ１４０へ進む。Ｃａｓｅ１では、文書データＩＭ４が最終ページであるため、制御部１１は、ステップＳ１４０において“Ｙｅｓ”と判定し、ステップＳ１５０へ進む。

【0046】

Ｃａｓｅ２を参照して図３のフローチャートを具体的に説明する。
ステップＳ１１０では、制御部１１は、１ページ目の文書データＩＭ４を解析することにより、文書データＩＭ４をいずれかのページタイプに分類する。これまでの説明から判るように、文書データＩＭ４はタイプｃに分類される。
ステップＳ１１０の次のステップＳ１２０では、制御部１１は、２ページ目の文書データＩＭ３を解析することにより、文書データＩＭ３をいずれかのページタイプに分類する。これまでの説明から判るように、文書データＩＭ３はタイプｄに分類される。

【0047】

ステップＳ１１０，Ｓ１２０の後のステップＳ１３０では、制御部１１は、１ページ目の文書データＩＭ４と２ページ目の文書データＩＭ３との前後関係を推測し、その前後関係が適切であるか否かを判定する。文書データＩＭ４のページタイプは、タイプｃであり、推測規則４０によれば、前ページがタイプｃであるときに推測される後ページはタイプａ又はタイプｂである。文書データＩＭ３のページタイプは、タイプｄである。従って、前ページである文書データＩＭ４のページタイプから推測した後ページのページタイプと、後ページである文書データＩＭ３のページタイプとが合わず、制御部１１は、ステップＳ１３０において“Ｎｏ”と判定し、ステップＳ１６０へ進む。

【0048】

上述したように、ステップＳ１５０では、制御部１１は「通常処理」を実施する。通常処理とは、例えば、スキャナー２０から取得した複数ページ分の文書データを所定フォーマットの一つのファイルとした上で、所定の保存先（例えば、記憶部１６）へ保存する処理である。ステップＳ１５０においては、ステップＳ１００で取得した複数ページ分の文書データに関するページの前後関係が、推定規則４０から見て適切であることから、原稿３２の読取順序が正当であると判定する。そのため、通常処理では、制御部１１は、スキャナー２０から取得した複数ページ分の文書データについて、ページの並び替えをすることなく、取得したときのページ順で一つのファイルに纏めて、保存する。

【0049】

ステップＳ１６０では、制御部１１は「誤セット対応処理」を実施する。ステップＳ１６０においては、ステップＳ１００で取得した複数ページ分の文書データに関するページの前後関係が、推定規則４０から見て適切でないことから、原稿３２の読取順序が不当であると判定する。そこで、誤セット対応処理では、制御部１１は、例えば、原稿３２の読取順序が正しくない旨を外部へ通知する。

【0050】

図６は、誤セット対応処理の一つとしての前記通知のために制御部１１が表示部１３に表示させるユーザーインターフェイス（ＵＩ）画面６０を例示している。ＵＩ画面６０は、メッセージ６１を含んでいる。メッセージ６１は、スキャナー２０による原稿３２の読取順序が正しくない旨をユーザーに認識させるための文字列であり、例えば「原稿セットの向き（表裏の読取順）が間違っています。」といった内容である。メッセージ６１を視認したユーザーは、例えば、ＵＩ画面６０内のＯＫボタン６３を、操作受付部１４を操作することにより押下した上で、原稿３２の再スキャンを実行することができる。再スキャンに際しては、ユーザーは、複数の原稿３２を正しい向きでスキャナー２０の給紙トレイ３１へ載置した上で、それら複数の原稿３２の読み取りをスキャナー２０に実行させる。

【0051】

ＵＩ画面６０は、ページ並べ替えボタン６２を含むものであってもよい。メッセージ６１を視認したユーザーは、例えば、ページ並べ替えボタン６２を、操作受付部１４を操作することにより押下する。制御部１１は、ページ並べ替えボタン６２の押下を検知すると、誤セット対応処理の一つとして、ページ並べ替え処理を実行する。ページ並べ替え処理は、スキャナー２０から取得した複数ページ分の文書データを並べ替えて保存する処理である。

【0052】

図５のＣａｓｅ２を参照すると、制御部１１は、文書データＩＭ４を１ページ目の文書像データ、文書像データＩＭ３を２ページ目の文書データ、文書データＩＭ２を３ページ目の文書データ、文書データＩＭ１を４ページ目の文書データとして、それぞれ取得済みである。従って、Ｃａｓｅ２に対応してステップＳ１６０で実行するページ並べ替え処理では、制御部１１は、文書データＩＭ４，ＩＭ３，ＩＭ２，ＩＭ１の順序を逆に並べ替えて、文書データＩＭ１を１ページ目の文書データ、文書データＩＭ２を２ページ目の文書データ、文書データＩＭ３を３ページ目の文書データ、文書データＩＭ４を４ページ目の文書データとした上で、それら文書データＩＭ１，ＩＭ２，ＩＭ３，ＩＭ４を前記所定フォーマットの一つのファイルとして所定の保存先（例えば、記憶部１６）へ保存する。

【0053】

制御部１１は、スキャナー２０から取得した複数ページ分の文書データを、スキャナー２０から取得したページの順序で並べてメッセージ６１とともに、あるいはメッセージ６１の表示の代わりに、ＵＩ画面６０に表示させるとしてもよい。具体的には、図５のＣａｓｅ２に示したように、文書データＩＭ４，ＩＭ３，ＩＭ２，ＩＭ１を、画面左側を先頭にして並べてＵＩ画面６０内に表示する。このように、原稿３２Ｂの裏面３２Ｂ‐２、原稿３２Ｂの表面３２Ｂ‐１、原稿３２Ａの裏面３２Ａ‐２、原稿３２Ａの表面３２Ａ‐１の順で並んだ各ページの文書データを、ＵＩ画面６０を介して視認したユーザーは、スキャナー２０に対する原稿セットの向きの誤り、つまり原稿３２の読取順序が正しくないことを、より具体的に認識することができる。

【0054】

上述したように、制御部１１は、ＵＩ画面６０を介したユーザーからの指示に応じてページ並べ替え処理を実行する。ただし、別の実施例として、制御部１１は、ステップＳ１６０ではＵＩ画面６０を表示させることなく、ページ並べ替え処理を実行するとしてもよ。つまり、制御部１１は、ステップＳ１６０では、ページ並べ替え処理を実行すべき旨のユーザーからの指示を受けることなく、自動的にページ並べ替え処理を実行するとしてもよい。

【0055】

３．まとめ：
このように本実施形態によれば、画像処理装置１０は、複数の原稿３２の読取結果に対する処理を実行する制御部１１を備える。制御部１１は、複数の原稿３２の読み取りにより生成された複数ページ分の文書データを取得する。そして、制御部１１は、取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域の検出を実行する（ステップＳ１１０，Ｓ１２０）。そして、制御部１１は、前記ページ毎の文書データにおける見出し領域の有無に基づいてページの前後関係を推測することにより、原稿３２の読取順序の正否を判定する（ステップＳ１３０，Ｓ１５０，Ｓ１６０）。

【0056】

前記構成によれば、制御部１１は、ページ毎の文書データを少なくとも見出し領域の有無に応じて分類し、分類に基づいてページの前後関係を推測する。そして、推測した通りの前後関係が、前記取得したページ順の文書データ間で保たれていれば原稿の読取順序は正しいと判定し、推測した通りの前後関係が、前記取得したページ順の文書データ間で保たれていなければ原稿の読取順序は正しくないと判定する。
このように、制御部１１は、原稿３２の読取順序の正否を適切に判定することができる。

【0057】

また、本実施形態によれば、制御部１１は、前記ページ毎の文書データを対象として、ページ内下部の空白領域（下部空白領域）の検出を実行する（ステップＳ１１０，Ｓ１２０）。そして、制御部１１は、前記ページ毎の文書データにおける見出し領域の有無および下部空白領域の有無に基づいてページの前後関係を推測することにより、原稿３２の読取順序の正否を判定する（ステップＳ１３０，Ｓ１５０，Ｓ１６０）。
前記構成によれば、見出し領域および下部空白領域という二つの要素それぞれの有無に基づいて、ページの前後関係をより的確に推測することができる。そのため、原稿３２の読取順序の正否を判定した結果も、より信頼性の高いものとなる。

【0058】

なお、本実施形態は、ページ毎の文書データを対象として、見出し領域および下部空白領域を検出する態様に限定されず、見出し領域のみの検出を実行する態様も含む。つまり、制御部１１は、ステップＳ１１０，Ｓ１２０で、対象の文書データから見出し領域の検出を実行し、見出し領域の有無に応じて文書データのページタイプを分類する。また、制御部１１が、ステップＳ１３０の判定のために参照する推測規則４０も、見出し領域の有無に応じた複数のページタイプ間の前後関係を規定する情報であってもよい。また、制御部１１は、例えば、１ページ目の文書データについては、見出し領域を有するページタイプであると推測し、１ページ目の文書データが見出し領域を有さないページタイプであれば、１ページ目に続く２ページ目との前後関係が、推測に反する、つまり適切でない（ステップＳ１３０において“Ｎｏ”）と判定してもよい。

【0059】

また、制御部１１は、文書データのページタイプを、より細かく分類してもよい。例えば、制御部１１は、文書データ内の見出し領域の位置に応じて、文書データを異なるページタイプに分類する。具体的には、制御部１１は、ページ内で最も上方の文字列を見出し領域として検出した場合と、前記最も上方の文字列以外の文字列を見出し領域として検出した場合とで、文書データを異なるページタイプに分類する。制御部１１は、前記最も上方の文字列を見出し領域として検出した文書データについては、これまでに説明したタイプａまたはタイプｂに分類する。一方、前記最も上方の文字列以外の文字列を見出し領域として検出した文書データのページタイプについては、タイプａ～ｄとは異なる第５のタイプ（以下、タイプｅ）に分類する。そして、制御部１１は、タイプｅについては、例えば、下部空白領域を有さないタイプｂやタイプｄの文書データを前ページとしたときの後ページの一つとなり得る旨の推測をして、ステップＳ１３０の判定を行うとしてもよい。

【0060】

また、本実施形態によれば、制御部１１は、文書データに含まれる文字列のフォントサイズ及び又は行間に基づいて見出し領域を検出する。
前記構成によれば、文書データ内から見出し領域を精度良く検出することができる。
また、本実施形態によれば、制御部１１は、原稿３２の読取順序が正しくないと判定した場合に、原稿３２の読取順序が正しくない旨を外部へ通知する。
前記構成によれば、ユーザーに、スキャナー２０に対する原稿セットの向きの誤り、つまり原稿３２の読取順序が正しくないことを認識させることができる。

【0061】

また、本実施形態によれば、制御部１１は、原稿３２の読取順序が正しくないと判定した場合に、前記複数ページ分の文書データを並べ替えて保存する。
前記構成によれば、制御部１１は、複数ページ分の文書データを、取得したときのページ順の逆に並び替えることにより、正しい読取順序に対応したページ順で保存することができる。

【0062】

また、本実施形態は、複数の原稿３２の読取結果に対する処理をコンピューターに実行させる画像処理プログラム１２を開示する。つまり、画像処理プログラム１２は、複数の原稿３２の読み取りにより生成された複数ページ分の文書データを取得する機能と、前記取得したページ毎の文書データを対象として、文書の見出しに該当する見出し領域を検出する機能と、前記ページ毎の文書データにおける前記見出し領域の有無に基づいてページの前後関係を推測することにより、前記複数の原稿の読取順序の正否を判定する機能と、をＣＰＵ１１ａに実行させる。むろん、画像処理装置１０が実行する各工程を含んだ方法の発明を、本実施形態から捉えることも可能である。

【0063】

なお、本実施形態は、片面だけに文書が印刷された複数の原稿３２について、スキャナー２０がそれら原稿３２の片面を連続的に片面読取することにより生成した複数ページ分の文書データを、処理する場面においても適用可能である。つまり、複数の原稿３２の片面を連続的に読み取ることにより生成された複数ページ分の文書データに対して、上述したような見出し領域等の検出やページの前後関係の推測を実行することにより、原稿３２の読取順序の正否を判定することができる。

【符号の説明】

【0064】

１…システム、１０…画像処理装置、１１…制御部、１２…画像処理プログラム、１３…表示部、１４…操作受付部、１５…通信ＩＦ、１６…記憶部、２０…スキャナー、２３…搬送経路、２９…第１読取部、３０…第２読取部、３１…給紙トレイ、３２，３２Ａ，３２Ｂ…原稿、３２Ａ‐１，３２Ｂ‐１…表面、３２Ａ‐２，３２Ｂ‐２…裏面、４０…推測規則、５０，５１…見出し領域、５２，５３…下部空白領域、５４…余白領域、６０…ＵＩ画面、６１…メッセージ、６２…ページ並べ替えボタン

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版