特許6983687 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特許6983687スキャン画像データに関連する情報を設定するための装置、方法、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6983687

(24)【登録日】2021年11月26日

(45)【発行日】2021年12月17日

(54)【発明の名称】スキャン画像データに関連する情報を設定するための装置、方法、及びプログラム

(51)【国際特許分類】

H04N 1/00 20060101AFI20211206BHJP

G06K 9/20 20060101ALI20211206BHJP

【ＦＩ】

H04N1/00 Z

G06K9/20 340J

G06K9/20 340C

【請求項の数】10

【全頁数】26

(21)【出願番号】特願2018-16604(P2018-16604)

(22)【出願日】2018年2月1日

(65)【公開番号】特開2019-134364(P2019-134364A)

(43)【公開日】2019年8月8日

【審査請求日】2021年1月28日

(73)【特許権者】

【識別番号】000001007

【氏名又は名称】キヤノン株式会社

(74)【代理人】

【識別番号】110001243

【氏名又は名称】特許業務法人谷・阿部特許事務所

(72)【発明者】

【氏名】丹羽広次

【審査官】豊田好一

(56)【参考文献】

【文献】特開２０１６−０１８４５４（ＪＰ，Ａ）

【文献】特開２０１６−１１１４８２（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１５／０３０４５２０（ＵＳ，Ａ１）

【文献】特開平０７−０２８９３５（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｈ０４Ｎ１／００

Ｇ０６Ｋ９／２０

(57)【特許請求の範囲】

【請求項1】

文書をスキャンして得られたスキャン画像データに関連する情報を設定するためのシステムであって、
処理対象のスキャン画像データを解析して１または複数の文字列領域を抽出する解析手段と、
前記処理対象のスキャン画像データに類似する過去のスキャン画像データがある場合、前記解析手段で抽出された文字列領域と、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられた文字列領域と、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域とに基づいて、前記処理対象のスキャン画像データに関連する情報を設定する際に用いるべき文字列領域を特定する特定手段と、を備え、
前記特定手段は、前記解析手段で抽出された文字列領域のうち、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられた文字列領域と前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域との両方に対応すると判定された文字列領域について分割を行い、分割後の文字列領域に基づいて、前記処理対象のスキャン画像データに関連する情報を設定する際に用いるべき文字列領域を特定することを特徴とするシステム。

【請求項2】

前記特定手段は、前記解析手段で前記処理対象のスキャン画像データから抽出された文字列領域の情報と、前記過去のスキャン画像データの文字列領域の情報とを比較することによって、前記処理対象のスキャン画像データに類似する過去のスキャン画像データがあるかどうか判定することを特徴とする請求項１に記載のシステム。

【請求項3】

前記特定手段は、前記解析手段で前記処理対象のスキャン画像データから抽出された文字列領域の座標と大きさを示す情報と、前記過去のスキャン画像データの文字列領域の座標と大きさを示す情報とを比較することによって、前記処理対象のスキャン画像データに類似する過去のスキャン画像データがあるかどうか判定することを特徴とする請求項２に記載のシステム。

【請求項4】

前記特定手段は、前記解析手段で前記処理対象のスキャン画像データから抽出された文字列領域のうち、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられた文字列領域に重なる文字列領域を候補領域とし、当該候補領域のうち、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域に重なる候補領域について分割を行い、当該分割後の候補領域と、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域に重ならない候補領域とに基づいて、前記処理対象のスキャン画像データに関連する情報を設定する際に用いるべき文字列領域を特定することを特徴とする請求項１乃至３のいずれか１項に記載のシステム。

【請求項5】

前記特定手段は、更に、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域に重ならない候補領域のうち、当該候補領域の周辺領域の個数が減少している候補領域について分割を行い、当該分割後の候補領域と、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域に重ならず且つ周辺領域の個数が減少しなかった候補領域とに基づいて、前記処理対象のスキャン画像データに関連する情報を設定する際に用いるべき文字列領域を特定することを特徴とする請求項４に記載のシステム。

【請求項6】

前記特定手段は、前記解析手段で抽出された文字列領域のうち、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられた文字列領域と前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域との両方に対応すると判定された文字列領域を、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域の幅に基づいて分割することを特徴とする請求項１乃至５のいずれか１項に記載のシステム。

【請求項7】

前記スキャン画像データを表示画面に表示するとともに、前記特定手段により特定された文字列領域を選択状態にして表示するように制御する表示制御手段を、更に備えることを特徴とする請求項１乃至６のいずれか１項に記載のシステム。

【請求項8】

前記処理対象のスキャン画像データに関連する情報は、前記処理対象のスキャン画像データのファイル名であり、前記特定手段で特定された文字列領域の文字認識結果を前記ファイル名に用いることを特徴とする請求項１乃至７のいずれか１項に記載のシステム。

【請求項9】

文書をスキャンして得られたスキャン画像データに関連する情報を設定するための方法であって、
処理対象のスキャン画像データを解析して１または複数の文字列領域を抽出する解析ステップと、
前記処理対象のスキャン画像データに類似する過去のスキャン画像データがある場合、前記解析ステップで抽出された文字列領域と、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられた文字列領域と、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域とに基づいて、前記処理対象のスキャン画像データに関連する情報を設定する際に用いるべき文字列領域を特定する特定ステップと、を備え、
前記特定ステップでは、前記解析ステップで抽出された文字列領域のうち、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられた文字列領域と前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域との両方に対応すると判定された文字列領域について分割を行い、分割後の文字列領域に基づいて、前記処理対象のスキャン画像データに関連する情報を設定する際に用いるべき文字列領域を特定することを特徴とする方法。

【請求項10】

コンピュータを、請求項１乃至８のいずれか１項に記載のシステムの各手段として機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、スキャンして得られたスキャン画像データに関連する情報を設定する技術に関する。

【背景技術】

【0002】

従来、紙文書をスキャンして得られた画像データ（以下、スキャン画像データともいう）に対して文字認識処理（ＯＣＲ処理）を行い、認識された文字を用いて、そのスキャン画像データのファイル名を設定する技術が知られている。特許文献１には、スキャン画像データをプレビュー画面に表示して、ユーザが選択した文字列領域に対してＯＣＲ処理を実行して認識結果を取得し、その認識結果に基づいてスキャン画像データのファイル名を設定することが記載されている。また、近年では、過去にスキャンした文書とフォーマットが類似する文書（以下、類似フォーマットの文書ともいう）をスキャンした場合に、ユーザが過去に選択した文字列領域に基づいてスキャン画像データのファイル名を設定することが検討されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開昭６２−５１８６６号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、類似フォーマットの文書であっても、文字列領域の位置や大きさが異なる場合があり、その結果、不要な文字列も取得してしまうことがあった。

【0005】

本発明は、このような問題に鑑みてなされたものであり、類似フォーマットの文書を処理する際に、ユーザが文字列領域を選択する手間を省きつつ、適切な文字列を取得することを目的とする。

【課題を解決するための手段】

【0006】

本発明の一実施形態において、文書をスキャンして得られたスキャン画像データに関連する情報を設定するためのシステムは、処理対象のスキャン画像データを解析して１または複数の文字列領域を抽出する解析手段と、前記処理対象のスキャン画像データに類似する過去のスキャン画像データがある場合、前記解析手段で抽出された文字列領域と、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられた文字列領域と、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域とに基づいて、前記処理対象のスキャン画像データに関連する情報を設定する際に用いるべき文字列領域を特定する特定手段と、を備え、前記特定手段は、前記解析手段で抽出された文字列領域のうち、前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられた文字列領域と前記類似する過去のスキャン画像データに関連する情報を設定する際に用いられなかった文字列領域との両方に対応すると判定された文字列領域について分割を行い、分割後の文字列領域に基づいて、前記処理対象のスキャン画像データに関連する情報を設定する際に用いるべき文字列領域を特定することを特徴とする。

【発明の効果】

【0007】

本発明によると、類似フォーマットの文書を処理する際に、ユーザが文字列領域を選択する手間を省きつつ、適切な文字列を取得することができる。

【図面の簡単な説明】

【0008】

【図1】システム全体図である。

【図2】ＭＦＰのソフトウェア構成図である。

【図3】スキャン画像データを生成してアップロードする処理を示すフローチャートである。

【図4】ＭＦＰのスキャン設定画面を示す図である。

【図5】画像解析処理を示すフローチャートである。

【図6】選択文字列領域の復元情報生成処理を示すフローチャートである。

【図7】復元候補領域の分割処理を示すフローチャートである。

【図8】ＭＦＰのプレビュー画面を示す図である。

【図9】ファイル名生成処理を示すフローチャートである。

【図10】ＭＦＰのアップロード設定画面を示す図である。

【図11】ＭＦＰのプレビュー画面を示す図である。

【図12】ＭＦＰのプレビュー画面を示す図である。

【図13】復元候補領域の分割処理を示すフローチャートである。

【図14】ＭＦＰのプレビュー画面を示す図である。

【発明を実施するための形態】

【0009】

以下、図面を参照して本発明の実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。また、以下の実施形態で説明されている特徴の組み合わせの全てが、本発明に必須のものとは限らない。

【0010】

＜第１の実施形態＞
図１は、本実施形態に係る画像処理システムの全体構成を示すブロック図である。画像処理システムは、ＭＦＰ（ＭｕｌｔｉｆｕｎｃｔｉｏｎＰｅｒｉｐｈｅｒａｌ）１０１と、ファイルサーバ１０２とを備える。ＭＦＰ１０１とファイルサーバ１０２は、ネットワーク（例えば、ＬＡＮ：ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）１００を介して互いに通信可能に接続されている。本実施形態では、ＭＦＰ１０１とファイルサーバ１０２とで画像処理システムを構成しているが、ファイルサーバ１０２の機能をＭＦＰ１０１が併有する構成であってもよい。

【0011】

ＭＦＰ１０１は、スキャン機能、ＦＡＸ機能、及びコピー機能などの複数の機能を有する複合機であり、画像処理装置の一例である。ＭＦＰ１０１は、制御部２１０、操作部２２０、プリンタ２２１、スキャナ２２２、及びモデム２２３を有する。制御部２１０は、ＭＦＰ１０１全体の動作を制御する。

【0012】

ＣＰＵ２１１は、ＲＯＭ２１２に記憶された制御プログラムを読み出して、読取、印刷、通信などの各種制御を行う。ＲＡＭ２１３は、ＣＰＵ２１１の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、ＭＦＰ１０１は、１つのＣＰＵ２１１が１つのメモリ（ＲＡＭ２１３またはＨＤＤ２１４）を用いて後述するフローチャートに示す処理を実行するものとするが、複数のＣＰＵや複数のＲＡＭまたはＨＤＤを協働させて実行するようにしてもよい。

【0013】

ＨＤＤ２１４は、画像データや各種プログラムを記憶する。操作部Ｉ／Ｆ２１５は、操作部２２０と制御部２１０を接続するインタフェースである。操作部２２０は、タッチパネル機能を有する液晶表示部やボタンボードなどを備えており、ユーザによる操作、入力、指示を受け付ける受付手段としての役割を担う。

【0014】

プリンタＩ／Ｆ２１６は、プリンタ２２１と制御部２１０を接続するインタフェースである。プリンタ２２１で印刷される画像データは、プリンタＩ／Ｆ２１６を介して制御部２１０からプリンタ２２１へ転送され、プリンタ２２１により記録媒体上に印刷される。

【0015】

スキャナＩ／Ｆ２１７は、スキャナ２２２と制御部２１０を接続する。スキャナ２２２は、原稿上の画像を読み取って画像データ（すなわち、スキャン画像データ）を生成し、スキャナＩ／Ｆ２１７を介して制御部２１０に入力する。ＭＦＰ１０１は、スキャナ２２２で生成された画像データを、プリンタ２２１で印刷する他に、ファイル送信またはメール送信することができる。

【0016】

モデムＩ／Ｆ２１８は、モデム２２３と制御部２１０を接続するインタフェースである。モデム２２３は、ＰＳＴＮ（ＰｕｂｌｉｃＳｗｉｔｃｈｅｄＴｅｌｅｐｈｏｎｅＮｅｔｗｏｒｋｓ）１１０を介して、不図示のファクシミリ装置との間における画像データのファクシミリ通信を実行する。ネットワークＩ／Ｆ２１９は、制御部２１０（すなわち、ＭＦＰ１０１）をネットワーク１００に接続するインタフェースである。ＭＦＰ１０１は、ネットワークＩ／Ｆ２１９を用いてネットワーク１００上の外部装置（ファイルサーバ１０２など）に画像データや情報を送信したり、各種情報を受信したりする。

【0017】

ファイルサーバ１０２は、電子化された文書ファイルの保存や管理を行う外部サーバの一例である。ファイルサーバ１０２は、制御部３１０を有する。制御部３１０は、ファイルサーバ１０２全体の動作を制御する。ＣＰＵ３１１は、ＲＯＭ３１２に記憶された制御プログラムを読み出して各種制御処理を実行する。ＲＡＭ３１３は、ＣＰＵ３１１の主メモリ、ワークエリア等の一時記憶領域として用いられる。ＨＤＤ３１４は、画像データや各種プログラムを記憶する。

【0018】

ネットワークＩ／Ｆ３１５は、制御部３１０（すなわち、ファイルサーバ１０２）をネットワーク１００に接続するインタフェースである。ファイルサーバ１０２は、ネットワークＩ／Ｆ３１５を介してネットワーク１００上の他の装置との間で各種情報を送受信する。

【0019】

図２は、本実施形態に係るＭＦＰ１０１のソフトウェア構成図である。ＭＦＰ１０１のソフトウェアは、ネイティブ機能部４１０と追加アプリケーション４２０の大きく２つに分けられる。ネイティブ機能部４１０に含まれる各部は、ＭＦＰ１０１に標準的に備えられたものである。一方、追加アプリケーション４２０は、ＭＦＰ１０１に追加インストールされたアプリケーションである。追加アプリケーション４２０は、Ｊａｖａ（登録商標）をベースとしたアプリケーションであり、ＭＦＰ１０１への機能追加を容易に実現できる。なお、ＭＦＰ１０１には図示しない他の追加アプリケーションがインストールされていても良い。

【0020】

アプリケーション表示部４２３は、ＭＦＰ１０１の操作部２２０のタッチパネル機能を有する液晶表示部に、ユーザによる操作、入力、指示を受け付けるためのＵＩ（ＵｓｅｒＩｎｔｅｒｆａｃｅ）画面を表示する。ＵＩ画面の詳細については後述する。

【0021】

スキャン指示部４２１は、アプリケーション表示部４２３を介して入力されたユーザからの情報を受けて、入力情報に含まれるスキャン設定や転送設定と共に、スキャン部４１１にスキャン処理を要求する。また、後述するアプリケーション転送部４２４が、画像データの転送先であるファイルサーバ１０２のフォルダパスの情報を一時的に保存する。

【0022】

スキャン部４１１は、スキャン指示部４２１からのスキャン設定を含んだスキャン要求を受けて、スキャン処理を実行する。スキャン部４１１は、スキャナＩ／Ｆ２１７を介してスキャナ２２２によって、原稿を読み取って画像データを生成し、画像データと転送設定を転送部４１２に渡す。

【0023】

転送部４１２は、スキャン部４１１から受け取った画像データを、同じくスキャン部４１１から受け取った転送設定に従って転送する。画像データの転送先としては、ファイルサーバ１０２、ネットワーク１００上のＰＣ（不図示）等を設定可能である。なお、本実施形態では、スキャン部４１１が生成した画像データを一旦全て追加アプリケーション４２０に転送するように設定されているものとする。また、転送部４１２は、ＦＴＰ（ＦｉｌｅＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌ）クライアント機能を有しており、ＦＴＰサーバ機能を有するアプリケーション受信部４２２に対してＦＴＰで画像データを転送することができる。

【0024】

アプリケーション受信部４２２は、転送部４１２から内部転送された画像データを受信し、アプリケーション転送部４２４に渡す。

【0025】

アプリケーション転送部４２４は、受信した画像データを画像解析部４２５に渡す。

【0026】

画像解析部４２５は、画像データに対して文字列領域の判定、文字列領域の分割、及び文字列の認識などを行うことができる。画像解析部４２５は、判定した文字列領域と、帳票情報保持部４２８に保存された帳票情報の文字列領域とを比較し、類似する帳票情報に基づいて、画像データに関連する情報（例えば、ファイル名等）の設定に用いる文字列領域情報を抽出することができる。画像解析部４２５は、画像データから抽出した文字列領域情報を、アプリケーション転送部４２４に渡す。

【0027】

また、アプリケーション転送部４２４は、受信した画像データ、抽出した文字列領域情報、及び、ユーザが選択した文字列領域の選択情報を、アプリケーション表示部４２３に渡す。

【0028】

アプリケーション表示部４２３は、アプリケーション転送部４２４から受信した画像データ、文字列領域情報、及び、選択情報を、プレビュー表示部４２６に渡す。

【0029】

プレビュー表示部４２６は、操作部２２０のタッチパネル機能を有する液晶表示部に、ユーザによる操作、入力、指示を受け付けるためのファイル名設定に関するＵＩ画面を表示する。表示するＵＩ画面の詳細については後述する。

【0030】

アップロード指示部４２７は、操作部２２０の液晶表示部に、フォルダパス設定に関するＵＩ画面を表示する。フォルダパス設定に関するＵＩ画面の詳細については後述する。また、アップロード指示部４２７は、ＵＩ画面に入力されたフォルダパスを受け取り、アプリケーション転送部４２４に渡す。

【0031】

また、アプリケーション転送部４２４は、アップロード指示部４２７が受け取ったフォルダパスに、プレビュー表示部４２６から受け取った文字列をフォルダやファイル名として追加する。そして、アプリケーション転送部４２４は、ファイルサーバ１０２に画像データを転送（送信）する。

【0032】

アプリケーション転送部４２４は、転送が終了すると、アプリケーション表示部４２３に転送が終了したことを通知する。アプリケーション表示部４２３は、アプリケーション転送部４２４からの通知を受けて、表示内容を更新する。

【0033】

また、アプリケーション転送部４２４は、ＳＭＢ（ＳｅｒｖｅｒＭｅｓｓａｇｅＢｌｏｃｋ）クライアント機能を有している。これにより、アプリケーション転送部４２４は、ＳＭＢサーバ機能を有するファイルサーバ１０２に対してＳＭＢを用いてファイル及びフォルダ操作を行うことができる。なお、ＳＭＢの他に、ＷｅｂＤＡＶ（ＤｉｓｔｒｉｂｕｔｅｄＡｕｔｈｏｒｉｎｇａｎｄＶｅｒｓｉｏｎｉｎｇｐｒｏｔｏｃｏｌｆｏｒｔｈｅＷＷＷ）や、ＦＴＰ（ＦｉｌｅＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌ）等を使用してもよい。また、ＳＭＴＰ（ＳｉｍｐｌｅＭａｉｌＴｒａｎｓｆｅｒＰｒｏｔｏｃｏｌ）等を使用してもよい。また、ファイル送信目的以外のＳＯＡＰ（ＳｉｍｐｌｅＯｂｊｅｃｔＡｃｃｅｓｓＰｒｏｔｏｃｏｌ）やＲＥＳＴ（ＲｅｐｒｅｓｅｎｔａｔｉｏｎａｌＳｔａｔｅＴｒａｎｓｆｅｒ）等も使用可能である。

【0034】

図３は、ＭＦＰ１０１がスキャン画像データを生成してファイルサーバ１０２にアップロードする処理を示すフローチャートである。フローチャートに示す各動作（ステップ）は、ＭＦＰ１０１のＣＰＵ２１１がＨＤＤ２１４に記憶された制御プログラムを読み出して実行することにより実現される。

【0035】

以下では、図３のフローチャートを３回実施する例を説明する。実施１回目では、帳票情報保持部４２８がスキャン対象の文書の類似文書情報を保持していない状態でスキャン処理を行う場合の処理について説明する。続いて、実施２回目では、帳票情報保持部４２８が実施１回目の文書情報を保持しており、実施１回目でスキャン処理した文書に類似する文書をスキャン処理する場合について説明する。したがって、実施２回目では、帳票情報保持部４２８に保持された文書情報を用いて、スキャン画像データから適切な文字情報が取得される。そして、実施３回目では、実施１回目の文書に類似する文書をスキャン処理するが、スキャン画像データにおいて、隣接する２つの文字列領域が１つの文字列領域として判定されてしまう場合の処理について説明する。

【0036】

＜実施１回目＞
まず、実施１回目の処理について、図３を参照して説明する。

【0037】

ステップＳ３０１では、アプリケーション表示部４２３が、操作部２２０の液晶表示部にスキャン設定画面を表示する。ユーザは、表示されたスキャン設定画面を介して、スキャン部４１１に行わせるスキャン処理の設定を行う。

【0038】

図４は、本実施形態に係るスキャン設定画面４００の一例を示す。スキャン設定画面４００は、５つのスキャン設定ボタン４０１乃至４０５を有する。［カラー設定］ボタン４０１は、原稿スキャン時のカラーまたはモノクロ設定を受け付ける。［解像度設定］ボタン４０２は、原稿スキャン時の解像度設定を受け付ける。［両面読み取り設定］ボタン４０３は、原稿スキャン時の両面読み取り設定を受け付ける。［原稿混載設定］ボタン４０４は、原稿スキャン時にサイズが異なる原稿をまとめてスキャンするかどうかの設定を受け付ける。［画像形式設定］ボタン４０５は、スキャン画像データの画像形式を受け付ける。ユーザがこれらのスキャン設定ボタン４０１乃至４０５を用いて設定を行う際には、ＭＦＰ１０１がサポートしている範囲で設定項目の候補が表示される。ユーザは、表示された候補から所望の設定項目を選択する。なお、上述した設定ボタンは一例であって、これら全ての設定ボタンが存在しなくてもよいし、これら以外の設定ボタンが存在してもよい。ユーザは、このようなスキャン設定画面４００を介して、スキャン処理についての詳細な設定を行なうことができる。［キャンセル］ボタン４０６は、スキャン設定を中止する場合に用いるボタンである。［スキャン開始］ボタン４０７は、原稿台等にセットした原稿に対するスキャン処理の開始を指示するためのボタンである。

【0039】

ステップＳ３０２では、アプリケーション表示部４２３は、［スキャン開始］ボタン４０７が押下されたか、［キャンセル］ボタン４０６が押下されたかを判定する。［スキャン開始］ボタン４０７が押下されたと判定すると、アプリケーション表示部４２３は、スキャン設定ボタン４０１乃至４０５で選択された設定で、スキャン指示部４２１に対してスキャン処理を実行させる。［キャンセル］ボタン４０６が押下されたと判定すると処理を終了する。

【0040】

ステップＳ３０３では、スキャン指示部４２１は、スキャン部４１１にスキャン処理を指示し、原稿をスキャンする。原稿をスキャンして生成されたスキャン画像データは、ステップＳ３０４において、転送部４１２を通じてアプリケーション受信部４２２にＦＴＰで内部転送される。

【0041】

ステップＳ３０５では、画像解析部４２５が、アプリケーション受信部４２２からの指示にしたがって、スキャン画像データの画像解析（レイアウト解析処理やＯＣＲ処理）を行う。画像解析部４２５は、例えば、スキャン画像データのヒストグラムを抽出したり、画素の塊を抽出したりして、文字列領域や図形領域など、スキャン画像データのレイアウトを解析する。文字列領域は、文字列と推認される領域（画像領域）である。文字列領域は、一文字の領域も含む。

【0042】

図５は、ステップＳ３０５の画像解析処理の詳細を示すフローチャートである。

【0043】

ステップＳ５０１では、画像解析部４２５は、アプリケーション受信部４２２から受け取ったスキャン画像データを、解析できる形態にして読み込む。

【0044】

ステップＳ５０２では、画像解析部４２５は、読み込んだスキャン画像データを、領域判定や文字列解析しやすい状態に補正する。具体的には、画像解析部４２５は、スキャン時にずれた文書の傾きがなくなるようにスキャン画像の傾きを補正したり、文書の方向を検知してスキャン画像を回転させたりする。

【0045】

ステップＳ５０３では、画像解析部４２５は、ステップＳ５０２で補正したスキャン画像データを解析して文字列領域を判定し、文字列領域の情報（以下、文字列領域情報という）を抽出する。表１は、文字列領域情報の一例を示す。

【0046】

【表1】

【0047】

上記表１において、［番号］は、特定された各文字列領域を一意に示す番号である。この例では、１から９までの通し番号が、認識された順番に付けられている。［領域のＸ座標］は、特定された各文字列領域の左上隅のＸ座標を示す。［領域のＹ座標］は、特定された各文字列領域の左上隅のＹ座標を示す。以後、文字列領域に対して“座標”と言う場合は、特に断らない限り、文字列領域の左上隅の位置座標のことを意味するものとする。［領域の幅］は、特定された各文字列領域の左辺から右辺までの距離を示す。［領域の高さ］は、特定された各文字列領域の上辺から下辺までの距離を示す。本実施形態では、［領域のＸ座標］、［領域のＹ座標］、［領域の幅］、及び［領域の高さ］はいずれもピクセルで示すが、ポイントやインチ等で示してもよい。文字列領域情報は、ＣＳＶまたはＸＭＬのフォーマットで取得されるものとするが、他のフォーマットでもよい。

【0048】

ステップＳ５０４では、画像解析部４２５は、ステップＳ５０３で抽出した文字列領域情報と、後述するステップＳ３１８の処理により帳票情報保持部４２８に保存された各帳票情報の文字列領域情報とを比較する。すなわち、画像解析部４２５は、過去に類似原稿を処理したことがあるかどうか判定する。画像解析部４２５は、過去に処理した類似原稿において以前にユーザが選択した選択文字列領域を、今回スキャンして得られたスキャン画像データ（処理対象のスキャン画像データ）上に復元するために必要な情報（以下、復元情報という）を生成する。選択文字列領域とは、以前に処理した過去の類似原稿において、後述するステップＳ３０８の処理によりユーザが選択した文字列領域のことである。選択文字列領域の復元とは、後述するステップＳ３０７のプレビュー画面の表示時に、復元情報に基づいて特定された文字列領域を予め選択状態とし、その文字列領域に含まれる文字列を今回のスキャン画像データに関連する情報として設定することである。例えば、特定された文字列領域に含まれる文字列は、今回のスキャン画像データのファイル名に適用することができる。以下、本実施形態では、スキャン画像データに関連する情報としてファイル名を例に説明する。

【0049】

図６は、ステップＳ５０４の選択文字列領域の復元情報生成処理の詳細を示すフローチャートである。

【0050】

ステップＳ６０１では、画像解析部４２５は、ステップＳ５０３で抽出した文字列領域情報と、帳票情報保持部４２８に保存された各帳票情報の文字列領域情報とを比較して、類似する帳票情報が存在するかどうかを判定する。実施１回目では、帳票情報保持部４２８に帳票情報（すなわち、過去に処理した原稿の文字列領域情報）が保存されていないため、ステップＳ６０２においてＮｏと判定され、復元情報生成処理を終了する。すなわち、画像解析部４２５は。選択文字列領域の復元情報を生成せずに、処理を終了する。次いで、処理は、図３のステップＳ３０６へ進む。図６に記載の他の処理（すなわち、ステップＳ６０３乃至Ｓ６０５の処理）については後述する。

【0051】

ステップＳ３０６では、アプリケーション転送部４２４は、画像解析部４２５がステップＳ５０３で抽出した文字列領域情報を取得する。アプリケーション転送部４２４は、画像解析部４２５がＨＤＤ２１４に一旦保存した文字列領域情報を取得するようにしてもよい。

【0052】

ステップＳ３０７では、プレビュー表示部４２６が、アプリケーション表示部４２３を介してアプリケーション転送部４２４から取得したスキャン画像データ及び文字列領域情報を用いて、操作部２２０の液晶表示部にプレビュー画面を表示する。ユーザは、プレビュー画面を介して、スキャン画像データに関連する情報（例えば、スキャン画像データのファイル名）を入力することができる。

【0053】

図８は、プレビュー画面８００の一例を示す。プレビュー画面８００は、スキャン画像データのファイル名表示領域８０１、ファイル名のフォーマット等を設定するためのボタン８０２、及びスキャン画像データをプレビュー表示するためのプレビュー表示領域８１０を有する。また、［戻る］ボタン８３０、及び［次へ］ボタン８３１を有する。

【0054】

プレビュー表示領域８１０は、スキャン画像データを表示するとともに、スキャン画像データの表示状態を変更するボタン８１１乃至８１４、及び文字列領域８１５乃至８２３を含む。

【0055】

［画面上部スクロール］ボタン８１１がユーザによって選択（タッチ）されると、プレビュー表示部４２６は、プレビュー表示領域８１０に表示されているスキャン画像データの領域を上方向に向かってスクロールする。［画面下部スクロール］ボタン８１２がユーザによって選択（タッチ）されると、プレビュー表示部４２６は、プレビュー表示領域８１０に表示されているスキャン画像データの領域を下方向に向かってスクロールする。［画面拡大］ボタン８１３がユーザによって選択（タッチ）されると、プレビュー表示部４２６は、プレビュー表示領域８１０に表示されているスキャン画像データの領域を拡大表示する。［画面縮小］ボタン８１４がユーザによって選択（タッチ）されると、プレビュー表示部４２６は、プレビュー表示領域８１０に表示されているスキャン画像データの領域を縮小表示する。

【0056】

プレビュー表示部４２６は、文字列領域８１５乃至８２３を、画像解析部４２５が取得した文字列領域情報に従って、プレビュー表示領域８１０に表示する。文字列領域情報は、上記表１に示したように、スキャン画像データ上での文字列領域の位置を示している。文字列領域８１５乃至８２３は、文字列領域情報に従って、スキャン画像データのスクロール位置や拡大縮小を考慮した位置に表示される。文字列領域８１５乃至８２３は、ユーザによって選択可能である。ユーザがいずれかの文字列領域を選択すると、プレビュー表示部４２６は、選択された文字列領域に対して文字認識処理（ＯＣＲ処理：Optical Character Recognition処理）を行う。プレビュー表示部４２６は、文字認識処理によって、選択された文字列領域（画像領域）に含まれている文字（テキストデータ）を抽出する。

【0057】

文字認識処理は、例えば、文字列領域に含まれている画素群と、予め登録されている辞書とをマッチング処理することで、文字（テキストデータ）を認識する処理である。かかる文字認識処理は、処理に時間を要する場合がある。そのため、本実施形態では、画像解析によって抽出された文字列領域に逐次的に文字認識処理を行わずに、ユーザが所望する文字列領域に対して文字認識処理を行うことで、処理の高速化を図っている。

【0058】

プレビュー表示部４２６は、ユーザによって選択された文字列領域から抽出した文字（テキストデータ）を、ファイル名表示領域８０１に設定する。なお、ファイル名表示領域８０１がタッチ（選択）されると、プレビュー表示部４２６は、ソフトウェアキーボード（不図示）を表示し、ユーザがソフトウェアキーボードを操作することによって、ファイル名の編集を可能にすることができる。

【0059】

実施１回目で最初に表示されるプレビュー画面８００では、図８（ａ）に示すように、いずれの文字列領域も選択状態ではない。

【0060】

図３に戻り、ステップＳ３０８では、プレビュー表示部４２６は、プレビュー画面８００を介して入力されたユーザ操作に従って、スキャン画像データのファイル名を生成する。

【0061】

図９は、ステップＳ３０８のファイル名生成処理の詳細を示すフローチャートである。

【0062】

ステップＳ９０１では、プレビュー表示部４２６は、ユーザが操作部２２０の液晶表示部（すなわち、プレビュー画面８００）にタッチしたかどうかを判定する。タッチされたと判定すると、ステップＳ９０２へ進み、プレビュー表示部４２６は、タッチされた位置の座標を取得する。タッチされていないと判定するとステップＳ９０１へ戻る。

【0063】

ステップＳ９０３では、プレビュー表示部４２６は、タッチされた位置の座標がプレビュー表示領域８１０に表示されている文字列領域と重なるか判定する。重なるか否かの判定は、タッチされた位置の座標が、プレビュー表示領域８１０内の文字列領域８１５乃至８２３の座標領域内にあるかどうかで判定する。重なると判定すると、ステップＳ９０４へ進み、重なっていないと判定するとステップＳ９０９へ進む。なお、ステップＳ９０９では、［次へ］ボタン８３１もしくは［戻る］ボタン８３０が押下されたと判定されれば処理を終了して、図３に戻り、ステップＳ３０９へ進む。一方、押下されてないと判定されればステップＳ９０１へ戻る。

【0064】

ステップＳ９０４では、画像解析部４２５は、タッチされた位置の座標が重なった文字列領域に対してＯＣＲ処理を行い、当該文字列領域に含まれている文字列を取得する。取得した文字列は、解析結果としてプレビュー表示部４２６へ渡す。

【0065】

ステップＳ９０５では、プレビュー表示部４２６は、ファイル名表示領域８０１に表示中のファイル名を取得する。ファイル名表示領域８０１に何も表示されていない場合には、ファイル名は取得できないため、次に進む。

【0066】

ステップＳ９０６では、プレビュー表示部４２６は、ステップＳ９０５で取得したファイル名の末尾に区切り文字を追加する。本実施形態では、区切り文字としてアンダーバー（“＿”）を使用するが、その他の文字を使用してもよい。なお、ステップＳ９０５でファイル名を取得できなかった場合は、区切り文字を追加せずに次に進む。

【0067】

ステップＳ９０７では、プレビュー表示部４２６は、ステップＳ９０６で追加した区切り文字に続けて、ステップＳ９０４で解析結果として取得した文字列領域の文字列を追加する。なお、ステップＳ９０５でファイル名を取得できなかった場合には、ステップＳ９０６で区切り文字も追加されないため、ステップＳ９０４で取得した文字列が、ファイル名として最初の文字列となる。

【0068】

ステップＳ９０８では、プレビュー表示部４２６は、ステップＳ９０７で生成した文字列をファイル名としてファイル名表示領域８０１に設定し、ステップＳ９０９へ戻る。

【0069】

なお、実施１回目では、ステップＳ９０１乃至Ｓ９０８を繰り返し、文字列領域８１５、８１６、８１７が順に選択されたものとする。図８（ｂ）は、その場合のプレビュー画面８００を示す。なお、ユーザによって選択された文字列領域に、転送先のファイルサーバでファイル名に使用できない文字が含まれている場合、プレビュー表示部４２６は、文字列をファイル名表示領域８０１に設定する際に、該当する文字を除去しても良い。図８（ｂ）のプレビュー画面８００では、文字列領域８１７に含まれるスラッシュ（“／”）が除去されている。除去対象の文字列は、予めＭＦＰ１０１に記憶しておいてもよいし、外部装置から当該文字列に関する情報を取得するようにしてもよい。

【0070】

以上説明したように、ステップＳ３０８のファイル名生成処理が行われる。

【0071】

次いで、図３に戻り、ステップＳ３０９では、プレビュー表示部４２６は、上述したステップＳ９０９での操作内容を判定する。具体的には、プレビュー表示部４２６は、ステップＳ９０９で［次へ］ボタン８３１が押下されたのか、それとも、［戻る］ボタン８３０が押下されたのかを判定する。［次へ］ボタン８３１が押下されたと判定すると、ステップＳ３１０へ進み、［戻る］ボタン８３０が押下されたと判定すると、ステップＳ３０１へ戻る。

【0072】

ステップＳ３１０では、プレビュー表示部４２６は、ファイル名表示領域８０１に設定されているファイル名を取得する。プレビュー表示部４２６は、取得したファイル名をアップロード指示部４２７へ渡す。

【0073】

ステップＳ３１１では、アップロード指示部４２７は、アップロード設定画面を操作部２２０の液晶表示部に表示する。ユーザは、アップロード設定画面を介して、アプリケーション転送部４２４に行わせるファイルサーバ１０２への外部転送（アップロード）に関する設定を行うことができる。

【0074】

図１０は、アップロード設定画面１０００の一例を示す。アップロード設定画面１０００において、フォルダパス入力欄１００１は、外部転送先であるファイルサーバ１０２のフォルダパス設定を受け付ける。ユーザがフォルダパス入力欄１００１をタップすると、アップロード指示部４２７は、ソフトウェアキーボード（不図示）を表示する。ユーザは、表示されたソフトウェアキーボードを介して、フォルダパス入力欄１００１にフォルダパスを入力する。図１０の例では、フォルダパス入力欄１００１に文字列“2017_09_10”が入力されている。フォルダパスの設定を終了する指示を受けると、アップロード指示部４２７は、設定されたフォルダパスを取得し、ソフトウェアキーボードを閉じる。なお、フォルダパスの設定は、フォルダパス入力欄１００１以外から設定可能であってもよい。例えば、ＭＦＰ１０１が保持するアドレス帳からフォルダパスを設定可能なようにしても良い。

【0075】

ステップＳ３１２では、アップロード指示部４２７は、アップロード設定画面１０００の［アップロード］ボタン１０２１が押下されたのか、それとも、［戻る］ボタン１０２０が押下されたのかを判定する。［アップロード］ボタン１０２１が押下されたと判定すると、ステップＳ３１３へ進み、［戻る］ボタン１０２０が押下されたと判定すると、ステップＳ３０７へ戻る。

【0076】

ステップＳ３１３では、アップロード指示部４２７は、ＨＤＤ２１４等のメモリに予め記憶されたファイルサーバ設定を取得する。ファイルサーバ設定には、ファイルサーバ１０２のホスト名、フォルダパスの起点、ファイルサーバ１０２にログインするためのユーザ名及びパスワードが含まれる。アップロード指示部４２７は、取得したファイルサーバ設定、ステップＳ３１１で取得したフォルダパス設定、及びステップＳ３１０で取得したファイル名を、アプリケーション転送部４２４へ渡す。

【0077】

ステップＳ３１４では、アプリケーション転送部４２４は、スキャン画像データの格納先となる格納先パスを生成する。格納先パスは、ファイルサーバ設定に含まれるファイルサーバ１０２のホスト名とフォルダパスの起点に、ステップＳ３１１で取得したフォルダパスを加えて生成される。これにより、例えば“\\server01\Share\2017_09_10”という格納先パスが生成される。

【0078】

ステップＳ３１５では、アプリケーション転送部４２４は、ファイルサーバ１０２にアクセスする。アプリケーション転送部４２４は、ステップＳ３１３で取得したファイルサーバ設定に含まれるユーザ名とパスワードをファイルサーバ１０２に送信し、ファイルサーバ１０２によるユーザ認証の結果を受信する。

【0079】

ステップＳ３１６では、アプリケーション転送部４２４は、受信したユーザ認証の結果に基づいて、ユーザ認証が成功したか（ファイルサーバ１０２にログインできたか）否かを判定する。ユーザ認証が成功した場合はステップＳ３１７に進み、ユーザ認証が失敗した場合は処理を終了する。

【0080】

ステップＳ３１７では、アプリケーション転送部４２４が、ステップＳ３１４で生成した格納先パスが示すフォルダに、スキャン画像データを外部転送（アップロード）する。

【0081】

ステップＳ３１８では、画像解析部４２５は、ステップＳ３０６でスキャン画像から取得した文字列領域情報と、ステップＳ３０８でプレビュー画面上でユーザが選択した文字列領域の情報（すなわち、選択情報）を、帳票情報保持部４２８に保存する。表２は、帳票情報保持部４２８に保存する文字列領域情報および選択情報の一例を示す。

【0082】

【表2】

【0083】

表２において、［帳票Ｎｏ］は、保存する帳票情報ごとに一意の番号が割り当てられる。表２は、１種類目の帳票情報を示しているので「１」が割り当てられている。また、表２は、文字列領域情報に加えて、選択情報を保存する。すなわち、選択情報は、［帳票Ｎｏ］が「１」のスキャン画像データに対応付けて保持される。また、選択情報は、ステップＳ３０８でユーザがプレビュー画面上で選択した文字列領域の順番を表している。また、選択情報における「‐」は、該当する文字列領域がユーザによって選択されていないことを表している。

【0084】

＜実施２回目＞
次に、実施２回目について説明する。実施２回目では、実施１回目でスキャンされた原稿と類似する原稿がスキャンされ、図３のフローチャートを参照して上述した処理が実施されるものとする。以下では、実施１回目と異なる処理を主に説明し、実施１回目と同様の処理については説明を省略する。また、実施２回目のプレビュー画面は、図１１を参照して説明する。

【0085】

表３は、図３のステップＳ３０５における画像解析処理、すなわち、図５のステップＳ５０３において、画像解析部４２５がスキャン画像データから抽出した文字列領域情報の一例を示す。

【0086】

【表3】

【0087】

次に、図６のステップＳ６０１では、画像解析部４２５は、ステップＳ５０３で抽出した文字列領域情報と、帳票情報保持部４２８に保存された各帳票情報の文字列領域情報とを比較する。そして、画像解析部４２５は、各帳票情報の中から、文字列領域の重なりが多い帳票情報を類似帳票情報として判定する。ここでは、帳票情報保持部４２８には、表２に示す帳票情報が保存されているものとする。この場合、表２に示す帳票Ｎｏが「１」である帳票情報の文字列領域と、表３に示す文字列領域との差分は、番号「８」の領域の幅のみである。その他の文字列領域は、表２と表３で同じ位置（Ｘ座標及びＹ座標）にあり、同じ大きさ（幅及び高さ）を有する。したがって、画像解析部４２５は、帳票Ｎｏが「１」である帳票情報を類似帳票情報と判定する（すなわち、類似帳票が存在すると判定する）。類似帳票が存在すると判定されたため、ステップＳ６０２においてＹｅｓと判定され、ステップＳ６０３へ進む。なお、帳票の類似判定は、例えば、比較対象とする文字列領域の総数に対して、互いに重なる文字領域の数の割合（類似度）が、予め定めた閾値以上であるかどうかに基づいて行うことができる。

【0088】

ステップＳ６０３では、画像解析部４２５は、類似帳票情報に含まれる選択情報に基づいて、今回のスキャン画像データに含まれる文字列領域の中から復元候補領域を決定する。具体的には、画像解析部４２５は、表３に示す文字列領域のうち、表２の類似帳票情報において「選択情報」に番号が格納されている文字列領域と最も重なる文字列領域を特定し、復元候補領域と決定する。ここでは、表３に示す番号「１」、「８」、「７」の文字列領域が、それぞれ類似帳票の選択情報「１」、「２」、「３」を有する文字列領域と最も重なる領域（すなわち、復元候補領域）であると特定される。

【0089】

ステップＳ６０４では、画像解析部４２５は、復元候補領域である各文字列領域の分割処理を行う。図７は、ステップＳ６０４における文字列領域分割処理の詳細を示すフローチャートである。

【0090】

ステップＳ７０１では、画像解析部４２５は、ステップＳ６０３で決定した復元候補領域が、類似帳票で選択されなかった文字列領域、すなわち、表２の類似帳票情報において「選択情報」に番号が格納されていない文字列領域と重なるかどうか判定する。以下では、類似帳票で選択されなかった文字列領域を、非選択文字列領域（または、非選択の文字列領域）ともいう。具体的には、画像解析部４２５は、表３に示す番号「１」、「８」、「７」の文字列領域（すなわち、復元候補領域）が、表２に示す類似帳票の番号「２」乃至「６」および「９」の文字列領域（すなわち、非選択文字列領域）と重なるかどうかを判定する。表２と表３の例では、復元候補領域と非選択文字列領域は重ならないため、続くステップＳ７０２ではＮｏと判定され、文字列領域分割処理を終了し、図６のステップＳ６０５へ進む。すなわち、復元候補領域と、類似帳票の非選択文字列領域とが重ならない場合、文字列領域（復元候補領域）の分割処理は行われない。図７に記載のその他の処理（すなわち、ステップＳ７０３、Ｓ７０４の処理）については、実施３回目の例で説明する。

【0091】

ステップＳ６０５では、画像解析部４２５は、選択文字列領域の復元に必要な復元情報を生成する。具体的には、ステップＳ６０３で取得した復元候補領域の文字認識を行う。実施１回目では、ステップＳ３０６において、画像解析部４２５は、表１に示すような文字列領域ごとの座標と大きさ（すなわち、文字列領域情報）を、アプリケーション転送部４２４に渡していた。一方、実施２回目では、画像解析部４２５は、文字列領域情報に選択情報と文字認識結果（「領域内文字列」）を加えた表４に示す復元情報を、画像解析データとしてアプリケーション転送部４２４に渡す。

【0092】

【表4】

【0093】

ステップＳ３０７では、プレビュー表示部４２６が、アプリケーション転送部４２４から取得したスキャン画像データ及び文字列領域情報（ここでは、復元情報）を用いて、操作部２２０の液晶表示部にプレビュー画面を表示する。すなわち、実施２回目では、プレビュー表示部４２６は、復元候補領域の復元情報に基づいて、以前にユーザによって選択された文字列領域が選択された状態で、プレビュー画面を表示する。

【0094】

図１１は、実施２回目のステップＳ３０７において表示されるプレビュー画面１１００の一例を示す。プレビュー画面１１００は、図８のプレビュー画面８００と同様に、ファイル名表示領域１１０１、フォーマット等設定ボタン１１０２、プレビュー表示領域１１１０、［戻る］ボタン１１３０、及び［次へ］ボタン１１３１を有する。また、プレビュー表示領域１１１０は、［画面上部スクロール］ボタン１１１１、［画面下部スクロール］ボタン１１１２、［画面拡大］ボタン１１１３、及び［画面縮小］ボタン１１１４を有する。これらのボタンは、図８のプレビュー画面８００と同様であるため、説明は省略する。また、プレビュー表示領域１１１０は、スキャン画像の文字列領域１１１５乃至１１２３を表示する。

【0095】

ステップＳ３０８では、プレビュー表示部４２６は、図９を参照して上述したファイル名生成処理を行う。プレビュー表示部４２６は、表４に示したように、実施２回目では、画像解析部４２５から文字列領域の選択情報と文字認識結果を取得している。プレビュー表示部４２６は、ユーザの操作を受け付ける前に、選択情報「１」、「２」、「３」に対応する文字列領域が、番号順に選択されたものとして、ステップＳ９０１乃至Ｓ９０８の処理を行い、スキャン画像データのファイル名を生成する。実施２回目では、ユーザが操作を行う前から、図１１に示したように、ファイル名の生成に使用にする文字列領域１１１５、１１１６、及び１１１７が予め選択状態となっている。また、選択状態となった文字列領域１１１５、１１１６、及び１１１７に含まれる文字列が、今回のスキャン画像データのファイル名としてファイル名表示領域１１０１に表示されている。これにより、ユーザによる文字列領域選択の手間を省きつつ、今回のスキャン画像データに適切なファイル名を設定することができる。

【0096】

なお、実施２回目では、実施１回目の帳票に類似する帳票が処理対象となるため、ステップＳ３０８の処理においてファイル名に使用する文字列領域に変更が無い場合は、ステップＳ３１８では文字列領域情報等を帳票情報保持部４２８に保存しない。一方、ステップＳ３０８でファイル名に使用する文字列領域に変更があった場合は、帳票情報保持部４２８に保存している情報のうち、少なくとも選択情報を修正するようにしてもよい。

【0097】

＜実施３回目＞
次に、実施３回目について説明する。実施３回目では、実施１回目の原稿に類似する原稿がスキャンされるものとするが、実施２回目とは異なり、処理対象のスキャン画像データの復元候補領域が、過去のスキャン画像データの非選択文字列領域と重なる場合について説明する。また、実施３回目においても、図３のフローチャートを参照して上述した処理が実施される。以下では、実施１回目及び実施２回目と異なる処理を主に説明し、実施１回目及び実施２回目と同様の処理については説明を省略する。また、実施３回目のプレビュー画面は、図１２を参照して説明する。

【0098】

表５は、図３のステップＳ３０５における画像解析処理、すなわち、図５のステップＳ５０３において、画像解析部４２５がスキャン画像データから抽出した文字列領域情報の一例を示す。

【0099】

【表5】

【0100】

次に、図６のステップＳ６０１では、画像解析部４２５は、ステップＳ５０３で抽出した文字列領域情報と、帳票情報保持部４２８に保存された各帳票情報の文字列領域情報とを比較する。そして、画像解析部４２５は、各帳票情報の中から、文字列領域の重なりが多い帳票情報を類似帳票情報として判定する。ここでは、帳票情報保持部４２８には、表２に示す帳票情報が保存されているものとする。この場合、画像解析部４２５は、表２に示す帳票Ｎｏが「１」である帳票情報を類似帳票情報と判定する。類似帳票が存在すると判定されたため、ステップＳ６０２においてＹｅｓと判定され、ステップＳ６０３へ進む。

【0101】

ステップＳ６０３では、画像解析部４２５は、類似帳票情報に含まれる選択情報に基づいて、今回のスキャン画像データに含まれる文字列領域の中から復元候補領域を決定する。具体的には、画像解析部４２５は、表５に示す文字列領域のうち、表２の類似帳票情報において「選択情報」に番号が格納されている文字列領域と最も重なる文字列領域を特定し、復元候補領域と決定する。ここでは、表５に示す番号「１」、「８」、「７」の文字列領域が、それぞれ類似帳票の選択情報「１」、「２」、「３」を有する文字列領域と最も重なる領域（すなわち、復元候補領域）であると特定される。

【0102】

【0103】

ステップＳ７０１では、画像解析部４２５は、ステップＳ６０３で決定した復元候補領域が、類似帳票の非選択文字列領域と重なるか判定する。具体的には、画像解析部４２５は、表５に示す番号「１」、「８」、「７」の文字列領域（すなわち、復元候補領域）が、表２に示す類似帳票の番号「２」乃至「６」および「９」の文字列領域（すなわち、非選択文字列領域）と重なるかどうか判定する。表２と表５の例では、表５の番号「８」の文字列領域と、類似帳票の番号「９」の文字列領域が重なる（文字列領域の重なりについては、図１２を参照して後述する）。したがって、ステップＳ７０２では、画像解析部４２５はＹｅｓと判定し、ステップＳ７０３に進む。

【0104】

ステップＳ７０３では、画像解析部４２５は、ステップＳ７０１の処理により、非選択文字列領域を含むと判定された番号「８」の文字列領域を分割するための座標（以下、分割座標ともいう）を決定する。画像解析部４２５は、表５の例では、番号「８」の文字列領域の右端（領域のＸ座標＋領域の幅）から、表２の類似帳票の番号「９」の文字列領域の幅分（すなわち、４５ピクセル）左に移動した座標を分割座標とする。すなわち、番号「８」の文字列領域において、以下の式（１）により分割座標（Ｘ座標）が決定される。
分割座標（２１４）＝領域のＸ座標（３５）＋幅（２２４）−差分（４５）・・・（１）

【0105】

なお、非選択文字列領域が復元候補領域の左側に含まれる場合は、復元候補領域の左端から非選択文字列領域の幅分右に移動した座標を分割座標としても良い。また、ステップＳ５０３で行う文字列領域の判定方法によっては、文字列領域に加えて、１文字ずつの領域を取得するようにしてもよい。その場合、類似帳票の幅の長さをそのまま用いるのではなく、文字と文字の中間点になるよう長さを伸縮させても良い。

【0106】

ステップＳ７０４では、画像解析部４２５は、ステップＳ７０３で決定した分割座標を用いて、復元候補領域である文字列領域を分割する。すなわち、画像解析部４２５は、表５の番号「８」の文字列領域を、Ｘ座標３５、Ｙ座標１６６、幅１７９（２２４−４５）、高さ３０の領域と、Ｘ座標２１４、Ｙ座標１６６、幅４５、高さ３０の２つの領域に分割する。画像解析部４２５は、分割を行った後、表５の番号「８」の文字列領域の幅を更新する。また、画像解析部４２５は、非選択文字列領域に対応する文字列領域を番号「９」として表５に追加し、図７の処理を終了する。

【0107】

図６に戻り、ステップＳ６０５では、画像解析部４２５は、選択文字列領域の復元に必要な復元情報を生成する。具体的には、画像解析部４２５は、ステップＳ７０４で分割した復元候補領域（すなわち、選択文字列領域）の文字認識を行う。実施３回目では、ステップＳ３０６において、画像解析部４２５は、分割処理を行った後の復元候補領域（すなわち、選択文字列領域）に対して文字認識を行う。画像解析部４２５は、選択情報と文字認識結果（「領域内文字列」）を加えた表６に示す復元情報を、画像解析データとしてアプリケーション転送部４２４に渡す。

【0108】

【表6】

【0109】

ステップＳ３０７では、プレビュー表示部４２６が、アプリケーション転送部４２４から取得したスキャン画像データ及び文字列領域情報（ここでは、復元情報）を用いて、操作部２２０の液晶表示部にプレビュー画面を表示する。すなわち、実施３回目では、プレビュー表示部４２６は、復元候補領域から非選択文字列領域を分割し、分割した復元候補領域が選択された状態で、プレビュー画面を表示する。

【0110】

図１２は、実施３回目のプレビュー画面１２００の一例を示す。プレビュー画面１２００は、図８のプレビュー画面８００と同様に、ファイル名表示領域１２０１、フォーマット等設定ボタン１２０２、プレビュー表示領域１２１０、［戻る］ボタン１２３０、及び［次へ］ボタン１２３１を有する。また、プレビュー表示領域１２１０は、［画面上部スクロール］ボタン１２１１、［画面下部スクロール］ボタン１２１２、［画面拡大］ボタン１２１３、及び［画面縮小］ボタン１２１４を有する。これらのボタンは、図８のプレビュー画面８００と同様であるため、説明は省略する。また、プレビュー表示領域１２１０は、スキャン画像の文字列領域１２１５乃至１２２６、および重複領域１２５０を表示する。

【0111】

図１２（ａ）は、仮にステップＳ７０３、及びＳ７０４の領域分割処理を行わなかった場合に、プレビュー表示部４２６が操作部２２０の液晶表示部に表示するプレビュー画面１２００を示す。重複領域１２５０は、表５の番号「８」の文字列領域１２１６において、類似帳票の番号「９」の文字列領域が重なる領域を示している。

【0112】

図１２（ｂ）は、復元候補領域から非選択文字列領域を分割した後のプレビュー画面１２００を示す。図１２（ｂ）では、図１２（ａ）の文字列領域１２１６が、２つの文字列領域１２２５、１２２６に分割されている。文字列領域１２２５は、選択文字列領域として処理され、選択状態で表示される。また、文字列領域１２２６は、非選択文字列領域として処理され、非選択状態で表示される。

【0113】

ステップＳ３０８では、プレビュー表示部４２６は、図９を参照して上述したファイル名生成処理を行う。プレビュー表示部４２６は、表６に示したように、実施３回目では、画像解析部４２５から分割処理後の文字列領域の選択情報と文字認識結果を取得している。プレビュー表示部４２６は、ユーザ操作を受け付ける前に、選択情報「１」、「２」、「３」に対応する文字列領域が、番号順に選択されたものとして、ステップＳ９０１乃至Ｓ９０８の処理を行い、スキャン画像データのファイル名を生成する。実施３回目では、ユーザが操作を行う前から、図１２（ｂ）に示したように、ファイル名の生成に使用する文字列領域１２１５、１２２５、及び１２１７が予め選択状態となる。また、選択状態となった文字列領域１２１５、１２２５、及び１２１７に含まれる文字列が、今回のスキャン画像データのファイル名としてファイル名表示領域１２０１に表示される。一方、復元候補領域から分割された非選択文字列領域に対応する文字列領域１２２６は、非選択状態となる。すなわち、文字列領域１２２６は、最初にプレビュー画面が表示される段階では、ファイル名として使用されない。これにより、ユーザによる選択の手間を省きつつ、適切なファイル名を設定することができる。

【0114】

上述したように、本実施形態では、実施１回目で保存された帳票情報の文字列領域情報を用いて、実施３回目のように隣接する２つの文字列領域が１つの文字列領域として判定された場合に当該文字列領域を分割して、適切なファイル名を設定することができる。しかし、帳票情報保持部４２８に類似帳票情報が保存されていない状態で、実施３回目のような隣接する２つの文字列領域が１つの文字列領域と判定される場合がある。その場合、ユーザは、当該文字列領域を選択した後、不要な文字列を削除する。このように、文字列領域を選択した後、文字列の削除を行った場合は、ステップＳ３１８の処理において、画像解析部４２５は、削除した文字列の領域を特定し、選択した文字列領域と削除した文字列の領域を分割して、保存するようにしてもよい。すなわち、実施３回目と同様の文書をスキャンし、図１２（ａ）に示したプレビュー画面１２００が表示された場合、文字列領域１２１５、１２１６、１２１７を選択すると、ファイル名は“見積書＿東京特許株式会社御中＿２０１７１０１５”と設定される。その後、ユーザが、“御中”という文字列を削除したとする。その場合は、文字列領域１２１６を、“東京特許株式会社”という文字列を含む領域と、“御中”という文字列を含む領域に分割して、表６に示すような文字領域情報を帳票情報保持部４２８に保存してもよい。

【0115】

なお、本実施形態では、画像処理を行って抽出した文字列を、スキャン画像データのファイル名として使用したが、その他の目的で使用してもよい。例えば、抽出した文字列に対応する電話番号を特定して、スキャン画像データをその電話番号を使用してファクス送信してもよい。また、抽出した文字列に対応するメールアドレスを特定して、スキャン画像データをそのメールアドレスを使用してメール送信してもよい。

【0116】

＜第２の実施形態＞
次に、本発明の第２の実施形態について説明する。上述した第１の実施形態との差異は、文字列領域分割処理（図６のステップＳ６０４）、およびプレビュー画面である。文字列領域分割処理の詳細は、図１３のフローチャートを参照して説明する。また、本実施形態におけるプレビュー画面は、図１４を参照して説明する。その他の構成について、第１の実施形態と同様であるものは説明を省略する。なお、本実施形態では、表２に示した文字列領域情報が、帳票情報保持部４２８に保存されているものとする。

【0117】

表７は、図２のステップＳ３０５における画像解析処理、すなわち、図５のステップＳ５０３において、画像解析部４２５がスキャン画像データから抽出した文字列領域情報の一例を示す。

【0118】

【表7】

【0119】

次に、図６のステップＳ６０１では、画像解析部４２５は、ステップＳ５０３で抽出した文字列領域情報と、帳票情報保持部４２８に保存された各帳票情報の文字列領域情報とを比較する。そして、画像解析部４２５は、各帳票情報の中から、文字列領域の重なりが多い帳票情報を類似帳票情報として判定する。ここでは、画像解析部４２５は、表２に示す帳票Ｎｏ．が「１」である帳票情報を類似帳票情報と判定する。類似帳票が存在すると判定されたため、ステップＳ６０２においてＹｅｓと判定され、ステップＳ６０３へ進む。

【0120】

ステップＳ６０３では、画像解析部４２５は、類似帳票情報に含まれる選択情報に基づいて、今回のスキャン画像データに含まれる文字列領域の中から復元候補領域を決定する。具体的には、画像解析部４２５は、表７に示す文字列領域のうち、表２の類似帳票情報において「選択情報」に番号が格納されている文字列領域と最も重なる文字列領域を特定し、復元候補領域と決定する。ここでは、表７に示す番号「１」、「８」、「７」の文字列領域が、それぞれ類似帳票の選択情報「１」、「２」、「３」を有する文字列領域と最も重なる領域（すなわち、復元候補領域）であると特定される。

【0121】

ステップＳ６０４では、画像解析部４２５は、復元候補領域である各文字列領域の分割処理を行う。図１３は、本実施形態におけるステップＳ６０４の文字列領域分割処理の詳細を示すフローチャートである。

【0122】

ステップＳ１３０１では、画像解析部４２５は、ステップＳ６０３で決定した復元候補領域が、類似帳票の非選択文字列領域と重なるか判定する。具体的には、画像解析部４２５は、表７に示す番号「１」、「８」、「７」の復元候補領域が、類似帳票の番号「２」乃至「６」および「９」の非選択文字列領域と重なるかどうか判定する。表２と表７の例では、復元候補領域と非選択文字列領域は重ならないため、続くステップＳ１３０２ではＮｏと判定され、ステップＳ１３１０に進む。なお、本実施形態における復元候補領域と非選択文字列領域との関係は、図１４を参照して後述する。

【0123】

ステップＳ１３１０では、画像解析部４２５は、復元候補領域の周辺領域に存在する文字列領域の個数と、類似帳票情報において当該周辺領域に存在する文字列領域の個数を比較する。周辺領域とは、例えば、文字列領域の左右一定幅の領域を指す。表２と表７の文字列領域情報を比較すると、表７に示す番号「８」の復元候補領域の周辺領域に含まれる文字列領域の個数は１つであるのに対し、当該周辺領域に含まれる表２の類似帳票の文字列領域の個数は２個（番号「８」と「９」の文字列領域）である。すなわち、復元候補領域の周辺領域に存在する文字列領域の個数は減少している。したがって、続くステップＳ１３１１では、Ｙｅｓと判定され、ステップＳ１３０３へ進む。なお、文字列領域の個数が変化しない場合は、文字列領域を分割せずに処理を終了し、図６のステップＳ６０５に進む。このように、本実施形態では、復元候補領域の周辺領域に含まれる文字列領域の個数に基づいて、当該周辺領域に過去のスキャン画像データの非選択文字列領域が含まれているかどうか判定する。

【0124】

ステップＳ１３０３では、画像解析部４２５は、ステップＳ１３１１で文字列領域の個数が減少したと判定された番号「８」の文字列領域（すなわち、復元候補領域）を分割するための座標を決定する。画像解析部４２５は、表７の例では、番号「８」の文字列領域の右端から、類似帳票の番号「９」の文字列領域の幅分（すなわち、４５ピクセル）左に移動した座標を分割座標とする。なお、番号「９」の文字列領域は、「選択情報」に番号が格納されていない文字列領域である。

【0125】

ステップＳ１３０４では、画像解析部４２５は、ステップＳ１３０３で決定した分割座標を用いて、復元候補領域である文字列領域を分割する。すなわち、画像解析部４２５は、表７の番号「８」の文字列領域を、Ｘ座標３４、Ｙ座標１６６、幅３０（７５−４５）、高さ３０の領域と、Ｘ座標６４（３４＋３０）、Ｙ座標１６６、幅４５、高さ３０の２つの領域に分割する。画像解析部４２５は、分割を行った後、表７の番号「８」の文字列領域の幅を更新し、分割された新たな文字列領域を番号「９」として表７に追加する。

【0126】

図６に戻り、ステップＳ６０５では、画像解析部４２５は、選択文字列領域の復元に必要な復元情報を生成する。本実施形態では、ステップＳ３０６において、画像解析部４２５は、ステップＳ１３０４の分割処理後の文字列領域に対して文字認識を行い、選択情報と文字認識結果を加えた表８に示す復元情報を、画像解析データとしてアプリケーション転送部４２４に渡す。

【0127】

【表8】

【0128】

ステップＳ３０７では、プレビュー表示部４２６が、アプリケーション転送部４２４から取得したスキャン画像データ及び文字列領域情報（ここでは、復元情報）を用いて、操作部２２０の液晶表示部にプレビュー画面を表示する。すなわち、本実施形態では、プレビュー表示部４２６は、復元候補領域から非選択文字列領域を分割し、分割した復元候補領域が選択された状態で、プレビュー画面を表示する。

【0129】

図１４は、本実施形態のプレビュー画面１４００の一例を示す。プレビュー画面１４００は、図８のプレビュー画面８００と同様に、ファイル名表示領域１４０１、フォーマット等設定ボタン１４０２、プレビュー表示領域１４１０、［戻る］ボタン１４３０、及び［次へ］ボタン１４３１を有する。また、プレビュー表示領域１４１０は、［画面上部スクロール］ボタン１４１１、［画面下部スクロール］ボタン１４１２、［画面拡大］ボタン１４１３、及び［画面縮小］ボタン１４１４を有する。これらのボタンは、図８のプレビュー画面８００と同様であるため、説明は省略する。また、プレビュー表示領域１４１０は、スキャン画像の文字列領域１４１５乃至１４２３、１４６０、１４６１を表示する。さらに、図１４（ａ）には、文字列領域１４１５乃至１４１７のそれぞれの周辺領域１４５１乃至１４５３と、類似帳票に存在する文字列領域１４５０を示している。

【0130】

図１４（ａ）は、仮にステップＳ１３０３、Ｓ１３０４の領域分割処理を行わなかった場合に、プレビュー表示部４２６が操作部２２０の液晶表示部に表示するプレビュー画面１４００を示す。図１４（ａ）では、「（株）雅」という文字列と「御中」という文字列を含む文字列領域１４１６が選択状態となっており、「（株）雅御中」という文字列がファイル名表示領域１４０１に設定されたファイル名に適用されている。なお、文字列領域１４１６は、類似帳票の非選択文字列領域と重ならないため、上述した第１の実施形態の処理方法では、分割対象の文字列領域とはならない。

【0131】

図１４（ｂ）は、復元候補領域から非選択文字列領域を分割した後のプレビュー画面１４００を示す。図１４（ｂ）では、文字列領域１４１６が、２つの文字列領域１４６０、１４６１に分割されている。文字列領域１４６０は、選択文字列領域として処理され、選択状態で表示される。また、文字列領域１４６１は、非選択文字列領域として処理され、非選択状態で表示される。すなわち、文字列領域１４１６は、周辺領域に非選択文字列領域に対応する文字列領域を含むため、分割される。

【0132】

ステップＳ３０８では、プレビュー表示部４２６は、図９を参照して上述したファイル名生成処理を行う。本実施形態では、プレビュー表示部４２６は、表８に示したように、画像解析部４２５から分割処理後の文字列領域の選択情報と文字認識結果を取得している。プレビュー表示部４２６は、ユーザ操作を受け付ける前に、選択情報「１」、「２」、「３」に対応する文字列領域が、番号順に選択されたものとして、ステップＳ９０１乃至Ｓ９０８の処理を行い、スキャン画像データのファイル名を生成する。本実施形態では、ユーザが操作を行う前から、図１４（ｂ）に示したように、ファイル名の生成に使用する文字列領域１４１５、１４６０、及び１４１７が予め選択状態となる。また、選択状態となった文字列領域１４１５、１４６０、及び１４１７に含まれる文字列が、今回のスキャン画像データのファイル名としてファイル名表示領域１４０１に表示される。一方、復元候補領域から分割された非選択文字列領域に対応する文字列領域１４６１は、非選択状態となる。すなわち、文字列領域１４６１は、最初にプレビュー画面が表示される段階では、ファイル名として使用されない。これにより、ユーザによる選択の手間を省きつつ、適切なファイル名を設定することができる。

【0133】

＜その他の実施形態＞
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

【図1】