特開2022-189109 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特開2022-189109画像処理装置、画像処理方法およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022189109

(43)【公開日】2022-12-22

(54)【発明の名称】画像処理装置、画像処理方法およびプログラム

(51)【国際特許分類】

G06F 40/131 20200101AFI20221215BHJP

H04N 1/00 20060101ALI20221215BHJP

G06V 30/413 20220101ALI20221215BHJP

G06V 30/412 20220101ALI20221215BHJP

【ＦＩ】

G06F40/131

H04N1/00 567L

G06K9/20 340L

G06K9/20 340C

【審査請求】未請求

【請求項の数】14

【出願形態】ＯＬ

(21)【出願番号】P 2021097497

(22)【出願日】2021-06-10

(71)【出願人】

【識別番号】000001007

【氏名又は名称】キヤノン株式会社

(74)【代理人】

【識別番号】110001243

【氏名又は名称】弁理士法人谷・阿部特許事務所

(72)【発明者】

【氏名】中村峻

【テーマコード（参考）】

5B029

5B109

5C062

【Ｆターム（参考）】

5B029AA01

5B029BB02

5B029CC26

5B029CC27

5B029CC28

5B029CC29

5B109NA03

5B109NC02

5B109NE01

5C062AA05

5C062AB02

5C062AB20

5C062AB23

5C062AB40

5C062AB42

5C062AC02

5C062AC05

5C062AC22

5C062AC58

5C062AF07

5C062AF13

(57)【要約】

【課題】処理コストを抑えながらも、複数の文書を連続でスキャンして得られたスキャン画像における文書単位の区切りを判別する。
【解決手段】複数の文書をページ単位で連続してスキャンして得られたスキャン画像についてページ単位でレイアウトを解析し、解析結果に基づき、スキャン画像の各ページについて、当該スキャン画像の１ページ目との類似度を算出する。算出した類似度に基づき、スキャン画像から、前記複数の文書の各文書における先頭ページ候補を抽出し、抽出した先頭ページ候補に対して文字認識を行う。文字認識結果に基づき、各文書の区切りを判定する。
【選択図】図１０

【特許請求の範囲】

【請求項1】

複数の文書をページ単位で連続してスキャンして得られたスキャン画像についてページ単位でレイアウトを解析する解析手段と、
前記解析手段による解析結果に基づき、前記スキャン画像の各ページについて、当該スキャン画像の１ページ目との類似度を算出する算出手段と、
前記算出手段により算出した類似度に基づき、前記スキャン画像から、前記複数の文書の各文書における先頭ページ候補を抽出する抽出手段と、
前記抽出手段により抽出した前記先頭ページ候補に対して文字認識を行う文字認識手段と、
前記文字認識手段による文字認識結果に基づき、前記各文書の区切りを判定する判定手段と、
を有する、ことを特徴とする画像処理装置。

【請求項2】

前記判定手段は、前記各文書の区切りとして、前記各文書の先頭ページを判定する
ことを特徴とする請求項１に記載の画像処理装置。

【請求項3】

前記抽出手段は、前記各文書の先頭ページ候補として、前記類似度が所定の閾値を超えるページと、前記スキャン画像における１ページ目とを抽出する
ことを特徴とする請求項２に記載の画像処理装置。

【請求項4】

前記判定手段が実行した過去の判定結果に基づき確定した前記先頭ページを示す履歴情報を登録する登録手段をさらに有し、
前記判定手段は、前記文字認識手段による文字認識結果と前記登録手段により登録された前記履歴情報とに基づき、前記各文書の先頭ページを判定する
ことを特徴とする請求項２または３に記載の画像処理装置。

【請求項5】

前記抽出手段により抽出した前記各文書における先頭ページ候補と、前記確定した前記先頭ページとの間の不適合率を算出する第二の算出手段を有し、
前記判定手段は、前記第二の算出手段により算出された不適合率が所定の値より小さい場合には、前記文字認識手段による文字認識を行わせず、前記先頭ページ候補を前記先頭ページとして判定する
ことを特徴とする請求項４に記載の画像処理装置。

【請求項6】

前記不適合率は、前記先頭ページ候補と、前記先頭ページとから得られる排他的論理和を、前記先頭ページ候補の総数で除した値である
ことを特徴とする請求項５に記載の画像処理装置。

【請求項7】

前記履歴情報は、さらに、前記判定手段による先頭ページの判定に用いられた文字列の文字領域を示す領域情報を含み、
前記文字認識手段は、前記領域情報に基づき、前記先頭ページの判定に用いられた文字列の文字領域に対してのみ文字認識を行う
ことを特徴とする請求項４から６の何れか一項に記載の画像処理装置。

【請求項8】

前記判定手段により判定した各文書の先頭ページに応じて前記スキャン画像を文書単位の区切りで分割する分割手段を有する
ことを特徴とする請求項１から７の何れか一項に記載の画像処理装置。

【請求項9】

前記分割手段により前記スキャン画像を前記文書単位の区切りで分割したファイルを管理する管理手段を有する、ことを特徴とする請求項８に記載の画像処理装置。

【請求項10】

前記判定手段による判定結果を含む画面を表示する表示手段をさらに有する
ことを特徴とする請求項８または９に記載の画像処理装置。

【請求項11】

前記判定手段による判定結果を含む画面では、前記文書単位の区切り位置がユーザ操作によって調整可能となっている
ことを特徴とする請求項１０に記載の画像処理装置。

【請求項12】

前記表示手段は、前記スキャン画像を前記文書単位の区切りで分割したファイルに対してファイル名を設定する設定画面を表示する
ことを特徴とする請求項１０または１１に記載の画像処理装置。

【請求項13】

複数の文書をページ単位で連続してスキャンして得られたスキャン画像についてページ単位でレイアウトを解析する解析ステップと、
前記解析ステップによる解析結果に基づき、前記スキャン画像の各ページについて、当該スキャン画像の１ページ目との類似度を算出する算出ステップと、
前記算出ステップにて算出した類似度に基づき、前記スキャン画像から、前記複数の文書の各文書における先頭ページ候補を抽出する抽出ステップと、
前記抽出ステップにて抽出した前記先頭ページ候補に対して文字認識を行う文字認識ステップと、
前記文字認識ステップによる文字認識結果に基づき、前記各文書の区切りを判定する判定ステップと、
を含む、ことを特徴とする画像処理方法。

【請求項14】

コンピュータを、請求項１から１２の何れか一項に記載の画像処理装置の各手段として機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、複数の文書を連続してスキャンして得られたスキャン画像における文書単位の区切りを判別する技術に関する。

【背景技術】

【0002】

文書の管理手法として、紙帳票などの文書をスキャナで読み取って得られたスキャン画像を所定フォーマットのファイルに変換し、ネットワーク上のストレージサーバに送信して保存する手法が広く利用されている。

【0003】

そのような手法が利用されるユースケースとして、複数の帳票等を連続スキャンして得られたスキャン画像を帳票単位の区切りで分割してファイル化し、ストレージサーバに保存することがある。このように文書単位でファイル化する際には、複数の帳票等を連続スキャンして得られたスキャン画像を文書単位で分離する必要がある。この点、特許文献１は、複数の文書を読み込んで得られた文書画像に対して文字認識処理および解析処理を行い、この処理結果を用いて文書区切り情報を抽出する技術を開示している。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２００２－３１２３８５号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

上記特許文献１の技術では、文書画像の全ページに対して文字認識処理および解析処理を行う必要があるため、多大な処理コストを要した。

【0006】

本開示は、上記の問題に鑑みてなされたものであり、処理コストを抑えながらも、複数の文書を連続でスキャンして得られたスキャン画像における文書単位の区切りを判別する技術を提供することを目的とする。

【課題を解決するための手段】

【0007】

本開示の一態様に係る画像処理装置は、複数の文書をページ単位で連続してスキャンして得られたスキャン画像についてページ単位でレイアウトを解析する解析手段と、前記解析手段による解析結果に基づき、前記スキャン画像の各ページについて、当該スキャン画像の１ページ目との類似度を算出する算出手段と、前記算出手段により算出した類似度に基づき、前記スキャン画像から、前記複数の文書の各文書における先頭ページ候補を抽出する抽出手段と、前記抽出手段により抽出した前記先頭ページ候補に対して文字認識を行う文字認識手段と、前記文字認識手段による文字認識結果に基づき、前記各文書の区切りを判定する判定手段と、を有することを特徴とする。

【発明の効果】

【0008】

本開示によれば、処理コストを抑えながらも、複数の文書を連続でスキャンして得られたスキャン画像における文書単位の区切りを判別することができる。

【図面の簡単な説明】

【0009】

【図1】画像処理システムの全体構成を示す図である。

【図2】ＭＦＰのハードウェア構成例を示す図である。

【図3】クライアントＰＣ、ＭＦＰ連携サーバ及びストレージサーバのハードウェア構成例を示す図である。

【図4】画像処理システムのソフトウェア構成例を示す図である。

【図5】画像処理システム全体の処理の流れを示すシーケンス図である。

【図6】スキャン画像群例を示す図である。

【図7】分割ページ確定画面例およびファイル名設定画面例を示す図である。

【図8】画像解析処理の流れを示すフローチャートである。

【図9】文書先頭ページ候補抽出処理の詳細な流れを示すフローチャートである。

【図10】文書先頭ページ判定処理の詳細な流れを示すフローチャートである。

【図11】ＯＣＲ結果による文書先頭ページ判定処理の詳細な流れを示すフローチャートである。

【図12】画像処理システム全体の処理の流れを示すシーケンス図である。

【図13】分割ページ確定画面例を示す図である。

【図14】文書先頭ページ判定処理の詳細な流れを示すフローチャートである。

【図15】履歴によるＯＣＲ要否判定処理の詳細な流れを示すフローチャートである。

【図16】ＯＣＲ結果による文書先頭ページ判定処理の詳細な流れを示すフローチャートである。

【図17】文書先頭ページ判定処理の詳細な流れを示すフローチャートである。

【発明を実施するための形態】

【0010】

以下、本開示の技術を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る本開示の技術を限定するものでなく、また以下の実施の形態で説明されている特徴の組み合わせの全てが本開示の技術の解決手段に必須のものとは限らない。

【0011】

［第一の実施形態］
＜画像処理システムの概要＞
図１は、本実施形態に係る画像処理システムの全体構成を示す図である。画像処理システム１００は、ＭＦＰ（Ｍｕｌｔｉ－ＦｕｎｃｔｉｏｎＰｅｒｉｐｈｅｒａｌ）１１０、クライアントＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）１１１、ＭＦＰ連携サーバ１２０およびストレージサーバ１３０を含む。ＭＦＰ１１０及びクライアントＰＣ１１１は、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）経由でインターネット上の各種サービスを提供するサーバに対して通信可能に接続されている。

【0012】

ＭＦＰ１１０は、スキャン機能を有する画像処理装置の一例である。ＭＦＰ１１０は、スキャン機能に加え印刷機能やＢＯＸ保存機能といった複数の機能を有する複合機である。クライアントＰＣ１１１はＭＦＰ連携サーバ１２０に対して依頼したサービスの提供を受けるアプリケーションがインストールされたコンピュータの一例である。サーバ装置１２０および１３０は、共にクラウドサービスを提供する画像処置装置の一例である。本実施形態のサーバ装置１２０は、ＭＦＰ１１０から受け取ったスキャン画像に対し画像解析を行い自サーバ上に保存したり、別のサービスを提供するサーバ装置１３０に対しＭＦＰ１１０からのリクエストを転送したりするサービスを提供する。以下、サーバ装置１２０が提供するクラウドサービスを「ＭＦＰ連携サービス」と呼ぶこととする。サーバ装置１３０は、インターネットを介して送られてきたファイルを保存したり、モバイル端末（不図示）などのウェブブラウザからの要求に応じて保存ファイルを提供したりするクラウドサービス（以下、「ストレージサービス」と呼ぶ）を提供する。本実施形態では、ＭＦＰ連携サービスを提供するサーバ装置１２０を「ＭＦＰ連携サーバ」と呼び、ストレージサービスを提供するサーバ装置１３０を「ストレージサーバ」と呼ぶこととする。

【0013】

本実施形態の画像処理システム１００は、ＭＦＰ１１０、クライアントＰＣ１１１、ＭＦＰ連携サーバ１２０およびストレージサーバ１３０からなる構成としているがこれに限定されない。例えば、クライアントＰＣ１１１やＭＦＰ連携サーバ１２０の機能をＭＦＰ１１０が兼ね備えてもよい。また、ＭＦＰ連携サーバ１２０はインターネット上ではなくＬＡＮ経由でＭＦＰ１１０やクライアントＰＣ１１１と接続されていてもよい。また、ストレージサーバ１３０を、メール配信サービスを行うメールサーバに置き換えて、文書のスキャン画像をメールに添付し送信する場面に適用してもよい。

【0014】

＜ＭＦＰのハードウェア構成＞
図２は、ＭＦＰ１１０のハードウェア構成例を示す図である。ＭＦＰ１１０は、制御部２１０、操作部２２０、プリンタ２２１、スキャナ２２２、モデム２２３を有する。制御部２１０は、以下の各部２１１－２１９を有し、ＭＦＰ１１０全体の動作を制御する。ＣＰＵ２１１は、中央処理装置であり、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）２１２に記憶された制御プログラム（後述のソフトウェア構成図で示す各種機能に対応するプログラム）を読み出して実行する。ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）２１３は、ＣＰＵ２１１の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施形態では１つのＣＰＵ２１１が１つのメモリ（ＲＡＭ２１３またはＨＤＤ２１４）を用いて後述のフローチャートに示す各処理を実行するものとするが、これに限定されない。例えば、複数のＣＰＵや複数のＲＡＭまたはＨＤＤを協働させて各処理を実行してもよい。ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）２１４は、画像データや各種プログラムを記憶する大容量記憶部である。操作部Ｉ／Ｆ２１５は、操作部２２０と制御部２１０とを接続するインタフェースである。操作部２２０には、表示部として機能するタッチパネルやキーボードなどが備えられており、ユーザによる操作／入力／指示を受け付ける。なお、タッチパネルへのタッチ操作には、人の指による操作やタッチペンによる操作が含まれる。プリンタＩ／Ｆ２１６は、プリンタ２２１と制御部２１０とを接続するインタフェースである。印刷用の画像データはプリンタＩ／Ｆ２１６を介して制御部２１０からプリンタ２２１へ転送され、紙等の記録媒体上に印刷される。スキャナＩ／Ｆ２１７は、スキャナ２２２と制御部２１０とを接続するインタフェースである。スキャナ２２２は、不図示の原稿台やＡＤＦ（ＡｕｔｏＤｏｃｕｍｅｎｔＦｅｅｄｅｒ）にセットされた原稿（文書）を光学的に読み取って画像データ（すなわち、スキャン画像データ）を生成し、スキャナＩ／Ｆ２１７を介して制御部２１０に入力する。ＭＦＰ１１０は、スキャナ２２２で生成された画像データをプリンタ２２１から印刷出力（コピー）する他、ファイル送信またはメール送信することができる。モデムＩ／Ｆ２１８は、モデム２２３と制御部２１０とを接続するインタフェースである。モデム２２３は、ＰＳＴＮ（ＰｕｂｌｉｃＳｗｉｔｃｈｅｄＴｅｌｅｐｈｏｎｅＮｅｔｗｏｒｋｓ）上のファクシミリ装置との間で画像データをファクシミリ通信する。ネットワークＩ／Ｆ２１９は、制御部２１０（ＭＦＰ１１０）をＬＡＮに接続するインタフェースである。ＭＦＰ１１０は、ネットワークＩ／Ｆ２１９を用いてインターネット上の各サービスに画像データや情報を送信したり、各種情報を受信したりする。

【0015】

＜クライアントＰＣ、サーバ装置のハードウェア構成＞
図３は、クライアントＰＣ１１１、ＭＦＰ連携サーバ１２０及びストレージサーバ１３０のハードウェア構成例を示す図である。クライアントＰＣ１１１、ＭＦＰ連携サーバ１２０及びストレージサーバ１３０は共通のハードウェア構成を有し、ＣＰＵ３１１、ＲＯＭ３１２、ＲＡＭ３１３、ＨＤＤ３１４及びネットワークＩ／Ｆ３１５で構成される。ＣＰＵ３１１は、ＲＯＭ３１２に記憶された制御プログラムを読み出して各種処理を実行することで、全体の動作を制御する。ＲＡＭ３１３は、ＣＰＵ３１１の主メモリ、ワークエリア等の一時記憶領域として用いられる。ＨＤＤ３１４は、画像データや各種プログラムを記憶する大容量記憶部である。ネットワークＩ／Ｆ３１５は、制御部３１０をインターネットに接続するインタフェースである。ＭＦＰ連携サーバ１２０及びストレージサーバ１３０は、ネットワークＩ／Ｆ３１５を介して他の装置（ＭＦＰ１１０等）から様々な処理のリスエストを受け、当該クリエストに応じた処理結果を返す。

【0016】

＜画像処理システムのソフトウェア構成＞
図４は、本実施形態に係る画像処理システム１００のソフトウェア構成例を示すブロック図であり、図４（ａ）に画像処理システム１００の全体を示し、図４（ｂ）にＭＦＰ連携サーバ１２０の画像処理部４３２の詳細を示す。以下、画像処理システム１００を構成するＭＦＰ１１０、ＭＦＰ連携サーバ１２０及びストレージサーバ１３０それぞれの役割に対応したソフトウェア構成を順に説明する。なお、以下では各装置が有する諸機能のうち、文書をスキャンして電子化（ファイル化）し、ストレージサーバ１３０に保存を行うまでの処理に関わる機能に絞って説明を行うものとする。

【0017】

＜ＭＦＰのソフトウェア構成＞
ＭＦＰ１１０の機能モジュールは、ネイティブ機能モジュール４１０とアディショナル機能モジュール４２０の２つに大別される。ネイティブ機能モジュール４１０はＭＦＰ１１０に標準的に備えられたアプリケーションであるのに対し、アディショナル機能モジュール４２０はＭＦＰ１１０に追加的にインストールされたアプリケーションである。アディショナル機能モジュール４２０は、Ｊａｖａ（登録商標）をベースとしたアプリケーションであり、ＭＦＰ１１０への機能追加を容易に実現できる。なお、ＭＦＰ１１０には図示しない他の追加アプリケーションがインストールされていてもよい。

【0018】

ネイティブ機能モジュール４１０は、スキャン実行部４１１およびスキャン画像管理部４１２を有する。アディショナル機能モジュール４２０は、表示制御部４２１、スキャン指示部４２２、連携サービスリクエスト部４２３、画像処理部４２４を有する。

【0019】

表示制御部４２１は、操作部２２０のタッチパネル機能を有する液晶表示部に、各種のユーザ操作を受け付けるユーザインターフェース画面（ＵＩ画面）を表示する。各種のユーザ操作には、例えば、ＭＦＰ連携サーバ１２０へのアクセスに用いられるログイン認証情報の入力、スキャン設定、スキャン開始指示、分割ページ確定指示、ファイル名の入力、ファイル名設定指示、ファイルの保存指示などがある。

【0020】

スキャン指示部４２２は、ＵＩ画面でなされたユーザ操作（例えば「スキャン開始」ボタンの押下）に応じて、スキャン設定の情報と共にスキャン実行部４１１に対しスキャン処理の実行を指示する。スキャン実行部４１１は、スキャン指示部４２２からのスキャン処理の実行指示に従い、スキャナＩ／Ｆ２１７を介してスキャナ２２２に文書の読み取り動作を実行させ、原稿台ガラスに置かれた原稿（紙文書）を読み取ることでスキャン画像データを生成する。生成したスキャン画像データは、スキャン画像管理部４１２によってＨＤＤ２１４に保存される。この際、保存されたスキャン画像データを一意に示すスキャン画像識別子の情報が、スキャン指示部４２２へ通知される。スキャン画像識別子は、ＭＦＰ１１０においてスキャンした画像をユニークに識別する番号や記号、アルファベットなどである。スキャン指示部４２２は、例えばファイル化する対象のスキャン画像データを上記のスキャン画像識別子を使ってスキャン画像管理部４１２から取得する。そして、ファイル化のために必要な処理のリクエストをＭＦＰ連携サーバ１２０に対して行うよう、連携サービスリクエスト部４２３に対して指示する。

【0021】

連携サービスリクエスト部４２３は、ＭＦＰ連携サーバ１２０に対して各種処理のリクエストを行ったり、そのレスポンスを受け取ったりする。各種処理には、例えば、ログイン認証、スキャン画像の解析、スキャン画像データの送信等が含まれる。ＭＦＰ連携サーバ１２０とのやり取りにはＲＥＳＴ（ＲｅｐｒｅｓｅｎｔａｔｉｏｎａｌＳｔａｔｅＴｒａｎｓｆｅｒ）やＳＯＡＰ（ＳｉｍｐｌｅＯｂｊｅｃｔＡｃｃｅｓｓＰｒｏｔｏｃｏｌ）等のプロトコルが使用される。ＭＦＰ連携サーバ１２０とのやり取りはこれに限定されず、その他の通信手段を用いてもよい。画像処理部４２４は、スキャン画像データに対して所定の処理を行って、表示制御部４２１が表示するＵＩ画面で用いられる画像を生成する。

【0022】

＜サーバ装置のソフトウェア構成＞
まず、ＭＦＰ連携サーバ１２０のソフトウェア構成について説明する。ＭＦＰ連携サーバ１２０は、リクエスト制御部４３１、画像処理部４３２、ストレージサーバアクセス部４３３、データ管理部４３４、表示制御部４３５を有する。リクエスト制御部４３１は、外部装置からのリクエストを受信できる状態で待機しており、受信したリクエスト内容に応じて、画像処理部４３２、ストレージサーバアクセス部４３３、データ管理部４３４に対し所定の処理を実行する。

【0023】

画像処理部４３２は、ＭＦＰ１１０から送られてくるスキャン画像に対して、文字領域の検出処理、文字認識処理、類似文書（帳票）の判定処理（図８から図１０を用いて後述する）といった解析処理、回転や傾き補正といった画像加工処理を行う。画像処理部４３２は、図４（ｂ）に示すように、画像補正部４５１、文字領域検出部４５２、ＯＣＲ（ＯＣＲ：ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ）処理部（文字認識部）４５３を有する。画像処理部４３２は、文書先頭ページ候補抽出部４６１、文書先頭ページ判定部４７１をさらに有する。文書先頭ページ候補抽出部４６１は、レイアウト解析部４６２、類似度算出部４６３を有する。文書先頭ページ判定部４７１は、不適合率算出部４７２、分割判定利用フラグ設定部４７３を有する。画像処理部４３２が有する各機能部の処理の詳細については、全体の処理の説明の中で随時行う。なお、各機能部は、他の機能部の一部の機能を担ってもよい。

【0024】

ストレージサーバアクセス部４３３は、ストレージサーバ１３０に対する処理のリクエストを行う。クラウドサービスでは、ＲＥＳＴやＳＯＡＰ等のプロトコルを用いてストレージサーバにファイルを保存したり、保存したファイルを取得したりする様々なインタフェースを公開している。ストレージサーバアクセス部４３３は、公開されたストレージサーバのインタフェースを使用して、ストレージサーバ１３０に対するリクエストを行う。データ管理部４３４は、ＭＦＰ連携サーバ１２０で管理するユーザ情報、画像解析結果、各種設定データ等を保持・管理する。

【0025】

表示制御部４３５は、インターネット経由で接続されたＰＣやモバイル端末（いずれも不図示）上で動作しているウェブブラウザからのリクエストを受けて、画面表示に必要な画面情報（ＨＴＭＬ、ＣＳＳ等）を返す。ユーザは、ウェブブラウザで表示される画面経由で、ＭＦＰ連携サーバ１２０に登録されているユーザ情報を確認したり、スキャン設定を変更したりできる。

【0026】

次に、ストレージサーバ１３０のソフトウェア構成について説明する。ストレージサーバ１３０は、リクエスト制御部４４１、ファイル管理部４４２、表示制御部４４３を有する。リクエスト制御部４４１は、外部装置からのリクエストを受信できる状態で待機しており、本実施形態においてはＭＦＰ連携サーバ１２０からのリクエストに応じて、受信したファイルの保存や保存ファイルの読み出しをファイル管理部４４２に指示する。そして、リクエストに応じたレスポンスをＭＦＰ連携サーバ１２０に返す。表示制御部４４３は、インターネット経由で接続されたＰＣやモバイル端末（不図示）上で動作しているウェブブラウザからのリクエストを受けて、画面表示に必要な画面構成情報（ＨＴＭＬ、ＣＳＳ等）を返す。ユーザは、ウェブブラウザで表示される画面経由で、ストレージサーバ１３０に登録されている保存ファイルを確認したり取得したりできる。

【0027】

なお、図４（ａ）を用いてＭＦＰ１１０がアディショナル機能モジュール４２０を有する構成例について説明したが、本実施形態はこの構成に限定されない。例えば、クライアントＰＣ１１１がアディショナル機能モジュール４２０の機能を含んでいても構わない。すなわち、ＭＦＰ１１０にて得たスキャン画像の解析リクエストや解析結果に基づく各文書における文書先頭ページの確定やファイル名の設定等を、クライアントＰＣ１１１で行うようなシステム構成でも構わない。

【0028】

クライアントＰＣ１１１にて各文書における文書先頭ページの確定やファイル名の設定等を行う場合、これら処理を行うためのプログラム（モジュール）は、クライアントＰＣ１１１に予めインストールしておく構成でもよい。ただし、これに限定されず、例えば、クライアントＰＣ１１１が備える汎用のウェブブラウザを利用して、文書先頭ページの確定等を行うためのウェブアプリケーションをＭＦＰ連携サーバ１２０から取得して実行する構成でもよい。

【0029】

＜画像処理システム全体の処理の流れ＞
図５は、ＭＦＰ１１０にて複数の文書をページ単位で連続してスキャンし、得られたスキャン画像をファイル化してストレージサーバ１３０に保存（送信）する際の、各装置間の処理の流れを示すシーケンス図である。ここでは、各装置間のやり取りを中心に説明する。なお、図５のシーケンス図ではＭＦＰ１１０がＭＦＰ連携サーバ１２０とやり取りを行う場合の説明となっているが、後述する解析結果取得、画面の表示等はＭＦＰ１１０でなくクライアントＰＣ１１１が実行する構成でも構わない。

【0030】

ＭＦＰ１１０は、通常の状態では提供する各機能を実施するためのボタンを並べたメイン画面をタッチパネル上に表示する。

【0031】

ＭＦＰ１１０にスキャン画像をストレージサーバ１３０に送信するための追加アプリケーション（以降、スキャンアプリと呼ぶ）をインストールすることで、アプリケーションの機能を使用するボタンがＭＦＰ１１０のメイン画面に表示される。メイン画面に表示されたボタンがユーザ操作によって押下されると、スキャン画像をストレージサーバ１３０に送信するための画面が表示され、図５のシーケンス図で示される一連の処理が開始する。以下、図５のシーケンス図に沿って、装置間のやり取りを時系列に説明する。なお、以下の説明において記号「Ｓ」はステップを表す。

【0032】

Ｓ５０１では、スキャンアプリが実行されることで、ＭＦＰ１１０は、ＭＦＰ連携サーバ１２０にアクセスするためのログイン認証の情報を入力するＵＩ画面（ログイン画面）を操作部２２０に表示する。

【0033】

Ｓ５０２では、ユーザが、予め登録されているユーザＩＤとパスワードを、ログイン画面上の入力欄にそれぞれ入力しログインボタンを押下すると、ログイン認証のリクエストがＭＦＰ連携サーバ１２０に送信される。

【0034】

Ｓ５０３では、ログイン認証のリクエストを受けたＭＦＰ連携サーバ１２０は、当該リクエストに含まれるユーザＩＤとパスワードを用いて認証処理を行う。認証処理の結果、正規のユーザであることが確認されれば、ＭＦＰ連携サーバ１２０は、アクセストークンをＭＦＰ１１０に返す。以降、ＭＦＰ１１０からＭＦＰ連携サーバ１２０に対して行う各種リクエストの際にこのアクセストークンを一緒に送ることで、ログイン中のユーザが特定される。本実施形態では、ＭＦＰ連携サーバ１２０へのログインの完了によって、ストレージサーバ１３０へのログインも同時に完了するものとする。このためにユーザは、インターネット上のＰＣ（不図示）のウェブブラウザ等を介して、ＭＦＰ連携サービスを利用するためのユーザＩＤとストレージサービスを利用するためのユーザＩＤとの紐づけを予め行っておく。これにより、ＭＦＰ連携サーバ１２０へのログイン認証に成功すれば同時にストレージサーバ１３０へのログイン認証も完了し、ストレージサーバ１３０にログインするための操作を省略できる。そして、ＭＦＰ連携サーバ１２０においては、自装置にログインしたユーザからのストレージサービスに関するリクエストにも対応可能となる。なお、ログイン認証の方法は一般的に公知な手法（Ｂａｓｉｃ認証、Ｄｉｇｅｓｔ認証、ＯＡｕｔｈを用いた認可等）を用いて行えばよい。

【0035】

ログインが完了すると、ＭＦＰ１１０は、スキャン設定用のＵＩ画面（以下、「スキャン設定画面」と表記）を操作部２２０に表示する（Ｓ５０４）。ユーザが、スキャン設定画面を介して、スキャン処理についての詳細な条件設定を行い、原稿台ガラスまたはＡＤＦにスキャン対象である複数の紙文書をセットし、「スキャン開始」ボタンを押下すると、スキャンが実行される（Ｓ５０５）。これにより、複数の紙文書を電子化したスキャン画像データ（スキャン画像）が生成される。スキャンの完了後、ＭＦＰ１１０は、スキャンによって得られたスキャン画像データを、その解析リクエストと共にＭＦＰ連携サーバ１２０に送信する（Ｓ５０６）。

【0036】

スキャン画像の解析リクエストを受けたＭＦＰ連携サーバ１２０では、リクエスト制御部４３１が画像処理部４３２に対し、画像解析処理の実行を指示する（Ｓ５０７）。その際、リクエスト制御部４３１は、受信した解析リクエストを一意に特定可能な識別子であるリクエストＩＤ（”processId”）をＭＦＰ１１０に返す。一方、解析処理の実行指示を受けた画像処理部４３２は、スキャン画像データに対する解析処理を実行する（Ｓ５０８）。

【0037】

画像解析処理では、まず、Ｓ５０６にてＭＦＰ１１０より受信したスキャン画像データに対して、Ｓ５０８にて各文書の文書先頭ページ候補を抽出し、抽出した文書先頭ページ候補に対して詳細な解析を行う。そして、解析結果を基づき、各文書の区切り位置を判定するための各文書の文書先頭ページを確定する。Ｓ５０８の解析処理の詳細については、図８から図１０を用いて後述する。なお、スキャン画像は、スキャン画像群ともいう。

【0038】

上記画像解析処理が行われている間、ＭＦＰ１１０は、上述のリクエストＩＤを使用して、ＭＦＰ連携サーバ１２０に対して定期的（例えば数百ミリ秒から数ミリ秒程度毎等）に処理状況の問い合わせを行う（Ｓ５０９～Ｓ５０９’）。この問い合わせは、ＭＦＰ連携サーバ１２０からの解析処理の完了レスポンス（Ｓ５１０）が取得できるまで繰り返し実行される。ＭＦＰ連携サーバ１２０は、処理状況の問い合わせを受けると、リクエストＩＤに対応する画像解析処理の進行状況を確認し、完了していない場合は処理中を表すレスポンスを返す。また、完了していた場合は完了を表すレスポンスを返す。このレスポンスの”status”には現在の処理状況を示す文字列、具体的には、ＭＦＰ連携サーバ１２０で処理が行われている最中である場合には”processing”が入り、処理が完了している場合には”completed”が入る。なお、処理が失敗した場合の”failed”など、他のステータスの文字列が入ることもある。また、処理完了時（statusがcompletedの場合）のレスポンスには、ステータス情報に加え、スキャン画像を解析した解析結果情報、スキャン設定情報等が含まれる。

【0039】

処理完了レスポンスを受信した後、ＭＦＰ１１０は、当該レスポンスに含まれる、画像解析結果の格納先を示すＵＲＬを用いて、画像解析処理結果の取得を、ＭＦＰ連携サーバ１２０に対してリクエストする（Ｓ５１１）。リクエストを受けたＭＦＰ連携サーバ１２０では、リクエスト制御部４３１が解析処理の結果情報をＭＦＰ１１０に返す。

【0040】

そして、ＭＦＰ１１０は、Ｓ５１１のリクエストで取得した解析処理の結果情報を使用して、スキャン画像群における各文書の分割ページを確定するためのＵＩ画面（以下、「分割ページ確定画面」と表記）を表示する（Ｓ５１２）。表示された分割ページ確定画面での処理の詳細については、図７（ａ）を用いて後述する。

【0041】

分割ページ確定画面７１０（図７（ａ））にてスキャン画像群に対し各文書の区切り位置が必要に応じてユーザ操作で再指定された状態で、「ＯＫ」ボタン７１７が押下されると、スキャン画像において、各文書の区切りとなる位置が確定されることとなる。

【0042】

そして、ＭＦＰ１１０は、Ｓ５１２の処理で確定した位置で区切られた各ファイルのファイル名を設定するためのＵＩ画面（以下、「ファイル名設定画面」と表記）を表示する（Ｓ５１３）。表示されたファイル名設定画面での処理の詳細については、図７（ｂ）を用いて後述する。ファイル名設定画面７２０（図７（ｂ）にて各ファイルのファイル名が入力された状態で、「ＯＫ」ボタン７２７が押下されると、各ファイルのファイル名が設定されることとなる。

【0043】

そして、Ｓ５１２にて確定された各文書の区切りとなる位置やＳ５１３にて設定されたファイル名などに関する情報がＭＦＰ連携サーバ１２０に送られる（Ｓ５１４）。ＭＦＰ連携サーバ１２０はリクエストを受信すると、ＭＦＰ１１０より受信した情報に基づきファイル生成処理を開始するとともにリクエストを正常に受けたことをＭＦＰ１１０に返す。ＭＦＰ１１０は送信のレスポンスを受けると処理を終了し、Ｓ５０４のスキャン設定画面表示に戻る。

【0044】

一方、ＭＦＰ連携サーバ１２０では、事前に登録されたスキャン設定からストレージサーバ１３０に送信するファイルフォーマットの情報を取得し、当該ファイルフォーマットに従ってスキャン画像からファイルを生成する（Ｓ５１５）。この際、生成されたファイルにはＳ５１３で設定されたファイル名が付されることになる。こうして生成されたスキャン画像ファイルは、ストレージサーバ１３０に送信され、保存される（Ｓ５１６）。スキャン画像ファイルを受信したストレージサーバ１３０は、ＭＦＰ連携サーバ１２０のリクエスト制御部４３１にスキャン画像ファイルの送信完了のレスポンスを返す。

【0045】

以上が、画像処理システム全体の処理の流れである。

【0046】

図６は、複数の文書をページ単位で連続してスキャンして得られたスキャン画像群例を示す図である。ＭＦＰ１１０によりＳ５０５の処理にて生成されたスキャン画像群は、「スキャン画像群におけるページ順」に示すように、６ページで構成されており、１、２、３、４、５、６の順番となっているものとする。６ページで構成されるスキャン画像群は、３つの文書のスキャン画像からなる。３つの文書は、それぞれ文書Ａ、文書Ｂ、文書Ｃであるとする。スキャン画像群におけるページ順が２番、３番、５番のページ画像はスキャン画像群におけるページ順が１番のページ画像とレイアウトが類似している。以降、スキャン画像群におけるページ順が１番のページ画像を「スキャン先頭ページ」と呼称し、スキャン画像群に含まれるある文書内の１ページ目を「文書先頭ページ」と呼称し区別することにする。図６の例では、スキャン画像群におけるページ順が１のページ画像がスキャン先頭ページかつ文書先頭ページであり、２番、５番のページ画像が文書先頭ページであるということになる。スキャン先頭ページとレイアウトが類似しているページ画像に記載された内容を見ると、それぞれ文書の識別子を表す「文書ＩＤ」と、文書中のページ番号を表す「Ｐ．」が記載されている。スキャン先頭ページの「文書ＩＤ」の値は１、「Ｐ．」の値は１である。スキャン画像群におけるページ番号が２番、３番、５番のページについては、この順に「文書ＩＤ」の値は２、２、３であり、また「Ｐ．」の値は１、２、１である。一般的に同一の文書中では文書の識別子は同一であり、文書内のページ番号は連番もしくは文書内のページ順に大きくなっていくものと認めることができる。また、スキャン先頭ページは、スキャン画像群に含まれる１つないし複数の文書のうちの１つの文書の文書先頭ページである可能性が高いと認めることができる。また、スキャン画像群に含まれる１つないし複数の文書の文書先頭ページは、スキャン先頭ページと類似していることが多いという前提に立つものである。本実施形態では、これらの前提のもとでスキャン画像群に含まれる１つないし複数の文書を文書単位で適切に分割する（判別する）ための手法を提案する。

【0047】

分割ページ確定画面での処理の詳細について、図を用いて説明する。図７は、ＭＦＰ１１０のタッチパネルに表示されるＵＩ画面例を示す図であり、図７（ａ）にＳ５１２にて表示される分割ページ確定画面例を示し、図７（ｂ）に、Ｓ５１３にて表示されるファイル名設定画面例を示す。分割ページ確定画面およびファイル名設定画面の表示箇所は、これに限定されず、クライアントＰＣ１１１であってもよい。図７（ａ）に示すように、分割ページ確定画面７１０には、スキャン及び画像解析処理が完了して得られた、ストレージサーバ１３０に送信する前のスキャン画像群の全てのページが表示される。すなわち、分割ページ確定画面７１０には、スキャン画像群のサムネイル画像７１１及びサムネイル画像７１１に対応するページ番号７１２が、スキャン画像群のページ数分だけ表示される。さらに、分割ページ確定画面７１０には、Ｓ５０８の画像処理で判定された、スキャン画像群における各文書の区切り位置がユーザによって確認可能に表示される。ただし、当該各文書の区切り位置は、ユーザ操作によって修正可能となっている。すなわち、分割ページ確定画面７１０には、Ｓ５０８の画像処理で判定された各文書の区切り位置を示す文書区切り線７１３が表示され、文書区切り線７１３を例えばドラッグするなどのユーザ操作によって各文書の区切り入りを修正可能となっている。分割ページ確定画面７１０には、文書区切り位置を確定するためのボタンである「ＯＫ」ボタン７１７が表示され、ユーザ操作によって押下されると、分割ページ確定画面７１０で設定された文書の区切り位置が文書の区切り情報として確定することになる。

【0048】

ファイル名設定画面での処理の詳細について、図７（ｂ）を用いて説明する。図７（ｂ）に示すように、ファイル名設定画面７２０には、分割ページ確定画面７１０と同様、スキャン画像群のサムネイル画像７２１及びサムネイル画像７２１に対応するページ番号７２２が、スキャン画像群のページ数分だけ表示される。さらに、ファイル名設定画面７２０には、Ｓ５０８の画像処理で判定された各文書の区切り位置を示す文書区切り線７２３と、文書区切り線７２３で区切られた文書単位でファイル名を設定するためのファイル名設定欄７２４とが表示される。また、ファイル名設定画面７２０には、ファイル名を設定するための「ＯＫ」ボタン７２７が表示される。例えばタップなどのユーザ操作でファイル名設定欄７２４が選択されると、キーボードなどのファイル名を入力するための入力用ＵＩ画面（不図示）が表示され、入力用ＵＩ画面を介して文字列が入力されると、入力文字列がファイル名設定欄７２４に表示される。そして、このような操作が各ファイルに対して実行された後、「ＯＫ」ボタン７２７がユーザ操作によって押下されると、次の処理が行われる。すなわち、上述のスキャン画像群における各文書の区切り位置およびファイル名などに関する情報が、ＭＦＰ連携サーバ１２０へ送信される。

【0049】

＜画像解析処理＞
続いて、上述のＳ５０８にてＭＦＰ連携サーバ１２０の画像処理部４３２が実行する画像解析処理について、図を用いて説明する。図８は、画像解析処理の流れを示すフローチャートである。

【0050】

Ｓ８０１では、画像処理部４３２（画像補正部４５１）は、複数の文書をページ単位で連続してスキャンして得られたスキャン画像群に対して画像補正を行う。画像補正部４５１は、スキャン画像群の傾きなどを補正する処理を実行する。なお、スキャン画像群の傾きなどを補正する処理には、公知の技術が用いられる。

【0051】

Ｓ８０２では、画像処理部４３２（文書先頭ページ候補抽出部４６１）は、画像補正後のスキャン画像群に対して、複数の文書の各文書における先頭ページ候補を抽出する文書先頭ページ候補抽出処理を実行する。この文書先頭ページ候補抽出処理の詳細な流れについて、図を用いて後述する。

【0052】

Ｓ８０３では、画像処理部４３２（文書先頭ページ判定部４７１）は、Ｓ８０２にて抽出した先頭ページ候補に対して、文書先頭ページを判定する処理を行う。文書先頭ページ判定処理の詳細な流れについては、図を用いて後述する。

【0053】

Ｓ８０３の処理を完了すると、図８に示すフローを終える。

【0054】

＜文書先頭ページ候補抽出処理＞
続いて、上述のＳ８０２にて画像処理部４３２が実行する文書先頭ページ候補抽出処理について、図を用いて説明する。図９は、文書先頭ページ候補抽出処理の詳細な流れを示すフローチャートである。

【0055】

Ｓ９０１では、ＭＦＰ連携サーバ１２０の画像処理部４３２（文書先頭ページ候補抽出部４６１）は、Ｓ５０６においてＭＦＰ１１０より受信したスキャン画像群のうち、スキャン先頭ページから順に、未処理のページに対応するページ画像を取得する。

【0056】

Ｓ９０２では、ＭＦＰ連携サーバ１２０の画像処理部４３２（レイアウト解析部４６２）は、Ｓ９０１で取得したページ画像に対して、レイアウト解析を実施する。レイアウト解析の具体的手法は限定されないが、ここでは一例としてページ画像内に存在する文字領域の解析を行うことによって行うものとして説明を進める。レイアウト解析部４６２は、例えば、現在の処理対象であるページ画像に対して文字領域の検出処理を実行するよう文字領域検出部４５２に指示して文字領域を検出する処理を実行させる。そして、レイアウト解析部４６２は、文字領域検出処理後のページ画像のヒストグラムを抽出したり、画素の塊を抽出したりして、文字領域や図形領域など、ページ画像のレイアウトを解析する。すなわち、Ｓ９０２では、レイアウト解析部４６２は、スキャン画像群（スキャン画像）についてページ単位でレイアウトを解析するといえる。なお、Ｓ９０２では、画像処理部４３２（レイアウト解析部４６２）は、文字領域検出部４５２を制御する制御部として機能するともいえる。

【0057】

Ｓ９０３では、画像処理部４３２は、Ｓ９０２の処理で得たレイアウト解析結果を、レイアウト解析情報としてデータ管理部４３４に保存する。

【0058】

Ｓ９０４では、画像処理部４３２は、Ｓ９０２でレイアウト解析を実施したページ画像がスキャン先頭ページであるか否かを判定する。スキャン先頭ページであるとの判定結果を得た場合（Ｓ９０４のＹＥＳ）、処理がＳ９０７に移行される。他方、Ｓ９０２でレイアウト解析を実施したページ画像が文書の２ページ目以降のページ画像であり、スキャン先頭ページではないとの判定結果を得た場合（Ｓ９０４のＮＯ）、処理がＳ９０５に移行される。

【0059】

Ｓ９０５では、画像処理部４３２（類似度算出部４６３）は、先ず、１ページ目（スキャン先頭ページ）の画像に対応し、Ｓ９０２の処理で得たレイアウト解析結果をデータ管理部４３４より取得する。そして、画像処理部４３２（類似度算出部４６３）は、取得したレイアウト解析結果と、現在の処理対象であるページ画像に対するレイアウト解析結果とを比較し、比較結果を基に類似度を導出する。類似度の導出について、具体的な方法は限定しないが、ここでは一例としてレイアウト解析結果として得られた画像内に存在する文字領域を示す座標群のそれぞれについて、各領域の重なり面積を類似度として導出するものとする。

【0060】

Ｓ９０６では、画像処理部４３２（文書先頭ページ候補抽出部４６１）は、Ｓ９０５にて算出した類似度が所定の閾値を超えるか否かにより、現在の処理対象であるページ画像が１ページ目（スキャン先頭ページ）の画像と類似しているか否かを判定する。類似度が所定の閾値を超え、現在の処理対象であるページ画像が１ページ目の画像と類似しているとの判定結果を得た場合（Ｓ９０６のＹＥＳ）、処理がＳ９０７に移行される。他方、類似度が所定の閾値を超えず、現在の処理対象であるページ画像が１ページ目の画像と類似していないとの判定結果を得た場合（Ｓ９０６のＮＯ）、処理がＳ９０８に移行される。

【0061】

Ｓ９０７では、画像処理部４３２（文書先頭ページ候補抽出部４６１）は、現在の処理対象であるページ画像を文書先頭ページ候補として登録する。すなわち、Ｓ９０７では、画像処理部４３２は、Ｓ９０５で算出した類似度に基づき、スキャン画像から、複数の文書の各文書における文書先頭ページ候補を抽出しているといえる。

【0062】

Ｓ９０８では、画像処理部４３２は、現在の処理対象であるページ画像を処理済みとして登録する。これらＳ９０７、Ｓ９０８による登録処理は、例えば、下記の表１に示すようなページ管理リストをデータ管理部４３４に保持することで行ってもよい。表１に示すページ管理リストでは、スキャン画像群に対するページ番号と、各ページに対する文書先頭ページ候補抽出処理の処理状況と、文書先頭ページ候補か否かを示すフラグ情報とが管理されている。さらに、ページ管理リストでは、各ページに対する文書先頭ページ判定処理の処理状況と、文書先頭ページか否かを示すフラグ情報も管理されている。

【0063】

ページ管理リストには、文書先頭ページ候補フラグの値として、Ｓ９０７の処理により文書先頭ページ候補として登録されたページ番号（ページ画像）に対しては「１」が付され、それ以外のページ番号（ページ画像）に対しては「０」が付されることになる。すなわち、Ｓ９０７の処理がスキップされて文書先頭ページ候補として登録されていないページ番号に対しては文書先頭ページ候補フラグの値として「０」が付されることになる。また、ページ管理リストには、文書先頭ページ候補抽出処理の処理状況の値として、Ｓ９０８の処理により処理済みページとして登録されたページ番号（ページ画像）に対しては「完了」が付されることになる。それ以外のページ番号（ページ画像）に対しては「未処理」が付されることになる。すなわち、未処理であり、Ｓ９０８の処理が行われていないページ番号に対しては、文書先頭ページ候補抽出処理の処理状況の値として「未処理」が付されることになる。

【0064】

さらに、ページ管理リストには、図１０を用いて後述する文書先頭ページ判定処理の処理状況及びその結果登録された文書先頭ページフラグも管理されており、ページ番号に対して文書先頭ページ候補処理の場合と同様な値が付される。すなわち、ページ管理リストには、文書先頭ページフラグの値として、文書先頭ページとして登録されたページ番号（ページ画像）に対しては「１」が付され、それ以外のページ番号（ページ画像）に対しては「０」が付されることになる。すなわち、文書先頭ページとして登録されていないページ番号に対しては文書先頭ページフラグの値として「０」が付されることになる。また、ページ管理リストには、文書先頭ページ判定処理の処理状況の値として、処理済みページとして登録されたページ番号（ページ画像）に対しては「完了」が付されることになる。それ以外のページ番号（ページ画像）に対しては「未処理」が付されることになる。

【0065】

表１の例では、９ページで構成されるスキャン画像群のうち、３ページ目まで図９に示す文書先頭ページ候補抽出処理が完了しており、そのうち１ページ目及び３ページ目が文書先頭ページ候補として抽出されたことを示している。

【0066】

【表1】

【0067】

図９の説明に戻る。Ｓ９０９では、画像処理部４３２は、表１に示されたページ管理リストから、現在処理していたページの次のページが存在するか否かを判定する。次のページが存在するとの判定結果を得た場合（Ｓ９０９のＹＥＳ）、処理がＳ９０１に戻され、次のページのページ画像に対して、Ｓ９０１からＳ９０９の一連の処理が実行される。他方、次のページが存在しないとの判定結果を得た場合（Ｓ９０９のＮＯ）、図９に示すフローを終える。

【0068】

以上、図９を用いて説明したフローを実行することにより、Ｓ５０５において生成された複数ページで構成されるスキャン画像群から、複数の文書の各文書における先頭ページ候補が抽出されることになる。

【0069】

＜文書先頭ページ判定処理＞
続いて、上述のＳ８０３にて画像処理部４３２が実行する文書先頭ページ判定処理について、図を用いて説明する。図１０は、文書先頭ページ判定処理の詳細な流れを示すフローチャートである。

【0070】

Ｓ１００１では、ＭＦＰ連携サーバ１２０の画像処理部４３２は、表１に示したページ管理リストをデータ管理部４３４より取得し、文書先頭ページ判定処理状況が「未処理」であるもののうち、ページ番号の最も小さいページに対応する管理データを取得する。

【0071】

Ｓ１００２では、画像処理部４３２（文書先頭ページ判定部４７１）は、Ｓ１００１で取得した管理データのうち、文書先頭ページ候補フラグを参照することで、現在の処理対象であるページ番号が文書先頭ページ候補であるか否かを判定する。文書先頭ページ候補フラグが「０」であり、現在の処理対象であるページ番号が文書先頭ページ候補ではないとの判定結果を得た場合（Ｓ１００２のＮＯ）、処理がＳ１００９に移行される。他方、文書先頭ページ候補フラグが「１」であり、現在の処理対象であるページ番号が文書先頭ページ候補であるとの判定結果を得た場合（Ｓ１００２のＹＥＳ）、処理がＳ１００３に移行される。

【0072】

Ｓ１００３では、画像処理部４３２（文書先頭ページ判定部４７１）は、ページ管理リストを参照し、現在の処理対象であるページ番号の１つ前のページ番号が存在するか否かを判定する。現在の処理対象であるページ番号の１つ前のページ番号が存在するとの判定結果を得た場合（Ｓ１００３のＹＥＳ）、処理がＳ１００４に移行される。他方、現在の処理対象であるページ番号の１つ前のページ番号が存在しないとの判定結果を得た場合（Ｓ１００３のＮＯ）、処理がＳ１００８に移行される。

【0073】

Ｓ１００４では、画像処理部４３２（文書先頭ページ判定部４７１）は、ページ管理リストを参照し、現在の処理対象であるページ番号の１つ前のページ番号に対して付された文書先頭ページ候補フラグの値を取得する。

【0074】

Ｓ１００５では、画像処理部４３２（文書先頭ページ判定部４７１）は、Ｓ１００４で取得した、現在の処理対象であるページ番号の１つ前のページ番号に対して付された文書先頭ページ候補フラグの値が「１」であるか否かを判定する。現在の処理対象であるページ番号の１つ前のページ番号に対して付された文書先頭ページ候補フラグの値が「１」であるとの判定結果を得た場合（Ｓ１００５のＹＥＳ）、処理がＳ１００６に移行される。他方、現在の処理対象であるページ番号の１つ前のページ番号に対して付された文書先頭ページ候補フラグの値が「０」でるとの判定結果を得た場合（Ｓ１００５のＮＯ）、処理がＳ１００８に移行される。

【0075】

Ｓ１００６では、画像処理部４３２（文書先頭ページ判定部４７１）は、現在の処理対象であるページ番号のページ画像に対してＯＣＲ処理を実行するようＯＣＲ処理部４５３に指示してＳ９０２の処理で検出した文字領域に対して文字認識処理を実行させる。なお、Ｓ１００６では、画像処理部４３２（文書先頭ページ判定部４７１）は、ＯＣＲ処理部４５３を制御する制御部として機能するともいえる。

【0076】

Ｓ１００６にてＯＣＲ処理を実行して得られたＯＣＲ処理結果（文字認識結果）について、下記の表２を用いて説明する。表２は、ＯＣＲ処理結果例を示す表である。ＯＣＲ処理結果には、文字認識処理対象となる文字領域について、領域番号と、Ｘ座標と、Ｙ座標と、幅と、高さと、領域内文字列とが含まれる。なお、各文字領域の領域番号、座標（Ｘ座標、Ｙ座標）、幅、高さは、Ｓ９０２にて画像処理部４３２（文字領域検出部４５２）によって取得される。「Ｘ座標」は文字領域の左上隅のＸ座標、「Ｙ座標」は文字領域の左上隅のＹ座標、「幅」は文字領域のＸ（幅）方向のピクセル数、「高さ」は文字領域のＹ（高さ）方向のピクセル数を示す。

【0077】

【表2】

【0078】

Ｓ１００７では、画像処理部４３２（文書先頭ページ判定部４７１）は、Ｓ１００６の処理で得たＯＣＲ結果（文字認識結果）に基づき、現在の処理対象であるページ画像が文書先頭ページであるか否かの判定を行う。本実施形態では、Ｓ１００６で取得した現在の処理対象のページ画像のＯＣＲ結果と、１つ前のページ番号のページ画像のＯＣＲ結果とを比較することで判定を行う。なお、判定の方法は、これに限定されず、ページ画像のＯＣＲ結果を用いたものであればよい。

【0079】

＜ＯＣＲ結果による文書先頭ページ判定処理＞
続いて、上述のＳ１００７にて画像処理部４３２（文書先頭ページ判定部４７１）が実行する、ＯＣＲ結果による文書先頭ページ判定処理について、図を用いて説明する。図１１は、ＯＣＲ結果による文書先頭ページ判定処理の詳細な流れを示すフローチャートである。

【0080】

Ｓ１１０１では、画像処理部４３２は、Ｓ１００６で取得した、現在の処理対象であるページ画像に対するＯＣＲ結果を取得する。Ｓ１１０１で取得されるＯＣＲ結果は、例えば、表２に示されるＯＣＲ処理結果であるとする。

【0081】

Ｓ１１０２では、画像処理部４３２は、データ管理部４３４より、現在の処理対象であるページ画像の１つ前のページ画像のＯＣＲ結果を取得する。Ｓ１１０２の処理で画像処理部４３２が取得した１つ前のページ画像のＯＣＲ結果は、例えば、下記の表３に示されるＯＣＲ結果であるとする。表３に示されるＯＣＲ結果は、表２に示されるＯＣＲ結果と比較すると、領域番号１～５では領域内文字列（ＯＣＲ文字列）が一致するが、領域番号６及び７では領域内文字列（ＯＣＲ文字列）が異なるとする。

【0082】

Ｓ１１０３では、画像処理部４３２は、Ｓ１１０１で取得した現在の処理対象であるページ画像に対するＯＣＲ結果のうち、未取得の領域内文字列（ＯＣＲ文字列）のうち小さい領域番号に対応する領域内文字列（ＯＣＲ文字列）を取得する。画像処理部４３２は、例えば、表２に示されるＯＣＲ結果では、まず領域番号１に対応する領域内文字列（ＯＣＲ文字列）である「見積書」を取得する。なお、処理が後述するＳ１１０５に移行した場合には、領域番号をインクリメントして次の領域番号に対応する領域内文字列（ＯＣＲ文字列）がＳ１１０３に戻されたときに取得される、という処理手順となる。

【0083】

【表3】

【0084】

Ｓ１１０４では、画像処理部４３２は、Ｓ１１０３で取得した領域内文字列（ＯＣＲ文字列）が後述する同一文書判定ルールに含まれるか否かを判定する。

【0085】

同一文書判定ルールについて、下記の表を用いて説明する。下記の表４は、Ｓ１１０４の判定処理で用いるために予め設定された同一文書判定ルール例を示す表である。同一文書判定ルールには、ルールの識別子であるルールＩＤと、同一文書判定処理に用いられる文字列である判定トークンと、各判定トークンに対して判定の際に同一文書と判定するために適用する条件を示す判定条件とが設定されている。判定条件は、判定トークンごとに「連続」または「同一」の値が設定されており、この値に応じて後述するＳ１１１０の同一文書判定処理における判定条件が規定される。より具体的には、判定条件が「連続」であった場合には、判定に用いる２つの領域内文字列（ＯＣＲ文字列）の間に連続の関係にあるか否かに基づく判定を行う。判定条件が「同一」であった場合には、２つの領域内文字列（ＯＣＲ文字列）が同一であるか否かに基づく判定を行う。例えば、２つの領域内文字列（ＯＣＲ文字列）「Ｐａｇｅ１」「Ｐａｇｅ２」があった場合、両方の領域内文字列の間で値が連続であると認められるため、判定条件が「連続」であった場合には同一文書であると判定される。別の例として、２つの領域内文字列（ＯＣＲ文字列）「文書番号Ａ－１２３」「文書番号Ａ－１２３」があった場合、両方の領域内文字列は同一であると認められるため、判定条件が「同一」であった場合には同一文書であると判定される。

【0086】

【表4】

【0087】

Ｓ１１０４の判定処理が、例えば、表４に示される判定トークンのうち、領域内文字列（ＯＣＲ文字列）に含まれるものがあるか否かで行われる。例えば、表２に示されるＯＣＲ結果のうち、領域番号４に対応する領域内文字列「見積番号: R12-3456」は、表４に示すルールＩＤ７に対応する判定トークン「見積番号」が含まれており、それ以外の領域内文字列は含まれていないと判定される。領域内文字列（ＯＣＲ文字列）に含まれる判定トークンが存在するとの判定結果を得た場合（Ｓ１１０４のＹＥＳ）、処理がＳ１１０７に移行される。他方、領域内文字列（ＯＣＲ文字列）に含まれる判定トークンが存在しないとの判定結果を得た場合（Ｓ１１０４のＮＯ）、処理がＳ１１０５に移行される。

【0088】

Ｓ１１０５では、画像処理部４３２は、Ｓ１１０３で取得した領域内文字列（ＯＣＲ文字列）の領域番号から１だけインクリメントした領域番号に対応する次の領域内文字列（ＯＣＲ文字列）が存在するか否かを判定する。次の領域番号に対応する領域内文字列が存在するとの判定結果を得た場合（Ｓ１１０５のＹＥＳ）、処理がＳ１１０３に戻され、インクリメントした領域番号（次の領域番号）に対応する領域内文字列（ＯＣＲ文字列）に対してＳ１１０３の処理が行われる。他方、次の領域番号に対応する領域内文字列（ＯＣＲ文字列）が存在しないとの判定結果を得た場合（Ｓ１１０５のＮＯ）、処理がＳ１１０６に移行される。

【0089】

Ｓ１１０７では、画像処理部４３２は、Ｓ１１０４にて領域内文字列（ＯＣＲ文字列）に含まれると判定された判定トークンに対応する判定条件を取得する。画像処理部４３２は、例えば、上述した、表２に示されるＯＣＲ結果の領域番号４に対応する領域内文字列（ＯＣＲ文字列）「見積番号: R12-3456」に対する判定条件として、表４に示されるルールＩＤ７に対応する判定条件である「同一」を取得する。

【0090】

Ｓ１１０８では、画像処理部４３２は、Ｓ１１０２で取得した、現在の処理対象の１つ前のページ画像に対するＯＣＲ結果の中にも、Ｓ１１０４で同一文書判定ルールに含まれると判定された判定トークンを含む領域内文字列が存在するか否かを判定する。すなわち、画像処理部４３２は、１つ前のページ画像に対するＯＣＲ結果も同一文書判定ルールに適合するか否かを判定する。１つ前のページ画像に対するＯＣＲ結果も同一文書判定ルールに適合しないとの判定結果を得た場合（Ｓ１１０８のＮＯ）、処理がＳ１１０６に移行される。１つ前のページ画像に対するＯＣＲ結果が同一文書判定ルールに適合するとの判定結果を得た場合（Ｓ１１０８のＹＥＳ）、処理がＳ１１０９に移行される。

【0091】

Ｓ１１０９では、画像処理部４３２は、１つ前のページ画像に対するＯＣＲ結果から同一文書ルールに含まれていると判定したＯＣＲ文字列を取得する。例えば、ルールＩＤ７に対応する判定トークン「見積番号」が、表３に示されるＯＣＲ結果の領域番号４に対応するＯＣＲ文字列「見積番号: R12-3456」に含まれる。そのため、この例では、Ｓ１１０８にてＹＥＳと判定されて処理がＳ１１０９に移行され、Ｓ１１０９にてＯＣＲ文字列として「見積番号: R12-3456」が取得されることになる。

【0092】

Ｓ１１１０では、画像処理部４３２は、次に示すＯＣＲ文字列および同一文書判定条件を用いて、現在のページ画像と１つ前のページ画像が同一文書か否かを判定する。すなわち、判定は、Ｓ１１０３で取得した現在のページ画像に対するＯＣＲ文字列、Ｓ１１０７で取得した同一文書判定条件、およびＳ１１０９で取得した１つ前のページ画像に対するＯＣＲ文字列を用いて行われる。判定の方法は、表４を用いて先述した手順で行う。同一文書であるとの判定結果を得た場合（Ｓ１１１０のＹＥＳ）、処理がＳ１１１１に移行される。同一文書でないとの判定結果を得た場合（Ｓ１１１０のＮＯ）、処理がＳ１１０６に移行される。

【0093】

Ｓ１１０６では、画像処理部４３２は、現在のページ画像が文書先頭ページであると判定し、現在のページ画像が文書先頭ページあるとして登録する。他方、Ｓ１１１１では、画像処理部４３２は、現在のページ画像が文書先頭ページでないと判定し、現在のページ画像を文書先頭ページではないとして登録する。より具体的に、Ｓ１１０６の処理では、表１に示されたページ管理リストのうち、「文書先頭ページフラグ」の値に「１」が登録されることになる。また、Ｓ１１１１の処理では、表１に示されたページ管理リストのうち、「文書先頭ページフラグ」の値に「０」が登録されることになる。

【0094】

なお、Ｓ１１０６の処理、またはＳ１１１１の処理が完了すると、図１１に示すフローを終える。

【0095】

図１０の説明に戻る。Ｓ１００８では、画像処理部４３２は、現在のページ画像が文書先頭ページであると判定し、上述のＳ１１０６と同様、現在のページ画像が文書先頭ページあるとして登録する。より具体的に、Ｓ１００８の処理では、表１に示されたページ管理リストのうち、「文書先頭ページフラグ」の値に「１」が登録されることになる。

【0096】

Ｓ１００９では、画像処理部４３２は、上述のＳ９０９と同様、現在の処理対象のページの次のページが存在するか否かを判定する。次のページが存在するとの判定結果を得た場合（Ｓ１００９のＹＥＳ）、処理がＳ１００１に移行され、次のページのページ画像に対して、Ｓ１００１からＳ１００９の一連の処理が実行される。他方、次のページが存在しないとの判定結果を得た場合（Ｓ１００９のＮＯ）、図１０に示すフローを終える。

【0097】

以上図８から図１１に示されるフローによりＳ５０８の画像解析処理を完了し、画像処理部４３２は、解析処理結果（解析情報）をリクエスト制御部４３１に返す。リクエスト制御部４３１に返す解析処理結果には、表１を用いて説明したページ管理リストが含まれる。例えば、解析処理結果（解析情報）の一部として最終的に下記の表５に示されるページ管理リストが含まれるとする。表５では、まず、上述の先頭候補ページ判定処理（Ｓ５０８の処理）にて、ページ番号１、３、４、５、７の各ページが文書先頭ページ候補としてレイアウト解析処理により抽出される。続いて、上述の文書先頭ページ判定処理（Ｓ５０８の処理）にて、それら文書先頭ページ候補それぞれに対してＯＣＲ処理を行って得たＯＣＲ結果を用いて詳細な判定を行った結果、ページ番号１、３、５、７が各文書の文書先頭ページとして判定される。Ｓ５１２では、この処理結果を受けて、文書先頭ページフラグの値が「０」から「１」に変わるページ境界に文書区切り線７１３が描画された状態で分割ページ確定画面７１０が表示される。

【0098】

【表5】

【0099】

以上説明した通り、本実施形態によれば、複数のページで構成される複数の文書をページ単位で連続してスキャンして得られたスキャン画像群における文書単位の区切りを判別する処理について、次に示すように行えるようになる。すなわち、レイアウト解析によりスキャン先頭ページと類似したページに対してのみＯＣＲ処理を用いた詳細な解析を行うことができるようになる。これにより、文書単位の区切り（分割位置）の自動判定に関する精度を維持しつつ、ＯＣＲ処理が行われるページ数を最小限に抑えられ、処理に要する時間を短縮することから、ユーザにとっての応答性を向上させることができる。すなわち、処理コストを抑えながらも、複数の文書を連続でスキャンして得られたスキャン画像における文書単位の区切りを判別することができる。

【0100】

［第二の実施形態］
本実施形態では、ユーザによる分割ページ確定履歴を利用する態様について、図を用いて説明する。なお、本実施形態では、第一の実施形態と同一の構成や処理手順についてはその説明を省略し、差異のある箇所について説明する。

【0101】

＜画像処理システム全体の処理の流れ＞
まず、本実施形態に係る画像処理システム全体の処理の流れについて、図を用いて説明する。図１２は、ＭＦＰ１１０にて複数の文書をページ単位で連続してスキャンし、得られたスキャン画像をファイル化してストレージサーバ１３０に保存（送信）する際の、各装置間の処理の流れを示すシーケンス図である。ここでは、各装置間のやり取りを中心に説明する。なお、図１２のシーケンス図ではＭＦＰ１１０がＭＦＰ連携サーバ１２０とやり取りを行う場合の説明となっているが、後述する解析結果取得、画面の表示等はＭＦＰ１１０でなくクライアントＰＣ１１１が実行する構成でも構わない。

【0102】

Ｓ１２０１では、ＭＦＰ連携サーバ１２０のリクエスト制御部４３１は、Ｓ５１２にてユーザによって確定されたスキャン画像群の分割結果の登録を画像処理部４３２に依頼する。登録を依頼する情報は、例えば、Ｓ５１２にて最終的に分割結果が確定した際のページ管理リストと、該スキャン画像群の１ページ目のページ画像に対するＳ９０２の処理によるレイアウト解析結果とが紐づいたデータ（以下、分割確定データと称す）である。例えば、Ｓ５１２で表示された分割ページ確定画面が図７（ａ）に示された状態の画面であるとし、この状態から、ユーザ操作によって、図１３に示すように、分割ページが修正された状態となり、「ＯＫ」ボタン７１７の押下により分割が確定されたとする。具体的には、ユーザ操作によって、３ページ目と４ページ目の間に文書区切り線１３０１が追加された状態となるとする。その結果、スキャン画像群に対するページ管理リストは下記の表６に示すように、ページ番号４に対応する文書先頭ページフラグが「０」から「１」に変更されることになる。Ｓ１２０１で登録依頼する分割確定データにおけるページ管理リストは、このようにＳ５１２を経てユーザにより確定した際のものとなる。図１３に示される分割ページ確定画面７１０では、文書区切り線がユーザ操作によって調整可能となっている。

【0103】

【表6】

【0104】

図１２の説明に戻る。Ｓ１２０２では、画像処理部４３２は、データ管理部４３４に登録されている分割履歴データに、Ｓ１２０１でリクエスト制御部４３１より依頼された分割確定データを履歴情報として追加する。分割履歴データは、複数のスキャン画像群それぞれに対する分割確定データを集積したデータである。なお、分割履歴データがデータ管理部４３４に登録されていない場合には、Ｓ１２０１でリクエスト制御部４３１より依頼された分割確定データがデータ管理部４３４に登録されることになる。

【0105】

次に、以上のようにして登録される分割履歴データを用いる文書先頭ページ判定処理について説明する。

【0106】

＜文書先頭ページ判定処理＞
図１４は、本実施形態に係る文書先頭ページ判定処理の詳細な流れを示すフローチャートである。本フローは、図８におけるＳ８０３の処理に相当する。

【0107】

Ｓ１４０１では、ＭＦＰ連携サーバ１２０の画像処理部４３２は、上述した分割履歴データを用いて、文書先頭ページの判定にＯＣＲ処理を実施する必要があるか否かを判定するための処理を実行する。

【0108】

＜履歴によるＯＣＲ要否判定処理＞
履歴によるＯＣＲ要否判定処理について、図を用いて説明する。図１５は、Ｓ１４０１の履歴によるＯＣＲ要否判定処理の詳細な流れを示すフローチャートである。

【0109】

Ｓ１５０１では、ＭＦＰ連携サーバ１２０の画像処理部４３２は、Ｓ９０３でデータ管理部４３４に保存されたスキャン先頭ページに対応するレイアウト解析結果（レイアウト解析データ）を取得する。続くＳ１５０２では、画像処理部４３２は、データ管理部４３４に保存された分割履歴データから、Ｓ１５０１で取得したレイアウト解析データと類似するレイアウト解析データを検索して取得する。

【0110】

Ｓ１５０３では、画像処理部４３２（不適合率算出部４７２）は、Ｓ１５０２で取得した複数の分割履歴データに含まれるページ管理リストを連結した連結リストを作成する。そして、画像処理部４３２（不適合率算出部４７２）は、作成した連結リストに記載された文書先頭ページ候補フラグと文書先頭ページフラグの値とから、両フラグ値の不適合率を算出する。不適合率の算出方法は、これに限定されない。算出方法として、例えば、まず上述の連結リストにおける文書先頭ページ候補フラグと文書先頭ページフラグとの排他的論理和を各ページに対して取り、排他的論理和の総和を文書先頭ページ候補フラグの総和（総数）で除した値を不適合率として算出する。具体的な算出例として、Ｓ１５０３の処理の過程で下記の表７に示されるような連結リスト及び排他的論理和が得られた場合、（文書先頭ページ候補フラグの総和）＝５、（排他的論理和の総和）＝１となるので、不適合率は１／５となる。このような不適合率を算出することで、分割履歴データから文書先頭ページ候補と、Ｓ５１２にてユーザ操作で確定された文書先頭ページとの不適合の度合いを示す指標を得ることができる。そのため、不適合率の算出方法は、これに限定されず、前記指標を算出できればよい。

【0111】

【表7】

【0112】

Ｓ１５０４では、画像処理部４３２は、Ｓ１５０３で上述のように算出された不適合率が予め定められた一定値より大きいか否かを判定する。一定値として、例えば、１／２（５０％）としてよいが、これに限定されない。不適合率が一定値より大きいとの判定結果を得た場合（Ｓ１５０４のＹＥＳ）、処理がＳ１５０５に移行される。他方、不適合率が一定値以下であるとの判定結果を得た場合（Ｓ１５０４のＮＯ）、処理がＳ１５０６に移行される。

【0113】

Ｓ１５０５では、画像処理部４３２は、スキャン画像群の分割判定にはＯＣＲ処理を行う必要があると判定する。Ｓ１５０６では、画像処理部４３２は、スキャン画像群の分割判定にはＯＣＲ処理を行う必要がないと判定する。Ｓ１５０５またはＳ１５０６の処理が完了すると、図１５に示すフローを終える。

【0114】

図１４の説明に戻る。Ｓ１４０２では、画像処理部４３２は、Ｓ１４０１の判定処理の結果に基づき、スキャン画像群に対するＯＣＲ処理を行う必要があるか否かを判定する。ＯＣＲ処理を行う必要があると判定結果を得た場合（Ｓ１４０２のＹＥＳ）、処理がＳ１００１に移行される。他方、ＯＣＲ処理を行う必要が無いとの判定結果を得た場合（Ｓ１４０２のＮＯ）、処理がＳ１４０３に移行される。

【0115】

Ｓ１４０３では、画像処理部４３２は、図９の処理を経て得られた文書先頭ページ候補フラグの値をそのまま各ページの文書先頭ページフラグとして設定する。なお、Ｓ１４０３の処理が完了すると、図１４に示すフローを終える。

【0116】

以上説明したように、本実施形態によれば、ユーザによって確定された分割履歴データから、文書先頭ページ候補と確定された文書先頭ページとの間の乖離が小さい場合、ＯＣＲ処理を行うことなく確度の高い分割結果をユーザに提示することができる。これにより、分割履歴データを用いない場合と比べて、処理に要する時間がさらに短縮されることから、ユーザにとって応答性をさらに向上させることができる。

【0117】

［第三の実施形態］
本実施形態では、文書先頭ページの判定において、ＯＣＲ処理を行う必要があるとなった場合でも、必要最小限の領域に対してのみＯＣＲ処理を実施する態様について、図を用いて説明する。なお、本実施形態では、第一及び第二の実施形態と同一の構成や処理手順についてはその説明を省略し、差異のある箇所について説明する。

【0118】

本実施形態では、上述の分割確定データのうち、スキャン画像群の１ページ目の画像に対するＳ９０２によるレイアウト解析結果に、「分割判定利用フラグ」（領域情報）の値が追加される。本実施形態における分割確定データに含まれるレイアウト解析結果例について、下記の表を用い説明する。下記の表８は、本実施形態における分割確定データに含まれるレイアウト解析結果例を示す表である。分割確定データに含まれるレイアウト解析結果では、領域番号４に対応する分割判定利用フラグの値が「１」、それ以外の領域番号に対応する分割判定利用フラグの値は「０」として登録されている。本実施形態における分割判定利用フラグの値の設定方法、及び利用方法については詳細な処理手順の説明と併せて後述する。なお、表８には領域内文字列の値が付されているが、説明の明瞭さのために便宜的に付しているものであって、必ずしも付されていなくてもよい。

【0119】

【表8】

【0120】

＜ＯＣＲ結果による文書先頭ページ判定処理＞
続いて、本実施形態におけるＳ１００７にて画像処理部４３２（文書先頭ページ判定部４７１）が実行する、ＯＣＲ結果による文書先頭ページ判定処理について、図を用いて説明する。図１６は、ＯＣＲ結果による文書先頭ページ判定処理の詳細な流れを示すフローチャートである。本フローチャートは、ＭＦＰ連携サーバ１２０によって実施される。

【0121】

Ｓ１６０１では、画像処理部４３２（分割判定利用フラグ設定部４７３）は、Ｓ１１０４において、同一文書判定ルールに含まれていると判定された判定トークンを含む領域内文字列（ＯＣＲ文字列）が存在する領域の分割判定利用フラグを「１」に設定する。すなわち、第一の実施形態で例示したのと同じく表２に示される各領域をもつレイアウト解析結果が得られており、かつ同一文書判定ルールが表４を用いて説明したものと同じであるとする。この場合、Ｓ１１０４にて同一文書判定ルールに含まれていると判定された判定トークンを含む領域内文字列（ＯＣＲ文字列）が存在する領域は領域番号４に対応する領域である。そのため、Ｓ１６０１にて領域番号４に対応する領域に対して分割判定利用フラグに「１」が付され、レイアウト解析データは表８で示される状態となる。以上のように設定された分割判定利用フラグを含むレイアウト解析データは、Ｓ５０８の画像解析結果としてリクエスト制御部４３１を経由してＭＦＰ１１０に送信される。そして、Ｓ５１２、Ｓ５１３、Ｓ５１４，Ｓ１２０１、Ｓ１２０２を経て分割履歴データとしてデータ管理部４３４に保存される。

【0122】

＜文書先頭ページ判定処理＞
図１７は、本実施形態に係る文書先頭ページ判定処理の詳細な流れを示すフローチャートである。本フローは、図８におけるＳ８０３の処理に相当する。

【0123】

Ｓ１７０１では、ＭＦＰ連携サーバ１２０の画像処理部４３２は、データ管理部４３４に保存された分割履歴データから、現在の処理対象であるスキャン画像群の１ページ目とレイアウトが類似するレイアウト解析データを取得する。なお、分割履歴データは、Ｓ１２０２にて登録されたデータである。

【0124】

Ｓ１７０２では、画像処理部４３２は、Ｓ１７０１で取得した分割履歴データのレイアウト解析データにて、分割判定利用フラグに「１」が設定されている領域が存在するか否かを判定する。分割判定利用フラグに「１」が設定されている領域が存在するとの判定結果を得た場合（Ｓ１７０２のＹＥＳ）、処理がＳ１７０３に移行される。他方、分割判定利用フラグに「１」が設定されている領域が存在しないとの判定結果を得た場合（Ｓ１７０２のＮＯ）、処理がＳ１００６に移行される。

【0125】

Ｓ１７０３では、画像処理部４３２（文書先頭ページ判定部４７１）は、Ｓ１７０１で取得したレイアウト解析データで分割判定利用フラグに「１」が設定されている領域に対してのみＯＣＲ処理を実行するようＯＣＲ処理部４５３に指示する。ＯＣＲ処理部４５３がＳ１７０１で取得したレイアウト解析データで分割判定利用フラグに「１」が設定されている領域に対してのみＯＣＲ処理を実行する。Ｓ１７０３では、画像処理部４３２（文書先頭ページ判定部４７１）は、ＯＣＲ処理部４５３を制御する制御部として機能するともいえる。なお、Ｓ１７０３の処理が完了すると、処理がＳ１００７に移行される。

【0126】

以上説明した通り、本実施形態によれば、過去にＳ１００７の文書先頭ページ判定で利用された領域に対してのみＯＣＲ処理を行うことができる。これにより、スキャン画像群（ページ画像）で検出した全ての文字領域に対してＯＣＲ処理を行う必要がある文書先頭ページ判定処理と比べて、文書先頭ページ判定処理に要する時間をさらに削減することができる。

【0127】

［その他の実施形態］
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１以上のプロセッサがプログラムを読み出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

【符号の説明】

【0128】

１２０ＭＦＰ連携サーバ
４３２画像処理部

【図1】