(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-09
(45)【発行日】2024-01-17
(54)【発明の名称】情報処理装置及びプログラム
(51)【国際特許分類】
G06F 3/04842 20220101AFI20240110BHJP
H04N 1/00 20060101ALI20240110BHJP
H04N 1/387 20060101ALI20240110BHJP
【FI】
G06F3/04842
H04N1/00 350
H04N1/387 200
(21)【出願番号】P 2020020638
(22)【出願日】2020-02-10
【審査請求日】2023-01-20
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】110001210
【氏名又は名称】弁理士法人YKI国際特許事務所
(72)【発明者】
【氏名】高木 有人
【審査官】塩屋 雅弘
(56)【参考文献】
【文献】特開2020-182020(JP,A)
【文献】特開2020-182021(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/04842
H04N 1/00
H04N 1/387
(57)【特許請求の範囲】
【請求項1】
プロセッサを備え、
プロセッサは、
原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、
前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、
前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出
し、
前記表示制御は、前記複数のパターンを同時表示する画像を前記画面に表示するための制御であり、
前記プロセッサは、前記入力画像から抽出された前記原稿領域の前記パターンの数が所定の閾値より大きい場合に、前記複数のパターンを同時表示する画像を前記画面に表示するための制御、とは別の表示制御を実行する、
ことを特徴とする情報処理装置。
【請求項2】
前記画像は、前記複数のパターンの各々に対応付けて、当該パターンを選択するためのUI部品を更に表示したものであり、
前記選択を受け付ける処理は、前記画面に表示された前記画像において前記ユーザが選択した前記UI部品に対応するパターンを前記正しいパターンとする、
ことを特徴とする請求項
1に記載の情報処理装置。
【請求項3】
プロセッサを備え、
プロセッサは、
原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、
前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、
前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出し、
前記表示制御は、前記複数のパターンのうちの第1のパターンを表示した画像を前記画面上に表示するための制御であり、
前記プロセッサは、更に、
前記画像に表示されている前記第1のパターンに含まれる原稿領域のうち1以上の正しい原稿領域の選択を受け付け、
前記入力画像のうち、選択された前記1以上の正しい原稿領域を除いた部分に含まれる原稿領域の指定を、前記第1のパターン内から選ぶ方法とは異なる方法で受け付ける第2受付処理を実行し、
前記入力画像の中から、選択された前記1以上の正しい原稿領域の各々の画像と、前記異なる方法で指定された各原稿領域の画像と、を抽出する、
ことを特徴とす
る情報処理装置。
【請求項4】
前記第2受付処理は、前記複数のパターンのうちの、選択された前記1以上の正しい原稿領域を含むパターン、の中から正しいパターンの選択を受け付ける処理である、請求項
3に記載の情報処理装置。
【請求項5】
前記第2受付処理は、選択された前記1以上の正しい原稿領域を含むパターンの数が所定の閾値以下である場合に、それら前記1以上の正しい原稿領域を含むパターンを同時表示する画像であって、同時表示するパターンの各々に対応付けて、当該パターンを選択するためのUI部品を表示した画像、を前記画面に表示し、前記画面に表示された当該画像において前記ユーザが選択した前記UI部品に対応するパターンを前記正しいパターンとする、
請求項
4に記載の情報処理装置。
【請求項6】
前記第2受付処理は、選択された前記1以上の正しい原稿領域を除いた部分に含まれる原稿領域を特定する頂点又は辺の指定を受け付ける、請求項
3に記載の情報処理装置。
【請求項7】
プロセッサを備え、
プロセッサは、
原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、
前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、
前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出し、
前記表示制御は、前記複数のパターンのうちの第1のパターンを表示した画像を前記画面上に表示するための制御であり、
前記プロセッサは、更に、
前記画像に表示されている前記第1のパターンに含まれる原稿領域のうち1以上の誤っている原稿領域の選択を受け付け、
前記入力画像のうち、選択された前記1以上の誤っている原稿領域に該当する部分に含まれる原稿領域の指定を、前記第1のパターン内から選ぶ方法とは異なる方法で受け付ける第2受付処理を実行し、
前記入力画像の中から、前記第1のパターンのうち前記1以上の誤っている原稿領域を除いた残りの各原稿領域の画像と、前記異なる方法で指定された各原稿領域の画像と、を抽出する、
ことを特徴とす
る情報処理装置。
【請求項8】
前記第2受付処理は、前記複数のパターンのうちの、選択された前記1以上の誤っている原稿領域を除いた残りの各原稿領域を含むパターン、の中から正しいパターンの選択を受け付ける処理である、請求項
7に記載の情報処理装置。
【請求項9】
前記プロセッサは、
前記画面に表示された前記入力画像に含まれる少なくとも1つの原稿領域を特定する頂点又は辺の指定を受け付け、
前記入力画像の中から、指定された頂点又は辺により特定される前記少なくとも1つの原稿領域の画像を抽出する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項10】
コンピュータを、
原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、
前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、
前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出する、
よう動作させるためのプログラム
であって、
前記表示制御は、前記複数のパターンを同時表示する画像を前記画面に表示するための制御であり、
前記プログラムは、前記コンピュータを、
前記入力画像から抽出された前記原稿領域の前記パターンの数が所定の閾値より大きい場合に、前記複数のパターンを同時表示する画像を前記画面に表示するための制御、とは別の表示制御を実行する、
よう動作させるためのものであることを特徴とするプログラム。
【請求項11】
コンピュータを、
原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、
前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、
前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出する、
よう動作させるためのプログラムであって、
前記表示制御は、前記複数のパターンのうちの第1のパターンを表示した画像を前記画面上に表示するための制御であり、
前記プログラムは、前記コンピュータを、更に、
前記画像に表示されている前記第1のパターンに含まれる原稿領域のうち1以上の正しい原稿領域の選択を受け付け、
前記入力画像のうち、選択された前記1以上の正しい原稿領域を除いた部分に含まれる原稿領域の指定を、前記第1のパターン内から選ぶ方法とは異なる方法で受け付ける第2受付処理を実行し、
前記入力画像の中から、選択された前記1以上の正しい原稿領域の各々の画像と、前記異なる方法で指定された各原稿領域の画像と、を抽出する、
よう動作させるためのものであることを特徴とするプログラム。
【請求項12】
コンピュータを、
原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、
前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、
前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出する、
よう動作させるためのプログラムであって、
前記表示制御は、前記複数のパターンのうちの第1のパターンを表示した画像を前記画面上に表示するための制御であり、
前記プログラムは、前記コンピュータを、更に、
前記画像に表示されている前記第1のパターンに含まれる原稿領域のうち1以上の誤っている原稿領域の選択を受け付け、
前記入力画像のうち、選択された前記1以上の誤っている原稿領域に該当する部分に含まれる原稿領域の指定を、前記第1のパターン内から選ぶ方法とは異なる方法で受け付ける第2受付処理を実行し、
前記入力画像の中から、前記第1のパターンのうち前記1以上の誤っている原稿領域を除いた残りの各原稿領域の画像と、前記異なる方法で指定された各原稿領域の画像と、を抽出する、
よう動作させるためのものであることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及びプログラムに関する。
【背景技術】
【0002】
スキャナ装置や複合機(すなわちスキャナ、プリンタ、コピー機等の機能を併せ持つ装置)の中には、プラテンとも呼ばれる原稿台の上に置かれた複数の原稿を読み取り、読み取った画像から個々の原稿の画像を切り出してデータ化する機能を持つものがある。このような機能は、マルチクロップ機能と呼ばれる。
【0003】
従来装置は、原稿台の上に置いた複数の原稿を黒い背景紙で覆う等の方法により原稿の周縁部と背景とのコントラストを高めることで、個々の原稿の画像の切り出しの精度を高めている。
【0004】
しかし、原稿群の上を黒い背景紙で覆うという操作は忘れられがちである。複合機等は、原稿台に対して開閉可能な原稿カバー部(これは自動原稿送り装置を内蔵する場合が多い)を備えており、この原稿カバー部の原稿台に面する面は一般に白色である。原稿台上の複数の原稿を黒い背景紙で覆うのを忘れ、通常通り原稿カバー部を閉めて読み取りを行うと、読取り結果の画像は、白い背景上に白い原稿が複数配置された状態を示すものとなる。この読取り結果の画像には原稿のエッジが明確に現れない場合が多い。原稿のエッジが明確でない場合、個々の原稿の画像の切り出しの精度が劣化する。例えば、別々の複数の原稿を、1つの大きな原稿として切り出してしまう等の誤りが生じる。
【0005】
また、黒い背景紙等を用いて切り出しの精度を高めた場合でも、切り出しに誤りが生じる場合がある。例えば、複数の原稿が、隙間なく又は互いに少し重なった状態で、整列して原稿台の上に置かれた場合、マルチクロップ機能が、それら複数の原稿を1つの原稿として切り出してしまうことがある。
【0006】
マルチクロップ機能を持つ従来装置の中には、切り出し結果をユーザに提示する機能を持つものがある。
【0007】
例えば特許文献1に開示された装置は、原稿台全面を低解像度でプレスキャンして得た画像から個々の原稿の領域を検出し、検出した原稿の領域を表示した後、本スキャンを実行する(同文献の段落0025、0061、0079、
図2を参照)。
【0008】
また、マルチクロップに関する従来技術を示す文献として、特許文献2及び3がある。
【先行技術文献】
【特許文献】
【0009】
【文献】特許第4574503号明細書
【文献】特開2018-201174号公報
【文献】特開2019-092065号公報
【発明の概要】
【発明が解決しようとする課題】
【0010】
原稿を撮像した入力画像から抽出した、原稿領域を単に表示するだけでは、ユーザは、表示された原稿領域が正しいものであるか否かを確認できるだけである。表示された原稿領域が誤っている場合、ユーザは、例えば、原稿台上の原稿を置き直し、再度装置に原稿の撮像を行わせる等の作業を行うことにより、正しい原稿領域が抽出されるようにするが、その操作がユーザにとっては煩雑であった。
【0011】
本発明は、原稿を撮像した入力画像から抽出した原稿領域を単に表示する方式と比べて、正しい原稿領域が抽出されるためのユーザの操作負担を軽減することを目的とする。
【課題を解決するための手段】
【0012】
請求項1に係る発明は、プロセッサを備え、プロセッサは、原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出し、前記表示制御は、前記複数のパターンを同時表示する画像を前記画面に表示するための制御であり、前記プロセッサは、前記入力画像から抽出された前記原稿領域の前記パターンの数が所定の閾値より大きい場合に、前記複数のパターンを同時表示する画像を前記画面に表示するための制御、とは別の表示制御を実行する、ことを特徴とする情報処理装置である。
【0014】
請求項2に係る発明は、前記画像は、前記複数のパターンの各々に対応付けて、当該パターンを選択するためのUI部品を更に表示したものであり、前記選択を受け付ける処理は、前記画面に表示された前記画像において前記ユーザが選択した前記UI部品に対応するパターンを前記正しいパターンとする、ことを特徴とする請求項1に記載の情報処理装置である。
【0016】
請求項3に係る発明は、プロセッサを備え、プロセッサは、原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出し、前記表示制御は、前記複数のパターンのうちの第1のパターンを表示した画像を前記画面上に表示するための制御であり、前記プロセッサは、更に、前記画像に表示されている前記第1のパターンに含まれる原稿領域のうち1以上の正しい原稿領域の選択を受け付け、前記入力画像のうち、選択された前記1以上の正しい原稿領域を除いた部分に含まれる原稿領域の指定を、前記第1のパターン内から選ぶ方法とは異なる方法で受け付ける第2受付処理を実行し、前記入力画像の中から、選択された前記1以上の正しい原稿領域の各々の画像と、前記異なる方法で指定された各原稿領域の画像と、を抽出する、ことを特徴とする情報処理装置である。
【0017】
請求項4に係る発明は、前記第2受付処理は、前記複数のパターンのうちの、選択された前記1以上の正しい原稿領域を含むパターン、の中から正しいパターンの選択を受け付ける処理である、請求項3に記載の情報処理装置である。
【0018】
請求項5に係る発明は、前記第2受付処理は、選択された前記1以上の正しい原稿領域を含むパターンの数が所定の閾値以下である場合に、それら前記1以上の正しい原稿領域を含むパターンを同時表示する画像であって、同時表示するパターンの各々に対応付けて、当該パターンを選択するためのUI部品を表示した画像、を前記画面に表示し、前記画面に表示された当該画像において前記ユーザが選択した前記UI部品に対応するパターンを前記正しいパターンとする、請求項4に記載の情報処理装置である。
【0019】
請求項6に係る発明は、前記第2受付処理は、選択された前記1以上の正しい原稿領域を除いた部分に含まれる原稿領域を特定する頂点又は辺の指定を受け付ける、請求項3に記載の情報処理装置である。
【0020】
請求項7に係る発明は、プロセッサを備え、プロセッサは、原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出し、前記表示制御は、前記複数のパターンのうちの第1のパターンを表示した画像を前記画面上に表示するための制御であり、前記プロセッサは、更に、前記画像に表示されている前記第1のパターンに含まれる原稿領域のうち1以上の誤っている原稿領域の選択を受け付け、前記入力画像のうち、選択された前記1以上の誤っている原稿領域に該当する部分に含まれる原稿領域の指定を、前記第1のパターン内から選ぶ方法とは異なる方法で受け付ける第2受付処理を実行し、前記入力画像の中から、前記第1のパターンのうち前記1以上の誤っている原稿領域を除いた残りの各原稿領域の画像と、前記異なる方法で指定された各原稿領域の画像と、を抽出する、ことを特徴とする情報処理装置である。
【0021】
請求項8に係る発明は、前記第2受付処理は、前記複数のパターンのうちの、選択された前記1以上の誤っている原稿領域を除いた残りの各原稿領域を含むパターン、の中から正しいパターンの選択を受け付ける処理である、請求項7に記載の情報処理装置である。
【0022】
請求項9に係る発明は、前記プロセッサは、前記画面に表示された前記入力画像に含まれる少なくとも1つの原稿領域を特定する頂点又は辺の指定を受け付け、前記入力画像の中から、指定された頂点又は辺により特定される前記少なくとも1つの原稿領域の画像を抽出する、ことを特徴とする請求項1に記載の情報処理装置である。
【0023】
請求項10に係る発明は、コンピュータを、原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出する、よう動作させるためのプログラムであって、前記表示制御は、前記複数のパターンを同時表示する画像を前記画面に表示するための制御であり、前記プログラムは、前記コンピュータを、前記入力画像から抽出された前記原稿領域の前記パターンの数が所定の閾値より大きい場合に、前記複数のパターンを同時表示する画像を前記画面に表示するための制御、とは別の表示制御を実行する、よう動作させるためのものであることを特徴とするプログラムである。
である。
請求項11に係る発明は、コンピュータを、原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出する、よう動作させるためのプログラムであって、前記表示制御は、前記複数のパターンのうちの第1のパターンを表示した画像を前記画面上に表示するための制御であり、前記プログラムは、前記コンピュータを、更に、前記画像に表示されている前記第1のパターンに含まれる原稿領域のうち1以上の正しい原稿領域の選択を受け付け、前記入力画像のうち、選択された前記1以上の正しい原稿領域を除いた部分に含まれる原稿領域の指定を、前記第1のパターン内から選ぶ方法とは異なる方法で受け付ける第2受付処理を実行し、前記入力画像の中から、選択された前記1以上の正しい原稿領域の各々の画像と、前記異なる方法で指定された各原稿領域の画像と、を抽出する、よう動作させるためのものであることを特徴とするプログラムである。
請求項12に係る発明は、コンピュータを、原稿を撮像した入力画像から抽出された原稿領域のパターンが複数ある場合に、それら複数のパターンを選択肢として画面に表示するための表示制御を実行し、前記表示制御による前記画面の表示に応じて、前記複数のパターンのうち正しいパターンの選択を受け付け、前記入力画像の中から、ユーザが選択した前記パターンに含まれる原稿領域の画像を抽出する、よう動作させるためのプログラムであって、前記表示制御は、前記複数のパターンのうちの第1のパターンを表示した画像を前記画面上に表示するための制御であり、前記プログラムは、前記コンピュータを、更に、前記画像に表示されている前記第1のパターンに含まれる原稿領域のうち1以上の誤っている原稿領域の選択を受け付け、前記入力画像のうち、選択された前記1以上の誤っている原稿領域に該当する部分に含まれる原稿領域の指定を、前記第1のパターン内から選ぶ方法とは異なる方法で受け付ける第2受付処理を実行し、前記入力画像の中から、前記第1のパターンのうち前記1以上の誤っている原稿領域を除いた残りの各原稿領域の画像と、前記異なる方法で指定された各原稿領域の画像と、を抽出する、よう動作させるためのものであることを特徴とするプログラムである。
【発明の効果】
【0024】
請求項1又は10に係る発明によれば、原稿を撮像した入力画像から抽出した原稿領域を単に表示する方式と比べて、正しい原稿領域が抽出されるためのユーザの操作負担を軽減することができる。
【0025】
更に、複数のパターンを切替表示する方式よりも、正しいパターンの選択のための画面切替の回数を減らすことができると共に、複数のパターンを同時表示するとパターン同士の視覚的区別が困難な場合には、同時表示以外の表示を行うことができる。
【0026】
請求項2に係る発明によれば、正しい原稿領域を一つ一つ選ぶ方式よりも、より少ない操作で、正しい原稿領域からなる正しいパターンを選択することができる。
【0028】
請求項3又は11に係る発明によれば、第1のパターンを表示した画像内で、そのパターン内の原稿領域のうち正しい原稿領域の選択を受けつつ、第1のパターン内の誤っている原稿領域は別の方法で指定を受け付けることができる。
【0029】
請求項4に係る発明によれば、複数のパターンのすべてから正しいパターンを選択するよりも、正しいパターンを選択するための操作の回数を減らすことができる。
【0030】
請求項5に係る発明によれば、複数のパターンを切替表示する方式よりも、正しいパターンの選択のための画面切替の回数を減らすことができる。正しい原稿領域を一つ一つ選ぶ方式よりも、より少ない操作で、正しい原稿領域からなる正しいパターンを選択することができる。
【0031】
請求項6又は9に係る発明によれば、選択された正しい原稿領域以外の原稿領域の特定をユーザから受け付けることができる。
【0032】
請求項7又は12に係る発明によれば、第1のパターンから選択された誤った原稿領域以外の原稿領域を正しいものとし、他の原稿領域を別の方法で指定を受け付けることができる。
【0033】
請求項8に係る発明によれば、複数のパターンのすべてから正しいパターンを選択するよりも、正しいパターンを選択するための操作の回数を減らすことができる。
【図面の簡単な説明】
【0034】
【
図1】情報処理装置が備えるコンピュータのハードウエア構成を例示する図である。
【
図2】情報処理装置のプロセッサが実行する処理手順の一部を例示する図である。
【
図3】情報処理装置のプロセッサが実行する処理手順の一部を例示する図である。
【
図4】情報処理装置のプロセッサが実行する処理手順の一部を例示する図である。
【
図5】情報処理装置のプロセッサが実行する処理手順の一部を例示する図である。
【
図6】パターンの抽出結果を示すデータの例を示す図である。
【
図7】プラテン上の原稿群の配置の一例を示す図である。
【
図9】プラテン上の原稿群の配置の別の例を示す図である。
【
図10】同時表示型のUI画面を例示する図である。
【
図11】同時表示型のUI画面で1つのパターンが選択された状態を示す図である。
【
図12】プラテン上の原稿群の配置の別の例を示す図である。
【
図13】切替表示型のUI画面を例示する図である。
【
図14】切替表示型のUI画面において1つの原稿領域が選択された状態を示す図である。
【
図15】切替表示型のUI画面に、選択された1つの原稿領域を持つ別のパターンが表示された状態を示す図である。
【
図16】切替表示型のUI画面において2つの原稿領域が選択された状態を示す図である。
【
図17】切替表示型のUI画面に、選択された2つの原稿領域を持つ別のパターンが表示された状態を示す図である。
【
図18】切替表示型のUI画面において表示されたすべての原稿領域が選択された状態を示す図である。
【
図19】プラテン上の原稿群の配置の別の例を示す図である。
【
図20】
図19に示したプラテンをスキャンしたときに表示されるUI画面を例示する図である。
【
図21】全選択ボタンの押下に応じて、表示された全ての原稿領域が選択状態となったUI画面を例示する図である。
【
図22】全選択された原稿領域のうちの1つの選択が解除されたときのUI画面を例示する図である。
【
図23】
図22と共通する選択状態の原稿領域を持つ別のパターンを表示したUI画面を例示する図である。
【
図24】
図23のUI画面の非選択状態の2つの原稿領域が選択された状態のUI画面を例示する図である。
【
図25】抽出された原稿領域の中に正しいものがない場合のUI画面を例示する図である。
【
図26】置換案内用のUI画面を例示する図である。
【
図27】矩形指定用のUI画面を例示する図である。
【
図28】矩形指定用のUI画面上で3つの頂点が選択された状態を例示する図である。
【
図29】矩形指定用のUI画面上で1つの原稿領域が確定した状態を例示する図である。
【発明を実施するための形態】
【0035】
<ハードウエア構成の例>
この実施形態の情報処理装置のハードウエア構成を
図1に示す。
図1に示す例は、情報処理装置がいわゆる複合機である場合のものである。複合機は、プリンタ、スキャナ、コピー機、ファクシミリ装置等の機能を併せ持つ装置である。複合機は、ローカルエリアネットワーク等のネットワーク経由でパーソナルコンピュータ等のクライアントからリクエストを受け付けたり、インターネット上のサーバ等と通信したりする機能を持つ場合もある。
【0036】
この情報処理装置は、例えば、
図2に示すように、ハードウエアとして、プロセッサ102、ランダムアクセスメモリ(RAM)等のメモリ(主記憶装置)104、フラッシュメモリやSSD(ソリッドステートドライブ)、HDD(ハードディスクドライブ)等の不揮発性記憶装置である補助記憶装置106を制御するコントローラ、各種の入出力装置108とのインタフェース、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース110等が、例えばバス112等のデータ伝送路を介して接続された回路構成を有する。入出力装置108の中には、例えば、タッチパネル等の表示装置兼入力装置やスピーカ等の音声出力装置、ユーザ認証用のカードリーダー等が含まれる。以上に説明した部分の回路構成は、汎用のコンピュータと同様のものでよい。
【0037】
また、情報処理装置は、バス112等を介してそのコンピュータ部分に接続されたスキャナ制御回路114、プリンタ制御回路116、ファクシミリ装置118等を備える。これらは、情報処理装置(この例では複合機)が備える各種の機能のためのものである。スキャナ制御回路114は、複合機が内蔵するスキャナや自動原稿送り装置を制御するための回路であり、プリンタ制御回路116は、複合機が内蔵するプリンタを制御するための回路である。また、ファクシミリ装置118は、複合機が持つファクシミリ送受信機能を担う装置である。
【0038】
情報処理装置のコンピュータ部分は、UI(ユーザインタフェース)のための処理、ネットワーク経由でのデータのやりとりの制御、スキャナ、プリンタ及びファクシミリ装置等の各種機能要素の制御のための情報処理を実行する。これら各種の情報処理の内容が記述されたプログラムが、ネットワーク等を経由してコンピュータにインストールされ、補助記憶装置106に保存される。補助記憶装置106に記憶されたプログラムが、プロセッサ102によりメモリ104を用いて実行されることにより、この実施形態の情報処理装置が実現される。
【0039】
ここでプロセッサ102とは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU:Central Processing Unit、等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、 ASIC:Application Specific Integrated Circuit、 FPGA:Field Programmable Gate Array、 プログラマブル論理デバイス、等)を含むものである。
【0040】
また、プロセッサ102の動作は、1つのプロセッサ102によってなすのみでなく、物理的に離れた位置に存在する複数のプロセッサ102が協働してなすものであってもよい。また、プロセッサ102の各動作は、以下の実施形態において説明する順序のみに限定されるものではなく、適宜に変更してもよい。
【0041】
本実施形態の処理は、情報処理装置が備える撮像機構(例えば、スキャナ制御回路114に接続されたスキャナ)により撮像された画像に対するものである。したがって、情報処理装置は、プリンタ及びこれを制御するプリンタ制御回路116やファクシミリ装置118等を含んでいなくてもよい。以下では、情報処理装置が複合機として実現されている場合を主たる例として説明するが、これはあくまで一例にすぎない。情報処理装置は、撮像機構を備えた装置であればよく、例えばスキャナ装置、キオスク端末、スマートフォン、タブレット端末、パーソナルコンピュータ等であってもよい。
【0042】
<原稿画像の抽出処理の例>
以下、
図2~
図5のフローチャートを参照して、スキャナでスキャン処理により得られたスキャン画像から原稿画像を抽出する処理の例を説明する。
【0043】
この処理は、ユーザが、情報処理装置に付属するスキャナのプラテン(すなわち原稿台)上に1以上の原稿を置き、情報処理装置に対して「マルチクロップ」処理の実行開始を指示すると開始される。なお、マルチクロップの対象となる原稿としては、例えば、名刺やレシート等がある(ただしこれらに限定されるものでない)。
【0044】
この処理では、
図2に例示するように、プロセッサ102は、まずスキャナ制御回路114を介してスキャナにスキャンを実行させる(S10)。これにより、プロセッサ102は、プラテン全面をスキャンした結果の画像(以下、スキャン画像と呼ぶ)を取得する。
【0045】
次にプロセッサ102は、スキャン画像から、その中に含まれる1以上の原稿領域を抽出する(S12)。原稿領域とは、スキャン画像のうち、プラテン上に置かれた原稿の画像(すなわち、原稿画像)の領域である。例えば、原稿がレシートの場合、レシートの画像を示す領域が原稿領域である。スキャン画像は、背景の画像(例えばプラテンを覆うカバーの画像)内に1以上の原稿画像が配置された画像であり、S12では、そのようなスキャン画像から原稿画像の領域、すなわち原稿領域を抽出するのである。一般に、原稿は矩形である場合が多いので、原稿領域のことを以下では「矩形」又は「矩形領域」とも呼ぶ。
【0046】
S12における原稿領域の抽出は、従来公知の技術を用いて行われる。このような技術としては、例えば、スキャン画像からエッジ抽出処理により抽出したエッジに基づいて個々の原稿領域を求める方式等がある。
【0047】
S12の原稿領域の抽出処理において、エッジ等から求められる原稿領域には、いくつかの可能性があることが少なくない。例えば、
図9に示した例では、プラテン10上に、幅が等しい2つの矩形の原稿12が、両側辺が同一直線上に並ぶように、互いに近接して配置されている。この状態をスキャンして得られるスキャン画像に対して原稿領域の抽出処理を行った場合、2つの原稿12に対応する2つの原稿領域からなるパターンだけでなく、それら2つの原稿12を一続きの1つの原稿領域とみるパターンも認識されることがある。2つの原稿12の境界がスキャン画像上にはっきり現れない場合、後者のパターンが認識される可能性が高い。そこで、原稿領域の抽出処理では、スキャン画像から認識した原稿領域のパターンに対して、そのパターンの確からしさを示すスコアを計算する。このスコアの計算処理には、従来のマルチクロップ処理で用いられている方法を利用すればよい。従来のマルチクロップ処理では、このスコアが最高値であるパターンを自動的に選び、そのパターンが示す各原稿領域の画像を抽出して出力していた。
【0048】
これに対して、本実施形態では、スコアが最高のパターンを自動的に選択するのではなく、ある程度スコアが高いパターンが複数ある場合に、それら複数のパターンをユーザに提示し、正しいパターンの選択をユーザに求める。
【0049】
図6に、S12の処理の結果、プロセッサ102がメモリ104内に作成したパターンの抽出結果データを例示する。この例の抽出結果データには、パターンごとに、パターン番号、スコア、領域数、領域ID、領域形状の情報を含む。パターン番号はパターンの通し番号である。スコアは上述のものである。領域数は、そのパターンが含む原稿領域の数であり、例えば、後述するS16の判定で参照される。領域IDは、S12で抽出された各原稿領域の識別情報である。領域形状は、対応する領域IDが示す原稿領域の矩形形状を規定する情報である。図示例では、矩形形状の情報は、矩形形状の3つの頂点の座標の組である。
図6に示す抽出結果データは、後述する
図10の例に示される抽出結果に対応している。例示したパターン番号1のパターンは、領域IDが1と2である2つの原稿領域からなるパターンである。
図6に示す例には含まれないが、同じ原稿領域が異なる複数のパターンに属することもある。
【0050】
プロセッサ102は、S12で求められた1以上のパターンの中から、あらかじめ定められたスコア閾値以上のスコアを持つパターンを抽出する(S14)。逆に言えば、スコアがスコア閾値以下のパターンは正解である可能性が著しく低いので、この段階で捨てる。
【0051】
次にプロセッサ102は、S14で抽出されたパターンの数が、1個であるか、2以上T個以下(Tは2以上の整数)であるか、(T+1)個以上であるか、を判定する(S16)。
【0052】
S16の判定結果が「1個」である場合の処理を、
図7及び
図8も参照しつつ説明する。
図7は、情報処理装置が備えるスキャナ機構のプラテン10上に2つの原稿12が互いに十分離れて置かれた状態を示している。このように個々の原稿12が十分離れて配置されている場合には、S12の処理により、すべての原稿12の原稿領域が的確に抽出され、スコアがスコア閾値以上である原稿領域のパターンは1つに絞られる。
【0053】
このようにS16の判定結果が「1個」の場合、プロセッサ102は、
図8に例示するUI画面200を、入出力装置108の一例である表示装置に表示させる(S18)。
図8に例示するUI画面200を、確認型UI画面と呼ぶ。このUI画面200には、スキャン画像210、切り出しボタン220、置き直しボタン222、矩形指定ボタン224、パターン数表示欄230が表示される。確認型UI画面は、求められたただ1つのパターンを表示し、そのパターンに従って原稿画像の抽出(図では「切り出し」と表現)を行うか否か、ユーザに確認を求めるために用いられる。
【0054】
スキャン画像210には、プラテン10上に置かれた原稿12の画像である原稿画像212が含まれる。また、スキャン画像210には、S12で抽出された原稿領域214が表示される。図示例では、原稿領域214は、当該原稿領域の外周を取り囲む枠線(図示例では矩形の枠線)の形態で示される。ただしこれは一例に過ぎない。この代わりに、例えば、二次元的な原稿領域全体を特定色で塗りつぶした画像を原稿領域214として用いてもよい。
【0055】
パターン数表示欄230には、S10で得たスキャン画像210中から抽出された原稿領域のパターンの数が表示される。
図7及び
図8の例では、ある程度確からしい(すなわちスコアがスコア閾値以上である)パターンが1個だけなので、パターン数表示欄230には「1」という値が表示される。
【0056】
切り出しボタン220は、スキャン画像210中から各原稿領域214の画像を切り出す、すなわち抽出する指示を受け付けるGUI(グラフィカルユーザインタフェース)部品である。例えば、情報処理装置が備える表示装置がタッチパネルとして構成されている場合、ユーザは、そのタッチパネル上に表示された切り出しボタン220に指で触れることで、切り出しボタン220を押下する。なお、
図8の切り出しボタン220に重なるように示した矢印は、切り出しボタン220が押下対象として選ばれたことを示している。
【0057】
置き直しボタン222は、ユーザがプラテン10上の原稿12群を置き直してスキャンをし直す場合に押下される。
【0058】
矩形指定ボタン224は、S12で抽出された原稿領域のパターンを破棄し、ユーザが原稿領域(この例では「矩形」)を手作業で指定する場合に押下される。
【0059】
プロセッサ102は、S18でUI画面200を表示した後、ユーザが切り出しボタン220、置き直しボタン222、矩形指定ボタン224のいずれを押下したか判定する(S20)。
【0060】
ユーザが切り出しボタン220を押下すると、プロセッサ102は、表示しているUI画面200に表示された唯一のパターンが示す各原稿領域214内の画像を抽出し、抽出した各画像をそれぞれ原稿画像として、ファイルに出力する(S22)。
【0061】
また、ユーザが置き直しボタン222を押下すると、プロセッサ102は、置き直し案内画面を表示装置に表示させ(S24)、置き直し案内画面の案内に従ってユーザが原稿を置き直してスキャン開始を指示するのを待つ(S26)。置き直し案内画面の具体例は、後で
図26を参照して説明する。
【0062】
ユーザが矩形指定ボタン224を押下すると、プロセッサ102は、矩形指定画面を表示装置に表示させ、その画面上でユーザから原稿領域の矩形の指定を受け付ける(S28)。矩形指定画面やS28の処理の具体例については、後で
図27~
図29を参照して説明する。
【0063】
S16の判定結果が「2~T個」である場合、プロセッサ102は、
図3に示す手順に進む。この場合、プロセッサ102は、表示装置に同時表示型UI画面を表示させる(S30)。同時表示型UI画面は、S14で抽出したスコアがスコア閾値以上であるパターンを1つのUI画面上に同時に表示する画面である。あまりに多数のパターンを1つの画面上で表示すると、人間から見て個々のパターンの区別がつきにくくなる。そこで、この例では、1画面上に表示しても人間が区別可能な上限のパターン数を閾値Tとし、S14で抽出されたパターンの数が2個以上T個以下であれば、同時表示型UI画面を用いることとした。
【0064】
図9に示す例では、スキャナのプラテン10上に、幅が等しい2つの矩形の原稿12が、両側辺が同一直線上に並ぶように、互いに近接して配置されている。既に簡単に説明したように、この例では、原稿領域の抽出処理により、2つの原稿12に対応する2つの原稿領域からなるパターンだけでなく、それら2つの原稿12を一続きの1つの原稿領域とみるパターンも認識されることがある。
【0065】
図10に、
図9に例示した状態のプラテン10をスキャンしたときに表示されるUI画面200(すなわち同時表示型UI画面)を例示する。この例では、UI画面200内のスキャン画像210上に、2つの原稿画像212の各々とほぼ同じ2つの矩形の原稿領域214aからなるパターン1と、それら2つの原稿画像212を合わせた1つの原稿領域214bからなるパターン2が同時に表示される。パターン1に属する各原稿領域と、パターン2に属する各原稿領域とは、互いに区別できるよう、異なる表示形態で表示される。図示例では、パターン1に属する各原稿領域214aは第1色の実線の枠線で、パターン2に属する原稿領域214bは第1色とは異なる第2色の破線の枠線で、それぞれ示されている。
【0066】
この例では、スキャン画像から認識されるパターンの数は2つであり、このパターン数「2」がパターン数表示欄230に表示されている。
【0067】
また、このUI画面200上には、
図8のUI画面200にもある切り出しボタン220、置き直しボタン222、矩形指定ボタン224に加え、「パターン1選択」ボタン226と「パターン2選択」ボタン228が表示される。「パターン1選択」ボタン226及び「パターン2選択」ボタン228は、それぞれ、ユーザからパターン1及びパターン2の選択を受け付けるためのGUI部品である。「パターン1選択」ボタン226は、スキャン画像210上のパターン1の各原稿領域214aの表示形態に対応する表示形態で表示され、「パターン2選択」ボタン229は、パターン2の原稿領域214bの表示形態に対応する表示形態で表示される。例えば、「パターン1選択」ボタン226はパターン1の原稿領域214aの表示色である第1色で、「パターン2選択」ボタン228はパターン2の原稿領域214bの表示色である第2色で表示される。
【0068】
このように、例示したUI画面200では、各パターンの原稿領域の表示形態と、それら各パターンを選択するためのボタンの表示形態とを、同じものまたは互いに対応するものとしている。これにより、パターンとボタンの対応付けが視覚的に分かりやすくなる。パターン及びこれに対応するボタンの表示形態には、上に例示した色の他に、原稿領域やボタンを囲む枠線の色や線種(例えば実線、破線等)、点滅表示の有無等もある。
【0069】
UI画面200上に表示された複数(
図10の例では2つ)のパターンの中に正しいパターンがあれば、ユーザは、UI画面200上の「正しいパターンを選択してください。」というメッセージに従い、正しいパターンに対応するボタン226又は228を押下する。
【0070】
プロセッサ102は、UI画面200に対するユーザの操作を検知した場合、その操作がパターンを選択するボタン226又は228の押下であるか、それとも他のボタン220、222又は224の押下であるかを判定する(S32)。なお、
図10のUI画面200を表示した時点では、同時表示された複数のパターンからユーザはどのパターンも選択していないので、切り出しボタン220が押下されても、それら複数のパターンのうちどのパターンに従って原稿画像を抽出してよいか分からない。したがって、S30の表示の時点では、切り出しボタン220を無効化しておいてもよい。
【0071】
S32でボタン226又は228が押下されたと判定した場合、プロセッサ102は、押下されたボタン226又は228に対応するパターンの各原稿領域を、スキャン画像210上で、「選択状態」(すなわち選択された状態)を示す表示態様で表示する(S34)。S34におけるUI画面200の表示例を、
図11に示す。この例はユーザが「パターン2選択」ボタン228を押下した場合の例である。この場合、スキャン画像210内のパターン2に属する2つの原稿領域214bの各々に対してチェックマーク215が表示される。これらチェックマーク215が、それら各原稿領域214bが選択状態であることを示す。S34の段階では、ユーザがパターンを選択しているので、切り出しボタン220を有効化(すなわち押下可能な状態に遷移)させる。選択状態とは、当該原稿領域をユーザが正しい原稿領域と判断したことを示す状態ともいえる。
【0072】
この後、プロセッサ102は、ユーザからの操作、すなわち、切り出しボタン220、置き直しボタン222、矩形指定ボタン224、パターンの選択のためのボタン226又は228の押下を待ち受ける。
【0073】
ユーザの操作を検知した場合、プロセッサ102は、その操作が切り出しボタン220の押下であるか判定する(S36)。この判定の結果がYesの場合、プロセッサ102は、スキャン画像210から、選択状態である各原稿領域内の画像を切り出して、ファイルに出力する(S38)。
【0074】
S36の判定結果がNoの場合、プロセッサ102は、ユーザの操作が置き直しボタン222の押下であるか否かを判定し(S40)、この判定の結果がYesの場合、
図2のS24の処理に進む。S40の判定結果がNoの場合、プロセッサ102は、ユーザの操作が矩形指定ボタン224の押下であるか否かを判定し(S42)、この判定の結果がYesの場合、
図2のS28の処理に進む。S42の判定結果がNoの場合、プロセッサ102は、S32に進み、ユーザの操作が、パターンを選択するボタン226又は228の押下であるかどうかを判定し、以降、既述の処理を実行する。
【0075】
S16の判定結果が「(T+1)個以上」である場合、プロセッサ102は、
図4に示す手順に進む。
図4の手順では、切替表示型UI画面を用いてユーザからの指示を受け付ける。以下では、一例としてT=2の場合の例を説明する。
【0076】
切替表示型UI画面は、当該画面内に1つのパターンのみを表示し、表示するパターンをユーザの操作で順次切り替えていくタイプの画面である。
【0077】
図12に示す例では、プラテン10上に3つの原稿12が配置されており、そのうちの右側の2つの原稿12は、両側辺が同一直線上に並ぶように、互いに近接して配置されている。この例では、
図2のS14で抽出されたパターンの数が5つであるとする。それら5つのパターンは、例えば、スコアが高い順に通し番号を付与してもよい。
【0078】
図13に、
図12に例示した状態のプラテン10をスキャンしたときに表示されるUI画面200(すなわち切替表示型UI画面)を例示する。この例では、UI画面200内のスキャン画像210上に、それら5つのパターンのうちの1つ(例えばスコアが最高値のもの)が表示される。このパターンは、左側の原稿画像212aを覆う原稿領域216aと、右側の2つの原稿画像212b及び212cを一続きに覆う原稿領域216bとからなる。
【0079】
S14で抽出された5つのパターンは、切替表示型のUI画面200に切替表示するパターンの候補である。これら候補のことを「切替候補」とよぶ。パターン数表示欄230内の表示内容「1/5」のうちの「/」の右側の「5」は切替候補のパターンの総数を示し、左側の「1」はそれら5つの切替候補のうち現在表示中のパターンの番号(例えば上述の通し番号)を示す。
【0080】
切替表示型のUI画面200には、前候補ボタン232、次候補ボタン234、全選択ボタン236、及び全解除ボタン238が表示される。前候補ボタン232は、UI画面200内に表示する切替候補のパターンを、現在表示中のパターンの1つ前の切替候補に切り替える指示を受け付けるボタンである。次候補ボタン234は、UI画面200内に表示する切替候補のパターンを、現在表示中のパターンの1つ後の切替候補に切り替える指示を受け付けるボタンである。全選択ボタン236は、現在表示中のパターンに含まれる全ての原稿領域を選択状態にする指示を受け付けるボタンであり、全解除ボタン238は、現在表示中のパターンに含まれる全ての原稿領域の選択状態を解除する指示を受け付けるボタンである。
【0081】
このUI画面200では、ユーザが原稿領域216a又は216bをタッチすると、タッチされた原稿領域216a又は216bが選択状態に遷移する。すなわち、ユーザは、表示されている原稿領域(すなわち、矩形)の中から、原稿画像にぴったり適合する正しい原稿領域を見つけると、その原稿領域にタッチすることにより、その原稿領域を選択する。また、選択状態の原稿領域216a又は216bをタッチすると、タッチされた原稿領域216a又は216bの選択状態が解除される。これにより、それまで選択状態であった原稿領域216a又は216bは、非選択状態に遷移する。
【0082】
図4の手順の説明に戻る。S16の判定結果が「(T+1)個以上」である場合、プロセッサ102は、S14で抽出したスコア閾値以上のスコアを持つパターンを切替候補に選定する(S50)。次にプロセッサ102は、
図13に例示したUI画面200を、表示装置に表示させる(S52)。この時点では、スキャン画像210上に示されたパターンに属する全ての原稿領域216a及び216bが非選択状態である。
【0083】
プロセッサ102は、そのUI画面200に対するユーザの操作を受け付けると、その操作が矩形、すなわち原稿領域216a又は216bの選択、又は解除を指示する操作であるか否かを判定する(S54)。S54の判定結果がYesの場合、プロセッサ102は、その選択又は解除の操作に応じ、原稿領域216a又は216bの状態を選択状態又は非選択状態に遷移させる。またこのときプロセッサ102は、前候補ボタン232又は次候補ボタン234の押下によりUI画面200に切り替え表示される切替候補のパターンを、現在選択状態にある原稿領域を含んだパターンのみに絞り込む(S56)。
【0084】
例えば、
図13に例示したUI画面200では、原稿領域216a及び216bはいずれも非選択状態であるが、ユーザが原稿領域216aをタッチすると、
図14に例示するように、原稿領域216aが選択状態に遷移する。
図14に例示するUI画面200では、スキャン画像210内の原稿領域216a上に、選択状態であることを示すチェックマーク215が表示されている。
図13の状態では切替候補は5つあったが、原稿領域216aの選択により、切替候補は、原稿領域216aを含むパターンに限定される。図示例では、そのようなパターンは3つである。
【0085】
S54の判定結果がNoの場合、プロセッサ102は、ユーザの操作が次候補ボタン234の押下であるか否かを判定する(S58)。この判定の結果がYesの場合、プロセッサ102は、スキャン画像210上に表示するパターンを次の切替候補へと切り替え(S60)、S52に戻る。
【0086】
例えば、
図14に例示したUI画面200上で、ユーザが次候補ボタン234を押下すると、
図15に例示するように、スキャン画像210上に次の、すなわち2番目の、切替候補のパターンが表示される。このパターンは、選択状態にある原稿領域216aの他に、原稿画像212bをぴったり覆う原稿領域216cと、原稿画像212cの下方の一部を覆う原稿領域216dからなる。原稿領域216dは、例えば、原稿画像212c内の濃度の分布等により原稿領域216dの上端に対応する部分にエッジがあると誤検出された結果と考えられる。
【0087】
S58の判定結果がNoの場合、プロセッサ102は、ユーザの操作が前候補ボタン232の押下であるか否かを判定する(S62)。この判定の結果がYesの場合、プロセッサ102は、スキャン画像210上に表示するパターンを1つ前の切替候補へと切り替え(S64)、S52に戻る。
【0088】
S62の判定結果がNoの場合、プロセッサ102は、ユーザの操作が全選択ボタン236の押下であるか否かを判定する(S66)。この判定の結果がYesの場合、プロセッサ102は、表示中のパターンに属する全ての矩形、すなわち原稿領域を選択状態に遷移させ(S68)、S52に戻る。また、プロセッサ102は、切替候補を、それら全ての原稿領域を含んだパターンのみに限定する。
【0089】
S66の判定結果がNoの場合、プロセッサ102は、ユーザの操作が全解除ボタン238の押下であるか否かを判定する(S70)。この判定の結果がYesの場合、プロセッサ102は、表示中のパターンに属する全ての矩形、すなわち原稿領域を非選択状態に遷移させ(S72)、S52に戻る。また、プロセッサ102は、切替候補の集合を、S50で選定した時点のものに戻す。
【0090】
S70の判定結果がNoの場合、
図5に示すように、プロセッサ102は、ユーザの操作が切り出しボタン220の押下か否かを判定する(S74)。この判定の結果がNoの場合、プロセッサ102は、ユーザの操作が置き直しボタン222の押下であるか否かを判定し(S84)、この判定の結果がYesの場合、
図2のS24の処理に進む。S84の判定結果がNoの場合、プロセッサ102は、ユーザの操作が矩形指定ボタン224の押下であるか否かを判定し(S86)、この判定の結果がYesの場合、
図2のS28の処理に進む。S86の判定結果がNoの場合、プロセッサ102は、S54に進み、ユーザの操作が、原稿領域の選択又は解除の操作であるかどうかを判定し、以降、既述の処理を実行する。
【0091】
S74の判定結果がYesの場合、プロセッサ102は、表示中のパターンに含まれる原稿領域の中に非選択状態のものがあるか否かを判定する(S76)。この判定の結果がNoの場合(すなわちそのパターン内の全ての原稿領域が選択状態である場合)、プロセッサ102は、スキャン画像210から、選択状態である各原稿領域内の画像を抽出し、ファイルに出力する(S82)。
【0092】
S76の判定結果がYesの場合、プロセッサ102は、非選択状態の原稿領域の画像については、切り出しすなわち抽出が行われない旨の警告と、切り出しを行ってよいかの問合せと、を含んだダイアログをUI画面200上に表示する(S78)。プロセッサ102は、このダイアログに対してユーザが入力した回答が「OK」(すなわち、切り出しを行ってよい)であるか否かを判定する(S80)。この判定の結果がYesの場合、スキャン画像210から、選択状態である各原稿領域内の画像を抽出し、ファイルに出力する(S82)。S78及びS80は、情報処理装置が抽出した原稿領域の中に、ユーザにとって不要なものがある場合を考慮に入れた処理である。例えば、プラテン10の汚れ等により本来原稿が存在しない部分に画像が生じ、その画像を含む部分が原稿領域と認識されてしまった場合には、その原稿領域の画像はそもそも抽出する必要がない。
【0093】
S80の判定の結果がNoの場合、プロセッサ102は、S52に戻ってUI画面200を表示し、ユーザからの更なる操作を受け付ける。
【0094】
図4及び
図5の処理において、例えば
図15に示したUI画面200上でユーザが原稿領域216cを選択すると、
図16に示すように、原稿領域216c上に、選択状態であることを示すチェックマーク215が表示される。また、この選択の結果、切替候補は、選択状態である原稿領域216a及び216cを含んだ2つのパターンに絞り込まれる。
図16のUI画面200上でユーザが次候補ボタン234を押下すると、
図17に例示する次の切替候補のパターンが表示される。このパターンは、上述の原稿領域216a及び216cに加え、原稿画像212cをぴったりと覆う原稿領域216eを含んでいる。
【0095】
図17のUI画面200上でユーザが原稿領域216eを選択すると、
図18に示すように、原稿領域216e上に、選択状態であることを示すチェックマーク215が表示される。このあと、ユーザが切り出しボタン220を押下すると、プロセッサ102は、S82にて、選択状態の原稿領域216a、216c、216eの画像を切り出し、切り出した各画像をそれぞれファイルに出力する。
【0096】
図12~
図18に示した例では、表示されているパターンの中からユーザが正しい原稿領域を選択することにより切替候補のパターンを絞り込み、最終的に正しいパターンにたどり着いた。しかし、切替候補のパターンが少数であれば、前候補ボタン232や次候補ボタン234を押下して全てのパターンを順に調べ、正しいパターンを見つけ出すこととしてさほど手間は掛からない。
【0097】
また、
図16及び
図17に示した例では、切替候補のパターン数が2つという十分小さい数に絞り込まれた時点でも、切替表示型のUI画面200を表示したが、これは一例に過ぎない。別の例として、ユーザによる原稿領域群の選択の結果、絞り込まれた切替候補のパターン数がT個以下になった時点で、プロセッサ102は、表示するUI画面200を同時表示型(
図10参照)のものに切り替えてもよい。この時点で残った切替候補のパターン同士の間では、選択状態である原稿領域群は共通している。そこで、非選択状態の原稿領域についてのみ、
図10に例示した異なるパターン間で表示形態の区別を行うようにしてもよい。
【0098】
次に、全選択ボタン236の利用シーンの例を説明する。
図19に例示するように、プラテン10上に多数の原稿12が比較的密な状態で配置されている場合、S14で抽出されるパターンの数がかなり大きい数となる場合がある。そのパターン数は仮に15であり、
図4のS50の後に最初に表示されるUI画面200が
図20に示すものであったとする。このように原稿の数や切替候補の数が多い場合、次候補ボタン234等を用いて全ての切替候補を順に調べる方法でも、正しい原稿領域218a等を順に1つずつ選んで切替候補を絞り込んでいく方向でも、正しいパターンにたどり着くのに時間がかかる。
【0099】
図20の例の場合、ユーザは、UI画面200上に表示されたパターンの各原稿領域218a、218b、・・・218h、218iと各原稿画像212a、212b、・・・212i、218jとを目視で確認する。これにより、ユーザは、原稿領域218iは、2つの原稿画像212i及び212jの両方を一続きで覆っているため誤っていることを知る。またユーザは、他の原稿領域218a、218b、・・・、218hは、それぞれ1つの原稿画像212a、212b、・・・、212hにぴったり適合しており、正しいものであることを知る。これらのことから、ユーザは、原稿画像212a、212b、・・・、212hは正しいものとして採用し、原稿領域218iだけを修正すればよいと判断する。
【0100】
そこでユーザは、全選択ボタン236を押下することにより、表示中のパターン内の全ての原稿領域218a、218b、・・・、218h、218iをいったん選択してしまう。これにより、UI画面200は
図21に示すものに変化する。このとき、切替候補の数は1個である。ユーザは、このUI画面200上で原稿領域218iにタッチすることで、原稿領域218iの選択状態を解除する。これにより、UI画面200は
図22に示すものに変化する。原稿領域218iが非選択状態となったことにより、切替候補の数が2個に増えている。ユーザは、もう一つの切替候補のパターンを確認するために、次候補ボタン234を押下する。これにより、UI画面200は
図23に示すものに変化する。
図23に示すUI画面200に示されるパターンには、原稿画像212iにぴったり適合する原稿領域218jと、原稿画像212jにぴったり適合する原稿領域218kが含まれる。ユーザが、それら2つの原稿領域218j及び218kを選択すると、UI画面200は
図24に示すものへと変化する。このUI画面200上でユーザが切り出しボタン220を押下すると、プロセッサ102は、選択状態の各原稿領域218a、218b、・・・、218h、219j、218k内の画像を切り出し、それぞれファイルに出力する。
【0101】
図19~
図24を参照して説明した例は、誤っている原稿領域は1つだけであったが、選択状態にある原稿領域のうち誤っているものが複数ある場合は、それら誤っているものを全て選択してもよい。この場合、プロセッサ102は、スキャン画像210のうち、それら選択された複数の原稿領域からなる部分を未確定部分とする。あるいは、プロセッサ102は、スキャン画像から「誤っている原稿領域の選択の後で選択状態(すなわち正しいもの)のまま残った原稿領域群」を除いた残りの部分を、未確定部分としてもよい。そして、プロセッサ102は、その未確定部分内の原稿領域の指定をユーザから受け付ける。例えば、プロセッサ102は、S14で抽出された各パターンのうち、選択状態のまま残った原稿画像群を含むパターンを切替候補としてユーザに提示し、それら切替候補の中からユーザの選択を受け付ける。この場合、ユーザに提示される切替候補同士の間では、未確定部分内の原稿領域は互いに異なるが、選択状態の原稿領域は共通である。この場合、UI画面200内のその未確定部分内に表示される原稿領域は、選択状態の原稿領域群を含んだパターン(すなわち切替候補)に含まれるものである。しかし、別の例として、S14で抽出されたパターンのうち選択状態の原稿領域群を含まないパターンに属する原稿領域であって、かつ未確定部分に内包される原稿領域を、正しい原稿領域の候補としてUI画面200上に表示し、ユーザから選択を受け付けてもよい。
【0102】
また、UI画面200が最初に表示された時点で、その中に表示されたパターンの全ての原稿領域を選択状態(すなわち「全選択」の状態)としておき、その状態から誤っている原稿領域をユーザに選択させてもよい。
【0103】
次に、置き直しボタン222及び矩形指定ボタン224の利用シーンを例示する。
【0104】
図25に示すUI画面200の例は、S12及びS14にて抽出された原稿領域のパターンの中に、正しいものが1つもない場合の例である。パターン1は2つの原稿画像212aと212bの両方を内包する1つの大きい矩形の原稿領域219aからなり、パターン2は原稿画像212aを下方に拡張した原稿領域219b-1と、原稿画像212bを部分的に覆う原稿領域219b-2からなる。原稿画像212a及び212bのエッジの曖昧さやそれら画像の濃度分布、プラテン10の汚れ等が相まって、このように原稿画像212a及び212bのどの1つにも適合しない原稿領域が抽出されることもある。
【0105】
この例では、抽出されたパターンが2つなので、同時表示型のUI画面200が採用されており、その画面内には「パターン1選択」ボタン226及び「パターン2選択」ボタンが表示されている。しかし、どちらのパターンも正しくないので、それらボタンを押下しても正しいパターンは選べない。
【0106】
この場合ユーザは、置き直しボタン222を押下してプラテン10上の原稿群を置き直すか、矩形指定ボタン224を押下してUI画面200上で矩形すなわち原稿領域を直接指定するかの操作を行う。
【0107】
ユーザが置き直しボタン222を押下した場合、プロセッサ102は、
図26に例示する置き直し案内用のUI画面200Aを表示する(
図2のS24)。この画面には、案内情報240が表示される。案内情報240には、ユーザが行うべき作業を表す「原稿を置き直して、再スキャンしてください。」とのメッセージと、その作業についての注意事項(例えば原稿同士を所定距離以上離すべきこと)の既述が含まれる。ユーザは、この案内情報240を参考にして、プラテン10上の原稿を置き直し、再度スキャンの実行を指示する。スキャン実行の指示を受けると(
図2のS26の判定結果がYes)、プロセッサ102は、
図2のS10以降のステップを再度実行する。
【0108】
図25に例示したUI画面200上で、ユーザが矩形指定ボタン224を押下した場合、プロセッサ102は、
図27に示す矩形指定用のUI画面200Bを表示し、ユーザからの操作を受け付け、その操作に応じて矩形すなわち原稿領域を確定していく(
図2のS28)。
【0109】
ユーザが矩形指定ボタン224を押下した直後に表示されるUI画面200Bのスキャン画像210には、原稿領域は1つも表示されていない。またこのUI画面200Bには、矩形指定の方法を示す説明文252、矩形数表示欄254、キャンセルボタン256及びやり直しボタン258が表示される。説明文252に示される矩形指定の方法は、矩形の4つの頂点のうちの任意の3つを、時計回りの順序で選択するという方法である。矩形数表示欄254には、ユーザの操作に応じて既に確定している又は選択済みの矩形(すなわち原稿領域)の数が表示される。
図27のUI画面200Bの表示の時点では、矩形は1つも確定していないので、矩形数表示欄254内に表示される矩形数は0である。
【0110】
キャンセルボタン256は、ユーザによる頂点の選択を取り消す指示のためのボタンである。例えば、ユーザが、第1の頂点を選択した後第2の頂点を選択し、その直後にキャンセルボタン256を押下すると、第2の頂点の選択が取り消され、更にもう一度キャンセルボタン256を押下すると、第1の頂点の選択も取り消される。やり直しボタン258は、スキャン画像210上での頂点の選択、及びそれに伴う原稿領域の確定を全てクリアするためのボタンである。
【0111】
ユーザは、スキャン画像210を見て原稿画像212a又は212bを認識し、認識した原稿画像212a又は212bの矩形の頂点を1つずつ、時計回りに選択していく。この選択は、例えば、タッチパネルに表示されたスキャン画像210内の原稿画像の頂点を指でタッチするという操作により行う。プロセッサ102は、選択された頂点のスキャン画像210内での座標を記憶すると共に、スキャン画像210上のその座標に、選択された頂点を示すマーク(図では、円)を表示する。
図27に表示した段階では、ユーザは、原稿画像212aの1つ目の頂点250aを選択済みである。この後ユーザは、時計回りに、原稿画像212aの2つ目及び3つ目の頂点250b及び250cを順に選択していく(
図28参照)。プロセッサ102は、選択された頂点の数が3つになると、それら3つの頂点の座標から一意に特定される矩形を、
図29に示すように1つの原稿領域219cとして確定し、確定した原稿領域219cの情報をメモリ104に記憶する。
図29に示すUI画面200B上では、確定された原稿領域219cが枠線で示され、更に選択状態(すなわち確定済み)であることを示すチェックマーク215がその領域内に表示されている。その後ユーザは、2つ目の原稿画像212bを示す矩形の3つの頂点を順に選択していく。
図29は、そのうちの1つ目の頂点250dが選択された時点の状態を示している。
【0112】
以上の例は、ユーザが原稿画像の矩形の3つの頂点を選択することでその矩形を特定するものであったが、これは一例にすぎない。この代わりに、例えば、ユーザがUI画面200B上の原稿画像の隣り合う2つの辺を指でなぞる操作により、その原稿画像の矩形を特定してもよい。
【0113】
図25~
図29を参照して説明した例は、原稿領域の抽出処理により抽出された原稿領域の中に正しい原稿領域が1つもない場合の例であった。しかし、矩形指定は、このような場合に限らず、任意の時点で実行可能である。例えば、
図16に例示した2つの原稿領域216a及び216cを選択した状態で、前候補ボタン232又は次候補ボタン234を押下して残りのパターンを全て調べても、原稿画像212cにぴったり適合する原稿領域を含んだパターンが見つからない場合に、矩形指定により原稿画像212cの原稿領域の矩形を指定してもよい。すなわち、この場合、プロセッサ102は、選択状態の各原稿領域の情報をメモリ104内に保持しつつ、ユーザが選択した頂点群に基づいて新たな原稿領域を認識し、メモリ104に追加して記憶する。
【0114】
以上、本発明の実施の形態を説明した。上述の実施の形態はあくまで一例に過ぎない。本発明の範囲内で様々な変形や改良が可能である。例えば、複数の原稿が並べられた面をスマートフォンのカメラで撮像し、これにより得られた画像に対して、スマートフォンにインストールされたアプリケーションが以上に説明した処理と同様の処理を行う例も考えられる。
【符号の説明】
【0115】
10 プラテン、12 原稿、102 プロセッサ、104 メモリ、106 補助記憶装置、108 入出力装置、110 ネットワークインタフェース、112 バス、114 スキャナ制御回路、116 プリンタ制御回路、118 ファクシミリ装置、200 UI画面、210 スキャン画像、212 原稿画像、214,216 原稿領域、220 切り出しボタン、222 置き直しボタン、224 矩形指定ボタン、226 「パターン1選択」ボタン、228 「パターン2選択」ボタン、230 パターン数表示欄、232 前候補ボタン、234 次候補ボタン、236 全選択ボタン、238 全解除ボタン。