特許第6606885号(P6606885)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

<>
  • 特許6606885-画像処理装置及び画像処理プログラム 図000002
  • 特許6606885-画像処理装置及び画像処理プログラム 図000003
  • 特許6606885-画像処理装置及び画像処理プログラム 図000004
  • 特許6606885-画像処理装置及び画像処理プログラム 図000005
  • 特許6606885-画像処理装置及び画像処理プログラム 図000006
  • 特許6606885-画像処理装置及び画像処理プログラム 図000007
  • 特許6606885-画像処理装置及び画像処理プログラム 図000008
  • 特許6606885-画像処理装置及び画像処理プログラム 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6606885
(24)【登録日】2019年11月1日
(45)【発行日】2019年11月20日
(54)【発明の名称】画像処理装置及び画像処理プログラム
(51)【国際特許分類】
   G06F 17/24 20060101AFI20191111BHJP
   G06F 17/22 20060101ALI20191111BHJP
   G06K 9/20 20060101ALI20191111BHJP
【FI】
   G06F17/24 680
   G06F17/22 694
   G06K9/20 340J
   G06K9/20 340C
   G06F17/22 617
【請求項の数】4
【全頁数】15
(21)【出願番号】特願2015-130705(P2015-130705)
(22)【出願日】2015年6月30日
(65)【公開番号】特開2017-16290(P2017-16290A)
(43)【公開日】2017年1月19日
【審査請求日】2018年2月28日
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士ゼロックス株式会社
(74)【代理人】
【識別番号】100115129
【弁理士】
【氏名又は名称】清水 昇
(74)【代理人】
【識別番号】100102716
【弁理士】
【氏名又は名称】在原 元司
(74)【代理人】
【識別番号】100122275
【弁理士】
【氏名又は名称】竹居 信利
(72)【発明者】
【氏名】市田 一
【審査官】 長 由紀子
(56)【参考文献】
【文献】 特開2015−005100(JP,A)
【文献】 特開平07−028792(JP,A)
【文献】 特開2010−182039(JP,A)
【文献】 特開2002−292962(JP,A)
【文献】 特開平10−040312(JP,A)
【文献】 特開平09−231291(JP,A)
【文献】 特開2010−122893(JP,A)
【文献】 特開2007−242021(JP,A)
【文献】 米国特許第07788579(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/20−28
G06Q 10/00−99/00
G06K 9/20
(57)【特許請求の範囲】
【請求項1】
複数の画像情報から、ユーザーが記入した文字を識別する記入文字識別手段、
複数の前記画像情報から、文字記入欄を識別する文字記入欄識別手段、
配置位置の異なる文字記入欄毎の文字記入量を取得する文字記入量取得手段、
前記文字記入欄毎の大きさに関する情報を取得する大きさ情報取得手段、
文字記入欄毎の文字記入量と大きさに関する情報に応じて、該文字記入欄の大きさを調整する調整手段、
を有し、
前記調整手段は、前記文字記入欄内の文字記入量が予め定められた閾値より少ない又は以下である場合は、該文字記入欄を削除すること、又は該削除の提案をすることを行う、
画像処理装置。
【請求項2】
前記文字記入量取得手段が取得する文字記入量として、文字数、文字の大きさ、各文字を囲む矩形の大きさの合計値、複数の前記画像情報における文字記入量の統計値、のいずれか1つ以上を用いる、
請求項1に記載の画像処理装置。
【請求項3】
前記文字記入欄の周辺の余白領域を識別する余白領域識別手段
を有し、
前記調整手段は、前記文字記入欄を大きくする場合は余白領域方向に拡大する、
請求項1又は2に記載の画像処理装置。
【請求項4】
コンピュータを、
複数の画像情報から、ユーザーが記入した文字を識別する記入文字識別手段、
複数の前記画像情報から、文字記入欄を識別する文字記入欄識別手段、
配置位置の異なる文字記入欄毎の文字記入量を取得する文字記入量取得手段、
前記文字記入欄毎の大きさに関する情報を取得する大きさ情報取得手段、
文字記入欄毎の文字記入量と大きさに関する情報に応じて、該文字記入欄の大きさを調整する調整手段、
として機能させ
前記調整手段は、前記文字記入欄内の文字記入量が予め定められた閾値より少ない又は以下である場合は、該文字記入欄を削除すること、又は該削除の提案をすることを行う、
画像処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置及び画像処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、テンプレート自動生成システムにおいて、ユーザーの好みに合ったページを作成することができるテンプレートを自動的に生成することを課題とし、サンプルページ記憶部には、ユーザーの好みに合ったサンプルページが複数枚格納されており、テンプレート抽出手段は、サンプルページ記憶部に格納されているサンプルページの内の、複数枚のサンプルページにおいてほぼ同一位置に配置され、且つ内容が同一の構成要素を内容一致構成要素として抽出すると共に、上記複数枚のサンプルページにおいてほぼ同一位置に配置され、内容が異なる構成要素を内容不一致構成要素として抽出し、抽出した内容一致構成要素を、その内容一致構成要素のサンプルページ上の配置位置に応じた位置に配置し、内容不一致構成要素の記入欄を、内容不一致構成要素のサンプルページ上に於ける配置位置に応じた位置に配置したテンプレートを生成することが開示されている。
【0003】
特許文献2には、帳票の予め記載されている文字の領域と、ユーザーが文字を記入できる領域とが、高い精度で区分けされたテンプレートを生成することを課題とし、文字識別部は、複数の帳票の画像情報から、帳票に予め記載されている固定文字と、ユーザーが記入した記入文字とを識別し、領域識別部は、文字識別部によって識別された固定文字と記入文字とに基づいて、ユーザーが帳票に文字を記入できる記入領域と、ユーザーが帳票に文字を記入できない非記入領域とを識別し、生成部は、領域識別部によって識別された記入領域と非記入領域とに基づいて、帳票のテンプレートを生成することが開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2001−312490号公報
【特許文献2】特開2015−005100号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
既存のページや帳票からテンプレートを生成することが行われている。
一方で、既存のページや帳票におけるユーザーの記入領域に記入された文字の記入量に着目して記入領域の大きさを変更したテンプレートを生成することは行われていない。
本発明は、画像情報からテンプレートを生成する際に、ユーザーが文字を記入できる文字記入欄における文字記入量に応じて文字記入欄の大きさを調整する画像処理装置及び画像処理プログラムを提供することを目的としている。
【課題を解決するための手段】
【0006】
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、複数の画像情報から、ユーザーが記入した文字を識別する記入文字識別手段、複数の前記画像情報から、文字記入欄を識別する文字記入欄識別手段、配置位置の異なる文字記入欄毎の文字記入量を取得する文字記入量取得手段、前記文字記入欄毎の大きさに関する情報を取得する大きさ情報取得手段、文字記入欄毎の文字記入量と大きさに関する情報に応じて、該文字記入欄の大きさを調整する調整手段、を有し、前記調整手段は、前記文字記入欄内の文字記入量が予め定められた閾値より少ない又は以下である場合は、該文字記入欄を削除すること、又は該削除の提案をすることを行う、画像処理装置である。
【0007】
請求項2の発明は、前記文字記入量取得手段が取得する文字記入量として、文字数、文字の大きさ、各文字を囲む矩形の大きさの合計値、複数の前記画像情報における文字記入量の統計値、のいずれか1つ以上を用いる、請求項1に記載の画像処理装置である。
【0008】
請求項3の発明は、前記文字記入欄の周辺の余白領域を識別する余白領域識別手段を有し、前記調整手段は、前記文字記入欄を大きくする場合は余白領域方向に拡大する、請求項1又は2に記載の画像処理装置である。
【0010】
請求項の発明は、コンピュータを、複数の画像情報から、ユーザーが記入した文字を識別する記入文字識別手段、複数の前記画像情報から、文字記入欄を識別する文字記入欄識別手段、配置位置の異なる文字記入欄毎の文字記入量を取得する文字記入量取得手段、前記文字記入欄毎の大きさに関する情報を取得する大きさ情報取得手段、文字記入欄毎の文字記入量と大きさに関する情報に応じて、該文字記入欄の大きさを調整する調整手段、として機能させ、前記調整手段は、前記文字記入欄内の文字記入量が予め定められた閾値より少ない又は以下である場合は、該文字記入欄を削除すること、又は該削除の提案をすることを行う、画像処理プログラムである。
【発明の効果】
【0011】
請求項1の画像処理装置によれば、既存のページや帳票における要素の配置の類似性に基づきテンプレートを生成する構成に比して、ユーザーが文字を記入できる文字記入欄における文字記入量に応じて文字記入欄の大きさを調整することができる。また、文字記入欄内の文字記入量が予め定められた閾値より少ない又は以下である場合は、その文字記入欄を削除すること、又はその削除の提案をすることができる。
【0012】
請求項2の画像処理装置によれば、文字記入量として、文字数、文字の大きさ、各文字を囲む矩形の大きさの合計値、複数の画像情報における文字記入量の統計値、のいずれか1つ以上を用いることができる。
【0013】
請求項3の画像処理装置によれば、余白領域を識別し、文字記入欄を大きくする場合は余白領域方向に拡大することができる。
【0015】
請求項5の画像処理プログラムによれば、既存のページや帳票における要素の配置の類似性に基づきテンプレートを生成する構成に比して、ユーザーが文字を記入できる文字記入欄における文字記入量に応じて文字記入欄の大きさを調整することができる。また、文字記入欄内の文字記入量が予め定められた閾値より少ない又は以下である場合は、その文字記入欄を削除すること、又はその削除の提案をすることができる。
【図面の簡単な説明】
【0016】
図1】本実施の形態の構成例についての概念的なモジュール構成図である。
図2】本実施の形態を利用したシステム構成例を示す説明図である。
図3】本実施の形態による処理例を示すフローチャートである。
図4】文字記入欄情報テーブルのデータ構造例を示す説明図である。
図5】本実施の形態による処理例を示す説明図である。
図6】本実施の形態による処理例を示す説明図である。
図7】本実施の形態による処理例を示す説明図である。
図8】本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
【発明を実施するための形態】
【0017】
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることを言い、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
【0018】
本実施の形態である画像処理装置100は、文書の型(フォーム、テンプレート、ひな型、帳票等とも言われる。以下、フォームとも言う)を生成するものであって、図1の例に示すように、画像受付モジュール110、記入文字・欄識別モジュール120、文字記入量取得モジュール135、記入欄情報取得モジュール140、調整モジュール145を有している。
フォームは、一般的に、記入欄(枠とも言われる)を含んで構成されている。その記入欄に、ユーザーが手書きで文字等を記入する。
フォームによっては、ユーザーにとって記入量が多いため記入欄としては小さく、その記入欄には多くの情報を小さく書き込む必要がある。
しかし、前述の従来技術によって生成されるものは、記入済み文書と同じテンプレートとなるために、記入欄が小さいという不満を解消させるためにはテンプレートの作り直しが必要になる。例えば、フォーム文書としてアンケート用紙があり、そのアンケート用紙にユーザーに手書きで記入してもらうことがある。街頭で、そのアンケート用紙を用いてアンケートを行い、途中で記入済みのアンケート用紙を回収して、その中にある記入欄が小さいことに気がついた場合であっても、街頭においては(フォーム文書を編集するためのパーソナルコンピュータがない場合が多いので)アンケート用紙を変更することは困難である。
そこで、本実施の形態では、複数の記入済みのフォーム画像から、文字記入欄の大きさを調整する。具体的な例をもって示すと、午前中に実施したアンケート用紙を回収して、現場にて、アンケート用紙を適切な文字記入欄の大きさに変更し、午後には、その調製後のアンケート用紙を用いてアンケートを行うことができる。このように、元のフォーム文書のデータがなくても、フォーム文書内の文字記入欄の大きさの調整を可能としている。
【0019】
画像受付モジュール110は、記入文字・欄識別モジュール120と接続されている。画像受付モジュール110は、画像を受け付けて、その画像を記入文字・欄識別モジュール120へ渡す。画像を受け付けるとは、例えば、スキャナー、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、フォームに文字が記入されたものであって、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。ここでのフォームには、文字記入欄が記載されており、その文字記入欄にはユーザーによって手書きの文字が記入されている。具体的には、前述したような記入済みのアンケート用紙等が該当する。
【0020】
記入文字・欄識別モジュール120は、記入文字識別モジュール125、文字記入欄識別モジュール130を有しており、画像受付モジュール110、文字記入量取得モジュール135、記入欄情報取得モジュール140と接続されている。画像受付モジュール110が受け付けた画像情報から、ユーザーが記入した文字と文字記入欄を判別する。つまり、元のフォーム画像部分(文字記入欄等を含む)とユーザーが書き加えた部分に分ける。例えば、複数の画像の論理演算(AND演算)を行って、フォーム画像部分を抽出するようにしてもよいし、論理演算(EOR演算)を行って、書き加えた部分を抽出するようにしてもよい。また、矩形である文字記入欄を抽出し、その文字記入欄内の画像を、ユーザーが書き加えた部分として抽出し、それ以外の部分をフォーム画像部分として抽出するようにしてもよい。これらは既存の技術を用いて行ってよい。
記入文字識別モジュール125は、画像受付モジュール110が受け付けた複数の画像情報から、ユーザーが記入した文字を識別する。つまり、前述のユーザーが書き加えた部分をユーザーが記入した文字とする。
文字記入欄識別モジュール130は、画像受付モジュール110が受け付けた複数の画像情報から、文字記入欄を識別する。つまり、前述のフォーム画像部分から、矩形を識別し、文字記入欄とする。
【0021】
文字記入量取得モジュール135は、記入文字・欄識別モジュール120、調整モジュール145と接続されている。文字記入量取得モジュール135は、配置位置の異なる文字記入欄毎の文字記入量を取得する。文字記入欄は、画像受付モジュール110が受け付ける画像は、フォームにユーザーが記入した文書であるので、複数の画像情報内でほぼ同一位置に配置されている。したがって、「配置位置の異なる文字記入欄」とは、フォームにおける各記入欄に該当する。
また、文字記入量取得モジュール135が取得する文字記入量として、文字数、文字の大きさ、各文字を囲む矩形の大きさの合計値、複数の画像情報における文字記入量の統計値、のいずれか1つ以上を用いるようにしてもよい。「文字数」として、例えば、文字認識技術を用いて、認識結果の文字数を計数してもよい。「文字の大きさ」として、文字の黒画素数としてもよい。「文字を囲む矩形」は、一般的には外接矩形と言われているものである。「文字記入量の統計値」とは、各画像情報内の文字記入欄毎における文字記入量に対して、統計的処理を施した値であり、例えば、合計値、平均値、中央値、最頻値等がある。
記入欄情報取得モジュール140は、記入文字・欄識別モジュール120、調整モジュール145と接続されている。記入欄情報取得モジュール140は、文字記入欄毎の大きさに関する情報を取得する。「大きさに関する情報」として、例えば、文字記入欄の面積、文字記入欄の高さ、文字記入欄の幅等がある。以下、面積を例示して説明する。
【0022】
調整モジュール145は、文字記入量取得モジュール135、記入欄情報取得モジュール140と接続されている。調整モジュール145は、文字記入欄毎の文字記入量と大きさに関する情報に応じて、その文字記入欄の大きさを調整する。例えば、文字記入量と面積との比率によって、文字記入欄の大きさを調整すればよい。より具体的には、記入欄情報取得モジュール140によって取得された面積を文字記入量取得モジュール135で取得した文字記入量で除算した値が、予め定められた閾値より小さい又は以下である場合は、その文字記入欄を大きくするように調整する。逆に、除算した値が、予め定められた閾値より大きい又は以上である場合は、その文字記入欄を小さく又はその文字記入欄を削除するように調整する。ここで、記入欄を大きくする又は小さくする処理には、拡大処理、縮小処理の他に、高さ又は幅のいずれか一方だけを大きく又は小さくすること、高さと幅を異なる倍率で拡大処理、縮小処理することが含まれる。
【0023】
また、調整モジュール145は、文字記入欄の周辺の余白領域を識別し、その文字記入欄を大きくする場合は余白領域方向に拡大するようにしてもよい。具体的には、文字記入欄の各4辺の外側の矩形である余白領域の面積を計測し、その面積の最も大きい余白領域がある方向に、その文字記入欄を大きくすればよい。
また、調整モジュール145は、文字記入欄内の文字記入量が予め定められた閾値より少ない又は以下である場合は、その文字記入欄を削除すること、又はその削除の提案をすることを行うようにしてもよい。「削除の提案」とは、例えば、画像処理装置100に備え付けられている液晶ディスプレイ(パネル)等の表示装置に、対象としている文字記入欄への記載が少ないことを理由として、削除すべきである旨のメッセージを表示することを言う。また、その提案に対して、画像処理装置100を利用しているユーザーの「了解(YES)」、「非了解(NO)」の指示を受け付け、「了解」である場合は、その対象としている文字記入欄を削除する。
また、調整モジュール145は、調整にあたって、文字記入欄を小さくする処理又は削除する処理を行った後に、文字記入欄を大きくする処理を行うようにしてもよい。文字記入欄を大きくするための余白を確保するために、文字記入欄を小さくする処理又は削除する処理を先に行う。
もちろんのことながら、調整モジュール145は、大きさを調整した後の文字記入欄の内側は空白として、フォーム文書とする。
【0024】
図2は、本実施の形態を利用したシステム構成例を示す説明図である。
図2(a)は、スタンドアロンのシステムとして構成したものである。画像読取形成装置200は、画像処理装置100、画像読取装置210、画像形成装置220を有している。画像読取形成装置200は、複合機(スキャナー、プリンター、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)として実現したものである。画像読取装置210は、画像処理装置100と接続されている。画像読取装置210は、スキャナーとして機能を有している。画像処理装置100は、画像読取装置210、画像形成装置220と接続されている。画像形成装置220は、画像処理装置100と接続されている。画像形成装置220は、プリンターとして機能を有している。
【0025】
図2(b)は、通信回線290を介して画像処理装置100の機能を提供するものである。画像処理装置100、画像読取装置210A、画像読取装置210B、画像形成装置220A、画像形成装置220B、画像読取形成装置230は、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。そして、画像処理装置100の機能を、クラウドサービスとして実現してもよい。画像読取形成装置230は、画像読取装置210と画像形成装置220の組み合わせたものである。画像読取装置210はスキャナーとしての機能を有し、画像形成装置220はプリンターとしての機能を有している。
例えば、画像読取装置210又は画像読取形成装置230で記入済みのフォーム文書を読み取り、画像処理装置100へ画像情報を送信し、文字記入欄の大きさを調整したフォーム文書を生成して、画像形成装置220又は画像読取形成装置230へ送信し、調整後のフォーム文書を印刷する。この調整後のフォーム文書を用いて、ユーザーによる書き込みが行われる。
【0026】
図3は、本実施の形態による処理例を示すフローチャートである。
ステップS302では、画像受付モジュール110は、複数の文書画像を受け付ける。
ステップS304では、記入文字・欄識別モジュール120は、複数の文書画像を用いて、フォーム部と記入部を判別する。
ステップS306では、記入文字識別モジュール125は、ユーザーが記入した文字を識別する。
ステップS308では、文字記入欄識別モジュール130は、文字記入欄を識別する。
ステップS310では、文字記入量取得モジュール135は、文字記入欄毎の文字記入量を取得する。
ステップS312では、記入欄情報取得モジュール140は、文字記入欄の大きさに関する情報を取得する。
ステップS314では、調整モジュール145は、文字記入欄毎の文字記入量と大きさに関する情報に応じて、文字記入欄の大きさ、形状、位置等を調整する。形状の調整として、高さと幅の比率を変更すること等がある。位置の調整として、文字記入欄を小さくしたものがある場合に、余白領域を埋めるように他の文字記入欄の位置を変更すること等がある。
ステップS316では、調整モジュール145は、調整後のフォーム画像を出力する。
【0027】
図4は、文字記入欄情報テーブル400のデータ構造例を示す説明図である。文字記入欄情報テーブル400は、各モジュールによって利用される。
文字記入欄情報テーブル400は、文書画像ID欄410、文字記入欄ID欄420、文字記入欄情報欄430、記入量欄440、自由記入欄欄450、除外対象欄欄460、調整後文字記入欄情報欄470を有している。文字記入欄情報欄430は、X欄432、Y欄434、幅欄436、高さ欄438を有している。調整後文字記入欄情報欄470は、X欄472、Y欄474、幅欄476、高さ欄478を有している。
文書画像ID欄410は、本実施の形態において、文書画像を一意に識別するための情報(文書画像ID:IDentification)を記憶している。文字記入欄ID欄420は、本実施の形態において、文字記入欄を一意に識別するための情報(文字記入欄ID)を記憶している。文字記入欄情報欄430は、文字記入欄情報を記憶している。X欄432は、その文字記入欄の左上角のX座標を記憶している。Y欄434は、その文字記入欄の左上角のY座標を記憶している。幅欄436は、その文字記入欄の幅を記憶している。高さ欄438は、その文字記入欄の高さを記憶している。記入量欄440は、その文字記入欄への文字記入量を記憶している。
【0028】
自由記入欄欄450は、自由記入欄であるか否かを示す情報を記憶している。自由記入欄とは、ユーザーによって文章が記入される欄を指し、自由記入欄以外であるとは、例えば、チェック欄のように、文章記入が想定されていない欄を指す。例えば、文字記入欄のサイズが予め定められた閾値より小さい又は以下である場合に、自由記入欄ではないと判断してもよい。そして、自由記入欄を調整対象の文字記入欄とする。チェック欄等に対して、大きさの調整は好ましくないからである。
除外対象欄欄460は、その文字記入欄は削除対象の欄であるか否かを示す情報を記憶している。つまり、自由記入欄であって、文字記入量が予め定められた閾値より少ない又は以下である場合に、削除対象の欄とする。削除対象の欄である場合は、その文字記入欄を削除してもよいし、削除対象である旨のメッセージを表示するようにしてもよい。
調整後文字記入欄情報欄470は、その文字記入欄に対して調整した後の文字記入欄情報を記憶している。X欄472は、調整後の文字記入欄の左上角のX座標を記憶している。Y欄474は、調整後の文字記入欄の左上角のY座標を記憶している。幅欄476は、調整後の文字記入欄の幅を記憶している。高さ欄478は、調整後の文字記入欄の高さを記憶している。
【0029】
図5は、本実施の形態による処理例を示す説明図である。
ステップS502では、ユーザー510の操作にしたがって、画像読取形成装置200は、文書(文書522、524、526)を読み取り、文書画像(文書画像532、534、536)を生成する。例えば、1つのフォームから生成された記入済みの複数の文書を、1回のスキャン操作で読み取らせ、その複数の文書画像を対象とするようにしてもよい。
ステップS504では、画像処理装置100は、各文書画像から、フォーム部(共通)と記入部(非共通)を判別する。フォーム画像542をステップS506、ステップS510に渡し、記入部画像552、554、556をステップS508に渡す。
ステップS506では、チェック欄等以外の文字記入欄を判別し、文字記入欄情報562をステップS508、ステップS510に渡す。
【0030】
ステップS508では、各文字記入欄の記入量を取得する。各文書画像における各文字記入欄の文字記入量の統計処理によって、文字記入量を算出する。ここで統計処理とは、各文字記入欄毎の読み取った文書画像の合計値、平均値、中央値、最頻値等を算出することを言う。そして、記入量情報572、574、576をステップS510に渡す。
ステップS510では、フォーム画像542、文字記入欄情報562、記入量情報572、574、576を用いて、文字記入欄を変更し、フォーム画像582を生成し、ステップS512に渡す。
ステップS512では、フォーム画像582を保存する。又は、フォーム画像582を印刷してもよい。
【0031】
図6は、本実施の形態による処理例を示す説明図である。
例えば、文書522等には、2つの文字記入欄がある。もちろんのことながら、文書524、文書526も、文書522と同じフォームから生成されているので、同じ位置、大きさの文字記入欄がある。ただし、その文字記入欄に記載されている内容は、一般的には、異なるユーザーによる記載であり、異なったものである。
文書522、文書524、文書526から、同じ部分だけを取り出して、フォーム画像542を生成する。フォーム画像542内には、説明文642、文字記入欄644の組と、説明文646、文字記入欄648の組がある。
文書522、文書524、文書526から、ユーザーが記入した文字を識別(抽出)して、記入部画像552、記入部画像554、記入部画像556を生成する。記入部画像552内には、文字記入欄644の内容652、文字記入欄648の内容654の文字記入部分がある。もちろんのことながら、文書524、文書526も、同様の文字記入部分がある。
【0032】
そして、文字記入欄644の内容652内の文字数を計数して「37」を算出し、文字記入欄648の内容654内の文字数を計数して「5」を算出する。同様に、記入量情報574、記入量情報576についても文字数を計数する。
次に、文字記入欄の変更処理660で、文字記入欄648における文字の記入比率が小さいため、面積を減少させる。この場合は、文字記入欄648の高さ664を低くし、高さ668とする。したがって、文字記入欄648はフォーム画像582内の調整後文字記入欄678のように小さくなる。
そして、文字記入欄644における文字の記入比率が大きいため、面積を増加させる。この場合は、文字記入欄644の高さ662を高くし、高さ666とする。したがって、文字記入欄644はフォーム画像582内の調整後文字記入欄674のように大きくなる。なお、説明文642、説明文646の内容は、変更せずに、文字記入欄648の大きさの変更に伴って、調整後文字記入欄678の直上の位置へと説明文646の位置を変更する。
【0033】
図7は、本実施の形態による処理例を示す説明図である。この例は、チェック欄があり、文字記入欄を削除した例を示している。
図7(a)に例示している元フォーム画像710は、男性であることを示すチェック欄722、女性であることを示すチェック欄724、説明文領域732、文字記入欄742の組、説明文領域734、文字記入欄744の組、説明文領域736、文字記入欄746の組が記載されている。
ユーザーによる記入の結果、文字記入欄744への記入が行われなかった場合(予め定められた閾値より少ない文字記入量である場合)、文字記入欄744とその文字記入欄に対応している説明文領域734を削除して、調整後フォーム画像750を生成する。また、文字記入欄742、文字記入欄746への記入が多く行われた場合(予め定められた閾値より多い文字記入量である場合)、文字記入欄742、文字記入欄746を大きくして(ここでは高さを高くする)、それぞれ文字記入欄782、文字記入欄786を生成する。説明文領域736の位置も説明文領域776の位置へと変更する。なお、チェック欄722、チェック欄724は、対象とする文字記入欄ではないので、大きさの変更はない。
そして、それらの処理の結果、図7(b)に例示している調整後フォーム画像750は、チェック欄762、チェック欄764、説明文領域772、説明文領域776、文字記入欄782、文字記入欄786を有している。
【0034】
図8を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図8に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナー等のデータ読み取り部817と、プリンター等のデータ出力部818を備えたハードウェア構成例を示している。
【0035】
CPU(Central Processing Unit)801は、前述の実施の形態において説明した各種のモジュール、すなわち、画像受付モジュール110、記入文字・欄識別モジュール120、文字記入欄識別モジュール130、文字記入量取得モジュール135、記入欄情報取得モジュール140、調整モジュール145等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
【0036】
ROM(Read Only Memory)802は、CPU801が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)803は、CPU801の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス804により相互に接続されている。
【0037】
ホストバス804は、ブリッジ805を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス806に接続されている。
【0038】
キーボード808、マウス等のポインティングデバイス809は、操作者により操作される入力デバイスである。ディスプレイ810は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。
【0039】
HDD(Hard Disk Drive)811は、ハードディスク(フラッシュメモリ等であってもよい)を内蔵し、ハードディスクを駆動し、CPU801によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けた文書画像、文字記入欄情報テーブル400、調整されたフォーム画像等が格納される。さらに、その他の各種データ、各種コンピュータ・プログラム等が格納される。
【0040】
ドライブ812は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体813に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース807、外部バス806、ブリッジ805、及びホストバス804を介して接続されているRAM803に供給する。リムーバブル記録媒体813も、ハードディスクと同様のデータ記録領域として利用可能である。
【0041】
接続ポート814は、外部接続機器815を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート814は、インタフェース807、及び外部バス806、ブリッジ805、ホストバス804等を介してCPU801等に接続されている。通信部816は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部817は、例えばスキャナーであり、ドキュメントの読み取り処理を実行する。データ出力部818は、例えばプリンターであり、ドキュメントデータの出力処理を実行する。
【0042】
なお、図8に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図8に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図8に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナー、プリンター、複合機などに組み込まれていてもよい。
【0043】
前述の実施の形態においては、アンケート用紙の例を示したが、文字記入欄があるフォームを用いた文書であれば、どのような文書であってもよい。
【0044】
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体を言う。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
【符号の説明】
【0045】
100…画像処理装置
110…画像受付モジュール
120…記入文字・欄識別モジュール
125…記入文字識別モジュール
130…文字記入欄識別モジュール
135…文字記入量取得モジュール
140…記入欄情報取得モジュール
145…調整モジュール
200…画像読取形成装置
210…画像読取装置
220…画像形成装置
230…画像読取形成装置
290…通信回線
図1
図2
図3
図4
図5
図6
図7
図8