特許第6000992号(P6000992)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 京セラドキュメントソリューションズ株式会社の特許一覧

特許6000992文書ファイル生成装置及び文書ファイル生成方法
<>
  • 特許6000992-文書ファイル生成装置及び文書ファイル生成方法 図000002
  • 特許6000992-文書ファイル生成装置及び文書ファイル生成方法 図000003
  • 特許6000992-文書ファイル生成装置及び文書ファイル生成方法 図000004
  • 特許6000992-文書ファイル生成装置及び文書ファイル生成方法 図000005
  • 特許6000992-文書ファイル生成装置及び文書ファイル生成方法 図000006
  • 特許6000992-文書ファイル生成装置及び文書ファイル生成方法 図000007
  • 特許6000992-文書ファイル生成装置及び文書ファイル生成方法 図000008
  • 特許6000992-文書ファイル生成装置及び文書ファイル生成方法 図000009
  • 特許6000992-文書ファイル生成装置及び文書ファイル生成方法 図000010
  • 特許6000992-文書ファイル生成装置及び文書ファイル生成方法 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6000992
(24)【登録日】2016年9月9日
(45)【発行日】2016年10月5日
(54)【発明の名称】文書ファイル生成装置及び文書ファイル生成方法
(51)【国際特許分類】
   G06F 17/21 20060101AFI20160923BHJP
【FI】
   G06F17/21 640
【請求項の数】12
【全頁数】17
(21)【出願番号】特願2014-11223(P2014-11223)
(22)【出願日】2014年1月24日
(65)【公開番号】特開2015-138496(P2015-138496A)
(43)【公開日】2015年7月30日
【審査請求日】2015年11月20日
【早期審査対象出願】
(73)【特許権者】
【識別番号】000006150
【氏名又は名称】京セラドキュメントソリューションズ株式会社
(74)【代理人】
【識別番号】100097113
【弁理士】
【氏名又は名称】堀 城之
(74)【代理人】
【識別番号】100162363
【弁理士】
【氏名又は名称】前島 幸彦
(72)【発明者】
【氏名】平塚 元規
【審査官】 川▲崎▼ 博章
(56)【参考文献】
【文献】 特開2005−063052(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/20 − 17/28
(57)【特許請求の範囲】
【請求項1】
文字認識によって得られる原稿の文字画像をデータ化した文書ファイルを生成する文書ファイル生成装置であって、
前記文字画像をベクトル化するベクトル化手段と、
該ベクトル化手段によるベクトル化の処理を制御するベクトル化処理制御手段とを備え、
前記ベクトル化処理制御手段は、
前記ベクトル化の処理の開始前である第1段階で、前記文字画像の文字数及び文字サイズに基づいた第1のファイルのサイズを算出し、
前記ベクトル化の処理の実行中である第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により抽出される文字画像の文字数及び文字サイズに基づいた第2のファイルのサイズを算出し、
前記ベクトル化の処理の終了後である第3段階で、前記文字画像の文字数及び前記ベクトル化したデータに基づく第3のファイルのサイズを算出し、
前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化手段によってベクトル化されているデータを書き込んだベクトル化ファイルを生成する
ことを特徴とする文書ファイル生成装置。
【請求項2】
前記ベクトル化処理制御手段は、
前記文字認識によって得られる原稿の文字画像を、それぞれの文字画像毎にカウントするカウント手段と、
前記ファイルのサイズを算出して比較するファイルサイズ算出比較手段と、
前記ベクトル化ファイル又は文書ファイルを生成する画像処理手段とを有し、
前記ファイルサイズ算出比較手段は、
前記第1段階で、前記文字画像の文字数にそれぞれの文字画像サイズを乗じた第1のファイルのサイズを算出し、
前記第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により対象文字を抽出し、前記文字画像の文字数に該抽出された対象文字のフォントのサイズを乗じた第2のファイルのサイズを算出し、
前記第3段階で、前記文字画像の文字数に前記ベクトル化によるデータを乗じた第3のファイルのサイズを算出し、
前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズと前記原稿のファイルのサイズとを比較し、
前記画像処理手段は、
前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化ファイルを生成し、
前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより大きい場合、以降の処理を中断し、前記原稿のファイルのファイル形式に従った文書ファイルを生成する
ことを特徴とする請求項1に記載の文書ファイル生成装置。
【請求項3】
前記ファイルサイズ算出比較手段は、前記第1のファイルのサイズを算出する際、前記カウント手段でカウントされたそれぞれの文字画像の合計文字数に、それぞれの文字画像のサイズを平均化した平均文字画像サイズを乗じることを特徴とする請求項2に記載の文書ファイル生成装置。
【請求項4】
前記画像処理手段は、
前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする請求項2又は3に記載の文書ファイル生成装置。
【請求項5】
前記画像処理手段は、前記文字認識により得られる文字画像のパターンから得られる特徴量と一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする請求項2又は3に記載の文書ファイル生成装置。
【請求項6】
前記フォント辞書への登録を行う場合、既に登録済みの文字についてはその登録が行われないことを特徴とする請求項4又は5に記載の文書ファイル生成装置。
【請求項7】
文字認識によって得られる原稿の文字画像をデータ化した文書ファイルを生成する文書ファイル生成方法であって、
ベクトル化手段により前記文字画像をベクトル化する工程と、
ベクトル化処理制御手段により該ベクトル化手段によるベクトル化の処理を制御する工程とを有し、
前記ベクトル化処理制御手段は、
前記ベクトル化の処理の開始前である第1段階で、前記文字画像の文字数及び文字サイズに基づいた第1のファイルのサイズを算出し、
前記ベクトル化の処理の実行中である第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により抽出される文字画像の文字数及び文字サイズに基づいた第2のファイルのサイズを算出し、
前記ベクトル化の処理の終了後である第3段階で、前記文字画像の文字数及び前記ベクトル化したデータに基づく第3のファイルのサイズを算出し、
前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化手段によってベクトル化されているデータを書き込んだベクトル化ファイルを生成する
ことを特徴とする文書ファイル生成方法。
【請求項8】
前記ベクトル化処理制御手段は、
カウント手段により、前記文字認識によって得られる原稿の文字画像を、それぞれの文字画像毎にカウントする工程と、
ファイルサイズ算出比較手段により、前記ファイルのサイズを算出して比較する工程と、
画像処理手段により、前記ベクトル化ファイル又は文書ファイルを生成する工程とを有し、
前記ファイルサイズ算出比較手段は、
前記第1段階で、前記文字画像の文字数にそれぞれの文字画像サイズを乗じた第1のファイルのサイズを算出し、
前記第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により対象文字を抽出し、前記文字画像の文字数に該抽出された対象文字のフォントのサイズを乗じた第2のファイルのサイズを算出し、
前記第3段階で、前記文字画像の文字数に前記ベクトル化によるデータを乗じた第3のファイルのサイズを算出し、
前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズと前記原稿のファイルのサイズとを比較し、
前記画像処理手段は、
前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化ファイルを生成し、
前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより大きい場合、以降の処理を中断し、前記原稿のファイルのファイル形式に従った文書ファイルを生成する
ことを特徴とする請求項7に記載の文書ファイル生成方法。
【請求項9】
前記ファイルサイズ算出比較手段は、前記第1のファイルのサイズを算出する際、前記カウント手段でカウントされたそれぞれの文字画像の合計文字数に、それぞれの文字画像のサイズを平均化した平均文字画像サイズを乗じることを特徴とする請求項8に記載の文書ファイル生成方法。
【請求項10】
前記画像処理手段は、
前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする請求項8又は9に記載の文書ファイル生成方法。
【請求項11】
前記画像処理手段は、前記文字認識により得られる文字画像のパターンから得られる特徴量と一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする請求項8又は9に記載の文書ファイル生成方法。
【請求項12】
前記フォント辞書への登録を行う場合、既に登録済みの文字についてはその登録が行われないことを特徴とする請求項10又は11に記載の文書ファイル生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字認識によって得られる原稿の文字画像をデータ化し、たとえばPDF(Portable Document Format)形式などの文書ファイルを生成する文書ファイル生成装置及び文書ファイル生成方法に関する。
【背景技術】
【0002】
電子書類の規格の一種としてPDF(Portable Document Format)形式がある。PDF形式のファイル(以下、PDFファイルという)には、文書内で用いられるフォント情報をそのPFDファイル自体に埋め込んでおくことができる。そのため、フォントを埋め込んだPFDファイルは、それを作成した環境以外でも、文書に埋め込まれたフォントを用いて作成者の意図通りに描画(表示あるいは印刷)することができる。
【0003】
また、PDFでは、文書を電子化するに際してファイルサイズを抑えるために、高圧縮方式が用いられている。これは、画像に含まれる文字や図形といったオブジェクト毎に画像層(画像レイヤ)で識別し、それぞれの画像レイヤに含まれるオブジェクトに応じて画像処理や画像圧縮が行われるようにしたものである。これにより、高画質と高圧縮とが同時に達成されるようになっている。
【0004】
ところで、PDFで描画される、たとえば文字画像を細かく綺麗に描画させる手段の一つとして、文字画像のベクトル化が挙げられる。ところが、文字画像をベクトル化すると、ベクトル化したフォントデータの描画処理をPDFファイル上に記載する必要があり、テキストデータに対して大きくなってしまう。
【0005】
このような不具合を解消する場合、たとえば特許文献1に示されている文書作成方法を適用することが考えられる。すなわち、特許文献1では、フォントを文書ファイルに埋め込むか否かの基準となるフォント名及びポイント数(すなわちサイズ)の閾値をテーブルとして入力し、処理対象の元データからその中で使用されているフォント名とポイント数とを獲得し、元データ内で使用されているフォント名がテーブル中に登録されていれば、その元データ中におけるポイント数とテーブル中のポイント数閾値とを比較し、閾値よりも大きいポイントの文字があれば、そのフォントを埋め込むものと決定するようにした文書作成方法を提案している。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2005−063052
【発明の概要】
【発明が解決しようとする課題】
【0007】
上述した特許文献1では、フォント情報を含むことのできる文書情報を作成する際に、フォントの名前のみならず、フォントのポイント数(すなわちサイズ)にも着目するようにしているため、作成される文書ファイルのサイズの縮小が可能となっている。
【0008】
ところが、フォント毎にポイント数などを持たせるようにすると、フォント毎のパターンが必要となり、登録されるフォント数が多くなるに従い、ファイルサイズが大きくなってしまうという問題があった。
【0009】
本発明は、このような状況に鑑みてなされたものであり、ファイルサイズを増大させることなく、画像を細かく綺麗に描画するための文書ファイルを生成することができる文書ファイル生成装置及び文書ファイル生成方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明の文書ファイル生成装置は、文字認識によって得られる原稿の文字画像をデータ化した文書ファイルを生成する文書ファイル生成装置であって、前記文字画像をベクトル化するベクトル化手段と、該ベクトル化手段によるベクトル化の処理を制御するベクトル化処理制御手段とを備え、前記ベクトル化処理制御手段は、前記ベクトル化の処理の開始前である第1段階で、前記文字画像の文字数及び文字サイズに基づいた第1のファイルのサイズを算出し、前記ベクトル化の処理の実行中である第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により抽出される文字画像の文字数及び文字サイズに基づいた第2のファイルのサイズを算出し、前記ベクトル化の処理の終了後である第3段階で、前記文字画像の文字数及び前記ベクトル化したデータに基づく第3のファイルのサイズを算出し、前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化手段によってベクトル化されているデータを書き込んだベクトル化ファイルを生成することを特徴とする。
また、前記ベクトル化処理制御手段は、前記文字認識によって得られる原稿の文字画像を、それぞれの文字画像毎にカウントするカウント手段と、前記ファイルのサイズを算出して比較するファイルサイズ算出比較手段と、前記ベクトル化ファイル又は文書ファイルを生成する画像処理手段とを有し、前記ファイルサイズ算出比較手段は、前記第1段階で、前記文字画像の文字数にそれぞれの文字画像サイズを乗じた第1のファイルのサイズを算出し、前記第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により対象文字を抽出し、前記文字画像の文字数に該抽出された対象文字のフォントのサイズを乗じた第2のファイルのサイズを算出し、前記第3段階で、前記文字画像の文字数に前記ベクトル化によるデータを乗じた第3のファイルのサイズを算出し、前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズと前記原稿のファイルのサイズとを比較し、前記画像処理手段は、前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化ファイルを生成し、前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより大きい場合、以降の処理を中断し、前記原稿のファイルのファイル形式に従った文書ファイルを生成することを特徴とする。
また、前記ファイルサイズ算出比較手段は、前記第1のファイルのサイズを算出する際、前記カウント手段でカウントされたそれぞれの文字画像の合計文字数に、それぞれの文字画像のサイズを平均化した平均文字画像サイズを乗じることを特徴とする。
また、前記画像処理手段は、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする。
また、前記画像処理手段は、前記文字認識により得られる文字画像のパターンから得られる特徴量と一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする。
また、前記フォント辞書への登録を行う場合、既に登録済みの文字についてはその登録が行われないことを特徴とする。
本発明の文書ファイル生成方法は、文字認識によって得られる原稿の文字画像をデータ化した文書ファイルを生成する文書ファイル生成方法であって、ベクトル化手段により前記文字画像をベクトル化する工程と、ベクトル化処理制御手段により該ベクトル化手段によるベクトル化の処理を制御する工程とを有し、前記ベクトル化処理制御手段は、前記ベクトル化の処理の開始前である第1段階で、前記文字画像の文字数及び文字サイズに基づいた第1のファイルのサイズを算出し、前記ベクトル化の処理の実行中である第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により抽出される文字画像の文字数及び文字サイズに基づいた第2のファイルのサイズを算出し、前記ベクトル化の処理の終了後である第3段階で、前記文字画像の文字数及び前記ベクトル化したデータに基づく第3のファイルのサイズを算出し、前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化手段によってベクトル化されているデータを書き込んだベクトル化ファイルを生成することを特徴とする。
また、前記ベクトル化処理制御手段は、カウント手段により、前記文字認識によって得られる原稿の文字画像を、それぞれの文字画像毎にカウントする工程と、ファイルサイズ算出比較手段により、前記ファイルのサイズを算出して比較する工程と、画像処理手段により、前記ベクトル化ファイル又は文書ファイルを生成する工程とを有し、前記ファイルサイズ算出比較手段は、前記第1段階で、前記文字画像の文字数にそれぞれの文字画像サイズを乗じた第1のファイルのサイズを算出し、前記第2段階で、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により対象文字を抽出し、前記文字画像の文字数に該抽出された対象文字のフォントのサイズを乗じた第2のファイルのサイズを算出し、前記第3段階で、前記文字画像の文字数に前記ベクトル化によるデータを乗じた第3のファイルのサイズを算出し、前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズと前記原稿のファイルのサイズとを比較し、前記画像処理手段は、前記第1段階〜第3段階で、前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより小さい場合、前記ベクトル化ファイルを生成し、前記第1段階、前記第2段階又は前記第3段階のいずれかで前記第1〜第3のファイルのサイズが前記原稿のファイルのサイズより大きい場合、以降の処理を中断し、前記原稿のファイルのファイル形式に従った文書ファイルを生成することを特徴とする。
また、前記ファイルサイズ算出比較手段は、前記第1のファイルのサイズを算出する際、前記カウント手段でカウントされたそれぞれの文字画像の合計文字数に、それぞれの文字画像のサイズを平均化した平均文字画像サイズを乗じることを特徴とする。
また、前記画像処理手段は、前記文字認識により得られる文字座標と前記ベクトル化したデータに含まれる文字座標との照合により一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする。
また、前記画像処理手段は、前記文字認識により得られる文字画像のパターンから得られる特徴量と一致する文字画像のベクトル化データをフォント辞書に登録し、該登録したベクトル化データを用いて前記ベクトル化ファイルを生成することを特徴とする。
また、前記フォント辞書への登録を行う場合、既に登録済みの文字についてはその登録が行われないことを特徴とする。
本発明の文書ファイル生成装置及び文書ファイル生成方法では、文字画像のベクトル化の処理の開始前である第1段階で、文字画像の文字数及び文字サイズに基づいた第1のファイルのサイズを算出し、文字画像のベクトル化の処理の実行中である第2段階で、文字認識により得られる文字座標とベクトル化したデータに含まれる文字座標との照合により抽出される文字画像の文字数及び文字サイズに基づいた第2のファイルのサイズを算出し、文字画像のベクトル化の処理の終了後である第3段階で、文字画像の文字数及びベクトル化したデータに基づく第3のファイルのサイズを算出し、第1段階〜第3段階で、第1〜第3のファイルのサイズが原稿のファイルのサイズより小さい場合、ベクトル化手段によってベクトル化されているデータを書き込んだベクトル化ファイルが生成される。
よって、第3段階での比較により、第3のファイルのサイズが原稿のファイルのサイズより小さい場合、ベクトル化されているデータを書き込んだベクトル化ファイルが原稿のファイルのサイズより小さくなる。
【発明の効果】
【0011】
本発明の文書ファイル生成装置及び文書ファイル生成方法によれば、第3段階での比較により、第3のファイルのサイズが原稿のファイルのサイズより小さい場合、ベクトル化されているデータを書き込んだベクトル化ファイルが原稿のファイルのサイズより小さくなることから、ファイルサイズを増大させることなく、画像を細かく綺麗に描画するための文書ファイルを生成することができる。
【図面の簡単な説明】
【0012】
図1】本発明の文書ファイル生成装置の一実施形態を説明するための図である。
図2図1の文書ファイル生成装置による文書ファイル生成方法の概要を説明するためのフローチャートである。
図3図1の文書ファイル生成装置による画像処理の概要を説明するための図である。
図4図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。
図5図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。
図6図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。
図7図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。
図8図1の文書ファイル生成装置における、ベクトル化とOCR(文字認識)を利用したベクトル化処理について説明するための図である。
図9図1の文書ファイル生成装置における、ベクトル化とパターンマッチングを利用したベクトル化処理について説明するための図である。
図10図1の文書ファイル生成装置における、ベクトル化とパターンマッチングを利用したベクトル化処理について説明するための図である。
【発明を実施するための最良の形態】
【0013】
以下、本発明の文書ファイル生成装置の一実施形態を、図1図3を参照しながら説明する。まず、図1に示すように、文書ファイル生成装置10は、制御部11、操作部12、表示部13、スキャナー部14を備えている。
【0014】
制御部11は、図示しないROM内の所定のプログラムに基づき、文書ファイル生成装置10の全体の動作を制御するものであり、操作受付部11a、画像認識部11b、画像処理部11c、ファイルサイズ算出比較部11d、カウンター11e、ベクトル化部11f、メモリー11gを備えている。
【0015】
操作受付部11aは、操作部12による画像処理に係わる操作を受け付ける。画像認識部11bは、スキャナー部14によって読み取られた文字画像のOCR(Optical Character Reader:文字認識)を行う。すなわち、スキャナー部14によって読み取られた文字画像が予め記憶されているパターンと照合されて特定され、その特定された文字画像のデータが得られる。
【0016】
画像処理部11cは、ベクトル化部11fによってベクトル化されているデータを書き込んだ文書ファイル(以下、ベクトル化ファイルという)、又は後述の原稿20のファイル形式に従った文書ファイルの生成などを行う。ファイルサイズ算出比較部11dは、ベクトル化部11fによるベクトル化の処理開始前(第1段階)、ベクトル化部11fによるベクトル化の処理実行中(第2段階)、ベクトル化部11fによるベクトル化の処理終了後(第3段階)のそれぞれにてファイルのサイズを算出する。また、ファイルサイズ算出比較部11dは、第1段階〜第3段階のそれぞれにて算出したファイルのサイズと後述の原稿20のファイルのサイズとの比較を行うものであるが、その詳細については後述する。
【0017】
カウンター11eは、画像認識部11bによって認識された文字毎の数(文字数)をカウントする。ベクトル化部11fは、画像認識部11bによって認識された文字画像のベクトル化を行うものであるが、その詳細についても後述する。メモリー11gには、スキャナー部14によって読み取られた文字画像などが記憶される。
【0018】
操作部12は、画像処理を指示する際に操作されるものであり、たとえばタッチパネルで構成されている。表示部13は、画像処理などをガイドするメッセージや、画像処理を選択させる項目などを表示する。スキャナー部14は、イメージセンサ(図示省略)によって読み取られる後述の原稿20の文字画像を光学的に読み取る。
【0019】
次に、図2及び図3を参照し、画像処理の概要について説明する。まず、スキャナー部14により、たとえば図3に示すような原稿20の読み取りによるOCR(文字認識)を実行させる(ステップS1)。なお、図3に示す原稿20は、たとえばPDF形式のファイル(以下、PDFファイルという)を印字した文書であり、説明の都合上、たとえばa〜dの文字画像が表示されている文字層のみを示している。
【0020】
すなわち、そのPDFファイルは、上述したように、画像層(画像レイヤ)に含まれるオブジェクトに応じて画像処理や画像圧縮が行われる高圧縮方式による構成となっている。また、原稿20のPDFファイルのサイズ(描画前のPDFファイルの文字層のデータのサイズ)は、既に取得されているものとする。
【0021】
また、スキャナー部14による原稿20の読み取りは、矢印で示すように、たとえば上段から順に1行ずつ行われるようになっているものとする。ここで、原稿20が読み取られると、新規の文字画像がOCR(文字認識)される毎に、それぞれ認識された文字画像の登録がカウンター11eにて行われる(ステップS2)。
【0022】
すなわち、まず「a」の文字画像が認識されると、その認識された「a」の文字画像がカウンター11eのaカウンター11e−1として登録される。続いて、次の「a」の文字画像が認識されると、aカウンター11e−1の文字数が加算される。つまり、「a」の文字画像が認識される毎に、aカウンター11e−1の文字数が加算されていく。
【0023】
次に、「b」の文字画像が認識されると、その認識された「b」の文字画像がカウンター11eのbカウンター11e−2として登録される。続いて、次の「b」の文字画像が認識されると、bカウンター11e−2の文字数が加算される。つまり、「b」の文字画像が認識される毎に、bカウンター11e−2の文字数が加算されていく。
【0024】
次に、「c」の文字画像が認識されると、その認識された「c」の文字画像がカウンター11eのcカウンター11e−3として登録される。続いて、次の「c」の文字画像が認識されると、cカウンター11e−3の文字数が加算される。つまり、「c」の文字画像が認識される毎に、cカウンター11e−3の文字数が加算されていく。
【0025】
次いで、原稿20の読み取りが終わると、ファイルサイズ算出比較部11dにより、aカウンター11e−1、bカウンター11e−2、cカウンター11e−3のそれぞれの文字画像の合計文字数と平均文字画像サイズから第1のファイルのサイズが算出される(ステップS3)。すなわち、平均文字画像サイズにそれぞれのaカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算された文字画像の合計文字数を乗じることで、第1のファイルのサイズが算出される。
【0026】
ここで、平均文字画像サイズを用いる理由は、「a」〜「b」のそれぞれの文字画像サイズが異なるためである。特に、たとえばひらがなと漢字を比べた場合、漢字の方が文字画像サイズが大きくなることが多い。この場合、それぞれの文字画像サイズを用いて第1のファイルのサイズを算出しようとすると、その算出が複雑になってしまうが、平均文字画像サイズを用いることで、第1のファイルのサイズの算出が容易となる。
【0027】
そして、算出された第1のファイルのサイズとPDFファイルの文字層のサイズとが比較される(ステップS4)。算出された第1のファイルのサイズがPDFファイルの文字層のサイズより大きい場合(ステップS4:NO)、画像処理部11cにより、次の処理となるベクトル化部11fによる文字画像のベクトル化への移行が中断され、通常のPFDファイルが生成される(ステップS5)。ここで、通常のPDFファイルとは、文書内で用いられるフォント情報をそのファイル自体に埋め込んでおくことができる従来のファイル形式を有したものである。
【0028】
なお、ベクトル化して登録されるフォントは、PDFファイルにおいて圧縮して登録されることになる。そのため、第1のファイルのサイズを算出する際は圧縮率を考慮する必要があるが、本実施形態では最低圧縮率を利用するものとする。つまり、PDFファイルにおいて、たとえば最高画質(低圧縮)、高画質、普通、低画質(高圧縮)の4通りの設定が可能であるとすると、最高画質(低圧縮)での圧縮率を利用するものとして第1のファイルのサイズが算出されるようになっている。このように、最高画質(低圧縮)での圧縮率を利用することで、画像を細かく綺麗に描画するための文書ファイルを生成することが化膿となる。
【0029】
一方、算出された第1のファイルのサイズがPDFファイルの文字層のサイズより小さい場合(ステップS4:YES)、ベクトル化部11fによる文字画像のベクトル化が行われる(ステップS6)。すなわち、上述したカウンター11eのaカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算されたそれぞれの文字画像である「a」〜「c」のベクトル化が行われる。
【0030】
次に、画像処理部11cにより、aカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算されたそれぞれの文字画像に対して、OCR(文字認識)で得られる文字座標とベクトル化したデータの文字座標とを照らし合わせ、対象文字の抽出が行われる(ステップS7)。ちなみに、OCR(文字認識)で得られるOCR(文字認識)情報には文字座標や文字コードなどが含まれている。また、ベクトル化したデータには、線の起終点の座標(位置)などが含まれている。よって、OCR(文字認識)情報とベクトル化したデータの文字座標を照らし合わせることで、対象文字の抽出が可能となる。
【0031】
次に、ファイルサイズ算出比較部11dにより、抽出された対象文字のフォントのサイズとaカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算された文字画像毎の合計文字数から、それぞれの文字毎にサイズがいくつになるかが算出されることで、第2のファイルのサイズが算出される(ステップS8)。次いで、算出された第2のファイルのサイズがPDFファイルの文字層のサイズと比較される(ステップS9)。
【0032】
算出された第2のファイルのサイズがPDFファイルの文字層のサイズより大きい場合(ステップS9:NO)、次の処理となるフォント置き換え処理が行われず、画像処理部11cにより通常のPDFファイルが生成される(ステップS5)。これに対し、算出された第2のファイルのサイズがPDFファイルの文字層のサイズより小さい場合(ステップS9:YES)、画像処理部11cによりフォント置き換え処理が実行される(ステップS10)。すなわち、ステップS6で行われたベクトル化部11fによるそれぞれの文字画像のベクトル化されたデータがたとえば上述したメモリー11gに記憶される。
【0033】
次に、画像処理部11cによりメモリー11gに記憶されているベクトル化されたデータに基づき、第3のファイルのサイズが算出される(ステップS11)。第3のファイルのサイズは、メモリー11gに記憶されているベクトル化されたデータとファイル化の際に使用されるフォント数とから算出することができる。
【0034】
そして、算出された第3のファイルのサイズとPDFファイルの文字層のサイズとが比較される(ステップS12)。ここで、その第3のファイルのサイズがPDFファイルの文字層のサイズより大きい場合(ステップS12:NO)、次の処理となるベクトル化ファイルの生成が行われず、画像処理部11cにより通常のPDFファイルが生成される(ステップS5)。
【0035】
これに対し、その第3のファイルのサイズがPDFファイルの文字層のサイズより小さい場合(ステップS12:YES)、画像処理部11cによりベクトル化ファイルの生成が行われる(ステップS13)。
【0036】
以上のように、本実施形態では、ステップS6でのベクトル化部11fによるそれぞれの文字画像のベクトル化の処理の開始前の段階(第1段階)でOCR(文字認識)により得られる文字画像の合計文字数と平均文字画像サイズから第1のファイルのサイズを算出し、ベクトル化部11fによるベクトル化の処理の実行中の段階(第2段階)でOCR(文字認識)情報とベクトル化したデータの文字座標との照合により抽出された対象文字のフォントのサイズとaカウンター11e−1、bカウンター11e−2、cカウンター11e−3で加算された文字画像毎の合計文字数から得られる第2のファイルのサイズを算出し、ベクトル化部11fによるベクトル化の処理の終了後の段階(第3段階)でベクトル化されたデータとファイル化の際に使用されるフォント数とから得られる第3のファイルのサイズを算出している。
【0037】
そして、それぞれの段階で算出されたファイルのサイズとPDFファイルの文字層のサイズとを比較することで、最終的な第3のファイルのサイズがPDFファイルの文字層のサイズより小さければベクトル化ファイルが生成されるようになっている。
【0038】
次に、上述した画像処理の具体例について説明する。図4図8は、ベクトル化とOCR(文字認識)を利用した文書ファイルの低サイズ化のためのベクトル化処理について説明するものである。なお、以下に説明するベクトル化処理は、上述した画像処理部11cが行うものとする。
【0039】
まず、図4に示すように、原稿20を上述したスキャナー部14により読み込み、文字画像とOCR(文字認識)情報bとを取得する。なお、ベクトル画像情報(ベクトルデータ)aは、上述したように、原稿20そのもののPDFファイルの情報であり、既に取得されているものとする。また、以下に説明するフォント辞書cは、PDFファイル内に含まれているものである。ここで、描画される文字が、ベクトル画像情報(ベクトルデータ)aからでは特定できないため、OCR(文字認識)情報bから文字コードと文字座標とを取得し、以下の手順でフォント辞書cへの登録を行う。
【0040】
すなわち、図5及び図6に示すように、
(1)たとえば「K」の文字画像がOCR(文字認識)されたとすると、「K」の文字画像の左端から右端の間で一致する描画開始位置のX座標を、OCR(文字認識)情報bから検索する。
(2)OCR座標(OCR(文字認識)情報bの文字座標)とベクトル画像情報aの描画開始位置のX座標とが一致した場合、Y座標の上端から下端間で一致する描画開始位置のY座標を検索する。
(3)どちらも一致した場合は、該当文字と判断しベクトル画像情報aのfillまでを文字としてフォント辞書cに登録する。
(4)既に登録済みの文字が検索で見つかった場合はフォント辞書cへの登録を行わない。
【0041】
なお、図6に示すように、フォント辞書cに登録された文字がたとえば「K」「y」「o」「c」となっていると、それぞれの文字が描画処理の際にそのフォント辞書cから読み出されることになる。
【0042】
次に、図7に示すように、ベクトル画像情報aのEOF(データの終端)までの検索を終えたら、次はベクトル画像情報aのベクトル座標からOCR(文字認識)情報bに対して検索をかける。ここで、OCR(文字認識)で認識できていない文字があり得るので、以下の手順でベクトル画像情報aから再度検索する。
【0043】
(5)ベクトルデータの書き出し開始位置について、OCR(文字認識)で認識された文字に一致しないものを検索する。
(6)一致した文字は、別認識した記号や既にフォント辞書cに登録済みであるため破棄する。
(7)一致しない文字は、ベクトル列をまとめて1つのフォント辞書cに追加登録する。
ここで、一致しない文字のブロックができるが、9割以上はフォント辞書cに登録されるためファイルのサイズの低減につながる。
【0044】
次に、図8に示すように、
(8)文字を登録したフォント辞書cからフォントを取得し、サイズ、記載座標を指定して描画処理を行う。すなわち、たとえば「K」「y」「o」「c」「o」「o」を描画する場合、それぞれの文字のフォントがフォント辞書cから取得されることになる。
【0045】
次に、図9などを参照し、ベクトル化とパターンマッチングを利用した文書ファイルの低サイズ化のためのベクトル化処理について説明する。なお、以下に説明するパターンマッチングは、上述した画像処理部11cが行うものとする。
【0046】
まず、図9に示すように、原稿20を上述したスキャナー部14により読み込み、文字画像を取得し、以下の手順でフォント辞書cへの登録を行う。
すなわち、図10(a)に示すように、
(1)ベクトル化前の2値画像の近傍画素において同じ輝度を持つ要素を探し出しラベルを作成する。ここでは、たとえば「K」の文字のラベルが取得されることなる。
(2)ラベル取得時の基点dの場所の座標と、縦横のドット幅を記憶する。
(3)文字画像内の記載座標に対して検索をかける。
(4)横ドット幅(X座標)を、文字画像の左端から右端の間で、一致する描画開始位置のX座標をベクトル画像情報aから検索する。
(5)X座標が一致した場合は、縦ドット幅(Y座標)の上端から下端間で一致する描画開始位置のY座標をベクトル画像情報aから検索する。
(6)どちらも一致した場合は該当文字と判断し、ベクトル画像情報aのfillまでを文字として上述したフォント辞書cに登録する。
(7)既に登録済みの文字が検索で見つかった場合はフォント辞書cへの登録を行わない。
【0047】
次に、図10(b)に示すように、
(8)ラベルの重心eを決め、その重心eの位置からのラベルの特徴量を算出する。
なお、特徴量は、ラベルの重心dから最外周輪郭線間までの距離(点線矢印で示している)である。これにより対象ラベルが拡大/縮小、回転をしても特徴の周期で一致させることが可能となる。
(9)特徴量の一致する文字をベクトル画像情報aから検索する。
(10)一致した文字の座標と縦横の幅を記憶する。
(11)文字が見つからなくなるまで(9)、(10)を繰り返す。
(12)次のラベルを取得し、上記同様のパターンマッチングを行う。
このとき、記憶した文字と座標を次の検索対象から外す。
(13)描画処理の際は、フォント辞書cからフォントを取得し、サイズ、記載座標が指定される。
【0048】
このように、本実施形態では、文字画像をベクトル化するベクトル化手段であるベクトル化部11fと、このベクトル化部11fによるベクトル化の処理を制御するベクトル化処理制御手段とを備えている。
【0049】
そして、ベクトル化処理制御手段により、ベクトル化の処理の開始前である第1段階で算出した第1のファイルのサイズが原稿20のファイルのサイズより小さい場合、ベクトル化の処理の実行中である第2段階に進み、第2段階で算出した第2のファイルのサイズが原稿20のファイルのサイズより小さい場合、ベクトル化の処理の終了後である第3段階に進み、第3段階で算出した第3のファイルのサイズが原稿20のファイルのサイズより小さい場合、ベクトル化部11fによってベクトル化されているデータを書き込んだベクトル化ファイルが生成される。
【0050】
具体的には、ベクトル化処理制御手段は、文字認識によって得られる原稿20の文字画像を、それぞれの文字画像毎にカウントするカウント手段であるカウンター11eと、ファイルのサイズを算出して比較するファイルサイズ算出比較手段であるファイルサイズ算出比較部11dと、ベクトル化ファイル又は文書ファイルを生成する画像処理手段である画像処理部11cとを有している。
【0051】
ファイルサイズ算出比較部11dは、第1段階で、文字画像の文字数にそれぞれの文字画像サイズを乗じた第1のファイルを算出し、第2段階で、文字認識により得られる文字座標とベクトル化したデータに含まれる文字座標との照合により対象文字を抽出し、文字画像の文字数に抽出された対象文字のフォントのサイズを乗じた第2のファイルを算出し、第3段階で、文字画像の文字数にベクトル化によるデータを乗じた第3のファイルのサイズを算出し、第1段階、第2段階又は第3段階のいずれかで第1〜第3のファイルのサイズと原稿のファイルのサイズとを比較している。
【0052】
そして、画像処理部11cは、第1段階〜第3段階で、第1〜第3のファイルのサイズが原稿のファイルのサイズより小さい場合、ベクトル化ファイルを生成し、第1段階、第2段階又は第3段階のいずれかで第1〜第3のファイルのサイズが原稿20のファイルのサイズより大きい場合、以降の処理を中断し、原稿20のファイルのファイル形式に従った文書ファイルを生成する。
【0053】
これにより、第3段階での比較により、第3のファイルのサイズが原稿20のファイルのサイズより小さい場合、ベクトル化されているデータを書き込んだベクトル化ファイルが原稿20のファイルのサイズより小さくなることから、ファイルサイズを増大させることなく、画像を細かく綺麗に描画するための文書ファイルを生成することができる。
【0054】
また、第1段階、第2段階又は第3段階のいずれかで第1〜第3のファイルのサイズが原稿20のファイルのサイズより大きい場合、以降の処理が中断されるため、無用な処理を省くことができる。
【0055】
また、ファイルサイズ算出比較部11dにより第1のファイルのサイズが算出される際、カウンター11eでカウントされたそれぞれの文字画像の合計文字数に、それぞれの文字画像のサイズを平均化した平均文字画像サイズが乗じられることから、第1のファイルのサイズの算出を容易に行うことができる。
【0056】
また、画像処理部11cにより、文字認識により得られる文字座標とベクトル化したデータに含まれる文字座標との照合により一致する文字画像のベクトル化データをフォント辞書cに登録し、この登録したベクトル化データを用いてベクトル化ファイルが生成されるようにしているので、文字認識により得られる文字画像のベクトル化を容易かつ確実に行うことができる。
【0057】
また、画像処理部11cにより、文字認識により得られる文字画像のパターンから得られる特徴量と一致する文字画像のベクトル化データをフォント辞書に登録し、この登録したベクトル化データを用いてベクトル化ファイルが生成されるようにしているので、上記同様に、文字認識により得られる文字画像のベクトル化を容易かつ確実に行うことができる。
【0058】
また、フォント辞書cへの登録を行う場合、既に登録済みの文字についてはその登録が行われないようにしているため、登録すべき文字画像が増えてもファイルサイズが増大してしまうことを抑制することができる。
【符号の説明】
【0059】
10 文書ファイル生成装置
11 制御部
11a 操作受付部
11b 画像認識部
11c 画像処理部
11d ファイルサイズ算出比較部
11e カウンター
11e−1 aカウンター
11e−2 bカウンター
11e−3 cカウンター
11f ベクトル化部
11g メモリー
12 操作部
13 表示部
14 スキャナー部
20 原稿
a ベクトル画像情報(ベクトルデータ)
b OCR(文字認識)情報
c フォント辞書
d 基点
e 重心
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10