(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5669957
(24)【登録日】2014年12月26日
(45)【発行日】2015年2月18日
(54)【発明の名称】西洋語の透かし処理をするための透かし画像の分割方法と装置
(51)【国際特許分類】
H04N 1/387 20060101AFI20150129BHJP
G06T 1/00 20060101ALI20150129BHJP
【FI】
H04N1/387
G06T1/00 500B
【請求項の数】11
【全頁数】15
(21)【出願番号】特願2013-545033(P2013-545033)
(86)(22)【出願日】2011年12月23日
(65)【公表番号】特表2014-500688(P2014-500688A)
(43)【公表日】2014年1月9日
(86)【国際出願番号】CN2011084577
(87)【国際公開番号】WO2012083882
(87)【国際公開日】20120628
【審査請求日】2014年4月15日
(31)【優先権主張番号】201010620424.X
(32)【優先日】2010年12月23日
(33)【優先権主張国】CN
【早期審査対象出願】
(73)【特許権者】
【識別番号】507231932
【氏名又は名称】北大方正集▲団▼有限公司
【氏名又は名称原語表記】PEKING UNIVERSITY FOUNDER GROUP CO., LTD
(73)【特許権者】
【識別番号】507232478
【氏名又は名称】北京大学
【氏名又は名称原語表記】PEKING UNIVERSITY
(73)【特許権者】
【識別番号】507230304
【氏名又は名称】北京北大方正▲電▼子有限公司
【氏名又は名称原語表記】BEIJING FOUNDER ELECTRONICS CO.,LTD.
(73)【特許権者】
【識別番号】513157039
【氏名又は名称】北京北大方正技▲術▼研究院有限公司
【氏名又は名称原語表記】PEKING UNIVERSITY FOUNDER R & D CENTER
(74)【代理人】
【識別番号】110000578
【氏名又は名称】名古屋国際特許業務法人
(72)【発明者】
【氏名】王高▲陽▼
(72)【発明者】
【氏名】▲其▼文法
(72)【発明者】
【氏名】王立▲東▼
(72)【発明者】
【氏名】▲楊▼斌
【審査官】
石田 信行
(56)【参考文献】
【文献】
特開2008−098946(JP,A)
【文献】
特開2005−341493(JP,A)
【文献】
特開2001−078006(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 1/387
G06T 1/00
(57)【特許請求の範囲】
【請求項1】
西洋語の透かし処理をするための透かし画像の分割方法であって、
西洋語画像を行列分割によって複数の文字画像ブロックを取得するステップと、
前記文字画像ブロックから有効な文字画像ブロックを識別するステップと、
前記西洋語画像がラージフォントテキストに対応するか、スモールフォントテキストに対応するかを判断するように、前記有効な文字画像ブロックのサイズを統計するステップと、
前記ラージフォントテキストと前記スモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うステップと、
グループ分けされた単語グループを、透かし画像ブロックに対応する複数の部分に均等に分割するステップと、
を備えることを特徴とする方法。
【請求項2】
前記文字画像ブロックから有効な文字画像ブロックを識別するステップにおいては、
前記文字画像ブロックを句読点画像ブロックと前記有効な文字画像ブロックとに分けることを特徴とする請求項1に記載の方法。
【請求項3】
前記文字画像ブロックを句読点画像ブロックと前記有効な文字画像ブロックとに分ける際には、
条件1:w>Nt1×H
条件2:Uの下端と上端がどちらもmの同じ側に位置する
条件3:Uの下端と上端がそれぞれmの両側に位置し、かつ、w<Nt2×H
を満足するかを判断し、
条件1〜3のいずれか1条件を満足する場合に、Uに対応する前記文字画像ブロックが句読点画像ブロックと判断され、条件1〜3のいずれも満足しない場合に、Uに対応する前記文字画像ブロックが有効な文字画像ブロックと判断されており、
ここで、Uが前記文字画像ブロックの集合Ωにおける前記文字画像ブロックの外接長方形の枠であり、HはUが位置する行の行高さであり、mはUが位置する中線であり、hとwはそれぞれUの高さと幅であり、Nt1とNt2はプリセット係数であることを特徴とする請求項2に記載の方法。
【請求項4】
Nt1=4、Nt2=0.35に設定することを特徴とする請求項3に記載の方法。
【請求項5】
前記有効な文字画像ブロックのサイズを統計するステップにおいては、
【数1】
を計算し、
H
s≧Th
size(Th
sizeはプリセット閾値である)の場合に、Uが位置する行はラージフォントサイズの文字行と判断され、H
s<Th
sizeの場合に、Uが位置する行はスモールフォントサイズの文字行と判断され、
前記西洋語画像における前記ラージフォントサイズの文字行の行数N
largeと前記スモールフォントサイズの文字行の行数N
smallとを統計し、
N
large≧N
smallの場合に、前記西洋語画像は前記ラージフォントサイズテキストに対応すると判断され、N
large<N
smallの場合に、前記西洋語画像は前記スモールフォントサイズテキストに対応すると判断されることを特徴とする請求項3に記載の方法。
【請求項6】
Thsize=88に設定することを特徴とする請求項5に記載の方法。
【請求項7】
前記単語グループを透かし画像ブロックに対応する複数の部分に均等に分割するステップにおいては、
単語列が投影する有効長さに基づいて前記単語グループを一定の数の部分に均等に分け、
前記数の部分の幅と、位置する文字の最大高さとを組合せて新たな外接長方形の枠が形成され、前記外接長方形の枠は透かし画像ブロックに対応することを特徴とする請求項1に記載の方法。
【請求項8】
西洋語画像を行列分割前に、
前記西洋語画像を取得し、
前記西洋語に対してノイズ除去処理を行い、2値化の前記西洋語画像を取得することを特徴とする請求項1に記載の方法。
【請求項9】
西洋語の透かし処理をするための透かし画像の分割装置であって、
西洋語画像を行列分割によって複数の文字画像ブロックを取得する分割モジュールと、
前記文字画像ブロックから有効な文字画像ブロックを識別する識別モジュールと、
前記西洋語画像はラージフォントサイズテキストに対応するか、スモールフォントサイズテキストに対応するかを判断するように、前記有効な文字画像ブロックのサイズを統計する統計モジュールと、
前記ラージフォントテキストと前記スモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うグループ分けモジュールと、
グループ分けされた単語グループを透かし画像ブロックに対応する複数の部分に均等に分割する均等分割モジュールと、
を備えることを特徴とする装置。
【請求項10】
前記識別モジュールは、
条件1:w>Nt1×H
条件2:Uの下端と上端がどちらもmの同じ側に位置する
条件3:Uの下端と上端がそれぞれにmの両側に位置し、かつ、w<Nt2×H
を満足するかを判断する判断モジュールと、
条件1〜3のいずれか1条件を満足する場合に、Uに対応する前記文字画像ブロックを句読点画像ブロックと判断し、条件1〜3のいずれも満足しない場合に、Uに対応する前記文字画像ブロックを有効な文字画像ブロックと判断する確定モジュールとを備えており、
ここで、Uが前記文字画像ブロックの集合Ωにおける前記文字画像ブロックの外接長方形の枠であり、HはUが位置する行の行高さであり、mはUが位置する中線であり、hとwはそれぞれUの高さと幅であり、Nt1とNt2はプリセット係数であることを特徴とする請求項9に記載の装置。
【請求項11】
前記統計モジュールは、
【数2】
を計算する計算モジュールと、
H
s≧Th
size(Th
sizeはプリセット閾値である)の場合に、Uが位置する行をラージフォントサイズの文字行と判断し、H
s<Th
sizeの場合に、Uが位置する行をスモールフォントサイズの文字行と判断する行確定モジュールと、
前記西洋語画像における前記ラージフォントサイズの文字行の行数N
largeと前記スモールフォントサイズの文字行の行数N
smallとを統計する行数統計モジュールと、
N
large≧N
smallの場合に、前記西洋語画像を前記ラージフォントサイズテキストに対応すると判断し、N
large<N
smallの場合に、前記西洋語画像を前記スモールフォントサイズテキストに対応すると判断するテキスト確定モジュールと、
を備えることを特徴とする請求項10に記載の装置。
【発明の詳細な説明】
【0001】
[技術分野]
本発明は、デジタル組版分野に関し、具体的に、西洋語の透かし処理をするための透かし画像の分割方法と装置に関する。
[背景技術]
電子商取引(e-commerce)と電子政府(e-government)が発展するにつれて、企業単位、事業単位、政党・政府機関及び国家安全などの関係部門は契約、秘密などの重要な書類が含まれる大量の文書資料を処理すべきである。これらのテキスト書類の版権保護と書類内容の安全が重要な問題であり、デジタル透かし技術は上記の問題を解決する手段を提供する。
【0002】
デジタル透かしでは、特定の情報をオーディオ、画像、または映像などのデジタル信号に埋め込む。デジタル透かしを有する信号をコピーすると、埋め込まれた情報も同時にコピーされる。デジタル透かしは、見える透かしと隠す透かしとに分類され、見える透かしは可視の透かし(visible watermarking)であり、それに含まれる情報が画像または映像を見るのと同時に見られる。通常、見える透かしに版権所有者の名前またはシンボルが含まれる。テレビ局はテレビ画面の隅で配置するシンボルも見える透かしの一種である。
【0003】
隠す透かしがデジタルデータの形でオーディオ、画像、または映像に埋め込まれるが、一般的な状況では見えない。隠す透かしの一つの重要な応用が版権保護であり、これによって、権限のないまま無断でデジタル媒質を複製やコピーすることを避けたり、防止したりする。ステガノグラフィー(Steganography)もデジタル透かしの一つの応用であり、デジタル信号に隠される情報によって互いに交流できる。デジタル写真に含まれる注釈データは写真を取る時間、使用されるレンズの絞りとカメラのシャッター、更にカメラのブランドなどの情報を記録でき、これもデジタル透かしの一つの応用である。ある書類フォーマットにこれらの「metadata(メタデータ)」と呼ばれる付加情報が含まれる。
【0004】
なお、たくさんのテキスト書類はデジタル形で存在するだけではなく、また印刷、コピーすることによって紙の形で伝播し、その中に、西洋語のテキストがかなりある。国際化がますます進んでいるのに伴い、西洋語のテキストを通じて交流することも頻繁になるので、これらのテキストに対する安全保護が強く要求される。デジタル化技術が非常に速く発展するにつれて、印刷、コピーすることによって紙の形を通じて交流することが既にかなり普及されており、たくさんの重要な情報または機密情報が紙書類の形で漏洩される。そのため、紙書類に基づいて、印刷とコピーを防止できる2値テキストの透かし技術を研究することが特に重要である。
【0005】
1.出願番号が200710121642.7である特許文献は2値画像におけるデジタル透かしを埋め込む方法を開示し、この方法は、2値画像の一部または全部を少なくとも二つの透かし画像ブロックを分割するステップと、それぞれの透かし画像ブロックにおける黒い画素点の数に基づいてグループに分けて、複数のグループを取得するステップと、それぞれの前記グループにおけるデータに対してアダマール(hadamard)変換を行うステップとを備える。量子化方法を使用し、埋め込み待ちの透かし信号を埋め込み、逆アダマール変換を行ってそれぞれの透かし画像ブロックにおける変更すべき画素点の数を取得することによって、透かしを埋め込んだり、抽出したりする目的を達する。
【0006】
2.出願番号が200810055770.0である特許文献は2値テキスト画像におけるデジタル透かしを埋め込む方法と装置を開示し、この方法は、2値画像の一部または全部を埋め込む部分と調整部分とを分割するステップと、前記埋め込む部分と調整部分におけるそれぞれの集合に含まれる黒い画素点の数の平均値を計算するステップと、前記平均値と埋め込む部分におけるそれぞれの集合に含まれる黒い画素点の数に基づいて色変更パラメータを計算するステップと、前記色変更パラメータに基づいて埋め込む部分と調整部分におけるそれぞれの集合に含まれる黒い画素点の数を変更し、透かしの埋め込みを実現するステップとを備える。
【0007】
3.出願番号が200610114048.0である特許文献はモノクロ2値テキスト画像におけるデジタル透かしの埋め込みと抽出を行う方法と装置を開示し、この埋め込み方法は、テキスト画像における有効文字エリアの位置を測定するステップと、有効文字エリアをグループに分け、それぞれの文字エリアにおける黒点の数を統計するステップと、グループ内の文字エリアにおける黒点の数の間の関係、透かしのビット・ストリング(bit string)及び第一ステップ長さに基づいて、それぞれの文字エリアにおける変転すべき画素の第一数を算出するステップと、第一数に従ってそれぞれの文字エリアにおける画素を変転するステップとを備える。また、この抽出する方法は、テキスト画像における有効文字エリアの位置を測定するステップと、有効文字エリアをグループに分け、それぞれの文字エリアにおける黒点の数を統計するステップと、それぞれのグループ内の文字エリアにおける黒点の数の間の相対関係及び第一ステップ長さに基づいて、埋め込まれた透かし情報のビット・ストリングを抽出するステップとを備える。
【0008】
上記の2値テキスト透かしの技術において、透かし画像ブロックは透かしを埋め込むエリアとして特に重要である。上記の特許出願1において、透かし画像ブロックを直接的に透かしを埋め込むエリアとする。特許出願2において、2値テキスト画像部分を透かし画像ブロックである埋め込む部分に分割する。特許出願3において、テキスト画像において、グループ分けされた有効文字エリアが透かし画像ブロックとする。上記の特許出願がいずれも透かし画像ブロックにおける黒い画素点の数を変更することによって透かしを埋め込み、透かし画像ブロックにおける黒い画素点の数を量子化することによって透かしを抽出する。
【0009】
そのため、上記の方法はいずれも二つの前提に基づく。即ち、
1.文字を分割する結果が正しくなければならない。現在の文字分割アルゴリズムは大体光学式文字識別OCR(Optical Character Recognition)システムの文字識別結果に依存するが、OCR識別の速度と効率を考慮し、それに、接触している西洋語に対して、OCR識別も一定のエラー率があるため、通常はデジタル透かしシステムにおいてOCRメカニズムを使用しない。
【0010】
2.透かし画像ブロックの黒い画像点の数の変化範囲が大きくない。例えば、中国語のテキストにおいて、一つの漢字を一つの透かし画像ブロックとする。中国語が角張った文字であり、各文字の面積差が少ないため、透かし画像ブロックにおける黒い画素点の数の差も少なく、透かしの埋め込みと抽出の正確さを確保することができる。
【0011】
しかしながら、以下の問題によって、上記の方法は西洋語にあまり適応しない。即ち、
(a)西洋語は印刷される前後に接触現象がよく発生し、例えば、「mn」、「tt」などが挙げられ、印刷・スキャンされる前後に文字分割の一致性を確保できない。シングルの西洋語を透かし画像ブロックとすれば、文字の接触は必ず透かしが埋め込まれると抽出される前後の文字画像ブロックを分割する系列の再同期性に影響し、透かしを埋め込むと抽出する成功率に影響する。
【0012】
(b)それぞれの西洋語単語の長さの差が大きく、単語に含まれる文字画像ブロックの黒い点数の変化範囲も大きい。例えば、「My extraordinary power」が挙げられ、それぞれの単語の長さの差が数倍になる。シングルの西洋語単語を透かし画像ブロックとすれば、透かし画像ブロックにおける黒い画素点の数が不安定であり、透かし操作を完成できない。
【0013】
(c)西洋語テキストのフォントサイズが変化することによって文字サイズが変化する。例えば、「Here」と「Here」に含まれる黒い画素点の数の差がかなり大きい。異なるフォントサイズのテキストによって、異なる量子化方法を使用すべきである。
【0014】
そのため、西洋テキストに対して、透かし画像ブロックを得るために、以下の条件を満足すべきであり、
1.文字接触による透かし画像ブロックが非同期の影響を避けることができる。
【0015】
2.透かし画像ブロックにおける黒い画素点の数の差が大きくない。
3.異なるフォントサイズのテキストに対して、サイズの大きさを順番にして透かし画像ブロックを適応的に分割できる。
[発明の概要]
本発明は従来の技術において西洋語画像に対して、透かし画像ブロックを正確に分割しにくい問題を解決するために、西洋語の透かし処理をするための透かし画像の分割方法と装置を提供することを目的とする。
【0016】
本発明は、西洋語の透かし処理をするための透かし画像の分割方法であって、この方法は、西洋語画像を行列分割によって複数の文字画像ブロックを取得するステップと、文字画像ブロックから有効な文字画像ブロックを識別するステップと、西洋語画像はラージフォントサイズテキストに対応するか、スモールフォントサイズテキストに対応するかを判断するように、有効な文字画像ブロックのサイズを統計するステップと、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うステップと、単語グループを透かし画像ブロックに対応する複数の部分に均等に分割するステップとを備えることを特徴とする。
【0017】
また、本発明は西洋語の透かし処理をするための透かし画像の分割装置であって、この装置は、西洋語画像を行列分割によって複数の文字画像ブロックを取得する分割モジュールと、文字画像ブロックから有効な文字画像ブロックを識別する識別モジュールと、西洋語画像はラージフォントサイズテキストに対応するか、スモールフォントサイズテキストに対応するかを判断するように、有効な文字画像ブロックのサイズを統計する統計モジュールと、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うグループ分けモジュールと、単語グループを透かし画像ブロックに対応する複数の部分に均等に分割する均等分割モジュールとを備えることを特徴とする。
【0018】
本発明の上記した実施例で、西洋語の透かし処理をするための透かし画像の分割方法と装置において、文字のフォントサイズに基づいて透かし画像ブロックを合理的に設置するため、従来の技術における西洋語に対して透かし画像ブロックを正確に分割しにくい問題を解決でき、透かしの埋め込み処理する操作性を確保することができる。
【図面の簡単な説明】
【0019】
以下で説明される図面は、本発明を更に理解するためのものであり、本願の一部分となる。本発明の実施例及びその説明は本発明を解釈するが、本発明に対する不当な制限を構成しない。
【
図1】本発明の実施例で、西洋語の透かし処理をするための透かし画像の分割方法を示すフローチャートである。
【
図2】本発明の実施例で、ラージフォントテキストか、スモールフォントテキストかを判断する方法を示すフローチャートである。
【
図3】本発明の実施例で、有効な文字エリアをグループに分ける方法を示すフローチャートである。
【
図4A】本発明の実施例で、西洋語2値画像の行高さと中心線を示す模式図である。
【
図4B】本発明の実施例で、西洋語2値画像の有効な文字画像ブロックを示す模式図である。
【
図5】本発明の実施例で、西洋語2値画像が分割された結果を示す模式図である。
【
図6】本発明の実施例で、西洋語2値画像の単語グループ分けの結果を示す模式図である。
【
図7A】本発明の実施例で、単語グループにおける文字の有効長さを計算する模式図である。
【
図7B】本発明の実施例で、透かし画像ブロックを取得する模式図である。
【
図8A】本発明の実施例で、スモールフォントサイズの西洋語テキストの透かし画像ブロックの模式図である。
【
図8B】本発明の実施例で、スモールフォントサイズの西洋語テキストが印刷・スキャンされた後の透かし画像ブロックの模式図である。
【
図8C】本発明の実施例で、異常な間隔があって、一部の文字が接触する場合に、スモールフォントサイズの西洋語テキストの透かし画像ブロックの模式図である。
【
図8D】本発明の実施例で、ラージフォントサイズの西洋語テキストの透かし画像ブロックの模式図である。
【
図8E】本発明の実施例で、ラージフォントサイズの西洋語テキストが印刷・スキャンされた後の透かし画像ブロックの模式図である。
【
図9】本発明の実施例で、単語分割を計算するプロセスにおける分割閾値を示す模式図である。
【
図10】本発明の実施例により提供される西洋語の透かし処理をするための透かし画像の分割装置を示す模式図である。
【発明を実施するための形態】
【0020】
以下、図面を参照しながら実施例で本発明を詳細に説明する。
図1で示されるように、本発明の一実施例は西洋語の透かし処理をするための透かし画像の分割方法であって、西洋語画像を行列分割によって複数の文字画像ブロックを取得するステップS10と、文字画像ブロックから有効な文字画像ブロックを識別するステップS20と、西洋語画像はラージフォントサイズテキストに対応するか、スモールフォントサイズテキストに対応するかを判断するように、有効な文字画像ブロックのサイズを統計するステップS30と、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うステップS40と、単語グループを透かし画像ブロックに対応する複数の部分に均等に分割するステップS50とを備える。
【0021】
この実施例において有効な文字画像のサイズを統計することによって、西洋語の単語はフォントが異なる場合に、行列分割の特性を十分に考慮し、ラージフォントテキストとスモールフォントサイズの文字テキストが区分される。ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でテキストをグループに適応的に分けて、取得された透かし画像ブロックにおける黒い画素点の数の差が小さくなり、透かしの埋め込み処理の操作性を確保することができる。
【0022】
なお、本実施例の均等に分けた単語グループが複数であり、印刷される前後に西洋語の間隔は不安定である特性を十分に考慮し、埋め込まれる前に、間隔を拡大すべき文字と間隔を縮小すべき文字を確定し修正を適当に行う。印刷される前後の西洋語の単語を分割する結果の一致性を確保でき、透かしの埋め込みと抽出を行う処理の頑健性を向上することができる。
【0023】
好ましくは、ステップS10を行う前に、西洋語画像を取得し、西洋語に対してノイズ除去処理を行い、2値化の西洋語画像を取得する。このステップは西洋語画像の前処理を実施し、コンピューターで簡単に実現できる。本好ましい実施例はノイズ除去処理によって、より良い西洋語の2値テキスト画像を取得できる。
【0024】
好ましくは、ステップS20においては、文字画像ブロックを句読点画像ブロックと有効な文字画像ブロックとに分ける。西洋語テキストに句読点とアルファベットとが主に含まれ、通常、句読点が小さいので、透かしに埋め込むことが不適である。本好ましい実施例は文字画像ブロックにおける句読点画像ブロックと有効な文字画像ブロックとに分けることによって、句読点を除外できる。
【0025】
好ましくは、文字画像ブロックを句読点画像ブロックと有効な文字画像ブロックとに分ける際には、
条件1:w>N
t1×H
条件2:Uの下端と上端がどちらもmの同じ側に位置する
条件3:Uの下端と上端がそれぞれにmの両側に位置し、かつ、w<N
t2×H
を満足するかを判断し、条件1〜3のいずれか1条件を満足する場合に、Uに対応する文字画像ブロックが句読点画像ブロックと判断され、条件1〜3のいずれも満足しない場合に、Uに対応する文字画像ブロックが有効な文字画像ブロックと判断されており、ここで、Uが文字画像ブロックの集合Ωにおける文字画像ブロックの外接長方形の枠であり、HはUが位置する行の行高さであり、mはUが位置する中線であり、hとwはそれぞれUの高さと幅であり、N
t1とN
t2はプリセット係数である。
【0026】
本好ましい実施例において、具体的な数値化を判断するプロセスが提供され、コンピューターでプログラミングによって実現することが便利である。
好ましくは、N
t1=4、N
t2=0.35に設定する。本好ましい係数は発明者によって大量の実験を行った上で得られた最適な係数である。もちろん、上記した値の近くに設定してもよく、同様に本発明の主旨に属する。
【0027】
好ましくは、ステップS30においては、
【0029】
を計算し、H
s≧Th
size(Th
sizeはプリセット閾値である)の場合に、Uが位置する行はラージフォントサイズの文字行と判断され、H
s<Th
sizeの場合に、Uが位置する行はスモールフォントサイズの文字行と判断され、西洋語画像におけるラージフォントサイズの文字行の行数N
largeとスモールフォントサイズの文字行の行数N
smallとを統計し、N
large≧N
smallの場合に、西洋語画像はラージフォントサイズテキストに対応すると判断され、N
large<N
smallの場合に、西洋語画像はスモールフォントサイズテキストに対応すると判断される。
【0030】
本好ましい実施例において、具体的な数値化を判断するプロセスが提供され、コンピューターでプログラミングによって実現することが便利である。
好ましくは、Th
size=88に設定する。本好ましい閾値は発明者によって大量の実験を行った上で得られた最適な係数である。もちろん、上記した値の近くに設定してもよく、同様に本発明の主旨に属し、本発明の保護範囲内に含まれる。
【0031】
図2は本発明の実施例で、ラージフォントテキストか、スモールフォントテキストかを判断する方法を示すフローチャートである。本発明は初歩的な行列分割によって複数の文字画像ブロックの外接長方形の枠を取得する。文字画像ブロックの統計特性によってラージフォントサイズの文字行か、スモールフォントサイズの文字行かを判断してから、ラージフォントテキストか、スモールフォントテキストかを判断する。具体的には、
S201:文字画像ブロックを取得する。
【0032】
初歩的な行列分割によって複数の文字画像ブロックの外接長方形の枠を取得する。
図4Aで示されるように、現在の文字画像集合Ωに対して、Hは現在の行高さであり、mが現在の行の中線である。
図4Bで示されるように、文字画像ブロックUはΩにおけるいずれかの外接長方形の枠である。h、wはそれぞれUの高さと幅である。
【0033】
S202:句読点画像ブロックと有効な文字画像ブロックとに分ける。
文字画像ブロックUが以下の三つの条件のいずれか1条件を満足する場合に、Uが句読点画像ブロックと判断し、以下の三つの条件のいずれも満足しない場合に、Uが有効な文字画像ブロックと判断する。即ち、
条件1:w>N
t1×H
条件2:Uの下端と上端がどちらもmの同じ側に位置する
条件3:Uの下端と上端がそれぞれにmの両側に位置し、かつ、w<N
t2×H
通常はN
t1=4、N
t2=0.35である。
【0034】
ここで、条件1は下線「_」のような句読点を除外するためであり、条件2はコンマ、句点、クォーテーション・マークなどの句読点を除外するためであり、条件3はハイフン「−」などの句読点を除外するためである。
【0035】
ステップS202が実行された後に、全ての文字画像ブロックUは句読点画像ブロックと有効な文字画像ブロックとに分けられることが明らかである。
S203:有効な文字画像ブロックの統計特性を計算する。
【0036】
現在の行において、有効な文字画像ブロックUの数がmとされる場合に、現在の有効な文字画像ブロックの有効高さHsは、
【0038】
であり、ここで、h1+h2+・・・hmはそれぞれ現在の行の有効な文字画像ブロック1、2・・・mの高さである。
S204:ラージフォントサイズの文字行か、スモールフォントサイズの文字行かを判断する。
【0039】
H
s≧Th
sizeの場合に、現在の行はラージフォントサイズの文字行と判断され、H
s<Th
sizeの場合に、現在の行はスモールフォントサイズの文字行と判断される。通常は、Th
size=88である。
【0040】
S205:テキストのタイプを判断する。
テキストにおけるラージフォントサイズの文字行の行数N
largeとスモールフォントサイズの文字行の行数N
smallとをそれぞれ統計し、N
large≧N
smallの場合に、当該テキストはラージフォントテキストと判断され、N
large<N
smallの場合に、当該テキストはスモールフォントテキストと判断される。
【0041】
好ましくは、ステップS50においては、単語列が投影する有効長さに基づいて単語グループを一定の数の部分に均等に分け、各部分の幅と位置する文字の最大高さとを組合せて新たな外接長方形の枠が形成され、外接長方形の枠は透かし画像ブロックに対応する。
【0042】
図3は本発明の実施例で、有効な文字エリアをグループに分ける方法を示すフローチャートである。ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行う。それぞれのグループをその中の単語列が投影する有効長さに基づいて一定の数の部分に均等に分け、各部分の幅と位置する文字の最大高さとを組合せて新たな外接長方形の枠が形成され、それぞれの新たな外接長方形の枠は透かし画像ブロックに対応する。これによって、有効エリアをグループに分けることが完成し、具体的には、
S301:テキストのタイプと単語の分割結果を取得する。
【0043】
ステップS30によってテキストのタイプが既に判断され、つまり、ラージフォントテキストか、スモールフォントテキストかが判断された。単語分割について、1行において全ての隣接する有効な文字画像ブロックの外接長方形の間の距離を昇順で並べる。この新しい系列に2種類のデータが含まれると考えられ、単語における文字の間隔と、単語同士の間隔である。明らかに、単語同士の間隔は単語における文字の間隔より大きい。
図9で示されるように、上記した2種類のデータを区分するために、昇順で並べる系列から分割閾値を選択する。従って、正確で安定的な分割閾値を取得することが単語を分割することのキーである。
【0044】
大津法と2ピーク方法(two-peak method)などの画像2値化方法によって上記した系列における2種類のデータを区分できる。なお、分割閾値の左サブ系列と右サブ系列の分散が両方とも比較的に小さい統計特性を考えて、系列における左分散と右分散の合計が最も小さい点を計算する方法によって最適な分割閾値を確定する。分割閾値が取得された後に、分割閾値より小さいである文字間隔に対応する文字画像ブロックを一つの単語に合併する。結果として、
図5で示されるような単語分割の結果が取得された。
【0045】
S302:一部の文字を局所的に調整する。
単語分割の閾値の近くの有効な文字画像ブロックを、間隔を拡大すべき文字とし、有効な文字画像ブロックの間隔が非常に小さくて、印刷された後に文字が接触しがちである有効な文字画像ブロックを間隔を縮小すべき文字とする。取得された有効な文字画像ブロックの属性に基づいて、相応する文字を移動する。間隔を拡大すべき文字が右に移動され、間隔を拡大すべき文字の右側にある全てのテキスト内容が右に移動される。間隔を縮小すべき文字が左に移動され、間隔を縮小すべき文字の右側にある全てのテキスト内容が左に移動される。
【0046】
S303:単語をグループに分ける。
図6で示されるように、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数で単語グループGに分ける。各ラージフォントテキストのグループにN
t3個の単語が含まれ、各スモールフォントテキストのグループにN
t4個の単語が含まれる。通常はN
t3=
3、N
t4=4である。
【0047】
S304:文字の有効長さを計算する。
図7Aで示されるように、あるグループGに対して、グループにおける合計m個の有効な文字画像ブロックUの有効長さLは
【0049】
である。当該グループを定数S個の部分に均等に分ける。そこで、各部分の有効長さL
s=L/Sである。ここで、Sの値は透かし処理次第である。例えば、出願番号は200710121642.7である特許において、Sの値と使用されるアダマール行列の階数と同じである。通常、S=4である。
【0050】
S305:透かし画像ブロックを取得する。
図7Bで示されるように、各部分の有効長さを有効な文字画像ブロックに対応してグループを分けるとともに、各部分に含まれる文字の最大高さを新たな外接長方形の枠に組合せ、各新たな外接長方形の枠が一つの透かし画像ブロックに対応する。
【0051】
S個の透かし画像ブロックごとに一つのグループが分けられ、分けられたグループに基づいてデジタル透かしに対して埋め込みと抽出を行う。
図8A、
図8Bはそれぞれのスモールフォントサイズの西洋語テキストが印刷・スキャンされる前後の透かし画像ブロックである。
図8Cは本発明の実施例で、異常な間隔があって、一部の文字が接触する場合に取得された透かし画像ブロックである。
図8D、
図8Eはそれぞれのラージフォントサイズの西洋語テキストが印刷・スキャンされる前後の透かし画像ブロックである。本発明により取得された透かし画像ブロックは印刷・スキャンの操作の影響を受けず、しかも、文字が接触することと、文字テキストのフォントサイズが異なることによる影響を避けることが分かる。
【0052】
図10は本発明の実施例で、西洋語の透かし処理をするための透かし画像の分割装置を示す模式図であり、この装置は、西洋語画像を行列分割によって複数の文字画像ブロックを取得する分割モジュール10と、文字画像ブロックから有効な文字画像ブロックを識別する識別モジュール20と、西洋語画像はラージフォントサイズテキストに対応するか、スモールフォントサイズテキストに対応するかを判断するように、有効な文字画像ブロックのサイズを統計する統計モジュール30と、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うグループ分けモジュール40と、単語グループを透かし画像ブロックに対応する複数の部分に均等に分割する均等分割モジュール50とを備える。
【0053】
この実施例は透かしの埋め込み処理の操作性を確保することができ、当該透かし画像ブロックの再同期性と、透かしの埋め込みと抽出を行う処理の頑健性を向上することができる。
【0054】
好ましくは、識別モジュール20は、
条件1:w>N
t1×H
条件2:Uの下端と上端がどちらもmの同じ側に位置する
条件3:Uの下端と上端がそれぞれにmの両側に位置し、かつ、w<N
t2×H
を満足するかを判断する判断モジュールと、条件1〜3のいずれか1条件を満足する場合に、Uに対応する文字画像ブロックを句読点画像ブロックと判断し、条件1〜3のいずれも満足しない場合に、Uに対応する文字画像ブロックを有効な文字画像ブロックと判断する確定モジュールとを備えており、ここで、Uが文字画像ブロックの集合Ωにおける文字画像ブロックの外接長方形の枠であり、HはUが位置する行の行高さであり、mはUが位置する中線であり、hとwはそれぞれUの高さと幅であり、N
t1とN
t2はプリセット係数であることを特徴とする装置。
【0057】
を計算する計算モジュールと、H
s≧Th
size(Th
sizeはプリセット閾値である)の場合に、Uが位置する行をラージフォントサイズの文字行と判断し、H
s<Th
sizeの場合に、Uが位置する行をスモールフォントサイズの文字行と判断する確定モジュールと、西洋語画像におけるラージフォントサイズの文字行の行数N
largeとスモールフォントサイズの文字行の行数N
smallとを統計する行数統計モジュールと、N
large≧N
smallの場合に、西洋語画像をラージフォントサイズテキストに対応すると判断し、N
large<N
smallの場合に、西洋語画像をスモールフォントサイズテキストに対応すると判断するテキスト確定モジュールとを備える。
【0058】
以上の説明で分かるように、本発明の上記の実施例は西洋語画像の透かし処理をする正確さを最終的に向上することができる。本発明において、フォントサイズが異なる西洋語単語の異なる行列分割特性を十分に考えた上で、フォントサイズが大きいテキストとフォントサイズが小さいテキストを区分する閾値を取得し、閾値によって大きいテキストか、フォントサイズが小さいテキストかを判断する。テキストのタイプによって異なる個数の単語でグループに分け、分けられた透かし画像ブロックにおける黒い画素点の数の差が小さくなり、透かし処理の頑健性を著しく向上できる。本発明において、印刷される前後に、西洋語単語同士の間における間隔は不安定の状況を十分に考えて、透かしを埋め込む時に、西洋語単語の分割閾値の局所特性を考えて、閾値の近くにある西洋語単語の内部文字の間の距離に対して微調整を行い、印刷・スキャンされる前後に文字分割の一致性を確保でき、当該透かし画像ブロックの再同期性と、透かしの埋め込みと抽出を行う処理の頑健性をいっそうに向上することができる。
【0059】
言うまでもなく、当業者であれば分かるように、上記した本発明の各モジュールや各ステップは、汎用のコンピューター装置によって実現でき、単一のコンピューター装置に集積されても良く、複数のコンピューター装置からなるネットワークに配置されても良く、任意に、各モジュールや各ステップは、コンピューター装置にて実行可能なプログラムコードで実現でき、それらを記憶装置に記憶して計算装置に実行させても良く、あるいは、それぞれ各集積回路モジュールとして作成しても良く、あるいは、それらの中の複数のモジュール又はステップを単一の集積回路モジュールとして作成して実現しても良い。このように、本発明は、いかなる特定のハードウェアとソフトウェアとの組合せに限定されない。
【0060】
以上は、本発明の好ましい実施例に過ぎず、本発明を限定するものではない。本発明に対して、様々な変更や変化が可能である。本発明の主旨と原則を離脱しない範囲で、いかなる変更、均等代替、改良なども本発明の保護範囲内に含まれる。