IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アクシス アーベーの特許一覧

特開2024-94284エンコーダ最適化テキストレンダリング
<>
  • 特開-エンコーダ最適化テキストレンダリング 図1
  • 特開-エンコーダ最適化テキストレンダリング 図2
  • 特開-エンコーダ最適化テキストレンダリング 図3
  • 特開-エンコーダ最適化テキストレンダリング 図4
  • 特開-エンコーダ最適化テキストレンダリング 図5
  • 特開-エンコーダ最適化テキストレンダリング 図6
  • 特開-エンコーダ最適化テキストレンダリング 図7
  • 特開-エンコーダ最適化テキストレンダリング 図8
  • 特開-エンコーダ最適化テキストレンダリング 図9
  • 特開-エンコーダ最適化テキストレンダリング 図10
  • 特開-エンコーダ最適化テキストレンダリング 図11
  • 特開-エンコーダ最適化テキストレンダリング 図12
  • 特開-エンコーダ最適化テキストレンダリング 図13
  • 特開-エンコーダ最適化テキストレンダリング 図14
  • 特開-エンコーダ最適化テキストレンダリング 図15
  • 特開-エンコーダ最適化テキストレンダリング 図16
  • 特開-エンコーダ最適化テキストレンダリング 図17
  • 特開-エンコーダ最適化テキストレンダリング 図18
  • 特開-エンコーダ最適化テキストレンダリング 図19
  • 特開-エンコーダ最適化テキストレンダリング 図20
  • 特開-エンコーダ最適化テキストレンダリング 図21
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024094284
(43)【公開日】2024-07-09
(54)【発明の名称】エンコーダ最適化テキストレンダリング
(51)【国際特許分類】
   H04N 19/80 20140101AFI20240702BHJP
   H04N 19/12 20140101ALI20240702BHJP
   H04N 19/176 20140101ALI20240702BHJP
【FI】
H04N19/80
H04N19/12
H04N19/176
【審査請求】未請求
【請求項の数】16
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023216696
(22)【出願日】2023-12-22
(31)【優先権主張番号】22216692
(32)【優先日】2022-12-27
(33)【優先権主張国・地域又は機関】EP
(71)【出願人】
【識別番号】502208205
【氏名又は名称】アクシス アーベー
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】ユアン, ソン
(72)【発明者】
【氏名】ハスブリング, ルドビック
(72)【発明者】
【氏名】ニルソン, ジェシカ
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LA02
5C159MA04
5C159MA21
5C159MC11
5C159ME01
5C159PP01
5C159PP02
5C159TA01
5C159TA37
5C159TB08
5C159TD17
5C159UA02
5C159UA05
(57)【要約】      (修正有)
【課題】ブロック単位変換符号化に適したラスタ画像内のテキストをレンダリングする方法及びデバイスを提供する。
【解決手段】ブロック単位変換符号化に適したデジタルラスタ画像内のテキスト文字列をレンダリングするための方法100は、ブロック単位変換符号化のための符号化ブロックへの画像領域のパーティションを取得すること110と、画像領域内の、各グラフィック要素の少なくとも位置、向き及びサイズを定める仮レイアウトに従って配置された書体からの複数のグラフィック要素としてテキスト文字列を表すこと114と、スペクトルスパース化動作を少なくとも1つの空でない符号化ブロックに適用することによって仮レイアウトを修正し、それによって修正されたレイアウトを取得すること116と、修正されたレイアウトに従って配置されたグラフィック要素のデジタルラスタ画像をレンダリングすること118と、を含む。
【選択図】図1
【特許請求の範囲】
【請求項1】
ブロック単位変換符号化に適したデジタルラスタ画像内のテキスト文字列をレンダリングするための方法であって、
前記ブロック単位変換符号化のための符号化ブロックへの画像領域のパーティションを取得することと、
前記画像領域内の仮レイアウトに従って配置された書体からの複数のグラフィック要素として前記テキスト文字列を表すことであって、前記仮レイアウトは、各グラフィック要素の少なくとも位置、向き、およびサイズを定める、表すことと、
スペクトルスパース化動作を少なくとも1つの空でない符号化ブロックに適用することによって前記仮レイアウトを修正し、それによって修正されたレイアウトを取得することと、
前記修正されたレイアウトに従って配置された前記グラフィック要素のデジタルラスタ画像をレンダリングすることと
を含む、方法。
【請求項2】
前記スペクトルスパース化動作は、グラフィック要素の回転、グラフィック要素の傾斜、完全なグラフィック要素の等方性または異方性再スケーリング、グラフィック要素の一部分のグラフィック要素の等方性または異方性再スケーリング、グラフィック要素の平行移動、書体修正、書体置換、コントラスト修正のうちの1つまたは複数を含む、請求項1に記載の方法。
【請求項3】
前記スペクトルスパース化動作は、グラフィック要素の回転または傾斜を含む、請求項1に記載の方法。
【請求項4】
前記回転または傾斜は、符号化ブロック内の固有の線の向きの数を減少させる、請求項3に記載の方法。
【請求項5】
前記回転または傾斜は、線の向きを垂直軸または水平軸と位置合わせする、請求項3に記載の方法。
【請求項6】
前記スペクトルスパース化動作は、完全なグラフィック要素の等方性もしくは異方性再スケーリング、またはグラフィック要素の一部分のグラフィック要素の等方性もしくは異方性再スケーリングを含む、請求項1に記載の方法。
【請求項7】
前記再スケーリングは、符号化ブロック内の固有の垂直距離または水平距離の数を減少させる、請求項6に記載の方法。
【請求項8】
前記スペクトルスパース化動作は、グラフィック要素の平行移動を含む、請求項1に記載の方法。
【請求項9】
前記平行移動は、符号化ブロックごとに幾何学的に類似のグラフィック要素を集めかつ/または幾何学的に非類似のグラフィック要素を分離し、それによって符号化ブロック内の固有の線の向きの数および/または固有の垂直距離もしくは水平距離の数を減少させる、請求項8に記載の方法。
【請求項10】
前記平行移動は、これらのグラフィック要素の以前のブロック単位変換符号化からの少なくとも1つのキャッシュされたスペクトルに基づいて、符号化ブロックごとにスペクトル的に類似のグラフィック要素を集めかつ/またはスペクトル的に非類似のグラフィック要素を分離する、請求項9に記載の方法。
【請求項11】
前記平行移動は、1つの符号化ブロック内のグラフィック要素を再配置し、それによって符号化ブロック内の固有の線の向きの数および/または固有の垂直距離もしくは水平距離の数を減少させる、請求項8に記載の方法。
【請求項12】
前記平行移動は、グラフィック要素によって占有される符号化ブロックの数を減少させる、請求項8に記載の方法。
【請求項13】
前記スペクトルスパース化動作は、書体修正または書体置換を含む、請求項1に記載の方法。
【請求項14】
前記書体修正または書体置換は、グラフィック要素の幾何学的形状を単純化する、請求項13に記載の方法。
【請求項15】
前記書体修正または書体置換は、グラフィック要素の終端形状を単純化すること、グラフィック要素上のイヤーまたはセリフを除去すること、グラフィック要素上のストロークの幅を均一化すること、グラフィック要素上の複数のストロークの幅を均一化すること、符号化ブロックにおける書体重みを均一化すること、1つまたは複数のグラフィック要素の開口を均一化することのうちの1つまたは複数を含む、請求項13に記載の方法。
【請求項16】
請求項1に記載の方法を実行するように配置された処理回路を備える、デバイス。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、二次元画像データ生成の分野に関する。特に、本開示は、ブロック単位変換符号化に適したラスタ画像内のテキストをレンダリングするための技術を提示する。
【背景技術】
【0002】
デジタル画像符号化の分野における著しい進歩のおかげで、非常に低いビットレートを有するビットストリームとして入力画像を表すことが可能であり、そこから画像をその視覚的品質を著しく低下させることなく再構成することができる。いくつかのユースケースでは、入力画像は固定されており、例えば、カメラによって記録されているか、または事前に合成されている。そして、デジタル画像符号化プロセスは、通常、非可逆および不非可逆(non-lossy)圧縮を含む様々なデータ圧縮技術を適用することによってのみビットストリームのビットレートを制御することができる。他のユースケースでは、入力画像は、特定の制限内の修正に従うことが可能である。これは、特に、入力画像が画像符号化と同時に合成(レンダリング)される場合に適用され、合成は、いくつかの側面を未定のままにするエンドユーザのレンダリング仕様を満たすものとする。例えば、レンダリング仕様は、いくつかの三次元オブジェクトの幾何学的形状および位置を定めることができるが、それらの色およびテクスチャを指定せず、かつ/またはシーンの照明を指定しない。言い換えれば、レンダリングを担当する人またはデバイスは、レンダリング時に上記色、テクスチャ、または照明を選択する自由度を有し、各選択は、エンドユーザにとって許容可能である。エンドユーザは、再構成画像を閲覧しようとしている人(例えば、消費者)、再構成画像に対して光学文字認識(OCR)を実施するプロセッサ、または実際には、その代わりに画像符号化が実施されるシステム所有者であってもよい。
【0003】
本発明者らは、この自由度を利用して画像符号化プロセスの性能を改善することができることを認識した。特に、本発明者らは、テキストレンダリングの分野において未開発の可能性を発見した。
【発明の概要】
【0004】
本開示の1つの目的は、デジタルラスタ画像がブロック単位変換符号化に適するようにデジタルラスタ画像内のテキスト文字列をレンダリングするための方法を利用可能にすることである。さらなる目的は、疎スペクトルを有するデジタルラスタ画像を発生させるためのテキストレンダリング方法を利用可能にすることである。さらなる目的は、1つまたは複数のレイアウト制約を満たすそのような方法を利用可能にすることである。さらなる目的は、背景デジタル画像と共にエンコードされるオーバーレイテキストを生成するのに適したテキストレンダリング方法を利用可能にすることである。別のさらなる目的は、これらの機能を有するデバイスおよびコンピュータプログラムを提案することである。
【0005】
これらの目的の少なくともいくつかは、独立請求項によって規定される本発明によって達成される。従属請求項は、有利な実施形態に関する。
【0006】
本開示の第1の態様では、ブロック単位変換符号化に適したデジタルラスタ画像内のテキスト文字列をレンダリングするための方法が提供される。テキスト文字列は、方法を実行するエンティティの観点から予め決められており、すなわち、テキスト文字列は、エンドユーザから受信されてもよく(上記の説明を参照)、または実行中のソフトウェアアプリケーションによって作成されてもよく、上記エンティティは、テキスト文字列を修正してはならない。方法は、ブロック単位変換符号化のための符号化ブロックへの画像領域のパーティションを取得することと、画像領域内の仮レイアウトに従って配置された書体からの複数のグラフィック要素としてテキスト文字列を表すことであって、仮レイアウトは、各グラフィック要素の少なくとも位置、向き、およびサイズを定める、表すことと、スペクトルスパース化動作を少なくとも1つの空でない符号化ブロックに適用することによって仮レイアウトを修正し、それによって修正されたレイアウトを取得することと、修正されたレイアウトに従って配置されたグラフィック要素のデジタルラスタ画像をレンダリングすることとを含む。
【0007】
スペクトルスパース化動作(または、別の用語では、スペクトルスパース化動作(spectral sparsification operation))は、スペクトルスパース化動作が実施されなかった場合よりもデジタルラスタ画像の符号化ブロックのスペクトルを疎にする。すなわち、スペクトルスパース化動作は、符号化ブロックに適用されたときにブロック単位変換符号化が発生する非ゼロ変換係数の数を減少させる可能性が高い。これは、デジタルラスタ画像をわずかに低いビットレートでエンコードすることができることを意味する。本発明者らは、スペクトルスパース化が効率的な画像エンコードのための重要な促進要因であることを認識し、テキスト文字列に適用されたときに非破壊的である有利なスペクトルスパース化動作のクラスを開発した。より正確には、スペクトルスパース化動作は、(任意選択のレイアウト制約を条件として)仮レイアウトを修正するが、テキスト文字列を維持する。第1の態様による方法は、テキストレンダリングプロセスと後続の画像エンコードプロセスをより近づける方法であり、それによってこれらのプロセス間の相乗効果を活用すると考えられ得る。このようにして、レンダリングされたテキスト文字列を有するエンコード画像は、より効率的にシステム内の利用可能な通信帯域幅または記憶空間の量を利用する。
【0008】
以下でさらに指定されるスペクトルスパース化動作は、後続の画像エンコードプロセスとの相互作用を前提としないモデルベースの開ループ動作として特徴付けることができる。スペクトルスパース化法は、本発明者らが蓄積した多くの経験に基づいて、デジタルラスタ画像に対するその影響を正確に予測することができるという意味でモデルベースである。モデルベースの開ループ手法は、処理リソースおよび実行時間の経済的な使用を可能にし、これにより第1の態様による方法が重要なマスマーケットのユースケースに適していることが保証される。スペクトルスパース化動作は、試行錯誤的な手法として正しく特徴付けられていない。対照的に、互換可能なビットレート減少を達成するためのモデルフリーの閉ループ手法は、より計算コストがかかる可能性が高い。閉ループ手法は、例えば、反復探索を含むことができ、各反復は、(1)テキスト文字列を新しいレイアウトでレンダリングすることと、(2)画像をエンコードすることと、(3)十分なサイズに達するまで、エンコード画像のサイズの変化を評価することとを含む。反復探索は、デジタル画像のスペクトルがレイアウト修正にどのように応答するかについての経験によって導かれないため、本明細書で提案される方法よりも効率的でない可能性が高い。例えば、各画像に対してかなりの数のエンコード動作(2)が必要とされ得る。テキスト文字列が多数のランダムに生成されたレイアウトに対してレンダリングされ、最良の性能のレイアウトがエンコード画像のサイズに基づいて選択されるモデルフリーの手法からは、同様に不十分な性能が予想され得る。
【0009】
いくつかの実施形態では、スペクトルスパース化動作は、グラフィック要素の回転、グラフィック要素の傾斜、完全なグラフィック要素の等方性または異方性再スケーリング、グラフィック要素の一部分のグラフィック要素の等方性または異方性再スケーリング、グラフィック要素の平行移動、書体修正、書体置換、コントラスト修正のうちの1つまたは複数を含む。本発明者らは、スペクトルスパース化動作のこれらのサブタイプと共に使用するための具体的なガイドラインを発見しており、以下で詳細に説明する。
【0010】
特に、スペクトルスパース化動作は、回転、傾斜、または平行移動などのグラフィック要素の剛体変換から構成されうる。
【0011】
いくつかの実施形態では、方法は、書体、最大範囲、最小範囲、および/または向きを指定する1つまたは複数のレイアウト制約を取得することをさらに含む。
【0012】
いくつかの実施形態では、ブロック単位変換符号化は、二重周期関数の直交基底に関する射影と、それに続くゼロへの丸め動作(round-to-zero operation)とを含み得る。
【0013】
いくつかの実施形態では、グラフィック要素は、キャラクタなどのグリフを含む。
【0014】
本開示の第2の態様は、第1の態様の方法を実行するように配置されたデバイスに関する。これらのデバイスは、画像もしくはビデオ編集、画像もしくはビデオコンテンツ管理、ビデオサブタイトル、画像もしくはビデオ再生、ワードプロセシングなどの異なる主目的を有することができ、または他のオーサリングツールを含むことができる。さらに、デバイスは、テキスト文字列をオーバーレイする自動注釈機能を有する、屋内または屋外ビデオ監視などの特定のユースケース用に設計されてもよい。本開示の第2の態様内のデバイスは、一般に、第1の態様の効果および利点を共有し、それらは同等の程度の技術的変形を伴って具現化することができる。
【0015】
本開示はさらに、コンピュータに上記の方法を実行させるための命令を含むコンピュータプログラムに関する。コンピュータプログラムは、データキャリアに記憶または分配することができる。本明細書で使用される場合、「データキャリア」は、変調された電磁波もしくは光波などの一時的データキャリア、または非一時的データキャリアであってもよい。非一時的データキャリアは、磁気、光学、またはソリッドステートタイプの永続的および非永続的記憶媒体などの揮発性および不揮発性メモリを含む。依然として「データキャリア」の範囲内で、そのようなメモリは固定的に取り付けられてもよく、または携帯可能であってもよい。
【0016】
一般に、特許請求の範囲で使用されるすべての用語は、本明細書で特に明示的に規定されない限り、技術分野におけるそれらの通常の意味に従って解釈されるべきである。「1つの(a/an)/要素、装置、構成要素、手段、ステップなど」へのすべての言及は、特に明記しない限り、要素、装置、構成要素、手段、ステップなどの少なくとも1つの例を指すものとして広く解釈されるべきである。本明細書に開示される任意の方法のステップは、明記しない限り、開示された正確な順序で実施される必要はない。
【0017】
以下、添付の図面を参照して、態様および実施形態を例として説明する。
【図面の簡単な説明】
【0018】
図1】デジタル画像内でテキスト文字列をレンダリングするための方法のフローチャートである。
図2】レンダリングされたテキスト文字列を有するエンコードデジタル画像を提供するための方法のフローチャートである。
図3】特定のレイアウト制約を指定するためのフレームワークを示す図である。
図4図1および図2の方法を実行するのに適したデバイスのブロック図である。
図5】グラフィック要素の回転を含むスペクトルスパース化動作を示す図である。
図6】グラフィック要素の回転を含むスペクトルスパース化動作を示す図である。
図7】グラフィック要素を傾斜させることを含むスペクトルスパース化動作を示す図である。
図8】グラフィック要素の局所的および/または異方性再スケーリングを含むスペクトルスパース化動作を示す図である。
図9】グラフィック要素の局所的および/または異方性再スケーリングを含むスペクトルスパース化動作を示す図である。
図10】グラフィック要素の局所的および/または異方性再スケーリングを含むスペクトルスパース化動作を示す図である。
図11】ラスタ画像の符号化ブロックを示す図である。
図12】ラスタ画像の符号化ブロックを示す図である。
図13】グラフィック要素の平行移動を含むスペクトルスパース化動作を示す図である。
図14】グラフィック要素の平行移動を含むスペクトルスパース化動作を示す図である。
図15】グラフィック要素の平行移動を含むスペクトルスパース化動作を示す図である。
図16】グラフィック要素の平行移動を含むスペクトルスパース化動作を示す図である。
図17】様々な書体修正を含むスペクトルスパース化動作を示す図である。
図18】様々な書体修正を含むスペクトルスパース化動作を示す図である。
図19】様々な書体修正を含むスペクトルスパース化動作を示す図である。
図20】様々な書体修正を含むスペクトルスパース化動作を示す図である。
図21】各々8×8画素の符号化ブロックに対する二重周期関数の直交基底のプロットを示す図である。
【発明を実施するための形態】
【0019】
次に、本開示の態様は、本発明の特定の実施形態が示されている添付の図面を参照して以下でより完全に説明される。しかし、これらの態様は、多くの異なる形態で具現化されてもよく、限定するものとして解釈されるべきではなく、むしろ、これらの実施形態は、本開示が徹底的かつ完全であり、本発明のすべての態様の範囲を当業者に完全に伝えるように例として提供される。説明全体を通して、同様の番号は同様の要素を指す。
【0020】
図1を参照して、ブロック単位変換符号化に適したデジタルラスタ画像内のテキスト文字列をレンダリングするための方法100をここで説明する。
【0021】
ラスタ画像は、画素のマトリックスまたはグリッドを含み、画素は、好ましくは正方形または長方形であることが理解される。画素は、画像領域310(図3)を形成する。ラスタ画像は、ブロック形式の画素バッファー画像であってもよい。ベクトル形式のグラフィック要素を有する画像は、ラスタ画像ではない。
【0022】
テキスト文字列は、ユニコード表(ISO/IEC 10646)などの予め決められたキャラクタ表から選択されたキャラクタの順序付きシーケンスであることが理解される。キャラクタは、文字、音節、表意文字、修飾文字、マーク、数字、句読点、数学記号、通貨記号、セパレータ、合字などを表すことができる。
【0023】
さらに、変換符号化は、広義には、二重周期関数
の直交基底に関する画像データを射影することを含むことが理解される。
ここで、
は、変換係数であり、
は、画素(n,n)についての画像データである。[0,N]×[0,N]への
の制限は、最も低い(k,k)対について、単一の周期または一定値に対応し得ることに留意されたい。特に、基底は、実数値の二重周期調和関数(例えば、DCT、DST、DFT、ウェーブレット変換)からなることができる。射影動作において計算された変換係数は、画像データのスペクトルの離散表現を構成する。エンコード画像は、場合によっては非破壊的データ圧縮(例えば、エントロピー、ハフマン、Lempel-Ziv、ランレングス、バイナリまたは非バイナリ算術符号化、例えばコンテキスト適応可変長符号化、CAVLC、コンテキスト適応バイナリ算術符号化、CABAC)および/または他の処理ステップの後に、変換係数を含む。特に、変換係数は、ゼロへの丸め動作、例えば、量子化動作を受けることができる。変換係数が前述の非破壊的データ圧縮技術のうちの1つに供給されるとき、ゼロ変換係数は、典型的にはゼロ値の数(「0.0」)として符号化されないが、非ゼロ変換係数よりも著しく少ない画像ビットストリーム内の空間を占有するように省略することができるので、丸め動作は重要である。意図された変換符号化は、符号化ブロックの処理が他の符号化ブロックの処理から独立しているという意味で、ブロック単位変換である。
【0024】
任意選択で、符号化ブロックの変換係数は、予測的に、特にフレーム内予測(「イントラ予測」)符号化によってエンコードすることができる。そのようなものとしてよく知られているかかる予測符号化技術によれば、1つの符号化ブロックの変換係数は、1つまたは複数の以前のまたは後の符号化ブロックを参照して増分的に表される。これは、特に画像が高度の空間的自己相関を有する自然なシーンを描写する場合、効率的なデータ圧縮をもたらす。本発明者らは、符号化ブロックのスペクトルが疎である場合、すなわち、それらがゼロ変換係数の大部分を含む場合、データ圧縮が一般により重要であることを認識した。
【0025】
方法100の第1のステップ110において、画像領域310のパーティション320が取得される。パーティション320は、エンドユーザからの命令に基づいて、(例えば、事前の合意または標準仕様に従って)予め決められたパーティションとして取得されてもよく、または方法100を実施するエンティティによって生成されてもよい。パーティション320は、画像領域310の各点が符号化ブロックに属するような符号化ブロックのセットを画定する。同様に、符号化ブロックの結合は、画像領域310に等しい。図3では、パーティション320は、符号化ブロックを区切る点線によって示されている。図5図6図10、および図13図19の符号化ブロックの境界を示すために、同じ点線の表記が使用されている。画像がビデオシーケンスのフレームであるとき、符号化ブロックは、ITU-T H.26xビデオ符号化規格の意味でのマクロブロックであってもよく、変換ブロックもしくは予測ブロック、またはこれらの両方の用途を有するブロックとすることができる。図3は、例示のみを目的とした簡略図であることに留意されたい。本発明の時点における一般的なユースケースでは、はるかに細かいパーティションを使用することが通例である。例えば、ビデオフレーム内のマクロブロックは、4×4画素、8×8画素、16×16画素、32×32画素、または64×64画素とすることができる。
【0026】
図21は、離散コサイン関数として、8×8画素の場合について決定された実数値の二重周期関数の基底の、(n,n)平面における各々64個のプロットを含む。
図21の一番上の線は、
ρ0,0(n,n)、ρ1,0(n,n)、ρ2,0(n,n)、…、ρ7,0(n,n
のプロットを含み、
ρ7,7(n,n)までのプロットが右下隅に見られる。図21では、白色は、
を表し、黒色は、
を表す。単一の基底関数または少数の基底関数の線形組み合わせに対応する符号化ブロックは、より多数の基底関数によって形成されなければならない複雑な外観および/または高い情報コンテンツを有する符号化ブロックよりもエンコードするのに比較的安価である(すなわち、より疎なスペクトルを有することになる)。図21の検査に基づいて、等距離の水平線または垂直線を有する符号化ブロックは、例えば、k=0またはk=0の基底関数
を使用してエンコードするのが安価である可能性が高いことが認識され得る。主に対角要素を有する符号化ブロックは、一般に、例えば、k=k
を使用してエンコードするのも安価である。ナイキスト-シャノンのサンプリング定理によって、
は、8×8画素符号化ブロックについての完全な基底であることが分かる。
【0027】
レンダリングされるテキスト文字列は、方法100への入力データを構成する。すなわち、テキスト文字列は、方法を実行するエンティティの観点から予め決定されており、すなわち、テキスト文字列は、エンドユーザから受信されてもよく、またはソフトウェアアプリケーションによって自動的に作成されてもよく、上記エンティティは、通常の条件でテキスト文字列を修正してはならない。方法100は、任意選択で、入力として1つまたは複数のレイアウト制約を受け入れることができる。任意選択の第2のステップ112で取得されるレイアウト制約は、レンダリングされたテキスト文字列の最大範囲332(図3)、レンダリングされたテキスト文字列の最小範囲334、および/またはレンダリングされたテキスト文字列の向きαを指定する。レイアウト制約は、1つまたは複数の許容可能な書体をさらに指定することができる。テキスト文字列は、これらのレイアウト制約に従ってレンダリングされるべきであり、これは、実施されるスペクトルスパース化動作の有効性を制限することがある。
【0028】
第3のステップ114において、テキスト文字列は、画像領域310内の仮レイアウトに従って配置された書体からの複数のグラフィック要素として表される。仮レイアウトは、各グラフィック要素の少なくとも位置、向き、およびサイズを定める。グラフィック要素は、グリフ、特にキャラクタを表すグリフを含むことができる。この意味でのグラフィック要素は、抽象的なキャラクタではなく、この書体におけるキャラクタの特定の表現、すなわち、具体的な形状を指すことが強調される。さらに、テキスト文字列のキャラクタおよびグラフィック要素は、必ずしも一対一の関係である必要はなく、一対多や多対一の関係であってもよい。グラフィック要素は、ベクトルグラフィック、例えば、スケーラブルな線、曲線、または多角形として表すことができる。
【0029】
次のステップ116において、仮レイアウトは、スペクトルスパース化動作を適用することによって修正される。スペクトルスパース化動作は、一度に単一の符号化ブロック、一度に符号化ブロックのグループ(例えば、近接する符号化ブロック)、または画像領域310全体に適用することができる。スペクトルスパース化動作は、好ましくは、空でない符号化ブロック、すなわち、少なくとも1つのグラフィック要素またはグラフィック要素の一部分を含むそのような符号化ブロックに制限される。以下で詳細に説明するように、スペクトルスパース化動作は、グラフィック要素の回転(ステップ116.1)、グラフィック要素の傾斜(ステップ116.1)、完全なグラフィック要素の等方性もしくは異方性再スケーリング(ステップ116.2)、グラフィック要素の一部分のグラフィック要素の等方性もしくは異方性再スケーリング(ステップ116.2)、グラフィック要素の平行移動(ステップ116.3)、書体修正(ステップ116.4)、書体置換もしくはコントラスト修正(ステップ116.4)、またはこれらの様々な組み合わせを含んでもよい。
【0030】
ステップ116の出力は、修正されたレイアウトであり、修正されたレイアウトに従ってグラフィック要素のデジタルラスタ画像がレンダリングされる第5のステップ118についての基底を形成する。レンダリングは、ラスタライゼーション、すなわち、画素のマトリックスとしてのベクトルグラフィックスの変換を含むことができる。ラスタライゼーションは、線描画アルゴリズムまたは曲線描画アルゴリズムを実行することを含むことができる。あるいは、書体がビットマップとしてグラフィック要素を表す場合、ステップ118におけるレンダリングは、修正されたレイアウトに従ってそれらのサイズおよび位置を使用してそのようなビットマップを出力デジタルラスタ画像に結合することを含んでもよい。
【0031】
レンダリングは、別々に画像領域全体または各符号化ブロックに対して単一の動作として実行することが可能である。
【0032】
ステップ118は、実際のレンダリングの前に前処理ステップをさらに含むことができる。前処理ステップにおいて、修正されたレイアウトに従って配置されたグラフィック要素のいくつかのグループは、例えばグラフィック要素の一部分を互いに向かって変形(拡張)することによって、および/または合字もしくはコネクタを追加することによって接合される。結果として生じる接合された外観は、アラビア語を含む特定の非ラテン語スクリプトで必須であり得、ラテン語スクリプトの選択肢として使用して筆記体に似させることができる。
【0033】
図2に示すように、上述したテキストレンダリング方法100は、テキスト文字列のエンコードデジタル画像を提供するための方法200に埋め込まれてもよい。そのような方法200は、方法100を実施することによってテキスト文字列のデジタルラスタ画像をレンダリングすることを含むことができる。この後、ブロック単位変換符号化動作210が画像領域の上記パーティション320の各ブロックに適用される。変換符号化は、二重周期関数(上記の式1を参照)の直交基底に関する射影210.1と、それに続くゼロへの丸め動作210.2とを含み得る。方法200の出力は、エンコードデジタル画像であり、予め決められた符号化を有する変換係数値の集合として表すことができる。
【0034】
方法200の実施形態は、テキストオーバーレイのユースケースに特に適合させることができる。そのような実施形態では、背景画像が取得され(例えば、エンドユーザから受信される、カメラによって記録されるなど)、ステップ118でレンダリングされたデジタルラスタ画像と結合される。例えば、レンダリングされたグラフィック要素を表す画素は、背景画像内の対応する画素に置き換えられてもよく、これらの画素の補数は透明として扱われ、すなわち、背景画像はここでは影響を受けない。ブロック単位変換符号化動作210は、結合画像に適用される。任意選択で、レンダリングされたグラフィック要素を表す画素は、背景画像がテキストを通して部分的に見えるように、設定可能な程度の透明度で重ね合わされてもよい。背景画像およびデジタルラスタ画像は、例えば、再スケーリング、トリミング、または拡張動作によって、結合する前に互いに適合されなければならない場合があることが理解される。
【0035】
あるいは、テキスト文字列が背景画像の上に表され(ステップ114)、スペクトルスパース化動作(ステップ116)が仮レイアウトに従って背景画像とテキスト文字列の組み合わせに適用される。これにより、スペクトルスパース化動作は、例えば、配置されたグラフィック要素をいくつかの符号化ブロック内の背景画像に似させることによって背景画像との相乗効果を利用することが可能になり、その結果、スペクトルはより疎になり、したがってエンコードするのがより安価になる。例えば、成功した場合のスペクトルスパース化動作は、オーバーレイされたグラフィック要素のスペクトルが同じ符号化ブロック内の背景画像のスペクトルにおいてゼロ値である変換係数とほぼ同じ変換係数のゼロ値を残すように、符号化ブロック内のレイアウト修正を識別することができる。
【0036】
方法100、200は、汎用コンピュータによって実行することができる。特に、方法100、200は、図4に示す基本的な機能構造を有するデバイスによって実行することが可能である。図示のように、デバイス400は、処理回路414と、メモリ410と、外部インターフェース418とを含む。内部データバス416は、これらの構成要素間の通信を容易にする。メモリ410は、方法100、200のいずれかを実施する命令を有するコンピュータプログラム412を記憶するのに適し得る。外部インターフェース418は、デバイス400がワイドエリアまたはローカルエリアネットワーク420を介して消費者またはビデオコンテンツオーサ(例えば、記録デバイス)によって動作される類似のデバイス(図示せず)と通信することを可能にする通信インターフェースであってもよい。さらに、デバイス400は、生もしくはエンコード画像データ、書体などを記憶するためのサーバ、または必要に応じてデバイス400によって利用され得るネットワーク化された(「クラウド」)処理リソースなどのホストコンピュータ430と通信することが可能である。ホストコンピュータ430は、方法100、200内の計算的に要求の厳しい動作のデバイス400をオフロードするように構成することができることが理解される。
【0037】
図5および図6は、グラフィック要素の回転を含むスペクトルスパース化動作を示している。
【0038】
上記回転は、符号化ブロック内の固有の線の向きの数を減少させるように定められうる。図5の左半分では、記号「/」(フォワードスラッシュ)は、文字「A」の左ストロークにほぼ平行であるため、これらのグラフィック特徴は、同じまたは部分的に同じ基底関数を使用してエンコードされ得ることを予想することができる。しかし、図5の右半分では、文字「A」の記号「/」および左ストロークは異なる向きを有し、非ゼロ値を有するためにより多くの変換係数を必要とする。これを考慮して、方法100のいくつかの実施形態は、図5の左半分により類似するように図5の右半分に従ってレイアウトを修正するスペクトルスパース化動作を実施することを含む。
【0039】
上記回転は、線の向きを垂直軸または水平軸と位置合わせするように、または線の向きをこれらの軸の対角線と位置合わせするように定められうる。垂直軸または水平軸は、レンダリングされるデジタルラスタ画像の画素マトリックスの軸に対応し、これは基底関数がパラメータ化される方法である(n、n変数)。図6の右半分では、文字「L」は、符号化ブロックの軸と位置合わせされていない。ここで、軸は、点線で描かれた文字「L」が含まれる符号化ブロックの境界に対応する。位置合わせされていない文字「L」は、少数の基底関数の組み合わせとして表現することができないため、エンコードするのにコストがかかる。図6の左半分の向きは、ブロック単位変換符号化の観点からより好ましい可能性が高い。このため、方法100のいくつかの実施形態は、図6の左半分により類似するように図6の右半分に従ってレイアウトを修正するスペクトルスパース化動作を実施することを含む。
【0040】
図7は、グラフィック要素を傾斜させることを含むスペクトルスパース化動作を示している。右方向への傾斜は、いくつかの書体において、徐々にイタリック体になっていく文字に対応し得る。逆に、傾斜は、1つまたは複数の文字をある程度まで非イタリック体化するために使用されてもよく、それによりそれらのストローク(例えば、クロスバー、ショルダ、ボウル、ステム)は、垂直軸もしくは水平軸、または対角線方向とより良好に位置合わせすることができる。傾斜は、符号化ブロック内の固有の線の向きの数を減少させること、線の向きを垂直軸もしくは水平(または対角)軸と位置合わせすること、および/または符号化ブロック内の固有の垂直距離もしくは水平距離の数を減少させることに寄与し得る。符号化ブロック内の「距離」は、ストロークの太さまたは分離の長さ(空間、隙間)であってもよい。さらに、基底関数は周期的であるため、変換符号化は符号化ブロックの周期的拡張を効果的にサンプリングし、したがってスペクトルスパース化動作は、符号化ブロックの周期的拡張における固有の距離の数を最小化するように設計されるべきであることに留意されたい。これは、図12を参照して以下に示される。
【0041】
図8および図9は、グラフィック要素の局所的再スケーリングおよび/またはグラフィック要素の異方性再スケーリングを含むスペクトルスパース化動作を示している。
【0042】
図8では、垂直方向の局所的再スケーリングによって小文字「h」のx高さをどのように変化させることができるかが示されており、これにより固有の垂直距離の数を制限することが可能である。図8では、水平再スケーリングは適用されていない。文字「h」が垂直方向に完全な符号化ブロックを占有する限り、図8の中央の形状は、x高さがキャップ高さの約半分であるため、単一の垂直距離を有することに留意されたい。場合によっては、図8の左側および右側の形状は、少なくとも2つの固有の垂直距離(すなわち、x高さおよびアセンダ高さ)を含み、したがってより多数の非ゼロ変換係数を必要とする。したがって、方法100のいくつかの実施形態は、図8の中央形状により類似するようにレイアウトを修正することができるスペクトルスパース化動作を実施することを含む。
【0043】
図9は、異方性再スケーリングの一例である水平方向のみの全体的な再スケーリングの効果を示している。このような再スケーリングによって、符号化ブロック内の固有の距離の数に影響を与えることができる。異方性再スケーリングはまた、異なる要因による水平および垂直再スケーリング動作の組み合わせを含む。
【0044】
図10は、スペクトルスパース化の目的で再スケーリング動作を使用することができる一例を示している。図10の左半分は、仮レイアウトに対応し、小文字「o」および数字「0」(ゼロ)は、共通の符号化ブロックを占有する。文字「o」は、数字「0」よりもわずかに小さく幅が狭い。図10の右半分は、スペクトルスパース化動作の出力に対応し、数字「0」を表す完全なグラフィック要素は、文字「o」と等しい高さを有するように等方的にダウンスケールされる。スペクトルスパース化動作の一部として、文字「o」と数字「0」との間の水平空間が文字「o」の幅にほぼ等しいことがさらに保証され、これは、水平方向に文字「o」または数字「0」を平行移動させることによって達成することができる。結果として、矢印によって示される3つの水平距離は、2つの垂直距離と同様に、ほぼ等しい。これらの考慮事項に基づいて、方法100のいくつかの実施形態は、図10の右半分により類似するように図10の左半分に従ってレイアウトを修正するスペクトルスパース化動作を実施することを含む。変換符号化はブロック単位であるため、隣接する符号化ブロック内の隣接する文字「N」および数字「5」を考慮する必要はないことに留意されたい。
【0045】
画素レベルに対するスペクトルスパース化動作の効果を説明するために、図11および図12は、ラスタ画像の8×8画素符号化ブロックを示す。図11の左半分では、線は1つの暗い画素の均一な水平太さを有し、それらは3つの明るい画素によって水平方向に分離されている。上記で説明した理由から、符号化ブロックの水平周期的拡張が考慮され、外側光画素は、2+1=3個の光画素の合計分離に結合する。概念的には、符号化ブロックの垂直境界は「互いに接着され」、水平境界も同様に考慮され得る。対照的に、図11の右半分では、水平方向に2つの明るい画素、1つの暗い画素、3つの明るい画素、および2つの暗い画素が識別される。図11の右半分では固有の水平距離の数がより大きいため、エンコードするのにコストがかかる。したがって、方法100のいくつかの実施形態は、図11の左半分により類似するように図11の右半分に従ってレイアウトを修正するスペクトルスパース化動作を実施することを含む。
【0046】
図12の第1の符号化ブロックでは、上側部分は、一定の画像データを含み、下側部分は、フォワードスラッシュに似たグラフィック要素が存在しており、水平距離1および7を含む。(周期的拡張における距離が関連することが想起される。)図12の第2の符号化ブロックでは、中央の上側部分は、一定の画像データを含み、下側部分は、グラフィック要素の2つのコピーが存在しており、水平距離1および3を含む。これは、図12の第1および第2の符号化ブロックを符号化するそれぞれのコストがほぼ等しいことを示唆する。したがって、2つの異なる符号化ブロックに位置するレイアウトを使用するのではなく、同じ符号化ブロックに上記グラフィック要素の2つのコピーを集めることが符号化効率に利益をもたらす。さらに、その垂直範囲全体にわたって水平距離1および7を含む図12の第3の符号化ブロックを考慮することは有益である。第3の符号化ブロックは、図12の第1および第2の符号化ブロックよりもさらに多くの数のゼロ値変換係数を有すると予想され得る。図12の第3の符号化ブロックは、左側のグラフィック要素と位置合わせされるまで上方に右側のグラフィック要素を平行移動させることによって、第2の符号化ブロックから取得することができる。
【0047】
これらの考慮事項を考慮して、方法100のいくつかの実施形態は、幾何学的に類似のグラフィック要素が1つの符号化ブロックに集められるように、および/または幾何学的に非類似のグラフィック要素が異なる符号化ブロックに分離されるように、1つまたは複数のグラフィック要素の平行移動を含むスペクトルスパース化動作を実施することを含む。これにより、符号化ブロック内の固有の線の向きの数および/または固有の垂直距離もしくは水平距離の数が減少される可能性がある。
【0048】
図13図14図15、および図16は、グラフィック要素の平行移動を含むスペクトルスパース化動作を示している。上述したように、そのような平行移動の目的は、符号化ブロックごとに幾何学的に類似のグラフィック要素を集めること、および/または幾何学的に非類似のグラフィック要素を分離することであり得る。これらの表現は、通常の意味で理解され得る。あるいは、いくつかの実施形態では、「幾何学的に類似の」および「幾何学的に非類似の」グラフィック要素の識別は、スペクトル的に類似のおよびスペクトル的に非類似のグラフィック要素を識別するように体系化されてもよい。これは、様々なグラフィック要素の以前のブロック単位変換符号化からのスペクトル(変換係数)をキャッシュすることによって達成される。スペクトルは、完全にまたは単純化された形式でキャッシュされ得、有用な単純化されたフォーマットは、各スペクトルにおいてどの変換係数が非ゼロであるかを記述することができる。例えば、2つのグラフィック要素は、それらが同一またはほぼ同一の非ゼロ変換係数のセットを有する場合にはスペクトル的に類似であるとみなされ得、そうでない場合にはスペクトル的に非類似であるとみなされる。スペクトル的に類似のグラフィック要素は集められるものとし、スペクトル的に非類似のグラフィック要素は異なる符号化ブロックに分離されるものとする。
【0049】
グラフィック要素の載置の近すぎた(非大域的な)最適化を回避するために、グラフィック要素の平行移動を含むそのようなスペクトルスパース化動作は、好ましくは、一度に複数の隣接する符号化ブロックの探索ウィンドウに適用される。探索ウィンドウ内で、異なる符号化ブロックへのグラフィック要素の可能な再分配の数が評価され、有利なものが選択される。グラフィック要素の様々な可能な再分配の中で、より適切なものは、以下の基準:非ゼロ変換係数の総数がより小さい、高周波係数(kおよびkの値が大きい)の割合が小さい、連続する符号化ブロック間で(イントラ予測走査順序に対して)非ゼロ変換係数のセットの構成のより小さい変動が存在する、のうちの1つまたは複数を満たすことができる。明らかに、テキスト文字列内のキャラクタは、上記再分配の下で並べ替えられないが、それらのシーケンスを保持する。しかし、計算の複雑さを制限するために、長いテキスト文字列の全体が単一のスペクトルスパース化動作で処理される場合のように、ウィンドウも広すぎてはならない。例えば、探索ウィンドウは、3つ、4つ、または5つの符号化ブロックなど、書き込み方向に2~10個の符号化ブロックを含むことができる。また、スライディング探索ウィンドウを使用することが可能である。
【0050】
図13は、符号化ブロックごとに幾何学的に類似のグラフィック要素を集めるための平行移動の使用を示している。図13の左半分では、左符号化ブロックは、文字「F」およびキャラクタ「\」(バックスラッシュ)の断片によって共有され、右符号化ブロックは、キャラクタ「\」の1つの部分コピーおよび2つの完全なコピーを含む。一方、文字「F」およびキャラクタ「\」の断片は幾何学的に非類似であるため、これは符号化目的には最適ではない可能性がある。キャラクタ「\」は2つの符号化ブロックを占有するため、さらに最適ではない。2つの垂直境界が「互いに接着される」ことが想定される符号化ブロックの周期的拡張では、これは大きな不連続性に対応し、周期的基底関数で表現するにはコストがかかる。図13の右側では、キャラクタ「\」の3つのコピーが右に平行移動されているため、3つすべてが右符号化ブロックに含まれ、文字「F」は左符号化ブロックに単独で含まれている。左符号化ブロックには2つの固有の線の向きしかなく、右符号化ブロックには単一の固有の線の向きしかないため、この平行移動は、結果として生じる非ゼロ変換係数の総数を減少させることが予想され得る。さらに、平行移動はまた、左端のキャラクタ「\」によって占有される符号化ブロックの数を減少させた。これを考慮して、方法100のいくつかの実施形態は、図13の右半分により類似するように図13の左半分に従ってレイアウトを修正するスペクトルスパース化動作を実施することを含む。
【0051】
図14は、符号化ブロックごとに幾何学的に非類似のグラフィック要素を分離するための平行移動の使用を示している。図14の左半分では、文字「P」を表すグラフィック要素が1つの符号化ブロックに含まれている。この文字のボウルおよびステムは幾何学的に非類似であるため、比較的多数の基底関数によって、すなわち、比較的高いコストで表現されなければならない。これは、例えば、図14の右半分に示すように、文字を1つの「D」様部分と1つの「I」様部分に分割し、これらを2つの異なる符号化ブロックに平行移動させることによって改善することができ、部分間の分離は、視認性のために誇張されている。これは、テキスト文字列のキャラクタおよびグラフィック要素が一対多の関係にあり得ることを示している。あるいは、文字「P」は、2つの異なる符号化ブロックに載置されるように、1つの「I」様部分と水平方向にフリップされた「C」に似た1つの部分に分割され得る。これを考慮して、方法100のいくつかの実施形態は、図14の右半分により類似するように図14の左半分に従ってレイアウトを修正するスペクトルスパース化動作を実施することを含む。
【0052】
図15は、符号化ブロック内の固有の垂直距離の数を減少させるために、1つの符号化ブロック内のグラフィック要素を再配置するための平行移動の使用を示している。図15の左半分では、ウムラウトドットの形態の2つのグラフィック要素が、小文字「o」を表す第3のグラフィック要素の近くに位置する。したがって、符号化ブロックは多数の垂直距離を有する。対照的に、図15の右半分では、ウムラウトドットは上方に平行移動され、「o」自体の高さとほぼ同じ高さで「o」の上に位置している。その結果、ドットの太さに対応する垂直距離および「o」は、ほぼ等しくなる。さらに、「o」の高さに対応する空間(x高さ、下側垂直二重矢印)、ウムラウトの2つの点々から「o」の上部までの垂直空間(上側垂直二重矢印)、および符号化ブロック内の完全な文字
の上下の自由空間の合計は、ほぼ等しい空間のトリプレットを構成する。(符号化ブロックの周期的拡張における距離が最も重要なことであることが想起され、垂直距離の場合、垂直周期的拡張が考慮される。)したがって、方法100のいくつかの実施形態は、図15の右半分により類似するように図15の左半分に従ってレイアウトを修正するスペクトルスパース化動作を実施することを含む。
【0053】
図16は、符号化ブロック内の固有の垂直距離および水平距離の数を減少させるために、1つの符号化ブロック内のグラフィック要素を再配置するための平行移動の使用を示している。図16の左半分は、図15の左半分と同一である。図16の右半分では、ウムラウトドットは、図15のように上方に平行移動されているだけでなく、「o」の幅とほぼ同じ水平方向の間隔を有するように、水平方向の平行移動によってさらに離間されている。図16の右半分では、固有の垂直距離の数だけでなく、固有の水平距離の数も最小限に抑えられている。これは、ある程度、後の予測符号化の観点から有利であり得る。平行移動は、フレーム内予測符号化が適用される場合、さらに大きな利点を表すことができる。したがって、方法100のいくつかの実施形態は、図16の右半分により類似するように図16の左半分に従ってレイアウトを修正するスペクトルスパース化動作を実施することを含む。
【0054】
図16の右半分から開始して、さらに別のスペクトルスパース化は、ウムラウトドットをウムラウトオーバーバーに変換することによって取得することができ、これは一部の読者によってアログラフとして受け入れられ得る。数学的にこれを説明するために、図16の右半分の以下の画素表現が考慮される。
そのような符号化ブロックのDCTスペクトルは、以下の外観を有し、ここで、*は、非ゼロ変換係数を表す。
ウムラウトドットがウムラウトオーバーバーに置き換えられる場合、以下の通りである。
次いでDCTスペクトルは、
となる。
非ゼロ変換係数の数が3だけ減少するので、符号化ブロックをよりコンパクトにデジタル的に表すことができることが分かる。
【0055】
上述したように、ステップ118は、1つまたは複数のグラフィック要素を接合する前処理ステップを含むことができる。接合は、修正されたレイアウトの視覚的外観を改善することができる、平行移動によるスペクトルスパース化動作の場面において潜在的に有用である。例えば、接合は、文字間の不均一な空間をより均一に見えるようにし、したがって見えにくくすることができる。別の用途は、画像領域310内のテキスト文字列の最小範囲334(図3)を指定するレイアウト制約を満たすことである。例えば、単語を表すテキスト文字列の文字は、上記最小範囲334にわたって分配することができるが、合字のおかげで、依然として単語として認識される。文字の接合は、典型的には、無視できる符号化労力を追加し、有益でさえあり得る。アラビア語スクリプトの特定の場合、そのような接合は、いわゆるkashidaによって、すなわち、グラフィック要素の一部分を拡張することによって、または合字として機能するグリフ(tatwil)を挿入することによって達成することができる。さらなる詳細については、研究論文M.J.E.Benatia et al.,「Arabic text justification.Survey of historical methods of Arabic text justification,and a recommended algorithm」,TUGboat,vol.27(2006),no.2,page 137-146を参照されたい。
【0056】
図17図18図19、および図20は、様々な書体修正または書体置換を含むスペクトルスパース化動作を示している。一般的に言えば、検討される書体修正および書体置換は、グラフィック要素の幾何学的形状を単純化する。これは、符号化ブロック内の固有の線の向きの数を減少させること、線の向きを垂直軸もしくは水平(または対角)軸と位置合わせさせること、および/または符号化ブロック内の固有の垂直距離もしくは水平距離の数を減少させることに寄与し得る。方法100が、書体または許容可能な書体のリストを指定するレイアウト制約に従って実施される場合、考慮中の書体置換はそれに応じて制限されなければならないことに留意されたい。
【0057】
図17は、セリフ書体における大文字「E」を表すグラフィック要素(図17の左半分)が、セリフなしの「E」についてのアログラフ(右半分)に変換される書体修正を示している。言い換えれば、変換は、すなわち、セリフを除去することによってグラフィック要素の終端形状を単純化する。書体修正は、文字「E」上の異なるストロークの幅をさらに均一化する。図17の右半分のグラフィック要素はより少ない固有の線の向きおよび/またはより少ない固有の距離を有するので、エンコードする方が安価である可能性が高い。これを考慮して、方法100のいくつかの実施形態は、図17の右半分により類似するように図17の左半分に従ってレイアウトを修正するスペクトルスパース化動作を実施することを含む。同様に、スペクトルスパース化動作は、セリフ書体からの「E」を、サンセリフ書体からの、特に均一なストローク幅を有するサンセリフ書体からの「E」に置き換えることができる。
【0058】
図18は、符号化ブロック内の書体重み(typeface weight)が均一化される書体修正を示している。例示的な書体重みには、超極細、細、中、太、および超極太が挙げられる。図18の左半分では、小文字「a」を表す3つのグラフィック要素は3つの異なる重みを有し、これは符号化ブロック内の多数の固有の垂直距離および水平距離に対応する。右半分では、重みは、書体置換または適切な再スケーリングによってほぼ均一にされており、経済的な変換符号化に有利である。したがって、方法100のいくつかの実施形態は、図18の右半分により類似するように図18の左半分に従ってレイアウトを修正するスペクトルスパース化動作を実施することを含む。
【0059】
図17を参照すると、グラフィック要素上の異なるストロークのそれぞれの幅を均一化することができることが示された。図19は、グラフィック要素上の特定のストロークの幅を均一にする書体修正を示している。図19の右半分では、不均一なストローク重みを有する書体からのグラフィック要素が、テキスト文字列「abc」を形成するために使用されている。同図の左半分では、均一なストローク重みを有する書体が使用されている。さらに、図19の右半分に見られる小さなイヤーおよびセリフは、左半分には存在しない。これらの変更の両方は、エンコードするために左半分のグラフィック記号の配置をより安価にする傾向がある。したがって、方法100のいくつかの実施形態は、図19の左半分により類似するように図19の右半分に従ってレイアウトを修正するスペクトルスパース化動作を実施することを含む。
【0060】
図20は、グラフィック要素の開口を修正することができる書体修正を示している。より正確には、図20は、小文字「e」を表し、下側開放円弧の長さに関して異なる3つのグラフィック要素を示す。頂部からクロスバーまでの間隔は、グラフィック要素が文字「e」としてのその重要性を失わずに変更することができる。この事実は、符号化ブロック内の固有の水平距離および/または垂直距離の数を制御するために利用することができる。これらの考慮事項を考慮して、方法100のいくつかの実施形態は、図20の3つのグラフィック要素間の変動と類似のグラフィック要素の開口を変換するスペクトルスパース化動作を実施することを含む。
【0061】
図21は、上述されている。
【0062】
多数の例が示したように、本発明者らは、効率的な変換符号化を容易にする方式で、符号化ブロックパターンに対して所与のテキスト文字列を構成するグラフィック要素を配置する方法を提案している。より詳細には、本発明者らは、グラフィック要素の仮レイアウトを、より疎なスペクトルを有し、したがってよりコンパクトに表すことができる修正されたレイアウトに変更するための動作のツールボックスを開発した。これらの動作は、テキスト文字列を無傷のままにし、したがってその通信上の重要性を維持し、一般に非専門家の視聴者には視覚的に気付かれない。スペクトルスパース化動作の離散性は、レイアウト制約が受け入れられ観察される実施形態のうちの1つを実装することによってさらに保証することができる。
【0063】
本開示の態様は、いくつかの実施形態を参照して主に上述されている。しかし、当業者によって容易に理解されるように、上記で開示されたもの以外の他の実施形態も本発明の範囲内で等しく可能であり、これは添付の特許請求の範囲によって規定される。例えば、例は主にラテン文字からの文字に関係しているが、当業者は、本明細書に開示された技術が、ギリシャ語、キリル語、アラビア語などの他のスクリプト、および表意文字スクリプトに容易に適用可能であることを理解するであろう。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
【外国語明細書】