(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024058540
(43)【公開日】2024-04-25
(54)【発明の名称】文字のコンポーネント-分割に基づくフォント生成システムおよびフォント生成方法
(51)【国際特許分類】
G06F 40/109 20200101AFI20240418BHJP
G09G 5/24 20060101ALI20240418BHJP
G09G 5/22 20060101ALI20240418BHJP
G09G 5/00 20060101ALI20240418BHJP
【FI】
G06F40/109
G09G5/24 690
G09G5/24 630S
G09G5/24 620Z
G09G5/22 660A
G09G5/00 555A
【審査請求】有
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2023024962
(22)【出願日】2023-02-21
(31)【優先権主張番号】10-2022-0131907
(32)【優先日】2022-10-14
(33)【優先権主張国・地域又は機関】KR
【新規性喪失の例外の表示】新規性喪失の例外適用申請有り
(71)【出願人】
【識別番号】519007581
【氏名又は名称】ファウンデーション オブ スンシル ユニバーシティー インダストリー コーオペレイション
【氏名又は名称原語表記】Foundation of Soongsil University-Industry Cooperation
【住所又は居所原語表記】(Sangdo-dong) 369, Sangdo-ro, Dongjak-gu, Seoul 06978, Republic of Korea
(74)【代理人】
【識別番号】100091683
【弁理士】
【氏名又は名称】▲吉▼川 俊雄
(74)【代理人】
【識別番号】100179316
【弁理士】
【氏名又は名称】市川 寛奈
(72)【発明者】
【氏名】チェ,ジェ ヨン
(72)【発明者】
【氏名】パク,ジャン キョン
(72)【発明者】
【氏名】ジョン,グン ホ
【テーマコード(参考)】
5B109
5C182
【Fターム(参考)】
5B109RA05
5B109RA11
5C182AC02
5C182AC04
5C182BC29
5C182CB52
5C182DA52
5C182FA03
5C182FA14
5C182FA25
5C182FA26
5C182FA47
5C182FA58
(57)【要約】 (修正有)
【課題】あらゆる漢字に対してフォント化した文字を提供できるフォント生成システムおよびフォント生成方法を提供する。
【解決手段】フォント生成システムは、少なくとも一つのソース文字(SRC)が入力され、入力された文字を少なくとも1つ以上のコンポーネント(CP)に分解するコンポーネント分解部120と、少なくとも1つ以上のコンポーネントを予め指定されたフォントのコンポーネントに変換して少なくとも1つ以上のイメージングコンポーネント(IM-CP)を生成するコンポーネント変換部140と、少なくとも1つ以上のイメージングコンポーネントを再結合し、フォント化した文字(FC)を生成するコンポーネント再結合部160と、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
フォント生成システムにおいて、
少なくとも一つの文字が入力され、該入力された文字を少なくとも1つ以上のコンポーネントに分解するコンポーネント分解部;
前記少なくとも1つ以上のコンポーネントを予め指定されたフォントのコンポーネントに変換し、少なくとも1つ以上のイメージングコンポーネントを生成するコンポーネント変換部;および
前記少なくとも1つ以上のイメージングコンポーネントを再結合し、フォント化した文字を生成するコンポーネント再結合部;を含む、フォント生成システム。
【請求項2】
前記少なくとも1つの文字は、
繁体の漢字、または簡体の漢字であることを特徴とする、請求項1に記載のフォント生成システム。
【請求項3】
前記コンポーネント分解部は、
前記繁体の漢字、または前記簡体の漢字から構成された前記少なくとも1つの文字を偏旁に分割することによって少なくとも1つ以上の第1のコンポーネントを生成する、請求項2に記載のフォント生成システム。
【請求項4】
前記コンポーネント分解部は、
前記少なくとも1つ以上の第1のコンポーネントを少なくとも1つ以上の第2のコンポーネントに分割する、請求項3に記載のフォント生成システム。
【請求項5】
前記コンポーネント変換部は、
前記少なくとも1つ以上の第2のコンポーネントを前記予め指定されたフォントのコンポーネントに変換し、前記イメージングコンポーネントを生成する、請求項4に記載のフォント生成システム。
【請求項6】
前記フォント生成システムは、
少なくとも1つのエンコーダおよびデコーダを含むGANモデルを利用して、前記コンポーネントの分割およびイメージングコンポーネントの再結合によって前記フォント化した文字を生成するように構成された、請求項1に記載のフォント生成システム。
【請求項7】
フォント生成方法において、
少なくとも一つの文字が入力され、該入力された文字を少なくとも1つ以上のコンポーネントに分解する段階;
前記少なくとも1つ以上のコンポーネントを予め指定されたフォントのコンポーネントに変換し、少なくとも1つ以上のイメージングコンポーネントを生成する段階;および
前記少なくとも1つ以上のイメージングコンポーネントを再結合し、フォント化した文字を生成する段階;を含む、フォント生成方法。
【請求項8】
前記少なくとも1つの文字は、
繁体の漢字、または簡体の漢字であることを特徴とする、請求項7に記載のフォント生成方法。
【請求項9】
前記コンポーネントに分解する段階は、
前記繁体の漢字、または前記簡体の漢字から構成された前記少なくとも1つの文字を偏旁に分割することによって少なくとも1つ以上の第1のコンポーネントを生成する段階を含む、請求項8に記載のフォント生成方法。
【請求項10】
前記コンポーネントに分解する段階は、
前記少なくとも1つ以上の第1のコンポーネントを少なくとも1つ以上の第2のコンポーネントに分割する段階を含む、請求項9に記載のフォント生成方法。
【請求項11】
イメージングコンポーネントを生成する段階は、
前記少なくとも1つ以上の第2のコンポーネントを前記予め指定されたフォントのコンポーネントに変換し、前記イメージングコンポーネントを生成する、請求項10に記載のフォント生成方法。
【請求項12】
前記フォント生成方法は、
少なくとも1つのエンコーダおよびデコーダを含むGANモデルを利用して、前記コンポーネントの分割およびイメージングコンポーネントの再結合によって前記フォント化した文字を生成するように構成された、請求項7に記載のフォント生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、フォント生成システムおよびフォント生成方法に関するものであって、より詳しくは、多数のコンポーネントを含む複雑な文字を分割し、これを変換した上、再結合してフォント化した文字を生成するフォント生成システムおよびフォント生成方法に関する。
【背景技術】
【0002】
フォント(font)は、書体または字体とも呼ばれ、文字(または字形、character)の形もしくは様式を意味する。同じ言語に該当する文字であっても、フォントが異なることがあり、PC、携帯電話などには互いに異なる複数のフォントが提供されている。このようなフォントは、その種類によって見る人に同じ文字でも違った雰囲気を感じさせてくれるので、最近では重要なデザイン要素となっている。
【0003】
一方、近年、技術の発展に伴い、手書きフォントの特性を抽出してデータ化またはデジタル化することによって、電子機器上でも手書きフォントを利用できるようになった。ただし、手書きフォントに相当するフォントをデータ化するためには、言語を構成するすべての文字に相当する手書きフォントの情報を収集し、収集した情報をデジタル化する必要があるので、多大な労力が必要である。
【0004】
特に、中国語、韓国語(ハングル)、タイ語などのように、字母の組み合わせによって文字が形成される文字の場合には、字母の組み合わせの場合の数が非常に膨大なため、すべての文字のデータを収集して、これをデータ化することは実際のところ非常に困難な作業に分類される。
【0005】
特に、前記の文字等は、多数の字母の組み合わせにより何千もの組み合わせの文字を形成することができる。例えば、中国語の漢字は、複雑な字母からなる繁体の場合、70,244もの文字(GB18030)があり、より簡素化された字母からなる簡体でも6,763もの文字(GB2312)があることで知られている。
【0006】
このように、複数個の字母の組み合わせにより形成される文字を有する字は、少なくとも数千個~数万個の組み合わせにより構成することができ、これらを手作業でフォント処理することは、事実上不可能な領域に近い。
【0007】
このような課題を補うために、数少ない手書きのデータを利用して、様々な組み合わせの文字を生成する研究が盛んに行われており、その一例として、韓国登録特許10-1229175による先行文献には、自筆フォント生成方法及び装置について開示されている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】韓国登録特許第10-1229175号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は、あらゆる漢字に対してフォント化した文字を提供できるフォント生成システムおよびフォント生成方法を提供することができる。
【0010】
本発明は、文字をコンポーネントに分割した後、これをフォント化したコンポーネントに変換し、次いで再結合することによって、あらゆる文字に対するフォント変換を行うことができるフォント生成システムおよびフォント生成方法を提供することができる。
【0011】
本発明は、フォント生成の結果に対する信頼性および精度が向上されたフォント生成システムおよびフォント生成方法を提供することができる。
【0012】
本発明は、中国語(漢字)、タイ語、または韓国語(ハングル)のフォント変換を行うことができ、フォント変換のための文字の種類はこれらに限定されず、多様な文字(または言語)に対するフォント変換を行うフォント生成システムおよびフォント生成方法を提供することができる。
【課題を解決するための手段】
【0013】
本発明の様々な実施例によれば、フォント生成システムは、少なくとも一つの文字が入力され、該入力された文字を少なくとも1つ以上のコンポーネントに分解するコンポーネント分解部;前記少なくとも1つ以上のコンポーネントを予め指定されたフォントのコンポーネントに変換し、少なくとも1つ以上のイメージングコンポーネントを生成するコンポーネント変換部;および前記少なくとも1つ以上のイメージングコンポーネントを再結合し、フォント化した文字を生成するコンポーネント再結合部;を含むことができる。
【0014】
前記少なくとも1つの文字は、繁体の漢字、または簡体の漢字であってもよい。
【0015】
前記コンポーネント分解部は、前記繁体の漢字、または前記簡体の漢字から構成された前記少なくとも1つの文字を偏旁に分割することによって少なくとも1つ以上の第1のコンポーネントを生成することができる。
【0016】
前記コンポーネント分解部は、前記少なくとも1つ以上の第1のコンポーネントを少なくとも1つ以上の第2のコンポーネントに分割することができる。
【0017】
前記コンポーネント変換部は、前記少なくとも1つ以上の第2のコンポーネントを予め指定されたフォントのコンポーネントに変換し、前記イメージングコンポーネントを生成することができる。
【0018】
前記フォント生成システムは、少なくとも1つのエンコーダ及びデコーダを含むGANモデルを利用して、前記コンポーネントの分割および前記イメージングコンポーネントの再結合によって前記フォント化した文字を生成するように構成することができる。
【0019】
本発明の多様な実施例によれば、フォント生成方法は、少なくとも一つの文字が入力され、該入力された文字を少なくとも1つ以上のコンポーネントに分解する段階;前記少なくとも1つ以上のコンポーネントを予め指定されたフォントのコンポーネントに変換し、少なくとも1つ以上のイメージングコンポーネントを生成する段階;および前記少なくとも1つ以上のイメージングコンポーネントを再結合し、フォント化した文字を生成する段階;を含むことができる。
【0020】
前記少なくとも1つの文字は、繁体の漢字、または簡体の漢字であってもよい。
【0021】
前記コンポーネントに分解する段階は、前記繁体の漢字、または前記簡体の漢字からなる前記少なくとも1つの文字を偏旁に分割することによって少なくとも1つ以上の第1のコンポーネントを生成する段階を含むことができる。
【0022】
前記コンポーネントに分解する段階は、前記少なくとも1つ以上の第1のコンポーネントを少なくとも1つ以上の第2のコンポーネントに分割する段階を含むことができる。
【0023】
前記イメージングコンポーネントを生成する段階は、前記少なくとも1つ以上の第2のコンポーネントを前記予め指定されたフォントのコンポーネントに変換し、前記イメージングコンポーネントを生成することができる。
【0024】
前記フォント生成方法は、少なくとも1つのエンコーダ及びデコーダを含むGANモデルを利用して、前記コンポーネントの分割およびイメージングコンポーネントの再結合によって前記フォント化した文字を生成するように構成することができる。
【発明の効果】
【0025】
本発明のフォント生成システムおよびフォント生成方法は、あらゆる漢字に対してフォント化した文字を提供することができる。
【0026】
本発明のフォント生成システムおよびフォント生成方法は、文字をコンポーネントに分割した後、これをフォント化したコンポーネントに変換し、次いで再結合することにより、あらゆる文字に対するフォント変換を実行することができる。
【0027】
本発明のフォント生成システムおよびフォント生成方法は、フォント生成の結果に対する信頼性および精度を向上させることができる。
【0028】
本発明のフォント生成システムおよびフォント生成方法は、中国語(漢字)、タイ語、または韓国語(ハングル)のフォント変換を行うことができ、フォント変換のための文字の種類はこれらに限定されず、多様な文字(または言語)に対するフォント変換を提供することができる。
【図面の簡単な説明】
【0029】
【
図1】本発明の実施例による、フォント生成システムのブロック図である。
【
図2】例示的な実施例による、漢字の偏旁を説明するための図である。
【
図3】本発明のフォント生成システムのコンポーネント分解部を介して漢字をコンポーネントに分割する過程を説明するための図である。
【
図4】本発明の実施例による、フォント生成システムを介して任意の1つの漢字に対するフォント化した漢字を生成する過程を説明するための図である。
【
図5】本発明の実施例による、フォント生成システムを介して任意の1つの漢字に対するフォント化した漢字を生成する過程を説明するための図である。
【
図6】本発明の実施例による、フォント生成システムに含まれたモデルの構成を説明するための図である。
【
図7】本発明の実施例による、フォント生成システムに含まれたモデルの構成を説明するための図である。
【
図8】本発明の実施例による、判別部を説明するためのブロック図である。
【
図9】本発明の実施例による、フォント生成システムを利用して多様なフォントの文字を生成した状態を説明するための図である。
【
図10】本発明のフォント生成システムを利用して生成された文字の一部を示す図である。
【
図11】本発明のフォント生成システムを利用してハングルとタイ語をフォント化した結果を出力した図である。
【
図12】本発明のフォント生成システムと既存のフォント生成システムのフォント生成の結果を定量的に比較した表である。
【
図13】本発明のフォント生成システムと既存のフォント生成システムのフォント生成の結果を定量的に比較するための図表である。
【
図14】本発明のフォント生成システムと既存のフォント生成システムのフォント生成の結果を定量的に比較するための図表である。
【
図15】本発明のフォント生成方法を説明するためのフローチャートである。
【発明を実施するための形態】
【0030】
以下、本発明の実施例を添付された図面を参照して詳細に説明する。以下の実施例は、本発明が属する技術分野における通常の知識を有する者に本発明の思想を十分に伝達するために呈するものである。本発明は、本明細書に提示された実施例のみに限定されず、他の形態で具体化されてもよい。図面は、本発明を明確にするために説明に関係のない部分の図示を省略し、理解を助けるために構成要素の大きさを多少誇張して表現することがある。
【0031】
本明細書に記載された実施例および図に示す構成は、開示された発明の好ましい一例に過ぎず、本出願の出願時点において本明細書の実施例および図面を代替できる様々な変形例があり得る。
【0032】
本明細書の各図に示されている同じ参照番号または符号は、実質的に同一機能を実行する部品または構成要素を指す。図面における要素等の形状および大きさなどは、明確な説明のために誇張されていることがある。
【0033】
本明細書で使用される用語は、実施例を説明するために使用されたものであって、開示された発明を制限および/または限定することを意図しない。単数の表現は、文脈上明らかに別段の意味がない限り、複数の表現を含む。本明細書において、「含む」または「有する」などの用語は、本明細書に記載された特徴、数字、段階、動作、構成要素、部品、またはそれらを組み合わせたものが存在することを指定するものであって、1つまたはそれ以上の他の特徴や数字、段階、動作、構成要素、部品、またはそれらを組み合わせたものの存在または追加の可能性を予め排除しない。
【0034】
本明細書で使用される「第1」、「第2」などの序数を含む用語は、様々な構成要素を説明するために使用することができるが、前記構成要素等はその用語によって限定されず、前記用語等は1つの構成要素を他の構成要素と区別する目的のみ使用される。例えば、本発明の権利の範囲から逸脱することなく、第1の構成要素は第2の構成要素と命名することができ、同様に第2の構成要素も第1の構成要素と命名することができる。「および/または」という用語は、複数の関連する記載された項目の組み合わせまたは複数の関連する記載された項目のいずれかを含む。
【0035】
以下で使用される用語「上段」、「下段」、「上部」、「下部」などは図面を基準に定義したものであり、この用語によって各構成要素の形状および位置が制限されるものではない。
【0036】
明細書全体に亘って同じ参照番号は同一構成要素を指す。本明細書が実施例の全ての要素を記述するものではなく、本発明が属する技術分野における一般的な内容または実施例間で重複する内容は省略する。
【0037】
本明細書で使用される「部、モジュール、装置」という用語は、ソフトウェアまたはハードウェアで具現することができ、実施例によって、複数の「部、モジュール、装置」を1つの構成要素として具現する、または1つの「部、モジュール、装置」が複数の構成要素を含むことも可能である。
【0038】
明細書全体において、ある部分が他の部分と「連結」されているとしたとき、これは直接連結されている場合だけでなく、間接的に連結されている場合を含み、間接的な連結は無線通信網を介して連結されることを含む。
【0039】
また、ある部分がある構成要素を「含む」としたとき、これは、特に断りがない限り、他の構成要素を除外するものではなく、他の構成要素をさらに含んでもよいことを意味する。
【0040】
第1、第2などの用語は、一つの構成要素を他の構成要素から区別するために使用されるものであって、構成要素が前述の用語によって限定されるものではない。
【0041】
単数の表現は、文脈上特に断りがない限り、複数の表現を含む。
【0042】
各段階において、識別符号は説明の便宜上、使用されるものであり、識別符号は各段階の順序を説明するものではなく、各段階は、特定の順序が文脈上明確に説明されていない限り、明示された順序とは異なる順序で実施することができる。
【0043】
図1は、本発明の実施例によるフォント生成システムのブロック図である。
【0044】
図1を参照すると、フォント生成システム100は、コンポーネント分解部120、コンポーネント変換部140、またはコンポーネント再結合部160を含むことができる。
【0045】
一例として、フォント生成のためのソース文字(SRC)は、中国語(漢字)、タイ語、または韓国語(ハングル)であってもよいが、これらに限定されない。以下、説明の便宜上、中国語のフォントを生成する方法を一例として説明するが、本発明は、これに限定されるものではなく、多様なソース文字(SRC)のフォントを変換するように構成することができる。
【0046】
コンポーネント分解部120は、フォント生成システム100に入力されるソース文字(SRC)をコンポーネント(CP)(components)に分割、または分解することができる。
【0047】
一例として、ソース文字(SRC)は、漢字の繁体であってもよく、または簡体であってもよい。本発明は、繁体で構成された漢字、または簡体で構成された漢字に関係なく、ソース文字(SRC)である漢字のフォントを生成することができる。
【0048】
コンポーネント分解部120は、入力されたソース文字(SRC)の組み合わせである漢字の組み合わせのあらゆる漢字に対して、コンポーネント(CP)に分割することができる。コンポーネント(CP)は、漢字を構成する部首であってもよいが、これに限定されるものではない。
【0049】
コンポーネント分解部120は、ソース文字(SRC)のそれぞれの漢字に対するコンポーネント(CP)を分割し、分割されたコンポーネント(CP)は、それぞれコンポーネント変換部140で予め指定されたフォントのコンポーネント(CP)に変換することができ、前記変換されたコンポーネントは、イメージングコンポーネント(IM-CP)として定義することができる。前記予め指定されたフォントのコンポーネントは、ユーザーが設計したコンポーネントであってもよいが、これに限定されるものではない。
【0050】
これにより、任意の一つの漢字は、任意の一つの漢字のコンポーネント(CP)に変換され、イメージングコンポーネント(IM-CP)を形成することができ、前記イメージングコンポーネント(IM-CP)をコンポーネント再結合部160で再結合されると、前記任意の1つの漢字に対するフォント化した文字(FC)を形成することができる。
【0051】
本発明の実施例による、フォント生成システム100は、上述の過程が入力されたソース文字(SRC)に対するあらゆる漢字に対してそれぞれ実行することによって、ソース文字(SRC)に対するあらゆる漢字のフォント化した文字(FC)を形成することができる。
【0052】
図2は、例示的な実施例による漢字の偏旁を説明するための図である。
【0053】
図2に示す漢字は、母親の媽(訓読み:はは、音読み:マ)を表す繁体の漢字11と簡体の漢字12を示すものである。
【0054】
示された漢字11、12以外の残りの漢字は、左偏旁、右偏旁、および冠と脚からなる、または一つの偏旁で構成することができる。
【0055】
示された漢字11、12の右偏旁をみると、同様の漢字(訓読み:うま、音読み:マ) 11b、12bであるが、実質的に異なる形状で形成することができる。漢字は、このように同じ文字であっても、繁体か簡体かによってその文字の形状が異なる場合がある。故に、従来のフォント生成システムは、数多くの漢字を変換するための適切な方法を呈することができなかった。
【0056】
本発明の実施例によるフォント生成システム100は、このように複雑な構造を有する漢字をコンポーネント(CP)に分割、または分解することにより、繁体または簡体に関係なく、あらゆる漢字のフォントを生成することができる。
【0057】
図3は、本発明のフォント生成システムのコンポーネント分解部を介して漢字をコンポーネントに分割する過程を説明するための図である。
【0058】
図3を参照すると、ソース文字21(SRC)が示される。コンポーネント分解部120は、ソース文字21(SRC)を左偏旁と右偏旁で構成された第1のコンポーネント22に分割することができる。示された実施例をみると、第1のコンポーネント22は、一つの偏旁で構成される、または2つの偏旁(左偏旁、右偏旁)で構成することができる。
【0059】
コンポーネント分解部120は、第1のコンポーネント22を最小単位である第2のコンポーネント23に分割することができる。前記第2のコンポーネント23は、コンポーネント変換部140を介して予め指定されたフォントのコンポーネントに変換されるためのコンポーネントCPを形成することができる。
【0060】
このように、コンポーネント分解部120は、ソース文字(SRC)の漢字をフォント化処理するための最小単位の第2のコンポーネント23に変換することができる。前記第2のコンポーネント23(CP)は、コンポーネント変換部140を介して予め指定されたフォントのコンポーネントに変換してイメージングコンポーネント(IM-CP)を形成することができる。
【0061】
図4~
図5は、本発明の一実施例によるフォント生成システムを介して任意の1つの漢字に対するフォント化した漢字を生成する過程を説明するための図である。
【0062】
図4~
図5を参照すると、任意の一つの漢字30は、コンポーネント分解部120により5つのコンポーネント31に分割、または分解することができる。前記の分割、または分解された5つのコンポーネント31(CP)は、コンポーネント変換部140によって予め指定されたフォントのコンポーネントに変換してイメージングコンポーネント32(IM-CP)を形成することができる。前記イメージングコンポーネント32(IM-CP)は、コンポーネント再結合部160によって再結合されてフォント化した文字、あるいは、フォント化した漢字33を形成することができる。
【0063】
漢字のほとんど(約99.99%)は、14個未満のコンポーネントを有するが、一部の漢字は14個以上のコンポーネントを有することができる。また、繁体の漢字は、簡体の漢字よりも多くのコンポーネントを有することができる。
【0064】
図6~
図7は、本発明の実施例による、フォント生成システムに含まれるモデルの構成を説明するための図である。
【0065】
図8は、本発明の実施例による、判別部を説明するためのブロック図である。
【0066】
図6~
図8を参照すると、フォント生成システム100は、エンコーダ(encoder)およびデコーダ(decoder)を含むモデルを利用してフォント化した文字を生成することができる。
【0067】
複雑な形の漢字から高品質のフォント化したイメージの漢字を生成するためには、モデルの学習中に情報が失われないように、対象スタイルの情報の特徴を正確に抽出する必要がある。
【0068】
本発明のフォント生成システム100は、GANモデル(generative adversarial networks using generation model)を含むことができる。本発明の実施例による、GANモデルは、一般的なGANモデルとは異なり、2つのエンコーダ(encoder)を含むことができる。第1のエンコーダ(Ec)は、フォントコンテンツ情報を生成し、第2のエンコーダ(Es)は、フォントスタイル情報を生成することができる。これは、対象フォントコンポーネントからより正確なスタイル情報を取得するためのものであって、損失を防ぐためにコンポーネント別のイメージを維持することができる。
【0069】
図6を参照すると、本発明のGANモデルは、一対多(1:多数)のフレームワークで漢字の構成とコンポーネントを活用したモデルであってもよい。また、前記GANモデルは、変換しようとする文字コンポーネントのコンテンツイメージ(Xc)とスタイルイメージ(Xs)を入力として使用する条件付きGAN構造で2つのエンコーダ構造(Ec、Es)を有することができる。第1エンコーダ(Ec)および第2エンコーダ(Es)は、複数のレイヤーにダウンサンプリングできる。各畳み込み層(convolution layer)は、kernel=4およびstride=2を使用し、kernel=7とstride=1を使用する最初のレイヤーを除いて、IN(instance normalization)に従うことができる。本発明のGANモデルは、活性化関数としてLeakyReluを使用し、すべてのレイヤーにSC(skip connection)構造を形成することができる。
【0070】
第1エンコーダ(Ec)および第2エンコーダ(Es)の結果、潜在ベクトル(ZcおよびZs)は併合され、デコーダ(decoder)への入力として使用された後、多重の畳み込み層(convolution layer)を介して再度アップサンプリングして、変換されたスタイルのコンテンツを生成することができる。一つの例として、各レイヤーは、kernel=5、stride=1、IN(instance normalization)方式およびLeaky ReLU関数を用いて逆畳み込み(deconvolution)を実行することができる。すべてのレイヤーは、エンコーダレイヤーとコンテンツ/スタイルがアップサンプリングされたベクトルと併合されるSC(skip connection)構造を形成することができる。また、結果画像(G(x))は畳み込み(convolution)およびtanh関数により生成することができる。生成された結果は、判別部(discrimator(D))に入力され、ソース画像と生成された結果画像とを比較し、GAN損失を計算することができる。原画像で生成されたベクトルと結果画像ベクトルとを比較し、文字およびスタイル損失を計算し、対象画像と生成画像(L1 Loss)とを比較し、画像の品質を向上させることができる。
【0071】
本発明のフォント生成システム100および/またはそれに含まれるGANモデルは、前記原画像と生成された結果画像を比較して損失値を計算し、前記損失値を使って前記生成された結果、画像の文字のフォントが前記原画像の文字のフォントと等しいかどうかを判別することができる。
【0072】
例えば、フォント生成システム100および/またはそれに含まれるGANモデルは、Adversarial損失(LADV)、スタイル損失(LS)、およびL1損失(LL1)を合計して前記損失値を算出することができる。
【0073】
Adversarial損失(LADV)は、min-max Lossとして知られた、以下の[数1]のように表すことができる。
【0074】
【0075】
例えば、GANモデルのフォント判別部(discriminator)は、入力された画像(G(x))が真(True:1)か偽(False:0)かを判別し、最大化(D(y)=1)することができる。
【0076】
スタイル損失(LS)は、D(yS)を最大化し、G(xS)を最小化する、以下の[数2]のように表すことができる。
【0077】
【0078】
例えば、フォント判別部は、一対多のスタイル変換された画像を生成するために真偽を判別し、生成された文字スタイルがオリジナル文字スタイルと同じかどうかを判別(D(yS))することができる。
【0079】
L1損失(LL1)は、下記[数3]のように表すことができる。
【0080】
【0081】
例えば、フォント判別部は、オリジナル文字スタイルと生成された文字スタイルをピクセル別に比較したMAE(Mean Absolute Error)値を減少させ、2つの画像が同じになるようにすることができる。
【0082】
図9は、本発明の実施例による、フォント生成システムを利用して多様なフォントの文字を生成した状態を説明するための図である。
図9を参照すると、本発明のフォント生成システム100を利用して任意の一つの漢字に対して生成された多様なフォントの漢字が示される。
【0083】
図10は、本発明のフォント生成システムを利用して生成された文字の一部を示す図である。
【0084】
図10を参照すると、本発明のフォント生成システムは、ターゲティングしたフォント(tgt)と同じスタイルの文字が出力(out)されることを確認することができる。
【0085】
図11は、本発明のフォント生成システムを利用してハングルとタイ語をフォント化した結果を出力した図である。
【0086】
図11を参照すると、本発明のフォント生成システムは、漢字以外にもハングルまたはタイ語などのコンポーネントに分割することができる多様な文字に適用することができる。
【0087】
図12は、本発明のフォント生成システムと既存のフォント生成システムのフォント生成の結果を定量的に比較するための表であり、
図13は、本発明のフォント生成システムと既存のフォント生成システムのフォント生成の結果を定量的に比較するための図表である。
図14は、本発明のフォント生成システムと既存のフォント生成システムのフォント生成の結果を定量的に比較するための図表である。
【0088】
本発明のフォント生成システム100(CCFont)の性能を確認するために、既存のフォント生成システムのうち、zi2zi及びMX-Fontを比較した。zi2zi、およびMX-Fontを比較すると、本発明のフォント生成システム(CCFont)が、鮮明で明確な高品質のフォントを生成することがわかる。
【0089】
図12および
図13を参照すると、L1、L2損失値は、微調整なしで生成されたCCFontモデル(0.2728、0.2689)がzi2ziモデル(0.5104、0.4225)およびMX-Fontモデル(0.5388、0.5360)と比較して大幅に低いことが示され、類似度はCCFont(0.8808)モデルがMX-Fontモデル(0.3276)よりも高いことが示され、CCFontモデルが格段に優れていることを示している。
【0090】
また、CCFontモデルは、微調整が行われるzi2ziに比べて、微調整なしで前記類似度の数値が導き出され、微調整が行われずに向上された品質のフォント化した文字を提供するので、フォント化処理に時間およびコストが節減される効果がある。
【0091】
FIDスコアは、実画像の特徴ベクトルと偽画像の特徴ベクトルとの距離を算出する性能指数である。すなわち、FIDスコアが低いほど、フォント生成システムによって生成された文字の画像の品質が実際とより相似しており、より優れていることを意味することができる。
【0092】
なお、CCFontモデルは、低いほど、原本に近く評価されるFIDスコア(29.2)が、zi2zi(104.8)、MX-Font(132.5)に比べて低く形成されることにより、文字の構造を損なうことなくフォント化処理が可能な本発明の優秀性を確認することができる。
【0093】
図15は、本発明のフォント生成方法を説明するためのフローチャートである。
【0094】
本発明のフォント生成方法は、フォント生成システム100を利用して、入力された文字を少なくとも1つ以上の第1のコンポーネントに分解する段階(S10)、少なくとも1つ以上の第2のコンポーネントをそれぞれ少なくとも1つ以上の第2のコンポーネントに分解する段階(S20)、少なくとも1つ以上の第2のコンポーネントをそれぞれイメージングコンポーネントに変換する段階(S30)、およびイメージングコンポーネントを再結合し、フォント化した文字を生成する段階(S40)を含むことができる。
【0095】
さらに
図12~
図14を参照すると、FIDスコアの値が低いほど原本に近く評価されるが、zi2zi(104.8)およびMX-Font(132.5)と比較して、CCFontのFIDスコアは29.2と低く形成されることにより、本発明の優秀性を確認することができる。
【0096】
以上、上述のシステムおよび方法は、ハードウェアの構成要素、ソフトウェアの構成要素、および/またはハードウェアの構成要素およびソフトウェアの構成要素の組み合わせにより具現することができる。例えば、実施例で説明した装置および構成要素は、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ(digital signal processor)、マイクロコンピュータ、FPA(field programmable array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令(instruction)を実行し、応答することができる他の任意の装置のように、1つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して具現することができる。処理装置は、オペレーティングシステム(OS)および前記オペレーティングシステム上で実行される1つ以上のソフトウェアアプリケーションを実行することができる。また、処理装置は、ソフトウェアの実行に応答し、データにアクセス、保存、操作、処理および生成することもできる。理解を助けるために、便宜上、処理装置は1つが使用されるものと説明されている場合もあるが、当該技術分野における通常の知識を有する者は、処理装置が複数個の処理要素(processing element)および/または複数タイプの処理要素を含むことができることがわかる。例えば、処理装置は、複数個のプロセッサまたは1つのプロセッサおよび1つのコントローラを含むことができる。また、パラレルプロセッサ(parallel processor)のような他の処理構成(processing configuration)も可能である。
【0097】
実施例による方法は、様々なコンピュータ手段を介して実行することができるプログラム命令の形態で具現され、コンピュータ読み取り可能な媒体に記録することができる。前記コンピュータ読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独でまたは組み合わせて含むことができる。前記媒体に記録されたプログラム命令は、実施例のために特別に設計され構成されたものであってもよく、コンピュータソフトウェア当業者に公知されて使用可能なものであってもよい。コンピュータ読み取り可能な記録媒体の例としては、ハードディスク、フロッピーディスク、および磁気テープのような磁気媒体(magnetic media)、CD-ROM、DVDなどの光記録媒体(optical media)、フロプティカルディスク(floptical disk)のような磁気光媒体(magneto-optical media)、およびロム(ROM)、ラム(RAM)、フラッシュメモリなどのプログラム命令を格納および実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令の例としては、コンパイラによって作成されるような機械語コードだけではなく、インタプリタなどを使用してコンピュータによって実行することができる高級言語コードも含む。前記のハードウェア装置は、実施例の動作を実行するために1つ以上のソフトウェアモジュールとして動作するように構成することができ、その逆も同様である。
【0098】
以上のように実施例が限定された図面によって説明されたが、当該技術分野における通常の知識を有する者であれば前記の記載から様々な変更および変形が可能である。例えば、記載された技術は、記載された方法とは異なる順序で実行されたり、および/または記載されたシステム、構造、装置、回路などの構成要素は、説明された方法とは異なる形態で結合または組み合わされたり、または他の構成要素または均等物によって代替または置換されても、適切な結果が達成され得る。したがって、他の具現例、他の実施例、および特許請求の範囲と同等のものも、後述する特許請求の範囲の範囲に属する。
【0099】
以上、本発明を限定された実施例と図面により説明したが、本発明はこれに限定されるものではなく、本発明が属する技術分野における通常の知識を有する者によって本発明の技術思想と以下に記載する特許請求の範囲の均等範囲内で多様に変更および変形が可能であることは勿論である。
【符号の説明】
【0100】
100:フォント生成システム
120:コンポーネント分解部
140:コンポーネント変換部
160:コンポーネント再結合部