(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022048226
(43)【公開日】2022-03-25
(54)【発明の名称】フォントデータベースの生成方法、ニューラルネットワークモデルのトレーニング方法、装置、記憶媒体およびコンピュータプログラム
(51)【国際特許分類】
G06F 16/73 20190101AFI20220317BHJP
G06T 7/00 20170101ALI20220317BHJP
G06N 3/02 20060101ALI20220317BHJP
【FI】
G06F16/73
G06T7/00 350C
G06N3/02
【審査請求】有
【請求項の数】19
【出願形態】OL
【公開請求】
(21)【出願番号】P 2022007188
(22)【出願日】2022-01-20
(31)【優先権主張番号】202110427857.1
(32)【優先日】2021-04-20
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】516262169
【氏名又は名称】北京百度網訊科技有限公司
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus,No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】110001195
【氏名又は名称】特許業務法人深見特許事務所
(72)【発明者】
【氏名】唐 礼 承
(72)【発明者】
【氏名】劉 家 銘
(57)【要約】
【課題】フォントデータベースの生成方法、ニューラルネットワークモデルのトレーニング方法、装置、機器および記憶媒体を提供する。
【解決手段】本開示は、フォントデータベースの生成方法、ニューラルネットワークモデルのトレーニング方法及び装置、記憶媒体およびコンピュータプログラムを開示し、人工知能分野、具体的には、コンピュータ視覚及びディープラーニング技術に関する。前記フォントデータベースの生成方法は、トレーニングされた類似度比較モデルを用いて、複数の基礎フォントデータベースにおける、ターゲットユーザの手書きフォントデータに最も類似する基礎フォントデータベースを決定し、候補フォントデータベースとすることと、前記候補フォントデータベースを生成するためのトレーニングされた基礎フォントデータベースモデルを用いて、前記ターゲットユーザの手書きフォントデータを調整し、前記ターゲットユーザに対するターゲットフォントデータベースを取得することと、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
フォントデータベースを生成するための方法であって、
トレーニングされた類似度比較モデルを用いて、複数の基礎フォントデータベースにおける、ターゲットユーザの手書きフォントデータに最も類似する基礎フォントデータベースを決定し、候補フォントデータベースとすることと、
前記候補フォントデータベースを生成するためのトレーニングされた基礎フォントデータベースモデルを用いて、前記ターゲットユーザの手書きフォントデータを調整し、前記ターゲットユーザに対するターゲットフォントデータベースを取得することと、を含む
フォントデータベースの生成方法。
【請求項2】
請求項1に記載の方法であって、
複数の基礎フォントデータベースにおける、ターゲットユーザの手書きフォントデータに最も類似する基礎フォントデータベースを決定することは、
トレーニングされた類似度比較モデルを用いて、前記ターゲットユーザの手書きフォントデータと前記複数の基礎フォントデータベースにおける各基礎フォントデータベースにおける相応的なフォントデータとの間の類似度を決定することと、
前記複数の基礎フォントデータベースにおける最大類似度を有する基礎フォントデータベースを前記候補フォントデータベースとすることと、を含む
フォントデータベースの生成方法。
【請求項3】
請求項2に記載の方法であって、
前記類似度は、前記ターゲットユーザの複数の手書きフォントデータと前記複数の基礎フォントデータベースにおける各基礎フォントデータベースにおける複数の相応的なフォントデータとの間の類似度の和を含む
フォントデータベースの生成方法。
【請求項4】
請求項1に記載の方法であって、
前記ターゲットユーザの手書きフォントデータの偏旁データを用いて、前記ターゲットフォントデータベースにおける対応的な偏旁データを置換することをさらに含む
フォントデータベースの生成方法。
【請求項5】
請求項4に記載の方法であって、
前記ターゲットユーザの手書きフォントデータの偏旁データを用いて、前記ターゲットフォントデータベースにおける対応的な偏旁データを置換することは、
置換後の偏旁画像データの重心位置と置換前の偏旁画像データの重心位置との間の差分値を計算することと、
前記差分値に基づいて置換後の偏旁画像データの位置を調整することと、を含む
フォントデータベースの生成方法。
【請求項6】
請求項1に記載の方法であって、
前記候補フォントデータベースを生成するためのトレーニングされた基礎フォントデータベースモデルを用いて、前記ターゲットユーザの手書きフォントデータを調整することは、
前記候補フォントデータベースを生成するためのトレーニングされた基礎フォントデータベースモデルを用いて、標準フォントの基礎筆画を入力とし、前記ターゲットユーザの手書きフォントの基礎筆画を出力とすることを含む
フォントデータベースの生成方法。
【請求項7】
請求項6に記載の方法であって、
前記ターゲットユーザの手書きフォントの基礎筆画は、コンシステンシーポイントセットドリフトCPDマッチングアルゴリズムを使用することにより前記ターゲットユーザの手書き字を分割して得られる
フォントデータベースの生成方法。
【請求項8】
請求項7に記載の方法であって、
前記CPDマッチングアルゴリズムを使用してマッチングした結果をフィルタリングし、不正確と決定された結果をフィルタリングすることをさらに含む
フォントデータベースの生成方法。
【請求項9】
ニューラルネットワークモデルのトレーニング方法であって、
前記ニューラルネットワークモデルは、基礎フォントデータベースモデル及び類似度比較モデルを含み、
前記方法は、
複数のユーザの手書きフォントデータを用いて前記基礎フォントデータベースモデルをトレーニングし、前記複数のユーザの各ユーザに、それに対応する基礎フォントデータベースモデル及び基礎フォントデータベースをそれぞれ保有させることと、
前記複数のユーザの複数の基礎フォントデータベースを用いて類似度比較モデルをトレーニングすることと、を含む
ニューラルネットワークモデルのトレーニング方法。
【請求項10】
請求項9に記載の方法であって、
前記基礎フォントデータは、フォントの画像データを含み、そして、前記複数のユーザの複数の基礎フォントデータベースを用いて類似度比較モデルをトレーニングすることは、
【数1】
前記画像データペアに対してマークlabelを添加し、ここで、前記画像データペアが同一の基礎フォントデータベースからのものであると決定すれば、label値が1であり、そうでなければ0であることと、
【数2】
前記距離及びlabelに基づいて前記類似度比較モデルの損失関数を取得することと、
前記損失関数を利用して前記類似度比較モデルを更新することと、を含む
ニューラルネットワークモデルのトレーニング方法。
【請求項11】
請求項10に記載の方法であって、
【数3】
ニューラルネットワークモデルのトレーニング方法。
【請求項12】
請求項9に記載の方法であって、
複数のユーザの手書きフォントデータを用いて前記基礎フォントデータベースモデルをトレーニングすることは、
標準フォントの基礎筆画を入力とし、前記複数のユーザにおける各ユーザの手書きフォントの基礎筆画を出力とすることを含む
ニューラルネットワークモデルのトレーニング方法。
【請求項13】
請求項12に記載の方法であって、
前記複数のユーザにおける各ユーザの手書きフォントの基礎筆画は、コンシステンシーポイントセットドリフトCPDマッチングアルゴリズムを用いることにより前記各ユーザの手書き字を分割して得られる
ニューラルネットワークモデルのトレーニング方法。
【請求項14】
請求項13に記載の方法であって、
前記CPDマッチングアルゴリズムを用いてマッチングした結果をフィルタリングし、不正確と決定された結果をフィルタリングすることをさらに含む
ニューラルネットワークモデルのトレーニング方法。
【請求項15】
フォントデータベースを生成するための装置であって、
トレーニングされた類似度比較モデルを用いて、ターゲットユーザの手書きフォントデータと複数の基礎フォントデータベースをそれぞれ比較し、前記複数の基礎フォントデータベースにおける、ターゲットユーザの手書きフォントデータに最も類似する基礎フォントデータベースを決定し、候補フォントデータベースとする決定モジュールと、
前記候補フォントデータベースを生成するためのトレーニングされた基礎フォントデータベースモデルを用いて、前記ターゲットユーザの手書きフォントデータを調整し、前記ターゲットユーザに対するターゲットフォントデータベースを取得する調整モジュールと、を含む
フォントデータベースの生成装置。
【請求項16】
ニューラルネットワークモデルのトレーニング装置であって、
前記ニューラルネットワークモデルは、基礎フォントデータベースモデル及び類似度比較モデルを含み、
前記トレーニング装置は、
複数のユーザの手書きフォントデータを用いて前記基礎フォントデータベースモデルをトレーニングし、前記複数のユーザの各ユーザに、それに対応する基礎フォントデータベースモデル及び基礎フォントデータベースをそれぞれ保有させる基礎フォントデータベースモデルトレーニングモジュールと、
前記複数のユーザの複数の基礎フォントデータベースを用いて類似度比較モデルをトレーニングする類似度比較モデルトレーニングモジュールと、を含む
ニューラルネットワークモデルのトレーニング装置。
【請求項17】
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信接続されたメモリとを備え、
前記メモリには、前記少なくとも一つのプロセッサにより実行可能な命令を記憶しており、
前記命令は、前記少なくとも一つのプロセッサが請求項1~14のいずれか一項に記載の方法を実行することができるように、前記少なくとも一つのプロセッサにより実行される
電子機器。
【請求項18】
コンピュータ命令が記憶された非一時的なコンピュータ読取可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1~14のいずれか一項に記載の方法を実行させる記憶媒体。
【請求項19】
プロセッサにより実行される場合に、請求項1~14のいずれか一項に記載の方法を実現するコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、人工知能分野に関し、具体的には、コンピュータ視覚及びディープラーニング技術に関し、特にフォントデータベースの生成方法、ニューラルネットワークモデルのトレーニング方法、装置、記憶媒体及びコンピュータプログラムに関する。
【背景技術】
【0002】
フォントの生成は、常に、国内外の多くの研究者が着目し研究する課題であり、フォント設計業界に広い応用価値を有する。現在主流の技術案は、ディープラーニングに基づくフォント生成案とフォントを分割して組み合わせたフォント生成案を含む。
【0003】
ディープラーニングに基づくフォント生成案、特に生成式対抗ネットワーク(GAN)に基づくフォント生成案に対して、大量のデータによってトレーニングする必要がある。データの品質及び数量は、最終的な出力効果に大きく影響し、したがって、トレーニングデータの取得及びデータ品質に高い要求を有する。フォントを分割して組み合わせたフォント生成案に対して、その必要なデータ量はGANよりも小さいが、ユーザのフォントの連続的な特徴を再現することが困難であり、これにより、ユーザのフォントの美観性および多様性に乏しい。
【発明の概要】
【課題を解決するための手段】
【0004】
本開示は、フォントデータベースの生成方法、ニューラルネットワークモデルのトレーニング方法、装置、機器および記憶媒体を提供している。
【0005】
第一態様によれば、トレーニングされた類似度比較モデルを用いて、複数の基礎フォントデータベースのうち、ターゲットユーザの手書きフォントデータに最も類似する基礎フォントデータベースを決定し、候補フォントデータベースとすることと、前記候補フォントデータベースを生成するためのトレーニングされた基礎フォントデータベースモデルを用いて、前記ターゲットユーザの手書きフォントデータを調整し、前記ターゲットユーザに対するターゲットフォントデータベースを取得することと、を含むフォントデータベースの生成方法を提供した。
【0006】
第二態様によれば、ニューラルネットワークモデルのトレーニング方法を提供し、前記ニューラルネットワークモデルは、基礎フォントデータベースモデル及び類似度比較モデルを含み、前記方法は、複数のユーザの手書きフォントデータを用いて前記基礎フォントデータベースモデルをトレーニングし、前記複数のユーザの各ユーザに、それに対応する基礎フォントデータベースモデル及び基礎フォントデータベースをそれぞれ保有させることと、前記複数のユーザの複数の基礎フォントデータベースを用いて類似度比較モデルをトレーニングすることと、を含む。
【0007】
第三態様によれば、トレーニングされた類似度比較モデルを用いて、ターゲットユーザの手書きフォントデータと複数の基礎フォントデータベースをそれぞれ比較し、前記複数の基礎フォントデータベースのうち、ターゲットユーザの手書きフォントデータに最も類似する基礎フォントデータベースを決定し、候補フォントデータベースとする決定モジュールと、前記候補フォントデータベースを生成するためのトレーニングされた基礎フォントデータベースモデルを用いて、前記ターゲットユーザの手書きフォントデータを調整し、前記ターゲットユーザに対するターゲットフォントデータベースを取得する調整モジュールと、を含むフォントデータベースの生成装置を提供した。
【0008】
第四態様によれば、ニューラルネットワークモデルのトレーニング装置を提供し、前記ニューラルネットワークモデルは、基礎フォントデータベースモデル及び類似度比較モデルを含み、前記トレーニング装置は、複数のユーザの手書きフォントデータを用いて前記基礎フォントデータベースモデルをトレーニングし、前記複数のユーザの各ユーザに、それに対応する基礎フォントデータベースモデル及び基礎フォントデータベースをそれぞれ保有させる基礎フォントデータベースモデルトレーニングモジュールと、前記複数のユーザの複数の基礎フォントデータベースを用いて類似度比較モデルをトレーニングする類似度比較モデルトレーニングモジュールと、を含む。
【0009】
第五態様によれば、少なくとも一つのプロセッサと、前記少なくとも一つのプロセッサと通信接続されたメモリとを備え、前記メモリには、前記少なくとも一つのプロセッサにより実行可能な命令を記憶しており、前記命令は、前記少なくとも一つのプロセッサが上記方法を実行することができるように、前記少なくとも一つのプロセッサにより実行される、電子機器を提供した。
【0010】
第六態様によれば、コンピュータ命令が記憶された非一時的なコンピュータ読取可能な記憶媒体を提供し、前記コンピュータ命令は、コンピュータに上記方法を実行させる記憶媒体を提供した。
【0011】
第七態様によれば、プロセッサにより実行される場合に、上記方法を実現するコンピュータプログラムを提供した。
【0012】
理解されるべきこととして、本部分に記載された内容は、本開示の実施例のキーポイント又は重要な特徴を示すことを意図するものではなく、本開示の範囲を限定するものでもない。本開示の他の特徴は、以下の説明により容易に理解される。
【0013】
図面は、本技術案をよりよく理解するために用いられ、本開示を限定するものではない。
【図面の簡単な説明】
【0014】
【
図1】本開示の実施例によるフォントデータベースを生成するための方法のフローチャートを示す。
【
図2】本開示の実施例によるコンシステンシーポイントセットドリフト(CPD)マッチングアルゴリズムを使用してユーザの手書き字を分割する効果を示す。
【
図3】本開示の別の実施例によるフォントデータベースを生成するための方法のフローチャートを示す。
【
図4】本開示の実施例による偏旁画像データの重心位置を調整する概略図を示す。
【
図5】本開示の実施例によるニューラルネットワークモデルのトレーニング方法のフローチャートを示す。
【
図6】本開示の実施例による基礎フォントデータベースモデルのモデル構造の概略図を示す。
【
図7】本開示の実施例による類似度比較モデルをトレーニングする方法のフローチャートを示す。
【
図8】本開示の実施例による類似度比較モデルのモデル構造の概略図を示す。
【
図9】本開示の実施例によるフォントデータベースを生成する効果の概略図を示す。
【
図10】本開示の実施例によるフォントデータベースを生成するための装置のブロック図である。
【
図11】本開示の実施例によるニューラルネットワークモデルのトレーニング装置のブロック図である。
【
図12】本開示の実施例を実施可能な電子機器のブロック図である。
【発明を実施するための形態】
【0015】
以下、図面を参照して本開示の例示的な実施例を説明する。ここで、より理解しやすいために本開示の実施例の様々な詳細は含まれ、それらが例示的なものであると考えられるべきである。したがって、当業者であれば、ここで記載される実施例に対して様々な変更・修正を行うことができ、本開示の範囲及び精神から逸脱することはないと分るべきである。同様に、明確かつ簡潔に説明するために、以下の記載において周知の機能や構成に対する説明を省略する。
【0016】
図1は、本開示の実施例によるフォントデータベースを生成するための方法100のフローチャートを示す。
【0017】
ステップS110において、トレーニングされた類似度比較モデルを用いて、複数の基礎フォントデータベースのうち、ターゲットユーザの手書きフォントデータに最も類似する基礎フォントデータベースを決定し、候補フォントデータベースとする。
【0018】
いくつかの実施例において、ターゲットユーザの手書きフォントデータと複数の基礎フォントデータベースにおける各基礎フォントデータベース中の相応的なフォントデータとの間の類似度を決定し、複数の基礎フォントデータベースにおける最大類似度を有する基礎フォントデータベースを候補フォントデータベースとすることができる。
【0019】
いくつかの実施例において、類似度は、ターゲットユーザの複数の手書きフォントデータと複数の基礎フォントデータベースにおける各基礎フォントデータベース中の複数の相応的なフォントデータとの間の類似度の和を含む。
【0020】
【0021】
ターゲットユーザの手書きフォントデータに最も類似する基礎フォントデータベースを候補フォントデータベースとすることができる。
【0022】
ステップS120において、候補フォントデータベースを生成するためのトレーニングされた基礎フォントデータベースモデルを利用して、ターゲットユーザの手書きフォントデータを調整し、ターゲットユーザに対するターゲットフォントデータベースを取得する。
【0023】
いくつかの実施例において、候補フォントデータベースを生成するためのトレーニングされた基礎フォントデータベースモデルを利用し、標準フォントの基礎筆画を入力とし、ターゲットユーザの手書きフォントの基礎筆画を出力とする。いくつかの実施例において、ターゲットユーザの手書きフォントの基礎筆画は、コンシステンシーポイントセットドリフト(CPD)マッチングアルゴリズムを使用することによりターゲットユーザの手書き字を分割して得られる。
【0024】
図2は、本開示の実施例によるコンシステンシーポイントセットドリフト(CPD)マッチングアルゴリズムを使用してユーザの手書き字を分割する効果を示す。
【0025】
図2に示すように、210はユーザが入力した手書き字を表し、220は標準楷書の字を表す。ユーザの手書き字と標準楷書の字は、CPDマッチングによって、マッチング結果230を取得する。
【0026】
いくつかの実施例において、さらにCPDマッチングアルゴリズムを使用してマッチングしたマッチング結果230をフィルタリングして、不正確と決定された結果をフィルタリングすることができる。
【0027】
本開示の実施例は、予めトレーニングされた基礎フォントデータベースモデルを利用することにより、ターゲットユーザに対するターゲットフォントデータベースを生成し、このようにターゲットユーザは、少量の手書きフォントデータを提供するだけで効果が安定したフォントデータベースモデルを取得することができる。本開示の実施例によるフォントデータベース生成方法のトレーニング過程は、簡単であり、処理ステップが少なく、モデル開発効率が高い。
【0028】
図3は、本開示の別の実施例によるフォントデータベースを生成するための方法300のフローチャートを示す。
【0029】
方法300におけるステップS310及びS320は、
図1を参照して説明したステップS110及びS120と同じであり、簡潔にするために、ここでステップS310及びS320に対する重複する説明を省略する。
【0030】
方法300は、ステップS330をさらに含むことができる。ステップS330において、ターゲットユーザの手書きフォントデータの偏旁データによってターゲットフォントデータベースにおける対応する偏旁データを置き換える。
【0031】
いくつかの実施例において、置換後の偏旁画像データの重心位置と置換前の偏旁画像データの重心位置との間の差分値を計算し、この差分値に基づいて置換後の偏旁画像データの位置を調整する。
【0032】
図4は、本開示の実施例による偏旁画像データの重心位置を調整する概略図を示す。
【0033】
【0034】
【0035】
本開示の実施例は、ターゲットユーザの手書きフォントデータの偏旁データによってターゲットフォントデータベースにおける対応偏旁データを置き換え、さらにユーザのフォントスタイルを反映する。同時に、重心整列に基づく方法によって置換後の偏旁画像の位置を調整することにより、置換後の偏旁画像を元の字画像の他の部分とより調和させる。
【0036】
図5は、本開示の実施例によるニューラルネットワークモデルのトレーニング方法500のフローチャートを示す。ニューラルネットワークモデルは、基礎フォントデータベースモデルと類似度比較モデルを含む。
【0037】
ステップS510において、複数のユーザの手書きフォントデータを利用して基礎フォントデータベースモデルをトレーニングすることにより、前記複数のユーザの各ユーザに、それぞれに対応する基礎フォントデータベースモデル及び基礎フォントデータベースを保有させる。基礎フォントデータベースモデルの入力は、標準フォント(例えば、標準楷書体)の基礎筆画であり、出力は、複数のユーザのうちの各ユーザの手書きフォントの基礎筆画である。
【0038】
ステップS520において、複数のユーザの複数の基礎フォントデータベースを利用して類似度比較モデルをトレーニングする。類似度比較モデルは、2つ以上のフォント画像データ間の類似度を比較することができる。
【0039】
図6は、本開示の実施例による基礎フォントデータベースモデル600のモデル構成の概略図を示す。
【0040】
図6を参照すると、標準フォント(例えば、標準楷書体)の基礎筆画を入力とし、複数のユーザのうちの各ユーザの手書きフォントの基礎筆画を出力として、基礎フォントデータベースモデル600をトレーニングする。例えば、入力は、
図6に示された入力1、入力2……入力Nであることができ、出力は、
図6に示された出力1、出力2……出力Nであることができる。
【0041】
いくつかの実施例において、複数のユーザのうちの各ユーザの手書きフォントの基礎筆画は、コンシステンシーポイントセットドリフト(CPD)マッチングアルゴリズムを使用することにより各ユーザの手書き字を分割して得られる。CPDマッチングアルゴリズムを用いてターゲットユーザの手書き字を分割する効果は
図2に示すものである。
【0042】
いくつかの実施例において、CPDマッチングアルゴリズムを使用してマッチングした結果をフィルタリングし、不正確に決定された結果をフィルタリングしてもよい。
【0043】
具体的には、CPDマッチングアルゴリズムを用いて分割して得られた各基礎筆画に対して、20点の均一的なサンプリングを行い、この20点の中心点(Xc、Yc)を計算する。次に、この20点の各点と中心点の座標差を計算し、各点と中心点との偏差値(Xi-Xc、Yi-Yc)を取得し、ここで、iは点のインデックスを表す。また、CPDマッチングアルゴリズムにより分割して得られた基礎筆画が属するカテゴリを決定することもできる。ここで、漢字を例とし、漢字の全ての筆画は、横、縦、点、左払い、右払いなどの30個の基礎筆画に分類することができる。すなわち、CPDマッチングアルゴリズムにより分割して得られた基礎筆画がこれらの30個の基礎筆画のうちのいずれに属するかを決定することもできる。最後に、基礎フォントデータベースモデル600に対する入力、すなわち標準フォントの基礎筆画を取得し、それは、次元が20*2+30=70次元である特徴ベクトルである。ここで、20点のサンプリングを例とし、各点は、座標(x、y)で表され、即ち20*2次元であり、30とは、基礎筆画のタイプが30種であることを意味する。基礎フォントデータベースモデル600の出力は、複数のユーザのうちの各ユーザの手書きフォントの基礎筆画である。
【0044】
本開示の実施例によれば、基礎フォントデータベースモデル600の入力と出力のシーケンス長さが一致するため、デコーダ部分を省略することができ、モデル600におけるエンコーダ構造のみをモデルの主体とし、それによりモデルのサイズを縮小する。
【0045】
図7は、本開示の実施例による類似度比較モデルをトレーニングする方法のフローチャートを示す。該類似度比較モデルは、2つ以上のフォントデータ間の類似度を比較することができる。
【0046】
【0047】
ステップS722において、画像データペアにラベルlabelを付加し、ここで画像データペアが同一の基礎フォントデータベースからのものであると決定すれば、label値は1であり、そうでなければ、0となる。
【0048】
【0049】
ステップS725において、距離及びlabelに基づいて類似度比較モデルの損失関数を取得する。
【0050】
ステップS726において、前記損失関数を利用して類似度比較モデルを更新する。
図8は、本開示の実施例による類似度比較モデル800のモデル構成の概略図を示す。
【0051】
【0052】
【0053】
【0054】
図9は、本開示の実施例によるフォントデータベースを生成する効果の概略図を示す。
図9に示すように、ターゲットユーザの手書きフォントデータの偏旁データによってターゲットフォントデータベースにおける対応偏旁データを置き換えることにより、ユーザの手書き字における連筆筆画及び連筆偏旁をよく保持することができ、それによりユーザの手書き字のフォントスタイルをさらに反映する。
【0055】
図10は、本開示の実施例によるフォントデータベースを生成するための装置1000のブロック図である。
【0056】
図10に示すように、フォントデータベースを生成するための装置1000は、決定モジュール1010及び調整モジュール1020を含む。
【0057】
決定モジュール1010は、トレーニングされた類似度比較モデルを用いて、ターゲットユーザの手書きフォントデータと複数の基礎フォントデータベースとをそれぞれ比較し、複数の基礎フォントデータベースのうちターゲットユーザの手書きフォントデータに最も類似する基礎フォントデータベースを決定し、候補フォントデータベースとする。
【0058】
調整モジュール1020は、候補フォントデータベースを生成するためのトレーニングされた基礎フォントデータベースモデルを利用して、ターゲットユーザの手書きフォントデータを調整し、ターゲットユーザに対するターゲットフォントデータベースを取得する。
【0059】
図11は、本開示の実施例によるニューラルネットワークモデルのトレーニング装置1100のブロック図である。該ニューラルネットワークモデルは、基礎フォントデータベースモデル及び類似度比較モデルを含む。
【0060】
図11に示すように、トレーニング装置1100は、基礎フォントデータベースモデルトレーニングモジュール1110及び類似度比較モデルトレーニングモジュール1120を含む。
【0061】
基礎フォントデータベースモデルトレーニングモジュール1110は、複数のユーザの手書きフォントデータを利用して基礎フォントデータベースモデルをトレーニングすることにより、複数のユーザの各ユーザに、それぞれに対応する基礎フォントデータベースモデル及び基礎フォントデータベースを保有させる。
【0062】
類似度比較モデルトレーニングモジュール1120は、複数のユーザの複数の基礎フォントデータベースを利用して類似度比較モデルをトレーニングする。
【0063】
本開示の実施例によれば、本開示は、電子機器、可読記憶媒体及びコンピュータプログラム製品をさらに提供する。
【0064】
図12は、本開示実施例を実施可能な電子機器1200のブロック図を示す。電子機器1200は、様々な形式のデジタルコンピュータ、例えば、ラップトップ型コンピュータ、デスクトップコンピュータ、作業台、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータを表示する。電子機器は、さらに様々な形式の移動装置、例えば、個人デジタルプロセス、携帯電話、スマートフォン、ウェアラブル装置及び他の類似の計算装置を表示することができる。本明細書に示された部材、それらの接続及び関係、及びそれらの機能は例示に過ぎず、本明細書に記載された及び/又は要求された本開示の実現を限定するものではない。
【0065】
図12に示すように、機器1200は計算ユニット1201を含み、リードオンリーメモリ(ROM)1202に記憶されたコンピュータプログラム又は記憶ユニット1208からランダムアクセスメモリ(RAM)1203にロードされたコンピュータプログラムに基づいて、様々な適切な動作及び処理を実行することができる。RAM 1203には、さらに機器1200の操作に必要な様々なプログラム及びデータをさらに記憶することができる。計算ユニット1201、ROM 1202、およびRAM 1203は、バス1204により相互に接続されている。入出力(I/O)インタフェース1205もバス1204に接続されている。
【0066】
機器1200における複数の部品は、I/Oインタフェース1205に接続され、例えばキーボード、マウス等の入力ユニット1206と、例えば様々なタイプのディスプレイ、スピーカ等の出力ユニット1207と、例えば磁気ディスク、光ディスク等の記憶ユニット1208と、例えばネットワークカード、モデム、無線通信トランシーバ等の通信ユニット1209と、を含む。通信ユニット1209は、機器1200は、例えばインターネット等のコンピュータネットワーク及び/又は様々な電気通信網を介して他の機器と情報/データをやり取りすることを許可する。
【0067】
計算ユニット1201は、処理及び計算能力を有する各種の汎用及び/又は専用の処理モジュールであることができる。計算ユニット1201のいくつかの例示として、中央処理ユニット(CPU)、グラフィックスプロセッシングユニット(GPU)、各種の専用の人工知能(AI)計算チップ、各種の運行機械学習モデルアルゴリズムの計算ユニット、デジタルシグナルプロセッサ(DSP)、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラ等を含むが、これらに限定されるものではない。計算ユニット1201は、上記説明した各方法及び処理、例えばフォントデータベースを生成するための方法およびニューラルネットワークモデルのトレーニング方法を実行する。例えば、いくつかの実施例において、フォントデータベースを生成するための方法およびニューラルネットワークモデルのトレーニング方法は、コンピュータソフトウェアプログラムとして実現され、例えば記憶ユニット1208という機械可読媒体に有形的に含まれる。いくつかの実施例において、コンピュータプログラムの一部又は全部は、ROM 1202及び/又は通信ユニット1209を介して機器1200にロード及び/又はインストールされることができる。コンピュータプログラムがRAM 1203にロードされ計算ユニット1201により実行される場合、上記説明したフォントデータベースを生成するための方法およびニューラルネットワークモデルのトレーニング方法の一つ又は複数のステップを実行することができる。代替的に、他の実施例において、計算ユニット1201は他の任意の適切な方式(例えば、ファームウェア)によりフォントデータベースを生成する方法およびニューラルネットワークモデルのトレーニング方法を実行するように配置されてもよい。
【0068】
本明細書で説明したシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、専用集積回路(ASIC)、専用標準製品(ASSP)、チップ上システムのシステム(SOC)、負荷プログラマブルロジックデバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行され及び/又は解釈される一つ又は複数のコンピュータプログラムに実施され、当該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、データ及び命令を該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置に伝送することができる、ということを含むことができる。
【0069】
本開示の方法を実施するためのプログラムコードは、一つ又は複数のプログラミング言語の任意の組み合わせで作成することができる。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供することができ、それによりプログラムコードがプロセッサ又はコントローラにより実行される際に、フローチャート及び/又はブロック図に規定された機能/操作が実施される。プログラムコードは機械に完全に実行されてもよく、部分的に機械で実行されてもよく、独立したソフトウェアパッケージとして部分的に機器で実行され遠隔機械で部分的に実行され、又は完全に遠隔機械又はサーバで実行されてもよい。
【0070】
本開示のコンテキストにおいて、機械可読媒体は、有形の媒体であってもよく、命令実行システム、装置又は機器により使用され又は命令実行システム、装置又は機器と組み合わせて使用されるプログラムを含むか又は記憶することができる。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読媒体は、電子的、磁気的、光学的、電磁的、赤外的、又は半導体システム、装置又は機器、又は上記内容の任意の適切な組み合わせを含むが、それらに限定されない。機械可読記憶媒体のより具体的な例示は、一つ又は複数の線に基づく電気的接続、携帯式コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、便利式コンパクトフラッシュ(登録商標)メモリ(CD-ROM)、光記憶装置、磁気記憶装置、又は上記コンテンツの任意の適切な組み合わせを含む。
【0071】
ユーザとの対話を提供するために、コンピュータにここで説明されたシステム及び技術を実施することができ、該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)と、を有し、ユーザは、該キーボード及び該ポインティングデバイスを介して入力をコンピュータに提供する。他の種類の装置は、さらにユーザとの対話を提供することもできる。例えば、ユーザに提供されたフィードバックは、いかなる形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であることができ、そして、いかなる形式(音声入力、語音入力、又は、触覚入力を含む)でユーザからの入力を受信することができる。
【0072】
ここで説明されたシステム及び技術を、バックグラウンド部品を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア部品を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド部品を含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザが該グラフィカルユーザインタフェース又は該ネットワークブラウザを介してここで説明されたシステム及び技術の実施形態と対話することができる)、又はこのようなバックグラウンド部品、ミドルウェア部品、又はフロントエンド部品の任意の組み合わせを含むコンピューティングシステムに実施することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によりシステムの部品を互いに接続することができる。通信ネットワークの例示は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)及びインターネットを含む。
【0073】
コンピュータシステムは、クライアント及びサーバを含むことができる。クライアントとサーバとは一般的に互いに離れており、通常、通信ネットワークを介して対話する。相応的なコンピュータで運行し、かつ互いにクライアント-サーバの関係を有するコンピュータプログラムにより、クライアント-サーバの関係を生成する。サーバは、クラウドサーバであってもよく、配布式システムのサーバであってもよく、又はブロックチェーンを結合したサーバであってもよい。
【0074】
理解されるべきこととして、以上に示された様々な形式のフローを使用してもよく、各ステップを改めてソーティングしたり、追加したり又は削除してもよい。例えば、本開示に記載の各ステップは、並列に実行されたり、順次に実行されたり、又は異なる順序で実行されてもよく、本開示が開示された技術案の所望の結果を実現することができれば、本明細書はここで限定されない。
【0075】
本開示の技術案において、係るユーザ個人情報の収集、記憶、使用、加工、搬送、提供および開示等の処理は、いずれも相関法規則の規定を満たし、公序良俗に反するものではない。
【0076】
上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション及び代替を行うことが可能であると理解すべきである。本開示の精神と原則内で行われる任意の修正、均等置換及び改良などは、いずれも本開示の保護範囲内に含まれるべきである。