(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-04
(45)【発行日】2024-07-12
(54)【発明の名称】画像サンプル生成方法、テキスト認識方法、装置、電子機器、記憶媒体及びコンピュータプログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20240705BHJP
G06T 7/70 20170101ALI20240705BHJP
G06V 30/14 20220101ALI20240705BHJP
【FI】
G06T7/00 350C
G06T7/70 Z
G06V30/14 340A
(21)【出願番号】P 2023509762
(86)(22)【出願日】2022-07-25
(86)【国際出願番号】 CN2022107554
(87)【国際公開番号】W WO2023134143
(87)【国際公開日】2023-07-20
【審査請求日】2023-02-10
(31)【優先権主張番号】202210051663.0
(32)【優先日】2022-01-17
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100083116
【氏名又は名称】松浦 憲三
(72)【発明者】
【氏名】常 ▲戦▼国
(72)【発明者】
【氏名】▲呂▼ 一
(72)【発明者】
【氏名】▲でん▼ 天生
(72)【発明者】
【氏名】▲ゆん▼ 挺
【審査官】伊知地 和之
(56)【参考文献】
【文献】中国特許出願公開第113011299(CN,A)
【文献】中国特許出願公開第110490232(CN,A)
【文献】特開2013-097561(JP,A)
【文献】中国特許出願公開第109299663(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G06V 10/00 - 20/90
G06V 30/00 - 30/12
G06V 30/14 - 30/168
G06V 30/18 - 30/222
G06V 30/224
G06V 30/226 - 30/32
G06V 30/40 - 30/416
G06V 30/418
G06V 30/42 - 30/424
G06V 40/16
G06V 40/20
CSDB(日本国特許庁)
(57)【特許請求の範囲】
【請求項1】
手書き書体テキストを検出する検出モデルのトレーニングに用いる画像サンプルを生成する画像サンプル生成方法であって、
少なくとも1つの手書き書体サンプル画像に基づいて、手書き書体テキスト画像を生成することと、
前記手書き書体テキスト画像を回転して、傾きの手書き書体テキスト画像を得ることと、
前記傾きの手書き書体テキスト画像を背景画像に追加することと、
前記傾きの手書き書体テキスト画像に基づいて、傾きのマーカーフレームを生成することと、
前記
傾きのマーカーフレームに基づいて、
傾きのマーカーフレーム
と前記傾きの手書き書体テキスト画像を有する目標サンプル画像を生成することとを含み、
前記マーカーフレームは、前記手書き書体テキスト画像の前記背景画像に位置する領域を表す画像サンプル生成方法。
【請求項2】
請求項
1に記載の方法であって、
前記傾きの手書き書体テキスト画像を背景画像に追加することは、
前記背景画像に位置する目標画素を特定することと、
前記目標画素と、前記傾きの手書き書体テキスト画像に位置する所定の画素とに基づいて、前記傾きの手書き書体テキスト画像を前記背景画像に追加することとを含む画像サンプル生成方法。
【請求項3】
請求項
2に記載の方法であって、
前記傾きの手書き書体テキスト画像に基づいて、前記マーカーフレームを生成することは、
前記手書き書体サンプル画像の高さ及び幅を含む手書き書体サンプル属性に基づいて、前記手書き書体テキスト画像の幅及び高さを特定することと、
前記目標画素の座標と、前記傾きの手書き書体テキスト画像の傾き角度と、前記手書き書体テキスト画像の幅及び高さとに基づいて、前記マーカーフレームの頂点座標を特定することと、
前記マーカーフレームの頂点座標に基づいて、前記マーカーフレームを生成することとを含む画像サンプル生成方法。
【請求項4】
請求項1に記載の方法であって、
前記少なくとも1つの手書き書体サンプル画像に基づいて、手書き書体テキスト画像を生成することは、
所定のテキストシーケンスに基づいて、前記少なくとも1つの手書き書体サンプル画像を特定することと、
前記少なくとも1つの手書き書体サンプル画像と、前記手書き書体サンプル画像の高さ及び幅を含む手書き書体サンプル属性とに基づいて、手書き書体テキスト画像を生成することとを含む画像サンプル生成方法。
【請求項5】
請求項
1に記載の方法であって、
前記マーカーフレームに基づいて、前記目標サンプル画像を生成することは、
前記マーカーフレームと、前記傾きの手書き書体テキスト画像と、前記背景画像とに基づいて、前記目標サンプル画像を生成することを含む画像サンプル生成方法。
【請求項6】
検出モデルを用いてテキスト画像に対して目標検出を行い、前記テキスト画像におけるテキストの位置する領域を表す検出フレイムを有するテキスト画像を取得することと、
前記検出フレイムを有するテキスト画像を分割し、被認識画像を取得することと、
前記被認識画像に基づいて、テキスト認識を行い、前記テキスト画像におけるテキストを取得することとを含み、
前記検出モデルは、請求項1に記載の方法により生成された複数の画像サンプルに基づいてトレーニングして得られたテキスト認識方法。
【請求項7】
請求項
6に記載の方法であって、
前記検出フレイムを有するテキスト画像を分割し、被認識画像を取得することは、
前記検出フレイムに基づいて、前記検出フレイムを有するテキスト画像を切り分け、前記検出フレイムを含む局所テキスト画像を取得することと、
前記局所テキスト画像をアフィン変換し、変換された画像を取得することと、
前記変換された画像を二値化処理し、前記被認識画像を取得することとを含むテキスト認識方法。
【請求項8】
手書き書体テキストを検出する検出モデルのトレーニングに用いる画像サンプルを生成する画像サンプル生成装置であって、
少なくとも1つの手書き書体サンプル画像に基づいて、手書き書体テキスト画像を生成
し、前記手書き書体テキスト画像を回転して、傾きの手書き書体テキスト画像を得る第1の生成モジュールと、
前記傾きの手書き書体テキスト画像を背景画像に追加する追加サブモジュールと、前記傾きの手書き書体テキスト画像に基づいて、傾きのマーカーフレームを生成する第1の生成サブモジュールと、前記
傾きのマーカーフレームに基づいて、
傾きのマーカーフレーム
と前記傾きの手書き書体テキスト画像を有する目標サンプル画像を生成する
第2の生成サブモジュールと、を含む第2の生成モジュールとを含み、
前記マーカーフレームは、前記手書き書体テキスト画像の前記背景画像に位置する領域を表す画像サンプル生成装置。
【請求項9】
請求項
8に記載の装置であって、
前記追加サブモジュールは、
前記背景画像に位置する目標画素を特定する第1の特定ユニットと、
前記目標画素と、前記傾きの手書き書体テキスト画像に位置する所定の画素とに基づいて、前記傾きの手書き書体テキスト画像を前記背景画像に追加する追加ユニットとを含む画像サンプル生成装置。
【請求項10】
請求項
9に記載の装置であって、
前記第1の生成サブモジュールは、
前記手書き書体サンプル画像の高さ及び幅を含む手書き書体サンプル属性に基づいて、前記手書き書体テキスト画像の幅及び高さを特定する第2の特定ユニットと、
前記目標画素の座標と、前記傾きの手書き書体テキスト画像の傾き角度と、前記手書き書体テキスト画像の幅及び高さとに基づいて、前記マーカーフレームの頂点座標を特定する第3の特定ユニットと、
前記マーカーフレームの頂点座標に基づいて、前記マーカーフレームを生成する第1の生成ユニットとを含む画像サンプル生成装置。
【請求項11】
請求項
8に記載の装置であって、
前記第1の生成モジュールは、
所定のテキストシーケンスに基づいて、前記少なくとも1つの手書き書体サンプル画像を特定する第1の特定サブモジュールと、
前記少なくとも1つの手書き書体サンプル画像と、前記手書き書体サンプル画像の高さ及び幅を含む手書き書体サンプル属性とに基づいて、手書き書体テキスト画像を生成する第3の生成サブモジュールとを含む画像サンプル生成装置。
【請求項12】
請求項
8に記載の装置であって、
前記第2の生成サブモジュールは、
前記マーカーフレームと、前記傾きの手書き書体テキスト画像と、前記背景画像とに基づいて、前記目標サンプル画像を生成する第2の生成ユニットを含む画像サンプル生成装置。
【請求項13】
検出モデルを用いてテキスト画像に対して目標検出を行い、前記テキスト画像におけるテキストの位置する領域を表す検出フレイムを有するテキスト画像を取得する検出モジュールと、
前記検出フレイムを有するテキスト画像を分割し、被認識画像を取得する分割モジュールと、
前記被認識画像に基づいて、テキスト認識を行い、前記テキスト画像におけるテキストを取得する認識モジュールとを含み、
前記検出モデルは、請求項
8~
12のいずれか1項に記載の装置により生成された複数の画像サンプルに基づいてトレーニングして得られたテキスト認識装置。
【請求項14】
請求項
13に記載の装置であって、
前記分割モジュールは、
前記検出フレイムに基づいて、前記検出フレイムを有するテキスト画像を切り分け、前記検出フレイムを含む局所テキスト画像を取得する切り分けサブモジュールと、
前記局所テキスト画像をアフィン変換し、変換された画像を取得するアフィン変換サブモジュールと、
前記変換された画像を二値化処理し、前記被認識画像を取得する二値化処理サブモジュールとを含むテキスト認識装置。
【請求項15】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信接続されたメモリとを備え、
前記メモリには、前記少なくとも1つのプロセッサにより実行可能な命令を記憶しており、
前記命令は、前記少なくとも1つのプロセッサが請求項1~
7のいずれか1項に記載の方法を実行することができるように、前記少なくとも1つのプロセッサにより実行される電子機器。
【請求項16】
コンピュータ命令を記憶した非一時的なコンピュータ可読記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1~
7のいずれか1項に記載の方法を実行させる記憶媒体。
【請求項17】
プロセッサにより実行される場合に、請求項1~
7のいずれか1項に記載の方法を実現するコンピュータプログラム。
【発明の詳細な説明】
【相互参照】
【0001】
本願は、2022年1月17日に提出された、出願番号202210051663.0の中国特許出願の優先権を主張し、その全ての内容は、引用によって本願に組み込まれる。
【技術分野】
【0002】
本開示は、人工知能技術分野に関し、特に、ディープラーニング技術及びコンピュータビジョン技術に関する。より具体的に、本開示は、画像サンプル生成方法、テキスト認識方法、装置、電子機器、記憶媒体及びコンピュータプログラムを提供する。
【背景技術】
【0003】
ディープラーニングモデルにより、プリント書体のテキストをテキスト認識することができるが、手書き書体のテキストについて、人工的な方式でテキスト認識することができる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示は、画像サンプル生成方法、テキスト認識方法、装置、機器及び記憶媒体を提供する。
【課題を解決するための手段】
【0005】
第一態様によれば、画像サンプル生成方法を提供し、該方法は、少なくとも1つの手書き書体サンプル画像に基づいて、手書き書体テキスト画像を生成することと、前記手書き書体テキスト画像と、背景画像とに基づいて、マーカーフレームを有する目標サンプル画像を生成することとを含み、前記マーカーフレームは、前記手書き書体テキスト画像の前記背景画像に位置する領域を表す。
【0006】
第二態様によれば、テキスト認識方法を提供し、該方法は、検出モデルを用いてテキスト画像に対して目標検出を行い、前記テキスト画像におけるテキストの位置する領域を表す検出フレームを有するテキスト画像を取得することと、前記検出フレイムを有するテキスト画像を分割し、被認識画像を取得することと、前記被認識画像に基づいて、テキスト認識を行い、前記テキスト画像におけるテキストを取得することとを含み、前記検出モデルは、本開示に提供の方法により生成された複数の画像サンプルに基づいてトレーニングして得られた。
【0007】
第三態様によれば、画像サンプル生成装置を提供し、該装置は、少なくとも1つの手書き書体サンプル画像に基づいて、手書き書体テキスト画像を生成する第1の生成モジュールと、前記手書き書体テキスト画像と、背景画像とに基づいて、マーカーフレームを有する目標サンプル画像を生成する第2の生成モジュールとを含み、前記マーカーフレームは、前記手書き書体テキスト画像の前記背景画像に位置する領域を表す。
【0008】
第四態様によれば、テキスト認識装置を提供し、該装置は、検出モデルを用いてテキスト画像に対して目標検出を行い、前記テキスト画像におけるテキストの位置する領域を表す検出フレイムを有するテキスト画像を取得する検出モジュールと、前記検出フレイムを有するテキスト画像を分割し、被認識画像を取得する分割モジュールと、前記被認識画像に基づいて、テキスト認識を行い、前記テキスト画像におけるテキストを取得する認識モジュールとを含み、前記検出モデルは、本開示に提供の装置により生成された複数の画像サンプルに基づいてトレーニングして得られた。
【0009】
第五態様によれば、電子機器を提供し、該電子機器は、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに通信接続されたメモリと備え、メモリには、少なくとも1つのプロセッサにより実行可能な命令が記憶されており、命令は、少なくとも1つのプロセッサが本開示に提供の方法を実行することができるように、少なくとも1つのプロセッサにより実行される。
【0010】
第六態様によれば、コンピュータ命令を記憶した非一時的なコンピュータ可読記憶媒体を提供し、該コンピュータ命令はコンピュータに本開示に提供の方法を実行させる。
【0011】
第七態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムはプロセッサにより実行される時に本開示に提供の方法を実現する。
【0012】
理解されるべきこととして、本部分に記載された内容は、本開示の実施例のキーポイント又は重要な特徴を示すことを意図するものではなく、本開示の範囲を限定するものでもない。本開示の他の特徴は、以下の説明により容易に理解される。
【図面の簡単な説明】
【0013】
ここで、図面は、本開示の発明をよりよく理解するために用いられ、本開示を限定するものではない。
【
図1】
図1は、本開示の一実施例に係る画像サンプル生成方法及びテキスト認識方法を適用できる例示的なシステムアーキテクチャの模式図である。
【
図2】
図2は、本開示の一実施例に係る画像サンプル生成方法のフローチャートである。
【
図3A】
図3Aは、本開示の一実施例に係る手書き書体サンプル画像の模式図である。
【
図3B】
図3Bは、本開示の一実施例に係る手書き書体テキスト画像の模式図である。
【
図3C】
図3Cは、本開示の一実施例に係る傾きの手書き書体テキスト画像の模式図である。
【
図3D】
図3Dは、本開示の一実施例に係る背景画像の模式図である。
【
図3E】
図3Eは、本開示の一実施例に係る目標サンプル画像の模式図である。
【
図4】
図4は、本開示の一実施例に係るテキスト認識方法のフローチャートである。
【
図5】
図5は、本開示の一実施例に係る認識画像サンプルの模式図である。
【
図6A】
図6Aは、本開示の一実施例に係る検出モデルの原理図である。
【
図6B】
図6Bは、本開示の一実施例に係る認識モデルの原理図である。
【
図7】
図7は、本開示の一実施例に係る画像サンプル生成装置のブロック図である。
【
図8】
図8は、本開示の一実施例に係るテキスト認識装置のブロック図である。
【
図9】
図9は、本開示の一実施例に係る画像サンプル生成方法及び/又はテキスト認識方法を適用できる電子機器のブロック図である。
【発明を実施するための形態】
【0014】
以下、図面を参照して本開示の例示的な実施例を説明する。ここで、より理解しやすいために本開示の実施例の様々な詳細は含まれ、それらが例示的なものであると考えられるべきである。したがって、当業者であれば、ここで記載される実施例に対して様々な変更・修正を行うことができ、本開示の範囲及び精神から逸脱することはないと分かるべきである。同様に、明確かつ簡潔に説明するために、以下の記載において周知の機能や構成に対する説明を省略する。
【0015】
手書き書体のテキスト筆跡は、変化が様々であり、統一の様式がない。手書き書体のテキストを人工的に認識してもよいが、高い人力のコストが必要となる。ディープラーニングモデルを用いて手書き書体のテキストを認識してもよいが、手書き書体のテキスに対応する画像サンプルが少なく、ディープラーニングモデルを有効的にトレーニングすることが困難である。
【0016】
図1は、本開示の一実施例に係る画像サンプル生成方法及びテキスト認識方法を適用できる例示的なシステムアーキテクチャの模式図である。
【0017】
留意されるべきこととして、
図1に示すのは、本開示の実施例のシステムアーキテクチャを適用できる例示に過ぎず、当業者が本開示の技術内容を理解することに役立つが、本開示の実施例は、別の機器、システム、環境又はシーンに適用できないことを意味するものではない。
【0018】
図1に示すように、該実施例に係るシステムアーキテクチャ100は、端末機器101、102、103と、ネットワーク104と、サーバ105とを含んでもよい。ネットワーク104は、端末機器101、102、103とサーバ105との間に通信リンクの媒体を提供する。ネットワーク104は、例えば、有線及び/又は無線通信リンクなどの様々な接続タイプを含んでもよい。
【0019】
ユーザは、端末機器101、102、103を使用して、ネットワーク104を介してサーバ105とインタラクションすることにより、メッセージ等を受信又は送信してもよい。端末機器101、102、103は、表示スクリーンを備え、ウェブブラウシングをサポートする様々な電子機器であってもよく、スマートフォン、タブレットコンピュータ、ラップトップコンピュータ及びデスクトップコンピュータなどを含むが、それらに限定されない。
【0020】
サーバ105は、様々なサービスを提供するサーバであってもよく、例えば、ユーザが端末機器101、102、103を用いてブラウシングされたサイトをサポートするバックグラウンド管理サーバ(例に過ぎない)である。バックグラウンド管理サーバは、受信されたユーザ要求等のデータを解析する等の処理を行い、処理結果(例えば、ユーザの要求に応じて取得又は生成されたウェブページ、情報、又はデータ等)を端末機器にフィードバックしてもよい。
【0021】
説明すべきこととして、本開示の実施例が提供する画像サンプル生成方法及び/又はテキスト認識方法は、一般的に、サーバ105により実行されてもよい。それに対して、本開示の実施例が提供する画像サンプル生成装置及び/又はテキスト認識装置は、一般的に、サーバ105に設置されてもよい。本開示の実施例が提供する画像サンプル生成方法及び/又はテキスト認識方法は、サーバ105と異なり、端末機器101、102、103及び/又はサーバ105と通信可能なサーバ又はサーバクラスタにより実行されてもよい。それに対して、本開示の実施例が提供する画像サンプル生成装置及び/又はテキスト認識装置は、サーバ105と異なり、端末機器101、102、103及び/又はサーバ105と通信可能なサーバ又はサーバクラスタに設置されてもよい。
【0022】
図2は、本開示の一実施例に係る画像サンプル生成方法のフローチャートである。
【0023】
図2に示すように、該方法200は、操作S210~S220を含んでもよい。
【0024】
操作S210において、少なくとも1つの手書き書体サンプル画像に基づいて、手書き書体テキスト画像を生成する。
【0025】
例えば、手書き書体サンプル画像は、1つの手書き書体文字の画像であってもよい。
【0026】
例えば、手書き書体サンプル画像は、所定のテキストシーケンスに対応する手書き書体テキストの画像であってもよい。一例において、所定のテキストシーケンスは、「趙は昨日地方に行った」であってもよい。該所定のテキストシーケンスに対応する手書き書体テキス画像は、8個手書き書体テキスト画像に基づいて生成されてもよい。
【0027】
操作S220において、手書き書体テキスト画像と、背景画像とに基づいて、マーカーフレームを有する目標サンプル画像を生成する。
【0028】
本開示の実施例において、マーカーフレームは、手書き書体テキスト画像の背景画像に位置する領域を表してもよい。
【0029】
例えば、背景画像は、1つのビデオフレームに対応する画像であってもよい。
【0030】
例えば、目標サンプル画像を生成するように、マーカーフレームと、手書き書体テキスト画像と、背景画像とに基づいて画像合成を行ってもよい。一例において、テキストシーケンスである「趙は昨日地方に行った」に対応する手書き書体テキスト画像、該画像のマーカーフレーム及び背景画像に基づいて、画像合成を行って、1つの目標サンプル画像を取得してもよい。
【0031】
本開示の実施例によれば、マーカーフレームを有するサンプル画像を大量に生成して、それらのサンプル画像に基づいてトレーニングされた検出モデルは、手書き書体テキストを効率よく検出することができる。
【0032】
本開示の実施例によれば、検出モデルをトレーニングするためのサンプル画像を大量に生成して、検出モデルのトレーニング効果を向上させることができる。例えば、サンプル画像を検出モデルに入力し、検出フレームを有するサンプル画像を取得してもよい。該検出フレームは、サンプル画像におけるテキストの位置する領域を表してもよい。一例において、検出モデルは、DBNet(Differentiable Binarization Network)モデルであってもよい。
【0033】
いくつかの実施例において、手書き書体テキスト画像と、背景画像とに基づいて、マーカーフレームを有する目標サンプル画像を生成することは、傾きの手書き書体テキスト画像を背景画像に追加することと、傾きの手書き書体テキスト画像に基づいてマーカーフレームを生成することと、マーカーフレームに基づいて目標サンプル画像を生成することとを含む。
【0034】
例えば、傾きの手書き書体テキスト画像は、手書き書体テキスト画像を回転して得られる。
【0035】
一例において、手書き書体テキスト画像は、傾き角度に応じて回転されてもよい。
【0036】
一例において、傾き角度は、値の範囲が-90°~90°であってもよい。
【0037】
一例において、手書き書体テキスト画像を回転させるように、ランダムに傾き角度を生成してもよい。
【0038】
一例において、傾き角度が30°を例とする。手書き書体テキスト画像の左上の頂点を基準として時計回りに30°回転させることで、傾きの手書き書体テキスト画像を取得してもよい。
【0039】
例えば、様々な方式で、傾きの手書き書体テキスト画像を背景画像に追加してもよい。
【0040】
本開示の実施例において、マーカーフレームは、傾きの手書き書体テキスト画像の背景画像に位置する領域を表してもよい。
【0041】
例えば、傾き角度に基づいて、マーカーフレームの幅方向と背景画像の幅方向との夾角を特定してもよい。
【0042】
一例において、傾き角度が30°を例とする。
【0043】
マーカーフレームの幅方向と背景画像の幅方向との夾角は、30°としてもよい。次に、マーカーフレームの特定された領域が傾きの手書き書体テキスト画像の位置する領域以上となるように、マーカーフレームの幅と高さを特定してもよい。傾きのマーカーフレームを有するサンプル画像を大量に生成して、それらのサンプル画像に基づいてトレーニングされた検出モデルは、傾きの手書き書体テキストを効率よく検出することができる。
【0044】
いくつかの実施例において、傾きの手書き書体テキスト画像を背景画像に追加することは、目標画素を特定することと、目標画素と、傾きの手書き書体テキスト画像における所定の画素とに基づいて、傾きの手書き書体テキスト画像を背景画像に追加することとを含む。
【0045】
例えば、目標画素は、背景画像に位置する。
【0046】
例えば、背景画像における1つの画素をランダムに目標画素として特定してもよい。
【0047】
例えば、所定の画素は、手書き書体テキスト画像の左上の頂点に対応する画素であってもよい。
【0048】
例えば、傾きの手書き書体テキスト画像を背景画像に追加した後、所定の画素が目標画素と重なる。背景画像における所定の画素の座標は、目標画素の座標であってもよい。
【0049】
いくつかの実施例において、傾きの手書き書体テキスト画像に基づいて、マーカーフレームを生成することは、手書き書体サンプル属性に基づいて、手書き書体テキスト画像の幅及び高さを特定することと、目標画素の座標と、傾きの手書き書体テキスト画像の傾斜角度と、手書き書体テキスト画像の幅及び高さとに基づいて、マーカーフレームの頂点座標を特定することと、マーカーフレームの頂点座標に基づいて、マーカーフレームを生成することとを含む。
【0050】
例えば、手書き書体サンプル属性は、手書き書体サンプル画像の幅と高さを含んでもよい。一例において、各手書き書体サンプル画像の高さは、同じであってもよく、一方、各手書き書体サンプル画像の幅は、異なってもよい。これによれば、手書き書体テキスト画像の高さは、手書き書体サンプル画像の高さであってもよい。手書き書体テキスト画像の幅は、複数の手書き書体テキストサンプル画像の幅の和であってもよい。
【0051】
例えば、手書き書体テキスト画像の幅と高さが特定された後、マーカーフレームの頂点の座標は、目標画素の座標と傾き角度に合わせて特定されてもよい。一例において、目標画素の座標、傾斜角度、手書き書体テキスト画像の幅、手書き書体テキスト画像の高さ、余弦関数及び正弦関数に基づいて、マーカーフレームの少なくとも3つの頂点座標を特定してもよい。
【0052】
さらに、3つの頂点座標に基づいてマーカーフレームを特定してもよい。例えば、3つの頂点座標及び目標画素の座標に基づいてマーカーフレームを特定する。
【0053】
いくつかの実施例において、少なくとも1つの手書き書体サンプル画像に基づいて、手書き書体テキスト画像を生成することは、所定のテキストシーケンスに基づいて、少なくとも1つの手書き書体サンプル画像を特定することと、少なくとも1つの手書き書体サンプル画像と手書き書体サンプル属性とに基づいて、手書き書体テキスト画像を生成することとを含む。
【0054】
例えば、手書き書体サンプル属性は、手書き書体サンプル画像の高さ及び幅を含む。
【0055】
例えば、少なくとも1つの手書き書体サンプル画像を特定するように、所定のテキストシーケンスに対応する手書き書体サンプル画像を取得してもよい。
【0056】
例えば、手書き書体サンプルの属性は、手書き書体サンプルの色と、手書き書体サンプルの回転角度とを含んでもよい。回転角度は、手書き書体サンプルの有する角度を指してもよい。一例において、手書き書体サンプルは、色が黒で、回転角度が10°であることを例とする。少なくとも1つの手書き書体サンプル画像が取得された後、各手書き書体サンプル画像の書体色を黒に調整し、各手書き書体サンプル画像を10°回転させる。次に、所定のテキストシーケンスにおける文字の順序に従って、手書き書体テキスト画像を生成してもよい。
【0057】
図3Aは、本開示の一実施例に係る手書き書体サンプル画像の模式図である。
【0058】
図3Aに示すように、該手書き書体サンプル画像301は、文字である「趙」に対応する。
【0059】
図3Bは、本開示の一実施例に係る手書き書体テキスト画像の模式図である。
【0060】
図3Bに示すように、該手書き書体テキスト画像302は、所定のテキストシーケンスである「趙は昨日地方に行った」に対応する。手書き書体テキスト画像302は、所定の画素303を含み、該所定の画素303は、手書き書体テキスト画像302の左上の頂点に対応する画素であってもよい。
【0061】
図3Cは、本開示の一実施例に係る傾きの手書き書体テキスト画像の模式図である。
【0062】
図3Cに示すように、傾きの手書き書体テキスト画像304は、15°の傾き角度に基づいて、例えば
図3Bにおける手書き書体テキスト画像を回転させて得られてもよい。
【0063】
図3Dは、本開示の一実施例に係る背景画像の模式図である。
【0064】
図3Dに示すように、背景画像305は、1つのソーシャルサイトからの画像であってもよい。背景画像305における画素306を目標画素として特定してもよい。
【0065】
図3Eは、本開示の一実施例に係る目標サンプル画像の模式図である。
【0066】
図3Eに示すように、例えば、
図3Cに示すような傾きの手書き書体サンプル画像304を、
図3Dに示すような背景画像305に追加してもよい。また、傾きの手書き書体サンプル画像が追加された背景画像において、所定の画素303と画素306とが重なってもよい。画素306の座標と、傾き角度(例えば15°)と、手書き書体テキスト画像302の幅及び高さとに基づいて、マーカーフレームの頂点座標を特定してもよい。次に、マーカーフレームの頂点座標に基づいて、マーカーフレーム307を取得する。次に、マーカーフレーム307と、傾きの手書きテキスト画像304と、背景画像305とに基づいて、目標サンプル画像308を取得してもよい。
【0067】
いくつかの実施例において、複数の手書き書体サンプル画像を取得して手書き書体サンプルのライブラリを生成してもよく、複数の背景画像を取得して背景画像のライブラリを生成してもよく、複数の所定のテキストシーケンスを取得してテキストのライブラリを生成してもよい。
【0068】
例えば、方法200における操作S210が実行される前に、先にテキストのライブラリから1つの所定のテキストシーケンスをランダムに取得し、その後、背景画像のライブラリから1つの背景画像を取得してもよい。該所定のテキストシーケンスに基づいて、手書き書体サンプルのライブラリから少なくとも1つの手書き書体サンプル画像を特定する。その後、操作S210を実行してもよい。
【0069】
図4は、本開示の一実施例に係るテキスト認識方法のフローチャートである。
【0070】
図4に示すように、該方法400は、操作S410~S430を含んでもよい。
【0071】
操作S410において、検出モデルを用いて、テキスト画像に対して目標検出を行い、検出フレイムを有するテキスト画像を取得する。
【0072】
例えば、検出フレイムは、テキスト画像におけるテキストの位置する領域を表す。
【0073】
例えば、検出モデルは、本開示に提供の方法により生成された複数の画像サンプルに基づいてトレーニングして得られる。
【0074】
操作S420において、検出フレイムを有するテキスト画像を分割し、被認識画像を取得する。
【0075】
本開示の実施例において、検出フレイムに基づいて、検出フレイムを有するテキスト画像を切り分け、検出フレイムを含む局所テキスト画像を取得してもよい。
【0076】
例えば、検出フレイムに基づいて検出フレイムの外接矩形を特定してもよい。該外接矩形の幅方向は、テキスト画像の幅方向と平行であり、該外接矩形の高さ方向は、テキスト画像の高さ方向と平行である。該外接矩形に基づいて、切り分けを行い、検出フレイムを含む局所テキスト画像を取得してもよい。
【0077】
本開示の実施例において、局所テキスト画像をアフィン変換し、変換された画像を取得する。
【0078】
アフィン変換とは、例えば、2次元座標から2次元座標への線形変換であり、2次元図形の「平直性」と「平行性」を維持するものである。平直性とは、変換された後も直線が曲がらなく依然として直線であり、円弧が変換された後も依然として円弧であることを指してもよい。平行性とは、2次元の図形間の相対位置が変わらないことを維持し、変換された後も平行な2本の線が依然として平行であり、交差する2本の線の交角が変換された後もそのままにすることを指してもよい。アフィン変換は、平行移動、ズーム、反転、回転、クリッピングなどの方式で実現してもよい。
【0079】
本開示の実施例において、変換された画像を二値化処理し、被認識画像を取得する。
【0080】
例えば、変換された画像は、背景とテキストとを含む。各種の方式で、背景に対応する画素の画素値を0とし、テキストに対応する画素の画素値を255として、被認識画像を取得してもよい。
【0081】
操作S430において、被認識画像に基づいて、テキスト認識を行い、テキスト画像におけるテキストを取得する。
【0082】
例えば、認識モデルを用いてテキスト認識を行ってもよい。
【0083】
本開示の実施例によれば、検出モデルの出力する検出フレイムを有するテキスト画像を分割することにより、大量の背景情報が除去されたため、テキスト認識の精度を向上させることができる。
【0084】
いくつかの実施例において、認識モデルは、複数の認識画像サンプルに基づいてトレーニングして得られた。例えば、手書き書体テキスト画像に基づいて、TextRenderer(テキストレンダラー)モデルを用いてランダムなノイズ情報を付加することで、認識画像サンプルを取得することができる。
【0085】
図5は、本開示の一実施例に係る認識画像サンプルの模式図である。
【0086】
図5に示すように、認識画像サンプルにおけるテキストは、例えば、
図3Eの目標サンプル画像におけるテキストと異なってもよい。
【0087】
理解できるように、検出モデルと認識モデルは別々にトレーニングされる。
【0088】
図6Aは、本開示の一実施例に係る検出モデルの原理図である。
【0089】
図6Aに示すように、検出モデル610は、第1の特徴抽出ネットワーク611を含んでもよい。例えば、第1の特徴抽出ネットワークは、軽量な特徴抽出ネットワークであってもよく、例えば、ShuffleNet(Shuffleネットワーク)V2であってもよい。
【0090】
第1の特徴抽出ネットワークは、テキスト画像601を処理し、第1の特徴マップ602を出力することができる。次に、第1の特徴マップ602から、確率マップ603と閾値マップ604とを取得することができる。確率マップ603及び閾値マップ604から、近似二値マップ605を取得することができる。例えば、第1の特徴量マップ602における特徴値のそれぞれは、確率マップ603における1つの確率値に対応し、閾値マップ604における1つの閾値にも対応し、近似二値マップ605における1つの画素値にも対応する。一例において、一つの特徴値Feat_iについては、該特徴値Feat_iに対応する確率値Prob_iが、該特徴値Feat_iに対応する閾値Th_i以上であれば、該特徴値に対応する画素値Pix_iが255である。一例において、別の特徴値Feat_jについては、該特徴値Feat_jに対応する確率値Prob_jが、該特徴値に対応する閾値Th_jより小さければ、該特徴値Feat_jに対応する画素値Pix_jが0である。類似した方式により、確率マップ603及び閾値マップ604から、近似二値マップ605の各画素値を取得することができる。
【0091】
次に、近似二値マップ605から検出フレイムを有するテキスト画像606を取得することができる。検出モデルに軽量な特徴抽出ネットワークを採用することで、検出効率を向上させることができる。また、確率マップ及び閾値マップを用いて処理を行うことで、検出の正確率を向上させることができる。
【0092】
いくつかの実施例において、検出フレイムを有するテキスト画像606を分割することによって、被認識画像を取得することができる。
【0093】
図6Bは、本開示の一実施例に係る認識モデルの原理図である。
【0094】
図6Bに示すように、認識モデル620は、第2の特徴抽出ネットワーク621と、LSTM(Long and Short Term Memory、長短時記憶)エンコーダ622と、LSTMデコーダ623と、アテンションネットワーク624とを含んでもよい。
【0095】
第2の特徴抽出ネットワーク621は、軽量な特徴抽出ネットワークであってもよく、例えばMobileNet(Mobileネットワーク)であってもよい。第2の特徴抽出ネットワーク621は、被認識画像607を処理して、第2の特徴マップ608を出力することができる。第2の特徴マップ608は、それぞれLSTMエンコーダ622及びアテンションネットワーク624に入力してもよい。
【0096】
LSTMエンコーダ622は、256個のLSTM符号化層を含んでもよく、それぞれのLSTM符号化層は、入力された特徴を符号化するために使用される。LSTMデコーダ623は、32個のLSTM復号層を含んでもよく、それぞれのLSTM復号層は、入力された特徴を復号するために使用される。LSTMデコーダ623の出力は、重み行列M_1であってもよい。
【0097】
アテンションネットワーク624は、2D Attention(2次元アテンションメカニズム)に基づいて構築してもよい。アテンションネットワーク624は、第2の特徴マップ624及び重み行列M_1に基づいて、重み行列M_2を出力ことができる。LSTMデコーダ623は、さらに重み行列M_1及び重み行列M_2に基づいて、目標重み行列Mを出力する。一例において、LSTMデコーダ623は、重み行列M_1と重み行列M_2とを加算して、目標重み行列Mを出力してもよい。
【0098】
目標重み行列Mに基づいて、テキスト画像におけるテキスト609を取得することができる。認識モデルは、軽量な特徴抽出ネットワークを採用するとともに、エンコーダおよびデコーダのパラメータ量を低減することにより、モデルの効率をさらに向上させることができる。
【0099】
図7は、本開示の一実施例に係る画像サンプル生成装置のブロック図である。
【0100】
図7に示すように、該装置700は、第1の生成モジュール710と、第2の生成モジュール720とを含んでもよい。
【0101】
第1の生成モジュール710は、少なくとも1つの手書き書体サンプル画像に基づいて、手書き書体テキスト画像を生成する。
【0102】
第2の生成モジュール720は、前記手書き書体テキスト画像と、背景画像とに基づいて、マーカーフレームを有する目標サンプル画像を生成する。例えば、前記マーカーフレームは、前記手書き書体テキスト画像の前記背景画像に位置する領域を表す。
【0103】
いくつかの実施例において、前記第2の生成モジュールは、前記手書き書体テキスト画像を回転して得られた傾きの手書き書体テキスト画像を背景画像に追加する追加サブモジュールと、前記傾きの手書き書体テキスト画像に基づいて、前記マーカーフレームを生成する第1の生成サブモジュールと、前記マーカーフレームに基づいて、前記目標サンプル画像を生成する第2の生成サブモジュールとを含む。
【0104】
いくつかの実施例において、前記追加サブモジュールは、例えば前記背景画像に位置する目標画素を特定する第1の特定ユニットを含む。前記目標画素と、前記傾きの手書き書体テキスト画像に位置する所定の画素とに基づいて、前記傾きの手書き書体テキスト画像を前記背景画像に追加する追加ユニットをさらに含む。
【0105】
いくつかの実施例において、前記第1の生成サブモジュールは、例えば前記手書き書体サンプル画像の高さ及び幅を含む手書き書体サンプル属性に基づいて、前記手書き書体テキスト画像の幅及び高さを特定する第2の特定ユニットを含む。前記目標画素の座標と、前記傾きの手書き書体テキスト画像の傾き角度と、前記手書き書体テキスト画像の幅及び高さとに基づいて、前記マーカーフレームの頂点座標を特定する第3の特定ユニットをさらに含む。前記マーカーフレームの頂点座標に基づいて、前記マーカーフレームを生成する第1の生成ユニットをさらに含む。
【0106】
いくつかの実施例において、前記第1の生成モジュールは、所定のテキストシーケンスに基づいて、前記少なくとも1つの手書き書体サンプル画像を特定する第1の特定サブモジュールを含む。前記少なくとも1つの手書き書体サンプル画像と、前記手書き書体サンプル画像の高さ及び幅を含む手書き書体サンプル属性とに基づいて、手書き書体テキスト画像を生成する第3の生成サブモジュールをさらに含む。
【0107】
いくつかの実施例において、前記第2の生成サブモジュールは、前記マーカーフレームと、前記傾きの手書き書体テキスト画像と、前記背景画像とに基づいて、目標サンプル画像を生成する第2の生成ユニットを含む。
【0108】
図8は、本開示の一実施例に係るテキスト認識装置のブロック図である。
【0109】
図8に示すように、該装置800は、検出モジュール810と、分割モジュール820と、認識モジュール830とを含んでもよい。
【0110】
検出モジュール810は、検出モデルを用いてテキスト画像に対して目標検出を行い、例えば前記テキスト画像におけるテキストの位置する領域を表す検出フレイムを有するテキスト画像を取得する。
【0111】
分割モジュール820は、前記検出フレイムを有するテキスト画像を分割し、被認識画像を取得する。
【0112】
認識モジュール830は、前記被認識画像に基づいて、テキスト認識を行い、前記テキスト画像におけるテキストを取得する。
【0113】
例えば、前記検出モデルは、本開示に提供の装置により生成された複数のサンプル画像に基づいてトレーニングして得られた。
【0114】
いくつかの実施例において、前記分割モジュールは、前記検出フレイムに基づいて、前記検出フレイムを有するテキスト画像を切り分け、前記検出フレイムを含む局所テキスト画像を取得する切り分けサブモジュールを含む。前記局所テキスト画像をアフィン変換し、変換された画像を取得するアフィン変換サブモジュールをさらに含む。前記変換された画像を二値化処理し、前記被認識画像を取得する二値化処理サブモジュールをさらに含む。
【0115】
本開示の技術案において、係わるユーザ個人情報の収集、記憶、使用、加工、伝送、提供、開示及び応用などの処理は、いずれも相関法律法規の規定に適合し、必要な秘密保持措置を行い、かつ公序良俗に反しない。
【0116】
本開示の技術案において、ユーザ個人情報を取得または収集する前に、ユーザの承認または同意を得ました。
【0117】
本開示の実施例によれば、本開示は、電子機器、可読記憶媒体及びコンピュータプログラムをさらに提供する。
【0118】
図9は、本開示の実施例を実施できる例示的な電子機器900を模式的に示すブロック図である。電子機器は、様々な形態のデジタルコンピュータを示すことを目的とし、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータである。電子機器は、さらに様々な形態の移動装置を示してもよく、例えば、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブル装置及び他の類似の演算装置である。本明細書に示された部材、それらの接続及び関係、及びそれらの機能は、例示に過ぎず、本明細書に記載された及び/又は要求された本開示の実現を限定しない。
【0119】
図9に示すように、電子機器900は、演算ユニット901を含み、演算ユニット901は、リードオンリーメモリ(ROM)902に記憶されたコンピュータプログラム又は記憶ユニット908からランダムアクセスメモリ(RAM)903にロードされたコンピュータプログラムに基づいて、様々な適切な動作及び処理を実行してもよい。RAM903には、さらに電子機器900の操作に必要な様々なプログラム及びデータを記憶してもよい。演算部901、ROM902及びRAM903は、バス904を介して相互に接続される。入出力(I/O)インタフェース905も、バス904に接続される。
【0120】
電子機器900における複数の部品は、I/Oインタフェース905に接続され、例えばキーボード、マウス等の入力ユニット906と、例えば様々な種類のディスプレイ、スピーカ等の出力ユニット907と、例えば磁気ディスク、光ディスク等の記憶ユニット908と、例えばネットワークカード、モデム、無線通信トランシーバ等の通信ユニット909とを含む。通信部909は、電子機器900がインターネットのようなコンピュータネットワーク及び/又は各種の電気通信ネットワークを介して他の機器と情報/データをやり取りすることを可能にする。
【0121】
演算部901は、処理及び演算能力を有する各種の汎用及び/又は専用の処理モジュールであってもよい。演算部901の幾つかの例としては、中央処理ユニット(CPU)、図形処理ユニット(GPU)、各種専用の人工知能(AI)演算チップ、各種動作機械学習モデルアルゴリズムをランニングする演算部、DSP(DIGITAL SIGNAL PROCESSOR)、並びに任意の適切なプロセッサ、コントローラ、マイクロコントローラ等が挙げられるが、それらに限定されない。演算ユニット901は、例えば画像サンプル生成方法及び/又はテキスト認識方法のような上記に記載の各方法及び処理を実行する。例えば、いくつかの実施例において、画像サンプル生成方法及び/又はテキスト認識方法は、例えば記憶ユニット908のような機械可読媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現されてもよい。いくつかの実施例において、コンピュータプログラムの一部又は全部は、ROM902及び/又は通信ユニット909を介して電子機器900にロード及び/又はインストールされてもよい。コンピュータプログラムがRAM903にロードされて演算ユニット901により実行される場合、上記に記載の画像サンプル生成方法及び/又はテキスト認識方法の1つ又は複数の操作を実行してもよい。代替的に、他の実施例において、演算ユニット901は、他の任意の適切な方式(例えば、ファームウェアを介する)により画像サンプル生成方法及び/又はテキスト認識方法を実行するように構成されてもよい。
【0122】
本明細書で説明したシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップ(SOC)、コンプレックスプログラマブルロジックデバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせにおいて実現されてもよい。これらの様々な実施例は、1つ又は複数のコンピュータプログラムにおいて実施され、該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラムマブルプロセッサを含むプログラムマブルシステムで実行され及び/又は解釈されることが可能であり、該プログラムマブルプロセッサは、専用又は汎用のプログラムマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、かつデータ及び命令を該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置に伝送することができることを含んでもよい。
【0123】
本開示の方法を実施するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせで作成されてもよい。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又は他のプログラムマブルデータ処理装置のプロセッサ又はコントローラに提供されてもよく、それによって、プログラムコードがプロセッサ又はコントローラにより実行される時に、フローチャート及び/又はブロック図に規定された機能/操作が実施される。プログラムコードは、機器に完全に実行されてもよく、部分的に機器で実行されてもよく、独立したソフトウェアパッケージとして部分的に機器で実行され、かつ部分的に遠隔機器で実行されるか又は完全に遠隔機器又はサーバで実行されてもよい。
【0124】
本開示のコンテキストにおいて、機械可読媒体は、有形の媒体であってもよく、命令実行システム、装置又は電子機器に使用され、又は命令実行システム、装置又は電子機器と組み合わせて使用されるプログラムを含んでか又は記憶してもよい。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってもよい。機械可読媒体は、電子の、磁気的、光学的、電磁的、赤外線の、又は半導体システム、装置又は電子機器、又は上記内容の任意の適切な組み合わせを含んででもよいが、それらに限定されない。機械可読記憶媒体のより具体的な例としては、1つ以上の線による電気的接続、携帯式コンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、コンパクトディスクリードオンリーメモリ(CD-ROM)、光記憶装置、磁気記憶装置、又は上記内容の任意の適切な組み合わせを含む。
【0125】
ユーザとの対話を提供するために、コンピュータにここで説明されたシステム及び技術を実施させてもよく、該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを備え、ユーザは、該キーボード及び該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類の装置は、さらにユーザとの対話を提供してもよく、例えば、ユーザに提供されたフィードバックは、いかなる形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、かついかなる形態(声入力、音声入力又は、触覚入力を含む)でユーザからの入力を受信してもよい。
【0126】
ここで説明されたシステム及び技術は、バックグラウンド部品を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア部品を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド部品を含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザが該グラフィカルユーザインタフェース又は該ネットワークブラウザを介してここで説明されたシステム及び技術の実施例と対話することができる)、又はこのようなバックグラウンド部品、ミドルウェア部品、又はフロントエンド部品のいずれかの組み合わせを含むコンピューティングシステムに実施されることが可能である。任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によりシステムの部品を互いに接続することができる。通信ネットワークの例としては、局所エリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)及びインターネットを例示的に含む。
【0127】
コンピュータシステムは、クライアント及びサーバを含んでもよい。クライアントとサーバ同士は、一般的に離れており、通常、通信ネットワークを介して対話する。クライアントとサーバとの関係は、該当するコンピュータ上でランニングし、クライアント-サーバの関係を有するコンピュータプログラムによって生成される。
【0128】
理解されるべきこととして、以上に示した様々な形態のフローを使用してもよく、操作を改めてソーティングしたり、追加したり又は削除してもよい。例えば、本発明に記載の各ステップは、並列的に実行されたり、順次に実行されたり、又は異なる順序で実行されてもよく、本開示の発明の所望の結果を実現することができれば、本明細書はここで限定されない。
【0129】
上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブコンビネーション及び代替を行うことが可能であると理解されるべきである。本開示の精神と原則内で行われた任意の修正、均等置換及び改良などは、いずれも本開示の保護範囲内に含まれるべきである。