(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-17
(45)【発行日】2024-05-27
(54)【発明の名称】文字候補提案装置、手書文字識別システム、手書文字識別方法およびプログラム
(51)【国際特許分類】
G06V 30/196 20220101AFI20240520BHJP
G06V 30/26 20220101ALI20240520BHJP
【FI】
G06V30/196 G
G06V30/264
G06V30/266
(21)【出願番号】P 2023096647
(22)【出願日】2023-06-13
(62)【分割の表示】P 2019163641の分割
【原出願日】2019-09-09
【審査請求日】2023-06-14
(73)【特許権者】
【識別番号】000233491
【氏名又は名称】株式会社日立システムズ
(74)【代理人】
【識別番号】110000198
【氏名又は名称】弁理士法人湘洋特許事務所
(72)【発明者】
【氏名】北見 淳
【審査官】新井 則和
(56)【参考文献】
【文献】特開平02-195489(JP,A)
【文献】特開2015-103082(JP,A)
【文献】特開平03-038787(JP,A)
【文献】特開平11-328317(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/196
G06V 30/264
G06V 30/266
(57)【特許請求の範囲】
【請求項1】
文字の外観の類似関係を記憶する類似文字記憶部と、
実存する
人名の文字列を記憶する実存文字記憶部と、
一つ以上の文字を受信して該文字の外観の類似する
人名の文字候補の案出を受託する受託処理部と、
受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理部と、
前記照合処理部による照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを
人名の候補文字として出力する候補文字送信処理部と、
を備え、
前記候補文字送信処理部は、前記外観が類似する文字の候補ごとの出現頻度の高い順に組み合わせた人名の候補文字を整列して出力する、
ることを特徴とする文字候補提案装置。
【請求項2】
請求項1に記載の文字候補提案装置であって、
前記候補文字を出力後、前記受託処理部が受信した前記文字のいずれかと類似する文字を受け付けると、前記類似文字記憶部に記憶されていない類似関係であれば前記類似文字記憶部に記憶させる類似文字登録処理部、
を備えることを特徴とする文字候補提案装置。
【請求項3】
請求項
1に記載の文字候補提案装置であって、
前記実存する人名の文字列は、姓と名が区分されており、
受信した前記文字を姓と名に区分して前記照合処理部に照合させる姓名判別処理部、
を備えることを特徴とする文字候補提案装置。
【請求項4】
請求項
3に記載の文字候補提案装置であって、
前記姓名判別処理部は、受信した前記文字について姓と名を区切る位置を変化させて姓と名に区分した組み合わせを特定し、各組み合わせの姓と名の両方について、前記照合処理部による照合の結果ヒットを得られた場合に前記候補文字とする、
ことを特徴とする文字候補提案装置。
【請求項5】
請求項
4に記載の文字候補提案装置であって、
前記候補文字送信処理部は、前記候補文字を、出現頻度に応じて整列して出力する、
ことを特徴とする文字候補提案装置。
【請求項6】
請求項1に記載の文字候補提案装置であって、
前記受託処理部が受信する前記文字は、手書き文字を読み取って認識した文字である、
ことを特徴とする文字候補提案装置。
【請求項7】
文字候補提案装置と、前記文字候補提案装置とネットワークを介して通信可能に接続される業務端末と、前記業務端末からの指示に応じて手書文字を読み取る読取装置と、を含む手書文字識別システムであって、
前記業務端末は、前記読取装置から前記手書文字を取得して文字認識を行う文字認識部と、
前記文字認識部により認識された文字を前記文字候補提案装置に送信して文字候補の提案を委託する委託処理部と、
前記文字候補提案装置から出力された文字候補を表示する目視確認処理部と、を備え、
前記文字候補提案装置は、
文字の外観の類似関係を記憶する類似文字記憶部と、
実存する
人名の文字列を記憶する実存文字記憶部と、
一つ以上の文字を受信して該文字の外観の類似する
人名の文字候補の案出を受託する受託処理部と、
受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理部と、
前記照合処理部による照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを
人名の候補文字として出力する候補文字送信処理部と、
を備え
、
前記候補文字送信処理部は、前記外観が類似する文字の候補ごとの出現頻度の高い順に組み合わせた人名の候補文字を整列して出力する、
ことを特徴とする手書文字識別システム。
【請求項8】
文字候補提案装置と、前記文字候補提案装置とネットワークを介して通信可能に接続される業務端末と、前記業務端末からの指示に応じて手書文字を読み取る読取装置と、を含む手書文字識別システムによる手書文字識別方法であって、
前記業務端末は、前記読取装置から前記手書文字を取得して文字認識を行う文字認識ステップと、
前記文字認識ステップにおいて認識された文字を前記文字候補提案装置に送信して文字候補の提案を委託する委託処理ステップと、
前記文字候補提案装置から出力された文字候補を表示する目視確認処理ステップと、を実行し、
前記文字候補提案装置は、
文字の外観の類似関係を記憶する類似文字記憶部と、
実存する
人名の文字列を記憶する実存文字記憶部と、を備え、
一つ以上の文字を受信して該文字の外観の類似する
人名の文字候補の案出を受託する受託処理ステップと、
受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理ステップと、
前記照合処理ステップによる照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを
人名の候補文字として出力する候補文字送信処理ステップと、
を実行
し、
前記候補文字送信処理ステップでは、前記外観が類似する文字の候補ごとの出現頻度の高い順に組み合わせた人名の候補文字を整列して出力する、
ことを特徴とする手書文字識別方法。
【請求項9】
コンピュータに、手書文字の識別を支援させる処理を行わせるプログラムであって、
前記コンピュータは、
文字の外観の類似関係を記憶する類似文字記憶部と、
実存する
人名の文字列を記憶する実存文字記憶部と、処理部と、を備え、
前記処理部に、
一つ以上の文字を受信して該文字の外観の類似する
人名の文字候補の案出を受託する受託処理ステップと、
受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理ステップと、
前記照合処理ステップによる照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを
人名の候補文字として出力する候補文字送信処理ステップと、
を実施させ
、
前記候補文字送信処理ステップでは、前記外観が類似する文字の候補ごとの出現頻度の高い順に組み合わせた人名の候補文字を整列して出力させる、
ことを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字候補提案装置、手書文字識別システム、手書文字識別方法およびプログラムに関するものである。
【背景技術】
【0002】
特許文献1には、「情報処理装置は、画像データから文字列を抽出する文字抽出部224と、入力文字に対応する1または2以上の変換候補文字を含む変換候補リストを作成するリスト作成部244と、前記変換候補リストに含まれる前記1または2以上の変換候補文字と、前記文字抽出部によって抽出された文字列との比較に基づいて、変換先の文字を特定する特定部248と、前記特定部によって特定された前記変換先の文字を含む表示画面を生成する表示制御部252と、を備える」ことについて記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記技術は、文字の候補を提示できるが、文字の認識を誤ると、適切な結果を得ることが難しい。
【0005】
本発明の目的は、類似する文字列候補をより適切に提案する技術を提供することにある。
【課題を解決するための手段】
【0006】
本願は、上記課題の少なくとも一部を解決する手段を複数含んでいるが、その例を挙げるならば、以下のとおりである。本発明の一態様に係る情報処理装置は、文字の外観の類似関係を記憶する類似文字記憶部と、実存する文字列を記憶する実存文字記憶部と、一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理部と、受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理部と、前記照合処理部による照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理部と、を備える。
【0007】
また例えば、上記の文字候補提案装置は、前記候補文字を出力後、前記受託処理部が受信した前記文字のいずれかと類似する文字を受け付けると、前記類似文字記憶部に記憶されていない類似関係であれば前記類似文字記憶部に記憶させる類似文字登録処理部、を備えるものであってもよい。
【0008】
また例えば、上記の文字候補提案装置は、前記実存文字記憶部には、実存する人名の文字列が格納されており、前記受託処理部は、案出する前記文字候補として人名の案出を受託し、前記候補文字送信処理部は、前記外観が類似する文字の候補の組み合わせを人名の候補文字として出力するものであってもよい。
【0009】
また例えば、上記の文字候補提案装置であって、前記実存する人名の文字列は、姓と名が区分されており、受信した前記文字を姓と名に区分して前記照合処理部に照合させる姓名判別処理部、を備えるものであってもよい。
【0010】
また例えば、上記の文字候補提案装置であって、前記姓名判別処理部は、受信した前記文字について姓と名を区切る位置を変化させて姓と名に区分した組み合わせを特定し、各組み合わせの姓と名の両方について、前記照合処理部による照合の結果ヒットを得られた場合に前記候補文字とする、ことを特徴とするものであってもよい。
【0011】
また例えば、上記の文字候補提案装置であって、前記候補文字送信処理部は、前記候補文字を、出現頻度に応じて整列して出力する、ことを特徴とするものであってもよい。
【0012】
また例えば、上記の文字候補提案装置であって、前記受託処理部が受信する前記文字は、手書き文字を読み取って認識した文字である、ことを特徴とするものであってもよい。
【0013】
また、本発明の別の態様にかかる手書文字識別システムは、文字候補提案装置と、前記文字候補提案装置とネットワークを介して通信可能に接続される業務端末と、前記業務端末からの指示に応じて手書文字を読み取る読取装置と、を含む手書文字識別システムであって、前記業務端末は、前記読取装置から前記手書文字を取得して文字認識を行う文字認識部と、前記文字認識部により認識された文字を前記文字候補提案装置に送信して文字候補の提案を委託する委託処理部と、前記文字候補提案装置から出力された文字候補を表示する目視確認処理部と、を備え、前記文字候補提案装置は、文字の外観の類似関係を記憶する類似文字記憶部と、実存する文字列を記憶する実存文字記憶部と、一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理部と、受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理部と、前記照合処理部による照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理部と、を備える、ことを特徴とする。
【0014】
また、本発明の別の態様にかかる手書文字識別方法は、文字候補提案装置と、前記文字候補提案装置とネットワークを介して通信可能に接続される業務端末と、前記業務端末からの指示に応じて手書文字を読み取る読取装置と、を含む手書文字識別システムによる手書文字識別方法であって、前記業務端末は、前記読取装置から前記手書文字を取得して文字認識を行う文字認識ステップと、前記文字認識ステップにおいて認識された文字を前記文字候補提案装置に送信して文字候補の提案を委託する委託処理ステップと、前記文字候補提案装置から出力された文字候補を表示する目視確認処理ステップと、を実行し、前記文字候補提案装置は、文字の外観の類似関係を記憶する類似文字記憶部と、実存する文字列を記憶する実存文字記憶部と、を備え、一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理ステップと、受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理ステップと、前記照合処理ステップによる照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理ステップと、を実行することを特徴とする。
【0015】
また、本発明の別の態様にかかるプログラムは、コンピュータに、手書文字の識別を支援させる処理を行わせるプログラムであって、前記コンピュータは、文字の外観の類似関係を記憶する類似文字記憶部と、実存する文字列を記憶する実存文字記憶部と、処理部と、を備え、前記処理部に、一つ以上の文字を受信して該文字の外観の類似する文字候補の案出を受託する受託処理ステップと、受信した前記文字と外観が類似する文字の候補を、前記類似文字記憶部と照合することで特定し、前記外観が類似する文字の候補の組み合わせのうち前記実存文字記憶部に記憶された前記実存する文字列と照合する照合処理ステップと、前記照合処理ステップによる照合の結果ヒットした前記外観が類似する文字の候補の組み合わせを候補文字として出力する候補文字送信処理ステップと、を実施させることを特徴とする。
【発明の効果】
【0016】
本発明によると、文章の内容を適切に評価できる技術を提供することができる。
【0017】
上記した以外の課題、構成および効果は、以下の実施形態の説明により明らかにされる。
【図面の簡単な説明】
【0018】
【
図1】実施形態に係る手書文字識別システムの概要を例示するブロック図である。
【
図2】手書文字識別システムの構成の例を示す図である。
【
図3】受領データ記憶部のデータ構造例を示す図である。
【
図6】類似文字記憶部のデータ構造例を示す図である。
【
図7】候補文字記憶部のデータ構造例を示す図である。
【
図10】文字候補提案装置のハードウェア構成例を示す図である。
【
図11】手書文字認識の全体処理フローの例を示す図である。
【
図12】姓名区分照合処理のフローの例を示す図である。
【
図13】候補文字受領処理のフローの例を示す図である。
【
図14】類似文字登録処理のフローの例を示す図である。
【発明を実施するための形態】
【0019】
以下に、本発明の一態様に係る実施形態を適用した手書文字識別システム1について、図面を参照して説明する。以下の実施の形態においては便宜上その必要があるときは、複数のセクションまたは実施の形態に分割して説明するが、特に明示した場合を除き、それらはお互いに無関係なものではなく、一方は他方の一部または全部の変形例、詳細、補足説明等の関係にある。
【0020】
また、以下の実施の形態において、要素の数等(個数、数値、量、範囲等を含む)に言及する場合、特に明示した場合および原理的に明らかに特定の数に限定される場合等を除き、その特定の数に限定されるものではなく、特定の数以上でも以下でもよい。
【0021】
さらに、以下の実施の形態において、その構成要素(要素ステップ等も含む)は、特に明示した場合および原理的に明らかに必須であると考えられる場合等を除き、必ずしも必須のものではないことは言うまでもない。
【0022】
同様に、以下の実施の形態において、構成要素等の形状、位置関係等に言及するときは特に明示した場合および原理的に明らかにそうではないと考えられる場合等を除き、実質的にその形状等に近似または類似するもの等を含むものとする。このことは、上記数値および範囲についても同様である。
【0023】
また、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。
【0024】
図1は、本実施形態に係る手書文字識別システムの概要を例示するブロック図である。手書文字識別システム1は、利用者が業務端末200を用いてブラウザ等を介して文字候補提案装置100に接続して利用するが、これに限られず、文字候補提案装置100の各機能がアプリケーションソフトウェアとして業務端末200に搭載されるものであってもよい。
【0025】
なお、業務端末200から文字候補提案装置100に接続する際には、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、携帯電話網等、あるいはこれらが複合した通信網であるネットワーク50を介して接続される。当該ネットワークは、携帯電話通信網等の無線通信網上のVPN(Virtual Private Network)等であってもよい。
【0026】
手書文字識別システム1の応用例を挙げると、手書文字識別システム1は、所定の書面(例えば、保険の申込書や銀行口座の開設申込書等、氏名を所定の様式に従って手書きで入力する書面)の取り扱いを伴う業務システム等がある。
【0027】
その際には、利用者は、所定の書面の所定の欄に氏名を手書きで書き込むことが想定されるが、大量の書面を事務処理するためには、コンピュータ処理による大量の情報処理を介した方が効率性の面でメリットが大きいため、一般的には氏名等の手書きの記述はOCR(Optical Character Recognition)によりデジタル化されることが多い。
【0028】
ここで、紙文書の文字データ電子化技術は向上しているが、誤読や不読が一定の割合で生じ、あらゆる手書き文字を完全に認識可能な技術は存在しない。そのため、最終的に人の目視による文字一致確認を行っているが、この目視作業は文書の文字データ電子化コストの削減を阻害する要因の一つとなっている。具体的には、氏名を読み取りした場合、名字、名前等の氏名に関するデータベースと照合して文字の認識率の向上を図る仕組みが取り入れられているが、読み取りが難しい文字や紛らわしい文字もあり、誤読が発生しているか目視で確認するコストが依然としてかかる。
【0029】
つまり、読取した文字に誤読が含まれる場合、例えば正しい名字「川本」をOCR等の文字認識エンジンが「小木」と誤読した場合、誤である「小木」に対して各データベースとの照合を行うため、正である「川本」の候補順位が劣後、または候補洩れする可能性がある。
【0030】
また、名字部分と名前部分の記入欄が各々明確にしないで氏名をフルネームとして記入する書式を用いる場合には、正しい名字の識別がなされなければ誤読の発生にすら気づかない場合もある。例えば「小山田伸」(おやまだしん)というフルネームの「田」を「由」と誤読すると、名字を「小山」(こやま)と認識し、「由」から始まる「由伸」(よしのぶ)等の名前を候補としてしまう可能性がある。
【0031】
これらを鑑み、本願はOCR等の文字認識エンジンで読取った文字が誤であることも前提に、名字と名前に関するDBとの照合に加えて、過去においてOCR等の文字認識エンジンで誤読の多かった文字の情報を記録した類似文字と照合する。これにより、誤読の発生しやすい文字を含んだ読取文字の候補の範囲を適切に広げ、劣後または候補洩れの可能性のある文字も候補とするとともに、名字と名前の判別処理を行ったうえで、候補文字の選別を行う。また、この類似文字は、文字の目視確認作業を通じて常に新しい類似文字情報が蓄積されうるものとすることで、文字認識の精度向上をねらう。
【0032】
本実施形態に係る業務端末200は、そのような所定の書面をデジタル化する業務に用いられる端末である。読取装置300は、スキャナーや撮像装置等であり、業務端末200からの指示に応じて所定の書面を画像等により読み取り、読み取った手書文字画像を業務端末200に受け渡す。
【0033】
当該業務では、業務端末200は、手書文字画像を受け取ると、OCRによりデジタル化して文字列情報へと変換し、変換した文字列を文字候補提案装置100に送信して文字候補提案装置100から案出された候補文字を受け取る。そして、業務端末200は、候補文字を選択的に表示し、利用者に選択された候補文字をデジタル化情報として利用する。
【0034】
なお、読取装置300は、スキャナーに限られるものではなく、カメラ付き携帯電話端末、カメラ付きタブレット端末等の画像をデータとして読込み可能な機器であってもかまわず、ネットワーク50を介して業務端末200と通信可能に接続される構成であってもよい。
【0035】
また、読取装置300は必須の装置ではなく、文字候補提案装置100または業務端末200がネットワーク50を介して他の装置から既に読取った画像データや文字認識を行ったデータを受信し、文字候補を提案するものであってもよい。
【0036】
図2は、手書文字識別システムの構成の例を示す図である。文字候補提案装置100は、記憶部110と、処理部120と、通信部130と、が互いにバス等で通信可能に接続される。
【0037】
記憶部110には、受領データ記憶部111と、実存文字記憶部112と、類似文字記憶部115と、候補文字記憶部116と、が含まれる。実存文字記憶部112には、実存する人名や固有名詞等の文字列が格納される。例えば、実存文字記憶部112には、名字記憶部113と、名前記憶部114と、が含まれる。例えば、日本人の名字は、30万種類以上あるといわれており、その実在が確認されている名字が名字記憶部113に格納される。
【0038】
図3は、受領データ記憶部のデータ構造例を示す図である。受領データ記憶部111には、受託日111Aと、依頼企業ID111Bと、文書番号111Cと、文字識別番号111Dと、認識文字コード111Eと、が含まれる。受託日111Aは、業務端末200から文字候補提案の依頼を受託した日を特定する情報である。依頼企業ID111Bは、文字候補提案を依頼した企業を特定する情報である。文書番号111Cは、文字候補提案の依頼対象となった文書(文書の画像データ)を特定する情報である。文字識別番号111Dは、認識対象の文書に含まれる個々の文字を特定する情報である。認識文字コード111Eは、個々の文字を外観から認識した結果得られた文字の文字コードである。
【0039】
図4は、名字記憶部のデータ構造例を示す図である。名字記憶部113には、名字識別子113Aと、名字113Bと、文字数113Cと、出現頻度113Dと、が含まれる。名字識別子113Aは、名字を他の名字から識別する情報である。名字113Bは、名字の表記情報である。文字数113Cは、名字の表記上の文字数である。出現頻度113Dは、名字の総体の中での出現頻度である。
【0040】
図5は、名前記憶部のデータ構造例を示す図である。名前記憶部114には、名前識別子114Aと、名前114Bと、文字数114Cと、出現頻度114Dと、が含まれる。名前識別子114Aは、名前を他の名前から識別する情報である。名前114Bは、名前の表記情報である。文字数114Cは、名前の表記上の文字数である。出現頻度114Dは、名前の総体の中での出現頻度である。
【0041】
図6は、類似文字記憶部のデータ構造例を示す図である。類似文字記憶部115には、文字コード115Aと、類似文字コード115Bと、出現頻度115Cと、記憶日115Dと、が含まれる。文字コード115Aは、互いに類似関係にある文字のうち基準とする文字のコードである。類似文字コード115Bは、文字コード115Aで特定される文字と外観上類似する文字のコードである。出現頻度115Cは、文字の使用において類似関係として出現する頻度である。記憶日115Dは、類似関係として記憶された日を特定する情報である。
【0042】
図7は、候補文字記憶部のデータ構造例を示す図である。候補文字記憶部116には、文字識別番号116Aと、候補文字コード116Bと、が含まれる。文字識別番号116Aは、認識対象の文書に含まれる個々の文字を特定する情報である。候補文字コード116Bは、OCRで認識された文字とは異なる文字候補であって、類似し、かつ実存する文字のコードである。
【0043】
処理部120には、受託処理部121と、姓名判別処理部122と、照合処理部123と、類似文字登録処理部124と、候補文字送信処理部125と、が含まれる。
【0044】
受託処理部121は、業務端末200からの文字候補の提案依頼を受託する。姓名判別処理部122は、複数の文字列の文字候補の提案を受けた場合に、姓名の区分位置を一文字ずつ変化させて区切った姓と名の組み合わせを特定し姓名として成立するか否か判別する。照合処理部123は、実存文字記憶部112と照合して、実存する文字候補であるか否かを判定する。類似文字登録処理部124は、未登録の類似関係として業務端末200から報告された文字を、類似文字記憶部115に登録する。候補文字送信処理部125は、照合処理部123による照合の結果ヒットした外観が類似する文字の候補の組み合わせを候補文字として出力する。具体的には、候補文字送信処理部125は、候補文字記憶部116に格納された候補を業務端末200に出力(送信)することで案出を実現する。通信部130は、ネットワーク50を介して他の装置と通信を行う。
【0045】
業務端末200は、記憶部210と、処理部220と、通信部230と、が互いにバス等で通信可能に接続される。
【0046】
記憶部210には、文字記憶部211と、候補文字記憶部212と、画像記憶部213と、が含まれる。
【0047】
図8は、文字記憶部のデータ構造例を示す図である。文字記憶部211には、画像データ番号211Aと、読取日211Bと、文字識別番号211Cと、画像211Dと、が含まれる。
【0048】
画像データ番号211Aは、読取装置300が読み取った文字列の画像を特定する情報である。読取日211Bは、読取装置300が文書を読み取った日を特定する情報である。文字識別番号211Cは、認識対象の文書に含まれる個々の文字を特定する情報である。画像211Dは、文字識別番号211Cで特定される文字単独の画像データ(読取装置300が読み取った画像の一部)を特定する情報である。
【0049】
図9は、画像記憶部のデータ構造例を示す図である。画像記憶部213には、画像データ番号213Aと、文書番号213Bと、読取日213Cと、画像213Dと、が含まれる。
【0050】
画像データ番号213Aは、読取装置300が読み取った文字列の画像を特定する情報である。文書番号213Bは、文字候補提案の依頼対象となった文書(文書の画像データ)を特定する情報である。読取日213Cは、読取装置300が文書を読み取った日を特定する情報である。画像213Dは、読取装置300が読み取った画像を特定する情報である。
【0051】
処理部220には、文字認識部221と、委託処理部222と、目視確認処理部223と、類似文字報告処理部224と、が含まれる。文字認識部221は、いわゆるOCRのエンジンであり、読取装置300から取得した手書文字画像を解析して文字を認識する。
【0052】
委託処理部222は、文字認識部221による誤読に起因する手戻りや手続の誤りを排除するために、文字候補提案装置100に精度の高い候補文字の提案を委託する。
【0053】
目視確認処理部223は、文字候補提案装置100から出力された文字候補のそれぞれを目視で確認できるように選択的に表示し、利用者から候補のいずれかの選択を受け付ける。
【0054】
類似文字報告処理部224は、利用者が類似する文字であると認識した文字の入力を受け付けて、文字候補提案装置100に類似文字として登録するよう報告する。
【0055】
通信部230は、ネットワーク50を介して他の装置と通信を行う。
【0056】
その他に、業務端末200は、図示しないが、利用者からの入力を受け付ける入力部と、画面や帳票等の各種出力情報を出力する出力部と、を備える。例えば、入力部は、タイピングやタッチ、フリック入力等の各種の接触入力、あるいは音声入力、または視線入力等の各種の入力を受け付ける。
【0057】
図10は、文字候補提案装置100のハードウェア構成例を示す図である。文字候補提案装置100は、いわゆるサーバー装置、ワークステーション、パーソナルコンピュータ、スマートフォンあるいはタブレット端末の筐体により実現されるハードウェア構成を備える。文字候補提案装置100は、演算装置101と、主記憶装置102と、補助記憶装置103と、通信装置104と、各装置をつなぐバス107と、を備える。業務端末200についても、同様である。また他に、業務端末200は、タッチパネルやキーボード、マイク、ディスプレイ等の入出力装置を備える。
【0058】
演算装置101は、例えばCPU(Central Processing Unit)などの演算装置である。
【0059】
主記憶装置102は、例えばRAM(Random Access Memory)などのメモリ装置である。
【0060】
補助記憶装置103は、デジタル情報を記憶可能な、いわゆるハードディスク(Hard Disk Drive)やSSD(Solid State Drive)あるいはフラッシュメモリなどの不揮発性記憶装置である。
【0061】
通信装置104は、ネットワークカード等の有線通信装置、あるいは無線通信装置である。
【0062】
上記した文字候補提案装置100の受託処理部121と、姓名判別処理部122と、照合処理部123と、類似文字登録処理部124と、候補文字送信処理部125とは、演算装置101に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置102、補助記憶装置103または図示しないROM装置内に記憶され、実行にあたって主記憶装置102上にロードされ、演算装置101により実行される。
【0063】
また、文字候補提案装置100の記憶部110は、主記憶装置102及び補助記憶装置103により実現される。また、通信部130は、通信装置104により実現される。以上が、文字候補提案装置100のハードウェア構成例である。
【0064】
文字候補提案装置100の構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、1つの構成要素がさらに多くの処理を実行するように分類することもできる。
【0065】
また、各処理部(受託処理部121と、姓名判別処理部122と、照合処理部123と、類似文字登録処理部124と、候補文字送信処理部125)は、それぞれの機能を実現する専用のハードウェア(ASIC、GPUなど)により構築されてもよい。また、各処理部の処理が一つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。
【0066】
次に、本実施形態における手書文字識別システム1の動作を説明する。
【0067】
図11は、手書文字認識の全体処理フローの例を示す図である。手書文字認識処理は、用者が業務端末200から開始を指示することにより起動される。
【0068】
まず、業務端末200は、読取装置300に文書の画像データの読取を要求する(ステップS10)。具体的には、文字認識部221は、読取装置300にスキャンあるいは撮影の開始を指示する。
【0069】
読取装置300は、業務端末200からの要求を受けて、当該文書の画像を読みとり、画像データを作成して業務端末200宛に応答する(ステップS11)。
【0070】
業務端末200の文字認識部221は、読取装置300から画像データを受領し、画像記憶部213に記憶し、OCRエンジンにて文字認識処理を実行する(ステップS12)。そして、認識した文字データを文字記憶部211に格納する(ステップS13)。なお、このOCRエンジンは、業務端末200が接続可能なネットワーク上に置かれているPC端末、サーバー端末等に実装され、業務端末200から文字認識処理を指示することで実行する構成であってもよい。
【0071】
そして、業務端末200では、認識した文字を委託処理部222が文字候補提案装置100に対して送信し、文字候補の提案処理を委託する(ステップS14)。
【0072】
そして、文字候補提案装置100の受託処理部121は、業務端末200から認識した文字を受領して受領データ記憶部111に格納する(ステップS15)。
【0073】
そして、照合処理部123が、受領した文字データを、実存文字記憶部112と、類似文字記憶部115と照合する(ステップS16)。
【0074】
そして、照合処理部123が、候補文字を選別し、候補文字記憶部116に格納する(ステップS17)。
【0075】
そして、候補文字送信処理部125が、候補文字を業務端末200あてに送信する(ステップS18)。
【0076】
業務端末200の委託処理部222は、候補文字を受領し、候補文字記憶部212に格納する(ステップS19)。
【0077】
そして、目視確認処理部223は、候補文字と画像記憶部の画像とを対比する画面を出力する(ステップS20)。より具体的には、例えば、当該画面には、読取装置300により読み取った手書文字画像と、その候補文字が選択入力可能なように複数表示される。
【0078】
利用者から類似文字の登録指示を受け付けると、類似文字報告処理部224は、候補文字以外に単文字で類似する文字があれば入力を受け付け、文字候補提案装置100へ応答する(ステップS21)。
【0079】
文字候補提案装置100の類似文字登録処理部124は、類似文字を受領し、類似文字記憶部115に未格納の場合には、格納する(ステップS22)。
【0080】
以上が、手書文字認識の全体処理フローの例である。手書文字認識の全体処理によれば、類似する文字列候補をより適切に提案することができる。
【0081】
図12は、姓名区分照合処理のフローの例を示す図である。姓名区分照合処理は、手書文字認識の全体処理フローの中のステップS16~S18の処理を一連として行う処理の例である。
【0082】
まず、姓名判別処理部122は、総文字数nを特定する(ステップS1601)。例えば、「小山田伸」の氏名が候補提示の対象となる文字列である場合には、姓名判別処理部122は、「小」「山」「田」「伸」の各漢字を一文字として、総文字数nを「4」と特定する。
【0083】
そして、姓名判別処理部122は、先頭からd(dは1以上n未満、初期値1)文字を名字として、残りの文字を名前とするように分解する(ステップS1602)。
【0084】
照合処理部123は、名字を構成する文字を一字ずつ分解して類似文字記憶部115と照合し、類似する文字の組み合わせを名字記憶部113と照合して実在する名字候補を選出する(ステップS1603)。
【0085】
そして、姓名判別処理部122は、類似文字記憶部115に該当した名字候補が無かったか否か判定する(ステップS1604)。名字候補が無かった場合(ステップS1604にて「Yes」の場合)には、姓名判別処理部122は、制御を後述するステップS1611へ進める。
【0086】
名字候補があった場合(ステップS1604にて「No」の場合)には、姓名判別処理部122は、当該名字候補には名字記憶部113に1つでも該当するものがあったか否か判定する(ステップS1605)。名字記憶部113に該当するものが無かった場合(ステップS1605にて「No」の場合)には、姓名判別処理部122は、制御を後述するステップS1611へ進める。
【0087】
名字候補に名字記憶部113に該当する名字があった場合(ステップS1605にて「Yes」の場合)には、姓名判別処理部122は、選出した全ての名字候補を一時保管する(ステップS1606)。
【0088】
そして、照合処理部123は、名前を構成する文字を一字ずつ分解して類似文字記憶部115と照合し、類似する文字の組み合わせを名前記憶部114と照合して実在する名前候補を選出する(ステップS1607)。
【0089】
そして、姓名判別処理部122は、類似文字記憶部115に該当した名前候補が無かったか否か判定する(ステップS1608)。名前候補が無かった場合(ステップS1608にて「Yes」の場合)には、姓名判別処理部122は、制御を後述するステップS1611へ進める。
【0090】
名前候補があった場合(ステップS1608にて「No」の場合)には、姓名判別処理部122は、当該名前候補には名前記憶部114に1つでも該当するものがあったか否か判定する(ステップS1609)。名前記憶部114に該当するものが無かった場合(ステップS1609にて「No」の場合)には、姓名判別処理部122は、制御を後述するステップS1611へ進める。
【0091】
名前候補に名前記憶部114に該当する名前があった場合(ステップS1609にて「Yes」の場合)には、姓名判別処理部122は、選出した全ての名前候補を一時保管する(ステップS1610)。
【0092】
そして、姓名判別処理部122は、名字の文字数dをインクリメント(+1)する(ステップS1611)。
【0093】
そして、姓名判別処理部122は、名字の文字数dが総文字数nと一致するか否か判定する(ステップS1612)。一致しない場合(ステップS1612にて「No」の場合)には、姓名判別処理部122は、制御をステップS1602に戻す。
【0094】
名字の文字数dが総文字数nと一致する場合(ステップS1612にて「Yes」の場合)には、姓名判別処理部122は、一時保管した名字候補および名前候補(名字長+名前長が総文字数nと一致するもの)の組があるか否か、すなわち結果としてヒットした姓名の組み合わせがあったか否か判定する(ステップS1613)。
【0095】
一時保管した名字候補および名前候補(名字長+名前長が総文字数nと一致するもの)の組がない場合(ステップS1613にて「No」の場合)には、候補文字送信処理部125は、業務端末200に対して、判別不能を通知する(ステップS1614)。
【0096】
一時保管した名字候補および名前候補(名字長+名前長が総文字数nと一致するもの)の組がある場合(ステップS1613にて「Yes」の場合)には、候補文字送信処理部125は、業務端末200に対して、文字候補を送信する(ステップS1801)。その際、候補文字送信処理部125は、一時保管した名字候補および名前候補の組ごとに、出現頻度の順に応じて整列させて送信する。すなわち、候補文字送信処理部125は、出現頻度の高い文字から構成されている名字候補および名前候補の順に送信する。
【0097】
以上が、姓名区分照合処理のフローの例である。姓名区分照合処理によれば、一以上の文字からなる氏名について、姓名の区分位置を変えてそれぞれの類似文字を当てはめ、実存する候補を特定することができる。例えば、上記の「小山田伸」の氏名の場合、「田」と「由」が類似文字であり、二文字の名字「小山」と残り部分の名前「由伸」とする候補と、三文字の名字「小山田」と残り部分の名前「伸」とする候補と、を含む候補文字を特定できる。
【0098】
図13は、候補文字受領処理のフローの例を示す図である。候補文字受領処理は、手書文字認識の全体処理フローの中のステップS19~S21の処理を一連として行う処理の例である。
【0099】
まず、委託処理部222は、受領した候補文字を候補文字記憶部212に記憶させる(ステップS191)。
【0100】
そして、目視確認処理部223は、候補文字と手書文字画像を確認表示する(ステップS201)。この確認表示の画面例については、後述する。
【0101】
そして、目視確認処理部223は、候補文字の選択入力を受け付ける(ステップS202)。これにより、手書文字のデジタル化を確定する。
【0102】
また、類似文字報告処理部224は、新しい類似文字の入力があるか否か判定する(ステップS211)。新しい類似文字の入力がない場合(ステップS211にて「No」の場合)には、類似文字報告処理部224は、候補文字受領処理を終了させる。
【0103】
新しい類似文字の入力がある場合(ステップS211にて「Yes」の場合)には、類似文字報告処理部224は、文字候補提案装置100に対して新たな類似文字となる情報を送信する(ステップS212)。
【0104】
以上が、候補文字受領処理のフローの例である。候補文字受領処理によれば、文字候補提案装置100から候補文字を受領して、手書文字と対比しながら候補を選択入力可能となる。また、類似文字に気づいた場合に、文字候補提案装置100へ報告し、新たに類似文字として登録するよう依頼することができる。
【0105】
図14は、類似文字登録処理のフローの例を示す図である。類似文字登録処理は、候補文字受領処理において類似文字となる情報が業務端末200から文字候補提案装置100に送信された場合に、文字候補提案装置100にて開始される。
【0106】
まず、類似文字登録処理部124は、受領した類似文字の情報が、類似文字記憶部115に既に記憶されているか否か判定する(ステップS2201)。
【0107】
受領した類似文字の情報が、類似文字記憶部115に既に記憶されていない場合(ステップS2201にて「No」の場合)には、類似文字登録処理部124は、類似文字の組み合わせを一対一に特定する(類似関係にある文字を一対一の組み合わせに分解する)(ステップS2202)。
【0108】
そして、類似文字登録処理部124は、互いに類似する文字の両方について、それぞれ互いを類似として類似文字記憶部115に格納する(ステップS2203)。
【0109】
受領した類似文字の情報が、類似文字記憶部115に既に記憶されている場合(ステップS2201にて「Yes」の場合)には、類似文字登録処理部124は、業務端末200に、登録済みである旨を通知する(ステップS2204)。
【0110】
そして、類似文字登録処理部124は、互いに類似する文字の両方について、それぞれ互いの出現頻度を所定量増加させる(ステップS2205)。
【0111】
以上が、類似文字登録処理のフローの例である。類似文字登録処理によれば、業務端末200から登録するよう依頼のあった類似文字が新たな関係であれば類似として登録し、既に登録済みのものであった場合には出現頻度を高めることができる。
【0112】
図15は、候補提示画面の例を示す図である。候補提示画面400は、手書文字認識全体処理フローのステップS20、候補文字受領処理のステップS201にて出力される画面である。目視確認を行う元データ(読取装置300で読み取った手書文字画像)が、元データ表示域401に表示され、目視確認を行う対象である候補文字は、名字候補表示域402と、名前候補表示域403に表示される。名字候補表示域402と、名前候補表示域403には、文字候補提案装置100が最も出現率が高い候補として提案した候補文字が表示される。名字候補決定ボタン404は、入力を受け付けると、名字候補表示域402に示された名字を確定させる。名前候補決定ボタン405は、入力を受け付けると、名前候補表示域403に示された名前を確定させる。
【0113】
次候補以降の候補文字は、各々、名字次候補表示域406と、名前次候補表示域407と、に出現頻度順に整列されて選択可能にリスト表示される。名字次候補表示域406と、名前次候補表示域407とは、リストした文字の選択を受け付ける。名字次候補決定ボタン408は、入力を受け付けると、名字次候補表示域406にて選択された名字を確定させる。名前次候補決定ボタン409は、入力を受け付けると、名前次候補表示域407にて選択された名前を確定させる。
【0114】
類似文字登録域410および類似文字登録域411は、それぞれ文字の入力を受け付ける。登録ボタン412は、入力を受け付けると、類似文字登録域410および類似文字登録域411に入力された文字を類似関係にある文字として受け付け、文字候補提案装置100への登録処理を開始させる。すなわち、目視確認の結果、目視作業担当者(利用者)が新たな類似文字として登録の必要性を感じる文字がある場合、類似文字登録域410および類似文字登録域411に当該文字を入力し、登録ボタン412を選択することで登録が可能となる。また、必要に応じて、戻るボタン413、次画面ボタン414への入力を受け付けると、前後の業務画面へ遷移する。
【0115】
図16は、名字候補提示例を示す図である。本実施形態を適用した手書文字識別システム1では、読取装置300および文字認識部221が誤読した場合でも、提示される候補に正解となる文字が含まれる可能性が高くなるが、このことを具体的に示す。
【0116】
正解となる「川本」(a)の名字を、OCR等の文字認識エンジンが「小木」(b)と誤読した場合、誤読である「小木」(b)に対して実存する名字との照合を行うと、本来の正解となる「川本」(a)の文字候補の順位が劣後、または候補漏れが生じる可能性がある。
【0117】
誤読である「小木」(b)を、「小」(c)と「木」(d)に文字を分解し、各々を類似文字記憶部115と照合し、それぞれ出現頻度の高い順に類似文字を特定する(e、f)。続いて、出現頻度の高い文字同士を合成した名字と、名字記憶部113とを照合することによって、候補文字(g)を選別して整列させる。これにより、誤読があった場合も、類似文字記憶部115との照合を実行することで、正解である「川本」(a)の劣後、または候補漏れを避けるとともに、文字認識率の向上が期待できる。
【0118】
以上が、実施形態に係る手書文字識別システムの例である。該実施形態に係る手書文字識別システムの例によれば、手書文字を読み取った画像について、類似する文字列候補をより適切に提案することができるため、利用者は提示された候補から選択するだけで円滑に手書文字の読取業務を行うことができる。
【0119】
また、上記実施形態の例では、手書文字の対象として氏名を例示したが、これに限られず、照合する実存文字記憶部112を差し替えることによって、住所等、あらゆる他の文字データについても適用が可能である。
【0120】
また、上記した実施形態の技術的要素は、単独で適用されてもよいし、プログラム部品とハードウェア部品のような複数の部分に分けられて適用されるようにしてもよい。
【0121】
以上、本発明について、実施形態を中心に説明した。
【符号の説明】
【0122】
1・・・手書文字識別システム、50・・・ネットワーク、100・・・文字候補提案装置、110・・・記憶部、111・・・受領データ記憶部、112・・・実存文字記憶部、113・・・名字記憶部、114・・・名前記憶部、115・・・類似文字記憶部、116・・・候補文字記憶部、120・・・処理部、121・・・受託処理部、122・・・姓名判別処理部、123・・・照合処理部、124・・・類似文字登録処理部、125・・・候補文字送信処理部、130・・・通信部、200・・・業務端末、210・・・記憶部、211・・・文字記憶部、212・・・候補文字記憶部、213・・・画像記憶部、220・・・処理部、221・・・文字認識部、222・・・委託処理部、223・・・目視確認処理部、224・・・類似文字報告処理部、230・・・通信部、300・・・読取装置。