(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025005939
(43)【公開日】2025-01-17
(54)【発明の名称】情報処理装置、文字検索プログラムおよび文字検索方法
(51)【国際特許分類】
G06F 16/9032 20190101AFI20250109BHJP
【FI】
G06F16/9032
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023106397
(22)【出願日】2023-06-28
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】山下 拡
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA10
5B175GC01
(57)【要約】
【課題】文字を容易に特定する。
【解決手段】情報処理装置1は、文字と文字を構成する部品とを対応づけて記憶する辞書DB23と、形が類似する部品をグループ化した異体部品DB24と、文字検索結果に含まれる異体字から特定の文字を選択する際に、異体字から指定された文字と、指定された文字を構成する複数の部品の中から指定された着目部品とを受け付け、指定された文字に関する異体字であって、指定された文字の着目部品の箇所を、異体部品DB24を基に別の部品に入れ替えた異体字を、辞書DB23を用いて検索する。そして、情報処理装置1は、検索された異体字を提示する。かかる情報処理装置1は、例えば、手書きされた漢字などの文字の選定に適用することができる。
【選択図】
図2
【特許請求の範囲】
【請求項1】
文字と前記文字を構成する部品とを対応づけて記憶する辞書DBと、
形が類似する部品をグループ化した部品DBと、
文字検索結果に含まれる異体字から特定の文字を選択する際に、前記異体字から指定された文字と、前記指定された文字を構成する複数の部品の中から指定された着目部品とを受け付ける受付部と、
前記指定された文字に関する異体字であって、前記指定された文字の前記着目部品の箇所を、前記部品DBを基に別の部品に入れ替えた異体字を、前記辞書DBを用いて検索する検索部と、
前記検索部によって検索された異体字を提示する提示部と、
を有することを特徴とする情報処理装置。
【請求項2】
前記検索部は、
前記部品DBから前記着目部品を含むグループを取得し、
前記指定された文字の前記着目部品の箇所を、該取得されたグループに属する部品に入れ替えた検索条件を生成し、
前記辞書DBを用いて、該生成された検索条件に一致する異体字を検索する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記文字検索結果は、手書き文字を入力として形が類似する文字を検索した結果であることを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記文字検索結果は、文字を構成する部品を入力として当該部品を含む文字を検索した結果である、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項5】
文字検索結果に含まれる異体字から特定の文字を選択する際に、前記異体字から指定された文字と、前記指定された文字を構成する複数の部品の中から指定された着目部品とを受け付け、
前記指定された文字に関する異体字であって、形が類似する部品をグループ化した部品DBを基に、前記指定された文字の前記着目部品の箇所を入れ替えた異体字を、文字と前記文字を構成する部品とを対応づけて記憶する辞書DBを用いて検索し、
該検索された異体字を提示する、
処理をコンピュータに実行させる文字検索プログラム。
【請求項6】
文字検索結果に含まれる異体字から特定の文字を選択する際に、前記異体字から指定された文字と、前記指定された文字を構成する複数の部品の中から指定された着目部品とを受け付け、
前記指定された文字に関する異体字であって、形が類似する部品をグループ化した部品DBを基に、前記指定された文字の前記着目部品の箇所を入れ替えた異体字を、文字と前記文字を構成する部品とを対応づけて記憶する辞書DBを用いて検索し、
該検索された異体字を提示する、
処理をコンピュータが実行する文字検索方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置などに関する。
【背景技術】
【0002】
自治体の職員は、住民の手書きの提出書類を自治体のシステムへ入力する業務を行っている。かかる業務では、職員が、例えば転入届などに手書きで記載された氏名や住所を、PC(Personal Computer)上の文字検索アプリを用いて自治体のシステムへ入力し記録する。その際、氏名や住所に含まれる見慣れない文字が存在する場合には、職員は、文字検索アプリを用いて、所属する自治体のシステムの文字セットから検索する。文字セットは、各自治体のシステム毎に個々に存在する。文字検索アプリは、文字セットから文字を検索できる場合には、検索される文字をシステムへ入力する。一方、文字検索アプリは、文字セットから文字を検索できない場合には、外字として文字セットへ新規登録する。
【0003】
ところが、政府の業務標準化政策に伴い、全自治体が使うそれぞれの文字セットは、標準化される。このため、標準化される文字セットには、類似する字形の文字が大量に含まれる。そして、標準化後は、各自治体で新しい外字を登録することは禁止される。したがって、職員は、標準の文字セットにない文字があった場合には、標準の文字セットの中で一番類似する文字を探し、入力することになる。
【0004】
文字検索アプリには、例えば、Interstage Charset Managerというアプリケーションが知られている。かかる文字検索アプリは、手書き文字検索機能や、文字の構成要素(文字部品)を指定して検索する文字部品検索機能を持つ。手書き文字検索機能は、ユーザがマウスなどで字形を描くと、描かれた字形に近い文字を検索し、検索された文字集合を出力する。また、文字部品検索機能は、ユーザが文字の構成要素(文字部品)を指定すると、指定された文字の構成要素を持つ文字集合を出力する。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2016-218842号公報
【特許文献2】特開2011-209814号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、従来技術では、システムへ入力する文字の特定が難しいという問題がある。
【0007】
例えば、手書き文字検索機能については、ユーザは、標準化前の文字セットであれば、手書き文字検索の結果のみで、部品が類似する文字一覧からシステムへ入力する文字を選択できる。ところが、標準化後の文字セットでは、類似する文字が大量にヒットしてしまい、着目部品の箇所だけが差異のある文字を選別することが難しい。この結果、システムへ入力する文字の特定が難しい。
【0008】
また、文字部品検索機能については、ユーザが文字部品検索を使って、着目部品のみ様々なバリエーションを持つ文字部品条件を指定して絞り込めば検索することができる。ところが、文字部品は大量にあるので、ユーザが着目部品に類似する文字部品がどれだけあるのかを把握し、漏れなく指定するのは困難である。特に、文字知識が少ない職員が指定するのは現実的ではない。
【0009】
なお、上記課題は、自治体の業務だけではなく、官庁、金融、文教、流通などの漢字で氏名や住所を入力する業務全般にも同様に生じる課題である。
【0010】
本発明は、1つの側面では、システムへ入力する文字を容易に特定することを目的とする。
【課題を解決するための手段】
【0011】
1つの態様では、情報処理装置は、文字と前記文字を構成する部品とを対応づけて記憶する辞書DBと、形が類似する部品をグループ化した部品DBと、文字検索結果に含まれる異体字から特定の文字を選択する際に、前記異体字から指定された文字と、前記指定された文字を構成する複数の部品の中から指定された着目部品とを受け付ける受付部と、前記指定された文字に関する異体字であって、前記指定された文字の前記着目部品の箇所を、前記部品DBを基に別の部品に入れ替えた異体字を、前記辞書DBを用いて検索する検索部と、前記検索部によって検索された異体字を提示する提示部と、を有する。
【発明の効果】
【0012】
1実施態様によれば、システムへ入力する文字の特定が容易に行える。
【図面の簡単な説明】
【0013】
【
図1】
図1は、実施例に係る情報処理装置の機能構成の一例を示す図である。
【
図2】
図2は、実施例に係る文字検索処理の流れの一例を示す図である。
【
図3】
図3は、実施例に係る文字字形DBの一例を示す図である。
【
図4】
図4は、実施例に係る部品字形DBの一例を示す図である。
【
図5】
図5は、実施例に係る辞書DBの一例を示す図である。
【
図6】
図6は、実施例に係る異体部品DBの一例を示す図である。
【
図7】
図7は、実施例に係る文字検索の画面例を示す図である。
【
図8A】
図8Aは、実施例に係る検索条件生成処理の一例を示す図(1)である。
【
図8B】
図8Bは、実施例に係る検索条件生成処理の一例を示す図(2)である。
【
図9】
図9は、実施例に係る検索結果の表示例を示す図である。
【
図10】
図10は、実施例に係る文字検索処理のフローチャートの一例を示す図である。
【
図11】
図11は、文字検索プログラムを実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
【0014】
以下に、本願の開示する情報処理装置、文字検索プログラムおよび文字検索方法の実施例を図面に基づいて詳細に説明する。なお、本発明は、実施例により限定されるものではない。
【0015】
まず、従来の文字検索アプリについて説明する。文字検索アプリは、手書き文字検索機能や、文字の構成要素(文字部品)を指定して検索する文字部品検索機能を持つ。
【0016】
図12は、手書き文字検索の参考例を示す図である。
図12に示すように、手書き文字検索機能は、ユーザがマウスなどで文字を描いた字形を入力すると、入力された字形に近い文字を検索し、検索結果として文字集合を出力する。すなわち、手書き文字検索機能は、手書きの文字と形が類似した文字集合を出力する。
【0017】
図13Aは、文字部品検索の参考例を示す図(1)である。
図13Aに示すように、文字部品検索機能は、ユーザが検索したい文字を構成する文字部品を入力すると、入力された文字部品を持つ文字集合を出力する。例えば、ユーザが各文字部品を1つずつ文字部品リストから指定する。文字部品検索機能は、指定された各文字部品を持つ文字を辞書DBから抽出し、抽出された文字集合を出力する。
【0018】
ここで、ユーザは、手書き書類の中の文字に形が曖昧な文字部品がある場合、その文字部品のみが形の似た別部品に入れ替わった文字集合の一覧を表示し、一覧の中から最も適した文字を選定したい場合がある。かかる場合には、ユーザが文字部品検索機能を使って着目部品のみ様々なバリエーションを持つ部品検索条件を生成し、生成された部品検索条件で絞り込めば、検索することができる。
図13Bは、文字部品検索の参考例を示す図(2)である。
図13Bに示すように、手書き書類の文字に形が曖昧な文字部品(符号a0)があるとする。すると、ユーザは、曖昧な文字部品を着目部品として着目部品を入れ替えた部品検索条件を生成する。そして、文字部品検索機能は、生成された部品検索条件で文字を検索し、文字集合を出力する。
【0019】
図12で示した手書き文字検索機能について、ユーザは、標準化前の文字セットであれば、手書き文字検索の結果のみで、部品が類似する文字集合からシステムへ入力する文字を選択できる。ところが、標準化後の文字セットでは、類似する文字が大量にヒットしてしまい、着目部品の箇所だけが差異ある文字を選別することが難しい。
【0020】
図13Bで示した文字部品検索機能について、ユーザが、文字部品リストから1つずつ指定し、着目部品の箇所のみバリエーションを持つ部品検索条件を生成して、生成された部品検索条件で絞り込み検索することができる。ところが、文字部品は大量にあるので、ユーザが着目部品に類似する文字部品がどれだけあるのかを把握し、漏れなく指定するのは困難であり、着目部品の箇所だけが差異ある文字を選別することが難しい。
【0021】
そこで、以降の実施例では、システムへ入力する文字を容易に特定することが可能な文字検索手法について説明する。
【実施例0022】
図1は、実施例に係る情報処理装置の機能構成の一例を示す図である。
図1に示す情報処理装置1は、文字検索結果に含まれる異体字から指定される文字と、指定される文字を構成する複数の部品(構成要素)の中から指定される着目部品とを受け付ける。そして、情報処理装置1は、指定される文字に関する異体字であって、着目部品の箇所を類似する部品で入れ替えた異体字を検索する。ここでいう異体字とは、字形が似ている異なる文字のことをいう。なお、文字検索結果は、手書き文字検索の結果であっても良いし、文字の部品(構成要素)を指定して検索する文字部品検索の結果であっても良い。以降では、文字検索結果を手書き文字検索の結果として説明する。
【0023】
ここで、情報処理装置1が行う文字検索について、
図2を参照して説明する。
図2は、実施例に係る文字検索処理の流れの一例を示す図である。
図2に示すように、情報処理装置1は、手書き文字検索で、対象の文字を検索する(<1>)。ここでは、ユーザが、マウスなどの手書きで、読みが「なべ」である対象の文字(漢字)を入力する。すると、情報処理装置1は、入力された文字の字形に近い文字を検索し、文字検索結果を出力する。
【0024】
情報処理装置1は、文字検索結果に含まれる異体字からユーザによって指定される文字を受け付けると、指定された文字を構成する複数の部品(構成要素)を出力する(<2>)。ユーザは、複数の部品(構成要素)の中から着目したい部品(以降、着目部品という)を指定する(<3>)。ここでは、ユーザは、複数の部品(構成要素)の中から着目部品として「ハ」を指定する。
【0025】
そして、情報処理装置1は、形が類似した部品をグループ化した異体部品DBを参照し、指定された着目部品に形が類似した異体部品のグループを抽出する。ここでは、着目部品「ハ」に対応する異体部品グループには、3つの部品「ハ」,「ル」,「八」が含まれる。そして、情報処理装置1は、着目部品を異体部品グループの部品に入れ替えた部品検索条件を生成する(<4>)。ここでは、情報処理装置1は、「ハ」を異体部品グループのそれぞれの部品に入れ替えた文字部品の検索条件を3パターン生成する。
【0026】
そして、情報処理装置1は、部品検索条件をORでつないで文字部品検索を行う(<5>)。そして、情報処理装置1は、文字部品検索による絞込み結果を提示する(<6>)。この結果、ユーザは、提示された検索結果からシステムへ入力する文字を選定することが可能になる。すなわち、形が曖昧な文字部品がある場合、情報処理装置1は、この文字部品に着目して、着目部品だけを形の似た別の部品に入れ替えた文字集合を検索して提示することで、最も適した文字をユーザに選定させることが可能になる。
【0027】
図1に戻って、情報処理装置1は、制御部10と、記憶部20とを有する。制御部10は、文字検索部11、着目部品受付部12、検索条件生成部13、文字部品検索部14および提示部15を有する。記憶部20は、文字字形DB21、部品字形DB22、辞書DB23および異体部品DB24を有する。なお、辞書DB23は、辞書DBの一例である。異体部品DB24は、部品DBの一例である。着目部品受付部12は、受付部の一例である。検索条件生成部13および文字部品検索部14は、検索部の一例である。提示部15は、提示部の一例である。
【0028】
文字字形DB21は、文字毎に各文字の字形を記憶する。ここで、文字字形DB21の一例を、
図3を参照して説明する。
図3は、実施例に係る文字字形DBの一例を示す図である。
図3に示すように、文字字形DB21は、字形ID(IDentifier)と字形画像データとを対応付けて記憶する。字形IDは、字形を一意に識別する識別子である。字形画像データは、字形IDに対応する字形の画像データである。
【0029】
図1に戻って、部品字形DB22は、部品毎に各部品の字形を記憶する。ここで、部品字形DB22の一例を、
図4を参照して説明する。
図4は、実施例に係る部品字形DBの一例を示す図である。
図4に示すように、部品字形DB22は、部品IDと部品字形画像データとを対応付けて記憶する。部品IDは、部品を一意に識別する識別子である。部品字形画像データは、部品IDに対応する部品字形の画像データである。
【0030】
図1に戻って、辞書DB23は、文字と、文字を構成する部品(構成要素)とを対応づけて記憶する。ここで、辞書DB23の一例を、
図5を参照して説明する。
図5は、実施例に係る辞書DBの一例を示す図である。
図5に示すように、辞書DB23は、字形ID、よみ、画数、部首および部品IDsを対応付けて記憶する。字形IDは、字形を一意に識別する識別子であり、文字字形DB21の字形IDに対応する。「よみ」は、字形IDに対応する字形の文字(漢字)の読み方である。部首は、字形IDに対応する字形の文字(漢字)を分類する際に用いられるものである。部首は、例えば、偏や冠など、漢字の一部分を用いる。部品IDsは、字形IDに対応する字形の文字(漢字)を構成する部品群の部品IDを示す。部品IDsは、部品字形DB22に記憶される部品IDの集合である。なお、部品IDsの欄外には、部品IDに対応する部品字形画像データが補足として表されている。
【0031】
図1に戻って、異体部品DB24は、形が類似した部品をグループ化した情報を記憶する。ここで、異体部品DB24の一例を、
図6を参照して説明する。
図6は、実施例に係る異体部品DBの一例を示す図である。
図6に示すように、異体部品DB24は、部品GIDと、部品IDsとを対応付けて記憶する。なお、部品IDsの欄外には、部品IDに対応する部品字形画像が補足として表わされている。部品GIDは、部品グループを一意に識別する識別子である。部品GIDに対応する部品グループには、形が類似した部品が複数含まれる。部品IDsは、部品GIDに対応する部品グループに含まれる部品群の部品IDを示す。部品IDsは、部品字形DB22に記憶される部品IDの集合である。
【0032】
図1に戻って、文字検索部11は、対象の文字を検索する。例えば、文字検索部11は、手書きで入力された文字を受け付ける。文字検索部11は、受け付けた手書きの文字の字形に近い文字を、文字字形DB21を用いて検索する。加えて、文字検索部11は、文字検索結果の文字を構成する部品を、辞書DB23および部品字形DB22を用いて取得する。そして、文字検索部11は、検索された文字の字形画像データと、文字を構成する部品の字形画像データとを対応付けた文字検索結果を出力する。文字検索結果の検索される文字は、異体字であり、字体が異なる。なお、文字検索部11による文字検索処理は、例えば、Interstage Charset Managerの文字検索アプリの文字検索機能を用いて実施されれば良い。
【0033】
着目部品受付部12は、着目部品の指定を受け付ける。例えば、着目部品受付部12は、文字検索結果の複数の文字から指定された着目する文字と、着目する文字を構成する複数の部品の中から指定された着目部品を受け付ける。そして、着目部品受付部12は、辞書DB23から、着目する文字の部品IDsと、着目部品の部品IDとを取得する。
【0034】
検索条件生成部13は、部品検索条件を生成する。例えば、検索条件生成部13は、異体部品DB24から、着目部品の字形が類似する部品のグループを取得する。検索条件生成部13は、着目する文字についての着目部品の箇所を、取得されたグループに含まれる部品に入れ替えた部品検索条件を生成する。一例として、検索条件生成部13は、異体部品DB24から、着目部品の部品IDを部品IDsに含んでいる部品GIDおよび部品IDsを取得する。検索条件生成部13は、着目する文字の部品IDsに含まれる着目部品の部品IDを、部品GIDの部品IDsに含まれる部品IDに入れ替えた部品検索条件式を生成する。検索条件生成部13は、部品GIDの部品IDsに含まれる全ての部品IDについて、部品検索条件式を生成する。
【0035】
文字部品検索部14は、文字部品検索を実施する。例えば、文字部品検索部14は、検索条件生成部13によって生成された複数の部品検索条件式をORでつないだ検索条件式を生成する。そして、文字部品検索部14は、生成された検索条件式を用いた文字部品検索を行う。一例として、文字部品検索部14は、辞書DB23から、検索条件式に一致する部品IDsを持つ字形IDの集合を検索する。
【0036】
提示部15は、検索結果を提示する。例えば、提示部15は、文字部品検索部14によって文字部品検索がされた検索結果を表示する。一例として、提示部15は、文字字形DB21を用いて、取得された字形IDの集合に対応する字形画像データを取得する。そして、提示部15は、取得された字形画像データを表示する。
【0037】
[文字検索の画面例]
ここで、文字検索部11が実施する文字検索の画面例を、
図7を参照して説明する。
図7は、実施例に係る文字検索の画面例を示す図である。
図7には、文字検索を行う際の画面G0が表されている。なお、
図7では、ユーザが、よみが「なべ」である、手書きの文字b0を入力した場合である。
【0038】
文字検索部11は、手書きで入力された文字b0を受け付けると、受け付けた文字b0の字形に近い文字を、文字字形DB21を用いて検索する。加えて、文字検索部11は、文字検索結果の文字を構成する部品を、辞書DB23および部品字形DB22を用いて取得する。検索される文字は、字体が異なる異体字であり、いずれかの部品が異なる。そして、文字検索部11は、文字検索結果の文字に対する読み、部首、画数などを辞書DB23から取得する。そして、文字検索部11は、検索された文字の字形などと、文字を構成する部品の字形とを対応付けた文字検索結果を出力する。ここでは、文字の字形は、符号b1の各行に示される。文字を構成する部品の字形は、符号b2の各行に示される。そして、読み、部首、画数が、文字の字形に対応付けて示されている。なお、基盤コードは、各行を一意に識別するために用いられるコードである。
【0039】
そして、ユーザは、着目する文字と、着目する文字を構成する複数の部品の中から着目部品を指定する。ここでは、着目する文字として符号b3の行の文字「邊」が指定される。着目部品として符号b4で示される部品「ハ」が指定される。
【0040】
[検索条件生成処理の一例]
ここで、検索条件生成部13が行う検索条件生成処理について、
図8Aおよび
図8Bを参照して説明する。
図8Aおよび
図8Bは、実施例に係る検索条件生成処理の一例を示す図である。
【0041】
図8Aに示すように、着目部品受付部12は、字形IDが「1」を示す着目する文字と、着目する文字を構成する着目部品「ハ」とを受け付ける。そして、着目部品受付部12は、辞書DB23および部品字形DB22から、着目する文字の部品IDsと、着目部品の部品IDとを取得する。ここでは、着目する文字の部品IDsは、文字ID「1」に対応する「1,2,3,5,8」である(符号b10)。着目部品の部品IDは、「ハ」に対応する「8」であるとする(符号b11)。
【0042】
検索条件生成部13は、異体部品DB24から、着目部品の字形が類似する部品のグループを取得する。ここでは、着目部品の部品IDが「8」であるので、検索条件生成部13は、異体部品DB24から、着目部品の部品ID「8」を含んでいる部品GID「2」および部品IDs「4,6,8」を取得する(符号b12)。
【0043】
図8Bに示すように、検索条件生成部13は、着目する文字の部品IDsに含まれる着目部品の部品IDを、部品GIDの部品IDsに含まれる部品IDに入れ替えた部品検索条件式を生成する。ここでは、着目する文字の部品IDsは、「1,2,3,5,8」である。着目部品の部品IDは、「8」である。そこで、検索条件生成部13は、着目する文字の部品IDs「1,2,3,5,8」に含まれる部品ID「8」の着目部品「ハ」を、部品GID「2」の部品IDs「4,6,8」に含まれる部品ID「4」の部品「ル」に入れ替えた「1,2,3,5,4」の部品検索条件式を生成する。同様に、検索条件生成部13は、着目する文字の部品IDs「1,2,3,5,8」に含まれる部品ID「8」の着目部品「ハ」を、部品GID「2」の部品IDs「4,6,8」に含まれる部品ID「6」の部品「八」に入れ替えた「1,2,3,5,6」の部品検索条件式を生成する。
【0044】
そして、文字部品検索部14は、検索条件生成部13によって生成された複数の部品検索条件式をORでつないだ検索条件式を生成する。
【0045】
その後、文字部品検索部14は、辞書DB23から、検索条件式に一致する部品IDsを持つ字形IDの集合を検索する。ここでは、文字部品検索部14は、辞書DB23から、検索条件式に一致する部品IDsとして「1,2,3,5,8」,「1,2,3,5,4」および「1,2,3,5,6」を持つ字形IDの集合を検索する。
【0046】
[検索結果の表示例]
図9は、実施例に係る検索結果の表示例を示す図である。
図9には、
図8Aおよび
図8Bで説明した検索条件生成処理によって生成された検索条件式で検索された検索結果G1が表されている。つまり、着目する文字の中の着目部品「ハ」のみの形が類似した別の部品に入れ替わった文字集合が表されている。ここでは、部品IDsが「1,2,3,5,8」の文字は、上段で示される文字であり、着目する文字である。そして、符号b21で示される部品は、着目部品「ハ」である。部品IDsが「1,2,3,5,4」の文字は、中段で示される文字である。そして、符号b22で示される部品は、着目部品に形が類似する部品「ル」である。部品IDsが「1,2,3,5,6」の文字は、下段で示される文字である。そして、符号b23で示される部品は、着目部品に形が類似する部品「八」である。
【0047】
これにより、例えば、手書き文字に形が曖昧な文字部品がある場合、提示部15は、その文字部品のみを形の似た別部品に入れ替えた文字集合を表示する。この結果、ユーザは、システムへ入力する文字の特定を容易に行える。
【0048】
[文字検索処理のフローチャート]
ここで、情報処理装置1が行う文字検索処理のフローチャートを、
図10を参照して説明する。
図10は、実施例に係る文字検索処理のフローチャートの一例を示す図である。
【0049】
図10に示すように、まず、情報処理装置1は、検索が依頼されたか否かを判定する(ステップS11)。例えば、情報処理装置1は、手書き文字検索の依頼を受けたか否かを判定する。
【0050】
検索が依頼されていないと判定した場合には(ステップS11;No)、情報処理装置1は、検索が依頼されるまで、判定処理を繰り返す。検索が依頼されたと判定した場合には(ステップS11;Yes)、情報処理装置1は、検索条件を取得する(ステップS12)。例えば、情報処理装置1は、手書きで入力された文字を検索条件として取得する。
【0051】
情報処理装置1は、検索条件を用いて文字を検索する(ステップS13)。例えば、情報処理装置1は、手書きで入力された文字の字形に近い文字を、文字字形DB21を用いて検索する。そして、情報処理装置1は、検索結果を生成する(ステップS14)。例えば、情報処理装置1は、文字字形DB21より、検索できた字形画像データおよび字形IDを取得する。加えて、情報処理装置1は、辞書DB23より、字形IDに対応する属性情報(よみ、画数、部首、部品IDs)を取得する。そして、情報処理装置1は、部品字形DB22より、部品IDsの各部品IDに対応する部品字形画像データを取得する。
【0052】
そして、情報処理装置1は、生成された検索結果を表示する(ステップS15)。例えば、情報処理装置1は、文字の字形画像データ、文字を構成する部品の部品字形画像データおよび属性情報を対応付けた検索結果を表示する。
【0053】
続いて、情報処理装置1は、着目情報が指定されたか否かを判定する(ステップS16)。ここでいう着目情報とは、着目する文字と、着目する文字を構成する複数の部品の中から指定される着目部品のことをいう。着目情報が指定されないと判定した場合には(ステップS16;No)、情報処理装置1は、着目情報が指定されるまで、判定処理を繰り返す。一方、着目情報が指定されたと判定した場合には(ステップS16;Yes)、情報処理装置1は、着目情報に対応する異体部品グループを取得する(ステップS17)。例えば、情報処理装置1は、異体部品DB24から、着目部品の部品IDを部品IDsに含んでいる部品GIDおよび部品IDsを取得する。
【0054】
そして、情報処理装置1は、異体部品グループに含まれる部品を選択する(ステップS18)。例えば、情報処理装置1は、部品GIDに対応する部品IDsに含まれる部品IDが示す部品を選択する。
【0055】
そして、情報処理装置1は、選択した部品の検索条件を生成する(ステップS19)。例えば、情報処理装置1は、着目する文字の部品IDsに含まれる着目部品の部品IDを、選択した部品IDに入れ替えた部品検索条件式を生成する。そして、情報処理装置1は、選択した部品の検索条件をORで連結する(ステップS20)。例えば、情報処理装置1は、部品検索条件式をORでつないだ検索条件式を生成する。
【0056】
そして、情報処理装置1は、異体部品グループに含まれる部品を全て選択したか否かを判定する(ステップS21)。異体部品グループに含まれる部品を全て選択していないと判定した場合には(ステップS21;No)、情報処理装置1は、次の部品を選択すべく、ステップS18に移行する。
【0057】
一方、異体部品グループに含まれる部品を全て選択したと判定した場合には(ステップS21;Yes)、情報処理装置1は、部品の検索条件で文字部品検索を行う(ステップS22)。例えば、情報処理装置1は、辞書DB23から、検索条件式に一致する部品IDsを持つ字形IDの集合を検索する。
【0058】
そして、情報処理装置1は、検索結果を生成する(ステップS23)。例えば、情報処理装置1は、検索できたそれぞれの字形IDについて、文字字形DB21より字形画像データを取得する。情報処理装置1は、辞書DB23より、字形IDに対応する属性情報(よみ、画数、部首、部品IDs)を取得する。そして、情報処理装置1は、部品字形DB22より、部品IDsの各部品IDに対応する部品字形画像データを取得する。
【0059】
そして、情報処理装置1は、生成された検索結果を表示する(ステップS24)。例えば、情報処理装置1は、文字の字形画像データ、文字を構成する部品の部品字形画像データおよび属性情報を対応付けた検索結果を表示する。そして、情報処理装置1は、文字検索処理を終了する。
【0060】
なお、実施例では、情報処理装置1は、手書き文字を入力し、手書きで入力された文字の字形に近い文字を、文字字形DB21を用いて検索し、検索結果から指定された文字の着目部品を類似する部品に入れ替えた検索条件を用いて文字部品検索を行うと説明した。
しかしながら、情報処理装置1は、これに限定されず、文字の部品(構成要素)を指定して文字を検索する文字部品検索を行う場合であっても良い。かかる場合には、情報処理装置1は、辞書DB23を用いて、指定された部品の部品IDに一致する字形IDが示す文字の集合を取得すれば良い。つまり、情報処理装置1は、文字の部品(構成要素)を入力し、入力された部品を含む文字を、辞書DB23を用いて検索し、検索結果から指定された文字の着目部品を類似する部品に入れ替えた検索条件を用いて文字部品検索を行えば良い。
【0061】
[実施例の効果]
上記実施例によれば、情報処理装置1は、文字と文字を構成する部品とを対応づけて記憶する辞書DB23と、形が類似する部品をグループ化した異体部品DB24と、を有する。そして、情報処理装置1は、文字検索結果に含まれる異体字から特定の文字を選択する際に、異体字から指定された文字と、指定された文字を構成する複数の部品の中から指定された着目部品とを受け付ける受付部と、指定された文字に関する異体字であって、指定された文字の着目部品の箇所を、異体部品DB24を基に別の部品に入れ替えた異体字を、辞書DB23を用いて検索する検索部と、検索部によって検索された異体字を提示する提示部と、を有する。かかる構成によると、情報処理装置1は、特定の文字の選択をユーザに容易に行わせることができる。
【0062】
また、上記実施例によれば、情報処理装置1は、異体部品DB24から着目部品を含むグループを取得する。情報処理装置1は、指定された文字の着目部品の箇所を、該取得されたグループに属する部品に入れ替えた検索条件を生成する。そして、情報処理装置1は、辞書DB23を用いて、該生成された検索条件に一致する異体字を検索する。かかる構成によれば、情報処理装置1は、文字の中に形が曖昧な部品がある場合、その部品のみを形の似た別の部品に入れ替わった文字集合を検索できる。この結果、情報処理装置1は、曖昧な部品に着目した文字集合から最も適した文字をユーザに容易に選択させることができる。
【0063】
また、上記実施例によれば、文字検索結果は、手書き文字を入力として形が類似する文字を検索した結果である。これにより、情報処理装置1は、手書き文字により文字の中に形が曖昧な部品がある場合、その部品のみを形の似た別の部品に入れ替わった文字集合を検索できる。この結果、情報処理装置1は、曖昧な部品に着目した文字集合から最も適した文字をユーザに容易に選択させることができる。
【0064】
また、上記実施例によれば、文字検索結果は、文字を構成する部品を入力として当該部品を含む文字を検索した結果である。これにより、情報処理装置1は、部品文字検索により文字の中に形が曖昧な部品がある場合、その部品のみを形の似た別の部品に入れ替わった文字集合を検索できる。この結果、情報処理装置1は、曖昧な部品に着目した文字集合から最も適した文字をユーザに容易に選択させることができる。
【0065】
[その他]
なお、上記実施例では、情報処理装置1は、文字検索を行うために、文字字形DB21、部品字形DB22、辞書DB23および異体部品DB24を用いると説明した。しかしながら、辞書DB23の部品IDsや異体部品DB24の部品IDsには、部品IDが設定されていたが、部員IDの代わりに部品字形画像データが設定される場合であっても良い。かかる場合には、情報処理装置1は、文字検索を行うために、文字字形DB21、辞書DB23および異体部品DB24を用いれば良い。
【0066】
また、上記実施例では、図示した情報処理装置1の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、情報処理装置1の分散・統合の具体的態様は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。また、記憶部20を情報処理装置1の外部装置としてネットワーク経由で接続するようにしても良い。
【0067】
また、上記実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、
図1に示した情報処理装置1と同様の機能を実現する文字検索プログラムを実行するコンピュータの一例を説明する。
図11は、文字検索プログラムを実行するコンピュータの一例を示す図である。
【0068】
図11に示すように、コンピュータ200は、各種演算処理を実行するCPU(Central Processing Unit)203と、ユーザからのデータの入力を受け付ける入力装置215と、表示装置209とを有する。また、コンピュータ200は、記憶媒体からプログラムなどを読取るドライブ装置213と、ネットワークを介して他のコンピュータとの間でデータの授受を行う通信I/F(InterFace)217とを有する。また、コンピュータ200は、各種情報を一時記憶するメモリ201と、HDD(Hard Disk Drive)205を有する。そして、メモリ201、CPU203、HDD205、表示制御部207、表示装置209、ドライブ装置213、入力装置215、通信I/F217は、バス219で接続されている。
【0069】
ドライブ装置213は、例えばリムーバブルディスク211用の装置である。HDD205は、文字検索プログラム205aおよび文字検索処理関連情報205bを記憶する。通信I/F217は、ネットワークと装置内部とのインタフェースを司り、他のコンピュータからのデータの入出力を制御する。通信I/F217には、例えば、モデムやLANアダプタなどを採用することができる。
【0070】
表示装置209は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する表示装置である。表示装置209は、例えば、液晶ディスプレイや有機EL(Electroluminescence)ディスプレイなどを採用することができる。
【0071】
CPU203は、文字検索プログラム205aを読み出して、メモリ201に展開し、プロセスとして実行する。かかるプロセスは情報処理装置1の各機能部に対応する。文字検索処理関連情報205bには、例えば、文字字形DB21、部品字形DB22、辞書DB23および異体部品DB24が含まれる。そして、例えばリムーバブルディスク211が、文字検索プログラム205aなどの各情報を記憶する。
【0072】
なお、文字検索プログラム205aについては、必ずしも最初からHDD205に記憶させておかなくても良い。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD-ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に当該プログラムを記憶させておく。そして、コンピュータ200がこれらから文字検索プログラム205aを読み出して実行するようにしても良い。
【0073】
また、上記実施例で説明した情報処理装置1が行う文字検索処理は、例えば、手書きされた漢字などの文字の選定に適用することができる。