(58)【調査した分野】(Int.Cl.,DB名)
前記文字列候補抽出手段により抽出された文字列候補の変換候補を所定のデータベースに基づいて検索し、前記検索された変換候補を、所定の優先順位に基づいて並び替えて表示手段に表示させる変換候補抽出手段を備えることを特徴とする請求項1記載の情報処理装置。
前記文字列候補抽出ステップにより抽出された文字列候補の変換候補を所定のデータベースに基づいて検索し、前記検索された変換候補を、所定の優先順位に基づいて並び替えて表示手段に表示させる変換候補抽出ステップを備えることを特徴とする請求項4記載の文字列候補確定方法。
抽出された前記文字列候補の変換候補を所定のデータベースに基づいて検索し、前記検索された変換候補を、所定の優先順位に基づいて並び替えて表示手段に表示させる処理をコンピュータに実行させることを特徴とする請求項7記載のプログラム。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、上記特許文献1に記載の技術では、単純に押下されたキーと押下されたキーの周囲のキーを全て出力するので、明らかに無効な候補を含んだ極めて多くの候補を得ることとなる。そのため、上記特許文献1に記載の技術では、ユーザが、候補の中から所望の文字列を探して選択することが困難であり、文字列選択操作が煩雑になるという課題があった。
【0006】
本発明はこのような実情を鑑みてなされたものであり、ユーザがミス入力した場合にも、無効な文字列を候補として示さないようにし、ユーザが所望の文字列を容易に選択することができる情報処理装置、文字列候補確定方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の情報処理装置は、文字列候補を抽出するための少なくとも1以上の規則とキー配列情報とを記憶する記憶手段と、ユーザからのキー入力を受け付ける入力手段と、キー配列情報に基づいて、入力手段により入力が受け付けられたキーの周囲に配置されているキーを周囲キーとして検索する周囲キー検索手段と、入力手段により入力が受け付けられたキーと周囲キー検索手段により検索された周囲キーと
を各キー入力に対応するキー候補として順次組み合わせた文字列のうち記憶手段により記憶された規則
を満たすものを、文字列候補
として抽出する文字列候補抽出手段と、文字列候補抽出手段により抽出された文字列候補を表示する表示手段と、を備えることを特徴とする。
【0008】
本発明の文字列候補確定方法は、ユーザからのキー入力を受け付ける入力ステップと、記憶手段に記憶されたキー配列情報に基づいて、入力ステップにより入力が受け付けられたキーの周囲に配置されているキーを周囲キーとして検索する周囲キー検索ステップと、記憶手段に記憶された少なくとも1以上の規則のうち適用する規則を決定する規則決定ステップと、入力ステップにより入力が受け付けられたキーと周囲キー検索ステップにより検索された周囲キーと
を各キー入力に対応するキー候補として順次組み合わせた文字列のうち規則決定ステップによりに決定された規則
を満たすものを、文字列候補
として抽出する文字列候補抽出ステップと、文字列候補抽出ステップにより抽出された文字列候補を表示手段に表示する表示ステップと、を備えることを特徴とする。
【0009】
本発明のプログラムは、ユーザからのキー入力を受け付ける処理と、記憶手段に記憶されたキー配列情報に基づいて、入力が受け付けられたキーの周囲に配置されているキーを周囲キーとして検索する処理と、記憶手段に記憶された少なくとも1以上の規則のうち適用する規則を決定する処理と、入力が受け付けられたキーと検索された周囲キーと
を各キー入力に対応するキー候補として順次組み合わせた文字列のうち適用が決定された規則
を満たすものを、文字列候補
として抽出する処理と、抽出された文字列候補を表示手段に表示する処理と、をコンピュータに実行させることを特徴とする。
【発明の効果】
【0010】
本発明によれば、実際に押下されたキーとその周囲キーとを入力キー候補として生成される文字列のうち、所定のルールに基づいて許容される文字列を文字列候補として確定してユーザに示すので、ユーザがミス入力した場合にも、ユーザは所望の文字列を効率的に選択することが可能となり、ユーザの再入力の手間も省くことが可能となる。つまり、本発明により、ユーザの操作性を向上させることが可能となる。
【発明を実施するための形態】
【0012】
以下に本発明の実施形態の例について、図面を用いて詳細に説明する。
【0013】
図1は、本実施形態に係る情報処理装置を適用したシステムの概略構成例を示す図である。尚、本実施形態では、情報処理装置100がネットワークと接続されている例を挙げて説明するが、これに限定されるものではなく、情報処理装置はネットワークに接続されていなくてもよい。
【0014】
図1に示すように、本実施形態に係る情報処理装置100を適用したシステムは、情報処理装置100と、少なくとも1以上のデータベースと、がインターネットなどのネットワーク200を介して接続されている。ネットワーク200としては、何れのネットワークでも適用することができ、有線・無線を問わない。また、
図1では、データベースを2つ備える例を挙げて示したが、これに限定されるものではなく、データベースの数や種類は適宜変更可能である。
【0015】
図2は、本実施形態に係る情報処理装置の概略構成例を示す。
図2に示すように、本実施形態に係る情報処理装置100は、CPU(Central Processing Unit)1、出力装置2、記憶装置3、入力装置4、ネットワークアダプタ5などを備えている。尚、ネットワークアダプタ5は必ずしも備える必要はない。尚、以下では、入力装置として、日本語入力が可能な入力装置を例に挙げて説明するが、これに限定されるものではない。本実施形態に係る情報処理装置が備える入力装置は、かな文字、漢字、ローマ字、数字だけでなく、いかなる文字を入力するための入力装置であってもよい。
【0016】
CPU1は、ROM(Read-Only Memory)などに格納されたプログラムに従って、情報処理装置の動作を制御する集中演算装置である。出力装置2は、例えば、モニタなどであり、ユーザに情報を表示する。記憶装置3は、各種情報を記憶する装置であり、例えば、キー配列データベース、単語辞書データベースや頻出度データベースなどを格納している。
【0017】
入力装置4は、例えば、キーボードやマウスなどであり、情報処理装置100がユーザからの入力を受け付けるための装置である。本実施形態では、入力装置4は、複数のキーを備えるキーボードであるものとする。尚、情報処理装置100が、他の入力装置として、マウスやタッチパッドを備えることももちろん可能である。また、上記キー配列データベースを、入力装置4が備えるようにしてもよい。ネットワークアダプタ5は、ネットワークに接続するためのアダプタである。情報処理装置100は、ネットワークアダプタ5を介して、ネットワーク上の共有ストレージから情報を取得することができる。
【0018】
図3は、本実施形態に係る情報処理装置の概略機能構成例を示す。
図3に示すように、本実施形態に係る情報処理装置100は、表示部20、記憶部30、入力部40、文字列候補抽出部50、周囲キー検索部60、変換候補検索部70などを備えている。
【0019】
表示部20は、ユーザへの情報表示を表示装置2により実現する。記憶部30は、各種データベースやテーブルなどの情報の格納を、記憶装置3により実現する。入力部40は、ユーザからのキー入力受付けを、入力装置4により実現する。文字列候補抽出部50は、入力部40を介して入力されたキー情報から、例えば、音節や表記ルールに基づいて文字列候補を抽出する。周囲キー検索部60は、キー配列データベースなどに基づいて、ユーザにより押下されたキーの周囲のキーを検索する。変換候補検索部70は、記憶部30に格納された又はネットワークを介して取得したデータベースや辞書などに基づいて、文字列候補抽出部50が抽出した文字列候補の変換候補を検索し、表示部20に表示させる優先度などを決定する。
【0020】
図4は、本実施形態に係る情報処理装置が備える機能の詳細例を示す。
図4に示すように、本実施形態に係る情報処理装置100は、
図3に示す構成以外に、母子音記号確定キー検索部10などを備えている。母子音記号確定キー検索部10は、キー配列データベース96などに基づいて、子音確定部分の抽出や母音可能性部分の抽出を行う。また、母子音記号確定キー検索部10は、検索結果を母子音確定キーテーブル31に格納する。ここで、キー配列としては、例えば、Qwerty配列などがあるが、特に限定はされない。記憶部30は、例えば、母子音記号確定テーブル31、確定済み単語テーブル32、英単語テーブル33、検索スクリプト80、データベース90などを格納している。尚、データベース90などは、必ずしも記憶部30が格納しておく必要はなく、適宜ネットワーク200を介して接続されたサーバなどから取得するようにしてもよい。
【0021】
文字列候補抽出部50は、文字列候補検索部51、英単語検索部52、音節候補検索部53、かな文字列候補検索部54などを備えている。文字列候補検索部51は、実際に押下されたキーと周囲キー検索部60により抽出された周囲キーとを参照し、文字列候補を検索する。英単語検索部52は、実際に押下されたキーと周囲キー検索部60により抽出された周囲キーとを参照し、英単語データベース95などに基づいて、英単語候補を検索し、検索結果を英単語テーブル33に格納させる。音節候補検索部53は、実際に押下されたキーと周囲キー検索部60により抽出された周囲キーとを参照し、母子音記号確定キーテーブル31や検索スクリプト80などに基づいて、音節候補を検索する。かな文字列候補検索部54は、実際に押下されたキーと周囲キー検索部60により抽出された周囲キーとを参照し、検索スクリプト80などに基づいて、かな文字候補を検索する。
【0022】
文字列候補抽出部50は、上記文字列候補検索部51、英単語検索部52、音節候補検索部53、かな文字列候補検索部54などの構成による少なくとも1以上の検索結果に基づいて、文字列候補を抽出する。尚、文字列候補抽出部50が備える構成は上記に限定されるものではない。文字列候補抽出部50は、上記構成を全て備える必要はなく、また、他の構成を備えるようにしてもよい。尚、文字列候補抽出部50が参照する検索結果は、予め設定されていてもよく、ユーザに設定させるようにしてもよい。
【0023】
変換候補抽出部70は、単語候補検索部71や変換候補検索部72などを備えている。尚、変換候補抽出部70は、必ずしも単語候補検索部71及び変換候補検索部72を備える必要はなく、また、他の構成を備えるようにしてもよい。
【0024】
単語候補検索部71は、確定済み単語テーブル32、単語辞書データベース91や単語関連データベース92などに基づいて、上記文字列候補抽出部50が抽出した文字列により形成される単語を検索する。ここで単語とは、熟語に限定されず、例えば、漢字、平仮名、片仮名、数字などの組み合わせを含むものとする。変換候補検索部72は、英単語テーブル33、頻出度データベース93や変換履歴データベース94などに基づいて、上記文字列候補抽出部50が抽出した文字列の変換候補を検索する。変換候補抽出部70は、単語候補検索部71や変換候補検索部72などの検索結果に基づいて、例えば、変換候補として可能性の高い順に変換候補を並べ替え、当該変換候補を表示部20に表示させる。尚、例えば、ローマ字入力により直接英単語を入力のみを行う場合には、文字列の変換は必要ないので、変換候補抽出部70を備えなくてもよい。
【0025】
検索スクリプト80は、各種ルール適用スクリプト81、1文字誤り検索スクリプト82、N文字誤り検索スクリプト83などを備えている。また、データベース90は、単語辞書データベース91、単語関連データベース92、頻出度データベース93、変換履歴データベース94などを備えている。尚、検索スクリプト80やデータベース90が備える構成はこれに限定されず、適宜変更可能である。また、情報処理装置100は、検索スクリプト80やデータベース90を必ずしも備える必要はなく、例えば、ネットワークを介して共有された検索スクリプトやデータベースを、文字列候補抽出や変換候補抽出に適用することもできる。
【0026】
各種ルール適用スクリプト81は、配列ルール、音節ルール、表記ルールなどの各種ルールを適用するためのスクリプトであり、例えば、ヘボン式ローマ字表記に基づく音節解析ルールのスクリプトなどである。1文字誤り検索スクリプト82は、連続タイプミスを除外し、1文字誤りに限定した場合のためのスクリプトである。N文字誤り検索スクリプト83は、連続タイプミスも考慮する場合のためのスクリプトである。
【0027】
頻出度データベース93は、辞書データなどに付加された頻出度情報や変換履歴データベース94の情報に基づいた頻出度情報を格納する。変換履歴データベース94は、ユーザ個人の変換履歴やネットワークで共有された変換履歴などに基づいた変換履歴情報を格納する。
【0028】
(変換候補表示処理)
図5は、本実施形態に係る変換候補表示処理の流れの例を示す。
図6は、入力装置4の例を示す。
図7は、タイプミス文字候補の抽出例を示す。
図8は、音節候補の推定を説明するための図である。
図9は、かな文字候補の抽出例を説明するための図である。
図10は、組み合わせ抽出と重み付けの例を説明するための図である。
図11は、表示装置に表示される変換候補の例を示す。以下に、本実施形態に係る情報処理装置100における変換候補表示処理例について、
図5に示すフローチャートと
図6〜
図11に示す図を用いて説明する。
【0029】
まず、入力部40は、ユーザからキー入力(ステップS501)及び変換単位の決定入力を受け付ける(ステップS502)。尚、変換単位の決定は、情報処理装置側で自動的に決定するものとしてもよい。
【0030】
ユーザからのキー入力を受け付けると、周囲キー検索部60は、キー配列データベース96に基づいて、ユーザにより押下されたキーの周囲のキーを検索し、タイプミス文字候補として抽出する(ステップS503)。例えば、周囲キー検索部60は、
図6に示すように、ユーザが「K」のキーを押下した場合には、「K」の周囲に配列されている「I、O、L、M、J、<」などの文字も抽出する。タイプミス文字候補が抽出されると、予め設定された又はユーザにより設定されたルールを適用する(ステップS504)。後述する文字列候補抽出部50の処理は、上記ステップS504において適用されたルールに基づいて行うこととなる。
【0031】
ルールの例としては、ヘボン式ローマ字表記に基づく音節解析ルールやキーボード配列による解析ルールなどが挙げられる。より詳細には、ヘボン式ローマ字表記に基づく音節解析ルールの例として、「最後の文字は母音又は『N』とする」というルールや、「子音『N』は、母音を伴わない可能性あり」というルール、「『SH』、『CH』、『NY』、『HY』、『MY』は複合子音とする」というルール、「『W、R、Y、N、M』の各文字が連続で入力された場合は、何れかがタイプミスである可能性よりも、あやまって同じキーを2度押下した可能性が高いため、合わせて1文字と解釈した候補を含める」というルールなどが挙げられる。また、キーボード配列による解析ルールの例としては、「『X、C、V、B、N、M、F、G、T』の各文字は、子音確定とする」というルールなどが挙げられる。これは、『X、C、V、B、N、M、F、G、T』の各文字の周囲には、母音を入力するためのキーが配列されていないことに基づいている。
【0032】
以下、上記ステップS504において適用するルールが、ヘボン式ローマ字表記に基づく音節解析ルール及びキーボード配列による解析ルールである場合を例に挙げて説明する。つまり、ここでは、
図7に示すような、[1]母音可能性部分の抽出、[2]独立子音及びその可能性の抽出、[3]促音又は拗音の可能性チェックという処理と、
図8に示すような、[4]子音確定部分の抽出、[5]最終文字が母音もしくは独立母音(N)であるかのチェック、[6]連続子音の組み合わせ抽出という処理を行う。尚、上記ステップS504において適用できるルールは上記ルールに限定されるものではなく、また、実施する処理も、上記[1]〜[6]やその組み合わせには限定されない。
【0033】
例えば、文字列候補検索部51は、
図7に示すように、上記[1]〜[3]に基づいて、上記ステップS503において抽出されたタイプミス文字候補について、ルールを適用する。具体的には、例えば、上記[1]に基づいて、文字列候補検索部51は、母子音記号確定キー検索部10に、タイプミス文字候補の中から母音可能性部分である「A、I、U、E、O」を抽出させる。また、上記[2]に基づいて、独立子音である「N」を抽出する。さらに、上記[3]に基づいて、促音又は拗音の可能性がある部分を抽出する。ここでは、4文字目及び5文字目のタイプミス文字候補である「Z」と、6文字目及び7文字目のタイプミス文字候補である「J」を抽出する。このとき、文字列候補検索部51は、上記ステップS504において適用されたルールのスクリプトに従って、タイプミス文字候補の絞り込みを行う。尚、上記文字列候補検索部51の処理は、後述する音節候補抽出処理の後に行うようにしてもよい。
【0034】
音節候補検索部53は、
図8に示すように、ユーザにより実際に押下されたキーに加え、タイプミス文字列候補も対象として、上記[4]〜[6]に基づいて音節を推定し、音節候補を抽出する(ステップS505)。このとき、音節候補検索部53は、上記ステップS504において適用されたルールのスクリプトに従って、音節候補を抽出する。
【0035】
上記ステップS505の処理において推定された音節候補の例を、
図8に示す。
図8に示すように、音節候補検索部53は、上記[4]に基づいて、母子音記号確定キー検索部10に、子音確定部分を抽出させる。ここでは、3文字目に実際に押下されたキー及び3文字目のタイプミス文字候補の全てが子音又は独立子音であるため、3文字目が子音確定部分として抽出されている。また、上記[5]に基づいて、音節候補検索部53は、最終文字が母音もしくは独立母音(N)である音節のみを候補として抽出する。
図8の(1)〜(11)では、最終文字が母音である音節候補を抽出している。尚、文字として数字を含める場合には、
図8の(12)〜(13)に示す音節も候補として抽出される。さらに、音節候補検索部53は、上記[6]に基づいて、連続子音の組み合わせを抽出する。例えば、
図8中の(1)の上側に記載された音節は、有効な音節ではないと判断されるため、音節候補検索部53は音節候補から外す。このようにして、音節候補検索部53は、上記[4]〜[6]の処理を行い、ユーザが所望するであろう音節候補を抽出する。
【0036】
タイプミス文字候補と音節候補が抽出されると、かな文字候補検索部54は、各種データベースや検索スクリプト80に基づいて、かな文字候補の抽出を行う。具体例として、
図7に示すようなタイプミス文字候補を抽出し、
図8に示した音節と推定した場合のかな文字候補の抽出例を
図9に示す。例えば、上記
図8の(1)に示すように、音節が「子、母、N、子、母、子、母」であると推定した場合、
図7に示すようなタイプミス文字候補から、かな文字に変換した1文字目としては、「け、め、じぇ」という文字が候補となり、かな文字に変換した2文字目としては、「ん」という文字が候補なる。同様にして、かな文字に変換した3文字目としては、「さ、だ、ざ、わ」という文字が候補なり、かな文字に変換した4文字目としては、「く、き、む、じゅ、み、じ」という文字が候補なる(
図9の(1))。尚、
図9では、下線が引かれた文字は、連続タイプミスを含める場合の候補文字を示している。以下では、説明の簡略化のため、連続タイプミスは含めないものとする。
【0037】
かな文字候補が抽出されると、文字列候補抽出部50は、かな文字候補に基づいて文字列候補の抽出を行う(ステップS506)。具体例として、
図8に示した音節と推定し、
図9に示したかな文字を抽出した場合の文字列候補を
図10に示す。例えば、上記
図9の(1)に示すように、1文字目が「け、め、じぇ」の何れかであり、2文字目が「ん」であり、3文字目が「さ、だ、ざ、わ」の何れかであり、4文字目が「く、き、む、じゅ、み、じ」の何れかであるというかな文字候補を抽出した場合、実際に押下された「けんさく」という文字列以外に、「めんさく」、「じぇんさく」、「けんだく」、「けんざく」、「けんわく」、「けんさじゅ」、「けんさむ」、「けんさき」という文字列が候補となる(
図10の(1))。
【0038】
次に、変換候補抽出部70は、文字列候補抽出部50により抽出された文字列候補の優先順位付けを行う(ステップS507)。優先順位付けは、例えば、単語辞典データベース91や頻出度データベース93などに基づいて行われる。そして、変換候補抽出部70は、優先順位付けに基づいて変換候補を抽出し、表示部に表示させる(ステップS508)。
【0039】
上記ステップS508において表示部20に表示される変換候補表示画面の例を
図11に示す。変換候補として表示する順序は、読みかな文字の頻出度と漢字に変換した場合の頻出度に基づいて決定される。より詳細には、本実施形態では、縦方向の表示順は、「読みかな」での頻出度に基づいて決定し、横方向の表示順は、「漢字の頻出度」に基づいて決定する。ここで、本実施形態では、実際に押下されたキーに基づく文字列あるいは変換候補が明らかに無効である場合を除いては、実際に押下されたキーに基づく変換候補を最優先として、最上段に表示する。しかし、変換候補の表示順の決定方法は、これに限定されるものではない。尚、頻出度が低いと判断された変換候補は、その他の候補として、初期候補には表示しないようにする。頻出度が低い候補や履歴にないような候補を変換候補として表示しないようにすることにより、ユーザは、厳選された変換候補を確認するだけでよく、所望する変換候補を容易に選択することができる。
【0040】
尚、上記では、ローマ字入力によってかな文字を入力し、その後漢字変換を行う場合の変換候補表示処理例について説明したが、これに限定されるものではない。例えば、ひらがな文字直接入力やローマ字を直接入力する英語入力であってもよく、いかなる入力方法や入力言語にも本実施形態を適用することができる。この場合、上記ステップS505〜ステップS508の処理は必ずしも行う必要はない。例えば、上記ステップS504においてルールが適用された後に、文字列候補抽出部50が、ユーザにより実際に押下されたキーとタイプミス文字列候補とルールとに基づいて、文字列候補を抽出し、表示部に表示するようにすればよい。尚、このとき表示部に表示する文字列候補は、頻出度などに基づく優先順位の順序で表示されることが好ましいが、これに限定されない。また、文字列候補を優先順に並び替える処理は、文字列候補抽出部50と変換候補抽出部70との何れが行っても構わない。
【0041】
また、本実施形態では、入力装置を備えた情報処理装置を例に挙げて説明したが、これに限定されるものではない。例えば、USB I/Fなどを介して入力装置を接続できるような情報処置装置であってもよい。この場合、情報処理装置は、ネットワークを介して又は入力装置からキー配列データベースを得るようにしてもよい。
【0042】
本実施形態により、実際に押下されたキーとその周囲キーを入力キー候補として生成される文字列のうち、ルールに基づいて許容されるものを文字列候補として確定し、無効な文字列を候補から外してユーザに示すので、ユーザは容易に所望する文字列を選択することが可能となり、入力ミスによる訂正の手間を省くことが可能となる。また、確定した文字列候補を頻出度などに基づいて並び替えを行った後に、当該文字列候補をユーザに示すので、さらにユーザの操作性を向上させることが可能となる。
【0043】
また、本実施形態により、ルールに基づいた文字列候補のみを抽出するので、「抽出される文字列候補が極めて多く、装置への負荷増大や文字列候補表示までの時間が長くなってしまう」という課題を解決することが可能となる。
【0044】
尚、各図のフローチャートに示す処理を、CPUが実行するためのプログラムは本発明によるプログラムを構成する。このプログラムを記録するコンピュータ読み取り可能な記録媒体としては、半導体記憶部や光学的及び/又は磁気的な記憶部などを用いることができる。このようなプログラム及び記録媒体を、前述した各実施形態とは異なる構成のシステムなどで用い、該システムのCPUで上記プログラムを実行させることにより、本発明と実質的に同じ効果を得ることができる。
【0045】
以上好適な実施の形態に基づき具体的に説明したが、本発明は上述した情報処置装置、文字列候補確定方法及びプログラムに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であるということは言うまでもない。