【解決手段】情報処理システム1が、第1言語による第1文字を入力する入力部F1と、第1文字を第2言語による当て字となる第2文字に変換する変換部F2と、変換部F2が変換を行う変換単位を決める区切りを設定する設定部F3と、第2文字で構成される出力文字を表示する表示部F4と、データベースWBS2を含んで構成される。情報処理システム1は、データベースWBS2を用いて、英字をカタカナに変換する。次に、情報処理システム1は、データベースWBS2を用いて、変換されたカタカナと同一又は類似の音となる漢字にカタカナを変換して、当て字を生成する。
【発明を実施するための形態】
【0009】
以下、本発明の好適な実施形態の具体例を示して説明する。
【0010】
<全体構成例>
図1は、情報処理システムの全体構成例を示す概要図である。図示するように、情報処理システム1は、1以上の情報処理装置を有する。具体的には、情報処理システム1は、情報処理装置の例であるサーバ2と、情報処理装置の例であるPC(Personal Computer)3とを有する。
【0011】
図示するように、サーバ2と、PC3とは、ネットワーク等によって接続され、相互にデータを送受信することができる。
【0012】
なお、サーバ2と、PC3とは、一体となる構成、すなわち、情報処理システム1は、1つの情報処理装置で構成されてもよい。一方で、情報処理システム1は、3以上の情報処理装置を有してもよい。なお、
図1のサーバ2及びPCの詳細構成は、後述する。以下、図示する全体構成を例に説明する。
【0013】
<ハードウェア構成例>
図2は、情報処理装置のハードウェア構成例を示すブロック図である。例えば、サーバ2及びPC3は、同一のハードウェア構成である。以下、サーバ2を例に説明し、PC3の説明を省略する。
【0014】
サーバ2は、CPU(Central Processing Unit)2H01と、記憶装置2H02と、入力装置2H03と、出力装置2H04と、インタフェース(interface)2H05とを有する。各ハードウェア資源は、バス(bus)で接続され、相互にデータを送受信する。
【0015】
CPU2H01は、演算装置及び制御装置の例である。記憶装置2H02は、主記憶装置等である。また、記憶装置2H02は、SSD(Solid State Drive)又はハードディスク等の補助記憶装置があってもよい。入力装置2H03は、ユーザURから操作を入力する装置である。例えば、入力装置2H03は、キーボード、マウス又はこれらの組み合わせ等である。出力装置2H04は、ユーザURに処理結果等を表示する装置である。例えば、出力装置2H04は、ディスプレイ等である。インタフェース2H05は、外部装置とデータを入出力する装置である。例えば、インタフェース2H05は、コネクタ又は通信装置等である。
【0016】
なお、ハードウェア構成は、図示する構成に限られない。例えば、ハードウェア構成は、演算装置又は制御装置等が内部又は外部に更にある構成等でもよい。
【0017】
<全体処理例>
図3は、全体処理例を示すフローチャートである。
【0018】
<第1言語による第1文字の入力例>
ステップS01では、情報処理システム1は、第1言語による第1文字C1を入力する。なお、第1文字C1等の文字は、1字の文字でもよいし、複数の文字で構成される文字列でもよい。以下、第1言語を「英語」とし、第1文字C1を「英字」とする例で説明する。なお、第1言語は、英語に限られず、後述する第2言語と異なる言語であればよい。また、以下の説明では、第2言語を「日本語」とし、第2文字C2を「漢字」とする例で説明する。
【0019】
<区切りごとに第1文字を第2言語の第2文字に変換する例>
ステップS02では、情報処理システム1は、入力された英字を区切られた変換単位ごとに変換する。例えば、まず、情報処理システム1は、データベースWBSを用いて、英字をカタカナに変換する。次に、情報処理システム1は、データベースWBSを用いて、変換されたカタカナと同一又は類似の音となる漢字に、カタカナを変換する。したがって、このような変換を行う場合では、データベースWBSは、英語をカタカナに変換する辞書データ及びカタカナを漢字に変換する辞書データ等で構成される。なお、データベースWBSには、変換に合わせた種類のデータが用意される。また、データベースWBSは、インターネット上で利用できるデータ等でもよい。
【0020】
なお、第1文字C1から第2文字C2に変換する手順は、上記のような手順に限られず、他の手順でもよい。例えば、情報処理システム1は、第1文字C1から第2文字C2に1回で変換してもよいし、3回以上変換を行ってもよい。
【0021】
<候補となる当て字の表示例>
ステップS03では、情報処理システム1は、候補となる当て字を表示する。すなわち、当て字に変換した結果、変換後の文字が複数ある場合には、情報処理システム1は、候補として複数の当て字を表示して、ユーザURに選択させる。
【0022】
<第1言語にて第2文字の説明等を表示する例>
ステップS04では、情報処理システム1は、英語にて当て字の意味等を示し、当て字の説明を表示するのが望ましい。
【0023】
情報処理システム1は、以上のようなステップS02乃至ステップS04の手順を区切りごとに行う。すなわち、情報処理システム1は、設定された区切りごとに第1文字C1を変換して各当て字の候補となる第2文字C2とし、変換によって得られる第2文字C2を組み合わせて出力文字COUTを生成する。例えば、情報処理システム1は、以下のような画面におけるUI(User Interface)等によって上記手順を行う。
【0024】
図4は、画面の一例(区切り変更前)を示す図である。以下、「Jeams」という名前を構成する第1文字C1が入力される例で説明する。
【0025】
図示する例では、「Jeams」は、第1区SP1、第2区SP2、第3区SP3及び第4区SP4の4つに区切るように設定される例である。したがって、この例では、第1区SP1、第2区SP2、第3区SP3及び第4区SP4を変換単位として、変換が行われ、第1出力文字COUT1は、合計で4文字の当て字で構成される例である。
【0026】
まず、情報処理システム1は、「Jeams」をカタカナに変換して「jieimuzu」という日本語での音SDに変換する。なお、このように変換後の音SDは、図示するように、英字にて表示されるのが望ましい。すなわち、変換単位を決める基準となる音SDが、例えば、図示するように、第1出力文字COUT1と併記されると、ユーザURは、第2言語でどのように発音されるかが分かりやすい。
【0027】
そして、この例では、音SDが、4つに区切られて、第1区SP1、第2区SP2、第3区SP3及び第4区SP4に分けられる。具体的には、この例では、「jieimuzu」のうち、「ji」の部分が第1区SP1に設定される。次に、「jieimuzu」のうち、「e」の部分が第2区SP2に設定される。さらに、「jieimuzu」のうち、「i」の部分が第3区SP3に設定される。同様に、「jieimuzu」のうち、「muzu」の部分が第4区SP4に設定される。
【0028】
図示するように、情報処理システム1は、区切りごとに、候補となる当て字を表示する。例えば、第1区SP1である「ji」には、第1候補文字CAN1が当て字の候補となる。同様に、第2区SP2である「e」には、第2候補文字CAN2が当て字の候補となる。さらに、第3区SP3である「i」には、第3候補文字CAN3が当て字の候補となる。さらにまた、第4区SP4である「muzu」には、第4候補文字CAN4が当て字の候補となる。例えば、第1候補文字CAN1、第2候補文字CAN2、第3候補文字CAN3及び第4候補文字CAN4から、ユーザURが1字ずつ選択できるUIであるとする。このようにして、各候補文字から選択された文字を組み合わせて、情報処理システム1は、第1出力文字COUT1を表示する。
【0029】
なお、図示する例は、候補文字のうち、選択されている文字が強調されて表示される例である。以下、同様に記載する。
【0030】
なお、図示するように、情報処理システム1は、区切りごとに、説明ACTを表示するのが望ましい。また、説明ACTは、図示するように、英語で表示されるのが望ましい。特に、外国人は、漢字の意味が分からない場合が多い。そこで、図示するように、情報処理システム1は、各候補文字の意味を英語で表示する。このように、説明ACTがあると、ユーザURは、第2言語における意味まで考慮して、候補文字から、当て字を選択することができる。
【0031】
<区切りを変更するか否かの判断例>
ステップS05では、情報処理システム1は、区切りを変更するか否かを判断する。例えば、情報処理システム1は、まず、区切りを設定するためのUIを表示する。具体的には、
図4に示す例では、以下のようなUIが表示される。
【0032】
図5は、区切りを設定するためのUIの一例を示す図である。図示する例は、
図4における第2区SP2及び第3区SP3の区切りを変更する例である。
【0033】
例えば、設定ボタンBSETは、
図4に示す画面の右側に表示されたり又はポップアップ表示されたりする。
【0034】
この例では、設定ボタンBSETは、第2区SP2及び第3区SP3の区切りを変更する用の第1ボタンB1(ステップS05でYES)と、第2区SP2及び第3区SP3の区切りを変更せず、維持する用の第2ボタンB2(ステップS05でNO)とで構成される例である。すなわち、ユーザURは、設定ボタンBSETが表示された後、第1ボタンB1又は第2ボタンB2を押して区切りを設定する操作を行う。なお、UIは、図示するような設定ボタンBSETに限られず、ユーザURが区切りを設定できるUIであれば他の種類でもよい。例えば、ボタンに限られず、スワイプ又はピンチアウト等のジェスチャー操作で、区切りは設定されてもよい。
【0035】
したがって、情報処理システム1は、設定ボタンBSETのうち、第1ボタンB1が押されると、区切りを変更すると判断し、区切りを変更して変更後の区切りでステップS02乃至ステップS04の処理を行う。一方で、情報処理システム1は、設定ボタンBSETのうち、第2ボタンB2が押されると、区切りを変更しないと判断し、区切りを維持してステップS06以降の処理を行う。
【0036】
例えば、
図4に示す例において、第1ボタンB1が押されると、情報処理システム1は、
図4に示す画面に代えて以下のような画面を表示する。
【0037】
図6は、画面の一例(区切り変更後)を示す図である。
図4と比較すると、
図6では、第2区SP2及び第3区SP3が1つとなって、第5区SP5となる点が異なる。以下、異なる点を中心に説明する。
【0038】
図示する例では、区切りは、第1区SP1、第5区SP5及び第4区SP4の3つとなる。したがって、この例では、第1区SP1、第5区SP5及び第4区SP4を変換単位として、変換が行われ、第2出力文字COUT2は、合計で3文字の当て字で構成される例である。
【0039】
図示するように、
図4では、「jieimuzu」のうち、「e」と、「i」のそれぞれの音に対して、情報処理システム1は、1文字ずつ当て字を表示する。これに対して、区切りを変更した後、すなわち、
図6では、情報処理システム1は、「e」と、「i」とを合わせて1つの変換単位とし、「ei」という音に対して1文字の当て字を表示する。
【0040】
したがって、
図6に示す例では、情報処理システム1は、「ei」と同一又は類似の当て字の候補となる第5候補文字CAN5を表示する。そして、区切りを変更した設定後、ユーザURは、変更後の区切りごとに、
図4と同様に、各候補文字から当て字を選択することができる。
【0041】
以下、ステップS05における区切りの設定が完了した後に行われる処理を説明する。
【0042】
<区切りごとに第2文字を当てた結果を確定する例>
ステップS06では、ステップS05で区切りが確定するため、情報処理システム1は、確定した区切りごとに当て字を当て、出力文字を表示する。例えば、
図4のように区切りが設定されると、情報処理システム1は、第1出力文字COUT1を表示し、一方で、
図6のように区切りが設定されると、情報処理システム1は、第2出力文字COUT2を表示する。
【0043】
<出力文字を保存するか否かの判断例>
ステップS07では、情報処理システム1は、出力文字を保存するか否かを判断する。例えば、保存ボタンBSAV等のUI等によって、情報処理システム1は、生成した出力文字を保存するか否かを問い、ユーザURの操作に基づいて出力文字を保存するか否かを判断する。
【0044】
出力文字を保存すると判断する場合(ステップS07でYES)には、情報処理システム1は、ステップS08に進む。一方で、出力文字を保存しないと判断する場合(ステップS07でNO)には、情報処理システム1は、処理を終了する。このようにして、情報処理システム1は、出力文字を保存する処理を行うのが望ましい。
【0045】
<コードの表示例>
ステップS08では、情報処理システム1は、コードを出力して出力文字を保存するのが望ましい。例えば、以下のようなコードが用いられるのが望ましい。
【0046】
図7は、コードを表示する画面の一例を示す図である。例えば、保存ボタンBSAVが押されると、情報処理システム1は、確定した出力文字をサーバ2等に保存した上で、保存した出力文字を特定できるコードCDを生成し、コードCDをユーザURに表示する。
【0047】
例えば、ユーザURは、表示されたコードCDを控えておく。そして、以後に、再度、生成した出力文字を情報処理システム1に表示させたい場合には、ユーザURは、コードCDを入力する。そして、情報処理システム1は、入力されたコードCDから出力文字を特定し、表示する。このようにすると、ユーザURは、以前に生成した出力文字を再現させることができる。
【0048】
なお、コードCDは、図示するように、数字及び英字の組み合わせ等で生成されるのが望ましい。すなわち、コードCDは、ユーザURが使いやすい文字等で構成されるのが望ましい。ユーザURが外国人等である場合には、使い慣れない言語で生成された出力文字を覚えるのが困難な場合が多い。一方で、図示するように、数字及び英字等で構成されるコードCDであると、ユーザURは、出力文字を覚えるより、楽に覚えることができる。
【0049】
なお、コードCDは、出力文字を特定できる文字等であればよく、数字のみ又は英字のみであってもよい。
【0050】
<機能構成例>
図1に示すように、情報処理システム1は、入力部F1、変換部F2、設定部F3及び表示部F4を含む機能構成である。
【0051】
入力部F1は、第1言語による第1文字C1を入力する。例えば、入力部F1は、入力装置2H03等によって実現される。
【0052】
変換部F2は、入力部F1が入力する第1文字C1を第2言語による当て字となる第2文字C2に変換する。例えば、変換部F2は、CPU2H01等によって実現される。
【0053】
設定部F3は、変換を行う変換単位の区切りを設定する。例えば、設定部F3は、入力装置2H03等によって実現される。
【0054】
表示部F4は、第2文字C2で構成される出力文字COUTを表示する。例えば、表示部F4は、出力装置2H04等によって実現される。
【0055】
なお、表示部F4は、コードCD、第2言語に変換後の音SD及び説明ACTを表示するのが望ましいが、必須ではない。
【0056】
<他の実施形態>
なお、全体処理は、図示する順序に限られない。例えば、各処理の一部又は全部は、並列又は図示する順序とは異なる順序で行われてもよい。また、各処理は、複数の情報処理装置によって、冗長、分散、並列、仮想化又はこれらを組み合わせて実行されてもよい。
【0057】
なお、本発明に係る情報処理方法は、プログラムによって実現されてもよい。すなわち、プログラムは、1以上の情報処理装置を含む情報処理システム等であるコンピュータに各処理を実行させるためのコンピュータプログラムである。
【0058】
したがって、プログラムに基づいて情報処理方法が実行されると、コンピュータが有する演算装置及び制御装置は、各処理を実行するため、プログラムに基づいて演算及び制御を行う。また、コンピュータが有する記憶装置は、各処理を実行するため、プログラムに基づいて、処理に用いられるデータを記憶する。
【0059】
また、プログラムは、コンピュータが読み取り可能な記録媒体に記録されて頒布することができる。なお、記録媒体は、磁気テープ、フラッシュメモリ、光ディスク、光磁気ディスク又は磁気ディスク等のメディアである。また、記録媒体は、補助記憶装置等でもよい。さらに、プログラムは、電気通信回線を通じて頒布することができる。
【0060】
以上、本発明の好ましい実施形態の具体例について詳述したが、本発明は、図面に記載された実施形態等に限定されない。すなわち、特許請求の範囲に記載された本発明の広範な要旨の範囲内において、種々の変形又は変更が可能である。