(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023152349
(43)【公開日】2023-10-17
(54)【発明の名称】日本語入力システムの漢字仮名変換
(51)【国際特許分類】
G06F 40/129 20200101AFI20231010BHJP
G06F 40/274 20200101ALI20231010BHJP
【FI】
G06F40/129
G06F40/274
【審査請求】未請求
【請求項の数】2
【出願形態】OL
(21)【出願番号】P 2022062288
(22)【出願日】2022-04-04
(71)【出願人】
【識別番号】505292063
【氏名又は名称】有限会社新英プラナーズ
(72)【発明者】
【氏名】河野 拓治
【テーマコード(参考)】
5B091
5B109
【Fターム(参考)】
5B091CC15
5B109MA05
(57)【要約】 (修正有)
【課題】より簡単な操作で利用者が選択する漢字のすべての「読み」を表示可能な日本語入力システムの漢字仮名変換方法を提供する。
【解決手段】変換方法は、候補の中に読みを調べたい漢字があれば、変換操作遷移キーを必要回数押すか、マウスで直接クリックし当該漢字を選択すれば、後は漢字仮名変換キーを押すだけで当該漢字のすべての読み及び品詞別の略号を表示できる、「漢字仮名変換キー」を押す前に「部分一致検索キー」を押したときは前方一致や後方一致などの部分一致したものも含める。
【選択図】
図1
【特許請求の範囲】
【請求項1】
コンピュータ上で動作する応用プログラムに日本語を入力する「仮名漢字変換/KEARM変換式日本語入力システム」(特願2022-017542の完全一致検索型逐次変換式日本語入力システムで、以後、仮名漢字変換/KEARM変換システムと呼ぶ)に、漢字仮名変換機能を追加するために「漢字仮名変換実行部」を組み込み、さらに操作に必要な論理キーである「漢字仮名変換キー」および「部分一致検索キー」を追加した日本語入力システムにおいて、
文字列入力後、逐次変換により表示された応用プログラム画面上の仮名漢字変換の変換候補一覧から、必要な操作キーまたはマウスを使って利用者が希望する変換候補である漢字または漢字交じり文(以後、「読みを調べる漢字」と呼ぶ)を選択した状態で、「漢字仮名変換キー」が押し下げられることにより「漢字仮名変換実行部」が主体となり以下のステップで実行される方法であって、
(1)仮名漢字変換/KEARM変換システムに内蔵の仮名漢字変換用辞書のすべての登録語句を「読みを調べる漢字」で検索し、完全一致があれば、その都度、登録語句と登録語句に対応する「読み」を括弧などで組合せるなどして漢字の「読み」が分かるようにし、さらに、品詞別のアルファベット略号(名詞のn、動詞のv、形容詞のaなど)を付加した変換候補文字列(例えば、神戸(コウベ)n、歩(アル)vなど)を作り、作成された複数の変換候補文字列を時系列順に並べた変換候補一覧用データを作るステップと、
(2)上記(1)の変換候補一覧用データを応用プログラムに送り、応用プログラム画面上に上書き表示させ漢字仮名変換の変換候補一覧として表示するステップと、
からなり、
上記(1)の完全一致のみの検索は標準動作とするものであり、例えば、「漢字仮名変換キー」を押す前に「部分一致検索キー」を押したときは前方一致や後方一致などの部分一致したものも含めるとしたものであり得る、
方法。
【請求項2】
請求項1に記載の「仮名漢字変換/KEARM変換式日本語入力システム」(特願2022-017542の完全一致検索型逐次変換式日本語入力システム)を、JISX4064規格に準拠または準じる他の仮名漢字変換式日本語入力システムに置き換えたシステムにおいて、
文字列入力しただけでは仮名漢字変換の変換候補一覧が表示されないシステムの場合は、それぞれのシステムに固有の方法で利用者が希望する変換候補一覧を表示させ、以後は請求項1で記載した内容と同様に、ステップ(1)で漢字の「読み」と品詞別の略号を含む変換候補一覧用データを作り、ステップ(2)で変換候補一覧用データを応用プログラム画面上に漢字仮名変換の変換候補一覧として上書き表示させ、
請求項1と同様に、ステップ(1)の完全一致のみの検索は標準動作とするものであり、例えば、「漢字仮名変換キー」を押す前に「部分一致検索キー」を押したときは前方一致や後方一致などの部分一致したものも含めるとしたものであり得る、
方法
【発明の詳細な説明】
【技術分野】
【0001】
「仮名漢字変換/KEARM変換式日本語入力システム」(非特許文献2の完全一致検索型逐次変換式日本語入力システムで、以後、仮名漢字変換/KEARM変換システムとも呼ぶ)に漢字仮名変換機能を追加するために必要な構成部分を組み込んだシステムにおいて、仮名漢字変換で得られた変換候補一覧から希望する漢字を選択後、漢字仮名変換キーを押すだけで、当該漢字の音読み、訓読みを含むすべての「読み」および品詞別の略号を表示でき、さらに検索方式を変えれば当該漢字の関連情報収集の目的にも使える方法に関する。
【0002】
仮名漢字変換/KEARM変換システムは、仮名漢字変換だけでなくKEARM変換および発音機能も含むが、本発明で読みを調べようとする漢字は仮名漢字変換で得られる漢字である。したがって、請求項2で記載のとおり、本発明は、仮名漢字変換/KEARM変換システムだけでなく、KEARM変換や発音機能を含まないJISX4064規格に準拠または準じる他の仮名漢字変換式日本語入力システムにも適用できる。
【0003】
本発明は、非特許文献2の段落番号0027で記述の多機能型日本語入力システムの項目(2)「日本語入力システムの漢字仮名変換」でもあり、
図10で示す多機能型日本語入力システムのブロック図において中央部分に位置する「漢字仮名変換」と左側部分の「漢字仮名変換キー」(いずれも背景をドットパターンのブロックで示す)に相当する。
図10の多機能型日本語入力システムは、仮名漢字変換/KEARM変換システム(背景を灰色のブロックで示す部分)を基幹部として12項目の機能を付加したシステムである。
【背景技術】
【0004】
本発明人が考案した特許文献1の漢字引き仮名変換も漢字の読みを調べる機能を持つが、この機能はどこでも実行できるわけではなく、事前に「読み」を調べようとする漢字を画面上でコピー処理し、システムが読み込みできる場所に貼り付ける動作が必要である。漢字の「読み」を表示するには結果的に数回の操作が必要になる。一方、本発明の漢字仮名変換は、逐次変換で表示されている変換候補一覧画面から希望する漢字を選択し、漢字仮名変換キーを押すだけで当該漢字の「読み」や品詞別の略号を表示できる。両者ともに日本語入力システムに内蔵されている仮名漢字変換用辞書の漢字を全検索し、一致する漢字を逆にたどって漢字の読みを抽出し、漢字と「読み」で構成する変換候補文字列データを作り漢字仮名変換の変換候補一覧として表示するものである。
【0005】
日本語の辞書は通常五十音の仮名を目次にして漢字を並べてあるので、分類上、仮名漢字変換辞書になる。これらの辞書を電子化し、仮名で入力して漢字に変換するだけでなく、漢字を入力し、逆に漢字の読みを調べるソフトウェアも簡単にできる。しかしこのソフトウェア自体に大した価値は認められない。理由は、利用するに値する必要な情報が得られないと思われるからである。しかし当該ソフトウェアでインターネット検索と同程度の漢字の情報が得られるのなら十分に利用価値がある。このソフトウェアと組み合わせて十分に利用価値があると考えられる辞書が日本語入力システムに内蔵されている仮名漢字変換用辞書である。
【0006】
市販の電子辞書や定期的に刊行される電子版の大型国語辞書も掲載する漢字の情報量は多いが、これらの辞書には致命的な欠点がある。それは情報の保守ができないことである。すなわち漢字の用語の追加ができない。日本語入力システムでも昔のワープロ専用機のようにROM化された辞書では同様である。日本語は日々進化している。生活習慣の変革に伴う新語や造語が生まれ、逆に従来使われていた漢字が廃れたりもする。新語や造語の数は少ないかもしれないが使われる頻度は高い。仮名漢字変換用辞書では新語・造語は簡単に追加できる。日本語入力システムのメーカーも辞書の更新には意欲的である。理由は、辞書に最新の漢字情報が載せられていなければ日本語入力システムで完璧な文章が書けないからである。
【0007】
現在、情報の保守ができる辞書は、本発明の漢字仮名変換とは関係ないが、インターネット上で動作する無料の百科事典ではないだろうか。この辞典では情報の保守を維持するための手段として、誰でも自由に編集ができるようにしている。欠点は、特定の勢力の意見や政治的なプロパガンダに使われることがあるため、不正確または偏った情報が載せられることがありえることである。一方、日本語入力システムの仮名漢字変換用辞書は日本語入力システムのメーカーの企業秘密に属し、ユーザーは操作の一環として辞書を使うことはできるが辞書の内容は公開されていない。辞書の内容は仮名漢字変換の変換性能と密接に関係するので公開していないと思われるが、上記百科辞典のように不正確な情報が紛れ込まないという利点にもなる。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】漢字引き仮名変換機能付き日本語入力システム 特許第6319542号公報(段落番号0017~0019、表1、
図1)
【非特許文献】
【0009】
【非特許文献1】仮名漢字変換システムの基本機能 JISX4064: 2002
【0010】
【非特許文献2】仮名漢字変換/KEARM変換式日本語入力システム 特願2022-017542(段落番号0233~0236、
図9、
図49)
【発明の概要】
【発明が解決しようとする課題】
【0011】
特許文献1の漢字引き仮名変換の機能は、「読み」を調べたい漢字をPC画面上に見つけると、まず当該漢字をコピーして当該システムで読み込み可能な場所に貼り付ける作業から始める。コピー作業および読み込み作業のみなので入力作業が必要な本発明とは異なる機能ではあるが、漢字の「読み」を調べるには結果的に数回の操作が必要になる。より簡単な操作で利用者が選択する漢字のすべての「読み」を表示できれば発明の適用範囲が広がると思われる。また特許文献1では漢字の単語の読みを調べるのが目的なので基本的に名詞形の漢字の「読み」を調べることになるが、本発明では名詞形だけでなく動詞や形容詞などの漢字の「読み」も対象とする。
【課題を解決するための手段】
【0012】
仮名漢字変換/KEARM変換システムは逐次変換システムなので文字列を入力しただけで逐次変換画面に仮名漢字変換の変換候補一覧を表示できる。変換候補の中に「読み」を調べたい漢字があれば変換操作遷移キーを押すかマウスを使って当該漢字を選び、当該漢字を変換用文字列(検索・変換に使う文字列)として仮名漢字変換用辞書の漢字を全検索し、一致した漢字があればその都度逆にたどって漢字の「読み」を抽出し、漢字と「読み」を組み合わせた変換候補文字列を作成し、それらを変換候補として時系列順に並べて変換候補一覧画面として表示する。仮名漢字変換で処理済みの漢字なので、名詞形たけでなく動詞形や形容詞の漢字の読みにも対応できる。
【0013】
特許文献1の漢字引き仮名変換と本発明の漢字仮名変換は、変換処理の後半部分である検索・文字列変換および変換候補表示の部分は両者ともほぼ同じである。本発明では、日本語入力システムとして使用している逐次変換方式を生かし、変換処理の前半部分である漢字の選択方法を簡素化し、さらに漢字の読みだけでなく、何の品詞として使われているか分かるように品詞別の略号を付加し、また完全一致検索と部分一致検索による用途分けなどで漢字引き仮名変換との差別化ができるので、変換名称も特許文献1の漢字引き仮名変換でなく本発明では漢字仮名変換と命名している。
【発明の効果】
【0014】
特許文献1の漢字引き仮名変換と本発明の漢字仮名変換の「読み」を調べようとする漢字の選択方法を比べると、本発明の方が圧倒的に簡単である。簡単ではあるが、変換機能を簡略化しているわけではなく、仮名漢字変換用辞書の登録漢字をすべて検索するので、音読み、訓読みを含む日本語で使用されるすべての「読み」を表示できる。
【0015】
特許文献1の漢字引き仮名変換は漢字の単語の「読み」を調べるものであり、基本的に名詞形の漢字の読みを調べるものである。本発明の漢字仮名変換では、名詞形だけでなく動詞や形容詞の漢字の読みもすべて表示できる。そのため漢字仮名変換の変換候補一覧には漢字の読みだけでなく品詞別の略号も付加している。
【0016】
本発明では検索方式により用途を使いわけており、完全一致検索では音読み、訓読みを含む漢字のすべての「読み」と品詞別の略号を表示でき、部分一致検索では、仮名漢字変換用辞書に含まれる苗字、名前、地名、市町村名、駅名、港名、空港名など様々な用語が検出できるので選択した漢字の関連情報収集の目的で使える。
【0017】
本発明を実行する漢字仮名変換実行部は、従来の仮名漢字変換実行部をそのまま使い、入出力処理および変換処理のみを変えたものである。したがって、本発明の漢字仮名変換は、市販の殆どの仮名漢字変換式日本語入力システムにも適用できる。
【図面の簡単な説明】
【0018】
【
図2】「仮名漢字変換/KEARM変換式日本語入力システム」に、仮名漢字変換機能を追加するために必要な構成部分(点線で囲んだ箇所)を組み込んだシステムのブロック図
【
図3】
図2の「漢字仮名変換実行部」52の動作説明図
【
図4】
図3の「仮名漢字変換/KEARM変換実行部」4~33の動作説明図
【
図7】実施例1 漢字仮名変換の画面遷移図(完全一致検索)
【
図8】実施例2 漢字仮名変換の画面遷移図(完全一致検索)
【
図9】実施例3 漢字仮名変換の画面遷移図(部分一致検索)
【発明を実施するための形態】
【0019】
本書では各種用語を使うので、先に用語の説明をしておく。JISX4064規定用語及びコンピュータ用語はここには含めない。本発明では仮名漢字変換/KEARM変換システムが持つ仮名漢字変換の機能のみを使い、他の機能であるKEARM変換や発音機能は使っていない。したがって本書では仮名漢字変換/KEARM変換システムのKEARM変換や発音機能についての説明は略している。また他の会社や団体等が提供している有料または無料の仮名漢字変換式日本語入力システムは便宜上「市販の~」と呼ぶ。
【0020】
(A)用語のまとめ
用語は順不同で個別に説明してある。
(ア)日本語入力システム
仮名漢字変換式日本語入力システム(JISX4064で規定、又はそれに準じるシステム)であってコンピュータキーボードおよび十分な大きさのモニターと組み合わせるパソコン用日本語入力システムである。検索方式には、完全一致検索による「一括変換式」と前方一致検索による「予測変換型」がある。仮名漢字変換/KEARM変換システムは一括変換式ではあるが、変換起動部があり1文字入力ごとに完全一致検索による一括変換を繰り返す「逐次変換式」である。「予測変換型」も前方一致検索による逐次変換式ではあるが、ここでは完全一致検索による逐次変換式を「逐次変換式」としている。
(ア)(a)一括変換式
JISX4064規格の仮名漢字変換システムは、文字列を入力後、利用者が変換キーを押すと、入力文字列を漢字の読みとして文節分けし、文頭から順に完全一致検索・変換を行う。変換後、文節の区切り位置変更や文節単位での別候補の選択などの編集もできる。最後に確定キーを押し各文節の変換結果の文字列を確定文字列として応用プログラムに入力する。
(ア)(b)予測変換型
1~3文字入力すると、システムが自動的に変換を開始し、入力文字列を漢字の読みとし、前方一致検索を基にシステムが予測変換候補を複数提示し利用者が希望する候補を順次選択して確定文字列を作成していく方式。ただし、利用者が候補を選択しないで入力し続けるとだんだん予測変換候補が少なくなり、最後は完全一致検索による候補一つになり、(c)逐次変換式と同じような動作になる。
(ア)(c)逐次変換式
JISX4064規格の完全一致検索・一括変換方式を踏襲し、かつ、1文字入力ごとに新たに変換を開始する変換起動部を付加した完全一致検索型逐次変換式システムである。この方式の特徴は、入力文字列に完全対応した変換候補を逐次出せることにある。一括変換式と同様に変換後の編集もできる。
(イ)入力モード
平仮名、片仮名、全角英数、半角片仮名、半角英数及びMPモードの6つのモードと日本語入力システムが介入しない直接入力モードがある。最初の5つのモードは市販のシステムと同じで逐次変換の入力に使う。MPモードは本発明では使わない。
(ウ)出力言語選択スイッチ
KEARM変換用なので本発明では使わない。
(エ)辞書
逐次変換では仮名漢字変換用辞書、ユーザー辞書および自動生成辞書を使う。仮名漢字変換用辞書は標準的な内容なので変更はできない。ユーザー辞書は標準装備されたツールで利用者が登録語句を追加・削除できる。自動生成辞書は逐次変換で英数記号・符号の処理のためシステムが必要に応じ自動的に作成・削除する。
(エ)(a)仮名漢字変換用辞書
図6で示す構造の辞書であり、仮名で「読み」を検索し対応する漢字を得ることで仮名漢字変換を行う。漢字仮名変換では、読みを調べようとする漢字で登録漢字を全検索し、一致すると逆にたどって漢字の読みを抽出し、漢字と「読み」さらに品詞別の略号を加えた変換候補文字列を作り、それを時系列順に並べて変換候補一覧を作る。
(エ)(b)ユーザー辞書
仮名漢字変換用辞書と同じ構造の辞書で、仮名漢字変換用辞書の補助用に使う。システムに標準装備されたツールで語句を追加・削除できる。
(エ)(c)自動生成辞書
英数記号・符号などを処理するため、システムが当該文字列を自動的に専用の辞書に登録する。逐次変換で使い更新はされず変換終了後、上書き削除される。
(オ)変換モード
逐次変換、新予測変換、KEARM優先変換及びMPモードがあるが、本発明では逐次変換モードのみを使う。
(オ)(a)逐次変換モード
1文字入力ごとに完全一致検索による変換を行うモードで、仮名漢字変換、ANS変換、KEARM変換及び自動生成辞書変換を行う。KEARM変換は本発明では使わない。漢字仮名変換もこのモードで実行する。
(カ)動作モード
ND、ADP、AD及びARPモードがある。単語・語句などの単文節の変換はNDモードのみ使い、文章の変換ではND --> ADP --> ADモードの順で変換を行う。漢字仮名変換はADモードで実行する。ARPモードは本発明では使わない。
(カ)(a)ND(Non-Div)
単語・語句などの単文節の変換に使う。複文節となる文字列の変換でも最初は単文節か否かのチェックが必要なためNDモードから変換を始める。
(カ)(b)ADP(AutoDivProcess)
複文節となる文字列を第1文節から順次、文節分けし、仮名漢字変換、ANS変換、KEARM変換または自動生成辞書変換を行う。ADPモードでの変換の目的は、各文節の最も適した変換候補を選ぶこと。KEARM変換は本発明では使わない。
(カ)(c)AD(AutoDiv)
ADPでの変換終了後、ADモードで第1文節に戻り、入力バッファss11[0]を変換用文字列として再度変換する。以後、左右の矢印キーで文節移動した場合も同様に入力バッファss11[n](nは文節番号0~49)を変換用文字列として変換を行う。ADモードでの変換をAD変換と呼ぶ。AD変換の目的は変換候補を最大数得ること。ただし逐次変換画面の標準では5候補に限定している。漢字仮名変換は変換候補一覧表示後の動作なのでADモードで行う。漢字仮名変換では候補数も多くなるので変換候補は1画面9候補表示の画面を使う。
(キ)入出力文字表示
応用プログラムの画面上で入出力文字列を表示する部分。この部分は画面枠はないが表示構造を持つ画面であり、表示する文字列は表示属性に沿って下線表示をする。入力文字列は同じ文字種である表示用文字列となり入力文字表示として使われる。逐次変換モードでは変換候補一覧画面への遷移後は表示用文字列ではなく選択候補である変換結果を表示する。
(キ)(a)入力文字列
キーボードから本システムに入力される文字列であるが、入力処理部で表示用文字列と変換用文字列に分けられ、実際に入力表示に使われるのは同じ文字種の表示用文字列である。
(キ)(b)表示用文字列
入力文字列と同じ文字種で応用プログラムの入出力文字表示の画面で入力文字列の表示用に使われる。
(キ)(c)変換用文字列
逐次変換モードで変換時の検索用入力として使われる文字列で、入力文字列が仮名の場合は全角片仮名が使われる。英数文字記号・符号では入力文字列がそのまま変換用文字列となる。漢字仮名変換では変換候補一覧表示の選択候補である漢字が変換用文字列となる。
(キ)(d)表示属性
逐次変換モードでの入出力文字表示は、表示属性を指定して文字列に特有の下線を引く。標準設定では、逐次変換画面の表示属性は「入力」(点線)で、変換候補一覧画面では、利用者が作業中の分節を「変換済み注目文節」(実線太線)とし、その他の文節を「変換済み文節」(実線細線)で区別する。
(キ)(e)変換結果
逐次変換画面から変換候補一覧画面への遷移後に入出力文字表示に表示される文字列は選択された候補であり変換結果と呼ぶ。変換操作遷移キーによる初動操作では変換第1候補が変換結果になるが、マウスで直接他の候補を選ぶこともできる。複文節では当該文節だけではなく第1文節から最終文節までの出力バッファss12[n](nは文節番号0~49)を組み合わせた文字列になる。確定キーを押すと変換結果の文字列が確定文字列となる。漢字仮名変換は変換候補一覧画面への遷移後の動作であるが逐次変換モードで行うので変換後の処理は逐次変換とほぼ同じになる。
(ク)逐次変換画面
逐次変換モードで文字列を入力しただけの画面であるが、仮名漢字変換/KEARM変換システムには変換起動部があるので1文字入力ごとに逐次変換を行い、単文節では変換候補一覧を表示し、複文節では各文節の変換第1候補を組み合わせた文字列を表示する。入出力文字表示は入力文字列と同じ文字種である表示用文字列を表示する。漢字仮名変換は変換候補一覧画面で行うのでこの画面では変換は行わない。
(ク)(a)変換出力(逐次変換画面用)
変換出力は変換して得られた文字列出力であり、仮名漢字変換およびANS変換では以下のように処理する。単数または複数の変換出力を統合し優先度を基に一元化した出力が変換情報szBufzになる。
(1)仮名漢字変換では、仮名漢字変換用辞書及びユーザー辞書を使い、1文字入力ごとに変換用文字列を入力として検索・変換を行う。例えば、変換用文字が「シ」で、得られた変換候補が「し」、「市」、「氏」、「死」・・・の場合、これらの変換候補を時系列順に並べて文字変数に保存し、文字列情報「し 市 氏 シ 死 ・・・」を得る。この文字列情報が変換出力になる。変換出力の各候補の末端には制御文字\0を置く。変換出力は辞書の品詞等により階級分け(項番と呼ぶ)し、副詞・名詞(項番4)は文字変数szBufa、名詞+助詞(項番5)は文字変数szBufb、動詞(項番8)は文字変数szBufc、ユーザー辞書(主として項番2)は文字変数UserDicに保存する。
(2)ANS変換は、仮名漢字変換ができない英数記号・符号の変換であり、JIS規格と同様に広義には仮名漢字変換の機能に含まれる。ANS変換では、ユーザー辞書、自動生成辞書を使うか、または辞書を使わず専用プログラムで変換し、数字・記号は全角/半角変換または半角/全角変換を行い、数字は漢数字変換も行われるが、括弧などの符号は類似の各種符号に変換される。変換された文字列を候補としてまとめた文字列情報が変換出力となる。変換出力の各候補の末端には制御文字\0を置く。名詞(項番4)は文字変数szBufa、名詞+助詞(項番5)は文字変数szBufb、ユーザー辞書(主として項番2)は文字変数UserDic、単文節のプログラム変換(項番1、項番6)による変換出力は文字変数szSymbolに保存する。
(ク)(b)逐次変換確定キー
逐次変換画面の変換第1候補は、変換時における入力文字列(及び表示用文字列)に対して一対一で対応する出力で、かつ、最も適した変換候補である。また変換第1候補が選択候補になっているので、逐次変換画面ではこの論理キー(物理キーはShift+Enterキー)を押せば変換第1候補を確定文字列として出力できる。市販の予測変換型は入出力が一対一に対応していないので必ず利用者が候補選択するというステップが必要である。
(ケ)新予測変換
本発明では使わない。
(コ)変換候補一覧画面(変換操作画面とも呼ぶ)
逐次変換画面から変換操作遷移キーを押すと変換操作画面である変換候補一覧を表示する画面になる。漢字仮名変換はこの画面で実行する。実行後の処理もこの画面の処理とほぼ同じである。
(コ)(a)出力順位(変換候補一覧画面用)
変換候補一覧画面の変換候補の出力順位(変換第1候補を先頭とする配置順)は、変換操作遷移キーを押して変換候補一覧画面に遷移した場合は逐次変換画面の出力順位と同じである。
(コ)(b)変換出力(変換候補一覧画面用)
変換候補一覧画面では左右への文節移動またはマウスで任意の文節をクリックしたとき、各文節の入力バッファss11[n](nは0~49)の文字列を入力としてAD変換が行われる。逐次変換画面の変換と同様にAD変換で得られた候補の文字列を時系列順に並べて文字変数に保存し変換出力とする。例えば、仮名漢字変換では「し 市 氏 シ 死 ・・・」のように文字変数に保存し、変換出力とする。ANS変換では全角/半角変換または半角/全角変換、漢数字変換や各種文字種変換による変換出力になる。いずれの変換出力も各候補の末端には制御文字\0を置く。仮名入力では仮名漢字変換、英数記号入力ではANS変換またはKEARM変換になるが、本発明ではKEARM変換は使わない。変換出力のまとめ方は、(ク)(a)変換出力(逐次変換画面用)とほぼ同じで、最終の変換出力を文字変数szBufzに保存し変換情報とする。
(コ)(c)変換操作遷移
逐次変換画面から変換候補一覧画面に遷移させる操作である。変換操作遷移キーは論理キーであり物理キーは用途で異なる。仮名漢字変換の逐次変換モードでは、Spaceキーなどを使う。マウスで直接希望する候補をクリックすれば同様の働きと同時に候補選択もできる。標準では変換候補は逐次変換と同じで最大5つまでの変換候補一覧を表示する。変換候補を最大数表示させるときは物理キーとして[変換]キーを使う。
(コ)(d)選択候補
変換候補一覧画面で希望する候補を上下矢印キーやマウスで選択できる。選択された候補は選択候補と呼ぶ。仮名漢字変換では単独の選択候補となり背景色は薄青になる。逐次変換モードでは選択候補は変換結果になる。漢字仮名変換では選択候補が変換用文字列となる。
(サ)仮名漢字変換
仮名を入力して漢字交じり文に変換すること。JISX4064で規定の仮名漢字変換では英数記号・符号の変換も含むので、逐次変換モードでも広義の仮名漢字変換は(シ)ANS変換も含む。
(シ)ANS変換
逐次変換で、英数記号・符号をANS(AlphaNumeric and Symbol)と呼ぶ。ANSの全角英数記号は半角英数記号に変換(全角/半角変換)し、半角英数記号は全角英数記号に変換(半角/全角変換)し、それぞれの変換用文字列と対にして2つの変換候補にする。数字の場合は漢数字にも変換する。括弧などの符号は各種の類似符号に変換する。
(ス)漢字情報変換、(セ)会話文変換、(ソ)再変換機能、(タ)メモ機能
いずれも本発明では使わない。
(チ)漢字仮名変換
変換候補一覧画面から希望する変換候補の漢字を選び、論理キーである漢字仮名変換キーを押すと仮名漢字変換用辞書の漢字を全検索し、一致した漢字の読みを逆にたどり漢字と読みを組み合わせ、さらに品詞別略号を付加した変換候補文字列を作り、それを変換候補一覧として表示させる機能。完全一致検索では文字通り当該漢字の読みと品詞別略号を表示する一覧となるが、部分一致検索では一致する漢字が多くなり、漢字の読みというよりは、当該漢字の関連文字列情報を示す一覧となる。
(チ)(a)漢字仮名変換キー
漢字仮名変換を開始させるキー(論理キーであり、物理キーはCtrlキー)
(チ)(b)部分一致検索キー
漢字仮名変換の標準検索方式は完全一致検索であるが、漢字仮名変換キーを押す前に部分一致検索キー(論理キーであり、物理キーはShiftキー)を押すと、完全一致だけでなく前方一致や後方一致も含む部分一致検索で漢字仮名変換を行う。
(ツ)漢字引き仮名変換、(テ)文章分割・変換、(ト)KEARM変換、(ナ)用語属性、(ニ)KEARM学習変換、(ヌ)KEARM定型変換、(ネ)KEARM詳細変換、(ノ)KEARM優先変換
いずれも本発明では使わない。
(ハ)用語情報
英数記号・符号は下記のとおりANS(Alpha-Numeric and Symbol)コード1~4で区別している。仮名漢字変換用辞書およびユーザー辞書に登録している用語には、要素情報として下記のとおりa~?のyougoCodeが付けてあり、数値換算で5~33に対応させている。両者を組み合わせた1~33を静的情報とし、さらに変換出力szBufa~szBufcで得られた動的情報(名詞、動詞、形容詞などの判断)を加味した1~256を用語情報として変換候補ごとにszBufzcode[n](nは0~499の候補番号)に保存する。prevCodeは変換第1候補であるszBufzcode[0]の用語情報で次の文節の変換時の情報として使う。次の文節との関係に格助詞が入る場合に使うprevCode1もある。szBufzcode[n]は変換候補を画面に表示させるときに下線を引いたり背景色を変えるために使う。
(ハ)(a)ANSコード(英数記号・符号Alpha-Numeric and Symbol)を数値1~4に対応させる。
1:数字 2:英字 3:記号(#$等)4:符号(「 」等)
(ハ)(b)yougoCode(必要に応じて使うのですべてを使うわけではない)
下記のコード(a ~ ?)を数値5~33に対応させる。
a:名字 b:名前 c:国名or東京の地名 d:東京以外の地名 e:苗字・名前兼用・中性名詞 f:人系名詞1(~監督、~君等)g:人系名詞2(被害者、大工等)h:人間の五体部分 i:食用植物 j: 乗物 k:期間(~週間等) l:動物 m:時期(3月等)n:自然現象 o:地形・古跡 p:連体詞・接続詞 q:中国語r:片仮名の擬態語 s: メモ機能t:漢数字 v:一般動詞w:五段活用音便2の動詞 x:形容詞 y:形容動詞z:動詞系名詞(驚き等)以降省略 ?:旧市町村名(与野市等)
下記のコード(*および+)は、上記コード(a ~ ?)に付加して併用できる。
*: 漢字情報変換で使われ、付加すると数値では+120され、変換候補の背景色を薄黄にする。
+: 仮名漢字変換の確定を2回行うと付加され、付加すると数値で+80され、該当する用語は優先使用される。
(ハ)(c)prevCode(必要に応じて使うのですべてを使うわけではない)
0:無し 1:数字 2:英字 3:記号($等)4:符号(「、{等) 5:名字 6:名前 7:国名or東京の地名 8:その他の地名 9:名字・名前兼用・中性名詞 10:人系名詞1(~さん、~君等)11:人系名詞2(被害者、大工等)12:人間の五体部分 13:食植物 14: 乗物 15:期間(~週間等) 16:動物 17:時期(3月等)18:自然現象 19:地形・古跡 20:連体詞・接続詞 21:第一候補以外の名字 22: メモ機能39:名詞節 40:漢数字 60:動詞(未然形含む)61:動詞(連用形)62:動詞(終止・連体形)70:形容詞1 (次節が名詞形)71:形容詞2(次節が動詞または名詞形)80:副詞相当 81:動詞形副詞(~て、~で)以降省略 94:KEARM変換実施節 97:AR変換実施節102~118:複合動詞の処理(買い続ける等)126:KEARM定型変換実施節 130:漢字仮名変換実施節
(ハ)(d)prevCode1(次節との関係に格助詞が絡む場合に使う。必要時のみ使う)
0:無し 1:人系名詞+格助詞(被害者が通う) 2:数量名詞+格助詞(3枚はある)3:人間の五体部分+格助詞(足を押さえる)5:食用植物+格助詞(みかんの皮 )6:乗物+格助詞(バスの車内)7:地域+格助詞(新潟で地震)8:時間・期間+格助詞(3月に会う)11:無使用 12:地形・古跡+格助詞(城の跡)
(ハ)(e)szBufzcode[n](nは候補番号0~499)
szBufzcode[n]は変換された全候補の用語情報で、n番目の候補の背景色を変えたり下線を引いたりする情報に使う。
(ヒ)変換情報
逐次変換では仮名漢字変換、ANS変換およびKEARM変換の変換出力szBufa~szBufc、UserDic、szSymbolの文字列から得られた最終の変換出力が変換情報szBufzとなる。本発明ではKEARM変換は使わない。複文節の逐次変換画面から変換操作遷移キー(Spaceキーや矢印↓キーなど)を押すと、AD変換が行われる。左右の矢印キーを押すと文節移動が行われ同様にAD変換を行う。AD変換においても変換出力szBufa~szBufcおよびUserDicの文字列情報から得られた最終の変換出力が変換情報szBufzとなる。変換情報は変換候補一覧を示す文字列情報である。
(フ)出力情報
逐次変換の出力情報は、単文節の変換候補一覧情報を示す変換情報szBufzか、複文節の各文節の変換出力の変換第1候補を並べたss12[0]~ss12[n](nは文節番号0~49)を示す文字列情報かにより異なる。単文節の変換情報か複文節の文字列情報かで判断し、文字変数szBufCanに保存して出力情報とする。このとき標準では変換情報の変換候補は最大5つに制限する。AD変換の出力情報は、各文節の変換候補一覧情報を示す変換情報szBufzとなる。
(ヘ)文節情報(抜粋のみ)
用語情報はそれぞれの文節の情報であり候補ごとの情報を持つが、文節情報は文節代表としての情報である。文節情報を示す文字変数はArrayAuto[n][m]である。nは文節番号で0~49、mは0~12である。
(ヘ)(a)ArrayAuto[n][2]: 文節情報
用語情報yougoCodeを保存する。
(ヘ)(b)ArrayAuto[n][5]: 文節情報
用語情報prevCodeを保存する。
(ヘ)(c)ArrayAuto[n][6]: 文節情報
用語情報prevCode1を保存する。
(ホ)入力バッファ/出力バッファ
複文節の変換では各文節の変換用文字列と変換後得られる変換情報の変換第1候補または選択候補を各文節ごとに保存しなければならない。そのための文節ごとに文字列を保存するためのバッファである。入力、出力および補助用にKER用バッファがあり、最大50(nは文節番号0~49)まで文節分けができる。文字列は128まで保存可能。
入力バッファss11[n][128]: 各文節の変換用文字列を保存。
出力バッファss12[n][128]: 各文節の変換第1候補または選択候補を保存。
KERバッファss12k[n][128]: 補助用。
(マ)関数一覧(抜粋のみ、標準関数は含まず)
ほとんどは本発明用に新規開発したもので、一部は既存の関数に機能追加したもの。
(a)AddCharN: 出力文字表示実行用関数
(b)ConvCandidate: 変換候補表示実行用関数
(c)ConvPhrase: 仮名漢字変換/ANS変換/KEARM変換/漢字仮名変換/漢字情報変換実行用関数
(d)DicWrite: ユーザー辞書登録用関数で自動生成辞書の登録にも使う
(e)GetKanjiWord: 漢字の読み・情報検索用用関数
(f)GetRefWord: 仮名漢字組合せ情報取得用関数
(ミ)変数(抜粋のみ)
(a)AD: ADモードのとき1となる
(b)ArrayStart: 逐次変換画面時は-1、変換操作画面時は注目文節番号(0~49)
(c)ArraywAdd[n][m]: 変換候補表示文字の語尾長(nは文節0~49、mは0~511)
(d)ChikujiHenkan: 逐次変換モードのとき1となる
(e)KanjiKanaHenkan: 漢字仮名変換実行時1となる
(f)nArray: 文節番号0~49の整数
(g)nEnable: 文書解析用整数
(h)nLength: 文書解析用補助整数
(i)n1: NDモードでの変換用文字変数ss1の文字長
(j)n1Auto: ss1Autoの文字長
(k)ShiftOnAD: 部分一致検索を示す変数
(l)ss1: 文字変数として多用途に使う
(m)ss1Auto: ADP及びARPモードでの変換用文字変数
(n)ss1Cand: 出力文字表示用文字変数
(o)ss5[n]: 変換候補表示用文字変数(nは候補番号0~499)
(p)szBuf: 変換文字列収集用文字変数(単独情報収集用)
(q)szBuf3: 変換補助情報用文字変数
(r)szBufCan: 変換終了時の出力情報用文字変数
(s)szBufa: 名詞(項番4)の変換出力用文字変数
(t)szBufb: 名詞+助詞(項番5)の変換出力用文字変数
(u)szBufc: 動詞(項番8)の変換出力用文字変数
(v)szBufz: 最終の変換出力用文字変数(変換出力の一元化情報)
(w)szBufzcode[n]: 変換終了時の用語情報、nは候補番号0~499
(x)szSymbol: プログラム変換出力用文字変数
(y)UserDic: ユーザー辞書変換出力用文字変数
(z)yougotitle: 書込み文字列代入用文字変数1
(α)yougo: 書込み文字列代入用文字変数2
(β)yougomode: ユーザー辞書書込みモード用整数
(B)動作説明および実施例
【0021】
図2は仮名漢字変換/KEARM変換システムに、仮名漢字変換機能を追加するために必要な構成部分(点線で囲んだ箇所)を組み込んだシステムのブロック図である。本発明では、仮名漢字変換以外で使う「KEARM変換用辞書」38、「出力言語選択スイッチ」39および「KEARM変換音声出力部」40は使用しないので、本発明の漢字仮名変換は、市販の殆どの仮名漢字変換システムにも適用できる。
【0022】
漢字仮名変換は、変換候補一覧から選んだ変換候補である漢字を変換用文字列として仮名漢字変換用辞書の登録語句を全検索し、一致した漢字を逆にたどって漢字の読みおよび品詞別略号を表示する方法である。特許文献1の漢字引き仮名変換ではPC画面上の漢字を読み込んで変換用文字列とするが、本発明では仮名漢字変換の変換候補一覧から選んだ漢字を変換用文字列として使うという違いがある。したがって両者が共通の部分は変換用文字列を使って漢字の読みを調べ、変換候補一覧で表示する後半の部分であり、特許文献1の段落番号0017~0019に記述され、表1および
図1の符号6~7に関する説明の部分である。
【0023】
ただし両者を実行するシステムが異なるので画面表示は異なる。さらに本発明では漢字の名詞形だけでなく漢字の動詞形の読みも表示できる。そのため漢字の読みだけでなく品詞別の略号も表示させている。また本発明では漢字仮名変換の結果が検索方式で異なることに注目し、完全一致検索と部分一致検索で使い分けできるようにした。完全一致検索では漢字の音読みおよび訓読みのすべての読みおよび品詞別略号を表示でき、部分一致検索では一致する登録語が多くなるので、当該漢字に関連する文字列情報を収集する目的で使える。最初に実施例1として、検索方式を完全一致検索にした場合の漢字の名詞形の読みを表示する動作例を示す。
【実施例0024】
図7(1)逐次変換画面および(2)変換候補一覧画面は、非特許文献2の
図49(1)逐次変換画面および(2)変換候補一覧画面と同じ画面であり、両画面の動作は非特許文献2の段落番号0233~0236の実施例31で説明している。本発明の漢字仮名変換の実施例1は、
図7(2)変換候補一覧画面から仮名漢字変換キーを押して漢字仮名変換を実行する動作例である。漢字仮名変換は、
図2の「漢字仮名変換実行部」52で行う。変換動作を
図3で説明する。
【0025】
図3の「漢字仮名変換キー操作」71aで漢字仮名変換キー(論理キーであり、物理キーはCtrlキー)を瞬時的に押すと、「漢字仮名変換を実行するための変数の設定」71bで各種変数の設定を行う。
図7(2)変換候補一覧画面の動作は逐次変換モードで実行されており、漢字仮名変換も逐次変換モードで実行するので逐次変換モードを示す変数ChikujiHenkanはそのまま1とし、動作モードも、
図7(1)逐次変換画面から(2)変換候補一覧画面に遷移したときにADモードになっており、そのまま変数AD = 1とし、注目文節番号を示す変数ArrayStartも同様に
図7(2)変換候補一覧画面に遷移したときのままでArrayStart = 0となる。次は、漢字仮名変換を実行するために変数KanjiKanaHenkan を 1にする。最後に検索方式による設定で、本発明の標準検索方式は完全一致検索であり実施例1も完全一致検索とし、部分一致検索キー(論理キーであり、物理キーはShiftキー)は押さずに変数ShiftOnADは0となる。
【0026】
次に
図3の「漢字仮名変換を実行するための変数の設定」71bから「仮名漢字変換/KEARM変換実行部」4~33をAD入力から起動する。このときの変換用文字列は、仮名漢字変換のときのように
図2の「入力部」1~3からの仮名入力ではなく
図3の「変換候補表示実行部」34aからの出力である変数ss5[n]であり、変換第1候補であるss5[0]の「神戸」である。このとき変換候補表示文字の語尾長を示す変数ArraywAdd[nArray][m](mは候補番号で0)を参照して「神戸」の語幹を求める。例えば、変換候補が「神戸の」であった場合は、「の」の部分の文字長がArraywAdd[nArray][0] = 1で検出できるので、語幹の部分の「神戸」のみを得ることができる。理由は、辞書の登録語句はすべて語幹で登録されているので漢字仮名変換で漢字を検索するには語幹が必要になる。本実施例の「神戸」の場合はArraywAdd[nArray][0] = 0になるので「神戸」がそのまま変換用文字列となる。次に、「仮名漢字変換/KEARM変換実行部」4~33の動作を
図4および
図5で説明する。
【0027】
図4のADの指定入力から「変換開始」で始まり「動作モード」4の判断に入り、ADから出てOR入力で「変換部」9に入りAD変換を行う。入力部分を2本の平行線で示しているのはORゲートを簡易的に示したもので以降の全ての図面でも同様に使う。「変換部」9の動作説明図である
図5の表では、行番号1、動作モードがAD、項番4で関数GetCandidateStringsFromDictionaryおよび関数GetKanjiWordを使って漢字仮名変換を行う。項番4のみになっているのは、変換用文字列が語幹のみであり語尾が含まれていないからである。変数ShiftOnADが0なので完全一致検索で変換を行う。漢字仮名変換の方法は、特許文献1の段落番号0017で記述され、表1および
図1の「漢字引き仮名変換と文字列変換」6について説明された方法と基本的には同じである。特許文献1では関数AlphaPhraseを使っているが本発明では関数ConvPhraseで処理している。変換方法は、変換用文字列である「神戸」で仮名漢字変換用辞書のすべての「読み」ごとに順に登録語句の検索を行い、変換用文字列と完全一致(ShiftOnAD = 0の場合)する漢字の語句が見つかると、その語句と、その語句に対応する「読み」、さらに品詞別の略号を組み合わせて変換候補文字列を作る。組み合わせる方法は、語句の後に、「前括弧+片仮名の読み+後括弧」とし、さらに辞書内の登録語句は品詞別に並んでいるので名詞(n)、動詞(v)、形容詞(a)、形容動詞(b)、副詞・連体詞など(p)に分けて英小文字を添付させ、例えば、神戸(カノト)nのような形式にする。変換候補文字列を時系列順に並べて変換候補一覧用データを作り、変数szBufaに変換出力として保存する。原則的には検索する辞書はシステムが標準装備している仮名漢字変換用辞書のみであるが、ユーザーが登録できるユーザー辞書も同じ構造の辞書なのでユーザー辞書の登録語句も検索対象に含めることもできる。すべての語句の検索が終われば検索は終了とする。
【0028】
特許文献1の段落番号0018で指摘のように、仮名漢字変換では漢字の目次となる「読み」だけを検索するが、漢字仮名変換では漢字の全検索になるのでコンピュータの処理時間が長く続くことになり通常のメッセージ機能を阻害しメッセージエラーになる可能性があるので、プログラムをマルチスレッド化する必要がある。
【0029】
漢字仮名変換の変換出力が得られると
図4に戻り「変換部」9を終了し、AD変換のADから出てOR入力で「出力選択」14bに入る。ここで変換出力szBufaを変換情報としてszBufzに保存し、入力バッファss11[0]には変換用文字列の「神戸」、出力バッファss12[0]には変換第1候補である「神戸(カノト)n」を保存する。さらに「単/複出力選択」21で変換情報szBufzを出力情報としてszBufCanに保存し、
図4の「変換成功」から出て
図3の「仮名漢字変換/KEARM変換実行部」4~33の出力情報szBufCanになる。以降の漢字仮名変換の変換候補一覧の表示部分は、特許文献1の段落番号0019で記述され、表1および
図1の「変換候補一覧表示」7について説明された部分に相当する。
【0030】
図3の「仮名漢字変換/KEARM変換実行部」4~33から出た出力情報szBufCanは、応用プログラムとのインターフェース部である「変換候補表示部・文字出力部」34~35に入り、最初の部門「変換候補表示部」34の「変換候補表示実行部」34aに入る。「変換候補表示実行部」34aは関数ConvCandidateを実行し、出力情報をコンピュータ管理の変換候補用構造体に送る。「変換候補表示実行部」34aで得られた変換候補表示情報ss5[0]~ss5[n](nは候補数-1で、本実施例では5)を基に「変換候補表示部」34は、「変換候補一覧表示要求」34cをコンピュータに送り「変換候補一覧表示を描く関数等」48の諸関数で「変換候補一覧表示」50のサイズや位置を決め、先頭に候補番号を付加し変換候補一覧を表示した画面が
図7(3)漢字仮名変換画面の「変換候補一覧」82となる。次に
図3の「文字出力部」35の「文字列出力選択」35bに入り、単文節なので出力としてss5[n](nは候補番号)を選ぶ。選択候補として変換第一候補が選ばれているので選択候補番号 = 0で文字列出力は「神戸(カノト)n」である。ここで「神戸(カノト)n」を文字変数ss1Candに格納する。次に「出力文字表示実行部」35cは出力文字表示実行用関数AddCharNを実行しss1Candの「神戸(カノト)n」をコンピュータ管理の編集用構造体に送る。以上の結果を基に「文字出力部」35は、「出力文字表示要求」35dをコンピュータに送り「入出力文字表示を描く関数等」47の諸関数で応用プログラムの画面「入出力文字表示」49のサイズや位置を決めた後、当該画面上に当該選択候補を
図7(3)漢字仮名変換画面の「神戸(カノト)n」83のように太線の下線付きで変換結果として表示させる。
【0031】
漢字仮名変換を実行する
図3の漢字仮名変換実行部は、
図2の「仮名漢字変換/KEARM変換実行部」4~33と「変換候補表示部・文字出力部」34~35から構成されている。漢字仮名変換は「入力部」1~3を除けば、
図2で示す通常の日本語入力システムの仮名漢字変換の構成と同じである。漢字仮名変換は、通常の仮名漢字変換の構成部分をそのまま使い、入出力の処理と変換方法を変えているだけである。したがって漢字仮名変換は、通常の仮名漢字変換式のシステムであればどのシステムにでも適用できることになる。
【0032】
実施例2では、実施例1と同様に完全一致検索で検索するが、変換候補が「神戸」のように漢字の名詞形ではなく、漢字の動詞形「歩く」の場合の漢字仮名変換の実施例を示す。動詞形の場合は変換候補の文字列に活用語尾が含まれるので、語幹と活用語尾の分離が必要である。理由は、漢字の動詞形の場合でも辞書の登録語句はすべて語幹で登録されているからである。
実施例3では、選択した漢字と完全一致する登録語句だけでなく前方一致および後方一致を含む部分一致による語句まで対象にして漢字仮名変換を行う。部分一致検索では当然ながら一致する漢字が多くなり、漢字の読みを調べるというより当該漢字の関連情報を収集するという目的に近くなる。