(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024077308
(43)【公開日】2024-06-07
(54)【発明の名称】文字置換支援装置、文字置換支援方法、プログラム及び記録媒体
(51)【国際特許分類】
G06F 16/38 20190101AFI20240531BHJP
【FI】
G06F16/38
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022189330
(22)【出願日】2022-11-28
(71)【出願人】
【識別番号】000232092
【氏名又は名称】NECソリューションイノベータ株式会社
(74)【代理人】
【識別番号】100115255
【弁理士】
【氏名又は名称】辻丸 光一郎
(74)【代理人】
【識別番号】100201732
【弁理士】
【氏名又は名称】松縄 正登
(74)【代理人】
【識別番号】100154081
【弁理士】
【氏名又は名称】伊佐治 創
(74)【代理人】
【識別番号】100227019
【弁理士】
【氏名又は名称】安 修央
(72)【発明者】
【氏名】袴田 博之
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175FB03
(57)【要約】
【課題】 文字の置換目的に基づく置換候補の選択を支援可能な文字置換支援装置を提供する。
【解決手段】 本発明の文字置換支援装置は、置換対象取得部、候補文字抽出部、及び評価値設定部を含み、
前記置換対象取得部は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出部は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定部は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
置換対象取得部、候補文字抽出部、及び評価値設定部を含み、
前記置換対象取得部は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出部は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定部は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定する、文字置換支援装置。
【請求項2】
前記評価値設定部は、
前記置換根拠情報に基づいて、前記置換候補文字の根拠重みを設定し、
前記置換目的に基づいて、前記置換候補文字の根拠重み係数を設定し、
前記根拠重み及び前記根拠重み係数に基づいて前記評価値を設定する、請求項1記載の文字置換支援装置。
【請求項3】
前記候補文字抽出部において、前記置換根拠毎の置換候補文字が複数抽出された場合、
前記評価値設定部は、
前記置換根拠毎の配列順に基づいて、前記置換候補文字の配列重み係数を設定し、
前記根拠重み及び前記配列重み係数に基づいて前記置換候補文字の根拠毎評価値を算出し、
前記根拠毎評価値及び前記根拠重み係数に基づいて前記評価値を設定する、請求項2記載の文字置換支援装置。
【請求項4】
出力部を含み、
前記出力部は、前記評価値に基づいて前記置換候補文字を選択し、選択した置換候補文字を出力する、
請求項1から3のいずれか一項に記載の文字置換支援装置。
【請求項5】
前記出力部は、前記置換候補文字及び前記評価値を出力する、請求項4記載の文字置換支援装置。
【請求項6】
テキスト情報取得部、分解部、及び文字列生成部を含み、
前記テキスト情報取得部は、テキスト情報を取得し、
前記分解部は、前記テキスト情報を文字情報に分解し、
前記置換対象取得部は、前記分解された文字情報から前記置換対象文字を取得し、
前記文字列生成部は、前記評価値に基づいて前記置換対象文字を置換候補文字に置換した文字列情報を生成する、請求項1から3のいずれか一項に記載の文字置換支援装置。
【請求項7】
置換対象取得工程、候補文字抽出工程、及び評価値設定工程を含み、
前記置換対象取得工程は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出工程は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定工程は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定し、
前記各工程がコンピュータにより実行される、文字置換支援方法。
【請求項8】
前記評価値設定工程は、
前記置換根拠情報に基づいて、前記置換候補文字の根拠重みを設定し、
前記置換目的に基づいて、前記置換候補文字の根拠重み係数を設定し、
前記根拠重み及び前記根拠重み係数に基づいて前記評価値を設定する、請求項7記載の文字置換支援方法。
【請求項9】
置換対象取得手順、候補文字抽出手順、及び評価値設定手順を含み、
前記置換対象取得手順は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出手順は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定手順は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定し、
前記各手順をコンピュータに実行させるためのプログラム。
【請求項10】
置換対象取得手順、候補文字抽出手順、及び評価値設定手順を含み、
前記置換対象取得手順は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出手順は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定手順は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定し、
前記各手順をコンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文字置換支援装置、文字置換支援方法、プログラム及び記録媒体に関する。
【背景技術】
【0002】
日本語には様々な漢字があるが、特に氏名、地名等の表記において、文字コードに含まれていない文字(外字)が多数あり、コンピュータで利用可能な漢字は一部である。このような外字をコンピュータで利用するために、MJ縮退マップ等を利用して外字を対応する文字に変換する手法が知られている(非特許文献1、2)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】“MJ縮退マップ”、[online]、文字情報技術促進協議会、[令和4年10月25日検索]、インターネット <URL:https://moji.or.jp/mojikiban/map/>
【非特許文献2】“縮退マップについて”、[online]、2015年9月、独立行政法人 情報処理推進機構、[令和4年10月25日検索]、インターネット <URL:https://moji.or.jp/wp-content/mojikiban/2015/09/20150925_5.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、候補文字が複数ある場合にその変換先を決定することが難しいという課題がある。このような場合、文字の置換目的に応じた適切な置換が行われることが好ましいが、既存のアルゴリズムでは対応できない。
【0005】
そこで本発明は、文字の置換目的に基づく置換候補の選択を支援可能な文字置換支援装置、文字置換支援方法、及び、記録媒体の提供を目的とする。
【課題を解決するための手段】
【0006】
前記目的を達成するために、本発明の文字置換支援装置は、
置換対象取得部、候補文字抽出部、及び評価値設定部を含み、
前記置換対象取得部は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出部は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定部は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定する。
【0007】
本発明の文字置換支援方法は、
置換対象取得工程、候補文字抽出工程、及び評価値設定工程を含み、
前記置換対象取得工程は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出工程は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定工程は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定し、
前記各工程がコンピュータにより実行される。
【0008】
本発明のプログラムは、
置換対象取得手順、候補文字抽出手順、及び評価値設定手順を含み、
前記置換対象取得手順は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出手順は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定手順は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定し、
前記各手順をコンピュータに実行させるためのプログラムである。
【0009】
本発明の記録媒体は、
置換対象取得手順、候補文字抽出手順、及び評価値設定手順を含み、
前記置換対象取得手順は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出手順は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定手順は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定し、
前記各手順をコンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体である。
【発明の効果】
【0010】
本発明によれば、文字の置換目的に基づいて適切な置換候補を選択可能となる。
【図面の簡単な説明】
【0011】
【
図1】
図1は、実施形態1の文字置換支援装置の一例の構成を示すブロック図である。
【
図2】
図2は、実施形態1の文字置換支援装置のハードウェア構成の一例を示すブロック図である。
【
図3】
図3は、実施形態1の文字置換支援装置における処理の一例を示すフローチャートである。
【
図4】
図4は、実施形態2の文字置換支援装置の一例の構成を示すブロック図である。
【
図5】
図5は、実施形態2の文字置換支援装置における処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0012】
以下、本発明の実施形態について図を用いて説明する。本発明は、以下の実施形態には限定されない。以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用でき、各実施形態の構成は、特に言及がない限り、組合せ可能である。
【0013】
[実施形態1]
図1は、本実施形態の文字置換支援装置10の一例の構成を示すブロック図である。
図1に示すように、本装置10は、置換対象取得部11、候補文字抽出部12、及び評価値設定部13を含む。また、本装置10は、図示していないが、例えば、入力部、出力部、表示部及び/又は記憶部を含んでもよい。
【0014】
本装置10は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、通信回線網を介して接続可能な装置でもよい。また、本装置10は、前記通信回線網を介して、後述する外部装置と接続可能である。前記通信回線網は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。前記通信回線網は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、SAN(Storage Area Network)、DTN(Delay Tolerant Networking)、LPWA(Low Power Wide Area)、L5G(ローカル5G)、等があげられる。無線通信としては、例えば、Wi-Fi(登録商標)、Bluetooth(登録商標)、ローカル5G、LPWA等が挙げられる。前記無線通信としては、各装置が直接通信する形態(Ad Hoc通信)、インフラストラクチャ(infrastructure通信)、アクセスポイントを介した間接通信等であってもよい。本装置10は、例えば、システムとしてサーバに組み込まれていてもよい。また、本装置10は、例えば、本発明のプログラムがインストールされたパーソナルコンピュータ(PC、例えば、デスクトップ型、ノート型)、スマートフォン、タブレット端末等であってもよい。本装置10は、例えば、前記各部のうち少なくとも一つがサーバ上にあり、その他の前記各部が端末上にあるような、クラウドコンピューティングやエッジコンピューティング等の形態であってもよい。
【0015】
図2に、本装置10のハードウェア構成のブロック図を例示する。本装置10は、例えば、中央処理装置(CPU、GPU等)101、メモリ102、バス103、記憶装置104、入力装置105、出力装置106、通信デバイス107等を含む。本装置10の各部は、それぞれのインタフェース(I/F)により、バス103を介して相互に接続されている。
【0016】
中央処理装置101は、コントローラ(システムコントローラ、I/Oコントローラ等)等により、他の構成と連携動作し、本装置10の全体の制御を担う。本装置10において、中央処理装置101により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、中央処理装置101が、置換対象取得部11、候補文字抽出部12、及び評価値設定部13として機能する。本装置10が、前記出力部を含む場合、中央処理装置101は、前記出力部として機能してもよい。本装置10は、演算装置として、CPU、GPU(Graphics Processing Unit)、APU(Accelerated Processing Unit)等の他の演算装置を備えてもよいし、これらの組合せを備えてもよい。
【0017】
バス103は、例えば、外部装置とも接続できる。前記外部装置は、例えば、ユーザの端末、外部記憶装置(外部データベース等)、プリンタ、外部入力装置、外部表示装置、外部撮像装置等があげられる。本装置10は、例えば、バス103に接続された通信デバイス107により、外部ネットワーク(前記通信回線網)に接続でき、外部ネットワークを介して、他の装置と接続することもできる。
【0018】
メモリ102は、例えば、メインメモリ(主記憶装置)が挙げられる。中央処理装置101が処理を行う際には、例えば、後述する記憶装置104に記憶されている本発明のプログラム等の種々の動作プログラムを、メモリ102が読み込み、中央処理装置101は、メモリ102からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。また、メモリ102は、例えば、ROM(読み出し専用メモリ)であってもよい。
【0019】
記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置104は、例えば、記録媒体と、記録媒体に読み書きするドライブとの組合せであってもよい。前記記録媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられる。記憶装置104は、例えば、記録媒体とドライブとが一体化されたハードディスクドライブ(HDD)、及びソリッドステートドライブ(SSD)であってもよい。本装置10が前記記憶部を含む場合、例えば、記憶装置104は、前記記憶部として機能する。前記記憶部は、例えば、後述する目的分類表、置換辞書情報、根拠重み係数、根拠重み表、等を記憶できる。
【0020】
本装置10において、メモリ102及び記憶装置104は、ログ情報、外部データベース(図示せず)や外部の装置から取得した情報、本装置10によって生成した情報、本装置10が処理を実行する際に用いる情報等の種々の情報を記憶することも可能である。この場合、メモリ102及び記憶装置104は、例えば、前述の本装置のユーザの情報等を記憶していてもよい。なお、少なくとも一部の情報は、例えば、メモリ102及び記憶装置104以外の外部サーバに記憶されていてもよいし、複数の端末にブロックチェーン技術等を用いて分散して記憶されていてもよい。
【0021】
本装置10は、例えば、さらに、入力装置105、出力装置106を備える。入力装置105は、例えば、タッチパネル、トラックパッド、マウス等のポインティングデバイス;キーボード;カメラ、スキャナ等の撮像手段;ICカードリーダ、磁気カードリーダ等のカードリーダ;マイク等の音声入力手段;等があげられる。出力装置106は、例えば、LEDディスプレー、液晶ディスプレー等の表示装置;スピーカ等の音声出力装置;プリンタ;等があげられる。本実施形態1において、入力装置105と出力装置106とは、別個に構成されているが、入力装置105と出力装置106とは、タッチパネルディスプレーのように、一体として構成されてもよい。
【0022】
つぎに、本実施形態の文字置換支援方法の一例を、
図3のフローチャートに基づき説明する。本実施形態の文字置換支援方法は、例えば、
図1又は
図2の装置10を用いて、次のように実施する。なお、本実施形態の文字置換支援方法は、
図1又は
図2の装置10の使用には限定されない。
【0023】
まず、置換対象取得部11は、置換対象文字と前記置換対象文字の置換目的とを取得する(S1、置換対象取得工程)。前記置換対象文字は、例えば、後述する置換辞書情報において、所定の文字集合に含まれる文字を、異なる文字集合に含まれる対応する文字(置換候補文字)に置換するように、指定されている文字があげられる。前記文字の種類は、特に制限されず、例えば、漢字、ひらがな、カタカナ、アルファベット等があげられるが、漢字が好ましい。前記置換対象文字は、例えば、いわゆる「外字」を含んでもよい。前記文字集合は、所定の用途又は機能に基づく文字の集合である。前記用途又は機能は、文字の用途又は機能でもよいし、文字の使用環境(例えば、各種デバイスにおける表示環境)でもよい。前記文字集合の具体例としては、例えば、JIS規格の文字コード(例えば、JIS X 0208、JIS X 0213又はJIS X 0221);常用漢字;文字情報基盤漢字(MJ文字ともいう);等があげられる。前記置換対象文字について、具体例をあげて説明する。例えば、文字情報基盤漢字には、およそ6万字の文字(漢字)が含まれているが、一般的なPCではその全ての文字を表現することはできない。そこで、前記文字情報基盤漢字に含まれる一部の文字(置換対象文字)について、JIS規格(JIS X 0213)のおよそ9千字の文字(漢字)に代替が行われる。この場合において、前記文字情報基盤漢字に含まれており、且つ、前記JIS規格への置換が、後述する置換辞書情報において定められている文字を前記置換対象文字とできる。
【0024】
前記置換目的は、前記置換対象文字の置換を行う目的であり、任意の目的を設定できる。具体例として、例えば、文字の典拠性を重視した置換(納得性重視)、文字の置換成立を重視した置換(強制性重視)、文字の平易性を重視した置換(平易性重視)等があげられる。置換対象取得部11は、例えば、前記置換目的を直接取得してもよいし、間接的に取得してもよい。具体的に、置換対象取得部11は、例えば、本装置10のユーザにより設定された置換目的の情報を取得することで前記置換目的を直接取得できる。また、置換対象取得部11は、例えば、本装置10のユーザにより、置換対象文字を含むテキストの利用目的を取得し、前記利用目的毎に置換目的が紐づけられた目的分類表を参照し、前記利用目的に紐づけられた置換目的を取得することにより、前記置換目的を間接的に取得できる。前記目的分類表は、例えば、本装置10のメモリ102又は記憶装置104に記憶されていてもよいし、外部装置(例えば、外部の端末、ストレージ、サーバ装置等)に記憶されていてもよい。後者の場合、置換対象取得部11、例えば、通信回線網を介して前記外部装置から前記目的分類表を取得できる。
【0025】
つぎに、候補文字抽出部12は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出する(S2、候補文字抽出工程)。前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報である。
前記置換根拠情報としては、例えば、JIS包摂規準・UCS統合規則(JIS X 0213包摂基準・UCS統合規則の適用により、置換対象文字と置換候補文字とが紐づけられているもの);読み・字形による類推(置換候補文字と、置換対象文字との関係が、読み、字形等から、JIS文字集合へ属する文字へ結びつけられると判断されるもの);辞書類等による関連字(置換候補文字と、置換対象文字との関係が、辞書類に示された異体字等の関係性から、JIS 文字集合に属する文字へ結びつけられると判断されるもの);法令等により関連付けられたもの(例えば、法務省戸籍法関連通達・通知(戸籍統一文字情報 親字・正字)、法務省戸籍法関連通達・通知(法務省民一2842号通達別表 誤字俗字・正字一覧表)、法務省告示582号別表第四 その一、法務省告示582号別表第四 その二等の、法務省の「在留カード等に係る漢字氏名の表記等に関する告示(平成23年法務省告示第582号)」により、JIS 文字集合に属する文字へ結びつけられると判断されるもの);文字情報基盤検索システム(URL:https://moji.or.jp/mojikibansearch/basic)に記載のMJ文字情報一覧表(Ver.006.01)における漢字施策(常用漢字、人名用漢字)等の属性;等があげられる。前記置換辞書情報は、例えば、本装置10のメモリ102又は記憶装置104に記憶されていてもよいし、外部装置(例えば、外部の端末、ストレージ、サーバ装置等)に記憶されていてもよい。後者の場合、候補文字抽出部12は、例えば、通信回線網を介して前記外部装置から前記置換辞書情報を取得できる。
【0026】
つぎに、評価値設定部13は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定する(S3、評価値設定工程)。評価値設定部13は、例えば、前記置換対象文字について、前記置換候補文字毎に、前記置換根拠情報と前記置換目的とに基づいて評価値を予め算出しておき、算出済みの評価値を設定してもよいし、前記評価値を都度算出して設定してもよい。評価値設定部13は、例えば、前記置換根拠情報に基づいて、前記置換候補文字の根拠重みを設定し、前記置換目的に基づいて、前記置換候補文字の根拠重み係数を設定する。そして、評価値設定部13は、例えば、前記置換候補文字毎に、前記根拠重みに前記根拠重み係数を乗算することで前記評価値を算出できる。前記根拠重みの設定は、例えば、置換候補文字及び置換根拠情報の組み合わせ毎に、置換根拠の種類毎の重みを設定した根拠重みづけ表を参照することにより設定できる。前記置換根拠の種類は、特に制限されず、例えば、前記置換根拠の由来に基づいて設定でき、行政根拠、典籍根拠、規格根拠等があげられる。前記根拠重み係数の設定は、例えば、前記置換目的毎に、前記置換根拠の種類毎の係数が紐づけられた目的根拠対応表を参照することにより設定できる。前記置換目的、置換根拠の種類、及び係数の組み合わせは、特に制限されず、任意の係数が設定できる。前記根拠重み表、及び、前記目的根拠対応表は、例えば、本装置10のメモリ102又は記憶装置104に記憶されていてもよいし、外部装置(例えば、外部の端末、ストレージ、サーバ装置等)に記憶されていてもよい。後者の場合、評価値設定部13は、例えば、通信回線網を介して前記外部装置から前記根拠重み表、及び、前記目的根拠対応表を取得できる。
【0027】
また、前記S2工程において、候補文字抽出部12により、前記置換根拠毎の置換候補文字が複数抽出された場合、評価値設定部13は、例えば、前記置換根拠毎の配列順に基づいて、前記置換候補文字の配列重み係数を設定し、前記根拠重み及び前記配列重み係数に基づいて前記置換候補文字の根拠毎評価値を算出し、前記根拠毎評価値及び前記根拠重み係数に基づいて前記評価値を設定してもよい。具体的に、評価値設定部13は、例えば、前記置換候補文字の種類毎に、前記根拠重み及び前記配列重み係数を乗算して前記根拠毎評価値を算出し、算出した前記根拠毎評価値に前記根拠重み係数を乗算することにより前記評価値を設定できる。前記配列重み係数は特に制限されず、任意の数値を設定できるが、例えば、各根拠の種類毎に、より優先度の高い順序(例えば、辞書の掲載順、法令等により置換が推奨されている順等)に応じて係数を設定することが好ましい。
【0028】
また、本実施形態の文字置換支援装置が、例えば、前記出力部を含む場合、前記出力部は、前記出力部は、例えば、前記評価値に基づいて前記置換候補文字を選択し、選択した置換候補文字を出力してもよい。前記出力部が選択及び出力する置換候補文字は、例えば、1つでもよいし、2以上の複数でもよい。前記出力部は、例えば、前記文字の置換目的に基づく評価値が最も高い置換候補文字を出力してもよいし、前記評価値が高い順に一定の順位(例えば、1位~10位等)までの複数の置換候補文字を出力してもよい。また、前記出力部は、例えば、前記置換候補文字に加えて、前記評価値を出力してもよい。このような態様によれば、例えば、文字置換支援装置のユーザは、出力結果を参照して最適な置換先を決定することができる。
【0029】
本実施形態の文字置換支援装置によれば、置換候補文字について、文字の置換目的に応じた評価値を設定できる。このため、本装置10のユーザは、例えば、文字の利用目的に応じてより適切な置換候補文字を容易に選択することが可能となる。
【0030】
[実施形態2]
実施形態2は、本発明の文字置換支援装置の他の例である。
【0031】
本実施形態の文字置換支援装置は、実施形態1の文字置換支援装置10の構成に加えて、テキスト情報取得部、分解部、及び文字列生成部を含むこと以外は前記実施形態1の文字置換支援装置10と同様であり、その説明を援用できる。本実施形態の文字置換支援装置10Aは、例えば、テキスト情報取得部、分解部、及び文字列生成部を含み、前記テキスト情報取得部は、テキスト情報を取得し、前記分解部は、前記テキスト情報を文字情報に分解し、前記置換対象取得部は、前記テキスト情報から前記置換対象文字を取得し、前記文字列生成部は、前記評価値に基づいて前記置換対象文字を置換候補文字に置換した文字列情報を出力する。
【0032】
図4は、本実施形態の文字置換支援装置10Aの一例の構成を示すブロック図である。
図4に示すように、文字置換支援装置10Aは、実施形態1の文字置換支援装置10の構成に加えて、テキスト情報取得部14、分解部15、及び文字列生成部16を含む。文字置換支援装置10Aのハードウェア構成は、
図2の文字置換支援装置10のハードウェア構成において、中央処理装置101が、
図1の文字置換支援装置10の構成に代えて、
図4の文字置換支援装置10Aの構成を備える以外は同様である。以下、テキスト情報取得部14、分解部15、及び文字列生成部16の処理を説明する。テキスト情報取得部14、分解部15、及び文字列生成部16の処理は、例えば、前記実施形態1で説明した
図3のフローチャートにおける任意の位置に適宜挿入できるが、
図5に示すように、テキスト情報取得部11及び分解部15による処理(S11~S12)の後、前記実施形態1のS1~S3を実行し、文字列生成部16による処理(S13)を実行することが好ましい。
【0033】
テキスト情報取得部14は、テキスト情報を取得する(S11、テキスト情報取得工程)。前記テキスト情報は、特に制限されず、例えば、前記置換対象文字を含むテキストでもよいし、前記置換対象文字を含まないテキストでもよいし、前記置換対象文字を含むか否か不明なテキストでもよい。前記テキスト情報の取得は、特に制限されず、例えば、本装置10Aのユーザが、本装置10Aの入力装置105により入力したテキスト情報でもよいし、外部の装置から取得したテキスト情報でもよい。
【0034】
分解部15は、前記テキスト情報を文字情報に分解する(S12、分解工程)。分解部15は、例えば、公知の文字分解手法を用いて、前記テキスト情報に含まれる文字を文字情報に分解できる。この場合、S1において、置換対象取得部11は、例えば、前記分解された文字情報から前記置換対象文字を取得する。なお、例えば、前記テキスト情報が前記置換対象文字を含まない場合、本装置10Aは、処理を終了してもよいし、置換対象文字を含まないことを出力してもよい。
【0035】
つぎに、前記実施形態1のS2及びS3と同様にして、前記置換候補文字毎の評価値を設定する。
【0036】
そして、文字列生成部16は、前記評価値に基づいて前記置換対象文字を置換候補文字に置換した文字列情報を生成する(S13、文字列生成工程)。文字列生成部16は、例えば、前記置換対象文字毎に、前記置換目的に対応する評価値が最も高い置換候補文字を選択し、前記テキスト情報に含まれる置換対象文字を前記選択した置換候補文字で置換できる。
【0037】
本実施形態の文字置換支援装置によれば、例えば、入力したテキスト情報を置換目的に応じて自動的に置換できる。
【0038】
[実施形態3]
以下、具体例をあげて本装置10(装置10、装置10A)の利用例を説明する。以下の説明においては、文字の利用目的が、地方自治体の業務目的であり、業務別に住民の氏名に含まれる外字を置換する場合を例に挙げて説明するが、本発明は、以下の例示にはなんら限定されず、テキストが含む外字の置換支援が必要な分野全般に利用できる。また、以下の例示において示す各表は、一例であり、本発明を何ら限定するものではない。
【0039】
本装置10を利用するユーザは、例えば、まず、本装置10の利用に先立ち、文字の利用目的(業務内容)に応じて、置換目的を設定した目的分類表を作成し、本装置10に記憶させる。下記表1に、文字の利用目的が地方自治体の業務である場合の目的分類表の具体例を示すが、本発明は、下記表1の例示にはなんら限定されない。表1に示すように、文字の利用目的(業務)が、市民税の納税通知書又は国民健康保険の納入通知書である場合は、前記置換目的を強制性重視に設定でき、文字の利用目的が市民税の還付通知書又は条例違反者の氏名公表である場合は、前記置換目的を納得性重視に設定できる。
【0040】
【0041】
つぎに、ユーザは、本装置10に、前記テキスト情報として、下記表2に示す住民の氏名と、業務の種類とを入力する。なお、下記表2において「XX」で示されている文字は、置換対象でない文字(例えば、苗字)を代替して示すものである。
【0042】
【0043】
本装置10の分解部15は、入力されたテキスト情報を、下記表3に示すような文字情報に分解する。そして、置換対象取得部11は、文字コード配列「D85E DC2D」により特定される文字を、置換対象文字として取得する。また、置換対象取得部11は、入力された業務の種類に応じて、前記表1の目的分類表を参照して置換目的(強制性重視又は納得性重視)を取得する。
【表3】
【0044】
つぎに、候補文字抽出部12は、前記置換対象文字(文字コード配列「D85E DC2D」により特定される文字)について、下記表4に示す置換辞書情報を用いて、置換候補文字を、置換根拠毎に抽出する。なお、表4に示す置換辞書情報において、各根拠毎の置換候補文字は、それぞれの置換根拠において、左側に配置されている文字ほど優先度が高い文字である。
【0045】
【0046】
つぎに、評価値設定部13は、まず、置換根拠情報毎の置換候補文字について、下記表5に示す配列重み係数を設定する。
【0047】
【0048】
つぎに、評価値設定部13は、まず、置換根拠情報毎の置換候補文字について、下記表6に示す根拠重みづけ表を参照し、置換候補文字及び置換根拠情報の組み合わせ毎に、置換根拠の種類毎の重みを設定した根拠重みを設定する。
【0049】
【0050】
そして、評価値設定部13は、置換候補文字毎に、前記配列重み及び前記根拠重みを乗算して、置換候補文字毎の根拠毎評価値を算出する。下記表7に、置換候補文字毎の根拠毎評価値を示す。
【0051】
【0052】
そして、評価値設定部13は、下記表8に示す目的根拠対応表を参照し、入力された業務と対応する置換目的に応じた根拠重み係数を、前記表7に示す置換候補文字毎の根拠毎評価値に乗算して、置換候補文字毎の評価値を算出する。算出した結果を表9に示す。
【0053】
【0054】
【0055】
そして、文字列生成部16は、前記置換目的に対応する評価値が最も高い置換候補文字を選択し、前記テキスト情報に含まれる置換対象文字を前記選択した置換候補文字で置換した文字列情報を生成する。
【0056】
[実施形態4]
本実施形態のプログラムは、前述の文字置換支援方法の各工程を、コンピュータに実行させるためのプログラムである。具体的に、本実施形態のプログラムは、コンピュータに、置換対象取得手順、候補文字抽出手順、及び評価値設定手順を実行させるためのプログラムである。
【0057】
前記置換対象取得手順は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出手順は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定手順は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定する。
【0058】
また、本実施形態のプログラムは、コンピュータを、置換対象取得手順、候補文字抽出手順、及び評価値設定手順として機能させるプログラムということもできる。
【0059】
本実施形態のプログラムは、前記本発明の文字置換支援装置及び文字置換支援方法における記載を援用できる。前記各手順は、例えば、「手順」を「処理」と読み替え可能である。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体は、例えば、非一時的なコンピュータ可読記録媒体(non-transitory computer-readable storage medium)である。前記記録媒体は、特に制限されず、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、ハードディスク(HD)、フラッシュメモリー(例えば、SSD(Solid State Drive)、USBフラッシュメモリー、SD/SDHCカード等)、光ディスク(例えば、CD‐R/CD‐RW、DVD‐R/DVD‐RW、BD‐R/BD‐RE等)、光磁気ディスク(MO)、フロッピー(登録商標)ディスク(FD)等があげられる。また、本実施形態のプログラム(例えば、プログラミング製品、又はプログラム製品ともいう)は、例えば、外部のコンピュータから配信される形態であってもよい。前記「配信」は、例えば、通信回線網を介した配信でもよいし、有線で接続された装置を介した配信であってもよい。本実施形態のプログラムは、配信された装置にインストールされて実行されてもよいし、インストールされずに実行されてもよい。
【0060】
以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。
【0061】
<付記>
上記の実施形態の一部又は全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
置換対象取得部、候補文字抽出部、及び評価値設定部を含み、
前記置換対象取得部は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出部は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定部は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定する、文字置換支援装置。
(付記2)
前記評価値設定部は、
前記置換根拠情報に基づいて、前記置換候補文字の根拠重みを設定し、
前記置換目的に基づいて、前記置換候補文字の根拠重み係数を設定し、
前記根拠重み及び前記根拠重み係数に基づいて前記評価値を設定する、付記1記載の文字置換支援装置。
(付記3)
前記候補文字抽出部において、前記置換根拠毎の置換候補文字が複数抽出された場合、
前記評価値設定部は、
前記置換根拠毎の配列順に基づいて、前記置換候補文字の配列重み係数を設定し、
前記根拠重み及び前記配列重み係数に基づいて前記置換候補文字の根拠毎評価値を算出し、
前記根拠毎評価値及び前記根拠重み係数に基づいて前記評価値を設定する、付記2記載の文字置換支援装置。
(付記4)
出力部を含み、
前記出力部は、前記評価値に基づいて前記置換候補文字を選択し、選択した置換候補文字を出力する、
付記1から3のいずれかに記載の文字置換支援装置。
(付記5)
前記出力部は、前記置換候補文字及び前記評価値を出力する、付記4記載の文字置換支援装置。
(付記6)
テキスト情報取得部、分解部、及び文字列生成部を含み、
前記テキスト情報取得部は、テキスト情報を取得し、
前記分解部は、前記テキスト情報を文字情報に分解し、
前記置換対象取得部は、前記分解された文字情報から前記置換対象文字を取得し、
前記文字列生成部は、前記評価値に基づいて前記置換対象文字を置換候補文字に置換した文字列情報を生成する、付記1から5のいずれかに記載の文字置換支援装置。
(付記7)
置換対象取得工程、候補文字抽出工程、及び評価値設定工程を含み、
前記置換対象取得工程は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出工程は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定工程は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定し、
前記各工程がコンピュータにより実行される、文字置換支援方法。
(付記8)
前記評価値設定工程は、
前記置換根拠情報に基づいて、前記置換候補文字の根拠重みを設定し、
前記置換目的に基づいて、前記置換候補文字の根拠重み係数を設定し、
前記根拠重み及び前記根拠重み係数に基づいて前記評価値を設定する、付記7記載の文字置換支援方法。
(付記9)
前記候補文字抽出工程において、前記置換根拠毎の置換候補文字が複数抽出された場合、
前記評価値設定工程は、
前記置換根拠毎の配列順に基づいて、前記置換候補文字の配列重み係数を設定し、
前記根拠重み及び前記配列重み係数に基づいて前記置換候補文字の根拠毎評価値を算出し、
前記根拠毎評価値及び前記根拠重み係数に基づいて前記評価値を設定する、付記8記載の文字置換支援方法。
(付記10)
出力工程を含み、
前記出力工程は、前記評価値に基づいて前記置換候補文字を選択し、選択した置換候補文字を出力する、
付記7から9のいずれかに記載の文字置換支援方法。
(付記11)
前記出力工程は、前記置換候補文字及び前記評価値を出力する、付記10記載の文字置換支援方法。
(付記12)
テキスト情報取得工程、分解工程、及び文字列生成工程を含み、
前記テキスト情報取得工程は、テキスト情報を取得し、
前記分解工程は、前記テキスト情報を文字情報に分解し、
前記置換対象取得工程は、前記分解された文字情報から前記置換対象文字を取得し、
前記文字列生成工程は、前記評価値に基づいて前記置換対象文字を置換候補文字に置換した文字列情報を生成する、付記7から11のいずれかに記載の文字置換支援方法。
(付記13)
置換対象取得手順、候補文字抽出手順、及び評価値設定手順を含み、
前記置換対象取得手順は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出手順は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定手順は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定し、
前記各手順をコンピュータに実行させるためのプログラム。
(付記14)
前記評価値設定手順は、
前記置換根拠情報に基づいて、前記置換候補文字の根拠重みを設定し、
前記置換目的に基づいて、前記置換候補文字の根拠重み係数を設定し、
前記根拠重み及び前記根拠重み係数に基づいて前記評価値を設定する、付記13記載のプログラム。
(付記15)
前記候補文字抽出手順において、前記置換根拠毎の置換候補文字が複数抽出された場合、
前記評価値設定手順は、
前記置換根拠毎の配列順に基づいて、前記置換候補文字の配列重み係数を設定し、
前記根拠重み及び前記配列重み係数に基づいて前記置換候補文字の根拠毎評価値を算出し、
前記根拠毎評価値及び前記根拠重み係数に基づいて前記評価値を設定する、付記14記載のプログラム。
(付記16)
出力手順を含み、
前記出力手順は、前記評価値に基づいて前記置換候補文字を選択し、選択した置換候補文字を出力する、
付記13から15のいずれかに記載のプログラム。
(付記17)
前記出力手順は、前記置換候補文字及び前記評価値を出力する、付記16記載のプログラム。
(付記18)
テキスト情報取得手順、分解手順、及び文字列生成手順を含み、
前記テキスト情報取得手順は、テキスト情報を取得し、
前記分解手順は、前記テキスト情報を文字情報に分解し、
前記置換対象取得手順は、前記分解された文字情報から前記置換対象文字を取得し、
前記文字列生成手順は、前記評価値に基づいて前記置換対象文字を置換候補文字に置換した文字列情報を生成する、付記13から17のいずれかに記載のプログラム。
(付記19)
置換対象取得手順、候補文字抽出手順、及び評価値設定手順を含み、
前記置換対象取得手順は、置換対象文字と前記置換対象文字の置換目的とを取得し、
前記候補文字抽出手順は、置換辞書情報を用いて、前記置換対象文字の置換候補文字を置換根拠毎に抽出し、
前記置換辞書情報は、置換対象文字毎に、置換候補文字と、前記置換候補文字の置換根拠情報とが紐づけられた情報であり、
前記評価値設定手順は、前記置換根拠情報と前記置換目的とに基づいて前記置換候補文字毎の評価値を設定し、
前記各手順をコンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体。
(付記20)
前記評価値設定手順は、
前記置換根拠情報に基づいて、前記置換候補文字の根拠重みを設定し、
前記置換目的に基づいて、前記置換候補文字の根拠重み係数を設定し、
前記根拠重み及び前記根拠重み係数に基づいて前記評価値を設定する、付記19記載の記録媒体。
(付記21)
前記候補文字抽出手順において、前記置換根拠毎の置換候補文字が複数抽出された場合、
前記評価値設定手順は、
前記置換根拠毎の配列順に基づいて、前記置換候補文字の配列重み係数を設定し、
前記根拠重み及び前記配列重み係数に基づいて前記置換候補文字の根拠毎評価値を算出し、
前記根拠毎評価値及び前記根拠重み係数に基づいて前記評価値を設定する、付記20記載の記録媒体。
(付記22)
出力手順を含み、
前記出力手順は、前記評価値に基づいて前記置換候補文字を選択し、選択した置換候補文字を出力する、
付記19から21のいずれかに記載の記録媒体。
(付記23)
前記出力手順は、前記置換候補文字及び前記評価値を出力する、付記22記載の記録媒体。
(付記24)
テキスト情報取得手順、分解手順、及び文字列生成手順を含み、
前記テキスト情報取得手順は、テキスト情報を取得し、
前記分解手順は、前記テキスト情報を文字情報に分解し、
前記置換対象取得手順は、前記分解された文字情報から前記置換対象文字を取得し、
前記文字列生成手順は、前記評価値に基づいて前記置換対象文字を置換候補文字に置換した文字列情報を生成する、付記19から23のいずれかに記載の記録媒体。
【産業上の利用可能性】
【0062】
本発明によれば、文字の置換目的に基づいて適切な置換候補の選択を支援できる。このため、本発明は、行政分野、金融分野、不動産分野、教育分野等において好適に利用できる。
【符号の説明】
【0063】
10 文字置換支援装置
11 置換対象取得部
12 候補文字抽出部
13 評価値設定部
14 テキスト情報取得部
15 分解部
16 文字列生成部
101 中央処理装置
102 メモリ
103 バス
104 記憶装置
105 入力装置
106 出力装置
107 通信デバイス