特許第5986879号(P5986879)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ゼンリンデータコムの特許一覧

特許5986879音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム
<>
  • 特許5986879-音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム 図000002
  • 特許5986879-音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム 図000003
  • 特許5986879-音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム 図000004
  • 特許5986879-音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム 図000005
  • 特許5986879-音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム 図000006
  • 特許5986879-音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム 図000007
  • 特許5986879-音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム 図000008
  • 特許5986879-音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5986879
(24)【登録日】2016年8月12日
(45)【発行日】2016年9月6日
(54)【発明の名称】音訓漢字対応韓国語翻訳装置、音訓漢字対応韓国語翻訳方法および音訓漢字対応韓国語翻訳プログラム
(51)【国際特許分類】
   G06F 17/28 20060101AFI20160823BHJP
【FI】
   G06F17/28 663
【請求項の数】6
【全頁数】14
(21)【出願番号】特願2012-230550(P2012-230550)
(22)【出願日】2012年10月18日
(65)【公開番号】特開2014-81864(P2014-81864A)
(43)【公開日】2014年5月8日
【審査請求日】2015年9月3日
(73)【特許権者】
【識別番号】500578216
【氏名又は名称】株式会社ゼンリンデータコム
(74)【代理人】
【識別番号】100091546
【弁理士】
【氏名又は名称】佐藤 正美
(72)【発明者】
【氏名】小関 光昭
(72)【発明者】
【氏名】金 成学
【審査官】 長 由紀子
(56)【参考文献】
【文献】 特開平9−185628(JP,A)
【文献】 特開平7−230472(JP,A)
【文献】 特開平2−144762(JP,A)
【文献】 特開2002−269085(JP,A)
【文献】 特開2011−18330(JP,A)
【文献】 特開2010−181562(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/20−28
(57)【特許請求の範囲】
【請求項1】
日本語の単漢字毎に、音読みの読みカナと訓読みの読みカナとを対応付けた単漢字辞書と、
音読みの漢字毎に、その読みに対応するハングル文字を登録した第1のハングル辞書と、
訓読みの漢字の読みの各音に対応させたハングル文字を登録した第2のハングル辞書と、
読みカナが対応付けられた日本語の1文字以上の漢字を先頭から1文字ずつ、前記単漢字辞書を用いて音読みの漢字か訓読みの漢字かの判定を行う音訓判定手段と、
音読みであると判定された漢字1文字は、音読みの読みカナに基づき前記第1のハングル辞書を参照して1文字のハングル文字に変換し、訓読みであると判定された漢字1文字は、訓読みの読みカナの音毎に前記第2のハングル辞書を参照して1文字以上のハングル文字に変換する変換手段と
を備えることを特徴とする音訓漢字対応韓国語翻訳装置。
【請求項2】
請求項1に記載の音訓漢字対応韓国語翻訳装置であって、
固有名詞の漢字と読みを対応付けて、地域別、属性別にまとめた固有名詞辞書と、
前記固有名詞辞書を用いて、翻訳対象の漢字文字列の読みカナを特定する特定手段と
を備えることを特徴とする音訓漢字対応韓国語翻訳装置。
【請求項3】
請求項1または請求項2に記載の音訓漢字対応韓国語翻訳装置であって、
読みカナの長音判定を行い、読みカナに含まれる長音を削除する長音判定手段を備え、
前記変換手段は、長音が削除された読みカナに基づいて、漢字をハングル文字に変換することを特徴とする音訓漢字対応韓国語翻訳装置。
【請求項4】
請求項1、請求項2または請求項3に記載の音訓漢字対応韓国語翻訳装置であって、
前記変換手段は、前記音訓判定手段により音読みか訓読みかの判定ができなかった場合には、読みカナの音毎に前記第2のハングル辞書を参照して1文字以上のハングル文字に変換することを特徴とする音訓漢字対応韓国語翻訳装置。
【請求項5】
音訓判定手段が、読みカナが対応付けられた日本語の1文字以上の漢字を先頭から1文字ずつ、日本語の単漢字毎に音読みの読みカナと訓読みの読みカナとを対応付けた単漢字辞書を用いて音読みの漢字か訓読みの漢字かの判定を行う音訓判定工程と、
変換手段が、音読みであると判定された漢字1文字を、音読みの読みカナに基づき音読みの漢字毎に、その読みに対応するハングル文字を登録した第1のハングル辞書を参照して1文字のハングル文字に変換し、訓読みであると判定された漢字1文字を、訓読みの漢字の読みの音毎に対応させたハングル文字を登録した第2のハングル辞書を参照して1文字以上のハングル文字に変換する変換工程と
を有することを特徴とする音訓漢字対応韓国語翻訳方法。
【請求項6】
日本語の単漢字毎に、音読みの読みカナと訓読みの読みカナとを対応付けた単漢字辞書と、音読みの漢字毎に、その読み対応するハングル文字を登録した第1のハングル辞書と、訓読みの漢字の読みの各音に対応させたハングル文字を登録した第2のハングル辞書との利用が可能な情報処理装置に搭載されたコンピュータにより実行されるプログラムであって、
音訓判定手段が、読みカナが対応付けられた日本語の1文字以上の漢字を先頭から1文字ずつ、前記単漢字辞書を用いて音読みの漢字か訓読みの漢字かの判定を行う音訓判定ステップと、
変換手段が、音読みであると判定された漢字1文字を、音読みの読みカナに基づき前記第1のハングル辞書を参照して1文字のハングル文字に変換し、訓読みであると判定された漢字1文字を、訓読みの読みカナの音毎に前記第2のハングル辞書を参照して1文字以上のハングル文字に変換する変換ステップと
が実行されることを特徴とする音訓漢字対応韓国語翻訳プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、例えば、地図等に記載されている日本語の漢字を、韓国語(ハングル文字)に翻訳する装置、方法、プログラムに関する。
【背景技術】
【0002】
日本語と韓国語には共通点が多いことに着目し、日本語と韓国語との間での翻訳処理に関して種々の発明がなされている。例えば、後に記す特許文献1には、対訳コーパス(言語データ)の形態素解析処理を必要とせずに、韓国語コーパス中の外来語を自動的に検出できるようにする発明が開示されている。当該発明は、日韓両語の外来語が音韻的に似ている特性を利用し、日本語のカタカナ語を手がかりにして韓国語コーパス中の外来語を自動抽出するものである。
【0003】
また、後に記す特許文献2には、ハングルで書かれている文書の内容を、容易な操作で、ハングルを解さない利用者が容易に知ることができるようにする発明が開示されている。当該発明は、ハングル文字と漢字との相互の対応関係を記憶した、ハングル文字および漢字対応辞書を用意し、これを参照してハングル文書中のハングル文字を、対応する漢字に変換する処理を行うものである。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2004−280353号公報
【特許文献2】特開平9−185628号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
日本語と韓国語は文法が同一であり、極めて共通点が多い。日本語と韓国語の相違点等については以下のようにまとめることができる。現在はハングル表記で統一されているが、韓国語はもともと日本語の漢字かな混じり文と同じく、漢字ハングル混じり文であった。韓国でも義務教育でおよそ1800語程度の漢字を学習する。韓国の漢字は音読みのみであり、日本の訓読みに相当する読みがほぼない。韓国の漢字は読みと同音のハングル文字1文字で代替される。韓国語の漢字の音読みハングルは日本語の漢字の音読みとほぼ同音で発音される。
【0006】
このように、韓国語の漢字には音読みしかないために、日本語の漢字をハングル文字に変換する場合には、例え訓読みの漢字であってもハングル文字では全て音読み表記されてしまう。このため、音読みとして誤表記された日本語の訓読みの漢字については、訓読みの音に対応したハングル文字に1つ1つ修正しなければならないという問題がある。また、日本語の漢字をその読みにしたがってハングル文字に変換する場合、音読みの漢字については、対応するハングル文字1文字に翻訳(変換)できるにもかかわらず、発音通りに1音1音がハングル文字1文字1文字に翻訳されてしまう場合がある。この場合、日本語の漢字の文字数に対してハングル表記が長くなるという問題がある。
【0007】
以上の点に鑑み、この発明は、日本語の漢字をその読み(読みカナ)が音読みか訓読みかをも考慮して、日本語の発音に合致し、しかも適切な文字数のハングル文字に変換することを目的とする。
【課題を解決するための手段】
【0008】
上記課題を解決するため、請求項1に記載の発明の音訓漢字対応韓国語翻訳装置は、
日本語の単漢字毎に、音読みの読みカナと訓読みの読みカナとを対応付けた単漢字辞書と、
音読みの漢字毎に、その読みに対応するハングル文字を登録した第1のハングル辞書と、
訓読みの漢字の読みの各音に対応させたハングル文字を登録した第2のハングル辞書と、
読みカナが対応付けられた日本語の1文字以上の漢字を先頭から1文字ずつ、前記単漢字辞書を用いて音読みの漢字か訓読みの漢字かの判定を行う音訓判定手段と、
音読みであると判定された漢字1文字は、音読みの読みカナに基づき前記第1のハングル辞書を参照して1文字のハングル文字に変換し、訓読みであると判定された漢字1文字は、訓読みの読みカナの音毎に前記第2のハングル辞書を参照して1文字以上のハングル文字に変換する変換手段と
を備えることを特徴とする。
【0009】
この請求項1に記載の発明の音訓漢字対応韓国語翻訳装置によれば、日本語の単漢字毎に、音読みの読みカナと訓読みの読みカナとを対応付けた単漢字辞書が利用可能になっている。また、音読みの漢字毎に、その読みに対応させたハングル文字を登録した第1のハングル辞書と、訓読みの漢字の読みの各音に対応させたハングル文字を登録した第2のハングル辞書とが利用可能になっている。音訓判定手段は、読みカナが対応付けられている翻訳対象の1文字以上の漢字を、先頭から1文字ずつ単漢字辞書を参照し、その読みカナに基づき当該漢字が音読みの漢字か、訓読みの漢字かを判定する。
【0010】
そして、変換手段は、音訓判定手段によって音読みであると判定された漢字1文字を、音読みの読みカナに基づき第1のハングル辞書を参照して1文字のハングル文字に変換する。また、変換手段は、音訓判定手段によって訓読みであると判定された漢字1文字を、訓読みの読みカナの音毎(1発音毎)に第2のハングル辞書を参照して1文字以上のハングル文字に変換する。
【0011】
これにより、日本語の漢字を、日本語の発音に合致し、しかも適切な文字数のハングル文字に変換できる。すなわち、地名や人名などの固有名詞であるにもかかわらず、日本語の発音とは異なる発音のハングル文字に変換されたり、また、対応する1文字のハングル文字に変換可能な漢字を複数のハングル文字に変換されたりするといった不都合を防止できる。
【発明の効果】
【0012】
この発明は、日本語の漢字をその読み(読みカナ)が音読みか訓読みかをも考慮して、日本語の発音に合致し、しかも適切な文字数のハングル文字に変換できる。これにより、日本語の漢字をハングル文字に変換した後に行われていた修正の手間を大幅に削減できる。
【図面の簡単な説明】
【0013】
図1】実施の形態の音訓漢字対応韓国語翻訳装置の構成例を説明するためのブロック図である。
図2】実施の形態の音訓漢字対応韓国語翻訳装置の漢字固有名詞辞書の格納データの例について説明するための図である。
図3】実施の形態の音訓漢字対応韓国語翻訳装置の単漢字音訓読み辞書の格納データの例について説明するための図である。
図4】実施の形態の音訓漢字対応韓国語翻訳装置の音読み用ハングル辞書の格納データの例について説明するための図である。
図5】実施の形態の音訓漢字対応韓国語翻訳装置の訓読み用ハングル辞書の格納データの例について説明するための図である。
図6】実施の形態の音訓漢字対応韓国語翻訳装置の翻訳対象漢字データファイルの格納データの例について説明するための図である。
図7】実施の形態の音訓漢字対応韓国語翻訳装置によって行われた翻訳処理の結果の一例を説明するための図である。
図8】実施の形態の音訓漢字対応韓国語翻訳装置で行われる音訓漢字対応韓国語翻訳処理を説明するためのフローチャートである。
【発明を実施するための形態】
【0014】
以下、この発明の装置、方法、プログラムの一実施の形態について説明する。以下に説明する実施の形態においては、例えば、パーソナルコンピュータを用いて、この発明の音訓漢字対応韓国語翻訳装置1を構成する場合を例にして説明する。また、以下に説明する音訓漢字対応韓国語翻訳装置1において用いられる漢字を韓国語に翻訳する方法が、この発明の音訓漢字対応韓国語翻訳方法が適用されたものである。また、以下に説明する音訓漢字対応韓国語翻訳装置1において実行される漢字を韓国語に翻訳するためのプログラムが、この発明の音訓漢字対応韓国語翻訳プログラムである。
【0015】
[音訓漢字対応韓国語翻訳装置1の構成例]
図1は、この実施の形態の音訓漢字対応韓国語翻訳装置1の構成例を説明するためのブロック図である。図1において、通信I/F101は、ネットワークを通じて受信した信号を自機(音訓漢字対応韓国語翻訳装置1)が処理可能なデータに変換して取り込んだり、送信用の種々のデータをプロトコルに準拠した信号に変換してネットワークに送出したりする。
【0016】
制御部102は、音訓漢字対応韓国語翻訳装置1の各部を制御するものであり、図示しないが、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)がCPUバスを通じて接続されて構成されたコンピュータ装置である。また、制御部102は、種々のアプリケーションを実行するアプリケーション実行部としても機能する。記憶装置103は、記録媒体としてハードディスクを備え、種々のアプリケーションプログラムや種々の処理により得られたデータ等のハードディスクへの書込み/記録保持/読み出し/削除を行う。
【0017】
操作部104は、ユーザーからの操作入力を受け付けて、これを電気信号に変換し、制御部102に供給するものである。操作部104は、アルファベットキー、数字キー、種々のファンクションキー等を備えたキーボードやマウスなど呼ばれるポインティングデバイスなどをも含む。
【0018】
漢字固有名詞辞書105は、固有名詞の漢字と読み(読みカナ)とを対応付けて、地域別、属性別にまとめたものである。図2は、漢字固有名詞辞書105の格納データの例について説明するための図である。図2に示すように、漢字固有名詞辞書105には、漢字で示される固有名詞と、当該固有名詞が用いられる地域と、当該固有名詞の属性と、当該固有名詞の読みカナとが対応付けられて登録されている。そして、図2に示した例では、「浅草」という固有名詞につき、「東京都台東区」において、「地名」としては、「あさくさ」と読まれるが、「寺院名」としては、「せんそう」と読まれることが登録されている。
【0019】
また、図2に示した例では、「新宿」という固有名詞につき、「東京都新宿区」、「群馬県館林市」、「千葉県千葉市」では、「地名」として、「しんじゅく」と読まれることが登録されている。また、同じく「新宿」という固有名詞につき、「群馬県桐生市」、「千葉県市川市」、「神奈川県厚木市」では、「地名」として、「しんしゅく」と読まれることが登録されている。また、同じく「新宿」という固有名詞につき、「茨城県常陸太田市」、「栃木県足利市」、「埼玉県川越市」では、「地名」として、「あらじゅく」と読まれることが登録されている。
【0020】
このように、漢字固有名詞辞書105には、同じ漢字で表された固有名詞であっても、それが用いられる地域や属性によって異なる読み方がされるものについて、図2に示した態様で各情報が記憶保持されている。なお、実際には、地域は例えば市区町村コードにより管理され、属性についても予め決められているコードが用いられて管理される。なお、図2において、属性としては、地名と寺院名しか示さなかったが、これに限るものではない。例えば、人名や物品名など、広く種々の属性が含まれる。
【0021】
単漢字音訓読み辞書106は、日本語のJIS(Japanese Industrial Standards)漢字の単漢字毎に、音読みの読みカナと訓読みの読みカナとを対応付けたものである。図3は、単漢字音訓読み辞書106の格納データの例について説明するための図である。図3に示すように、単漢字音訓読み辞書106には、日本語のJIS漢字1文字(単漢字)毎に、音読みの読みカナと訓読みの読みカナとが対応付けられて登録されている。
【0022】
図3に示した例では、日本語の漢字「亜」については、音読みでは「ア」と読み、訓読みでは「つぐ」と読むことか登録されている。同様に、日本語の漢字「阿」については、音読みでは「ア」と読み、訓読みでは「くま、おもねる」と読むことが登録されている。また、日本語の漢字「安」については、音読みでは「アン」と読み、訓読みでは「やすい、いずくんぞ」と読むことが登録されている。
【0023】
また、図3に示した例では、日本語の漢字「宿」については、音読みでは「シュク、シク」と読み、訓読みでは「やど、やどる、やどす」と読むことが登録されている。また、日本語の漢字「新」については、音読みでは「シン」と読み、訓読みでは「あたらしい、あらた、あら、にい」と読むことが登録されている。このように、単漢字音訓読み辞書106には、JISコードが割り当てられた日本語の漢字のそれぞれ毎に音読みの読みカナと訓読みの読みカナが登録されている。なお、図3には示さなかったが、各単漢字はJISコードによって特定できるようになっている。
【0024】
また、上述もしたように、韓国語の漢字の音読み(ハングル)は日本語の漢字の音読みと同音で発音される。「契約、無料、写真機、調味料、酵素、高速道路、計算、市民、家族、温度」など殆どの音読み漢字(単語)は韓国語でも同じ発音である。また、韓国の漢字は読みと同音のハングル1文字で代替される。このため、日本語の漢字でもそれが音読みである場合には、ハングル文字1文字で置き換えることができる。
【0025】
この点に鑑み、音読み用ハングル辞書107は、音読みの漢字毎に、その読みに対応するハングル文字を登録したものである。図4は、音読み用ハングル辞書107の格納データの例について説明するための図である。図4に示すように、音読み用ハングル辞書107には、日本の漢字の音読みの読みカナと、これに対応するハングル文字とが対応付けられて登録されている。
【0026】
図4に示した例では、音読みで「ア」と読む漢字である「亜、阿、…」、音読みで「アン」と読む漢字である「安、案、暗、…」に対応する1文字のハングル文字が登録されている。同様に、音読みで「ジュク」と読む漢字である「宿、熟、…」、音読みで「シン」と読む漢字である「新、信、真、…」に対応する1文字のハングル文字が登録されている。このように、音読み用ハングル辞書107には、音読みの種々の漢字の読みカナと1文字のハングル文字とが対応付けられて登録されている。
【0027】
訓読み用ハングル辞書108は、訓読みの漢字の読みの各音に対応させたハングル文字を登録したものである。換言すれば、訓読み用ハングル辞書108は、日本語で発音される1音毎に対応する1文字のハングル文字を対応されたものである。図5は、訓読み用ハングル辞書108の格納データの例について説明するための図である。図5に示すように、訓読み用ハングル辞書108には、日本語で発音される1音毎に対応する1文字のハングル文字が対応付けられて登録されている。
【0028】
図5においては、その一例として、日本語の「あ」、「い」、「う」、「え」、「お」のそれぞれに対応する同じ発音のハングル文字が登録されている場合を示している。このように、訓読み用ハングル辞書108には、日本語のいわゆる50音に対応するハングル文字、日本語の濁音に対応するハングル文字、日本語の半濁音に対応するハングル文字等、1発音が日本語の発音と同じになるハングル文字が対応付けられて登録されている。
【0029】
なお、漢字固有名詞辞書105、単漢字音訓読み辞書106、音読み用ハングル辞書107、訓読み用ハングル辞書108のそれぞれは、必ずしも音訓漢字対応韓国語翻訳装置1に設けられている必要はない。ネットワーク上に設けられている漢字固有名詞辞書105、単漢字音訓読み辞書106、音読み用ハングル辞書107、訓読み用ハングル辞書108を通信I/F101を通じて利用することも可能である。また、漢字固有名詞辞書105、単漢字音訓読み辞書106、音読み用ハングル辞書107、訓読み用ハングル辞書108の内の幾つかは音訓漢字対応韓国語翻訳装置1に設け、その他のものはネットワーク上で利用可能なものを用いるといった使い分けを行うことも可能である。
【0030】
表示部109は、種々の画像データや映像データの供給を受けて、これを映像信号に変換し、当該映像信号に応じた画像や映像を自己の表示画面に表示する。この実施の形態において、表示部109には、例えば、操作部104を通じて入力される翻訳対象の漢字や翻訳結果などが表示される。
【0031】
翻訳対象漢字データファイル110は、翻訳対象の漢字データを記憶保持する。図6は、翻訳対象漢字データファイル110の格納データの例について説明するための図である。図6に示すように、この実施の形態においては、翻訳対象の漢字、当該翻訳対象の漢字の読みカナ、当該翻訳対象の漢字の音訓判定結果、当該翻訳対象の漢字の翻訳結果(ハングル文字)の各情報からなる。翻訳対象の漢字および翻訳対象の漢字の読みカナは予め入力されているものである。
【0032】
なお、図6に示した翻訳対象漢字データファイル110において、翻訳対象の漢字の読みカナは、通常は、ユーザーが入力するなどして予め設定されている。しかし、地名等の固有名詞についての読みカナは、後述する読みカナ特定部111の機能により、自動的に特定し、これを翻訳対象の漢字の読みカナとして用いることもできる。また、同ファイル110において、翻訳対象の漢字の音訓判定結果は、後述する音訓判定処理部112による読みカナの音訓判定の結果である。また、同ファイル110において、翻訳対象の漢字の翻訳結果(ハングル文字)は、後述するハングル翻訳部114による当該漢字の翻訳結果である対応するハングル文字である。
【0033】
このように、翻訳対象漢字データファイル110は、翻訳対象の漢字およびその漢字の読みカナが予め入力されており、これらに基づく音訓判定結果及び翻訳結果たるハングル文字が後から更新される構成になっている。なお、図6に示した例では、「荒川(あらかわ)」、「新宿(しんじゅく)」、「渋谷(しぶや)」のそれぞれについての、音訓判定結果と対応するハングル文字とが特定されて更新された場合を示している。
【0034】
なお、この実施の形態においては、説明を簡単にするため、翻訳対象漢字データファイル110は、図6に示す構成を有するものとしたが、これに限るものではない。例えば、地図に表示する種々の名称などのデータ(名称データ)が記録されたデータファイルを、翻訳対象漢字データファイル110とするなど、翻訳対象の漢字とその読みカナとを記憶保持する種々の態様のデータファイルを翻訳対象漢字データファイル110とすることができる。
【0035】
そして、制御部102の制御の下に機能する、読みカナ特定部111、音訓判定処理部112、長音判定処理部113、ハングル翻訳部114が、この実施の実施の形態の音訓漢字対応韓国語翻訳装置1の主要部を構成している。以下、これら主要部について具体的に説明する。
【0036】
読みカナ特定部111は、例えば図6を用いて説明した翻訳対象漢字データファイル110に格納されている主に固有名詞である翻訳対象の漢字に読みカナが付されていない場合に、これを特定して付加する。読みカナ特定部111は、翻訳対象の漢字に基づいて、漢字固有名詞辞書105を参照し、候補となる読みカナを表示部109に表示して、ユーザーによる選択を可能にし、選択された読みカナを翻訳対象の漢字の読みカナ欄に更新する。なお、地図の名称データのように、名称などを表示する地域や名称などが示すものの属性(地名、建物名などの区別)が分かっている場合には、ユーザーの選択操作は必要なく、自動的に正確な読みカナを特定し、翻訳対象漢字データファイル110の該当欄に特定した読みカナを更新できる。
【0037】
音訓判定処理部112は、翻訳対象漢字データファイル110に用意される翻訳対象の漢字とその読みカナに基づいて、図3を用いて説明した単漢字音訓読み辞書106を参照し、当該翻訳対象の漢字の読みカナは、音読みか訓読みかを判定する。この場合、音訓判定処理部112は、翻訳対象の漢字をその先頭から1文字ずつの読みカナについて音読みか訓読みかを判定し、その結果を翻訳対象漢字データファイル110の音訓判定結果に更新する。なお、音訓判定処理部112は、単漢字音訓読み辞書106に登録されていない読みカナについては、所定の判定方法に基づいて音訓判定を行う。当該所定の判定方法は以下の通りである。
【0038】
まず、(1)音読みの場合には漢字1文字の読みが1拍または2拍であり、訓読みの場合には漢字1文字の読みは1拍〜3拍であることに着目し、読みカナが3拍であれば訓読みと判定する。例えば、「形(かたち)」、「椿(つばき)」などは訓読みと判定できる。そして、読みカナが1拍、2拍の漢字について、引き続き音訓判定を行う。次に、読みカナが1拍、2拍の漢字について、(2)撥音(ん)で終わる読みカナは音読みと判定する。例えば、「運(うん)」、「番(ばん)」、「縁(えん)」などは音読みと判定できる。また、(3)拗音(きゃ、きゅ、しゅ、しょ等)を含んだ読みカナは音読みと判定する。例えば、「客(きゃく)」、「蝶(ちょう)」などは音読みと判定できる。
【0039】
また、(4)濁音で始まる読みカナは音読みと判定する。例えば、「毒(どく)」、「台(だい)」などは音読み判定できる。また、(5)促音(っ)が入る読みカナは音読みと判定する。例えば、「発展(はってん)」、「活発(かっぱつ)」などは音読みと判定できる。また、(6)ラ行で始まる読みカナは音読みと判定する。例えば、「陸(りく)」、「列(れつ)」などは音読みと判定できる。また、(7)漢字のつくりが同じパーツを含んだ同音、類似音がある漢字の読みカナは音読みと判定する。例えば、「職(しょく・しき)」と「織(しょく、しき)」、「馬(ば・ま)」と「罵(ば・ま)」、「塀(へい)」と「併(へい)」、「蜜(みつ)」と「密(みつ)」などは音読みと判定できる。また(8)音読みであれば、必ず「イ、ウ、キ、ク、ツ、チ、ン」の7音のいずれかが末尾にくるので、当該7音のいずれも末尾につかなければ訓読みと判定する。
【0040】
上記の(1)〜(8)によっても音訓判定できないものに関しては、例外辞書に予め登録し、これを用いて判定することが可能である。しかし、殆どの場合、単漢字音訓読み辞書106と上記(1)〜(8)の手順で示した所定の判定方法を用いることによって、漢字の読みカナの音訓判定を行うことができる。
【0041】
長音判定処理部113は、翻訳対象の漢字の読みカナに長音が含まれるか否かを判定し、読みカナに長音が含まれる場合に、その長音を削除する処理を行う。韓国語には長音は存在せず、対応する音のハングル文字に翻訳する場合に支障が生じるためである。ここで、長音は、日本語の音節で、母音を通常の倍にのばしたものを意味する。すなわち、1音節で2モーラ(2拍)を持つものであり、音声学的には長母音である。
【0042】
ハングル翻訳部114は、音読み用ハングル翻訳部114Aと訓読み用ハングル翻訳部114Bとを備える。音読み用ハングル翻訳部114Aは、読みカナが音読みであると判定された漢字について、その読みカナに基づいて音読み用ハングル辞書107を参照し、1文字の漢字を1文字のハングル文字に翻訳する。また、訓読み用ハングル翻訳部114Bは、読みカナが訓読みであると判定された漢字について、その読みカナの1発音毎に訓読み用ハングル辞書108を参照し、1文字の漢字を1文字以上のハングル文字に翻訳する。そして、ハングル翻訳部114は、翻訳したハングル文字を翻訳対象漢字データファイル110の対応する漢字のハングル文字に更新する。なお、「服部(はっとり)」などの特殊な読みカナの漢字については、訓読み用ハングル翻訳部114Bが機能し、その読みカナの1発音毎に訓読み用ハングル辞書108を参照し、1文字の漢字を複数文字のハングル文字に翻訳する。
【0043】
図7は、この実施の形態の音訓漢字対応韓国語翻訳装置1によって行われた翻訳処理の結果の一例を説明するための図である。図2を用いて説明したように、地名である「新宿」は地域によって読みカナが異なる。しかし、この実施の形態の音訓漢字対応韓国語翻訳装置1においては、例えば、漢字固有名詞辞書105などを用いることにより、その読みカナを正確に特定することにより、各漢字の読みカナが音読みか訓読みかを正確に特定する。
【0044】
そして、音読みの漢字は対応する1文字のハングル文字に翻訳し、訓読みの漢字については、その読みカナの1音1音毎に1文字のハングル文字に翻訳する。これにより、図7に示すように、同じ「新宿」との漢字を用いる場合であっても、「しんじゅく」と読む場合には両漢字とも音読みであるので2文字のハングル文字に翻訳できる。同様に、「しんしゅく」と読む場合も、両漢字とも音読みであるので2文字のハングル文字に翻訳できる。また、「にいじゅく」と読む場合には、「新(にい)」は訓読み、「宿(じゅく)」は音読みであるので、図7に示すように訓読みの「新(にい)」は二文字のハングル文字に翻訳し、音読みの「宿(じゅく)」は1文字のハングル文字に翻訳し、これらを結合して3文字のハングル文字に翻訳できる。
【0045】
同様に、「あらじゅく」と読む場合には、「新(あら)」は訓読み、「宿(じゅく)」は音読みであるので、図7に示すように、訓読みの「新(あら)」は二文字のハングル文字に翻訳し、音読みの「宿(じゅく)」は1文字のハングル文字に翻訳し、これらを結合して3文字のハングル文字に翻訳できる。また、「あらやど」読む場合には、「新(あら)」は訓読み、「宿(やど)」も訓読みであるので、図7に示すように、訓読みの「新(あら)」は二文字のハングル文字に翻訳し、訓読みの「宿(やど)」も2文字のハングル文字に翻訳し、これらを結合して4文字のハングル文字に翻訳できる。
【0046】
したがって、「新宿」を「しんじゅく」と音読みで読む場合までを、例えば「シン・ジュ・ク」と3つの音節に分解し、3文字のハングル文字に変換してしまうことを防止できる。また、「新宿」を「にいじゅく」や「あらじゅく」のように訓読みと音読みとを含む場合や「あらやど」のように訓読みだけの場合にも、「シン・ジュ・ク」という読みカナに従って合致しない発音のハングル文字に翻訳することもない。
【0047】
[音訓漢字対応韓国語翻訳装置1の処理のまとめ]
次に、上述したこの実施の形態の音訓漢字対応韓国語翻訳装置1で行われる音訓漢字対応韓国語翻訳処理についてまとめる。図8は、この実施の形態の音訓漢字対応韓国語翻訳装置1で行われる音訓漢字対応韓国語翻訳処理を説明するためのフローチャートである。この実施の形態の音訓漢字対応韓国語翻訳装置1は、操作部104を通じて入力される漢字とその読みカナに基づいて、当該漢字をハングル文字に翻訳することもできるものである。しかし、ここでは説明を簡単にするため、図6を用いて説明した翻訳対象漢字データファイル110に、翻訳対象となる地名等の漢字データが既に用意されている場合を例にして説明する。
【0048】
この実施の形態の音訓漢字対応韓国語翻訳装置1においては、例えば、所定のメニューから音訓漢字対応韓国語翻訳処理を実行する項目が選択されると、制御部102は、図8のフローチャートに示す音訓漢字対応韓国語翻訳処理を実行する。まず、制御部102は、翻訳対象漢字データファイル110を参照し、最初に翻訳対象となる漢字データを特定する(ステップS101)。
【0049】
そして、制御部102は、特定した漢字データに読みカナが付されていない場合には、読みカナ特定部111を制御し、漢字固有名詞辞書105を用いて当該翻訳対象の漢字の読みカナを特定する処理を行う(ステップS102)。このステップS102においては、特定した読みカナを、図6を用いて説明した翻訳対象漢字データファイル110の該当漢字の音訓判定結果の欄に更新する処理をも行う。なお、翻訳対象の漢字に既に読みカナが付されている場合には、ステップS102の処理は行われない。
【0050】
次に、制御部102は、音訓判定処理部112を制御し、単漢字音訓読み辞書106や上述した所定の判定方法を用いて、翻訳対象の漢字について、先頭から1文字ずつ音読みか訓読みかの判定を行う(ステップS103)。なお、ステップS103では、例えば、「服部(はっとり)」などのように、単漢字音訓読み辞書106ではその読みカナが音読みか訓読みかを判定できない漢字については、特殊の読みカナの漢字として、読みカナ通りに翻訳するものとして特定する。
【0051】
そして、制御部102は、長音判定処理部113を制御し、音訓判定した各漢字の読みカナについて、長音が含まれるか否かを判定し、長音が含まれる場合には、その読みカナからその長音を削除する処理を行う(ステップS104)。この後、制御部102は、ハングル翻訳部114を制御し、読みカナの音訓判定が行われた翻訳対象の漢字について、その読みカナに基づいてハングル文字への翻訳処理を実行する(ステップS105)。
【0052】
ステップS105においては、音読みの漢字1文字については、その読みカナに基づいて音読み用ハングル辞書107が用いられて、1文字のハングル文字に翻訳される。また、訓読みの漢字や特殊な読みの漢字は、その漢字の読みカナの発音通りに、1音を1文字のハングル文字に翻訳する。そして、制御部102は、ステップS105で得られた翻訳結果(ハングル文字列)を、図6を用いて説明した翻訳対象漢字データファイル110の該当漢字のハングル文字(翻訳結果)の欄に更新する(ステップS106)。
【0053】
そして、制御部102は、翻訳対象漢字データファイル110に格納されている全ての漢字データについての翻訳処理が終了したか否かを判別する(ステップS107)。ステップS107の判別処理において、終了していないと判別したときには、制御部102は、翻訳対象漢字データファイル110の次に翻訳すべき漢字データを処理対象に位置付け(ステップS108)、ステップS102からの処理を繰り返す。また、ステップS107の判別処理において、終了したと判別したときには、制御部102は、翻訳対象漢字データファイル110をクローズするなどの所定の終了処理を実行し(ステップS109)、この図8に示す処理を終了する。このようにして、この実施の形態の音訓漢字対応韓国語翻訳装置1は、日本語の漢字を適切にハングル文字に翻訳できる。
【0054】
[実施の形態の効果]
この実施の形態の音訓漢字対応韓国語翻訳装置1は、ハングル文字への翻訳対象の漢字の1文字ずつの読みカナについて、音読みか訓読みかを適切に判定し、音読みの漢字1文字は、対応するハングル文字1文字に変換する。また、訓読みの漢字や特殊な読みの漢字については、その発音通りに1音につき、1文字のハングル文字に変換する。これにより、日本語の漢字を、日本語の発音から大きく外れることなく、また、1文字の漢字を不用意に複数のハングル文字に変換することなく、適切なハングル文字に変換できる。換言すれば、日本語の漢字をその読み(読みカナ)が音読みか訓読みかをも考慮して、日本語の発音にほぼ合致し、しかも適切な文字数のハングル文字に変換できる。
【0055】
特に、名称などが日本語の地図から名称などが韓国語の地図を作成する場合において、名称などの文字数が必要以上に多くなったり、また、全く異なる発音のハングル文字に変換してしまったりするなどといった不都合を生じさせることがない。従って、適切なハングル文字で表された地図などが作成できる。このように、この発明は、地名などの固有名詞の漢字をハングル文字に翻訳する場合において特に効果的である。
【0056】
[変形例]
なお、上述した実施の形態においては、地名を示す日本語の漢字「新宿」をハングル文字に翻訳する場合を例にして説明したが、翻訳対象の漢字は、1文字以上の種々の文字数の漢字をハングル文字への翻訳対象とすることができる。例えば、人名や施設の名称等の漢字表現された固有名詞をハングル文字に翻訳する場合に効果が大きい。
【0057】
また、施設の名称の中には、「グランドホテル新宿」などのように、カタカナと漢字とか組み合わされた名称なども存在する。このような場合、カタカナ部分はその発音通りに1音ずつハングル文字に翻訳し、漢字部分につき、この発明を適用することが可能である。
【0058】
また、上述した実施の形態では、翻訳対象漢字データファイル110に登録された翻訳対象の漢字を一括してハングル文字に翻訳する場合を例にして説明したが、これに限るものではない。例えば、スマートホンと呼ばれる高機能携帯電話端末を用いて、名称などが日本語で表示された地図を閲覧している時に、指示した位置に表示されている日本語の名称などを韓国語に翻訳する場合にもこの発明を適用できる。この場合には、翻訳対象の日本語の漢字が、指示された位置に表示されている名称などになるだけであり、図8を用いて説明した処理により、日本語の名称などを韓国語に翻訳できる。このように、この発明は、日本語の多くの漢字を一括して韓国語に翻訳する場合だけでなく、指示した所定の漢字だけを韓国語に翻訳する場合にも用いることができる。
【0059】
また、図1に示した読みカナ特定部111、音訓判定処理部112、長音判定処理部113、ハングル翻訳部114の各機能を、制御部102で実行されるプログラムによって、制御部102の機能として実現することもできる。
【0060】
[その他]
なお、請求項1〜請求項4における音訓漢字対応韓国語翻訳装置の各手段と、実施の形態の音訓漢字対応韓国語翻訳装置1の各部とを対応付けると以下のようになる。すなわち、単漢字辞書の機能は単漢字音訓読み辞書106が実現し、第1のハングル辞書の機能は音読み用ハングル辞書107が実現し、第2のハングル辞書は訓読み用ハングル辞書108が実現している。また、音訓判定手段の機能は音訓判定処理部112が実現し、変換手段の機能はハングル翻訳部114が実現している。また、固有名詞辞書の機能は漢字固有名詞辞書105が実現し、特定手段の機能は読みカナ特定部111が実現している。また、長音判定手段の機能は長音判定処理部113が実現している。
【0061】
また、この発明の音訓漢字対応韓国語翻訳方法は、図8に示したフローチャートに対応している。また、図8に示した音訓漢字対応韓国語翻訳処理を実行するプログラムが、この発明の音訓漢字対応韓国語翻訳プログラムに対応している。
【符号の説明】
【0062】
1…音訓漢字対応韓国語翻訳装置、101…通信I/F、102…制御部、103…記憶装置、104…操作部、105…漢字固有名詞辞書、106…単漢字音訓読み辞書、107…音読み用ハングル辞書、108…訓読み用ハングル辞書、109…表示部、110…翻訳対象漢字データファイル、111…読みカナ特定部、112…音訓判定処理部、113…長音判定処理部、114…ハングル翻訳部、114A…音読み用ハングル翻訳部、114B…訓読み用ハングル翻訳部
図1
図2
図3
図4
図5
図6
図7
図8