特許第6076285号(P6076285)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ゼンリンデータコムの特許一覧

<>
  • 特許6076285-翻訳装置、翻訳方法及び翻訳プログラム 図000002
  • 特許6076285-翻訳装置、翻訳方法及び翻訳プログラム 図000003
  • 特許6076285-翻訳装置、翻訳方法及び翻訳プログラム 図000004
  • 特許6076285-翻訳装置、翻訳方法及び翻訳プログラム 図000005
  • 特許6076285-翻訳装置、翻訳方法及び翻訳プログラム 図000006
  • 特許6076285-翻訳装置、翻訳方法及び翻訳プログラム 図000007
  • 特許6076285-翻訳装置、翻訳方法及び翻訳プログラム 図000008
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6076285
(24)【登録日】2017年1月20日
(45)【発行日】2017年2月8日
(54)【発明の名称】翻訳装置、翻訳方法及び翻訳プログラム
(51)【国際特許分類】
   G06F 17/28 20060101AFI20170130BHJP
【FI】
   G06F17/28 663
   G06F17/28 609
【請求項の数】7
【全頁数】15
(21)【出願番号】特願2014-62001(P2014-62001)
(22)【出願日】2014年3月25日
(65)【公開番号】特開2015-184998(P2015-184998A)
(43)【公開日】2015年10月22日
【審査請求日】2016年3月28日
(73)【特許権者】
【識別番号】500578216
【氏名又は名称】株式会社ゼンリンデータコム
(74)【代理人】
【識別番号】100091546
【弁理士】
【氏名又は名称】佐藤 正美
(72)【発明者】
【氏名】小関 光昭
【審査官】 成瀬 博之
(56)【参考文献】
【文献】 特開2015−176541(JP,A)
【文献】 特開2013−061830(JP,A)
【文献】 特開昭61−070663(JP,A)
【文献】 特開2009−075748(JP,A)
【文献】 特開2013−257672(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/20−17/28
(57)【特許請求の範囲】
【請求項1】
文字列とその読み仮名とを対応付けた読み仮名辞書と、
前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第1のプログラム作成手段と、
読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書と、
前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成手段と、
前記第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
前記第2のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
を備えることを特徴とする翻訳装置。
【請求項2】
請求項1に記載の翻訳装置であって、
前記第2のプログラム作成手段は、所定の翻訳条件に合致するプログラムロジックに変換できるものであることを特徴とする翻訳装置。
【請求項3】
請求項1または請求項2のいずれかに記載の翻訳装置であって、
前記読み仮名辞書と前記翻訳辞書とは、検索語の一致方式が、前方一致、後方一致、部分一致で異なる複数の辞書からなることを特徴とする翻訳装置。
【請求項4】
請求項3に記載の翻訳装置であって、
前記第1のプログラム作成手段は、前方一致、後方一致、部分一致で使用される前記読み仮名辞書のそれぞれを、最長一致法で読み仮名を置換するプログラムロジックに変換するものであり、
前記第2のプログラム作成手段は、前方一致、後方一致、部分一致で使用される前記翻訳辞書のそれぞれを、最長一致法で対象翻訳言語に置換するプログラムロジックに変換するものであることを特徴とする翻訳装置。
【請求項5】
請求項1、請求項2、請求項3または請求項4のいずれかに記載の翻訳装置であって、
前記翻訳対象の文字列は、場所に関するものであり、前記読み仮名変換辞書には、各文字列に対応して、その文字列が属する地域を示すエリア情報と、その文字列の属性を示す属性情報とが付加されており、
前記第1のプログラム作成手段は、前記エリア情報と前記属性情報とを含めて、前記読み読み仮名変換辞書の内容をプログラムロジックに変換することを特徴とする翻訳装置。
【請求項6】
第1のプログラム作成手段が、文字列とその読み仮名とを対応付けた読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第1のプログラム作成工程と、
第2のプログラム作成手段が、読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成工程と、
前記第1のプログラム作成工程において作成した前記読み仮名付与プログラムを、読み仮名付与手段が実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与工程と、
前記第2のプログラム作成工程において作成した翻訳プログラムを、翻訳手段が実行し、前記読み仮名付与工程で付与した読み仮名を目的とする言語に翻訳する翻訳工程と
を有することを特徴とする翻訳方法。
【請求項7】
文字列とその読み仮名とを対応付けた読み仮名辞書と、読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書とを備えた情報処理装置に搭載されたコンピュータを、
前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第1のプログラム作成手段と、
前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成手段と、
前記第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
前記第2のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
して機能させることを特徴とする翻訳プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、例えば、地図上に記載される文字情報であるいわゆる地図注記などのように、大量に存在する名詞句の羅列データの翻訳を行うための装置、方法、プログラムに関する。
【背景技術】
【0002】
従来から機械翻訳装置に関する種々の発明がなされている。例えば、後に記す特許文献1には、固有名詞を翻訳する場合であっても、固有名詞辞書を適切に整備しておくことにより正確に翻訳することができることが記載されている。また、同文献には、固有名詞辞書に登録された各固有名詞に対する捕捉語を記憶保持する捕捉語辞書をも用いることにより、固有名詞がどのようなものかについても翻訳結果に含めるようにすることが記載されている。これにより、翻訳結果をより理解し易いものとすることができるという点で効果がある。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2004−220416号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の機械翻訳装置の場合、翻訳のために種々の辞書が必要になっている。上述した特許文献1に記載の発明でも固有名詞などの翻訳辞書に加えて捕捉語辞書も必要なっている。翻訳のために辞書を検索する処理にはある程度時間がかかるために、大量の固有名詞などの名詞句の羅列の翻訳を行う場合には時間が掛かる。例えば、大量の名詞句の羅列の翻訳行う場合の例として、地図注記の翻訳を行う場合について考える。
【0005】
地図には、例えば、市街図、道路図、広域図、地方図、全国図といった種々のものがあり、さらに同じ種類の地図でも縮尺の異なる複数の地図が存在する。このように、種類や縮尺の異なる全ての地図を対象にした場合、地図注記は数千万件も存在する。そして、数字、アルファベット、アイコンのみにより構成される地図注記などの翻訳が必要ないものは除外し、重複する地図注記は1つに集約したとしても、翻訳対象となる地図注記は数百万件も存在する。
【0006】
この数百万件の地図注記を、従来の辞書を参照する方式で多言語に機械翻訳する場合には、数週間を要しているのが現状である。また、地図注記は、地図上の地物が無くなったり、新たにできたりした場合には、必ず変わるため、所定のタイミングで現地調査をして更新し、翻訳し直す必要がある。
【0007】
このように、地図注記は、翻訳を繰り返す必要があるため、できるだけ高速に翻訳したいとする要求が従来からある。このことは地図注記だけでなく、住所リスト、電話帳リスト、顧客リストなどに記載された、例えば、地名、名称、名前、住所といった多数の名詞句の羅列を翻訳する場合にも同様に生じている課題である。
【0008】
以上のことに鑑み、この発明は、大量に存在する名詞句の羅列データを、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できるようにすることを目的とする。
【課題を解決するための手段】
【0009】
上記課題を解決するため、請求項1に記載の発明の翻訳装置は、
文字列とその読み仮名とを対応付けた読み仮名辞書と、
前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第1のプログラム作成手段と、
読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書と、
前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成手段と、
前記第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
前記第2のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
を備えることを特徴とする。
【0010】
この請求項1に記載の発明の翻訳装置によれば、読み仮名辞書は、第1のプログラム作成手段によって、その内容がプログラムロジックに変換され、入力さえた文字列に対してその読み仮名を付与する読み仮名付与プログラムとなる。同様に、翻訳辞書は、第2のプログラム作成手段によって、その内容がプログラムロジックに変換され、読み仮名を所定の言語に翻訳する翻訳プログラムとなる。
【0011】
当該翻訳装置では、読み仮名変換手段が、第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する。当該読み仮名付与プログラムは、読み仮名辞書の内容がそのままプログラムロジックとされたものなので、外部の読み仮名辞書を参照する必要は全く無い。
【0012】
当該翻訳装置では、翻訳手段が、第2のプログラム作成手段で作成された翻訳プログラムを実行し、読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する。当該翻訳プログラムは、翻訳辞書の内容がそのままプログラムロジックとされたものなので、外部の翻訳辞書を参照する必要は全く無い。
【0013】
このように、当該翻訳装置では、翻訳対象の文字列に読み仮名を付与する場合にも、また、付与された読み仮名を目的とする言語に翻訳する場合にも、外部の辞書を全く参照しないため、極めて高速に翻訳を行える。従って、翻訳対象の文字列が多数存在していても、超高速に翻訳が行える。
【発明の効果】
【0014】
この発明によれば、例えば、地図注記などの大量に存在する名詞句の羅列を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できる。
【図面の簡単な説明】
【0015】
図1】実施の形態の翻訳装置の構成例と動作の概要を説明するためのブロック図である。
図2】読み仮名辞書群111の内の固有名詞読み仮名辞書の一例を示す図である。
図3図2に示した固有名詞読み仮名辞書をプログラムロジックに変換して形成した読み仮名付与プログラムの例を示す図である。
図4】入力データ「23,138,小碓通」を翻訳処理する場合の例を説明するための図である。
図5】従来の翻訳装置における翻訳処理の概要を説明するための図である。
図6】実施の形態の翻訳装置で行われる翻訳処理のための事前準備処理を説明するためのフローチャートである。
図7】実施の形態の翻訳装置で行われる翻訳処理を説明するためのフローチャートである。
【発明を実施するための形態】
【0016】
以下、図を参照しながら、この発明の装置、方法、プログラムの一実施の形態について説明する。この発明は、地図注記、電話帳リスト、顧客リストなどに記載された地名、名称、名前、住所といった、大量に存在する名詞句の羅列データについて翻訳を行う場合に適用可能なものである。「名詞句」との文言は、物体、物質、人物、場所など具体的な対象を示す語句を意味する。この明細書において、翻訳対象となる「名詞句の羅列」の具体例として、地図注記、電話帳リスト、顧客リストなどに記載された、例えば、地名、名称、名前、住所といったものを想定している。
【0017】
以下においては、地図注記の翻訳を行う場合を例にして具体的に説明する。地図注記は、上述もしたように大量に存在し、頻繁に更新されるため、その更新の都度、翻訳し直さなければならないものであること。また、近年おいては、外国から日本を訪れる観光客やビジネスマンも増えてきており、最新の地図の地図注記を所定の外国語に翻訳して表した外国語対応の最新の地図を迅速に提供することが望まれていること。しかも、外国語は、中国語(簡体)、中国語(繁体)、英語、韓国語などというように、複数の言語に対応することが求められることなどの事情がある。
【0018】
このような背景の下、以下に説明する実施の形態の装置、方法、プログラムは、大量に存在する地図注記を、従来の機械翻訳装置に比べて、飛躍的に速く、しかも適切に、且つ、複数の言語に翻訳することを実現している。
【0019】
[ビッグデータ翻訳装置の構成例]
まず、この実施の形態のビッグデータ翻訳装置(以下、単に翻訳装置と記載する。)の構成例と動作の概要について説明する。図1は、この実施の形態の翻訳装置の構成例と動作の概要を説明するためのブロック図である。図1に示す翻訳装置において、制御部101は、当該翻訳装置の各部を制御する機能を、記憶装置102は情報記憶保持機能を実現し、操作部103は、ユーザーインターフェース機能を実現する。
【0020】
読み仮名辞書群111は、固有名詞読み仮名辞書、一般名詞読み仮名辞書、接頭語読み仮名辞書、接尾語読み仮名辞書、カタカナ語読み仮名辞書などの複数の読み仮名辞書を備え、日本語の地図注記データに対する読み仮名を提供する。なお、図示していないが、接頭語読み仮名辞書は、固有名詞接頭語読み仮名辞書、一般名詞接頭語読み仮名辞書、カタカナ語接頭語読み仮名辞書がある。同様に、接尾語読み仮名辞書は、固有名詞接尾語読み仮名辞書、一般名詞接尾語読み仮名辞書、カタカナ語接尾語読み仮名辞書がある。
【0021】
また、固有名詞読み仮名辞書、一般名詞読み仮名辞書、カタカナ語読み仮名辞書のそれぞれは、部分一致により漢字の読み仮名の検索が可能なものである。また、各接頭語読み仮名辞書は、接頭語の読み仮名を提供するものであるので、前方一致により漢字の読み仮名の検索が可能なものである。また、各接尾語読み仮名辞書は、接尾語の読み仮名を提供するものであるので、後方一致により漢字の読み仮名の検索が可能なものである。
【0022】
読み仮名付与プログラム作成部(第1のプログラム作成手段)112は、読み仮名辞書群111の各読み仮名辞書の内容をプログラムロジックに変換し、地図注記データに対して読み仮名を付与する読み仮名付与プログラムを作成する。読み仮名付与プログラム作成部112により作成された読み仮名付与プログラムは、読み仮名付与プログラム格納部113に格納される。読み仮名付与プログラム格納部113は、例えば、記憶装置102の所定の格納領域に形成される。
【0023】
図2は、読み仮名辞書群111の内の固有名詞読み仮名辞書の一例を示す図である。図3は、図2に示した固有名詞読み仮名辞書の一例から読み仮名付与プログラム作成部112により作成され、読み仮名付与プログラム格納部113に格納される読み仮名付与プログラムの一例を示す図である。
【0024】
図2に示すように、読み仮名辞書は、エリアコード、属性番号、固有名詞及びその読み仮名からなる。エリアコードは、所定のエリアを一意に特定する情報である。エリアコードで特定される所定のエリアとしては、例えば都道府県がある。もちろん、都道府県よりも細分化したエリアとすることも可能である。属性番号は、地図注記として用いられる固有名詞がどのような属性のものかを示すものであり、例えば、地名、教育機関、公共機関、山岳、河川など100以上の属性(レイヤ)に分類されている。
【0025】
また、図2において、固有名詞は、地図注記として用いられる固有名詞であり、読み仮名は、対応する固有名詞の読み仮名である。図2に示した固有名詞読み仮名辞書の一例は、愛知県(エリアコード=23)の、地名(属性番号=138)の一部を示すものである。なお、ここでは、固有名詞読み仮名辞書の例を示したが、その他の一般名詞読み仮名辞書、接頭語読み仮名辞書、接尾語読み仮名辞書、カタカナ語読み仮名辞書も基本的に図2に示した固有名詞読み仮名辞書と同様の構成を有する。
【0026】
図2に示した固有名詞読み仮名辞書を、読み仮名付与プログラム作成部112によりプログラムロジックに変換すると、図3に示す読み仮名付与プログラムが得られる。図3に示した読み仮名付与プログラムは、プログラミング言語としてPerl(パール)によって記述されたものである。図3に示す読み仮名付与プログラムは、エリアコードと属性番号が一致し、且つ、地図注記(この例では固有名詞である地名)が一致したら、地図注記と読み仮名を出力するものである。
【0027】
読み仮名付与プログラム作成部112は、具体例を示せば、図2に示した固有名詞読み仮名辞書から、図3に示した読み仮名付与プログラムを作成するものである。この実施の形態においては、最長一致法により地図注記の読み仮名を特定する。このため、読み仮名付与プログラム作成部112は、読み仮名辞書の内容を、名詞句(図2図3に示した例では固有名詞)を長いもの順に並び変えたプログラムを作成している。図3に示した読み仮名付与プログラムを見れば分かるように、読み仮名辞書の内容がそのままプログラムロジックとなっているので、外部の辞書を参照する必要の全く無いプログラムとなっている。
【0028】
実際には、読み仮名辞書群111は、上述したように複数の読み仮名辞書を備えているため、読み仮名付与プログラム作成部112により作成される読み仮名付与プログラムは、各読み仮名辞書に対応したプログラムロジック部を有する。より具体的には、読み仮名付与プログラムは、初期処理部、ユーザー辞書提供部、固有名詞接尾語辞書(後方一致)ロジック部、固有名詞接頭語辞書(前方一致)ロジック部、固有名詞辞書(部分一致)ロジック部、一般名詞接尾語辞書(後方一致)ロジック部、一般名詞接頭語辞書(前方一致)ロジック部、一般有名詞辞書(部分一致)ロジック部、カタカナ語一般名詞接尾語辞書(後方一致)ロジック部、カタカナ語一般名詞接頭語辞書(前方一致)ロジック部、カタカナ語一般有名詞辞書(部分一致)ロジック部、例外処理部、終了処理部の各部からなる。
【0029】
読み仮名付与プログラム作成部112は、上記の各ロジック部の作成(生成)時には、(1)処理対象の読み仮名辞書から同じエリアコードと属性番号の辞書データ(エリアコード、属性番号、名詞句、読み仮名)を抽出する。そして、(2)読み仮名付与プログラム作成部112は、抽出した辞書データを名詞句の文字数の多いもの順に並べ変える。最長一致により読み仮名の抽出を可能にするためである。当該(1)、(2)の処理を処理対象の辞書から同じエリアコードと属性番号の辞書データが無くなるまで繰り返し、無くなれば、次のエリアコードと属性番号を有する辞書データの処理に移る。
【0030】
このようにして、処理対処の全ての辞書データについて処理が完了すると、当該処理対処の読み仮名辞書に対応するロジック部が作成(生成)できる。そして、読み仮名辞書群111の各読み仮名辞書について、プログラムロジックを作成することにより、前方一致、後方一致、部分一致で用いられる各読み仮名辞書を最長一致法で読み仮名を抽出する読み仮名付与プログラムロジックに変換できる。
【0031】
言語別翻訳辞書群121は、この実施の形態では、日本語の地図注記データの読み仮名を、目的とする外国語に翻訳するための言語別の翻訳辞書を備える。この実施の形態では、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に対応するため、4言語の翻訳辞書を備える。更に、各言語の翻訳辞書は、大きく分けると、一般名詞に関する辞書やカタカナ語に関する辞書を備える。一般名詞に関する辞書は、一般名詞接尾語辞書、一般名詞接頭語辞書、一般名詞辞書からなる。カタカナ語に関する辞書は、カタカナ語固有名詞接尾語辞書、カタカナ語固有名詞接頭語辞書、カタカナ語固有一般名詞辞書、カタカナ語一般名詞接尾語辞書、カタカナ語一般名詞接頭語辞書、カタカナ語一般名詞辞書からなる。
【0032】
また、一般名詞辞書、カタカナ語固有名詞辞書、カタカナ語一般名詞辞書のそれぞれは、部分一致により読み仮名などに対応する翻訳データ(翻訳語句)の検索が可能なものである。また、各接頭語辞書は、接頭語に対応する翻訳データを提供するものであるので、前方一致により接頭語の翻訳データの検索が可能なものである。また、各接尾語辞書は、接尾語の翻訳データを提供するものであるので、後方一致により接尾語の翻訳データの検索が可能なものである。
【0033】
言語別翻訳辞書群121が有する翻訳辞書もまた、図2に示した読み仮名辞書の場合と同様に、エリアコード、属性番号を備える。翻訳辞書の場合、図2における「固有名詞」が「読み仮名」などとなり、図2における「読み仮名」が「所定の言語の文字列(翻訳データ)」となるものである。
【0034】
言語別翻訳プログラム作成部(第2のプログラム作成手段)122は、言語別翻訳辞書群121の各翻訳辞書の内容をプログラムロジックに変換し、地図注記データの読み仮名などを、所定の言語に変換する言語別翻訳プログラムを作成する。言語別翻訳プログラム作成部122により作成された言語別翻訳プログラムは、言語別翻訳プログラム格納部123に格納される。言語別翻訳プログラム格納部123、例えば、記憶装置102の所定の格納領域に形成される。
【0035】
言語別翻訳プログラム作成部122により作成される言語別翻訳プログラムのプログラムロジック自体は、図3に示した読み仮名変換プログラムと同様のものである。すなわち、言語別翻訳プログラム作成部122により作成される言語別翻訳プログラムは、エリアコードと属性番号が一致し、且つ、読み仮名など(この例では地図注記の読み仮名など)が一致したら、当該読み仮名などと対応する所定の言語の文字列(翻訳データ)を出力するものである。
【0036】
実際には、言語別翻訳辞書群121は、上述したように複数の翻訳辞書を備えているため、言語別翻訳プログラム作成部122により作成される言語別翻訳プログラムは、各翻訳辞書に対応したプログラムロジック部を有する。より具体的には、言語別翻訳プログラムは、初期処理部、ユーザー辞書提供部、一般名詞接尾語辞書(後方一致)ロジック部、一般名詞接頭語辞書(前方一致)ロジック部、一般名詞辞書(部分一致)ロジック部、カタカナ語固有名詞接尾語辞書(後方一致)ロジック部、カタカナ語固有名詞接頭語辞書(前方一致)ロジック部、カタカナ語固有有名詞辞書(部分一致)ロジック部、カタカナ語一般名詞接尾語辞書(後方一致)ロジック部、カタカナ語一般名詞接頭語辞書(前方一致)ロジック部、カタカナ語一般有名詞辞書(部分一致)ロジック部、例外処理部、終了処理部などの各部からなる。
【0037】
言語別翻訳プログラム作成部122は、上記の各ロジック部の作成(生成)時には、(A)処理対象の翻訳辞書から同じエリアコードと属性番号の辞書データ(エリアコード、属性番号、名詞句、翻訳データ)を抽出する。そして、(B)言語別翻訳プログラム作成部122は、抽出した辞書データを名詞句の文字数の多いもの順に並べ変える。最長一致により翻訳データの抽出を可能にするためである。当該(A)、(B)の処理を処理対象の辞書から同じエリアコードと属性番号の辞書データが無くなるまで繰り返し、無くなれば、次のエリアコードと属性番号を有する辞書データの処理に移る。
【0038】
このようにして、処理対処の全ての辞書データについて処理が完了すると、当該処理対処の翻訳辞書に対応するロジック部が作成(生成)できる。そして、言語別翻訳辞書群121の各翻訳辞書について、プログラムロジックを作成することにより、前方一致、後方一致、部分一致で用いられる各翻訳辞書を最長一致法で読み仮名を抽出する言語別翻訳プログラムロジックに変換できる。
【0039】
翻訳対象データファイル(図1では、翻訳対象データFと記載。)131は、翻訳対象となる多数の地図注記データを保持する。具体的に、翻訳対象データファイル131には、「エリアコード、属性番号、地図注記データ」からなる翻訳対象データが多数保持されている。この翻訳対象データファイル131には、例えば、図示しない外部インターフェイスなどを通じて外部機器から提供された翻訳対象データなどが格納される。
【0040】
読み仮名付与プログラム実行部132は、読み仮名付与プログラム作成部112により作成され、読み仮名付与プログラム格納部113に格納されている読み仮名付与プログラムを読み出して実行する。これにより、翻訳対象データファイル131に格納されている翻訳対象データの地図注記データに対して、実行された読み仮名付与プログラムにより読み仮名が付与される。
【0041】
このようにして、翻訳対象データに対して読み仮名が付与されて形成された読み仮名データは、読み仮名データファイル(図1では、読み仮名データFと記載。)133に記録される。当該読み仮名データは、「エリアコード、属性番号、地図注記データ、対応する読み仮名」からなるものである。読み仮名データファイル133は、ハードディスクなどの大容量記録媒体に作成される。
【0042】
言語別翻訳プログラム実行部134は、言語別翻訳プログラム作成部122により作成され、言語別翻訳プログラム格納部123に格納されている言語別翻訳プログラムを読み出して実行する。これにより、読み仮名データファイル133に格納されている各読み仮名データの読み仮名が、実行された言語別翻訳プログラムにより所定の言語に翻訳され、読み仮名データに対して、翻訳データが付加された言語別翻訳データが形成される。
【0043】
言語別翻訳プログラム実行部134により実行された言語別翻訳プログラムにより作成された言語別翻訳データは、言語別翻訳データファイル135に記録される。当該言語別翻訳データは、「エリアコード、属性情報、地図注記データ、対応する読み仮名、所定の言語の文字列(翻訳データ)」からなるものである。言語別翻訳データファイル135は、ハードディスクなどの大容量記録媒体に作成される。
【0044】
このように、この実施の形態の翻訳装置は、読み仮名辞書をプログラムロジックに変換して、読み仮名付与プログラムを作成し、この読み仮名付与プログラムを用いて、翻訳対象の地図注記データに対して読み仮名を付与する。また、この実施の形態の翻訳装置は、言語別の翻訳辞書をプログラムロジックに変換して、言語別翻訳プログラムを作成し、この言語別翻訳プログラムを用いて、地図注記データに対して付与された読み仮名を目的とする言語に翻訳する。
【0045】
このように、使用される種々の辞書は、プログラムロジックに変換され、プログラムとして機能するので、種々の辞書を参照することが無く、プログラムを通じて、地図注記に対して読み仮名を付与し、この読み仮名が所定の言語に翻訳される構成になっている。これにより、外部の辞書を参照しないので、大量の地図注記を高速に目的とする言語に翻訳できる。
【0046】
[翻訳装置の動作の具体例]
次に、図1を用いて説明したこの実施の形態の翻訳装置における翻訳処理の具体例について説明する。この実施の形態の翻訳装置は、大量の地図注記を超高速に翻訳できるものであるが、その処理内容を簡単に説明するため、1件分の入力データがどのように処理されるのかを具体的に説明する。
【0047】
図4は、図1に示した翻訳装置において、エリアコードが「23(愛知県)」で、属性番号が「138(地名)」で、地図注記が「小碓通」である入力データを処理する場合の例を説明するための図である。図4に示すように、「23(エリアコード),138(属性番号),小碓通(地図注記)」である入力データが翻訳対象データファイル131に用意されている(ステップS1)。
【0048】
そして、読み仮名辞書がプログラムロジックに変換されて形成された読み仮名付与プログラムを、読み仮名付与プログラム実行部132が実行する(ステップS2)。当該読み仮名付与プログラムは、翻訳対象データファイル131の当該入力データを読み出して、当該入力データ中の地図注記データに対応する読み仮名を付与した読み仮名データを形成し、これを読み仮名データファイル133に記録する(ステップS3)。
【0049】
ステップS3で読み仮名データファイル133に記録される読み仮名データは、図4のステップS3に示したように、入力データに対して、更に読み仮名「こうす どおり」が付与されたものである。この読み仮名データは、どの言語に翻訳する場合にも共通に用いられる。すなわち、読み仮名データファイル133の読み仮名データは、各言語の翻訳プログラムによって共通に用いられる。
【0050】
次に、言語別翻訳辞書がプログラムロジックに変換されて形成された言語別翻訳プログラムを、言語別翻訳プログラム実行部134が実行する(ステップS4)。当該言語別翻訳プログラムは、読み仮名データファイル133の当該読み仮名データを読み出して、当該読み仮名データ中の読み仮名に対応する所定の言語の文字列(翻訳データ)を付与した言語別翻訳データを形成し、これを言語別翻訳データファイル135に記録する(ステップS5)。
【0051】
ステップS5で言語別翻訳データファイル135に記録される翻訳データは、図4のステップS5に示したように、読み仮名データに対して、更に各言語の翻訳データが付与されたものである。この実施の形態においては、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に翻訳されるため、各言語の翻訳プログラムにより、図4のステップS5に示したように、4言語のそれぞれの言語別の翻訳データが形成される。
【0052】
これに対して、図5は、従来の翻訳装置における翻訳処理の概要を説明するための図である。図5に示すように、従来の翻訳装置では、図4に示した例と同様の入力データを翻訳する場合、言語別翻訳プログラムが、まず、翻訳対象の文字列(この例の場合には地図注記)を形態素解析などの手法を用いて意味のある文字列単位に分解する。そして、この分解した各文字列(あるいは文字)を、翻訳辞書を用いて翻訳する。
【0053】
この従来の翻訳装置の場合には、形態素解析の段階や翻訳処理の段階で種々の辞書(データベース)を参照する必要がある。このように種々に辞書にアクセスする分の時間は、翻訳処理に掛かる時間の多くの部分を占めており、翻訳処理は時間の掛かるものとなっていた。
【0054】
しかし、図4図5とを比較しても分かるように、この出願の翻訳装置の場合には、外部の辞書(データベース)を全く参照しないため、翻訳処理の高速化が実現できる。また、地図注記に読み仮名を付与することで、正しい読み仮名に応じた翻訳が可能となる。また、地図注記データに対して読み仮名が付与されて形成された読み仮名データは、各言語の翻訳プログラムで共通に使用される。このため、各言語の翻訳プログラムにおいて、地図注記に読み仮名を付与する処理は行わなくてもよい。
【0055】
[実施の形態の翻訳装置で行われる処理のまとめ]
この実施の形態の翻訳装置で行われる処理は、読み仮名付与プログラムと言語別翻訳プログラムを作成する事前準備処理と、作成された読み仮名付与プログラムと言語別翻訳プログラムを用いて地図注記を翻訳する翻訳処理とに大きく分けることができる。事前準備処理は、基になる読み仮名辞書や言語別翻訳辞書が変更されない限り、繰り返し行う必要は無い。また、この実施の形態の翻訳装置において行われる翻訳処理は、まず、地図注記データに対して読み仮名を付与して読み仮名データを形成する処理と、形成された読み仮名データの読み仮名を翻訳する処理とに分けられる。以下においては、この実施の形態の翻訳装置で行われる、事前準備処理と翻訳処理のそれぞれについて、具体的に説明する。
【0056】
[事前準備処理]
図6は、この実施の形態の翻訳装置で行われる事前準備処理を説明するためのフローチャートである。事前準備処理は、図6に示すように、まず、読み仮名付与プログラム作成部112が、読み仮名辞書群111の各読み仮名辞書のぞれぞれの内容をプログラムロジックに変換して、読み仮名付与プログラムを作成する(ステップS21)。ステップS21の処理では、前方一致、後方一致、部分一致で使用される読み仮名辞書のそれぞれが、最長一致法で読み仮名を置換するプログラムロジックに変換される。
【0057】
次に、言語別翻訳プログラム作成部122が、言語別翻訳辞書群121の各翻訳辞書の内容をプログラムロジックに変換して、言語別翻訳プログラムを作成する(ステップS22)。ステップS22の処理でも、前方一致、後方一致、部分一致で使用される翻訳辞書のそれぞれが、最長一致法で対象翻訳言語に置換するプログラムロジックに変換される。
【0058】
これら2つの処理を通じて、読み仮名付与プログラム格納部113には読み仮名付与プログラムが格納され、言語別翻訳プログラム格納部123には、各言語別の翻訳プログラムが格納され、地図注記の翻訳処理の準備が整えられる。なお、言語別翻訳プログラム格納部123には、言語別の複数の翻訳プログラムが格納されることになる。
【0059】
このように、図6に示した処理を通じて、翻訳処理前の事前準備ができる。そして、上述もしたように、図6に示す事前準備は、読み仮名辞書群111の読み仮名辞書に変更が生じたり、言語別翻訳辞書群121の翻訳辞書に変更が生じたりした場合に実行すればよい。もちろん、読み仮名辞書群111の読み仮名辞書だけに変更が生じた場合には、図6に示したステップS21の処理だけを行えばよい。また、言語別翻訳辞書群121の翻訳辞書だけに変更が生じた場合には、図6に示したステップS22の処理だけを行えばよい。
【0060】
[翻訳処理]
図7は、この実施の形態の翻訳装置で行われる翻訳処理を説明するフローチャートである。当該翻訳処理は、図7に示すように、読み仮名付与処理(図7(A))と、言語別翻訳処理(図7(B))からなる。読み仮名付与処理(図7(A))は、読み仮名付与プログラム実行部132において実行される読み仮名付与プログラムによる処理である。言語別翻訳処理(図7(B))は、言語別翻訳プログラム実行部134において実行される言語別翻訳プログラムによる処理である。
【0061】
当該翻訳処理では、まず、読み仮名付与プログラム実行部132が読み仮名付与プログラムを実行し、翻訳対象データファイル131をインプットファイルとし、読み仮名データファイル133をアウトプットファイルとして、図7(A)に示す読み仮名付与処理を行う。当該読み仮名付与処理において、読み仮名付与プログラム実行部132は、翻訳対象データファイル131から翻訳対象データを順次に読み出す(ステップS31)。読み仮名付与プログラム実行部132は、翻訳対象データが読み出せたか否か(全ての翻訳対象データの読み出しが終了したか否か)を判別する(ステップS32)。
【0062】
ステップS32の判別処理において、翻訳対象データが読み出せたと判別したとする。この場合、読み仮名付与プログラム実行部132は、その読み出した翻訳対象データの地図注記データに対して読み仮名を付与して読み仮名データを形成し、これを読み仮名データファイル133に書き込む処理を行う(ステップS33)。この後、ステップS31からの処理を繰り返す。
【0063】
ステップS32の判別処理において、全ての翻訳対処データの読み出しが終了したと判別したときには、図7(A)に示す読み仮名付与処理を終了する。
【0064】
当該読み仮名付与プログラムによる読み仮名付与処理が終了すると、言語別翻訳プログラム実行部134が言語別翻訳プログラムを実行し、読み仮名データファイル133をインプットファイルとし、言語別翻訳データファイル135をアウトプットファイルとして、図7(B)に示す言語別翻訳処理を行う。当該言語別翻訳処理において、言語別翻訳プログラム実行部134は、読み仮名データファイル133から読み仮名データを順次に読み出す(ステップS41)。言語別翻訳プログラム実行部134は、読み仮名データが読み出せたか否か(全ての読み仮名データの読み出しが終了したか否か)を判別する(ステップS42)。
【0065】
ステップS42の判別処理において、読み仮名データが読み出せたと判別したとする。この場合、言語別翻訳プログラム実行部134は、その読み出した読み仮名データの読み仮名に対する所定の言語の文字列(翻訳データ)を付与して言語別翻訳データを形成し、これを言語別翻訳データファイル135に書き込む処理を行う(ステップS43)。この後、ステップS41からの処理を繰り返す。
【0066】
ステップS42の判別処理において、読み仮名データが読み出せなかった(全ての読み仮名データの読み出しが終了した)と判別したときには、図7(B)に示す言語別翻訳与処理を終了する。なお、この図7(B)に示す処理は、言語別の翻訳プログラムによって言語別に行われる処理である。
【0067】
このように、読み仮名付与処理(図7(A))と言語別翻訳処理(図7(B))の処理を通じて翻訳処理が行われる。そして、読み仮名付与処理と言語別翻訳処理のいずれにおいても、インプットファイルとアウトプットファイルが存在するだけで、参照データベースは一切存在しない。すなわち、読み仮名辞書や翻訳辞書は、プログラムロジックに変換されて、それぞれ、読み仮名付与プログラム、言語別翻訳プログラムとされている。このため、地図注記に対する読み仮名の付与は、読み仮名付与プログラムの中だけで完結するように処理され、付与された読み仮名の所定の言語への翻訳は、言語別翻訳プログラムの中だけで完結するように処理される
このようにして、この実施の形態の翻訳装置では、大量の地図注記を極めて高速に翻訳することを実現している。
【0068】
[実施の形態の効果]
上述した実施の形態の翻訳装置によれば、大量に存在する地図注記を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できる。
【0069】
また、地図注記について読み仮名を付与し、この付与した読み仮名を翻訳する構成としているので、実際の読み方に即した翻訳ができる。不自然な翻訳となることが無い。
【0070】
また、読み仮名が付与されて形成された読み仮名データは、各言語の翻訳プログラムで共通に使用できる。つまり、地図注記を複数の言語に翻訳する場合であっても、各言語の翻訳プログラムなどで重複して読み仮名データを形成する処理を行わなくても済む。
【0071】
そして、数百万件の地図注記を翻訳する場合、従来は翻訳に数週間かかっていたが、これを数時間に短縮することができた。各言語の翻訳プログラムによる処理は、それぞれ数十分の処理時間を実現している。
【0072】
[変形例など]
なお、上述した実施の形態では、地図注記データを中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に翻訳するものとして説明したが、これに限るものではない。この他の種々の言語に翻訳することももちろんできる。翻訳対象の言語の組み合わせは種々の組み合わせとすることができる。もちろん、単一の言語に翻訳する場合にも対応できる。
【0073】
また、上述した実施の形態では、地図注記データを翻訳する場合を例にして説明したが、これに限るものではない。例えば、電話帳リスト、顧客リスト、住所リストといった多数の名前、住所などの名詞句の羅列が含まれるものの当該多数の名詞句の羅列を翻訳する場合に、この発明を適用できる。
【0074】
また、上述した実施の形態では、読み仮名に対して翻訳を行うものとして説明した。しかし、これに限るものではない。例えば、ひらがな、カタカナ、漢字、アルファベット、数字、記号からなる翻訳対象そのものと作成した読み仮名とを比較しながら、より適切に翻訳を行うようにすることができる。
【0075】
[その他]
上述した実施の形態の説明からも分かるように、請求項に記載した翻訳装置の読み仮名辞書は、実施の形態の翻訳装置の読み仮名辞書群の各読み仮名辞書に対応し、また、請求項に記載した翻訳装置の翻訳辞書は、実施の形態の翻訳装置の言語別翻訳辞書群の各翻訳辞書に対応している。また、請求項に記載した翻訳装置の第1のプログラム作成手段は、実施の形態の翻訳装置の読み仮名付与プログラム作成部112に対応し、請求項に記載した翻訳装置の第2のプログラム作成手段は、この実施の形態の翻訳装置の言語別翻訳プログラム作成部122に対応している。
【0076】
また、請求項に記載した翻訳装置の読み仮名付与手段は、この実施の形態の翻訳装置の読み仮名付与プログラム実行部132に対応し、また、請求項に記載した翻訳装置の翻訳手段は、この実施の形態の翻訳装置の言語別翻訳プログラム実行部134に対応している。
【0077】
また、図5図6を用いて説明した翻訳処理は、この発明の翻訳方法の一実施の形態が適用されたものであり、図5図6を用いて説明した翻訳処理を実行するプログラムは、この発明の翻訳プログラムの一実施の形態が適用されたものである。また、図1に示した読み仮名付与プログラム作成部112、言語別翻訳プログラム作成部122、読み仮名付与プログラム実行部132、言語別翻訳プログラム実行部134の各機能は、制御部101で実行されるプログラムにより、制御部101の機能として実現することもできる。
【符号の説明】
【0078】
101…制御部、102…記憶装置、103…操作部、111…読み仮名辞書群、112…読み仮名付与プログラム作成部、113…読み仮名付与プログラム格納部、121…言語別翻訳辞書群、122…言語別翻訳プログラム作成部、123…言語別翻訳プログラム格納部、131…翻訳対象データファイル、132…読み仮名付与プログラム実行部、133…読み仮名データファイル、134…言語別翻訳プログラム実行部、135…言語別翻訳データファイル
図1
図2
図3
図4
図5
図6
図7