(58)【調査した分野】(Int.Cl.,DB名)
翻訳対象言語に応じて、検索する名詞句の種類の異なる複数の翻訳辞書の中から使用する辞書を選択して抽出し、その使用順序を定めて並べ替え、名詞句の読み仮名の長いもの順に辞書内容を並べた翻訳用辞書を作成する辞書作成手段と、
翻訳対象の1以上の名詞句と当該1以上の名詞句のそれぞれの読み仮名とを有する読み仮名付与済みデータを、他の読み仮名付与済みデータと区別可能な態様で1つの変数に格納する格納手段と、
前記辞書作成手段により作成された前記翻訳用辞書の辞書データを1件ずつ読み込み、前記変数に格納されている前記読み仮名付与済みデータの翻訳対象の名詞句を、前記翻訳用辞書の前記辞書データを用いて目的とする言語に全文置換する全文置換手段と
を備えることを特徴とする翻訳装置。
辞書作成手段が、翻訳対象言語に応じて、検索する名詞句の種類の異なる複数の翻訳辞書の中から使用する辞書を選択して抽出し、その使用順序を定めて並べ替え、名詞句の読み仮名の長いもの順に辞書内容を並べた翻訳用辞書を作成する辞書作成工程と、
格納手段が、翻訳対象の1以上の名詞句と当該1以上の名詞句のそれぞれの読み仮名とを有する読み仮名付与済みデータを、他の読み仮名付与済みデータと区別可能な態様で1つの変数に格納する格納工程と、
全文置換手段が、前記辞書作成手段により作成された前記翻訳用辞書の辞書データを1件ずつ読み込み、前記変数に格納されている前記読み仮名付与済みデータの翻訳対象の名詞句を、前記翻訳用辞書の前記辞書データを用いて目的とする言語に全文置換する全文置換工程と
を有することを特徴とする翻訳方法。
【発明を実施するための形態】
【0014】
以下、図を参照しながら、この発明の装置、方法、プログラムの一実施の形態について説明する。この発明は、地図注記、電話帳リスト、顧客リストなどに記載された地名、名称、名前、住所といった、大量に存在する名詞句の羅列データについて翻訳を行う場合に適用可能なものである。「名詞句」との文言は、物体、物質、人物、場所など具体的な対象を示す語句を意味する。この明細書において、翻訳対象となる「名詞句の羅列」の具体例として、地図注記、電話帳リスト、顧客リストなどに記載された、例えば、地名、名称、名前、住所といったものを想定している。
【0015】
以下においては、地図注記の翻訳を行う場合を例にして具体的に説明する。地図注記は、上述もしたように大量に存在し、頻繁に更新されるため、その更新の都度、翻訳し直さなければならないものである。また、近年おいては、外国から日本を訪れる観光客やビジネスマンも増えてきており、最新の地図の地図注記を所定の外国語に翻訳して表した外国語対応の最新の地図を迅速に提供することが望まれている。しかも、外国語は、中国語(簡体)、中国語(繁体)、英語、韓国語などというように、複数の言語に対応することが求められる。
【0016】
このような背景の下、以下に説明する実施の形態の装置、方法、プログラムは、大量に存在する地図注記を、従来の機械翻訳装置に比べて、飛躍的に速く、しかも適切に、且つ、複数の言語に翻訳することを実現している。
【0017】
[ビッグデータ翻訳装置の構成例]
まず、この実施の形態のビッグデータ翻訳装置(以下、単に翻訳装置と記載する。)の構成例と動作の概要について説明する。
図1は、この実施の形態の翻訳装置の構成例と動作の概要を説明するためのブロック図である。なお、
図1において、翻訳対象データF111などの記載における文字「F」は、ファイル(file)の略称として用いている。
【0018】
図1に示す翻訳装置において、制御部101は、当該翻訳装置の各部を制御する機能を実現し、記憶装置102は情報記憶保持機能を実現し、操作部103は、ユーザーインターフェース機能を実現する。
【0019】
読み仮名辞書群104は、固有名詞読み仮名辞書、一般名詞読み仮名辞書、接頭語読み仮名辞書、接尾語読み仮名辞書、カタカナ語読み仮名辞書などの複数の読み仮名辞書を備え、日本語の地図注記データに対する読み仮名を提供する。なお、図示していないが、接頭語読み仮名辞書には、固有名詞接頭語読み仮名辞書、一般名詞接頭語読み仮名辞書、カタカナ語接頭語読み仮名辞書がある。同様に、接尾語読み仮名辞書には、固有名詞接尾語読み仮名辞書、一般名詞接尾語読み仮名辞書、カタカナ語接尾語読み仮名辞書がある。
【0020】
また、固有名詞読み仮名辞書、一般名詞読み仮名辞書、カタカナ語読み仮名辞書のそれぞれは、部分一致により読み仮名の置換が可能なものである。また、各接頭語読み仮名辞書は、接頭語の読み仮名を提供するものであるので、前方一致により読み仮名の置換が可能なものである。また、各接尾語読み仮名辞書は、接尾語の読み仮名を提供するものであるので、後方一致により読み仮名の置換が可能なものである。
【0021】
言語別翻訳辞書群105は、この実施の形態では、日本語の地図注記データの読み仮名を、目的とする外国語に翻訳するための言語別の翻訳辞書を備える。この実施の形態では、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に対応するため、4言語の翻訳辞書を備える。更に、各言語の翻訳辞書は、大きく分けると、一般名詞に関する辞書やカタカナ語に関する辞書を備える。一般名詞に関する辞書は、一般名詞接尾語辞書、一般名詞接頭語辞書、一般名詞辞書からなる。カタカナ語に関する辞書は、カタカナ語固有名詞接尾語辞書、カタカナ語固有名詞接頭語辞書、カタカナ語固有一般名詞辞書、カタカナ語一般名詞接尾語辞書、カタカナ語一般名詞接頭語辞書、カタカナ語一般名詞辞書からなる。
【0022】
また、一般名詞辞書、カタカナ語固有名詞辞書、カタカナ語一般名詞辞書のそれぞれは、部分一致により読み仮名などに対応する翻訳データ(翻訳語句)の置換が可能なものである。また、各接頭語辞書は、接頭語に対応する翻訳データを提供するものであるので、前方一致により接頭語の翻訳データの置換が可能なものである。また、各接尾語辞書は、接尾語の翻訳データを提供するものであるので、後方一致により接尾語の翻訳データの置換が可能なものである。
【0023】
翻訳対象データファイル111は、翻訳対象となる多数の地図注記データを保持する。
図2は、翻訳対象データファイル111の格納データの例を説明するための図である。
図2に示すように、翻訳対象データファイル111には、「エリアコード、属性番号、地図注記データ」からなる翻訳対象データが多数保持されている。この翻訳対象データファイル111には、例えば、図示しない外部インターフェイスなどを通じて外部機器から提供された翻訳対象データなどが格納される。
【0024】
読み仮名付与部112は、翻訳対象データファイル111に格納されている多数の地図注記データのそれぞれについて、これに含まれている漢字部分を、読み仮名辞書群104の読み仮名辞書を用いて読み仮名に変換する。読み仮名付与部112は、変換した読み仮名を含む、読み仮名付与済みデータを形成して、読み仮名付与済みデータファイル113に記録する。読み仮名付与済みデータファイル113は、ハードディスクなどの大容量記録媒体に作成され、読み仮名付与部112によって形成された読み仮名付与済みデータを蓄積する。
【0025】
図3は、読み仮名付与済みデータファイル113の格納データの例を説明するための図である。
図3に示すように、読み仮名付与済みデータファイル113に格納された読み仮名付与済みデータは、「エリアコード、属性番号、地図注記データ、読み仮名」からなるものである。なお、読み仮名は、読み仮名を取得した辞書が異なれば、それらは分離して示されている。すなわち、
図3において、「悪石島」は、「悪石」部分の読み仮名は、例えば固有名詞辞書から取得され、「島」部分の読み仮名は、一般名詞接尾語辞書から取得されたために、「あくせき じま」というように、「あくせき」と「じま」がそれぞれ異なる辞書から取得されたことが分かる態様で読み仮名付与済みデータに格納されている。
【0026】
この実施の形態において、使用辞書作成部114は、翻訳対象言語(何語に翻訳するのか)に応じて、翻訳に使用する翻訳用使用辞書を翻訳用使用辞書ファイル115に作成する。具体的に使用辞書作成部114は、翻訳対象言語に応じて言語別翻訳辞書群105の翻訳辞書の中から使用する辞書を選択して抽出する。そして、その使用順序を定めて抽出した辞書を並べ変えて結合し、更に各辞書の内容(辞書データ)を地図注記の読み仮名の長いもの順に並べた翻訳用使用辞書を翻訳用使用辞書ファイル115に作成する。
【0027】
なお、各辞書データには、使用辞書作成部114により、その辞書データが属する辞書に応じて、部分一致、前方一致、後方一致のいずれにより検索語の置換が可能なものかを示す情報も付加される。例えば、一般名詞辞書、カタカナ語固有一般名詞辞書、カタカナ語一般名詞辞書の辞書データには部分一致により使用されるものである情報が付加される。また、一般名詞接頭語辞書、カタカナ語固有名詞接頭語辞書、カタカナ語一般名詞接頭語辞書には前方一致により使用されるものである情報が付加される。また、一般名詞接尾語辞書、カタカナ語固有名詞接尾語辞書、カタカナ語一般名詞接尾語辞書の辞書データには後方一致により使用されるものである情報が付加される。
【0028】
全文置換処理部116は、大容量メモリ116Mを備え、大きく以下の2つの処理を行う。第1の処理は、読み仮名付与済みデータファイル113の読み仮名付与済みデータを読み込んで、読み仮名付与済みデータごとにセパレータを付しながら、全読み仮名付与済みデータを1つの変数に格納する処理を行う。第2の処理は、使用辞書作成部114が作成した翻訳用使用辞書ファイル115の辞書データを1件ずつ読み込み、上記の変数に格納した読み仮名付与済みデータの読み仮名を辞書データの翻訳データで置換する処理を行う。
【0029】
これにより、全文置換処理部116は、読み仮名付与済みデータの地図注記データに対する翻訳データを含む翻訳済みデータを形成し、これを翻訳済みデータファイル117に記録する。翻訳済みデータファイル117は、ハードディスクなどの大容量記録媒体に作成され、全文置換処理部116によって形成された翻訳済みデータを蓄積する。
【0030】
このように、この実施の形態の翻訳装置は、全文置換処理部116の機能により、読み仮名付与済みデータファイル113の全読み仮名付与済みデータを所定の変数に格納することにより、全読み仮名付与済みデータをメモリ116Mに格納して、一括して処理の対象にする。そして、整えた翻訳用使用辞書ファイル115の辞書データを1件ずつ読み込んで、メモリ116M上の全ての読み仮名付与済みデータを対象にして、翻訳用使用辞書ファイル115の翻訳データを付与する処理を行う。換言すれば、メモリ116M上の全ての読み仮名付与済みデータの各読み仮名を、翻訳用使用辞書ファイル115の翻訳データにより全文置換するようにしている。これにより、数多く存在する地図注記の超高速な翻訳を可能にしている。
【0031】
以下、この実施の形態の翻訳装置の主要部である、使用辞書作成部114において行われる処理と、全文置換処理部116において行われる処理の詳細について説明する。
【0032】
[使用辞書作成部114の処理]
図4は、使用辞書作成部114の処理について説明するためのブロック図である。上述もし、また、
図4にも示すように、言語別翻訳辞書群105には、言語別に、例えば、一般名詞接尾語辞書、一般名詞接頭語辞書、一般名詞辞書、カタカナ語固有名詞接尾語辞書、カタカナ語固有名詞接頭語辞書、カタカナ語固有一般名詞辞書、カタカナ語一般名詞接尾語辞書、カタカナ語一般名詞接頭語辞書、カタカナ語一般名詞辞書が用意されている。
【0033】
このため、使用辞書作成部114は、翻訳対象言語に応じて、言語別翻訳辞書群105の翻訳辞書の中から使用する辞書を選択して抽出する。そして、その使用順序を定めて辞書を並べ変えて結合し、更に各辞書の内容(辞書データ)を、地図注記の読み仮名の長いもの順に並べた翻訳用使用辞書を翻訳用使用辞書ファイル115に作成する。なお、地図注記の読み仮名の長いもの順に並べるのは、最長一致法により、読み仮名付与済みデータの名詞句を置換するためである。また、各辞書データには、上述もしたように、その辞書データが属する辞書に応じて、部分一致、前方一致、後方一致のいずれにより検索語の置換が可能なものかを示す情報も付加される。
【0034】
また、辞書の選択や並び順は、翻訳対象言語ごとの優先度や必要性に応じて行う。辞書の選択や並び順の一例について説明する。韓国語は表音文字であり、カタカナで表現された日本語は、その音(おん)に対応する韓国語(ハングル文字)に置き換えることができる。このため、翻訳対象言語が韓国語の場合、使用辞書作成部114は、カタカナ語の辞書は使用せず、韓国語への翻訳用の一般名詞接尾語辞書、一般名詞接頭語辞書、一般名詞辞書を使用辞書として選択する。
【0035】
そして、使用辞書作成部114は、選択した辞書の並び順として、例えば、接尾語、接頭語を翻訳した上で、残りの一般名詞を翻訳するために、(1)一般名詞接尾語辞書→(2)一般名詞接頭語辞書→(3)一般名詞辞書の順に並べて結合する。各辞書内は、上述もしたように、地図注記に対応する読み仮名の長いもの順に並べる。このようにして、地図注記を韓国語に翻訳するための翻訳用使用辞書を翻訳用使用辞書ファイル115に形成する。
【0036】
また、漢字で表された日本語の一般名詞は、中国語でも同じ漢字で表される場合も多い。このため、翻訳対象言語が中国語である場合には、上述した9つの全ての辞書を用いるが、カタカナ語の翻訳を優先させるため、カタカナ語に関する辞書を先に使用し、次に一般名詞に関する辞書を使用するように使用辞書を並べ変えて結合する。各辞書内は、上述もしたように、地図注記に対応する読み仮名の長いもの順に並べる。このようにして、地図注記を中国語に翻訳するための翻訳用使用辞書を翻訳用使用辞書ファイル115に形成する。
【0037】
また、翻訳対象言語が英語の場合には、日本語とは全く異なる言語であるため、上述した9つの全ての辞書を用い、その使用順も最初に一般名詞に関する辞書、次にカタカナ語に関する辞書というように並べて結合することができる。この場合においても、各辞書内は、上述もしたように、地図注記に対応する読み仮名の長いもの順に並べておく。このようにして、地図注記を英語に翻訳するための翻訳用使用辞書を翻訳用使用辞書ファイル115に形成する。
【0038】
なお、ここで説明した翻訳対象言語ごとの優先度や必要性に応じた辞書の選択や並び順は一例であり、この他にも種々の態様とすることができる。また、上述した9つの辞書以外にも使用する辞書が存在する場合には、その辞書についても考慮することは言うまでもない。また、翻訳対象言語ごとに特別に設けられた辞書が存在する場合もあり、その場合には、その翻訳対象言語が選択された場合には、当該辞書も使用される辞書として選択されることになる。
【0039】
[全文置換処理部116の処理]
[第1の処理(変数への格納処理)]
図5、
図6、
図7のそれぞれは、全文置換処理部116で行われる第1の処理である読み仮名付与済みデータファイル113の全ての読み仮名付与済みデータを1つの変数に格納する処理について説明するための図である。
【0040】
この内、
図5は、全文置換処理部116で行われる当該第1の処理について説明するための図である。
図5に示すように、全文置換処理部116で行われる第1の処理は、読み仮名付与済みデータファイル113の読み仮名付与済みデータを読み込んで、読み仮名付与済みデータごとにセパレータを付しながら、全読み仮名付与済みデータを1つの変数に格納する。これにより、読み仮名付与済みデータファイル113の全ての読み仮名付与済みデータが、全文置換処理部116のメモリ116M上に展開される。
【0041】
図6は、全文置換処理部116において実行される読み仮名付与済みデータの変数への格納プログラムの一例を示す図である。
図6に示すプログラムにより、
図3を用いて説明したように、「エリアコード、属性番号、地図注記、読み仮名」からなる読み仮名付与済みデータのそれぞれは、他の読み仮名付与済みデータと分離可能な態様で変数$head[$i]に格納される。更に、読み仮名付与済みデータのそれぞれの読み仮名だけが変数$jpに格納される。これら変数に格納された読み仮名付与済みデータと、当該読み仮名付与済みデータの読み仮名とは、同じ順番で各変数に格納されるので、そのそれぞれの対応関係は維持される。
【0042】
図7は、
図3に示した読み仮名付与済みデータファイル113の各読み仮名付与済みデータの読み仮名が、変数$jpに格納された状態を示す図である。
図6に示したプログラムを実行することにより、各読み仮名付与済みデータの読み仮名だけが、他の読み仮名と分離可能な態様で変数$jpに格納される。これにより、各読み仮名付与済みデータの各読み仮名がメモリ116M上に格納され、一括して処理の対象にできる。
【0043】
[第2の処理(全文置換処理)]
図8、
図9、
図10、
図11のそれぞれは、全文置換処理部116で行われる第2の処理である翻訳用使用辞書ファイル115の辞書データを用いて、上述したように変数$Jpに格納された読み仮名を目的とする言語に置換する処理について説明するための図である。
【0044】
この内、
図8は、全文置換処理部116で行われる当該第2の処理について説明するための図である。
図8に示すように、全文置換処理部116で行われる第2の処理は、翻訳用使用辞書ファイル115の辞書データを1件ずつ読み込み、変数$jpに格納されている読み仮名付与済みデータの読み仮名を当該辞書データの翻訳データに置換する処理を行う。そして、変数$head[$i]に格納された読み仮名付与済みデータと、これに対する変数$jpの置換された翻訳データとを対応付けて翻訳済みデータを形成し、これを翻訳済みデータファイル117に記録する。これにより、翻訳対象の地図注記を、目的とする翻訳対象言語に翻訳できる。
【0045】
図9は、全文置換処理部116において実行される変数$Jpに格納された読み仮名を目的とする言語に全文置換するプログラムの一例を示す図である。
図9に示すプログラムは、後方一致により用いられる辞書の辞書データを用いては、後方一致により置換処理を行う。また、当該プログラムは、前方一致により用いられる辞書の辞書データを用いては、前方一致により置換処理を行う。同様に、当該プログラムは、部分一致により用いられる辞書の辞書データを用いては、部分一致により置換処理を行う。
【0046】
そして、
図9に示すプログラムは、置換処理終了後においては、変数$head[$i]に格納された読み仮名付与済みデータと、これに対する変数$jpの置換された翻訳データとを対応付けて翻訳済みデータを形成し、これを出力する。実際には、形成された翻訳済みデータは翻訳済みデータファイル117に記録される。このようにして、翻訳対象の地図注記が目的とする翻訳対象言語に翻訳される。
【0047】
ここで、
図7に示したように、変数$jpに格納された翻訳対象の地図注記に対応する読み仮名を、英語に翻訳する場合を例にして、全文置換処理部116で行われる第2の処理である全文置換処理について具体的に説明する。
【0048】
図10は、変数$jpに格納された翻訳対象の地図注記に対応する読み仮名を、英語に翻訳する場合に、翻訳用使用辞書ファイル115に用意される翻訳用使用辞書データの例を説明するための図である。ここでは、説明を簡単にするため、
図10に示すように、辞書A〜Eの5つの辞書が使用する辞書として選択されて抽出され、辞書A〜Eの順番で並べられたものとする。そして、辞書A〜Eのそれぞれには、辞書データが1つだけ存在しているものとする。
【0049】
図11は、
図10に示した辞書により、変数$jpの格納データを全文置換処理した場合の状態を示す図である。
図11(A)は、
図7に示した内容と同じであり、変数$jpに、3つの地図注記データの読み仮名「あくせき じま」、「ひずえ じま」、「ヲウボウ かはん」が格納されている場合を示している。
【0050】
そして、全文置換処理部116は、この例の場合、まず、翻訳用使用辞書ファイル115から、辞書Aの辞書データを読み込み、部分一致により、変数$jpの格納データの全文置換を行う。すなわち、全文置換処理部116は、辞書Aの辞書データに応じて、「ヲウボウ」を「Wobou」に置換せよという命令を出す。ここで、「ヲウボウ」は、名詞句の任意の位置にある「ヲウボウ」を置換の対象にすることを意味する。この場合、
図11(B)に示すように、3番目の名詞句の読み仮名の「ヲウボウ」が、辞書Aの辞書データの翻訳データ「Wobou」に置換される。
【0051】
なお、この例において、全文置換処理部116が出す命令において、部分一致、前方一致、後方一致の区別は、置換対象の読み仮名に付される「,(カンマ)」の位置により判別できる。すなわち、前方一致により置換を指示する場合には、「,ヲウボウ」となり、後方一致で置換を指示する場合には、「ヲウボウ,」となる。また、部分一致で置換を指示する場合には、「ヲウボウ」となり、「,(カンマ)」は付されないものとなる。
【0052】
次に、全文置換処理部116は、翻訳用使用辞書ファイル115から、辞書Bの辞書データを読み込み、前方一致により、変数$jpの格納データの全文置換を行う。すなわち、全文置換処理部116は、辞書Bの辞書データに基づいて、「,あくせき」を「Akuseki」に置換せよという命令を出す。ここで、「,あくせき」は、名詞句の前方にある「あくせき」を置換の対象にすることを意味する。この場合、
図11(C)に示すように、1番目の名詞句の読み仮名の前側(前方)に位置する「あくせき」が、辞書Bの辞書データの翻訳データ「Akuseki」に置換される。
【0053】
次に、全文置換処理部116は、翻訳用使用辞書ファイル115から、辞書Cの辞書データを読み込み、後方一致により、変数$jpの格納データの全文置換を行う。すなわち、全文置換処理部116は、辞書Cの辞書データに基づいて、「かはん,」を「River side」に置換せよという命令を出す。ここで、「かはん,」は、名詞句の後方にある「かはん」を置換の対象にすることを意味する。この場合、
図11(D)に示すように、3番目の名詞句の読み仮名の後側(後方)に位置する「かはん」が、辞書Cの辞書データの翻訳データ「Rever Side」に置換される。
【0054】
次に、全文置換処理部116は、翻訳用使用辞書ファイル115から、辞書Dの辞書データを読み込み、前方一致により、変数$jpの格納データの全文置換を行う。すなわち、全文置換処理部116は、辞書Dの辞書データに基づいて、「,ひずえ」を「Hizue」に置換せよという命令を出す。ここで、「,ひずえ」は、名詞句の前方にある「ひずえ」を置換の対象にすることを意味する。この場合、
図11(E)に示すように、2番目の名詞句の読み仮名の前側(前方)に位置する「ひずえ」が、辞書Dの辞書データの翻訳データ「Hizue」に置換される。
【0055】
最後に、全文置換処理部116は、翻訳用使用辞書ファイル115から、辞書Eの辞書データを読み込み、後方一致により、変数$jpの格納データの全文置換を行う。すなわち、全文置換処理部116は、辞書Eの辞書データに基づいて、「じま,」を「Island」に置換せよという命令を出す。ここで、「じま,」は、名詞句の後方にある「じま」を置換の対象にすることを意味する。この場合、
図11(F)に示すように、1番目と2番目の2つの名詞句の読み仮名の後側(後方)に位置する「じま」が、辞書Eの辞書データの翻訳データ「Island」に置換される。このようにして、翻訳用使用辞書ファイル115に作成された翻訳用使用辞書の辞書データにより、変数$jp内の読み仮名を翻訳データに置き換える全文置換が行われる。
【0056】
そして、全文置換処理部116は、上述もしたように、変数$head[$i]に格納された読み仮名付与済みデータと、これに対する変数$jpの置換された翻訳データとを対応付けて翻訳済みデータを形成し、これを翻訳済みデータファイル117に記録する。
図12は、翻訳済みデータファイル117の格納データの例を説明するための図である。
図12に示すように、翻訳済みデータファイル117の格納データである翻訳済みデータは、「エリアコード、属性番号、地図注記、読み仮名、翻訳データ」からなる。このようにして、翻訳対象データファイル111の各翻訳対象データに対して、対応する翻訳データを付加した翻訳済みデータが、翻訳済みデータファイル117に得られる。
【0057】
なお、
図11に示した例においては、名詞句を構成する語句が2つしかないために、部分一致の例と前方一致の例が同じになっている。しかし、本来の部分一致置換は、例えば「○○映画村」という翻訳対象データが存在し、「置換方式=部分一致,翻訳対象=映画,翻訳データ=movie」という辞書データで翻訳することが指示されたとする。この場合には、「映画」を「movie」に置換せよという命令が出される。この命令により、「○○映画村」が、「○○movie村」というように、「映画」が「movie」に置き換えられるのが本来の部分一致による置換である。
【0058】
[実施の形態の翻訳装置での翻訳処理のまとめ]
次に、この実施の形態の翻訳装置で行われる地図注記の翻訳処理について、
図13、
図14のフローチャートを参照しながらまとめる。この実施の形態の翻訳装置で行われる処理は、大きく分けると翻訳対象データである地図注記データへの読み仮名の付与処理と、読み仮名が付与された地図注記データの翻訳処理とに分けることができる。読み仮名が付与された地図注記データは、地図注記データを種々の言語に翻訳する場合に共通して利用することができるため、地図注記データに変更が生じない限り、1回だけ行えばよい。これに対して、地図注記の翻訳処理は、翻訳対象言語がことなれば別途実行する必要のある処理である。
【0059】
[読み仮名の付与処理]
図13は、この実施の形態の翻訳装置で行われる翻訳対象データに対して読み仮名を付与する処理を説明するためのフローチャートである。この
図13のフローチャートに示す処理は、当該翻訳装置の制御部101において実行され、制御部101が読み仮名付与部112を制御することによって行われる。
【0060】
当該翻訳装置の制御部101は、操作部103を通じて当該翻訳装置の使用者からの読み仮名の付与処理の実行指示を受け付けると、
図13に示す翻訳処理を実行する。この場合、制御部101は、読み仮名付与部112を制御し、翻訳対象データファイル111に蓄積されている各翻訳対象データの地図注記に対して、読み仮名辞書群104の各辞書を用いて、読み仮名を付与する処理を行う(ステップS101)。
【0061】
このステップS101の処理において読み仮名付与部112は、
図2に示した翻訳対象データファイル111の各翻訳対象データに対して、その地図注記に対する読み仮名を付与して、
図3に示した読み仮名付与済みデータを作成する。ここで作成された読み仮名付与済みデータは、読み仮名付与済みデータファイル113に蓄積される。
【0062】
このようにして、翻訳対象データファイル111の全ての翻訳対象データに対応する読み仮名付与済みデータが、読み仮名付与済みデータファイル113に格納されると、この
図13に示す処理は終了する。
【0063】
[地図注記の翻訳処理]
図14は、この実施の形態の翻訳装置で行われる地図注記の翻訳処理を説明するためのフローチャートである。この
図14のフローチャートに示す処理は、当該翻訳装置の制御部101において実行され、制御部101が使用辞書作成部114と、全文置換処理部116とを制御することによって行われる。
【0064】
当該翻訳装置の制御部101は、操作部103を通じて当該翻訳装置の使用者からの翻訳処理の実行指示を受け付けると、
図13に示す翻訳処理を実行する。まず、制御部101は、操作部103を通じて使用者からの翻訳対象言語の選択入力を受け付ける(ステップS201)。
【0065】
次に、制御部101は、使用辞書作成部114を制御し、選択された翻訳対象言語に応じた翻訳用使用辞書を、翻訳用使用辞書ファイル115に作成する処理を行う(ステップS202)。このステップS202の処理は、上述もしたように、使用辞書作成部114が、翻訳対象言語に応じて、翻訳に使用する辞書を言語別翻訳辞書群105から選択して抽出する。そして、使用辞書作成部114が、抽出した辞書をその使用順序を定めて並べ替える共に、地図注記の読み仮名の長いもの順に辞書データを並べた翻訳用使用辞書を翻訳用使用辞書ファイル115に作成する。
【0066】
次に、制御部101は、全文置換処理部116を制御して、読み仮名付与済みデータファイル113に格納されている読み仮名付与済みデータを、所定の変数に格納する処理を行う(ステップS203)。このステップS203の処理は、
図5〜
図7を用いて説明したように、変数$head[$i]に読み仮名付与済みデータを、変数$jpに読み仮名付与済みデータの読み仮名を格納する処理である。
【0067】
この後、制御部101は、全文置換処理部116を制御して、翻訳用使用辞書ファイル115の辞書データを1件ずつ読み込み、変数$jpに格納した読み仮名を辞書データの翻訳データで全文置換する処理を行う(ステップS204)。このステップS204の処理は、
図8〜
図11を用いて説明した処理であり、変数$jpに格納された地図注記の読み仮名は、翻訳用使用辞書ファイル115に格納されている各翻訳用使用辞書データの翻訳データで全文置換される。
【0068】
そして、制御部101は、更に全文置換処理部116を制御し、全文置換処理部116が、翻訳済みデータを作成し、これを翻訳済みデータファイル117に記録する処理を行う(ステップS205)。このステップS205において作成される翻訳済みデータは、変数$head[$i]に格納された読み仮名付与済みデータと、これに対する変数$jpの置換された翻訳データとを対応付けて形成されるものである。このステップS205の処理の後、この
図14に示す翻訳処理は終了する。これにより、翻訳済みデータファイル117には、
図12に示した態様の翻訳済みデータが蓄積される。
【0069】
なお、上述もしたように、
図12に示した例の翻訳済みデータは、地図注記を英語に翻訳したものである。従って、
図14に示した翻訳処理において、ステップS201で目的とする言語を翻訳対象言語として選択することにより、地図注記を目的とする言語に翻訳した翻訳済みデータが作成できる。
【0070】
[中国語への翻訳の場合の特例処理]
上述した実施の形態では、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に翻訳することを想定した。当該4言語のどの言語に翻訳する場合にも、この発明を適用することが可能である。しかし、中国語(簡体)、中国語(繁体)に翻訳する場合であって、日本語の地図注記の漢字部分については、これに付与された読み仮名を用いずに、単漢字変換により翻訳が可能である。
【0071】
すなわち、日本語の漢字は、中国語(簡体)、中国語(繁体)と共通に用いることができるものも多く、通常、日本語の漢字に対して、対応する中国語の簡体文字、中国語の繁体文字が決まる。このため、日本語の地図注記の漢字部分は、読み仮名を用いずに、単漢字変換により翻訳する。簡単には、日本語の漢字をそのまま用いるようにしてもよいし、日本語の漢字から中国語の簡体文字、中国語の繁体文字を特定して、これを翻訳結果として用いるようにしてもよい。なお、日本語のかたかなやひらがなについては、上述したこの発明によって翻訳できる。
【0072】
[実施の形態の効果]
上述した実施の形態の翻訳装置によれば、大量に存在する地図注記を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できる。
【0073】
また、地図注記について読み仮名を付与し、この付与した読み仮名を翻訳する構成としているので、実際の読み方に即した翻訳ができる。不自然な翻訳となることが無い。
【0074】
そして、数百万件の地図注記を翻訳する場合、従来は翻訳に数週間かかっていたが、これを数時間に短縮することができた。
【0075】
[エリアコードと属性番号の利用]
なお、上述した実施の形態においては、
図3を用いて説明したように、読み仮名付与済みデータファイル113の各格納データには、エリアコードと属性番号とが付されている。このため、翻訳用変数はエリア別、属性別で用意する。そして、翻訳対象データに読み仮名を付与した読み仮名付与済みデータを、各変数に振り分けて格納し、これを結合することにより、エリア別、属性別に、読み仮名付与済みデータを格納した1つの変数が形成できる。この場合、エリアコードと属性番号とが、各読み仮名付与済みデータのヘッダ情報となる。
【0076】
また、上述した実施の形態では、言語別翻訳辞書群の各翻訳辞書には、エリアコードや属性番号が無い場合を例にして説明したが、これに限るものではない。実際には、辞書データもエリア別、属性別に編成される。すなわち、言語別翻訳辞書群の各翻訳辞書が有する辞書データのそれぞれにも、翻訳対象データの場合と同様にして、エリアコードと属性番号とが付与されている。同じ文字からなる地図注記でも、エリアが異なれば読み方が違う場合も有れば、同じ文字からなる地図注記でも、属性が異なれば読み方が違う場合もあるためである。前者の例としては、「新宿」との記載は、「しんじゅく」と読む地名もあれば、「あらじゅく」と読む地名もある。また、後者の例としては、「浅草」と記載されていても、地名では「あさくさ」と読ませ、寺院の名称としては「せんそう」と読ませるといった例がある。
【0077】
そこで、使用辞書作成部114は、翻訳用使用辞書を作成するに当り、各翻訳辞書の各辞書データが備えるエリアコードと属性番号をも含めて辞書データを構成する。そして、各辞書の辞書データは、エリアコード順であって、属性番号順で、且つ読み仮名の文字数の長いもの順に並べる。そして、エリアコードと、属性番号と、読み仮名とが一致した場合にのみ、読み仮名付与済みデータの読み仮名を、翻訳用使用辞書ファイル115の辞書データの翻訳データで置換する。このようにすることによって、エリアや属性が異なることによって読み仮名が違う同じ表記の地図注記に対しても、その適切な読み仮名に応じた適切な翻訳結果を確実に付与できる。
【0078】
また、エリアコードと、読み仮名とが一致した場合にのみ、読み仮名付与済みデータの読み仮名を、翻訳用使用辞書ファイル115の辞書データの翻訳データで置換することもできる。同様に、属性番号と、読み仮名とが一致した場合にのみ、読み仮名付与済みデータの読み仮名を、翻訳用使用辞書ファイル115の辞書データの翻訳データで置換することもできる。前者の場合には、例えば、翻訳対象が住所などのように、属性番号を有しないデータを翻訳する場合に適用できる。後者の場合には、単一のエリアの地図注記を翻訳する場合など、翻訳対象のデータが属するエリアが単一のエリアに限られている場合に適用できる。
【0079】
[変形例など]
なお、上述した実施の形態では、地図注記データを翻訳する場合を例にして説明したが、これに限るものではない。例えば、電話帳リスト、顧客リスト、住所リストといった多数の名前、住所などの名詞句の羅列が含まれるものの当該多数の名詞句の羅列を翻訳する場合に、この発明を適用できる。
【0080】
また、上述した実施の形態では、地図注記データを翻訳する場合の翻訳対象言語には、例えば、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に対応可能なものとして説明したが、これに限るものではない。目的とする言語の翻訳辞書を用意するだけで、地図注記などの名詞句の羅列を種々の言語に翻訳できる。
【0081】
また、読み仮名が付与されて形成された読み仮名付与済みデータは、各言語に翻訳する場合に共通に利用できるので、
図13に示した翻訳対象データに対して読み仮名を付与する処理は、地図注記に変更が無い限り、1回だけ行えばよい。
【0082】
また、上述した実施の形態では、使用辞書作成部114が、言語別翻訳辞書群105から翻訳対象言語に応じて、必要となる辞書を選択して抽出し、それらの並び順を整えた翻訳用使用辞書を翻訳用使用辞書ファイル115に作成するものとして説明した。しかし、これに限るものではない。必要となる辞書を、必要となる順番で、シーケンシャルに読み出すようにしてももちろんよい。この場合、使用辞書作成部114は、全文置換処理部116に対して、使用する辞書とその使用順を指示するものとなる。
【0083】
また、
図2などに示した地図注記データは、その一例として簡単なものを示したが、実際には、漢字、カタカナ、ひらがな、英数字記号が混在する場合がある。このため、漢字やカタカナの一般名詞については、上述した方式で翻訳を行う。また、漢字の固有名詞については、その読み仮名をローマ字変換する。また、カタカナを韓国語に翻訳する場合には、音(おん)に応じて韓国に置き換える。英数字記号は、何もせずにそのまま用いる。というように、ハイブリッドな翻訳が行われる。
【0084】
[その他]
上述した実施の形態の説明からも分かるように、請求項に記載した翻訳装置の翻訳辞書は、実施の形態の翻訳装置の言語別翻訳辞書群の各翻訳辞書に対応し、また、請求項に記載した翻訳装置の辞書作成手段は、実施の形態の翻訳装置の使用辞書作成部114に対応している。また、請求項に記載した翻訳装置の読み仮名辞書は、実施の形態の翻訳装置の読み仮名辞書群104の各読み仮名辞書に対応し、請求項に記載した翻訳装置の読み仮名付与手段は、実施の形態の翻訳装置の読み仮名付与部112に対応している。
【0085】
また、請求項に記載した翻訳装置の格納手段、全文置換手段のそれぞれは、実施の形態の翻訳装置の全文置換処理部116に対応している。
【0086】
また、
図14を用いて説明した翻訳処理は、この発明の翻訳方法の一実施の形態が適用されたものであり、
図14を用いて説明した翻訳処理を実行するプログラムは、この発明の翻訳プログラムの一実施の形態が適用されたものである。また、
図1に示した読み仮名付与部112、使用辞書作成部114、全文置換処理部116の各機能は、制御部101で実行されるプログラムにより、制御部101の機能として実現することもできる。